Académique Documents
Professionnel Documents
Culture Documents
A Alfaomega
;Qii es la Estadstica^
19
Si Inubiramos utilizado una calculadora para obtener estas medidas y otras necesarias para analizar completamente los precios de venta, se hubieran requerido muchas horas de clculos. La probabilidad de cometer un error aritmtico es alta cuando se incluyen grandes cantidades de valores. Por otro lado, los paquetes de programas estadsticos y hojas de clculo pueden proporcionar informacin exacta en cuestin de segundos. Siguiendo los consejos de su instructor, y dependiendo del sistema operativo disponible, le recomendamos aplicar un paquete de cmputo para los ejercicios presentados en la seccin de Ejercicios de Datos para Computadora en cada captulo. Esto le evitar realizar tediosos clculos, y le permitir concentrarse en el anlisis de los datos.
Captulo 2
Ao 1950 1955 1960 1965 1970 Poblacin 152.30 165.90 180.70 194.30 205.10 Ao 1975 1980 1985 1990 1995 Poblacin 216.00 227.70 238.50 249.90 263.00
28. A continuacin m o s t r a m o s los gastos del personal militar y civil en las ocho b a s e s militares m s grandes en los E s t a d o s Unidos. Elabore una grfica de barras y resuma los resultados en un breve informe.
Resumen del captulo 2 / / I. U n a distribucin de frecuencias es una grupacin de datos en categoras que m u e s t r a n el n m e r o de observaciones en c a d a c a t a g o r a m u t u a m e n t e excluyente. .A. Los pasos para elaborar una distribucin de frecuencias s o n : 1. Determinar el t a m a o del intervalo de clase. 2. Clasificar los d a t o s reales en las clases. 3. Contar el n m e r o de entradas en c a d a clase. B. La frecuencia de clase es el n m e r o de observaciones e n c a d a clase. C. El intervalo de clase es la diferencia entre los lmites inferiores de dos clases c o n s e c u t i vas. D. El punto medio de clase se e n c u e n t r a a la mitad entre los lmites inferiores de d o s clases consecutivas. E. Los criterios para elaborar una distribucin de frecuencias s o n : 1. Evitar tener m e n o s de 5 o m s de 15 clases. 2. No incluir clases abiertas. 3. Mantener los intervalos de clase del m i s m o tamao. 4. No tener superposicin de clases. II. U n a distribucin de frecuencias relativas muestra el porcentaje de observaciones e n cada clase. Mi. U n a representacin de tallo y hoja es una alternativa a una distribucin de f r e c u e n c i a s . A. El dgito principal es el tallo, y el dgito siguiente la hoja. B. Las ventajas de la grfica de tallo y hoja sobre una distribucin de frecuencias, s o n : 1. No se pierde la identidad de c a d a o b s e r v a c i n . 2. Los dgitos en s d a n una i m a g e n de la disthbucin. '* 3. Tambin se reportan las f r e c u e n c i a s a c u m u l a d a s . IV. H a y d o s m t o d o s p a r a r e p r e s e n t a r g r f i c a m e n t e u n a d i s t r i b u c i n d e f r e c u e n cias. A. Un histograma m u e s t r a el n m e r o d e frecuencias en c a d a clase, en forma d e rectngulos. B. Un p o l g o n o de f r e c u e n c i a s c o n s i s t e e n s e g m e n t o s d e recta que u n e n los p u n t o s d e t e r m i n a d o s por las intersecciones de los puntos m e d i o s d e clase y las f r e c u e n c i a s de clase.
V. Un polgono de f r e c u e n c i a s a c u m u l a d a s "menor que" m u e s t r a el nmero de o b s e r v a c i o n e s por abajo de un valor d e t e r m i n a d o . V I . Los peridicos y las revistas utilizan m u c h a s grficas.
57
28 31
25 26
48 21
37 32
41 25
19 31
32 43
26 35
16 42
23 38
23 33
29 28
36
a) Cuntas clases r e c o m e n d a r a ? b) Q u intervalo de clase es de sugerir? c) Q u r e c o m e n d a r a c o m o lmite inferior d e la p r i m e r a clase? d) Organice los datos e n una distribucin d e f r e c u e n c i a s . e) C o m e n t e a c e r c a de la forma de la distribucin m e n c i o n a d a . 32. Los siguientes datos presentan las cantidades s e m a n a l e s (en dlares), g a s t a d a s en c o m e s tibles s e g n u n a m u e s t r a de h o g a r e s . $319 232 41 188 123 $250 503 335 320 325
a) Cuntas clases r e c o m e n d a r a ? b) Q u intervalo d e clase sugerira? c) Q u r e c o m e n d a r a c o m o el lmite inferior de la primera clase? d) O r g a n i c e los d a t o s en una distribucin de f r e c u e n c i a s . 3 3 . La siguiente representacin de tallo y hoja muestra el n m e r o de minutos de televisin diurn a q u e una m u e s t r a de estudiantes d e universidad o b s e r v a . 2 3 6 10 13 24 30 7 33 28 21 12 8 4 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 05 0 137 0029 499 00155667799 023468 1366789 01558 1122379 022367899 2457 4668 249 5 ,
9 1
u =
N
[3-1]
b)
La f r m u l a p a r a la m e d i a de u n a muestra es:
X = n
c)
[3-2]
X =
[3-7]
2.
B.
Las caractersticas principales de la m e d i a (aritmtica) s o n : a) Se requiere por lo m e n o s el nivel de intervalo de medicin. b) Todos los valores de datos se aplican en el clculo. c) Un c o n j u n t o d e datos tiene slo una media. Esto quiere decir q u e es nica. d) La s u m a de las d e s v i a c i o n e s respecto de la m e d i a es igual a 0. La m e d i a p o n d e r a d a se d e t e r m i n a multiplicando c a d a observacin por su " p e s o " c o r r e s pondiente. 1. La f r m u l a para d e t e r m i n a r la m e d i a p o n d e r a d a es:
+ W2+ W3 + + w
C.
2. Es un c a s o especial de la m e d i a aritmtica. La media g e o m t r i c a e s la raz n-sima del producto de n valores. 1 . La f r m u l a para la m e d i a g e o m t r i c a es:
[3-5]
D.
3. La m e d i a g e o m t r i c a s i e m p r e es igual a o m e n o r que la m e d i a aritmtica. La m e d i a n a es el valor localizado en el centro de un conjunto de datos o r d e n a d o s . 1. Para encontrar la m e d i a n a , clasifique las observaciones de la m s p e q u e a a la m s grande e identifique el valor central. 2. La f r m u l a p a r a estimar la m e d i a n a de datos a g r u p a d o s es:
92
LA ESTADSTICA EN ACCIN
La mayora de los insticutos universirarios (colleges) en EUA informan respecto al "tamao de la clase promedio". Esta informacin puede ser engaosa porque tal valor puede obtenerse de varias maneras. Si obtenemos el niimero de estudiantes en cada clase en una universidad especfica, el resultado es el nmero medio de estudiantes por clase. Si se rene un enlisrado de los tamaos de clae para cada estudiante y se obtiene el tamao de clase medio, podramos encontrar que la media es muy diferente. Una escuela encontr que el nmero medio de estudiantes en cada una de sus 747 clases, era 40. Pero cuando obtuvieron la media a partir de una lista de los tamaos de clase para cada estudiante, la cifra fue 147. Por qu hay esta disparidad? Porque hav pocos esrudiantes en las clases pequeas y ms estudiantes en las ciases gtandes, lo que hace que el tamao de la media de clase aumente cuando se calcula de esta manera. Una escuela podra reducir dicho tamao de la clase para cada alumno disminuyendo el nmero de estudiantes en cada clase. Esto excluve las sobrepobadas clases de estudiantes de primer ao.
Captulo 3
Mediana = L +
(/)
[3-8]
3.
Las caractersticas principales d e la m e d i a n a s o n : a) t) c) d) S e requiere por lo m e n o s el nivel ordinal de medicin. No e s influenciada por valores extremos. El 5 0 % d e las o b s e n / a c i o n e s s o n mayores q u e la m e d i a n a . Es nica para un conjunto de datos.
E.
La m o d a es el valor q u e ocurre c o n m s f r e c u e n c i a e n un conjunto d e datos. 1. La m o d a p u e d e d e t e r m i n a r s e para datos d e nivel nominal. 2. U n c o n j u n t o de datos p u e d e tener m s de u n valor m o d a l .
Simbologa
SMBOLO SIGNIFICADO M e d i a de u n a poblacin Operacin de suma IX X S u m a d e u n grupo d e valores M e d i a de m u e s t r a Media ponderada MG IfX M e d i a geomtrica S u m a de los productos d e las frecuencias y los puntos centrales de c l a s e PRONUNCIACIN mu sigma sigma X
c) C o m p r u e b e q u e I ( X - . u ) = 0. 3 8 . L a c o m p a a O w e n s O r c h a r d s v e n d e m a n z a n a s e n s a c o s por peso. U n a muestra d e siete s a c o s c o n t e n a las siguientes c a n t i d a d e s de m a n z a n a s : 2 3 , 19, 2 6 , 17, 2 1 , 2 4 , 2 2 . a) Calcule la m e d i a y la m e d i a n a d e las cantidades d e m a n z a n a s e n un saco. b) C o m p r u e b e q u e I ( X - X ) = 0. 39. U n a m u e s t r a de familias q u e e s t n suscritas a la c o m p a a telefnica United Bell registr los siguientes n m e r o s de l l a m a d a s recibidas la s e m a n a p a s a d a . D e t e r m i n e la m e d i a y la m e d i a n a d e los n m e r o s d e l l a m a d a s recibidas.
52 34
43 46
30 32
38 18
30 41
42 5
12
46
39
37
4 0 . El b a n c o Citizens Bani<ing C o m p a n y e s t e s t u d i a n d o el n m e r o d e v e c e s q u e e s utiliz a d o p o r d a un cajero a u t o m t i c o localizado e n el s u p e r m e r c a d o Loblaws. A continuacin s e indican los n m e r o s d e v e c e s q u e dicho aparato s e e m p l e e n c a d a uno d e los ltimos 3 0 di'as. D e t e r m i n e la m e d i a del n m e r o d e v e c e s que la m q u i n a fue utilizada p o r da.
127
1 500
--
;
I '
300 - O
a) D e t e r m i n e la m e d i a n a . b) O b t e n g a el primero y el tercer cuartiles. c) D e t e r m i n e la amplitud cuartlica. d) M s all de q u p u n t o s e c o n s i d e r a un valor c o m o dato incongruente? e) Identifique c u a l e s q u i e r a datos i n c o n g r u e n t e s y calcule su v a l o r f} La distribucin es s i m t r i c a o a s i m t r i c a , de sesgo positivo o negativo? 4 1 . En un estudio del millaje de a u t o m v i l e s f a b r i c a d o s en 1997, el n m e r o medio de millas por galn fue 27.5, y la m e d i a n a , 26.8. El valor m s pequeo en el estudio fue 12.70 millas por g a l n , y el m s g r a n d e , 5 0 . 2 0 . El p r i m e r o y el tercer cuartiles fueron 17.95 y 3 5 . 4 5 millas por g a l n , r e s p e c t i v a m e n t e . Elabore un d i a g r a m a de caja y c o m e n t e respecto a la distrib u c i n . Es una distribucin simtrica? 42. U n a m u e s t r a de 28 hospitales en Florida revel los siguientes cargos diarios (en dlares) p a r a un alojamiento s e m i p n v a d o . Por c o n v e n i e n c i a , se ordenaron los datos desde el mayor h a s t a el menor. Realice un d i a g r a m a de caja para representar los datos. C o m e n t e a c e c a de ^ la d i s t n b u c i n . A s e g r e s e de identificar el p r i m e r cuartil y el tercero y la mediana, y c o m e n t e a c e r c a de la f o r m a de la distribucin de los c a r g o s diarios. $116 229 260 307 $121 232 264 309 $157 236 276 312 S192 236 281 317 $207 239 283 324 $209 243 289 341 $209 246 296 353
B.
a) Slo dos valores se utilizan en su clculo. b) Tiene la influencia de valores extremos. c) Es fcil de calcular y de c o m p r e n d e r La desviacin m e d i a (absoluta) es la s u m a de las desviaciones (absolutas) dividida entre el n m e r o de o b s e r v a c i o n e s . 1. La f r m u l a para calcular la d e s v i a c i n media absoluta e s :
DM=
^l^--^!
[4-2]
n
2. S u s caractersticas principales s o n : a) No e s influenciada n o c i v a m e n t e por valores grandes o pequeos.
128
Captulo 4
b) T o d o s los valores s e utilizan en su clculo. c) Es algo difcil trabajar c o n valores absolutos. C. La variancia es la media de las desviaciones al cuadrado con respecto a la media (aritmtica). 1. Las caractersticas principales de la variancia s o n : a) Todas las o b s e r v a c i o n e s se usan en su clculo. b) N o tiene influencia i m p r o p i a de o b s e r v a c i o n e s extremas. c) L a s unidades resultan inconvenientes en el trabajo; son las unidades originales elevadas al c u a d r a d o . 2. La f r m u l a para calcular la variancia poblacional e s :
c f = ^ i ^
N 3. La f r m u l a para evaluar la variancia muestral es:
: [4-3]
[4-5] D. , n-1
" V n - 1 2.
n-1
Las caractersticas principales de la desviacin estndar son: a) S u valor est en las m i s m a s unidades q u e los datos originales. b) Es la raz c u a d r a d a d e la distancia p r o m e d i o respecto de la m e d i a , elevada al cuadrado. c) No p u e d e ser n e g a t i v a . d) Es la m e d i d a de d i s p e r s i n m s a m p l i a m e n t e utilizada. II. El t e o r e m a d e Chebysfiev e s t a b l e c e que, sin considerar la forma de la distribucin, por lo m e n o s 1 - 1/A^ de las o b s e r v a c i o n e s estar dentro d e k unidades respecto d e la media. III. El coeficiente d e variacin es u n a m e d i d a de dispersin relativa. A . La f r m u l a p a r a el coeficiente d e variacin es:
CK= (100)
[4-9]
B. Refleja la variacin c o n r e s p e c t o a la media. C. Es til p a r a c o m p a r a r distribuciones con diferentes unidades. IV. El coeficiente de asimetra mide la simetra de u n a distribucin. A. La f r m u l a p a r a el coeficiente d e asimetra es: * . ^^^3(X-mediana)
s
S u s caractersticas principales s o n : 1. P u e d e variar desde - 3 . 0 0 fiasta 3.00. 2. Un valor c e r c a n o O indica u n a distribucin simtrica. 3. Si la cola de la distribucin est a la derecha, la distribucin es positivamente asimtrica (con s e s g o positivo). 4. Si la cola de la distribucin est a la izquierda, la distribucin es negativamente a s i m t r i c a (con s e s g o n e g a t i v o ) . V. Las m e d i d a s d e ubicacin t a m b i n d e s c r i b e n la d i s e m i n a c i n en un conjunto de observaciones. A . Un cuartil divide un c o n j u n t o d e o b s e r v a c i o n e s en cuatro partes iguales. 1. S e tiene q u e 2 5 % de las o b s e r v a c i o n e s s o n m e n o r e s q u e el p r i m e r cuartil, 5 0 % s o n m e n o r e s que el s e g u n d o cuartil (la m e d i a n a ) , y 7 5 % son menores que el tercer cuartil. B.
Simbologa
SIMBOLO SIGNIFICADO Variancia poblacional Desviacin estndar poblacional S u m a del p r o d u c t o d e os puntos centrales d e clase al c u a d r a d o , y la f r e c u e n c i a de c l a s e L o c a l i z a c i n d e un centil (o porcentil) Lsubp Qsub Osub3 1 FORMA EXPRESIVA s i g m a al c u a d r a d o sigma sigma fXal cuadrado
o, o.
Temperatura (F) Medida Estadstica Media aritmtica Mediana Moda Desviacin estndar Desviacin media Desviacin cuartlica Lnea 1 238.1 240.0 241.5 3.0 1.9 Lnea 2 240.0 240.0 240.0 0.4 0.2 0.1 Lnea 3 242.9 240.0 239.1 3.9 2.2 1.7
i.o
4 3 . Cul de las lneas tiene u n a distribucin de c a m p a n a ? 44. Q u lnea p r e s e n t a mayor variacin e n la temperatura? C m o lo sabe? 45. De a c u e r d o c o n la Regla Emprica, a p r o x i m a d a m e n t e 9 5 % de las lecturas de t e m p e r a t u r a de la lnea 2 estuvieron entre qu valores? 46. Q u lneas tienen s e s g o positivo en la distribucin de las t e m p e r a t u r a s de los h o r n o s ? 47. Para, la lnea 2 d e t e r m i n e el primero y el tercer cuartiles. 4 8 . Para la lnea 3, de a c u e r d o con el t e o r e m a de Chebyshev, a p r o x i m a d a m e n t e 8 9 % de las t e m p e r a t u r a s s e e n c u e n t r a n entre cules dos valores? 49. D e t e r m i n e el coeficiente d e variacin p a r a la lnea 3. 50. O b t e n g a el coeficiente de asimetra p a r a la lnea 1.
299
En el muestreo no probabilstico, la inclusin en la m u e s t r a se b a s a en el criterio de la p e r s o n a que realiza el muestreo. Las muestras no probabilsticas pueden llevar a result a d o s con sesgo.
III. La diferencia entre el p a r m e t r o p o b l a c i o n a l y el valor estadstico muestral se d e n o m i n a el error de muestreo. IV. La distribucin d e m e d i a s mustrales e s u n a distribucin probabilstica que s e a l a t o d a s las m e d i a s mustrales posibles y sus p r o b a b i l i d a d e s de ocurrencia. A. B. Para un t a m a o de m u e s t r a dado, el valor medio de t o d a s las medias mustrales posibles seleccionadas de la poblacin, e s exactamente igual a la media poblacional. Existe m e n o s d i s p e r s i n en la d i s t h b u c i n muestral de m e d i a s que en la poblacin. 1. 2. La desviacin e s t n d a r de la distribucin de medias mustrales se d e n o m i n a el error estndar de la m e d i a . Se calcula m e d i a n t e la f r m u l a siguiente:
C.
El t e o r e m a d e lmite central especifica q u e si se seleccionan t o d a s las muestras de t a m a o r a z o n a b l e m e n t e grande (n > 30) de cualquier poblacin, la distribucin d e las m e dias mustrales es a p r o x i m a d a m e n t e n o r m a l . 1. 2. La a p r o x i m a c i n m e j o r a con m u e s t r a s m s grandes. El muestreo de u n a poblacin n o r m a l lleva directamente a una distribucin n o r m a l d e las medias m u s t r a l e s .
V. U n a estimacin puntual es un valor nico (estadstico) que se utiliza para estimar un valor de poblacin (parmetro). V I . Un e s t i m a d o de intervalo de c o n f i a n z a es u n intervalo de variacin d e valores dentro de los c u a l e s se e s p e r a que o c u r r a el p a r m e t r o d e la poblacin. A. Los factores q u e c o n s t i t u y e n un intervalo de confianza para una media s o n : 1. 2. 3. El n m e r o de o b s e r v a c i o n e s en la muestra, n. La variabilidad e n la p o b l a c i n , q u e generalmente se e s t i m a mediante la desviacin estndar de la m u e s t r a , s. Ei nivel de c o n f i a n z a . Est r e p r e s e n t a d o por el valor z.
300
Captulo 8
B. Un inten/alo de c o n f i a n z a p a r a la m e d i a es
X z = - ^ \ C.
[8-5]
Los factores q u e d e t e r m i n a n un intervalo de confianza para una proporcin s o n : 1. El n m e r o de o b s e r v a c i o n e s en la muestra. 2. El valor de p que se obtiene dividiendo el nmero de xitos en la m u e s t r a , X, entre el n m e r o de o b s e r v a c i o n e s en la m i s m a , n. 3. El nivel de confianza. Est representado por el valor z. D. Un Intervalo de confianza para una proporcin es
p ^ z lzA
[8-8]
VII. El t a m a o d e m u e s t r a necesario p u e d e ser determinado tanto para m e d i a s c o m o p a r a proporciones. A . Los factores q u e d e t e r m i n a n el t a m a o de la muestra para una m e d i a s o n : 1. El nivel de c o n f i a n z a d e s e a d o , z. 2 . El m x i m o error permisible, E. 3. La variacin e n la poblacin (que por lo general se estima con s). B. La f r m u l a p a r a el t a m a o d e m u e s t r a para una m e d i a es:
[8-11]
C.
Los factores q u e d e t e r m i n a n el t a m a o de muestra p a r a una proporcin s o n : 1. El nivel de c o n f i a n z a d e s e a d o , z. 2. El m x i m o error permisible, E. 3. U n a e s t i m a c i n d e la proporcin de poblacin. Si no se cuenta c o n u n valor estimado, e n t o n c e s se usa 0.50. D. La f r m u l a para el t a m a o de m u e s t r a para una proporcin es:
n = p(1 - p)
_z_\
[8-12]
Simbologa
SMBOLO (ijf 0-Sjf or " SiGNlFICADO M e d i a d e la d i s t r i b u c i n de medias mustrales Error e s t n d a r d e a p o b i a c i n de medias mustrales Error e s t n d a r d e la m u e s t r a de medias mustrales Error e s t n d a r a e la p r o p o r c i n de muestra FORMA EXPRESIVA mu sub X con. sigma barra barra
Captulo 9
[ A U T O E X A M E N 9-6
S u p n g a s e que la m e d i a v e r d a d e r a de un lote recibido de varillas de acero es 10 180 p s i . C u l es la probabilidad de q u e el inspector d e control de c a l i d a d acepte los p r o d u c t o s c o m o si tuvieran una m e d i a d e 10 0 0 0 psi? (Parecera i n c o n g r u e n t e que se r e c h a c e n t a l e s varillas si la r e s i s t e n c i a a la t e n s i n es m s alta que lo especificado. Sin e m b a r g o , p u e d e ser que el p a s a d o r d e c h a v e t a t e n g a u n a funcin doble en un motor nutico f u e r a de b o r d a . P u e d e estar d i s e a d o p a r a q u e n o se r o m p a por cizallamiento si el m o t o r c h o c a c o n t r a un objeto p e q u e o , pero p a r a q u e se rompa si h a y g o l p e contra una roca. Por tanto, el acero no d e b e s e r demasiado resistente.) El r e a blanca en el D i a g r a m a 9-11 C r e p r e s e n t a la p r o b a b i l i d a d de aceptar f a l s a m e n t e la hiptesis de q u e la resistencia m e d i a a la tensin del lote recibido es 10 0 0 0 p s i . C u l e s la p r o b a b i l i d a d d e c o m e t e r un e r r o r T i p o II?
Ejercicios
9-1 y el e j e m p l o probabilidad de 9-1 y el e j e m p l o probabilidad de p r e s e n t a d o . Con n = 100, cr = 400, X^=Q 9 2 2 , y x, = un error de Tipo 11, es 0.1469. p r e s e n t a d o . Con n = 100, a = 400, = 9 922, y ji, = un error de Tipo II vale 0.6736.
Tal c o n c e p t o e s el valor d e t e r m i n a d o a partir de la informacin de la muestra que se utiliza para decidir si se rechaza la hiptesis nula. 2. La distribucin n o r m a l estndar, z, s e utiliza c o m o el valor estadstico de p r u e b a para muestras g r a n d e s . D. Plantear la regla d e d e c i s i n . 1. La regla de d e c i s i n indica la c o n d i c i n o condiciones c u a n d o se rechaza la hiptesis nula. 2. En una p r u e b a d e d o s colas, la regin de rechazo se divide igualmente entre la extremidad de valores superiores y la de valores inferiores. 3. En una p r u e b a de u n a cola t o d a la regin de rechazo se encuentra en la extremidad de valores s u p e r i o r e s o en la de valores inferiores. E. Seleccionar u n a m u e s t r a , calcular el valor estadstico de prueba, tomar u n a decisin acerca de la hiptesis nula e interpretar el resultado. III. Un valor p es la p r o b a b i l i d a d de que el valor estadstico de p r u e b a sea tan grande o m s que el obtenido, c u a n d o la hiptesis nula es v e r d a d e r a . IV. P r u e b a de una hiptesis respecto a la m e d i a poblacional. A . Si se conoce la d e s v i a c i n e s t n d a r d e la poblacin, a, el valor estadstico de p r u e b a se aproxima a la distribucin normal estndar, z, y se d e t e r m i n a por:
o/V
343
V. P r u e b a d e una hiptesis acerca de d o s m e d i a s poblacionales. A. El objetivo es d e t e r m i n a r si existe u n a diferencia entre d o s m e d i a s mustrales. B. A m b a s muestras d e b e n s e r al m e n o s 3 0 . C. El valor estadstico d e p r u e b a es: X,-X,
z= V "1 "2
V I . P r u e b a d e u n a hiptesis respecto a u n a relacin proporcional. A. Tanto n n c o m o n(1 - tc) d e b e n ser al m e n o s 5. B. El valor estadstico d e p r u e b a e s :
z=
p(1 - )
[9-8]
B.
P1-P2
VIH. Errores d e Tipo I y de T i p o II. A. U n error de T i p o 1 s e presenta c u a n d o s e rechaza u n a hiptesis nula v e r d a d e r a . 1. Es igual al nivel d e significancia. 2. S e d e n o t a c o n la letra a . B. U n error de T i p o II s e p r e s e n t a c u a n d o no s e rechaza u n a hiptesis nula falsa. 1. S e d e n o t a c o m o [3. 2. L a probabilidad de u n error de T i p o II s e obtiene m e d i a n t e : . __ X,-,, a/Vn
Simbologa
SMBOLO SIGNIFICADO Hiptesis nula Hiptesis alternativa FORMA EXPRESIVA H sub cero H sub uno
Pruebas de hiptesismuestras
Peso (Ib) Nombre Evie Gorky Bob Mack Lou Brandon KarI Unger SueKoontz Antes 190 250 S^S 210 114
pequeas
Peso (Ib) Nombre PatOLeary Kim Dennis Connie Kaye TomDama Maxine Sims Antes 126 186 116 196 125 Despus 196 240 345 212 113
381
Despus 129 189 115 194 124
A l nivel de significancia de 0 . 0 1 , p u e d e decirse q u e es un xito el nuevo progrania d e reduccin de p e s o ? 2 4 . S e realiz un e s t u d i o sobre las z o n a s de alta delincuencia en Miami, Florida. S e registr el n m e r o de delitos e n c a d a una de o c h o reas de m u e s t r e o durante un perodo de un ao. D e s p u s se aplic un p r o g r a m a de vigilancia por parte d e los vecinos. En la siguiente tabla se muestra el n m e r o de delitos o c u r r i d o s antes y d e s p u s del programa. H u b o una disminucin en la c a n t i d a d de actos delictivos que se p r e s e n t a r o n desde que se inici el programa?
f = ^ ^ s/Vn
[10-1]
d o n d e X e s la m e d i a muestral, u es la media p o b l a c i o n a l , s es la desviacin estndar muestral y n es el n m e r o de o b s e r v a c i o n e s en la m u e s t r a . B. Los g r a d o s d e libertad son n - 1. IV. En una p r u e b a d e d o s muestras se c o m p a r a n las d o s m e d i a s mustrales para d e t e r m i n a r si la m u e s t r a provino d e poblaciones c o n medias iguales. A . Las s u p o s i c i o n e s requeridas s o n : 1. 2. 3. A m b a s p o b l a c i o n e s estn distribuidas n o r m a l m e n t e . Las p o b l a c i o n e s son independientes. Las d e s v i a c i o n e s estndares s o n las m i s m a s en a m b a s poblaciones.
J3i
382
Captulo 10
B. Debido a q u e se c o n s i d e r a q u e las p o b l a c i o n e s tienen d e s v i a c i o n e s estndares guales, se c o m b i n a n las d e s v i a c i o n e s e s t n d a r e s de muestra. 1. La f r m u l a para la variancia c o m b i n a d a (la desviacin e s t n d a r respectiva al cuadrado) es (n^-1)s^ + (n3-1)s| [10-2] n, + - 2 a las d o s desviacio-
2.
d o n d e n, y se refieren a los t a m a o s de ias muestras, y s, y nes estndares mustrales. El valor estadstico d e p r u e b a se calcula m e d i a n t e
[10-3]
donde X, y se refieren a las dos medias mustrales independientes, ^ a la variancia muestral c o m b i n a d a , y n^ y a ios d o s t a m a o s de m u e s t r a . V. Si las muestras estn p a r e a d a s o son d e p e n d i e n t e s , el valor de f, el estadstico de prueba, se calcula por [10-4]
sJVn
Simbologa
SMBOLO S I G N I F I C A D O Variancia m u e s t r a l c o m b i n a d a X, Xj M e d i a de la p r i m e r a m u e s t r a M e d i a de la s e g u n d a m u e s t r a Nmero de observaciones en la p r i m e r a m u e s t r a N m e r o de o b s e r v a c i o n e s en la s e g u n d a m u e s t r a 5 M e d i a de la d i f e r e n c i a entre observaciones dependientes D e s v i a c i n e s t n d a r d e la d i f e r e n c i a entre o b s e r v a c i o n e s d e p e n d i e n t e s s sub d d con raya n sub 2 FORMA EXPRESIVA s sub p cuadrada
Captulo 11
Unidades producidas Empleado Skaff Lum Clark Treece Morgan Maana 31 33 28 30 28 Tarde 25 26 24 29 26 Noche 35 33 30 28 27
18. Existen tres liospitales en el rea de Tulsa. Los siguientes d a t o s muestran el n m e r o de intervenciones quirrgicas practicadas a pacientes externos en c a d a iiospital, la ltima sem a n a . Al nivel de significancia de 0.05, es posible concluir q u e existe una diferencia en el n m e r o p r o m e d i o de cirugas realizadas entre los tres hospitales y en el n m e r o p r o m e d i o d e o p e r a c i o n e s e f e c t u a d a s por da de la s e m a n a ? Nmero de intervenciones realizadas Da Lunes Martes Mircoles Jueves Viernes St. Luke's 14 20 16 18 20 St. Vincent 18 24 22 20 28 Mercy 24 14 14 22 24
C. T i e n e s e s g o positivo.
F = - ^ si
[11-1]
III. S e u s a un A N O V A d e u n a direccin para c o m p a r a r vahas m e d i a s de tratamiento, a fin de ver si p r o v i e n e n de la m i s m a poblacin o de poblaciones iguales. A. B. Un trata.mlento e s u n a fuente de variacin. Las s u p o s i c i o n e s implcitas en el A N O V A s o n : 1. 2. 3. C. 1. Las m u e s t r a s provienen de p o b l a c i o n e s normalmente distribuidas. Las p o b l a c i o n e s tienen Iguales desviaciones estndares. Las p o b l a c i o n e s s o n independentes. La f r m u l a p a r a S S total, s u m a de cuadrados total, es:
S S total = ZX'-
[11-2]
Anlisis de variancia
2. La f r m u l a p a r a SST, s u m a de c u a d r a d o de tratamientos, es:
415
SST = I
[11-3]
3.
4.
Esta informacin se r e s u m e en la siguiente tabla y se d e t e r m i n a el valor de F. Fuente de Variacin Tratamientos Error Total Suma de cuadrados Grados de libertad SST SSE SS total /<- 1
n - k
Cuadrado medio
n-1
IV. Si se recfiaza u n a hiptesis nula de m e d i a s de tratamiento iguales, se p u e d e n identificar los p a r e s q u e difieren a partir del siguiente intervalo de confianza:
(X, - X^) f \ / M S E
[11-5]
V. En un A N O V A d e d o s direcciones se c o n s i d e r a una s e g u n d a variable de tratamiento. A. B. La s e g u n d a v a h a b l e d e tratamiento se d e n o m i n a variable de bloqueo. Se d e t e r m i n a u s a n d o la siguiente f r m u l a : / B2_\ SSB = I (SX)^
[11-6]
C.
D.
Grados de libertad
kb-
1 1
(k--l)(b-A)
Total
n-1
I Simbologa
SIMBOLO S S total SST SSE T| SIGNIFICADO S u m a d e c u a d r a d o s , total S u m a de cuadrados, tratamientos S u m a de cuadrados, error Totales de c o l u m n a e l e v a d o s al c u a d r a d o N m e r o de o b s e n / a c i o n e s en cada tratamiento MSE SSB Error c u a d r a d o m e d i o S u m a d e c u a d r a d o s p a r a los bloques MSE SSB FORMA EXPRESIVA S S total SST SSE T sub o al n sub c cuadrado
462
Captulo 12
Ejercicios
3 1 . Se p r e s e n t a la siguiente tabla ANOVA: FUENTE Regresin Error Total a) b) GL 1 13 14 SS 1000.0 500.0 1 500.0 MS 1000.00 38.46 F 26.00
O b t e n g a el coeficiente de d e t e r m i n a c i n . S u p o n i e n d o u n a relacin directa entre las variables, cul es el coeficiente d e correlacin? c) D e t e r m i n e el error estndar de e s t i m a c i n . 32. En ei primer e x a m e n d e Estadstica, el coeficiente de d e t e r m i n a c i n entre las horas estudiad a s y la calificacin o b t e n i d a fue 8 0 % . El error estndar de estimacin tuvo un valor de 10. H a b a 20 estudiantes en la clase. Elabore una tabla A N O V A .
n^XY-lXlY \'[rilX'--CLX)^][nlYi-(lm
G. poblacin es d i f e r e n t e de 0.
j^2..,j
r=
[12-2]
III. Ei coeficiente d e d e t e r m i n a c i n es la p o r c i n fraccionaha del cambio en una variable que es explicada por la o t r a . A . Vara de O a 1.0. B. Es el c u a d r a d o del coeficiente de correlacin. IV. En el anlisis de regresin se calcula u n a variable c o n b a s e en otra variable. A . La variable q u e se evala es la variable d e p e n d i e n t e . B. La variable q u e se e m p l e a para realizar la estimacin es la vahable i n d e p e n d i e n t e . 1. La relacin entre las variables d e b e ser lineal. 2. Tanto la v a h a b l e independiente c o m o la d e p e n d i e n t e d e b e n ser de e s c a l a de intervalo o de r a z n . 3. El criterio d e m n i m o s c u a d r a d o s se utiliza para d e t e r m i n a r la ecuacin de regresin.
463
a = ^
[12-5]
C.
b es la p e n d i e n t e de la recta. 1. Indica la m a g n i t u d del c a m b i o e n / ' para una v a r i a c i n de valor 1 en X. 2 . Un valor positivo para b indica u n a relacin d i r e c t a entre las d o s variables, y uno negativo, u n a relacin inversa. 3. El signo d e > y el signo de r, el coeficiente de c o r r e l a c i n , siempre son iguales. 4. b se calcula c o n la siguiente e c u a c i n : j^_n(IXVl-(IX)(I/) n(IX2)-(ZX)2
D. X e s el valor d e la variable i n d e p e n d i e n t e . V I . El error estndar de e s t i m a c i n m i d e la variacin a l r e d e d o r de la lnea de r e g r e s i n . A. Est en las m i s m a s u n i d a d e s q u e la variable d e p e n d i e n t e . B. Se basa en las d e s v i a c i o n e s al c u a d r a d o respecto d e la recta de regresin. C. Valores p e q u e o s indican que los p u n t o s se a g r u p a n c e r c a de la citada recta. D. Se calcula u s a n d o la siguiente f r m u l a : i/^-a(iy)-b(ixy) j^2-7]
n-2
VII. La inferencia a c e r c a d e la regresin lineal s e basa en las siguientes c o n s i d e r a c i o n e s . A. Para un valor d a d o de X, los v a l o r e s d e / s e distribuyen de forma normal respecto d e la lnea de r e g r e s i n . B. La desviacin e s t n d a r de c a d a u n a de las distribuciones normales es la m i s m a para todos los valores de X y se calcula p o r medio del e r r o r e s t n d a r de e s t i m a c i n . C. Las d e s v i a c i o n e s respecto de la l n e a de regresin s o n independientes, sin n i n g n modelo referente al t a m a o o la d i r e c c i n . VIII. Existen d o s tipos de e s t i m a c i o n e s de intervalos. A . En un intervalo de confianza, el valor medio de / s e c a l c u l a para un valor d a d o d e X . 1. Se evala por m e d i o de la s i g u i e n t e frmula:
rtSy,=
[12-8]
2.
B.
La a m p l i t u d del intervalo es a f e c t a d a por el nivel d e confianza, la m a g n i t u d del error estndar d e e s t i m a c i n y el t a m a o de la muestra, a s c o m o por el valor de la variable i n d e p e n d i e n t e . En un intervalo de prediccin, el valor individual de / s e calcula para un valor d a d o de X. 1. Se obtiene por m e d i o de la s i g u i e n t e frmula:
/'fs,,=
h +
[12-9] (IX)^
2.
La diferencia entre las f r m u l a s (12-8) y (12-9) es el n m e r o 1 bajo el radical. a) El intervalo de prediccin s e r m s amplio q u e el intervalo de confianza. b) El intervalo de prediccin s e b a s a tambin en el nivel de confianza, el t a m a o del error e s t n d a r de e s t i m a c i n , la dimensin de la m u e s t r a y el valor de la variable independiente.
Captulo 13
Ejemplo 1 Ejemplo 2
-*Y
Qu problemas son causados por los residuos que no muestran homoscedasticidad? Las desviaciones estndares de los coeficientes de regresin seran subestimadas (muy pequeas), ocasionando que posibles variables independientes parezcan ser significativas cuando tal vez no lo sean. El remedio para esta condicin es seleccionar otras variables independientes o transformar algunas de las variables. Para una exposicin ms detallada del anlisis de residuos, consltense textos avanzados, como Applied Linear fegression Modele, de Neter, Kutner, Nachtsheim y Wasserman (Richard D. Irwin, 1996).
1 -50
*
9
0 Residuos -
50
Diagrama 13-3
i
I.
II.
r = a + b,X, +
b2X2
+ ... + b,X,
[13-3]
III.
d o n d e Y' es el valor estimado, a es la o r d e n a d a del p u n t o de interseccin c o n el eje / , las literales b s o n los coeficientes de regresin muestral, y las X representan los valores de las diversas variables i n d e p e n d i e n t e s . A . P u e d e haber cualquier n m e r o de variables independientes. B. El criteho de m n i m o s c u a d r a d o s se utiliza p a r a desarrollar la e c u a c i n . C. Se n e c e s i t a una c o m p u t a d o r a p a r a determinar a y los diversos valores b. Existen d o s m e d i d a s de la efectividad d e la ecuacin de regresin:
mltiples
495
IV. V. VI.
VII.
El error e s t n d a r mltiple de e s t i m a c i n es s e m e j a n t e a la desviacin e s t n d a r 1. Se mide e n ias mismas u n i d a d e s q u e la variable d e p e n d i e n t e . 2. Es difcil d e t e r m i n a r qu es un valor grande y qu es un valor p e q u e o del error estndar B. El coeficiente d e determinacin p u e d e variar de O a 1. 1. Muestra la fraccin de la variacin en V q u e se explica por medio del conjunto de variables independientes. 2. No indica la direccin de la relacin. La tabla ANOVA d a la variacin en la variable d e p e n d i e n t e explicada por la e c u a c i n de regresin. U n a matriz de c o r r e l a c i n muestra t o d o s los posibles coeficientes de correlacin simple entre pares de variables. S e usa una p r u e b a global para investigar si cualesquiera d e las variables i n d e p e n d i e n t e s tienen coeficientes de regresin significativos. A. La fiiptesis nula es: Todos los coeficientes de regresin son cero. B. La hiptesis alternativa es: Al m e n o s un coeficiente de regresin no e s cero. C. El valor estadstico de prueba es la distribucin F c o n k (el n m e r o de v a n a b l e s independientes) y n - (/( + 1) g r a d o s de libertad, d o n d e n e s el t a m a o d e la muestra. La prueba para v a n a b l e s individuales d e t e r m i n a cules vanables i n d e p e n d i e n t e s tienen coeficientes de r e g r e s i n distintos de cero. A. Las vanables q u e tienen coeficientes d e regresin nulos usualmente s e eliminan del anlisis. B. El valor estadstico de prueba es la disthbucin f c o n n - (/c + 1) grados de libertad. Las variables ficticias s o n e m p l e a d a s p a r a representar las variables cualitativas, y pueden adoptar slo una d e las dos posibles c o n d i c i o n e s . Un residuo es la diferencia entre el valor real de Yy el valor pronosticado de Y'. A. Los residuos d e b e n distribuirse de f o r m a a p r o x i m a d a m e n t e n o r m a l . Los histogramas y los d i a g r a m a s de tallo y hoja s o n tiles para verificar esta condicin. B. Una grfica d e los residuos y los valores Y c o r r e s p o n d i e n t e s sirve para m o s t r a r q u e no hay t e n d e n c i a s o pautas en los residuos.
VIII. IX.
Simbologa
SMBOLO 7, b,, Sy,,2--k SIGNIFICADO Coeficiente de regresin para la primera v a r i a b l e independiente Coeficiente de regresin para cualquier v a r i a b l e independiente Error estndar mltiple de estimacin FORMA EXPRESIVA b sub 1 b sub k s sub y punto 1, 2 ...
i
9.
a) b) c) d) e)
Cul es el t a m a o de muestra total? Cuntas variables independientes se estn c o n s i d e r a n d o ? Calcule el c o e f i c i e n t e de d e t e r m i n a c i n . Determine el error estndar de e s t i m a c i n . Pruebe la hiptesis de q u e ninguno d e los coeficientes de regresin es igual a cero. Sea a = 0.05.
20.
538
Capitulo 14
Comunidad Urbana Rural Granjera Noticias nacionales 170 120 130 Deportes 124 112 90 Historietas cmicas 90 100 88
-Al nivel de significancia de 0.05, se p u e d e concluir q u e existe u n a relacin entre ei tipo de c o m u n i d a d d o n d e la p e r s o n a reside y la parte del diario q u e lee primero? 16. Se estn c o n s i d e r a n d o cuatro marcas de lmparas elctricas para su uso en una gran planta manufacturera. El director de c o m p r a s pidi muestras de 100 a c a d a fabricante. Las cantidad e s de productos aceptables e inaceptables de cada uno se indican a continuacin. Al nivel de significancia d e 0.05, existe a l g u n a diferencia en la calidad de las bombillas?
17. El d e p a r t a m e n t o d e control d e calidad de la e m p r e s a Food T o w n , Inc., una c a d e n a de tiend a s de comestibles en Nueva York, realiza una inspeccin m e n s u a l para c o m p a r a r los precios registrados c o n los precios a n u n c i a d o s . El siguiente d i a g r a m a r e s u m e los resultados de u n a muestra de 5 0 0 artculos en el m e s anterior. La administracin de la e m p r e s a deseara saber si existe a l g u n a relacin entre las tasas de error en m e r c a n c a de precio regular y en los artculos de precio especial. Utilice ai nivel de significancia d e 0 . 0 1 .
18. El e m p l e o de telfonos celulares (o porttiles) en automviles ha a u m e n t a d o notablemente e n los ltimos a o s . El efecto de tal uso en las tasas de a c c i d e n t e s de trnsito es de inters p a r a los peritos viales y para los f a b h c a n t e s de dichos telfonos. Es m s probable q u e alguien q u e utilice un telfono celular participe en un accidente de trnsito? Cul es su conclusin a partir de la siguiente informacin muestral? Utilice el nivel de significancia de 0.05.
2i,
Mtodos no paramtricosAplicaciones
de ji cuadrada
539
II. Una prueba de b o n d a d de ajuste m o s t r a r si un c o n j u n t o de frecuencias observadas podra provenir de una distribucin discreta hipottica. A. Los grados de libertad son fc - 1, d o n d e /ees el n m e r o de categoras. B. La f r m u l a para calcular el valor de ji c u a d r a d a es
= I
'e
[14-1]
III. Una prueba de b o n d a d de ajuste t a m b i n p u e d e utilizarse para determinar si las observaciones mustrales provinieron de una distribucin c o n t i n u a c o m o la de tipo n o r m a l . A. Para realizar la p r u e b a para una distribucin n o r m a l , determine la m e d i a y la desviacin estndar d e la distribucin. B. A g r u p e los datos en una distribucin de frecuencias. C. Convierta los lmites de clase a valores z. D. Multiplique la probabilidad de encontrar un valor en cada clase por el nmero total de o b s e r v a c i o n e s , a fin de encontrar la f r e c u e n c i a esperada. E. Utilice la f r m u l a (14-1) para d e t e r m i n a r el valor de ji cuadrada. F. Los g r a d o s de libertad s o n fc- 3 si la m e d i a y la desviacin estndar se estiman a partir de los datos. IV. U n a tabla de c o n t i n g e n c i a s se utiliza para probar si hay relacin entre dos caractersticas. A. C a d a o b s e r v a c i n se clasifica de a c u e r d o c o n d o s caractersticas. B. La f r e c u e n c i a e s p e r a d a se d e t e r m i n a c o m o s e indica a continuacin: ^ _ (Total por rengln)(Total por columna) (Gran total) C. Los g r a d o s d e libertad se obtienen m e d i a n t e : g / = (Renglones - 1 )(Columnas - 1 ) D. Se utiliza el procedimiento c o m n de p r u e b a de hiptesis. [14 2 ]
Simbologa
SMBOLO X" 4 /, SIGNIFICADO Distribucin probabilstica Frecuencia observada Frecuencia esperada i . FORMA EXPRESIVA cuadrada fsubo sube
19. Los vehculos que se dirigen al oeste sobre la calle Front pueden dar vuelta a la d e r e c h a , a la izquierda, o bien seguir d e r e c h o hasta la calle Elm. Un experto en trnsito urbano cree q u e la mitad de los vehculos continuar sin c a m b i o de direccin al pasar por la interseccin. De la mitad restante, proporciones iguales darn vuelta hacia la derecha o hacia la izquierda. Se observaron 2 0 0 vehculos, c o n los siguientes resultados. Utilice el nivel de significancia d e 0.10. Se p u e d e concluir que el ingeniero de trnsito est en lo correcto? No cambia direccin Frecuencia 112 Vuelta a la derecha 43 Vuelta a la izquierda 40
2 0 . El editor de una revista deportiva planea ofrecer uno de tres regalos a los nuevos suscriptores: una s u d a d e r a c o n el logotipo de su equipo favorito, u n a taza para caf con tal s m b o l o o un par de aretes t a m b i n c o n dicho distintivo. A continuacin se p r e s e n t a la informacin c o n respecto a la c a n t i d a d de o b s e q u i o s s e l e c c i o n a d o s p a r a una m u e s t r a de 5 0 0 n u e v o s
2Z/
Captulo 15
Clasificacin por buscador Jugadora Cora Jean Sos Bette Jones Jeannie Black Norma Tidwe Cata Mariscal Jean Cann 7 2 10 1 6 John Cannelli 5 4 10 3 6 Jugadora Candy Jenkins Rita Rosinski Anita Lpez BrendaTowne DeniseOber Clasificacin por buscador Jean Cann 3 5 4 8 9 John Cannelli 1 7 2 9 8
a) Determine el coeficiente de correlacin de rangos de S p e a r m a n . b) Al nivel de significancia de 0.05, se p u e d e concluir q u e hay una asociacin positiva entre los rangos?
II. La p r u e b a del valor m e d i a n o se usa p a r a probar una hiptesis acerca de la m e d i a n a de una poblacin. A. Se aplica la a p r o x i m a c i n n o r m a l a la disthbucin binomial. B. S e usa la distribucin z c o m o el valor estadstico de pr ueba. C. El valor z s e calcula a partir de la f r m u l a que sigue, donde X e s el nmero de observaciones por a r h b a o p o r abajo de la m e d i a n a . ^^JXa50)-^^ o III. La p r u e b a de rangos c o n signo, de W i l c o x o n . A. Los datos c u a n d o m e n o s d e b e n estar en e s c a l a ordinal y las muestras d e b e n ser d e p e n dientes. B. Los pasos para realizar la p r u e b a s o n : 1. Se a s i g n a n rangos a las diferencias absolutas entre las observaciones relacionadas. 2. Se r e c o n o c e n los e m p a t e s y se otorgan signos apropiados a los rangos. 3. Se efectan las s u m a s de los rangos negativos y positivos. 4. La menor de las dos s u m a s e s el valor 7 c a l c u l a d o . 5. C o n s u l t a n d o el valor crtico e n el A p n d i c e J, se t o m a u n a decisin con respecto a /-/. IV. La p r u e b a de s u m a de rangos de W i l c o x o n se usa para evaluar si dos muestras independientes surgieron de poblaciones iguales. A. No se requiere n i n g u n a c o n s i d e r a c i n respecto de la f o r m a de la poblacin. B. Para aplicar d i c h a p r u e b a , los datos c u a n d o m e n o s d e b e n estar en escala ordinal. C. C a d a muestra d e b e contener al m e n o s ocho observaciones. D. Para d e t e r m i n a r el valor estadstico de p r u e b a W, se asignan rangos a todos los datos, de m e n o r a mayor, c o m o si fuer an de una sola poblacin. E. Se d e t e r m i n a la s u m a de rangos para c a d a una de las dos muestras. F. Ws& usa para calcular z, d o n d e W B S la s u m a de los rangos para la poblacin 1 , a partir de y^, n , ( n , + n; + 1) [15-1]
z=
,
/ nin2{n, + 03 + 1) 12
[15-4]
22y
575
G. La distribucin z se utiliza c o m o el v a l o r estadstico d e prueba. V. A N O V A por r a n g o s en un sentido, de Krusi<ai-Wallis. A. N o se n e c e s i t a n consideraciones r e s p e c t o a la f o r m a de ias poblaciones. B. Las m u e s t r a s d e b e n ser i n d e p e n d i e n t e s y estar al m e n o s en escala ordinal. C. S e utiliza p a r a probar si varias p o b l a c i o n e s son i d n t i c a s . D. S e a s i g n a n rangos a las o b s e r v a c i o n e s mustrales, d e s d e el ms p e q u e o hasta el m s grande, c o m o si fueran un solo g r u p o . E. La distribucin de ji cuadrada p u e d e usarse c o m o valor estadstico de p r u e b a , siempre que haya al m e n o s 5 o b s e r v a c i o n e s e n c a d a m u e s t r a . F. El valor estadstico de p r u e b a se c a l c u l a por m e d i o de la siguiente f r m u l a :
n { n + 1) V I . El coeficiente d e correlacin de rangos de S p e a r m a n es u n a medida de la asociacin entre d o s variables s e g n escala ordinal. A. P u e d e i r d e - 1 a l . 1. Un valor de O indica que no hay asociacin e n t r e las variables. 2. Un valor de - 1 indica una c o r r e l a c i n negativa perfecta, y 1 es u n a correlacin positiva perfecta. B. El valor de s e calcula a partir d e la siguiente f r m u l a :
r 3 = 1 - ^ ^ n(n==-1) C.
[15-6]
f='-s
/ - ^ ^ V 1-r|
[15-7]
1. 2.
Simbologa
SIMBOLO (Sf,)^ r. SIGNIFICADO C u a d r a d o del total d e los rangos d e la p r i m e r a c o l u m n a C o e f i c i e n t e d e c o r r e l a c i n de r a n g o s r sub s FORMA EXPRESIVA Sigma R sub 1 al cuadrado
I
29.
30.