Académique Documents
Professionnel Documents
Culture Documents
Prueba CHI-CUADRADO
O1 + O2 + ... + O k = n
E1 + E2 + ... + E k = n
Notas:
(1) El valor del estadstico 2 se podr aproximar por una distribucin Chi-cuadrado
cuando el tamao muestral n sea grande (n > 30), y todas las frecuencias
esperadas sean iguales o mayores a 5 (en ocasiones deberemos agrupar varias
categoras a fin de que se cumpla este requisito).
(2) Las observaciones son obtenidas mediante muestreo aleatorio a partir de una
poblacin particionada en categoras.
Un experimento multinomial es la generalizacin de un
experimento binomial:
Ei = n * pi i = 1, ..., k
EJEMPLO
Canal Bebidas
consumidas
1 13
2 22
3 18
4 17
tot 70
Prueba Chi-cuadrado en
Tablas de Contingencia.
Una variable categrica es aquella cuya escala de medida consiste
en un conjunto de categoras. Estas escalas categricas son muy
comunes en ciencias sociales, ciencias biolgicas y en estudios de
variables que miden comportamiento. Segn el nmero de variables
que observemos y el nmero de categoras que tenga cada variable,
los individuos de una poblacin se agrupan dando lugar a las
frecuencias observadas para cada alternativa de clasificacin. Los
datos dispuestos de esta forma se llaman tablas de contingencia.
.
.
muestra m nm1 nm2 nm
(116 102) 2
(84 98) 2
(113 127) 2
(137 123) 2
c2 7,06
102 98 127 123
El valor-p asociado es:
valor p P( ( r 1)(c1) c )
2 2
FACTOR Y
Tota
Y1 Y2 ... Yj
l
F X1 n11 n12 ... n1j n1.
A
C X2 n21 n22 ... n2j n2.
T
O ... ... ... ... ... ...
R
Xi ni1 ni2 ... nij ni.
X
Total n.1 n.2 ... n.j n..
Los grados de libertad son: el nmero de filas menos uno , por el nmero
de columnas menos uno
Recordemos que dos eventos son independientes, si la
probabilidad que ocurran juntos se puede calcular como
el producto de sus probabilidades individuales. Por
ejemplo, suponga que la probabilidad de que un alumno
pase de curso es 1/2 y que se cambie de colegio es de
1/3, por lo tanto la probabilidad de que pase de curso y
se cambie de colegio es 1/6. Se puede plantear la
hiptesis de que las variables aleatorias consideradas
en el experimento son independientes versus que no
son independientes.
OBSERVADOS Sobrepeso
xito Si No Total
Si 162 263 425
No 38 37 75
Total 200 300 500
El investigador, lo que en realidad est probando es si existe
independencia entre estas dos variables.
(O ij E ij ) 2
El Estadstico de prueba es: 2
c i, j E ij
, donde
n i. * n . j
(*) E ij , es la frecuencia esperada bajo H0 y Oij es la
n .. frecuencia observada y se encuentra en la
muestra.
Solucin
ESPERADOS Sobrepeso
xito Si No Total
Si E11 =170 E12 = 255 425
No E21 = 30 E22 = 45 75
Total 200 300 500
Note que los totales son iguales a las frecuencias observadas.
La Estadstica de prueba es:
(162 170) 2
( 263 255) 2
(38 30) 2
(37 45) 2
c2 4,183
170 255 30 45
El valor p asociado a esta prueba es:
valor p P( ( r 1)(c1) c )
2 2 r = n de filas
c = n de columnas