Académique Documents
Professionnel Documents
Culture Documents
(uso interno)
Test de independencia de X2
1
Métodos Cuantitativos 2014
Variable A
Presencia a b a+b
2
Métodos Cuantitativos 2014
3
Métodos Cuantitativos 2014
4
Métodos Cuantitativos 2014
“Adherencia a las inmunizaciones en niños nacidos con menos de 1.500 gr de peso o antes
de 32 semanas de gestación, en dos centros chilenos”.
Neonatos pretérmino con menos de 1500 gr. o antes de 32 semanas de gestación presentan
una morbilidad y mortalidad aumentada debido a enfermedades infecciosas. La inmunización
en estos niños es crítica pero a menudo es incompleta y presenta retrasos. Objetivos:
Describir la adherencia a vacunas programadas y adicionales, recomendadas en
pretérminos menores de 1500 gr. y comparar el nivel de conformidad en dos centros.
Pacientes y Métodos: Se incluyeron prematuros de menos de 1500 gr. nacidos entre enero
de 2006 y diciembre de 2008 en un centro privado (HCPUC) y en un centro del sistema de
salud pública (HSR). Fueron revisados gráficos neonatales y registros de seguimiento.
Fueron registrados datos demográficos, diagnósticos, programa de vacunación, retrasos y
sus causas y prescripción de vacunas adicionales. Resultados: 92 niños provenientes del
HCPUC y 246 del HSR. Entre éstos el 60 – 70% respectivamente tenías atraso en las
inmunizaciones. Las razones para ello fueron consideradas como no justificables en cerca
del 80% de los casos, siendo la razón principal la supervisión o falta de tiempo de los padres.
El uso de vacunas adicionales sigue siendo bajo en ambos centros. Conclusión: En Chile la
vacunación de prematuros requiere mejoras importantes, educación de padres y del personal
de salud, inclusión de registros computarizados e inclusión de nuevas vacunas seguras y
eficaces en el programa regular de inmunización sin costo para el paciente.
5
Métodos Cuantitativos 2014
si hay o no una diferencia que consideremos como estadísticamente significativa para una o
más variables entre dos poblaciones.
Existen múltiples tests que nos permiten analizar una asociación existente entre dos
variables. El test a utilizar depende: 1) del tipo de variable analizada; 2) de la escala en la
cual dicha variable ha sido medida; 3) de si las observaciones son independientes o se trata
de observaciones apareadas.
El más común de los test utilizados para el estudio de la asociación existente entre dos
variables cualitativas medidas en escala nominal con datos no apareados es el test de Chi
cuadrado; en el caso de dos variables cualitativas con dos categorías cada una puede
también utilizarse el test exacto de Fisher en determinados casos como ya veremos.
La distribución (X2k) se usa para distintos problemas estadísticos como ser pruebas de
independencia, pruebas de homogeneidad y pruebas de bondad de ajuste, en este curso
veremos la primera de las aplicaciones mencionadas, es decir, sólo nos concentraremos en
el test de Chi-cuadrado para pruebas de independencia entre dos variables cualitativas.
Estaremos en condiciones entonces de determinar si dos variables cualitativas están o no
asociadas.
Para la aplicación del test trabajaremos bajo los siguientes supuestos o condiciones de
aplicación del test: a) la muestra de n observaciones es aleatoria e independiente y b) las
categorías con las que se trabaja son mutuamente excluyentes.
Al igual a lo visto anteriormente en el curso, al aplicar un test estadístico, deberemos fijar las
hipótesis con las que trabajaremos.
6
Métodos Cuantitativos 2014
Para contrastar las hipótesis planteadas debemos calcular las frecuencias esperadas para
cada celda de la tabla de r filas y k columnas bajo el supuesto de la hipótesis nula, o sea de
que existe independencia entre las variables a estudiar.
Con los totales marginales fijos, tenemos que la frecuencia esperada en la celda de la fila i y
columna j, será la probabilidad de que un individuo pertenezca a la categoría i de la variable
A y a la categoría j de la variable B, multiplicada por n. Así calcularemos las frecuencias
esperadas para cada celda. El test de chi-cuadrado se basa en la comparación de las
frecuencias observadas, y de las frecuencias esperadas en caso de independencia, para
cada una de las celdas de la tabla.
7
Métodos Cuantitativos 2014
Supongamos que al igual que los investigadores del estudio, nos interesa conocer si existe
asociación entre la presencia de Displasia Broncopulmonar y el Centro de Procedencia.
Ambas variables son cualitativas y medidas en escala nominal.
Lo primero que haremos es construir la tabla de frecuencias observadas según los datos que
tenemos del estudio.
HCPUC HSR
Planteo de hipótesis.
8
Métodos Cuantitativos 2014
Calcularemos las frecuencias esperadas para cada celda bajo el supuesto de que la
hipótesis nula es cierta.
Para ello, tengamos en cuenta el cuadro anterior sólo con las frecuencias marginales:
HCPUC HSR
Si existiese independencia entre ambas variables, el 17.8% de los 92 casos que provienen
del HCPUC y el 17.8% de los 246 casos que provienen del HSR corresponderían a
presencia de Displasia Broncopulmonar (primera fila). En consecuencia, el 82.2% de los 92
niños del HCPUC se ubicarían en la fila de ausencia para la displasia broncopulmonar, al
igual que el 82.2% de los 246 niños del HSR. El 17.8% de 92 y 246 son 16.33 y 43.67
respectivamente. El 82.2% de 92 y 246 son 75.67 y 202.33 respectivamente. De lo anterior
podemos construir la siguiente tabla:
HCPUC HSR
9
Métodos Cuantitativos 2014
Resulta interesante señalar que el cálculo de las frecuencias esperadas para cada una de las
celdas puede realizarse como fue descrito anteriormente, o lo que es lo mismo, multiplicando
el total de la columna correspondiente por el total de la fila correspondiente dividido por el
total de totales; en nuestro ejemplo:
Otro aspecto a tener en cuenta es el relativo a los valores obtenidos con las frecuencias
absolutas esperadas. Si alguna de las celdas presenta frecuencias esperadas menores a 5,
es preferible no aplicar para los cálculos el Chi cuadrado como está siendo descrito en este
material sino el Chi cuadrado corregido (corrección de Yates) o incluso el test exacto de
Fisher en el caso que las frecuencias esperadas obtenidas se aproximen al cero y que
estemos en presencia de una tabla tetracórica.
Previo a realizar cualquier cálculo estadístico deberemos haber fijado el nivel de significación
o probabilidad de error de tipo I, que nos permitirá tomar una decisión acerca de las hipótesis
planteadas, en nuestro ejemplo trabajaremos para un valor de α = 5%.
k
(Oi − Ei )
2
El estadístico de prueba es χ =∑
2
donde Oi son las frecuencias absolutas
i =1 EI
observadas y Ei son las frecuencias absolutas esperadas para cada una de las celdas,
debiéndose realizar la sumatoria desde la 1 a k celdas que conforman el cuadro de doble
entrada.
De esta forma, el estadístico calculado mide la diferencia entre el valor observado y el valor
que debiera resultar si las dos variables fuesen independientes, elevado al cuadrado y
ponderado por el valor esperado en caso de independencia.
10
Métodos Cuantitativos 2014
Debemos además recordar que estamos frente a un test no dirigido (de planteo bilateral),
que nos indicará si existe o no asociación entre las variables pero no en que sentido se
produce tal asociación.
Bajo la hipótesis nula de independencia sabemos que los valores del estadístico se
distribuyen según una distribución conocida denominada ji-cuadrado, la cual depende de un
parámetro al que denominamos grados de libertad (gl).
Cálculo de los grados de libertad: Los grados de libertad son el número de unidades de
información “independientes” usadas para calcular un test estadístico en particular. En el
caso del Chi cuadrado, y en este ejemplo, siendo la tabla de r filas y k columnas, los gl son
igual al producto del número de filas menos 1 (r – 1) por el número de columnas menos 1 (k
– 1).
Si tenemos en cuenta la tabla utilizada para los cálculos, y dejando fijos los totales
marginales de las líneas y las columnas, tenemos la “libertad” de fijar una sola de las celdas
de la tabla, las otras se determinan por ese único valor de una celda en una tabla de 2 x 2.
En el caso de una tabla de 3 x 2 tendremos la “libertad” de fijar el valor de hasta dos celdas,
y así sucesivamente.
Con el fin de definir la zona para los valores del estadístico que permiten rechazar la
hipótesis nula es que utilizaremos el nivel de significación prefijado y los gl calculados. Esta
zona es a la que llamamos región crítica.
11
Métodos Cuantitativos 2014
Valor-p
Como puede observarse el valor del estadístico es menor al valor de la tabla (0.28 < 3.84)
concluyendo el no rechazo de la hipótesis nula.
Con lo que estamos en condiciones de afirmar que las variables: presencia de displasia
broncopulmonar y centro de procedencia no se encuentran asociadas.
Nota: hemos desarrollado un ejemplo práctico con variables cualitativas nominales, debiendo
recordar que aquellas medidas en escala ordinal también son válidas de trabajar con este
test utilizando una modificación del mismo: el chi cuadrado de tendencias.
12
Métodos Cuantitativos 2014
Proporciones de 2 muestras
En el estudio Maron y col (1986) con adolescentes, se encontró que 165 de 712 varones
declararon que siempre usaban cinturón de seguridad, frente a 91 de 641 adolescentes
mujeres. Interesa calcular el intervalo de confianza para la diferencia de las proporciones de
uso de cinturón entre varones y mujeres.( ejemplo tomado de Altman,1991)
165
pˆ1 = = 0.232;
712
91
pˆ 2 = = 0.142;
641
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
EE ( p1 − p2 ) = +
n1 n2
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
( pˆ1 − pˆ 2 ) ± Zα / 2 +
n1 n2
Usando los datos del ejemplo, para el calculo de un intervalo al 95% de confianza:
Resultando en [ 0.05 ; 0.13] , con una estimación puntual de 0.090. Tenemos una confianza
de 95% que la proporción de varones que usan cinturón está entre 0.05 y 0.13 por encima
del uso de cinturón en mujeres adolescentes.
13
Métodos Cuantitativos 2014
Se pretende rechazar la hipótesis nula Ho) P1=P2 a favor de algunas de las hipótesis
alternativas posibles
Como la hipótesis nula indica que la dos proporciones son iguales, podemos obtener el
estimador común de la proporción:
n1 pˆ1 + n2 pˆ 2 x1 + x2
pˆ = =
n1 + n2 n1 + n2
El estadístico resulta:
pˆ1 − pˆ 2
z=
1 1
pˆ (1 − pˆ ) +
n1 n2
La historia de bronquitis en edad temprana puede ser un predictor de futuras tos nocturna a
los 14 años .En una muestra de 273 niños con historia de bronquitis antes de los 5años, 26
de los cuales presentan tos nocturna a los 14 años. De una muestra de 1046 niños sin
historia de bronquitis , 44 presentan tos a los 14 años. Interesa saber si la proporción de
individuos con tos es mayor en el grupo con historia de bronquitis.
14
Métodos Cuantitativos 2014
Si No
Si 26 44 70
Ho) P1=P2
Ha) P1>P2
26 44
pˆ 1 = = 0.09524, pˆ 2 = = 0.04207
273 1046
La proporción común es
26 + 44
pˆ = = 0.05307
273 + 1046
Como 3.49 > 1.65 se rechaza la hipótesis de igualdad y se concluye que la proporción de
individuos con tos a los 14 es mayor en aquellos con historia de bronquitis en la infancia, a
un nivel de significación de 5%.
Como podemos ver, cuando tenemos que comparar las proporciones de dos muestras
independientes podemos usar tanto el contraste de proporciones como el test de
independencia.
15