13 Inferencia Cualitativas

13.
Relaciones entre dos variables cualitativas (Inferencia)
Problema: ¿Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de

enseñanza básica?
Estado Nutricional
Malo Regular Bueno TOTAL
Bajo 130 95 30 255
Rendimiento
Promedio 90 450 35 575
Académico
Sobre 70 30 70 170
TOTAL 290 575 135 1000
Ya vimos cómo podemos describir los datos que provienen de este tipo de problema, mediante tablas de
contingencia o de doble entrada. En esta unidad revisaremos los test estadísticos disponibles, el test de
Ji cuadrado y el test F.
Test de Ji-cuadrado
Existen varios tests de Ji cuadrado* que sirven para contestar distintas preguntas, pero estos tienen
ciertas características comunes:
1. Los datos consisten en frecuencias observadas (O), esto es, cuantos ítems o sujetos caen en cada
categoría.
2. Se calculan las frecuencias esperadas (E) bajo H 0 , esto es, las frecuencias que esperamos ver en
cada categoría si la correspondiente hipótesis nula es correcta.
3. Comparamos las frecuencias observadas con las esperadas por medio del test estadístico que será
una medida de cuán cerca están las frecuencias observadas de las frecuencias esperadas bajo H 0 .
Entonces, si la "distancia" es grande, tenemos evidencia para rechazar H 0 . El test de Ji cuadrado
es:
 
2 O  E2
E
Si las frecuencias observadas están cerca de las frecuencias esperadas bajo H 0 , entonces el
estadístico de  2 debe ser chico. Valores grandes del estadístico indican diferencias entre lo
observado y lo esperado. Como sólo valores grandes son evidencia a favor de la hipótesis
alternativa, los tests de Ji cuadrado son unilaterales y la dirección del extremo es hacia la derecha.
El valor-p será la probabilidad de observar un test estadístico igual o mayor al calculado,
asumiendo que la hipótesis nula es cierta.
4. La relación entre el test y la distribución funciona bien siempre cuando el número esperado es al
menos 5. En general los softwares estadísticos verifican este supuesto.
*
Esencialmente la prueba de asociación que veremos aquí y las pruebas de bondad de ajuste.
1
Propiedades de la distribución de Ji-cuadrado   gl 
2
- La distribución no es simétrica, es sesgada a la derecha

- Sus valores son cero o positivos, no negativos.
- La distribución está definida por el número de grados de libertad.
- El promedio de la distribución de Ji-cuadrado es igual a sus grados de libertad.
- La varianza de la distribución de Ji-cuadrado es dos veces sus grados de libertad (2 gl).
gl=1
gl=4
gl=10
0 5 10 15 20 2

X de libertad
Figura: Distribuciones de Ji cuadrado con distintos grados
2
Tabla de Ji cuadrado
3
Prueba de asociación o de independencia*
La prueba de asociación, permite al investigador saber si existe asociación entre dos variables cualitativas.
Ejemplo: Para evaluar un nuevo tratamiento, cuyos resultados son desconocidos, se trata a 12
pacientes con el nuevo tratamiento y a 13 pacientes (seleccionados aleatoriamente) con un tratamiento
antiguo y se registra si mejora o no.
Tratamiento
Experimental Antiguo Total
Estado Mejora 9 2 11
No mejora 3 11 14
Total 12 13 25
a) Planteamiento de la hipótesis
Hipótesis de nulidad ( H 0 ): No hay asociación entre el estado del paciente y el tratamiento, es decir, el
porcentaje de pacientes que mejora es el mismo, sin importar a qué tratamiento fue sometido.
Simbólicamente, H 0 : Pexp  Pant en que P representa el porcentaje de mejoría.
Hipótesis alternativa ( H 1 ): Hay asociación entre el estado del paciente y el tratamiento, es decir, el
porcentaje de pacientes que mejora es diferente entre los sometidos al tratamiento experimental y los
sometidos al tratamiento antiguo.
Simbólicamente, H 1 : Pexp  Pant
Estadística a utilizar:
fxc ( Oi  E i ) 2
2  
i 1 Ei
en que:
Oi = frecuencia observada en la celda i
E i = frecuencia esperada en la celda i
fxc = número de celdas, se obtiene multiplicando número de filas (f) por número de columnas (c).
En este problema =4
b) Cálculo del Ji-cuadrado
Bajo la hipótesis nula, no hay asociación entre el estado del paciente y el tratamiento; por lo tanto, el
porcentaje que mejora debería ser el mismo para los dos tratamientos. Su mejor estimación será: 11/25,
44%, vale decir, el porcentaje de mejoría observado en el total. La frecuencia esperada ( Ei ) de los que
mejoran la obtenemos aplicando este porcentaje a los totales marginales, respectivamente.
11 11
E1   12  5,28 E2   13  5,72
25 25
*
Algunos textos hacen la distinción entre una prueba de Ji cuadrado de independencia y una prueba de Ji cuadrado de
homogeneidad. El cálculo y la interpretación práctica de cada procedimiento son idénticos. Utilizamos la prueba de
asociación para incluir ambos tipos.
4
Por analogía, la frecuencia esperada ( Ei ) de los que no mejoran la obtendremos aplicando 14/25, 56% el
porcentaje de los que no mejoran a los totales marginales, respectivamente.
14 14
E3   12  6,72 E4   13  7,28
25 25
Una manera alternativa para el cálculo de las frecuencias esperadas para determinada celda utiliza los
totales de la fila y de la columna en que se encuentra el valor observado de la celda:
E = (total fila x total columna)/ Total
El estadístico observado a partir de los datos de este ejemplo es:
 OBS
2

 9  5,28 2 
 2  5,72  2 
 3  6,72  2 
11  7,28 2  9,000
5,28 5,72 6,72 7,28
c) Grados de libertad
Este test de Ji cuadrado tiene distribución de Ji cuadrado con (número de filas - 1) x (número de
columnas - 1) grados de libertad.
En este ejemplo, (2-1) x (2-1) = 1 grado de libertad
Comparemos con la salida del SPSS:
Pruebas de chi-cuadrado
Sig. asintótica Sig. exacta Sig. exacta

Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 9.000b 1 .003
Corrección por
a 6.744 1 .009
continuidad
Razón de verosimilitudes 9.638 1 .002
Estadístico exacto de
.005 .004
Fisher
Asociación lineal por
8.640 1 .003
lineal
N de casos válidos 25
a. Calculado sólo para una tabla de 2x2.
b. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada
es 5.28.
5
Supuestos del test de Ji cuadrado
La prueba de Ji cuadrado no asume distribución alguna para las observaciones, es decir es una prueba
no paramétrica. Un supuesto básico al utilizar esta prueba consiste en que cada observación registrada
en la tabla de contingencia es independiente de las demás. "Independencia" en este contexto significa
que no más de una observación viene de cada unidad observacional. La unidad más común es una
persona. Si hay 96 personas en estudio, el número total de observaciones en la tabla de contingencia
deberá ser 96. Si la misma persona contribuye en más de una entrada en una tabla, la prueba de Ji
cuadrada no es apropiada.
Por último, un supuesto importante es saber que el estadístico de Ji cuadrado sigue una distribución de
Ji cuadrado siempre que los valores esperados sean mayores que 5, si esto no se cumple, el test no es
válido.
¿Qué hacer si tenemos frecuencias esperadas menores que 5?
El test de probabilidad exacta de Fisher
Se utiliza para el análisis de tablas de contingencia cuando no se cumple el requisito del tamaño mínimo
para aplicar el método de Ji cuadrado, que exige que los valores esperados en cada celda de la tabla sean al
menos 5. El test de probabilidad exacta de Fisher requiere el cálculo de las probabilidades individuales
para las distintas maneras (combinaciones) en que pueden aparecer las frecuencias dentro de las celdas de
la tabla de contingencia, manteniendo constantes las frecuencias marginales.
No vamos a revisar los cálculos para la prueba de Fisher sino que revisaremos la solución que nos da la
salida SPSS cuando analizamos tablas de contingencia.
6
Paradoja de Simpson (opcional)
Ya hemos revisado el problema de las variables confundentes, el efecto de estas variables podría
influenciar la asociación entre dos variables categóricas.
Ejemplo: Suponga que el Ministerio de Salud nos entrega datos sobre la mortalidad de dos Hospitales
de la Región. Los datos en una tabla de 2x2 nos muestran la sobrevivencia de pacientes después de
cirugía en el hospital A y B, donde sobrevivencia significa que el paciente está vivo al menos 6
semanas después de la cirugía.
HOSPITAL
A B
Estado Vivo 2037 784
paciente Muerto 63 16
Total 2100 800
Hospital A pierde 63/2100 = 3% de los pacientes de cirugía y Hospital B pierde 16/800 = 2% de los
pacientes de cirugía. Concluimos que el Hospital B es "mejor".
Pero, no todas las cirugías son del mismo tipo. Luego, se entregan nuevos datos que incluyen la
condición de los pacientes antes de la cirugía clasificados como "buena" o "mala".
Buena condición Mala condición

Hospital Hospital
A B A B
Estado Sobrevive 594 592 Estado Sobrevive 1443 192
Muere 6 8 Muere 57 8
Total 600 600 Total 1500 200
Si analizamos ahora según la condición, resulta que en el Hospital A sólo 6/600 = 1% muere y en el
Hospital B 8/600 = 1,3% muere entre los pacientes que estaban en buenas condiciones. Entre los
pacientes que están en malas condiciones en el Hospital A sólo 57/1500 = 3,8% muere y en el Hospital
B 8/200 = 4% muere. Este fenómeno es conocido como la paradoja de Simpson.

13 Inferencia Cualitativas

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

13 Inferencia Cualitativas

Transféré par

Droits d'auteur :

Formats disponibles

13.

Relaciones entre dos variables cualitativas (Inferencia)

Problema: ¿Existe relación entre el estado nutricional y el rendimiento académico de estudiantes de

Bajo 130 95 30 255

- La distribución no es simétrica, es sesgada a la derecha

Simbólicamente, H 0 : Pexp  Pant en que P representa el porcentaje de mejoría.

Simbólicamente, H 1 : Pexp  Pant

b) Cálculo del Ji-cuadrado

E = (total fila x total columna)/ Total

El estadístico observado a partir de los datos de este ejemplo es:

En este ejemplo, (2-1) x (2-1) = 1 grado de libertad

Comparemos con la salida del SPSS:

Sig. asintótica Sig. exacta Sig. exacta

¿Qué hacer si tenemos frecuencias esperadas menores que 5?

El test de probabilidad exacta de Fisher

Buena condición Mala condición

Vous aimerez peut-être aussi