Vous êtes sur la page 1sur 5

Pruebas de contraste de hiptesis para

variables cualitativas.
Introduccin
En numerosas ocasiones, se necesita analizar la relacin de dependencia o
independencia entre dos variables de tipo cualitativo o categrico. A estas variables
tambin se les denomina factores, mientras que a las distintas categoras de la variable
se les suele denominar niveles. Existen diferentes pruebas para medir la dependencia
entre dos variables cualitativas, entre ellas la prueba ji-cuadrado en sus diferentes
versiones. En este captulo repasaremos las pruebas estadsticas ms utilizadas en la
investigacin biomdica para cruzar variables categricas, as como ejemplos que
faciliten su comprensin.
Supongamos que realizamos un estudio en 45 pacientes en el que deseamos estudiar la
relacin entre el hbito tabquico y EPOC diagnosticado mediante espirometra
obteniendo los resultados de la Tabla I. Podemos ver que 15 pacientes de 25 (60%)
tenan EPOC dentro del grupo de fumadores, mientras que tan solo 5 de 20 (25%)
presentaron EPOC en el grupo de no fumadores. Desde un punto de vista clnico las
diferencias son importantes, pero lo sern desde un punto de vista estadstico?
Tabla I. Relacin entre EPOC y hbito tabquico. Frecuencias observadas y
porcentajes de columna.

Fumador
EPOC
No
S
Total

No
15 (75%)
5 (25%)
20 (100%)

S
10 (40%)
15 (60%)
25 (100%)

Total
25 (55,6%)
20 (44,4%)
45 (100%)

Prueba ji-cuadrado (X2)


La prueba ji-cuadrado de Pearson (X2) es una de las pruebas ms utilizadas en el mbito
de la medicina y la biologa. Esta prueba no mide el grado o la fuerza de la asociacin
entre dos variables categricas, para ello ya existen medidas como la odds ratio o el
riesgo relativo, adecuadas para estos fines. Se aplica principalmente para estudiar la
asociacin entre dos variables categricas o cualitativas y para comparar proporciones o
porcentajes. Su uso no est restringido nicamente para variables dicotmicas. Si alguna
de las dos variables es de naturaleza ordinal, se debe aplicar la prueba ji-cuadrado de
tendencia lineal como veremos ms adelante.
Tambin podremos encontrarla bajo el nombre de chi-cuadrado, siendo su origen la
traduccin al castellano del trmino ingls chi-squared. Ya que el nombre en
castellano para la letra griega X es ji, utilizaremos esta denominacin. La prueba X2
puede aplicarse con una sola variable para comparar valores observados respecto a
esperados, aunque su uso ms frecuente es para comparar dos proporciones. Una de sus
limitaciones es que requiere un tamao muestral suficientemente grande y aunque su
clculo es sencillo, no lo es tanto el entender su procedencia y su interpretacin.

Simplemente diremos que los valores que toma el estadstico ji-cuadrado con un grado
de libertad corresponden a los obtenidos a una distribucin normal tipificada elevados al
cuadrado, y que por tanto la prueba ji-cuadrado solo tiene una cola tomando nicamente
valores positivos.
La expresin de la prueba ji-cuadrado es la siguiente:
Obs: frecuencias observadas.
Esp: frecuencias esperadas.
En nuestro ejemplo de la Tabla I hemos cruzado dos variables cualitativas EPOC y
fumador con dos categoras cada una. Excluyendo las celdas de los totales
(denominadas marginales) obtenemos una tabla de 2 filas por 2 columnas. Una vez
conocidos los totales para cada categora, si sabemos la frecuencia de una de las celdas,
es fcil deducir las frecuencias de las dems. Por ello se dice que tenemos 1 grado de
libertad, ya que conocidos los marginales, slo tenemos la libertad de poner valores
en una de las celdas, porque las dems ya vienen impuestas por los datos. Para tablas de
n filas y m columnas, los grados de libertad se calcularan como (n 1) x (m 1).
En el ejemplo, si sabemos que hay 15 fumadores con EPOC, conocidas las frecuencias
marginales es fcil completar el resto de la tabla. Tenemos por lo tanto un solo grado de
libertad.
Nuestra hiptesis nula (Ho) sera la que afirma que la proporcin de pacientes con
EPOC es la misma en el grupo de fumadores que en el de no fumadores. Nuestra
hiptesis alternativa (H1), por el contrario, afirmara que estas proporciones son
distintas. Si la proporcin es distinta, tenemos en cuenta las dos posibilidades que
existen: que la proporcin de pacientes con EPOC sea ms alta o ms baja en los
fumadores, por lo tanto la prueba es bilateral o tambin denominada de dos colas.

Si al calcular los valores de la expresin X2, que es la diferencia entre lo observado y lo


esperado, sobrepasamos cierto valor crtico, diremos que las diferencias encontradas son
demasiado grandes como para poder ser explicadas por el azar. Si en nuestro estudio
tenemos 20 pacientes con EPOC de 45 personas (44%), para que la hiptesis nula fuese
cierta, tendramos que tener la misma proporcin de pacientes con EPOC en los
fumadores y en los no fumadores. Es decir, de los 25 fumadores, esperamos tener
(25*20)/45, que seran 11 fumadores aproximadamente. De este modo obtendramos las
frecuencias esperadas para el resto de las 3 celdas (Tabla II). Una vez conocidas las
frecuencias esperadas, slo nos queda calcular el valor de la expresin X2 que es una
simple suma de unas diferencias al cuadrado:
Tabla II. Relacin entre EPOC y hbito tabquico. Frecuencias esperadas.
Fumador
EPOC
No
S

No
11,1 (55,6%)
8,9 (44,4%)

S
13,9 (55,6%)
11,1 (44,4%)

Total
25 (55,6%)
20 (44,4%)

Total

20

25

45

Si miramos en las tablas de la distribucin ji-cuadrado para un grado de libertad,


podemos ver que la significacin estadstica p<=0,05, se alcanza para aquellos valores
de X2 iguales o superiores a 3,84. Como el valor obtenido en nuestro estudio; 5,51 es
mayor al valor crtico de 3,84, podemos rechazar la hiptesis nula (H0) y afirmar que las
diferencias encontradas difcilmente pueden ser explicadas por el azar, siendo mayor la
proporcin de pacientes con EPOC en los fumadores (p<0,05). Como puede
comprobarse, el valor del estadstico ji-cuadrado no cambia al permutar las filas por las
columnas. Si recordamos un poco la distribucin normal tipificada (media 0 y
desviacin tpica 1), el intervalo (-1,96; +1,96) recoge el 95% de la probabilidad,
dejando solo un 5% fuera. Precisamente (1,96)2 es 3,84. Si disponemos de un ordenador
o en su defecto de una tabla con los valores de p y de la X2, podremos ver que el valor
de p asociado a una X2=5,51 con un grado de libertad es de p=0,019.
Para aplicar correctamente la prueba ji-cuadrado, al menos el 80% de las celdas debe
tener una frecuencia esperada mayor de 5. Si esto no es as, siempre tenemos el recurso
de agrupar categoras excepto cuando nuestra tabla sea de 22 (ambas variables
dicotmicas), en cuyo caso debemos utilizar la prueba exacta de Fisher.
A veces se introduce una modificacin en el clculo de la expresin X2, denominada
correccin de Yates o correccin por continuidad, siendo su efecto mnimo en muestras
de gran tamao. La consecuencia de su aplicacin es una reduccin del valor final de la
ji-cuadrado, y por tanto la hace un poco ms conservadora. Si bien no existe consenso
en la literatura sobre su utilizacin, su uso se debe al hecho de que en ocasiones
variables numricas se transforman en dicotmicas con un punto de corte.
Otras pruebas de contraste de hiptesis entre variables categricas
Una variante de la prueba X2 de Pearson para contrastar la hiptesis de independencia
entre variables categricas, es la razn de verosimilitud ji-cuadrado. A diferencia de la
ji-cuadrado de Pearson, esta prueba se basa en el cociente de los logaritmos de las
frecuencias observadas y esperadas.
Existe una serie de medidas con las que podemos medir el grado de asociacin entre
variables categricas aparte de los ya conocidos riesgos relativos y odds ratios. Entre el
conjunto de pruebas que miden el grado de dependencia entre variables categricas
nominales se encuentran el coeficiente de contingencia, la V de Cramer, las Lambdas
simtricas y asimtricas y los coeficientes de incertidumbre simtrico y asimtrico. En
general, todas estas pruebas (a excepcin del coeficiente de contingencia en tablas de
ms de 22) toma valores dentro de un rango de 0 a 1, donde el 0 nos indicara no
asociacin entre variables y el 1, una fuerte asociacin. Todas estas pruebas pueden
encontrarse en paquetes estadsticos como el SPSS.
Tambin nos puede surgir en algn momento la necesidad de cruzar dos variables
categricas con la particularidad de que una de ellas es ordinal. Imaginemos que

deseemos cruzar el consumo de tabaco medido en tres categoras: no fumador, fumador


moderado, fumador alto, con EPOC (Tabla III). Podemos ver claramente, que la
proporcin de pacientes con EPOC aumenta con el consumo de tabaco.
Tabla III. Relacin EPOC y hbito tabquico.

EPOC
No
S
Total

No fumador
23 (76,7)
7 (23,3)
30 (100%)

Hbito
tabquico
Moderado
19 (63,3)
11 (36,7)
30 (100%)

Alto
15 (50,0)
15 (50,0)
30 (100%)

Total
57 (63,3%)
33 (36,7%)
90 (100%)

Si calculsemos en este ejemplo el estadstico ji-cuadrado, obtendramos un valor de


4,60 y una p=0,111 (dos grados de libertad). Este valor es el mismo independientemente
de cmo hubiramos ordenado las categoras del consumo de tabaco. En el clculo de la
prueba X2 de Pearson no se tiene en cuenta el orden de las categoras y de este modo
perdemos una valiosa informacin. La prueba X2 de tendencia lineal, siempre tiene un
grado de libertad, e incluye una modificacin para su clculo respecto a la expresin de
la prueba ji-cuadrado de Pearson, de modo se tiene en cuenta el orden de las categoras.
En nuestro ejemplo de la Tabla III, el valor de p sera 0,033, indicando que a medida
que aumenta el consumo de tabaco, lo hace tambin el porcentaje de pacientes con
EPOC.
El mismo problema, se podra haber resuelto mediante la prueba no paramtrica U de
Mann-Whitney, ya que tambin permite la comparacin de dos variables ordinales.
Si queremos cruzar dos variables ordinales para estudiar su relacin de dependencia,
podemos utilizar el coeficiente de correlacin no paramtrico de Spearman, aunque
tambin tenemos otras medias de asociacin para variables ordinales, como la Gamma,
Tau-b de Kendall, Tau-C de Kendall y D de Somers. La interpretacin de estos
coeficientes es similar en todos ellos, tomando valores entre -1 y 1. Valores prximos a
1 nos indicaran una fuerte asociacin positiva, es decir, a medida que aumentan los
valores de una variable, tambin lo hacen los de la otra. Por el contrario, valores
prximos a -1, indicaran una fuerte asociacin negativa, y por tanto a medida que
aumentan los valores de una variable, disminuyen los de la otra. En el ejemplo de la
Tabla IV, en el que medimos el grado y el sentido de la asociacin entre hbito
tabquico y gravedad de la EPOC, al calcular el valor de de la Gamma obtenemos un
resultado de 0,718, indicando una fuerte asociacin positiva entre ambas variables.
Muchos de estos coeficientes vienen incluidos en los programas estadsticos como el
SPSS o SAS.
Tabla IV. Relacin entre gravedad de la EPOC y hbito tabquico,

EPOC
Leve

No fumador
20 (66,7%)

Hbito
tabquico
Moderado
8 (26,7%)

Alto
2 (6,7%)

Total
30 (33,3%)

Moderado
Grave
Total

8 (26,7%)
2 (6,7%)
30 (100%)

10 (33,3%)
12 (40,0%)
30 (100%)

8 (26,7%)
20 (66,7%)
30 (100%)

26 (28,9%)
34 (37,8%)
90 (100%)

Para finalizar recomendamos al lector otras lecturas especializadas para profundizar en


estos coeficientes, ya que segn el contexto y la situacin pueden ser preferibles unos a
otros.
Bibliografa
1 Ferrn Aranaz, M. (1996). SPSS para Windows. Programacin y anlisis estadstico.
Tablas de contingencia y medidas de asociacin. McGraw-Hill.
2 Molinero, L. M. (2004). http://seh-lelha.org/stat1.htm. Asociacin de variables
cualitativas nominales y ordinales. (Alce Ingeniera).
3 Pita Fernndez, S. y S. Prtega Daz (2004). http://www.Fisterra.com. Asociacin de
variables cualitativas: test de chi-cuadrado. Cad Aten Primaria.
4 Martnez Gonzlez, M. A., Jokin de Irala y F. J. Fauln Fajardo (2001). Bioestadstica
Amigable. Ed: Daz de Santos.

Vous aimerez peut-être aussi