Académique Documents
Professionnel Documents
Culture Documents
variables cualitativas.
Introduccin
En numerosas ocasiones, se necesita analizar la relacin de dependencia o
independencia entre dos variables de tipo cualitativo o categrico. A estas variables
tambin se les denomina factores, mientras que a las distintas categoras de la variable
se les suele denominar niveles. Existen diferentes pruebas para medir la dependencia
entre dos variables cualitativas, entre ellas la prueba ji-cuadrado en sus diferentes
versiones. En este captulo repasaremos las pruebas estadsticas ms utilizadas en la
investigacin biomdica para cruzar variables categricas, as como ejemplos que
faciliten su comprensin.
Supongamos que realizamos un estudio en 45 pacientes en el que deseamos estudiar la
relacin entre el hbito tabquico y EPOC diagnosticado mediante espirometra
obteniendo los resultados de la Tabla I. Podemos ver que 15 pacientes de 25 (60%)
tenan EPOC dentro del grupo de fumadores, mientras que tan solo 5 de 20 (25%)
presentaron EPOC en el grupo de no fumadores. Desde un punto de vista clnico las
diferencias son importantes, pero lo sern desde un punto de vista estadstico?
Tabla I. Relacin entre EPOC y hbito tabquico. Frecuencias observadas y
porcentajes de columna.
Fumador
EPOC
No
S
Total
No
15 (75%)
5 (25%)
20 (100%)
S
10 (40%)
15 (60%)
25 (100%)
Total
25 (55,6%)
20 (44,4%)
45 (100%)
Simplemente diremos que los valores que toma el estadstico ji-cuadrado con un grado
de libertad corresponden a los obtenidos a una distribucin normal tipificada elevados al
cuadrado, y que por tanto la prueba ji-cuadrado solo tiene una cola tomando nicamente
valores positivos.
La expresin de la prueba ji-cuadrado es la siguiente:
Obs: frecuencias observadas.
Esp: frecuencias esperadas.
En nuestro ejemplo de la Tabla I hemos cruzado dos variables cualitativas EPOC y
fumador con dos categoras cada una. Excluyendo las celdas de los totales
(denominadas marginales) obtenemos una tabla de 2 filas por 2 columnas. Una vez
conocidos los totales para cada categora, si sabemos la frecuencia de una de las celdas,
es fcil deducir las frecuencias de las dems. Por ello se dice que tenemos 1 grado de
libertad, ya que conocidos los marginales, slo tenemos la libertad de poner valores
en una de las celdas, porque las dems ya vienen impuestas por los datos. Para tablas de
n filas y m columnas, los grados de libertad se calcularan como (n 1) x (m 1).
En el ejemplo, si sabemos que hay 15 fumadores con EPOC, conocidas las frecuencias
marginales es fcil completar el resto de la tabla. Tenemos por lo tanto un solo grado de
libertad.
Nuestra hiptesis nula (Ho) sera la que afirma que la proporcin de pacientes con
EPOC es la misma en el grupo de fumadores que en el de no fumadores. Nuestra
hiptesis alternativa (H1), por el contrario, afirmara que estas proporciones son
distintas. Si la proporcin es distinta, tenemos en cuenta las dos posibilidades que
existen: que la proporcin de pacientes con EPOC sea ms alta o ms baja en los
fumadores, por lo tanto la prueba es bilateral o tambin denominada de dos colas.
No
11,1 (55,6%)
8,9 (44,4%)
S
13,9 (55,6%)
11,1 (44,4%)
Total
25 (55,6%)
20 (44,4%)
Total
20
25
45
EPOC
No
S
Total
No fumador
23 (76,7)
7 (23,3)
30 (100%)
Hbito
tabquico
Moderado
19 (63,3)
11 (36,7)
30 (100%)
Alto
15 (50,0)
15 (50,0)
30 (100%)
Total
57 (63,3%)
33 (36,7%)
90 (100%)
EPOC
Leve
No fumador
20 (66,7%)
Hbito
tabquico
Moderado
8 (26,7%)
Alto
2 (6,7%)
Total
30 (33,3%)
Moderado
Grave
Total
8 (26,7%)
2 (6,7%)
30 (100%)
10 (33,3%)
12 (40,0%)
30 (100%)
8 (26,7%)
20 (66,7%)
30 (100%)
26 (28,9%)
34 (37,8%)
90 (100%)