Vous êtes sur la page 1sur 22

Distribucin chi-cuadrado

y sus aplicaciones.
Prueba chi-cuadrado (_
2
)
1. Definicin:
Es una prueba de significacin estadstica que
responde a la siguiente ecuacin general:



Donde:
O
i
= Frecuencias absolutas observadas
E
i
= Frecuencias absolutas esperadas
_2 mide el grado de desacuerdo entre frecuencias
observadas y esperadas, suponiendo que H
0
es
verdadera.


= _
i
2
i i
2
E
) E O (
2. Aplicaciones:
Las aplicaciones ms importantes de la
distribucin chi cuadrado, son:
Con una sola variable: Prueba de bondad de
ajuste, ejemplo, prueba de normalidad
Con dos variables:
Prueba de independencia
Prueba de homogeneidad de poblaciones.
Estudiaremos estas dos aplicaciones que
son las ms usadas en las investigaciones
biomdicas. Adems veremos la aplicacin
para analizar dos muestras relacionadas (_2
de Mc Nemar)
Prueba de independencia
Permite determinar si dos variables cualitativas
nominales son independientes (no estn
asociadas o no estn relacionadas) cuando
ambas se han medido en la misma unidad de
anlisis.
Las n unidades de anlisis se clasifican en
categoras mutuamente excluyentes de modo
que las frecuencias se presentan en una tabla
de contingencia bivariada o de doble entrada o
tabla de f filas x c columnas.
Los totales marginales no estn controlados por
el investigador.
Tose por la
Maana?
Fuma Cigarrillos?
Total
SI NO
Si 45 24 69
No 15 16 31
Total 60 40 100
Ejemplo:
En una muestra de 100 personas de 25 a 50 aos
se desea determinar si toser por la maana est
asociado al hbito de fumar cigarrillos.
Prueba de independencia
1. Planteamiento de hiptesis
H
0
: Toser por la maana es independiente del
hbito de fumar cigarrillos
H
a
: Toser por la maana est asociado al hbito
de fumar cigarrillos.
2. Tamao de la muestra: n = 100
3. Nivel de significacin: = 0,05
4. Nivel de confianza:1 - = 0,95
5. Grados de libertad:
g.l.= (f 1)(c 1) = (2-1)(2-1) = 1

Prueba de independencia
6.- Estadstico de contraste (Tablas)
con = 0,05 y g.l = 1

3.84
Prueba de independencia
= 0.05
Zona de rechazo
_
2

_
c
2
(1; 0,05) = 3,84


P (_
2
> 3,84 ) = 0.05


* Clculo de frecuencias esperadas y _
2
:
7.- Estadstico de Prueba
( ) ( ) ( ) ( )
11
12
21
22
2 2 2 2
2
2
69 60
41.4
100
69 40
27.6
100
31 60
18.6
100
31 40
12.4
100
45 41.4 15 18.6 24 27.6 16 12.4
41.4 18.6 27.6 12.4
2.53
c
c
x
E
x
E
x
E
x
E
_
_
= =
= =
= =
= =

= + + +
=
Tose por
la
Maana?
Fuma Cigarrillos?
Total
SI NO
Si
45 (41,4) 24 (27,6) 69
No
15 (18,6) 16 (12,4) 31
Total
60 40 100

* Estadstico de prueba
de los clculos: _
2
= 2.53

Valor de p:
De la tabla de la distribucin de _
2
con g.l. = 1:
p > 0,10

Prueba de independencia
2.53 3.84
P > 10%
P > 5%
_
2



Valor de p:
De la tabla de la distribucin de _
2
con g.l. = 1:
p > 0,10
Al realizar el anlisis con computadora se
obtiene un valor de p exacto, (p = 0,112)
6. Decisin y conclusin:
Decisin: Siendo p > 0,05, no se rechaza Ho.

Conclusin: toser por la maana es
independiente del hbito de fumar cigarrillos
(p = 0,112).
Prueba de independencia
Se aplica cuando se desea conocer si dos o
ms muestras provienen de poblaciones
homogneas
Tiene mayor posibilidad de uso en estudios
experimentales.
La hiptesis nula establece que las
muestras provienen de la misma poblacin
o que las poblaciones son homogneas
respecto a la variable de inters o no
difieren significativamente respecto a la
variable de inters.
Prueba de homogeneidad de
poblaciones
Ejemplo:
En tres muestras de pacientes con enfermedad
de transmisin sexual (ETS) tipo A, B y C, se
desea evaluar la efectividad de un antibitico.
Prueba de homogeneidad de
poblaciones
Resultado
del
tratamiento
ETS Total
A B C
Efectivo
75(63.75) 25(49.58) 70(56,67) 170
No efectivo
15(26.25) 45(20.42) 10(23.33) 70
Total
90 70 80 240

1. Planteamiento de la hiptesis:
H
o
: Las proporciones de curados en las tres ETS
no difieren significativamente.(Las tres
poblaciones, que reciben el antibitico, son
homogneas respecto a la efectividad del
tratamiento)
H
1
: Las proporciones de curados de las tres ETS
difieren significativamente.(Las tres
poblaciones, que reciben el antibitico, no
son homogneas respecto a la efectividad
del tratamiento
2. Nivel de significacin: 0.05 o =

Prueba de homogeneidad de
poblaciones
2. Frecuencias esperadas y clculo de _
2
:
Prueba de homogeneidad de
poblaciones
( ) ( ) ( )
11 12
13 21
22 23
2 2 2
2
2
170 90 170 70
63.75 49.58
240 240
170 80 70 90
56.67 26.25
240 240
70 70 70 80
20.42 23.34
240 240
75 63.75 25 49.58 10 23.34
...
63.75 49.58 23.34
59.34
c
c
x x
E E
x x
E E
x x
E E
_
_
= = = =
= = = =
= = = =

= + + +
=
3. Valor de p:
De la tabla, con g.l.= 2 p < 0,005.
La computadora proporciona p = 0,000
4. Decisin y conclusin:
Decisin: Siendo p < 0,05, se rechaza H0.
Conclusin: Las proporciones de curados,
con el antibitico, en las tres enfermedades
de transmisin sexual, difieren
significativamente. Es decir, el antibitico no
tiene la misma efectividad para el tratamiento
de las tres enfermedades (p= 0,000).
Prueba de homogeneidad de
poblaciones
Prueba _2 con correccin de Yates
Se usa en tablas de 2x2, especialmente cuando
los tamaos muestrales no son muy grandes (n
entre 30 y 60 ). Algunos recomiendan aplicar la
correccin de Yates en toda tabla de 2x2 . As:

Grupo
Variable
Total
+ -
I a b a + b
II c d c + d
Total a + c b + d n = a+b+c+d

Prueba _
2
con correccin de Yates





La correccin se puede aplicar tanto en _
2

prueba de independencia como en
homogeneidad de poblaciones.

_
2
con g.l. = 1
Donde a, b, c y d son frecuencias observadas
y n el total general.


d) b)(c d)(a c)(b (a
)
2
n
bc ad n(

2
2
+ + + +

=
En resumen:

La prueba de _
2
se aplica en tablas de
contingencia (prueba de independencia o de
homogeneidad de poblaciones) cuando las
variables son cualitativas con nivel de medicin
nominal y con categoras mutuamente
excluyentes. Las muestras consideradas deben
ser grandes para evitar tener E
ij
5 .
Si alguna E
ij
5:
En tablas de ms de 2x2, agrupar categoras
parecidas para que las E
ij
sean mayores que 5.
En tablas de 2x2, aplicar la prueba exacta de
Fisher y no chi cuadrado.


Prueba _2 de Mc Nemar
Se usa para comparar dos muestras relacionadas
(Diseo antes despus o diseo pareado)
La variable de inters debe ser dicotmica

Antes
Despus
Total
+ -
+ a b
- c d
Total n
Mtodo
A
Mtodo B
Total
+ -
+ a b
- c d
Total n
b + c cambian
La frecuencia esperada:


b + c desacuerdos
2
c b
E
c b,
+
=
Prueba _2 de Mc Nemar
Como las celdas a y d incluye elementos que no
cambian o que no aportan en la posible
diferencia, slo se aplica la ecuacin general de
_
2
en las celdas b y c. Luego:

c b
c) (b
2
N M
2
+

c b
1) - c b (

2
N M
2
+

Ecuacin a ser usada:


Prueba _2 de Mc Nemar
Ejemplo: Determinar si hay
acuerdo entre los criterios
de diagnostico A y B en su
capacidad para detectar
casos positivos:
H
0
= No difieren los
criterios en la deteccin
de (+)
H
1
= Difieren los
criterios en la deteccin
de (+)



B
Total
+ -
A
+ 30 15 45
- 3 22 25
Total 33 37 70
9
2
3 15
E
c b,
=
+
=
6,72
18
121
3 15
1) - 3 15 (
N M
2
2
N M
2
= =
+

Prueba _2 de Mc Nemar
gl =1
Valor de p: 0,005 < p < 0,01
Decisin: Siendo p < 0,05, se rechaza H
0
.
Conclusin: Difieren los criterios de diagnstico en
cuanto a su capacidad para detectar los positivos
( p < 0,01).

Si la frecuencia esperada (E
b,c
) fuera menor o
igual que 5, en lugar de usar _
2
M-N
se aplica la
prueba binomial con la que se calcula el valor de p
directamente.

Vous aimerez peut-être aussi