Académique Documents
Professionnel Documents
Culture Documents
Una medida muy extendida para medir la dependencia e independencia, es el estadstico Chicuadrado, que da una medida de la diferencia entre las frecuencias observadas en la tabla y
las frecuencias esperadas en caso de independencia. Recordamos el clculo de dichas
frecuencias esperadas eij:
fi . f . j
eij
Con el estadstico Chi-cuadrado se obtiene una medida de diferencia entre las frecuencias
esperadas y las frecuencias observadas. El estadstico se calcula en la forma siguiente:
( f ij eij ) 2
2
exp
i
eij
( f ij eij ) 2
eij
( f ij f ij ) 2
eij
0.
Esto ocurre slo cuando las dos variables de la tabla son independientes; Por tanto, si hay
2
independencia entre las dos variables de la tabla, exp 0
Cuanto mayor sea la diferencia entre las frecuencias observadas y esperadas en la tabla, el
valor de Chi cuadrado ser mayor. Es decir, a mayor intensidad de la asociacin entre las
variables, Chi-cuadrado ser mayor.
El valor de Chi-cuadrado siempre es positivo o cero (pues es suma de nmeros positivos, ya
que los denominadores de la suma son todos positivos al ser suma de nmeros elevados al
cuadrado.
En general, a mayor nmero de sumandos, se obtendr un valor mayor.
2
exp
( f ij eij ) 2
eij
(2n 1)( m 1)
e1,1
110,6
n
1313
( f ij eij ) 2
eij
= 62,9+32,9+5,4+2,8+46,2+24,2 = 174,4
Probabilidad de un valor
superior - Alfa ()
Grados
libertad
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0,1
2,71
4,61
6,25
7,78
9,24
10,64
12,02
13,36
14,68
15,99
17,28
18,55
19,81
21,06
22,31
23,54
24,77
25,99
27,20
28,41
29,62
30,81
32,01
33,20
34,38
35,56
36,74
37,92
39,09
40,26
5,02
7,38
9,35
11,14
12,83
14,45
16,01
17,53
19,02
20,48
21,92
23,34
24,74
26,12
27,49
28,85
30,19
31,53
32,85
34,17
35,48
36,78
38,08
39,36
40,65
41,92
43,19
44,46
45,72
46,98
6,63
9,21
11,34
13,28
15,09
16,81
18,48
20,09
21,67
23,21
24,73
26,22
27,69
29,14
30,58
32,00
33,41
34,81
36,19
37,57
38,93
40,29
41,64
42,98
44,31
45,64
46,96
48,28
49,59
50,89
7,88
10,60
12,84
14,86
16,75
18,55
20,28
21,95
23,59
25,19
26,76
28,30
29,82
31,32
32,80
34,27
35,72
37,16
38,58
40,00
41,40
42,80
44,18
45,56
46,93
48,29
49,65
50,99
52,34
53,67
Contraste de independencia
En el ejemplo hemos llevado a cabo un contraste de independencia Chi-cuadrado, que nos
permite determinar si existe una relacin entre dos variables categricas.
Recordars que un contraste de hiptesis es un procedimiento estadstico, con una serie de
pasos que lleva a la aceptacin o rechazo de una hiptesis estadstica. Los pasos a realizar en
un contraste de hiptesis son los siguientes:
1. Fijar las hiptesis que se quieren contrastar: La hiptesis nula H 0 y la hiptesis alternativa
H1. Estas hiptesis son complementarias una de otra.
2. Fijar el nivel de significacin, o probabilidad mxima de rechazar la hiptesis nula H 0, en
caso de que sea cierta. Recordemos que el nivel de significacin es la probabilidad de
Error Tipo I (probabilidad de rechazar la hiptesis nula, cuando de hecho es cierta).
3. Elegir un estadstico de contraste, que tenga alguna relacin con la hiptesis. Formacin a
partir del estadstico de una regla de decisin, dividiendo los posibles valores del
estadstico en dos regiones: (a) Si el estadstico cae en la regin crtica (o de rechazo), se
rechaza la hiptesis nula; (b) si el estadstico cae en la regin de aceptacin, no se puede
rechazar la hiptesis nula.
4. Se comprueba el valor del estadstico y se toma la decisin de rechazar o no la hiptesis.
En el contraste de independencia, se desea decidir si las dos variables en una tabla de
contingencia estn o no asociadas. Siguiendo los pasos anteriores, se tendra
1. Fijar las hiptesis que se quieren contrastar. Estas hiptesis son las siguientes:
H0: Las variables en filas y columnas de la tabla son independientes
H1: Hay asociacin entre las filas y columnas de la tabla
2. Fijamos el nivel de significacin; lo ms usual es elegir un valor =0,05. Esto quiere decir
que la probabilidad mxima que fijamos para el error tipo I (rechazar la hiptesis de
independencia cuando sea falsa) es 0,05.
3. Elegir un estadstico de contraste, que tenga alguna relacin con la hiptesis. En este caso,
elegimos el estadstico Chi cuadrado,
2
exp
i
( f ij eij ) 2
eij
fi . f . j
n
No
16,5
38,5
2
exp
( f ij eij ) 2
eij
( f ij eij ) 2
eij
aunque las diferencias entre frecuencias observadas y esperadas fuese grande. Por eso, se
recomienda que se use una muestra de suficiente tamao. Estas son dos recomendaciones
importantes
- Como mximo el 20% de las frecuencias esperadas pueden ser menores que el valor 5.
- No debe usarse si hay frecuencias esperadas inferiores a 1.