Académique Documents
Professionnel Documents
Culture Documents
Solamente en las tablas de contingencia para agrupar datos y en las secciones sobre correlación
y regresión se estudia la relación entre dos variables. Las pruebas de hipótesis han sido todas
paramétricas y de una forma u otra han asumido como modelo estadístico, la distribución
normal.
A. Pruebas paramétricas
Propiedades
B Pruebas no paramétricas
Propiedades
Nota
Las dos indicaciones más importantes que se deben tener en cuenta para utilizar una prueba no
paramétrica son que:
Los métodos no paramétricos son menos poderosos que los paramétricos. Esto quiere decir que
es más difícil rechazar la hipótesis nula con las pruebas no paramétricas.
Por esa razón los estadísticos, por lo general, recurren a los métodos no paramétricos sólo
cuando los datos no cumplen con los supuestos paramétricos. Sin embargo, hay problemas de
investigación en los que las variables categóricas son las indicadas y por lo tanto sólo un método
no paramétrico es el indicado. Los pasos en las pruebas de hipótesis no paramétricas son los
mismos de las paramétricas. Los cambios, por lo general, se limitan a cambios en la fórmula
para obtener el valor observado y en la tabla que se utiliza. Pero se habla de hipótesis nula, nivel
de significación, error tipo I y tipo II, etc.
2
Prueba no paramétrica de hipótesis Chi-cuadrada χ
2
Pruebas no paramétricas CHI CUADRADA χ se utiliza cuando la variable es nominal.
Supuestos
1. Se categorizan sujetos con respecto a una sola variable que tiene dos o más categorías.
1
3. Cada asignación a una categoría es independiente de cualquier otra asignación. (El que un
sujeto se asigne a una categoría no tiene nada que ver con cómo se asigna otro sujeto)
Fórmulas
N = tamaño de la muestra
2
La prueba de hipótesis usando χ
Ho: Las frecuencias en la población son iguales.
Ejemplo: Se lanza una moneda 200 veces y salen 92 caras y 108 cruces. ¿Está cargada la
moneda?
Agricultura 20%
Obreros 30%
Profesionales 15%
ejecutivos 5%
2
En una muestra de 864 las frecuencias obtenidas fueron:
agricultura 145
obreros 310
profesionales 78
ejecutivos 26
En este capítulo se utilizará esta prueba de hipótesis para una o dos variables.
Cuando el estudio tiene que ver con una sola variable el nombre que recibe la prueba de
hipótesis es Prueba Ji-cuadrada de ajuste o JI CUADRADA ( χ 2) de una vía. En este caso
el interés del investigador se concentra en comparar las frecuencias de los niveles de la variable
en la muestra con las frecuencias de los niveles de la variable en la población.
Cuando el estudio tiene que ver con dos variables el nombre que recibe la prueba es Prueba Ji-
cuadrada de independencia . En este caso el interés del investigador se dirige a analizar si las
frecuencias en los diferentes niveles de las dos variables indican que existe o no una relación
entre las dos variables.
2
La distribución JI CUADRADA χ )
Propiedades
Las distribuciones ji cuadrada tienen un sesgo positivo por lo que la zona de rechazo para las
pruebas de hipótesis son siempre de una cola a pesar de que siempre la hipótesis es no
direccional. Los valores son siempre positivos y el valor mínimo posible es cero. Esto ocurre
puesto que, como se verá más adelante, en el cómputo de la fórmula hay un paso en que se
cuadran los valores obtenidos haciéndose todos positivos. La zona donde se encuentra el cero
(izquierda de la distribución) corresponde siempre a la zona de no rechazo. No es necesario
analizar el valor crítico negativo. Si el valor observado es mayor que el valor crítico se rechaza
la hipótesis nula. A medida que los grados de libertad aumentan, la distribución se hace más
simétrica y con más de 30 grados de libertad comienza a parecerse a la distribución normal.
(Hinkle, p.577)
3
La prueba de bondad de ajuste
A. Supuestos
Se utiliza la prueba de ajuste cuando el estudio cumple con los siguientes supuestos:
1. Los sujetos están categorizados con respecto a una sola variable que puede tener dos o más
categorías.
3. Cada asignación a una categoría es independiente de cualquier otra asignación. (El que un
sujeto se asigne a una categoría no tiene nada que ver con cómo se asigna otro sujeto)
Si el dado no está cargado se espera que las frecuencias de cada uno de los seis valores sean
iguales. Esta frecuencia esperada se indica como fe.
Esta situación raramente ocurre, pues está presente el aspecto aleatorio del experimento. Sin
embargo, es posible decir que mientras más cercanas sean las frecuencias observadas (fo) a las
frecuencias esperadas, más seguro se puede estar de que el dado no está cargado. La fórmula
que indica cuanto se parecen las frecuencias esperadas a las observadas es la de la estadística χ
2
4
Ejemplo En la tabla que aparece a continuación se encuentran, en la primera columna, las
frecuencias observadas de un dado que se lanza 120 veces. En la segunda columna se incluyen
las frecuencias esperadas y en la tercera la estadística ji-cuadrada.
1 15 20 -5 25/20
2 27 20 7 49/20
3 20 20 0 0/20
4 30 20 10 100/20
5 10 20 -10 100/20
6 18 20 -2 4/20
22
χ observada = 278/20 = 13.9
2
D. La prueba de hipótesis usando χ
La prueba de hipótesis sigue los pasos conocidos:
2. Seleccionar la prueba que se va a utilizar y los grados de libertad que corresponden a c-1
donde c son los niveles de la variable o las categorías.
Ho indica que no hay diferencia entre las frecuencias observadas de los valores en la muestra y
las frecuencias esperadas.
La implicación de Ho es que si las frecuencias observadas no son iguales esto se debe a un error
de muestreo.
5
H1 es la hipótesis alterna y siempre indica que las frecuencias observadas son diferentes de las
esperadas.
Ejemplo Se lanza una moneda 200 veces y salen 92 caras y 108 cruces. ¿Está cargada la
moneda?
Esta es una prueba de ajuste, pues el investigador está interesado en determinar si las
frecuencias de caras y cruces obtenidas en la muestra corresponden a una población donde la
probabilidad de obtener cara o cruz es 0.5 en cada tirada. Si la probabilidad no fuese 0.5,
entonces se podría decir que la moneda está cargada.
1. Los sujetos están categorizados con respecto a una sola variable que puede tener dos o más
categorías.
3. Cada asignación a una categoría es independiente de cualquier otra asignación. (El que un
sujeto se asigne a una categoría no tiene nada que ver con cómo se asigna otro sujeto)
valor fo fe
cara 92 100
Pasos 1 y 2: Hipótesis
La redacción de las hipótesis depende de la interpretación del problema por el investigador. Hay
variedad, pero, por lo general, habrá una referencia a las frecuencias de los niveles de las
variables. La hipótesis alterna es la hipótesis del investigador. Las hipótesis siempre se refieren
a la población, aunque en este caso no se hable de parámetros.
La prueba es no direccional, pues la hipótesis alterna indica que las frecuencias obtenidas
difieren de las esperadas.
Ho: Las frecuencias (de cara y cruz) en la población son iguales. El dado no está cargado.
H1: Las frecuencias(de cara y cruz) en la población no son iguales. El dado está cargado.
6
Como se cumple con los supuestos de la prueba de ajuste se debe utilizar la prueba χ 2 de una
vía con c -1 grados de libertad donde c es el número de categorías. En este caso 2 -1 = 1 df
En el caso de α = 0.05 y 1 df, el valor crítico es 3.841 (Hinkle, p.638, Tabla C.4).
2
Por lo tanto si χ o ≥ 3.84, se rechaza Ho
2
si χ o< 3.84, NO se rechaza Ho
2
Paso 7: Cómputo de χ o
2
χ o cayó en la zona de NO rechazo, por lo tanto NO se rechaza la hipótesis nula.
Con un nivel de significación de 0.05 podemos decir que NO hay suficiente evidencia para
concluir que el dado estuviera cargado. La probabilidad de que las frecuencias observadas
hayan ocurrido al azar, si en efecto la hipótesis nula fuera cierta es mayor de 0.05.
2
Se pueden hacer pruebas de hipótesis utilizando χ cuando hay más de dos categorías o
niveles para la variable.
X 2c 49.91
7
Determina si la hipótesis del sociólogo es correcta.
Paso 1 y 2: Hipótesis
Como la variable es nominal se debe utilizar la prueba χ 2 de una vía con c -1 grados de
libertad donde c es el número de categorías. En este caso 5 -1 = 4 df
En el caso de α = 0.05 y 4 df, el valor crítico es 9.488 (Hinkle, p.638, Tabla C.4).
2
Por lo tanto si χ o ≥ 9.488, se rechaza Ho
2
si χ o< 9.488, NO se rechaza Ho
2
Paso 7: Cómputo de χ o
2
χ o cayó en la zona de rechazo, por lo tanto se rechaza la hipótesis nula.
8
Con un nivel de significación de 0.05 podemos decir que NO hay suficiente evidencia para
concluir que la hipótesis del sociólogo sea correcta. La probabilidad de que las frecuencias
observadas hayan ocurrido al azar, si en efecto la hipótesis nula fuera cierta es menor de 0.05.
La prueba de independencia
A. Supuestos
Se utiliza la prueba de independencia cuando el estudio cumple con los siguientes supuestos:
1. Los sujetos están categorizados con respecto a dos variables que pueden tener dos o más
niveles.
2. Cada sujeto aparece una sola vez y en un solo nivel de cada variable.
3. Cada asignación a un nivel es independiente de cualquier otra asignación. (El que un sujeto se
asigne a un nivel no tiene nada que ver con cómo se asigna otro sujeto)
Hombres 46 10 65 121
Mujeres 55 4 38 97
9
bajo nivel Nivel sobre nivel Total
Pasos 1 y 2: Hipótesis
La redacción de las hipótesis depende de la interpretación del problema por el investigador. Hay
variedad, pero, por lo general, habrá una referencia a las frecuencias de los niveles de las
variables. La hipótesis alterna es la hipótesis del investigador. Las hipótesis siempre se refieren
a la población, aunque en este caso no se hable de parámetros.
La prueba es no direccional, pues la hipótesis alterna indica que las frecuencias obtenidas
difieren de las esperadas.
Dos colas:
Ho: Las frecuencias (de cara y cruz) en la población son iguales. El dado no está cargado.
H1: Las frecuencias(de cara y cruz) en la población no son iguales. El dado está cargado.
Como se cumple con los supuestos de la prueba de ajuste se debe utilizar la prueba χ 2 de una
vía con c -1 grados de libertad donde c es el número de categorías. En este caso 2 -1 = 1 df
10
En el caso de α = 0.05 y 1 df, el valor crítico es 3.841 (Hinkle, p.638, Tabla C.4).
2
Por lo tanto si χ o ≥ 3.84, se rechaza Ho
2
si χ o< 3.84, NO se rechaza Ho
2
Paso 7: Cómputo de χ o
2
χ o cayó en la zona de NO rechazo, por lo tanto NO se rechaza la hipótesis nula.
Con un nivel de significación de 0.05 podemos decir que NO hay suficiente evidencia para
concluir que el dado estuviera cargado. La probabilidad de que las frecuencias observadas
hayan ocurrido al azar, si en efecto la hipótesis nula fuera cierta es mayor de 0.05.
2
Se pueden hacer pruebas de hipótesis utilizando χ cuando hay más de dos categorías o
niveles para la variable.
Paso 1 y 2: Hipótesis
Como la variable es nominal se debe utilizar la prueba χ 2 de una vía con c -1 grados de
libertad donde c es el número de categorías. En este caso 5 -1 = 4 df
En el caso de α = 0.05 y 4 df, el valor crítico es 9.488 (Hinkle, p.638, Tabla C.4).
11
Paso 6: Regla decisional
2
Por lo tanto si χ o ≥ 9.488, se rechaza Ho
2
si χ o< 9.488, NO se rechaza Ho
2
Paso 7: Cómputo de χ o
2
χ o cayó en la zona de rechazo, por lo tanto se rechaza la hipótesis nula.
Con un nivel de significación de 0.05 podemos decir que NO hay suficiente evidencia para
concluir que la hipótesis del sociólogo sea correcta. La probabilidad de que las frecuencias
observadas hayan ocurrido al azar, si en efecto la hipótesis nula fuera cierta es menor de 0.05.
V. La prueba de independencia
A. Supuestos
Se utiliza la prueba de independencia cuando el estudio cumple con los siguientes supuestos:
1. Los sujetos están categorizados con respecto a dos variables que pueden tener dos o más
niveles.
2. Cada sujeto aparece una sola vez y en un solo nivel de cada variable.
3. Cada asignación a un nivel es independiente de cualquier otra asignación. (El que un sujeto se
asigne a un nivel no tiene nada que ver con cómo se asigna otro sujeto)
12
TABLA DE DISTRIBUCION χ²
Probabilidad
0 1 χ²
gl 0.995 0.99 0.975 0.95 0.9 0.1 0.05 0.025 0.01 0.005
1 3.93E-05 0.000157 0.000982 0.003932 0.015791 2.705541 3.841455 5.023903 6.634891 7.8794
2 0.010025 0.0201 0.050636 0.102586 0.210721 4.605176 5.991476 7.377779 9.210351 10.59653
3 0.071723 0.114832 0.215795 0.351846 0.584375 6.251394 7.814725 9.348404 11.34488 12.83807
4 0.206984 0.297107 0.484419 0.710724 1.063624 7.779434 9.487728 11.14326 13.2767 14.86017
5 0.411751 0.554297 0.831209 1.145477 1.610309 9.236349 11.07048 12.83249 15.08632 16.74965
6 0.675733 0.872083 1.237342 1.63538 2.20413 10.64464 12.59158 14.44935 16.81187 18.54751
7 0.989251 1.239032 1.689864 2.167349 2.833105 12.01703 14.06713 16.01277 18.47532 20.27774
8 1.344403 1.646506 2.179725 2.732633 3.489537 13.36156 15.50731 17.53454 20.09016 21.95486
9 1.734911 2.087889 2.700389 3.325115 4.168156 14.68366 16.91896 19.02278 21.66605 23.58927
10 2.155845 2.558199 3.246963 3.940295 4.865178 15.98717 18.30703 20.4832 23.20929 25.18805
11 2.603202 3.053496 3.815742 4.574809 5.577788 17.27501 19.67515 21.92002 24.72502 26.75686
12 3.073785 3.570551 4.403778 5.226028 6.303796 18.54934 21.02606 23.33666 26.21696 28.29966
13 3.565042 4.1069 5.008738 5.891861 7.0415 19.81193 22.36203 24.73558 27.68818 29.81932
14 4.074659 4.660415 5.628724 6.570632 7.789538 21.06414 23.68478 26.11893 29.14116 31.31943
15 4.600874 5.229356 6.262123 7.260935 8.546753 22.30712 24.9958 27.48836 30.57795 32.80149
16 5.142164 5.812197 6.907664 7.961639 9.312235 23.54182 26.29622 28.84532 31.99986 34.26705
17 5.697274 6.407742 7.564179 8.671754 10.08518 24.76903 27.5871 30.19098 33.40872 35.71838
18 6.264766 7.014903 8.230737 9.390448 10.86494 25.98942 28.86932 31.52641 34.80524 37.15639
19 6.843923 7.632698 8.906514 10.11701 11.65091 27.20356 30.14351 32.85234 36.19077 38.58212
20 7.433811 8.260368 9.590772 10.8508 12.4426 28.41197 31.41042 34.16958 37.56627 39.99686
21 8.033602 8.897172 10.28291 11.59132 13.2396 29.61509 32.67056 35.47886 38.93223 41.40094
22 8.642681 9.542494 10.98233 12.33801 14.04149 30.81329 33.92446 36.78068 40.28945 42.79566
23 9.260383 10.19569 11.68853 13.09051 14.84795 32.00689 35.17246 38.07561 41.63833 44.18139
24 9.886199 10.85635 12.40115 13.84842 15.65868 33.19624 36.41503 39.36406 42.97978 45.55836
25 10.51965 11.52395 13.11971 14.6114 16.47341 34.38158 37.65249 40.6465 44.31401 46.92797
26 11.16022 12.19818 13.84388 15.37916 17.29188 35.56316 38.88513 41.92314 45.64164 48.28978
27 11.80765 12.87847 14.57337 16.15139 18.11389 36.74123 40.11327 43.19452 46.96284 49.64504
28 12.46128 13.56467 15.30785 16.92788 18.93924 37.91591 41.33715 44.46079 48.27817 50.99356
29 13.12107 14.25641 16.04705 17.70838 19.76774 39.08748 42.55695 45.72228 49.58783 52.3355
30 13.78668 14.95346 16.79076 18.49267 20.59924 40.25602 43.77295 46.97922 50.89218 53.67187
40 20.70658 22.1642 24.43306 26.5093 29.05052 51.80504 55.75849 59.34168 63.69077 66.76605
50 27.99082 29.70673 32.35738 34.76424 37.68864 63.16711 67.50481 71.42019 76.1538 79.48984
13
60 35.5344 37.4848 40.48171 43.18797 46.45888 74.39700 79.08195 83.29771 88.37943 91.95181
70 43.27531 45.4417 48.75754 51.73926 55.32894 85.52704 90.53126 95.02315 100.4251 104.2148
80 51.17193 53.53998 57.15315 60.39146 64.27784 96.57820 101.8795 106.6285 112.3288 116.3209
90 59.19633 61.75402 65.64659 69.12602 73.29108 107.5650 113.1452 118.1359 124.1162 128.2987
100 67.32753 70.065 74.22188 77.92944 82.35813 118.498 124.3421 129.5613 135.8069 140.1697
120 83.85171 86.92331 91.5726 95.70462 100.6236 140.2326 146.5673 152.2113 158.95 163.6485
14