Académique Documents
Professionnel Documents
Culture Documents
Las pruebas Chi-cuadrado se utilizan para probar hiptesis referidas a los patrones de
comportamiento de frecuencias relacionadas con variables ya sean cuantitativas o
cualitativas. En este sentido, entre las pruebas ms comunes se encuentran la de Bondad
del Ajuste, la de Independencia y la de Homogeneidad.
En general, el procedimiento de prueba comienza con la formulacin de las hiptesis; en la
hiptesis nula se plantea el modelo terico que determinara el comportamiento de las
frecuencias. Luego, se comparan con los datos efectivamente obtenidos y se cuantifican las
diferencias numricas efectivamente halladas. Ahora bien, para juzgar la significancia de las
diferencias halladas, Karl Pearson (1900) propuso el estadstico de prueba Chi - Cuadrado, una
prueba cuyos detalles de implementacin se presentan a continuacin.
En esencia, la prueba consiste en determinar si esas diferencias se deben a variaciones al azar y
por lo tanto no son significativas o si por el contrario son significativas. En el primer caso no se
rechaza la hiptesis nula planteada, mientras que en el segundo se rechaza.
m 2
( oi ei )
x =
2
i=1 ei
Donde:
oi : Frecuencia observada en la categora Ai
Ejemplos:
H0:
La demanda es uniforme para los cuatro tipos de botes.
H1:
La demanda no es uniforme para los cuatro tipos de botes
Prueba de ajuste a un patrn especfico.
Un banco de Nueva York trata de seguir una poltica de extender un 60% de sus
crditos a empresas comerciales, un 10% a personas naturales y un 30% a
prestatarios extranjeros.
Para determinar si la poltica se estaba siguiendo, el vicepresidente de mercadeo
selecciona aleatoriamente 85 crditos que se aprobaron recientemente.
Encuentra 1ue 62 de tales crditos se otorgaron a negocios, 10 a personas
naturales, y 13 a personas extranjeras. A un nivel de significancia de 0,10
parece que el patrn de cartera deseado se preserva?
H0:
Se mantuvo el patrn deseado.
H1:
El patrn deseado no se mantuvo.
Prueba de normalidad.
H0:
Los niveles de llenado estn distribuidos normalmente.
H1:
Los niveles de llenado no estn distribuidos normalmente.
b. Prueba de homogeneidad.
La prueba Chi-cuadrado se puede aplicar para determinar si dos o ms muestras
aleatorias independientes se extraen de la misma poblacin. Para ello se clasifica a la
poblacin en trminos de una variable cualitativa en k grupos (categoras de la variable)
o niveles de un factor, con el objeto de evaluar si las proporciones poblacionales son
homogneas. Por ejemplo, podramos querer verificar si las opiniones (de acuerdo, en
desacuerdo), respecto a la poltica del Presidente Regional de Lambayeque, son
homogneas en tres ciudades como pueden ser Lambayeque, Ferreafe y Chiclayo, de
las cuales se obtuvieron tres muestras independientes.
Tambin este tipo de prueba se puede aplicar para realizar un anlisis confirmatorio de
los datos que se poseen de una encuesta ya efectuada. En este ltimo caso, entonces, de
acuerdo a las dos variables categricas podremos armar una tabla de contingencia con
las frecuencias asociadas a lo que definiremos como xito y fracaso para cada grupo.
El estadstico de prueba es:
m k 2
( oij eij )
x =
2
i=1 j=1 e ij
Donde:
oi : Frecuencia observada en la categora A i B j
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
Ejemplo
Estamos interesados en estudiar la fiabilidad de cierto componente informtico con relacin al
distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes
de cada uno de los 3 distribuidores que nos sirven el producto comprobando el nmero de
defectuosos en cada lote. La siguiente tabla muestra el nmero de defectuosos para cada uno de
los distribuidores.
Solucin:
1. Formulacin de hiptesis:
H0 :
No existen diferencias entre los tres distribuidores con respecto al nmero de
componentes defectuosos.
H1 :
Existen diferencias entre los tres distribuidores con respecto al nmero de
componentes defectuosos.
0.05
2. Establecer un nivel de significancia:
3. Eleccin del estadstico de prueba:
m k 2
( oij eij )
x =
2
i=1 j=1 e ij
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
p=0.002<0.05 H0
4. Decisin: como entonces rechazamos
5. Conclusin: Existen diferencias entre los tres distribuidores con respecto al nmero de
componentes defectuosos, a un nivel de significancia de 0,05.
Ejemplo:
En un proceso de fabricacin de tornillos, el fabricante quiere determinar si la proporcin de
tornillos defectuosos producidos por tres mquinas variaba de una mquina a otra. Para verificar
esto se seleccionaron muestras de 400 tornillos de la produccin de cada mquina y se cont el
nmero de tornillos defectuosos en cada una obtenindose los siguientes datos.
Ejemplo:
Con el propsito de decidir si la opinin sobre el nivel de las carreras de ingeniera, que tienen
los acadmicos y los alumnos son concordantes, se procede a encuestar a 100 acadmicos y a
200 alumnos, obtenindose los siguientes resultados:
Pruebe la hiptesis que la distribucin proporcional de la opinin entre los acadmicos y los
alumnos es la misma, utilizando un nivel de significancia de 0,05.
a) Prueba de independencia.-
En este caso, se trata de una situacin en la que interesa poner a prueba si existe o no
independencia entre dos variables cualitativas (atributos) de una poblacin. Para ello se
toma una muestra, se construye una tabla de contingencia con las dos variables
cualitativas de inters, y en base a la distribucin de frecuencias conjunta observada en
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
m k 2
( oij eij )
x =
2
i=1 j=1 e ij
Donde:
oi : Frecuencia observada en la categora A i B j
Ejemplo:
Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se seleccion una
muestra aleatoria simple de 100 jvenes, con los siguientes resultados:
Determinar si existe asociacin entre la actividad del sujeto y su estado de nimo. Utilice un
nivel de significancia de 0,05
1. Formulacin de hiptesis:
H0 :
No existe asociacin entre la actividad del sujeto y su estado de nimo.
H1 :
Existe asociacin entre la actividad del sujeto y su estado de nimo.
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
0.05
2. Establecer un nivel de significancia:
3. Eleccin del estadstico de prueba:
m k 2
( oij eij )
x =
2
i=1 j=1 e ij
p=0.016< 0.05 H0
4. Decisin: como entonces rechazamos
5. Conclusin: Existe asociacin entre la actividad del sujeto y su estado de nimo, a un nivel
de significancia de 0,05.
Ejemplo:
Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el grado
de silicosis de los trabajadores. Para ello se extrae una muestra aleatoria de 300 trabajadores y
se clasifican segn se muestra en la siguiente tabla.
Pruebe la hiptesis de que el tipo de trabajo afecta el grado de silicosis del trabajador
con un nivel de significancia de 0,05
Ejemplo.
Una institucin ambiental hizo un estudio para determinar si el sector habitacional se relaciona
con el grado de contaminacin por plomo. Una muestra aleatoria de 300 personas a las que se
les examin arroj los siguientes resultados:
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
Cree usted que el sector habitacional se relaciona con el grado de contaminacin por plomo?
Use un nivel de significancia de 0,05.
Ejemplo
En la siguiente tabla se muestran los datos de 43 nios de diferente gnero, en donde se ha
evaluado la satisfaccin familiar (PRUEBA DE INDEPENDENCIA)
Lo que se plantea es que alguno de los dos gneros pueda tener mayor frecuencia de
satisfaccin familiar.
H0 :
La satisfaccin familiar es igual en hombres y mujeres.
H0 :
No existe asociacin entre la satisfaccin y el gnero. (Porcentajes iguales)
H1 :
La satisfaccin familiar no es igual en hombres y mujeres.
H1 :
Existe asociacin entre la satisfaccin y el gnero. (Porcentajes diferentes)
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
genero
no 4 7 (3.83) 11
Total 28 15 43
Pruebas de chi-cuadrado
Significacin Significacin
asinttica Significacin exacta
Valor gl (bilateral) exacta (bilateral) (unilateral)
a
Chi-cuadrado de Pearson 5,380 1 ,020
b
Correccin de continuidad 3,813 1 ,051
Razn de verosimilitud 5,208 1 ,022
Prueba exacta de Fisher ,031 ,027
Asociacin lineal por lineal 5,255 1 ,022
N de casos vlidos 43
a. 1 casillas (25,0%) han esperado un recuento menor que 5. El recuento mnimo esperado es 3,84.
b. Slo se ha calculado para una tabla 2x2
0.05
2. Establecer un nivel de significancia:
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
2
xtab 3.84
4. Determinar la regin crtica.
H0
5. Decisin: como p=0.020<0.05 entonces rechazamos
6. Conclusin: La satisfaccin familiar no es igual en hombres que en mujeres.
Sin embargo una casilla o el 25% de las casillas, tienen una frecuencia esperada menor a 5. La
frecuencia mnima esperada es 3.84. Este valor nos indica que debemos realizar una correccin.
Deberemos, por lo tanto, utilizar la correccin por continuidad. Esta correccin se utiliza
cuando los valores en la tabla son muy pequeos
Correccin de Yates:
n ( oi ei 0.5) 2
x
2
i 1 ei
H0
1. Decisin: como p=0.51 no es menor que 0,05 entonces no rechazo .
2. Conclusin: No existe suficiente evidencia estadstica para afirmar que la satisfaccin
familiar no es igual en hombres y mujeres.
Es importante aclarar que cuando la hiptesis nula no es rechazada, tampoco se puede decir que
se acepta. Se debe decir que la hiptesis nula no se rechaza. Se debe evitar el uso de la palabra
aceptar en este caso porque pudiera haberse cometido el error de tipo II. Dado que,
frecuentemente, la probabilidad de cometer un error de tipo II puede ser realmente alta, no se
pretende cometerlo al aceptar la hiptesis nula.
Pruebas de chi-cuadrado
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
Significacin Significacin
asinttica Significacin exacta
Valor gl (bilateral) exacta (bilateral) (unilateral)
a. 3 casillas (75,0%) han esperado un recuento menor que 5. El recuento mnimo esperado es 2,88.
b. Slo se ha calculado para una tabla 2x2
1. Formulacin de hiptesis:
H0 :
La satisfaccin familiar es igual en hombres y mujeres.
H1 :
La satisfaccin familiar no es igual en hombres y mujeres
0.05
2. Establecer un nivel de significancia:
3. Eleccin del estadstico de prueba:
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
n
(oi ei )2
x
2
i 1 ei
2
xtab 3.84
4. Determinar la regin crtica.
H0
5. Decisin: como p=0.034<0.05 entonces rechazamos
6. Conclusin: La satisfaccin familiar no es igual en hombres que en mujeres.
Sin embargo, tres casillas, es decir, el 75% de ellas tienen una frecuencia esperada menor a 5.
La frecuencia mnima esperada es 2.88. Como este valor es demasiado bajo no se puede aplicar
la correccin de Yates. Aplicamos entonces la siguiente regla de decisin: cuando una de las
frecuencias esperadas es menor que 5 aplicamos la correccin de yates; sin embargo, si esta
frecuencia es menor a tres, aplicaremos la correccin de Fisher.
En este caso la frecuencia mnima esperada es 2,9 que es menor que 3; por lo tanto aplicaremos
la correccin de Fisher o el Test exacto de Fisher.
Test de Fisher
H0
5. Decisin: como p=0.058>0.05 entonces no rechazamos
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
Hay que tener en cuenta que a pesar que las proporciones son muy diferentes y aparentemente
existe diferencias, no se puede afirmar tal hecho debido a que la muestra es muy pequea.
PRUEBA DE MC NEMAR
CONTROL EXPERIMENTAL
ANTES DESPUES ANTES DESPUES
participantes son seleccionados al azar para un estudio de mercado, se les pide inicialmente que
indiquen sus preferencias por dos proveedores de telefona celular en competencia, Sprint y
Verizon. Supongamos que, inicialmente, 282 dicen que prefieren Sprint y 318 dicen que
prefieren Verizon. Despus de exponer a todo el grupo a una estrategia de campaa de
marketing intensiva para Verizon, supongamos que los mismos 600 consumidores de nuevo les
pidi que indicaran sus preferencias, con los siguientes resultados: De los 282 panelistas que
previamente Sprint preferida, 246 mantienen su lealtad a la marca, pero 36 de ellos se cambi a
Verizon. De los 318 panelistas que inicialmente preferan Verizon, 306 permanecen fieles a la
marca, mientras que 12 prefiri a Sprint. RESOLVER
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI
Ho 21
H1 2>1
Unilateral cola a la derecha
P=0.0005<=0.005
Decisin
Se rechaza la hiptesis nula
Conclusin:
Existe suficiente evidencia estadstica para afirmar que la proporcin de
personas que prefieren verinzon despus de la campaa es mayor que la
proporcin de personas que prefieren verinzon antes de la campaa de
marketing, con un nivel de significacin de 0.05