Vous êtes sur la page 1sur 14

PRUEBAS CHI CUADRADO

Prof. Willer David Chanduvi Puicn ENEI

Las pruebas Chi-cuadrado se utilizan para probar hiptesis referidas a los patrones de
comportamiento de frecuencias relacionadas con variables ya sean cuantitativas o
cualitativas. En este sentido, entre las pruebas ms comunes se encuentran la de Bondad
del Ajuste, la de Independencia y la de Homogeneidad.
En general, el procedimiento de prueba comienza con la formulacin de las hiptesis; en la
hiptesis nula se plantea el modelo terico que determinara el comportamiento de las
frecuencias. Luego, se comparan con los datos efectivamente obtenidos y se cuantifican las
diferencias numricas efectivamente halladas. Ahora bien, para juzgar la significancia de las
diferencias halladas, Karl Pearson (1900) propuso el estadstico de prueba Chi - Cuadrado, una
prueba cuyos detalles de implementacin se presentan a continuacin.
En esencia, la prueba consiste en determinar si esas diferencias se deben a variaciones al azar y
por lo tanto no son significativas o si por el contrario son significativas. En el primer caso no se
rechaza la hiptesis nula planteada, mientras que en el segundo se rechaza.

a. Prueba de bondad de ajuste.-


Esta es una prueba para decidir, a partir de una muestra particular, si se rechaza o no la
hiptesis de que una variable aleatoria se ajusta o no a una distribucin probabilstica
especifica. Por ejemplo, muchos de los mtodos que se aplicarn se basan en el
supuesto de que los datos provienen de una poblacin con distribucin normal.
Un procedimiento adecuado para verificar ese supuesto es aplicar una prueba de bondad
del ajuste, debiendo aclararse que no es en el nico caso en que se puede aplicar esta
prueba ya que, esta es susceptible de utilizarse cualquiera sea la distribucin
especificada: uniforme, Poisson, exponencial, normal, entre otras.
El procedimiento comienza con el planteo de la hiptesis nula de que la variable
aleatoria bajo estudio tiene una distribucin especfica. Luego se toma una
muestra aleatoria de la poblacin, la cual provee las frecuencias observadas.
Seguidamente se compara con la distribucin terica. Los valores de las
probabilidades tericos cuando se los multiplica por el tamao de la muestra, se
transforman en las frecuencias esperadas.
El estadstico de prueba es:

m 2
( oi ei )
x =
2

i=1 ei

Donde:
oi : Frecuencia observada en la categora Ai

e i : Frecuencia esperada de la categora Ai


PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

k : Nmero de parmetros estimados en la distribucin terica.

m: Nmero de categoras en que se agrupan los datos.

Ejemplos:

Prueba para un ajuste uniforme.

El director de mercadeo de Seven Seas Inc., tiene la responsabilidad de


controlar el nivel de xistencias para cuatro tipos de botes vendidos para su
firma. En el pasado ha ordenado nuevos botes bajo la premisa de que los cuatro
tipos son igualmente populares y la demanda de cada tipo es la misma. Sin
embargo, recientemente las existencias se han vuelto ms difciles de controlar
y el director considera que debera verificar su hiptesis respecto a una
demanda uniforme. Sus hiptesis son:

H0:
La demanda es uniforme para los cuatro tipos de botes.
H1:
La demanda no es uniforme para los cuatro tipos de botes
Prueba de ajuste a un patrn especfico.

Un banco de Nueva York trata de seguir una poltica de extender un 60% de sus
crditos a empresas comerciales, un 10% a personas naturales y un 30% a
prestatarios extranjeros.
Para determinar si la poltica se estaba siguiendo, el vicepresidente de mercadeo
selecciona aleatoriamente 85 crditos que se aprobaron recientemente.
Encuentra 1ue 62 de tales crditos se otorgaron a negocios, 10 a personas
naturales, y 13 a personas extranjeras. A un nivel de significancia de 0,10
parece que el patrn de cartera deseado se preserva?

H0:
Se mantuvo el patrn deseado.
H1:
El patrn deseado no se mantuvo.

Prueba de normalidad.

Las especificaciones para la produccin de tanques de aire utilizados en


inmersin requieren que los tanques se llenen a una presin promedio de 600
libras por pulgada cuadrada (psi) se permite una desviacin estndar de 10 psi.
Las especificaciones de seguridad permiten una distribucin normal en los
niveles de llenado. Usted acaba de ser contratado por Aqua Lung un importante
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

fabricante de equipos de inmersin. Su primera tarea es determinar si los


niveles de llenado se ajustan a una distribucin normal. Aqua Lung est seguro
de que la media de 600 psi y la desviacin estndar de 10 psi prevalecen. Solo
queda por probar la naturaleza de la distribucin. En este esfuerzo se miden
1000 tanques y se halla la siguiente distribucin:

H0:
Los niveles de llenado estn distribuidos normalmente.
H1:
Los niveles de llenado no estn distribuidos normalmente.

b. Prueba de homogeneidad.
La prueba Chi-cuadrado se puede aplicar para determinar si dos o ms muestras
aleatorias independientes se extraen de la misma poblacin. Para ello se clasifica a la
poblacin en trminos de una variable cualitativa en k grupos (categoras de la variable)
o niveles de un factor, con el objeto de evaluar si las proporciones poblacionales son
homogneas. Por ejemplo, podramos querer verificar si las opiniones (de acuerdo, en
desacuerdo), respecto a la poltica del Presidente Regional de Lambayeque, son
homogneas en tres ciudades como pueden ser Lambayeque, Ferreafe y Chiclayo, de
las cuales se obtuvieron tres muestras independientes.
Tambin este tipo de prueba se puede aplicar para realizar un anlisis confirmatorio de
los datos que se poseen de una encuesta ya efectuada. En este ltimo caso, entonces, de
acuerdo a las dos variables categricas podremos armar una tabla de contingencia con
las frecuencias asociadas a lo que definiremos como xito y fracaso para cada grupo.
El estadstico de prueba es:

m k 2
( oij eij )
x =
2

i=1 j=1 e ij

Donde:
oi : Frecuencia observada en la categora A i B j
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

e i : Frecuencia esperada de la categora A i B j

k : Nmero de categoras para la variable Y.

m: Nmero de categoras para la variable X.

Ejemplo
Estamos interesados en estudiar la fiabilidad de cierto componente informtico con relacin al
distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes
de cada uno de los 3 distribuidores que nos sirven el producto comprobando el nmero de
defectuosos en cada lote. La siguiente tabla muestra el nmero de defectuosos para cada uno de
los distribuidores.

Solucin:

1. Formulacin de hiptesis:

H0 :
No existen diferencias entre los tres distribuidores con respecto al nmero de
componentes defectuosos.
H1 :
Existen diferencias entre los tres distribuidores con respecto al nmero de
componentes defectuosos.

0.05
2. Establecer un nivel de significancia:
3. Eleccin del estadstico de prueba:

m k 2
( oij eij )
x =
2

i=1 j=1 e ij
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

p=0.002<0.05 H0
4. Decisin: como entonces rechazamos

5. Conclusin: Existen diferencias entre los tres distribuidores con respecto al nmero de
componentes defectuosos, a un nivel de significancia de 0,05.
Ejemplo:
En un proceso de fabricacin de tornillos, el fabricante quiere determinar si la proporcin de
tornillos defectuosos producidos por tres mquinas variaba de una mquina a otra. Para verificar
esto se seleccionaron muestras de 400 tornillos de la produccin de cada mquina y se cont el
nmero de tornillos defectuosos en cada una obtenindose los siguientes datos.

Verifique si la proporcin de tornillos defectuosos no difiere entre las siguientes mquinas.

Ejemplo:
Con el propsito de decidir si la opinin sobre el nivel de las carreras de ingeniera, que tienen
los acadmicos y los alumnos son concordantes, se procede a encuestar a 100 acadmicos y a
200 alumnos, obtenindose los siguientes resultados:

Pruebe la hiptesis que la distribucin proporcional de la opinin entre los acadmicos y los
alumnos es la misma, utilizando un nivel de significancia de 0,05.

a) Prueba de independencia.-

En este caso, se trata de una situacin en la que interesa poner a prueba si existe o no
independencia entre dos variables cualitativas (atributos) de una poblacin. Para ello se
toma una muestra, se construye una tabla de contingencia con las dos variables
cualitativas de inters, y en base a la distribucin de frecuencias conjunta observada en
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

esa tabla de contingencia y la frecuencia esperada, que se calcula de acuerdo a la


hiptesis nula planteada, se construye el estadstico Chi-cuadrado para evaluar las
diferencias entre ambas. Si la diferencia es significativa, concluimos que las variables
estn relacionadas o son dependientes.
El estadstico de prueba es:

m k 2
( oij eij )
x =
2

i=1 j=1 e ij

Donde:
oi : Frecuencia observada en la categora A i B j

e i : Frecuencia esperada de la categora A i B j

k : Nmero de categoras para la variable Y.

m: Nmero de categoras para la variable X.

Ejemplo:

Para estudiar la dependencia entre la prctica de algn deporte y la depresin, se seleccion una
muestra aleatoria simple de 100 jvenes, con los siguientes resultados:

Determinar si existe asociacin entre la actividad del sujeto y su estado de nimo. Utilice un
nivel de significancia de 0,05

1. Formulacin de hiptesis:

H0 :
No existe asociacin entre la actividad del sujeto y su estado de nimo.
H1 :
Existe asociacin entre la actividad del sujeto y su estado de nimo.
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

0.05
2. Establecer un nivel de significancia:
3. Eleccin del estadstico de prueba:
m k 2
( oij eij )
x =
2

i=1 j=1 e ij

p=0.016< 0.05 H0
4. Decisin: como entonces rechazamos

5. Conclusin: Existe asociacin entre la actividad del sujeto y su estado de nimo, a un nivel
de significancia de 0,05.

Ejemplo:
Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el grado
de silicosis de los trabajadores. Para ello se extrae una muestra aleatoria de 300 trabajadores y
se clasifican segn se muestra en la siguiente tabla.

Pruebe la hiptesis de que el tipo de trabajo afecta el grado de silicosis del trabajador
con un nivel de significancia de 0,05
Ejemplo.
Una institucin ambiental hizo un estudio para determinar si el sector habitacional se relaciona
con el grado de contaminacin por plomo. Una muestra aleatoria de 300 personas a las que se
les examin arroj los siguientes resultados:
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

Cree usted que el sector habitacional se relaciona con el grado de contaminacin por plomo?
Use un nivel de significancia de 0,05.

Correccin por continuidad o correccin de yates

Ejemplo
En la siguiente tabla se muestran los datos de 43 nios de diferente gnero, en donde se ha
evaluado la satisfaccin familiar (PRUEBA DE INDEPENDENCIA)

Lo que se plantea es que alguno de los dos gneros pueda tener mayor frecuencia de
satisfaccin familiar.

1. Formulacin de hiptesis: Debes Fijarte en los grficos

H0 :
La satisfaccin familiar es igual en hombres y mujeres.
H0 :
No existe asociacin entre la satisfaccin y el gnero. (Porcentajes iguales)
H1 :
La satisfaccin familiar no es igual en hombres y mujeres.
H1 :
Existe asociacin entre la satisfaccin y el gnero. (Porcentajes diferentes)
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

Tabla cruzada satisfaccion*genero


Recuento

genero

femenino masculino Total


satisfaccion si 24 8 32

no 4 7 (3.83) 11
Total 28 15 43

Pruebas de chi-cuadrado

Significacin Significacin
asinttica Significacin exacta
Valor gl (bilateral) exacta (bilateral) (unilateral)
a
Chi-cuadrado de Pearson 5,380 1 ,020
b
Correccin de continuidad 3,813 1 ,051
Razn de verosimilitud 5,208 1 ,022
Prueba exacta de Fisher ,031 ,027
Asociacin lineal por lineal 5,255 1 ,022
N de casos vlidos 43

a. 1 casillas (25,0%) han esperado un recuento menor que 5. El recuento mnimo esperado es 3,84.
b. Slo se ha calculado para una tabla 2x2

0.05
2. Establecer un nivel de significancia:
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

3. Eleccin del estadstico de prueba:


n
(oi ei ) 2
x2
i 1 ei

2
xtab 3.84
4. Determinar la regin crtica.
H0
5. Decisin: como p=0.020<0.05 entonces rechazamos
6. Conclusin: La satisfaccin familiar no es igual en hombres que en mujeres.

Sin embargo una casilla o el 25% de las casillas, tienen una frecuencia esperada menor a 5. La
frecuencia mnima esperada es 3.84. Este valor nos indica que debemos realizar una correccin.
Deberemos, por lo tanto, utilizar la correccin por continuidad. Esta correccin se utiliza
cuando los valores en la tabla son muy pequeos

Correccin de Yates:

n ( oi ei 0.5) 2
x
2

i 1 ei

H0
1. Decisin: como p=0.51 no es menor que 0,05 entonces no rechazo .
2. Conclusin: No existe suficiente evidencia estadstica para afirmar que la satisfaccin
familiar no es igual en hombres y mujeres.

Es importante aclarar que cuando la hiptesis nula no es rechazada, tampoco se puede decir que
se acepta. Se debe decir que la hiptesis nula no se rechaza. Se debe evitar el uso de la palabra
aceptar en este caso porque pudiera haberse cometido el error de tipo II. Dado que,
frecuentemente, la probabilidad de cometer un error de tipo II puede ser realmente alta, no se
pretende cometerlo al aceptar la hiptesis nula.

Test Exacto de Fisher

Pruebas de chi-cuadrado
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

Significacin Significacin
asinttica Significacin exacta
Valor gl (bilateral) exacta (bilateral) (unilateral)

Chi-cuadrado de Pearson 4,496a 1 ,034


b
Correccin de continuidad 2,624 1 ,105
Razn de verosimilitud 4,651 1 ,031
Prueba exacta de Fisher ,058 ,052
Asociacin lineal por lineal 4,232 1 ,040
N de casos vlidos 17

a. 3 casillas (75,0%) han esperado un recuento menor que 5. El recuento mnimo esperado es 2,88.
b. Slo se ha calculado para una tabla 2x2

NO SE RECHAZA (0.58) es mayor a 0.05 LA Ho no existe la suficiente evidencia estadstica


para afirmar que la satisfaccin familiar
Ejemplo

Se tienen 17 nios de diferente sexo; masculino y femenino, a quienes se les ha evaluado la


satisfaccin familiar. Los datos se presentan en la siguiente tabla:

1. Formulacin de hiptesis:

H0 :
La satisfaccin familiar es igual en hombres y mujeres.
H1 :
La satisfaccin familiar no es igual en hombres y mujeres

0.05
2. Establecer un nivel de significancia:
3. Eleccin del estadstico de prueba:
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

n
(oi ei )2
x
2

i 1 ei

2
xtab 3.84
4. Determinar la regin crtica.
H0
5. Decisin: como p=0.034<0.05 entonces rechazamos
6. Conclusin: La satisfaccin familiar no es igual en hombres que en mujeres.

Sin embargo, tres casillas, es decir, el 75% de ellas tienen una frecuencia esperada menor a 5.
La frecuencia mnima esperada es 2.88. Como este valor es demasiado bajo no se puede aplicar
la correccin de Yates. Aplicamos entonces la siguiente regla de decisin: cuando una de las
frecuencias esperadas es menor que 5 aplicamos la correccin de yates; sin embargo, si esta
frecuencia es menor a tres, aplicaremos la correccin de Fisher.

En este caso la frecuencia mnima esperada es 2,9 que es menor que 3; por lo tanto aplicaremos
la correccin de Fisher o el Test exacto de Fisher.

Test de Fisher

Calcula exactamente la probabilidad a travs de:

(a b)!(c d )!(a c)!(b d )!


p
n !a !b !c !d !

H0
5. Decisin: como p=0.058>0.05 entonces no rechazamos
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

6. Conclusin: No existe suficiente evidencia estadstica para afirmar que la


satisfaccin familiar no es igual en hombres que en mujeres.

Hay que tener en cuenta que a pesar que las proporciones son muy diferentes y aparentemente
existe diferencias, no se puede afirmar tal hecho debido a que la muestra es muy pequea.

PRUEBA DE MC NEMAR

CONTROL EXPERIMENTAL
ANTES DESPUES ANTES DESPUES

Necesariamente uso este grupo


Para ver si hubo un cambio debido
A un reforzamiento

Para ilustrar esta prueba, supongamos que un grupo de consumidores de n=600

participantes son seleccionados al azar para un estudio de mercado, se les pide inicialmente que
indiquen sus preferencias por dos proveedores de telefona celular en competencia, Sprint y
Verizon. Supongamos que, inicialmente, 282 dicen que prefieren Sprint y 318 dicen que
prefieren Verizon. Despus de exponer a todo el grupo a una estrategia de campaa de
marketing intensiva para Verizon, supongamos que los mismos 600 consumidores de nuevo les
pidi que indicaran sus preferencias, con los siguientes resultados: De los 282 panelistas que
previamente Sprint preferida, 246 mantienen su lealtad a la marca, pero 36 de ellos se cambi a
Verizon. De los 318 panelistas que inicialmente preferan Verizon, 306 permanecen fieles a la
marca, mientras que 12 prefiri a Sprint. RESOLVER
PRUEBAS CHI CUADRADO
Prof. Willer David Chanduvi Puicn ENEI

Se aplica para la diferencia de proporciones


Sabemos que una prueba de independcia se utiliza
Para probar si existe evidencia de una diferencia entre las proporciones de
una muestra relacionada

Objetivo si la campaa de marketing fue efectiva para Verinzon


Poblacin 1: nmero de personas que prefieren verinzon antes de la
campaa de marketing. (1)
Poblacin 2: nmero de personas que prefieren verinzon despus de la
campaa de marketing. (2)
Parmetro 1 proporcion de personas que prefieren verinzon antes de la
campaa de marketing.
Parmetro 2 proporcion de personas que prefieren verinzon despus de la
campaa de marketing.

Ho 21
H1 2>1
Unilateral cola a la derecha
P=0.0005<=0.005
Decisin
Se rechaza la hiptesis nula

Conclusin:
Existe suficiente evidencia estadstica para afirmar que la proporcin de
personas que prefieren verinzon despus de la campaa es mayor que la
proporcin de personas que prefieren verinzon antes de la campaa de
marketing, con un nivel de significacin de 0.05

Vous aimerez peut-être aussi