Vous êtes sur la page 1sur 11

Prueba de Chi Cuadrado

Danny Brito Rosado

Natalia Carolina Vega Gomes


Pablo Rafael Valiente Montiel

Universidad de la Guajira
(Sede central)

Riohacha la Guajira

21/11/2017
1. Prueba de Chi Cuadrado

La hipótesis nula de la prueba Chi-cuadrado postula una distribución de


probabilidad totalmente especificada como el modelo matemático de la población
que ha generado la muestra. Para realizar este contraste se disponen los datos en
una tabla de frecuencias.
El procedimiento Prueba de chi-cuadrado tabula una variable en categorías y
calcula un estadístico de chi-cuadrado. Esta prueba de bondad de ajuste compara
las frecuencias observadas y esperadas en cada categoría para contrastar que
todas las categorías contengan la misma proporción de valores o que cada
categoría contenga una proporción de valores especificada por el usuario.

Ejemplos. La prueba de chi-cuadrado podría utilizarse para determinar si una bolsa


de caramelos contiene en igualdad de proporción caramelos de color azul, marrón,
verde, naranja, rojo y amarillo. También podría utilizarse para ver si una bolsa de
caramelos contiene un 5% de color azul, un 30% de color marrón, un 10% de color
verde, un 20% de color naranja, un 15% de color rojo y un 15% de color amarillo.

2. ¿COMO SE APLICA?

Las pruebas chi-cuadrado son un grupo de contrastes de hipótesis que sirven para
comprobar afirmaciones acerca de las funciones de probabilidad (o densidad) de una o dos
variables aleatorias.
Estas pruebas no pertenecen propiamente a la estadística paramétrica pues no establecen
suposiciones restrictivas en cuanto al tipo de variables que admiten, ni en lo que refiere a
su distribución de probabilidad ni en los valores y/o el conocimiento de sus parámetros.
Se aplican en dos situaciones básicas:
a) Cuando queremos comprobar si una variable, cuya descripción parece adecuada, tiene
una determinada función de probabilidad. La prueba correspondiente se llama chi-
cuadrado de ajuste.
b) Cuando queremos averiguar si dos variables (o dos vías de clasificación) son
independientes estadísticamente. En este caso la prueba que aplicaremos ser la chi-
cuadrado de independencia o chi-cuadrado de contingencia.
2.1 Chi-cuadrado de ajuste

En una prueba de ajuste la hipótesis nula establece que una variable X tiene una cierta
distribución de probabilidad con unos determinados valores de los parámetros. El tipo de
distribución se determina, según los casos, en función de: La propia definición de la variable,
consideraciones teóricas al margen de esta y/o evidencia aportada por datos anteriores al
experimento actual.
A menudo, la propia definición del tipo de variable lleva implícitos los valores de sus
parámetros o de parte de ellos; si esto no fuera así dichos parámetros se estimarán a partir
de la muestra de valores de la variable que utilizaremos para realizar la prueba de ajuste.
Como en casos anteriores, empezaremos definiendo las hipótesis.

Hipótesis nula: X tiene distribución de probabilidad f(x) con parámetros y1,..., yp

Hipótesis alternativa: X tiene cualquier otra distribución de probabilidad.

2.2 Chi-cuadrado de contingencia o independencia

La prueba chi-cuadrado de contingencia sirve para comprobar la independencia de frecuencias


entre dos variables aleatorias, X e Y.

Las hipótesis contrastadas en la prueba son:

Hipótesis nula: X e Y son independientes.

Hipótesis alternativa: X e Y no son independientes (No importa cual sea la relación que mantengan
ni el grado de esta.
3. EN QUE SE APLICA

Esta prueba solamente puede aplicarse a estudios basados en muestras


independientes, y cuando todos los valores esperados son mayores de 5. Los
valores esperados son los que indican la independencia absoluta entre ambas
variables.
La prueba de Chi cuadrado utiliza una aproximación a la distribución Chi cuadrado,
para evaluar la probabilidad de una discrepancia igual o mayor que la que exista
entre los datos y las frecuencias esperadas según la hipótesis nula. La exactitud de
esta evaluación depende de que los valores esperados no sean muy pequeños, y
en menor medida de que el contraste entre ellos no sea muy elevado.

4. Ejemplos

Chi cuadrado de ajuste

-Se ha tomado una muestra aleatoria de 40 baterías y se ha registrado su duración en años. Estos

resultados se los ha agrupado en 7 clases en el siguiente cuadro

i clase (duración) frecuencia observada (oi)

1 1.45 – 1.95 2

2 1.95 – 2.45 1

3 2.45 – 2.95 4

4 2.95 – 3.45 15

5 3.45 – 3.95 10

6 3.95 – 4.45 5

7 4.45 – 4.95 3
Verificar con 5% de significancia que la duración en años de las baterías producidas por este

fabricante tiene duración distribuida normalmente con media 3.5 y desviación estándar 0.7

Solución

Sea X: duración en años (variable aleatoria contínua)

1) Ho: X ~ N(3.5,0.7) (distribución normal, µ=3.5, σ=0.7)

2) Ha: no H0

3) α = 0.05

Cálculo de la probabilidad correspondiente a cada intervalo

p1 = P(X≤1.95) = P(Z≤(1.95 – 3.5)/0.7) = 0.0136

p2 = P(1.95≤X≤2.45) = P((1.95 – 3.5)/0.7 ≤Z≤ (2.45 – 3.5)/0.7) = 0.0532

p3 = P(2.45≤X≤2.95) = P((2.45 – 3.5)/0.7 ≤Z≤ (2.95 – 3.5)/0.7) = 0.135

Cálculo de las frecuencias esperadas

e1 = p1 n = 0.0136 (40) ≈ 0.5

e2 = p2 n = 0.0532 (40) ≈ 2.1

e3 = p3 n = 0.135 (40) ≈ 5.4

... (etc)

Resumen de resultados

duración (años) frecuencia observada (oi) frecuencia esperada (ei)

1.45 – 1.95 2 0.5


1.95 – 2.45 1 2.1

2.45 – 2.95 4 5.4

2.95 – 3.45 15 10.3 Ojo con el redondeo,

3.45 – 3.95 10 10.7 la suma debe ser n =40

3.95 – 4.45 5 7

4.45 – 4.95 3 3.5

Es necesario que se cumpla la condición ∀i, ei ≥ 5 por lo que se deben agrupar clases adyacentes.

Como resultado se tienen cuatro clases k=4

duración (años) frecuencia observada (oi) frecuencia esperada (ei)

1.45 – 2.95 7 8.5

2.95 – 3.45 15 10.3

3.45 – 3.95 10 10.7

3.95 – 4.95 8 10.5

Ahora se puede definir la región de rechazo de Ho

Observemos que en este ejemplo la media y la desviación estándar de la distribución normal no se

estimaron, sino que están propuestas, de donde r = 0


Chi-cuadrado de contingencia o independencia

Vous aimerez peut-être aussi