Vous êtes sur la page 1sur 10

ESTADISTICA Y PROBABILIDADES

DISTRIBUCIÓN DE  CHICUADRADO
2

Las distribución Chi cuadrado, se derivan de la distribución Normal y están


relacionadas con la teoría del muestreo pequeño n< 30.
Son muy importantes pues son la base de metodologías inferenciales, tales como
Intervalos de Confianza y Pruebas de Hipótesis.

En otros estudios se les define como la suma de diferencias cuadráticas relativas entre
valores experimentales (observados) y valores teóricos (esperados).

1. DEFINICIÓN DE LOS TÉRMINOS

 Fórmula de Chi Cuadrado

 2

( f o  fe )2
fe

 α = Nivel de Significancia

En estadística, un resultado se denomina estadísticamente significativo cuando no es


probable que haya sido debido al azar. Son comunes los niveles de significancia del
0,05, 0,01 y 0,1. En algunas situaciones es conveniente expresar la significancia
estadística como percentil 1 − α.

Este valor hace referencia al nivel de confianza que deseamos que tengan los cálculos
de la prueba; es decir, si queremos tener un nivel de confianza del 95%, el valor de
alfa debe ser del 0.05, lo cual corresponde al complemento porcentual de la confianza.

 Hipótesis:

Si un contraste de hipótesis proporciona un valor P inferior a α, la hipótesis nula es


rechazada, siendo tal resultado denominado “estadísticamente significativo”. Cuanto
menor sea el nivel de significancia, más fuerte será la evidencia de que un hecho no
se debe a una mera coincidencia (al azar).

 Grados de Libertad: GL=k-1

En estadística, grados de libertad es un estimador del número de categorías


independientes en una prueba particular o experimento estadístico. Se encuentran
mediante la fórmula n − r, donde n=número de sujetos en la muestra, también pueden
ser representados por k − r

k=número de grupos, cuando se realizan operaciones con grupos y no con sujetos


individuales

r=número de sujetos o grupos estadísticamente dependientes


2. DISTRIBUCIÓN  CHI-CUADRADO
2

3. TABLA  CHI-CUADRADO
2
4. LA REGLA DE DECISIÓN

¿Para que utilizamos una Prueba de  Chi-


2

Cuadrado?

 Para determinar si la muestra se ajusta o no se ajusta a una distribución


teórica.

 Para saber si la(s) población(es) son homogénea(s) o no.

 Para determinar la dependencia e independencia la(s) variable(s) a analizar.


5. APLICACIONES DE  CHI-CUADRADO
2

1. Prueba de Bondad de Ajuste

Se utiliza para la comparación de la distribución de una muestra con alguna


distribución teórica que se supone describe a la población de la cual se extrajo.

 Ho : La variable tiene comportamiento normal se distribuye de manera


uniforme

 H1: La variable no tiene comportamiento normal, no se distribuye de manera


uniforme.

2  ( f o  fe )
fe
EJEMPLO 1.

Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el
número de caras de cada serie. El número de series en los que se presentaron 0, 1, 1,
3, 4 y 5 caras se muestra en la siguiente tabla. Ajustar una distribución binomial a los
datos con un α= 0.05

Número Número de
de caras series

(frecuencia
observada)

0 38

1 144

2 342

3 287

4 164

5 25

Total 1000
Solución:

H0; Los datos se ajustan a una distribución binomial.

H1; Los datos no se ajustan a una distribución binomial.

=n.p

=5p

α= 0.05

GL= 5

2 =11.07 de la tabla

Reemplazando la distribución binomial obtendremos

2  ( f o  fe )
 Calculamos el Chi-Cuadrado fe

 Como el 7.54 no es mayor a 11.07, no se rechaza H0 y se concluye con


un α = 0.05 que el ajuste de los datos a una distribución binomial es
bueno.

 7.54<11.07 se acepta la Hipótesis


2. Prueba de Independencia

Se usa para analizar la frecuencia de dos variables con categorías múltiples para
determinar si las dos variables son independientes o no.

 Hipótesis nula (H0) : Las variables X e Y son independientes, ( X e Y no están


relacionadas)

 Hipótesis alternativa (H1): Las variables X e Y no son independientes, (X e Y


están relacionadas)

F C (Oij  Eij ) 2
 2
( F 1)( C 1)  
i 1 j 1 Eij

Tablas de contingencias

 Grados de libertad GL= (m-1)(n-1)

 Calculo de frecuencia esperado.

suma( fila )  suma(columna)


fe 
(total)
 Una Tabla de contingencia con r filas y c columnas tiene la siguiente forma:

Ejemplo2.

El uso de bebida ordenado con alimentos en un restaurante ¿es independiente de la


edad del consumidor? Se toma una muestra aleatoria de 309 clientes del restaurante
de donde resulta el siguiente cuadro de valores observados. Utilice α = 1% para
determinar si las dos variedades son independientes.
EDAD CAFÉ (TÉ) REFRESCO LECHE

21 – 34 26 95 18

35 – 55 41 40 20

>55 24 13 32

Planteamiento de Hipótesis

H0 : El tipo de bebida preferida es independiente de la edad

H1 : El tipo de bebida preferida no es independiente ,esta relacionada con la edad

Nivel de significancia

α = 0.01

Cálculos

Grados de Libertad GL = (m-1)(n-1)

Tenemos 3 filas y tres columnas, es decir

GL = (3-1)(3-1) = 4

El  crítico = 13.27 (Según Tabla)


2

Calculo de frecuencia esperado. suma( fila )  suma(columna)


fe 
(total)
F C (Oij  Eij ) 2
 2
( F 1)( C 1)  
Hallamos Chi-cuadrado i 1 j 1 Eij

(26−43.8)2 (95−71.2)2 (18−24)2 (41−31.8)2


 = 43.8
+ 71.2
+ 24 + 31.8 +

(40−51.7)2 (20−17.5)2 (24−15.4)2 (13−25.1)2


 51.7
+ 17.5 + 15.4 + 25.1 +

(32−8.5)2
 8.5
=97.93

3. Prueba de Homogeneidad

Se extraen Muestras Independientes de varias poblaciones y se prueban para ver si


son homogéneas con respecto a algún criterio de clasificación.

 H0 = Las Poblaciones son Homogéneas

 H1 = Las Poblaciones no son Homogéneas

F C (Oij  Eij ) 2
 2 ( F 1)(C 1)  
i 1 j 1 Eij

Ejemplo 3:

La siguiente tabla indica las familias de cuatro distritos y el número de personas que
vieron un programa especial de política económica nacional. Use α=1%

A B C D TOTAL
Número de personas que si vio 10 15 5 18 48
Número de personas que no vio 40 35 45 32 152
∑ Total 50 50 50 50 200

Solución:

Planteamiento de Hipótesis

 H0: todos vieron el programa

 H1: No todos vieron el programa

Nivel de Significancia

 α = 0.01

Cálculos

 GL = (m-1)(n-1) = (2-1)(4-1) = 3

2
 = 11.35 (De la Tabla)

 Calcular las frecuencias esperadas y el Ch2 observado.

suma( fila )  suma(columna)


Calculo de la Frecuencia esperada fe 
(total)

A B C D TOTAL
Número de personas que si vio 12 12 12 12 48
Número de personas que no vio 38 38 38 38 152
∑ Total 50 50 50 50 200

F C (Oij  Eij ) 2
 
Calculo del Chi-cuadrado:
 2
( F 1)( C 1)
i 1 j 1 Eij

A B C D TOTAL
VEN EL PROGRAMA 0.33 0.75 4.08 3.00
NO VEN EL PROGRAMA 0.11 0.24 1.29 0.95
∑ TOTAL 10.75

Como el valor observado (10.75) es menor que el valor critico (11.35). No podemos
rechazar H0 para un nivel del 1%. La diferencia de las proporciones no es
suficientemente grande para rechazar H0.

10.75<11.35

Vous aimerez peut-être aussi