Logros Al finalizar la sesin el estudiante ser capaz de:
Aplicar pruebas de hiptesis utilizando la distribucin Chi-cuadrado para verificar si existe independencia y/o comportamiento similar (homogneo) entre dos variables cualitativas concernientes a su especialidad.
USOS DE LA DISTRIBUCION CHI CUADRADO Permite comparar frecuencias observadas con frecuencias esperadas segn un modelo supuesto. Esta caracterstica de la distribucin Chi-cuadrado permite efectuar las siguientes pruebas: 1.Prueba de independencia. 2.Prueba de homogeneidad de subpoblaciones. 3.Pruebas de bondad de ajuste a una distribucin de probabilidades. Tabla de contingencia Es una tabla de frecuencia simple de dos vas (bidireccional), sus r filas y sus c columnas se usan para resumir y anotar los resultados de datos recolectados de dos variables: Una variable para clasificar las filas y otra para clasificar las columnas. Est relacionado el tipo de falla con el turno de trabajo? PRUEBA DE INDEPENDENCIA Esta prueba permite evaluar si dos variables son independientes entre s. Es til cuando se trata de analizar la independencia entre dos variables en escala nominal.
Ejemplo 1 Una fbrica de galletas realiz una investigacin para determinar si la incidencia de ciertos tipos de fallas en el empaque de las galletas estn relacionadas con el material utilizado. Las fallas mas frecuentes detectadas en los empaques son: arruga, rotura, despegue y quemado. La siguiente tabla muestra el nmero de fallas ocurrido en el uso de los tres materiales obtenida con una muestra tomada durante el ltimo trimestre: Frecuencias Observadas Tipo de Falla Material Utilizado Polietileno Poliestireno Polipropileno Arruga 162 310 258 Rompe 118 196 193 Despega 451 996 458 Quema 18 25 10 SOLUCION: 1. Hiptesis: H 0 : El tipo de falla que se presenta es independiente de los diferentes materiales de empaque utilizados. No hay relacin entre el tipo de falla que se presenta y los diferentes materiales utilizados en el empaque. H 1 : El tipo de falla que se presenta no es independiente de los diferentes materiales de empaque utilizados. Hay relacin entre el tipo de falla que se presenta y los diferentes materiales utilizados en el empaque.
2. Nivel de significacin o=0,01
3. Estadstica de prueba:
( ) ( )( ) 2 2 2 ( ) 1 ~ ; 1 1 . . k i i i i o e r c g l e u _ _ u =
= =
4. Regin crtica y criterios de decisin:
Si Chi cal >16,8 se rechaza la hiptesis nula. 5. Procedimiento: Clculo de los valores esperados Polietileno Poliestireno Polipropileno Total Arruga 162 171.1 310 348.9 258 210.0 730 Rompe 118 118.9 196 242.3 193 145.8 507 Despega 451 446.6 996 910.5 458 547.9 1905 Quema 18 12.4 25 25.3 10 15.2 53 Total 749 1527 919 3195 Por Entre Clculo del valor de la estadstica de prueba Total de obs. Total de esp. = _ 2 cal
6. Decisin estadstica y conclusin Rechazar Ho Conclusin: Con un nivel de significacin del 1% se puede afirmar que el tipo de falla no es independiente de los materiales de empaque utilizados. Esto es, existe relacin entre el tipo de falla y el material de empaque. Ejemplo 2 Se seleccion una muestra de amas de casa y se aplic una encuesta para determinar si existe relacin entre los sectores socioeconmicos (A, B y C) y su preferencia por uno de dos detergentes (alfa o beta). Los resultados de la investigacin se muestran en la siguiente tabla. Sobre la base de los datos mostrados y usando un nivel de significacin de 0,05 verifique si la preferencia por un detergente tiene relacin con el nivel socioeconmico. AMAS DE CASA Nmero que favorece el detergente alfa Nmero que favorece el detergente Beta Nivel A 197 203 Nivel B 260 240 Nivel C 232 168 Solucin: 1. Planteo de hiptesis: 2. Nivel de significacin: = 0.05 3. Estadstico de prueba: ( ) 2 ) 2 , 05 . 0 ( 2 2 ~ _ _
= i i i C e e o Ho: Preferencia del detergente es independiente del nivel socioeconmico H1:. Preferencia del detergente no es independiente del nivel socioeconmico 4. Regiones crticas criterios de decisin: Si 991 . 5 2 s C _ No se rechaza Ho Si Se rechaza Ho 991 . 5 2 > C _ o=0.05 Distribucin chi cuadrado con 2 g. l. 991 . 5 2 = C _ 5. Clculos: Detergente alfa Detergente beta oi ei oi ei Total Nivel A 197 212 203 188 400 Nivel B 260 265 240 235 500 Nivel C 232 212 168 188 400 TOTAL 689 689 611 611 1300 Frecuencia observada (oi) Frecuencia esperada (ei) 197 212 1,06132075 260 265 0,09433962 232 212 1,88679245 203 188 1,19680851 240 235 0,10638298 168 188 2,12765957 1300 1300 6,47330389 Total de obs. Total de esp. _ 2 cal
6.- Conclusiones: Con un nivel de significacin del 5% existen evidencias estadsticas para afirmar que el tipo de detergente no es independiente del nivel socioeconmico de las amas de casa.
4733 . 6 2 = C _ D. E. : Rechaza la hiptesis nula Prueba de homogeneidad de proporciones La percepcin de calidad (Buena o Mala) en el suministro de agua y alcantarillado ser la misma en los distritos de La Molina, La Victoria y San Isidro? 0 10 20 30 40 50 60 70 Buena Mala La Victoria 0 10 20 30 40 50 60 70 Buena Mala La Molina San Isidro 0 10 20 30 40 50 60 70 Buena Mala Calidad del Servicio Variable categrica Distritos Poblaciones De cada distrito se selecciona una muestra La Molina La Victoria San Isidro Buena Mala Ho: p 1 =p 2 =p 3
H 1 : No todas las proporciones son iguales Ejemplo 1 Una empresa de transporte interprovincial, esta evaluando importar una nueva flota de mnibus. Ha recibido varias ofertas y se qued con tres marcas: Amrica Motors, Europa Motors y Asia Motor. El gerente de operaciones investig y obtuvo muestras de mnibus de cada marca, evalo el desempeo y envi la siguiente informacin respecto al desempeo integral de los vehculos de esas marcas. Se puede concluir con un nivel de significacin de 0,05 que los desempeos de las tres marcas son semejantes (iguales, homogneas)? Desempeo
America Motors Europa Motors Asia Motor Muy Bueno 20 35 15 Bueno 40 40 12 Regular 30 20 20 1. Plantear la Hiptesis Ho: Las proporciones de desempeo de las tres marcas son semejantes (AM, EM y AsM) (son iguales, homogneas). H 1 : Las proporciones de desempeo de las tres marcas no son semejantes (AM, EM y AsM) (no son iguales, no son homogneas). 2. Nivel de significacin o=0,05 3. Estadstica de prueba:
( ) ( )( ) 2 2 2 ( ) 1 ~ ; 1 1 . . k i i i i o e r c g l e u _ _ u =
= =
4. Regin crtica y criterios de decisin:
Si Chi cal >9.488 se rechaza la hiptesis nula. Con 4 gl y = 0.05 Chi cuadradro critico= 9.488 _ 2 cal = 11.666
5. Realizar los clculos de valores esperados Desempeo America Motors Europa Motors ASIA Motor Muy Bueno 27.15517 28.66379 14.18103 Bueno 35.68966 37.67241 18.63793 Regular 27.15517 28.66379 14.18103 _ 2 Tabla= 9.488
6. Decisin estadstica y conclusin Rechazar Ho
Conclusin: Con nivel de significacin del 0,05; hay evidencias estadsticas para rechazar que las proporciones de desempeo (AM, EM y AsM) son iguales u Homogneas o Semejantes. Podemos afirmar, que las marcas presentan diferente nivel de desempeo. Ejemplo 2 Se est considerando cuatro marcas de lmparas elctricas para su uso en una gran planta manufacturera. El director de compras pidi muestras de 100 a cada fabricante. Las cantidades de productos aceptables e inaceptables de cada uno se indican a continuacin. A nivel de significacin del 5%, existe alguna diferencia en la calidad de las bombillas? Producto Fabricante A B C D Inaceptable 12 8 5 11 Aceptable 88 92 95 89 Solucin: 1. Planteo de hiptesis: 2. Nivel de significacin: = 0.05 3. Estadstico de prueba: ( ) 2 ) 3 , 05 . 0 ( 2 2 ~ _ _
= i i i C e e o Ho: La proporcin de productos aceptables de las cuatro marcas toman el mismo valor H 1 : Al menos una de las proporciones de productos aceptables es diferente Sea p 1 , p 2 , p 3 y p 4 la proporcin de productos aceptables de las cuatro marcas: A, B, C y D 4. Regiones crticas criterios de decisin: Si 815 . 7 2 s C _ No se rechaza Ho Si Se rechaza Ho 815 . 7 2 > C _ o=0.05 Distribucin chi cuadrado con 3 g. l. 815 . 7 2 = C _ 5. Clculos: Fabricante Producto A B C D Total oi ei oi ei oi ei oi ei Inaceptable 12 9 8 9 5 9 11 9 36 Aceptable 88 91 92 91 95 91 89 91 364 Total 100 100 100 100 400 Frecuencia observada (oi) Frecuencia esperada (ei) 12 9 1 8 9 0,11111111 5 9 1,77777778 11 9 0,44444444 88 91 0,0989011 92 91 0,01098901 95 91 0,17582418 89 91 0,04395604 400 400 3,66300366 Total de obs. Total de esp. _ 2 cal
6.- Conclusiones: Con un nivel de significacin del 5% existen evidencias estadsticas para afirmar que las proporciones de productos aceptables es la misma en las cuatro marcas
663 . 3 2 = C _ D. E. : No rechaza la hiptesis nula Gracias