Vous êtes sur la page 1sur 37

PLAN DE CLASE

• Competencias
• Motivación.
Inicio • Saberes previos.

• Prueba de Independencia.
• Pruebas de Bondad de Ajuste.
Contenido de
sesión • Ejercicios resueltos.

• Retroalimentación.
• Autoevaluación
Cierre

miércoles, 16 de marzo de 2016


CASO PRACTICO
La Ing. Gassi, responsable del área de distribución de la
empresa farmacéutica “Medic S.A.”, desea utilizar la
distribución normal para modelar el tiempo de demora en
la entrega de los pedidos a los clientes. Para este fin,
selecciona al azar una muestra aleatoria de los tiempos
de demora de los pedidos y luego de procesarlos obtiene
la siguiente tabla de distribución de frecuencias:
Tiempo de demora 20-30 30-40 40-50 50-60 60-70
Número de pedidos 25 80 40 25 20

Ejecute la prueba de hipótesis para probar que el tiempo


de demora tiene distribución normal con = 42 y =10.
Use =0.05.
Competencias
Al termino de la sesión, el
estudiante estará en capacidad
de:
 Realizar pruebas de
independencia y de bondad de
ajuste en problemas
contextualizados.
 Interpretar los resultados
obtenidos de la prueba
respectiva.
PRUEBA DE INDEPENDENCIA

Esta prueba permite analizar la relación de dependencia o


independencia entre dos variables cualitativas.
¿El consumo de comida
chatarra está relacionado
con las enfermedades
sanguíneas, diabetes,
colesterol, obesidad?

uhm
pero
Tabla de contingencia
Los datos obtenidos para un par de variables cualitativas se resumen en
una tabla de doble entrada que se conoce como tabla de contingencia, tal
como se muestra a continuación:

donde:
A i: : Característica i de la variable A
Bj: : Característica j de la variable B
Ri : Número de individuos que tiene la característica Ai
Cj : Número de individuos que tiene la característica Bj
Oij : Número de individuos que tiene las características Ai y Bj a la vez.
n : Tamaño de la muestra
Pasos a seguir:
1.- Planteamiento de las hipótesis

Hipótesis nula (H0): Las variables X e Y son independientes.


(X e Y no están relacionadas)

Hipótesis alterna (H1): Las variables X e Y no son independientes.


( X e Y están relacionadas)

2.- Fijar α

R C (Oij  Eij ) 2
3.- Estadístico de  cal
2
 
i 1 j 1 Eij
prueba
donde:
Oij : Frecuencia observada de la celda que está en la intersección de la fila i
y columna j.

Eij : Frecuencia esperada de la celda que está en la intersección de la fila i y


columna j.

La frecuencia esperada se calcula Ri  C j


de la siguiente manera: Ei j 
n

4.- Valor crítico 5.- Decisión

T2   (2R 1)( C 1); 1


donde: (R-1)(C-1) son los grados de
libertad Re chazar Ho si :  cal
2
  (2R 1)(C 1);1
Observaciones:
1.- Cuando Ho es verdadera, las diferencias entre Oi y Ei son pequeñas,
pero cuando Ho es falsa esta diferencia es grande.

2.- Para saber si O(observado) y E (esperado) son suficientemente grandes,


se utiliza la distribución Chi – Cuadrado.

3.- Para que los resultados de la prueba sean válidas debe de cumplirse
(supuestos):

o La muestra debe ser aleatoria y de preferencia de tamaño mayor a


100.

o La frecuencias esperadas deben ser mayores que cero y se admite solo


un 25% de celdas con Eij < 5; si esto no se cumple, se puede agrupar
categorías adyacentes.
¿CUÁL ES EL GRADO DE LA RELACIÓN ENCONTRADA?

Una vez determinado que existe relación entre dos variables, el


segundo aspecto de interés lógico será medir el grado de esta
relación.

Phi (Es la más utilizada en tablas 2x2)  cal


2
 
n

Coeficiente de Contingencia (para  cal


2
tablas de orden diferente de 2x2) C
n   cal
2
Ejemplo 1
Existe la controversia de que un estudiante universitario logra
culminar en menos tiempo su carrera en las especialidades de
letras que en ingeniería o ciencias básicas. Por lo cual la empresa
“Tanto” ha decidido realizar un estudio para verificar la
controversia y por ello ha seleccionado una muestra aleatoria de
1600 estudiantes. Los resultados se muestran en el siguiente
cuadro:
Al nivel de significación
del 5%, ¿se puede inferir
que existe relación entre el
tipo de especialidad y el
tiempo que el estudiante
logra culminar su carrera.

“LO QUE ESCUCHO LO OLVIDO. LO QUE VEO LO RECUERDO. PERO LO QUE HAGO, LO ENTIENDO.”
Solución
1.- Planteamiento de las hipótesis
Ho : El tipo de especialidad y el tiempo que el estudiante logra culminar su
carrera son independientes.
H1: El tipo de especialidad y el tiempo que el estudiante logra culminar su
carrera no son independientes.

2.- α = 0.05 4.- Valor crítico


 T2   (231)( 31); 1
3.- Estadístico de prueba
 T2   42;0.95  9.488
R C (Oij  Eij ) 2
 c
2
   98
i 1 j 1 Eij

5.- Decisión
Como  C2  98   T2;0.95  9.88, se rechaza Ho.

Por lo tanto, con un nivel de significancia del 5%, existe evidencia estadística
para pensar que el tipo de especialidad y el tiempo que el estudiante logra
culminar su carrera no son independientes.
Reporte: Minitab
Menos de 4 Entre 5 a 6 Mayor igual Total
Especialidad
años años a 7 años (fila)
Letras 300 150 50 500
229.687 195.313 75.000 500.000
21.524 10.513 8.333
Ciencias Básicas 110 125 90 325
149.297 126.953 48.75 325
10.343 0.030 34.904
Ingeniería 325 350 100 775
356 302.7 116.3 775
2.702 7.380 2.272
Total columna 735 625 240 1600
Reporte: Minitab
Menos de 4 Entre 5 a 6 Mayor igual Total
Especialidad
años años a 7 años (fila)
Letras 300 150 50 500
229.687 195.313 75.000 500.000
21.524 10.513 8.333
Ciencias Básicas 110 125 90 325
149.297 126.953 48.75 325
10.343 0.030 34.904
Ingeniería 325 350 100 775
356 302.7 116.3 775
2.702 7.380 2.272
Total columna 735 625 240 1600
PRUEBA DE BONDAD DE AJUSTE
Motivación
¿El número de clientes que llegan a
un centro comercial se distribuye
como una distribución Poisson?
Prueba de Bondad de ajuste Chi Cuadrado

Estas pruebas permiten verificar que la población de la cual


proviene una muestra tiene una distribución especificada o
supuesta.
Esta prueba es aplicable para variables aleatorias discretas o
continuas.
Las pruebas de bondad de ajuste pueden utilizarse para determinar
si una variable se ajusta a una determinada distribución de
probabilidades, como por ejemplo:
 Normal
 Binomial
 Poisson
 Otra
Pasos a seguir:
1.- Planteamiento de hipótesis

Hipótesis nula (H0) : La variable de estudio se distribuye de acuerdo


a la distribución dada.

Hipótesis alternativa (H1) : La variable de estudio no se distribuye de


acuerdo a la distribución dada.

2.- Fijar α
R
(Oi  Ei ) 2
3.- Estadístico de prueba  C2 
i 1 Ei

donde: Ei = n. Pi
Pi es la probabilidad de la distribución dada
n es el tamaño de muestra
4.- Valor crítico

T2   k2m1,1

donde: k: número de categorías formadas


m: número de parámetros estimados

5.- Decisión

Rechazar Ho si:  C2   k2 m1;1


Observaciones

¿En qué casos se deben de estimar algunos parámetros a partir de


la muestra?

 Cuando una variable se aproxima a una distribución normal y


no se conocen los dos parámetros poblacionales ( µ y σ), se
deben estimar a partir de los datos de la muestra (𝑋 y s) , y
en este caso m=2

 Las frecuencias esperadas de cada una de las categorías deben ser


mayores o iguales a cinco; si alguna categoría tuviera una
frecuencia esperada menor que cinco, se deberán unir categorías
adyacentes.
Ejemplo 2

En el Ministerio de salud (Minsa) se afirma que el tipo de


sangre de las personas que residen en Lima Metropolitana está
en el orden de 35%,10%,6% y 49%. Un investigador quiere
verificar si estos porcentajes son los mismos en el
departamento del Cuzco. Para ello, se seleccionó una muestra
de 200 personas residentes en el Cuzco y se obtuvieron los
siguientes resultados:

¿Podemos afirmar que el investigador tiene la razón? Use α = 0.05


Solución

Estamos ante el caso de una distribución multinomial:


1.- Planteamiento de las hipótesis
H0 : El tipo de sangre de las personas que residen en el Cuzco se
distribuye según indica el Minsa

H1 : El tipo de sangre de las personas que residen en el Cuzco no se


distribuye según indica el Minsa

2.- α = 0.05 4.- Valor crítico T2   32;0.95  7.815

3.- Estadístico de prueba 5.- Decisión


R
(Oi  Ei ) 2
 C2   9.489
i 1 Ei

Rechazamos Ho, ya que: C2  9.489  T2  7.815

Por lo tanto, con un nivel de significancia del 5%, existe evidencia estadística
para pensar que el tipo de sangre de las personas que residen en el Cuzco no se
distribuye según indica el Minsa.
Ejercicio 3
Se ha tomado una muestra aleatoria de 40 baterías y se ha registrado
su duración en años. Los resultados se han agrupado en siete
categorías tal como se muestra en el siguiente cuadro:

Verifique al 5% de significancia si la duración en años de las


baterías producidas por este fabricante se distribuye como una
normal con µ = 3.5 y σ = 0.7
Solución

Primero, se tienen que hallar las probabilidades para cada intervalo

 1.45  3.5 
P( X  1.45)  P Z    P( Z  2.93)  0.00169
 0.7 

 1.45  3.5 1.95  3.5 


P(1.45  X  1.95)  P Z    0.0117
 0.7 0.7 

De la misma forma para los otros intervalos.


Como las frecuencias esperadas son menores que cinco en las primeras
categorías, se unen como una sola, al igual que las últimas tres categorías
que formaron una sola como se muestra en cuadro adjunto
En este problema los parámetros(µ y σ ) son conocidos, por tanto m=0
1.- Planteamiento de hipótesis

H0 : El tiempo se distribuye como una normal con µ = 3.5 y σ =0.7


H1 : El tiempo no se distribuye como una normal con µ = 3.5 y σ =0.7
2.- α = 0.05 4.- Valor crítico 5.- Decisión

3.- Prueba Estadística T2   32;0.95  7.815


R
(Oi  Ei ) 2 7.815
 2
C   3.154
i 1 Ei ¡Concluya!
EJERCICIO RESUELTO
Se propone que el número de defectos en las tarjetas de
circuito impreso sigue una distribución Poisson. En una
muestra aleatoria de 60 tarjetas de circuito impreso se observa
el número de defectos. Los resultados obtenidos son los
siguientes:

¿Muestran estos datos suficiente evidencia para decir que provienen


de una distribución Poisson?. Haga la prueba de la bondad de ajuste
con α = 0.05
Solución: (Cálculos previos)
Primer paso
Reconocer que la media o promedio ( λ ) de la distribución
Poisson propuesta en este ejemplo es desconocida y debe
estimarse a partir de los datos contenidos en la muestra.
Segundo paso: Estimar el valor de lambda
32(0)  15(1)  9(2)  4(3)
x
ˆ  0.75
60
Tercer paso
A partir de la distribución Poisson con el parámetro estimado
(0.75) pueden calcularse las probabilidades asociadas con el
valor de x:
e   x
P( X  x)  x  0,1,2...., 
x!
e 0.75 0.75 0 e 0.75 0.75 1
P( X  0)   0.472 P( X  1)   0.354
0! 1!

e 0.75 0.75 2 P( X  3)  1  0.472  0.354  0.133   0.041


P( X  2)   0.133
2!

El cuadro queda como sigue:


1.- Planteamiento de hipótesis
H0 : El número de defectos en las tarjetas de circuito impreso sigue una distribución Poisson
H1 : El número de defectos en las tarjetas de circuito impreso no sigue una distribución Poisson

2.- α = 0.05 4.- Valor crítico


3.- Prueba Estadística T2  3211; 0.95  3.841
R
(Oi  Ei ) 2 En este problema el parámetro λ se estimó a
 2
C   2.9616
i 1 Ei partir de la muestra, por tanto m=1 y k=3.

5.- Decisión
Como C  2.9616  T  3.841 no se
2 2

rechaza Ho. Con un nivel de


significación del 5%, existe evidencia
estadística para pensar que el número
de defectos en las tarjetas de circuito
impreso sigue una distribución Poisson.
EJERCICIO PROPUESTO
Un ingeniero de control de calidad elige al azar
diariamente una muestra de 10 neumáticos que salen
de una línea de ensamblaje para verificar sobre la base
de los datos si el número de llantas con defectos
observadas en 205 días sigue una distribución binomial.
Los datos registrados se presentan en la siguiente tabla.
Utilice un 5% de significancia.
Número de Número de
defectos días
0 138
1 53
2 9
>=3 5
Total 205
SÍNTESIS

• Prueba Chi-cuadrado
– Prueba de independencia. Relación de
dependencia o independencia entre dos Variables
cualitativas.
– Prueba de bondad de ajuste.
• Distribución cualquiera
• Poisson
• Binomial
• Normal
METACOGNICIÓN

 ¿Qué aspectos te han parecido interesantes?


 ¿Qué contenido consideras más importante del tema
trabajado?
 ¿Qué competencias del tema podrías aplicar en tu vida
diaria?
PARA REFORZAR LO APRENDIDO

RESOLVER LOS PROBLEMAS DE LA GUÍA DE


TRABAJO.
REFERENCIAS BIBLIOGRÁFICAS
1. Referencias básicas:
• Anderson, D. (2012) Estadística para Negocios y Economía.
México: CENGAGE Learning.
• Chue, J. (2012) Estadística Descriptiva y Probabilidades. Lima:
Universidad de Lima.
2. Referencias de lectura obligatoria:
• Lind, D. (2012) Estadística Aplicada a los Negocios y la
Economía. México: Mc Graw Hill.
• Pérez, C. (2013) Diseño de experimentos: técnicas y
herramientas. Madrid: Garceta.

Vous aimerez peut-être aussi