Vous êtes sur la page 1sur 8

Prueba de bondad de ajuste: distribuciones de Poisson

Ya vimos la prueba de bondad de ajuste para poblaciones multinomiales. En


general, la prueba de bondad de ajuste puede usarse con cualquier distribución de
probabilidad hipotética.

Miremos el uso de la prueba de bondad de ajuste para el caso en que se tiene la


hipótesis de que la población tiene una distribución de Poisson.

Para esta prueba de bondad de ajuste y en el uso de la distribución chi-cuadrada


se sigue el mismo procedimiento general aplicado para la prueba de bondad de
ajuste.

Distribución de Poisson

Ejemplo, las llegadas de los clientes al Dubek’s Food Market en Tallase, Florida.
Se han presentado recientemente algunos problemas de personal, los gerentes
solicitan los servicios de una empresa de consultoría para que les ayude en la
programación de los empleados de las cajas. Después de revisar el avance de las
filas en las cajas, la empresa de consultoría sugerirá un procedimiento para la
programación de los empleados de cajas. Este procedimiento se basa en un análisis
matemático de las filas y sólo es aplicable si el número de llegadas de clientes
durante un determinado lapso de tiempo sigue una distribución de Poisson. Por
tanto, antes de poner en marcha el procedimiento de programación, habrá que
recolectar datos sobre las llegadas de los clientes y realizar una prueba estadística
para ver si es razonable suponer que las llegadas de los clientes siguen una
distribución de Poisson.

DISTRIBUCIÓN DE POISSON. Esta distribución es una de las más importantes


distribuciones de variable discreta. Sus principales aplicaciones hacen
referencia al modelado de situaciones en las que nos interesa determinar el
número de hechos de cierto tipo que se pueden producir en un intervalo de
tiempo o de espacio, bajo presupuestos de aleatoriedad y ciertas
circunstancias restrictivas.
Otro de sus usos frecuentes es la consideración límite de procesos
dicotómicos(es decir se refiere a la DIVISIÓN en 2 partes.) reiterados un gran
número de veces si la probabilidad de obtener un éxito es muy pequeña.

Variable discreta
Una variable discreta es aquella que toma valores aislados, es decir no admite
valores intermedios entre dos valores específicos. Por ejemplo:

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.


Variable continúa
Una variable continua es aquella que puede tomar valores comprendidos entre
dos números. Por ejemplo:

La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

Las llegadas de los clientes a la tienda se definen en términos de cantidad de


clientes que entran en la tienda durante intervalos de 5 minutos. Por tanto las
hipótesis nulas y alternativa en este estudio son las siguientes:

Ho: La cantidad de clientes que entran en la tienda durante intervalos de 5 minutos


tiene una distribución de probabilidad de Poisson

Ha: La cantidad de clientes que entran en la tienda durante intervalos de 5 minutos


no tienen una distribución de probabilidad de Poisson

Si una muestra de llegadas de clientes indica que no se puede rechazar Ho,


Dubeck’s procederá a poner en marcha el proceso de programación de la empresa
de consultoría.

Pero, si la muestra lleva a rechazar Ho, no se podrá suponer que las llegadas siguen
una distribución de Poisson y habrá que considerar otro procedimiento de
programación.

Para probar la suposición de que las llegadas de los clientes en las mañanas de los
días entre semana siguen una distribución de Poisson, un empleado de la tienda
toma una muestra aleatoria de 128 intervalos de 5 minutos, en las mañanas de tres
semanas consecutivas. Durante cada uno de los intervalos de 5 minutos que forman
la muestra, el empleado registra el número de llegadas de clientes. El empleado
determina el número de intervalos de 5 minutos en los que no hubo ninguna llegada,
el número de intervalos de 5 minutos en los que hubo una llegada, el número de
intervalos de 5 minutos en los que hubo dos llegadas, etc.

Las frecuencias observadas en las 10 categorías.

Numero de
Llegada de Frecuencia
clientes observada
0 2
1 8
2 10
3 12
4 18
5 22
6 22
7 16
8 12
9 6
128

Se debe usar la prueba de bondad de ajuste para determinar si las muestras de los
128 lapsos favorecen la hipótesis de que las llegadas tienen una distribución de
Poisson.

Para usar la prueba de bondad de ajuste, se necesitan considerar, las frecuencias


esperadas para cada una de las 10 categorías, lapsos de tiempo en los que llegarán
cero clientes, un cliente, dos clientes, etcétera.

Para esto necesita la función de probabilidad de Poisson.

μ representa la media o número esperado de llegadas de clientes en lapsos de 5


minutos,

x representa la variable aleatoria del número de llegadas de clientes en un lapso


de 5 minutos

f(x) es la probabilidad de x llegadas de clientes en un lapso de 5 minutos.

e representa el valor de 2,7183

μ = Sumatoria (número de clientes* Numero de Llegada de clientes/ Frecuencia


observada)

numero de llegada de clientes frecuencia numero de llegada de clientes*frecuencia


X observada
0 2 0
1 8 8
2 10 20
3 12 36
4 18 72
5 22 110
6 22 132
7 16 112
8 12 96
9 6 54
128 640

μ = 640/128 = 5

Con este valor como media poblacional aplicamos la distribución de Poisson, una
estimación de la función de probabilidad de Poisson es:

Entonces, la probabilidad de que lleguen cero clientes en un lapso de cinco minutos


es f(0) =0.0067, la probabilidad de que llegue un cliente en un lapso de 5 minutos
es f(1) = 0.0337, etc.

La frecuencia esperada en cada una de las categorías se encuentra multiplicando


su probabilidad por el tamaño de la muestra. Por ejemplo, el número de lapsos de
tiempo con cero llegadas es (0.0067)(128) = 0.86, el número esperado de lapsos
de tiempo con una llegada es (0.0337)(128) = 4.31, etcétera.

FRECUENCIAS ESPERADAS EN LAS LLEGADAS DE LOS CLIENTES A


DUBEK’S SUPONIENDO QUE SIGAN UNA DISTRIBUCIÓN DE POISSON
CON μ = 5

Probabilidad de
numero de frecuencia Poisson

llegada de clientes observada f(x) 128* (f (x))


0 2 0,006737722 0,8624284160 0,8600
1 8 0,033688609 4,312141946 4,31
2 10 0,084221522 10,78035486 10,78
3 12 0,140369204 17,96725811 17,97
4 18 0,175461505 22,45907263 22,46
5 22 0,175461505 22,45907263 22,46
6 22 0,146217921 18,71589386 18,71
7 16 0,104441372 13,36849561 13,36
8 12 0,065275857 8,355309759 8,36
9 6 0,036264365 4,641838755 4,65 123,9200
10 y mas 0,018132183 4,08 4,0800
128,0000

Antes de hacer los cálculos habituales para comparar las frecuencias observadas y
esperadas, hay que observar que en la tabla hay cuatro categorías que tienen una
frecuencia esperada menor que cinco. Esto viola los requerimientos para el uso de
la distribución chi-cuadrada. Sin embargo, no es una dificultad, ya que se pueden
combinar categorías menores que cinco para satisfacer la condición de que la
frecuencia esperada sea “por lo menos cinco”.

Aquí, se combinan 0 y 1 en una sola categoría y también se combinan 9 y “10 o


más” en una sola categoría.

De esta manera se satisface la regla de un mínimo de cinco como frecuencia


esperada en cada categoría.

FRECUENCIAS OBSERVADAS Y ESPERADAS EN LAS LLEGADAS DE LOS


CLIENTES A DUBEK´S, DESPUÉS DE COMBINAR CATEGORÍAS

Probabilidad Número
| de esperado
De lapsos de 5 minutos
Numero de Frecuencia Poisson con
Llegada de X llegadas,
clientes observada F(x) 128 f (x) (ei)
1 10 0.0403 5.17 5,1700
2 10 0,084221522 10,78035486 10,78
3 12 0,140369204 17,96725811 17,97
4 18 0,175461505 22,45907263 22,46
5 22 0,175461505 22,45907263 22,46
6 22 0,146217921 18,71589386 18,71
7 16 0,104441372 13,36849561 13,36
8 12 0,065275857 8,355309759 8,36
9 6 0,0541 8.73 8,73
mas 128 128,0000

Recordemos que la prueba de bondad de ajuste se centra en las diferencias entre


frecuencias observadas y esperadas, fi - ei. Por tanto, para calcular el estadístico
de prueba chi-cuadrada se usarán las frecuencias observadas y esperadas en
las llegadas de los clientes a dubek´s, después de combinar categorías.
CÁLCULO DEL ESTADÍSTICO DE PRUEBA CHI-CUADRADA PARA EL
ESTUDIO DE DUBEK’S FOOD MARKET

Cuadrado de
Frecuencia Frecuencia Diferencia la diferencia
Dividido entre
la
frecuencia
Numero de observada Esperada Diferencia Al cuadrado esperada
llegada de
clientes fi ei ( fi - ei) ( fi - ei)2 ( fi -ei)2/ei
4,5123
1 10 5,17 4,8300 23,3289
0,0564
2 10 10,78 -0,7800 0,6084
1,9778
3 12 17,96 -5,9700 35,6409
0,882
4 18 22,45 -4,4600 19,8916
0,009
5 22 22,45 -0,4600 0,2116
0,5785
6 22 18,71 3,2900 10,8241
0,5216
7 16 13,36 2,6400 6,9696
1,5955
8 12 8,35 3,6400 13,2496
0,8749
9 6 8,77 -2,7300 7,4529
mas 128 128,0000 Varianza X2=11,008
X2=11,008

El valor del estadístico de prueba es X2 =11.008

Antes de buscar en la tabla de chi-cuadrada debemos encontrar los grados de


libertad = k-p-1 donde k es el número de categorías y p es el número de
parámetros poblacionales estimados a partir de los datos muestrales entonces k=9
y p = 1 por que solo se halló la media muestral entonces GL=9-1-1=7
GRADOS LIBETAD = 7

Suponga que en la prueba de la hipótesis nula de que la distribución de probabilidad


de las llegadas de los clientes es una distribución de Poisson se usa 0.05 como nivel
de significancia.

Para probar esta hipótesis, se necesita determinar el valor-p correspondiente al


valor del estadístico de prueba X2 =11.008 hallando el área en la cola superior de
la distribución chi-cuadrada con 7 grados de libertad.

Valor-p
X2 = 11.008 corresponde a un área, en la cola superior de valor-p(0,25 y 0, 10) y
un valor critico (9,037 y 12,017), Por tanto se sabe que el valor-p para 0.05 =
14.067
0.25 a 0.10<=0.05
No se cumple, por lo tanto no se rechaza Ho, entonces se acepta

Como el valor-p > α=0.05, no se puede rechazar Ho. De manera que no se puede
rechazar la suposición de que la distribución de probabilidad de las llegadas de los
clientes, en las mañanas entre semana, siga una distribución de probabilidad de
Poisson. De esta manera, los administradores de Dubek’s pueden continuar con el
procedimiento de programación para las mañanas de los días entre semana.
Valor critico

X2>= X2α se rechaza la hipótesis nula

(9,037 y 12,017)>= 14.067


No se cumple, por lo tanto, no se rechaza Ho, entonces se acepta

Ejercicio 1. Al parecer el número de accidentes automovilísticos por día en una


determinada ciudad tiene una distribución de Poisson. A continuación se presentan
los datos de una muestra de 80 días del año anterior. ¿Estos datos apoyan la
creencia de que el número de accidentes por día tiene una distribución de Poisson?
Use α = 0.05.

Vous aimerez peut-être aussi