Vous êtes sur la page 1sur 11

Regresin de Poisson

Anlisis de datos categricos

Regresin de Poisson
Ms Carlos Lpez de Castilla Vsquez
Universidad Nacional Agraria La Molina

2015-2

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Regresin de Poisson

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Distribucin de Poisson

La distribucin de Poisson es usada con frecuencia para


modelar datos de conteo.
Si Y P() su distribucin de probabilidad es:
f () =

y exp {}
y!

y = 0, 1,

donde E(Y ) = y Var(Y ) = .


El parmetro se dene por lo general como una tasa.
Para ventas el parmetro se podra denir como el nmero
promedio de clientes que compran un producto por cada 100
clientes que visitan la tienda.
Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Regresin de Poisson

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Distribucin de Poisson

Para accidentes de trnsito el parmetro se puede denir


como: accidentes por cada 1000 vehculos, accidentes por cada
1000 licencias, accidentes por cada 1000 habitantes, etc.
La escala de tiempo debe ser incluida en la denicin, por
ejemplo la tasa de accidentes automovilsticos suele denirse
en un ao mientras que la tasa de ciclones tropicales puede
estar referida a la estacin de noviembre a abril.
En general la tasa se dene en trminos de las unidades de
exposicin. Por ejemplo, para accidentes laborales cada
trabajador esta expuesto durante el horario de trabajo por lo
que la tasa se puede denir en trminos de personas por ao
en riesgo.
Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Regresin de Poisson

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Distribucin de Poisson

En este captulo se consideran dos situaciones. En la primera


los eventos estan sometidos a diferentes cantidades de
exposicin que deben ser incorporadas al modelar la tasa de
eventos. Las otras variables explicativas pueden ser contnuas o
categricas.
En la segunda situacin la exposicin es constante y por
consiguiente no relevante para el modelo. Las variables
predictoras son usualmente categricas. La variable respuesta
es la frecuencia observada en cada celda y las variables usadas
para denir la tabla son tratadas como variables explicativas.

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Regresin de Poisson

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Regresin de Poisson

Sean Y1 , , YN v.a.i. donde Yi denota el nmero de eventos


observados de un total de ni .
El valor esperado de Yi puede ser escrito como:
E(Yi ) = i = ni i
Suponga que Yi es el nmero de reclamos de seguro hechos
por una marca determinada de autos, que depende del nmero
de autos asegurados ni y otras variables que afectan a i como
la antiguedad del auto, el lugar de uso, etc.

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Regresin de Poisson

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Regresin de Poisson

La dependencia de i con las variables predictoras se modela


por:
n
o
i = exp xT
El modelo lineal generalizado es:
n

E(Yi ) = i = ni exp xT

Yi P(i )

La funcin de enlace natural es:


log i = log ni + xT

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Regresin de Poisson

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Regresin de Poisson

Los valores estimados son:


n
o
Yi =
i = ni exp xT

i = 1, , N

Los residuales de Pearson son:


oi ei
Yi Yi
ri =
= p
ei
Yi

y pueden ser estandarizados usando los leverages:


oi ei
rpi =
ei 1 hi

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Regresin de Poisson
Regresin de Poisson

2
El estadstico chi-cuadrado: X 2 = N
i=1 ri
La devianza para el modelo de Poisson es:

D=2

X
[oi log(oi /ei )]

ya que oi = ei .
Los residuales de devianza son los componentes de D :
P

di = signo(oi ei )
P
2
tal que D = N
i=1 di

2[oi log(oi /ei ) (oi ei )]]

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Regresin de Poisson

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Ejemplo: Consumo de tabaco

El conjunto de datos Fumadores del aula virtual tiene los


resultados de un estudio conducido por Sir Richard Doll y sus
colegas.
En 1951 los doctores britnicos recibieron un pequeo
cuestionario sobre el consumo de tabaco. Los datos incluyen
tambin el nmero de muertes por enfermedades coronarias
entre doctores 10 aos despus del estudio. Tambin se
muestra el nmero de personas por ao de observacin en el
momento del anlisis.
Las preguntas de inters fueron: es la tasa de muertes mayor
para fumadores en comparacin a los no fumadores? se
encuentra el efecto diferencial relacionado con la edad?
Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Regresin de Poisson

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Ventajas y desventajas

El supuesto de igualdad entre la media y variancia de la


variable respuesta presenta una de las principales ventajas de
usar la distribucin de Poisson.
Sin embargo podra tratarse tambin de una limitacin ya que
dicha situacin rara vez se observa en la realidad.
Por lo general la distribucin de los datos de conteo presenta
sobredispersin, es decir la variaza es mayor que el valor
esperado y, aunque menos comn, tambin pueden presentarse
casos de infradispersin.
Las alternativas al problema de la sobredispersin consideran
usar los modelos de regresin binomial negativa, modelos
inados en ceros, y los modelos hurdle.
Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Introduccin
Regresin de Poisson
Distribucin binomial negativa

Regresin de Poisson
Distribucin binomial negativa

Si la variable respuesta es el nmero de pruebas hasta que el


r simo xito sucede entonces:
f (yi |p, r ) =

yi 1
r 1

p r (1 p)yi r

yi = r , r + 1,

Si la variable respuesta es el nmero de fallas antes del


r simo xito entonces:
f (yi |p, r ) =

r +yi 1
yi

p r (1 p)yi

yi = 0, 1,

Es ms conveniente trabajar con la segunda parametrizacin


ya que el rango de yi es positivo y no depende de r .

Ms Carlos Lpez de Castilla Vsquez

Anlisis de datos categricos

Vous aimerez peut-être aussi