Vous êtes sur la page 1sur 12

UNIVERSIDAD NACIONAL AGRARIA LA

MOLINA
FACULTAD ECONOMIA Y PLANIFICACION
DEPARTAMENTO DE ESTADISTICA E
INFORMTICA

Modelo de Regresin
de Poisson

Callalli Jimenez, Maura Elena


Castro, Luis
Patow Len, Andrea Alessandra
Zavala Principe, Santiago

TRABAJO ENCARGADO
Grupo
-

Modelo de Regresin de Poisson

INDICE
1. Modelo de Regresin de Poisson
Introduccin..,..
..2
1.1. Definicin ................
..........3
1.2. Mtodo de mxima verosimilitud.......................
.......5
1.3. Interpretacin de los parmetros...
.....6
1.4. Aplicaciones para la Regresin de Poisson.....
.....8
Ejemplo

Modelo de Regresin de Poisson

INTRODUCCION
La distribucin de Poisson fue derivada por SIMEON DENIS POISSON,
quien en 1837 public un trabajo de Investigacin en el que se
presentaba una nueva distribucin para el clculo de probabilidades
aplicado al mbito penal. Poisson encontr que cuando el tamao de
una muestra es grande y la probabilidad de ocurrencia de un evento es
pequea, el valor esperado =np tiende a una constante.
En el presente trabajo buscamos, mediante la distribucin de Poisson,
modelar una regresin de variables. En donde la variable respuesta tiene
una distribucin Poisson y el logaritmo de su valor esperado puede ser
modelado por una combinacin lineal de parmetros desconocidos.
Usando datos de conteo para este proceso.

Modelo de Regresin de Poisson

MODELO DE REGRESION DE POISON


1.1 DEFINICION
El Modelo de Regresin Poisson (MRP) es el modelo de referencia en
estudios de variables de recuento. Es un modelo que resulta
especialmente adecuado para modelar valores enteros no negativos,
especialmente cuando la frecuencia de ocurrencia es baja.
Dentro del modelado de regresin se estudia un escenario diferente,
en donde la variable de inters y tiene distribucin Poisson en
lugar de distribucin normal. Esta variable representa un conteo de
algn elemento, es decir el nmero de veces que ocurre este
fenmeno aleatorio.
Tomando a

yi

, de conteo, como la observacin

yi

= 0,1, Un

modelo probabilstico razonable para estos datos sera

f ( y )=

e
, y =0,1, .
y!

donde el parmetro > 0

Ya que dentro de esta distribucin se relacionan promedio y varianza,


se demuestra de forma directa;
E ( y )= y Var ( y )=

El modelo de regresin de Poisson puede escribirse as


y i=E ( y i ) + i , i=1,2, , n

Se supondr que hay una funcin g, llamada funcin cadena

Modelo de Regresin de Poisson

g ( i )= i
0+ 1 x1 +. . .+ k
x'i

Esta funcin relaciona la media de

con un predictor lineal que es

i=g1 ( i ) =g1 ( x ' i )

Existen varias funciones que se usan frecuentemente con la


distribucin de Poisson.
Como por ejemplo la cadena identidad, que se escribe
g ( i )=i =x ' i

Cuando se utiliza

E ( y i )=i =x ' i

, porque

i=g ( x ' i )=x ' i .

Otra funcin cadena muy usada es la logartmica


g ( i )=ln ( i )=x ' i

Para esta funcin la relacin entre la media de la variable de


respuesta y el predictor lineal es
i=g1 ( x ' i ) =e x

'
i

La finalidad de usar esta cadena logartmica es asegurar que todos


los valores predichos de la variable respuesta sean no negativos.

Modelo de Regresin de Poisson

1.2 METODO DE MAXIMA VEROSIMILITUD


Se usa para estimar los parmetros de regresin de Poisson. Su
desarrollo es parecido al mtodo que se us en la regresin logstica.
Con una muestra n, variables predictores x y respuesta y ,
tenemos una funcin de verosimilitud como sigue
n

L ( y , )= f i ( y i )=
i=1

i
yi !

i=1

i y exp i
i

i=1

yi !

i=1

yi

donde

i=g1 ( x ' i )

i=1

Se maximiza el logaritmo de verosimilitud

Modelo de Regresin de Poisson

yi !

ln
n

y i ln( i) i
i=1

i=1

ln L ( y , ) =
i=1

Para determinar los estimados de mxima verosimilitud, se pueden


usar los mnimos cuadrados. Y luego de obtenerse los estimados del
^
parmetro , se tiene el modelo ajustado
^y i=g1 (x ' i )

Usando la cadena identidad, la ecuacin se transforma en


^y i=x ' i

Usando la cadena logartmica se obtiene


^y i=exp (x' i )

La desviacin del modelo es una medida general de bondad de


ajuste, y se pueden hacer pruebas sobre subconjuntos de los
parmetros del modelo usando la diferencia de la desviacin entre los
modelos completo y reducido. stas son pruebas de cociente de
verosimilitud. Para probar hiptesis y establecer intervalos de
confianza para los parmetros individuales del modelo se puede usar
la inferencia de Wald, basada en las propiedades de estimadores de
mxima verosimilitud con muestra grande.

1.3 INTERPRETACIN DE LOS PARMETROS

Modelo de Regresin de Poisson

Es necesario ser cuidadosos cuando modelamos la media . Por


yi
ejemplo, si
es el nmero de defectos en una pieza con un rea
a
yi
,a
de superficie i , deberemos usar el modelo
Poisson ( 0 i ),

donde 0 es el nmero medio de defectos por unidad de rea.


En otros casos la exposicin es constante, en tal caso no necesitamos
incluirlo explcitamente en el modelo.
Ejemplo:
En las agencias de seguros se pueden, especficamente,
colectar datos del nmero de accidentes que cada cliente
yi
tiene en un ao dado. Si
es el nmero de accidentes
por cliente en un ao dado, entonces usaremos el modelo
yi
Poisson ().
Donde es el nmero promedio de accidentes por cliente.

Ahora si consideramos un modelo simple con un solo predictor

x ,

tenemos que
E ( Y )===exp ( + x)

Tambin puede escribirse, como sigue


E ( Y )=exp ( ) ( exp ( ) )

x ,
tenemos una funcin media de tal manera que la media en x+ 1

Considerando el incremento de una unidad en el predictor

es

multiplicada por exp ( ) , as que el


impacto de una unidad de cambio en x es un mltiplo de la media
simplemente la media en
anterior.
E ( y / x+1 ) =exp ( ) ( exp ( ) )

x+1

exp ( ) ( exp ( ) ) exp ( )

Modelo de Regresin de Poisson

E ( y /x ) exp ( )

Las estimaciones de los parmetros a menudo son interpretadas

exp ( j )
sobre e en trminos de razn de incidencias, es decir,
representa el riesgo relativo (RR) sobre la tasa de incidencia de los
sucesos asociada a un incremento de una unidad en la covariable
xj
.
Para una variable explicativa binaria denotada por una variable
x =0
x j=1
indicadora ( i
si el factor est ausente o
si est
presente), el riesgo relativo para la presencia versus la ausencia se
define como
y
y
E(
)/ E(
)=e
x=1
x=0
De forma similar para una variable explicativa continua

xk

, un

incremento de una unidad resultar en un efecto multiplicativo de


e en la razn m, es decir si la variable
k

x k , aumenta n unidades, la esperanza de la variable Poisson se

multiplica por
e n =(e k ) n , es decir la potencia n-sima de
k

e k

Modelo de Regresin de Poisson

1.4 APLICACIONES PARA LA REGRESION DE POISSON


Dado que el modelo de regresin de Poisson es ms apropiado
cuando la variable dependiente es un conteo, es decir un nmero de
sucesos o eventos que ocurren en una misma unidad de observacin
en un intervalo espacial o temporal definido. Se tienen algunas
aplicaciones regularmente usadas como por ejemplo, el nmero de
llamadas que llegan a una central telefnica, que dependen de otras
variables como, por ejemplo el da de la semana o la hora del da.
Asumiendo, claro, que los sucesos son independientes.
En forma general, estas variables de conteo pueden ser
Conteos en el tiempo:
Nmero de accidentes de trfico en un tramo de cierta
carretera en un mes.
Nmero del registro de partculas de una desintegracin
radioactiva por segundo.
Nmero de mutaciones en una poblacin de animales durante 5
aos.
Conteos en el espacio:
Nmero de accidentes de trfico que se originan en el cruce de
2 carreteras.
Nmero de organismos infecciosos propagados en una placa
agrica.

Modelo de Regresin de Poisson

Nmero de clulas sanguneas en una muestra de sangre (el


espacio es igual al volumen en centmetros cbicos)
Nmero de rboles infectados por hectrea en un bosque.
Nmero de pasas en una masa por kg.

Este modelo se usa tambin para variables de Poisson con intervalos


que no son espaciales ni temporales sino de otro tipo. En las ltimas
dos dcadas se ha usado en la epidemiologa para investigar la
incidencia y mortalidad de enfermedades crnicas, entre sus
numerosas aplicaciones se ha usado para comparar grupos de
expuestos y no expuestos, adems para evaluar el curso clnico de
algunos enfermos.
Se puede medir la frecuencia de una enfermedad contando, en un
tiempo dado, el nmero de enfermos en una cierta poblacin, dividida
en intervalos prefijados de habitantes. Al nmero de personas
enfermas en una poblacin de tamao n , en un instante de tiempo,
se le denomina prevalencia de la enfermedad en ese instante y es,
por tanto, una variable de Poisson.
Adems, tomando en cuenta la incidencia, se puede medir el nmero
de personas que se enferman en una poblacin susceptible de
enfermar, en un periodo de tiempo determinado. En este caso el
intervalo es de personas-tiempo, habitualmente personas-ao.
Habitualmente ambas medidas se expresan para intervalos de
tamao por unidad.
Siempre se debe tener cuidado al aplicar este tipo de modelos a
datos reales, pues, en algunos casos, se dan fenmenos tales como la
sobredispersin.
Se sabe que una peculiaridad de la distribucin de Poisson es que su
media sea igual a su varianza. Sin embargo, en ciertos conjuntos de
datos se observa una varianza superior a la esperada. El fenmeno se
conoce como sobredispersin e indica que el modelo no es adecuado.
Un motivo frecuente es la omisin de alguna variable relevante. En
algunos casos se aconseja recurrir a la distribucin binomial negativa.
Exceso de ceros: Otro fenmeno que aparece en la prctica es el del
exceso de ceros. Puede deberse a que existen dos fenmenos
estadsticos que se entrecruzan: uno genera ceros; otro, los valores
no nulos. Esto ocurre, por ejemplo, al tratar de modelar el nmero de
cigarrillos fumados por cada uno de los integrantes de un grupo de
personas: puede que algunos de ellos, simplemente, no sean
fumadores.
1

Modelo de Regresin de Poisson

Vous aimerez peut-être aussi