Académique Documents
Professionnel Documents
Culture Documents
Poisson PDF
Poisson PDF
kangadesire@yahoo.fr
kanga.desire@gmail.com
16 avril 2016
1 Position du problème
2 Distribution de Poisson
3 Idée de l’hétérogénéité
Plan
1 Position du problème
2 Distribution de Poisson
3 Idée de l’hétérogénéité
Position du problème
Définition
Une variable Y est dite de comptage si elle désigne le nombre de fois qu’un
événement survient.
1 Les variables de comptage sont la résultante de certains phénomènes
prenant des petits nombres de valeurs discrets positives, mais non
catégorielles
2 Ex. : nombre d’accidents, nombre d’enfants, nombre d’années d’études,
nombre d’arrivée journalière à une gare, nombre de fois où un individu
change d’emploi.
3 Pour expliquer comment les réalisations de telles variables, le modèle
linéaire classique se révèle inadéquat pour les mêmes raisons que dans
le modèle dichotomique :
le nuage des observations n’a pas une forme adaptée à un ajustement
linéaire ;
l’hypothèse de normalité ne peut être plausible puisque la variable
endogène prend des valeurs discrètes avec des probabilités non nulles ;
les prévisions de l’endogène donnent des valeurs que ne peut prendre y .
4 Que faire ? Le but de ce chapitre est de trouver le ou les modèles
appropriés pour analyser une variable d’intérêt qui est une variable de
comptage.
Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 5 / 21
Distribution de Poisson
Plan
1 Position du problème
2 Distribution de Poisson
3 Idée de l’hétérogénéité
Distribution de Poisson
Rappel
Soit une variable aléatoire indiquant le nombre de fois un événement s’est
produit durant un intervalle de temps. y ∼ P(λ) si
λk
P(y = k ) = e−λ
k!
Le paramètre λ est appelé taux d’incidence et vérifie : E(y ) = λ = Var (y )
1 L’égalité de la moyenne et la variance est qualité d’équidispersion.
2 En pratique, les variables de comptage ont souvent une variance plus
grande que la moyenne, ce qui est qualifié de surdispersion.
3 Le développement des modèles de comptage essaie de prendre en
compte cette surdispersion.
4 Une autre hypothèse du modèle de Poisson est que les événements
sont indépendants : lorsqu’un événement se produit il n’affecte la
probabilité de réalisation de l’événement dans le futur.
5 Ex. : considérons le nombre de visites chez un médecin. L’hypothèse
d’indépendance implique que quand un individu visite un médecin, son
taux de visite ne change pas. Les visites passées n’affectent pas les
visites futures.
Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 7 / 21
Idée de l’hétérogénéité
Plan
1 Position du problème
2 Distribution de Poisson
3 Idée de l’hétérogénéité
Hétérogénéité
Plan
1 Position du problème
2 Distribution de Poisson
3 Idée de l’hétérogénéité
Présentation
1 Soit yi une variable de comptage à valeur dans N. La probabilité que
{yi = k }, avec k ∈ {1, 2, . . .}, est donnée par :
λki
P(yi = k ) = e−λi (1)
k!
où λi est le paramètre de la distribution tel que E(yi ) = λi = Var (yi )
2 Pour introduire les variables explicatives, on pose que
k
X
λi = exp(Xi β) = exp( βj xji ) (2)
j=1
Estimation
Probabilités prédites
1 La probabilité prédite :
Plan
1 Position du problème
2 Distribution de Poisson
3 Idée de l’hétérogénéité
Présentation
1 Le modèle de Poisson impose que l’espérance conditionnelle est égale
à la variance conditionnelle. Cette hypothèse est parfois peu réaliste.
2 Le problème souvent rencontré est celui de la surdispersion :
V (y |x) > E(y |x) . Ce problème est due à l’hétérogénéité non
observable.
3 Pour prendre en compte cette dimension, on modifie l’espérance du
modèle de Poisson comme suit
λ̃i = exp(Xi β + ei ) (11)
où ei est un terme d’erreur aléatoire supposé non corrélé avec Xi .
4 Dans le modèle de Poisson, les variations de λi résultent de
l’hétérogénéité observée entre les individus. A différentes valeurs de Xi
seront associées différentes valeurs de λi et tous les individus ayant les
mêmes caractéristiques observables X ont la même valeur de λ.
5 Dans le modèle binomial négatif, les variations de λ̃ sont dues à la fois
aux variations de Xi et à l’hétérogénéité non observable captée par la
variable ei .
6 La relation entre les moyennes conditionnelles du modèle de Poisson et
du modèle binomial négatif est donnée par la relation suivante :
λ̃i = λi exp(ei ) = λi δi (12)
Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 17 / 21
Modèle binomial négatif Présentation
Présentation
Présentation
Estimation