Vous êtes sur la page 1sur 21

Initiation à l’économétrie

Kanga, Kouamé Désiré

kangadesire@yahoo.fr
kanga.desire@gmail.com

16 avril 2016

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 1 / 21


Plan

1 Position du problème

2 Distribution de Poisson

3 Idée de l’hétérogénéité

4 Modèle de régression de Poisson


Présentation
Estimation
Interprétation des coefficients
Effet marginal sur la moyenne conditionnelle
Probabilités prédites
Prise en compte du temps d’exposition

5 Modèle binomial négatif


Présentation
Estimation
Test de l’hypothèse de surdispersion

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 2 / 21


Modèle de Poisson

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 3 / 21


Position du problème

Plan

1 Position du problème

2 Distribution de Poisson

3 Idée de l’hétérogénéité

4 Modèle de régression de Poisson


Présentation
Estimation
Interprétation des coefficients
Effet marginal sur la moyenne conditionnelle
Probabilités prédites
Prise en compte du temps d’exposition

5 Modèle binomial négatif


Présentation
Estimation
Test de l’hypothèse de surdispersion

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 4 / 21


Position du problème

Position du problème

Définition
Une variable Y est dite de comptage si elle désigne le nombre de fois qu’un
événement survient.
1 Les variables de comptage sont la résultante de certains phénomènes
prenant des petits nombres de valeurs discrets positives, mais non
catégorielles
2 Ex. : nombre d’accidents, nombre d’enfants, nombre d’années d’études,
nombre d’arrivée journalière à une gare, nombre de fois où un individu
change d’emploi.
3 Pour expliquer comment les réalisations de telles variables, le modèle
linéaire classique se révèle inadéquat pour les mêmes raisons que dans
le modèle dichotomique :
le nuage des observations n’a pas une forme adaptée à un ajustement
linéaire ;
l’hypothèse de normalité ne peut être plausible puisque la variable
endogène prend des valeurs discrètes avec des probabilités non nulles ;
les prévisions de l’endogène donnent des valeurs que ne peut prendre y .
4 Que faire ? Le but de ce chapitre est de trouver le ou les modèles
appropriés pour analyser une variable d’intérêt qui est une variable de
comptage.
Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 5 / 21
Distribution de Poisson

Plan

1 Position du problème

2 Distribution de Poisson

3 Idée de l’hétérogénéité

4 Modèle de régression de Poisson


Présentation
Estimation
Interprétation des coefficients
Effet marginal sur la moyenne conditionnelle
Probabilités prédites
Prise en compte du temps d’exposition

5 Modèle binomial négatif


Présentation
Estimation
Test de l’hypothèse de surdispersion

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 6 / 21


Distribution de Poisson

Distribution de Poisson

Rappel
Soit une variable aléatoire indiquant le nombre de fois un événement s’est
produit durant un intervalle de temps. y ∼ P(λ) si

λk
P(y = k ) = e−λ
k!
Le paramètre λ est appelé taux d’incidence et vérifie : E(y ) = λ = Var (y )
1 L’égalité de la moyenne et la variance est qualité d’équidispersion.
2 En pratique, les variables de comptage ont souvent une variance plus
grande que la moyenne, ce qui est qualifié de surdispersion.
3 Le développement des modèles de comptage essaie de prendre en
compte cette surdispersion.
4 Une autre hypothèse du modèle de Poisson est que les événements
sont indépendants : lorsqu’un événement se produit il n’affecte la
probabilité de réalisation de l’événement dans le futur.
5 Ex. : considérons le nombre de visites chez un médecin. L’hypothèse
d’indépendance implique que quand un individu visite un médecin, son
taux de visite ne change pas. Les visites passées n’affectent pas les
visites futures.
Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 7 / 21
Idée de l’hétérogénéité

Plan

1 Position du problème

2 Distribution de Poisson

3 Idée de l’hétérogénéité

4 Modèle de régression de Poisson


Présentation
Estimation
Interprétation des coefficients
Effet marginal sur la moyenne conditionnelle
Probabilités prédites
Prise en compte du temps d’exposition

5 Modèle binomial négatif


Présentation
Estimation
Test de l’hypothèse de surdispersion

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 8 / 21


Idée de l’hétérogénéité

Hétérogénéité

1 L’une des explications de l’échec de la distribution de Poisson à ajuster


correctement les données empiriques est que le paramètre diffère selon
les individus.
2 On qualifie cette situation d’hétérogénéité entre les individus.
3 L’hétérogénéité dans les caractéristiques des individus est la cause de la
surdispersion dans la distribution marginale de la variable.

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 9 / 21


Modèle de régression de Poisson

Plan

1 Position du problème

2 Distribution de Poisson

3 Idée de l’hétérogénéité

4 Modèle de régression de Poisson


Présentation
Estimation
Interprétation des coefficients
Effet marginal sur la moyenne conditionnelle
Probabilités prédites
Prise en compte du temps d’exposition

5 Modèle binomial négatif


Présentation
Estimation
Test de l’hypothèse de surdispersion

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 10 / 21


Modèle de régression de Poisson Présentation

Présentation
1 Soit yi une variable de comptage à valeur dans N. La probabilité que
{yi = k }, avec k ∈ {1, 2, . . .}, est donnée par :
λki
P(yi = k ) = e−λi (1)
k!
où λi est le paramètre de la distribution tel que E(yi ) = λi = Var (yi )
2 Pour introduire les variables explicatives, on pose que
k
X
λi = exp(Xi β) = exp( βj xji ) (2)
j=1

3 Le choix de la forme fonctionnelle liant le paramètre aux exogènes


s’explique essentiellement par la nécessité d’avoir des positifs. Une
autre spécification conduirait à des λi négatifs.
4 De plus lorsque les variables explicatives sont prises en log, les
coefficients s’interprètent comme des élasticités :
∂E(log(yi )
βj =
∂ log(xji )
5 La probabilité conditionnelle de s’écrit :
P(yi = k ) = exp{−λi (xi ) + k log(λi (xi )) − log(k !)} (3)
Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 11 / 21
Modèle de régression de Poisson Estimation

Estimation

1 La log-vraisemblance du modèle de Poisson est :


n
X
log(L) = {− exp (Xi β) + kXi β − log(k !)} (4)
i=1

2 Le vecteur β est obtenu par maximisation de la vraisemblance (4).

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 12 / 21


Modèle de régression de Poisson Interprétation des coefficients

Effet marginal sur la moyenne conditionnelle


1 La valeur espérée de y conditionnellement aux explicatives est :
E(y ) = exp(X β) (5)
2 L’effet marginal d’une explicative xj sur la valeur espérée de y est :
∂E(y |x)
= βj exp(X β) = βj E(y |x) (6)
∂xj
3 L’effet marginal dépend de mais aussi de toutes les autres variables.
4 On peut calculer l’effet sur la moyenne en termes relatif ou de
pourcentage. Pour une variation absolue de xj de δ (xj? → xj? + δ), on a :
E(y |x, xj = xj? + δ)
= exp(βj δ) (7)
E(y |x, xj = xj? )
5 Toutes choses égales par ailleurs, toute variation d’une unité de xj
(δ = 1) entraîne une variation de la valeur espérée de exp(βj ).
6 Alternativement, on peut exprimer cette variation en pourcentage :
E(y |x, xj = xj? + δ) − E(y |x, xj = xj? )
100 × = 100 × [exp(βj δ) − 1] (8)
E(y |x, xj = xj? )
7 On calcule un changement discret
|x)
∆j = ∆E(y
∆x
= E(y |x, xj = xe ) − E(y |x, xj = xs )
Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 13 / 21
Modèle de régression de Poisson Interprétation des coefficients

Probabilités prédites

1 La probabilité prédite :

exp(− exp(Xi β̂)) exp(Xi β̂)k


P(yi = k ) = (9)
k!
2 Cette probabilité est calculée pour chaque observation et pour chaque
valeur de donnée. La probabilité prédite moyenne permet, pour chaque
valeur de donnée, de résumer le pouvoir prédictif du modèle.

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 14 / 21


Modèle de régression de Poisson Prise en compte du temps d’exposition

Prise en compte du temps d’exposition

1 Dans ce qui précède, nous n’avons pris en compte le temps d’exposition


des individus à l’événement d’intérêt.
2 Pour rappel, les yi sont indépendantes et que λi = E(yi |Xi ) dans une
unité d’intervalle de temps.
3 Désignons par ti la durée de temps d’exposition de l’individu à
l’événement.
4 Alors au bout du temps ti , le nombre d’événements espéré est :

µi = ti × λi = exp(ln(ti ) + Xi β) = exp(zi β̃) (10)


5 On peut donc intégrer le temps dans la régression à l’aide de la variable
ln(ti ) dont le coefficient est forcé égal à 1.

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 15 / 21


Modèle binomial négatif

Plan

1 Position du problème

2 Distribution de Poisson

3 Idée de l’hétérogénéité

4 Modèle de régression de Poisson


Présentation
Estimation
Interprétation des coefficients
Effet marginal sur la moyenne conditionnelle
Probabilités prédites
Prise en compte du temps d’exposition

5 Modèle binomial négatif


Présentation
Estimation
Test de l’hypothèse de surdispersion

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 16 / 21


Modèle binomial négatif Présentation

Présentation
1 Le modèle de Poisson impose que l’espérance conditionnelle est égale
à la variance conditionnelle. Cette hypothèse est parfois peu réaliste.
2 Le problème souvent rencontré est celui de la surdispersion :
V (y |x) > E(y |x) . Ce problème est due à l’hétérogénéité non
observable.
3 Pour prendre en compte cette dimension, on modifie l’espérance du
modèle de Poisson comme suit
λ̃i = exp(Xi β + ei ) (11)
où ei est un terme d’erreur aléatoire supposé non corrélé avec Xi .
4 Dans le modèle de Poisson, les variations de λi résultent de
l’hétérogénéité observée entre les individus. A différentes valeurs de Xi
seront associées différentes valeurs de λi et tous les individus ayant les
mêmes caractéristiques observables X ont la même valeur de λ.
5 Dans le modèle binomial négatif, les variations de λ̃ sont dues à la fois
aux variations de Xi et à l’hétérogénéité non observable captée par la
variable ei .
6 La relation entre les moyennes conditionnelles du modèle de Poisson et
du modèle binomial négatif est donnée par la relation suivante :
λ̃i = λi exp(ei ) = λi δi (12)
Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 17 / 21
Modèle binomial négatif Présentation

Présentation

1 Pour permettre que le modèle ait la même moyenne conditionnelle que


le modèle de Poisson, on pose que : E(δi ) = 1
2 La distribution conditionnelle est toujours :

P(yi = k ) = exp{−λ̃i (xi ) + k log(λ̃i (xi )) − log(k !)} (13)


3 Cependant, étant donné que le paramètre δ est inconnu, on ne peut pas
calculer cette distribution de probabilité.
4 On impose une distribution de probabilité pour le paramètre δi .
5 L’hypothèse la plus souvent faite est de supposer que δ suit une
distribution Gamma de paramètre νi
ν
νi i νi −1
g(δi ) = δ exp(−δi νi ) (14)
Γ(νi ) i

où νi > 0, E(δi ) = 1, var (δi ) = 1/νi

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 18 / 21


Modèle binomial négatif Présentation

Présentation

1 Finalement, sous ces hypothèses, nous avons


 
λi
Var (Yi |Xi ) = λi 1 + (15)
νi
2 On suppose que νi = 1/α (pour éviter incidental parameters problem)
3 Cette hypothèse implique que la variance de δi est constante.
4 α est appelé paramètre de dispersion car ↑ α ⇒ ↑ Var (y |X )

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 19 / 21


Modèle binomial négatif Estimation

Estimation

1 La vraisemblance du modèle binomial négatif est :


n α−1   yi
Γ(yi + α−1 ) α−1

Y λi
L= (16)
Γ(α−1 )yi ! α−1 + λi α−1 + λi
i=1

2 Le vecteur (β, α) est obtenu par maximisation de la vraisemblance (16).

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 20 / 21


Modèle binomial négatif Test de l’hypothèse de surdispersion

Test de l’hypothèse de surdispersion

1 Il est important de tester l’hypothèse de surdispersion lorsqu’on utilise le


modèle de Poisson afin de vérifier si l’hypothèse sous-jacente au
modèle de Poisson est vérifiée.
2 La spécification de Poisson peut être facilement testée à travers
l’hypothèse H0 : α = 0.
3 Sous l’hypothèse nulle le modèle binomial négatif se réduit au modèle
de Poisson.
4 On peut utiliser un z − test unilatéral pour tester la significativité de α.
5 Ou encore utiliser la statistique du rapport de vraisemblance définie par :

LR = 2(log(LNegBin ) − log(LPois )) ∼ χ2 (1)

Kanga, Kouamé Désiré ENSEA, Abidjan 16 avril 2016 21 / 21

Vous aimerez peut-être aussi