Académique Documents
Professionnel Documents
Culture Documents
com
Retrouver ce titre sur Numilog.com
Retrouver ce titre sur Numilog.com
D a n s la m ê m e série
Christian GOURIEROUX
P r o f e s s e u r à l'ENSAE
ECONOMETRIE
D E S VARIABLES
QUALITATIVES
2e é d i t i o n
ECONOMICA
49, rue Héricart, 75015 Paris
Retrouver ce titre sur Numilog.com
Avant-propos
Introduction
0.1. H I S T O R I Q U E
E (ψ (y)/x) = xb,
CHAPITRE I
(1.1.)
La p e r t u r b a t i o n a d m e t o b l i g a t o i r e m e n t u n e loi discrète, ce
qui interdit de faire l ' h y p o t h è s e de normalité.
e) Si n o u s i m p o s o n s a u x p e r t u r b a t i o n s d'être de moyenne
nulle, pi est d é t e r m i n é e de m a n i è r e unique, c a r :
=> Pi = Xib .
Retrouver ce titre sur Numilog.com
0 ^ Xib ^ 1, i = 1, ..., n .
yi = xib + ui , Eui = 0 , i = 1, n ,
n'a p a s de sens.
f) Si les c o n t r a i n t e s sont c o m p a t i b l e s , ceci crée a u m o i n s
d e u x difficultés :
— le p a r a m è t r e b doit être e s t i m é sous c o n t r a i n t e s à l'inégalité ;
— la p r é v i s i o n de y c o r r e s p o n d a n t a u x valeurs Xn + i des va-
r i a b l e s explicatives ne p e u t ê t r e faite q u e si la c o n t r a i n t e
0 < Xn + i b < 1 est u n e c o n s é q u e n c e des contraintes 0 < Xib ^ 1,
i = 1, ..., n.
g) R e m a r q u o n s f i n a l e m e n t q u e la v a r i a n c e des p e r t u r b a t i o n s
v a u t Vui = xib (1 - Xib) : il y a h é t é r o s c e d a s t i c i t é ; la m é t h o d e des
m o i n d r e s c a r r é s g é n é r a l i s é s (contrainte) n'est c e p e n d a n t p a s
applicable, p u i s la m a t r i c e de v a r i a n c e - c o v a r i a n c e des p e r t u r b a -
t i o n s d é p e n d d u p a r a m è t r e i n c o n n u b f i g u r a n t d a n s l'explication
linéaire.
1.2. P R É S E N T A T I O N DU M O D È L E D I C H O T O M I Q U E S I M P L E
Ces modèles ont été initialement utilisés pour les études bio-
logiques, mais ont un champ d'application très vaste. Ils sont
notamment employés pour déterminer la façon dont des indivi-
dus (insectes, herbes, personnes) tolèrent un certain produit (insec-
ticide, désherbant, médicament). Pour cela on effectue plusieurs
expériences où des individus de caractéristiques différentes, pla-
cés dans des conditions différentes, sont soumis à diverses doses
du produit. On observe à chaque fois si l'individu a ou non bien
supporté l'expérience. Pour chacune des expériences i = 1, ..., n
la variable endogène observée yi est dichotomique :
(1.2)
(1.3)
(1.4)
P (Yi = 1) = F (x.b) ,
1.3.b — N o n - r é p o n s e s
Il existe t o u j o u r s lors d ' u n e e n q u ê t e u n e c e r t a i n e propor-
tion de n o n - r é p o n s e s qui p e u v e n t être dues à l'absence de l'en-
quêté de son domicile (lors d ' e n q u ê t e s p a r interview), a u refus
de l'enquêté de répondre, à la n o n - c o m p r é h e n s i o n des questions.
Le t a u x de n o n - r é p o n s e d é p e n d de la m é t h o d e de collecte
employée, m a i s a u s s i des c a r a c t é r i s t i q u e s des e n q u ê t e u r s (âge,
niveau d'éducation, sexe) et de celles des répondants. Savoir
quelle est la f o r m e de cette d é p e n d a n c e p o u r u n c e r t a i n type
Retrouver ce titre sur Numilog.com
1.4.a — Le modèle
Une fois mis en évidence les paramètres identifiables, nous
avons vu que le modèle dichotomique simple correspond à une
vraisemblance de la forme :
(1.5)
et dans le second :
1.4.c — E q u a t i o n de v r a i s e m b l a n c e
Dérivons la log-vraisemblance p a r r a p p o r t a u vecteur b des
p a r a m è t r e s et a n n u l o n s cette dérivée ; on a :
on obtient :
⇔ (1. 7)
converge en loi vers une variable aléatoire admettant une loi nor-
male centrée réduite).
En pratique, la matrice de variance-covariance asymptotique
de 6, qui dépend du paramètre inconnu devra être estimée. Nous
le ferons en remplaçant dans son expression b par 6.
(1.8)
(1.9)
Elle est e s t i m é e p a r :
R e m a r q u e 1.10
f = F (1 - F) ,
et d o n c :
Retrouver ce titre sur Numilog.com
R e m a r q u e 1.11
On p e u t d o n n e r de la m a t r i c e des dérivées secondes u n e
e x p r e s s i o n p l u s compacte. N o t o n s X la m a t r i c e des observations
des variables explicatives ; X est de taille (n, K) et a p o u r ie ligne
Xi. Appelons d ' a u t r e p a r t A, la m a t r i c e diagonale de taille n, dont
le ie é l é m e n t de la diagonale est :
1.5. R É S O L U T I O N N U M É R I Q U E D E S ÉQUATIONS
DE VRAISEMBLANCE
c'est-à-dire par :
(1.11)
(1.12)
yi — F (x.b) + Vi ,
(1.13)
1 ni
pj = — S yij e s t u n e m o y e n n e e m p i r i q u e d e v a r i a b l e s a l é a t o i r e s
nj i = i
et la variable :
suit a p p r o x i m a t i v e m e n t u n e loi n o r m a l e de m o y e n n e 0, de
variance :
R e m a r q u o n s q u e ce critère p o u r r a i t être r e m p l a c é p a r :
1.7. UN E X E M P L E : LA R É U S S I T E D E S É T U D I A N T S
E N P R E M I È R E ANNÉE DE MÉDECINE
Cette é t u d e est décrite d a n s Lassibile [1979]. Il s'agit d ' u n
m o d è l e logit u n i v a r i é dichotomique. La v a r i a b l e o b s e r v é e p o u r
c h a q u e é t u d i a n t est la réussite (Yi = 1) o u l'échec (y; = 0) à l'exa-
m e n de fin d'année.
Significativité
r du coefficient :
Variable Estimation + 10%
du coefficient + + 5%
+ + + 1%
Taille de la c o m m u n e de r é s i d e n c e -0 .31 + + +
des p a r e n t s _
R e s s o u r c e des p a r e n t s 1.16 + + +
Age - 3.65 + + +
N o t e o b t e n u e à u n t e s t logique 0.18 + + +
Origine d u s e c o n d a i r e 0.37 +
Constante — 0.53 + + +
Retrouver ce titre sur Numilog.com
1.8. E R R E U R S D E SPÉCIFICATION
Les méthodes d'estimation que nous avons introduites : maxi-
mum de vraisemblance, méthodes de Berkson, x2 — minimum
possèdent de bonnes propriétés, lorsque le modèle (1.4) sur lequel
elles sont fondées est correct, c'est-à-dire contient la « vraie loi »
des observations. Il est évidemment important de regarder com-
ment se comportent ces méthodes en présence d'erreurs de spéci-
fication. Ces erreurs peuvent porter par exemple sur la forme
retenue pour la fonction F, sur la liste des variables exogènes, sur
l'hypothèse de non corrélation des perturbations, sur le mode de
tirage des observations (exercices 6 et 7).
Retrouver ce titre sur Numilog.com
(1.15)
Propriété 1.16:
Si le modèle comporte un terme constant :
et p o s o n s :
avec :
P r o p r i é t é 1.17:
La méthode du score maximum fournit des estimateurs conver-
gents.
Preuve :
S o u v e n t les m é t h o d e s d ' e s t i m a t i o n e m p l o y é e s c o n s i s t e n t à
m a x i m i s e r (ou à m i n i m i s e r ) p a r r a p p o r t a u p a r a m è t r e b u n e fonc-
n
avec :
Or:
P (y = 1/x) .
Malheureusement de telles méthodes nécessitent un très
grand nombre d'observations dans le cas de plusieurs variables
exogènes. Ainsi pour un même degré de précision sur l'estima-
tion, il faut approximation 17 fois plus d'observations dans le cas
de 3 variables explicatives que dans le cas d'une seule, 210.000
fois plus dans le cas de 10 variables exogènes.
Il est possible de se ramener facilement à une seule variable
conditionnante. Si on suppose les variables (xi, Yi) i = 1, ..., n
indépendantes, de même loi, on peut utiliser la formule de Bayes
pour écrire :
P [y = 1/x] = p (x; b)
par :
Retrouver ce titre sur Numilog.com
(1.18)
(1.20)
(1.21)
S u p p o s o n s q u e p o u r e s t i m e r bi n o u s a y o n s a p p l i q u é la
m é t h o d e d u m a x i m u m de v r a i s e m b l a n c e a u m o d è l e e r r o n é :
.
L ' e s t i m a t e u r est s o l u t i o n de
εij = αj + βij ,
désignent