Vous êtes sur la page 1sur 144

Les variables qualitatives

Lionel Nesta
Ecole Doctorale Marchs et Organisation : Droit Economie Gestion
Formation dconomtrie avec Stata
Plan du cours : premire partie
1. Les variables qualitatives explicatives
1. Cration et gestion des variables qualitatives sous STATA
2. Les variables muettes dans le modle MCO
2. Les modles variables qualitative dpendante
1. Le modle de probabilit linaire
2. Lestimation par le maximum de vraisemblance
3. La rgression logistique
Plan du cours : deuxime partie
3. La rgression logistique multinomiale
1. Simple
2. Ordinale
4. Les modles de comptage
1. Le modle de Poisson
2. Le modle ngatif binomial
Les variables qualitatives
explicatives
1. Les variables qualitatives explicatives
Les variables qualitatives
Les variables muettes (les dummies)
Crer une variable muette avec Stata
Interprtation des coefficients dans le modle MCO
Les effets croiss entre variables muettes et continues
Les variables qualitatives
Il sagit de variables qui donnent des informations sur des
caractristiques discrtes.
Le nombre de catgories prises par les variables qualitatives est en
gnral petit.
Ces valeurs peuvent tre numriques mais chaque nombre indique
une qualit; une caractristiques.
Une variable discrte peut avoir plusieurs modalits
Deux modalits : homme ou femme
Trois modalits : nationalit (franaise, allemande, anglaise)
Plus de trois modalits : secteur (automobile, chimie, bureautique, mtallurgie,
etc.)
Les variables qualitatives
Il existe plusieurs manires de coder une variable
qualitative n modalits
Codage par une seule variable catgorielle
Codage par n - 1 variables muettes
Une variable muette ou indicatrice est une variable
qualitative qui prend les valeurs 0 ou 1.
On parle de variable binaire ou dichotomique.
En Anglais, on parle de dummy variables , ou
dummies
Les variables qualitatives
Codage par une seule variable catgorielle
Deux modalits : On cre une variable catgorielle genre qui est
gale 1 si lindividu est une femme, 2 si lindividu est un homme.
Trois modalits : On cre une variable nationalit qui est gale
1 si lindividu est franais, 2 si lindividu est allemand, 3 si lindividu
est anglais.
Variable n modalits : On cre une variable nationalit qui est
gale 1 si lindividu est franais, 2 si lindividu est allemand, 3 si
lindividu est anglais, etc.
Le codage dune variable catgorielle ncessit lutilisation dun label pour
savoir quelle modalit se rfre ledit numro.
Labliser des variables
Labliser les variables est intressant, fastidieux, ennuyeux.
Consquence importante sur linterprtation des rsultats
label variable. Dcrit une variable qualitative ou quantitative
label variable asset "real capital"
label define. Dcrit les valeurs (modalit) dune variable qualitative
label define firm_type 1 "biotech" 0 "Pharma"
label values Applique le label dfini prcdemment
label values type firm_type
Exemple de labellisation
*************************************************************************************
******* CREATION DES LABELS INDUSTRIES *********
*************************************************************************************
egen industrie = group(isic_oecd)
#delimit ;
label define induscode 1 "Text. Habill. & Cuir"
2 "Bois"
3 "Pap. Cart. & Imprim."
4 "Coke Raffin. Nucl."
5 "Chimie"
6 "Caoutc. Plast."
7 "Aut. Prod. min."
8 "Mtaux de base"
9 "Travail des mtaux"
10 "Mach. & Equip."
11 "Bureau & Inform."
12 "Mach. & Mat. Elec."
13 "Radio TV Telecom."
14 "Instrum. optique"
15 "Automobile"
16 "Aut. transp."
17 "Autres";
#delimit cr
label values industrie induscode
Exercice
1. Tlchargez la base var_qual.dta
2. Lablisez la variable firm_type
3. Dfinissez un label pour la variable firm_type, sachant
que la modalit 1 qualifie les grandes firmes
pharmaceutiques et la modalit 2 qualifie les firmes de
biotechnologie.
Les variables qualitatives muettes
Codage par des variables muettes
Deux modalits.
On cre une variable muette femme qui est gale 1 si
lindividu est une femme, 0 sinon.
On cre une variable muette homme qui est gale 1 si
lindividu est une femme, 0 sinon.
Or une des deux variables muettes est redondante. A partir du
moment o femme = 0, alors homme = 1.
Autrement dit pour une variable catgorielle deux modalits, on
a besoin dune seule variable muette seulement pour avoir la
mme information.
Les variables qualitatives muettes
Codage par n variables muettes
Exemple avec trois modalits
On cre trois variables muettes, la premire tant est gale 1 si
lindividu est franais, 0 sinon (variable appel FRA ).
la deuxime modalit est gale 1 si lindividu est allemand, 0
sinon (variable appel DEU ).
la troisime modalit est gale 1 si lindividu est anglais, 0 sinon
(variable appel GBR ).
Or une des trois variables muettes est redondante. A partir du
moment o FRA = 0, DEU = 0, alors GBR = 1.
Pour une variable n modalits, on cre n - 1 variables muettes,
chacune reprsentant une modalit particulire de la variable.
Crer une variable muette sous stata
Gnrer une variable muette partir dune variable
qualitative.
generate DEU = 0
replace DEU = 1 if country==GERMANY
generate FRA = country==FRANCE
Gnrer une variable muette partir dune variable
qualitative.
generate GE = 1 if taille > 100
replace GE =0 if taille < 101
generate GE = taille > 100
Crer une variable muette sous stata
Si vous disposez dune variable qualitative n
modalits, il peut tre fastidieux de crer n-1 variables
muettes
La fonction tabulate a une extension trs pratique,
puisquelle gnrera autant de variables muettes quil y a
de modalits dune variable catgorielle.
tabulate varcat, gen(v_)
tabulate country, gen(c_)
Va crer la variable muette c_1 pour le premier parti, c_2 pour le
second, c_3 pour le troisime, etc.
Interprtation des coefficients devant les
variables muettes
Dans la rgression linaire, le coefficient estim
sinterprte comme la variation de la variable dpendante
suite la variation dune unit de la variable explicative,
toute chose gale par ailleurs.
Soit le modle de fonction de production de connaissance
o y est le nombre de brevet produit par les firmes et
biotech est une variable muette gale 1 pour les
firmes de biotechnologie.
y biotech u = +- +
Interprtation des coefficients devant les
variables muettes
Si la firme est une firme de biotechnologie, la variable
muette biotech est gale lunit, donc :
Si la firme est une firme pharmaceutique, la variable
muette biotech est gale 0, donc :


y 1 = +- = +


y 0 = +- =
Interprtation des coefficients devant les
variables muettes
Quand la variable explicative est muette, le coefficient
sinterprte comme variation de la variable dpendante
quand la variable muette est gale 1, relativement
une situation o la variable muette est gale 0.
Pour deux modalits, je dois introduire une variable muette.
Pour trois modalits, je dois introduire deux variables muettes.
Pour n modalits, je dois introduire (n-1) variables muettes.
Exercice
1. A partir de la base var_qual.dta, rgressez le modle
2. Prdisez la production de brevet pour les firmes de
biotechnologie et les firmes pharmaceutiques
3. Etablissez les statiques descriptives de PAT pour
chacun des types de firme avec la commande table
4. Quobservez-vous ?
PAT biotech u = +- +
Interprtation des coefficients devant les
variables muettes
Pour la forme semi logarithmique (log Y), le coefficient
est interprt comme une approximation du pourcentage
de variation de Y pour une variation de 1 de la variable
explicative.
Cette approximation est acceptable quand est petit (
< 0.1). Quand est grand ( 0.1), alors le pourcentage
exact de la diffrence selon les vnements 0 ou 1 est :
100 (e

1)
La fonction de production de connaissances
Application 1: modle de base

1 2
1 2
PAT f (RD,SIZE)
PAT A RD SIZE exp u
pat rd size u

=
=
= + + +
Application 1: modle de base

_cons -.7080941 .3893776 -1.82 0.070 -1.4733 .0571119
size -.3995841 .0731757 -5.46 0.000 -.5433891 -.2557791
rd .6904159 .0876424 7.88 0.000 .5181807 .862651

pat Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 708.526573 456 1.55378635 Root MSE = 1.1439
Adj R-squared = 0.1578
Residual 594.078634 454 1.30854325 R-squared = 0.1615
Model 114.447939 2 57.2239696 Prob > F = 0.0000
F( 2, 454) = 43.73
Source SS df MS Number of obs = 457
. reg pat rd size
Application 2: Changement de modle

1
2
1 2
PAT f (RD,SIZE)
RD
PAT A SIZE exp u
SIZE
RD
pat log size u
SIZE

=
+
=

' '
+
= + + +

' '
La fonction de production de connaissances
Application 2: Changement de modle

_cons -.7080941 .3893776 -1.82 0.070 -1.4733 .0571119
size .2908318 .033395 8.71 0.000 .2252038 .3564598
rdi .6904159 .0876424 7.88 0.000 .5181807 .862651

pat Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 708.526573 456 1.55378635 Root MSE = 1.1439
Adj R-squared = 0.1578
Residual 594.078634 454 1.30854325 R-squared = 0.1615
Model 114.447939 2 57.2239696 Prob > F = 0.0000
F( 2, 454) = 43.73
Source SS df MS Number of obs = 457
. reg pat rdi size
Application 3: Variable muette

1
2
3
1 2 3
PAT f (RD,SIZE, )
RD
PAT A SIZE exp u
SIZE
rd
p
B
at size u
si
IO
BIO
BI
ze
O

=
+
= +

' '
+
= + + + +

' '
La fonction de production de connaissances
Application 3: Variable muette

_cons -5.745133 .633991 -9.06 0.000 -6.991061 -4.499204
biotech 1.673523 .1744372 9.59 0.000 1.330716 2.016329
size .5768994 .0426386 13.53 0.000 .4931055 .6606934
rdi .5106912 .0821529 6.22 0.000 .3492431 .6721392

pat Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 708.526573 456 1.55378635 Root MSE = 1.044
Adj R-squared = 0.2985
Residual 493.755974 453 1.08996904 R-squared = 0.3031
Model 214.770599 3 71.5901997 Prob > F = 0.0000
F( 3, 453) = 65.68
Source SS df MS Number of obs = 457
. reg pat rdi size biotech
Application 3: Variable muette
Patent
ln(PAT)
size
3

2 3

Biotech : size

+ +
2

pente =
2

pente =
2

Pharma : size +
3

Application 4: Variable dinteraction




1
2
3 4
1 2 3 5
BIO
BIO B
PAT f (RD,SIZE, )
RD
PAT A SIZE exp u
SIZE
rd
pat si
IO size
BIO BIO siz ze u
size
e

=
+
= + +

' '
+
= + + + + +

' '
-
-
La fonction de production de connaissances
Application 4: Variable dinteraction

_cons -6.92359 .8591161 -8.06 0.000 -8.611947 -5.235232
size_bio -.1688997 .0834314 -2.02 0.044 -.3328612 -.0049382
biotech 3.950866 1.138292 3.47 0.001 1.713864 6.187868
size .6503855 .0558872 11.64 0.000 .5405545 .7602165
rdi .4881356 .082628 5.91 0.000 .3257528 .6505183

pat Coef. Std. Err. t P>|t| [95% Conf. Interval]

Total 708.526573 456 1.55378635 Root MSE = 1.0405
Adj R-squared = 0.3033
Residual 489.319346 452 1.08256492 R-squared = 0.3094
Model 219.207228 4 54.801807 Prob > F = 0.0000
F( 4, 452) = 50.62
Source SS df MS Number of obs = 457
. reg pat rdi size biotech size_bio
Application 4: Variable dinteraction
Patent
ln(PAT)
Size

4 2 3

Biotech : size

BIO size + - + +
2

Pharma : size +

2 4

BIO

pe ize e s nt - = +
2

pente =
3

Les modles variable qualitative


dpendante
Le modle de probabilit linaire
Le modle de probabilit linaire
Quand la variable qualitative dpendante est binaire ou dichotomique
(0/1), le modle OLS est appel modle de probabilit linaire (par
exemple : Y=1 si lentreprise innove, Y=0 sinon).
0 1 1 2 2
Y x x u = + + +
Y ne prend que 2 valeurs (0;1). Comment interprter
j
? Si E(u|X)=0
alors:
0 1 1 2 2
E(Y| X) x x = + +
Le modle de probabilit linaire
Y suit une distribution de Bernoulli desprance P. Ce modle est
donc dit MPL car son esprance conditionnelle E(Y|X) peut tre
interprte comme la probabilit conditionnelle que lvnement se
produise compte tenu des valeurs de X :
E(Y| X) Pr(Y 1| X)
1 E(Y| X) Pr(Y 0| X)
= =
= =
mesure de combien est modifi la probabilit de succs quand X
change dune unit (X=1)
E(Y| X) Pr(Y 1| X)
Pr(Y 1| X)
X X
( ( =
= = = ( =
( (
Les limites du modle de prob. linaire (1)
Labsence de normalit des erreurs
OLS6 : Le terme d'erreur est indpendant des variables
indpendantes et suit une loi Normale de moyenne nulle et de
variance W2
Les erreurs tant le complmentaire par rapport 1 de la
probabilit conditionnelle, elles suivent une distribution de
Bernoulli, et non normale.
2
u Normal(0, ) W
Les limites du modle de prob. linaire (1)
Labsence de normalit des erreurs
0
.
5
1
1
.
5
2
2
.
5
D
e
n
s
i
t
y
-1 -.5 0 .5
Residuals
Les limites du modle de prob. linaire (2)
Lhtroscdasticit des erreurs
OLS5 : La variance du terme d'erreur est la mme, quelle que
soiet les valeurs des variables indpendantes
Si le terme derreur suit une distribution de Bernoulli, alors sa
variance dpend de X:

2
1 2 k
Var u x , x , , x = W
Var(u) P(1 P) E(Y| X) (1 E(Y| X)) = =
Les limites du modle de prob. linaire (2)
Lhtroscdasticit des erreurs
-
1
-
.
5
0
.
5
R
e
s
i
d
u
a
l
s
.4 .6 .8 1 1. 2
Fitted values
Les limites du modle de prob. linaire (3)
Des prdictions aberrantes
Par dfinition, une probabilit est toujours comprise entre 0 et 1,
si bien que :
Or OLS ne garantit en rien cette condition :
On peut imaginer des prdictions en dehors de [0;1]
Leffet marginal reste constant en permanence car P = E(Y|X) croit
linairement avec X. Ceci nest pas raliste (ex: la probabilit davoir
un enfant en fonction du nombre denfants dans la fratrie).

0 E Y| X 1 e e
Les limites du modle de prob. linaire (3)
Des prdictions aberrantes
0
1
2
3
D
e
n
s
i
t
y
.4 .6 .8 1 1.2
Fitted values
Mauvaises
prdictions
Les limites du modle de prob. linaire (4)
Un coefficient de dtermination faible
Les valeurs observes de Y sont gales 1 ou 0, alors que les
valeurs prdites appartiennent lensemble des rels compris
enter 0 et 1 : [0;1].
Si on confronte graphiquement les valeurs prdites avec les
valeurs observes, lajustement linaire apparat
systmatiquement faible.
Les limites du modle de prob. linaire (3)
Des prdictions aberrantes
0
.
2
.
4
.
6
.
8
1
D
u
m
m
y

i
n
n
o
v
a
t
i
o
n
.4 .6 .8 1 1.2
Fitted values
Mauvaises
prdictions qui
baissent le R
2
Les limites du modle de probabilit linaire
1. Labsence de normalit des erreurs
2. Lhtroscdasticit des erreurs
3. Les prdictions aberrantes
4. La faible valeur du coefficient de dtermination
0 E Y| X 1 e e

2
1 2 k
Var u x , x , , x = W
2
u Normal(0, ) W
Surmonter les limites du MPL
1. Labsence de normalit des erreurs
Augmenter la taille de lchantillon
2. Lhtroscdasticit des erreurs
Effectuer des estimations robustes
3. Les prdictions aberrantes
Effectuer des estimations contraintes ou non linaires
4. La faible valeur du coefficient de dtermination
Ne pas utiliser le R
2
pour estimer la qualit de lajustement
Le MPL et ses utilisations
Malgr ses limites, le MPL est assez largement utilis :
1. Parce quil constitue une base exploratoire dont les coefficients
sont faciles interprter.
2. Parce quil marche plutt bien pour les valeurs des variables
indpendantes qui sont proches de la moyenne des donnes.
3. Parce qu la condition de travailler sur des grandes bases de
donnes, il permet daborder des problmes destimation que
dautres approches ont du mal aborder.
Le modle LOGIT
Probabilits, chances et logit
Nous voulons expliquer la ralisation vnement : la
variable expliquer prend deux valeurs : y={0;1}.
En fait, on va expliquer la probabilit de ralisation (ou
non) de lvnement: P(Y=y | X) [0 ; 1].
Il nous faudrait une transformation de P(Y) qui tendent
lintervalle de dfinition.
Nous allons voir que le calcul des chances permet
denvisager cette transformation.
Nous comprendrons alors les sources de la fonction logit.
Le modle Logit (1)
Z
Z Z
Z Z
0 i i i
e 1
P
1 e 1 e
1 1
1 P 1
1 e 1 e
avec z x u

= =
+ +
= =
+ +
= + +
Modlisons la probabilit en nous assurant que quelles que soient
les valeurs de X, P reste toujours entre 0 et 1.
Le modle Logit (2)
Z
Z
Z
0 1 1 2 2
P 1 e
e
1 P 1 e
P
ln z x x u
1 P

+
= =
+
+
= = + + +

' '
Ecrivons le ratio de chance (odds ratio) et prenons son log:
Notons deux caractristiques importantes et dsires du modle :
1. Malgr le fait que P soit compris entre 0 et 1, le logit est un
rel compris entre - et +
2. La probabilit nest pas linaire en X
Les ratios de chance
( 1)
odds ratio =
1 ( 1)
P Y
P Y
=
=
Ou plus gnralement
innover
innover innover
ne pas innover
Probabilit
Chance (odds ratio)
Probabilit
= =
Plutt que dexpliquer Y (=1 ou =0), on va tenter
dexpliquer le ratio de chance (ou odds ratio)
Probabilits, chances et logit
P(Y=1) Odds
p(y=1)
1-p(y=1)
Ln (odds)
0.01 1/99 0,01 -4,60
0.03 3/97 0,03 -3,48
0.05 5/95 0,05 -2,94
0.20 20/80 0,25 -1,39
0.30 30/70 0,43 -0,85
0.40 40/60 0,67 -0,41
0.50 50/50 1,00 0,00
0.60 60/40 1,50 0,41
0.70 70/30 2,33 0,85
0.80 80/20 4,00 1,39
0.95 95/5 19,0 2,94
0.97 97/3 32,3 3,48
0.99 99/1 99,0 4,60
La transformation logit
Le prcdent tableau fait correspondre une liste de
probabilit entre 0 et 1 et son quivalent en termes de
chance au logarithme des chances.
Si la probabilit varie de 0 1, la chance varie de 0
linfini. Le log de la chance varie de + .
Remarquez que la distribution des chances et des log
est symtrique.
La distribution logistique
0
.
0
5
.
1
.
1
5
.
2
.
2
5
D
e
n
s
i
t
y
-10 -5 0 5 10
Log (Odds ratio)
La mthode du maximum de vraisemblance
Le problme est que nous nobservons pas le ratio de chance.
Encore une fois, le modle MCO ne convient pas.
Pour estimer le modle LOGIT, on a recours la mthode du
maximum de vraisemblance.
La mthode MV est une mthode destimation alternative la
mthode des moindres carrs.
Elle consiste trouver la valeur des paramtres qui maximisent la
vraisemblance des donnes.
La vraisemblance en conomtrie est dfinie comme la probabilit
jointe dobserver un chantillon, tant donn les paramtres du
processus ayant gnr les donnes.
La mthode du maximum de vraisemblance
Supposons que nous disposons dun chantillon de n observations
alatoires. Soit f(Y) la probabilit que Y=1 ou 0. La probabilit jointe
dobserver les n variables de Y est donne par la fonction de
vraisemblance :

1 2
1
, ,..., ( )
n
n i
i
f y y y f y
=
=
|
On doit maintenant spcifier la fonction f(.). Elle dcoule de la
distribution des probabilits dun vnement qui ne peut avoir que
deux occurrences: un succs et un chec. Il sagit de la distribution
binomiale :
1
( ) (1 )

=
i i
y y
i
f y p p
La fonction de vraisemblance
En dfinitive, la fonction de vraisemblance scrit:
? A ? A


i i
i
i
i
i
i
i i
n n
y 1 y
i
i 1 i 1
y
1 y
z
n n
i
z z
i 1 i 1
y
1 y
x
n n
i i
x x
i 1 i 1
L y f (y ) p 1 p
e 1
L y, z f (y , z)
1 e 1 e
e 1
L y, x, f (y , x , )
1 e 1 e

= =

= =


= =
= =


= =


+ +
|
|


= =


+ +
|
|
| |
| |
| |
La fonction de vraisemblance
Parce quelle est difficile manipuler, on utilise gnralement le log.
Aprs manipulation, la fonction log de la vraisemblance scrit :





i
i
n n
z
i
i 1 i 1
n n
x
i i
i 1 i 1
n
x
i i
i 1
LL y, z y z ln 1 e
LL y, x, y x ln 1 e
LL y, x, ln 1 e y x
= =

= =

=
= +
|

= +
|

= +
|

La mthode du maximum de vraisemblance


Le problme est le suivant: tant donn la forme
fonctionnelle de f(.) et les N observations, quelles valeurs
des paramtres rendent lobservation de lchantillon la
plus vraisemblable?
La maximisation de la vraisemblance


n
i i i
z
i 1
i
z
n
i i i i
i 1
LL
y x 0
e
where
1 e LL
1 x x
=
=

= A =


A =
`
+

'
= A A

'

Cette maximisation na pas de solution analytique et se


rsout grce un algorithme ditration dit de Newton-
Raphson.
Les estimateurs obtenus en maximisant la vraisemblance
sont efficaces. Ou encore en maximisant le log de la
vraisemblance.
Lexemple des chances dinnover
Les entreprises de biopharmaceutique : 373
(81%) ont innover et 84 (19%) ne lont pas fait.
La chance dinnover est denviron 4 contre 1.En
effet 373/84=4.4
Pour les entreprises de biopharmaceutique, la
probabilit dinnover est quatre fois plus leve
que la probabilit de ne pas le faire.
Le modle de rgression logistique
Application sur la base de donnes OLS
Instruction Stata : logit
logit y x
1
x
2
x
3
x
k
[if] [weight] [, options]
Options : noconstant : estime le modle sans constante
robust : estime des variances robustes, mme en
cas d'htroscdasticit
if : permet de slectionner les observations sur lesquelles portera la
rgression
weight : permet de pondrer les diffrentes observations
Interprtation des coefficients (1)
Pour avoir la mesure de la variation de probabilit, il faut utiliser la
formule du logit pour transformer le logit en probabilit


i
i
x
x
e
P
1 e

=
+
Interprtation des coefficients (2)
Tapons un modle sans variable explicative et
seulement une constante:
Tapons logit inno et nous trouvons
La constante 1.491 sinterprte comme le log ratio
moyen. Calculons la probabilit moyenne dinnover.
Tapons : dis exp(_b[_cons])/(1+exp(_b[_cons]))
Nous trouvons bien la valeur observe: 81%
1,491
1,491
e
P 0,81
1 e
= =
+
Interprtation des coefficients (3)
Un signe positif signifie que la probabilit de succs
augmentera avec la variable correspondante.
Un signe ngatif signifie que la probabilit de succs
diminuera avec la variable correspondante.
Une des difficults dans linterprtation des probabilits
est leur non linarit: elles ne varient pas identiquement
selon le niveau des variables indpendantes.
Cest pourquoi il est frquent de calculer la probabilit
au point moyen de lchantillon.
Interprtation des coefficients (4)
Tapons logit inno rdi size spe pharma
-7.63 0.757 0.979 0.367 3.781
-7.63 0.757 0.979 0.367 3.781
e
P
1 e
+ - + - + - -
+ - + - + - -
=
+
rdi size spe pharma
rdi size spe ph

arma
A partir du modle, on peut calculer la probabilit conditionnelle
moyenne en utilisant les valeurs moyennes de rdi, size, spe et
pharma.
e
P 0,8724
1 e
= =
+
1.9228238
1.9228238
Les effets marginaux (1)
Il est souvent utile de connatre leffet marginal dune variable explicative sur
la probabilit de succs dun vnement.
Puisque la probabilit est une fonction non linaire des variables
explicatives, la variation de la probabilit due un changement dune
variable explicative (ou son effet marginal) ne sera pas identique selon que
les autres variables sont maintenues leur niveau moyen, ou mdian, ou au
premier quartile, etc.
prvalue produit les probabilit prdites aprs un modle logit (ou autre
modle)
prvalue
prvalue , x(size=10) rest(mean) renvoie pour p(Y=1) : 0.1177
prvalue , x(size=11) rest(mean) renvoie pour p(Y=1) : 0.2622
prvalue , x(size=12) rest(mean) renvoie pour p(Y=1) : 0.4862
prvalue , x(size=10) rest(median) renvoie pour p(Y=1) : 0.0309
prvalue , x(size=11) rest(median) renvoie pour p(Y=1) : 0.0781
prvalue , x(size=12) rest(median) renvoie pour p(Y=1) : 0.1841
Les effets marginaux (2)
La commande prchange est bien utile. Elle produit
leffet marginal de chacune des variables explicatives
pour la plupart des variations de valeurs dsires.
prchange [varlist] [if] [in range]
,x(variables_and_values) rest(stat) fromto
prchange
prchange, fromto
prchange , fromto x(size=10.5) rest(mean)
Qualit de lestimation
Il nexiste pas de mesure comparable au R
2
de la rgression linaire.
On utilise exclusivement la statistique du log de vraisemblance (LL),
cad du log de la probabilit jointe dobserver lchantillon.
Plus il y a dobservation, plus le produit des probabilit jointe tend vers 0.
Autrement dit, pour un mme modle, plus il y a dobservations, plus LL
tend vers -
Pour une mme nombre dobservations, plus le modle est explicatif, plus
LL tend vers 0.
Cest en comparant deux LL que lon value la qualit dun
ajustement, avec toujours un modle contraint et un modle non
contraint.
Le McFadden Pseudo R
2
On utilise le McFadden Pseudo R
2
(1973) en premire analyse pour
voir la qualit de lajustement. Il sinterprte de manire analogue au
R
2
. Toutefois, parce quil reste gnralement faible, son utilisation
reste limite.
Le pseudo-R
2
dpend des maxima de vraisemblance obtenus si le
modle navait quune constante (modle contraint) et pour le modle
complet (modle non contraint). Il est compris entre 0 et1. Plus il est
proche de 1 et mieux cest.
? A
c nc 2
nc
MF
nc c
ln L ln L
ln L
Pseudo R 1
ln L ln L

= =
Le rapport de vraisemblance (LR test)
Le ratio de vraisemblance dpend aussi des maxima de vraisemblance
et suit une loi de G
2
. La probabilit que les variables indpendantes ne
sont pas explicatives (H
0
) est donne par le test du G
2
.
Le rapport de vraisemblance compare une spcification contrainte une
autre non contrainte:
Ce rapport suit une distribution du G
2.
Une grande valeur indique que le modle non contraint apporte une
information significative lvnement que le modle veut expliquer.
? A
nc c
LR 2 lnL lnL =
Autre utilisation du LR test
Comme output, STATA prsente toujours le LR test, comparant le
modle spcifi avec un modle sans variable explicative et
seulement une constante.
On peut raliser ce test pour comparer deux spcifications pour
justifier lajout de variables explicatives. Ceci est trs utile lorsquil
sagit de voir si lajout dune variable apporte de linformation.
logit [modle contraint]
est store [nom1]
logit [modle non contraint]
est store [nom2]
lrtest nom2 nom1
La qualit de la prvision
On peut enfin effectuer une comparaison entre les
vnements prdits correctement avec ceux prdits avec
erreurs.
Il faut alors faire une hypothse: quand la probabilit
prdite est suprieure 0,5, alors la prdiction est que
lvnement a lieu.
Sous STATA, ceci est effectuer avec
estat class
Autre modlisation du choix binaire
Le modle Logit ne constitue quune modlisation
possible, mme dans le cas o la variable dpendante
est une variable binaire.
On utilise largement le modle Probit comme modle
concurrentiel.
Ou encore le modle dit log-log complmentaire dans le
cas des probabilit de survie, car il se prte bien la
modlisation de la fonction de hasard.
Autres modlisations de choix binaire
Le modle Probit
Le modle log-log complmentaire



2
2
2 z 2
z
e e
Pr(Y 1| X) dz dz t dt
2 2
'
' '

' = = 1 = = = o
x x

X
X X
X

Pr(Y 1| X) 1 exp exp( ) ' ' = = 1 = X X
Les fonctions de vraisemblance et
commandes STATA
? A ? A
? A
1
1 1
1
1 1
1
1
( , , ) ( , , )
1 1
( , , ) ( , , ) ( ) 1 ( )
( , , ) ( , , ) 1 exp( exp( )) exp( exp(
i
i
i i
i
y
y
n n
i i
i i
n n
y y
i i
i i
n
y
i i
i
e
L y x f y x
e e
L y x f y x
L y x f y x


'
' '
= =

= =
=


= =


+ +
|
|
' ' = = 1 1
' ' = =
| |
| |
|
X
X X
X X
X
Logit :
Probit :
Log-log comp :
? A
1
1
))
i
n
y
i

=
|
X
Exemple
logit inno rdi size spe pharma
probit inno rdi size spe pharma
cloglog inno rdi size spe pharma
Les fonctions de rpartition
0
.
2
.
4
.
6
.
8
1
y
-4 -2 0 2 4
x
Probit Transformation Logit Transformation
Complementary log log Transformation
Comparaison des modles
OLS Logit Probit C log-log
rd - size 0.113 0.757 0.428 0.365
[4.03]*** [3.63]*** [3.55]*** [3.24]***
ln(Actif matriel) 0.126 0.979 0.558 0.495
[8.73]*** [7.43]*** [7.68]*** [7.32]***
ln(spcialisation technologique) 0.051 0.367 0.196 0.131
[1.03] [0.90] [0.87] [0.67]
Dummy Pharma -0.447 -3.782 -2.12 -1.836
[7.56]*** [6.63]*** [6.83]*** [6.57]***
Constant -0.407 -7.64 -4.376 -4.264
[2.39]** [5.31]*** [5.44]*** [5.61]***
Observations 457 457 457 457
Absolute t value in brackets (OLS) z value for other models.
* 10%, ** 5%, *** 1%
Comparaison des effets marginaux
OLS Logit Probit C log-log
Intensit de recherche 0.113 0.085 0.093 0.102
Actif matriel 0.126 0.110 0.121 0.137
Spcialisation technologique 0.051 0.040 0.042 0.037
Entreprise Pharmaceutique -0.445 -0.470 -0.466 -0.455
Pour les modles logit, probit et cloglog, les effets marginaux ont t valus par une variation dun point
autour de la moyenne, en utilisant les valeurs moyennes des autres variables.
Le modle LOGIT multinomial
Le modle multinomial
Envisageons maintenant le cas o la variable dpendante est
multinomial. Par exemple, dans la cadre des activits dinnovation de
la firme:
Collabore avec universit (modalit 1)
Collabore avec grande firme (modalit 2)
Collabore avec PME (modalit 3)
Ne collabore pas (modalit 4)
Ou dans le cadre de la survie des firmes:
Survie (modalit 1)
Banqueroute (modalit 2)
Rachat (modalit 3)
Introduction au modle multinomial
Prenons le cas de la survie des firmes. La premire possibilit est
denvisager trois rgressions logistiques indpendantes comme suit:
(1) (1) (1)
0 1 1 m m
(2) (2) (2)
0 1 1 m m
(3) (3) (3)
0 1 1 m m
P(Y 1| X)
ln x x
1 P(Y 1| X)
P(Y 2| X)
ln x x
1 P(Y 2| X)
P(Y 3| X)
ln x x
1 P(Y 3| X)
+ =
= + + +

=
' '
+ =
= + + +

=
' '
+ =
= + + +

=
' '

O 1 = survie, 2 = banqueroute, 3 = rachat.


1. Ouvrez le fichier mlogit.dta
2. Pour chaque modalit, estimez la probabilit au point moyen de
lchantillon, conditionnelle :
- temps (log_time)
- la taille (log labour)
- lge (entry_age)
- lindicatrice spinout (spin_out)
- lindicatrice cohorte (cohort_*)
Introduction au modle multinomial
(1) (1) (1)
0 1 1 m m
(2) (2) (2)
0 1 1 m m
(3) (3) (3)
0 1 1 m m
P(Y 1| X)
ln x x
1 P(Y 1| X)
P(Y 2 | X)
ln x x
1 P(Y 2 | X)
P(Y 3| X)
ln x x
1 P(Y 3 X)

|

+ =
= + + +

=
' '
+ =
= + + +

=
' '
+ =
= + + +

=
' '

P(Y 1| X) 0.8771
P(Y 2 | X) 0.0398
P(Y 3| X) 0.0679
= =
= =
= =
k
P(Y k | X) 0.9848 1 = = =

Le modle multinomial
Premirement, la somme des probabilits conditionnelles doccurrence
dvnements exclusifs doit tre gale lunit.

k
j k
P Y 0 | X 1 P Y j | X
=
= = =


k
j 0
P Y j | X 1
=
= =

Deuximement, pour k modalits diffrentes, nous navons besoin


destimer que (k 1) modalits. Donc
Le modle multinomial
Troisimement, le modle multinomial est un modle destimation
simultane comparant des ratios de chance pour chaque pair de
modalits. Dans le cas de trois modalits:
(1|0) (1|0) (1|0)
0 1 1 m m
(2|0) (2|0) (2|0)
0 1 1 m m
(1|2) (1|2) (1|2)
0 1 1 m m
P(Y 1| X)
ln x x
P(Y 0| X)
P(Y 2 | X)
ln x x
P(Y 0| X)
P(Y 1| X)
ln x x
P(Y 2 | X)
+ =
= + + +

=
' '
+ =
= + + +

=
' '
+ =
= + + +

=
' '

Le modle logit multinomial








P Y 1| X P Y 2 | X P Y 1| X
ln ln ln
P Y 0 | X P Y 0| X P Y 2 | X
= = =
=
, ` , ` , `
= = =
| ) | ) | )
Remarquons quil y a redondance dinformation dans les trois modles
prcdents. En effet :








1|0 2|0 1|2
P Y 1| X P Y 2 | X P Y 1| X
ln x ;ln x ;ln x
P Y 0 | X P Y 0 | X P Y 2 | X
= = =
= = =
, ` , ` , `
= = =
| ) | ) | )
1|0 2|0 1|2
x x x =

1|0 2|0 1|2
=
Quatrimement, lestimation dun modle multinomial revient estimer
conjointement (k 1) modles logit en posant la contrainte sur les
paramtres estimer:
Le modle logit multinomial



( j|0)
( j|0)
x
j k
x
j 0
e
P Y j | X
e

=
= =

Dans une modlisation logistique k modalits, la probabilit


doccurrence de la modalit j scrit:
Par convention, la modalit 0 est la modalit de base
Le modle logit multinomial



j| j
P Y j | X
x ln ln(1) 0
P Y j | X
=
= = =
, `
=
| )
Notez que

j| j
x, j : 0 =


( j|0)
j k
x
j 1
1
P Y 0 | X
1 e
=

=
= =
+




( j|0)
( j|0)
x
j k
x
j 1
e
P Y j | X
1 e

=
= =
+




( j|0)
( j|0)
x
j k
x
j 0
e
P Y j | X
e

=
= =

Le modle Logit binomial comme un cas


particulier du logit multinomial
Rcrivons la probabilit de lvnement Y=1
On voit bien que le logit binomial est un cas particulier du
cas multinomial o seulement deux modalits sont
analyses.










(1|0) (1|0) (1|0)
(1|0) ( 0|0) (1|0) ( k|0)
x
x
x x x
x x x x
k 0,1
e
P Y 1| X
1 e
e e e
P Y 1| X
1 e e e e



=
= =
+
= = = =
+ +

La mthode du maximum de vraisemblance
Supposons que nous disposons dun chantillon de n observations
alatoires. Soit f(Y) la probabilit que Y=j. La probabilit jointe
dobserver les n variables de Y est donne par la fonction de
vraisemblance :

n
1 2 n i
i 1
f y , y ,..., y f (y )
=
=
|
On doit maintenant spcifier la fonction f(.). Elle dcoule de la
distribution des probabilits dun vnement qui peut avoir plusieurs
modalits. Il sagit de la distribution multinomiale :
j 0 1 k k
i i i i i
dY dY dY dY dY
i 0 1 j k j
j K
f (y ) p p p p p

= =
|
La fonction de vraisemblance
En dfinitive, la fonction de vraisemblance scrit:





j
i
j 0
i i
( j|0)
( j|0) ( j|0)
n n k
dY
i j
i 1 i 1 j 1
dY dY
x
n n k
( j|0)
i i j k j k
x x
i 1 i 1 j 1
j 1 j 1
L(y) f y p
1 e
L(y) f y , x ,
1 e 1 e
= = =

= =

= = =
= =
+
= =

' '
+





= = -



+ +


| |
' '
| | |
| | |

La fonction de vraisemblance
Aprs manipulation, la fonction log de la vraisemblance scrit




( j|0)
i
( j|0) ( j|0)
i i
( j|0)
i i
x
n k
( j|0) 0 j
i i j k j k
x x
i 1 j 1
j 0 j 0
j k
x x
( j|0) j ( j|0)
i i
j 0
1 e
LL(y, x, ) dy ln dy ln
1 e 1 e
LL(y, x, ) ln 1 e dy x ln 1 e

= =

= =
= =
=

=
+
+







= - + -



+ +




| |
' '
' '

= + + +

|




( j|0)
( j|0)
i
j k n k
i 1 j 1 j 0
j k n k k
x
( j|0) j ( j|0)
i i
i 1 j 1 j 1 j 0
LL(y, x, ) dy x k 1 ln 1 e
=
= = =
=

= = = =
+
+






|
' '
' '
+
+

= + +




|
' '
' '


Le modle de logit multinomial
Instruction Stata : mlogit
mlogit y x
1
x
2
x
3
x
k
[if] [weight] [, options]
Options : noconstant : estime le modle sans constante
robust : estime des variances robustes, mme en
cas d'htroscdasticit
if : permet de slectionner les observations sur lesquelles portera la
rgression
weight : permet de pondrer les diffrentes observations
Le modle de logit multinomial
use mlogit.dta, clear
mlogit type_exit log_time log_labour entry_age entry_spin cohort_*
Dans Stata, la modalit de rfrence est celle
qui a la plus grande frquence empirique
Bloc des description de lajustement
Paramtres estims, erreurs
standards et probabilits critiques
Interprtation des coefficients
Linterprtation des coefficients seffectue toujours en rfrence la
catgorie de base.
La probabilit de rachat dcroit-elle
avec le temps ?
Non!!
Linterprtation correcte est:
relativement la survie, la probabilit
de rachat dcroit avec le temps
Interprtation des coefficients
Linterprtation des coefficients seffectue toujours en rfrence la
catgorie de base.
La probabilit de rachat est elle moins
forte pour les spinoffs ?
Non!!
Linterprtation correcte est:
relativement la survie, La probabilit
de rachat est moins forte pour les
spinoffs
Interprtation des coefficients
Relativement la banqueroute, la
probabilit de rachat est plus forte
pour les spinoffs

1|0 2|0 1|2 2|0 1|0 2|1
= =
lincom [boughtout]entry_spin [death]entry_spin
Croiser les rfrences
mcross fait le travail pour nous !
Attention la nouvelle catgorie
de rfrence !!
Rachat relativement la
banqueroute
Relativement la banqueroute, la
probabilit de rachat est plus forte
pour les spinoffs
Croiser les rfrences
mcross fait le travail pour nous !
Et nous retrouvons notre rsultat
prcdent
Lhypothse dindpendances des tats
non pertinents (IIA)
Le modle repose sur lhypothse que pour chaque paire de
modalits les ralisations sont indpendantes des autres modalits.
Autrement dit, les autres modalits sont non pertinentes (irrelevant).
Dun point de vue statistique, cela revient faire lhypothse
dindpendance des termes derreur entres les diffrentes modalits
(do le nom IIA: Independence of irrelevant alternatives)
Une faon simple de tester la proprit IIA est alors destimer le
modle en retirant une modalit (pour retreindre les choix), et de
comparer les nouveaux paramtres avec ceux du modle complet
Si IIA est valide, les paramtres ne changent pas significativement
Si IIA nest pas valide, les paramtres changent significativement
Lhypothse dindpendances des tats
non pertinents (IIA)
H
0
: La proprit IIA est valide
H
1
: La proprit IIA nest pas valide

1
* * *
R C R C R C

H var var

'

=
|
La statistique H (H car il sagit en fait dun test dHausman) suit une
distribution du M degr de libert (M tant le nombre de
paramtres)
Application de IIA
H
0
: La proprit IIA est valide
H
1
: La proprit IIA nest pas valide
mlogtest, hausman
Variable omise
Application de IIA
H
0
: La proprit IIA est valide
H
1
: La proprit IIA nest pas valide
mlogtest, hausman
Donc on compare les paramtres du modle
Banqueroute relativement Rachat
estim conjointement avec
survie relativement rachat
avec
les paramtres du modle
Banqueroute relativement Rachat
estim sans
survie relativement rachat
Application de IIA
H
0
: La proprit IIA est valide
H
1
: La proprit IIA nest pas valide
mlogtest, hausman
La conclusion est que la modalit survie modifie
significativement larbitrage rachat ou
banqueroute.
En fait pour une firme, le rachat peut tre vu
comme une modalit de rester en activit avec
une perte sur la dcision conomique
dinvestissement notamment.
Le LOGIT multinomial ordonn
Le modle multinomial ordonn
Envisageons maintenant le cas o la variable dpendante est une
variable discrte, dont la valeur indique une intensit. Typiquement,
dans le cadre dune enqute dopinion (genre CIS1-4), on a des
questions dont la rponse est code par une chelle de Likert :
Obstacles linnovation (chelle de 1 5)
Intensit de collaboration (chelle de 1 5)
Enqute de marketing (Napprcie pas (1) Apprcie (7))
Note dtudiants
Test dopinion
Etc.
La structure ordonne
*
n
1
*
n
1 2
*
n 2 3
*
3 k
y 1 si y
y 2 si y
y 3 si y
y k si y
= e
= e
= e
=
M
Ces variables dcrivent des chelles verticales quantitatives, si
bien quune faon de modliser le problme est de considrer des
intervalles dans lesquels la variable latente y* peut se trouver
o
j
sont des bornes inconnues estimer, dfinissant la frontire
des intervalles.
La structure ordonne
i i
*
i
x u y = +
On pose ensuite lhypothse que la variable latente (non observe)
y* est une combinaison linaire des variables explicatives :
o u
i
admet une fonction de rpartition F(.). Les probabilits
associes aux ralisations de y (y y*) sont alors lies la fonction
de rpartition de F(.). Regardons la probabilit que y = 1 :




1 i
1 i
i i
i i
x
1 i x
*
1 i
1
1
P(y 1) P
P(y 1) P x u
P(y 1) P u x
e
P(y 1) x
1 e
y


= =
= = +
= =
= = A =
+
e
e
e

La structure ordonne
Regardons la probabilit que y = 2 :


i 1 i
i 1 i
2
2
x x
2 i 1 i x x
* *
2 1 i i
P(y 2) P P
e e
P(y 2) x x
1 e 1 e
y y


= =
= = A A =
+ +
e e

Donc dans lensemble, nous avons:




1 i
2 i 1 i
3 i 2 i
k 1 i
P(Y 1) x
P(Y 2) x x
P(Y 3) x x
P(Y k) 1 x

= = A
= = A A
= = A A
= = A

M
Probabilit dans le modle ordonn
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
y=3 y=2 y=1 y=k

1 i
x
2 i
x
3 i
x
k 1 i
x


u
i
La fonction de vraisemblance
j
0 n
k n
dy
n k
j i j-1 i
i=1 j=1
y, x,
avec
F( - x ) 0
F( - x ) 1
L( , ) = F( x ) F( x )

|
=
=

||
En dfinitive, la fonction de vraisemblance scrit:
Dans le cas o u
i
suit une fonction logistique, la fonction log de
la vraisemblance scrit :




j i j-1 i
j i j-1 i
x x
n k
j
i
x x
i 1 j 1
j
j i j-1 i
j i j-1 i
dy
x x
n k
x x
i=1 j=1
y, x,
et donc
e e
y, x, dy ln
1 e 1 e
e e
L( , ) =
1 e 1 e
LL( , ) =
+ +


' ' ' '
+ +


' ' ' '


= =






|



+ +
|

+ +


||
La fonction de vraisemblance
Le logit multinomial ordonne
Instruction Stata : ologit
ologit y x
1
x
2
x
3
x
k
[if] [weight] [, options]
Options : noconstant : estime le modle sans constante
robust : estime des variances robustes, mme en
cas d'htroscdasticit
if : permet de slectionner les observations sur lesquelles portera la
rgression
weight : permet de pondrer les diffrentes observations
Le modle de logit multinomial
use est_var_qual.dta, clear
ologit innovativeness size rdi spe biotech
Qualit de
lajustement
Paramtres
estims
Points seuils
Interprtation des coefficients



i i
1.95
i
1.95
i
1
P(y 1) P x u
e
P(y 1) P 270.5 u 268.6 .1245
1 e
P(y 1) P u 1.9

= = +

= = + =
`
+

= =

)
e
e
e
Un signe positif signifie une relation positive entre la variable
explicative et le rang (ou lordre)
Une des difficults dans linterprtation est le rle des variables de
seuil. Notre modle est :
Quelle est la probabilit que Y = 1 : P( = 1) ?
Quelle est la probabilit que le score soit infrieur au premier seuil ?
i i
Score x u = +
Interprtation des coefficients







i i
1.95
i
1.95
i
2 i 1 i
i i
1.95
i
1.95
i
1
2
P(y 1) P x u
e
P(y 1) P 270.5 u 268.6 .1245
1 e
P(y 1) P u 1.9
P(Y 2) F x F x
P(Y
P(y 1) P x u
e
P(y 1) P 270.5 u 269.3 .2321
1 e
P(y 1) P u 1.2

= = +

= = + =
`
+

= =
= =

= = +


= = + =
`

= =

)
)
e
e
e

e
e
e
2) .2321 .1245
P(Y 2) .1076
= =
= =
Quelle est la probabilit que Y = 2 : P( Y = 2) ?
Obtenir les probabilit prdites
prvalue fait le travail pour nous !
Les modles de comptage
Partie 1. Le modle de Poisson
Les modles de comptage
Envisageons maintenant le cas o la variable dpendante est une variable
discrte positive qui dcrit un nombre dvnement. Typiquement, dans le
cadre de lanalyse de linnovation, on dnombre des innovations, de
demande de brevets, des inventions.
On pourrait utiliser les MCO mais les MCO peuvent produire des prdictions
ngatives. Pour les cas o les recensement sont importants (nombre de
brevets par pays, et non par firme), alors les MCO peuvent tre utiliss. On
pourrait utiliser le modle multinomial ordonn pour le faible dnombrement.
Gnralement on utilise les modle de comptage, dont la variable
expliquer suit une loi de Poisson.
Le modle de Poisson
Soit Y variable alatoire de comptage, la probabilit donne par la
distribution de Poisson que Y soit gale un entier y
i
est :
Pour introduire les variables explicatives dans le modle, on conditionne

i
en imposant la forme log-linaire comme suit:


i i
y
i
i i
i
i
e
P Y y , y 0,1, 2,...
y !
avec E Y var Y

= = =
= =
i
x
i
i i
e
ln x

=
=
La distribution de Poisson
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0.8 1.5
2.9 10.5
Valeur de Lambda
La fonction de vraisemblance scrit :


i
n
x
i i i
i 1
i i
y
n
i
i=1
i
y,
et donc
y, x, y x e ln y !
e
L( ) =
y !
LL( ) =

=

|
La fonction de vraisemblance
Le modle de Poisson
Instruction Stata : poisson
poisson y x
1
x
2
x
3
x
k
[if] [weight] [, options]
Options : noconstant : estime le modle sans constante
robust : estime des variances robustes, mme en
cas d'htroscdasticit
if : permet de slectionner les observations sur lesquelles portera la
rgression
weight : permet de pondrer les diffrentes observations
Le modle de Poisson
use est_var_qual.dta, clear
poisson poisson PAT rdi size spe biotech
Bloc des paramtres estims
Bloc des description de lajustement
Linterprtation des coefficients
i i
ln x 1 x
ln x ; x
x x x
ln

= = =


Si les variables sont entres en logarithme, on peut
interprter les coefficients comme des lasticits :
Laugmentation de 1% de la taille de lentreprise est associe
une augmentation de 0.51% du nombre espr de brevets
Linterprtation des coefficients
i i
ln x 1 x
ln x ; x
x x x
ln

= = =


Si les variables sont entres en logarithme, on peut
interprter les coefficients comme des lasticits :
Laugmentation de 1% de linvestissement en R&D est associe
une augmentation de 0.79% du nombre espr de brevets
Linterprtation des coefficients
Si la variable explicatives nest pas une transform
logarithmique, linterprtation change
Laugmentation de 1 point du degr de spcialisation est associe
une augmentation de 0.74% du nombre espr de brevets
Linterprtation des coefficients
Pour les variables muettes, linterprtation est lgrement
diffrentes
Les entreprises de biotechnologie ont un nombre espr de
brevets suprieur de 1% aux autres entreprises.
Linterprtation des coefficients
Toutes les variables sont extrmement significatives
mais hlas

E Y var Y =
Les modles de comptage
Partie 2. Le modle ngatif binomial
Le modle ngatif binomial
Gnralement, le modle de Poisson est invalid par la prsence
dune surdispersion des donnes qui violent lhypothse dgalit des
deux premiers moments de la distribution: la moyenne et la variance.
Le modle ngatif binomial pallie ce problme en ajoutant la
forme log-linaire un terme dhtrognit non observe:
i i i i i
ln v ln ln u x = + = + s


i
i i
y
u
i i
i
i
e u
P Y y
y !

= =
Le modle ngatif binomial
La densit de y
i
(la probabilit) est obtenue en prenant lesprance
de lexpression par rapport la densit de u
i
:




i
i i
i
y
u
u i i 1
i i i i i i
i 0
av
e u
f Y y | x g u du e u ec g u
y !



= = =
I

En supposant que u
i
suit une loi Gamma de moyenne 1, la densit de
y
i
devient :



i
y
i
i
i i
i i i
y
Y y x
y 1

I + + +

= =

I + I + +
' ' ' '
f |
La fonction de vraisemblance








i
i
y
n
i
i
i 1
i i i
n
x
i i i
i 1
y
L y, ,
y 1
LL y, x , y x y ln e ln

=
I + + +

=

I + I + +
' ' ' '
= + - + +
|

O alpha est le paramtre de surdispersion


Le modle ngatif binomial
Instruction Stata : nbreg
nbreg y x
1
x
2
x
3
x
k
[if] [weight] [, options]
Options : noconstant : estime le modle sans constante
robust : estime des variances robustes, mme en
cas d'htroscdasticit
if : permet de slectionner les observations sur lesquelles portera la
rgression
weight : permet de pondrer les diffrentes observations
Le modle de Poisson
use est_var_qual.dta, clear
nbreg poisson PAT rdi size spe biotech
Qualit de
lajustement
Paramtres
estims
Paramtre de
surdispersion
Test de
surdispersion
Linterprtation des coefficients
Si les variables sont entres en logarithme, on pouvons
toujours interprter les coefficients comme des lasticits :
Laugmentation de 1% de la taille de lentreprise est associe
une augmentation de 0.66% du nombre espr de brevets
Linterprtation des coefficients
Si les variables sont entres en logarithme, on pouvons
toujours interprter les coefficients comme des lasticits :
Laugmentation de 1% de la taille des dpenses de R&D est associe
une augmentation de 0.86% du nombre espr de brevets
Linterprtation des coefficients
Si la variable explicatives nest pas une transform
logarithmique, linterprtation change:
Laugmentation de 1 point du degr de spcialisation est associe
une augmentation de 0.84% du nombre espr de brevets
Linterprtation des coefficients
Et pour les variables muettes :
Les entreprises de biotechnologie ont un nombre espr de brevets
suprieur de 1,56% aux autres entreprises.
Le test de surdispersion
On utilise le test LR qui compare le modle ngatif binomial
avec le modle de Poisson

NBREG PRM
LR 2 ln L ln L 2 3055 6110 = = - =
-4536 -1481 -
Le rsultat du test (H0: Alpha=0) rejette lhypothse de nullit de
alpha. Il y a de la surdispersion dans les donnes. Il faut donc choisir
le modle binomial ngatif.
Des erreurs standard plus grandes
Des valeurs z plus petites
Extensions
Estimateurs MV
Tous les modles prsents peuvent tre tendus la
prise en compte de lhtrognit non observe
Effets fixes
Effets alatoires
Le modle dHeckman
Biais de slection
Deux quations, dont la premire estime la probabilit
dtre observ
Les modles de survie
En temps discret: log-log complmentaire, logit
En temps continu