Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
Spécification et problèmes de
données
Licence Econométrie – Econométrie II
2007-2008
Martin Fournier
Fournier@gate.cnrs.fr
L3 Econométrie - Econométrie II 1
1. Formes fonctionnelles
L3 Econométrie - Econométrie II 2
1
1.2 Formes fonctionnelles (2)
Deux approches :
Que dit la théorie économique ?
Nature de la relation connue (exponentielle, linéaire…) ?
Concavité / convexité attendue ?
Quelle interprétation peut-on dériver des résultats ?
y = α.x + β
y = α.x + β .x2 + γ
y = α.x1 + β .x2 + γ.x1.x2 + δ
y = α.ln(x) + β
Ln(y) = α.ln(x) + β
Etc…
∂y ∂y / ∂x ∂y dx
Interprétation de , , par rapport à x, , x1 , x2 ,...
∂x y ∂x1 x
L3 Econométrie - Econométrie II 4
Prix immobiliers :
price = β 0 + β1lotsize + β 2 sqrft + β 3bdrms + u
contre
price = β 0 + β1lotsize + β 2 sqrft + β 22 ( sqrft ) 2
+ β 3bdrms + β 32 (bdrms) 2 + u
2
L3 Econométrie - Econométrie II 7
H0 : δ1 = δ2 = 0
1.7 Exemple
Prix immobiliers :
price = β 0 + β1lotsize + β 2 sqrft + β 3bdrms + u
Estimation et simulation de :
priˆce = βˆ0 + βˆ1lotsize + βˆ2 sqrft + βˆ3bdrms + u
Nouvelle estimation de :
price = β 0 + β1lotsize + β 2 sqrft + β 3bdrms
+ δ1 ( priˆce) 2 + δ 2 ( priˆce)3 + u
L3 Econométrie - Econométrie II 9
3
L3 Econométrie - Econométrie II 10
Spécification en logarithme
L3 Econométrie - Econométrie II 11
y = β0 + β1x1 + … + βkxk + u
contre
y = β0 + β1ln(x1) + … + βkln(xk) + u
L3 Econométrie - Econométrie II 12
4
1.11 Approche de Minzon et
Richard
Minzon et Richard (1986) :
1) Estimation d’un modèle complet incluant toutes les
formes fonctionnelles des explicatives :
y = α0 + β1x1 + … + βkxk + δ1ln(x1) + … + δkln(xk) + u
2) Test de
H0 : β1 = … = βk = 0
et H0 : δ1 = … = δk = 0
NB : Nombre important de paramètres à estimer
Question : Si les deux hypothèses nulles sont rejetées ?
L3 Econométrie - Econométrie II 13
5
1.14 Remarques sur les test
d’alternatives non-imbriquée (2)
Rejeter une spécification contre une autre ne
signifie pas que la deuxième est la « bonne » (elle
pourrait être elle-même rejetée contre une
troisième)
Le problème devient encore plus complexe
lorsque l’on veut tester des formes fonctionnelles
différentes sur la variable expliquée (y contre
ln(y) par exemple)
une idée est de suivre la même logique et de
transformer la valeur prédite de ln(y) pour en
déduire le ŷ utilisé en deuxième étape (et
réciproquement)L3 Econométrie - Econométrie II 16
1.15 Exemple
Prix immobiliers :
on teste :
ln( price) = β 0 + β1lotsize + β 2 sqrft + β 3bdrms + u
contre :
ln( price) = δ 0 + δ1 ln(lotsize) + δ 2 ln( sqrft ) + δ 3bdrms + u
On construit :
^
ln( price) = βˆ0 + βˆ1lotsize + βˆ2 sqrft + βˆ3bdrms
et ^ˆ
ln( price) = δˆ0 + δˆ1 ln(lotsize) + δˆ2 ln(sqrft ) + δˆ3bdrms
L3 Econométrie - Econométrie II 17
L3 Econométrie - Econométrie II 18
6
1.17 Exemple (suite)
On estime :
ln( price) = β 0 + β1lotsize + β 2 sqrft + β 3bdrms
^ˆ
+ α1 ln( price)+ u
et :
On teste la significativité de α1 et α2
L3 Econométrie - Econométrie II 19
L3 Econométrie - Econométrie II 20
L3 Econométrie - Econométrie II 21
7
2.1 Présentation du problème
L3 Econométrie - Econométrie II 22
2.2 Exemple
Estimer le rendement de l’éducation
Fonction mincérienne de salaire :
ln(W) = β 0 + β 1EDUC + β 2EXPER + u
Avec W : salaire, EDUC : nombre d’années d’études et
EXPER : nombre d’années d’expérience.
Les capacités intellectuelles intrinsèques (CII) de
l’individu (ability) sont :
- Inobservées
- positivement corrélées avec le niveau d’éducation
atteint (EDUC = δ1CII + v)
- positivement corrélées avec le niveau de salaire
(ln(W) = δ2CII + w)
L3 Econométrie - Econométrie II 23
L3 Econométrie - Econométrie II 24
8
2.3 Étendue du problème
Ce problème est inhérent à toute analyse
économétrique :
Certaines variables sont par nature inobservables ou non-
mesurables (dynamisme, charisme, capital social d’un
individu, esprit d’équipe dans une entreprise, etc.)
Certaines variables sont non disponibles pour
l’économètre (questions non posées, réponses biaisées sur
des sujets sensibles, etc.)
Il faut juste rester conscient que certaines variables
peuvent capter des effets plus larges que ce
pourquoi elles sont inclues dans le modèle
L3 Econométrie - Econométrie II 25
9
2.4 Les Variables Proxy (2)
Les équations (1) et (2) impliquent :
y = β0 + β1x1 + β2(δ0 + δ1x2 + v) + u
= [β0 + β2δ0] + β1x1 + β2δ1x2 + [β2v + u]
= π0 + β1x1 + π2x2 + w
w ne doit pas être corrélé avec les variables
explicatives du modèle, donc u et v doivent être
non corrélés avec x1 et x2
NB : Les valeurs des coefficients estimés pour le
terme constant et la proxy ne sont pas directement
interprétables.
L3 Econométrie - Econométrie II 28
2.6 Exemple
Reprenons l’exemple de la fonction de salaire :
L3 Econométrie - Econométrie II 30
10
L3 Econométrie - Econométrie II 31
L3 Econométrie - Econométrie II 32
11
3.2 Erreur de mesure sur une
variable expliquée
y* = β 0 + β1 x1 + L + β k xk + u (1)
L3 Econométrie - Econométrie II 36
12
3.5 Erreur de mesure sur une
variable explicative
Deux cas extrêmes :
e1 est non-corrélée avec la mesure observée x1 :
cov(x1 , e1 ) = 0
e1 est alors corrélée avec la variable explicative
inobservée du fait que : e1 = x1 − x1∗
13
3.8 Erreurs de mesures CEV (2)
n
Rappel
∑ x (u i1 i − β1ei1 )
βˆ1 = β1 + i =1
n
∑ (x − x1 )
2
i1
i =1
cov( x1 , u − β1e1 )
Et donc
( )
plim βˆ1 = β1 +
var( x1 )
σ e2
= β1 1 − 2 1 2
σ ∗ +σe
x1 1
σ x2∗
= β1 2 1 2
σ ∗ +σe
x1 1
L3 Econométrie - Econométrie II 40
L3 Econométrie - Econométrie II 42
14
4.1 Valeurs manquantes : Est-ce
un problème ?
Si les valeurs manquantes sont aléatoires, le sous-
échantillon ayant des observations est un échantillon
représentatif de l’échantillon total
Aucun problème (statistiques descriptives, régressions,
etc.)
Les problèmes apparaissent lorsque l’attrition (les
valeurs manquantes) est corrélée à une dimension du
problème considéré (ex. : les plus riches refusent de
donner une information sur leurs revenus)
Le sous échantillon informé n’est plus représentatif
(statistiques descriptives biaisées)
Les résultats d’estimations peuvent être baisés
L3 Econométrie - Econométrie II 43
15
4.4 Processus de sélection
complexes
Le processus de sélection attrition peut
être plus complexe et entraîner des biais
dans les estimations
L3 Econométrie - Econométrie II 47
2 Sources potentielles :
Erreurs de saisie / de compréhension des question /
Fausses réponses
Observation effectivement très différente des autres
(milliardaire, SDF…)
L3 Econométrie - Econométrie II 48
16
5.2 Les points aberrants (2)
1ère étape : détecter les points aberrants et
vérifier la cohérence des réponses (statistiques
descriptives)
La correction peut apparaître évidente (zéro de
trop ou zéro manquant) ou peut se retrouver par
raisonnement logique (combinaison de réponses à
d’autres questions)
Si la correction n’est pas évidente, il peut être
légitime de tout bonnement supprimer
l’observation (ou de présenter les régression avec
et sans les points considérés aberrants)
L3 Econométrie - Econométrie II 49
L3 Econométrie - Econométrie II 50
L3 Econométrie - Econométrie II 51
17
L3 Econométrie - Econométrie II 52
L3 Econométrie - Econométrie II 53
L3 Econométrie - Econométrie II 54
18
5.7 Méthode des Moindres
Déviations Absolues (LAD)
La méthode LAD (Least Absolute Deviations) est
parfois utilisée pour diminuer la sensibilité des
résultats aux points aberrants.
Idée : Minimiser la somme des déviations
n
absolues :
∑
i=1
ˆ
u i
19