Vous êtes sur la page 1sur 37

Statistique et Econométrie I

Adrian Bruhin

Université de Lausanne

Automne 2019

4. Le modèle de régression simple (3/3).

1
La semaine dernière
• Les propriétés de l’estimateur OLS si N tend vers l’infini.

– Convergence:

– Distribution asymptotique:

• Les tests des hypothèses

– Le principe général d’un test

– Application: Ariely et al. (2009) « Large Stakes and Big


Mistakes » 2
Qu'allons-nous faire aujourd'hui?
• Les intervalles de confiance
– Une autre façon d'utiliser l'information d'un test d'hypothèse.

• Que faire si la variance du résidu n'est pas constante?


– L'estimateur OLS n'est pas affecté.
– Simple modification de l'erreur standard

• Plus d'applications relatives aux tests d'hypothèses


– Fisman et Miguel (2007): La « culture de corruption » affecte-t-
elle le comportement ?
 Amendes de parking des diplomates à NYC.
 Plus de tests, et application des erreurs standards
hétéroscédastiques.
3
Survol du cours
La loi des grands Un coefficient
Hypothèses Distribution nombres
OLS asymptotique
Propriétés Les tests
stochastiques Le théorème d’hypothèses
central de la limite
Espérance et
variance Hétéro-
scédasticité

Régression linéaire simple

L’estimateur OLS:

4
Exemple: Les notes des élèves en Californie
• Le résultat de la régression linéaire

• Beaucoup d'informations utiles que nous savons


maintenant utiliser
– L'erreur standard de b0 est égale à 10.4
– L'erreur standard de b1 est égale à 0.52
– On avait déjà discuté du R2 et de l'ESR.
5
Exemple 1: Les notes des élèves en Californie
• La taille de classe est-elle significative à α=0.05?
– Test bilatéral:

– Calcul de la valeur p:

 Nous concluons donc que la taille des classes a un effet


négatif sur les notes.
 Avec une valeur p << α, l’effet est fortement significatif.
6
Les intervalles de confiance
• Etant donné b1 et S(b1), dans quel intervalle faut-il
s'attendre à trouver le vrai paramètre β1?
– Typiquement: probabilité de 95%.
– Rappelons-nous que

 Donc, l'intervalle de confiance à 95% dans exemple est :


-2.28 +/-0.52*1.96 = (-3.30, -1.26). 7
La variance du résidu
• Jusqu'à maintenant nous avons considéré le cas où le
résidu avait une variance constante pour toutes les
observations.
– Interprétation graphique

8
La variance du résidu
• Mais il est possible que la variance ne soit pas
constante bien que l'hypothèse 1 soit vraie.

– Interprétation graphique

9
La variance du résidu
• Dans quelques applications, il est évident que la
variance du résidu n'est pas constante.

10
La variance du résidu
• Mais ici? Difficile à dire.
– L'idéal serait d'avoir une correction applicable aux OLS
même lorsque l'on n'est pas sûr à 100% que la variance
n'est pas constante.

11
La variance du résdu
• L'hétéroscédasticité n'est pas un grand problème

– Comme l'hypothèse 1 (espérance du résidu conditionnelle


à x est égale à zéro) est satisfaite, l'estimateur est
consistant même si la variance est hétéroscédastique.

– Par contre la formule pour la variance n'est plus correcte!

 Il faut « réparer » l'estimateur de la variance S(b)

 Comment?

12
Vers quoi tend la variance de l'estimateur OLS?
• La variance de l'estimateur OLS est égale à:

13
Vers quoi tend la variance de l'estimateur OLS?
• La variance approximative de l’estimateur OLS sous
hétéroscédasticité

– Cette expression ne correspond pas à la variance que nous


avons calculée sous l'hypothèse 2 des distributions
identiques.

 Il faut trouver un estimateur SR(b1) tel que

14
Vers quoi tend la variance de l'estimateur OLS?
• Considérons le candidat suivant

– Il tend vers la bonne limite! Ça marche.


 On appelle SR l'estimateur robuste de la variance. 15
La magie de l'estimateur robuste de la variance
• Modification de l’estimateur OLS
– Le résultat de convergence n’est pas touché par
l’hétéroscédasticitié.
– Il faut ajustder la matrice de covariance de la distribution
limite

• Point magique: Bien que la variance du résidu puisse


prendre une infinité de valeurs, il est possible
d'estimer son espérance
– Il serait impossible d'estimer chaque valeur possible de la
variance du résidu, mais il suffit de connaître l'espérance.
 Par la loi des grands nombres, on peut l'estimer.
16
Application: Fisman et Miguel (2007)
• Deux questions de recherche

1. Les normes culturelles, spécifiquement le niveau de


corruption dans le pays d'origine, ont-elles un impact sur
le comportement des gens?

Les normes de corruption d'un pays agissent-elles sur


le comportement des individus même si ceux-ci ne sont
plus dans ce pays?

2. Quelle est l'importance de l'impact des incitations


financières sur le comportement vis-à-vis des normes
culturelles?
17
Application: Fisman et Miguel (2007)
• Motivation pour l'article
– Dans bon nombre de pays, les diplomates bénéficient de
l'immunité diplomatique leur permettant d'échapper aux
condamnations
 « le droit » de ne pas payer les amendes

– Entre novembre 1997 et la fin 2002, les diplomates de


l'ONU à NYC ont accumulé plus de 150'000 amendes de
stationnement non-payées
 engendrant plus de 18 millions de dollars de manque à
gagner pour la ville de New York.

18
Portée du problème

• Stationner illégalement en usant de son statut


diplomatique correspond bien à la définition
commune de la corruption:
– « Utilisation abusive d'un pouvoir reçu par délégation à
des fins privées »

• Comment mesurer l'effet de la corruption?


– Observer les comportements de diplomates d'origines
différentes dans un lieu commun (NY)

19
Régression univariée
• Régression basique

20
Evidence descriptive
• Les amendes des diplomates en fonction de la
corruption de leur pays d'origine
Ln(1 + Amendes impayées/diplomate)

21
Ln(1 + Amendes impayées/diplomate)
Droite de régression OLS

22
Les résultats de la régression en détail
• Variable dépendante: log(amendes par diplo + 1)
– Forme commune de présentation des résultats

Toujours l’ erreurs Le coefficient


standard!
estimé: de combien
change la variable
dépendante si on
augmente l'indice
L'erreur standard du
de 1?
coefficient: La base
pour le test de
signification

23
Les résultats de la régression en détail
• Variable dépendante: log(amendes par diplo + 1)
– Forme commune de présentation des résultats
C'est fortement
significatif !!!

Convention typique

*: significatif au niveau de
10% (valeur critique: 1.65)

**: significatif au niveau de


Test de signification: 5% (valeur critique: 1.96)

***: significatif au niveau de


1% (valeur critique: 2.57)
24
Interprétation des résultats

• La corruption du pays d'origine est fortement liée au


nombre d'infractions de trafic des diplomates.
– L'effet paraît très fort, mais peut-être est-ce parce que les
diplomates n'avaient aucune incitation financière à éviter
les amendes?

 A partir de 2003, la police obtient le droit de confisquer la


plaque d’une voiture de diplomate si plus de 3 amendes
n'ont pas été payées.

 Comment change la relation entre les amendes et la


mesure de corruption?
25
Application: Fisman et Miguel (2007)

26
L'effet du changement des incitations financières
• Il semble que la droite devienne moins pentue

confisquée

1997 – 2002 2003 - 2006


27
Les résultats des régressions

La corruption dans
le pays d’origine
est significative
même après le
changement

Mais l'effet est


moins fort

28
Les résultats des régressions

Le niveau général
des amendes a
diminué

29
Comment calculer les erreurs standards?
• C'est évident que les observations deviennent plus
dispersées pour les pays plus corrompus

30
Régression avec erreurs standards robustes
• Les coefficients sont identiques, on ne fait que
corriger les erreurs standards.

Les erreurs
standards
diminuent dans
cet exemple

Mais en général,
c'est impossible
de dire dans
quelle direction
cela va aller.
31
Interprétation des résultats

• Forte relation entre la corruption dans le pays


d'origine et le comportement des diplomates.

– Les diplomates des pays plus corrompus accumulent plus


d'amendes de trafic à NYC.

– La relation devient plus faible après l'introduction des


sanctions, mais elle est encore significative.

32
Interprétation des résultats
• Mais est-ce que cela démontre que la culture de
corruption dans le pays d'origine est la source de ce
comportement?

• Non. Il y a d'autres causes possibles qui pourraient


être corrélées avec la corruption
– Par exemple: peut-être que les pays corrompus sont plus
pauvres et paient des salaires plus bas aux diplomates.

 Comme la pauvreté est corrélée avec la corruption, la


régression donne l'impression que la corruption engendre
les infractions, mais ce n'est pas clair qu'il en soit ainsi.
33
Interprétation des résultats

• En général, des variables omises, mais corrélées avec


x, génèrent un biais.

– Le biais de variables omises.


 On en discutera la semaine prochaine.

– Il faut trouver une façon de résoudre ce problème.


 Régression multiple. On commence avec cela la semaine
prochaine.

34
Qu'avons-nous fait aujourd'hui?
• Plus de détails sur le modèle linéaire simple
– Les intervalles de confiance.
– Les erreurs standards robustes

• Applications
– Les notes des élèves en Californie: On sait maintenant que
la taille de classe a un effet significatif sur les notes.

– Fisman et Miguel (2007): La corruption a une influence sur


le comportement des diplomates même quand ils sont
dans un pays différent.

35
Qu'allons-nous faire?
• Dans les exercices
– Correction exercices
– Les matrices (vous verrez pourquoi)

• La semaine prochaine
– Le biais de variables omises: C'est un des plus grands
problèmes dans ce domaine.
 Comment peut-on le résoudre?

– La régression multiple
• Comment utiliser les matrices pour écrire la
régression?
• Comment définir et calculer l'estimateur OLS? 36
Que ferez-vous?

• Les exercices
– La série 3 est en ligne
– Délai pour rendre le corrigé: dimanche à 23h59

• Vidéo
– Nous réviserons ce qu'il faut savoir des matrices.

• Lisez le chapitre 6 dans SW (chapitre 3 dans SWT).

37

Vous aimerez peut-être aussi