Vous êtes sur la page 1sur 26

Statistique et Econométrie I

Adrian Bruhin

Université de Lausanne

Automne 2019

2. Le modèle de régression simple (1/3).

1
La semaine dernière
• La semaine dernière, nous avons commencé avec le
modèle linéaire et l’estimateur OLS

– La définition du modèle:

 C’est l’estimateur le plus important en économétrie !


2
La semaine dernière
• Les élèves en Californie

3
Qu’allons-nous faire aujourd’hui?
• Continuons la discussion du modèle linéaire simple
– Les mesures de précision
• Le R2 et l’erreur standard de régression.

– Sous quelles hypothèses l’estimateur OLS a-t-il une


interprétation pertinente?

– Quelles propriétés stochastiques de l’estimateur


découlent de ces hypothèses?
• Aujourd’hui: Quelles sont l’espérance et la variance de
l’estimateur OLS?
• Semaine prochaine: Quelle est sa distribution
asymptotique?
4
Les mesures de précision du modèle linéaire
• Deux mesures différentes

– Le R2: Quel pourcentage de la variance totale de la variable


dépendant peut-on expliquer avec le modèle?

– L’erreur standard de régression: Quelle est l’erreur


moyenne de la part imprévue de la variable dépendant?

5
Les mesures de précision du modèle linéaire
• Dans le modèle, on peut décomposer une
observation en deux parties:
– La partie prévue:

– La partie imprévue:

• Le résidu empirique
• Notez qu’on peut observer le résidu empirique ei, mais
pas le résidu dans la population εi

• Nous avons vu dans la vidéo 1 que

6
Application: Les élèves en Californie
• Quelle est la valeur prévue pour le district de
Antelope, CA?
– x = 19.3 élèves par classe

7
Le R2
• On peut décomposer la variance empirique (Vidéo 1)

• Le R2 utilise cette décomposition


– la proportion expliquée de la variance totale:

 Le R2 prend une valeur comprise entre 0 et 1.


8
L’erreur standard de régression
• L’erreur standard de régression est égale à l’erreur
standard du résidu empirique:

– Ne vous occupez pas du N – 2.

– Comme l’ESR est mesurée dans la même unité que y, on


peut la comparer, par exemple, à la moyenne de y ou à
l’écart type de y.

9
Application: Les élèves en Californie
• Le R2 = 0.05, l’ESR = 18.9, Ecart-type y: 19.05

• Est-ce que cela veut dire que la taille des classes


n’est pas importante?
 NON! Mais on a du mal à expliquer la variation des notes
par le facteur taille des classes. 10
Où en sommes-nous?
• Nous sommes en train de discuter des propriétés de
l’estimateur OLS
– sans nous occuper du modèle statistique qui génère les
données.

• Nous allons poser des hypothèses concernant le modèle


statistique
– Les trois hypothèses OLS
 Quelles propriétés stochastiques de l’espérance et de la
variance de l’estimateur OLS découlent de ces hypothèses?

• La semaine prochaine: Plus de propriétés


– Des implications encore plus fortes.
 Quelles propriétés peut-on observer si N tend vers l’infini?

11
Les trois hypothèses sur le modèle
• Les trois hypothèses impliquent des fortes propriétés
L’hypothèse importante. Les deux autres sont
facilement démontrables.

– Hypothèse 1: L’espérance de ε conditionnellement à x


égale 0.

– Hypothèse 2: (xi,yi) sont indépendants des autres j, et


identiquement distribués. (i.i.d.)

– Hypothèse 3: Les observations aberrantes sont très rares.

12
Hypothèse 1: L’espérance du résidu
• L’espérance de ε conditionnelle à x égale 0.

• Deux implications importantes :

– Cela implique que l’espérance est égale à 0.

– Cela implique que ε et x ne sont pas corrélés.

 Si ε était corrélé avec x, il serait impossible que


13
Hypothèse 1: L’espérance du résidu
• Interprétation
– Le résidu est imprévisible pour tous les x

 Avec des données observationnelles, l’hypothèse


n’est pas toujours satisfaite. 14
Hypothèse 1: L’espérance du résidu
• Par contre, dans une expérience, l’hypothèse est
satisfaite par construction.

• Exemple: Traitement expérimental de la grippe


– yi : La durée de la grippe.
– xi : 0 pour le groupe de contrôle, 1 pour le groupe de
traitement

• Les chercheurs allouent les patients de façon


aléatoire à l’un des deux groupes.
 Les ε (i.e. les différences aléatoires dans la durée de la
grippe qu’on ne peut pas expliquer avec le traitement)
sont indépendantes des groupes x:
15
Hypothèse 2: L’indépendance des observations
• Deux parties de l’hypothèse
– (xi,yi) sont indépendants des autres observations j.

– (xi,yi) sont distribués identiquement.

• Souvent, l’indépendance est garantie par la structure


de l’échantillon.
– Par exemple: Echantillon aléatoire de 10% des travailleurs
suisses en 2015 pour analyser les déterminants du salaire.
– Les attributs importants qu’on observe pas - comme le
talent - sont distribue de façon aléatoire vers les individus.
 Les observations sont indépendantes.
16
Hypothèse 2: L’indépendance des observations
• Deux parties de l’hypothèse
– (xi,yi) sont indépendants des autres observations j.

– (xi,yi) sont distribués identiquement.

• Mais, l’indépendance est souvent violée si on analyse


plusieurs observations du par individu.
– Par exemple: Echantillon de 10% des travailleurs suisses en
2014, 2015, 2016 pour analyser les déterminants du salaire.
– Les les attributs d’un individu affectent son salaire sur les
trois années.
 Le salaire d’un individu est corrélé vers ces trois années.
 Méthodes panels dans la deuxième partie du cours. 17
Hypothèse 2: L’indépendance des observations
• Deux parties de l’hypothèse
– (xi,yi) sont indépendants des autres observations j.

– (xi,yi) sont distribués identiquement.

• La distribution identique n’est pas très important.


– Facile à remplacer. On le fera dans deux semaines.
– Mais très utile. Implique que la variance du résidu est
constante

Si ce n’était pas le cas, la distribution ne serait évidemment


pas identique (parce que la variance change entre
observations) 18
Hypothèse 3: Les Observations aberrantes sont très rares.
• L’estimateur OLS est sensible aux observations
aberrantes. Condition:

• Souvent, les observations aberrantes sont causées par


des erreurs de codage des données. Vérifier! 19
Les propriétés stochastiques de l’estimateur OLS
• Les trois hypothèses génèrent des propriétés
importantes.

• Aujourd’hui: L’espérance et la variance de l’estimateur.


– Quelles propriétés améliorent la précision de l’estimateur?

• Mais les implications les plus importantes sont obtenues


quand N tend vers l’infini.
– Pendant les exercices: La théorie asymptotique.

– La semaine prochaine: Les propriétés asymptotiques de


l’estimateur OLS
20
L’espérance de l’estimateur OLS

• Propriété importante

– L’estimateur est non biaisé

 « En moyenne, c’est juste »

• Mais cela ne dit rien sur sa précision

21
La variance de l’estimateur OLS

• Expression similaire pour la variance de b0

• La variance comprend trois parties


– La variance de ε : moins de précision pour b1!
 Une plus grande variance de ε augmente la variance de b1
– La variance de x : plus de précision pour b1!
 Une plus grande de variance de x diminue la variance de b1
- La taille d’échantillon
22
La variance de l’estimateur OLS

• Deux nuages avec le même nombre de points: Bleu et noir.


 Plus de précision pour le nuage de points noir! Il y a plus de
variation de X dans les données. 23
Qu’est-ce qu’on a fait aujourd’hui?
• Trois hypothèses
– Une est importante: l’espérance conditionnelle du résidu
est égale à zéro.

– Les deux autres rendent la vie plus facile, mais peuvent


être remplacées par des hypothèse moins restrictives.

• Nous avons commencé la discussion des propriétés


de l’estimateur OLS sous les trois hypothèses.
Résultats:
– Il est non biaisé
– Il est plus précis si la variance de x est grande.
24
La semaine prochaine
• On continue la discussion des propriétés

– Les propriétés lorsque N tend vers l’infini. Très important!


• Mais ce sera aussi la leçon la plus difficile du cours!

– Première session d’exercices.

25
Qu’allez-vous faire cette semaine
• Exercices
– Vous devez tous être inscrits dans une section (et équipe)
– Ceux qui doivent préparer un corrigé: envoyez le corrigé à
votre assistant jusqu’à dimanche, 23h59!

• Lisez le chapitre 5 dans SW (chapitre 2 dans SWT).

• Regardez les vidéos 3 et 4

• La prochaine séance de cours sera difficile!


 Vous devez être en pleine forme!!
26