Vous êtes sur la page 1sur 40

Statistique et Econométrie I

Adrian Bruhin

Université de Lausanne

Automne 2019

1. Introduction à la matière.
Que ferons-nous aujourd’hui?
• La structure du cours
– Votre équipe
– Les rôles des séances de cours et d’exercices
– Evaluation du cours et l’examen
– Les heures de réception

• Survol du cours

• On commence immédiatement avec la régression


linéaire simple
Votre équipe

Adrian Bruhin Clémence Kieny Tobias Lehmann


adrian.bruhin@unil.ch clemence.kieny@unil.ch tobias.lehmann.1@unil.ch

• Assistants étudiants
– Jonathan Chanel (jonathan.chanel@unil.ch)
– Alexandre El Din (alexandre.eldin@unil.ch)
– Maxime Moix (maxime.moix@unil.ch)
– Laure Perret (laure.perret@unil.ch)
Le rôle des séances de cours
• Structure des séances de cours
– Groupe A: Vendredi, 14h15 à 16h00, Amphipôle D
– Groupe B: Vendredi, 16h15 à 18h00, Amphipôle D

• Expliquer les concepts théoriques


– Dériver les résultats principaux: l’estimateur OLS et ces
propriétés
– Faire ressortir l’intuition derrière ces résultats

• Discuter des applications


– Applications concrètes qui utilisent les concepts que nous avons
développés
– Interprétation des résultats d’estimation de des modèles
statistiques
Le rôle des séances de cours: Matériel pour le cours
• Slides utilisés pendant le cours
– Disponibles sur moodle au moins un jour avant le cours.
– https://moodle.unil.ch/course/view.php?id=14305

• Vidéos avec détails techniques


– Mon collègue Lorenz Goette a fait de courtes vidéos avec des
dérivations techniques
– Très utiles pour mieux comprendre le contexte formel

• Le livre pour le cours


– James Stock et Mark Watson (2007), Introduction to
Econometrics, 2nd edition.
• Version française: Stock et Watson (SWT 2012), traduit par
Jamel Trabelsi, 3e édition.
– Fortement recommandé
Le rôle des séances d’exercices
• Séances d’exercices

– 8 sections des séances d’exercices


• Lundi 14h15 à 16h00: 4 sections (Groupe B)
• Mardi 10h15 à 12h00: 4 sections (Groupe A)

– Les détails sont affiches sur moodle

– Vous devez vous inscrire et choisir une équipe sur


https://www2.unil.ch/cours-bruhin/se1/index.php
Le rôle des séances d’exercices
• Séances d’exercices

– Semaine prochaine: Séance d’organisation

• Groupe B: Lundi, 23.9. à l’Amphipôle B, 14h15-15h00

• Groupe A: Mardi, 24.9. à l’Anthropole 2024,


pour ceux avec un nom de famille A-G: 10h15-11h00,
pour ceux avec un nom de famille H-Z: 11h15-12h00

– 3ème semaine: Début de la discussion des séries d’exercices


Le rôle des séances d’exercices
• Les objectifs des séances d’exercices
– Apprendre à communiquer et expliquer des concepts
statistiques et résultats empiriques
– Apprendre à corriger des exercices, et répondre aux questions
 Présentation des corrections d’exercices par vous!

• Format des séances d’exercices


– Chaque section consiste des équipes de 4-5 personnes
– Chaque équipe devra préparer la correction de plusieurs
exercices au cours du semestre
 Lors de la séance: un tir au sort décide si vous présentez la
correction devant les autres ou si vous rendez la correction
 Plus de détails dans la séance d’organisation
Evaluation du cours
• Ces capacités apprises aux séances d’exercices sont
importantes sur le marché de travail
 Le travail en équipe dans les séances d’exercices fera
partie de l’évaluation
 En même temps, ce travail vous aidera pour préparer
l’examen

• La formule: la note sera basée sur


– 30%: le score obtenu par votre équipe à la séance
d’exercices
– 70%: votre score obtenu dans l’examen écrit

– Deuxième tentative: le score de l’équipe ne compte que


s’il augmente la note.
L’examen
• Les modalités
– Durée : 2h
– Documentation et calculatrice non autorisée
– La collection des formules disponible sur moodle sera
aussi disponible pendant l’examen

– Idem pour la session de rattrapage

• Matière pour l’examen


– TOUT ce qui est couvert pendant les séances (slides,
exercices, dérivations, preuves, calculs, applications,…)
est sujet à l’examen.
Les heures de réception
• Heures de réception:

– Adrian Bruhin: Après le cours ou pendant la pause

– Tobias Lehmann: Sur rendez-vous.


Les détails sont affichés sur moodle.

• N’hésitez pas de discuter vos questions pendant ou


après les séances d’exercices!
Pourquoi des méthodes quantitatives?

• Supposons que Cesla Amarelle, cheffe


du département de la formation,
jeunesse et culture (DFJC VD), ait reçu
100 millions pour améliorer le système
d’éducation.

 Comment les notes des élèves


dépendent-elles des effectifs des
classes?
Les notes et la taille de classe

 Y a-t-il une relation significative entre les deux variables?


 De combien augmentent les notes si l’on réduit la taille
des classes?
Pourquoi des méthodes quantitatives?

• La culture de notre pays d’origine, même si nous ne


vivons plus dans celui-ci, a-t-elle une influence sur
notre comportement?

• Diplomats à New York


– Interdictions de se garer
– Immunité
– Origine culturelle différente
Les origines culturelles de la corruption
Ln(1 + Amendes impayées/diplomate)

 Y a-t-il une relation significative entre les deux variables?


Pourquoi des méthodes quantitatives?

• La taille d’une
personne a-t-elle une
influence sur son
salaire horaire?
La taille et les salaires horaires

165 cm 177 cm 190 cm

 Y a-t-il une relation significative entre les deux variables?


Survol du cours
La loi des grands Un coefficient
Hypothèses Distribution nombres
OLS asymptotique
Propriétés Les tests
stochastiques Le théorème d’hypothèses
central de la limite
Espérance et
variance Hétéro-
scédasticité

Régression linéaire simple

L’estimateur OLS:
Les limitations du modèle linéaire simple

• Dans quelques cas spéciaux, le modèle linéaire


simple est parfaitement adéquat.
– Par exemple, pour l’analyse des expériences simples

• Mais souvent, cela ne suffit pas.


Les notes et la taille de classe

 Les personnes mieux éduquées vivent dans les districts


riches, qui ont des classes plus petites.
 Comment peut-on corriger ce biais?
Les origines culturelles de la corruption

Ln(1 + Amendes impayées/diplomate)

 Les pays les plus corrompus sont aussi les plus pauvres.
 Payent-ils moins leurs diplomates?
La taille et les salaires horaires

165 cm 177 cm 190 cm

• Les personnes plus grandes viennent-elles d’un


environnement plus favorable?
Régression linéaire multiple

• Il nous faut une méthode qui nous permet d’estimer


l’impact de plusieurs variables.

 Important pour isoler l’effet de chaque variable, et


comparer les effets.
Survol du cours
La loi des grands Un coefficient
Hypothèses Distribution nombres
OLS asymptotique
Propriétés Les tests
stochastiques Le théorème d’hypothèses
central de la limite
Espérance et Plusieurs
variance Hétéro- coefficients
scédasticité

Régression linéaire
multiple
Dangers à la
L’estimateur OLS: validité
Les deux parties du cours
• La première partie
– Le modèle linéaire (simple et multiple)
– Les propriétés asymptotiques
– Les tests d’hypothèses

• La deuxième partie
– Modifications des hypothèses OLS pour traiter des
applications plus générales.
• Modèles panels
• Variables endogènes

 Simples modifications des estimateurs dont nous avons


parlé dans la première partie du cours
Survol du cours
La loi des grands Un coefficient
Hypothèses Distribution nombres
OLS asymptotique
Propriétés Les tests
stochastiques Le théorème d’hypothèses
central de la limite
Espérance et Plusieurs
variance Hétéro- coefficients
scédasticité

Régression linéaire
multiple Plusieurs
observations
L’estimateur OLS:
par individu
Les instruments et Les modèles
les expériences panels

La forme clustering La matrice de


TSLS
réduite
Variables covariance
endogènes
Survol du cours

Régression linéaire simple

L’estimateur OLS:
Le modèle linéaire simple
• Y a-t-il une relation entre la taille des classes et les
notes des élèves?
– 420 districts d’écoles en Californie
Le modèle linéaire simple

• Comment peut-on examiner cela d’une façon


systématique?

 Il faut spécifier un modèle statistique

 Le plus simple possible est le modèle linéaire simple


Le modèle linéaire simple
Le modèle linéaire simple
Interprétation géométrique
• Le résidu
– L’écart entre la droite β0 + xiβ1 et la valeur yi
Pourquoi le modèle linéaire?

• C’est simple.
– La simplicité est précieuse. Vous verrez que ça devient
assez compliqué par la suite.

• Une régression linéaire simple suffit pour tester


l’hypothèse nulle qu’il n’y ait aucune relation entre y
et x (β1 = 0).
– Nous discuterons des formes fonctionnelles plus
complexes par la suite.
Comment estimer les coefficients β ?
• Une approche intuitive: Minimiser la somme des
résidus carrés.

– Pourquoi les résidus carrés? Pourquoi pas les résidus


absolus?
 Simplicité mathématique

• L’estimateur des moindres carrés ordinaires est le


concept le plus important dans toute l’économétrie.

– Moindres carrés ordinaires en anglais: ordinary least squares.


 Nous utiliserons la convention OLS.
La définition de l’estimateur
L’estimateur OLS: Les écoles en Californie
L’estimateur OLS: Taille et salaire horaire

Sal96i = -11.55 + 0.39Taillei + ei


Qu’avons-nous fait aujourd’hui

• Survol du cours

• Nous avons commencé avec le modèle linéaire


– La définition du modèle:

– La définition de l’estimateur OLS:


Qu’allons-nous faire?
• Dans les exercices: Répétition et outils pour le calcul
de l’estimateur OLS.
– Calculs et manipulations d’espérances et de variances
– D’autres développements utiles pour OLS

• La semaine prochaine
– Les mesures du pouvoir prédictif de l’estimateur OLS
– Les hypothèses qui permettent une interprétation de
l’estimateur OLS.
– On commencera à discuter des propriétés stochastiques
Qu’allez-vous faire cette semaine?

• Si nécessaire (…), répétez les chapitres 2 et 3 dans


Stock et Watson (SW), appendix A et B dans Stock,
Watson et Trabelsi (SWT).

• Lisez le chapitre 4 dans SW (chapitre 1 dans SWT).

Vous aimerez peut-être aussi