Vous êtes sur la page 1sur 40

Econométrie

avec application sous SAS


M1 IES
Ekaterina.Kalugina@univ-evry.fr
Plan du cours
 Introduction: définition, modélisation, données,
estimation, régression simple

Le modèle de régression multiple


 Estimation, tests, interprétation des coefficients,
mesures de la qualité de l’ajustement, spécification
 Violation de certaines hypothèses:
 Multicollinéarité
 Hétéroscédasticité et autocorrélation

2
Bibliographie
 B. Crépon et N. Jacquemet (2010), Econométrie: méthode et
applications, Groupe de Boeck s.a.;

 V. Delsart, A. Rys et N. Vaneecloo (2009), Econométrie:


théorie et application sous SAS, Presses Universitaires du
Septentrion

 B. Dormont (2006), Introduction à l’économétrie,


Montchrestien, 2ème édition;

 W. Green (2011), Econométrie, Pearson Education

 J. Wooldridge (2009), Introductory Econometrics. A Modern


Approach, Forth Edition.

3
Introduction
1. Modèle économétrique
2. Données
3. Estimation
4. Régression simple
Introduction
Qu’est-ce que l’économétrie?
Définition:
 « Il s’agit de l’ensemble des méthodes statistiques
et mathématiques appliquées à l’analyse de
données économiques. Son but consiste à fournir
un contenu empirique aux théories économiques en
les vérifiant ou en les réfutant », Maddala (1983)
 L’objectif de l’économétrie: mettre en évidence
empiriquement et quantifier des relations causales
entre phénomènes économiques

5
Introduction
 Le rôle de l’économétrie
 Tester la validité des théories économiques
 Evaluer les paramètres d’intérêt dans les relations
économiques
 Prédiction et anticipation

6
Introduction
 Le modèle économétrique
 Un modèle économétrique est une équation dont le rôle
est « d’expliquer » un phénomène grâce à des variables
que l’on juge déterminantes au premier plan.

 Trois ingrédients:
1) Variables
2) Paramètres
3) Perturbations
7
Introduction
 Le modèle économétrique

1) Variables
 L’analyse économétrique s’intéresse à l’effet d’un ensemble
de variables explicatives – x – sur une ou plusieurs
variables expliquées – y.
 Variable expliquée=variable dépendante=variable endogène
 Variables explicatives=variables indépendantes=variables exogènes
 La relation entre y et les x se fait à travers une fonction f,
dite forme fonctionnelle: = ( )

8
Introduction
 Le modèle économétrique

2) Paramètres
 Ces relations, = ( ), font intervenir certains paramètres
inconnus clefs de l’analyse économique (l’élasticité-prix, la
propension à investir etc.) que l’on va chercher à estimer
 Les relations précédentes s’écrivent ainsi = ( , )
 Le rôle d’économétrie est de produire des connaissances tant
sur la fonction f que sur l’existence concrète et la valeur
empirique de ces paramètres, , à partir de l’observation des
comportements réels fournie par les variables x et y.

9
Introduction
 Le modèle économétrique

2) Paramètres
 Donc, les paramètres inconnus du modèle mesurent l’impact
des variables explicatives sur la variable à expliquer.
 C’est l’économétrie qui va permettre une évaluation de ces
paramètres en utilisant l’information contenue dans toutes les
observations de l’échantillon et donc d’analyser et d’utiliser
les résultats obtenus.

10
Introduction
 Le modèle économétrique

3) Perturbations
 Il est souvent impossible de connaître et d’observer
parfaitement l’ensemble des déterminants d’un phénomène
social. Tout modèle économétrique inclut un terme d’erreur
(perturbation) qui capture les variation de y qui ne peuvent
être expliquées par les variables explicatives x.

11
Introduction
 Le modèle économétrique
 = + + ℎ + + + +

 Variable à expliquer
 - mesure de la fréquence des activités criminelles

 Variables explicatives
 - le salaire qui peut être gagné dans l’emploi légal
 ℎ – le revenu des autres sources
 – nombre des arrestations précédentes
 – nombre de condamnation
 – la durée moyenne du réclusion criminelle après condamnation

 Paramètres inconnus (à estimer)


 , , , , !,

 Perturbation

12
Introduction
 Les données
1. Données en coupe
2. Données temporelles
3. Données de panel
4. Propriétés des données

13
Introduction
 Les données
1. Données en coupe = coupes transversales=coupes
instantanées
 On observe n individus à une seule date

"# − & , '# − = 1, … , 14


15
16
Introduction
 Les données
2. Données temporelles=séries chronologiques=séries
temporelles
 On observe 1 individus pendant T périodes:

"* , '* = 1, … , + 17
18
Introduction
 Les données
3. Données de panel=coupes répétées
 On observe n individus pendant T périodes. Par
exemple, pour T=2:

"#* , '#* = 1, … ; = 1, … , + 19
20
Introduction
 Les données
4. Propriétés des données
 Echantillon et Population
 Pour être utilisables, les données doivent refléter aussi fidèlement
que possible le phénomène étudié. Les données utilisées sont un
échantillon supposé représentatif de la population dont on cherche
à caractériser le comportement.

21
Introduction
 Les données
4. Propriétés des données
 Echantillon et Population
 Pour être utilisables, les données doivent refléter aussi fidèlement
que possible le phénomène étudié. Les données utilisées sont un
échantillon supposé représentatif de la population dont on cherche
à caractériser le comportement.
 Un échantillon aléatoire:
1. Les individus sont tirés aléatoirement indépendamment de
leurs caractéristiques
2. Inclusion d’un individu n’a pas de conséquence sur la
probabilité qu’un autre individu de la population soit inclus
à son tour

Ces deux conditions définissent un échantillon aléatoire, dont les observations


sont i.i.d. (indépendamment et identiquement distribuées) 22
Introduction
 Les données
4. Propriétés des données
 Echantillon et Population
 Un échantillon observé: Un échantillon particulier est une
réalisation d’un échantillon aléatoire. Tout calcul fait sur ces
données constitue également une réalisation d’une statistique
aléatoire. On aurait probablement obtenu des valeurs différentes si
on avait tiré (tout aussi aléatoirement) un autre échantillon.
 Données manquantes
 Problèmes d’erreurs de mesure (écarts entre les niveaux
enregistrés d’une variable et sa valeur réelle)
 Données censurées : les variables ne sont observées qu’en
partie, la période d’observation est plus étroite que la
valeur réelle des variables

Source: B. Crépon et N. Jacquemet (2010), Econométrie: méthode et applications, Groupe de Boeck s.a 23
Introduction
Nom de Note (/20) Echantillons Echantillons aléatoires
l’élève sélectionnés
Meilleurs Faibles EA1 EA2 EA3
Anna 7 7 7 7 7 7
Fabien 11 11 11 11 11 11
Karim 14 14 14 14 14 14
Alcina 12 12 12 12 12 12
Laura 9 9 9 9 9 9

Moyenne 10,6 13,0 8,0 9,0 11,5 11,5


Variances 2,4 1,0 1,0 2,0 2,5 0,5

Tailles des échantillons : N=2

Source: B. Crépon et N. Jacquemet (2010), Econométrie: méthode et applications, Groupe de Boeck s.a

24
Introduction
L’estimation
1. Méthodes d’estimation
2. Qualité d’un estimateur

25
Introduction
L’estimation
L’estimation est la procédure statistique qui permet
d’obtenir une valeur empirique pour les paramètres du
modèle à partir des données disponibles
 Formellement, cette étape consiste à définir une
statistique, c’est-à-dire une fonction des observations y
et x, appelée estimateur.
 Pour un ensemble des données particulier,
l’application de cette fonction i.e. le calcul de la
statistique permet d’obtenir une statistique calculée,
c’est-à-dire la valeur prise par la statistique pour ces
observations. Cette quantité est appelée estimation.

Source: B. Crépon et N. Jacquemet (2010), Econométrie: méthode et applications, Groupe de Boeck s.a
26
Introduction
L’estimation
En résumé, on manipule trois types de paramètres
(pour un modèle = + -):
a) a et b les « vrais » paramètres inconnus que l’on
n’observe jamais, mais qui peuvent être utilisés dans
les calculs théoriques
b) /0 et 12 les estimateurs, qui sont des variables
aléatoires
c) 4 et -2 les estimations des paramètres inconnus, cad
des valeurs numériques particulières associées à
l’échantillon
Dans les cours d’économétrie traditionnels et à l’inverse des cours de probabilités, on fait
rarement la différence des les notations entre les estimations et les estimateurs.

27
Introduction
L’estimation
1. Méthodes d’estimation
 L’activité principale de l’économétrie est de
développer des méthodes permettant de formuler
des estimateurs, appelées méthodes d’estimation.

28
Introduction
L’estimation
1. Méthodes d’estimation
 Solution 1.
a) Imposer les restrictions sur les moments du terme
d’erreur: 5 =5 =0
b) Méthode des Moindres Carrés
Solution 2.
a) Spécifier la loi des observations
b) Méthode du maximum vraisemblance

29
Introduction
L’estimation
2. Qualité d’un estimateur
La contribution majeure de l’économétrie consiste à
proposer des critères permettant de sélectionner les
estimateurs sur la base de leurs propriétés statistiques
 L’une des questions fondamentales à laquelle
l’analyse permet de répondre est celle de la capacité
d’un estimateur à révéler la vraie valeur du
paramètre économique auquel on s’intéresse.
 Puisqu’un estimateur est une variable aléatoire, c’est
sur sa distribution que portent les critères de qualité.

Source: B. Crépon et N. Jacquemet (2010), Econométrie: méthode et applications, Groupe de Boeck s.a
30
Introduction
L’estimation
2. Qualité d’un estimateur
a) L’absence de biais (unbiased)
 L’estimateur concorde en moyenne avec la vraie valeur
du paramètre: 5 /0 =
b) Convergence (consistent)
 L’estimateur se rapproche de la vraie valeur du
paramètre lorsque le nombre d’observations augmente:
78 /0 =
c) Variance minimale (efficace) (best) dans une
classe donnée d’estimateurs

31
Introduction
Régression simple
On dispose de données sur n=100 individus. On
observe une variable y, que l’on va chercher à
expliquer à l’aide d’une autre variable x.

32
Source: cours d’Antoine Terracol pour la première année du Master Economie Théorique et Empirique à Paris 1.
Introduction
 Régression simple
On spécifie le modèle suivant:
# = + # + 9#
Qui correspond à une relation linéaire entre #
et # . Le terme et la constante, et le terme
est le coefficient associé à la variable #

33
Introduction
Régression simple
On cherche à estimer et par 0 et 0 de façon à
obtenir une droite de régression qui ai de “bonnes
propriétés”

34
Source: cours d’Antoine Terracol pour la première année du Master Economie Théorique et Empirique à Paris 1.
Introduction
 Régression simple
 Il est évident que la droite de régression 4# = 0 + 0 # ne peut
pas être un résumé parfait de la relation entre y et x. En particulier,
la prédiction linéaire 4# n’est (presque) jamais égale à la valeur
observée # . On appellera résidu la différence entre les deux: # =
# − 4#

35
Introduction
Un point de vocabulaire:
 Le terme d’erreur (la perturbation) - ici 9# - est
la différence entre la vraie valeur # et la vriae
droite de régression dans la population. On peut
l’intérpréter comme un aléa pur, ou comme l’effet
des déterminants de #
 Le résidu - ici # - est la différence entre la vraie
valeur # et la valeur 4# prédite par notre modèle.
Ce n’est pas une caractéristique de la population

36
Introduction
 Régression simple
 Comment obtenir les valeurs de 0 et de 0 ? Autrement dit,
quel critère faut-il appliquer pour les obtenir?
 Critère retenu: minimisation de la somme des carrés des
résidus (SCR)
A
0 , 0 = min @ #
(I.1)
=> ,=?
#B
= min ∑A#B # − − #
=> ,=?

= min D ,
=> ,=?
37
Introduction
 Régression simple
 Soit 0 et 0 les valeurs de et de qui minimisent la
sommes des carrés des résidus. Ils doivent donc vérifier des
conditions du premier ordre:
ED( , )
=0 (CPO 1)
E
(CPO 2)
ED( , )
=0
E
A
(CPO 1)
−2 @ # − 0 − 0 # =0
#B

0 − 0 (CPO 2)
−2 ∑A#B # #− # =0
38
Introduction
Régression simple

"GH2 ⇒

39
Introduction
 Régression simple
 Donc, les estimateurs des moindres carrés ordinaires des
paramètres et du modèle # = + # + 9# sont
définis par les expressions:

∑A#B # − ̅ # − K
0 =
∑A#B # − ̅

0 = K− 0 ̅
(la droite estimée passe par le point moyen de l’échantillon)

40

Vous aimerez peut-être aussi