Vous êtes sur la page 1sur 36

La régression comme un élément de la modélisation prédictive

Spécification et estimation des modèles économétriques de base


Test d’hypothèse, interprétation des résultats

Cours d’Econométrie
(JB Boyabé)

Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale

Chapitre III
La modélisation économétrique
Année 2021-2022
beamer-icsi-logo

1/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive
Spécification et estimation des modèles économétriques de base
Test d’hypothèse, interprétation des résultats

Plan
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
2/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive
Spécification et estimation des modèles économétriques de base
Test d’hypothèse, interprétation des résultats

Plan
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
2/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive
Spécification et estimation des modèles économétriques de base
Test d’hypothèse, interprétation des résultats

Plan
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
2/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Etymologie du terme “régression”
Spécification et estimation des modèles économétriques de base L’économétrie n’est qu’une méthode d’analyse de données
Test d’hypothèse, interprétation des résultats L’économétrie est une modélisation prédictive

Outline
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
3/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Etymologie du terme “régression”
Spécification et estimation des modèles économétriques de base L’économétrie n’est qu’une méthode d’analyse de données
Test d’hypothèse, interprétation des résultats L’économétrie est une modélisation prédictive

Définition et exemple
La régression est un terme qui désigne une technique, dans
laquelle on prédit une variable réponse, appelé “dépendante”
ou “expliquée” à partir de plusieurs “prédicteurs”, nommées
“indépendantes” ou “explicatives”.
De façon générale, l’analyse de la régression peut être utilisée
pour identifier les variables explicatives qui sont reliées à la
variable réponse, pour décrire la forme de la relation qui est en
jeu, et pour fournir une équation destinée à prédire la variable
réponse à partir des variables explicatives
Exemple
si on cherche à prédire le comportement d’une variable numérique
telle que le CA, le profit, les coûts, le volume des ventes ou encore
le prix, il est recommandé de recourir à la technique de l’analyse debeamer-icsi-logo
la régression
4/ 34
.
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale
Cours d’Econométrie (JB Boyabé)

.
.
Notes
Wikipedia :
“Le terme « régression » a été introduit par Francis Galton à la
suite d’une étude sur la taille des descendants de personnes de
grande taille, qui diminue de générations en générations vers une
taille moyenne (donc leur taille régresse).
En apprentissage automatique, on distingue les problèmes de
régression des problèmes de classification. Ainsi, on considère que
les problèmes de prédiction d’une variable quantitative sont des
problèmes de régression tandis que les problèmes de prédiction
d’une variable qualitative sont des problèmes de classification.
Certaines méthodes, comme la régression logistique, sont à la fois
des méthodes de régression au sens où il s’agit de prédire la
probabilité d’appartenir à chacune des classes et des méthodes de
classification”
La régression comme un élément de la modélisation prédictive Etymologie du terme “régression”
Spécification et estimation des modèles économétriques de base L’économétrie n’est qu’une méthode d’analyse de données
Test d’hypothèse, interprétation des résultats L’économétrie est une modélisation prédictive

Outline
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
5/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Etymologie du terme “régression”
Spécification et estimation des modèles économétriques de base L’économétrie n’est qu’une méthode d’analyse de données
Test d’hypothèse, interprétation des résultats L’économétrie est une modélisation prédictive

Modélisation à partir de données


La technique de modélisation dépend de l’objectif recherché
Le paradigme du “data science” recense 5 objectifs majeurs
Que recherche le data scientist ?, 5 objectifs possibles :
1 La “caractérisation” : l’objectif est de décrire les données (rapporter des
informations) statistiquement et/ou graphiquement
2 La “recherche des relations ou des corrélations” : l’objectif est de mettre
en exergue des potentiels causes des effets observés dans les données
3 Le “clustering” : l’objectif est de regrouper des individus dans les données
selon une certaine similitude de leurs caractères ou comportements
4 Le “classement” : l’objectif est de ranger les individus selon leurs
caractères dans un ordre précis d’un item, ou des préférences
5 Le “scoring” : l’objectif est d’affecter des “notes” aux individus dans les
données, en croisant les caractères
6 La “classification” : l’objectif est de décider si quelque chose ou quelqu’un
beamer-icsi-logo
appartient à telle catégorie ou à une telle autre
6/ 34
.
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

.
.
Notes
.
.
.

........
La régression comme un élément de la modélisation prédictive Etymologie du terme “régression”
Spécification et estimation des modèles économétriques de base L’économétrie n’est qu’une méthode d’analyse de données
Test d’hypothèse, interprétation des résultats L’économétrie est une modélisation prédictive

Outline
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
7/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Etymologie du terme “régression”
Spécification et estimation des modèles économétriques de base L’économétrie n’est qu’une méthode d’analyse de données
Test d’hypothèse, interprétation des résultats L’économétrie est une modélisation prédictive

La prédiction par un exemple


Il existe une variété de modèles d’analyses prédictives
Linéaire simple Prédiction d’une réponse quantitative à partir d’une
autre variable quantitative
.
Linéaire multiple Prédiction d’une réponse quantitative à partir de
plusieurs variables quantitatives
.
Multivariée Prédiction de plusieurs variables quantitatives à partir de
plusieurs autres variables quantitatives
.
Logistique Prédiction d’une variable qualitative à partir de plusieurs
variables quantitatives ou qualitatives
. beamer-icsi-logo

Série temporelle Modélisation de données qui évoluent de façon


8/ 34
chronologiques
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

.
Notes Non paramétrique Prédiction d’une réponse quantitative, à partir de
variables quantitatives où la forme de la relation est dictée
par les données, plutôt que définie à priori
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Outline
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
9/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Le passage du modèle économique au modèle économétrique


on appelle Y = β1 X + β0 le modèle économique,
on appelle Y = β1 X + β0 + ε le modèle économétrique, où β0 et β1
sont des “paramètres” à estimer, ε représente “le terme de l’erreur”,
l’aléa qui explique la variabilité des donées.
Enfin la version estimée du modèle précédant sera notée
Ŷ = βˆ1 X + βˆ0 + e, où βˆ1 est l’estimateur de β1 , puis βˆ0 l’estimateur
de β0 et enfin e l’estimateur de ε
Considérons la série statistique précédente, retraçant les dépenses
et le revenu des ménages d’une économie :
Rev 80 100 120 140 160 180 200 220 240 260
Dep 55 88 90 80 118 120 145 135 145 175
i 1 2 3 4 5 6 7 8 9 10
.
.
. beamer-icsi-logo

.
. 10/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)
.

Notes

Pourquoi faire apparaître le ε ?


Le terme de l’erreur ε représente la différence entre les valeurs
“observées” et les valeurs “estimées”
ε se justifient par le fait qu’il existe des explications de la
variations de Y autres que la seule X : on peut identifier
d’autres sources de variations des dépenses que le seul revenu
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Outline
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
11/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Les estimateurs βˆ1 et βˆ0 du modèle linéaire simple


La “MMCO” suggère que βˆ1 , soit la valeur qui minimise la somme
des carrés des résidus ( soit Min S(βk ) = ∑ et2 ), ce qui donne
1 L’estimateur de β1 est βb1 = ∑(x∑i (−x )(yi −y )
xi −x )2
. Sachant que l’on connaît
ȳ et x̄ on trouve βb0 , à partir de y = βb0 + βb1 x
2 Les valeurs estimées de la variable dépendante sont ybi = βb0 + βb1 xi
3 Les résidus ei sont calculés à partir de ei = yi − ybi
4 Etant donnée que les estimateurs βˆ1 et βˆ2 sont des variables
aléatoires, ils une une variance :
1 La variance de β b1 s’écrit : σ̂ 2 = σ̂ε2
2
βˆ1 ∑(xhi −x ) i
2 2 1 x 2
2 La variance de β0 s’écrit : σ̂ où n
ˆ = σ̂ε n + (
b
β0 )2 ∑ xi −x
représente le nombre d’observations dans les données
beamer-icsi-logo
3 Les résidus ont également une variance et s’écrivent :

.
12/ 34
.
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)
.
∑ ei2
σ̂ε2 = n−k− 1 où k est le nombre de variables explicatives (ici
Notes 2 ∑ ei2
k = 1 donc σ̂ε = n−2 ) et on appellera ∑ ei2 “la somme des
carrés des résidus”)

Pourquoi βˆ1 et βˆ2 sont des variables aléatoires ?


Etant donnée que l’échantillon est tiré au hasard, les
estimateurs β1 et β2 qui proviennent de cet échantillon sont
eux-mêmes des variables aléatoires.
Autrement dit, les valeurs de ces estimateurs fluctuent avec
l’échantillon.
A noter également qu’ils ont de très faibles chances de
coïncider avec les valeurs vraies des paramètres de la
population β1 et β0
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

On appellera “résidus” les valeurs ei qui représentent les écarts


entre la droite de régression et les différents points qui représentent
les (nuages) observations
Il y aura 10 résidus : e1 , e2 . . . e10 (à représenter sur le graphique)

Explication : le résidu est l’estimateur du “terme de l’erreur” qui


s’explique de la façon suivante
Dans plupart du temps, au-delà de l’influence qu’exerce X sur Y il y a toujours
d’autres sources de variation de Y . Cela peut être des variables omises, des
erreurs de mesure, une forme fonctionnelle incorrecte, de sorte qu’il soit
nécessaire d’ajouter une terme de l’erreur dit stochastique : Y = β0 + β1 X + ε
où ε représente le “terme de l’erreur”.
Y et X représente donc les « connaissances », alors que ε représente «
l’ignorance ».
En considérant que le modèle s’applique à n observations statistiques on réécrit
beamer-icsi-logo
le modèle Yi = β 0 + β1 Xi + εi avec i = 1, 2 . . . , n
13/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Analyse de la variance (ANOVA)


Décomposition de la variance du modèle simple
On sait désormais que ŷ = βˆ x + e est l’estimation de
y = βx +ε
On sait aussi que ei = yi − yˆi = yi − xi βˆ
On appellera SCT la Somme des Carrés des écarts Totaux,
SCE la Somme des Carrés des écarts Expliqués, SCR la
Somme des Carrés des Résidus et on note :
SCT = ∑(yi − ȳ )2 variance des valeurs théoriques de y autour
de la moyenne
SCE = ∑(ŷi − y )2 variance des valeurs estimées de y par
rapport à la moyenne
SCR = ∑(yi − ŷi )2 = ∑ ei2 variance des résidus
On démontre alors que : SCT = SCE + SCR
beamer-icsi-logo

Application : calculons SCT, SCE et SCR de l’exercice précédent 14/ 34


2 Côte d’Opale
Licence 3 Eco/Gestion - Université du Littoral
Cours d’Econométrie (JB Boyabé)
SCT
 = ∑ (yi − y ) = 
2 2 2
(12 − 26) + (13 − 26) + . . . + (48 − 26) = 1250
Notes
SCR = ∑ ei2 = ∑ (yi − ybi )2 = 350
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

On appelle R 2 ou coefficient de détermination


Etant donné que tous les termes sont des sommes des carrés (SCT,
SCR et SCE), on peut supposer légitimement que SCT 6= 0. On
montre que : 0 6 SCR/SCT 6 1
Cela permet de définir une statistique noté R 2 encore appelé
« coefficient de détermination » qui permet de mesurer la « qualité
» du modèle

SCR
R 2 = 1 − SCT
e2
= 1 − ∑(y∑ −y
i
)2
i

et puisque 0 6 SCR/SCT 6 1 alors 0 6 R 2 6 1.


On voit alors que pour un modèle parfait, où les données observées
correspondent parfaitement au modèle, alors les résidus sont tous
nuls, ce qui correspond au cas où, dans R 2 , SCR = 0 et R 2 = 1. beamer-icsi-logo
.
15/ 34
.
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)
.
Application
Notes
SCR 350
R 2 = 1 − SCT = 1 − 1250 = 0, 72 = 72%
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Application1
On va estimer la relation yi = β0 + β1 xi + εi sur les données précédentes
∑(xi −x)(yi −y )
Voici les calculs : y = 26 et x = 4, on cherche βb1 = ∑(xi −x)2
et βb0 = y − βb1 x
i yi xi yi − y xi − x (xi − x)(yi − y ) (xi − x)2 ŷi ei
1 12 0 -14 -4 56 16 14 -2
2 13 3 -13 -1 13 1 23 -10
3 15 1 -11 -3 33 9 17 -2
4 19 0 -7 -4 28 16 14 5
5 26 6 0 2 0 4 32 -6
6 27 5 1 1 1 1 29 -2
7 29 3 3 -1 -3 1 23 6
8 31 4 5 0 0 0 26 5
9 40 10 14 6 84 36 44 -4
10 48 8 22 4 88 16 38 10 beamer-icsi-logo

Totaux 300 100 0


16/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)
.
On a ainsi βˆ1 = ∑(x∑i −x)(y i −y )
(xi −x)2
= 300
100 et
Notes βˆ = ȳ − βˆ x̄ = 26 − 4 × 3 = 14
0 1

D’où notre équation estimée est : yi = 14 + 3xi

Les ŷi sont calculées à partir de ybi = βb0 + βb1 xi


ŷ1 = βb1 x1 + βb0 = 3 × 0 + 14 = 14
ŷ2 = βb1 x2 + βb0 = 3 × 3 + 14 = 23
..
.
ŷ10 = βb1 x10 + βb0 = 3 × 8 + 14 = 38
Les ei sont calculés à partir de : ei = yi − ybi
e1 = 12 − 14 = −2
e2 = 13 − 23 = −10
..
.
e10 = 48 − 38 = 10
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Généralisation du modèle à k variables explicatives,


Yi = β0 + β1 X1i + . . . . + βk Xki + εi
Exemple, k = 2
i yi x1,i x2,i
1 12 7 48
2 21 9 40
3 24 11 18
4 24 12 28
5 13 7 40 Le modèle sous forme matricielle s’écrit
6 17 9 32
7 21 12 31
8 26 14 24
9 31 19 22
10 30 21 25 beamer-icsi-logo

Y = X β + ε, soit pour n = 10 observations et k = 2


17/ 34
.
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)
.
.
Notes .
variables explicatives
     
12 1 7 48 ε1

 21 


 1 9 40  
 ε2




 24 


 1 11 18  
 ε3



 24   1 12 28      ε4 
   β 0
 
 13   1 7 40   ; β =  β1  ; ε =  ε5
 
Y =  ;X =  
 17   1 9 32   ε6 
    β 2
 

 21 


 1 12 31  
 ε7




 26 


 1 14 24  
 ε8



 31   1 19 22   ε9 
30 1 21 25 ε10
.
avec
Y de dimension n × 1,
X de dimension n × (k + 1),
β de dimension (k + 1) × 1 et ε de dimension n × 1.
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

La MMCO
La MMCO comprte plusieurs étapes et permettent de calculer
mathématiquement l’estimateur des βi :
La Méthode des Moindres Carrées Ordinaires suggère de
sélectionner des estimateurs de sorte à « minimiser » la somme des
carrées des erreurs (ei )observées.
Si on appelle S cette somme des résidus élevé au carré, on a
S = S(β1 , β2 , . . . ., βk ) = ∑ ei2 telle que Min(S) nous donne la
solution βˆ = (X 0 X )−1 X 0 Y

D’où la formule de l’estimateur : βˆ = (X 0 X )−1 X 0 Y


où X 0 est la matrice transposée de X
(X 0 X )−1 est la matrice inversé de (X 0 X )
Pour appliquer βˆ = (X 0 X )−1 X 0 Y , les étapes du calcul sont les suivantes :
' $
1 On transpose la matrice X pour avoir X 0 pour pouvoir calculer X 0 X beamer-icsi-logo

2 On inverse X 0 X pour avoir (X 0 X )−1


18/ 34
3 On calcule X Y 0
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)
4 On fait le produit (X 0 X )−1 et X 0 Y pour avoir βˆ = (X 0 X )−1 X 0 Y
!
ˆ
Notes 5 Le vecteur qui en résulte est βˆ =
β1
βˆ2
& %
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Exemple : pour calculer les coefficients estimés à la main

Considérons les données en exemple précédents :

i yi x1,i x2,i 2
∑(yi −ȳ )
ȳ = 21, 9 ; x¯1 = 12, 1 ; x̄2 = 16, 8 ; σy2 = n = 376, 9 ;
1 12 7 48
σŷ2 = 38, 38127 ; σε2 = 4, 50
2 21 9 40
On a besoin
 de :   
3 24 11 18 10 121 308 219
4 24 12 28
X 0 X =  121 1667 3449  ; X 0 Y =  2904 
308
 3449 10282 6291

5 13 7 40 6, 2246 −0, 2158 −0, 1140
6 17 9 32 (X 0 X )−1 =  −0, 2158 0, 0094 0, 00329 
−0, 1140 0, 0032 0, 0024
7 21 12 31 
1) Estimez les coefficients du modèle βˆ = [X 0 X ]−1 X 0 Y
8 26 14 24

9 31 19 22

10 30 21 25
beamer-icsi-logo

19/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
Application SPSS

Considérons les données en exemple précédents :


i yi x1,i x2,i 1) Saisir les données dans RStudio
1 12 7 48 2) Estimer les coefficients du modèle par la
2 21 9 40 MMCO (commande lm) et interprétez
3 24 11 18 3) Affichez les résidus et montrez que sa
4 24 12 28 moyenne est égale à zéro
5 13 7 40 4) Affichez la variance des résidus et les
6 17 9 32 variances des estimateurs
7 21 12 31 5) Testez la significativité des coefficients du
8 26 14 24 modèle au seuil de 5%.
9 31 19 22 6) Calculer le coefficient de détermination R 2 et
10 30 21 25 interprétez.

20/ 34

Notes
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Outline
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
21/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Les hypothèses faites sur le modèle Y = β0 + β1 X


Une fois le modèle fonctionnel spécifié, les hypothèses
additionnelles suivantes doivent être faites :
1 E (ε ) = 0; i = 1, . . . ., n
i
2 Var(ε ) = σ 2 ; i = 1, . . . ., n
i
3 Cov(ε , ε ) = 0; i = 1, . . . ., n pour au moins un s 6= i.
i s
4 normalité : les erreurs sont distribuées suivant une loi normale

Remarques :
- Dans la seconde hypothèse, la constante de la variance
Var(εi ) = σ 2 est appelé homoscédasticité, et donc si Var(εi ) = σi2
on parle d’hétéroschédasticité.
- La troisième hypothèse implique que la corrélation entre deux
résidus voisins doit être nulle (voir test de Durbion-Watson)
.
beamer-icsi-logo
.
. 22/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Du modèle économique au modèle économétrique
Spécification et estimation des modèles économétriques de base L’estimation des coefficients par la MMCO
Test d’hypothèse, interprétation des résultats Les hypothèses à faire

Hypothèses faites sur le modèle multiple


Les hypothèses additionnelles
(H7) exogénéité : les variables X1 , X2 , X3 , . . . Xk sont
indépendantes du terme d’erreurs
(H8) non multicolinéarité : les variables X1 , X2 , X3 , . . . Xk
sont linéairement indépendantes, ce qui assure l’unicité de
l’estimateur MCO. En cas de presque linéarité, les estimations
obtenues seront instables.
.
.
.
.
2
Le R 2 − ajust é noté R
Le coef de détermination R 2 augmente automatiquement au fur et
à mesure que l’on augmente le nombre de variables explicatives beamer-icsi-logo
(régresseurs). Ce phénomène est un problème en soit car s’il suffit
d’augmenter les régresseurs pour améliorer la qualité du modèle, 23/ 34
Licencecela veut dire
3 Eco/Gestion que dumême
- Université Littoral si les
Côte variables
d’Opale additionnelles
Cours d’Econométrie ne sont pas
(JB Boyabé)

significatives ou pertinentes, la qualité du modèle s’améliore. Pour


Notes corriger ce problème, on calcule le R 2 − ajust é par la formule
2  n−1
R = 1 − 1 − R 2 n−k−1
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Outline
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
24/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Fondements du test d’hypothèse

Le test d’hypothèse est le calcul de la probabilité que la relation


obtenue sur l’échantillon soit un efet de hasard, et donc que dans la
population la relation est nulle.
Si cette probabilité calculée est suffisamment faible, on peut exclure
l’effet de l’aléa et conclure à l’existence d’un effet réel dans la
population également. Le principe du test est alors le suivant :
On note H0 l’hypothèse (nulle) : c’est un effet de hasard
On note H1 l’hypothèse (alternative) : ce n’est pas un effet de
hasard

beamer-icsi-logo

25/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Test de nullité sur les coefficients

But du test de nullité


On cherche à savoir si les coefficients de la population ne seraient pas
non nuls, autrement dit, si le résultat obtenu sur l’échantillon n’est pas
que “statistique”.
On écrit :
H0 : βj = 0
H1 : βj 6= 0

si P − value < 5% (marge d’erreur acceptable) alors H0 est rejetée


au bénéfice de l’hypothèse alternative H1 : β1 est significativement
différent de 0
beamer-icsi-logo

26/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Outline
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
27/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
Test d’autocorrélation des résidus (ei = ρei−1 + εi )
L’autocorrélation (ou l’autocovariance) d’une série fait référence au
fait que dans une série (temporelle en général), la mesure d’un
phénomène à un instant t peut être corrélée aux mesures
précédentes (au temps t − 1,t − 2, t − 3, etc.) ou aux mesures
suivantes (à t + 1, t + 2, t + 3, ...). Une série autocorrélée est
ainsi corrélée à elle-même, avec un décalage (lag) donné.

Test de Durbin Watson


On définit l’autocorrélation d’ordre p comme la relation
xt = ρ1 xt−1 + ρ2 xt−2 + . . . + ρp xt−p + µt
Dans la procédure de Durbin Watson l’autocorrélation des résidus
est testée à l’ordre 1, soit : ei = ρei−1 + εi pour i = 1 . . . n. Dès lors
la procédure est la suivante :
Le test d’hypothèse est :
H0 : ρ = 0
H1 : ρ > 1
∑t=n
t=2 (et −et−1 )
2
Durbin Watson : DW = d = ∑t=n 2 =
t=1 et 28/ 34
(−10−2)2 +(−2−(−10))2 +...(10−(−4))2
350 = 1, 874286
Notes Conclusion : absence d’autocorrélation entre les résidus
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Test de Fisher ou test de significativité globale


Le test de significativité globale ne concerne que le modèle à
plusieurs variables explicatives
L’hypothèse nulle correspond à la situation où aucune des
exogènes n’apporte de l’information utile dans l’explication de
y c’est à dire le modèle ne sert à rien (tous les coefficients
sont-ils nuls ?).
Le
( test s’écrit, pour k variables explicatives :
H0 : β1 = β2 = . . . = βk = 0
H1 : ∃j tel que βj = 0

si P − value < 5% (marge d’erreur acceptable) alors H0 est rejetée


au bénéfice de l’hypothèse alternative H1 : β1 est globalement
significatif : il existe au moins un β 6= 0
beamer-icsi-logo
.
29/ 34
Possibilité 2 : qq-plot des résidus
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)
Si la distribution d’une série est N (0, 1), on la compare graphiquement
avec les quantiles de la distribution normale : Si ces points se trouvent
Notes alignés le long d’une droite, alors on conclue que les données en question
sont approximativement de distribution normale.
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Outline
1 La régression comme un élément de la modélisation prédictive
Etymologie du terme “régression”
L’économétrie n’est qu’une méthode d’analyse de données
L’économétrie est une modélisation prédictive
2 Spécification et estimation des modèles économétriques de base
Du modèle économique au modèle économétrique
L’estimation des coefficients par la MMCO
L’estimateur du modèle linéaire à une seule variable explicative
L’estimateur du modèle linéaire multiple
Les hypothèses à faire
3 Test d’hypothèse, interprétation des résultats
Tests d’hypothèse sur les coefficients estimés
Quelques autres principaux tests à faire
beamer-icsi-logo
Interprétation des résultats
30/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Interprétation des résultats selon le modèle

Comment interpréter les coefficients d’un modèle, selon que la variable est en
log ou en niveau, cas d’une seule variable explicative x. Quatre spécifications
sont envisageables :
1 Modèle où y est en niveau et x en niveau, soit y = β0 + β1 x + ε : ici une
augmentation d’une unité de x augmente y de β1 unités.
2 Modèle où y est en niveau et x en logarithme, soit y = β0 + β1 log(x) + ε :
ici une augmentation de 1% de x augmente y de β1 /100 unités.
3 Modèle où y est en logarithme et x en niveau, soit log(y ) = β0 + β1 x + ε :
ici une augmentation d’une unité de x augmente y de (β1 × 100) unités,
β1 mesure dans ce cas précis la “sémi-élasticité” de y par rapport à x
4 Modèle où y est en logarithme et x en logarithme, soit
log(y ) = β0 + β1 log(x) + ε : ici une augmentation d’une 1% de x
augmente y de β1 % unités. Cette interprétation correspond à des
coefficients qui sont des élasticités. La fonction de base est en l’occurence
de type Cobb-Douglas beamer-icsi-logo

31/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Le tableau suivant résume les différents modèles


(Wooldridge, 2009)
Type de modèle Expliquée Explicative Interprétation
y = β0 + β1 x + ε y x 4y = β1 4x
 
β1
y = β0 + β1 log(x) + ε y log (x) 4y = 100 %4x
log(y ) = β0 + β1 x + ε log (y ) x %4y = (100β1 ) 4x
log(y ) = β0 + β1 log(x) + ε log (y ) log (x) %4y = β1 %4x

Exemple

y = 4 + 0, 5x Une hausse de 10 unités de x entraîne une hausse de 5 unités de y


une hausse de 10% de x entraîne une hausse de 5% de y
y = 4 − 300log(x) Une hausse de 1% de x entraîne une baisse de 3% de y
log(y ) = 4 + 0, 05x Une hausse de 1% de x entraîne une hausse de 5% de y
log(y ) = 4 − 2log(x) Une hausse de 1% de x entraîne une baisse de 2% de y beamer-icsi-logo

(en terme d’élasticité)


. 32/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)
.
Entraînez-vous !
Notes Interprétez les modèles estimés suivants (prenez des variations de 2, 5 10
unités ; 10%, 15% et 50% etc), :
1 Risque = 25 − 0, 5Revenu + 1, 5Age
2 Prix = 7, 5435 − 1, 9 × Age
3 Rendement = 9 + 0, 012Pret − 0, 05Depots + 0, 005Production
4 Log (CA) = 2Log (Prix) − 2, 5Log (Frais) + 0, 75Publicite
5 PIB = 500 + 0, 8Log (Cons) + 1, 2Inv + 0, 09Log (Dep) − 1, 5Import
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Application (Travail à rendre)

Exercice
Soient les données du cours sur la section modèle multivarié :
1 Apllication de la régression sous SPSS : faites la régression de y en
fonction de x1 et x2 (supposons y= CA, x1=Prix et x2=Pub)
2 Tests d’hypothèse sur les coefficients
3 Commentaire des coefficients, du R 2 , du Fisher, du test de
normalité des aléas
4 Les enseignements du modèle

beamer-icsi-logo

33/ 34
Licence 3 Eco/Gestion - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

Notes
La régression comme un élément de la modélisation prédictive Tests d’hypothèse sur les coefficients estimés
Spécification et estimation des modèles économétriques de base Quelques autres principaux tests à faire
Test d’hypothèse, interprétation des résultats Interprétation des résultats

Travail à faire et à rendre


TP à rendre
Soit le tableau de données DirigeantsUS. Sachant que ces données
portent sur le salaire des dirigeants d’Entreprise (salary), leurs primes
(totcomp), leurs expérienses (tenure), leurs âges (age), les profits réalisés
par leurs entreprises (profit) et les actifs de leurs entreprises (assets) :
1 Faites les statistiques descriptives des varibales et commentez
2 Générez des graphiques : boxplots, histogrammes, densités et
quelques scatterplots et commentez
3 Transformez les variables “salary”, “tenure” et “age” en variables
qualitatives (créez des catégories) et effectuez quelques tableaux
croisés puis commenter
4 Proposez une étude économétrique :
1 Choix d’une variable à expliquer et choix des variables

explicatives (régresseurs) beamer-icsi-logo


2 Apllication de la régression sous SPSS

. 34/ 34
Licence 3 Eco/Gestion. - Université du Littoral Côte d’Opale Cours d’Econométrie (JB Boyabé)

3 Tests d’hypothèse sur les coefficients


2
4 Commentaire des coefficients, du R , du Fisher, du test de
Notes
normalité des aléas
5 Les enseignements du modèle

Vous aimerez peut-être aussi