Econometrie Exercices Hhkat Ok2 PDF

UNIVERSITE DE LUBUMBASHI
--------------------------------------------------
FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION
-------------------------------------------------------------
Licence 3 Economie et Gestion (L3EG)
Rédaction rédigée sous la supervision du Professeur

KASONGO ILUNGA Daniel
Avec la collaboration bayésienne du Dr. Marius C. O.

AMBA, du chef de travaux MUYEMBE SABULONI Jeef
et des collègues assistantes ; MWIRUKA IGERHA
Divine et MWANALUMA NGENDA Angel.
Introduction à l’économétrie
Théories et recueil d’exercices résolus
Héritier HESHEMU KATEBULA

Assistant premier mandat /FASEG UNILU
M2 Sc Economie mathématique, statistique et économétrie
Copyright © heritierkatebula@gmail.com-Mars,2024
i
Introduction à l’économétrie
Théories et recueil d’exercices résolus
Héritier HESHEMU KATEBULA

Copyright © heritierkatebula@gmail.com-Avril,2024
ii
iii
« Les problèmes que nous avons à résoudre ne peuvent pas l’être aussi longtemps
qu’ils restent au même niveau de langage qui est celui dans lequel ils ont été
posés » (Albert Einstein)
« Je sais pourquoi tant de gens aiment couper du bois. C'est une activité où l'on
voit tout de suite le résultat. » (Albert Einstein)
« Il est à peu près impossible de faire de la recherche en sciences économiques

sans se trouver devant la nécessité de lire ou de réaliser des travaux
d’économétrie à un moment ou un autre » (Fodiye B.D., p.3).
iv
Plan sommaire
Avant-propos
1. Qu’est-ce que l’économétrie

2. Etude de corrélation
3. Régression linéaire simple
4. Régression linéaire multiple
5. Relâchement des hypothèses
6. Equations simultanées
7. Séries temporelles
8. Séries de Panel
9. Travaux pratiques (données de la Rd Congo, de l’Afrique et de l’OCDE)
v
Avant-propos
Cette synthèse sur l’introduction à l’économétrie et exercices résolus constituent un

répertoire essentiel et important pour le besoin réel et urgent auprès des étudiants en
sciences économiques du nouveau système en vigueur en République démocratique du
Congo qui ambitionnent disposer d’un recueil qui accompagne le cours magistral assuré
par le professeur d’une part et d’autre part l’absence, pendant très longtemps, d’un
recueil d’applications approprié et capable de relayer la partie magistrale du cours
d’économétrie tel que dispensé à la Faculté des Sciences Economiques et gestion
(FASEG, système LMD).
Plus simple ; plus pratique, plus agréable aux yeux ; mieux adapté- du moins ont voudrait
le croire –aux gouts avec pour objectifs phares hormis ceux précités, d’aider à préparer
les épreuves et de fournir les outils d’analyse nécessaire pour l’analyse économétrique.
Ces outils nécessaires pour mener une étude économique rigoureuse.
À l'issue de la lecture de ce recueil, l'étudiant devra comprendre l'utilité de l'économétrie

dans des problèmes concrets. De plus, il devra maitriser l’implémentation d’une analyse
économétrique à l’aide des logiciels statistiques (STATA , Eviews et SPSS).
Il sied de signaler que ce recueil ne remplace en aucun cas, le cours magistral de

l’enseignant car l’assistance au cours s’avère de toute façon indispensable. Les étudiants
doivent, à tout moment, se rappeler que tout sujet traité aux cours (séances théoriques
et pratiques) constitue un événement élémentaire équiprobable du domaine de
définition de la matière de l’examen.
Les lecteurs trouveront également des exercices se rapportant aux examens et
interrogations de différentes universités, notamment l’université de Lubumbashi
[UNILU], la Dschang School of Economics [UDsC], l’université nationale de la Zambie
[UNAZA], L’université de Nairobi [UN-KENYA], l’université de Yaoundé II [UY 2- SOA],
l’Université Abdelmalek Essaâdi à Tétouan, l’Université Protestante au Congo [UPC],
l’Université de Kinshasa [UNIKIN], l’Université William-Booth [UWB], l’Université Libre
de Kinshasa [ULK], l’Université Cheik Anta DIOP [UCAD], l’Université de Johannesburg
,l’Université de Sorbonne…
In fine, en mettant à la disposition du public ce recueil d’exercices, je formule le vœu que
ce recueil suscite, parmi mes étudiants et mes collègues de la FASEG, de nombreux esprits
critiques qui pourront nous proposer mieux.
HESHEMU KATEBULA Héritier
vi
Remerciement
Le défi n’était pas moins grand pour moi de réaliser ce recueil d’économétrie qui
certainement va combler un vide et relancer le débat sur la manière de présenter les
travaux pratiques par les collègues assistants dans notre université.
A présent, rendons à César, ce qui est à César ! Je tiens à remercier le Professeur Daniel
KASONGO pour avoir accepté de superviser cette rédaction, au doyen de la FASEG le
professeur Kalaba Bin Sankwe, pour les orientations et Jean-Paul Tsasa pour l’idéal qu’il ne
cesse de me transmettre.
Mes sincères remerciements vont aux Professeurs José Mwania Wa Kosia et Pascal Sem
Mbimbi que j’assiste respectivement au cours d’Econométrie, de Statistique inférentielle,
microéconomie, macroéconomie et de méthodologie de recherche. Leurs concours, par
effet de diffusion et à travers les multiples discussions engagées avec eux, m’ont permis
de voir au-delà de l’horizon. De même, je ne saurai passer sous silence les multiples
discussions engagées avec mes ainés scientifiques, particulièrement aux chefs de travaux :
Jeef Muyembe Sabuloni, Alexandre Nshue Mbo Mokime et Labi Bokechu Mpiana. Et aussi
vifs remerciements aux assistants et chefs de travaux : Claude Kabemba, Patient Mutunda,
Elie Etshiloni, Divine MWIRUKA, Angel Mwanaluma et Olivier Kinama.
Je remercie aussi mes étudiants de licence 3 Economie et gestion promotion 2023-2024,

pour avoir beaucoup exigé et attendu de moi ; ils m’ont contraint à plus de sérieux dans le
travail, et je leur en suis reconnaissant.
Bien entendu, selon la formule consacrée, ce support n’engage que son auteur. Pour toutes
incompréhensions, imperfections ou erreurs éventuelles, Merci de les signaler sur le forum
de la faculté de sciences économiques de l'université de Lubumbashi, à cette adresse :
http://www.forum-fasegunilu.fr (Connexion à partir de http://gide-éco.fr/forum), à défaut
de ne pouvoir me contacter directement...Toute remarque pertinente pouvant en
améliorer le contenu sera la bienvenue.
vii
viii
Chapitre 1 : Qu’est-ce que l’économétrie
Le présent chapitre chapitre porte sur une brève introduction (les généralités) et débute
par la présentation de l’origine en 1, de la définition en 2 et de l’approche méthodologique
de l’analyse économétrique en 3. Ensuite, un accent est mis sur le rôle de l’économétrie
après avoir mis en lumière la typologie des données qui peuvent faire l’objet d’une étude
économétrique.
1.1. Origine de l’économétrie
Le 29 décembre 1930, l’économie va prendre un nouvel essor avec Jan TINBERGEN et Ragnar
FRISCH, Charles ROOS et Irving FISHER. Ragnard FRISCH est à l’origine de la Société d’économétrie.
Le premier colloque se fait en 1931 à Lausanne. A la même époque, Alfred COWLES, conseiller
financier et spécialiste en prévision boursière, rentre en contact avec la Société d’économétrie et p
L’institutionnalisation de l’Econométrie en tant que discipline des sciences économiques s’est

réalisée exactement le 29 décembre 1930 à l’occasion de la création à Cleveland, aux Etats-Unis, par
16 économistes1 dont Ragnar Frisch2 , Charles ROOS, Jan TINBERGEN et Irving Fisher sont les plus
cités, de l’Econometric Society [la Société d’Econométrie] avec comme devise : ’’ pour l’avancement
de la théorie économique dans ses relations avec la statistique et les mathématiques’’.
A la même époque, Alfred COWLES, conseiller financier et spécialiste en prévision boursière, rentre
en contact avec la Société d’économétrie et propose deux projets :
i Financer la publication d’une revue d’économétrie

ii Financer une organisation de recherche sous son patronat
1
R. Frisch, I. Fisher, Hotelling, K. Menger , F. Mills, Ogburn, Ore, Roos, Rorty, J. A. Schumpeter, H. Schultz,
Shewart, Snyder , Wedervang, Wiener, Wilson. 4 Premier lauréat du prix de la Banque de Suède – communément
appelé prix Nobel en mémoire de son fondateur Alfred Nobel – d’économie en 1969 avec Jan Tinbergen.
2
INTRODUCTION A L’ECONOMETRIE / L3 ECONOMIE UNILU 2024 HESHEMU KATEBULA Héritier p 9

Dans les années 1930, la revue Econometrica est créée, le premier numéro sort en Janvier 1933, son
rédacteur de l’époque étant Ragnar FRISCH. L’organisme de recherche, la COWLES Commission,
voit aussi le jour à cette époque. Elle s’installe à Chicago et s’intéresse à la mesure directe des
phénomènes laissant de côté l’inférence sur les mesures statistiques et prend par la suite de
nouvelles mesures d’orientation (obtient des subventions de la part des universités).
Apparait à ce moment-là les premiers modèles à équations simultanées, du fait de l’apparition dans
les équations de termes « aléatoires » qui reflètent des causes multiples. Le premier modèle macro-
économétrique apparait à son tour et incorpore des principes probabilistes et celui de Lawrence
KLEIN dans les années 1950-1960. Cette époque voit le développement des modèles à retard
échelonné de KOYCK, en 1954. Parallèlement commence à se développer des méthodes de
prévisions à court terme, où l’on retrouve les modèles de BOX et JENKINS. On estime alors des
Processus univariés pour réaliser des prévisions.
1.2. Définition de l’économétrie
Il n’existe pas de définition généralement acceptée par tous à la question qu’est-ce que
l’économétrie (Kennedy P., p.1 1998) 3 . Mais, ce mot économétrie comprend deux parties :
économie et métrie (qui signifie mesure). Littéralement parlant, le mot "économétrie" signifie
"mesure en économie". Cette définition est trop large pour être utile, car la plupart des
considérations économiques concernent la mesure. Nous mesurons notre produit intérieur brut, la
masse monétaire, les exportations, les importations, etc.
Avant de chercher à comprendre «l’objectif de l’économétrie », il faut, tout d’abord, être à même
de comprendre « qu’est-ce que l’économétrie ? » En voici une des réponses :
Schéma 1. Définition de l’économétrie
ECONOMETRIE
ECONOMETRIE
STATISTIQUE MATHEMATIQUE ECONOMIE
Statistique descriptive et Algèbre Matricielle et Microéconomie et

Statistique Mathématique Optimisation (Max et Min) Macroéconomie
Simplement, l’économétrie peut être définie comme l’application des méthodes statistiques et
mathématiques à l’analyse des données économiques, dans le but de donner un contenu empirique
aux théories économiques et de les vérifier ou de les réfuter. (J Paul Tsasa K, 2011)
« L’économétrie, c’est l’unification de la théorie économique, des mathématiques et des statistiques.

L’économétrie n’est pas assimilable uniquement à la statistique économique ou aux méthodes
mathématiques appliquées à l’économie : c’est la conjonction de la théorie économique, de la
statistique et des mathématiques » ( Ragnar FRISCH, 1933)
3
Cité par KINTAMBU MAFUKU, 2014 p 3

À cet égard, on distingue l’économétrie de l’économie mathématique, qui consiste uniquement en
une application des mathématiques, et les théories dérivées n’ont pas nécessairement de contenu
empirique.
1.3. Objectifs de l’économétrie
L’économétrie a un triple objectif ou rôle en sciences sociales. D’abord, il apparait comme un outil
de validation de la théorie économique. Ensuite, il apparait comme un outil d’investigation.
L’investigation renvoie à la mise en évidence des relations entre les variables économiques. Enfin,
c’est un outil de prévision.
S’agissant des objectifs assignés à l’économétrie ils sont de trois ordres à savoir :
i l’objectif analytique tendant à tester ou à vérifier une théorie économique;

ii l’objectif de prise de décision car les valeurs numériques des coefficients estimés peuvent être
utilisées pour la prise de décision et
iii l’objectif prévisionnel. On remarquera que les trois objectifs ne s’excluent pas mutuellement
1.4. Modèle économique et modèle économétrique
La première tâche d’un économètre est celle de formuler un modèle économétrique. Qu’est-ce
qu’un modèle ? Il est délicat de fournir une définition unique de la notion de modèle (Bourbonnais,
p.1. 2015). Un modèle est une représentation simplifiée d’un processus du monde réel. Selon
Barbancho4 , un modèle est l’expression mathématique d’une certaine théorie économique. On
parlera de deux types qui sont : (1) Modèle économique et (2) modèle économétrique.
Selon Barbancho 5 , un modèle est l’expression mathématique d’une certaine théorie

économique. L’exemple de la loi de la demande est assez pertinent à cet effet. D’après cette loi,
en moyenne et la plupart du temps lorsque le prix d’un bien augmente, la quantité demandée de
ce bien diminue. Barbancho, A.G (p.38. 1962) pour qui « un modèle économique est l’expression
mathématique d’une certaine théorie économique ».
Nous formulons un modèle économique lorsque nous affirmons que la quantité demandée d’un
bien sur un marché où règne la libre concurrence, ceteris paribus, est fonction de son prix ; ce que
nous exprimons par l’équation :
qt = f(pt) (1.1)
Pour illustrer cet exemple très simple, dire que la courbe de la demande est en pente descendante
ne suffit pas. Nous devons écrire la déclaration sous forme mathématique. Cela peut être fait de
plusieurs manières. Par exemple, en définissant Qt comme quantité demandée et Pt comme prix,
on peut écrire mathématiquement, comme suit :
Qt = β0 + β1Pt (1.2) [avec β0 : intercepte et β1 < 0 propension marginale à demander]
En général, le modèle spécifié par l’économiste est défini comme étant une maquette de la
réalité ou nous pouvons considérer qu’un modèle consiste en une présentation formalisée
4
Cité par KINTAMBU MAFUKU 2014
5
Cité par KINTAMBU MAFUKU 2014

d’un phénomène sous forme d’équations dont les variables sont des grandeurs
économiques.
Toujours selon Barbancho, un modèle économétrique n’est autre chose qu’un modèle
économique qui contient les spécifications nécessaires pour son application empirique.
C’est donc le modèle économique auquel on ajoute un terme d’erreur εt.
Qt = β0 + β1Pt + εt. (1.3) [modèle spécifié par l’économètre]
La première partie de ce modèle [β0 + β1Pt] constitue sa partie systématique ou déterministe

et la deuxième [εt 6] sa partie stochastique ou aléatoire.
1.5. Portée et Méthodologie de l’Économétrie
Les étapes protocolaires de l’économétrie sont les suivantes :
i. Référence à une théorie
Une théorie s’exprime au travers d’un certain nombre d’affirmation qu’il convient d’appeler
hypothèses. A titre d’exemple, le modèle keynésien que d’usage classique en macroéconomie,
repose sur deux hypothèses principales :
La consommation et le revenu sont liés ; le niveau d’investissement privé et le taux d’intérêt sont
liés. Les modèles économétriques sont basés généralement sur la théorie économique.
ii. Spécification ou formulation d’un modèle économétrique,
C’est-à-dire formulation d’un modèle économique sous une forme testable empiriquement.
Généralement, il existe plusieurs façons de formuler le modèle économétrique à partir d’un modèle
économique, car nous devons choisir la forme fonctionnelle, la spécification de la structure
stochastique des variables, etc. Cette partie constitue l’aspect spécification du travail
économétrique.
On peut aussi dire qu’il s’agit ici de l’expression mathématique des relations postulées par la théorie. En
effet, à partir des propositions précédentes, nous pouvons construire les relations ci-après :
La consommation est fonction du revenu C = f (Y )

L’investissement privé dépend du taux d’intérêt I = g(r) .
6
Il convient de noter également que le terme d’erreur ut [bruit, perturbation ou aléa] dénote de la différence entre
l’économiste et l’économètre. Il synthétise l’influence sur Ct [variable expliquée] de toutes les autres variables
oubliées et des erreurs éventuelles de spécification de la forme fonctionnelle dans le modèle spécifié par
l’économiste. De plus, sa présence dans le modèle rend les paramètres α0 et α1 inconnus, on ne sait plus les
calculer, il faut donc les estimer. Par exemple, dire que la quantité demandée d’oranges dépend du prix d’oranges
est une représentation simplifiée, car il existe une foule d’autres variables auxquelles on peut penser qui
déterminent la demande d’oranges. Par exemple, le revenu des consommateurs, une augmentation de la conscience
de l’alimentation (boire de l’alcool provoque le cancer, il est donc préférable de passer au jus d’orange, etc.),

Pour achever la formalisation, nous devons donner à chacune de ces hypothèses une forme fonctionnelle.
Il s’agit précisément d’expliciter la forme des fonctions g et f. Si nous postulons une relation linéaire,
on peut écrire :
C =α0 +α1Y (1.4) et I =β0 +β1r (1.5)
Estimation et test de ces modèles avec les données observées. Cette partie constitue l’aspect inférence
du travail économétrique.
iii. Estimation ou confrontation du modèle avec les données
Il s’agit ici d’estimer les paramètres du modèle, puis d’effectuer des tests pour juger la validité sur
le plan statistique. Il convient néanmoins de préciser que l’estimation des paramètres est
conditionnée par la disponibilité des données. On distingue principalement quatre types de
données selon que le modèle est spécifié en :
Séries temporelles (séries chronologiques, chroniques ou time séries) (Yt, t = 1, 2, ……T)

C’est le cas le plus fréquent en économétrie, Il s’agit des variables observées à des intervalles de
temps réguliers (données hebdomadaires, mensuelles, trimestrielles, annuelles, …)
Ex1 Le PIB de la RDC, exprimé en Franc courants depuis 1990 jusqu’en 2022
Ex2. La série des dépenses mensuelles en publicité des sociétés de communication de mars 2020
à Février 2010 en RDC.
Séries en coupe transversale (coupe instantanée ou cross section) (Yi, i = 1, 2, ……n)

Ce sont des données observées au même instant et concernent les valeurs prises par la variable
pour un groupe d’individus spécifique. On peut citer l’exemple de consommation des ménages
des cadres politiques à Lubumbashi en 2023. Ex 2 le PIB des pays du COMESA en 1987.
Panel (Yit , i = 1, 2, ……n, t = 1, 2, …..T)

Ce sont des données qui concernent un groupe spécifique d’individus et qui sont observées à des
intervalles de temps réguliers. Il s’agit d’un type particulier des séries mixtes dans lesquelles les
données représentent les valeurs prises par un même échantillon d’individus sur une période de
temps. A titre d’exemple 1, on peut citer les dépenses de consommation des ménages des
parlementaires provinciaux aux à Lubumbashi de 2019 à 2022.
Ex 2 : les PIB des pays du COMESA de 1990 à 2024
Comme on peut le constater, les données de panel ont ainsi une double dimension : individuelle
et temporelle.
Cohorte
Très proche des données de Panel, les données de cohorte se distingue de la précédente par la
constance de de l’échantillon. Les individus sondés sont le même d’une période à l’autre. Une
cohorte désigne un groupe d’individu ayant vécu le même évènement au cours de la même période.
Ex1 La cohorte des pays Africains qui ont atteint l’émergence depuis 2010.
vi. Validation et prévision
Comme les données sous études portent sur un échantillon, il est vivement obligatoire de
passer par le test d’adéquations pour vérifier si cequi est vrai pour l’échantillon et aussi vrai

pour la population (inférence). C’est seulement lorsqu’on confirme l’adéquation entre les
deux que la prévision est possible.
Schéma 2. Etapes protocolaires ou Méthodologie de l’économétrie
Référence à une
théorie économique
Spécification : 1. Spécification
Modélisation ou mathématique
formalisation de la théorie 2. Spécification
économique
MCO : Moindres carrés

ordinaires (Max SCR)
Non validation Estimation : Confrontation MMG : Moments

du modèle avec les données généralisés (Egal moments
Test sur nouvelles théoriques aux moments
données et empiriques)
respécification du
modèle MMV: Maximum de
vraisemblance etc…
Validation:
Validation théorique : Théorème de Validation empirique :

GAUSS-MARKOV les estimateurs
doivent être BLUE 1) Test de significativité individuelle ou
test paramétrique (t-Student)
2) Test de significativité globale (Fischer)
Prévision et utilisation du modèle à des fins de

contrôle ou de politique économique

Exercices résolus sur le premier chapitre
Exercice 1. L’économétrie est :

a. Une science sociale qui utilise les outils mathématiques, statistique et de la mathématique
statistique afin d’expliquer la théorie économique.
b. Une méthode qui utilise les outils mathématiques, statistique, la mathématique statistique et la
théorie économique dans le but de comprendre les problèmes économiques.
c. Une partie de la science économique qui utilise les outils mathématiques, statistique, la
mathématique statistique et la théorie économique dans le but de comprendre les problèmes
économiques.
d. L’analyse quantitative de phénomènes économiques réels basée sur une bonne modélisation
puis estimation des paramètres.
e. Une science qui s’intéresse à la détermination des valeurs numériques des paramètres.
Exercice 2. Un paramètre est :

a. Une variable dont on ne connait pas la valeur
b. Une constate dont on veut la valeur
c. Une constante dont la valeur est ignorée
d. Une constate aléatoire dont on ignore la valeur
e. Aucune réponse n’est exacte
Exercice 3. La principale préoccupation de l’économie mathématique est :

a. D’exprimer la théorie économique sous forme d’équations mathématiques tout en tenant
compte de vérification empirique de la théorie.
b. D’exprimer la théorie économique sous forme d’équations mathématiques sans tenir compte de
la vérification de la théorie.
c. La collecte, le traitement et la présentation des données économiques (telles que : le PIB,
l’emploi, le chômage, les prix, la consommation) sous forme de graphique et de tableaux.
d. La collecte, le traitement des données économiques (telles que : le PIB, l’emploi, le chômage, les
prix, la consommation).
e. L’expression de la théorie économique sous forme d’équations mathématiques puis la collecte
de données.
Exercice 4. La différence entre un modèle économique et un modèle économétrique se voit :

a. Uniquement sur la présence du terme d’erreur dans le modèle économique.
b. Uniquement sur la présence du terme d’erreur dans le modèle économétrique
c. Sur la présence du terme d’erreur et/ou le nombre de variables dans l’un des modèles.
d. Sur la présence du terme d’erreur et le nombre de variables dans l’un des modèles.

Exercice 5. Par modèle économique, on entend
a. une représentation simplifiée d’un phénomène sous forme d’équations dont les variables
sont des grandeurs économiques ;
b. caricature d’une réalité économique
c. un modèle ayant deux parties ; partie stochastique et partie déterministe.
Exercice 6. Pour analyser un problème économique, l’économètre adopte le plus souvent la

méthodologie classique qui domine encore la recherche empirique en Economie et dans d’autres
Sciences sociales. La méthodologie classique propose les étapes suivantes sauf :
a. référence à une théorie ;
b. spécification du modèle mathématique ;
c. spécification du modèle statistique ou économétrique ;
d. sélection des variables et des données statistiques ;
e. estimation des paramètres du modèle économétrique ;
f. validation ou diagnostic du modèle ;
g. utilisation du modèle estimé.
Exercice 7. Une étude portant sur le PIB des pays du COMESA observés sur les 30 dernières
années utilisera les données d’une (d’un)
a. série temporelle, ou série chronologique
b. série instantanée ou données en coupe transversale,
c. Panel,
d. Cohorte.
Exercice 8. L’économétrie a un triple objectif en sciences sociales. D’abord, il apparait comme

a. un outil de validation de la théorie économique ;
b. outil d’investigation ;
c. outil de prévision ;
d. les propositions a, b et c sont fausses
e. a, b et c sont vraies
Exercice 9. Le père de l’économétrie moderne

Exercice 10.

Chapitre II : Etude de corrélation
La notion de corrélation étant au centre de l’analyse économétrique, ce chapitre marque

un temps d’arrêt sur la notion de corrélation. Il explicite les types de corrélation qui peuvent
être observés au sein de 02 variables dans la présentation du concept, présente la première
étape indiquée pour débuter une corrélation ; le graphique en 2, présente trois outils de
mesure de la corrélation linéaire et fait un exposé du test que l’on peut être amené à
conduire au sein d’un échantillon pour se prononcer sur la significativité d’un coefficient de
corrélation. Puis en fin, distingue la corrélation simple de corrélation multiple, distingue la
notion de causalité de celle de corrélation.
2.1. Présentation
L’interprétation des résultats relatifs aux modèles économétriques se fait le plus souvent en termes
de corrélation. Lorsque deux phénomènes ont une évolution commune, on dit qu’ils sont corrélés.
La corrélation simple mesure le degré de liaison entre deux phénomènes. La corrélation partielle,
quant à elle, intervient lorsque nous sommes en présence d’au moins trois variables.
Le terme corrélation désigne le degré de liaison existant entre deux variables quantitatives ou
qualitatives ; c’est le lien qui existe entre deux variables d’une série statistique double. Elle signifie,
en effet, «tendance à varier ensemble ».
Ainsi, donc deux variables peuvent être :
- En corrélation positive si l’on constate une augmentation (ou diminution, ou constance) simultanée
des valeurs des deux variables ;
- En corrélation négative, lorsque les valeurs de l'une augmentent (respectivement. diminuent), les
valeurs de l'autre diminuent (respectivement augmentent) ;
- Non corrélées, s’il n'y a aucune relation de dépendance entre les valeurs des deux variables.
Ainsi, deux façons sont possibles pour analyser la corrélation entre deux variables, il s’agit de (i)
l’analyse graphique (diagramme de dispersion) et (ii) les coefficients de corrélation.
2.2. Graphique ou diagramme de dispersion

L’analyse graphique « diagramme de dispersion ou graphique nuage de points » est la plus adaptée
et indiquée pour débuter l’étude de la corrélation. Après l’avoir réalisé, la forme du nuage des points
renseigne à partir d’un simple coup d’œil sur le type d’une éventuelle liaison entre X et Y. Trois
situations sont possibles pour le cas d’une association linéaire entre deux variables :
Fig 1. Corrélation négative Fig 2. Aucune corrélation Fig 3. Corrélation positive
Nota : Il est généralement souhaitable et recommandé de présenter tout d’abord le graphique en

nuage des points (diagramme de dispersion) de variables sous analyse, avant de calculer le

coefficient de corrélation linéaire car le graphique permettra de se rendre compte de la linéarité ou
non de la relation des variables en cause.
Cependant, cette première façon de déterminer la corrélation par un graphique semble être la
moins rigoureuse car elle donne juste un sens sans en donner la teneur de corrélation, d’où la
nécessité des coefficients de corrélation qui donneront non seulement le sens mais et aussi le
degré de corrélation.
Pour traiter quantitativement le problème de la dispersion des données au tour d’une droite, il est
indispensable de définir une mesure de la corrélation.
2.3. Coefficients de corrélation linéaire
1. Coefficient de Corrélation Linéaire Simple de Bravais-Galton-Pearson ( rxy )
La représentation graphique nous donne certes une idée sur l’existence ou non de la corrélation
mais ne nous renseigne pas avec précision sur son intensité. Dans les cas linéaires, l’intensité de la
corrélation entre deux variables quantitatives X et Y est appréhendée par le coefficient de
corrélation noté rxy . Il est donné par le rapport entre la covariance et le produit non nul des écarts
– types des variables en cause x et y.
Mathématiquement il est défini par :
𝑪𝒐𝒗(𝑿,𝒀)
rxy = (2.1)
𝝈𝒙𝝈𝒚
∑(𝑿−𝑿̅ )(𝒀− 𝒀
̅)
rxy = ̅ )𝟐 √(𝒀− 𝒀
̅ )𝟐
(2.2)
√(𝑿−𝑿
𝑵 ∑ 𝑿𝒀 – ∑ 𝑿 ∑ 𝒀
rxy = (2.3)
√𝑵 ∑ 𝑿𝟐 − (∑ 𝑿)𝟐 √𝑵 ∑ 𝒀𝟐 − (∑ 𝒀)𝟐
(2.1) est formule initiale qui mène a (2.2) la formule du coefficient de corrélation linéaire avec les
variables centrées à leurs moyennes, après développement de (2.2) ça donne (2.3) La formule du
coefficient avec données brutes.
Nota : Par construction on peut montrer que : rxy ∈ [−𝟏 , 𝟏]7 𝒐𝒖 − 𝟏 ≤ 𝒓𝒙𝒚 ≤ +1.
Lorsque :
(i) si rxy → +1, on dira que les deux variables corrèlent positivement ;
(ii) si rxy → -1, on dira que les deux variables corrèlent négativement ;
(iii) si rxy → 0. Absence de corrélation entre les deux variables.
1.1. Hypothèses fortes au calcul du rXY
7
C’est le domaine de définition du Coefficient de Corrélation linéaire Simple

Le calcul du coefficient de corrélation linéaire de Bravais – Galton - Pearson entre les variables X et
Y n’est adapté qu’au strict respect des hypothèses suivantes :
H1: Les variables X et Y doivent être quantitatives (mesurables) ;

H2: Les variables X et Y doivent être gaussiennes (suivre la loi normale) et
H3: La relation entre X et Y doit être linéaire
1.2 Test sur le coefficient de corrélation
Le résultat obtenu, après application de la formule du coefficient de Bravais-Pearson, doit être soumis à
un test statistique avant sa validation. Pour vérifier si la corrélation calculée existe bel et bien au sein de
la population étudiée, le rxy est soumis à un test statistique appelé le test de Student [test mis à jour par
Gosset]. Ce test passe par 5 étapes comme indiquées ci-dessous.
1. Spécification des hypothèses (hypothèse nulle contre hypothèse alternative)

Ho: δxy = 0 Il n’y a pas corrélation
H1: δxy ≠ 0 Il y a corrélation,
2. La détermination du seuil de signification α avec :

α = Pr (décider H1/H0 vraie) C’est la probabilité de décider H1 sachant Ho vraie. Plus
prosaïquement, le tableau ci-dessous est assez résumant pour comprendre les deux types
d’erreurs appelés respectivement erreur de 1ere espèce α et erreur de 2 e espèce β.
Ho H1
Ho Pas de problème α = Pr (décider H1/H0 vraie)
H1 β=Pr(déciderHo/H1vraie) Pas de problème
3. Calcul de la statistique du test qui est donné par la formule :
|𝒓𝒙𝒚− 𝛿𝑥𝑦| |𝒓𝒙𝒚|

t-calculé = sous hypothèse nulle on a t-calculé =
𝟏− 𝒓𝟐 𝟐
√ √𝟏− 𝒓𝒙𝒚
𝒏−𝟐 𝒏−𝟐
4. La détermination de la statistique t sur la table de Student avec un seuil de signification α et un

degré de liberté n-2.
t-table = tα/2n-2
5. Critères de décision : Ilya deux critères de décision (soit t-calculé est grand que t-lu , soit non)8
1. Si t-calculé > t-table R Ho : on dit qu’il y a corrélation linéaire entre deux variables X et Y
8
Il existe également une table qui permet d’évaluer, pour un niveau de risque donné, la significativité du coefficient
de corrélation simple, c’est la table de Pearson-Hartley [voir en annexe]. Ainsi, le coefficient de Bravais-Pearson
serait significatif lorsque sa valeur est supérieure à celle de la table, pour un seuil de signification quelconque.

2. Si t-calculé < t- table A Ho : on dit qu’il n’y a pas de corrélation linéaire entre les deux variables
X et Y
Nota 2 : - Lorsque H2 et H3 sont violées, c’est-à-dire (x et y ne suivent plus la loi normale et la relation
entre X et Y n’étant plus linéaire) on ne peut plus calculer le coefficient de corrélation linéaire simple
de BGP dans ce cas, le coefficient le mieux adapté est le coefficient de corrélation de Rang de Spearman
2. Coefficient de corrélation de rang de Spearman9

Comme vu précédemment, le coefficient de corrélation de Bravais-Pearson mesure la liaison pouvant
exister entre deux variables. Cependant, comme nous le verrons par la suite, cet outil devient inopérant
lorsque les distributions ne sont pas normalement distribuées (violation de H2) ou lorsqu’on est en face
de variables qualitatives (violation de H1). Dans ces cas, on recourt à la corrélation des rangs, celle-ci
ne prend plus en compte les observations mais leur classement par rapport à l’ordre observé sur l’autre
variable. Dans ce recueil, nous nous intéressons au coefficient développé par Spearman.
Si l’on note le rang de X par Ri et celui de Y par Si, le ρxy est donné par la formule du rxy mais calculé
sur les rangs, soit :
𝑪𝒐𝒗(𝒙,𝒚) 𝑪𝒐𝒗(𝑹𝒊,𝑺𝒊)
𝝆𝒙𝒚 = 𝝈𝒙𝝈𝒚
Ou simplement ; 𝝆𝒙𝒚 = 𝝈𝑹𝒊𝝈𝑺𝒊
∑𝒏𝒊=𝟏(𝑹𝒊 − 𝑹𝒊)(𝑺𝒊 − 𝑺𝒊)

𝝆𝒙𝒚 =
𝟐 𝟐
√∑(𝑹𝒊 − 𝑹𝒊) √∑(𝑺𝒊 − 𝑺𝒊)
En tenant compte de certaines propriétés de rang, le ρ peut être calculé bien plus simplement par les
deux formules équivalentes données par :
𝟏𝟐 ∑ 𝑹𝒊𝑺𝒊 𝟑(𝒏+𝟏) 𝟔 ∑ 𝑫𝒊𝟐

𝝆𝒙𝒚 = 𝒏(𝒏𝟐 −𝟏)
− 𝒏−𝟏 = 𝟏 − 𝒏(𝒏𝟐−𝒏)
Avec, Di = Ri – Si et n le nombre d’observations

Le test de signification statistique du ρxy est de la même forme que celui du rxy.
Exemple 2.2 On donne la distribution statistique suivante :
9
Le coefficient de corrélation de rang de Spearman est un coefficient non paramétrique et parallèlement au
coefficient de corrélation linéaire de Bravais-Galton-Pearson rxy qui est un coefficient paramétrique, l’avantage du
coefficient de rang ; ρxy quantifie également le degré de liaison linéaire entre deux variables quantitatives. En
revanche, même à défaut de normalité, ou de symétrie le ρxy reste particulièrement approprié. Une autre de ses
particularités tient à ce que son calcul nécessite que les données soient transformées en rang.

Y 6 8 4 6 2 9 10
X 10 8 8 5 8 4 2
Avec Y (Quantité demandée de Maïs) en kg et X le prix du Mais en USD
TAF : Calculer le coefficient de corrélation linéaire de rang de SPEARMAN

Solution
On détermine le rang de X et de Y (données brutes), pour y arriver, on transforme d’abord les
données brutes en suite ordonnée.
Pour Yi (2, 4, 6, 6, 8, 9, 10) : 2 occupe le premier rang, on notera par R1, 4 occupe le deuxième
rang R2, mais 6 occupe successivement R3 et R4 pour ce faire, on calcule la moyenne arithmétique
3+4
de 3 et 4, formellement on aura 2 qui donne 3.5 et on dira que les six ont pour rangs 3.5, le 8
occupe quant à lui le 5e rang, 9 (R6) et 10 (R7).
Pour Xi (2, 4, 5, 8, 8, 8, 10) : 2 occupe R1, 4 occupe le deuxième rang R2, 5 occupe le 3e rang, mais
pour déterminer le rang de 8 on fera la moyenne arithmétique de 4, 5 et 6 ce qui donne 5, alors on
dira que les huits occupent le 5e rang; et 10 le 7e rang R5
Confectionnons un tableau qui reprend différentes informations nécessaires pour le calcul du
coefficient de corrélation de rang de Spearman.
X Y Rang de X (Ri) Rang de Y (Si) Di = Ri - Si 𝐷𝑖 2

10 6 7 3.5 3.5 12.25
8 8 5 5 0 0
8 4 5 2 3 9
5 6 3 3.5 -0.5 0.25
8 2 5 1 4 16
4 9 2 6 -4 16
2 10 1 7 -6 36
89.5
Rapportons le résultat de Di trouvé dans le tableau dans la formule du coefficient de corrélation

de rang de Spearman ci-après :
12 ∑ 𝑅𝑖𝑆𝑖 3(𝑛+1) 6 ∑ 𝐷𝑖 2
𝜌𝑥𝑦 = 𝑛(𝑛2 −1)
− 𝑛−1
= 1 − 𝑛(𝑛2 −𝑛)
Considérons la dernière égalité :

6 ∑ 𝐷𝑖 2 6×89.5 537
𝜌𝑥𝑦 = 1 − 𝑛(𝑛2 −𝑛) = 1 -7(72 −7) = 1 - 294 = - 0.826
Le signe moins veut simplement dire qu’il existe une corrélation négative entre la quantité demandée
d’un bien et son prix « c’est la loi de la demande énoncée en économie politique 1 » pour le cas sous
étude, la corrélation entre les deux variables est négative à la hauteur de 82.6% si l’hypothèse est rejetée.

Nota 3 : - Lorsque H1 est violée c’est-à-dire que les variables X et Y sont qualitatives, dans ce cas, le
coefficient le mieux adapté est le coefficient des variables qualitatives dont le plus connu est le
coefficient tétrachrorique.
Corrélation des variables qualitatives

Une variable qualitative, du moins pour le cas que nous considérons dans ce manuel, est une
variable dichotomique ne prenant que deux valeurs, à savoir :
• 1 pour indiquer que le phénomène (ou l’événement) a lieu ; (ou présence de l’attribut)
• 0 pour indiquer que le phénomène (ou l’événement) n’a pas lieu. (Ou absence de
l’attribut)
Elle est utilisée pour saisir les facteurs qualitatifs – comme la nationalité, l’état civil, le sexe, la
religion ou même un événement tel qu’une guerre, une grève, un tsunami, etc. – qui intéressent
l’analyse.
Plus généralement comme déjà vu précédemment, une variable qualitative est une variable qui
n’est pas numérique par nature.
3. Le coefficient de corrélation tétrachorique (ou Phi)

Le coefficient tétrachorique [ou phi] est un coefficient utilisé pour mesurer le degré de liaison entre
deux variables qualitatives codées 0 et 1.
Le Phi, noté par , est aussi une mesure de la force de l’association éventuelle entre variables
qualitatives. Symétrique et basé sur la statistique du Khi – deux, le est donné par la racine carré
du rapport du et du nombre d’observations.
Formellement nous avons :
Les variables peuvent être dichotomiques par nature, ou dichotomisées (découper en deux intervalles
d’une variable continue) comme les variables ne sont pas censées être dichotomiques qualitatives c’est-
à-dire les modalités ne sont pas ordonnées, on peut recourir à un test de Khi – deux (inventé par Karl
Pearson) d’indépendance des caractères ou attributs étudiés dans un tableau de contingence.
Un tableau de contingence est un tableau à double entrée qui croise les modalités en ligne d’une
variable qualitative à celles en colonne d’une autre.
Pour illustrer, considérons les variables nationalité et réussite en mathématiques, pour un groupe de N
étudiants échantillonnés. La variable nationalité est définie 1 si l’étudiant est congolais et 0 dans les
autres cas, la variable réussite en mathématique, quant à elle, est définie 1 si l’étudiant a réussi et 0
sinon. En les croisant, on obtient le tableau de contingence 2 2 suivant.
Tableau ???.. Tableau de contingence 2 2

Réussite en Mathématique
0 1 Total
0 α β α+β
1 γ δ γ+δ
Total α+γ β+δ N
Les ratios (γ+δ)/N, δ/N et (α+γ)/N, donnent respectivement la proportion des étudiants congolais dans
l’échantillon, la proportion des étudiants congolais ayant réussi en mathématique et la proportion des
étudiants ayant échoué en mathématiques.
𝛼𝛿 − 𝛽𝛾
∅=
√(𝛼 + 𝛽)(𝛾 + 𝛿)(𝛼 + 𝛾)(𝛽 + 𝛿)
Le codage 0 et 1 détermine le signe de ∅, il n’a pas d’incidence sur la valeur absolue du coefficient. Cela
permet de détecter les attractions ou les répulsions entre les modalités.
Exemple 2..le tableau suivant présente des données relatives à la relation entre le tabagisme (X) et
le cancer (Y) ; les deux variables ayant reçu les scores de 0 et 1 : un individu fumait ou ne fumait pas,
est mort du cancer ou pas. Il vous est demandé de calculer le coefficient approprié pour établir cette
relation et d’en calculer la significativité.
Tableau ???.. Tableau de
X 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1
Y 0 1 0 0 1 0 0 0 1 1 0 1 1 1 1 0 1 1 1 0
Solution
Puis qu’il s’agit de deux variables qualitatives (dichotomiques), le coefficient thetrachrorique ou phi
sera utilisé. Le tableau de contingence nous donne comme situation :
Autres cas (1) Cancer total

Non-fumeur (1) 7 3 10
Fumeur (0) 4 6 10
Total 11 9 20
𝛼𝛿− 𝛽𝛾 7×6−3×4
Le coefficient tétrachrorique phi est donné par : ∅ = = = 0.302
√𝛼+𝛽)(𝛾+𝛿)(𝛼+𝛾)(𝛽+𝛿) √10×10×11×9

Le test de significativité du coefficient phi consiste à effectuer un test sur le coefficient de Spearman.
Nous aurons donc, n=20 et r = 0.302, et nous testons les hypothèses suivantes : Ho (rxy =0) contre H1
0.302
(rxy ≠ 0). La statistique du test est t = 2
= 1.34 et le seuil critique au seuil de 5% est t-table =
√1−0.32
20−2
2.101. Conclusion : t-calculé inferieur a t-table (t-table = 2.101> t-calculé = 1.34),
nous acceptons l’hypothèse nulle c.a.d rien ne prouve, pour ce petit échantillon, l’existence d’une
relation entre le tabagisme et le cancer.
2.4. Limites de la corrélation

Les coefficients de corrélation présentés dans ce chapitre présentent essentiellement quatre faiblesses, à
savoir :
i La mesure ne concerne qu’une relation linéaire. Le coefficient de corrélation linéaire sert avant
tout à caractériser une liaison linéaire. Lorsqu’elle ne l’est pas, ce coefficient peut induire en
erreur, surtout sur l’intensité de la liaison entre variables considérées.
ii La corrélation n’est ni impact ni causalité. L’objet de la corrélation n’est pas d’établir une
causalité mais simplement de rendre compte du sens et du degré d’association éventuelle entre
variables.
iii La corrélation peut être fortuite [artificielle ou fallacieuse ou encore artefactuelle]. Une
corrélation élevée ne peut tenir qu’à un facteur confondant ou artefact. En réalité, les deux
variables peuvent simplement être liés à un même phénomène - source : une troisième variable
dont il faut neutraliser l’effet. Les alternatives face à ces faiblesses sont notamment la
corrélation pour variables qualitatives, le coefficient de corrélation partiel, le rapport de
corrélation, la régression linéaire et non linéaire, la causalité, la co intégration, etc.
Nota 4: La signification clinique ou l’interprétation des coefficients n’est valable que si, après test, on
rejette l’hypothèse d’absence de corrélation (Ho). Le travail d’interprétation d’un coefficient de
corrélation linéaire se fait toujours en deux temps : une interprétation par rapport au signe/sens de la
liaison et une interprétation par rapport au degré de dépendance.
En résumé, l’estimation d’un coefficient de corrélation suivra toujours [sauf indication contraire], dans
l’ordre, les cinq étapes suivantes :
(i) Test de linéarité [utiliser un diagramme de dispersion]
(ii) Test de normalité [Jarque-Berra10]
(iii) Choix et estimation d’un coefficient de corrélation 1, 2 ou 3
(iv) Test de significativité statistique sur le coefficient calculé
(v) Interprétation ou signification clinique du coefficient estimé [valable seulement si on décide
H1]
10
Ceci fera l’objet du chapitre sur le relâchement des hypothèses

Exercices résolus sur le deuxième chapitre
Exercice 1. Le tableau ci-après renseigne sur l’évolution du revenu X et la consommation Y d’un

ménage.
X 10 8 9 11 14 6 4 12 7 5 8
Y 7 6 7 8 9 6 5 8 6 6 7
Travail à faire :
(1) Tester la linéarité par un diagramme de dispersion (graphique),
(2) Calculer le coefficient de corrélation sans tenir compte du test normalité.
(3) Tester sa significativité statistique
(4) Evaluer sa signification clinique.
Exercice 2. On donne la distribution statistique suivante :
Y : Taux d’inflation en % 6 8 4 6 2 9 10
X : Masse monétaire en Fc 10 8 8 5 8 4 2
Travail à faire : Calculer le coefficient de corrélation linéaire correspondant, tester sa nullité au seul
de 10% et interpréter les résultats et dites sils sont conforme à la théorie économique ?
Exercice 3. Un agronome s’intéresse à la liaison pouvant exister entre le rendement de maïs x (en
quintal) d’une parcelle de terre et la quantité d’engrais y (en kilo). Il relève 10couples de données
consignés dans le tableau suivant :
X 16 18 23 24 28 29 26 31 32 34
y 20 24 28 22 32 28 32 36 41 41
Source : Régis Bourbonnais, 2015 p10
Travail demandé
(1) Calculer le coefficient de corrélation linéaire de BGP entre x et y

(2) Calculer le coefficient de corrélation linéaire de rang de Spearman et le comparer au (1)
(3) Ce coefficient est-il statistiquement différent de 0 au risque 1 % ?
(4) Interpréter les résultats obtenus.
Exercice 4. Montrer rigoureusement que par construction le coefficient de corrélation linéaire est
toujours comprise entre - 1 et 1 [Utiliser les formules de Bravais – Pearson et la formule de rang de
Spearman]

Exercice 5. Le tableau ci-après renseigne sur l’évolution de l’offre de jus de banane (X) et son prix en
USD (Y).
X 1O 8 5 4 2
y 20 24 25 21 30
Travail à faire :
(1) Calculer le coefficient de corrélation approprié.

(2)Tester sa significativité statistique au seuil α = 10 % ;
(3)Evaluer sa signification clinique
Exercice 6. Voici un échantillon de deux variables gaussiennes :
X Y Travail à faire :
- Estimez le coefficient de corrélation de Bravais – Galton- Pearson - A quoi renvoie

0 0
ce résultat ?
- Faites maintenant un diagramme de dispersion.
-2 1 - Que voyez-vous ? Quelle nuance pouvez-vous donc formuler dans ce cas ?
4 1
-1 2
1 4
Exercice 7. A Washington, un journaliste a découvert qu’il existe une très forte corrélation entre le
fait d’avoir un nid de cigognes sur sa demeure et le fait d’avoir des enfants. D’où il conclut que les
cigognes apportent les bébés. Quelle remarque pouvez-vous faire à une telle conclusion ?
Solution de l’exercice 7 La remarque principale à formuler à ce type de corrélation que rien ne peut
expliquer – ou qui en réalité tient à un autre phénomène-source – est que la corrélation peut être
fortuite ou artificielle. Par ailleurs, à bien analyser les choses, tenant compte des réalités de
Washington, la présence d’un nid de cigognes sur le toit signifierait plutôt que la famille qui y habite
est aisée et donc disposée, financièrement, à avoir plus d’enfants.
Exercice 8. [Il y a au moins une réponse exacte, à cocher, à la question suivante]. Le coefficient de
corrélation linéaire entre deux variables statistiques :
(a) ne peut être calculé que si les deux variables sont quantitatives

(b) est un nombre positif ou nul
(c) n’est égal à zéro que lorsque les variables sont indépendantes
(d) est un nombre sans dimension.
Exercice 9. Le tableau ci-après reprend les données statistiques relatives au Produit intérieur brut
(PIB) et à la consommation privée de la RDC pour la période allant de 1980 à 1996111 .
Exercice 10.
11
Notes : 1) Consommation des ménages aux prix de 2006 (en milliards de Francs); 2) PIB aux prix de 2022 (en
milliards de Francs) 3) Taux d'inflation Source : Jemy Meta Heshemu, Estimation d'un modèle de
consommation des ménages. Cas de la RDC de 2006 à 2022, Mémoire de Licence, Faculté des Sciences
Economiques (FASE), Université Protestante de Lubumbashio, Octrobre 2023.

Chapitre III : Le modèle linéaire simple
Le modèle linéaire simple est l’expression la moins complexe des modèles économétriques.
C’est la plus simple dans la mesure où on met en relation essentiellement deux variables
quantitatives. Dans ce chapitre, nous présenterons d’une part le modèle proprement dit et,
d’autre part, la technique d’estimation des paramètres.
3.1 Le modèle
2.1.1 Formulation
Nous cherchons à mettre en avant une relation de dépendance entre les variables Y et X. Y
est celle que l'on cherche à expliquer (à prédire), on parle de variable endogène
(dépendante) ; X est la variable explicative (prédictive), on parle de variable exogène
(indépendante). Le modèle de régression linéaire simple s'écrit :
Yt = β0 +β1Xt + εt (3.1)
β0 et β1 sont les paramètres (les coefficients) du modèle. Dans le cas spécifique de la

régression simple, β1 est la pente, β0 est la constante. Nous disposons d'un échantillon de
n observations i.i.d (indépendantes et identiquement distribuées) pour estimer ces
paramètres.
Le terme aléatoire ε, que l'on appelle l'erreur du modèle, tient un rôle très important dans
la régression. Il permet de résumer toute l'information qui n'est pas prise en compte dans
la relation linéaire que l'on cherche à établir entre Y et X c.-à-d. les problèmes de
spécification, l'approximation par la linéarité, résumer le rôle des variables explicatives
absentes, etc.
L’objet du modèle est de formaliser la relation entre la variable Yt et la variable Xt.

précisément, il vise à expliquer le comportement de la variable y à partir de la variable x.
c’est d’ailleurs pour cette raison que la variable xt est dite explicative tandis que la variable
yt est dite expliquée.
Lorsque les données sont en coupe longitudinale (série temporelle), on introduit l’indice t pour
différencier les observations, le modèle devient : Yt =β0 + β1Xt + εt
Si par contre, les données sont en coupe transversale, on introduit plutôt l’indice i, et le modèle
s’écrit : Yi = β0 + β1xi + εi.
3.1.2 Le terme d’erreur

Pour mieux saisir l’importance de ce terme, supposons que notre modèle est l’expression
de la fonction de consommation keynésienne et faisons abstraction du terme d’erreur. On
écrira : Yt = β0 +β1 Xt. Yt = consommation ; Xt = revenu.

Trois éléments sont à relever :
• Il est évident que le revenu à lui seul n’explique pas la consommation. En effet,
certains éléments tels que les dons et les transferts influencent la consommation.
Sous l’hypothèse restrictive du revenu, notre modèle peut souffrir d’une erreur de
spécification.
• De même, la mesure des variables x et y peut être entachée d’erreurs, ce qui
engendre des erreurs de mesure.
• La collecte des données nécessaire pour estimer le modèle peut se faire sur une
partie de la population (échantillon), et non sur la population totale ; ceci peut
induire un autre type d’erreur dit erreur d’échantillonnage.
Le souci de prise en compte de ces trois types d’erreurs justifie la présence de la variable ε dans le
modèle. Le terme d’erreur est donc très important en ce sens qu’il vient matérialiser les
imperfections du modèle.
3.1.3 Hypothèses sous-tendant les MCO

La résolution du modèle (1) qui passe par l’estimation des paramètres β0 et β1 exigent qu’un certain
nombre d’hypothèses soit vérifié (Le modèle linéaire de régression simple s’appuie sur les hypothèses
fondamentales suivantes) :
H1 : Linéarité Le modèle est linéaire en Xt ou en n’importe quelle transformation de Xt
H2 : La variable explicative Xt est observée avec certitude. La variable explicative X est non-
stochastique, c’est-à-dire fixée dans des échantillons répétés et, par conséquent, non
corrélée avec les erreurs. Tandis que Yt, observée également sans erreur, est aléatoire par
l’intermédiaire de εt .
H3 : Centralité ou nullité de l’espérance mathématique des erreurs ; E(εi) = 0 pour tout i = 1, ...,
n, c’est-à-dire, les erreurs ont une moyenne nulle. Cette hypothèse est nécessaire pour
s’assurer qu’en moyenne nous sommes sur la droite réelle
H4 : Homoscédasticité des erreurs ; E(εi2) =σ2 pour tout i = 1, ..., n, c’est-à-dire, les erreurs ont
une variance constante. Cela assure que chaque observation est également fiable.
H5 : La non autocorrélation des erreurs ; E(εiεj ) = 0 pour i ≠ j , pour i = j et i, j = 1, ..., n , c’est-à-

dire, les erreurs ne sont pas corrélées. La connaissance de la i-ème erreur ne nous dit rien
sur la j-ème erreur car i = j
H6 : Exogénéité ou indépendance entre la variable explicative Xt et la variable aléatoire εt ; Cov

(Xi, εi) = 0 pour tout i = 1, ..., n ; toutes les variables explicatives ne sont pas corrélées avec
le terme d’erreur. On suppose que les valeurs observées des variables explicatives sont
indépendantes des valeurs du terme d’erreur.
3.2 Estimation du modèle

L’estimation des paramètres β0 et β1 peut être menée soit par la méthode des moments
(MMG) soit par la méthode des maximum de vraisemblances (MMV) ou par la méthode des

moindres carrés (MCO). Dans le cadre de notre travail spécialement, nous allons les
présenter toutes les trois et leurs principes. (1) la Méthode des moindre carrés ordinaires
(MCO) Celle-ci consiste à minimiser la somme des carrés des écarts entre les valeurs réelles
et les valeurs estimées de la variable expliquée. Ce qui revient à minimiser la somme des
carrés des erreurs ou la somme des carrés de résidus (SCR).
La méthode des MCO consiste à retenir comme estimateur de 𝜷𝒐 𝒆𝒕 𝜷𝟏 ce qui résulte

autrement de la minimisation de la somme des carrés des écarts, écart entre la valeur
observée de la variable endogène (rappel : expliquée) et la variable calculée de cette même
variable endogène, écart respectivement mesuré par la projection parallèlement à l’axe des
ordonnées des points sur la droite de régression
Y (observée) 𝑌̂
Ɛi
Ɛi = Yi - 𝑌̂
𝑌̂ (Estimée)
Yi
On est donc amené à résoudre le programme ci-après :
Min (𝑺𝑪𝑹) ou simplement Min (∑ 𝜺𝟐 ) = Min[∑(𝒀𝒕 − 𝜷𝒐 − 𝜷𝟏𝑿𝒕) 𝟐]
Conditions nécessaires de 1er ordre
∂S
=0 ∑ 𝟐(−𝟏)(𝒀𝒕 − 𝜷𝒐 − 𝜷𝟏𝑿𝒕) = 0
𝜕𝛽𝑜
∂S
= 0 ∑ 𝟐(−𝑿𝒕)(𝒀𝒕 − 𝜷𝒐 − 𝜷𝟏𝑿𝒕) =0
𝜕𝛽1
∑(𝒀𝒕 − 𝜷𝒐 − 𝜷𝟏𝑿𝒕) =0
∑ 𝑿𝒕(𝒀𝒕 − 𝜷𝒐 − 𝜷𝟏𝑿𝒕) =0
∑ 𝒀𝒕 − 𝑵𝜷𝒐 − 𝜷𝟏 ∑ 𝑿𝒕) =0
∑ 𝑿𝒕𝒀𝒕 − 𝜷𝒐 ∑ 𝑿𝒕 − 𝜷𝟏 ∑ 𝑿𝒕 𝑿𝒕) = 0

∑ 𝒀𝒕 − 𝑵𝜷𝒐 − 𝜷𝟏 ∑ 𝑿𝒕 = 0 (1)
∑ 𝑿𝒕𝒀𝒕 − 𝜷𝒐 ∑ 𝑿𝒕 − 𝜷𝟏 ∑ 𝑿𝒕 𝟐 = 0 (2)
Les équations (1) et (2) sont dites « Equations normales ». Elles constituent un système de deux
équations à deux inconnues d’où l’utilisation de plusieurs méthodes est possible pour trouver les
deux inconnues qui sont dans ce cas : 𝛽0̂ 𝑒𝑡 𝛽1̂.
(i). Méthode Matricielle
̂ −𝟏
𝜷𝟎 ∑ 𝑿𝟐 ∑𝑿 ∑ 𝑿𝒀
( )= ( ) ( )
̂
𝜷𝟏 ∑𝑿 𝑵 ∑𝒀
(ii). Méthode de Cramer
∑ 𝑿𝟐 ∑ 𝒀− ∑ 𝑿 ∑ 𝑿𝒀
̂ = 𝑵 ∑ 𝑿𝒀− ∑ 𝑿 ∑ 𝟐𝒀 et 𝜷𝟏
𝜷𝒐 ̂= 𝟐
𝟐𝑵 ∑ 𝑿 − (∑ 𝑿) 𝑵 ∑ 𝑿𝟐 − (∑ 𝑿)
(iii). Méthode de substitution
∑ 𝒀𝒕 𝜷𝟏 ∑ 𝑿𝒕
De (1) 𝑵𝜷𝒐 = ∑ 𝒀𝒕 − 𝜷𝟏 ∑ 𝑿𝒕 , 𝜷𝒐 = - Ou simplement
𝑵 𝑵
𝜷𝒐 = 𝒀𝒕̅̅̅ - 𝜷𝟏𝑿𝒕
̅̅̅̅ (3)
(3) dans (2)
𝑵 ∑ 𝑿𝒀− ∑ 𝑿 ∑ 𝒀 𝑪𝒐𝒗(𝑿,𝒀)
̂ =
𝜷𝟏 ̂ =
Ou simplement 𝜷𝟏
𝑵 ∑ 𝑿𝟐 −(∑ 𝑿)𝟐 𝑽𝒂𝒓(𝑿)
Conditions suffisantes de 2nd ordre
𝜕2 𝑆
= ∑2 > 0
𝜕2 𝑆
= ∑ 2 𝑋𝑡 2 > 0 c’est bien un minimum
(2) la méthode de Moments généralisés. Elle consiste à égaliser le moment théorique au

moment empirique. H3 et H6 (H3 l’hypothèse de bonne spécification du modèle ou le
centrage et H6 : hypothèse d’indépendance de la partie déterministe et de la partie
stochastique ou l’exogénéité)
H3 : E(∈) = 0, en moyenne le modèle est bien spécifié (centrage)

Yt = β0 + β1Xt + ∈t . Alors, ∈t = Yt - β0 - β1Xt (1*) dans H3

E(∈) = 0 E (Yt - β0 - β1Xt) = 0
E (Yt) - E(β0) - β1E(Xt ) = 0 𝑌̅ - β0 - β1𝑋̅ = 0
̅ - β1𝑿
β0 = 𝒀 ̅ (2*)
H6 : Cov (X, ∈) = 0
𝟏
̅ )(∈ - ∈
Cov (X, ∈) = 𝑵 ∑(𝑿 − 𝑿 ̅ ) = 0 or E(∈) = ∈
̅ = 0 (H3)
̅ )(∈) = 0 (3*) ∈t = Yt - β0 - β1Xt (1*) dans (3*)
Cov (X, ∈) = ∑(𝑿 − 𝑿
̅ )(𝒀𝒕 −
Cov (X, ∈) = ∑(𝑿 − 𝑿 𝜷𝟎 − 𝜷𝟏𝑿𝒕 ) = 0 (5*) (2*) dans (5*)
̅ )(𝒀𝒕 −
= ∑(𝑿 − 𝑿 ̅ + 𝜷𝟏𝑿
𝒀 ̅ − 𝜷𝟏𝑿𝒕 ) = 0
̅ )[(𝒀𝒕 −
= ∑(𝑿 − 𝑿 ̅ ) − 𝜷𝟏(𝑿𝒕 − 𝑿
𝒀 ̅ )] = 0
̅ )(𝒀𝒕 − 𝒀
= ∑(𝑿 − 𝑿 ̅ ) − 𝜷𝟏 ∑(𝑿 − 𝑿
̅ )(𝑿 − 𝑿
̅) = 0
̅ )(𝒀𝒕 − 𝒀
∑(𝑿−𝑿 ̅)
𝜷𝟏 = ̅̅̅̅̅̅̅̅̅̅̅
∑(𝑿−𝑿)(𝑿−𝑿 ̅)
(6*)
Exemple 3.1 On dispose des séries suivantes
Xt 2 2 5 4 7
Yt 2 4 6 8 10
Travail à faire on vous demande par la méthode des Moindres carrés ordinaires d’
1. écrire le modèle de régression théorique qui explique Y par X

2. écrire le modèle de régression théorique qui explique X par Y
3. estimer ce modèle ; le modèle de la question 1.
4. Calculer le carré du coefficient de corrélation linéaire puis le comparer avec le produit des
pentes trouvées dans 1 et dans 2
Propriétés des estimateurs
̂ et 𝜷𝟏
On montre aisément que les estimateurs 𝜷𝒐 ̂ sont sans biais, de variances minimales
et convergents. De plus, ils sont linéaires. On dit alors qu’ils sont BLUE (Best Linear
Unbiaised Estmator), ce qui signifie « Meilleurs estimateurs linéaires sans biais ».
Rappel :
i. Un estimateur 𝜷 ()
̂ de β est dit sans biais si E 𝛽̂ = β

ii.
Il est dit convergent s’il est sans biais et, de plus, la limite de sa variance tend vers zéro
quand la taille de l’échantillon tend vers l’infini.
On montre que la variance des estimateurs 𝛽𝑜 ̂ et 𝛽1 ̂ s’écrit comme suit :
𝑋̅ 2
̂) = σ ε2 ( 1 +
Var (𝛽𝑜 ̂ = 0 et Var (𝛽1
), lim 𝛽𝑜 ̂ )= 1
σ ε2
𝑛 ∑(𝑋− ̅𝑋)̅̅̅2 𝑛→∞ ∑(𝑋− ̅𝑋)
̅̅̅2
𝝈𝟐
̂) =
On remarque que la Var (𝜷𝒐 ̂ ) et cov (𝜷𝒐,
̅ 𝟐 var (𝜷𝟏
+ 𝑿 ̂ 𝜷𝟏̂ ) = −𝑿 ̂)
̅ var (𝜷𝟏
𝒏
Alors la matrice de variance covariance sera :
𝟏 ̅𝟐
𝑿
( 𝒏 + ∑(𝑿− ̅𝑿) ̂)
̅ 𝒗𝒂𝒓 (𝜷𝟏
2
̅̅̅𝟐 ) −𝑿
Rho = σ ε ( 𝟏
)
̂)
̅ 𝒗𝒂𝒓 (𝜷𝟏
−𝑿 ∑(𝑿− ̅𝑿)
̅̅̅𝟐
3.3 Tests sur les paramètres du modèle (ou test de significativité individuelle)
Après avoir estimé les paramètres du modèle, il est judicieux de vérifier s’ils sont significatifs sur
le plan statistique ou pas. Une approche alternative mais complémentaire à la méthode des
intervalles de confiance pour tester des hypothèses statistiques est l’approche des tests de
signification développée indépendamment par R. A. Fisher et conjointement par Neyman et
Pearson. De manière générale, un test de signification est une procédure par laquelle des
résultats d’échantillons sont utilisés pour vérifier la véracité ou la fausseté d’une hypothèse
nulle12. Pour cela, on procède par des tests.
1. Hypothèse du test Spécification des hypothèses (hypothèse nulle contre hypothèse

alternative)
H0 : β1= 0, la variable indépendante Xt n’explique pas la variable dépendante Yt (X =0)

H1 : β1 ≠ 0, la variable indépendante Xt explique la variable dépendante Yt (X ≠0)
2. La détermination du seuil de signification avec :

α = P (décider H1 /H0 vraie) C’est la probabilité de décider H1 sachant Ho vraie,
3. Calcul de la statistique du test qui est donné par la formule :
En plus des hypothèses H3 et H4 précédemment définies concernant le modèle, on définit une

hypothèse supplémentaire dite de normalité des erreurs.
Précisément, on admet que les erreurs suivent une loi normale de moyenne nulle et de variance σ2ε.
L’hypothèse de normalité des erreurs est indispensable à la construction des tests statistiques. Elle
permet d’établir la normalité des paramètres.
12
L’idée clé derrière les tests de signification est celle d’une « statistique de test » (estimateur) et de la distribution
d’échantillonnage d’une telle statistique sous l’hypothèse nulle. La décision d’accepter ou de rejeter H0 est prise
sur la base de la valeur de la statistique de test obtenue à partir des données disponibles. Une notion essentielle qui
concerne les tests est la probabilité que l'on a de se tromper (cfr tableau p). Il existe deux façons de se tromper lors
d’un test statistique :  La première façon de se tromper est de commettre l’erreur [ou risque] de première espèce,
noté α, qui est la probabilité de rejeter à tort HO alors qu’elle est vraie. On dit, dans ce cas, que α est la probabilité
d’avoir un faux positif.  La deuxième façon de se tromper est de commettre l’erreur [ou risque] de deuxième
espèce, noté β, qui est la probabilité de ne pas rejeter HO alors qu’elle est fausse. On dit, dans ce cas, que β est la
probabilité d’avoir un faux négatif.

Statistique du test
En plus des hypothèses H3 et H4 précédemment définies concernant le modèle, on définit une
hypothèse supplémentaire dite de normalité des erreurs. Précisément, on admet que les erreurs
suivent une loi normale de moyenne nulle et de variance σε2.
L’hypothèse de normalité des erreurs est indispensable à la construction des tests statistiques. Elle
̂ 𝑒𝑡 𝛽1
permet d’établir la normalité des paramètres : 𝛽0 ̂.
En effet, on montre que :
̂ −𝛽0)
(𝛽0
̂ → 𝑁(β0 , Var(β0)) i.e
𝛽0 → N(0,1)13
𝑣𝑎𝑟(𝛽0)1/2
̂ −𝛽1)
(𝛽1
̂ → 𝑁(β1 , Var(β1))
𝛽1 i.e → N(0,1)
𝑣𝑎𝑟(𝛽1)1/2
∑ 𝜺𝟐
Si σ 2 n’est pas connu on l’estime par 𝝈̂ 𝟐 ε =
𝒏−𝟐
Avec εt sont les résidus, ie les erreurs observées à la suite de l’estimation du modèle. Dans ce cas,
̂ −𝛽𝑖)
(𝛽𝑖
𝑣𝑎𝑟(𝛽𝑖)
suit la loi normale à n-2 degré de liberté14 avec i= 0, 1.
̂ −𝛽𝑖)
(𝛽𝑖
On peut en déduire la statistique du test : t-calculé ou simplement tcal = 𝑣𝑎𝑟(𝛽𝑖)
sous hypothèse
̂
𝛽𝑖
nulle (Ho) 𝛽𝑖 = 0 alors tcal = 𝑣𝑎𝑟(𝛽𝑖)
4. La détermination de la statistique t sur la table de Student avec un seuil de signification α et

un degré de liberté n-2.
t-table = tα/2n-2
5. Critères de décision (Règle de décision) : Ilya deux critères de décision (soit t-calculé est
grand que t-lu , soit non)
1. Si |t-calculé | > t-table (tα/2n-2), Alors rejeter Ho

2. Si |t-calculé | < t-table (tα/2n-2), ne pas rejeter Ho
13
On peut noter que les tests de student et de Fischer dépendent de la loi normale. Ainsi, F= tcal 2 = N(0 ; Iσ)2
14
Le degré de liberté correspond au nombre de valeurs que nous pouvons choisir arbitrairement. Il désigne aussi
le nombre de variables aléatoires qui ne peuvent être déterminées ou fixées dans une équation. Les degrés de liberté
correspondent au nombre de valeurs que nous pouvons choisir arbitrairement (par exemple, pour la variabilité
totale, connaissant (n − 1) valeurs, nous pourrons en déduire la n − ème puisque nous connaissons la moyenne de
Y ). 2 La notion de degré de liberté correspond au nombre de valeurs restant réellement à disposition après une
procédure d’estimation statistique. Si un échantillon comprend ÷ valeurs, il faut lui retirer le nombre des
paramètres estimés.

Ou alors si P-value < 0.05 le paramètre est non nul (la variable explicative contribue à l’explication
de la variable expliquée) à 5 %
𝑋−𝐸(𝑋)
P[| 𝜎
| < t ] = 1 - α
0.95
α/2 α/2
- tα/2n-2 + tα/2n-2
Alors si,
̂
𝛽𝑖
1°) tcal = 𝑣𝑎𝑟(𝛽𝑖)
∈ ] −tluα/2, + tluα/2 [ décider Ho
̂
𝛽𝑖
2°) tcal = ∉ ] −tluα/2, + tluα/2 [ décider H1
𝑣𝑎𝑟(𝛽𝑖)
Intervalle de confiance. On montre aisément que :

̂ ± tluα/2(n−2)*Var(βi) ] décider H1
βi ∈ [𝜷𝒊
̂ ± tluα/2(n−2)*Var(βi) ] décider Ho
βi ∉ [𝜷𝒊
Intervalle de prévision (cfr Regis Bourbonais, Econométrie p)
3.4 Analyse de variance

Trois écritures du modèle sont possibles
Yt = β0 + β1 Xt +εt (1*)
̂ = 𝛽̂ 𝑜 + 𝛽̂ 1Xt
𝑌𝑡 (2*)
Yt = 𝛽̂ 𝑜 + ̂𝛽 1Xt + εt (3*)
Compte tenu du fait que : ∑ 𝜀𝑡 = 0 (voir H3 ) et ∑ 𝑦𝑖 = ∑ 𝑦𝑖

̂ , on montre aisément que :
Théorème
La somme des carrés totale (SCT) est égale à la somme des carrés expliquée (SCE) plus la somme
des carrés résiduelle (SCR) :
∑(𝑌 − 𝑦̅)2 = ∑(𝑦̂ − ̅𝑌)

̅̅2 + ∑ 𝜀𝑡 2
̂
∑(𝑌 − 𝑌̅) = ∑(𝑌̂ − ̅𝑌)

̅̅2 + ∑(𝑌 − 𝑌̂) 2
2
̂
SCT = SCE + SCR (4*)

La décomposition (4*) correspond à l’équation d’analyse de la variance ; c’est l’équation
fondamentale d’analyse de la variance, avec
i. SCT : (somme des carrés totale) qui exprime la variance totale

ii. SCE : (somme de carrés expliquée) qui exprime la variance expliquée
iii. SCR : (somme de carrés résiduelle ou de régression) qui exprime la variance résiduelle.
L’équation (4*) va nous permettre de juger la qualité de l’ajustement d’un modèle. En effet, plus la
variance expliquée est proche de la variance totale, meilleur est l’ajustement du nuage de points
sur la droite de régression.
Le modèle est donc jugé à partir du ratio suivant (Le coefficient de détermination R2 est la fraction
de la variabilité totale expliquée par la régression. Plus précisément),
𝑆𝐶𝐸 1−𝑆𝐶𝑅
𝑅2 = ou simplement 𝑅 2 =
𝑆𝐶𝑇 𝑆𝐶𝑇
Ce ratio est appelée coefficient de détermination (ou coefficient d’ajustement R2).
Nota :
i. 0 ≤ R2 ≤ 1
ii. R2 → 1, l’ajustement est meilleur (le modèle est bon)
iii. R2 → 0, l’ajustement est mauvais (le modèle est mauvais)
C’est en soit le pourcentage de variabilité de Y due à la variabilité de Xi
Le tableau d’analyse de la variance (ou tableau d’ANOVA) se présente comme suit :
Source de variabilité Somme des carrée Degré de Somme de

SV SC liberté Carrée moyen
DDL /SCM
Expliquée (X) k-1 = 1 SCE/1
SCE =∑(𝑌̂ − ̅𝑌)
̅̅2
̂
Résiduelle (€) SCR = ∑(𝑌 − 𝑌̂) 2 n-k = n-2 SCR/n-2
Total 2 k-1 + n –k = n-1 SCT/n-1
SCT = ∑(𝑌 − 𝑌̅)
Le tableau d’analyse de la variance ou tableau d’ANOVA15 conduit à la définition de la statistique

de Fisher. Celle-ci nous permet de mieux juger la qualité globale du modèle. Elle se définit comme
suit :
𝑆𝐶𝐸 𝑆𝐶𝐸
𝑆𝐶𝑀𝐸 𝑆𝐶𝑀𝐸
F = 𝑆𝐶𝑀𝑅 = 𝑘−1
𝑆𝐶𝑅 et → F (k-1 , n− 2) pour k = 2 F = 𝑆𝐶𝑀𝑅 = 1
𝑆𝐶𝑅 et → F (1, n− 2)
𝑛−2 𝑛−2
i.e qu’elle suit une loi de Fisher à (1, n-2) degré de liberté.
15
ANOVA de l’Anglais Analysis of variance (analyse de la variance)

3.5 Tests sur le modèle (ou test de significativité globale ou encore test de significativité conjointe)
Ce test permet de tester la nullité de tous les paramètres du modèle hors mis celui relatif à la
constante. Dans le cadre du modèle linéaire simple, il se résume au test de nullité du paramètre β1.
Hypothèse du test
H0 : β1 = 0
H1 : β1 ≠ 0
Règle de décision
i. Si Fcal > Fα(1, n− 2) alors rejeter H0

ii. Sinon, ne pas rejeter H0
Remarque
𝑆𝐶𝐸
𝑅 2 = 𝑆𝐶𝑇 → SCE = SCT *𝑅2
𝑆𝐶𝑅
𝑅2 = 1 − 𝑆𝐶𝑇
→ 𝑆𝐶𝑅 = (1 − 𝑅2 ) ∗
𝑆𝐶𝑇
𝑅2⁄
1
D’où F-cal = (1−𝑅2)/(𝑛−2)
Avec la prise en compte des degrés de liberté, on définit le R2 ajusté comme suit :
𝑆𝐶𝑀𝑅
𝑅̅ 2 = 1 - 𝑆𝐶𝑀𝑇
𝑆𝐶𝑅
(𝑛−1) 𝑆𝐶𝑅
̅2
𝑅 = 1- 𝑛−2
𝑆𝐶𝑇 =1-
(𝑛−𝑘) 𝑆𝐶𝑇
𝑛−1
(𝑛−1) (𝑆𝐶𝑇−𝑆𝐶𝐸)
𝑅̅2 = 1 -
(𝑛−𝑘) 𝑆𝐶𝑇
𝑛−1 (1− 𝑅 2 )
𝑅̅ 2 = 1 - C’est la formule de R-carré corrigé16
𝑛−𝑘
16
Le R-carré à un défaut celui de croitre avec l’augmentation des variables explicatives dans le modèle, même si
elle ne contribue pas à l’explication du modèle alors pour pallier à ce problème on fait recours à ce pseudo R-carré
appelé R-carré corrigé. Toutefois, ce pseudo R-carré ne concerne pas dans la pratique un modèle de régression
simple. , il convient de dire que ce coefficient est souvent critiqué par certains auteurs, en raison du fait qu’il croit
de manière systématique avec l’augmentation des variables explicatives. Pour pallier à cette insuffisance, on peut
utiliser le R-carrée ajusté, connu encore sous le nom de R-carrée corrigé.

Exercices résolus sur le Troisième chapitre
Exercice 1. La méthode des Moindres carrés ordinaires est basée sur un certain nombre
d’hypothèses. On vous demande de discuter la signification des hypothèses suivantes :
a) Bonne spécification du modèle (ou centrage)

b) homoscedasticité
c) absence de colinéarité
d) exogeneité
e) parcimonie
Exercice 2. La consommation totale des ménages Lushois (Yt) et le revenu disponible réel
(Xt) d’un pays entre 2019 et 2023 (en millions d’unités monétaire) sont reproduits dans le
tableau ci-dessous :
Année Xt Yt Travail à faire

2019 10 7 a. Faites le graphique
2020 15 11 b. Spécifiez le modèle de consommation de J.M Keynes
c. Estimez les paramètres du modèle par les MCO;
2021 20 15 d. Etablir une relation linéaire dans laquelle le revenu explique
2022 25 20 consommation finale ;
e. interpréter le coefficient (la pente du modèle) sur le plan économique.
2023 30 27
f. Calculer le coefficient de détermination, le Fisher et le t-de student ;
Exercice 3. Nous disposons des données du tableau ci-dessous : Une relation économique
suggère que le taux d’intérêt nominal R est une fonction croissante du taux d’inflation INF
: R = f(INF), avec ∂R /∂INF > 0
Année Rt INFt a) Estimer les paramètres du modèle et interpréter

2019 8 10 économiquement ;
2020 13 8 b) représenter graphiquement ce modèle ;

c) calculer le coefficient de corrélation linéaire simple ;
2021 7 6
d) le carré du coefficient de corrélation linéaire simple ;
2022 19 4
e) Calculer le coefficient de détermination (R2) et comparez au rxy2
2023 22 2
qu’en déduisez-vous ?
2024 21 6
f) Calculer le coefficient de détermination corrigé ( 𝑅̅ 2 )

Exercice 4. Les données relatives à 5 entreprises manufacturières concernant les dépenses
d’investissement (X) et les bénéfices (Y) ( en millions de francs congolais ) ont permis
d’avoir les données suivantes recensées dans le tableau ci-dessous :
t 1 2 3 4 5
Xt 2 3 1 5 9
Yt 4 7 3 9 17
a) Représenter le nuage des points. Que constatez-vous ?

b) Exprimer Y en fonction de X
c) Calculer l’équation de la droite de régression linéaire
d) Calculer le coefficient de corrélation linéaire et interpréter
e) Calculer la variance estimée de la régression et la variance des paramètres estimés
f) Juger de la qualité de cet ajustement
g) Calculer le F statistique
h) Tester la significativité individuelle et conjointe des paramètres
i) Interpréter le modèle au seuil de 5%
Exercice 5. Un producteur s’intéresse à la liaison pouvant exister entre le rendement d’un

produit (Xi) la quantité de matière première utilisée (Yi). Il relève 9 couples de données
consignés dans le tableau ci-dessous :
Xi 2 4 6 9 14 24 30 36 45
Yi 4 8 10 15 19 30 39 45 50
Travail à faire
(1) Estimer les deux paramètres de la droite de régression simple β0 et β1 et écrire la fonction
de la droite Yt = β0 +β1Xt.
(2) Tester la significativité de la pente.
(3) Construire l’intervalle de confiance au niveau de confiance de 95% pour le paramètre β1.
(4) Calculer le coefficient de détermination R2 et effectuer le test de Fisher permettant de

déterminer si la régression est significative dans son ensemble.
(5) le producteur prévoit respectivement 57 et 69 pour le rendement de produit.

Déterminer les valeurs prévues de la quantité de matière première pour ces deux prévisions,
ainsi que l’intervalle de prévision au niveau de confiance de 95%.

Exercice 6. Soit le tableau suivant issu d’une analyse d’estimation portant sur une
entreprise de prestation VALENTIN SPRL pour une période donnée et comportant deux
(02) variables dont la production (Q) et le travail (L).
Source SS df MS Number of obs = 100

F(1, 98) = 34.74
Model 243.301677 1 243.301677 Prob > F = 0.0000
Residual 686.36898 98 7.0037651 R-squared = 0.2617
Adj R-squared = 0.2542
Total 929.670657 99 9.39061269 Root MSE = 2.6465
production Coef. Std. Err. t P>|t| [95% Conf. Interval]
travail .544286 .0923465 5.89 0.000 .3610274 .7275446

_cons 3.937554 .2691961 14.63 0.000 3.403343 4.471765
Travail à faire
1. De quel type des données s’agit-il ?
2. Formalisez le modèle de régression et déterminez la période
3. Donnez une interprétation des résultats obtenus
4. De la relation qui existe entre la variable dépendante et la variable indépendante incluse
dans le modèle, donnez une interprétation économique
5. Quelle(s) recommandation(s) formulez-vous à la lumière des résultats obtenus ? et que
peut-on conclure de ce modèle ?
6. Donnez la commande stata utilisée pour la réalisation de cette estimation
7. Appréciez la significativité globale du modèle et la qualité d’ajustement
8. Donnez à partir des informations du tableau la somme des carrés expliquée SCE, la
somme des carrés résiduelle et la somme des carrés total. Calculez le R2
9. La constante et la variable capitale sont-elles significatives ? Si oui pourquoi ?
10. Que représente le tableau ci- dessus ?
Exercice 7. Partie B : Questions de cours
1. Définir : régresseur, variable de contrôle.

2. Donner les étapes de la méthodologie économétrique.
3. Donner les hypothèses classiques des MCO dans un modèle de régression linéaire simple
4. Présenter les principales méthodes d’estimation des paramètres et leurs principes
5. Quelle est la différence entre le terme d’erreur et le résidu ?
6. Que capte (a) le terme d’erreur ? (b) La constante ou l’ordonnée à l’origine 𝜷𝟎 ?

Exercice 8. Un statisticien s’intéresse à la liaison pouvant exister entre la croissance économique
d’un pays (Yi) et est le niveau d’inflation (Xi). Il relève 8 couples de données consignés dans le
tableau ci-dessous :
Xt 7 10 13 15 19 21 23 25
Yt 38 35 30 25 20 17 15 13
(1) Déterminer l’équation de la droite de régression de Y sur X.

(2) Le coefficient de la variable X est-il significativement inférieur à (−1) ?
(3) Juger la qualité de cet ajustement et effectuer le test de Fisher permettant de déterminer si la
régression est significative dans son ensemble. Commenter.
(4) Le statisticien prévoit respectivement 26 et 30 pour le niveau d’inflation. Déterminer les
valeurs prévues pour la variable croissance, ainsi que les intervalles de prévision au niveau de
confiance de 95%.
Exercice 9. La fête de la Saint Valentin appelée encore « fêtes des amoureux » est caractérisée par
entre autres l’échange de cadeaux entre les deux partenaires d’un couple. La recherche des
explications liées aux déterminants du volume de cadeaux a provoqué une violente dispute entre
Roméo et Juliette, deux de vos voisins du quartier. En effet, Roméo pense que le volume de cadeaux
(G) offerts par un individu à son partenaire est expliqué par la durée (D) de leur relation, alors que
Juliette est d’avis contraire, estimant que cette durée n’exerce aucune influence sur le volume de
cadeaux.
Ces deux amoureux sont convaincus que vous pouvez trancher les débats, vous que tout le quartier
reconnait en tant que le MAJOR en économétrie de l’Université de Lubumbashi.
En supposant que 𝜶𝟎 est le terme constant et que 𝜶𝟏 est le coefficient associé à la variable
explicative :
1. La spécification du modèle mathématique puis du modèle économétrique des données sur le

volume de cadeaux et la durée de la relation (en mois) est donnée par :
a) D𝒊 = 𝜶𝟎 + 𝜶𝟏G𝒊 + 𝜺𝒊
b) 𝑮𝒊 = 𝜶𝟎 + 𝜶𝟏𝑫𝒊 + 𝜺𝒊
c) 𝑮𝒊 = 𝜶𝟎 + 𝜶𝟏𝑫𝒊
2. Après avoir défini le paramètre, donner une interprétation de 𝜶𝟎 et de 𝜶𝟏.

On se propose d’estimer le modèle par 𝑮𝒊 = 𝜶𝟎 + 𝜶𝟏𝑫𝒊 + 𝜺𝒊 où 𝜺𝒊 est le terme aléatoire normalement
distribué.
En utilisant les données du tableau ci-dessous, déterminez :
(a) Les estimations des estimateurs 𝜶̂𝟎 de 𝛼0 et 𝜶̂𝟏 de 𝛼1.

(b) La somme des carrés totale SCT.
(c) 𝑅2 sachant que la somme des carrés des résidus 𝑺𝑪𝑹 = 𝟓𝟏. 𝟖𝟓𝟐.

A présent, il vous est demandé :
1. D’établir le tableau d’analyse de la variance.

2. De formaliser le test F de Fisher puis de l’effectuer.
3. De calculer la valeur estimée 𝝈̂𝟐, puis la variance estimée de 𝜶̂𝟏.
4. De formaliser et d’effectuer le test t de Student.
5. De vérifier la relation suivante : 𝑭𝒄𝒂𝒍 = (𝒕𝜶̂𝟏)
6. Au regard des différents résultats obtenus, le MAJOR d’économétrie pense-t-il que Juliette a eu
raison dans la dispute l’opposant à son amoureux Roméo ?
G 8 10 12 14 16 18 20 9 24 12 7 7 10 22 21
D 7 6 9 10 11 12 12 7 15 9 7 8 10 13 14
Table2 : Données sur le volume de cadeaux et la durée de la relation (en mois)
Exercice 10. On dispose des séries suivantes Un jeune économiste souhaite modéliser la relation
entre les ventes d’un produit de grande consommation V et les dépenses de publicité PUB de
l’entreprise productrice. Si l’on pense que la « productivité », en termes de ventes, des dépenses de
publicité croît avec leur montant, on peut écrire : V = α + β PUB , avec 0 < β < 1 Cette spécification
implique en effet une dérivée première de V par rapport à PUB, qui croît avec le montant de PUB.
Autrement dit, au fur et à mesure que les dépenses publicitaires augmentent, l’augmentation des
ventes devient de plus grande.
xt 1 2 3 4 5
yt 2 4 5 7 10
1) écrire le modèle de régression théorique qui explique Y par X

2) écrire le modèle de régression théorique qui explique X par Y
3) estimer ce modèle ; le modèle de la question 1.
4) déterminer la variance des paramètres estimés
5) calculer le coefficient de détermination
6) tester la nullité du paramètre β1
7) Donner un intervalle de confiance pour β1.
Exercice 11. Soit un modèle linéaire simple : Yi = β0 + β1Xi + εi i = 1, ..., n on donne les informations
suivantes : ∑𝑛𝑖=1 𝑋𝑖𝑌𝑖 = 184500, ∑𝑛𝑖=1 𝑌𝑖 2 = 26350, ∑𝑛𝑖=1 𝑋𝑖 2 = 1400000, 𝑌̅= 60 et 𝑋̅= 400 et n = 7
(1) Estimer les coefficients du modèle

(2) Evaluer la qualité de cet ajustement
(3) Tester la significativité globale du modèle
(4) Calculer l’intervalle de confiance de l’estimateur β1

Exercice 12. : On considère le modèle de régression linéaire simple Yt = a + bXt   (t =1,....,n)
;avec les hypothèses habituelles .un échantillon de 20 observations (x ;y) a donné les résultats
suivants :
∑𝑛𝑖=1 𝑌𝑖 = 21.9, ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 = 186.2, ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2 = 86,9 , ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅) = 106,4
1) calculer le coefficient de corrélation linéaires entre X et Y .commenter ce résultat

2) sur la base des résultats ci-dessus, estimer les résultats du modèle
3) estimer les variances de a et b, puis présenter les résultats du modèle
4) calculer le coefficient de détermination R, commenter ce résultat
5) implémenter le test H0: b  0 contre : H1 b  0 prendre   5%
6) implémenter le test H0 : a  0 contre H1 : a  0 prendre   5%
7) implémenter le test H0 : a  0 et b  0 contre H1 : a  0 ou b  prendre   5%
8) à l’aide de l’intervalle de confiance de niveau 95%, prévoir la valeur de Y pour X=10.
Exercice 13 Les ventes V d’une entreprise sont une fonction croissante de ses dépenses de
publicité PUB, mais au fur et à mesure que les dépenses de publicité augmentent, l’accroissement
des ventes devient de plus en plus faible, d’autant plus que le niveau de départ des dépenses
publicitaires est élevé.
La relation entre les ventes V et les dépenses de publicité PUB est-elle bien représentée par une des
spécifications suivantes, et laquelle ?
Vt = β1 + β2PUBt, avec β1 > 0 et β2 > 0
Vt = β1 + PUBtβ2 avec β1 > 0 et 0 < β2 < 1
Vt = ln(β1 + PUBβ2), avec β1 > 0 et 0 > β2 > −1
Solution La deuxième spécification représente bien la relation entre ventes et dépenses publicitaires.
La dérivée de Vt par rapport à PUBt vaut en effet β1β2PUBβ2−1 t et cette dérivée diminue quand PUBt
augmente, parce que β1 > 0 et 0 < β2 < 1.
Exercice 14 Un producteur s’intéresse à la liaison pouvant exister entre la quantité produite d’un
bien et quantité d’une matière première utilisée. Il relève des données consignées dans le tableau
ci-dessous qu’il soumet à votre analyse :
Table 1: Base de données.
i 1 2 3 4 5 6 7 8 9
Xt 2 4 6 9 14 24 30 36 45
Yt 4 8 10 15 19 30 39 45 50

1. Dans cette étude, quel est :
a. la variable dépendante Y ?
b. la variable indépendante X ? Justifier votre choix.
2. Faire une représentation graphique de la relation entre X et Y. Commenter.
3. De ce graphique,
a. formuler une spécification mathématique du modèle.
b. en déduire la spécification économétrique du modèle.
4. Dans le modèle économétrique, combien y-a-t-il :
a. de variables?
b. de paramètres?
c. de variable aléatoires?
5. Dans le modèle économique, combien y-a-t’il:
a. de variables?
b. de paramètres?
c. de variables aléatoires?
6. Quel est le signe attendu de chaque paramètre?

7. Discuter des valeurs prises par:
a. le paramètre constant
b. le paramètre associé à la variable indépendante.
8. Calculer pour chaque variable:
a. la moyenne
b. la variance 1 c. l’écart-type
Exercice 15. Le producteur fait de nouveau appel à vous en utilisant les mêmes données que
précédemment. Il vous demande cette fois ci:
1. d’Estimer les paramètres du modèle et écrire le modèle économique estimé.

2. de Commenter les résultats obtenus.
3. de Calculer le coefficient de détermination et le coefficient de détermination ajusté. Commenter
4. de Faire le test de significativité globale. Commenter
5. de Tester la causalité de la variable indépendante.
6. de Construire l’intervalle de confiance au niveau de confiance de 95% pour le paramètre associé
à la variable indépendante.
Exercice 16. Le producteur revient vous voir, en vous disant qu’il prévoit respectivement utiliser des
quantités de 57 et 69 pour la variable indépendante. Pour cela, il vous demande:
1. De déterminer les valeurs prévues de la quantité de matière première pour ces deux prévisions
2. De déterminer pour ces deux prévisions les différents intervalles de prévision au niveau de
confiance de 95%. Que constatez-vous?
Exercice 17. Une ONG s’intéresse à la liaison pouvant exister entre la croissance économique des
pays de la zone d’Afrique Centrale et leur niveau d’inflation. Pour cela elle relève des données sur
certains pays qu’elle consigne dans le tableau ci-dessous.

Table 2: Base de données.
i RDC ZAMBIE ANGOLA TANZANIE RCA RWANDA BURUNDI CONGO
Xt 7 10 13 15 19 21 23 25
Yt 38 35 30 25 20 17 15 13
1. Dans cette étude, quel est :
a. la variable dépendante Y ?
b. la variable indépendante X ? Justifier votre choix.
2. Faire une représentation graphique de la relation entre X et Y. Commenter.
3. Quel est le signe attendu du paramètre associé à la variable explicative? Justifier votre choix.
5. Calculer pour chaque variable:
a. la moyenne
b. la variance
c. l’écart-type
d. Commentez
Exercice 18. En utilisant les données tu tableau précédent, l’ONG vous demande
1. d’Estimer les paramètres du modèle et de Déterminer le modèle économique estimé

2. Le coefficient associé à la variable indépendante est-il significativement inférieur à −1 ?
3. Juger la qualité de cet ajustement
4. Effectuer le test de Fisher permettant de déterminer si la régression est significative dans son
ensemble. Commenter.
5. L’ONG prévoit respectivement 26 et 30 pour le niveau d’inflation.
Déterminer les valeurs prévues pour la variable croissance, ainsi que les intervalles de prévision au
niveau de confiance de 95%.
Exercice 19. La FSEG de l’Université de Lubumbashi, étudie la performance des étudiants de

Licence 3 en économétrie I de son université. Pour cela une étude a été menée auprès d’un certain
nombre d’étudiants. Les informations ainsi recueillis ont été rassemblées dans le tableau ci-dessous
La FSEG fait appel à vous en tant que économètre et vous donne le cahier de charge suivant:

1. Classer les variables suivant les différents échelles
2. Dresser, pour la variable “Mention”, le tableau:
a. des effectifs.
b. des fréquences
c. des fréquences cumulées
d. Faire un diagramme à bandes des fréquences
e. Faire un diagramme circulaire des effectifs
f. Commenter les faits marquants
3. Dresser, pour la variable “Genre”, le tableau:
a. des effectifs b. des fréquences c. Est-il possible de dresser un tableau des fréquences
cumulées? Pourquoi?
Comme deuxième cahier de charge, la FSEG vous demande de :
1. Faire :
a. un tableau croisé de la variable “Mention” en fonction du “Genre”

b. Commenter les résultats
2. Calculer pour la variable “Note”
a. La moyenne, l’écart-type, le minimum, le maximum b. Commenter
3. Calculer la moyenne, l’écart-type, le minimum et le maximum de la variable “Note” selon
a. Le Genre. Commenter
b. La Langue. Commenter
4. Pour capter la performance en économétrie des étudiants
a. Quels sont les principales variables candidates?
b. Parmi ces variables, laquelle contient le plus d’informations? Justifier votre choix.
8 Exercice C (Saison 3) Troisième Cahier de charge
1. Concernant la variable “Lieu de résidence” est-il possible de l’utiliser tel quel? Justifier votre choix.
2. S’il vous était demandé d’utiliser cette variable pour une analyse de la performance en
économétrie,
a. Comment traiteriez vous cette variable (donner deux façons) ?
b. A partir de cette variable “Lieu de résidence” générer deux variables traitées (une quantitative
et une qualitative)
c. Pour chaque nouvelle variable, faire une analyse descriptive appropriée.
9 Exercice C (Saison 4) Quatrième Cahier de charge
1. Faite une représentation graphique de la relation entre l’age et le note finale en éonométrie.
Commenter
2. En utilisant une approche linéaire,
a. estimer les paramètres du modèle de le relation entre la note et l’age

b. écrire le modèle économique estimé
3. Tester la significativité de chaque paramètre du modèle. Commenter
4. Tester la significativité globale du modèle. Commenter
5. Evaluer la qualité d’ajustement du modèle. Que constater vous? (On pourra comparer ce résultat
à ceux obtenu dans les Exercice A et B)
6. Interpreter les résultats du modèle obtenu
Cinquième Cahier de charge

1. Faite une représentation graphique de la relation entre le nombre d’heures d’étude et le note
finale en éonométrie. Commenter
2. En utilisant le variable traitée issue de “lieu de résidence” faite une analyse descriptive du nombre
d’heures d’études.
a. estimer les paramètres du modèle de le relation entre la note et le nombre d’heures d’études
c. Tester la significativité de chaque paramètre du modèle. Commenter
d. Tester la significativité globale du modèle et évaluer la qualité d’ajustement du modèle au
données.
e. Interpreter les résultats du modèle obtenu
a. estimer les paramètres du modèle de le relation entre la note et l’âge et le nombre d’heures
d’études.
d. Tester la significativité globale du modèle et évaluer la qualité d’ajustement du modèle au
données.
e. Interpréter les résultats du modèle obtenu
a. estimer les paramètres du modèle de le relation entre la note et l’âge, le nombre d’heures
d’études et la variable traitée du “lieu de résidence”.
d. Tester la significativité globale du modèle et évaluer la qualité d’ajustement du modèle aux
données.
e. Interpréter les résultats du modèle obtenu
Exercice 20. On désire étudier la relation entre la consommation (C) et le revenu (Y) de quelques
étudiants de l’Université de Lubumbashi/UNILU. Pour cela on utilise un modèle économétrique de
la forme :
𝑴𝟏 : 𝑪𝒊 = 𝜷𝟎 + 𝜷𝟏𝒀𝒊 + 𝜷𝑌𝑖 2 + 𝜺𝒊 .
(1) Le modèle mathématique qui a permis d’obtenir le modèle (M1) est alors :
a. 𝐶 = 𝛽0 + 𝛽1𝑌 + 𝛽2𝑌
b. 𝐶 = 𝛽0 + ln (𝛽1𝑌𝛽2𝑌2)
c. 𝐶 = 𝛽0 + 𝛽2𝑌 2
d. 𝐶 = 𝐴𝑌 𝛽1(𝑌 2) 𝛽2
e. Pas de bonne réponse
(2) Dans le modèle 𝑀1 la propension marginale à consommer est :
a. Constante
b. Variable en fonction du revenu
c. Variable en fonction de la consommation
d. Constante mais différente de 𝛽1

(3). On fait l’hypothèse que 𝛽2 = 0 (valable jusqu’à la question 6).
On obtient le modèle 𝑴𝟐 : 𝑪𝒊 = 𝜷𝟎 + 𝜷𝟏 + . La valeur estimée du paramètre constant est :
a. 𝛽̂0 = 10.0
b. 𝛽̂0 = 15.95
c. 𝛽̂0 = 08.3
d. 𝛽̂0 = 0.11 4.
(4) La somme des carrés totale est :
a. 𝑆𝐶𝑇 = 63.00
b. 𝑆𝐶𝑇 = 64.00
c. 𝑆𝐶𝑇 = 63.058
d. 𝑆𝐶𝑇 = 63.58 5.
(5) La somme des carrés des résidus est :

a. 𝑆𝐶𝑅 = 42.77
b. 𝑆𝐶𝑅 = 42.077
c. 𝑆𝐶𝑅 = 43
d. 𝑆𝐶𝑅 = 42 6.
(6) Le coefficient de détermination est :
a. 𝑅2 = 0.19
b. 𝑅2 = 0.70
c. 𝑅2 = 0.32
d. 𝑅2 = 0.33
(7) En supposant que la valeur de 𝛽̂ 1 dans le modèle 𝑀1 est significative, cette valeur est-elle en lien
avec la théorie économique ?
a. Non, pas du tout

b. Uniquement la valeur la valeur mais pas son signe
c. Oui mais à la fois sur la valeur et les signe
d. Aucun
On donne le tableau suivant : (vous servir de ce tableau pour répondre aux questions ci-dessus)
Consommation (Ci) 16 18.25 22.25 13.25 18.25 20 22.16

Revenu (Yi ) 10 15.00 35.00 5.00 55.00 20 32.00
Table1 : Consommation et revenu de 07 étudiants

Chapitre IV : Le modèle de régression multiple
Le modèle de régression multiple est une extension du modèle de régression simple. En effet, dans
le chapitre 3, nous avons considéré un modèle économétrique comportant une variable explicative.
Dans la pratique, les phénomènes sont bien plus complexes pour être expliquer par une seule
variable. Afin de se rapprocher de la réalité, nous envisageons dans ce chapitre le cas de k variables
explicative (k >1).
4.1 Présentation
Ce modèle s’écrit :
Yt =β0 +β1X1t +β2X2t + ...+βk Xkt +εt (4.1*)
Yt : variable expliquée à la date t,
X1t : variable explicative 1 à la date t ,
X2t : variable explicative 2 à la date t
, Xkt : variable explicative k à la date t ,
εt ; terme d’erreur et
β0 , β1, β2 ,…,βk sont des paramètres.

t = 1, 2,3,..., n sont les individus.
Pour la résolution du modèle (4.1) une formulation matricielle s’impose. En effet, l’observation du
modèle dans sur les n individus permet d’écrire le système de la forme matricielle étendue suivant:
Y1 = β0 +β1X11 +β2X21 + ...+βk Xk1+ ε1
Y2 = β0 +β1X12+β2X22 + ...+βk Xk2 + ε2
Y3 = β0 +β1X13 +β2X23 + ...+βk Xk3 + ε3
Y4 = β0 +β1X14 +β2X24 + ...+βk Xk4 + ε4 (4.2*)
Y5 = β0 +β1X15 +β2X25 + ...+βk Xk5 + ε5
…………………………………
Yn = β0 +β1X1n +β2X2n + ...+βk Xkn +εn

𝑌1 𝜷𝟎 𝜀1
1 𝑋11 𝑋21. . 𝑋𝑘1
𝑌2 1 𝑋12 𝑋22. . 𝑋𝑘2 𝜷𝟏 𝜀2
𝑌3 𝜷𝟐 𝜀3
Posons Y = ; X = 1. 𝑋13
. 𝑋23
. .. .. 𝑋𝑘3
. ;β = ;ε =
. . .
. . . . . . . . .
(𝑌𝑛) (1 𝑋1𝑛 𝑋2𝑛. . 𝑋𝑘𝑛) ( 𝜷𝒌) ( 𝜀𝑛 )
Et on a : Y = Xβ+ε ( 4.3*)
Pour la résolution du modèle (4.3*), il est également indispensable que deux hypothèses
supplémentaires soient formulées en marge de celles formulées au chapitre précédent.
H7 : Absence de multi colinéarité ou absence de colinéarité entre les variables explicative i .e la

matrice (X’X) est régulière.
H8 : Parcimonie, le nombre d’observations est supérieur au nombre de variable.

(ou la taille de l’échantillon N doit être supérieure au nombre de paramètre à estimer ; N > k)17
4.2 Estimation des paramètres

̂ sont obtenus par la méthode des moindres carrés
Comme au chapitre précédent, les estimateurs 𝛽𝑖
ordinaires (MCO). Celle-ci consiste à minimiser la somme des carrés des écarts entre les valeurs
observées et les valeurs estimées. Ce qui revient à résoudre le programme ci-après : Min ε’ε
Or εε' = (Y − Xβ)’(Y − Xβ)
= (Y '−β' X ')(Y − Xβ)
= Y 'Y −Y ' Xβ−β' X 'Y +β' X ' Xβ
Or β'X 'Y est un scalaire, et Y 'Xβ la transposé de β'X 'Y d’où les deux quantités sont identiques. On
écrit alors :
εε' =Y 'Y − 2β'X 'Y +β' X ' Xβ Ainsi,
Conditions nécessaires du premier ordre :
̂ = 0 ⇒ X 'X 𝛽𝑖
=−2X 'Y+ 2X ' X𝛽𝑖 ̂ = X 'Y , Pour isoler 𝛽𝑖
̂ , on pré multiplie les deux membres
̂ =(X ' X)−1 (X 'Y)

par (X ' X)−1 d’où : 𝜷𝒊
17
Si n = k , SCE = SCT c’est-à-dire que SCR = 0 ou R2 = 1 On ne peut plus utiliser une méthode d’estimation (on
calcul juste /méthode de substitution par ex )

̂ =(X ' X)−1 (X 'Y)
𝜷𝒊
Conditions suffisantes du deuxième ordre
𝜕 𝜕𝜀′𝜀
( )= 2X’X Matrice définie positive18, donc c’est bien un minimum
𝜕𝛽 𝜕𝛽
Exemple 1
Un agent économique désire établir la relation entre la quantité de biens produite (Y) et la valeur
des inputs ( X1 ) et ( X 2 ) nécessaire pour cette production. A cet effet, il réalise des relevés de la
production et des inputs pendant une dizaine (10) de jours et postule la forme fonctionnelle
suivante : Yi =β0 +β1X1i +β2X2i +εi
10 2 2 11.8
Sachant que X’X = ( 2 7 1) et X’Y = ( 7.1 )
2 1 7 4.1
Travail à faire
(a) Estimer β0, β1 et β2 sachant que X1 est le facteur capital et X2 facteur travail
(b) Déterminer à partir des informations suivantes les données des X1 , X2 et Y pour les 10 jours
(c) Interpréter le modèle.
1.6. Validation théorique des estimateurs

Le théorème de Gauss-Markov vu précédemment stipule que les estimateurs doivent être BLUE
(Best = Meilleur, Linear = linéaire, Unbiesed = sans biais et Estimator = estimateur)
i. ̂ est dit sans biais si : E (𝜷

Un estimateur 𝜷 ̂) = β
Espérance mathématique de 𝛽̂ ou E (𝛽̂ )
E (𝛽̂ ) = E((X ' X )−1 (X 'Y))
= E((X ' X )−1 (X '(Xβ+ε)))
= E((X ' X )−1 X ' Xβ+(X ' X )−1 X 'ε)
=β+(X ' X)−1 X ' E(ε) or par hypothèse (voir H3 ) E(ε)= 0
D’où : E (𝛽̂ ) = β on en déduit que beta estimé est sans biais
18
La notion de matrice définie positive en dimension n>2, est identique à celle de réel positif en dimension 1. En
effet, une propriété mathématique stipule que pour toute matrice X inversible, la matrice X’X est définie positive

ii. Meilleur (variance minimale) un estimateur est dit meilleur lorsque sa variance est
minimale possible
La variance de β
Var(𝛽̂) = E((βˆ −β)(βˆ −β)') or 𝛽̂ – β = (X ' X)−1 X 'ε d’où
Var(𝛽̂) =E(((X ' X)−1 X 'ε)((X ' X)−1 X 'ε)')
=E(((X ' X )−1 X 'ε)(ε' X (X ' X )−1 ))
=E(X ' X)−1 X 'εε' X (X ' X)−1
=(X ' X)−1 X ' E(εε')X (X ' X)−1 or par hypothèse (voir H 4 ), E(εε')=σε2I
d’où : ̂ ) = σε2(X 'X )−1

Var(𝜷
Avec : Var(𝛽̂) variance de Beta ; σε2 variance de l’erreur, on peut montrer aisément que lorsque la
variance des erreurs n’est pas connue (σε2 inconnu), on peut l’estimer à travers les résidus du modèle
̂ 𝜀̂
𝜀′
par : ̂
𝜎𝜀2 = et (X 'X)−1 L’inverse de la matrice des variables explicatives.
𝑛−𝑘−1
Ainsi, la matrice de variance covariance sera donnée par :
𝐶11 𝐶12 … 𝐶1𝑘

Var(𝛽̂) = σε2 [𝐶21 𝐶22 … 𝐶2𝑘] , Var(𝛽1
̂ ) = σε2C1, Var(𝛽2
̂ ) = σε2C22
𝐶𝑘1 𝐶𝑘2 … 𝐶𝑘𝑘
̂ ) = σε2Ckk, l’écart-type estimé de beta par : σε2 √𝐶𝑘𝑘 et la covariance(𝛽1

Var(𝛽𝑘 ̂ , 𝛽2
̂ ) = σε2C12 …
• Analyse de la variance
Comme dans le cas de la régression simple, l’équation fondamentale de la variance est établie par
le théorème suivant :
La somme des carrés totale (SCT) est égale à la somme des carrés expliquée (SCE) plus la somme des
carrés résiduelle (SCR) :
∑(𝑌 − 𝑦̅)2 = ∑(𝑦̂ − ̅𝑌)
̂̅̅2 + ∑ 𝜀𝑡 2
∑(𝑌 − 𝑌̅) = ∑(𝑌̂ − ̅𝑌)

̅̅2 + ∑(𝑌 − 𝑌̂) 2
2
̂
SCT = SCE + SCR
La décomposition (4*) correspond à l’équation d’analyse de la variance ; c’est l’équation
fondamentale d’analyse de la variance.

Remarque : De cette relation on montre que :
̂ X 'Y + 𝜀̂′𝜀̂ ⇒
Y 'Y =𝛽′ 𝜀̂′𝜀̂= ∑ 𝜀 2 =Y 'Y − 𝛽′
̂ X 'Y
Le tableau d’analyse de la variance, quant à lui, s’écrit :
Source de la Somme des carrées Degré de liberté Somme des carrées

variation moyens
X1, X2, X3,…, Xk SCE = ∑(𝑌̂ − ̅𝑌)
̅̅2
̂ k SCE/k
ε SCR = ∑(𝑌 − 𝑌̂) 2 n- k -1 SCR/(n - k - 1)
total 2 n-1 SCT/ n-1
SCT = ∑(𝑌 − 𝑌̅)
Coefficient de détermination
Le modèle est donc jugé à partir du ratio suivant (Le coefficient de détermination R2 est la fraction
de la variabilité totale expliquée par la régression. Plus précisément),
𝑆𝐶𝐸 1−𝑆𝐶𝑅
𝑅 2 = 𝑆𝐶𝑇 ou 𝑅 2 = 𝑆𝐶𝑇
Ce ratio est appelée coefficient de détermination. 0 ≤ R2 ≤ 1

1. Si R2 → 1, l’ajustement est meilleur (le modèle est bon)
2. Si R2 → 0, l’ajustement est mauvais (le modèle est mauvais)
Toutefois, il convient de dire que ce coefficient est souvent critiqué par certains auteurs, en raison
du fait qu’il croit de manière systématique avec l’augmentation des variables explicatives. Pour
pallier à cette insuffisance, on peut utiliser le R-carrée ajusté, connu encore sous le nom de R-
carrée corrigé.
𝑆𝐶𝑅
𝑅̅ 2 = 1 - 𝑑𝑑𝑙
𝑆𝐶𝑇
𝑑𝑑𝑙
𝑆𝐶𝑀𝑅
̅𝑅 2 = 1 -
𝑆𝐶𝑀𝑇
𝑆𝐶𝑅
(𝑛−𝑘− 1) 𝑆𝐶𝑅
𝑅̅ 2 = 1- 𝑛−2
𝑆𝐶𝑇 =1-
(𝑛−1) 𝑆𝐶𝑇
𝑛−1
(𝑛−𝑘− 1) (𝑆𝐶𝑇−𝑆𝐶𝐸)
𝑅̅ 2 = 1 - (𝑛−1) 𝑆𝐶𝑇
𝑛−1 (1− 𝑅2 )
𝑅̅ 2 = 1 - C’est la formule de R-carré corrigé
𝑛− 𝑘−1 .

Exemple 2
Reprenant les données de l’exercice précédent, déterminer la matrice de variance covariance des
Coefficients estimés, puis calculer le coefficient de détermination sachant que : Y 'Y =19.34 et
SCT = 5.42
4.4 Tests sur les coefficients
A la suite des estimations, plusieurs types de tests peuvent être nécessaires pour juger la qualité du
modèle.
4.4.1 Test de significativité globale
Le test de significativité globale s’intéresse à tous les paramètres du modèle de manière générale
et essaye de donner une réponse à la question suivante : existe-t-il au moins un paramètres
statistiquement non nul, hormis le terme constant ? Pour mener à bien ce test, nous verrons
successivement ses hypothèses, la statistique de test et la règle de décision.
Hypothèse du test
H0 : β1 =β2 =β3 = ... =βk = 0 Aucune variable Xi n’explique Yi contre
H1 : ∃ βi ≠ 0 / i∈{1,2,3,...,k} il existe au moins une variable Xi qui explique Yi
Statistique du test
Ce test est conduit par la statistique de Fisher, c’est d’ailleurs pour cette raison qu’on l’appelle
habituellement « Test de Fisher ».
𝑆𝐶𝐸 /𝑑𝑑𝑙𝑆𝐶𝐸 𝑆𝐶𝐸 /𝑘

Fcal = 𝑆𝐶𝑅/𝑑𝑑𝑙𝑆𝐶𝑅
= 𝑆𝐶𝑅 → F(k, n−k −1)
𝑛−𝑘−1
Règle de décision
1. Si Fcal > Fluα(k,n−k −1) Alors rejeter H0

2. Si Fcal < Fluα(k,n−k −1) Décider H0
4.4.2 Test de significativité individuelle
Quand on conclut qu’il existe au moins une variable indépendante Xi qui explique la variable
dépendante Yi, on ne sait pas avec précision (les)laquelle(s) des Xi ? Le test de significativité
individuelle s’intéresse aux différents paramètres pris individuellement. Pour un paramètre βi,
i∈{0,1,2,3,...,k} donné, il essaye de donner une réponse à la question suivante : βi est-il statiquement
non nul ?

Hypothèse du test
H0 : βi = 0
H1 : βi ≠ 0
Statistique de test
Pour mener à bien ce test, on utilise la statistique de Student, c’est d’ailleurs pour cette raison qu’on
l’appelle habituellement « test de Student ». En effet, la statistique de test est :
̂
𝛽
t-cal = → T (n−k −1)
𝜎𝛽ˆ
Règle de décision
1. Si |t-Cal| > t α/2 - table (n−k −1) alors rejeter H0

2. Si |t-cal| < t α/2 - table (n−k −1) décider H0
Exemple
En considérant les résultats de l’exemple précédent, conduisez les tests appropriés
4.4.3. Test sur les restrictions linéaires

A la suite des estimations, l’on peut être amené à effectuer les tests sur des combinaisons linéaires
de paramètres. Par exemple, si le modèle estimé est une fonction de production de type Cobb
Douglass, on peut s’interroger sur la nature des rendements d’échelle.
Les tests de restriction linéaire porte sur des combinaisons de paramètres que nous pouvons
résumer par l’écriture : Rβ= r.
Où : R : matrice d’ordre (q,k+1) ; β vecteur (k+1,1) et r : une matrice (q,1), q :

nombre de restriction.
Hypothèses du test
H0 : Rβ= r
H1 : Rβ≠ r
𝑆𝐶𝑀𝐸
Statistique de test F =
𝑆𝐶𝑀𝑅
Règle de décision
1. Si Fcal > Flu, rejeter H0

2. Si Fcal > Flu, décider

Exemple :
En reprenant les données des exemples précédents, peut-on dire que β1 +β2 = 1 ?
Remarque : Par test de restriction linéaire, il faut noter deux éléments principaux : restriction et
linéaire. Restriction, parce que nous imposons des contraintes sur les coefficients estimés. Linéaire,
parce que la contrainte imposée doit avoir une forme linéaire.
4.4.4. Test de changement de structure
A la suite de l’estimation d’un modèle, on peut être également amené à s’interroger sur la stabilité
de la relation estimée sur l’ensemble de la période considérée. Autrement dit, on pourrait se
demander si la structure des coefficients estimés est la même sur deux sous périodes prédéfinies.
Le test statistique qui permet de se prononcer sur cette problématique est le test de CHOW.
Pour le conduire, on procède en plusieurs étapes :
Etape 1 : Estimation du modèle sur l’ensemble de la période, puis récupération de la somme des
carrés résiduels que nous pouvons noter SCR
Etape 2 : Estimation du modèle sur chacune les deux sous périodes, puis récupération de la somme
des carrés résiduelle que nous pouvons noter SCR1 et SCR2.
Hypothèse du modèle
H0 :β=β1 =β2
H1 :∃i tq β=βi i =1 , 2
β : Vecteur des paramètres estimés sur l’ensemble de la période
βi : Vecteur des paramètres estimés sur la sous période i.
Statistique du test
Fcal =
ddl1 = n− (k +1) −[n1 − (k +1)]−[n2 − (k +1)]= k +1 ; ( car n = n1 +n2)
ddl2 =[n1 − (k +1)]−[n2 − (k +1)]= n− 2(k +1)
Règle de décision

Exemple
On considère le modèle yt = a0 +a1x1t +a2x2t +a3x3t +εt

L’estimation de modèle sur la période 1987-2000 a permis d’obtenir une somme des carrés résiduels
de : 67,45. Mais, il se trouve que les variables mises en jeu dans cette équation sont des variables
macroéconomiques d’un pays de la zone CEMAC. Cette zone a connu un choc en 1994 et on se
demande si celui-ci n’a pas perturbé la structure du modèle. L’estimation du modèle sur la période
1987-1993 donne une SCR de 27,31 tandis que l’estimation sur la période 1994-2000 donne
SCR=20,73. Conduire le test approprié.
4.5. Modèle de régression avec des variables binaires
Jusqu’ici les variables utilisées dans les régressions ont été toutes quantitatives ; mais un modèle
de régression peut également comprendre des variables qualitatives comme la nationalité, le sexe,
la race, la religion ou même un évènement tel qu’une grève, une éruption volcanique etc.
Ces variables qualitatives appelées également variables dichotomiques, binaires, artificielles,

muettes (Dummy) ne prennent que deux valeurs à savoir :
Di = 1 pour signifier la présence de l’attribut ou de l’événement ;
Di = 0 pour signifier son absence.
Les modèles de régression avec des variables binaires peuvent être regroupés en deux catégories :
1. Le Modèle d’analyse de la variance ou modèle ANOVA
Les modèles de régression d’une variable quantitative sur des variables binaires, appelés modèles
d’analyse de la variance est régression d’une variable quantitative Yi sur une ou plusieurs variables
qualitatives (Modèle ANOVA).
Yi = a0 +a1D1t
Yi = a0 +a1D1t +a2D2t +….+ a3Dkt +εt
Nous allons exposer ce modèle à travers un exemple comprenant une variable dépendante
quantitative Yi et une seule variable binaire Di. Le modèle pouvant s’étendre à plusieurs variables
qualitatives. Prenons l’exemple d’une entreprise minière qui utilise pendant l’exploitation d’un
produit cobaltifere saisonnier des ouvriers nationaux et étrangers.
Soient Yi les salaires payés et Di=1 si le salaire est perçu par un ouvrier national et Di=0 si le salaire
est perçu par un ouvrier étranger.
Disposant des informations reprises au tableau 4.1., nous allons faire la régression :
Yi = β1+β2Di+ ui (4.1)
Di 1 1 1 0 0 1 0 1 0 1
Yi 50 55 57 60 62 59 64 63 68 66

Les résultats obtenus sont : Ces résultats renseignent que le salaire moyen des ouvriers étrangers
est de 63,5 tandis que celui des ouvriers nationaux est de 63,5-5,17=58,33. Mais puisque β2 n’est pas
significatif nous pouvons conclure qu’il n’y a pas de différence significative entre les salaires des
nationaux et des étrangers. Nous pouvons avoir plus d’une variable binaire comme variable
explicative, par exemple le sexe des ouvriers. Nous allons alors ajouter cette dernière variable
binaire au tableau précédent pour constituer le tableau suivant
D1i 1 1 1 0 0 1 0 1 0 1
D2i 1 0 0 1 1 0 0 1 0 1
Yi 50 55 57 60 62 59 64 63 68 66
Le modèle à estimer est alors : Yi = β0+ β1D1i+ β2 D2i +ui (4.3) où D1i =1 si ouvrier national D1i =0 si
ouvrier étranger D2i =1 si ouvrier masculin D2i =0 si ouvrier féminin La régression faite sur Eviews
donne les résultats ci-après : Y = 63.7 - 5.166666667 D1i - 0.4 D2i t-stat [20.24860] [-1.505240] [-
0.118938] Les résultats ci-dessus montrent qu’il n’y a pas de discrimination d’après le sexe, ni d’après
la nationalité ; car les coefficients associés aux variables sexe et nationalité sont non significatifs.
2. modèle d’analyse de la covariance ou modèle ANCOVA
C’est un modèle de régression d’une variable quantitative sur un mélange des variables
quantitatives et variables qualitatives appelés des modèles de covariance (modèles ANCOVA) ;
Yi = a0 +a1D1t +a2X1t +….+ a3Dkt + a3Xkt + εt
Supposons maintenant que nous voulons connaître si dans cette même entreprise qui emploie des
ouvriers nationaux et étrangers, il existe une discrimination
EXERCICES SUR LE CHAPITRE 4

Exercice 1. A partir des données du tableau ci-après, on demande de calculer les
estimations de 𝛽0
̂ ; 𝛽1 ̂ . On suppose que la consommation totale des ménages
̂ 𝑒𝑡 𝛽2
Yt augmente avec leur revenu disponible réel X1t, mais diminue quand le taux d’intérêt
X2t monte.
Année X1t X2t Yt Travail à faire

2019 10 20 7 a. Estimer les paramètres du modèle
2020 15 18 11 Yt =β0 + β1X1t + β1X2t ;
b. présenter le modèle dans un graphique si possible ;
2021 20 16 15
c. sans tenir compte du test, interpréter les résultats.
2022 24 14 20
2023 30 12 27
Exercice 2. Soit le modèle suivant : Yt = β0 + β1X1t + β1X2t + εt

Nous disposons des données du tableau ci-dessous : Une relation économique
suggère que le taux d’intérêt nominal R est une fonction croissante du taux d’inflation
INF et du taux de croissance de la production CR : R = f(INF, CR), avec ∂R /∂INF > 0 et
∂R /∂CR > 0
Année X1t Yt X2t a) Estimer les paramètres du modèle ;
2019 3 8 10 b) test de significativité conjointe ou globale (Fischer)
2020 5 13 8 c) test de significativité individuelle (t-student) ;
2021 2 7 6 d) comment interpréter β0 ?
2022 8 19 4 e) Calculer le coefficient de détermination (R2)
2023 10 22 2 f) Calculer le coefficient de détermination corrigé ( 𝑅̅ 2 )
et dites pourquoi on le calcule ?
2024 9 21 6

Chapitre V : Relâchement des hypothèses
Dans les chapitres précédents, l’estimation des paramètres du modèle linéaire simple et multiple,
par les MCO, nécessitait qu’un certain nombre d’hypothèses de base sur l’aléa soit vérifié : H1 à H8.
Nous étudierons dans ce chapitre les problèmes relatifs à la non vérification des hypothèses
formulées dans le cadre des moindres carrés ordinaires (MCO). Il s’agit des problèmes de normalité,
de multi-colinéarité, d’autocorrélation des erreurs, d’hétéroscedasticité et de l’endognéité.
5.1. Normalité
Une variable est dite normale ou gaussienne (ou une variable suit une loi normale) lorsqu’elle est
continue et elle est caractérisée par deux paramètres la moyenne et l’écart-type
1.1. Conséquence de l’absence de normalité
1.2. Tests de détection de la normalité
1. Le test de Jarque-Bera [JB]
Le test de Jarque-Bera, proposé en 1980 par Carlos Jarque et Anil Bera, est parmi les tests de
normalité les plus populaires dans les milieux académiques. Mais la remarque à faire, d’ores et déjà,
est qu’il est particulièrement approprié pour grand échantillon, soit n > 88. Le test JB est fondé sur
les coefficients d’asymétrie et d’aplatissement. Sa richesse consiste à ce qu’il permet de conclure à
la fois sur l’asymétrie et l’importance des queues [aplatissement] d’une distribution.
Spécification des Hypothèses :

H0 : Normalité / la variable est gaussienne
H1 : Non normalité la variable n’est pas gaussienne
Sous l’hypothèse de normalité de la série, la statistique du test JB suit asymptotiquement une

distribution du Khi deux χ2 à degrés de liberté avec le risque d’avoir un faux positif [ou seuil de
signification] α = 5%.
La statistique du test
La statistique du test est calculée comme suit :
𝑆2 (𝐾−3)2
JB = n [ 6 + 24
] où n est la taille de l’échantillon, Avec S : le Skewness et K : la Kurtosis.
Critère de décision :
1. Si JB ≥ à la valeur du χ2 (2) de la table au seuil α, alors RH0 de normalité.
2. Si non

5.2. Multi-colinéarité
Le terme multi-colinéarité est employé dans le cas d’un modèle présentant des variables
explicatives liées entre elles. Ce qui remet en cause l’hypothèse H7 nécessaire à l’estimation des
paramètres du modèle par les MCO. Lorsque deux séries Xi et Xj sont parfaitement non liées, on dit
qu’elles sont orthogonales.
Si pour des raisons théoriques, nous admettons habituellement que les séries étudiées sont
orthogonales, il convient de reconnaitre que, dans la pratique, cette hypothèse n’est pas toujours
vérifiée : les séries sont dans la majeure partie du temps plus ou moins liées entre elles, ce qui
engendre des conséquences non négligeables sur les estimateurs.
1.2. Conséquence de la multi-colinéarité

La multi-colinéarité engendre trois conséquences principales :
i Augmentation de la variance estimée des paramètres. En effet, lorsque le degré de
colinéarité augmente entre les variables explicatives, on peut assister à une modification de
la distribution des paramètres, ce qui a une incidence sur la variance desdits paramètres ;
ii Instabilité des paramètres estimés. En effet, en cas de multi colinéarité, de faibles

fluctuations des données entrainent une forte variation des paramètres estimés.
iii Singularité de la matrice (X ' X) et impossibilité d’estimation du modèle.

Dans le cas extrême de colinéarité parfaite entre deux variables explicatives, la matrice X
est singulière et, par conséquent, X ' X n’est pas inversible. On assiste donc à une
impossibilité d’estimation des paramètres du modèle.
1.3. Détection de la multi colinéarité

Deux tests peuvent nous permettre de détecter la présence de multi colinéarité : le test de Klein et
celui de Farar - Glauber.
1.2.1) Test de klein

Le test de Klein est fondé sur la comparaison du coefficient de détermination calculé sur le modèle
à k variables explicatives et les coefficients de corrélation simple obtenus en couplant les
différentes variables explicatives.
Si R2 < r2xi,xj alors il y a une forte présomption de colinéarité entre les variables xi et xj.
𝑪𝒐𝒗(𝑿𝒊,𝑿𝒋)
Rappel : rxy = 𝝈𝒙𝒊𝝈𝒙𝒋
∑(𝑿−𝑿̅ )(𝒀− 𝒀
̅)
rxy = ̅ ) √(𝒀− 𝒀
𝟐 ̅ )𝟐
√(𝑿−𝑿
𝑵 ∑ 𝑿𝒀 – ∑ 𝑿 ∑ 𝒀
rxy = : coefficient de corrélation linéaire entre xi et xj.
√𝑵 ∑ 𝑿𝟐 − (∑ 𝑿)𝟐 √𝑵 ∑ 𝒀𝟐 − (∑ 𝒀)𝟐
Donc, il est question de comparer le coefficient de détermination et le carrée du coefficient de

corrélation entre variables explicatives. Souvenons-nous que le carré du coefficient de corrélation
traduit le coefficient de détermination dans le modèle simple. Donc, il est question de comparer le
pouvoir explicatif du modèle à ce qu’auraient fourni les variables prises 2 à 2.

Il convient néanmoins de remarquer que le test de Klein n’est pas un test au sens statistique du
terme, il s’agit en réalité d’un simple critère de présomption de colinéarité.
1.2.2 Test de Farrar et Glauber
Ce test s’appuie également sur les différents coefficients de corrélation entre les variables
explicatives prises 2 à 2 et se conduit en trois étapes :
Etape 1 : Calculer le déterminant de la matrice de corrélation entre les variables explicatives.
1 𝑟𝑋1𝑋2 ⋯𝑟𝑋1𝑋𝑘 − 1 𝑟𝑋1𝑋𝑘

D = (𝑟𝑋2𝑋1 1 ⋱ 𝑟𝑋2𝑋𝑘 )
⋮ ⋮
… ⋱ 1
𝑟𝑋𝑘𝑋1 𝑟𝑋𝑘𝑋2
Remarque :
Pour un modèle à deux variables explicatives parfaitement corrélées, on a : rx1,x2 = rx2,x1 = 1
1 1 ⋯
1
D = (1 1 ⋱
1)
⋮ ⋮
…⋱ 1
1 1
Alors D = 0. Par contre, lorsqu’il n’y a pas de corrélation (cas des variables orthogonales), on a
rx1,x2 = rx2,x1 = 0 et D = 1
1 0 ⋯
0
D = (0 1 ⋱
0)
⋮ ⋮
…⋱ 1
0 0
La logique de ces deux cas extrêmes guide la Seconde étape de ce test.
Etape 2 : Effectuer le test statistique suivant :
H0 : D =1 Absence de multi colinéarité

H1 : D < 1 présence de multi colinéarité
1 1
La statistique de test est χ2 cal = [1 – n + 6 (2𝑘 + 5)] log D χ2 = [2 𝐾 (𝑘 − 1)]
Remarque : Dans le cadre particulier de ce test k désigne nombre de variables explicatives y compris
le terme constant.
Si χ2 cal > χ2 –table alors rejeter H0 ; Sinon, ne pas le rejeter.
Exemple : Un économiste cherche à expliquer une variable Y à l’aide de quatre variables

explicatives. Pour cela les estimations donnent les résultats suivant :
yˆ =−13,53 + 0.096x1 + 0,015x2 − 0.199x3 + 0,34x4

1 0.988 0.980 0.987
0,988 1 0.969 0.969
R2 = 0.998 ; n = 10 ; D = ( ) |D| = 0.92198.10 -5
0.980 0.969 1 0.991
0.987 0.969 0.991 1
Travail à faire : Ce modèle souffre-t-il d’un problème de multi colinéarité ?
Résolution
1) Test de Klein
A la lecture des données, on a rxi,xj < R2 ce qui conduit à r2xi,xj < R2 , ∀i ≠ j . On en déduit une non
présomption de multi-colinéarité d’après le critère de Klein. Toutefois, les valeurs des
coefficients de corrélation sont assez élevées et proches du R2 , Ce résultat relatif à Klein
mérite donc d’être relativisé.
2) Test de Farar-Glauber
H0 : D = 1
H1 : D < 1
1.3 Comment remédier à la multi colinéarité

La littérature recommande deux manières pour remédier au problème de multi colinéarité, lorsque
les variables à l’origine de la multi colinéarité ne sont pas clairement identifiés.
• Augmentation de la taille de l’échantillon : En effet, lorsque la taille de l’échantillon est
réduite, il y a de forte chance de multi-colinéarité ; pour y remédier, on pourrait tout
simplement augmenter la taille de l’échantillon.
• Transformation de la matrice X 'X. Cette procédure est essentiellement mathématique et
vise l’ajout d’une matrice cIn à X 'X, de sorte que l’on ait plutôt (X ' X +cIn ) en lieu et place
de X ' X .
In : matrice identité d’ordre n, C : constante convenablement choisie.
Il s’agit en réalité d’un ajout de l’ordre de « c » sur les éléments de la diagonale de la matrice X ' X
avec pour objectif la réduction des effets de la multi colinéarité.
Si nous pouvons identifier les variables à l’origine de la multi-colinéarité, la stratégie la plus efficace
consiste à éliminer les séries susceptibles de représenter les mêmes phénomènes que celle déjà
présentent dans le modèle, lors de la spécification du modèle. On est dans ce cas confronté à un
problème de choix du modèle optimal.
1.4. Choix du modèle optimal

Le choix du modèle optimal en présence de plusieurs variables explicatives consiste à déterminer
les variables qui doivent faire partie du modèle et celles à exclure. Ce choix doit être guidé par deux
éléments principaux : la validité sur le plan économétrique et le sens économique ou social du
modèle que l’on désire construire. En ce qui concerne, le volet économétrique le choix repose sur
deux critères :
• Critère de maximisation du R2 ;

• Critère de minimisation d’une fonction d’information : AKAIKE ou SCHWARTZ
Toutefois, il convient de remarquer que dans la pratique les deux critères sont parfois difficiles à
mettre en œuvre de manière simultanée, il revient donc à l’économètre de choisir le critère
prépondérant.
Exercices résolus
5.3. Auto corrélation des erreurs

D’après l’hypothèse H5 des MCO, nous avons supposé que E(εεi , j ) = 0 ∀i ≠ j ; ce qui voudrait dire
que les erreurs ne sont pas corrélées. Néanmoins, dans la pratique, cette hypothèse n’est pas
toujours vérifiée, on est souvent confronté aux cas où E(εεj ) ≠ 0 , synonyme d’une auto corrélation
des erreurs.
2.1) Causes de l’autocorrélation

L’auto corrélation des erreurs peut être observée pour plusieurs raisons :
i. Absence d’une variable explicative importante. En effet, l’omission de certaines variables

clés du modèle peut réduire le pouvoir explicatif du modèle et donc, engendrer une forte
corrélation entre les erreurs. L’introduction de cette variable viendrait alors modifier la
structure des erreurs, tout en réduisant leur dépendance.
ii. Une mauvaise spécification du modèle, En effet, il peut se trouver que la relation mise en
œuvre n’est pas linéaire. Ce qui rendrait les résidus très importants. Une transformation
appropriée viendrait améliorer la structure des résidus.
iii. Typologie des données, La typologie des données a une influence sur l’auto corrélation.
En effet, sur les séries temporelles, le problème d’auto corrélation est très fréquent. Ceci
est dû au fait que le comportement de la série à une date t peut influencer son
comportement à une date t + h (h > 1). En revanche, lorsque les données sont en coupe
transversale, le risque d’auto corrélation est réduit.
2.2) Conséquences de l’auto corrélation

L’auto corrélation des erreurs a pour conséquence, une augmentation de la variance des
paramètres estimés. De ce fait, nous sommes en présence des estimateurs sans biais mais de
variance non minimale.
2.3) Détection de l’auto corrélation

La détection d’une dépendance entre les erreurs se fait à partir de l’analyse des résidus. On peut
procéder soit par un examen visuel soit par des tests.
2.3.1 Examen visuel
L’analyse du graphique des résidus de la régression peut nous donner une idée sur la présence ou
non de l’auto corrélation. En effet, si les résidus semblent alignés sur une courbe, dans le repère (t,
et ) on parle d’auto corrélation positive, si par contre, ils alternent on parle d’auto corrélation
négative.

Toutefois, l’analyse graphique n’offrent pas toujours les caractéristiques évidentes à interpréter,
d’où la nécessité des tests.
2.3.2 Test de Durbin-Watson.
Le test de Durbin –Watson permet de détecter l’auto corrélation de la forme :
εt =ρεt−1 +υt où υt →N(0,συ2 ).
Il s’agit précisément d’une auto corrélation d’ordre 1.
Hypothèse du test
H0 : ρ= 0 (absence d’autocorrélation)
H1 : ρ≠ 0 (présence d’autocorrélation)
Statistique du test
Règle de décision
Afin de mener à bien ce test, Durbin et Watson ont tabulé les valeurs critiques en fonction de la
taille de l’échantillon (n) et du nombre de variables explicatives (k) que compte le modèle. En outre,
la lecture de la table se fait au moyen de 02 valeurs d’aide à la décision notée d1 et d2. Par
construction, 0<DW<4, on a alors la règle de décision suivante :
ρ> 0 ? ρ= 0 ρ= 0 ? ρ< 0
0 d1 d2 2 4-d2 4-d1 4
Remarque :
Trois conditions sont nécessaires à l’utilisation du test de Durbin Watson :
• Le modèle doit comporter un terme constant

• La variable expliquée ne doit pas figurer parmi les variables explicatives
• Pour les données en coupe instantanée (transversale) les observations doivent être
ordonnées suivant la variable expliquée.
La limite du test de Durbin-watson réside dans son incapacité à traiter les problèmes d’auto
corrélation d’un ordre supérieur à 1. C’est pour cela que ses travaux ont été généralisés par
Breusch-Godfrey.
2.3.3 Test de Breusch-Godfrey
Ce test traite des auto-corrélations de la forme : εt =ρε1 t−1 +ρε2 t−2 +...+ρεp t−p +νt avec νt →N(0,σv2 ) . Il
s’agit de l’autocorrélation d’ordre p. La procédure du test est la suivante :

• Etape 1 : Estimer le modèle général : yt =β0 +β1x1t +β2x2t + ...+βk xkt +εt
• Etape 2 : Récupérer les résidus de l’estimation du modèle précédent, puis estimer le
modèle suivant : et =β0 +β1x1t +β2x2t +...+βk xkt +ρε1 t−1 +ρε2 t−2 +...+ρεp t−p +νt
• Etape 3 : Récupérer le coefficient de détermination ( R2 ) de l’étape 2 puis faire le test

suivant.
Hypothèse du test
H0 :ρ1 =ρ2 = .... =ρp = 0 (Absence d 'autocorrélation)
H1 : ∃ j ∈ {1,2,..., p} tq ρj ≠ 0 (Présence d 'autocorrélation)
Statistique du test : La statistique du test est LM = nR2 → χ2 ( p)
Règle de décision Si LM >χ2( p) alors rejeter H0 . Sinon ne pas la rejeter
Exemple
5.3 Hétéroscédasticité
3.1 Présentation du problème

Dans le modèle linéaire général, nous avons supposé que les erreurs étaient homoscédastique i.e
E(εiεj) = σε2 I
De manière explicite, la variance est constante quel que soit individus…i = j =1 et i ‡ j = 0

1 0 0
E(εiεj) = Cov(εiεj) = σε2 I = σε2 (0 1 0)
0 0 1
Lorsque cette hypothèse n’est pas vérifiée, la variance des erreurs n’est plus constante sur la
première diagonale. On dit qu’il y a hétéroscedsaticité.
3.2 Causes de l’heteroscédasticité

Ce phénomène peut être dû trois éléments principaux :
i. Présentation des données sous forme de moyenne ; autrement dit, il s’agit des cas où les
variables explicatives sont les moyennes observées sur des groupes d’individus.
ii. Répétition des valeurs des variables explicatives.
iii. Typologie des données ; en effet, ce problème est assez fréquent sur les données en coupe
instantanée.
3.3 Conséquence de l’hétéroscedasticité

Les conséquences de l’heteroscedasticité sur les résultats de l’estimation du modèle par la
méthode des MCO sont identiques à ceux de l’autocorrélation, notamment l’augmentation de la
variance des estimateurs.

3.4 Correction de l’hétéroscedasticité : la méthode des MCG
La correction dépend de la forme de l’hétéroscedasticité relevée. Quoiqu’il en soit, la correction
passe de manière générale par l’utilisation de la méthode des moindres carrés généralisés (MCG).
En effet, considérons un modèle linéaire général dans lequel la variance des erreurs
Var(εi2 ) = E(εε') ≠ σ2 I . On a : Y = Xβ+ε
Pour déterminer un estimateur β possédant les mêmes propriétés que l’estimateur des MCO, on
montre qu’il suffit de poser : β = (X 'Vε−1X )−1 (X 'Vε−1Y) et Var (β) = (X 'Vε−1X )−1 . Cet estimateur est
appelé estimateur des moindres carrées généralisées (MCG) ou estimateur de AIKEN.
Remarque : l’estimateur des MCO (βˆ =(X ' X)−1 (X 'Y)) est un cas particulier des MCG. En effet, dans
le cadre des MCO, on a Var(εi2 ) = E(εε') ≠ σ2 I .
En introduisant cette expression de la variance dans β, on a :
On vérifie aussi que : Var (β) = σε2(X ' X )−1 =Var (βˆ) .
3.5 Tests de détection de l’heteroscedasticité

En ce qui concerne la détection du phénomène, plusieurs méthodes sont applicables. Au rang de
celui-ci, deux retiendront notre attention : le test d’égalité de la variance et le test de
GoldfeldQuandt.
3.5.1 Test d’égalité des variances
Ce test est appliqué le plus souvent dans le cadre des modèles de régression simple, lorsque la
variable explicative est répétée. Dans ce cadre les données sont regroupées suivant la variable
explicative et le test conduit sous l’hypothèse :
H0 :σ12 =σ22 = ... =σm2 où m est le nombre le groupe formé.
Pour construire la statistique de test, on procède en trois étapes :
Etape1 : calcul de la variance empirique pour chaque groupe : ni −1
Etape 2 : calcul de la variance totale :
Etape 3 : on calcule la statistique de test
Q=v* Ln(σˆT2 )−∑vi * Ln(σˆi2 ) → χ2 (m−1) avec vi = ni −1 et v =∑vi
• Si Q >χ2 (m−1) alors rejeter H0

3.5.2 Test de Goldfred-Quandt
Ce test est valable lorsque l’une des variables explicatives est à l’origine de l’heteroscadasticité.
De plus, la taille de l’échantillon doit être suffisamment large.
Hypothèses du test :
Ho : σε2 = constante (homoscédasticité)
H1 : σε2 ‡ constante (heteroscédasticité)
De manière récapitulative, ce test est conduit en trois étapes :
Etape 1 : Ordonner les observations en fonction de la variable susceptible de causer

l’héteroscédasticité.
Etape 2 : Omettre C observations centrales.
C doit être approximativement le quart de l’échantillon. De manière pratique on prend C = partie

entière de n/4.*
Etape 3 : Estimation du modèle, respectivement dans les deux sous échantillons crées de part et
d’autre des valeurs omises. Notons SCR1 et SCR2 les sommes des carrés des résidus des deux
estimations précédentes. On montre que :
. Si Fcal > Flu (ddl2 , ddl1) alors rejeter l’hypothèse nulle d’homoscedasticité.
Exemple (voir TD)
5.4 Le problème de l’autocorrélation
Détection de l’autocorrélation On se place ici dans un modèle de série temporelle. Les erreurs sont
inconnues. Seuls les résidus apportent une information sur les erreurs. L’autocorrélation
concernent donc les résidus. L’autocorrélation représente des corrélations à l’intérieur de la série
des résidus. Il y a autocorrélation toutes les fois où l’on peut trouver un coefficient de corrélation
linéaire significativement différent de 0, entre la chronique des résidus et elle-même, retardée d’un
ou plusieurs pas de temps. Ces coefficients d’autocorrélation peuvent se représenter
graphiquement dont la représentation graphique s’appelle le corrélogramme. L’ensemble des
coefficients de corrélation s’appelle la fonction d’autocorrélation.
Exemple : Si les résidus sont une bonne représentation de l’aléa, ils doivent vérifier l’hypothèse de
non autocorrélation. Cela signifie que toutes les autocorrélations successives doivent être
significativement proches de 0 (barres courtes). Il existe deux types d’autocorrélation des résidus
: Autocorrélation positive Autocorrélation négative
Principales causes de l’autocorrélation - Le modèle ignore une variable explicative - Les variables de
départ étaient saisonnières - Les variables contiennent des phénomènes exceptionnels, mal
expliqué par le modèle oubli d’une variable dichotomique ?) - Les variables de départ des non-

informations qui ont été corrigés par interpolation linéaire - Les variables de départ ne vérifie pas
l’hypothèse de stationnarité, c’est-à-dire qu’elles peuvent contenir des tendances déterministes
(Trend linéaire) ou stochastique C. Les effets de l’autocorrélation obéit à un processus autorégressif
: - Les estimateurs restent sans biais - Les variances d’échantillon des coefficients de régression ne
sont plus minimales - La méthode des MCO n’est plus la meilleure des méthodes pour estimer le
modèle. D.
Exercices sur le chapitre 5

Chapitre VI : Equations simultanée
Dans les modèles ne comportant qu’une seule équation, une hypothèse implicite supposait
que la relation de cause à effet entre la variable dépendante Yt et la (les) variable(s)
explicative(s) était unidirectionnelle : les variables explicatives étaient la cause et la variable
dépendante l’effet. Or, nombre des théories économiques sont basées sur des modèles à
plusieurs équations, c'est-à-dire des systèmes d’équations. Ces équations n’étant pas
indépendantes les unes des autres, l’interaction des différentes variables peut avoir des
conséquences importantes au niveau de l’estimation de chacune des équations et du
système d’équations dans son ensemble.
Donc, on ne peut pas, sauf cas particulier, utiliser efficacement la méthode des moindres
carrés ordinaires (MCO) équation par équation lorsqu’on cherche à tester des théories
économiques décrivant un système complet d’équations pour faire des prévisions
simultanées sur un ensemble des variables liées.
9.1. Définition d’un Modèle à équations simultanées
Un modèle est dit à équations simultanées (ou équations structurelles) s’il contient des
variables qui sont à la fois dépendante et indépendantes
Présentation du modèle à équations simultanées
Y1t = ao + a1 X1t + a2Y2t + Ɛ1t (1)
Y2t = bo + b1 Y1t + Ɛ2t (2)
Où Y1t est le taux d’intérêt, X1t offre de monnaie et Y2t le revenu
9.2. Le problème de l’identification des Equations
Les conditions d’identification se déterminent équation par équation. Nous pouvons

distinguer trois cas d’identifications :
– le modèle est sous-identifié si une équation du modèle est sous-identifiable (il y a

moins d’équations que de paramètres à identifier dans la forme structurelle, le système
est donc impossible à résoudre) ;
– le modèle est juste identifié si toutes les équations sont justes identifiables ;
– le modèle est sur-identifié si les équations du modèle sont soit justes identifiables, soit
sur-identifiables.
Si le modèle est sous-identifié, il n’existe aucune possibilité d’estimation des

paramètres du modèle, celui-ci doit être respécifié.

Les conditions d’identification peuvent faire l’objet d’un développement complexe,
nous nous bornons ici à édicter des règles simples qui sont, dans la pratique, appliquées
en premier lieu. Soit :
n = nombre de variables endogènes du modèle (ou encore nombre d’équations

du modèle ; n = n1 + n2) ;
n1 = nombre de variables endogènes présente dans une équation ;
n2 = nombre de variables endogènes absente dans une équation ;
m1 = nombre de variables exogènes présente dans une équation ;
m2 = nombre de variables exogènes absente dans une équation et
r = nombre de contrainte (ou restriction) présente dans une équation.
Nota : Il y a r restrictions, autres que celles d’exclusion, concernant les paramètres d’une
équation (en cas d’égalité de deux coefficients, par exemple ; deux variables différentes
ont une même pondération ou coefficient), Il y a aussi une restriction sur un coefficient de
la forme structurelle, chaque fois qu’un paramètre est contraint – par l’écriture du modèle
– à être égal à une valeur déterminée.
Lorsque les restrictions ne sont que des restrictions d’exclusion, les conditions –
nécessaires – d’identifiabilité19 s’énoncent ainsi :
. n2 + m2 + r > n – 1 → l’équation est sur-identifiée ; DMC, TMC et MMV

. n2 + m2 + r = n – 1 → l’équation est juste identifiée ; MCI et MCO
. n2 + m2 + r < n − 1 → l’équation est sous-identifiée ; Aucune méthode
Ce qui peut se résumer ainsi : pour qu’une équation ne soit pas sous-identifiée, le nombre
de variables exclues de l’équation doit être au moins égal au nombre d’équations du
modèle moins un.
9.3. Équations sous forme réduite
Lorsque nous sommes en présence d’un modèle linéaire à équations multiples, il arrive
fréquemment qu’une variable endogène d’une équation apparaisse en tant que variable
explicative d’une autre équation. Ce double statut de certaines variables entraîne un biais
dans les estimations des coefficients lorsque nous employons les MCO, équation par
équation. Nous allons donc chercher à transformer le modèle initial en un modèle où les
variables endogènes ne sont exprimées qu’en fonction des variables exogènes.
A. Exemple introductif
Considérons le modèle macro-économique à trois équations :
19
Ces conditions – nécessaires – sont appelées conditions d’ordre d’identifiabilité. Il convient de vérifier des
conditions suffisantes, qualifiées de conditions de rang qui, dans la pratique, se révèlent difficiles, voire parfois
impossibles à mettre en œuvre. En annexe, ces conditions sont exposées.

Ct = a0 + a1Yt + ε1t (1)
It = b0 + b1Yt−1 + ε2t (2)
Yt = Ct + It (3)
Avec :
Ct = consommation totale pour l’année t ;
It = investissement total pour l’année t ;
Yt = revenu total pour l’année t.
Ce système d’équations multiples, spécifié par l’économiste, qui traduit directement les relations
entre les variables, s’appelle : le système d’équations structurelles. Ce modèle comporte trois
équations dont une identité (3). En effet, dans la relation (3), il n’y a aucun coefficient à estimer et
par conséquent pas de terme aléatoire. L’équation (1) est une fonction de consommation et
l’équation (2) est relative à l’investissement.
Ce système contient trois variables endogènes : Ct, It , Yt et deux variables exogènes Yt−1 et u (avec
u : une matrice unité). Nous remarquons, par exemple, que la variable Yt apparaît comme variable
explicative en [1], ce qui est contraire à son statut de variable endogène.
Pour lever ce problème, nous allons exprimer les trois variables endogènes (Ct, It, Yt) en fonction
de la seule variable exogène (Yt−1). En substituant [3] dans [1], nous obtenons :
Ct = a0 + a1(Ct + It) + ε1t
Ct = a0 + a1Ct + a1 It + ε1t *
Ct - a1Ct = a0 + a1 It + ε1t
Ct(1 - a1) = a0 + a1 It + ε1t
𝑎0 𝑎1 𝜀1𝑡
Ct = (1 − 𝑎1)
+ (1 − 𝑎1)
It + (1 − 𝑎1)
(4) 2 dans 4
𝑎0 𝑎1(𝑏0 + 𝑏1𝑌𝑡−1 + 𝜀2𝑡 ) 𝜀1𝑡

Ct = (1 − 𝑎1)
+ (1 − 𝑎1)
+ (1 − 𝑎1)
𝑎0+𝑎1𝑏1 𝑎1𝑏1𝑌𝑡−1 𝜀1𝑡+ 𝑎1𝜀2𝑡

Ct = (1 − 𝑎1)
+ (1 − 𝑎1)
+ (1 − 𝑎1)
(5) 1 et 2 dans 3
Yt = a0 + a1Yt + ε1t + b0 + b1Yt−1 + ε2t
Yt - a1Yt = a0 + ε1t + b0 + b1Yt−1 + ε2t
(1 - a1) Yt = a0 + ε1t + b0 + b1Yt−1 + ε2t
𝑎0 + 𝜀1𝑡 + 𝑏0 + 𝑏1𝑌𝑡−1 + 𝜀2𝑡

Yt = (1 − 𝑎1)

(𝑎1+𝑏0) 𝑏1 (Ɛ1𝑡+ 𝜀2𝑡)
Yt = + 𝑌𝑡 − 1 + (6) et It = b0 + b1Yt−1 + ε2t (7)
(1 − 𝑎1) (1 − 𝑎1) (1 − 𝑎1)
Forme réduite de 1 et 2
𝒂𝟎+𝒂𝟏𝒃𝟏 𝒂𝟏𝒃𝟏𝒀𝒕−𝟏 𝜺𝟏𝒕+ 𝒂𝟏𝜺𝟐𝒕

Ct = + + (*)
(𝟏 − 𝒂𝟏) (𝟏 − 𝒂𝟏) (𝟏 − 𝒂𝟏)
(𝒂𝟏+𝒃𝟎) 𝒃𝟏 (Ɛ𝟏𝒕+ 𝜺𝟐𝒕)

Yt = (𝟏 + 𝒀𝒕 − 𝟏 + (**)
− 𝒂𝟏) (𝟏 − 𝒂𝟏) (𝟏 − 𝒂𝟏)
It = b0 + b1Yt−1 + ε2t (***)
𝑎0+𝑎1𝑏1 𝑎1𝑏1 𝜀1𝑡+ 𝑎1𝜀2𝑡 (𝑎1+𝑏0)

Posons 𝜋0 = , 𝜋1 = , 𝑉1𝑡 = , 𝜋2 = (1 , 𝜋3 =
(1 − 𝑎1) (1 − 𝑎1) (1 − 𝑎1) − 𝑎1)
𝑏1 (Ɛ1𝑡+ 𝜀2𝑡)
, 𝑉2𝑡 = , 𝜋4 = b0 , 𝜋5 = b1 et V3t = ε2t
(1 − 𝑎1) (1 − 𝑎1)
Ct = 𝝅𝟎 + 𝝅𝟏𝒀𝒕 − 𝟏 + 𝑽𝟏𝒕
Yt = 𝝅𝟐 + 𝝅 3Yt-1 + V2t
It = 𝝅𝟒 + 𝝅𝟓𝒀𝒕 − 𝟏 + V3t
Nota :
L’équation [E5] indique que la variable Yt est fonction de ε1t et par conséquent E(Yt ε1t) ≠ 0 . Il en
résulte que, dans l’équation [E1], l’hypothèse d’indépendance entre la « variable explicative » Yt et
l’erreur ε1t n’est pas respectée et l’application des MCO sur le modèle [E1] conduit à des estimateurs
biaisés et non convergents.
En revanche, l’utilisation des MCO sur les équations réduites est licite puisque la variable Yt−1 est
indépendante de ε1t et ε2t .
Il est à noter que la forme réduite permet de mesurer l’effet total, direct et indirect, d’une
modification de la variable exogène Yt−1 sur les variables endogènes.
Par exemple, le schéma suivant illustre la cascade des causalités :
[E2] [E3] [E1] Yt−1 → It → Yt → Ct ce qui est résumé dans [E4].

Exercices sur les Equations simultanées
Exercice 1 : Soit un modèle microéconomique donné par :
Y1t = ao + a1 X1t + a2Y2t + Ɛ1t (1)
Y2t = bo + b1 Y1t + Ɛ2t (2)
Où Y1t est le taux d’intérêt, X1t offre de monnaie et Y2t le revenu
Travail demandé
1. Le modèle constitue-t-il un système d’équations simultanées ? Dites pourquoi ?

déterminer les variables endogènes et les variables exogènes dans ce modèle ;
2. En estimant les paramètres de ce système d’équations par la méthode des MCO, les
estimateurs sont- ils BLUE ? pourquoi ?
3. Déterminer la forme réduite de ce modèle ;
4. Identifier les équations de ce modèle et préciser la technique d’estimation appropriée,

indiquer les valeurs des coefficients structurels ;
5. Si l’équation de Yt inclut Y2t-1 en tant que variable explicative additionnelle, quelle sera
alors l’identification des équations du modèle ? Préciser la technique d’estimation
appropriée.
Exercice 2

Exercice 3 : On considère les données ci-après :
Années t Ct Zt Yt
2014 1 90 20 110
2015 2 95 23 118
2016 3 100 25 125
2017 4 110 26 136
2018 5 112 30 142
2019 6 115 32 147
2020 7 120 33 153
Et le modèle suivant :
Ct = α + β Yt + Ɛt
Yt = Ct + Zt
Travail à faire
1. Quelles sont les variables endogènes et les variables exogènes du modèle ?

2. Le modèle constitue-t-il un système d’équations simultanées ? Pourquoi ?
3. Déterminer la forme réduite de ce modèle ;
4. Identifier les équations de ce modèle et préciser la technique d’estimation appropriée, indiquer
les valeurs des coefficients structurels ;
5. Déterminer successivement par les moindres carrés directs, les moindres carrés indirects, et le
double moindres carrés les estimateurs des paramètres du modèle ci-après ;
6. Comparer les résultats

Exercice 4. Soit le modèle suivant sous forme structurelle :
Rt = β1 Ct + α1Dt + Ɛ1t
Ct = β2 Rt + α2Rt-1 + Ɛ2t
Avec : Rt = revenu national pour l’année t ;

Ct = consommation de ménages pour l’année t ;
Dt = demande finale autre que la consommation des ménages pour l’année t.
Variables macroéconomiques centrées
Année Rt Ct Dt Rt-1
2016 -30 -14 -26 20
2017 -4 10 5 -30
2018 -19 -19 -36 -4
2019 -6 -11 -6 -19
2020 -9 6 -13 -6
2021 11 -12 25 -9
9 10 5 11
2022 19 11 32 9
2023 29 19 14 19
Travail à faire
1. interpréter les équations en précisant le signe attendu des paramètres ;

2. Déterminer les variables exogènes et les variables endogènes ;
3. Préciser les conditions d’identification du modèle ;
4. En supposant 1-β1β2‡ 0 Donner la forme réduite en précisant le contenu de ses composantes ;
5. Estimer les paramètres de la forme réduite en utilisant le logiciel STATA ;
6. Estimer les coefficients structurels par les moindres carrés indirects ;
7. Quel est l’effet de la variation unitaire du revenu national sur la consommation ?
8. Quel est l’effet indirect de la variation unitaire de la demande finale ?

9. Quel est l’effet à long terme de la variation unitaire du revenu national sur la consommation ?
10.
Exercice 5 : Soit le modèle suivant sous forme structurelle :
Y1t = a(Y2t + X1t) + ε1t [E1]
Y2t = bY1t + cY1t−1 + ε2t [E2]
Avec :
Y1t = Produit National Brut pour l’année t ;

Y2t = consommation des ménages pour l’année t ;
X1t = demande finale autre que consommation des ménages pour l’année t.
Nous disposons des données du tableau 1 dans lequel les variables ont été préalablement
centrées.
Tableau 1 – Variables macro-économiques centrées
t Y1t Y2t X1t Y1t-1
1 -30 -14 -26 20
2 -4 10 5 -30
3 -19 -19 -36 -4
4 -6 -11 -6 -19
5 -9 6 -13 -6
6 11 -12 25 -9
7 9 10 5 11
8 19 11 32 9
9 29 19 14 19
1) Préciser les conditions d’identifiabilité du modèle.
2) Estimer les équations de la forme structurelle par les MCO et démontrer que les
estimateurs ne sont pas BLUE.
3) Estimer les coefficients par les MCI et les DMC.
4) Comparer les résultats obtenus.

Chapitre 8 Séries temporelles
1. Définitions
Une série temporelle (ou série chronologique ou chronique) est une suite ordonnée d’une
observation, d’une grandeur au cours du temps.
Ensemble d’observation d’une variable statistique ou économique qui est observée à

l’intervalle de temps régulier (Année, trimestre, mois, semaine, jours etc…) sont les
périodicités les plus courantes.
La grandeur mesurée dont on suit l’évolution sera désignée par Y
L’étude des séries temporelles intéresse tous ceux qui désirent décrire, expliquer,
contrôler, prévoir des phénomènes évoluant au cours du temps.
Temps
8.2 Stationnarité
L’objectif des séries temporelles étant de faire des prévisions d’une variable dans le temps,
il est très commode et normale de commencer par tester si la série est stationnaire dans le
temps
La stationnarité est une situation ou la moyenne, la variance de la variable et la structure

de la variable sont constantes dans le temps.
2. Composantes des séries temporelles
L’étude des phénomènes économiques a distingué depuis longtemps divers types

d’évolution, qui peuvent éventuellement se combiner (Une série temporelle peut être
composée d’une tendance à long terme, d’un mouvement saisonnier et du mouvement
résiduel ou aléatoire composé de tout ce qui n’est pas pris en compte par la tendance et le
mouvement saisonnier
2.1. La tendance (Tt) ou trend

Cette composante représente l’évolution moyenne à long terme de variable, elle
correspond à une variation lente s’effectuant dans un sens déterminé qui se maintient
pendant des longues périodes.
2.2. Composante saisonnière (St)
Comme la précédente, cette composante est supposée périodique. Elle se distingue

cependant du fait que sa période est généralement dépendante de notre environnement.
Cette liaison peut être naturelle, comme l’influence de saison sur la consommation
mensuelle d’électricité.
Correspond à un phénomène qui se répète a intervalle de temps réguliers (périodique) en

général c’est un phénomène saisonnier d’où le terme variation saisonnière
2.3. Composante résiduelle (Rt) ou bruit résiduel
Celle-ci regroupe tout ce qui n’est pas pris en compte par les composantes précédentes, et
notamment les multiples influences extérieures qui ont pour caractéristique de ne pas avoir
d’impact important sur l’allure générale de la série.
Correspond à des fluctuations irrégulières en général, des faibles intensités mais de nature
aléatoire, on parle aussi d’aléa (Ɛt). Composante accidentelles grèves, conditions
météorologiques désastreuses crash boursier
2.4. Composante cyclique (Ct )
Une autre composante faisant objet d’une étude particulière traduit un phénomène
cyclique se répétant sur des durées plus longues en économie principalement (ex
expansion/récession) un autre exemple du cycle de JUGLAR
3. Méthodes de décomposition
Comment combiner ces différentes composantes ? Il existe deux principaux modèles en

séries temporelles qui sont :
Modèle additif Yt = Tt + Ct + St + Rt
Modèle multiplicatif Yt = T𝑡 × 𝐶𝑡 ×St ×Rt
Méthode graphique pour déterminer le type de modèle, on peut aisément se servir d’une
représentation graphique
Si on relie le maxima distant d’une période et on fait de même avec le minima et si les deux
courbes sont à peu près parallèles, il s’agit d’un mouvement additif, si non d’un mouvement
multiplicatif

Le cas où le mouvement saisonnier est d’amplitude constante dans le temps on parle d’un
modèle additif (mouvement additif) une chronique ou le profile saisonnier ne modifie pas
au cours du temps et ou la tendance est peut marquée.
Un mouvement saisonnier d’amplitude croissante ou décroissante dans le temps,

correspond au modèle multiplicatif. Rend compte des séries chronologiques ou l’amplitude
du profil saisonnier évolue au cours du temps proportionnellement a la valeur de la
tendance.
4. Méthodes du modèle de décomposition par la méthode de Buys - Ballot
La méthode de Buys et Ballot consiste à calculer pour chacune des années la moyenne et
l’écart-type puis à vérifier la liaison entre l’écart type et la moyenne par la méthode des
moindres carrés. Nous devons rechercher le modèle :
𝜎𝑋 = 𝑎𝑋̅ + b
Deux cas se présentent :
1. a=0 𝜎𝑋 = b, le modèle est additif (les écart-types sont constants pendant la période)
2. a ‡ 0 l’ecart-type est fonction de la moyenne, le modèle est multiplicatif. Les écart-types
ne sont pas constants pendant la période.
5. Détermination de la tendance
Nous donnons ici trois méthodes de calcul permettant de connaitre avec le maximum de
précision la tendance de la chronique.
1. Méthode de l’ajustement linéaire
Cette approche repose sur l’hypothèse que la tendance peut être représentée par une
courbe, supposée définie a priori, d’équation Y = f(t) ou t est le temps.
Ainsi, dans le cas d’une tendance linéaire, on a :
Yt = β0 +β1 t. Yt = la variable à étudier et t = temps.
Les coefficients sont estimés à l’aide de la méthode des moindres carrés ordinaires. On
obtient les résultats suivants :

̂ −𝟏
𝜷𝟎 ∑ 𝑿𝟐 ∑𝑿 ∑ 𝑿𝒀
( )= ( ) ( )
̂
𝜷𝟏 ∑𝑿 𝑵 ∑𝒀
Nota : la tendance est déterminée par le signe de β1. On distingue 3 cas :
1. Si β1 > 0 , alors la série étudiée a une tendance croissante (trend haussier)

2. Si β1 = 0 , alors la série étudiée est stationnaire (tendance constante)
3. Si β1 < 0 ,alors la série étudiée a une tendance décroissante (trend baissière)
2. Méthode de Moyenne mobile (MM)
Le filtre moyenne mobile permet d’écrêter les pics et les creux d’une chronique afin de
mieux déceler sa tendance de fond.
Il s’agit de calculer une moyenne sur un certain nombre de valeurs de la série et de l’affecter
à une période donnée.
La moyenne mobile de longueur (ou d’ordre) m est définie par :
𝑋𝑡 +𝑋𝑡−1+𝑋𝑡−2+⋯𝑋𝑡−𝑚+1
Mt = 𝑚
Pour le choix de l’ordre de la moyenne mobile, on a coutume de retenir les valeurs suivantes
:
1. Pour les données annuelles : m = 3 ou m = 5

2. Pour les données trimestrielles : m = 4
3. Pour les données mensuelles : m= 12
Les valeurs de la moyenne mobile permettent de déterminer la tendance de la série
Exercices

Exercice 1. Les ventes d’un produit sont
Année Rand du Ventes en

trimestre Xt milliers d’euros
1 48
2022 2 41
3 60
4 65
5 58
6 52
2023 7 68
8 74
9 60
2024 10 56
11 75
12 78
Travail à faire
1. Faites le graphique ventes ;

2. De quel type de modèle s’agit-t-il ?
3. Estimer le modèle de prévision en fonction du temps ;
4. Est-il possible de prévoir directement les ventes du 13e e et 14e trimestre ? Pourquoi ?
5. Quels sont les coefficients de saisonnalité (corrigés) pour chaque trimestre ?
6. Prévoir les ventes des 13 e, 14e, 15e, 16e et 20e trimestres si possibles ;
7. interpréter en pourcentage les valeurs au-dessus et en dessous de la tendance et
dites quel est le pic

8.5 Introduction
8.6 Description d’une série temporelle
8.7 Traitement des données manquantes
8.8 Modèle ARIMA ET SARIMA
8.9 Modèle VAR
8.10 Modèle VECM
Exercices
8.11 Introduction sur les séries financières
Exemple du CAC 40
8.12 Heteroscédasticité conditionnelle
8.13 Qu’est-ce que le modèle ARCH ?
8.14 Qu’est-ce que le modèle GARCH ?
8.15 Procédure de modélisation et extension possibles
Exercices

Eléments de Bibliographie
Greene W ; (2003), Econométric analysis, 5éme édition
Saporta G. (2006), Probabilités, analyses des données et statistique, paris, éditions Technip
Bourbonnais R. (2006), Econométrie, Dunod, 6éme édition
Antoine Terracol (2008), « Stata par la pratique : statistiques, graphiques et éléments de

programmation par Eric Cahuzac et Christophe Bontemps », the Stata Journal 8, Number
4, pp. 574-578.
Baltagi Badi H. (2005), « Econometric Analysis of Panel Data », 3è édition, JW edition,

Angletere, 316 p. Benchimol Jonathan, « Formation EViews 7 : Introduction », 95 p.
Bocquier Philippe (1996), « L’analyse des enquêtes biographiques à l’aide du logiciel STATA
», Documents et Manuels du CEPED n°4, Paris, 224 p.
Bourbonnais R. (2015), « Econométrie : cours et exercices corrigés », 9è édition, éd. DUNOD,

Paris, 392 p. (2009), « Logiciel Eviews », Université de Paris-Dauphine, 31 p.
Bourbonnais, R. et Terraza, M. (2016), « Analyse des séries temporelles – Applications à

l’économie et à la gestion : Cours et exercices corrigés », éd. Dunod, 4è édition, Paris, 354p.
Bozio Antoine (2005), « Introduction au logiciel STATA », Paris, 18 p.
Cadoret I. et al. (2009), « Econométrie appliquée : Méthodes – Applications – Corrigés », éd.

de boeck, 2è édition, Bruxelles, 462 p.

Casin Philippe (2009), « Econométrie : Méthodes et applications avec EViews », éd. Technip,
Paris, 224 p.
Charpentier Arthur, « Cours de séries temporelles : Théories et applications – Volume 2 »,

141 p.
Christopher Baum F. (2001), « Stata : the language of choice for time series analysis », in The
Stata Journal 1, number 1, pp. 1-16. Couderc Nicolas, « Econométrie appliquée avec Stata »,
Université Paris 1 Panthéon-Sorbonne, 22 p.
Cette introduction à l’économétrie et les exercices résolus sont conçus pour un

premier cours d’économétrie de premier cycle. Pour que l’économétrie soit
pertinente dans un cours d’introduction, des applications intéressantes doivent
faire appel à la théorie qui doit elle aussi correspondre aux applications. Cet
ouvrage fournit aux étudiants de premier cycle un aperçu des techniques
économétriques utilisées par les économistes aujourd’hui. Le texte se concentre
sur des techniques économétriques standards et aussi sur les développements
récents dans le domaine. Un aspect très utile de cet ouvrage est l’utilisation de
données pour illustrer l’application des différentes techniques. Cette approche
rend le texte vivant et très pertinent pour les étudiants et les chercheurs. Avec
la grande disponibilité des progiciels économétriques tels que EViews, Stata,
etc., les lecteurs peuvent acquérir une expérience pratique en les maniant dans
certains exercices fournis dans le texte. Il est essentiel que les lecteurs
comprennent les principes sous-jacents qui guident l’utilisation de la gamme de
procédures des tests statistiques produites par ces programmes
économétriques. L’objectif de ce livre est de préparer les étudiants à effectuer
des travaux économétriques appliqués.
00000000000000000000000000000000000000
Héritier HESHEMU KATEBULA est assistant premier mandat à la faculté des

sciences économiques et gestion de l’Université de Lubumbashi en Rd-Congo. Il y
assiste les mathématiques appliquées à l’économie, l’introduction à
l’économétrie, l’économétrie de Panel, Séries temporelles, la microéconomie, la
macroéconomie, la recherche opérationnelle, la théorie des jeux, l’optimisation
dynamique, et la modélisation statistique appliquée en économie au niveau
Licence et est chargé de cours de techniques quantitatives dans plusieurs
universités et instituts de la Rd-Congo. Licencié en Economie mathématique et
Master en cours en Sciences économiques (Mathématiques appliquées aux
sciences sociales / économie mathématique, statistique et économétrie) à
l’université de YAOUNDE 2. Coordonnateur des projets LFUNG, ses travaux de
recherche portent sur la modélisation macroéconomique moderne (MEGC, DSGE
etc..), la monnaie , les inégalités, la pauvreté, l’économétrie de séries temporelles
et de Panel, l’optimisation et la nouvelle microéconomie.

Econometrie Exercices Hhkat Ok2 PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Econometrie Exercices Hhkat Ok2 PDF

Transféré par

Droits d'auteur :

Formats disponibles

UNIVERSITE DE LUBUMBASHI

Licence 3 Economie et Gestion (L3EG)

Rédaction rédigée sous la supervision du Professeur

Avec la collaboration bayésienne du Dr. Marius C. O.

Héritier HESHEMU KATEBULA

Héritier HESHEMU KATEBULA

« Il est à peu près impossible de faire de la recherche en sciences économiques

1. Qu’est-ce que l’économétrie

Cette synthèse sur l’introduction à l’économétrie et exercices résolus constituent un

À l'issue de la lecture de ce recueil, l'étudiant devra comprendre l'utilité de l'économétrie

Il sied de signaler que ce recueil ne remplace en aucun cas, le cours magistral de

HESHEMU KATEBULA Héritier

Je remercie aussi mes étudiants de licence 3 Economie et gestion promotion 2023-2024,

1.1. Origine de l’économétrie

L’institutionnalisation de l’Econométrie en tant que discipline des sciences économiques s’est

i Financer la publication d’une revue d’économétrie

INTRODUCTION A L’ECONOMETRIE / L3 ECONOMIE UNILU 2024 HESHEMU KATEBULA Héritier p 9

1.2. Définition de l’économétrie

Schéma 1. Définition de l’économétrie

STATISTIQUE MATHEMATIQUE ECONOMIE

Statistique descriptive et Algèbre Matricielle et Microéconomie et

« L’économétrie, c’est l’unification de la théorie économique, des mathématiques et des statistiques.

INTRODUCTION A L’ECONOMETRIE / L3 ECONOMIE UNILU 2024 HESHEMU KATEBULA Héritier p 10

1.3. Objectifs de l’économétrie

i l’objectif analytique tendant à tester ou à vérifier une théorie économique;

1.4. Modèle économique et modèle économétrique

Selon Barbancho 5 , un modèle est l’expression mathématique d’une certaine théorie

Qt = β0 + β1Pt (1.2) [avec β0 : intercepte et β1 < 0 propension marginale à demander]

INTRODUCTION A L’ECONOMETRIE / L3 ECONOMIE UNILU 2024 HESHEMU KATEBULA Héritier p 11

Qt = β0 + β1Pt + εt. (1.3) [modèle spécifié par l’économètre]

La première partie de ce modèle [β0 + β1Pt] constitue sa partie systématique ou déterministe

1.5. Portée et Méthodologie de l’Économétrie

Les étapes protocolaires de l’économétrie sont les suivantes :

i. Référence à une théorie

ii. Spécification ou formulation d’un modèle économétrique,

La consommation est fonction du revenu C = f (Y )

INTRODUCTION A L’ECONOMETRIE / L3 ECONOMIE UNILU 2024 HESHEMU KATEBULA Héritier p 12

C =α0 +α1Y (1.4) et I =β0 +β1r (1.5)

iii. Estimation ou confrontation du modèle avec les données

Séries temporelles (séries chronologiques, chroniques ou time séries) (Yt, t = 1, 2, ……T)

Séries en coupe transversale (coupe instantanée ou cross section) (Yi, i = 1, 2, ……n)

Panel (Yit , i = 1, 2, ……n, t = 1, 2, …..T)

vi. Validation et prévision

INTRODUCTION A L’ECONOMETRIE / L3 ECONOMIE UNILU 2024 HESHEMU KATEBULA Héritier p 13

Schéma 2. Etapes protocolaires ou Méthodologie de l’économétrie

MCO : Moindres carrés

Non validation Estimation : Confrontation MMG : Moments

Validation théorique : Théorème de Validation empirique :

2) Test de significativité globale (Fischer)

Prévision et utilisation du modèle à des fins de

INTRODUCTION A L’ECONOMETRIE / L3 ECONOMIE UNILU 2024 HESHEMU KATEBULA Héritier p 14

Exercice 1. L’économétrie est :

Exercice 2. Un paramètre est :

Exercice 3. La principale préoccupation de l’économie mathématique est :

Exercice 4. La différence entre un modèle économique et un modèle économétrique se voit :

INTRODUCTION A L’ECONOMETRIE / L3 ECONOMIE UNILU 2024 HESHEMU KATEBULA Héritier p 15

Exercice 6. Pour analyser un problème économique, l’économètre adopte le plus souvent la

Exercice 8. L’économétrie a un triple objectif en sciences sociales. D’abord, il apparait comme

Exercice 9. Le père de l’économétrie moderne

INTRODUCTION A L’ECONOMETRIE / L3 ECONOMIE UNILU 2024 HESHEMU KATEBULA Héritier p 16

La notion de corrélation étant au centre de l’analyse économétrique, ce chapitre marque

2.2. Graphique ou diagramme de dispersion

Fig 1. Corrélation négative Fig 2. Aucune corrélation Fig 3. Corrélation positive