Académique Documents
Professionnel Documents
Culture Documents
5. Contenu
O. Introduction générale :
2
INTRODUCTION GENERALE
SECTION 1 : Définition
Econométrie : c’est la méthode d’analyse des données qui, par
l’utilisation de la statistique et de la mathématique, recherche des
corrélations permettant l’étude et la prévision des phénomènes
économiques.
Econométrie, branche des sciences économiques qui traite
des modèles et des méthodes mathématiques appliquées aux
grandeurs et variations économiques.
Le calcul infinitésimal, les probabilités, les statistiques, la
programmation linéaire et la théorie des jeux, ainsi que d’autres
domaines des mathématiques, sont utilisés pour analyser,
interpréter et prévoir divers phénomènes économiques tels que les
variations de prix sur le marché, l’évolution des coûts de
production, le taux de croissance, le niveau du chômage, les
variations du taux de change, les grandes tendances de
l’économie à court et moyen terme qui permettent d’orienter la
conduite d’une politique économique. Les modèles utilisés ne
permettent pas de prévoir, au sens strict, l’évolution des
phénomènes économiques, mais davantage de construire des
hypothèses et d’extrapoler des tendances futures à partir
d’éléments actuels.
Etymologiquement le terme économétrie comprend deux
mots :
Economie et Métrie vient de mettre signifie mesure. Ce qui
désigne l’économétrie comme une technique qui concerne les
mesures des relations économiques. Scientifiquement, nous
5
Q = a + bp0 + cp1 + dr + eg
a , b , c , d et e sont les coefficients de l’équation, c’est-à-dire
les paramètres des comportements retenus.
Les seules déterminantes sont les quatre facteurs qui
apparaissent à droite de l’équation.
- La troisième étape est la mesure économétrique proprement
dite.
C’est ici qu’intervient la statistique, mais une statistique
spéciale :
6
𝑄 = 𝑎 + bp0 + cp1 + dr + eg + 𝑢
7
prix.
SECTION 2
2) Objectif décisionnel
Qd Qo bop (1)
Qd Q 1 b1p (2)
Qo Qd (3)
Qo = Quantité offerte Qd = Quantité demandée
Ce modèle est économique et non économétrique, pour rendre
ce modèle économétrique, il faut introduire une mesure
stochastique, c’est-à-dire commencer par poser l’hypothèse, selon
laquelle le modèle n’est pas parfait, qu’il a erreur. Il faut
introduire une erreur dans l’équation.
Nous aurons enfin le modèle économétrique suivant :
Qd Qo bop e (1)
Qd Q1 b1p e (2)
Qo Qd1 (3)
De ce qui procède, il résulte des sources d’hypothèses
suivantes :
L’économie, les mathématiques et les statistiques.
La science économique a pour ambition de combiner toutes
les branches en vue de mesurer les relations entre variables
économiques. Cette mesure des variables économiques se fait par
trois étapes comme signalées ci-dessous.
C Qo Q1Y e
On doit s’attendre d’après la théorie économique à ce que le
coefficient Q1 qui désigne la propension marginale à consommer
12
REMARQUE
La spécification du modèle est l’étape la plus importante et la
plus difficile de la recherche économétrique. Notons que toutes les
méthodes économétriques que nous verrons sont très sensibles
aux erreurs de spécification ; c’est-à-dire les erreurs des
coefficients seront incorrectes ou peu fiables lorsque le modèle
n’est pas correctement spécifié.
Les erreurs de spécification sont les suivantes :
Omission de certaines variables importantes ;
Exemple : dans une équation de demande, omettre le prix ou -
omission d’une équation importante ;
Exemple : dans un modèle d’équilibre de marché, oublier une
équation.
- Spécification d’une forme fonctionnelle erronée ;
Exemple : l’équation est exponentielle, vous spécifiez un modèle
linéaire.
Certaines des causes de mauvaise spécification sont faciles à
appréhender :
- La pauvreté des énoncés théoriques ;
- les limites des connaissances sur les facteurs déterminants
dans un cas particulier ;
- le manque des données pour le modèle large.
2) Identification de la fonction
1) Critères économiques
Ce sont des critères qui sont déterminés par les lois de la
théorie économique et se rapportent aux signes et grandeurs des
paramètres des relations économiques.
- le coefficient de corrélation
Y = Quantité d’offre,
X = prix
On néglige donc d’autres variables et on s’en tient à ce qu’Y
soit fonction de prix.
19
Exemples 1
On nous demande :
- d’estimer les paramètres 𝛼̂ et𝛼̂ ;
- de procéder à une analyse des variances ;
- de déterminer le coefficient de détermination R2 et coefficient
de corrélation r ;
- d’établir les intervalles y afférent à β au niveau de
probabilité de 95% ;
- de tester les hypothèses (1 – ε = 95 %) ;
- décision.
Ho a 0 Ho 0
H1 0 H1 0
Résolution
Calcul de 𝑋𝑖 et 𝑌𝑖
X x
n
Y y
n
Calcul de Xi et Yi
Xi X X
21
X 4 400 400 0
X i 0
Yi Y Y
Y1 40 60 20
Y2 50 60 10
Y3 50 60 10
Y4 70 60 10
Y5 65 60 5
Y6 65 60 5
Y7 80 60 20
Y 0 i
Calcul ̂ et ̂
ˆ XY i i
X
2
i
ˆ Y ˆ X
X Y 16500 ; X 280.000
2
i i i
ˆ X Y i i
16500
0,0589
X
2
i
280.000
Calcul Yˆi
Yˆi ˆ β̂Xi Ui
Estimation de la régression
Les coefficients ̂ et β̂ sont d’habitude inconnus, il faut donc
les estimer sur base d’observations statistiques. Si on donne les
valeurs X1, X2……….𝑋𝑛 à X et on observe Y1, Y2,…….. 𝑌𝑛 comme
valeurs de Y, alors le modèle impose
Yi βX i εi qui signifie Y, est corrélé à Xi pour une relation
linéaire (𝛼̂ et 𝛽̂) avec une erreur aléatoire εi , ce que l’on doit
supposer pour que la quantité εi soit une erreur et non un écart
systématique. C’est que E (εi = 0), dans ce cas il nous est possible
d’estimer Yˆi ˆ β̂x i où a et b sont deux nombres qui estiment ̂ et
β̂ .
e1 40 42,33 2,33
e2 50 48,22 1,78
e3 50 54,11 4,11
e4 70 60 10
e5 55 5,89 0,89
e6 65 71,78 6,78
e7 80 77,67 2,33
e i 0
e 177,65
2
i
2
∑ e2i ̂)
= ∑(Y − Y
24
𝑥̅ 𝑦̅
| |
0 𝛼̂
- le coefficient de corrélation
On considère une série d’observation X et Y et on se demande
s’il existe un degré d’association entre deux variables, c’est une
analyse de corrélation. Le coefficient de corrélation est une
indication d’une liaison linéaire entre les variables X et Y, permet
d’en mesurer le degré d’intensité.
La corrélation ne peut pas avoir lieu entre deux variables
indépendantes.
Exemple :
L’âge et le résultat à l’école. Alors la corrélation peut se
réaliser qu’entre deux variables dépendantes, exemple : la taille et
le poids de l’enfant ; les deux variables sont dépendantes et
augmentent au même moment, ici nous sommes devant une
corrélation positive. Tandisque l’exemple de la vente de billets
dans un stade ou dans une salle de cinéma au fur et à mesure
que les billets diminuent les places aussi diminuent, c’est une
corrélation négative.
La formule pour trouver le coefficient de corrélation est :
25
r Yi Xi
Xi Yi
2 2
r Yi Xi
16.500
16.500
16.500
0,91
Xi Yi
2 2
280.000 1.150 529,15 33,91 17944,34
Degré de détermination
26
R 2
1
ei 2
, R2 1
ERSS(VNE) 2
R 1
177,65
0,85
yi 2
TSS(VT) 1150
177,65
R2 1 0,85
1150
La relation entre le coefficient de corrélation et le coefficient
de régression, est donnée par le degré de détermination.
27
Var u
2
ei
N2
Var u
2
ei 177,65
35,53
N2 72
DL = N - K
- 2,5 1−α
+ 2,5
- t α/2 + t α/2
Démonstration de la formule
- Tx/2 < T < Tx/2 1 x
β̂ βo
T
Sβ̂
1) Intervalle de confiance α
Sˆ t/2 < < Sˆ t/2
36,4 – 2,22 < α <36,44 + 2,22 (2,5)
30,81 < α < 42,065
2) Intervalle de confiance pour β
β Sβ̂ tx/2 < β < β Sβ̂ tx/2
2) Procédure du test
- t α/2 1-ε
+ t α/2
Pour b pour a
Ho : b = 0 Ho : a = 0
H1 : b # 0 H1 : a # 0
B̂ Bo â ao
Zc Zc
Var b̂ Var â
Interprétation
Si on rejette ou accepte Ho ce qu’a et b est ou n’est pas
significativement différent de zéro.
32
1. Calcul de X et de Y
a) X b) Y
X Y
N N
Calcul de Xi et de Yi
a) Xi X X b) Yi Y Y
Calcul de β et a
a) ˆ
XiYi
b) ˆ Y X
Xi 2
Calcul de Y
33
Yˆ aˆ ̂Xi
Calcul de ei
ei Y Yˆ
r Yi Xi
Xi Yi
2 2
Calcul de R²
1
2
2 ei
R
yi 2
u
2
ei2
N 2
ei 2
2
N Xi 2
1
2 ˆ 2ei
Xi 2
Les intervalles de confiance
a) ˆ ˆ t 2 < < ˆ ˆ t 2
H1 : b # 0 H1 : a # 0
bˆ b aˆ a
Tcbˆ Tc aˆ
bˆ â
Pour tracer la droite bX + α
𝑥̅ 𝑦̅
| |
0 𝛼̂
Exemple 2 : la fonction linéaire à deux variables (variable de
revenu de l’agriculteur en fonction de sa superficie cultivée.
Y = revenu en dollars
X = superficie cultivée
Le modèle théorique est le suivant :
Yi a bXi Ui
Estimer ̂ et ̂
Déterminer r et R²
Estimer la variance résiduelle et les variances estimateurs
Etablir les intervalles de confiance Y afférant à β au niveau
de la probabilité de 95 % (le seuil de signification est de 5 %).
X 21 75 67 47 80
Y 112 210 410 330 405
Année 1 2 3 4 5
Calcul de X et Y
X
X
290
58
N 5
Y
Y 1.467 293, 4
N 5
2). Calcul de X et de Y
35
a) X X X b) Y Y Y
X1 = 21 – 58 = -37 Y1 = 110 – 293,4 = - 181,4
X2 = 75 – 58 = 17 Y2 = 210 – 293,4 = - 83,4
X3 = 67 – 58 = 9 Y3 = 410 – 293,4 = 116,6
X4 = 47 – 58 = - 11 Y4 = 330 – 293,4 = 36,6
X5 = 80 – 58 = 22 Y5 = 405 – 293,4 = 111,6
∑X = 0
3). Calcul de ̂ et ̂
a) ˆ 2
XiYi 8,396
Xi 2,344
Y
𝑦
̅
𝛼
̂
𝑥̅ 𝑋
3). Calcul de B et α
a) ˆ 2
XiYi 8,396
3,58
Xi 2,344
4). Calcul de y
yi ˆ β̂xi ui
5). Calcul de li
ei yi yi
37
∑ei = 0
0 ̂
x y
r Yi Xi
Xi Yi 2 2
8,396
r 66%
2.344 67.251,2
1
2
ei 37.177,44
R 2
1 50%
yi 2
67.251,2
Var u 2 ei 2
37.177,44
12.932,48
N 2 52
Var â Xi 2
12.392,48 2,344
2478,49
N Xi 2
11.720
38
1 12.392,48
Var b̂ 5.2868
Xi 2
2,344
SB = 2,29 ; Sα = 49,78
9). Les intervalles de confiance
a). α - sαtα/2 < α < α + p α α/2
b). B – Var B t α/2 < B < B + Var B tα/2
1). 85,76 – 49,78 (3,1) < α< 85,76 + 49,78 (3,1)
2). 3,58 – 2,29 (3,1) < B < 3,58 + 2,29 (3,1)
EXERCICES
Exercice 1.
Supposons qu’on ait à observer la fonction d’offre suivante
sur un échantillon de 7 observations.
Y = 100 + 4,00 x
(20) (1,5) on veut tester b
1). Condition
La taille de l’échantillon (700) est suffisamment large pour
considérer que l’écart type estimé est une bonne approximation
de l’écart type vrai. On peut alors utiliser le test t.
2). Hypothèses
39
Bˆ Bo 4
t cb 2,26
Sˆ Bˆ 1,5
Ho: b = 0
3). Statistiques du test
Bˆ 0 4
t cb 2,26
Sˆ Bˆ 1,5
t cb̂
> t/2 :On rejette HO
6). Interprétation
b étant élasticité de cette fonction d’offre, il est plus que probable
que la pente vraie (b) est différent de zéro.
Exercice 2.
Revenus X 11 8 7 5 5 25 10 4
Ventes en Y 24 18 12 12 11 50 24 10
milliers
Exercice 4.
Après une analyse économique sur la commercialisation du
cuivre à l’étranger par la Gécamines, Monsieur TITA, a relevé les
renseignements suivants :
Où X = la commercialisation du cuivre ;
Y = les recettes réalisées par la Gécamines.
En nous servant des informations ci-dessus :
41
Exercice 5.
Veuillez concevoir un modèle économétrique la régression
simple et de tester l’association entre la consommation de tabac
et le cancer des bronches, pour cinq périodes.
Y = cancer des bronches
X = consommations des tabacs
Exercice 6.
Un chercheur est intéressé par les deux séries
chronologiques suivantes :
X = enfants morts ayant moins d’un an (milliers)
Y = consommations de bière (tonneaux)
Exercice 7.
Etudiants 1 2 3 4 5 6 7 8
Cotes 1 6 4 2 3 7 8 10
Nombre 2 5 6 1 4 10 7 9
d’heures
Calculer r
Exercice 8.
Chiffre d’affaire et budget publicitaire d’une entreprise
Budget
Chiffre
Année Publicitaire 3
d’Affaires
% du C.A
Y = chiffres d’affaire
X = coûts publicitaires
Calculer la corrélation entre les coûts publicitaires et les
chiffres d’affaire.
Notion de degré de liberté
Par degré de liberté, il faut entendre le nombre total
d’observation diminue les paramètres à estimer (K). Dans
l’expression, le degré de liberté est donné par N-2, les paramètres
étant a et b.
DL = N – K en régression simple
DL = N – K – 1en régression multiple
43
Les hypothèses :
Main d’œuvre 𝐱𝟐
Production y
Capital 𝐱𝟏
𝑨𝒏𝒏é𝒆
On nous demande :
- D’extrapoler la production jusqu’à l’an 2025 si la main-
d’œuvre était maintenue constante et l’accroissement de
capital augmente de 20 % chaque année dès 2022;
- Déterminer le coefficient de corrélation partiel entre Y et X1,
Y et X2 et le coefficient de corrélation multiple ;
- De tester les hypothèses au seul de signification de 5 %.
Connaissant les données de X1 et X2, notre première
préoccupation consistera à calculer ̂o , ̂1 , ̂ 2 et ̂o = partie
autonome.
B1 et B2 sont coefficients des variables indépendantes.
Xi1Yi b Xi1 b Xi1Xi2
1
2
2
b̂o Y - b1 X1 - b 2 X 2
280.000b1 -10.960
Bo Y - B1X1 - B2 X 2
47
r1
Xi1Yi
16.500
0,91
Xi1 Yi
2 2
280.800 x1,150
r2
X12Yi
600
600
0,88
Xi2 Yi
2 2 400 x1,150 678,2
Tt = 2, 78
Β1 = b ± 2,78(0,00437)
0, 02586< β < 0, 05014: H1
β̂ βo 0,036
Tcb̂1 8,69
S 1 0,000437
Tcβ< tt → H1
8,69 > 2,78
B2 = 0, 83 ± 2, 78(0,115)
0, 5103 < β < 1, 497
𝛽 −𝛽 ̂0,083
𝑇𝑐𝑏̂2 = ̂ 0 = = 7,2
𝑆𝛽 2 0,115
Tcb2 > tt → H1
(7,2> 2, 78
Exercice2.
On a répondu à plusieurs reprises des quantités d’engrais sur
un lot de terre et on a observé le rendement du mais pour
différents niveaux des précipitations. A chaque semence, ces
observations faites sont les suivants :
49
Exercice 3.
Dans une unité chimique, le pourcentage d’ammoniac perdu
(y), dépend des facteurs suivants :
X1 = débit ; X2 = température de l’eau de refroidissement ; X3 =
concentration d’acide nitrique. A partir de n = 21 observation, on
a estimé l’équation suivante :
Ŷ 40 0,72 1 1,29 2 0,15 3
X1 X2 Y
70 21 198
35 26 209
55 14 197
25 10 156
28 12 85
43 20 187
15 5 43
33 28 211
23 9 120
4 6 62
45 10 176
20 8 117
56 36 273
51
B1
B2 X'X 1 X'Y
B3
1 70 21 198 û1
1 35 26 209
1 55 14 156
1 25 10 85
1
28 12 187
1 43 20 43
X Y U
1 15 5 211
1 33 28 120
1 4 6 62
1 45 10 176
1 20 8 117
1 û
56 36 273 13
1 1 1 1 1 1 1 1 1 1 1 1 1
X' 70 35 55 25 28 43 15 23 4 45 20 26
21 26 14 10 12 20 5 28 9 6 10 8 36
13 452 205
( X ' X ) 452 19828 8452
205 8452 4343
2034
( X ' Y ) 82495
38769
X' X 36557768
37,5023
B (X'X) 1(X'Y) 1, 4963
4, 2446
S 2uˆ
ûi2
n K 1 (0, 40147 0, 00039 0, 00146)
S (b 0 ,b1 ,b 2 ) Suˆ 2
2
Exercice 5
Disposant des données ci – après :
Y X1 X2
10 4 7
12 6 4
16 5 8
18 8 6
20 7 9
D’où
6,465306122
2,13012245
1,306122449
2,1706122449
B1 5,014304205
0,4328840366
1,306122449
B2 3,670449783
0,3558284862
R2 = 0,945
Pour α = 0,05, Bo n’est pas significatif car la valeur calculée
de t student est 1,7489 inférieur à la valeur du t de la table qui
est de 4,3 ; De même pour B2.
Par contre B1, est significatif car la valeur calculée de t
student est supérieure à celle de la table.
On calcul le F de Fisher qui est :
𝑅2/(𝐾−1) 0,94589/2
F= = = 26,22130845
(1−𝑅2)/(𝑇−𝑘) (1−0,94589/3
Exercice 6
Le tableau suivant concerne 15 pays développés et donne
pour chacun d’eux, le revenu réel par tête d’habitant y en milieu
55
Pays
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
n°
Y 6 8 8 7 7 12 9 8 9 10 10 11 9 10 11
X1 9 10 8 7 10 4 5 5 6 8 7 4 9 5 8
X2 8 13 11 10 12 16 10 10 12 14 12 16 14 10 12
Solution
Le nombre à estimer est :
Y=Bo+B1Xi1+B2Xi2+Ui
Le vecteur des paramètres estimés est :
B0
B B1 X ' X X ' Y
1
B 2
T
X 1 X 2
X ' X X1 X 2
X X 1 2
1
X 2 X X X 2
1 2 2
795 1248
cof X 1.1 218526;
1248 2234
105 1248
cof X 1.2 9930;
180 2234
105 795
cof X 1.3 12060;
180 1248
15 180
cof X 2.2 1110;
180 2234
15 105
cof X 2.3 ;
180 1248
57
15 105
cof X 3.3 900;
105 795
218526 9930 12060
cof X ' X 9930 1110 180
12060 180 900
B 2
218526 9930 12060 135 620
1
9930 1110 180 917 0,38
644440
12060 180 900 1658 0, 45
u 'u
variance du terme aléatoire µ et est donne par S 2 où u est
T K
le vecteur des résidus d’estimateur (T = taille de l’échantillon et K
= nombre de paramètre estimés)
u ' u Y ' Y B ' X ' Y avec Y ' Y Y12 125
135
u ' u 1255 6, 20 0,38 0, 45. 917
1658
u 'u
12, 2718808 et S 2
T K
12, 2718808
1, 02265673
15 3
D’où
S 2 B S 2 X ' X X 'Y
1
58
Où
S 2 ( B 0 ) 3, 46798705, S ( B1 ) 0, 0176156
S 2 ( B 2 ) 0, 01428292
S 2 ( B 0 ) 1,862253219; S ( B1 ) 0,132723756;
S ( B 2 ) 0,11951115
SOLUTION
1 0 1 2 1 2 0 1 0 1 9
0 1 2 0 1 1 0 2 1 0 8
1 0 1 4 1 4 0 1 0 1 13
0 1 4 0 1 1 0 4 1 0 12
0 0 2 0 1 2 0 2 0 0 7
V ( x)
13
V(X) = − (0,9)2 = 0,49 et l’écart type
10
= √𝑉(𝑋) = √0,49 = 0,9
V(Y) = 12⁄10 − (0,8)2 = 0,56 et l’écart type √𝑉(𝑦) = √0,56 = 0,75
7
Cov (X, Y) = − 0,9 𝑥 0,8 = 0,02
10
Rxy = 0,02/0,7 x 0,75/ = - 0,0
𝑋𝑖2 𝑌𝑖2
V(X) = − 𝑋2 V(Y) = − 𝑌2
𝑁 𝑁
COV(X, Y = XY – X x Y
Régression simple
Exercice 1
Le tableau ci-dessous présente les données relatives à
l’exploitation de bois de la forêt équatorial en RDC et son
exportation pendant la période de 1990 à 1995
X= Taux annuel d’exploitation
Y= Taux annuel d’exportation
Exercice 2
Le tableau ci-après reprend les données statistiques relatives
au produit intérieur bruit (PIB) et la consommation privée de la
RDC pour la période allant de 1980 à 1995.
X 43 36 52 27 49 32 70 66 49 67 40
Y 130 145 156 150 147 166 210 199 194 202 160
Questions :
1. Déterminer le coefficient de corrélation ainsi que le degré de
détermination ;
2. Etablir les intervalles de confiance y afférent à 𝛽 au niveau de
probabilité de 95% et tester l’hypothèse au seuil de signification
de 5%.
La régression multiple :
Exercice
Niveau des Rendement
Engrais précipitations du maïs
(mn) (Q/ha)
50 15 20
100 10 25
150 5 25
200 15 35
250 10 32,5
300 10 32,5
350 15 40
64
2,571