Vous êtes sur la page 1sur 64

1

1.Intitule du cours : Econométrie


- Volume horaire : 1,5 crédit.
- Responsable : Prof. Dr ADJANGA NATORO PIPA Rémy
- Collaborateur : ASS DANZIMA MAKIDO José
- Année d‘étude : L3

2.Objectifs généraux : Trois objectifs généraux : analytique,


décisionnel et prévisionnel.
- L’analytique, l’étudiant doit être capable de vérifier les
hypothèses dans un modèle ;
- Décisionnel, l’étudiant doit être capable de mettre en pratique
les modèles économétriques dans les situations réelles ;
- Prévisionnel, l’étudiant doit être capable de prédire les
grandeurs économiques futures en vue de prendre des mesures
appropriées qui influencent le cours des événements.
3.Pré requis : Mathématique, économie, statistique descriptive.
4.Objectifs spécifiques
Les futurs ingénieurs seront capables de tirer des
conclusions sur le rendement, la fiabilité ainsi que la rentabilité
d’outil de production dans son cadre social où ils sont appelés à
prendre des décisions pour un meilleur avenir de la production.

5. Contenu

O. Introduction générale :
2

Définition, objectifs, méthodologie


Chapitre I : Modèle simple en économétrie
- Construction d’un modèle en économétrie
- Coefficient de corrélation
- Degré de détermination
- Intervalle de confiance
- Test d’hypothèse
Chapitre II. Modèle multiple en économétrie par la méthode de
deux équations à deux inconnues.
Chapitre III. Modèle multiple en économétrie par la méthode
matricielle.
6.Mode d’évaluation

TP (travaux pratiques), TD (travaux dirigés), TPE (travaux


personnels de l’étudiant ; Examen.
7.Références bibliographiques
1. ARTHUR S.GOLDBERGER, Econometric-theory, Department of
Economics and Social Systems Research Institut, University of
Wisconson, New- York, 1966.

2. CLAUDE COSSU, Comptabilité analytique et gestion budgétaire,


édition ISTRA (cours et corrigés).
3. CONSTANTIN BARBULESCU, Conducerea organizarea si
planificarea unitatilor economice, Bucaresti, 1981.
4. DEHEM R, Traité d’Analyse économique, Dunod, Paris, 1963.
5. G.S MADDALA, Econometrics, Ed Macgraw – hall; 1977.
6. G.VANGRE VILINGLE, Econométrie, d’Herman, 1973.
7. GHEORGHUI, Analiza activitatii Economice a Intreprinderilor,
Bucarest, 1982.
3

8. GUSTAVE, ECONOMETRIE, Kinshasa, 2004.1111


9. J. JOHNSON, Econometric methods, Ed- Macgraw – hall, 1972.
10. J.François AUDROING et Nabi BDOU ? Initiation au calcul
des Probabilités et à la théorie de l’échantillonnage, ministère
de la Coopération, Paris, 1979.
11. KINTAMBU MAFUKU EMMANUE : Econométrie;
12. KUFULULA MAKILA, Elements d’Economètrie, Kinshasa,
1989.
13. LABROUSSE, Introduction à l’Econométrie, Dunod, Paris,
1972.
14. LECAILLON J. Analyse micro économique, Ed, Cujas, Paris,
1967.
16. MUSTAFA BENYAKLEF, Probabilités et Statistique
Mathématique, Tome II, Maroc 1977.
4

INTRODUCTION GENERALE

SECTION 1 : Définition
Econométrie : c’est la méthode d’analyse des données qui, par
l’utilisation de la statistique et de la mathématique, recherche des
corrélations permettant l’étude et la prévision des phénomènes
économiques.
Econométrie, branche des sciences économiques qui traite
des modèles et des méthodes mathématiques appliquées aux
grandeurs et variations économiques.
Le calcul infinitésimal, les probabilités, les statistiques, la
programmation linéaire et la théorie des jeux, ainsi que d’autres
domaines des mathématiques, sont utilisés pour analyser,
interpréter et prévoir divers phénomènes économiques tels que les
variations de prix sur le marché, l’évolution des coûts de
production, le taux de croissance, le niveau du chômage, les
variations du taux de change, les grandes tendances de
l’économie à court et moyen terme qui permettent d’orienter la
conduite d’une politique économique. Les modèles utilisés ne
permettent pas de prévoir, au sens strict, l’évolution des
phénomènes économiques, mais davantage de construire des
hypothèses et d’extrapoler des tendances futures à partir
d’éléments actuels.
Etymologiquement le terme économétrie comprend deux
mots :
Economie et Métrie vient de mettre signifie mesure. Ce qui
désigne l’économétrie comme une technique qui concerne les
mesures des relations économiques. Scientifiquement, nous
5

pouvons la définir comme un ensemble des techniques ou


procédures permettant d’obtenir et de projeter une mesure
quantitative des relations entre les variables économiques, et d’en
tester la validité. L’économétrie se relève donc comme la
combinaison de la théorie économique, de l’économie
mathématique et de la statistique dans le double
But :
a) De déterminer empiriquement les relations économiques
- La première étape consiste à donner des valeurs numériques
aux paramètres des relations économiques.
Exemple:
La théorie économique postule que la demande d’un bien est
fonction de son prix, des prix d’autres biens, de revenu et du goût
du consommateur. Ceci est une relation exacte, parce que la
demande est déterminée par ces quatre facteurs.
- La deuxième étape consiste à exprimer les relations
économiques en terme mathématique pour pouvoir les mesurer.
C’est la construction du modèle.

Q = a + bp0 + cp1 + dr + eg
a , b , c , d et e sont les coefficients de l’équation, c’est-à-dire
les paramètres des comportements retenus.
Les seules déterminantes sont les quatre facteurs qui
apparaissent à droite de l’équation.
- La troisième étape est la mesure économétrique proprement
dite.
C’est ici qu’intervient la statistique, mais une statistique
spéciale :
6

L’économétrie. Cette mesure économétrique consiste à utiliser


des méthodes spécifiques pour obtenir les valeurs numériques
des coefficients des relations économiques (dans notre exemple ci-
dessus, a, b, c, d et e), les méthodes économétriques sont des
méthodes spécifiques adaptées aux particularités des
phénomènes économiques.
Deux particularités de ces phénomènes méritent d’être
soulignées :

Les phénomènes économiques ne sont pas susceptibles


d’expérimentation contrôlée comme en science exacte. Les
données qui servent à la mesure économique des relations sont
tirées de la vie réelle.
Une adaptation des méthodes statistiques aux phénomènes
économiques consiste justement à construire des méthodes qui
permettent de traiter ces données non expérimentales. Les
phénomènes économiques sont déterminés par un grand nombre
de facteurs dont certains sont connus d’autres pas. Ceci interdit
d’exprimer les relations économiques sous forme exacte, en
ignorant les autres facteurs que le modèle ne prend pas toujours
en considération.

En économétrie, l’influence des autres facteurs sont pris en


compte en incluant une variable aléatoire, dans l’exemple ci-
dessus, l’équation de la demande qui fera l’objet de la mesure
économétrique, sera sous la forme stochastique suivante :

𝑄 = 𝑎 + bp0 + cp1 + dr + eg + 𝑢
7

u : Représente les facteurs aléatoires affectant la quantité


demandée.

b) De tester les théories économiques

Nous partirons de la théorie économique, de la théorie


mathématique, plus un terme d’erreur.
Exemple :

La demande d’un bien est en relation inverse avec le prix de


ce bien.
Q  a  bp  e
Dq
Augmentation de la demande est en relation inverse avec son
Dp

prix.

Nous allons ensuite estimer le paramètre b et le confronter à


ce que dit la théorie économique. Si b est inférieur à zéro, la
théorie économique est vérifiée. Si non, cela signifie que la théorie
ne se vérifie pas dans l’échantillon prélevé. A ce cas on décide
soit de rejeter la théorie, soit amender la théorie en ajoutant dans
la relation une nouvelle variable.
Exemple :
q  a  bp  cr  u
La théorie ainsi amender doit être ré testée.
8

SECTION 2

Les objectifs de l’économétrie :


1) Objectif analytique
Il s’agit de tester les théories économiques, c’est-à-dire d’en
rechercher la pertinence pour décider de son pouvoir explicatif. Il
est de plus en plus admis que toute théorie ne peut être
généralement acceptée sans vérification empirique. L’économétrie
se relève comme un instrument des politiques économiques.

2) Objectif décisionnel

Il s’agit d’obtenir des estimations numériques des coefficients


dans les relations économiques afin de stimuler les politiques
économiques ou d’entreprises.
Si q  12  0,3p
La simulation consistera à déterminer par exemple la
quantité qui sera demandée si le prix venait à changer. Exemple :
si en 2021, on observe la relation. Q=12-0,3p, on peut extrapoler
cette relation dans le futur, si en 2022 les prix s’élèvent à 40,
quelle sera la quantité demandée, on peut alors calculer le seuil
de rentabilité par exemple.
3) Objectif prévisionnel :
Qui consiste à obtenir des valeurs numériques pour prédire
les grandeurs économiques futures en vue de prendre des
mesures appropriées qui influencent le cours des événements.
Cette brochure est indispensable pour les ingénieurs, car il
permet de tirer des conclusions sur le rendement, la fiabilité ainsi
que la rentabilité d’outil de production dans son cadre social où
9

ils sont appelés à prendre des décisions pour un meilleur avenir


de la production.
SECTION 3 :

Méthodologie de recherche en économétrie

La démarche économétrie comprend trois étapes :


1) La spécification du modèle ;
2) L’estimation des paramètres ;
3) L’évaluation de cette estimation.
Mais avant d’entrer en détail, disons un mot sur le terme
« modèle ».
Notion de modèle économétrique :
Un modèle est une représentation des idées sur un
phénomène donné, mais il existe plusieurs types des modèles :
- si nous utilisons le verbe, nous avons un modèle verbal ;
- si nous utilisons les mathématiques, nous avons un modèle
mathématique ;
- si c’est un phénomène aléatoire, nous avons un modèle
statistique.
Un modèle économétrique est une représentation des idées
sur les relations existantes entre variables économiques
indépendantes (exogènes, explicatives) et dépendante (endogène),
en utilisant les symboles. Ce qui fait d’un modèle qui utilisé des
symboles mathématiques, pour analyser les phénomènes
économiques.
Un modèle économétrique, c’est l’utilisation de ce modèle
(demande), d’une hypothèse statistique.
10

Qd  Qo  bop (1)
Qd  Q 1  b1p (2)

Qo  Qd (3)
Qo = Quantité offerte Qd = Quantité demandée
Ce modèle est économique et non économétrique, pour rendre
ce modèle économétrique, il faut introduire une mesure
stochastique, c’est-à-dire commencer par poser l’hypothèse, selon
laquelle le modèle n’est pas parfait, qu’il a erreur. Il faut
introduire une erreur dans l’équation.
Nous aurons enfin le modèle économétrique suivant :
Qd  Qo  bop  e (1)
Qd  Q1  b1p  e (2)
Qo  Qd1 (3)
De ce qui procède, il résulte des sources d’hypothèses
suivantes :
L’économie, les mathématiques et les statistiques.
La science économique a pour ambition de combiner toutes
les branches en vue de mesurer les relations entre variables
économiques. Cette mesure des variables économiques se fait par
trois étapes comme signalées ci-dessous.

ETAPES 1 : SPECIFICATION DU MODELE

Détermination des variables :


Il s’agit de spécifier des variables exogènes (redresseurs,
explicatives, indépendantes) qui influencent la variable endogène
(régressant, expliquée, dépendante).
La détermination des variables explicatives se fonde sur :
- La théorie économique ;
11

Exemple : la théorie de l’investissement dit que celui-ci dépend


du taux d’intérêt, du niveau de revenu ;
- Les études antérieures
Ces études peuvent nous déceler certains variables
décisionnelles ;
- Les informations sur les circonstances particulières, sur le
comportement même de l’agent économique.
Rappelons qu’il a une troisième catégorie des variables
appelées, terme d’erreur. Ceci parce qu’il est impossible d’inclure
dans le modèle toutes les variables explicatives. Ainsi, on inclura
dans le modèle des variables importantes et toutes les variables
restantes seront comprises dans les variables stochastiques. De
déterminer à priori des signes et des grandeurs des paramètres
avant d’estimer, on s’attend d’après la théorie économique à ce
que les paramètres aient des signes et des grandeurs
déterminées. Cette détermination à priori nous permet d’établir
des critères économiques selon lesquelles les paramètres estimés
seront jugés à posteriori.
Les critères de choix de ces signes et grandeurs sont :
La théorie économique, les études antérieures et l’information
spécifique à propos du phénomène étudié.
Exemple : soit la version simple la fonction de consommation qui
stipule que la consommation dépend du revenu c’est-à-dire :

C  Qo  Q1Y  e
On doit s’attendre d’après la théorie économique à ce que le
coefficient Q1 qui désigne la propension marginale à consommer
12

soit de signe positif et que sa valeur soit comprise dans l’intervalle


0 et 1.
Donc 0 < Q1 < 1
On s’attend par ailleurs à ce que le signe du terme constant
Qo (consommation de la substance ou incompressible) soit positif.
Détermination de la forme mathématique du modèle.
Il s’agit de déterminer le nombre d’équations du modèle ainsi que
la forme fonctionnelle de ces équations (linéaire ou non).
La détermination de la forme mathématique dépend :
- de la théorie économique ;
- du graphique si la théorie est muette, en examinant la forme
de la courbe obtenue en portant la variable endogène sur
graphique et chacune des variables explicatives ;
- de l’expérimentation en estimant plusieurs formes
fonctionnelles et choisir la forme la plus satisfaisante
d’après les critères imposés ;
- la détermination de nombre d’équations est laissée à la
direction de chercheur.
En général, ce nombre dépend des facteurs ci-après :
- La complexité de la relation à étudier. Il faut ici spécifier
toute la structure du marché ou du bien ;
- le but poursuivi par la recherche (prévision, analyse,
décision) ;
- la disponibilité des données sur les variables ;
- la facilité des calculs.
13

REMARQUE
La spécification du modèle est l’étape la plus importante et la
plus difficile de la recherche économétrique. Notons que toutes les
méthodes économétriques que nous verrons sont très sensibles
aux erreurs de spécification ; c’est-à-dire les erreurs des
coefficients seront incorrectes ou peu fiables lorsque le modèle
n’est pas correctement spécifié.
Les erreurs de spécification sont les suivantes :
Omission de certaines variables importantes ;
Exemple : dans une équation de demande, omettre le prix ou -
omission d’une équation importante ;
Exemple : dans un modèle d’équilibre de marché, oublier une
équation.
- Spécification d’une forme fonctionnelle erronée ;
Exemple : l’équation est exponentielle, vous spécifiez un modèle
linéaire.
Certaines des causes de mauvaise spécification sont faciles à
appréhender :
- La pauvreté des énoncés théoriques ;
- les limites des connaissances sur les facteurs déterminants
dans un cas particulier ;
- le manque des données pour le modèle large.

ETAPES 2 : ESTIMATION DU MODELE

Cette étape intervient après spécification du modèle. Il s’agit


donc d’obtenir des estimations numériques des coefficients du
modèle.
L’estimation consiste :
14

- à rassembler les données ;


- à examiner les conditions d’identification de la fonction ;
- à examiner les problèmes d’agrégation de la fonction ;
- à examiner le degré de corrélation entre variables
explicatives ;
- à choisir la technique appropriée.

1. Le choix des données : Il s’agit de rassembler les données ou


observations statistiques sur les variables incluses dans le
modèle. Il existe plusieurs types de données dont les principaux :

a)Séries chronologiques (Times séries) :

Données qui fournissent des valeurs numériques des variables


relatives d’une période à une autre.

b) Coupes instantanées (Gross Section) :

Elles donnent les informations sur les variables relatives aux


agents individuelles (producteurs, consommateurs…) ou à des
points de l’espace, à un moment donné de temps (ville, pays…).

c) Variables auxiliaires (Dummy variables) :

Sont des variables constantes pour l’économètre, pour traduire


les variables qualitatives : sexe, religion, tribu….

2) Identification de la fonction

Il s’agit d’établir que les coefficients qui seront estimés sont


réellement les coefficients vrais de la fonction étudiée.
15

Exemple : Soit à estimer Qo  a  bp (offre), en quoi a et b sont-ils


différentes de C et d de l’équation Qd  C  dp (demande)
Qo  Qd et que c’est le même prix qui vaut sur le marché.

3) Examen du problème d’agrégation

Le problème d’agrégation Examen du problème provient du fait


qu’on utilise des variables agrégées dans la fonction :

a) de l’agrégation sur les individus

Exemple : Revenu total = somme des revenus individuels

Offre total = somme d’offres des firmes individuelles

b) de l’agrégation sur les biens.

Ce sont des agrégations de qualité ou de prix utilisant des indices


de quantité ou de prix.

c) de l’agrégation sur les points de l’espace

Exemple : population de différentes villes, pays.

4) Examen de degré corrélation entre les variables exogènes.

Si les variables explicatives sont fortement corrélées (évoluant


dans le même sens) il devient impossible de distinguer la
contribution de chacune d’elle à l’explication de la variable
endogène.
Exemple : nous savons que le prix et le salaire évoluent dans le
même sens. Si par exemple comme variables explicatives de la
fonction de la demande nous considérons ces deux variables, il
est fort probable que les valeurs estimées des coefficients
16

manquent des précisions et montrent une influence troquée de


deux variables. Le problème de corrélation des variables est
connu sous le terme MULTICOLLINEARITE.

5) Choix de la technique économétrique.

Il existe plusieurs techniques économétriques à savoir :


- les moindres carrées ordinaires ;
- doubles moindres carrés ;
- les triples moindres carrés etc.
S’il est purement prévisionnel, la propriété la plus importante
est l’efficience.
- de la simplicité des calculs et disponibilités des données ;
- de l’économie du temps et d’argent.
Après le choix de la technique d’estimation, l’économètre doit
énoncer explicitement des hypothèses de la technique choisie, et
au besoin examiner ses implications sur les estimations des
paramètres.
Ces hypothèses se réfèrent :
- à la forme de la distribution de probabilités de la
variable « e » ;
- aux relations entre variables explicatives.

ETAPE 3 : EVALUATION DES ESTIMATEURS

Il s’agit de décider si les estimateurs ont :


- une pertinence économique ;
- une fiabilité statistique ;
- une validité économique.
17

1) Critères économiques
Ce sont des critères qui sont déterminés par les lois de la
théorie économique et se rapportent aux signes et grandeurs des
paramètres des relations économiques.

2) Critères statistiques (tests de 1er ordre).

Ces critères visent l’évaluation des fiabilités statistiques des


estimateurs. En effet, les estimateurs des paramètres du modèle
sont obtenus à partir d’un échantillon d’observations sur les
variables incluses dans le modèle.
La théorie de l’échantillonnage en statistique, fournit un
certain nombre de tests qui permettent de mesurer la précision de
ces estimateurs.

Les critères statistiques les plus utilisés sont :

- le coefficient de corrélation

Qui nous donne le degré de dépendance de la variable expliquée


vis-à-vis des variables explicatives.

- la déviation standard (écart types).


Des paramètres : plus l’écart types est grand, plus la dispersion
est grande autour de la valeur vraie du paramètre.
3) Critères économétriques (test de second ordre)
Ces critères sont établis sur base de la théorie économétrique. Ils
visent à établir si les hypothèses de la méthode économétrique
employée ont été respectées. Les critères économétriques sont
appelés test de second ordre parce que ce sont des tests sur les
tests statistiques.
18

CHAPITRE 1 : MODELE SIMPLE EN ECONOMETRIE

Section 1 : Processus de construction d’un modèle


économétrie

Un modèle de régression est un modèle statistique qui


englobe les hypothèses sur une relation dépendance entre une
variable dépendante et une ou plusieurs autres variables
indépendantes.
Ce modèle prend la forme d'une équation bien spécifiée et
dans laquelle toutes les variables ont des propriétés statistiques
bien définies.
Si dans l’équation du modèle, nous avons une seule variable
indépendante nous parlons du modèle de régression simple. Si
par contre, nous avons au moins deux variables indépendantes, il
s’agit de modèle de la régression multiple.
Par modèle de régression simple, il faut entendre une relation
entre variables X et Y où Y est la variation dépendante et X la
variable indépendante. Lorsque le modèle de régression est une
équation linéaire, on parle de régression linéaire.
Exemple : soit à estimer une relation d’offre sur le marché,
en terme économétrique, nous savons que l’offre du marché
dépend du prix. En d’autres variables.On choisira une formule
mathématique.
Y  a  bx où

Y = Quantité d’offre,
X = prix
On néglige donc d’autres variables et on s’en tient à ce qu’Y
soit fonction de prix.
19

Notre problème économique est de déterminer a et b


numériquement. Avant de résoudre ce problème, on doit ajouter
un terme aléatoire qui prend en compte les autres facteurs qui
peuvent influencer l’offre mais, qui ne sont pas insérées dans le
modèle spécifie ci-haut.
Nous aurons Y  a  bx  e , pour ce faire, nous introduisions le terme
erreur. L’équation de régression qui prend la forme Y = a + bX + e,
comprend deux types des variables. Les variables observables Y et
X, le variable non observable e.
Nous pouvons écrire :
Y = variable expliquée, variable dépendante, variable endogène.
X = variable explicative, indépendante, exogène.
E = variable résiduelle, terme erreur.
α et B > paramètres de base de la population
̂ et ̂ > viennent des paramètres de base, paramètres estimés.

Section 2 : Régression simple : Estimation de modèle linéaire


à deux variables

Exemple 1 : en nous basant sur la littérature économique, nous


posons l’hypothèse suivante :
Si nous accroissons l’utilisation des engrais dans notre
culture de maïs ou d’arachide, la production va aussi accroître
mais ceci n’est pas évident. Si nous confirmons cela notre
coefficient angulaire sera positif c'est-à-dire, il va varie dans le
même sens.
On suppose que le modèle théorique est la suivante :
𝑌𝑖 = 𝛼 + 𝑏𝑋𝑖 + 𝑢𝑖
Où Y : représente le rendement
X : représente l’engrais
i : Représente les périodes
20

Exemples 1

Après analyse et étude, on a observé le rendement y en


fonction x d’engrais utilisés x et on est abouti à des observations
ci- après :

X 100 200 300 400 500 600 700


Y 40 50 50 70 65 65 80

On nous demande :
- d’estimer les paramètres 𝛼̂ et𝛼̂ ;
- de procéder à une analyse des variances ;
- de déterminer le coefficient de détermination R2 et coefficient
de corrélation r ;
- d’établir les intervalles y afférent à β au niveau de
probabilité de 95% ;
- de tester les hypothèses (1 – ε = 95 %) ;
- décision.
Ho  a  0 Ho    0

H1    0 H1    0

Résolution
Calcul de 𝑋𝑖 et 𝑌𝑖

X x
n

Y y
n

Calcul de Xi et Yi
Xi  X  X
21

X1  100  400  300

X 2  200  400  200

X 3  300  400  100

X 4  400  400  0

X 5  500  400  100

X 6  600  400  200

X 7  700  400  300

X i 0

Yi  Y  Y

Y1  40  60  20

Y2  50  60  10

Y3  50  60  10

Y4  70  60  10

Y5  65  60  5

Y6  65  60  5

Y7  80  60  20

Y  0 i

Calcul ̂ et ̂

ˆ  XY i i

X
2
i

ˆ  Y  ˆ X

X Y  16500 ; X  280.000
2
i i i

ˆ  X Y i i

16500
 0,0589
X
2
i
280.000

ˆ  Y  ˆ X  60  0,0589 400  60  23,56  36,44


22

Calcul Yˆi

Yˆi  ˆ  β̂Xi  Ui

Yˆ1  36,44  0,0589 100  42,33

Yˆ2  36,44  0,0589 200  48,22

Yˆ3  36,44  0,0589  300  54,11

Yˆ4  36,44  0,0589 400  60

Yˆ5  36,44  0,0589  500  65,89

Yˆ6  36,44  0,0589  600  71,67

Yˆ7  36,44  0,0589  700  77,67

Estimation de la régression
Les coefficients ̂ et β̂ sont d’habitude inconnus, il faut donc
les estimer sur base d’observations statistiques. Si on donne les
valeurs X1, X2……….𝑋𝑛 à X et on observe Y1, Y2,…….. 𝑌𝑛 comme
valeurs de Y, alors le modèle impose
Yi    βX i  εi qui signifie Y, est corrélé à Xi pour une relation

linéaire (𝛼̂ et 𝛽̂) avec une erreur aléatoire εi , ce que l’on doit
supposer pour que la quantité εi soit une erreur et non un écart
systématique. C’est que E (εi = 0), dans ce cas il nous est possible
d’estimer Yˆi  ˆ  β̂x i où a et b sont deux nombres qui estiment ̂ et

β̂ .

Quelle méthode pourrons-nous suivre pour trouver ( ̂ et β̂ ) ?


C’est-à-dire quelle droite choisir pour représenter une corrélation
entre X et Y ? Il est logique de choisir le nombre qui s’approche
les points (XiYi). Mais de quelle distance s’agit-il, quand nous
parlons d’écart ?
23

La méthode des moindres carrés répond à la question, on


choisi la droite qui passe entre les points (Xi, Yi), telle que la
somme des carrés des écarts entre Xi et Yi soit la plus petite
possible.

Section 3. Les estimations des moindres carrés


Calcul ei
ei  Yi  Ŷi

e1  40  42,33  2,33

e2  50  48,22  1,78

e3  50  54,11  4,11

e4  70  60  10

e5  55  5,89  0,89

e6  65  71,78  6,78

e7  80  77,67  2,33

e i 0

e  177,65
2
i

La méthode des moindres carrées consiste à minimiser la


distance entre les observations réelles et les points
correspondants. Critère est de choisir a et b pour rendre la plus
2
̂)
petite possible la somme des carrés des écarts.∑ e2i = ∑(Y − Y

Pour déterminer les valeurs qui minimisent e


2
i

2
∑ e2i ̂)
= ∑(Y − Y
24

La droite qui va être choisie celle qui rend minimum la


somme des carrés des écarts, (écarts signifie les erreurs). La
droite ainsi définie est appelée la droite de régression empirique
ou observée. Elle est aussi appelée la droite des moindres carrés.
Min  (Y  a  bx)  ε
2

Pour tracer la droite bx  

𝑥̅ 𝑦̅
| |
0 𝛼̂

Section 4 : Qualité de l’ajustement

- le coefficient de corrélation
On considère une série d’observation X et Y et on se demande
s’il existe un degré d’association entre deux variables, c’est une
analyse de corrélation. Le coefficient de corrélation est une
indication d’une liaison linéaire entre les variables X et Y, permet
d’en mesurer le degré d’intensité.
La corrélation ne peut pas avoir lieu entre deux variables
indépendantes.
Exemple :
L’âge et le résultat à l’école. Alors la corrélation peut se
réaliser qu’entre deux variables dépendantes, exemple : la taille et
le poids de l’enfant ; les deux variables sont dépendantes et
augmentent au même moment, ici nous sommes devant une
corrélation positive. Tandisque l’exemple de la vente de billets
dans un stade ou dans une salle de cinéma au fur et à mesure
que les billets diminuent les places aussi diminuent, c’est une
corrélation négative.
La formule pour trouver le coefficient de corrélation est :
25

r  Yi Xi
 Xi  Yi
2 2

En conclusion, la corrélation définit le degré d’association


linéaire entre les deux variables X et Y, il prend des valeurs allant
de – 1 à + 1.
Si r = +1 on a une corrélation positive
Si r = - 1 on a une corrélation négative
Le degré de corrélation détermine la dépendance entre les
facteurs analysés qui varient toujours entre -1 et + 1.
Si le degré de corrélation varie entre 0 et 0,20, la corrélation est
faible, donc la relation est négligeable.
De 0,20 à 0,40, la corrélation est basse, la relation est définie,
mais faible.
De 0,40 à 0,70, la corrélation est modérée mais la relation est
constante.
De 0,70 à 0,90 la corrélation est haute par conséquent la
relation est marquée.
De 0,90 à 1 la corrélation est forte par simple vue, nous
constatons.

A partir de l’exemple ci-dessus, le coefficient de corrélation


égale à

r  Yi Xi 
16.500

16.500

16.500
 0,91
 Xi  Yi
2 2
280.000  1.150 529,15  33,91 17944,34

Degré de détermination
26

Le degré de détermination qui indique la proportion de la


valeur de Y expliquée par l’influence des variables exogènes. Ceci
signifie que pour une variable totale d’une unité, la part due à la
variation systématique est égale à 1 moins la part de la variable
de l’erreur et indique dans quelle mesure la droite s’ajuste aux
valeurs observées. On sait que 0  R 2  1 .

VT = TSS (Total sums of squares)


VNE = ERSS (Error sums of squares)
VE = RSS (Regression sums of squares)

TSS  RSS  ERSS


VT  VE  VNE

R 2
 1
 ei 2

, R2  1
ERSS(VNE) 2
R 1
177,65
 0,85
 yi 2
TSS(VT) 1150

177,65
R2  1  0,85
1150
La relation entre le coefficient de corrélation et le coefficient
de régression, est donnée par le degré de détermination.
27

CHAPITRE II : ANALYSE SUR LA VARIANCE RESIDUELLE ET


LES VARIANCES DES ESTIMATEURS

SECTION 1 : VARIANCE RESIDUELLE

Var u  
2
ei
N2

Notion de degré de liberté


Par degré de liberté, il faut entendre le nombre total
d’observations diminué des paramètres à estimer (K). Dans
l’expression, le degré de liberté est donné par N – 2, les
paramètres étant a et b.
En nous référant à notre exemple ci-haut, la variance
résiduelle égale

Var u  
2
ei 177,65
  35,53
N2 72

DL = N - K

Section 2 : Variances des estimateurs


1 35,53
Var ˆ  Var u   0,0001268
 ei
2
280.000
28

CHAPITRE III : INTERVALLE DE CONFIANCE ET TEST


D’HYPOTHESE DANS LES MODELES LINEAIRES

Section 1 : Intervalle de confiance


Les intervalles de confiance sont des valeurs limites autour
du paramètre estimé, à l’intérieur desquelles, on s’attend avec
une probabilité déterminée à trouver le paramètre vrai. La
probabilité est choisie d’avance. En économétrie est généralement
égale à 95 %, on choisi un niveau de signification égale à
0,05(5%), avec région critique bilatérale
Nous disons que la probabilité pour T calculé soit inclus dans
l’intervalle.
P (-t a2 <t<t a2 )  1  ε

- 2,5 1−α
+ 2,5

- t α/2 + t α/2

Nous disons que nous pouvons commettre l’erreur de 5 %, ou


seuil de signification 5%.
Le problème pour nous est de trouver ces deux limites. Pour
trouver ces limites, il faut utiliser la formule suivante :
29

Démonstration de la formule
- Tx/2 < T < Tx/2  1  x

β̂  βo
T
Sβ̂

- Tx/2 < β  β < Tx/2  1  x

- β̂  Tx/Sβ̂ < β < β̂  Tx/2 Sβ̂

- β̂  Tx/2Sβ̂ < β < β̂  Tx/2 Sβ̂

β̂  Tx/2Sβ̂ < β < β̂  Tx/2 Sβ̂

1) Intervalle de confiance α
  Sˆ t/2 <  <   Sˆ t/2
36,4 – 2,22 < α <36,44 + 2,22 (2,5)
30,81 < α < 42,065
2) Intervalle de confiance pour β
β  Sβ̂ tx/2 < β < β  Sβ̂ tx/2

0,0589 – 0,11(2,5 < β 0,0589 + 0,0275


0,0314  0,0864
 0,0589  b
2

Section 2 : Test d’hypothèse dans les modèles linéaires

Principes généraux des tests d’hypothèse


(Validité et confiance accordée aux estimateurs)
Soit Yi = α + bxi
Etant donné que les estimateurs ne sont pas exactement
égaux aux paramètres à estimer, il faut procéder à des tests pour
vérifier si ces estimations sont valables ou non.
30

1) Définition des hypothèses

H0 = Hypothèse nulle à tester


Ex : b = 0
H1 = Hypothèse alternative contre laquelle on teste l’hypothèse
nulle
Ex : b < 0, b > 0

2) Procédure du test

Ho : b = bx c’est à dire, le paramètre b est égale à une valeur bx


souhaitée (quelconque).
H1 : b# bx on peut avoir b > bx ;
b < bx.
De même pour le paramètre a.
En économétrie, on suppose que la valeur du paramètre
postulée (souhaitée) est nulle.
Si on choisi un seuil, on a une région de probabilité de a,
dans l’espace de probabilité de Z
La décision devient :
Si la probabilité d’observer Ho tombe dans la région à
probabilité a, on rejette Ho si elle tombe en dehors de la région,
on accepte Ho
31

Région critique ou 1- Région critique ou


de rejet 1- de rejet
a
a

- t α/2 1-ε
+ t α/2

On peut comparer les valeurs de Z, ces valeurs Z sont données


par le table.
On a donc Z α, Zc puis tα et tc
b̂  bo
Zc 
b̂
Si Zc > Z , on rejette Ho, c'est-à-dire, Zc tombe dans la régions .
Si Zc < Zα , on accepte Ho, ce que Zc tombe en dehors de la
région.

Hypothèse typique en économétrie

Pour b pour a
Ho : b = 0 Ho : a = 0
H1 : b # 0 H1 : a # 0
B̂  Bo â  ao
Zc  Zc 
Var b̂ Var â

Interprétation
Si on rejette ou accepte Ho ce qu’a et b est ou n’est pas
significativement différent de zéro.
32

Dans le cas où b n’est significativement différent de zéro


(acceptation de Ho), on conclut qu’il n’existe pas probablement de
relation linéaire entre X et Y.
Tcβ̂ > tt  5,27 > 2,5

Décision hypothèse zéro est rejetée et, on opte pour


l’hypothèse H1. C'est-à-dire le rendement agricole est influencé
par l’utilisation des engrais chimiques.
Ho : β  0
H1 : β  0
Nombre X Y Xi Yi XiYi Xi² ̂
𝒀 𝒆𝒊 Yi² ei²
1 100 40 -300 -20 6000 90.000 42,3 -2,33 400 5,428
2 200 50 -200 -10 2000 40000 48,2 1,78 100 3,1668
3 300 50 -100 -10 1000 10000 54,1 -4,11 100 16,39
4 400 70 0 10 0 0 60 10 25 100
5 500 65 100 5 500 10000 65,8 0-89 25 0,79
6 600 65 200 5 1000 40000 71,7 -6,68 200 45,968
7 700 80 300 20 6000 90000 77,67 2,33 400 5,428
∑ 2.800 420 0 0 16.500 280.000 420 0 1150 177,67

Quelques formules utiles en économétrie

1. Calcul de X et de Y

a) X   b) Y  
X Y
N N

Calcul de Xi et de Yi
a) Xi  X  X b) Yi  Y  Y

Calcul de β et a

a) ˆ  
XiYi
b) ˆ  Y   X
 Xi 2
Calcul de Y
33

Yˆ  aˆ  ̂Xi

Calcul de ei
ei  Y  Yˆ

Calcul de coefficient de corrélation

r  Yi Xi
 Xi  Yi
2 2

Calcul de R²

1 
2
2 ei
R
 yi 2

Calcul de variance résiduelle et des estimateurs


Variance résiduelle

 u
2
ei2

N 2

Variance des estimateurs

 
 ei 2

 2

N  Xi 2

1
 2 ˆ   2ei
 Xi 2
Les intervalles de confiance
a) ˆ  ˆ t 2 <  < ˆ  ˆ t 2

b) β̂  β̂ tβ 2 < β̂ < β̂  β̂ tβ 2

Hypothèse typique en économétrie.


Pour b Pour a
H0 : b = 0 H0 : a = 0
34

H1 : b # 0 H1 : a # 0
bˆ  b aˆ  a
Tcbˆ  Tc aˆ 
 bˆ  â
Pour tracer la droite bX + α

𝑥̅ 𝑦̅
| |
0 𝛼̂
Exemple 2 : la fonction linéaire à deux variables (variable de
revenu de l’agriculteur en fonction de sa superficie cultivée.
Y = revenu en dollars
X = superficie cultivée
Le modèle théorique est le suivant :

Yi  a  bXi  Ui

Estimer ̂ et ̂
Déterminer r et R²
Estimer la variance résiduelle et les variances estimateurs
Etablir les intervalles de confiance Y afférant à β au niveau
de la probabilité de 95 % (le seuil de signification est de 5 %).

X 21 75 67 47 80
Y 112 210 410 330 405
Année 1 2 3 4 5

Calcul de X et Y

X
X 
290
 58
N 5

Y
 Y  1.467  293, 4
N 5
2). Calcul de X et de Y
35

a) X  X  X b) Y  Y  Y
X1 = 21 – 58 = -37 Y1 = 110 – 293,4 = - 181,4
X2 = 75 – 58 = 17 Y2 = 210 – 293,4 = - 83,4
X3 = 67 – 58 = 9 Y3 = 410 – 293,4 = 116,6
X4 = 47 – 58 = - 11 Y4 = 330 – 293,4 = 36,6
X5 = 80 – 58 = 22 Y5 = 405 – 293,4 = 111,6
∑X = 0
3). Calcul de ̂ et ̂

a) ˆ   2 
XiYi 8,396
 Xi 2,344

b) ˆ  Y   X  293,4  3,58(58)  85,76


4). Calcul de Yˆ
Yˆi  ˆ  ˆ Xi  ui

y1 = 85,76 + 3,58 (21) = 160,24


y2 = 85,76 + 3,58 (75) = 354,26
y3 = 85,76 + 3,58 (67) = 325,62
y4 = 85,76 + 3,58 (47) = 354,02
y5 = 85,76 + 3,58 (80) = 372,16
5). Calcul de ei
ei = Yi – Ŷi
e1 = 112 – 1260,94 = - 48,94
e2 = 210 – 354,26 = - 144,26
e3 = 410 – 325,62 = 84,38
e4 = 330 – 254,02 = 75,98
e5 = 405 – 372,16 = 32,84
∑ei = 0
36

Pour tracer la droite de régression


Bx+α
0 𝛼̂
| |
𝑥̅ 𝑦̅

Y
𝑦
̅

𝛼
̂

𝑥̅ 𝑋

3). Calcul de B et α

a) ˆ   2 
XiYi 8,396
 3,58
 Xi 2,344

b) ˆ  Y  ˆ X  293,4  3,58(58)  85,76

4). Calcul de y

yi  ˆ  β̂xi  ui

y1 = 85,76 + 3,58 (21) = 160,24

y2 = 85,76 + 3,58 (75) = 354,26

y3 = 85,76 + 3,58 (67) = 325,26

y4 = 85,76 + 3,58 (47) = 254,02

y5 = 85,76 + 3,58 (80) = 372,16

5). Calcul de li

ei  yi  yi
37

e1 = 112 – 160,94 = - 48,94

e2 = 210 – 354,26 = - 144,26

e3 = 410 – 325,62 = 84,38

e4 = 330 – 254,02 = 75,98

e5 = 405 – 372,16 = 32,84

∑ei = 0

Pour tracer la droite b X + α

0 ̂
x y

6) Calcul de coefficient de corrélation

r  Yi Xi
 Xi  Yi 2 2

8,396
r  66%
2.344  67.251,2

7). Calcul le degré de détermination

 1 
2
ei 37.177,44
R 2
 1  50%
 yi 2
67.251,2

8). Calcul de la variance résiduelle et des estimateurs :


Variance résiduelle

Var u 2   ei 2


37.177,44
 12.932,48
N 2 52

Variances des estimateurs

Var â   Xi 2


12.392,48  2,344
 2478,49
N  Xi 2
11.720
38

1 12.392,48
Var b̂    5.2868
 Xi 2
2,344

SB = 2,29 ; Sα = 49,78
9). Les intervalles de confiance
a). α - sαtα/2 < α < α + p α α/2
b). B – Var B t α/2 < B < B + Var B tα/2
1). 85,76 – 49,78 (3,1) < α< 85,76 + 49,78 (3,1)
2). 3,58 – 2,29 (3,1) < B < 3,58 + 2,29 (3,1)

N X Y Xi Yi XiYi Xi² Y ei ei² Yi²


1 21 112 -37 -181,46 6714,02 1369 160,24 -48,94 2395,12 32305,9
2 75 210 17 -83,4 -1417,8 289 354,26 -144,26 2810,9 6955,5
3 67 410 9 116,6 1049,04 81 325,26 84,38 7119,9 13595,5
4 47 330 -11 36,6 -402,6 121 254,02 75,98 5792,9 1339,5
5 80 405 22 111,6 2455,2 484 372,16 32,84 1078,9 12454,5
X 290 1467 70 0 8398,22 2344 1467 0 37177,2 67250,8

EXERCICES

Exercice 1.
Supposons qu’on ait à observer la fonction d’offre suivante
sur un échantillon de 7 observations.
Y = 100 + 4,00 x
(20) (1,5) on veut tester b

1). Condition
La taille de l’échantillon (700) est suffisamment large pour
considérer que l’écart type estimé est une bonne approximation
de l’écart type vrai. On peut alors utiliser le test t.
2). Hypothèses
39

Bˆ  Bo 4
t cb    2,26
Sˆ Bˆ 1,5

Ho: b = 0
3). Statistiques du test
Bˆ  0 4
t cb    2,26
Sˆ Bˆ 1,5

4). Régions critique


Seuil de signification 0,05
5). Décision
On constate que t  1, 059 et t  2,66
 /2 cbˆ

t cb̂
> t/2 :On rejette HO

6). Interprétation
b étant élasticité de cette fonction d’offre, il est plus que probable
que la pente vraie (b) est différent de zéro.

Exercice 2.

Dans une étude d’impact des exportations sur les


importations, on a relevé les informations suivantes :
Mi = (M – M)² = 117,68 ; M = 60 ; X = 400 ;
∑Xi² = 280.000 ; ∑ Mixi = 16.500 ;
∑ Mi² = 1.150 et N = 7

M = Importations
Mi = Moyenne des importations
X = Exportations
Xi = Moyenne des exportations
Mi = M – M les déviations de variable à
Xi = X – X leurs moyennes
40

En nous servant des informations ci-dessus calculons :


- Le coefficient de corrélation ;
- Le degré de détermination ;
- La partie autonome ;
- Et tracer la droite de régression.
Exercice 3.
Une entreprise a relevé dans plusieurs départements le
nombre d’unités vendues de l’un de ses produits d’une part et
d’autre part le revenu en pourcentage du total national.

Revenus X 11 8 7 5 5 25 10 4
Ventes en Y 24 18 12 12 11 50 24 10
milliers

Calculer le coefficient de corrélation et le degré de détermination.

Exercice 4.
Après une analyse économique sur la commercialisation du
cuivre à l’étranger par la Gécamines, Monsieur TITA, a relevé les
renseignements suivants :

X 10,5 37,5 33,5 23,5 40


Y 50 105 205 165 202,5

Où X = la commercialisation du cuivre ;
Y = les recettes réalisées par la Gécamines.
En nous servant des informations ci-dessus :
41

Calculez le coefficient de corrélation et le degré de


détermination ;
De trouver la variance résiduelle et les variances des
estimateurs.

Exercice 5.
Veuillez concevoir un modèle économétrique la régression
simple et de tester l’association entre la consommation de tabac
et le cancer des bronches, pour cinq périodes.
Y = cancer des bronches
X = consommations des tabacs

Exercice 6.
Un chercheur est intéressé par les deux séries
chronologiques suivantes :
X = enfants morts ayant moins d’un an (milliers)
Y = consommations de bière (tonneaux)

Année 1935 1936 1937 1938 1939 1940 1941 1942


X 60 62 61 55 60 63 53 52
Y 23 23 25 26 26 29 50 30
Calculez le coefficient de corrélation entre X et Y

Exercice 7.

On a classé 10 étudiants en économétrie en fonction des


côtes à l’examen final et du nombre d’heures de travail et on a
obtenu le tableau suivant :
42

Etudiants 1 2 3 4 5 6 7 8
Cotes 1 6 4 2 3 7 8 10
Nombre 2 5 6 1 4 10 7 9
d’heures
Calculer r
Exercice 8.
Chiffre d’affaire et budget publicitaire d’une entreprise
Budget
Chiffre
Année Publicitaire 3
d’Affaires
% du C.A

1991 1.760.720.167 52.821.875,01

1992 2.034.659.722 61.039.791,66

1993 2.243.738.426 67.312.152

1994 2.658.988.425 79.529.652,75

Y = chiffres d’affaire
X = coûts publicitaires
Calculer la corrélation entre les coûts publicitaires et les
chiffres d’affaire.
Notion de degré de liberté
Par degré de liberté, il faut entendre le nombre total
d’observation diminue les paramètres à estimer (K). Dans
l’expression, le degré de liberté est donné par N-2, les paramètres
étant a et b.
DL = N – K en régression simple
DL = N – K – 1en régression multiple
43

CHAPITRE IV : LE MODELE LINEAIRE GENERAL

Section 1 : Formulation du problème


Définition :
La régression multiple est une extension de la régression
simple au cas où nous avons K variables explicatives (K ≥ 2).
Le modèle :
Formulation mathématique :
Soit y une fonction linéaire de K – l variables explicatives
allant de X2 à Xn .

Nous pouvons écrire comme suit :


Yi  B0  B1xi1  B2xi2  ...  Bk x ik  u i

Où : Yi = Vecteur de la variable endogène


Xin = Vecteur de la variable exogène quelconque
Bo = terme constant
bn = paramètre associé à la variable exogène
u = vecteur des termes d’erreurs.
i=périodes
Si nous considérons toutes observations (de 1 à n), nous avons :
En notation matricielle

y1 1 Xi1 Xi2 Xi3 b1 u1


- - - - - - -
- - - - - - -
- - - - - B - U -
Y -
X - - - - - -
= - - - - - - -
- - - - - -
yn 1 Xn1 Xn2 Xn3 bn un
44

La régression multiple couvre la même matière que la


régression simple, seulement l’existence de plusieurs variables,
introduit quelques nouveaux problèmes pratiques et théoriques
sur le plan du traitement mathématique du modèle.

Aussi, l’existence de ces variables nécessite un traitement


statistique un peu élaboré. Pourtant, la logique de la méthode
reste la même que celle de la régression simple.

Les hypothèses :

Ce sont les mêmes hypothèses que celles de la régression


simple.

Section 2 : Exercices de la régression multiple.


Exercices 1
Y=Production
X1=Capitale inverti
X2=la main- d’œuvre utilisée dans la production
Par la méthode de deux équations à deux inconnues.
45

Main d’œuvre 𝐱𝟐

Production y
Capital 𝐱𝟏
𝑨𝒏𝒏é𝒆

𝐱𝒊𝟏 𝐱𝒊𝟐 𝐲𝐢 𝒙𝟐𝒊𝟏 𝒙𝟐𝒊𝟐 𝒚𝟐𝒊 𝐱𝒊𝟏 𝐲𝐢 𝐱𝒊𝟐 𝐲𝐢 𝐱𝒊𝟏 𝐱𝒊𝟐 ̅


𝒚 𝜺𝒊 𝜺𝟐𝑰
2015 100 10 40 -300 -10 -20 90.000 100 400 6000 200 3000 40,3 -0,3 0,09
2016 200 20 50 -200 0 -10 40.000 0 100 2000 0 0 52,4 -2,4 5,76
2017 300 10 50 -100 -10 -10 10.000 100 100 1000 100 1000 47,9 2 ,1 4,41
2018 400 30 70 0 10 10 0 100 100 0 100 0 68,3 1,7 2,89
2019 500 20 65 100 0 5 10.000 0 25 500 0 0 63,8 1,2 1,44
2020 600 20 65 200 0 5 40.000 0 25 1000 0 0 67,6 -2,6 6,76
2021 700 30 80 300 10 20 90.0000 100 400 6000 200 3000 79,7 0,3 0,09
 2800 140 420 0 0 0 280.000 400 1150 16500 600 7000 420 0 21,44
46

On nous demande :
- D’extrapoler la production jusqu’à l’an 2025 si la main-
d’œuvre était maintenue constante et l’accroissement de
capital augmente de 20 % chaque année dès 2022;
- Déterminer le coefficient de corrélation partiel entre Y et X1,
Y et X2 et le coefficient de corrélation multiple ;
- De tester les hypothèses au seul de signification de 5 %.
Connaissant les données de X1 et X2, notre première
préoccupation consistera à calculer ̂o , ̂1 , ̂ 2 et ̂o = partie
autonome.
B1 et B2 sont coefficients des variables indépendantes.
 Xi1Yi  b  Xi1  b  Xi1Xi2
1
2
2

 Xi 2Yi  b1 Xi1Xi 2  b  Xi


2
2 2

b̂o  Y - b1 X1 - b 2 X 2

16500 = 280000b1 + 7000b2


600 = 7000b1 + 4000b2
16500 = - 280000b1 – 7000b2
24000 = 280 000b1 + 16000b2
7500 = 9000b2
9000b2 = 7500
 7500
b2   0,83
 900
16.500  280.000  7.000(0,83)

16.500  280.000b1  5810

 280.000b1  5810 - 16.500

 280.000b1  -10.960
Bo  Y - B1X1 - B2 X 2
47

Bo  60 - 0,038(400) - 0,83(20)  28,2

La première question consiste à l’extrapolation de la


production jusqu’à l’an 2025 si la main - d’œuvre était maintenue
constante et l’accroissement capital augmentait de 20% chaque
année de 2022.

𝑌̂2021 =28,2+0,038(700) +0,83(30)=79,7


𝑌̂2022 =28,2+0,038(840) +0,83(30)=82,02
𝑌̂2023 =28,2+0,038(1008) +0,83(30)=91,404
𝑌̂2024 =28,2+0,038(1.209) +0,83(30)=99,0648
𝑌̂2025 =28,2+0,038(1.451,52) +0,83(30)=108,257

La production estimée à l’an 2024 si la main d’œuvre était


maintenue constante est de 108,257 milliers de francs.
La deuxième question est de déterminer le coefficient de
corrélation partielle entre Y et X1 ; Y et x2 et le coefficient de
corrélation multiple.
Le coefficient de corrélation partielle est calculé par la
formule ci-après :

r1 
 Xi1Yi 
16.500
 0,91
 Xi1  Yi
2 2
280.800 x1,150

r2 
 X12Yi 
600

600
 0,88
 Xi2  Yi
2 2 400 x1,150 678,2

La troisième question consiste à tester les hypothèses au


seuil de signification de 5%(0,05)
L’hypothèse nulle est Ho : B  0 . Pour tester cette hypothèse au
seuil de 5%, on peut simplement vérifier si la valeur 0 est
contenue dans l’intervalle de confiance à 95%.
DL = N- K - I = 7- 2- 1 = 4
48

Tt = 2, 78
Β1 = b ± 2,78(0,00437)
0, 02586< β < 0, 05014: H1
β̂  βo 0,036
Tcb̂1    8,69
S 1 0,000437

 Tcβ< tt → H1
8,69 > 2,78
B2 = 0, 83 ± 2, 78(0,115)
0, 5103 < β < 1, 497
𝛽 −𝛽 ̂0,083
 𝑇𝑐𝑏̂2 = ̂ 0 = = 7,2
𝑆𝛽 2 0,115

Tcb2 > tt → H1
(7,2> 2, 78

Ceci nous pousse à conclure que le capital et la main d’œuvre


ont un effet significatif sur la production.

Exercice2.
On a répondu à plusieurs reprises des quantités d’engrais sur
un lot de terre et on a observé le rendement du mais pour
différents niveaux des précipitations. A chaque semence, ces
observations faites sont les suivants :
49

Engrais Niveau des Rendement


(Kg/ha précipitations du mais
(mm) (Q/ha)
50 5 20
100 10 25
150 5 25
200 15 35
250 10 32,5
300 10 32,5
350 15 40
Estimer la pente de la droite décrivant le rendement en
fonction de la quantité d’engrais, pour des valeurs constantes des
précipitations, c’est- à dire estimer l’augmentation de rendement
par kilo d’engrais ajouté.
Si la quantité d’engrais était maintenue constante, estimer
l’accroissement par mm de hauteur de pluies supplémentaires.
Donner approximativement une estimation du rendement
pour 400kilos d’engrais et 10 mm de pluies.

Exercice 3.
Dans une unité chimique, le pourcentage d’ammoniac perdu
(y), dépend des facteurs suivants :
X1 = débit ; X2 = température de l’eau de refroidissement ; X3 =
concentration d’acide nitrique. A partir de n = 21 observation, on
a estimé l’équation suivante :
Ŷ  40  0,72  1  1,29  2  0,15  3

SE (0,13) (0,37) (0,16)


R= 0,956
Pour chaque redresseur
50

Calculer T et la probabilité critique pour Ho ; redresseur est-il


significativement lié à y au seuil α = 5%
Calculer le coefficient de corrélation partielle avec y, à partir
de la formule
b/SE
r
(b / SE ) 2  (n  K  1)

Exercice 4 : Par la méthode matricielle


ˆ  ˆ o+B
Y ˆ Xi +B
ˆ Xi  Ui
1 1 2 2

X1 X2 Y
70 21 198
35 26 209
55 14 197
25 10 156
28 12 85
43 20 187
15 5 43
33 28 211
23 9 120
4 6 62
45 10 176
20 8 117
56 36 273
51

 B1 
 B2   X'X 1 X'Y
   
 B3 

1 70 21  198   û1 
     
1 35 26   209   
1 55 14   156   
     
1 25 10   85   
1     
 28 12  187   
1 43 20   43   
X Y   U   
1 15 5   211   
1 33 28   120   
     
1 4 6   62   
1 45 10   176   
     
1 20 8  117   
1     û 
 56 36   273   13 

 1 1 1 1 1 1 1 1 1 1 1 1 1
 
X'   70 35 55 25 28 43 15 23 4 45 20 26 
 21 26 14 10 12 20 5 28 9 6 10 8 36 
 

 13 452 205 
 
( X ' X )   452 19828 8452 
 205 8452 4343 
 

 2034 
 
( X ' Y )   82495 
 38769 
 

X' X  36557768

14676700 230376 244436 


 1
(X'X) '   230376 14434 17216 
 244436 17216 2
 53460 

14676700 230376 244436 


1  
(X'X) 
-1
 230376 14434 17216 
336557768 
 244436 17216 53460 

 0, 40147 0, 00630 0, 00667 


 
(X'X)   0, 0063 0, 00039 0, 00047 
-1

 0, 00669 0, 00047 0, 00146 


 
52

 37,5023 
 
B  (X'X)  1(X'Y)   1, 4963 
 4, 2446 
 

Ŷi  37,5023  1,4963Xi1  4,2446Xi 2

S 2uˆ 
 ûi2
n  K  1 (0, 40147 0, 00039 0, 00146)
S (b 0 ,b1 ,b 2 )  Suˆ 2
2

Exercice 5
Disposant des données ci – après :

Y X1 X2
10 4 7
12 6 4
16 5 8
18 8 6
20 7 9

Trouver les valeurs du vecteur B ;


Calculer le coefficient de détermination R2 ;
Mener le test de signification sur les paramètres
individuellement.
SOLUTION

L’estimation du vecteur B s’obtient avec la formule : B̂  (X'X)1X'Y


 
 
   10 
1 7  
4  5 30 34   12 
   
X  1 6 4  ( X ' X )   30 190 203  Y   16 
1  34 203 246   
5 8   18 
   20 
1 8 6  
1 
 7 9
53

Calculons ensuite (X’X) -1 et X’Y


 0,6503401361  0,5034013605   76 
A.B  0,1006802721 0,0068027210  A X' y  B  476
 
0,0068027210 0,0680272109  534

D’où

 7,525170068 0,6503401361 0,0503401305  76 


A.B   0,6503401361 0,1006802721 0,0068027210   476
 0,5034013605 0,0068027210 0,0680272109  534 

6,465306122 
 2,13012245 
1,306122449 

Soit, Ŷ  6,465306122 2,13012245X1  1,306122449X2


6,465306122 
 2,13012245 
1,306122449 

Calcul le degré de détermination R2


SCE B' X 'Y  TY 2
R2  
SCT Y 'Y  TY 2
R 2  0,945

Test de signification des paramètres individuellement


U’U = 1224 – 1220,277551 = 3,722449
û' u 3,722449
Var û    1,8612245
T-K 2
Var (Bo) = 7,525170068 + 1, 8612245 = 14, 0060309 => Var Bo =
3,742463213
Var (B1) = 0,100680272 x 1, 8612245 = 0, 1873885891 => Var B 1
= 0, 4328840366
54

Var (B2) = 0, 0680272109 x 1, 8612245 = 0, 1873885891


Var B2 = 0, 3558284862
6,465306122
Bo    1,748929983
3,742463213

2,1706122449
B1   5,014304205
0,4328840366

1,306122449
B2   3,670449783
0,3558284862

Présentation des résultats

Ŷ = - 6,465 + 2,131 x1 + 1,306 X2


(3,742) (0,433) (0,355)
(- 1,748) (5,014) (3,670)

R2 = 0,945
Pour α = 0,05, Bo n’est pas significatif car la valeur calculée
de t student est 1,7489 inférieur à la valeur du t de la table qui
est de 4,3 ; De même pour B2.
Par contre B1, est significatif car la valeur calculée de t
student est supérieure à celle de la table.
On calcul le F de Fisher qui est :
𝑅2/(𝐾−1) 0,94589/2
F= = = 26,22130845
(1−𝑅2)/(𝑇−𝑘) (1−0,94589/3

Puisque la valeur du F calcul qui égal à 26,22 est supérieure


à celle de la table qui est de 19,2 dans l’ensemble les paramètres
sont significatifs.

Exercice 6
Le tableau suivant concerne 15 pays développés et donne
pour chacun d’eux, le revenu réel par tête d’habitant y en milieu
55

de dollars US, avec pourcentage X1 de la force de travail employé


dans l’agriculture et la durée moyenne de la scolarité X2 (en
nombre d’années), pour la population au dessus de 25ans.

Pays
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Y 6 8 8 7 7 12 9 8 9 10 10 11 9 10 11
X1 9 10 8 7 10 4 5 5 6 8 7 4 9 5 8
X2 8 13 11 10 12 16 10 10 12 14 12 16 14 10 12

Etablir l’équation MCO de Y par rapport à X1 et X2 ;


Tester la signification des paramètres estimés au seuil de
5% ;
2
Calculer le coefficient de détermination corrigé R ;
Donner l’interprétation économique des résultats de
l’estimation.

Solution
Le nombre à estimer est :

Y=Bo+B1Xi1+B2Xi2+Ui
Le vecteur des paramètres estimés est :
 B0 
 
B   B1    X ' X  X ' Y
1

 
 B 2 

Où X est la matrice des données et Y le vecteur de la variable


expliquée.
56

T

X 1 X 2


X ' X   X1 X 2
X X 1 2 
 
1

  X 2 X X X 2
1 2 2


15 105 180    y1  135 


105  
 795 180  et   X 1Y1   917 
180 1248 2234    X Y 2  1658
 2 1 

Pour le calcul de l’inverse de X’X, on a besoin du déterminant


de Y’X et de la matrice des cofacteurs.
15 150 
En effet : T  15  0    900  0;
105 795

15 105 180 


105 795 1248   15 795 1248 

  1248 2234 
  
Et 180 1248 2234 
105 795 
180  
180 1248

 15  218526   105  9930   180  12060   64440  0

X’X est symétrique, pour le calcul de la matrice de cofacteurs


nous avons besoins des cofacteurs des éléments d’une moitié
seulement de la matrice, en l’occurrence :

795 1248
cof  X 1.1    218526;
1248 2234
105 1248
cof  X 1.2    9930;
180 2234

105 795
cof  X 1.3    12060;
180 1248
15 180
cof  X 2.2    1110;
180 2234
15 105
cof  X 2.3   ;
180 1248
57

15 105
cof  X 3.3    900;
105 795
 218526  9930  12060 
cof  X ' X    9930 1110 180 
 12060 180 900 

 218526  9930  12060 


1 
X 'X  180 
1
 9930 1110
64440 
 12060 180 900 
 B0 
 
Et d ' où B   B1    X ' X   X 'Y 
1

 
 B 2 
 218526  9930  12060  135   620 
1 
 9930 1110 180  917    0,38
644440
 12060 180 900  1658  0, 45 

b) Pour teste la signification statistique des paramètres, on a


besoin de la matrice des covariances de B dont l’estimateur sans
S ( B)  S 2  X ' X  ou S2 est estimateur la
1
biais est donnée par

u 'u
variance du terme aléatoire µ et est donne par S 2  où u est
T K
le vecteur des résidus d’estimateur (T = taille de l’échantillon et K
= nombre de paramètre estimés)
u ' u  Y ' Y  B ' X ' Y avec Y ' Y   Y12  125
135 
u ' u  1255   6, 20  0,38 0, 45. 917 
1658
u 'u
 12, 2718808 et S 2 
T K
12, 2718808
  1, 02265673
15  3

D’où

 
S 2 B  S 2  X ' X  X 'Y
1
58

3, 46798705  0,157588  0,191391 


 0,157588 0, 0176156 0, 00286 
 
 0,191391 0, 00286 0, 01428292 


S 2 ( B 0 )  3, 46798705, S ( B1 )  0, 0176156
S 2 ( B 2 )  0, 01428292
S 2 ( B 0 )  1,862253219; S ( B1 )  0,132723756;
S ( B 2 )  0,11951115

Dès lors, on peut calculer les valeurs de la statistique (t-


student) pour chaque coefficient estime :
6, 20
tc ( B 0 )   3,331
1,862253219
0,38
tc ( B1 )   (2,834)
0,132723756
0, 45
tc ( B 2 )   3,331
0,11951115

Ces valeurs de t sont à comparer à la valeur


tt  DL  N  K  1  12 degrés de libertés au seuil de 5%, tt=2,18. Nous

remarquons que tous les t calculés sont supporteurs (en valeur


absolue) au tt.
Les paramètres estimés sont statistiquement significatifs
(différents de zéro) et les valables explicatives expliquent
significativement le comportement de la variable dépendante.
c) le coefficient de détermination est donné par :
2
Bx ' y  T ' Y 1242, 7281192  1215
R  
Y ' Y  TY
2
1255  1215
27, 7281192
 0, 693
40
T 1
1  R 2   1  1  0, 693  0, 642
14
2
R  1
T K 12
59

Le niveau de revenu réel par tête y est inversement lié au


pourcentage X1 de la force de travail employé dans l’agriculture,
mais il est en relation directe avec la durée X2 de la scolarité de la
population au-dessus de 25ans. De façon plus précise, le
coefficient de X1 fait apparaitre qu’une réduction de 1% de
l’effectif employé dans l’agriculture est associé à une
augmentation du revenu réel par tête à 380$ US, X2 restant
constant.
Un accroissement d’une année de scolarité de la population
au-dessus de 25ans est associé à une augmentation du revenu
réel par tête d’habitant égale 450$ USA, X1 restant constant.
60

Tableau des différents calculs se présente comme suit :


61

Rappel sur la Statistique


Le coefficient de corrélation
Si rxy = 1 alors X et Y sont fortement
Si rxy = 0 alors X et Y sont corrélées indépendantes
Rappel
Soit le tableau suivant
X1 1 0 1 2 1 2 0 1 0 1
Y1 0 1 2 0 1 1 0 2 1 0
Calculer X, Y, V(X)’, V(Y)’, COV(X,Y) et rxy

SOLUTION

1 0 1 2 1 2 0 1 0 1 9
0 1 2 0 1 1 0 2 1 0 8
1 0 1 4 1 4 0 1 0 1 13
0 1 4 0 1 1 0 4 1 0 12
0 0 2 0 1 2 0 2 0 0 7

On trouve X = 9/10 = 09 ; y = 8/10 = 0,8

V ( x)
13
V(X) = − (0,9)2 = 0,49 et l’écart type
10
= √𝑉(𝑋) = √0,49 = 0,9
V(Y) = 12⁄10 − (0,8)2 = 0,56 et l’écart type √𝑉(𝑦) = √0,56 = 0,75
7
Cov (X, Y) = − 0,9 𝑥 0,8 = 0,02
10
Rxy = 0,02/0,7 x 0,75/ = - 0,0
𝑋𝑖2 𝑌𝑖2
V(X) = − 𝑋2 V(Y) = − 𝑌2
𝑁 𝑁

COV(X, Y = XY – X x Y

rxy = cov (X, Y) / SX x SY


62

Régression simple
Exercice 1
Le tableau ci-dessous présente les données relatives à
l’exploitation de bois de la forêt équatorial en RDC et son
exportation pendant la période de 1990 à 1995
X= Taux annuel d’exploitation
Y= Taux annuel d’exportation

Années 1990 1991 1992 1993 1994 1995


X 15 25 50 75 55 65
Y 100 200 300 400 500 600
Analyser et interpréter les résultats

Exercice 2
Le tableau ci-après reprend les données statistiques relatives
au produit intérieur bruit (PIB) et la consommation privée de la
RDC pour la période allant de 1980 à 1995.

Le modèle est : 𝐶𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜇𝑖


année Consommation PIB
1980 545,0 741,1
1981 559,0 748,1
1982 579,0 744,7
1983 591,0 755,2
1984 610,0 797,1
1985 637,6 800,8
1986 656,0 838,6
1987 678,3 861,0
1988 684,4 865,9
1989 701,9 854,1
1990 749,0 798,0
1991 540,8 730,0
1992 502,8 654,3
1993 425,9 565,8
1994 456,7 543,9
1995 464,1 547,7
63

a) Calculer le coefficient de corrélation ainsi que le degré de


détermination ;
b) Trouver l’intervalle de confiance 𝑑𝑒 𝛽au niveau de
probabilité de 95% ;
c) Tester les hypothèses au seuil de signification de 5% et
interpréter les résultats.
Exercices 3
Une entreprise voudrait savoir s’il existe une variation
significative dans la relation entre les ventes de son produit x et
les frais qu’il engage pour sa publicité. Il dispose des informations
reprises au tableau ci-dessous :

X 43 36 52 27 49 32 70 66 49 67 40
Y 130 145 156 150 147 166 210 199 194 202 160

Questions :
1. Déterminer le coefficient de corrélation ainsi que le degré de
détermination ;
2. Etablir les intervalles de confiance y afférent à 𝛽 au niveau de
probabilité de 95% et tester l’hypothèse au seuil de signification
de 5%.

La régression multiple :
Exercice
Niveau des Rendement
Engrais précipitations du maïs
(mn) (Q/ha)
50 15 20
100 10 25
150 5 25
200 15 35
250 10 32,5
300 10 32,5
350 15 40
64

Le modèle théorique est 𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝜇𝑖


TABLE DE LA LOI DE STUDENT

Valeurs d T ayant la probabilité P d’être dépassées en valeur


absolue

2,571

Vous aimerez peut-être aussi