Vous êtes sur la page 1sur 30

Introduction

Quest-ce que lconomtrie ?


Lconomtrie est la partie qui soccupe de la mesure. Elle applique les mthodes
statistiques aux donnes empiriques issues de lconomie, hritire la fois des
mathmatiques de lconomie et des statistiques, son objet est de confronter un modle
conomique un ensemble de donnes.
DEFINITION 1 :
Etudes de relations quantitatives de la vie conomique faisant appel lanalyse statistique et
la formulation mathmatique.
DEFINITION 2 :
Lconomtrie exprime quantitativement les corrlations pouvant exister entre des
phnomnes conomiques dont la thorie conomique fournit des ides sur les processus
qui dterminent les grandeurs conomiques. Lconomtrie apporte une vrification
empirique et tablit quantitativement les corrlations qui apparaissent valids.
DEFINITION 3 :
Lobjectif de lconomtrie est de confronter un modle conomique un ensemble de
donnes (srie temporelle) et ainsi den vrifier la validit.
DEFINITION 4 :
Lconomtrie est une branche de lconomie qui traite de lestimateur pratique des
relations conomiques.
Lconomtrie (appele galement thorie des biens , mathmatiques financires ou
encore analyse financire a pour objectif de tenter de rgler, de modliser et de
dterminer les origines des prix de biens dchange ou valeurs dagents conomiques
acteurs du march) en comptition rationnelle selon les modles thoriques construits en
thorie de la dcision.
REMARQUE :
Lconomtrie est trs intiment lconomie politique qui est un sujet absolument fascinent
pour qui veut comprendre les rouages de notre socit. Nous ne saurions ce titre que
recommander louvrage les grands conomistes de L.HEILBRONER qui consiste une
introduction assez magistrale ce domaine pour les non spcialistes.
Lintervention des mathmatiques dans la modlisation nest pas rcente (ni trs vielle non
plus et cela se voit normment dans son inconsistance).
Effectivement, cest au 17eme sicle que NEWTON nomme gardien de la monnaie en
Angleterre, sintresse la modlisation mathmatique de la valeur de la monnaie par
rapport celle dor (cest encore aujourdhui dans le monde entier que nous lui devons
ltalon or).
Cest en tenant de btir une thorie de la spculation que LOUIS BACHELIER a dcouvert au
dbut du 20me sicle lobjet mathmatique appel aujourdhui mouvement
BROWNIEN . Mais la modlisation financire a pris une dimension nouvelle partir de 1973
avec les travaux de BLACK SCHOLES et MERTON sur lvaluation (pricing en anglais) et la
couverture des options.

La notion de modle :
- Un modle consiste en une prsentation formalis dun phnomne sous forme
dquation dans les variables sont des grandeurs conomiques.
- Le modle est loutil que le modlisateur utilise lorsquil cherche comprendre et
expliquer des phnomnes. Pour ce faire, il met des hypothses et explicite des
relations.

Schma 1 : thorie conomique et conomtrie :


Lconomtrie nest pas seulement un systme de validation mais galement un outil
danalyse entre dautres. Par :
- La mise en vidence de relation entre des variables conomiques qui ntaient pas
priori videntes ou prsentes.
- Lindication statistique consiste infrer, dduire partir des caractristiques dune
population.
- La simulation qui mesure limpact de la modification de la valeur dune variable sur
autre.
- La prvision par lutilisateur de modle conomtrique qui est utilise par les pouvoirs
publics ou lentreprise afin danticiper et ventuellement de ragir lenvironnement
conomique.

QUELQUES OUVRAGES :
- introduction lconomtrie : DORMONT .B
- introduction lconomtrie : C. LARBOUSSE
- mthode statistique de lconomtrie EDWARD MALINVAUD
JOURNAUX :
- Le monde (du mardi)
- Figaro (du samedi)
Introduction :
La nature des traitements dpend de plusieurs facteurs ; on retiendra ici la distinction entre
donnes chronologiques et donnes en coupe instantane (donnes denqutes).
Sur les donnes en coupe, il faudra par exemple dfinir les ratios en liaison avec la
spcification retenue ;
Sur les sries chronologiques, il ya la correction des variations saisonnires, la colinarit et
la distinction entre volume et valeur .

Annes PIB Maroc Pays PIB (1990)

1990 110 Maroc 110

1991 120 Sngal 140

1992 113 Cte divoire .

1993 140 Algrie .

. . Lib .

. .
. .
. .
. .
2014 .

Pays Anne PIB

Maroc 1990
.
.
.
2014

Cte 1990
divoire
.
.
.
2013
DH Constant DH Courant

Valeur Volume

Rel Nominal

- Lorsque lon dflate par un indice appropri, une srie en valeur, on obtient une
srie en volume. On parlera aussi de srie exprime en dirhams constants dirhams
courants ou encore variation en terme nominal variation en terme rel.
Ce travail consiste exclure leffet prix dans lapprciation des variations dune grandeur.
En effet, linflation fausse, les conclusions que nous pouvons faire propos de
lvaluation dune grandeur : par exemple les dpenses ; le chiffre daffaires

Comment dflater une srie statistique ?

Pour observer lvolution relle dune grandeur (chiffre daffaires, dpenses,


exportations) il faut exclure leffet prix.
On dispose de plusieurs repres pour dflater une srie statistique :
Le coefficient drosion montaire (dgradation de la valeur de la monnaie) ;
Le taux dinflation ;
Les indices des prix ;

Nous montrerons ici comment utiliser les indices de prix

Lutilisation des indices des prix

Travail sur une grandeur : les indices simples

T T+1 CAt CAt + 1


Px Qts Px Qts
Bien A 10 300 12 290 3000 3480

Pour apprcier et analyser lvolution du CA, on pourra dire que :


En terme nominal, le CA a augment de 16 % ; par contre les quantits vendues (volume
de vente) ont baiss de 3,3 % entre t et t+1.
Nous pouvons mesurer les variations du CA en terme rel en cartant leffet de
linflation, nous allons alors dflater, c--d corriger le CA en DH courant par lindice
des prix .

Prenons comme anne de base T :

On rappelle que : IPt/o = (Pt / Po) x 100


Pour lanne T :
Le CA de lanne T va rester le mme puisque lindice des prix est gal 100.

Pour lanne T+1 :


+/ =

{
= = =
+/

CA en DH CA en DH CA en DH du CA du CA De qts
Crt (T) Crt (T+1) Cst (T+1) en DH Cst en DH Cst produites

Bien A 3000 3480 2900 16% -3,33% -3,33%

Lgalit entre la variation du CA en DH constant et la variation des quantits


vendues tient au fait que nous avons limin leffet des prix, entre T et T+1.

Mathmatiquement parlant, on peut la dmontrer par la formule suivante :

+ + . +
= = = +/
.

Prenons cette fois T+1 comme anne de base (rfrence) :

Lanne T :

10
=
100 = 83,33 %
12
{ +1
3000
= 83,33 100 = 3600

Lanne T+1 :

Le CA de lanne T+1 va rester le mme puisque lindice des prix est gal 100, pour
cette anne (quand elle est prise comme anne de rfrence ou base).

- Lorsque nous travaillons sur une seule grandeur (le CA par exemple), raisonner sur les
quantits ou sur ma srie en DH constant revient au mme.
- Quand il sagit de plusieurs grandeurs la fois (CA ralis par la vente de plusieurs biens),
le passage par les indices simpose, On ne peut en effet pas ajouter des kg de tomates
avec des litres dhuile, ou encore des souliers avec des chemises
Exercice :
Dans lexemple suivant, X reprsente le CA obtenu grce la vente des GSM et leurs
accessoires.

Annes Pris Qt des Prix GSM Qt GSM Pis Kit Qt kit


carcasse carcasses (en DH) man (en man
(en DH) DH)
Ao 5 21 50 12 1,3 7

A1 5,7 29 57 17 1,8 6

A3 6 33 49 8 2,4 3

- Analyser le comportement des ventes par une lecture conomique du tableau.


- Calculer le CA ralis avec les ventes des GSM et ses accessoires.
En prenant Ao comme anne de base :
- Calculer les variations des quantits vendues des carcasses. Comparer les rsultats.
- Expliquer le biais et faire les calculs ncessaires pour lcarter. Commenter.

Evolution des ventes des GSM et ses accessoires

35
30
25
20
15
10
5
0
Ao A1 A2

Qts des carcasses Qt GSM Qt Kit man

On constate que seules les ventes des carcasses qui ont augment entre Ao , A1 et A2,
malgr que les prix ont subi une augmentation pendant A1 et A2 . Les autres articles ont
connu une diminution au cours de A1 et A2.


CA Carcasse 105 165,3 198

CA GSM 600 969 392

CA Kit man 9,1 10,8 7,2

CA annuel 714,1 1145,1 597,2



Annes Quantit des carcasses Ai/Ao

Ao 21 1,00

A1 29 0,38

A2 33 0,57

Les ventes des carcasses ont connu un accroissement trs important par rapport Ao.
Elles sont passes dune lvation de 38% en A1 57% en A2.

Selon la dernire question, les quantits de carcasses ont connu respectivement une
augmentation de 38% et 57% en A1 et A2. Par ailleurs, on peut affirmer selon la 2eme
question que les chiffres daffaires en DH courant raliss par lentreprise pout cet article
ont connu une lvation respectivement de 57% et 88% en A1 et A2.

La diffrence daccroissement constate entre les variations des CA et des quantits ne


peut tre engendre que par la prsence de leffet des prix et donc dinflation.

Nous pouvons mesurer les variations du CA en terme rel en cartant leffet de


linflation ; nous allons alors dflater, cest--dire corriger le CA en DH courant par
lindice des prix.

Prenons comme anne de base Ao :


On rappelle que : IPt/o = (Pt / Po) x 100

Annes Prix Quantit IPt/o CA CA CA


carcasse des courant constant constant
(en DH) carcasses
Ao 5 21 100 105 105 -

A1 5,7 29 114 165,3 145 38

A2 6 33 120 198 165 57

Lgalit entre la variation du CA en DH constant et la variation des quantits vendues


tient au fait que nous avons limin leffet des prix, entre A0 / A1 et entre A0/A2.
Section I : Prsentation des modles :

MARCO MICRO

J=1 : volume de lemploi de la main J=1 : part de march.


duvre
J=2 : chiffre daffaire.
J=2 : solde de la balance commerciale.
J=3 : productivit.
J=3 : taux de croissance du PIB.

Ces variables sont appeles variables Ces variables sont appeles variables
dcisionnelles = exognes = explicatives. objectives.

En effet, laugmentation du PIB entraine une augmentation des dpenses publiques ce qui
favorise lemploi travers linvestissement ce qui engendre laugmentation de la production.
On peut conclure donc que la dpense publique est une variable endogne alors que
lemploi, linvestissement et la production sont des variables intermdiaires.
Exemple :

C = f(R)
C=aR+b
Anne Consommation Revenu

2011 10 13

2012 12 15

2013 11 16

2014 10 13
diagramme de dispertion
12.5

12

11.5

11

10.5

10

9.5
0 2 4 6 8 10 12 14 16 18

A travers ces points on ne peut pas faire une prvision, donc on utilise la mthode des
moindres carrs ordinaires ou on cherche une droite : = r+ b
C = aR+b constitue le modle conomique.
La premire variable qui permet dexprimer la consommation cest le revenu puis les prix.

C = aR + b + e
e est un terme alatoire qui permet dexpliquer les fonctions, dcarter les erreurs
et lindiction et la stimulation.
La consommation ne dpend pas seulement du revenu mais aussi, du niveau de vie, les prix,
les cots, zone gographique.
Exemple introductif :

Soit la fonction de consommation keynsienne : = +

O :
- C = consommation ;
- y = Revenu ;
- a0 : proportion marginal consommer ;
- a1 : Consommation autonome ou incompressible.
La variable consommation est appele variable expliquer ou variable endogne .
La variable revenu est appel variable explicative ou variable exogne .
a0 et a1 sont les paramtres du modle ou encore les coefficients de rgression.

ei =0 donc Esprance (ei)= ei/n = 0/N = 0


Variance (ei) = (ei)/n = On constante donc que lcart type est constant.

E()=a et V()=a, E ()=b et V ()=b ; on dit que le modle est BLEU (Best Linear Unbested
Estimateur).

+
= + + Ce qui entraine que = +
Donc :
)(
( )
=
Et =


( )

Rvision :
Dfinir les concepts suivants ainsi que leurs fonctions.

a- Modles de rgression simple ;


b- Modle linaire de la rgression ;
c- Diagramme de dispersion ;
d- Terme derreur.
Formuler la relation gnrale entre la consommation Y et le revenu X :
1- Sous une forme linaire exacte.
2- Sous une forme alatoire
3- Pourquoi peut-on sattendre ce que la plupart des valeurs observes de Y ne
donnent pas des points situs exactement en ligne droite.
En quel sens la mthode de MCO permet-elle destimer la meilleure droite
dajustement pour un chantillon dobservation XY ?
Pourquoi choisir les carts verticaux ?
Pourquoi ne pas prendre simplement des carts sous les postes au carr ?
Pourquoi ne pas prendre la somme de valeurs absolues des carts ?
par les moindres carrs ordinaires (MCO) :
et de
Dtermination de
Exemple 1 :
Pendant 10 ans, de 1996 2005, une ferme a expriment le rendement du mas (Y en
kg/ha) associ lemploi de quantits croissantes dun fertilisant (X en g). Le tableau suivant
rassemble ces donnes.
1- Reporter ces donnes sur le diagramme de dispersion.
2- Donner lquation estime la droite de rgression.

3- Tracer la droite de rgression et calculer lcart ( ) entre et

Anne n


1996 1 40 6 -17 -12 204 144

1997 2 44 10 -13 -8 104 64

1998 3 46 12 -11 -6 66 36

1999 4 48 14 -9 -4 36 16

2000 5 52 16 -5 -2 10 4

2001 6 58 18 1 0 0 0

2002 7 60 22 3 4 12 16

2003 8 68 24 11 6 66 36

2004 9 74 26 17 8 136 64

2005 10 80 32 23 14 322 196

Somme 570 0 0 956 576

Moyenne 57 18

Diagramme de dispersion
90
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25 30 35

)(
( )
Sachant que : =
( )
=

Donc = 956/576 = 1.66 (pente estime de la droite de rgression)

Et = 57-(1.66*18) = 57 29,88 = 27.12 (ordonne lorigine)


Equation estime de la droite de rgression = 27,12 + 1,66

Par consquent si = 0 alors = 27,12 = et lorsque = 18 = moyenne de X alors :


= 27,12 + (1,66 18) = 57 = moyenne de Y.
Il en rsulte que la droite de rgression passe par le point (18, 57)



1 40 37.08 2.92

2 44 43.72 0.28

3 46 47.04 -1.04

4 48 50.36 -2 :36

5 52 53.36 -1.68

6 58 57 1

7 60 63.64 -3.64

8 68 66.96 1.04

9 74 70.28 3.72

10 80 80.24 -0.24
570 0

Exemple 2 :
1- Construire un diagramme de dispersion pour les donnes en Milliards de Dhs.
Dpenses de consommation, Y, et le revenu disponible, X, pendant 12 annes de 1994
2005.
2- Etablir lquation de rgression.
3- Tracer la droite de rgression correspondante en indiquant lcart spcifiant chaque
couple.
n Yi Xi
1994 1 102 114
1995 2 106 118
1996 3 108 126
1997 4 108 130
1998 5 122 136
1999 6 124 140
2000 7 128 148
2001 8 130 156
2001 9 142 160
2003 10 148 164
2004 11 150 170
2005 12 154 178

Exemple 3 :
Considrons la srie des indices de la livraison trimestrielle dessence au Maroc pour annes
conscutives :

Anne 1er 2me 3me 4me


trimestre trimestre trimestre trimestre
1997 109 108 137 114
1998 111 119 140 122
1999 115 122 140 150
2000 125 125 150 137

Travail faire :
1. Tracer le nuage de points, que fait-il apparatre ?
2. Donner la droite de rgression.
3. Quel serait lindice de la livraison en 2me trimestre 2011 ?
Correction :

160

140

120

100

80

60

40

20

0
0 2 4 6 8 10 12 14 16 18

Commentaire :
- Le graphique fait apparatre une tendance gnrale laugmentation. Il convient de
mentionner quun mouvement saisonnier se produit chaque anne un maximum absolu
est atteint le troisime trimestre de chaque anne (arrive des travailleurs marocains
ltranger, touriste).
- N.B : Pour une bonne interprtation, il est ncessaire de dessaisonnaliser de cette srie.


( ) ( )(
)
1 109 -7.5 -16.25 56.25 121.875
2 108 -6.5 -17.25 42.25 112.125
3 137 -5.5 11.75 30.25 -64.625
4 114 -4.5 -11.75 20.25 50.625
5 111 -3.5 -14.25 6.25 49.875
6 119 -2.5 -6.25 6.25 15.625
7 140 -1.5 14.75 2.25 -22.125
8 122 -0.5 -3.25 0.25 1.625
9 115 0.5 -10.25 0.25 -5.125
10 122 1.5 -3.25 2.25 -4.875
11 140 2.5 14.75 6.25 36.875
12 130 3.5 4.75 12.25 16.625
13 125 4.5 -0.25 20.25 -1.125
14 125 5.5 -0.25 30.25 -1.375
15 150 6.5 24.75 42.25 160.875
16 137 7.5 11.75 46.25 88.125
Somme : 136 2004 340 555
Moyenne : 125.25
8.5

Dtermination des coefficients :

(( )(
) 555
=

= = 1.63
( ) 340

=

= , , , ,
Donc : = 1,63 + 111,4

Pour tracer la droite : t = 0 et y =

t = et y =
Calcul de lindice de la livraison en 2me trimestre 2011 :

On sait que :
= 1,63 + 111,4
t = 58, alors : = 1,63 58 + 111,4 = 205,94

Exemple 4 :
On reprend les observations consignes dans le tableau exemple 3 propos de la relation
entre la consommation globale et le revenu disponible.

Dterminer ,

O :

- est lestimateur de la variance de lerreur.


- est lestimateur de la variance de
.
-
est lestimateur de la variance de .
Il faut poser deux questions sur les estimateurs (voir hypothse 6) :
Les estimateurs sont-ils sans biais ?
Les estimateurs sont-ils convergents ?
Rponse : Voir les pages : 15 -19
(ou ) converge en probabilit vers celle du et la valeur
La distribution des
()
= Estimateur de la variance des rsidus.

O :
- n : le nombre dobservation ;
- n-2 : le nombre de degr de libert ;
- 2 : le nombre des paramtres (a et b).
Cela signifie que :


=
)
(
De mme :



Sb= S [ + ( )
]

Rsultat de lexercice :

2
()2 115.28
= = = 11.53
n2 12 2

2
2 11.53
= 2 = = 0.0024
( ) 4812


1 1 (145)2
Sb= S[ + ] = 11.53 (12 + ) = 51.34
( ) 4812

Donc:
2
= 0.0024 = 0.05

= 51.34 = 7.17


= = t = test de student


Donc :
= 0.86
.
= .
= .
Pour savoir si la variable exogne choisie est pertinente on passe au test de student.

- Test de student de = =
avec ddl = n-k = n-2 (avec k nombre de
paramtre).
- Soit on compare le par rapport t tabl. Si >
, t tabl on rejette H0
(H0 : a = 0). La variable exogne est pertinente.
- Soit on compare 2 ; si > on rejette H0 (H0 : a = 0). La variable exogne
est pertinente.
- Sinon la variable exogne nest pas pertinente.
Application :
= , / 0,05 = 17,5
=

Avec ddl = n-k (avec k nombre de paramtre) = 12-2=10


t tabl 5% = 2.228
t tabl 17.5 > 2.228, on rejette Ho (Ho : a=o)
Alors >
La variable exogne est pertinente.
Exercice I :
Au cours dun mois donn, le reprsentant dune socit commercialisant du matriel de bureau a
visit 56 entreprises rparties dans 7 villes. Le tableau suivant indique le nombre de visites ralises
et les commandes enregistres en 10Dhs.


1 2 23
2 3 27
3 5 28
4 9 39
5 10 39
6 12 45
7 15 51

Question 1 :
Reprsenter graphiquement le nuage des points et donner le modle de rgression
= + par la mthode des moindres carres (MCO) ;
Interprter les rsultats.
Correction :

Relation entre les commandes et le nomble de


visites de reprsentants
0.06

0.05

0.04
1000 DH

0.03

0.02

0.01

0
0 2 4 6 8 10 12 14 16
/1/ /2/

Ville i Nombre Commandes /1/*/2/ /1/2


de visites


1 2 23 -6 -13 78 36

2 3 27 -5 -9 45 25

3 5 28 -3 -8 24 9

4 9 39 1 3 3 1

5 10 39 2 3 6 4

6 12 45 4 9 36 16

7 15 51 7 15 105 49

Total 56 252 0 0 297 140

Moyenne 8 36

On sait :

( )(Yi ) (, )
= = = 2
( )2 ()
Alors
42.4
= = 2.12 Et = 19
20

Alors Y = 2,12 X + 19

Ce rsultat peut tre interprt de la faon suivante :


En absence de visite, le montant des commandes dun dpartement slverait
19000DH ;
Chaque visite dun reprsentant amne une masse de commandes supplmentaire
denviron 2120 DH.
Question 2 :
Calculer les diffrentes dispersions selon la loi des carts.
La loi des carts :
La loi des carts permet de relier lerreur associe lhypothse nulle et lerreur associe
lhypothse Y dpend de X .
Lerreur attache lhypothse nulle est mesure par la dispersion totale des , cest--dire
par la somme des carres des carts des par rapport la moyenne .
)
Dispersion totale = (
(Yi )
( )

Lerreur attache la seconde hypothse, ou encore dispersion rsiduelle est donne par
somme des carres des carts entre les observations et les valeurs estimes
par
le modle.

Dispersion rsiduelle = ( )
Dans le tableau prcdent, il apparait que lerreur associe au modle est trs faible avec
e=7,9
Dans ce cas lerreur de lhypothse nulle slve 638

Ni Xi Yi i
Y yi y (Yi ) i (i ) i Yi (i Yi)

1 2 23 23.27 -13 169 -12.73 162.0529 0.27 0.0729

2 3 27 25.39 -9 81 -10.61 112.5721 -1.61 2.5921

3 5 28 29.64 -8 64 -6.36 40.4496 1.64 2.6896

4 9 39 38.12 3 9 2.12 4.4944 -0.88 0.7744

5 10 39 40.24 3 9 4.24 17.9776 1.24 1.5376

6 12 45 44.49 9 81 8.49 72.0801 -0.51 0.2601

7 15 51 50.85 15 225 14.85 220.5225 -0.15 0.2225

56 252 0 638 630.1492 7.9492

M 8 36

La diffrence entre la dispersion totale et la dispersion rsiduelle correspond la dispersion


explique par le modle de rgression compte tenu du fait que :

( ) = ( ) + ( )
On tire la dcomposition suivante :

( ) = ( ) + ( )
Relation connue sous le nom de loi des carts, nous pouvons crire :

Dispersion explique : ( )

Donc on a :

Dispersion totale = dispersion expliqu + dispersion rsiduelle


SCT = SCE + SCR
Pour lexemple considr, la dispersion explique slve 630,09.
Question 3 :
Dterminer le coefficient de dtermination et le coefficient de corrlation.
R2 ne peut jamais tre suprieure 1.

** = = = = .

Il apparait que le modle restitue 98.7% de linformation totale.

** = = . = .
Ce qui indique une relation linaire presque parfaite entre X et Y.
Question 4 :
Reprsenter lanalyse de la variance et le test de Fisher.
On note:


=


Dans notre exemple K=1 et n=7 alors Fc=395. (c : calcul)
Ft (tabul) 1% avec ddl (1.5) = 16.26.
Comme Fc > Ft on peut admettre la relation linaire entre X et Y.

Analyse de la variance pour la rgression (Test Fisher)


ddl Somme des Carres F
carres moyens
Rgression K=1 630.09 630.09 630
396 =
1.59
( )

Erreur n-k-1=5 7.94 7.94


1.59 =
5
(i Y)

Total n-1=6 638

(Yi )

. = .

Question 5 : (Test de SYDENT)


Si X = 20 visites, combien seront les commandes ?
Ainsi X= 20 visites devraient amener selon le modle, 61400 Dhs de commandes en
moyenne, puisque 61.4 = 2.12 (20) + 19

Exercice II :
On sintresse dans un secteur de production la relation entre les bnfices raliss par les
entreprises et le budget annuel quelles consacrent la publicit. 15 observations ont t
ralises :

Budget 15 8 36 41 16 8 21 21 53 10 32 17 58 6 20

Bnfice 48 43 77 89 50 40 56 62 100 47 71 58 102 35 60

1/ On veut tablir une rgression linaire entre les deux variables, quelle doit tre la variable
endogne ?
2/ On admet lexistence dune relation linaire de forme = + +
Calculer les estimations des coefficients a et b.
3/ Prciser lquation danalyse de la variance, calculer ses valeurs et en dduire le
coefficient de dtermination de corrlation.
Voir les pages : 22 et 23
Hypothse I :
Le modle dit, il faut que les variables explicatives retenues soient les meilleures sans
omission dautres variables, la vraie relation soit une relation linaire, dans ou par rapport
aux paramtres estimer et enfin la variable alatoire intervienne de manire additive.
Hypothse V :
Moyenne = 0 et cart-type = cte
Hypothse VI : (voir lexemple)
On a : X/pop ; M/pop ; PIB/pop Une erreur au niveau de X, M ou PIB engendre une erreur
sur lensemble des rapports

Problmes particuliers :
La violation des hypothses
Deux formes classiques :
Autocorrlation des erreurs
Htroscdasticit
Les causes de la dtection de lautocorrlation des erreurs :
1/ Dfinition et causes :
Nous sommes en prsence dune autocorrlation des erreurs lorsque les erreurs sont lies
par un processus de reproduction. Nous pouvons distinguer lautocorrlation positive
(graphique 1) et lautocorrlation ngative (graphique2).

Graphique 1 : Autocorrlation positive

Graphique 2 : Autocorrlation ngative :


Lautocorrlation des erreurs peut tre observe pour plusieurs raisons :

Labsence dune variable explicative importante.


Une mauvaise spcification du modle, les relations entre la variable expliquer et
les variables explicatives ne sont pas linaires et sexpriment sous une autre forme
que celle du modle estim (logarithmes)
Une interpolation des donnes ou un lissage par moyenne cre une autocorrlation
artificielle des erreurs due lusage de ces deux oprations.
Lautocorrlation des erreurs se rencontre :

Dans les modles en srie temporelle o linfluence dune erreur dune priode sur
lautre est plausible.
Dans le cas de modle spcifie en coup instantan si les observations ont t
pralablement tries en fonction croissante (ou dcroissante) de la variable
expliquer (rare).
Dtection ne peut seffectuer qu partir de lanalyse des rsidus :

Examen visuel des rsidus :


Les rsidus sont pendant plusieurs priodes conscutives soit positifs, soit ngatifs :
autocorrlation positive (graphique 1). Les rsidus sont alterns : autocorrlation ngative
(graphique 2).

Test de Durbin et Watson (1950) :


Le test DW permet de dtecter une autocorrlation dordre 1.

LHtroscdasticit :
Consquences de l Htroscdasticit :
(Sont identiques celles de lautocorrlation des erreurs)

Estimation sans biais


Lestimateur de MCO nest plus variance minimale
Causes de l Htroscdasticit :

Lorsque les observations reprsentent des moyennes calcules sur les chantillons
de taille diffrente.
La rptition dune mme valeur de la variable expliquer pour des valeurs
dfrentes dune variable explicative.
Lorsque les erreurs sont lies aux valeurs proses par une variable explicative, dans un
modle en coupe instantane, la variance de la consommation crot, par exemple,
avec le revenu disponible, etc.
Concepts : On sait que :

=
SCT = SCE + SCR
Variabilit totale = Variabilit explique + Variabilit des rsidus

)
(

F (Fisher) =

=
( )
()
Application:
On a: = . + . + . . +
(11.66) (0.29) (0.15) (0.05)
R = 0.702
n = 14
(.) = cart-type
1/ les variables exognes sont-elles pertinentes ?
2/ Lajout des variables 2 3 amliore-t-il significativement la qualit de lestimation par
rapport x1 t seul ?
Dtermination des paramtres :
Lquation de MRLM scrit sous la forme matricielle suivante : = +
Avec : la matrice de dimension (n, p) des variables exognes qui expliquent la variable
endogne.
X (n, p) = (1 , 2 ,, ; E) pour variant de 1 n

= ( ).

Avec X la transpose de la matrice X.


est la matrice des vecteurs des estimateurs de a

Proprits de
:

()==
( )
= [( )( )] = ( )
est BLUE : meilleur estimateur parmi les estimateurs linaires de a.
est efficace dans la classe des estimateurs de a sans biais et linaires en y.

Test dans le MRM :


Le coefficient de dtermination de R :
) ( )
(
= = =
)
( )
(

Test de Fisher :
H0 : a = 0 Hypothse de nullit qui stipule que le modle nest pas pertinent
H1 : a 0


= = ()
()
Lorsque le F calcul est suprieur au F thorique obtenu partir de la table par lintersection
entre (n-p) et (p-1), lhypothse H0 est rejete.

Interprtation :

Fc > Ft Au moins une variable est pertinente pour expliquer la variable endogne

Test de Student :
H0 : a = 0 Hypothse de nullit qui stipule que le modle nest pas pertinent
H1 : a 0
Le test de student mesure la significativit de chaque composante du vecteur a. Il permet
dapprcier la porte explicative de chaque variable exogne retenue .

Mthode dapproximation :


= ||
Mthode de lintervalle :

< + . ] = .
[ . <

Interprtation :
Si nappartient pas lintervalle, H0 est rejete puisquelle accorde 95% des chances que
soit compris entre[ . ; + . ]. Le coefficient est donc statistiquement diffrent de
zro et selon lchantillon, pertinent pour expliquer la variation de la variable endogne.

Validation des modles :


Le test de Durbin & Watson DW (avec p est le nombre des coefficients du modle).
Test de lhypothse H4 ( , ) =
La statistique de DW est donne par :

(
)
=
=

Auto Doute Indpendance Doute Auto


corrlation corrlation
positive ngative
1 2 Sont des valeurs critiques tabules obtenues par DW (n ; p-1)

Dcision :
Si < < : Il ya une autocorrlation positive.
Les rsidus ragissent de faon identique dans le mme sens p > 0.

Si < < : Doute. On peut se prononcer sur lexistence dune auto


corrlation entre les rsidus.
Si < < : Independence entre les erreurs. Le modle est correctement
spcifi p=0.
Si < < : Doute
Si < < : Auto corrlation ngative p < 0.

Illustration : Suite de lexemple1


On ajoute au modle prcdent une nouvelle variable relative lindice de pluviomtrie,
estime sur la priode 1970 2009.
Le modle devient : Pbl = 19,44 Eng + 0,43 Pluv 30,47
Les carts types estims des estimateurs sont respectivement 5,19 ; 0,15 et 6,87
On donne R = 0,96 et DW = 2,31
Analyser ces rsultats sur le plan conomique et statistique.

R = 0,96
La variation des variables exognes explique 96% de la variabilit de la variable endogne,
soit 2% de plus aprs lintroduction dune 2eme variable explicative dans le modle.
En dautres termes, la variation de la quantit dengrais utilise par an et lindice de
pluviomtrie explique 96% de la variabilit du niveau de production de bl, soit 2% de plus
suite la prise en considration de la variation de lindice de pluviomtrie.

Test de Fisher : n = 40 et p = 3

- H0 : = 0
- H1 : a 0

= = > (, )
( )
()
Rejet de H0 : le modle est globalement significatif

Test de Student : T = /

Pour la variable Engrais : T = 19,44 / 5 ,19 = 3,74 > 2
Rejet de H0, 1 est donc diffrente de 0 et la quantit dengrais utilise annuellement
est explicative du niveau de production de bl.
Pour la variable pluviomtrie : T = 0,43 / 0,15 = 2,86 > 2
Rejet de H0, 2 est donc diffrente de 0. Par consquent, lindice de pluviomtrie est
pertinent pour expliquer la variabilit du niveau de production de bl.

Test de Durbin et Watson DW : 2,31


DW (p 1, n) = DW (2,40) d1 = 1,39 et d2 = 1.6

Autocorrlation Doute Independence Doute Autocorrlation


positive ngative

< < : Independence. Il ny a pas dautocorrlation entre les rsidus.