Vous êtes sur la page 1sur 45

Printemps 2013

Econométrie linéaire appliquée

© Soussi Noufail Outmane


Université Mohammed V Souissi
Printemps 2013
Introduction à l’Econométrie

Université Mohammed V Soussi


FSJES Salé
Licence des études fondamentales Année 2012-2013
Filière d’économie et de Gestion

Semestre «S6» : Econométrie linéaire appliquée


Pratique de l’économétrie à travers des exemples

©Mr. Soussi Noufail Outmane

Plan du cours :

1. Econométrie : Origine(s), définition(s) et objectif(s)


2. La démarche économétrique
3. Analyse de régression simple
4. Analyse de régression multiple
5. Domaines d’application (en cours de préparation)
6. Types de données (en cours de préparation)

Travaux dirigés

1. Généralités : commentaires des relations économiques et passage aux relations


économétriques
2. Exercices : série 4, série 5

Bibliographie :

1. Régis BOURBONNAIS, « Econométrie – Manuel et exercices corrigés », Dunod, 1998.


2. Y.Dodge, V.Rousson, « Analyse de régression appliquée», Dunod, 2004.
3. M. Tenenhaus, « Statistique : Méthodes pour décrire, expliquer et prévoir », Dunod,
4. René GIRAUD, Nicole CHAIX, « Econométrie», PUF, 1994.
5. Jack JOHNSTON, John DINARDO, « Méthodes économétriques », Economica, 1997.

1
Introduction à l’Econométrie

Econométrie : Origine(s), définition(s) et objectif(s)


Utilité

L’économétrie est le principal outil d’analyse quantitative utilisé par les économistes et gestionnaires
dans divers domaines d’application. Comme la macroéconomie, la finance ou le marketing. Les
méthodes d’économétrie permettent de vérifier l’existence de certaines relations entre des
phénomènes économiques, et de mesurer correctement ces relations, sur la base d’observations et
de fais réels.

Quelques définitions

Définition 1. Etudes des relations quantitatives de la vie économique faisant appel à l’analyse
statistique et à la formulation mathématique.

Définition 2. L'économétrie exprime quantitativement les corrélations pouvant exister entre des
phénomènes économiques dont la théorie affirme l'existence. La théorie économique fournit des
idées sur les processus qui déterminent les grandeurs économiques, l'économétrie apporte une
vérification empirique et établit quantitativement les corrélations qui apparaissent valides.

Définition 3. L’objectif de l’économétrie est de confronter un modèle économique à un ensemble de


données (données de panel, série temporelle, etc.) et ainsi d’en vérifier la validité.

Définition 4. L’économétrie est une branche de l’économie qui traite de l’estimation pratique des
relations économiques.

Econométrie : Carrefour de 3 disciplines

Economiste (Expert du domaine)


Exprime une théorie sur un phénomène économique
Ex. La demande dépend du prix

Mathématicien (Modélisation) Statisticien (Estimation)


Propose une formulation algébrique de la Estime les paramètres du modèle à partir de

Ex.  =  ∗
+  Ex.  = −0.5 ;  = 10
théorie données : Validation statistique

Validation de l’Expert du domaine (ex.  est forcément négatif)


Sous le contrôle de l’Economiste

2
Introduction à l’Econométrie

Notions Clés : Modèle économique

Un modèle consiste en une présentation formalisée d’un phénomène des idées sous forme
d’équations mathématiques.

Le raisonnement sur le modèle nous permet d’explorer les conséquences logiques des hypothèses
retenues, de les confronter avec les résultats de l’expérience, d’arriver ainsi à mieux connaitre la
réalité, et agir plus efficacement sur elle.

Comme toutes les variables économiques sont interdépendantes (notion de système), il n'est pas
suffisant de construire des équations isolées : il faut établir un système complet d'équations.

Exemple :

Depuis les premiers économistes classiques, ont sait que, sur un marché concurrentiel, l’équilibre des
échanges s’établie grâce à un arbitrage entre l’ensemble des offres et des demandes. Toutes les
ventes d’un même produit se concluent au même prix. Soient D et O les quantités demandées et

les échanges. Les quantités O et D dépendent des


, car les échangistes peuvent décider de ne pas
offertes d’n certain produit, un certain jour, sur un certain marché. Soit p le prix auquel s’effectuent

qu’il existe deux fonctions,  = (


) fonction de demande, et  = (
) fonction de l’offre, qui
acheter ou de ne pas vendre si le prix ne leur donne pas satisfaction. Pour exprimer ce faite, on dit

déterminent respectivement les quantités  et  à partir des


. Ceci convient à dire qu’une fois les
prix du produit sont connus, les quantités  et  le sont. Pour qu’il y ait équilibre sur le marché il faut
que  = . Formellement on a :

 = (
)
 = (
)
Equations de comportement
 = +∆
Théorie économique
Identité

 =×
+
Modélisation

 = ×
+
(Introduction d’hypothèses
simplificatrices sur la forme de la relation)

Estimation de , ,    à partir des données disponibles

Limites de cette relation : existence d’autres variables exogènes au modèle tels que le revenu, le prix
du bien de substitution, etc.

Les formulations précédentes supposent un ajustement instantané de l’offre et la demande aux


variations du prix, puisque le temps n’intervient pas explicitement. Dans certains cas, cette
simplification ne sera pas admissible. Ainsi l’offre de nombreux denrées agricoles dépend peu de prix
auxquels elles se vendront, et beaucoup plus des prix observés au cours de l’année antérieure.

! = (
! )
! = (
!"# )
! = ! + ∆!

3
Introduction à l’Econométrie

Notions Clés : Modèle économétrique

Faire intervenir l’aléatoire dans l’équation économique.


Parce que la relation n’est pas déterministe.

 La spécification retenue est une simplification, il est évident qu’il ne résume pas
toute la teneur de la relation (ex. dans les équations, la relation est vraiment
linéaire ?)
 Il y a d’autres facteurs dont on ne tient pas compte (ex. le prix des autres de biens
qui peuvent se substituer au bien étudié).
 Les erreurs de mesure sur les grandeurs étudiées, soit lors du processus de
récolte des informations, soit tout simplement parce que la donnée récoltée
représente peu ou prou le concept que l’on veut étudier.

 =  ×
+  + $%
Introduction du facteur «aléatoire»
 =  ×
+  + $&
Résumé de toute l’information non prise en
compte dans le modèle

Notions Clés : Variables

Les variables représentent des grandeurs économiques observées ou mesurées. Ex. les
quantités vendues d’un bien, le prix d’un bien, des taux d’intérêt, le solde d’une balance
commerciale, le taux de change, etc.

La variable doit être représentative du phénomène que l’on étudie, de sa qualité dépend la
validité des résultats obtenus

 Problèmes d’inadéquation (étudier les ventes de pain, et utiliser


des données mesurant les ventes de biscottes)
 Erreur de mesures (problèmes lors du recueil des données ou des
Problèmes dur les transmissions des données), d’unités (compter en nombre de pain
variables vendu, ou en chiffre d’affaires)
 Problème de représentativité (mesurer uniquement des ventes
des boulangeries, et ne pas tenir compte des ventes en grande
surface)

Notions Clés : Variables aléatoire


Une variable aléatoire est une grandeur mesurable dont les valeurs sont soumises à une
certaine dispersion lors de la répétition d’un processus donné.

La dispersion d’une variable aléatoire est régie par une loi de probabilité.

possibles «pile» ou «face», il suit une loi de Bernouilli de paramètre


= 0.5.
Ex. le résultat du jet d’une pièce de monnaie est une variable aléatoire, il prend deux valeurs

Remarque : à chaque phénomène étudié sa loi de probabilité.

Ex. Durée entre deux phénomènes, nombre d’occurrence d’un phénomène dans un laps de
temps, nombre d’essais avant d’obtenir un résultat, etc.

4
Introduction à l’Econométrie

Notions clés - Types de variables

1. Quantitative
2. Qualitative nominale
3. Qualitative ordinale

Le critère le plus important pour distinguer les variables est de déterminer si l’écart entre deux
valeurs a un sens, et qu’elles sont comparables deux a deux.
Ex. Age, Salaires, Satisfaction, Type d’études suivies,…

Notions clés – Population et échantillon

 La population définit l’ensemble d’individus sur lesquels nous voulons travailler : on parle
alors de population de référence ou de population parente ou population mère (ex. les
véhicules vendus au Maroc en 2005, etc.). Tous les résultats obtenus sont toujours relatifs à
(circonscrites à) une population.
 Les enquêtes exhaustives consistent à observer tous les individus qui composent la
population. Opération très coûteuse.
 On procède alors à un échantillonnage, on prélève une fraction de la population en veillant
à ce qu’il soit représentatif de la population c’est-à-dire refléter la composition et la
complexité de la population.
 Le taux de sondage correspond au rapport entre la taille de l’échantillon et la taille de la
population.

Attention au mauvais échantillonnage.


Comment s’assurer que l’échantillon est représentatif ?
Rôle des variables de contrôle.

Notions clés – Inférence statistique

Inférence statistique. Elle consiste alors à effectuer des études sur l’échantillon et transposer
les résultats sur la population.

Cette transposition n’est pas stricte, elle attache toujours une probabilité aux résultats et aux
conclusions émises.

 Tirer des conclusions sur l’existence ou non d’un phénomène (test


d’hypothèses - ex. l’augmentation du prix du tabac réduit-t-il vraiment la
consommation de cigarettes ?).
 Estimer les paramètres d’un phénomène (estimation de paramètres – ex.
une augmentation de 1 dirham du prix du paquet de cigarette réduit de
combien le nombre de paquets vendus?).

5
Introduction à l’Econométrie

La démarche économétrique
THEORIE

FORMALISATION DE LA THEORIE (MODELISATION)

CONFRONTATION DU MODELE AVEC LA REALITE

ESTIMATION ECONOMETRIQUE

THEORIE NON VALIDEE


THEORIE VALIDEE

RE SPECIFICATION DU MODELE

Attention : Distinguer ce qui relève de la simple régularité statistique (artefact) de ce qui représente
une causalité économique.

La théorie économique (la connaissance du domaine) est un garde-fou indispensable.

Phases de l’élaboration d’un projet économétrique professionnel


Compréhension du Connaissance des Préparation des
Modélisation Evaluation Déploiement
la problématique données données
− Détermination − Collecte des − Sélectionner les − Sélection de la − Evaluer les − Plan du
des objectifs données données technique de résultats déploiement
Background Données initial Inclusion/exclusion modélisation Evaluation des
Objectifs Rapport données − Production du
Critères − Données claires − Générer les tests rapport final
− Données Rapport − Approuver le
− Evaluer la descriptives − Construction du modèle − Examen du
situation Descriptif des − Construction des modèle Processus d’examen projet
Risc données données Paramètres Expérience
Rapport Données intégrée Modèle − Détermination des documentation
− Déterminer les Fusion étapes suivantes
objectifs de − Exploration des − Description du Liste des actions
l’exploration des données − Formes des modèle futures possibles
données Rapport données
Data mining goals − Evaluer le
− Vérification de − Description de modèle
− Produire le plan la qualité des l’ensemble des Evaluation du
du projet données données modèle
Plan Rapport Révision des
Techniques à paramètres
utiliser

6
Introduction à l’Econométrie

Le modèle de régression simple

rencontrer : une variable endogène unique ' dépend linéairement d’une variable exogène unique (
Ce chapitre est consacré au traitement du modèle le plus simple de tous ceux que l’on puisse

et une perturbation aléatoire non observable.

'! = (! + 
Variable explicative
Variable Endogène
(1.1)
Comme il est douteux que tous les points appartiennent à la droite correspondante, la relation

)! .
linéaire exacte (1.1) doit être modifiée afin d’inclure le terme stochastique1 que nous désignons par

'! = (! +  + )!
Terme d’Erreur
(1.2)
L’ajustement par la méthode des moindres carrées ordinaires, va apparaitre comme le procédés
convenant à l’estimation des paramètres du modèle.

Transformation simple permettant d’étendre l’usage du l’ajustement linéaire

S’il existait une relation certaine entre consommation * et revenu des ménages +, et que cette

*, = *- + +,
relation était précisément la même pour tout le monde, on aurait pour chaque individu :

les observations pour 2 ménages seulement pour trouver les valeurs des paramètres *- et . Ce
Dans ce cas, toutes les observations appartiendraient à la même droite, Il suffirait alors de connaitre

cadre de figure ne se rencontre jamais car la réalité est plus complexe. En effet, aucun ménage ou
presque ne vérifie exactement la fonction de consommation keynésienne : Certains ménages sont
plus dépensiers, D’autres ménages sont très exposés au risque de chômage par exemple ils
cherchent à consommer moins pour économiser pour se constituer une épargne de précaution. Pour
gérer cette incertitude, on utilise une approche probabiliste en introduisant une variable aléatoire :

*, = *- + +, + ),
Le modèle économétrique que l’on considérera est alors le suivant :

production Cobb-Douglass, où la production ' (variable endogène) dépend des facteurs de


Bien entendu, on peut s’intéresser à d’autres modèles, par exemple, l’estimation d’une fonction de

production, le capital . et le travail /, ainsi que le temps :


' = 0/1 . #"1 2!

On remarque que ce modèle n’est pas linéaire tel que, mais on peut le rendre linéaire (dans les

3 =  + 4 + (1 − )5 + 
variables) si on prend le logarithme de cette équation. En effet, on obtient :

Où on note en minuscule le logarithme des variables (5 = 4(.), 4 = 4(/), et des paramètres


( = 4(0),  = 4(2)). Le modèle économétrique à estimer est dit modèle de régression multiple,
car il comporte plusieurs variables explicatives (capital, emploi, temps) au phénomène étudié
(production de l’entreprise). Si nous disposons d’observations dans le temps pour les variables, le

3! = ( + ) + 4! + (1 − )5! + )!
modèle est donné par :

)! est un terme aléatoire non observable appelé : terme d’erreur, terme aléatoire ou perturbation aléatoire
1

7
Introduction à l’Econométrie

Hypothèses d’application du modèle :

Nous supposons le modèle soumis aux conditions suivantes :

1. Les variables ( et ' sont observer sans erreurs ; la variable ( est certaine : elle prend des
valeurs fixes dans l’échantillon répétés, de sorte que ( et ) ne sont pas corrélés ;
2. Le terme d’erreurs est de moyenne (ou d’espérance mathématique) nulle (hypothèse
fondamentale) ;
3. Il suit une loi de distribution normale (hypothèse de normalité) ;
4. Sa variance est constante (hypothèse d’homoscédasticité) ;
5. Il n’y pas de corrélation entre les termes d’erreurs (hypothèse d’indépendance des divers
observations)2.

Exemple :
Pendant dix ans, de 2001 à 2010, une ferme a expérimenté le rendement du Maïs (3 en Tonnes par
hectare) associé à l’administration d’une quantité croissante d’un fertilisant ( en litres par hectare).

dispersion de la figure (1.1). La relation existante entre et 3 apparait approximativement linéaire,


Le tableau (1.1) rassemble ces données qui sont également rapportées sur le diagramme de

les points ( , 3) se trouvent placés sur une ligne droit ou à son voisinage immédiat.

6 76 86
Tableau (1.1) : production du Maïs et emploi du fertilisant
Années Figure (1.1): Rendement du Fertlisant
2001 1 40 6
2002 2 44 10 100
Maïs (tonnes par hectare)

2003 3 46 12
80
2004 4 48 14
2005 5 52 16 60
2006 6 58 18
40
2007 7 60 22
2008 8 68 24 20
2009 9 74 26
0
2010 10 80 32
0 10 20 30 40
10 570 180
Fertilisant (Litres par hectare)

Ajustement par la méthode des moindres carrées ordinaires

droite» sur les données d’observation 3 constituant un échantillon. Si nous considérons les
La méthode des moindres carrées ordinaire est un procédé qui permet d’ajuster la «meilleure

distances verticales (écarts verticaux) des points 3 par rapport à la droite d’ajustement, cela

9  ∑(3! − 3;! )²
implique de minimiser la somme des carrées des écarts :

=
Où 3, désigne une observation effective et '! la valeur correspondante ajustée, de sorte que
(1.3)

3! − 3;! = $! , le résidu3 (écart résiduel observé).

Ces hypothèses s’inscrivent respectivement : (2) >(), ) = 0 ; (4) >(), ? ) = @ ? , (pour tout i) ; (5) >(), , )A ) = 0
pour = B.
2

Strictement parler, dans les modèle économiques, les résidus peuvent être calculés ($! est la différence entre
3

le terme calculé et le terme observé), tandis que les erreurs ()! ) ne sont pas observables, donc inconnues
appelées simplement aléas.

8
Introduction à l’Econométrie

déduit des équations normales (voir le cours) les valeurs des paramètres ; et =.
L’équation (1.3) implique que l’on minimise la somme des écarts (des résidus) quadratiques. On

∑ ! 3! − C ̅ 3E
; = (1.4)
∑ ! ² − C ̅ ²

= = 3E −  ̅
3G! = ; ! + =
(1.5)
L’équation de régression par la méthode des MCO est alors :

Exemple : Le tableau (1.2) réunit les résultats des calculs en vue d’estimer l’équation de régression

6 76 86 86 76 86 ²
correspondante :
Années
2001 1 40 6 240 36
2002 2 44 10 440 100
2003 3 46 12 552 144
2004 4 48 14 672 196
2005 5 52 16 832 256
2006 6 58 18 1044 324
2007 7 60 22 1320 484
2008 8 68 24 1632 576
2009 9 74 26 1924 676
2010 10 80 32 2560 1024
Sommes 10 570 180 11216 3816
Moyennes 57 18

Nous pouvons donc déduire les valeurs des paramètres du modèle à partir des relations (1.4) et (1.5).

; = =
∑ HI JI "KH̅ JE ##?#L"#- ×#M×NO QNL
∑ HI ²"KH̅ ² PM#L"#-×#M²
= QOL = 1,6597 la pente estimée de la droite de régression

= = 3E −  ̅ = 57 − 1.65972 × 18 = 27.125 L’ordonnée à l’origine

Il en résulte : 3G! = ; ! + =

7G6 = W, XYZ86 + [\, W[Y


Figure (1.2): Rendement du Fertlisant

90 Equation estimée de la
80 droite de régression
Maïs (tonnes par hectare)

70
y = 1,6597x + 27,125

( ̅ , 3E)
60

! = 0, alors 3; = 27.125 = =
Par conséquent si :
50

40

Et lorsque ! = 18 = ̅ , alors
30

3; = (1,6597 × 18) + 27,125 = 57 = 3E
20
10
0

passe par le point ( ̅ , 3E).


− Il en résulte que la droite de régression
0 10 20 30 40
Fertilisant (Litres par hectare)

9
Introduction à l’Econométrie

Autres relations pour calculer du paramètre ; de la régression linéaire

∑ ! 3! − C ̅ 3E ∑( ! − ̅ )3! ∑] ! − ̅ )(3! − 3E)^ _`a( , 3)


; = = = =
∑ ! ² − C ̅ ² ∑( ! − ̅ )² ∑( ! − ̅ )² a ( )

_`a( , 3) = a ( ) =
∑]HI "H̅ )(JI "JE)^ ∑(HI "H̅ )²
K K
Avec et

Propriétés des estimations des moindres carrés

À défaut de connaître la vraie droite, on retient la droite des moindres carrés, les valeurs : ; et =,

d'une droite géométriquement satisfaisante, mais des estimations statistiques des coefficients :  et
calculées comme précédemment par la méthode MCO, ne sont plus simplement les coefficients

, du modèle théorique de base.

La relation 3G! = ; ! + =
'! = (! +  + )! (à ne pas confondre avec la relation «vraie» du paragraphe
Attention : est l'équation estimée. Tandis que chaque relation

précédent) fournit le résidu )! correspondant.

dépendent des caractéristiques de l'aléa $!


Les propriétés des estimateurs des moindres carrés,

On suppose les hypothèses de la méthode de MCO: la normalité, l’indépendance et l’efficacité. Et


sous ces conditions nous avons les propriétés suivantes des estimateurs:

∑ )!
1. Les résidus calculés: )! , approchent les erreurs inconnus: $! , et la quantité c
√C − 2
liée à la somme des carrés des résidus, est une bonne estimation de l'écart-type: @, de l'aléa.

2. Les estimateurs : ; et =, sont les «meilleurs possibles» (en un sens mathématique qu'on ne
Elle est appelée: écart-type résiduel ;

3. Les estimateurs : ; et =, suivent des lois normales : d(>(;), @e; ) et d(>(=), @f= ), dont les
précisera pas davantage pour l'instant);

espérances de ; et =, sont les quantités estimées ; ces estimateurs sont sans biais ;
4. Les écarts-types : @e; et @f= , des estimateurs : ; et =, peuvent également être estimés.

Pour une précision minimale des estimations, on demande généralement que le nombre : C,
d'observations utilisées approche au moins la quinzaine.

Tests de signification de coefficients pour les estimations (Test de Student)

nous devons déterminer les variances de ; et =. (Pour les démonstrations voir le cours)
Si nous voulons tester la signification statistique des estimations des paramètres dans la régression

Les tests de signification des estimateurs se font à travers un test d’hypothèse sur ; et = en
utilisant la distribution de Student, avec  − 5 degrés de liberté, afin de construire les
intervalles de confiances correspondants.

10
Introduction à l’Econométrie

variances : a (;) a ]=^ et leurs espérances mathématiques : >(;)  >]=^.


Pour réaliser ces tests, nous devons étudier les paramètres des estimateurs à savoir leurs

Il s'agit de tester si, pour un niveau de confiance donné (en général 95%), l'intervalle de confiance
peut ou non contenir la valeur 0. En effet si la valeur véritable du coefficient peut être 0, il n'est
même pas certain que la variable explicative (ou le terme constant) intervienne réellement dans le
modèle.

Sachant que pour un risque α, l'intervalle de confiance pour ; est : [; − 1 h


; ; ; + 1 h
;]
Le test revient à examiner si le rapport suivant dépasse ou non 1 :
|;| |Coefoicient estimé|
==
h; écart − type estimé
1

On fait en général ce test au risque  = 5%, ce qui donne, en utilisant la valeur approchée -,-N

< 1.96
≈1,96
||}~o€|€~‚ ~ƒ‚€„é|
⇝ coefficient non significatif au risque 5% ;
é|…†‚"‚‡ˆ~ ~ƒ‚€„é


> 1.96
||}~o€|€~‚ ~ƒ‚€„é|
Pour n = 30
⇝ coefficient significatif au risque 5% ;
é|…†‚"‚‡ˆ~ ~ƒ‚€„é


Ce test est généralement appelé test de Student, car, strictement, lorsque l'échantillon utilisé est de
petite taille (C < 30), il conviendrait d'employer une loi de Student, voisine de la loi normale mais plus
dispersée, pour tenir compte du fait que l'écart-type est lui-même estimé.

Lors d'une étude économétrique, le test de Student sur chacun des coefficients est beaucoup plus
important que l'examen du coefficient de corrélation.

Un «bon» test de Student doit toutefois être regardé avec une certaine modestie, ce test suppose en
effet la pertinence du modèle, mais il n'a pas vocation à la confirmer; en fait, il sert essentiellement à
mettre en doute ou à écarter les variables d'influence incertaine.

Donc nous avons (voir le cours) : outils nécessaires pour faire le calcul (C étant l’effectif total)

∑ ! a ( ) =
∑ HI ²
− ̅ ² @H = Œa ( ) ∑ ! 3!
̅ = _`aHJ = − ̅ 3E
C K
C
∑ 3! ∑ 3! ² _`aHJ
3E = @J = Œa (3) =
a (3) = − 3E² a ( )a (3)
C C

a (;) = ∑(H Ž"H̅ )²


 ²
Variance de )! étant Inconnue, nous
utilisant la variance résiduelle @; appelée
I

∑ ! ² simplement @; ou ²
encore variance des erreurs, notée

a ]=^ = @ ²
C ∑( ! − ̅ )²
Nombre de paramètres estimé ici
Alors

∑ ! ²
pour la régression simple (nous

² = @; = @; =
C−5
disposant de deux paramètres)

11
Introduction à l’Econométrie

Donc une estimation non biaisée des variances de  et  est alors de la forme :

∑ ! ² 1 ∑ ! ² ∑ ! ²
e; ² = × f= ² = ×
C − 5 ∑( ! − ̅ )² C − 5 C ∑( ! − ̅ )²
(1.6)

a 4 ~4` d` 4


→ a 4~   )
a 4 ~4` d` 4

pour tester la signification statistique de ; et =.


Exemple : Le tableau (1.3) qui est une extension du tableau (1.2) rassemble des calculs nécessaires

Années “ ”“ •“ •“ ”“ •“ ² G
7 –6 –— ² ˜)²
(86 − 8
2001 1 40 6 240 36 37,08 2,92 8,51 144
2002 2 44 10 440 100 43,72 0,28 0,08 64
2003 3 46 12 552 144 47,04 -1,04 1,09 36
2004 4 48 14 672 196 50,36 -2,36 5,57 16
2005 5 52 16 832 256 53,68 -1,68 2,82 4
2006 6 58 18 1044 324 57,00 1,00 1,00 0
2007 7 60 22 1320 484 63,64 -3,64 13,24 16
2008 8 68 24 1632 576 66,96 1,04 1,09 36
2009 9 74 26 1924 676 70,28 3,72 13,85 64
2010 10 80 32 2560 1024 80,24 -0,24 0,06 196
Sommes 10 570 180 11216 3816 o 47,31 576
Moyennes 57 18

Il en résulte que pour tester la signification des paramètres ; et = à partir de l’équation estimée :
7G6 = W, XYZ86 + [\, W[Y
= =
|e;|
Le calcul du test d’hypothèse suivant se
( e; ) ? ( f= ) ? e; œG
De déterminer 3; (colonne 7), et par conséquent le calcul des erreurs |žeŸe é!Ÿ¡| (voir le cours du test
réalise en calculant

S’effectue ! = (3! − 3;! ) (colonne 8).


œ¢£ é¤eŸ!"!Jž¡
d’hypothèse)

∑ ! ² 1 47,31 1
Et à partir des relations (1.6) :

e; ² = × = × = 0,01
C − 5 ∑( ! − ̅ )² 10 − 2 567

Donc e; = √0,01 ≈ 0,1

∑ ! ² ∑ ! ² 47,31 3816
De la même manière,

f= ² = × = × = 3,92 Donc e; = Œ3,92 ≈ 1, 98


C − 5 C ∑( ! − ̅ )² 10 − 2 10 × 567

|;| |1,659 |
Par conséquent,

e; = = ≈ 16,6
e; 0,1

12
Introduction à l’Econométrie

¥=¥ |27,125|
= = ≈ 13,7
f=
f= 1,98

Comme e; et f= dépassent tous deux !ef¦é¡ = 2,306 avec C − 5 = 8 degrés de liberté au seuil de
signification de 5% (d’après la table de Student), nous concluons que ; et = ensemble sont
statistiquement signifiants au seuil de 0,05.

Test d’efficacité d’ajustement et coefficient de corrélation

plus les résidus sont faible), plus importante est la variabilité de ' expliquée par l’équation de
Plus les points représentatifs des observations sont proches de la droite de régression (c'est-à-dire

régression estimée. La variabilité totale de ' est donc égale à la somme de variabilité expliquée et la
variabilité résiduelle.

§('! − 'E)? = §]'=! − 'E^² + §('! − '¨! )² (1.7)

Variabilité Totale de ' Variabilité expliquée de ' Variabilité résiduelle de '


(somme totale des écarts à la (somme des carrées de la (somme des carrées des

©*C = ©*> + ©*+


moyenne) régression) erreurs)

Somme des carrées Totale = Somme des carrées explicatives + Somme des carrées résiduelle

©*> ©*+
On peut encore écrire :

1= +
©*C ©*C
Si le coefficient de détermination, +², désigne la proportion de la variabilité totale de ' expliquée par
la régression de ' par rapport à (, il vient :

©*> ©*+
+² = =1−
©*C ©*C

Ce qui peut s’exprimer sous la forme :

∑(3;! − 3E)² ∑ ! ²
+² = =1−
∑(3! − 3E)² ∑(3! − 3E)²

La valeur de +² s’établit entre 0 (l’équation de régression estimée n’explique en rien la variabilité de


') et 1 (tous les points ((, ') appartiennent à la droite de régression).

Le coefficient de corrélation , est alors tel que :


∑(y;‚ − yE)²
= Œ+² = ª
∑(y‚ − yE)²
Les valeurs de s’établissent entre -1 (corrélation linéaire négative parfaite) et +1 (corrélation
linéaire positive parfaite), mais ce coefficient n’implique ni causalité, ni dépendance entre les

d’ordre), appelé le coefficient de Spearman, ′.


variables. Avec des données qualitatives, on peut employer le coefficient de corrélation de rang (ou

13
Introduction à l’Econométrie

Exemple : le tableau (1.4) permet de calculer le coefficient de détermination dans le cas du fertilisant
du maïs en ajoutant les deux dernières colonnes:

Années “ ”“ •“ •“ ”“ •“ ² G
7 –6 –— ² (86 − 8˜)² (76 − 7˜)² G6 − 7
(7 ˜)²
2001 1 40 6 240 36 37,08 2,92 8,51 144 289 397
2002 2 44 10 440 100 43,72 0,28 0,08 64 169 176
2003 3 46 12 552 144 47,04 -1,04 1,09 36 121 99
2004 4 48 14 672 196 50,36 -2,36 5,57 16 81 44
2005 5 52 16 832 256 53,68 -1,68 2,82 4 25 11
2006 6 58 18 1044 324 57,00 1,00 1,00 0 1 0
2007 7 60 22 1320 484 63,64 -3,64 13,24 16 9 44
2008 8 68 24 1632 576 66,96 1,04 1,09 36 121 99
2009 9 74 26 1924 676 70,28 3,72 13,85 64 289 176
2010 10 80 32 2560 1024 80,24 -0,24 0,06 196 529 540
Sommes 10 570 180 11216 3816 0 47,31 576 1634 1587
Moyennes 57 18

R² = 1 − ∑(‡ "‡ = 1 − #LP® = 1 − 0,029 ≈ 0,971, 97,10%


­∑~ ² ®O,P#
˜)²
­
Nous avons :

≈ 3% représente la part
R² = ∑(‡­"‡˜)² = #LP® ≈ 0,971, 97,10%
∑(‡
G "‡
˜)² #NMO
­
Et encore :
de la variabilité résiduelle

L’équation de régression explique donc environ 97% de la variabilité totale de la production du maïs.
Les 3% restant peuvent être attribués à des facteurs inclus dans le terme d’erreur.

Dés lors : = Œ+² = √0,971 ≈ 0,9854 = 98,54% ; est positif parce que ; l’est.

Propriétés des estimations par les moindres carrées ordinaires


Les estimateurs MCO (méthode des moindres carrées ordinaires) sont des estimateurs efficace dans
la classe des estimateurs linéaires sans biais. On les dira encore estimateurs «BLUE» (de l’anglais

que l’estimateur ; présente une espérance mathématique égale à la valeur vrai  (on dit aussi que 
best linear unbiased estimators : meilleur estimateurs linéaires sans biais). L’absence du biais signifie

>(;) =  2   = >(;) −  = 0
est centré) :
De sorte que :

Un estimateur sans biais est efficace (ou optimal) si la variance est minimale. Les estimateurs MCO
sont donc les meilleurs de tous les estimateurs linéaires sans biais. Ce résultat est connu sous le non
de théorème de Gauss-Markov : il représente la justification la plus importante dont on dispose pour
l’emploi du MCO.

Il peut arriver qu’un chercheur choisisse d’accepter un léger biais afin d’obtenir éventuellement une
variance plus faible : il cherchera alors à minimiser l’erreur quadratique moyenne :

>¯9(;) = >(; − )? = a (;) + (   ;)²

Supposons une population infinie et un échantillon de plus en plus grand extrait de cette population :
à la limite, l’échantillon sera de taille infinie. Dans ce cas, l’échantillon est dit convergent en
probabilité si sa valeur est égale à la limite à celle du paramètre «vrai» (l’estimateur est
asymptotiquement centré) et si sa distribution se comprime sur le paramètre «vrai».

14
Introduction à l’Econométrie

Résumé :

Le modèle de régression simple

Relation économique '! = (! + 

Spécification économétrique '! = (! +  + )!

Ajustement linéaire 3! = 3! +  + !

9  ∑ ! ²
Hypothèses Méthode des MCO 3G! = a; ! + = Questions importantes :
1) Est-ce que l’ajustement est

∑ ! 3! − C ̅ 3E
; =
«bon» dans sa globalité ?

∑ ! ² − C ̅ ²
2) Est-ce que les paramètres

= = 3E −  ̅
Recherche des paramètres
Propriétés sont significatifs ?

Accepter si

|;| |
 é |
Réponse pour question 2 : Voir si ces paramètres sont « robustes» leurs valeurs si

e; = =
e; ` é_ − 3

Voir leurs significations (tests sont supérieurs

e; inconnue
d’hypothèses) à 1.96.

Problème qui se pose : (car @ est inconnue)


∑ ! ²
² = @; = @; =
Maintenant on

C−5
Solution : calcul de la variance peut calculer :
e; et f= à partir
résiduelle

e; ² = ∑(H
des calculs de


I "H̅ )²
et f= ² = @; ×
Réponse pour question 1 : Tester la qualité de la régression

∑(3;! − 3E)² ∑ ! ² ∑ HI ²
Relations :
+² = =1−
∑(3! − 3E)² ∑(3! − 3E)² K ∑(HI "H̅ )²

0 ≤ +² ≤ 1
Solution :
∑(y;‚ − yE)²
−1 ≤ ≤ 1 = Œ+² = ª
∑(y‚ − yE)²
Si ²² est proche de 1 : l’ajustement est «bon»
Si ³ est proche de 1 : il y a une forte corrélation positive

15
Introduction à l’Econométrie

Exercices résolus : Modèle linéaire

Exercice :
Définir les concepts suivant ainsi que leurs fonctions : (a) modèle de la régression simple, (b)
modèle linaire de la régression, (c) diagramme de dispersion, (d) terme d’erreur.

relation entre la variable indépendante, ', et une variable indépendante ou explicative, (, il


a) Le modèle de la régression simple est utilisé pour tester des hypothèses portant sur la

sert également à la prévision, dans les même conditions. Il faut le distingué du modèle de la
régression multiple qui au lieu d’une variable indépendante, en comporte deux ou
davantage, le chapitre suivant traitera ce problème.

( et ' : autrement dit, l’ensemble des couple de valeurs (! et '! appartenant à l’échantillon
b) Le modèle linaire de la régression suppose qu’il existe une relation linéaire approchée entre

aléatoire observé par les points ((! , '! ) répartis sur une droite ou au voisinage immédiat de
celle-ci. Il faut distinguer un tel modèle des modèles de régression non linéaire.

indépendantes et indépendantes un point dans un plan euclidien orthonormé ('. Il permet


c) Un diagramme de dispersion est un graphe qui associe à chaque couple d’observations

variable indépendante ' et la variable indépendante ou explicative (.


d’établir au jugé, par observation direct, s’il existe une relation linéaire approchée entre la

d) Le terme d’erreur (encore appelé terme stochastique ou perturbation aléatoire) mesure


l’écart (d’ordinaire en projection verticale) entre chaque valeur observée Y et la valeur vraie

)! , interviennent parce que (1) de nombreuses variables explicatives dont les effets sont
mais inobservable, donnée par la courbe de régression. Ces termes d’erreurs désignée par

faibles et irréguliers ne figurent pas dans l’équation linéaire exacte (1.1), (2) la mesure de '
peut être entachée d’erreur, (3) le comportement humain introduit un élément de variabilité
intrinsèque.

Formuler la relation générale entre la consommation, ´, et le revenu disponible, µ, (a) sous une
Exercice :

part des valeurs observées de ´ ne donnent des points situés exactement en ligne droite.
forme linéaire exacte, (b) sous une forme aléatoire, (c) pourquoi peut on s’attendre à ce que la plus

a) La relation exacte, déterministe, entre les dépenses globales de consommation, Y, et le

'! = (! + 
revenu disponible global, X, peut être écrite sous la forme suivante :

constantes inconnues appelée paramètres. Le paramètre  représente l’ordonnée à l’origine,


Où, selon le type d’analyse, désigne une année ou une unité économique, a et b sont des

tandis que le paramètre  mesure ¶¸ , c'est-à-dire, ici dans le contexte du problème, mesure
¶·

correspondante à la relation linéaire générale (1.1), il faut estimer les valeurs de  et  ; ces
la propension marginale à consommer (PMC). Pour obtenir la relation linéaire

valeurs estimés s’écrivent ; et = et se lisent  chapeau, et  chapeau.


b) On peut rendre aléatoire la relation linéaire exacte (1.1) en lui adjoignant un terme d’erreur

'! = (! +  + )!
non observable :

c) Divers raison empêchent la plupart des valeurs observées de ' d’appartenir exactement à
l’ensemble des ordonnées d’une droite : (1) bien qu’on suppose que la consommation '

16
Introduction à l’Econométrie

dépende avant tout du revenu disponible (, de nombreuses autres variables -omises ici-
peuvent intervenir, qui n’ont sur ' qu’un effet faible ou irrégulier (par contre, si l’effet de

entre ' et ( à titre de variable explicatives supplémentaires, ce qui exigerait de recourir à un


certaines d’entre elles était significatif et régulier, il faudrait les introduire dans la relation

modèle de régression multiple. (2) des erreurs sont susceptibles de modifier la mesure de '.

d’ordinaire, des circonstances identiques, différentes valeurs de ' pour une même valeur de
(3) le comportement humain a en lui-même un aspect aléatoire, de sorte qu’on observera

(.

Exercice :
Formuler les cinq hypothèses sur lesquelles repose le modèle classique de régression linaire
simple et donner une explication intuitive de la signification et de la nécessité de chacune ?

terme d’erreur ) suit une loi de distribution normale. En conséquence, ´ et la distribution


1. Première hypothèse du modèle classique de régression linaire simple (modèle MCO) : le

d’échantillonnage des paramètres de la régression suivent aussi une loi normale et il est
possible d’effectuer des tests de signification sur les paramètres.
2. Seconde hypothèse : le terme d’erreur est d’espérance mathématique ou de moyenne

>()! ) = 0
nulle :

En raison de cette hypothèse, l’équation (1.1) fournit la valeur moyenne de '. En effet, dans
la mesure où l’on dispose que la valeur de ( dans l’équation (1.1) varie au-delà de sa
moyenne suivant que ) est plus grand ou plus petit de zéro. Puisque la valeur moyenne de
) est nulle par hypothèse, l’équation (1.1) donne bien la valeur moyenne de '.

tous les valeurs de (. autrement dit :


3. Troisième hypothèse : La variance du terme d’erreur est constante à chaque période et pour

>(), )² = @ ²
L’hypothèse signifie que chaque observation est également sûre (les variables sont observée
sans erreur) : il en résulte que les estimateurs des paramètres de la régression sont efficaces
et que les tests les concernant ne présentent pas de biais.

)~d(0, @? )
On peut résumer ces trois hypothèses sur le terme d’erreur par l’expression :

4. Quatrième hypothèse : Les erreurs relatives à deux observations différentes quelconques ou

>]), , )A ^ = 0
`) ≠ B; , B = 1,2, … . , C
à deux périodes quelconques sont indépendantes entre elles. Autrement dit,

La valeur moyenne de ' dépend donc seulement de ( et non de ), d’où, une fois encore,
l’efficacité des estimateurs des paramètres et l’absence du biais dans les tests de
signification qui s’y rattachent.
5. Cinquième hypothèse : La variable explicative est une variable certaine. En d’autres termes,
elle prend des valeurs fixes qui peuvent se retrouver en prenant l’échantillonnage, de sorte

>((! , )! ) = 0
qu’elle est sans corrélation avec le terme d’erreur :

Cette dernière hypothèse permet de simplifier l’analyse.

17
Introduction à l’Econométrie

Exercices résolus : Ajustement par la méthode de moindre carrée ordinaire

Exercice :

meilleure droite d’ajustement par un échantillon d’observation µ´ ? (b) Pourquoi choisir les écarts
(a) En quel sens la méthode dite des moindres carrées ordinaire (MCO), permet-elle d’estimer la

verticaux ? (c) Pourquoi ne pas prendre simplement la somme des carrées sans les porter au
carré ? (d) Pourquoi ne pas prendre la somme des valeurs absolues des écarts ?

a) Une droite ajuste les données (les observations de l’échantillon (') au sens des moindres
carrées lorsque, sur un graphe de dispersion, la somme des distances verticales entre les
points observés et la droite est minimale.

changements de ', lequel est mesuré sur l’axe vertical.


b) On utilise les écarts verticaux parce qu’on s’efforce d’expliquer ou de prédire les

opposés s’éliminent, de sorte que la somme totale est nulle (voir ∑ ! dans le tableau (1.3)) :
c) Si l’on somme simplement les écarts, deux écarts de même valeur absolue mais de signes

la méthode serait inapplicable.


d) On pourrait éviter la difficulté précédente en prenant la somme des valeurs absolues des
écarts. On préfère toutefois d’utiliser la somme des écarts quadratique de manière à
défavoriser relativement les grands écarts par rapport au petits (voir le théorème dit de
Gauss-Markov).

(a) Quelle est la différence entre les deux couples de termes (», ¼) et (» ¨) ? (b) quelle est la
G, ¼
Exercice

différence entre ½6 et –6 ? (c) Ecrire les équations exprimant les deux relations, vraie et estimée,
entre µ et ´ ? (d) Ecrire les deux équations des droites correspondantes aux deux régressions,
vraie et estimée, de ´ par rapport à µ ?

a) (, ) sont les paramètres de la régression linéaire vraie mais inconnue de ' par rapport
à ( ; (;, =) sont les paramètres de la régression linéaire estimée.
b) )! est le terme d’erreur ou terme aléatoire dans la relations vraie mais inconnue de ' par
rapport à ( ; le terme ! est le résidu calculable, défini par la différence entre chaque valeur
observée 3;! et la valeur ajustée 3! qui lui correspond dans la relation estimée entre ( et '.
c) Les deux relations, vraie et estimée, entre ( et ', ont respectivement pour équation :
3! =  ! +  + )!
3! =  ! +  + !
d) Les deux régressions, vraie et estimée, de Y par rapport à X ont, quant à elles,

>(3! ) =  ! + 
respectivement pour équation :

3;! = ; ! + =

Exercice

pays pendant douze années. (a) déterminer la valeur de » ¨ ? (b) tracer la droite de régression?
G et ¼
Le tableau suivant trace la relation entre la consommation globale et le revenu disponible dans un

G et ¼
(c) calculer les valeurs des paramètres » ¨ en utilisant les valeurs centrée de 8 et 7 (´ = 7 − 7 ˜,
˜) ?
et µ = 8 − 8

18
Introduction à l’Econométrie

a) Le tableau suivant fournit les résultats des calculs nécessaires pour déterminer ; et = .
¾ 7— 8— 8— 7— 8— ² ˜
´ — = 7— − 7 ˜
µ— = 8— − 8 µ— ´ — µ— ²
1 102 114 11628 12996 -25 -31 775 961
2 106 118 12508 13924 -21 -27 567 729
3 108 126 13608 15876 -19 -19 361 361
4 110 130 14300 16900 -17 -15 255 225
5 122 136 16592 18496 -5 -9 45 81
6 124 140 17360 19600 -3 -5 15 25
7 128 148 18944 21904 1 3 3 9
8 130 156 20280 24336 3 11 33 121
9 142 160 22720 25600 15 15 225 225
10 148 164 24272 26896 21 19 399 361
11 150 170 25500 28900 23 25 575 625
12 154 178 27412 31684 27 33 891 1089
1524 1740 225124 257112 4144 4812

Minimiser ∑ ! ² revient à calculer : (voir les colonnes 4 et 5)


127 145

∑ , 3, −  ̅ 3E 225124 − (12 × 127 × 145)


; = = ≈ 0,86
∑ , ² −  ̅ ² 257112 − (12 × 145? )

= = 3E −  ̅ = 127 − 0,86 × 145 = 2,13

3;, = ; ! + = = 0,87 , + 2,13 = 2,13 + 0,87 ,

évidement de disposer de deux points de cette droite : par exemple quand , = 114,
b) Pour définir complètement la droite de régression correspondant à cette équation, il suffit

3, = 2,13 + (0,86 × 114) = 100,34 ; et quand , = 178, 3, = 2,13 + (0,86 ∗ 178) =


155,38. La droite de régression pour la consommation est tracée sur la figure ci-dessous,
laquelle on peut dire qu’elle représente le meilleur ajustement des observations constituant
l’échantillon consommation – revenu disponible.
200
Revenu disponible

150
100
50
0
0 50 100 150 200
Consommation globale

c) Calcul des valeurs des paramètres ; et = à partir des valeurs centrée de et 3 : les colonnes

∑ (, ', 4144
6, 7, 8 et 9, fournissent les calculs nécessaires pour calculer les paramètres du modèle.
Une autre relation (1.8) de  sur la base des
; = = ≈ 0,86
valeurs centrée de et de 3 (sera utilisée ∑ (, ² 4812
= = 3E −  ̅ = 127 − 0.86 × 145 = 2,13
3;, = ; , + = = 0,87 , + 2,13 = 2,13 + 0,87 ,
dans la régression multiple

G¿ ?
On considère les résultats le l’exercice précédent, (a) indiquer la signification de l’estimateur »
Exercice

¨ ? (c) déterminer l’élasticité-revenu de la consommation ?


(b) celle de ¼

19
Introduction à l’Econométrie

a) L’estimateur = = 2,13 représente la valeur de la consommation globale, en millions de

de régression sur le graphique. Le fait que = > 0 confirme les considérations théoriques.
dirhams, lorsque le revenu disponible est nul ; c’est aussi l’ordonnée à l’origine de la droite

b) L’estimateur ; = ≈ 0,86 donne la pente de la droite de régression estimée. Il mesure la


ÀJ
ÀH

une variation unitaire du revenu disponible. Ici encore, le fait que 0 < ; < 1 corrobore les
proportion marginale à consommer, PMC, c’est-à-dire la variation de la consommation pour

c) L’élasticité-revenu de la consommation, Á, mesure la variation relative de la consommation


anticipations théoriques.

change d’ordinaire en chaque point ((, ') de la courbe concernée, on définit une élasticité
rapportée à la variation relative du revenu disponible qui l’a provoquée. Comme l’élasticité

̅
moyenne :

Á = ;
3E
Dans ce cas traité, et d’après les données du tableau précédent : Á = ; JE = 0,86 #?O = 0,98
H̅ #®N

On notera qu’à la différence de la pente, l’élasticité est mesurée par un nombre pur,
indépendant des unités utilisées.

20
Introduction à l’Econométrie

Exercices résolus : Tests de signification pour les paramètres estimés

¨) ? (c) ûG ² et è ² ?
G ) et Ä»³(¼
Définir (a) ½ ² et ò ? (b) Ä»³(»
Exercice :
¼

a) @ ² est la variance du terme d’erreur dans la relation vraie entre ( et '. par contre
² = @; ² = est la variance résiduelle et fournit une estimation sans biais de @ ², lequel
∑ ¡I ²
K"Å
est inconnu. 5 étant le nombre de paramètres estimés : 5 = 2 dans le cas de la régression
simple. Par conséquent, C − 5 = C − 2 appelé nombre de degrés de liberté.
b) a (;) = ∑(H Ž a ]=^ = @ ² . il est nécessaire de connaitre les
 ² ∑ HI ²
I "H̅ )² K ∑(HI "H̅ )²
variances de ; et = (ou leurs estimations) pour tester les hypothèses sur ces deux
tandis que

paramètres et pour construire les intervalles de confiances correspondants.


c) e; ² = × ∑(H et f= ² = × K ∑(H I"H̅ )² sont les écarts types respectifs de ; e
∑ ¡I ² # ∑ ¡I ² ∑H ²
K"Å I "H̅ )² K"Å
d) t =, lesquelles sont connues puisque ∑ ! ² est connue.
I

e; = Œe; ² et f= = Œf= ² sont respectivement les écarts types respectifs de ; et = : on les
appelle erreurs standard ou erreur types.

Exercice

consommation globale et le revenu disponible. Déterminer (a) ò , (b) ûG ² et ûG , (c) ü¨ ² et ü¨ ?
En reprend les observations consignées dans le tableau précédent qui trace la relation entre la

pour déterminer ². Les valeurs de y, viennent de l’équation de régression établie précédemment.
Le tableau suivant, extension du tableau précédent, rassemble les résultats des calculs nécessaires

¾ 7— 8— 8— 7— 8— ² G
7 –— –— ² (8— − 8˜)²
1 102 114 11628 12996 100,30 1,70 2,88 961
2 106 118 12508 13924 103,75 2,25 5,07 729
3 108 126 13608 15876 110,64 -2,64 6,96 361
4 110 130 14300 16900 114,08 -4,08 16,67 225
5 122 136 16592 18496 119,25 2,75 7,57 81
6 124 140 17360 19600 122,69 1,31 1,71 25
7 128 148 18944 21904 129,58 -1,58 2,51 9
8 130 156 20280 24336 136,47 -6,47 41,90 121
9 142 160 22720 25600 139,92 2,08 4,34 225
10 148 164 24272 26896 143,36 4,64 21,51 361
11 150 170 25500 28900 148,53 1,47 2,16 625
12 154 178 27412 31684 155,42 -1,42 2,01 1089
1524 1740 225124 257112 0,00 115,27 4812

² = @; = @; = = = 11,52752 ≈ 11,53


∑ ¡Ç ² ##N,?O
127 145

£"Å #?"?
a)

f= ² = @; × £ ∑(H Ç"H̅ )² = × £ ∑(H Ç"H̅ )² = 11,53 × #?×®M#? ≈ 51,32


∑H ² ∑ ¡Ç ² ∑H ² ?NO##?
Ç £"Å Ç
b)

21
Introduction à l’Econométrie

Par la suite : f= = Œe; ² = Œ51,32 ≈ 7.23

s…?; = ∑(Ê = ≈ 0,0024



È ##,NP
E )Ì
Ë "Ê ®M#?
c)

e; = Œe; = Œ0,0024 ≈ 0,05

Dans le cas du problème précédent, tester au seuil de signification de 5% pour (a) Í et (b) Î ?
Exercice

¥f=¥
= = = ≈ 0,29
|žeŸe é!Ÿ¡| |?,#P|
a) f= œ¢£ é¤eŸ!"!Jž¡ œÏ̈ O,?P
Cette valeur de f= est d’après la table de Student, inférieur à la valeur tabulée = 2,228 au
seuil de 5% (test bilatéral) et pour a = 10 : il faut conclure que f= n’est pas statistiquement
signifiant au seuil de 5% ; autrement dit, on ne peut rejeter l’hypothèse Ð- suivant laquelle
=0
= œ¢£ é¤eŸ!"!Jž¡ = = ≈ 17,2
|žeŸe é!Ÿ¡| |e;| |-,ML|
b) e; œG -,-N

ne peut rejeter l’hypothèse H# , suivant laquelle a ≠ 0.


Par conséquent, a est statistiquement signifiant au seuil de 5% (et aussi au seuil de 1%) : on

Dans le cas du même problème, établir les intervalles de confiances à 95% pour (a) Í et (b) Î ?
Exercice

a) L’intervalle de confiance à 95%, dans le cas de b est donné par :

 = = ± 2,228 × f= = 2,13 ± (2,228 × 7,23) = 2,13 ± 16,10

Par conséquent  est compris entre -13,97 et 18,23 au seuil de confiance de 95%. La largeur
de cette intervalle, qui lui ôte tout intérêt, reflète que = n’a pas de signification statistique.

b)  = ; ± 2,228 × e; = 0,86 ± (2,228 × 0,05) = 0,86 ± 0,11

 est donc compris entre 0,75 et 9,97 (0,75 <  < 9,97) au seuil de confiance de 95%.

22
Introduction à l’Econométrie

Exercices résolus : Test d’efficacité d’ajustement et coefficient de corrélation

(a) Définir le ²² (b) que mesure le coefficient de corrélation ? (c) quel est son intervalle de
Exercice :

variation ? (d) quel rapport existe-t-il entre corrélation et régression ?

a) Par définition le coefficient de détermination, +², est la proportion de la variabilité totale de


' «expliquée» par la régression de ' par rapport à (. +² est une grandeur sans dimension,
indépendante de toute unité, et 0 ≤ +² ≤ 1 parce que 0 ≤ ©*+ ≤ ©*C. +² = 0 lorsque, par

horizontale ' = 'E. +² = 1 quant tous les points de l’échantillon appartiennent à la droite de
exemple, tous les points représentatifs de l’échantillonnage se trouvent sur la droite

régression estimée, ce qui est appelé un ajustement parfait.


b) Le coefficient de corrélation donne une mesure de la liaison entre deux variables ou
davantage. Dans le cas où l’on envisage que deux variable, le coefficient de la corrélation
linéaire simple qui peut exister entre elle, pour l’ensemble des observations d’un échantillon,

= Œ+² = Ô∑(‡­"‡˜)²
∑(‡ ˜)²
G "‡
­
s’écrit :
L’intervalle de variation de +² détermine évidement celui de −1 ≤ ≤ 1. Que soit négatif
est l’indication que ( et ' varient dans le sens inverse : s’agissant d’une marchandise, tel est
le cas, par exemple, de la quantité demandée et du prix. Par contre > 0 signifie que ( et '
varient dans le même sens, comme l’offre et le prix d’une marchandise. = 1 et = −1
dénotent une corrélation parfaite, soit positive, soit négative : toutes les observations de
l’échantillon sont représentées par des points alignés sur une même droite, à pente

Mais plus se rapproche de ±1, plus forte est la liaison linéaire positive ou négative entre (
représentativement positive ou négative. Ces deux éventualités se rencontrent rarement.

et '. on notera que le signe de est toujours celui de ;. Un coefficient de corrélation nul
indique qu’il n’existe entre ( et ' aucune relation linéaire quelle qu’elle soit ; autrement dit,
( et ' ont tendance à varier de façon indépendante l’un de l’autre. Par exemple, si tous les

existe entre ( et ' une relation non linéaire parfaite et une relation linéaire nulle de sorte
points représentatifs d’un échantillon appartiennent exactement à une circonférence, il

= 0.
Un modèle de régression suppose une dépendance causale entre la variable indépendante (
et la variable dépendante '. La corrélation, en revanche, n’implique aucune notion de

deux variables. Ainsi, par exemple, ( et ' peuvent être étroitement corrélés par l’effet d’une
causalité ou de dépendance, mais concerne seulement le mode et la force de la liaison entre

troisième variable qui agit séparément et fortement sur chacun d’eux. Au regard de la
régression, la corrélation n’offre donc qu’un instrument d’analyse sensiblement moins
puisant.

Exercice :
On considère l’équation de la régression estimée dans l’exercice précédent à propos de la
consommation, déterminer R² en utilisant (a) l’équation de ²² = ∑(”“ "”E)² (b) l’équation ²² = W −
∑(”; "”E)²
“
∑ –— ²
∑(”Õ "”E)²
?

a) Nous avons vu dans l’exercice précédent que :

23
Introduction à l’Econométrie

¾ 7— 8— 8— 7— 8— ² G
7 –— –— ² (8— − ˜8)² G— − 7
(7 ˜)² (7— − 7 ˜)(7— − 7
˜)² (8— − 8 ˜)
1 102 114 11628 12996 100,30 1,70 2,88 961 712,71 625 775
2 106 118 12508 13924 103,75 2,25 5,07 729 540,65 441 567
3 108 126 13608 15876 110,64 -2,64 6,96 361 267,73 361 361
4 110 130 14300 16900 114,08 -4,08 16,67 225 166,87 289 255
5 122 136 16592 18496 119,25 2,75 7,57 81 60,07 25 45
6 124 140 17360 19600 122,69 1,31 1,71 25 18,54 9 15
7 128 148 18944 21904 129,58 -1,58 2,51 9 6,67 1 3
8 130 156 20280 24336 136,47 -6,47 41,90 121 89,74 9 33
9 142 160 22720 25600 139,92 2,08 4,34 225 166,87 225 225
10 148 164 24272 26896 143,36 4,64 21,51 361 267,73 441 399
11 150 170 25500 28900 148,53 1,47 2,16 625 463,52 529 575
12 154 178 27412 31684 155,42 -1,42 2,01 1089 807,64 729 891
1524 1740 225124 257112 0,00 115,27 4812 3569 3684 4144
127 145

∑(3;, − 3E)² 3569


+² = = ≈ 0,9687 = 96,87%
∑(3, − 3E)² 3684
+² = 1 − ∑(J "J =1− ≈ 0,9687 = 96,87%
Ç ∑¡ ² ##N,?O
E)²
Ç PLM®
b)
C’est vraiment la même valeur de (a).

Toujours dans le même problème, déterminer ³ en utilisant les expressions suivantes :


Exercice :

(b) =
∑(HÇ "H̅ )(JÇ "JE)
(a) = Œ+² (c) = Ô; ×
∑(HÇ "H̅ )(JÇ "JE)
Œ∑(HÇ "H̅ )²×Œ∑(JÇ "JE)² ∑(JÇ "JE)²

= Œ+² = √0,9687 = 0,9842 est positif puisque ; > 0


a) Le tableau ci-dessus fournit les calculs nécessaires :

∑( , − ̅ )(3, − 3E) 4144


b) Aussi :

= = = 0,9842
Œ∑( , − ̅ )² × Œ∑(3, − 3E)² √4812 × √3684
c) Et
∑( , − ̅ )(3, − 3E) 0,86 × 4144
= ª; × =ª = 0,9836
∑(3, − 3E)² 3684

24
Introduction à l’Econométrie

Exercices résolus : Propriétés des estimations par les moindres carrées ordinaires

Exercice :
Que faut-il entendre par « estimateur sans biais » ? Comment définir le biais ?

Un estimateur est dit : centré ou sans biais, si la moyenne de sa distribution d’échantillonnage est

l’estimateur. Si ; est estimateur du paramètre vrai de . L’absence de biais signifie donc que
égale au paramètre vrai. La moyenne de la distribution est égale à l’espérance mathématique de

>(;) = . Le biais est alors défini comme la différence entre l’espérance mathématique de
l’estimateur et la valeur vraie du paramètre :    = >(;) − . On notera que l’absence du biais ne
signifie pas que ; =  , mais que, si l’on répète l’échantillonnage aléatoire, on obtiendra, en

fournisse une valeur de ; proche de la moyenne de la distribution d’échantillonnage de l’estimateur.


moyenne, l’estimation correcte. On espère dons que l’échantillon effectivement sélectionné

Exercice :
Que faut-il entendre par « le meilleur estimateur sans biais » (estimateur efficace) ? Quelle est
l’importance de cet estimateur ?

Parmi tous les estimateurs sans biais, le meilleur qui est dit aussi efficace est celui dont la variance
est minimale. C’est l’estimateur centré qui présente la distribution la plus compacte, la moins
dispersée. Cette caractéristique est fort importante car le chercheur qui examine une population sera
ainsi mieux assurer que la valeur prise par l’estimateur est voisine à la valeur vraie du paramètre qu’il
doit estimer. Il revient au même de dire qu’un estimateur efficace présente le plus petit intervalle de
confiance et qu’il a donc plus de chance d’être statistiquement signifiant qu’aucun autre estimateur.
On notera toutefois que la variance minimale n’a pas grand intérêt en elle-même, à moins d’être
couplé avec absence de biais.

Exercice :
Pourquoi des estimateurs MCO sont-ils fréquemment utilisés ? Sont-ils supérieur à tout autre
estimateur ?

L’intérêt des estimateurs MCO, et qui rend compte de leur large usage, est qu’ils sont BLUE (best
linear unbiaised estimators) : ce sont des estimateurs efficaces dans la classe des estimateurs
linéaires ; autrement dit, parmi tous les estimateurs linéaires sans biais, ils présentent la plus faible
variance. Les propriétés BLUE des estimateurs MCO déroule du théorème de Gauss-Markov.

Exercice :
Que faut-il entendre par « convergence » ?

Pour être convergent en probabilité, un estimateur doit satisfaire à deux conditions (1) lorsque la
taille de l’échantillon augmente indéfiniment, la valeur de l’estimateur tend vers la valeur vrai du
paramètre (il s’agit d’une probabilité asymptotique que l’on peut appeler le centrage asymptotique
de l’estimateur). (2) lorsque la taille de l’échantillon devient infinie, la distribution de
l’échantillonnage de l’estimateur se comprime pour devenir, à la limite un segment de droite
verticale de hauteur 1 et d’abscisse a (valeur vraie du paramètre). On emploi cette propriété
asymptotique de convergences des grands échantillons seulement si l’on ne peut obtenir de petits
échantillons BLUE ou des estimateurs EQM minimaux.

25
Introduction à l’Econométrie

Problèmes supplémentaire : le modèle de régression simple

Exercice :

On cherche s’il existe une relation linéaire entre le revenu réel par tête dans les pays développés et
leur population agricole active. Le tableau suivant rassemble les données correspondantes pou un

régression de ´— par rapport à µ— . (b) Tester la signification statistique des paramètres, au seuil de
échantillon de 15 pays développés, pendant une année donnée. (a) Estimer l’équation de

signification de 5%. (c) Trouver le coefficient de détermination (d) présenter sous forme habituelle
les résultats obtenus.

',
Pays n° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

(,
6 8 8 7 7 12 9 8 9 10 10 11 9 10 11

Données du revenu réel ', sont arrondis au millier de dollars American


9 10 8 7 10 4 5 5 6 8 7 4 9 5 8

(, Est en pourcentage de la population active totale

Le tableau suivant présente les résultats des différents calculs nécessaires pour répondre aux
questions posées :
Pays n° 7— 8— 8— 7— 8— ² G
7 –— ² (8— − 8˜)² (7— − 7˜)²
1 6 9 54 81 8,07 4,27 4 9
2 8 10 80 100 7,60 0,16 9 1
3 8 8 64 64 8,53 0,28 1 1
4 7 7 49 49 9,00 4,00 0 4
5 7 10 70 100 7,60 0,36 9 4
6 12 4 48 16 10,40 2,56 9 9
7 9 5 45 25 9,93 0,87 4 0
8 8 5 40 25 9,93 3,74 4 1
9 9 6 54 36 9,47 0,22 1 0
10 10 8 80 64 8,53 2,15 1 1
11 10 7 70 49 9,00 1,00 0 1
12 11 4 44 16 10,40 0,36 9 4
13 9 9 81 81 8,07 0,87 4 0
14 10 5 50 25 9,93 0,00 4 1
15 11 8 88 64 8,53 6,08 1 4
135 105 917 795 26,93 60 40
9 7

(a) ; = et = = 3E −  ̅
∑ HÇ JÇ "£H̅ JE
Relations de base Résultats

∑ HÇ ²"£H̅ ²
; = −0,47 ; = = 12,27

² = 2,07 ; s…?; = 0,03 ; f= ² = 1,83 ; = =


|"-,®O|
(b) ² = ; s…?; = ∑(Ê "ÊE)Ì ;
∑ ¡Ç ² œ²
£"Å e; -,#M
Ë

2,51 ; = = 9,07 > 2,16


|#?,?O|
f= ² = ² × £ ∑(H Ç"H̅ )² ; =
∑H ² |e;|
e; f= #,PN
Ç œG
;
¥f=¥
f= = œÏ̈ Les deux paramètres sont significativement différents de

; = Œ+² +² = 0,33 ; = 0,57


zéro au seuil de 5%.
(c) +² = 1 − ∑(‡ "‡
Ç ∑¡ ²
˜)² Ë

3;, = ; , + = +² =? =? 3;, = ; , + = +² = 0,33 = 0,57


( e; ) ? ( f= ) ? (2,51 ) (9,07)
(d)

26
Introduction à l’Econométrie

Exercice : La prévision des ventes du produit «Jawal»

C’est en fonction des prévisions de ventes que l’entreprise détermine la production, les achats et les
investissements nécessaires. La prévision des ventes conditionne l’ensemble de la construction
budgétaire. Elle est généralement mise à œuvre à partir de modèles de prévisions reposant sur des
méthodes statistiques. Ces méthodes ont pour objet : De mesurer les phénomènes d’évolution des
ventes à moyen terme (tendance ou «trend») et l’estimation de la tendance à l’aide d’un ajustement
linéaire.

Les méthodes basées sur l’ajustement linéaire nécessitent une:

1. Représentation graphique de la série afin d’observer la tendance.


2. Confirmation de l’évolution linéaire par le calcul du coefficient de corrélation linéaire.
3. Identification de la relation par le calcul des paramètres du modèle par la méthode MCO.

Vous êtes analyste chez une entreprise de télécom, et on vous pose les questions suivantes et vous
disposer d’une plage de données, votre savoir faire pour construire votre modèle et un logiciel de
bureautique pour faire des calculs, donc :

1. Les affiches publicitaires dans la presse ont-elles un impact sur les ventes du produit
«Jawal»?
2. Les quantités vendues dépendent-elles du nombre d’affiches publicitaires ?

Au cours des années écoulées l’entreprise a relevé les données suivantes (en millions de dirhams):

Années Dépenses publicitaires Chiffre d’affaires


2003 5 560
2004 3,4 500
2005 3,6 510
2006 5,6 584
2007 4,4 530
2008 4 520
2009 3,8 524
2010 4,4 560
2011 6 570
2012 6,1 592

600 Le graphique illustre une relation


580
linéaire entre le chiffre d’affaire et les
dépenses publicitaires du produit
Chiffre d’affaires

560
« Jawal », la tendance est haussière
540 donne un premier aperçu de la relation,
520
il parait que l’évolution des dépenses
publicitaires suivent l’évolution du
500
chiffre d’affaire de l’entreprise (on
480 prévoie une évolution des deux variables
0 2 4 6 8 à un sens unique.
Dépenses publicitaires

27
Introduction à l’Econométrie

les dépenses publicitaire et le chiffre d’affaire de l’entreprise, '! = (() , avec (! sont les dépenses
Nous pouvons maintenant construire notre modèle théorique : on veut rechercher la relation entre

publicitaires et '! représente le chiffre d’affaire de l’entreprise.


', = (, + 

', = (, +  + ),
Puis notre spécification économétrique est sous la forme :

On dispose du modèle de régression linéaire, nous utilisons la méthode des moindres carrées
ordinaires pour avoir un meilleur ajustement linéaire des données par une droite de régression qui

3G× = a; , + =
prendra la forme de :

Notre travail sera consacré en premier lieu à la recherche des paramètres a; et b= , et en deuxième
lieu, valider notre modèle à partir des tests d’hypothèses sur les paramètres estimés et à calculer le
coefficient de détermination qui permettra de juger la qualité de la régression. Mais avant, on calcul

G
le coefficient de corrélation.
Années n 7— 8— 8— 7— 8— ² 7 –— ² ˜)²
(8— − 8 ˜)²
(7— − 7
2003 1 560 5 2800 25,00 556,30 13,67 0,137 225
2004 2 500 3,4 1700 11,56 507,43 55,14 1,513 2025
2005 3 510 3,6 1836 12,96 513,54 12,50 1,061 1225
2006 4 584 5,6 3270 31,36 574,63 87,76 0,941 1521
2007 5 530 4,4 2332 19,36 537,97 63,58 0,053 225
2008 6 520 4 2080 16,00 525,75 33,11 0,397 625
2009 7 524 3,8 1991 14,44 519,64 18,97 0,689 441
2010 8 560 4,4 2464 19,36 537,97 485,15 0,053 225
2011 9 570 6 3420 36,00 586,85 283,96 1,877 625
2012 10 592 6,1 3611 37,21 589,91 4,38 2,161 2209
N = 10 5450 46,300 25505 223,25 1058,229 8,881 9346
545 4,630
La corrélation linéaire exprime l’intensité de la liaison entre deux variables : le chiffre d’affaires en
fonction des dépenses publicitaires.
Le coefficient de corrélation ( ) est un indicateur de cette relation. Il est déterminé de la façon

_`a( , 3) ∑ , 3, −  ̅ 3E ∑( , − ̅ ) × (3, − 3E)


suivante :

= = = = 0,942
@H @J ∑ , ² −  ̅ ² × ∑ 3, ² − 3E ² Œ∑( , − ̅ )² × Œ∑(3, − 3E)²
Ce qui confirme une forte corrélation entre les dépenses publicitaires et le chiffre d’affaires.
Lorsque la corrélation linéaire est significative, on peut estimer notre relation économétrique.

D’après le tableau des calculs, on peut calculer a;


et b= , nous avons donc :
600

3G× = 30,55 , + 403,56


y = 30,548x + 403,56
580
R² = 0,8868
Chiffre d’affaires

Et (7,9) (22,13) R² = 0,8868 560

540
La droite obtenue permet d’effectuer des
prévisions. 520

 + 1 pour des dépenses publicitaires de 6.3


Par exemple, le chiffre d’affaires prévisibles
500

millions de dirhams, serait de 596 Millions de 480


dirhams. 0 2 4 6 8
Dépenses publicitaires

28
Introduction à l’Econométrie

Exercice : L’analyse des ventes du carburant

Supposant que vous être recruté en tant qu’analyste au sein d’une compagnie de distribution du
carburant opérant dans la région de Rabat, et elle prévoit investir en termes d’augmentation des
points de vente dans d’autre région que Rabat. Le tableau suivant trace l’évolution pendant un mois
des ventes (en milliers de Dirhams) en fonction de l’évolution du nombre des points de vente du

3
carburant (nombre de station d’essence).
2000
12 2
48 4 1500
192 6
24 3 1000

768 8
500
96 5
96 5 0
384 7 0 2 4 6 8 10
1536 9
On vous demande d’analyser d’abord la courbe tirée du croisement de variables à partir du tableau,
et ensuite proposer une modélisation linéaire et une estimation des ventes si le nombre des stations
égale à 12.
La représentation graphique de l’évolution des ventes nous renseigne que la relation entre les deux

', = 20 HÇ
variables peut avoir la forme d’une courbe exponentielle, de la forme :

Dans ce cas on ramène la tendance exponentielle à la forme linéaire (logarithme népérien):

43, = (40) , + (42)

On procède à un changement de variable de sorte que : ', = 43, ,  = (40) et  = (4) : on aura

3, =  , + 
la forme :

3, =  , +  + ),
Puis notre spécification économétrique est sous la forme :

On calcul les paramètres ; et = par la méthode des moindres carrées ordinaires :


43 8,000
2,485 2
y = 0,6931x + 1,0986
6,000 R² = 1
3,871 4
5,257 6 4,000
3,178 3
6,644 8 2,000
4,564 5
0,000
4,564 5
0 2 4 6 8 10
5,951 7

La valeur de 0Ø et 2=: 0Ø =  e; =  -,LQP# ≈ 2 et 2= =  f =  #,-QML ≈ 3


=
7,337 9

Maintenant on peut prévoir les ventes pour trois de stations supplémentaires : = 12,
', = 20 HÇ = 3 × 2#? = 12281

29
Introduction à l’Econométrie

Le modèle de régression multiple


Définition et Ajustement par la méthode des moindres carrées ordinaires

variable dépendante ', et au moins deux variables indépendantes notées (Å (il s’agit donc d’un
L’analyse par régression multiple permet de tester les hypothèses portant sur la relation entre une

ensemble de variables exogènes, (# , (? , etc.). Cette analyse permet également d’effectuer des
prévisions. Le modèle de régression linéaire à plusieurs variables peut s’exprimer sous la forme :
Terme constant Variables explicatives (composante déterministe)

', = - + # (#, + …
Ù + Å (Å, + ),
Variable Endogène
(2.1)
Terme d’Erreur
composante

étant le nombre de variables exogènes, et varie selon les  individus.


Paramètres
aléatoire

Ce qui peut encore représenté par la forme matricielle :

', = (, + ), (2.2)

spécifient le modèle de régression simple : il n’existe pas de relation linéaire exacte entre les (Å ,
La multiplicité des variables exogènes conduit à ajouter une hypothèse nouvelle à celles qui

(absence de colinéarité).

On peut estimer les paramètres de l’équation (2.1) par les moindres carrées ordinaires (MCO) en
recherchant le minimum de la somme des résidus quadratiques :

minÚÛ ,ÚÜ ,..ÚÝ ∑ , ² (2.3)


Il en résulte des équations normales :

Ø = (( Þ ()"# (′'

Avec :

Ø-
Ø
Ø = à # ã

ßØÅ â

Exemple :
Le tableau (2.1) une extension du tableau (1.1) : il rapporte les effets d’un insecticide ajoutés à ceux
du fertilisant sur la production du Maïs. Les observations concernent également les mêmes années.
Dans le cas de la régression multiple il est difficile de mener les calculs avec plusieurs variables
explicatives. L’usage des logiciels spécialisés reste une solution très pratique.
Nous utilisons :

1. Excel pour faire le calcul des paramètres


2. La calculette pour faire le calcul manuellement (pour le cas de deux variables exogènes, les
calculs sont un peut abordable).
3. Le calcul matriciel

30
Introduction à l’Econométrie

1. Calcul en utilisant Excel (facile quelque soit le nombre k paramètres et de n observations)

Années ´— µW— µ[— Procédure Excel:

2. Indiquez les données pour la variable ', et pour les


2001 40 6 4 1. Outils  Utilitaire d’analyse  Régression linéaire

variable(s) (. Cochez les cases : Intitulé présent, Résidus,


2002 44 10 4
2003 46 12 5
2004 48 14 7 Courbes des résidus et Courbes de régression et faites OK.
2005 52 16 9
3. Les résultats seront affichés sur une feuille séparée.
2006 58 18 12
2007 60 22 14 NB : le cas ou « Utilitaire d’analyse » ne figurent pas dans l’anglet
2008 68 24 20 «outil», allez au : option Excel  Complément  allez au gérer
2009 74 26 21 complément  atteindre  choisir utilitaire d’analyse (analysis
2010 80 32 24 toolPak)  suivre les indications d’installation.
570 180 120
Les résultats sont les suivants :

Coefficients Erreur-type Statistique t Probabilité

(#,
Constante 31,9806714 1,63179572 19,5984528 2,2481E-07

(#,
0,65005086 0,25016126 2,59852729 0,0355012
1,10986775 0,26743364 4,1500679 0,00429473
Donc l’équation prend la forme suivante :

'=, = 31,98 + 0,65(#, + 1,11(?,

2. Calcul en utilisant le calcul simple (difficile si k>2 et ~∞)

Pour le calcul manuelle nous utilisons les valeurs centrée de 3, = ', − 'E , #, = (#, − (E et de
?, = (?, − (E, voir la relation (1.8), le tableau suivant résume les calculs nécessaires :

Années ¾ ´— µW— µ[— 7— 8W— 8[— 8W— 7 8[— 7 8W— 8[— 8W— ² 8[— ²
2001 1 40 6 4 -17 -12 -8 204 136 96 144 64
2002 2 44 10 4 -13 -8 -8 104 104 64 64 64
2003 3 46 12 5 -11 -6 -7 66 77 42 36 49
2004 4 48 14 7 -9 -4 -5 36 45 20 16 25
2005 5 52 16 9 -5 -2 -3 10 15 6 4 9
2006 6 58 18 12 1 0 0 0 0 0 0 0
2007 7 60 22 14 3 4 2 12 6 8 16 4
2008 8 68 24 20 11 6 8 66 88 48 36 64
2009 9 74 26 21 17 8 9 136 153 72 64 81
2010 10 80 32 24 23 14 12 322 276 168 196 144
10 570 180 120 956 900 524 576 504
57 18 12

(∑ # 3)]∑ ?² ^ − (∑ ? 3)(∑ # ? ) (956) × (504) − (900) × (524)


Ø# = = ≈ 0,65
]∑ #² ^]∑ ?² ^ − (∑ # ? )² (576) × (504) − (524)²

(∑ ? 3)]∑ #² ^ − (∑ # 3)(∑ # ? ) (900) × (576) − (956) × (524)


Ø? = = ≈ 1,11
]∑ #² ^]∑ ?² ^ − (∑ # ? )² (576) × (504) − (524)²

Ø- = ' − Ø# (E# − Ø? (E? ≈ 57 − (0,65) × 18 − (1,11) × 12 ≈ 31,98

31
Introduction à l’Econométrie

De sorte que : '=, = 31,98 + 0,65(#, + 1,11(?,

3. La recherche des paramètres en utilisant le calcul matriciel : (difficile si k> 2)

Notre modèle ', = (, + ), peut être écrit de la façon suivante :

40 16 4 )#
44 110 4 Ø ) ?
à46ã à112 5 ã # à )P ã
Ø
å ⋮ æ = å ⋮ ⋮ ⋮ æ ç? è + å ⋮ æ
74 12621 ØP )Q
ß80â ß13224â )
ß #- â

Il s’agit de calculer le vecteur des estimateurs Ø défini par l’égalité suivante :


des ', et (# , on vous laisse la peine
ØÅ = (( Þ ()"# (′'
Voir le tableau (1.3) pour le calcul

du calcul des valeurs de (?

 § (# § (?
à ã 10 180 120
(Þ( = å
å§ (# § (# ² § (# (? æ
æ = é 180 3816 2684 ê
Important à retenir

120 2684 1944


ߧ (? § (# (? § (? ² â

(( Þ ()"# =? Calculons d’abord  (( Þ () :

 (( Þ () = 10 × ](3816 × 1944) − (2684²)^ − 180](180 × 1944) − 322080^ + 120 × 25200


= 157280

La transposée de ( Þ ( est :

10 180 120
( Þ ( K = é180 3816 2684ê
120 2684 1944

La matrice inverse est alors : (( Þ ()"# = ë~‚ (¸ ì ¸) (0B (( Þ ())


#

La co-matrice appelée encore la matrice adjointe est calculée comme suit :

3816 2684 180 2684 180 3816


í î í î í î
2684 1944 120 1944 120 2684 + − +
à 180 120 10 120 10 180 ã
0B (( () = åí
Þ
î í î í îæ × é− + −ê
2684 1944 120 1944 120 2684
180 120 10 120 10 180 + − +
ßí3816 2684
î í
180 2684
î í
180 3816
îâ

1 1,363 −0,177 0,160


(( Þ ()"# = (0B (( Þ
()) = é −0,177 0,032 −0,033ê
det (( Þ () 0,160 −0,033 0,037

32
Introduction à l’Econométrie

§'
à ã 570
Aussi :

(Þ' = å
å§ '(#ææ = é 11216ê
7740
Important à

ߧ '(? â
retenir

Donc :

1,363 −0,177 0,160 570 570 31,98


ØÅ = (( Þ ()"# ( Þ ' = é−0,177 0,032 −0,033ê × é11216ê = é11216ê = é 0,65 ê
0,16 −0,033 0,037 7740 7740 1,11

De sorte que : '=, = 31,98 + 0,65(#, + 1,11(?,

L’estimation des paramètres à plusieurs variables explicatives nécessite bien l’assistance d’un
ordinateur.

Tests de signification pour les paramètres estimés (Test de Student)


Comme dans la régression simple, il faut déterminer les variances des estimateurs si l’on veut
évaluer, dans une régression multiple, la signification statistique des estimations de paramètres.

ð ]ØÅ ^ = @ ²(( Þ ()"#

Comme @ ² est inconnue, on utilise la variance résiduelle, ², à titre d’estimation sans biais de cette
grandeur :

);′); ∑ ,²
² = @; = @; = =
−5 −5

Où 5 représente le nombre de paramètres estimés.

L’estimation de sans biais est alors donnée par la formule :

Ú̈Ý ² = @; (( Þ ()"#

De sorte que Ú̈ ² fournit les erreurs types de l’estimation.

Exemple :
On teste la signification statistique des paramètres du modèle de l’exemple précédent. Il en résulte
des valeurs rassemblées dans le tableau (2.1) que,

);′); ∑ ,² ∑(', − '=, )² 13,67


Nous pouvons également calculer :

² = @; = @; = = = = = 1,95
−5 −5 −5 10 − 3

1,363 −0,177 0,160 2,663 −0,346 0,313


D’où :

Ú̈Ý ² = @; ²(( Þ ()"# = 1,95 é−0,177 0,032 −0,033ê = é−0,346 0,063 −0,065ê
0,16 −0,033 0,037 0,313 −0,065 0,072

Les écarts types Ú̈Ý des estimateurs ØÅ sont alors donnés par les racines carrées des éléments
diagonaux de cette matrice. Nous avons ainsi :

33
Introduction à l’Econométrie

Ú̈Û = Œ2,663 = 1,63

Ú̈Ü = Œ0,063 = 0,24

Ú̈Ì = Œ0,072 = 0,27

=
¥Ú̈Ý ¥
Par conséquent Ú̈Ý œñ̈
, alors on déduit :
Ý

¥Ø- ¥ 31,98 ¥Ø# ¥ 0,65 ¥Ø? ¥ 1,11


= = = = 19,6 = = = = 2,70 = = = = 4,15
- Ú̈Û
Ú̈Û 1,63 # Ú̈Ü
Ú̈Ü 0,24 ? Ú̈Ì
Ú̈Ì 0,27
Comme - , # , ? dépassent tous le œ!À¡£! = 2,635 pour  − 5 = 7 degrés de liberté au seuil de
signification de 5% . - , # , ? sont tous statistiquement signifiants au seuil de 0,05.

Le coefficient de détermination multiple, +², est défini par la proportion de la variabilité totale de '
Coefficient de détermination multiple

«expliquée» par la régression multiple de ' par rapport à (# et (? et, on peut le calculer à partir de
l’expression suivante :

©*> '=′' );′); ©*+


+² = = =1− =1−
©*C '′' '′' ©*C

«expliquée» = '=′' , pour une même variabilité totale, ©*C = '′', +² doit augmenter dans une
Comme il est vraisemblable que l’inclusion de nouvelles variables explicatives accroisse la part

l’influence linéaire) des variables additionnelles, on défini un +² corrigé, écrit +E ², qui tienne compte
régression multiple. Cette augmentation ne tenant qu’au nombre et non au pouvoir explicatif (à

de la diminution du nombre du degrés de liberté consécutive à l’introduction de nouvelles variables


indépendantes :

−1 ©*+ò
+E ² = 1 − (1 − + ? ) =1− −5
−5 ©*Cò
−1

Ou  représente le nombre d’observations et k, le nombre de paramètre estimés.

Calculons sur la base du tableau (2.1) le +² et le +E ².


Exemple :

suivantes : ©*C = ©*> + ©*+


Méthode : calculons le tableau d’ANOVA pour notre exemple, il s’agit de calculer les quantités

570
Avec : ©*> = Ø Þ ( Þ ' − 'E² = (30,98 0,65 1,11) × é11216ê − (10) × (57)? = 1620
7740

Et ©*C = ' Þ ' − 'E ? = 34124 − (10) × (57)? = 1634

©*+ = ©*C − ©*+ = 1634 − 1620 = 13,67

©*> 1620
+² = = = 0,992
©*C 1634

34
Introduction à l’Econométrie

Par conséquent : +E ? = 1 − (1 − + ? ) = 1 − (1 − 0,992) = 0,989 ≈ 98,9%


£"# #-"#
£"Å #-"P

Méthode : calcul direct

Nous avons : Ø Þ ( Þ ' = 34110,32 et );’); = ' Þ ' − Ø Þ ( Þ ' = 34124 − 34110,32 = 13,67

Et ² = 1,95 donc :

);’); 13,67
+? = 1 − =1− = 0,992
'Þ'− ' E ? 34124 − 10 × (57)?

−1 5 − 1 10 − 1 3−1
+E ? = × +? − = × 0,992 − = 0,989 ≈ 98,9%
−5  − 5 10 − 3 10 − 3

Test d’ensemble sur la signification de la régression


La signification globale de la régression peut être appréciée grâce au rapport de la variance

(distribution ô) avec 5 − 1 et  − 5 degrés de liberté,  étant le nombre d’observations et 5 le


expliquée et la variance inexpliquée. Celui-ci obéit à une loi de distribution de Ficher-Snedecor

nombre de paramètres estimés :

Si le rapport ô calculé dépasse la valeur tabulaire de ô pour le risque admis (c’est à dire pour le seuil
de signification donnée) en fonction des degrés de libertés 5 − 1 et  − 5, on accepte l’hypothèse
que les paramètres de la régression ne sont pas tous nuls et +² diffère significativement de zéro.

Exemple :

précédent, nous pouvons utiliser +² , de sorte que :


Pour tester au seuil de 5% la signification d’ensemble de la régression estimée dans l’exemple

+²ò 0,992ò
ôÅ"#;£"Å = ô?;O = 5−1 = 3 − 1 = 413,17
1 − +²ò 1 − 0,992ò
−5 10 − 3

Comme la valeur calculée de ô dépasse la valeur tabulaire ô = 4,74 pour le seuil de signification de

et que +² est significativement différent de zéro.


5% avec le couple de degrés de liberté (2 ; 7), nous admettons l’hypothèse que ne sont pas tous nuls

Coefficients de corrélation partielle


Considérons l’une des variables indépendantes du modèle. Le coefficient de corrélation partielle
mesure la corrélation nette entre la variable dépendante et cette variable indépendante après avoir

demeurent alors constantes. Par exemple ·¸Ü ,¸Ì est le coefficient de corrélation partielle entre ' et
exclu l’effet collectif des autres variables indépendantes dan le modèle : autrement dit, ces dernières

(# , après avoir éliminer l’effet de (? sur els deux variables ' et (# .


·¸Ü − ·¸Ì ¸Ü ¸Ì
·¸Ü ,¸Ì =
Ô1 − ¸Ü ¸Ì ² × Ô1 − ·¸Ü ²

Où ·¸Ü , ·¸Ì et ¸Ü ¸Ì représentent respectivement les coefficient de corrélation simple (ou d’ordre
zéro) entre ' et (# , ' et (? , (# et (? . les coefficients de corrélation partielle ont une valeur
appartenant à l’intervalle (−1, +1), borne comprises, comme les coefficients de corrélation simple.

35
Introduction à l’Econométrie

Ils ont le signe du paramètre estimé correspondant et servent à déterminer l’importance relative des
différentes variables explicatives dans une régression multiple.

36
Introduction à l’Econométrie

Résumé :

Le modèle de régression multiple

Relation économique ', = - + # (#, + ⋯ + Å (Å,

Spécification économétrique ', = - + # (#, + ⋯ + Å (Å, + ),

Ajustement linéaire ', = (, + );!


Hypothèses du
Régression Simple

minÚÛ ,ÚÜ ,..ÚÝ ∑ );, ²


+ absence de

3G! = Ø (,
colinéarité (pas de

entre les (,
relations linéaire Méthode des MCO Questions importantes :
1) Est-ce que l’ajustement est
«bon» dans sa globalité ?

Recherche des paramètres ØÅ = (( Þ ()"# (′'


2) Est-ce que les paramètres
sont significatifs ?
Propriétés 3) Tester l’absence de
colinéarité ?

Accepter si

¥ØÅ ¥ |
 é |
Réponse pour question 2 : Voir si ces paramètres sont « robustes» leurs valeurs si

= =
Ú̈Ý
Ú̈Ý ` é_ − 3

Voir leurs significations (tests sont supérieurs

e; inconnue
d’hypothèses) à 1.96 pour n>30

Problème qui se pose : (car @ est inconnue)


);′);
² = @; = @; =
Maintenant on
peut calculer : e;
−5
Solution : calcul de la variance
résiduelle et f= à partir des

Ú̈ ² = @; ²(( Þ ()"#


Réponse pour question 1 : Tester la qualité de la régression multiple calculs de

©*> '=′' );′); ©*+


Relations :
+² = = =1− =1−
©*C '′' '′' ©*C
0 ≤ +E ² ≤ 1
Solution :

−1 5−1 SCRò


+E ² = +² × − =1− n−k
−5 −5 SCTò
n−1
˜ ² est proche de 1 : l’ajustement est «bon»
Si ²

régression Test de Ficher-Snedecor ù


Réponse pour question 1 : test d’ensemble sur la signification de la

+²ò
ôÅ"#;£"Å = 5−1
1 − +²ò
−5

37
Introduction à l’Econométrie

Exercices résolus : modèle linéaire à plusieurs variables explicatives

Exercice :

exogènes sont en jeu, indiquer la signification de (a) ú¿ , (b) úW , (c) ú[ . (d) ces trois paramètres
D’après le modèle linéaire fourni par l’analyse de régression multiple, lorsque deux variables

a) Le paramètre Ø- est le terme constant de l’équation de la régression, '=, = Ø- + Ø# (#, +
sont –ils BLUE ?

Ø? (?, ; Dans un espace euclidien à trois dimensions, c’est la coordonnée , '= de l’intersection
de l’axe des Y avec le plan de régression défini par cette équation ; autrement dit, Ø- donne
la valeur estimée de ', lorsque (#, = (?, = 0.
b) Le paramètre Ø# mesure la variation de '= pour toute variation unitaire de (# , lorsque (?

(# ', O étant l’origine des coordonnées. Ce paramètre est un coefficient de régression


reste constant ; il représente la pente des droites du plan de régression parallèle au plan

partielle parce qu’il est égal à la dérivée partielle de '= par rapport à (# soit
û·
û¸Ü
c) Le paramètre Ø? mesure la variation de '= pour toute variation unitaire de (? , lorsque (#
.

(? '. C’est le second coefficient de régression partielle, étant égal la dérivée partielle de '=
reste constant ; il représente la pente des droites du plan de régression parallèle au plan

par rapport à (? soit


û·
û¸Ì
d) Comme Ø- , Ø# et Ø? sont obtenus par la méthode MCO, ils sont aussi les meilleurs
.

estimateurs linéaires sans biais (BLUE). Autrement dit : >(Ø- ) = - , >(Ø# ) = # et


>(Ø? ) = ? , et Ú̈Û , Ú̈Ü et Ú̈Ì ont des valeurs minimales par rapport à tout autre estimateur
linéaire sans biais. Prouver ces propriétés manque particulièrement d’élégance hors l’emploi
du calcul matriciel.

Exercice :

réel par tête ´ en milliers de US$. Avec le pourcentage de de la force de travail employé dans
Le tableau suivant (2.2) concerne 15 pays développés et donne pour chacun le niveau de revenu

l’agriculture et la durée moyenne de la scolarité µ[ (en années) pour une population au-dessus de
25 ans (a) établir l’équation de régression MCO de ´ par rapport à µW et µ [ ? (b) interpréter les

', ²
résultats ainsi obtenus ?
pays n° ', (#, (?, (#, ² (?, ² (#, (?, ', (#, ', (?,
1 6 9 8 36 81 64 72 54 48
2 8 10 13 64 100 169 130 80 104
3 8 8 11 64 64 121 88 64 88
4 7 7 10 49 49 100 70 49 70
5 7 10 12 49 100 144 120 70 84
6 12 4 16 144 16 256 64 48 192
7 9 5 10 81 25 100 50 45 90
8 8 5 10 64 25 100 50 40 80
9 9 6 12 81 36 144 72 54 108
10 10 8 14 100 64 196 112 80 140
11 10 7 12 100 49 144 84 70 120
12 11 4 16 121 16 256 64 44 176
13 9 9 14 81 81 196 126 81 126
14 10 5 10 100 25 100 50 50 100
15 11 8 12 121 64 144 96 88 132

Quantités utilisées pour calculer ØÅ


135 105 180 1255 795 2234 1248 917 1658
9 7 12

38
Introduction à l’Econométrie

a) Calcul des paramètres à partir de l’équation :

', = - + # (#, + ? (?, + ),

Nous utilisons le calcul matriciel, d’après les calculs tirés du tableau (2.2), nous avons :

ØÅ = (( Þ ()"# (′'


"#
 § (# § (?
à ã 3,391 −0,154 −0,187
( Þ ( "# = å
å§ (# § (# ² § (# (? æ
æ = é−0,154 0,017 0,003 ê
−0,187 0,003 0,014
ߧ (? § (# (? § (? ² â

Et

§'
à ã 135
( Þ' = å
å§ '(# æ
æ = é 917 ê
1658
ߧ '(? â

6,20
ØÅ = (( Þ ()"# ( Þ ' = é−0,38ê
0,45

'=, = 6,20 − 0,38(#, + 0,45(?,


Donc :

b) Cette dernière équation indique que le niveau du revenu réel par tête ', est inversement lié
au pourcentage (# de la force de travail dans l’agriculture, mais qu’il est en relation directe
avec la durée (? de la scolarité de la population au dessus de 25 ans : ce qui d’ailleurs aurait
pu être anticipé. De façon précise Ø# fait apparaitre qu’une réduction de 1% de l’effectif

dollars. (? restant constant. Lorsque (? = (? = 0 , '=, = Ø- = 6,20. Dans la mesure où il est
employé e agriculture est associée à une augmentation de revenu réel par tête égale à 380

prouvé que (? est statistiquement signifiant et doit par conséquent être inclus dans
l’équation de régression, la valeur Ø# = −0.47 déterminée dans l’exercice du modèle de
régression simple n’est pas une estimation satisfaisante de .

39
Introduction à l’Econométrie

Exercices résolus : tests de signification pour les paramètres

D’après le tableau (2.2) qui réunit les calculs nécessaires. Les valeurs de ´ ¨ sont obtenues par
Exercice :

substitution des valeurs de µW et de µ[ dans l’équation estime par la régression MCO, telle que
l’on établie dans l’exercice précédent.

'= );²
Dés lors :

);′); 12,27
Calculons d’abord :
² = @; = @; = = = 1,023
 − 5 15 − 3
6,44 0,19
8,32 0,10

3,391 −0,154 −0,187


8,17 0,03 On déduit :

Ú̈ ² = @; ²(( Þ ()"# = 1,023 × é−0,154 0,017 0,003 ê


8,09 1,20
−0,187 0,003 0,014
3,468 −0,154 −0,193
7,87 0,76

= é−0,154 0,017 0,003 ê


11,94 0,00

−0,193 0,003 0,014


8,85 0,02
8,85 0,72

Œ3,468
Donc :
1,86
9,38 0,14

Ú̈Ý = üŒ0,017ý = é0,13ê


9,53 0,22

0,12
9,00 1,00

Œ0,014
11,94 0,88

3,33
Ú̈Ý = é2,83ê
9,15 0,02

3,78
8,85 1,33
8,62 5,65
135 12,27

Ú̈Ý dépassent = 2,17 au seuil de 5% pour


þ =  − 5 = 15 − 3 = 12, on conclura que
Puisque les valeurs absolues de sa valeur tabulaire
Ú̈Ý sont tous signifiant au seuil de 5%.

40
Table de la Loi de Student – Test t

Seuil de risque alpha (bilatéral)


0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,05 0,02 0,01 0,005 0,001
DDL
1 0,1584 0,3249 0,5095 0,7265 1 1,3764 1,9626 3,0777 6,3137 12,706 31,821 63,656 127,32 636,58
2 0,1421 0,2887 0,4447 0,6172 0,8165 1,0607 1,3862 1,8856 2,92 4,3027 6,9645 9,925 14,089 31,6
3 0,1366 0,2767 0,4242 0,5844 0,7649 0,9785 1,2498 1,6377 2,3534 3,1824 4,5407 5,8408 7,4532 12,924
4 0,1338 0,2707 0,4142 0,5686 0,7407 0,941 1,1896 1,5332 2,1318 2,7765 3,7469 4,6041 5,5975 8,6101
5 0,1322 0,2672 0,4082 0,5594 0,7267 0,9195 1,1558 1,4759 2,015 2,5706 3,3649 4,0321 4,7733 6,8685
6 0,1311 0,2648 0,4043 0,5534 0,7176 0,9057 1,1342 1,4398 1,9432 2,4469 3,1427 3,7074 4,3168 5,9587
7 0,1303 0,2632 0,4015 0,5491 0,7111 0,896 1,1192 1,4149 1,8946 2,3646 2,9979 3,4995 4,0294 5,4081
8 0,1297 0,2619 0,3995 0,5459 0,7064 0,8889 1,1081 1,3968 1,8595 2,306 2,8965 3,3554 3,8325 5,0414
9 0,1293 0,261 0,3979 0,5435 0,7027 0,8834 1,0997 1,383 1,8331 2,2622 2,8214 3,2498 3,6896 4,7809
10 0,1289 0,2602 0,3966 0,5415 0,6998 0,8791 1,0931 1,3722 1,8125 2,2281 2,7638 3,1693 3,5814 4,5868
11 0,1286 0,2596 0,3956 0,5399 0,6974 0,8755 1,0877 1,3634 1,7959 2,201 2,7181 3,1058 3,4966 4,4369
12 0,1283 0,259 0,3947 0,5386 0,6955 0,8726 1,0832 1,3562 1,7823 2,1788 2,681 3,0545 3,4284 4,3178
13 0,1281 0,2586 0,394 0,5375 0,6938 0,8702 1,0795 1,3502 1,7709 2,1604 2,6503 3,0123 3,3725 4,2209
14 0,128 0,2582 0,3933 0,5366 0,6924 0,8681 1,0763 1,345 1,7613 2,1448 2,6245 2,9768 3,3257 4,1403
15 0,1278 0,2579 0,3928 0,5357 0,6912 0,8662 1,0735 1,3406 1,7531 2,1315 2,6025 2,9467 3,286 4,0728
16 0,1277 0,2576 0,3923 0,535 0,6901 0,8647 1,0711 1,3368 1,7459 2,1199 2,5835 2,9208 3,252 4,0149
17 0,1276 0,2573 0,3919 0,5344 0,6892 0,8633 1,069 1,3334 1,7396 2,1098 2,5669 2,8982 3,2224 3,9651
18 0,1274 0,2571 0,3915 0,5338 0,6884 0,862 1,0672 1,3304 1,7341 2,1009 2,5524 2,8784 3,1966 3,9217
19 0,1274 0,2569 0,3912 0,5333 0,6876 0,861 1,0655 1,3277 1,7291 2,093 2,5395 2,8609 3,1737 3,8833
20 0,1273 0,2567 0,3909 0,5329 0,687 0,86 1,064 1,3253 1,7247 2,086 2,528 2,8453 3,1534 3,8496
21 0,1272 0,2566 0,3906 0,5325 0,6864 0,8591 1,0627 1,3232 1,7207 2,0796 2,5176 2,8314 3,1352 3,8193
22 0,1271 0,2564 0,3904 0,5321 0,6858 0,8583 1,0614 1,3212 1,7171 2,0739 2,5083 2,8188 3,1188 3,7922
23 0,1271 0,2563 0,3902 0,5317 0,6853 0,8575 1,0603 1,3195 1,7139 2,0687 2,4999 2,8073 3,104 3,7676
24 0,127 0,2562 0,39 0,5314 0,6848 0,8569 1,0593 1,3178 1,7109 2,0639 2,4922 2,797 3,0905 3,7454
25 0,1269 0,2561 0,3898 0,5312 0,6844 0,8562 1,0584 1,3163 1,7081 2,0595 2,4851 2,7874 3,0782 3,7251
26 0,1269 0,256 0,3896 0,5309 0,684 0,8557 1,0575 1,315 1,7056 2,0555 2,4786 2,7787 3,0669 3,7067
27 0,1268 0,2559 0,3894 0,5306 0,6837 0,8551 1,0567 1,3137 1,7033 2,0518 2,4727 2,7707 3,0565 3,6895
28 0,1268 0,2558 0,3893 0,5304 0,6834 0,8546 1,056 1,3125 1,7011 2,0484 2,4671 2,7633 3,047 3,6739
29 0,1268 0,2557 0,3892 0,5302 0,683 0,8542 1,0553 1,3114 1,6991 2,0452 2,462 2,7564 3,038 3,6595
30 0,1267 0,2556 0,389 0,53 0,6828 0,8538 1,0547 1,3104 1,6973 2,0423 2,4573 2,75 3,0298 3,646
31 0,1267 0,2555 0,3889 0,5298 0,6825 0,8534 1,0541 1,3095 1,6955 2,0395 2,4528 2,744 3,0221 3,6335
32 0,1267 0,2555 0,3888 0,5297 0,6822 0,853 1,0535 1,3086 1,6939 2,0369 2,4487 2,7385 3,0149 3,6218
33 0,1266 0,2554 0,3887 0,5295 0,682 0,8526 1,053 1,3077 1,6924 2,0345 2,4448 2,7333 3,0082 3,6109
34 0,1266 0,2553 0,3886 0,5294 0,6818 0,8523 1,0525 1,307 1,6909 2,0322 2,4411 2,7284 3,002 3,6007
35 0,1266 0,2553 0,3885 0,5292 0,6816 0,852 1,052 1,3062 1,6896 2,0301 2,4377 2,7238 2,9961 3,5911
36 0,1266 0,2552 0,3884 0,5291 0,6814 0,8517 1,0516 1,3055 1,6883 2,0281 2,4345 2,7195 2,9905 3,5821
37 0,1265 0,2552 0,3883 0,5289 0,6812 0,8514 1,0512 1,3049 1,6871 2,0262 2,4314 2,7154 2,9853 3,5737
38 0,1265 0,2551 0,3882 0,5288 0,681 0,8512 1,0508 1,3042 1,686 2,0244 2,4286 2,7116 2,9803 3,5657
39 0,1265 0,2551 0,3882 0,5287 0,6808 0,8509 1,0504 1,3036 1,6849 2,0227 2,4258 2,7079 2,9756 3,5581
40 0,1265 0,255 0,3881 0,5286 0,6807 0,8507 1,05 1,3031 1,6839 2,0211 2,4233 2,7045 2,9712 3,551
41 0,1264 0,255 0,388 0,5285 0,6805 0,8505 1,0497 1,3025 1,6829 2,0195 2,4208 2,7012 2,967 3,5443
42 0,1264 0,255 0,388 0,5284 0,6804 0,8503 1,0494 1,302 1,682 2,0181 2,4185 2,6981 2,963 3,5377
43 0,1264 0,2549 0,3879 0,5283 0,6802 0,8501 1,0491 1,3016 1,6811 2,0167 2,4163 2,6951 2,9592 3,5316
44 0,1264 0,2549 0,3878 0,5282 0,6801 0,8499 1,0488 1,3011 1,6802 2,0154 2,4141 2,6923 2,9555 3,5258
45 0,1264 0,2549 0,3878 0,5281 0,68 0,8497 1,0485 1,3007 1,6794 2,0141 2,4121 2,6896 2,9521 3,5203
46 0,1264 0,2548 0,3877 0,5281 0,6799 0,8495 1,0482 1,3002 1,6787 2,0129 2,4102 2,687 2,9488 3,5149
47 0,1263 0,2548 0,3877 0,528 0,6797 0,8493 1,048 1,2998 1,6779 2,0117 2,4083 2,6846 2,9456 3,5099
48 0,1263 0,2548 0,3876 0,5279 0,6796 0,8492 1,0478 1,2994 1,6772 2,0106 2,4066 2,6822 2,9426 3,505
49 0,1263 0,2547 0,3876 0,5278 0,6795 0,849 1,0475 1,2991 1,6766 2,0096 2,4049 2,68 2,9397 3,5005
50 0,1263 0,2547 0,3875 0,5278 0,6794 0,8489 1,0473 1,2987 1,6759 2,0086 2,4033 2,6778 2,937 3,496
60 0,1262 0,2545 0,3872 0,5272 0,6786 0,8477 1,0455 1,2958 1,6706 2,0003 2,3901 2,6603 2,9146 3,4602
70 0,1261 0,2543 0,3869 0,5268 0,678 0,8468 1,0442 1,2938 1,6669 1,9944 2,3808 2,6479 2,8987 3,435
80 0,1261 0,2542 0,3867 0,5265 0,6776 0,8461 1,0432 1,2922 1,6641 1,9901 2,3739 2,6387 2,887 3,4164
90 0,126 0,2541 0,3866 0,5263 0,6772 0,8456 1,0424 1,291 1,662 1,9867 2,3685 2,6316 2,8779 3,4019
100 0,126 0,254 0,3864 0,5261 0,677 0,8452 1,0418 1,2901 1,6602 1,984 2,3642 2,6259 2,8707 3,3905
110 0,126 0,254 0,3863 0,5259 0,6767 0,8449 1,0413 1,2893 1,6588 1,9818 2,3607 2,6213 2,8648 3,3811
120 0,1259 0,2539 0,3862 0,5258 0,6765 0,8446 1,0409 1,2886 1,6576 1,9799 2,3578 2,6174 2,8599 3,3734
130 0,1259 0,2539 0,3862 0,5257 0,6764 0,8444 1,0406 1,2881 1,6567 1,9784 2,3554 2,6142 2,8557 3,367
140 0,1259 0,2538 0,3861 0,5256 0,6762 0,8442 1,0403 1,2876 1,6558 1,9771 2,3533 2,6114 2,8522 3,3613
infini 0,1257 0,2533 0,3853 0,5244 0,6744 0,8416 1,0364 1,2816 1,6449 1,96 2,3264 2,5759 2,8072 3,2908
Lois de Student
Si T est une variable aléatoire suivant la loi de Stu-
dent à ν degrés de liberté, la table donne, pour α fixé,
la valeur t1α{2 telle que  { u  
Pt|T | ¥ t1 α 2 α. {
α/2 α/2
Ainsi, t1α{2 est le quantile d’ordre 1 α 2 de la loi de
Student à ν degrés de liberté. tα/2 0 t1−α/2

α 0,900 0,500 0,300 0,200 0,100 0,050 0,020 0,010 0,001


ν
1 0,1584 1,0000 1,9626 3,0777 6,3138 12,7062 31,8205 63,6567 636,6192
2 0,1421 0,8165 1,3862 1,8856 2,9200 4,3027 6,9646 9,9248 31,5991
3 0,1366 0,7649 1,2498 1,6377 2,3534 3,1824 4,5407 5,8409 12,9240
4 0,1338 0,7407 1,1896 1,5332 2,1318 2,7764 3,7469 4,6041 8,6103
5 0,1322 0,7267 1,1558 1,4759 2,0150 2,5706 3,3649 4,0321 6,8688
6 0,1311 0,7176 1,1342 1,4398 1,9432 2,4469 3,1427 3,7074 5,9588
7 0,1303 0,7111 1,1192 1,4149 1,8946 2,3646 2,9980 3,4995 5,4079
8 0,1297 0,7064 1,1081 1,3968 1,8595 2,3060 2,8965 3,3554 5,0413
9 0,1293 0,7027 1,0997 1,3830 1,8331 2,2622 2,8214 3,2498 4,7809
10 0,1289 0,6998 1,0931 1,3722 1,8125 2,2281 2,7638 3,1693 4,5869
11 0,1286 0,6974 1,0877 1,3634 1,7959 2,2010 2,7181 3,1058 4,4370
12 0,1283 0,6955 1,0832 1,3562 1,7823 2,1788 2,6810 3,0545 4,3178
13 0,1281 0,6938 1,0795 1,3502 1,7709 2,1604 2,6503 3,0123 4,2208
14 0,1280 0,6924 1,0763 1,3450 1,7613 2,1448 2,6245 2,9768 4,1405
15 0,1278 0,6912 1,0735 1,3406 1,7531 2,1314 2,6025 2,9467 4,0728
16 0,1277 0,6901 1,0711 1,3368 1,7459 2,1199 2,5835 2,9208 4,0150
17 0,1276 0,6892 1,0690 1,3334 1,7396 2,1098 2,5669 2,8982 3,9651
18 0,1274 0,6884 1,0672 1,3304 1,7341 2,1009 2,5524 2,8784 3,9216
19 0,1274 0,6876 1,0655 1,3277 1,7291 2,0930 2,5395 2,8609 3,8834
20 0,1273 0,6870 1,0640 1,3253 1,7247 2,0860 2,5280 2,8453 3,8495
21 0,1272 0,6864 1,0627 1,3232 1,7207 2,0796 2,5176 2,8314 3,8193
22 0,1271 0,6858 1,0614 1,3212 1,7171 2,0739 2,5083 2,8188 3,7921
23 0,1271 0,6853 1,0603 1,3195 1,7139 2,0687 2,4999 2,8073 3,7676
24 0,1270 0,6848 1,0593 1,3178 1,7109 2,0639 2,4922 2,7969 3,7454
25 0,1269 0,6844 1,0584 1,3163 1,7081 2,0595 2,4851 2,7874 3,7251
26 0,1269 0,6840 1,0575 1,3150 1,7056 2,0555 2,4786 2,7787 3,7066
27 0,1268 0,6837 1,0567 1,3137 1,7033 2,0518 2,4727 2,7707 3,6896
28 0,1268 0,6834 1,0560 1,3125 1,7011 2,0484 2,4671 2,7633 3,6739
29 0,1268 0,6830 1,0553 1,3114 1,6991 2,0452 2,4620 2,7564 3,6594
30 0,1267 0,6828 1,0547 1,3104 1,6973 2,0423 2,4573 2,7500 3,6460
40 0,1265 0,6807 1,0500 1,3031 1,6839 2,0211 2,4233 2,7045 3,5510
80 0,1261 0,6776 1,0432 1,2922 1,6641 1,9901 2,3739 2,6387 3,4163
120 0,1259 0,6765 1,0409 1,2886 1,6577 1,9799 2,3578 2,6174 3,3735
8 0,1257 0,6745 1,0364 1,2816 1,6449 1,9600 2,3263 2,5758 3,2905

Lorsque ν  8, t1α{2 est le quantile d’ordre 1  α{2 de la loi normale N p0, 1q.
p
A.4. Lois de Fisher–Snedecor (α  0, 05)

P t ¥
Si F est une variable
 u  
aléatoire suivant la loi de
Fisher–Snedecor à ν1 , ν2 q degrés de liberté, la table
donne la valeur f1 α telle que  
F f1 α α 0,05.
α
Ainsi, f1α est le quantile d’ordre 1 α 0,95 de la
loi de Fisher–Snedecor à pν1 , ν2 q degrés de liberté. 0 f1−α

ν2
ν1 1 2 3 4 5 6 8 10 15 20 30 8
1 161 200 216 225 230 234 239 242 246 248 250 254
2 18,5 19,0 19,2 19,2 19,3 19,3 19,4 19,4 19,4 19,4 19,5 19,5
3 10,1 9,55 9,28 9,12 9,01 8,94 8,85 8,79 8,70 8,66 8,62 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,96 5,86 5,80 5,75 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,82 4,74 4,62 4,56 4,50 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,06 3,94 3,87 3,81 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,64 3,51 3,44 3,38 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,35 3,22 3,15 3,08 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,14 3,01 2,94 2,86 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,98 2,85 2,77 2,70 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 2,95 2,85 2,72 2,65 2,57 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,85 2,75 2,62 2,54 2,47 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,77 2,67 2,53 2,46 2,38 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,70 2,60 2,46 2,39 2,31 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,64 2,54 2,40 2,33 2,25 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,59 2,49 2,35 2,28 2,19 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,55 2,45 2,31 2,23 2,15 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,51 2,41 2,27 2,19 2,11 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,48 2,38 2,23 2,16 2,07 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,45 2,35 2,20 2,12 2,04 1,84
22 4,30 3,44 3,05 2,82 2,66 2,55 2,40 2,30 2,15 2,07 1,98 1,78
24 4,26 3,40 3,01 2,78 2,62 2,51 2,36 2,25 2,11 2,03 1,94 1,73
26 4,23 3,37 2,98 2,74 2,59 2,47 2,32 2,22 2,07 1,99 1,90 1,69
28 4,20 3,34 2,95 2,71 2,56 2,45 2,29 2,19 2,04 1,96 1,87 1,65
30 4,17 3,32 2,92 2,69 2,53 2,42 2,27 2,16 2,01 1,93 1,84 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,18 2,08 1,92 1,84 1,74 1,51
50 4,03 3,18 2,79 2,56 2,40 2,29 2,13 2,03 1,87 1,78 1,69 1,44
60 4,00 3,15 2,76 2,53 2,37 2,25 2,10 1,99 1,84 1,75 1,65 1,39
80 3,96 3,11 2,72 2,49 2,33 2,21 2,06 1,95 1,79 1,70 1,60 1,32
100 3,94 3,09 2,70 2,46 2,31 2,19 2,03 1,93 1,77 1,68 1,57 1,28

8 3,84 3,00 2,60 2,37 2,21 2,10 1,94 1,83 1,67 1,57 1,46 1,00
A.5. Lois de Fisher–Snedecor (α  0, 025)
p
Si F est une variable aléatoire suivant la loi de
Fisher–Snedecor à ν1 , ν2 q degrés de liberté, la table
Ptf1 ¥α telle
donne la valeur  uque 
F f1 α α 0, 
025. 
α
Ainsi, f1α est le quantile d’ordre 1 α 0,975 de la
loi de Fisher–Snedecor à pν1 , ν2 q degrés de liberté. 0 f1−α

ν2
ν1 1 2 3 4 5 6 8 10 15 20 30 8
1 648 800 864 900 922 937 957 969 985 993 1 001 1 018
2 38,5 39,0 39,2 39,2 39,3 39,3 39,4 39,4 39,4 39,4 39,5 39,5
3 17,4 16,0 15,4 15,1 14,9 14,7 14,5 14,4 14,3 14,2 14,1 13,9
4 12,2 10,6 9,98 9,60 9,36 9,20 8,98 8,84 8,66 8,56 8,46 8,26
5 10,0 8,43 7,76 7,39 7,15 6,98 6,76 6,62 6,43 6,33 6,23 6,02
6 8,81 7,26 6,60 6,23 5,99 5,82 5,60 5,46 5,27 5,17 5,07 4,85
7 8,07 6,54 5,89 5,52 5,29 5,12 4,90 4,76 4,57 4,47 4,36 4,14
8 7,57 6,06 5,42 5,05 4,82 4,65 4,43 4,30 4,10 4,00 3,89 3,67
9 7,21 5,71 5,08 4,72 4,48 4,32 4,10 3,96 3,77 3,67 3,56 3,33
10 6,94 5,46 4,83 4,47 4,24 4,07 3,85 3,72 3,52 3,42 3,31 3,08
11 6,72 5,26 4,63 4,28 4,04 3,88 3,66 3,53 3,33 3,23 3,12 2,88
12 6,55 5,10 4,47 4,12 3,89 3,73 3,51 3,37 3,18 3,07 2,96 2,72
13 6,41 4,97 4,35 4,00 3,77 3,60 3,39 3,25 3,05 2,95 2,84 2,60
14 6,30 4,86 4,24 3,89 3,66 3,50 3,29 3,15 2,95 2,84 2,73 2,49
15 6,20 4,76 4,15 3,80 3,58 3,41 3,20 3,06 2,86 2,76 2,64 2,40
16 6,12 4,69 4,08 3,73 3,50 3,34 3,12 2,99 2,79 2,68 2,57 2,32
17 6,04 4,62 4,01 3,66 3,44 3,28 3,06 2,92 2,72 2,62 2,50 2,25
18 5,98 4,56 3,95 3,61 3,38 3,22 3,01 2,87 2,67 2,56 2,44 2,19
19 5,92 4,51 3,90 3,56 3,33 3,17 2,96 2,82 2,62 2,51 2,39 2,13
20 5,87 4,46 3,86 3,51 3,29 3,13 2,91 2,77 2,57 2,46 2,35 2,09
22 5,79 4,38 3,78 3,44 3,22 3,05 2,84 2,70 2,50 2,39 2,27 2,00
24 5,72 4,32 3,72 3,38 3,15 2,99 2,78 2,64 2,44 2,33 2,21 1,94
26 5,66 4,27 3,67 3,33 3,10 2,94 2,73 2,59 2,39 2,28 2,16 1,88
28 5,61 4,22 3,63 3,29 3,06 2,90 2,69 2,55 2,34 2,23 2,11 1,83
30 5,57 4,18 3,59 3,25 3,03 2,87 2,65 2,51 2,31 2,20 2,07 1,79
40 5,42 4,05 3,46 3,13 2,90 2,74 2,53 2,39 2,18 2,07 1,94 1,64
50 5,34 3,98 3,39 3,06 2,83 2,67 2,46 2,32 2,11 1,99 1,87 1,55
60 5,29 3,93 3,34 3,01 2,79 2,63 2,41 2,27 2,06 1,94 1,82 1,48
80 5,22 3,86 3,28 2,95 2,73 2,57 2,36 2,21 2,00 1,88 1,75 1,40
100 5,18 3,83 3,25 2,92 2,70 2,54 2,32 2,18 1,97 1,85 1,71 1,35

8 5,02 3,69 3,12 2,79 2,57 2,41 2,19 2,05 1,83 1,71 1,57 1,00