Vous êtes sur la page 1sur 74

2011

INTRODUCTION A
2012 2011 2012

LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. FRANÇOISE SEYTE

Introduction à
[Tapez le sous-titre du document]

NOMETRIE Page 0

H34VEN
Cours pour Licence 3, Semestre 5 Année 2011-2012
INTRODUCTION A 2011 2012

LICENCE 3 SCIENCES ECONOMIQUES COURS DE MME FRANÇOISE SEYTE

Cours magistral

Ecrit pour les étudiants de troisième année de licence en sciences économiques

Pour toutes incompréhensions, imperfections ou erreurs éventuelles,

Merci de les signaler sur le forum de la faculté de sciences économiques de l'UM1, à cette
adresse :

http://www.forum-sceco.fr (Connexion à partir de http://gide-éco.fr/forum ), à défaut de ne


pouvoir me contacter directement...

PRISE DE NOTE PAR : PLASMAN SYLVAIN ANNEE 2011 2012

NOMETRIE Page 2
INTRODUCTION A 2011 2012

P.005

(peut tomber en examen, cf. Annales)


? / Bibliographie P.005
I. -
économétrique P.006
II. La crise de la modélisation macro-économétrique au développement
P.008
A. Les années 70 P.008
B. P.008

Chapitre I P.009

Modèles linéaires simples : Le modèle à 2 variables


I. Les hypothèses du modèle P.009
II. P.010
III. Les propriétés des estimateurs des MCO P.013
A. Les hypothèses P.013
B. Les propriétés P.018
IV. P.019
A. Estimations par intervalle de confiance P.019
B. Test des paramètres P.021
C. Etude de la corrélation P.023
V. Utilisation du modèle de régression en prévision P.026
A. correspondant à une valeur de
: Intervalle de confiance P.027
B.
carrés P.029

Chapitre II P.031

Modèle linéaire général simple


I. P.031
A. Test de Skewness-Kurtosis P.031
B. Test de Jarque-Bera P.032
II. P.032
A. P.032
B. Principales causes de P.034
C. P.034
D. P.034
III. P.035
A. Glejser P.035

NOMETRIE Page 3
INTRODUCTION A 2011 2012

B. (processus) ARCH P.035


C. White P.036
D. Goldfeld-Quandt P.036
IV. Robustesse du MLGS (Modèle Linéaire Général Simple) P.037
A. Test de comparaison de 2 coefficients de régression P.037
B. P.038
C. Test de comparaison de 2 coefficients de corrélation P.038

NOMETRIE Page 4
INTRODUCTION A 2011 2012

(A ne pas zapper, peut tomber en examen !)

-ce que ?

mathématiques appliquée a conjonction de la théorie économique, de la


statistique et des mathématiques »
Le domaine de l’économie qui s’occupe des applications de la statistiques, mathématiques
et de l’inférence à la mesure inpirique des relations constitue par la théorie économie. Définition de Ragnar FRISCH, 1933

1°) 1980 : Lawrence KLEIN (Premiers modèles macro-économétriques, analyse des fluctuations et
croissance)

2°) 1989 : Trygve HAAVELMO


simultanées)

3°) 2000 : James HECKMAN )

l
4°) 2000 : Daniel McFADDEN (Analyse des choix discrets en économétrie)

5°) 2003 : Robert GRANGER & Clive ENGLE (Co-intégration & Volatilité des séries temporelles et des
modèles ARCH)

Bibliographie :

PIROTTE, : des origines aux développements récents

JOHNSON-DINARDO, Econométrie, DUNOD

LABROUSSE, , DUNOD

BOURBONNAIS, , DUNOD

I. -économétrique

Les premières études empiriques datent du XVIIème-XVIIIème siècle. de la loi


naturelle, à cette époque, se dégage progressivement de celle de la religion et de celle du prince.

NOMETRIE Page 5
INTRODUCTION A 2011 2012

En Allemagne se met en place la Statistique descriptive qui se situe dans une description globale des
états. Hermann CONRING (1606 1681) qui conçoit la statistique comme un moyen de
classer des savoirs.
repose sur l’utilisation du technique, statistique simple pour
Arithmétique politique (Dépouillement des registres et des paroisses
des baptêmes, des mariages et des décès). On construit des tables de mortalités et on calcule des
espérances de vie. t
William PETTY a contribué lui au développement de la Statistique démographique.

Gregory KING est le premier à formaliser une loi de demande.

probabiliste de multiples champs comme Astronomie, la Sociologie, la Biologie, la Physique.


permettre de donner une dimension statistique à la représentation de la société.

La genèse rie apparait au milieu du XIXème siècle, avec le développement de


Auguste COURNOT et Léon WALRAS.

iculier à GALTON en 1885-1888


développe la corrélation (Liaison entre 2 variables)

A la même époque, Francis EDGEWORTH détermine la formule de la fonction de densité normale.

Karl PEARSON développe le coefficient multiple et montre le lien avec les coefficients de corrélation
simple

George YULE

Evelyn HOCKER est le premier à étudier des variables retardées dans les modèles de régression.

Marcel LENOIR e. Son approche étant

moderne : Henry
MOORE nation des salaires, des fonctions de demande et des
cycles de périodicité. Sa démarche consiste à prouver que les mathématiques et la statistique
peuvent servir de révélateur empirique et autoriser une interprétation concrète des phénomènes
économiques.

américains qui jouent un rôle essentiel dans la détection statistique des cycles. Il faut observer,
analyser, systématiser les phénomènes de prospérité, de crise et de dépression.

Cycle de JUGLAR/Cycle de KITCHIN/Cycle de KUZNETS/Cycle de KONDRATIEFF

En 1920 apparait le premier institut de conjoncture. A la même époque est créé le National Bureau
of Economics Research (NBER). Son rôle étant basé sur la recherche économique empirique.

: Des

mathématiques et la statistique. ue comme une discipline à part entière.


NOMETRIE Page 6
INTRODUCTION A 2011 2012

Jan TINBERGEN et Ragnar FRISCH.


FRISCH S . Le premier colloque se fait 1931 à Lausanne. A la
même époque, Alfred COWLES, conseiller financier et spécialiste en prévision boursière, rentre en

t piesidentFisher
contact avec la et propose 2 projets :

- Financer
- Financer une organisation de recherche sous son patronat

Dans les années 1930, la revue Econometrica est créée, le premier numéro sort en Janvier 1933, son
Ragnar FRISCH.

COWLES

subventions de la part des universités).

Apparait à ce moment-là les premiers modèles à équations simultanées


les équations de termes « aléatoires » qui reflètent des causes multiples.

Le premier modèle macro-économétrique apparait à son tour et incorpore des principes


probabilistes et celui de Lawrence KLEIN dans les années 1950-1960. Cette époque voit le
développement des modèles à retard échelonné de KOYCK, en 1954.

Parallèlement
retrouve les modèles de BOX et JENKINS. On estime alors des Processus univariés pour réaliser des
prévisions.

II. La crise de la modélisation macro-économétrique au développement récent de

A. Les années 70

-économétrie, le choc pétrolier contredit tous


les précédents modèles macro-économétriques.

Cela ouvre cependant la voie à de nouveaux modèles, notamment les modèles Vecteurs Auto
Régressifs (VAR). Se développent en même temps les analyses de la Causalité.

B. séries temporelles depuis les années 1980

Les Tests de racine unitaire de MICKEY-FULLER, les modèles ARMA, la modélisation ARCH, les
modèles LOGIT-PROBIT, les modèles de BOOSTRAP et les modèles bayésiens apparaissent dans les
années 1980.

NOMETRIE Page 7
INTRODUCTION A 2011 2012

- L des séries temporelles


-
- PANEL

NOMETRIE Page 8
INTRODUCTION A 2011 2012

Modèles linéaires simples : Le modèle à 2 variables

I. Les hypothèses du modèle

Le modèle économétrique est une représentation simplifiée mais la plus exhaustive possible

représenté par des équations, le plus souvent linéaire. Dans ces équations, nous avons 2 types de
variables :

- Les variables exogènes (explicatives) :


- Les variables endogènes (expliquées) :
Y ftp.xilineairel
flx.i ⼼ 指数的
La fonction peut avoir plusieurs formes, elle peut être linéaire, exponentiel, fonction puissance,
mais il faut savoir que tout modèle non linéaire peut se ramener au cas non linéaire par
transformation par anamorphose.

Soit

so

YoY n
Yuu

NOMETRIE Page 9
INTRODUCTION A 2011 2012

aléa ou erreur que ne peut


expliquer.

En économie, il y a trois types de modèles :

-
chronologique
Le modèle en série temporelle, notée dealdative
Le modèle en coupe instantanée, notée 灬n
-
t.tl
- Le modèle de PANEL, notée

r les paramètres et connaissant les valeurs observées de et


n n n
Les valeurs calculées vont être notées et , étant estimateurs.

et est appelé écart ou résidu, notée

钢 hg
Il existe deux méthodes permettant de calculer alpha et beta
Yt Yie
La méthode des Moindre Carrées Ordinaires (MCO)
empiriqneG
-
- La méthode du maximum de vraisemblance ienrenr

douiqunhpnt.tt
hypothèses de base soit vérifié.
Les hypothèses du modèle
1) est une variable contrôlée -à-
正态性
2) :
expliqués par la régression et qui se retrouve dans tendent à se compenser
3) homoscédacticité : u que la variance des est
signifie

4) :
i La distribution des , qui
correspond à celle des Men
est indépendante de celle des , qui correspond à celle des

eueust.li
-> les erreurs sont non corrélées
Nous avons donc 3 quantités inconnues dans notre modèle

nmiiityfhiōǖci哥
-
-
41 cnn.ci ⽐试了⼀ ⽐巧 们

Ah
II.
Mco
La méthode des MCO consiste à retenir comme estimateur de et ce qui résulte de la
minimisation de la somme des carrés des écarts, écart entre la valeur observée de la variable
endogène (rappel : expliquée) et la variable calculée de cette même variable endogène, écart

droite de régression.

NOMETRIE Page 10
INTRODUCTION A 2011 2012

㐽 N
n n n

Point de nuage

ix it

Équations normales

fxieij.piixi
xneii

I
ㄈ ⼼不 iiliuxt.in
i 中⼼ 间 itnli
过Yi ilt.li ⼼ ⼼脏⻔
T.IYi ifia ziyttai.it 刻
器 1Tttnàtzfxt
2⼯作 _àfxt 0
ni na pnxio
i ni ii ix
2 l zxif.inttfxi
hyttzixtzpixttzftl
tlyt jxttit px.it
E

NOMETRIE Page 11
INTRODUCTION A 2011 2012


忷 缝

嬲⼼㹪1

Nnpleth
iii
炸 i

i.pl
n ⾮必 T

I
_Tat
f
i iii
liin

MCO

NOMETRIE Page 12
INTRODUCTION A 2011 2012

Valeurs centrées :

III. Les propriétés des estimateurs du MCO


4 灬
A. Hypothèses :

1) Les estimateurs des MCO sont des fonctions linéaires des estimateurs de Y. Pour
conséquence, comme dépend de , est une variable aléatoire. De ce fait, et sont
aussi des variables aléatoires. Ainsi, et obéiront à une loi Normale

2 下⼀ i

Propriétés de

Fonction linéaire de Y

Comme dépend de , est une variable aléatoire. De ce fait, sont des variables
tfpzoknpptliuneimaturensansbiai.si
aléatoires. Les sont des constantes fixés dans les échantillons.

2) sont des estimateurs sans biais de

NOMETRIE
tl on a Page 13
INTRODUCTION A 2011 2012

NOMETRIE Page 14
INTRODUCTION A 2011 2012

3) sont des estimateurs à variance minimale de

- Calcul de variance de

- Calcul de la variance de

NOMETRIE Page 15
INTRODUCTION A 2011 2012

- Calcul de la covariance de

ont des variances, il faut montrer maintenant .

On considère un estimateur linaire quelconque de par rapport à , tel que :

Si est sans biais et de variance minimale, on aura et


NOMETRIE Page 16
INTRODUCTION A 2011 2012

Si est minimal, la variance est elle aussi minimale. On a donc un problème de minimisation
sous contrainte.

NOMETRIE Page 17
INTRODUCTION A 2011 2012

Or

B. Propriétés

1)

Estimateur convergent

(15 pages de polycopiés)


NOMETRIE Page 18
INTRODUCTION A 2011 2012

sont des estimateurs linéaires de , ils sont aussi sans biais, convergents, de variance
Best Linear Unbiased Estimator (BLUE)

ōi

𣳈不

点 his
on_no

L’estimateur de la variance de l’erreur :


ˊ
i 呰 t.nhdeparani.estime
IV.

Comme les estimateurs sont des estimateurs linéaires de , qui dépendent de l'aléa
estimateurs sont aléatoires et obéissent à une loi normale
啊 TT Mm o
in
前前
idà 服从n

上粣
的 尛丽
A. Estimations par intervalle de confiance dex etdeP


fP 世

Eei

i
n 2 三 tiny
l ni
On einen parameter
IS

NOMETRIE Page 19
INTRODUCTION A 2011 2012

v XEUENK.nl
1 1

1 finn
7 1 in

㫵 i.TL
⼗ 在只

kxi kxi

1 I n
P ti If If IT n_n
if
Proline⼆⽇
x.i.lrpiprdolxcxco.IT
inwnnu

Man
KAPPEL T
in t
n

he 1 1
six
pfhi.IM
fn


1 1
在只
ii

哔囇 in
𠠬
政 政 灬 的
NOMETRIE Page 20
INTRODUCTION A 2011 2012

Test sur

Problème :

__n
I 哭嵌
B. Test des paramètres ⻔
管步
tiii 嚠1
Test sur

110

siHour

RDD :

-
-
Si
Si
aiello
alors
alors
acceptée au risque
rejetée au risque

Il faut rejeter pour avoir une relation linéaire cela revient à tester la validité du modèle.

NOMETRIE Page 21
INTRODUCTION A 2011 2012

RDD :
i
- Si acceptée au risque
- Si rejetée au risque


1 ftp
He


RDD :

- Si acceptée au risque
- Si rejetée au risque p

RDD :

- Si acceptée au risque
- Si rejetée au risque

rest mroi NOMETRIE Page 22


INTRODUCTION A 2011 2012

Test de :

RDD :

- Si acceptée au risque
- Si rejetée au risque

C. Etude de la corrélation

Le coefficient de corrélation est le coefficient qui mesure le degré de covariation linéaire entre
et -à-dire la manière dont varient ensemble les variables linéaires

• Propriétés
-
4
昨 -

ryxiniiiiiiiya.tn
variables

Relation entre

Yi.it Ì t
reii in推测 业
N

eiji
NOMETRIE Page 23
INTRODUCTION A 2011 2012

t t
a f 术 Xth
c 7


SUI ⼆
Variance totale = Variance résiduelle + Variance expliquée

La fluctuation totale des valeurs de autour


décomposée en 2 éléments :

- La Variance Expliquée est la variation des valeurs de


de la variable .
- La Variance Résiduelle est la variation résiduelle des valeurs de autour de la droite des

lcktsni.int
faible, plus le modèle sera précis et exact.
meilleur

Calcul de : Le coefficient de détermination


惩 it if
RE 以⼼
f 以灿
NOMETRIE Page 24
INTRODUCTION A 2011 2012

Et

Le coefficient de corrélation, porté au carré, indique la fraction de la variance de


.

- Test du coefficient de corrélation linéaire simple

T T
点 n_n 三
Fu ⼼
下 Mon
所n_n


仨 笑卡 u
点 森 fi
Hijo Hi to
kbn.si 品 灬 c Fun

si
品 n_n 扣 灬

Rnindique la fraction de variance de Y qui est


expliquée par l’influence linéaire de X

p
N
Cette hypothèse revient à tester la validité globale du modèle et donc tester la corrélation de
type linéaire entre et .

RDD :

Si acceptée au risque de première espèce

NOMETRIE Page 25
INTRODUCTION A 2011 2012

Si rejetée au risque de première espèce

Degré de liberté
Origine des variances Somme des carrées des écarts DDL Carrés moyens
Variance expliquée 1
let
Variance résiduelle
u
Variance totale
y On calcule séparément, on montre que

Test du coefficient de détermination

RDD :

- Si acceptée au risque de première espèce


- Si rejetée au risque de première espèce

V. Utilisation du modèle de régression en prévision

Prévoir la valeur moyenne de la variable expliquée pour une valeur donnée de la variable
explicative connaissant la valeur .
On construit un intervalle de confiance de cette valeur

On va se demander maintenant si une prévision ponctuelle donnée ( est


compatible avec la relation linéaire dont on a estimé les paramètres.

1
Rho
NOMETRIE Page 26
INTRODUCTION A 2011 2012

A. correspondant à une valeur de : Intervalle de confiance

de telle sorte que soit la meilleure prévision linéaire


-à-dire, il faut que soit un estimateur BLUE ; On doit calculer son espérance
est de variance
minimale.

- Calcul de la variance (qui doit être minimale)

Cf. Polycop « Démonstration : doit être minimale »

- Calcul de variance de

2
: Sachant que
NOMETRIE Page 27
INTRODUCTION A 2011 2012

Y ⼆xtpxota
yiitpx.TN
代们 厩
哦⼘城城

tliltx.tl

Xtpx
N
ii icxi

Ǘtǖixi
Exit n Tun T
⼀ ⼰
忙nT
T

i

1 1
U

NOMETRIE Page 28
INTRODUCTION A 2011 2012

B. prévision ponctuelle à la droite des moindres carrés

On souhaite obtenir un intervalle pour et regarder si la valeur prévue est compatible


avec la valeur moyenne de sachant

Supposons que la relation estimée soit valable pour trouver

Il convient donc de chercher la loi de : Comme obéit à une loi normale, obéit à
une loi normale aussi.

Les estimateurs sont biais, donc ils disparaissent quand ils sont soustraits aux
paramètres.

et de variance

NOMETRIE Page 29
ix
Est-ce que le point de nuage de régression obtenu par ce couple de valeur YoY
Est-ce que ce point peut être considéré comme appartenant à la droite de régression

INTRODUCTION A 2011 2012

U
tl

1
1 1
U

幽 以
RDD :
兹1幻
- Si acceptée au risque de première espèce
- Si rejetée au risque de première espèce

NOMETRIE Page 30
INTRODUCTION A 2011 2012
normalit

hemothiitemenantowuh.to

Modèle linéaire générale simple àz variables

hypothèses et on va les tester. Nous sommes donc amenés à nous poser trois questions :
– Comment déterminer un nouvel estimateur pour a ?
– Comment détecter une éventuelle autocorrélation des erreurs ?
– Quelles méthodes d’estimation doit-on utiliser ?

I.

Il existe deux tests :

- Le test de Skewness-Kurtosis
- Le test de Jarque-Bera

A. Test de Skewness-Kurtosis

Test de Skewness

Hi pas
Skene mi
t (6 et pas !!)
ri
six
i
rp rrd.ly 䇮 红则
i
RDD : Prob
I ⽚ th
- Si acceptée au risque

𨰻
- Si rejetée au risque

Test de Kurtosis :

Hipas

Kurt A
4
Kurt : Le coefficient d’aplatissement de Pearson

NOMETRIE ri Page 31
INTRODUCTION A 2011 2012

RDD :

- Si accepté au risque

- Si rejetée au risque

B. Test de Jarque-Bera

Hi nonnormal
RDD :

- Si accepté au risque
- Si JB rejetée au risque

II. Le problème de
della

A.

On se place ici dans un modèle de série temporelle.

Les erreurs sont inconnues. Seuls les résidus apportent une information sur les
erreurs tion concernent donc les résidus.

significativement différent de 0, entre la chronique des résidus et elle-


plusieurs pas de temps.

corrélogramme.

NOMETRIE Page 32
INTRODUCTION A 2011 2012

Exemple :

retard

non autocorrélation. Cela signifie que toutes les autocorrélations successives doivent être
significativement proches de 0 (barres courtes).

résidus :

Autocorrélation positive

Autocorrélation négative

NOMETRIE Page 33
INTRODUCTION A 2011 2012

B.

- Le modèle ignore une variable explicative


- Les variables de départ étaient saisonnières
- Les variables contiennent des phénomènes exceptionnels, mal expliqué par le modèle
?)
- Les variables de départ des non-informations qui ont été corrigés par interpolation
linéaire
- Les variables -à-
peuvent contenir des tendances déterministes (Trend linéaire) ou stochastique

C.

- Les estimateurs restent sans biais


- gression ne sont plus minimales
-

D.

1 : le test de Durbin-Watson


lift n tnt
Abs

Hi Pto

0 2 4
Autocorrélation Autocorrélation acceptée Autocorrélation Autocorrélation
positive négative positive négative

Si

Test pour une autocorrélation supérieure à 1 : Le test de Ljung-Box

k
NOMETRIE Page 34
INTRODUCTION A 2011 2012

ARIK

RDD :

- Si acceptée au risque
- Si rejetée au risque

III. Le

A. Glejser

Test de la nullité de la pente de la droite :

RDD :

- Si acceptée au risque
- Si rejetée au risque

Si est rejetée, alors il y a hétéroscédacticité

B. (processus) ARCH

Multiplicateur de Lagrange
IM

NOMETRIE Page 35
INTRODUCTION A 2011 2012

RDD :

- Si acceptée au risque (homoscédacticité)


- Si rejetée au risque

C. White

explicatives à
niveau ( ) et avec aussi le carré de ces variables.

(Homoscédacticité)

Le degré de liberté du égale au multiplicateur de Lagrange est égale au nombre de


variables explicatives.

RDD :

- Si acceptée au risque
- Si rejetée au risque

Il existe une deuxième façon de faire le test : on utilise la statistique de Fisher, comme
pour le test du paramètres.

D. Goldfeld-Quandt

Ce test -

On ordonne les observations des variables en fonction des valeurs croissantes


de

NOMETRIE Page 36
INTRODUCTION A 2011 2012

Soit . On obtient 2 sous-


correspond aux faibles valeurs de On applique la méthode des
MCO sur les observations faibles et sur les observations fortes.

Homoscédacticité

Hétéroscédacticité

RDD :

- Si acceptée au risque

- Si rejetée au risque

IV. Robustesse du MLGS (Modèle Linéaire Général Simple)

Un modèle est dit « robuste Dans


ce cas, il nous faut étudier le modèle sous plusieurs sous-périodes. Par exemple, la relation
« prix/récolte du vin » est-
marché commun en 1970 ?

Un modèle est dit « robuste » si quelque-soit les sous-ensembles constitués à partir


les estimateurs du même modèle sur chacun
de ces sous-ensembles sont :

- Valide : Il faut tester la significativité des paramètres, du , de Durbin-Watson


- Stable : Les paramètres estimés ne sont pas significativement différents. 3 tests :
o Test de comparaison de 2 coefficients de régression :
o
o Test de comparaison de 2 coefficients de corrélation

A. Test de comparaison de 2 coefficients de régression

NOMETRIE Page 37
INTRODUCTION A 2011 2012

RDD :

- Si acceptée au risque
- Si rejetée au risque

Même chose pour les

B.

On appelle la somme des carrés des résidus du modèle sur toute la période, la
somme des carrés des résidus de la régression sur chaque sous-période (
sous-périodes).

Le test consiste à faire une comparaison entre et

RDD :

- Si acceptée au risque (Stabilité)


- Si rejetée au risque

C. Test de comparaison de 2 coefficients de corrélation

Soit 2 sous périodes et , respectivement les coefficients de corrélation de la sous

NOMETRIE Page 38
INTRODUCTION A 2011 2012

r de son espérance mathématique parce que la distribution est


fortement asymétrique pour des valeurs éloignées de 0.

Comme on ne peut pas comparer les deux coefficients de corrélation, Fisher a proposé
:

RDD :

- Si acceptée au risque (Stabilité)


- Si rejetée au risque

NOMETRIE Page 39
瞧 end
笮 nhdep.int
1
i
8 Ī

⼆次的
if if D1AGN
diagonale

hi
多重共线性

9cm
A
lananauoddetlAkanan

an.tn


fermion


conti exh

Hddi⽐

1 到
11 in

Hdhé

Vous aimerez peut-être aussi