Vous êtes sur la page 1sur 10
Introduction à l’économétrie II. Modèle de régression linéaire simple Claudio Araujo CERDI, Université
Introduction à l’économétrie
II. Modèle de régression linéaire simple
Claudio Araujo
CERDI, Université d’Auvergne
Clermont-Ferrand, France
www.cerdi.org
http://www.cerdi.org/claudio-araujo/perso/
1. Dépendante, endogène, expliquée, régressant, de réponse Licence 3
1.
Dépendante, endogène, expliquée,
régressant, de réponse
Licence 3

Définition et modélisation économétrique

L’estimation du modèle peut être ponctuelle (obtention d’une valeur spécifique du paramètre) ou par intervalle (la vraie valeur du paramètre est comprise dans un intervalle de confiance). Le plus souvent, on s’intéresse aux propriétés d’une variable conditionnellement à d’autres variables.

Propriété conditionnelle : espérance d’une variable y conditionnelle à la variable x. E(y|x) = f(x)

Indépendante, exogène, explicative, régresseur, de contrôle
Indépendante, exogène, explicative,
régresseur, de contrôle

14/09/2013

1. Définition et modélisation économétrique a) Présentation du modèle • Une régression économétrique
1.
Définition et modélisation économétrique
a)
Présentation du modèle
Une régression économétrique permet de décrire et
d’évaluer la relation entre une variable dépendante (y) et
une ou plusieurs variables indépendantes (x k ).
Dans le modèle de régression simple, k = 1.
Dans le modèle de régression multiple, k > 1.
Afin
d’obtenir
des
information
des
variables
pour
l’ensemble
d’une
population,
on
fait
de
l’inférence
statistique.
Inférence statistique : consiste à obtenir des informations sur
la population à partir de l’échantillon.
Echantillon : sous-ensemble de la population étudiée.
Licence 3
1. Définition et modélisation économétrique • – – • – Cas d’une régression linéaire simple
1. Définition et modélisation économétrique
– Cas d’une régression linéaire simple :
(
y
=
y
x
,
) =
+
x
+
i
i
i
i
1
2
i
i
Licence 3

Dans une régression, la variable y et la (ou les) variable(s) x est (sont) traitée(s) de manière asymétrique.

La variable y est supposée être aléatoire ou stochastique.

La (ou les) variable(s) x est (sont) supposée(s), au sens strict, avoir des valeurs fixes d’un échantillon à l’autre.

En raison du caractère aléatoire de y, les valeurs observées dévient de leur espérance conditionnelle. Cette déviation est qualifiée d’écart aléatoire ( ).

1 : ordonnée à l’origine (constante - intercept) 2 : pente, mesure l’impact marginal, ceteris paribus, de x sur y.

à l’origine (constante - intercept ) 2 : pente, mesure l’impact marginal, ceteris paribus , de
1. Définition et modélisation économétrique b) Rôle des erreurs stochastiques • Calculer la valeur théorique
1. Définition et modélisation économétrique
b) Rôle des erreurs stochastiques
Calculer la
valeur
théorique
de
y,
sachant
que
1 = 1000 et 2 = 0,8 ; dans le cas d’une régression linéaire.
Revenu
Consommation
Consommation
C obs – C th
disponible (x)
observée (y)
théorique
9
000
8
170
8 200
– 30
9
500
8 800
8 600
200
11
000
9 700
9 800
– 100
12 000
10 500
10 600
– 100
13 500
11 200
11 800
– 600
11 000
9 674
Moyenne
Licence 3

:

700 9 800 – 100 12 000 10 500 10 600 – 100 13 500 11
1. Définition et modélisation économétrique • Interprétation de l’écart aléatoire : – Du point de
1.
Définition et modélisation économétrique
Interprétation de l’écart aléatoire :
Du point de vue statistique : réalisation d’une variable
aléatoire, ayant sa propre distribution de probabilité pour
chaque i (ou t, dans le cas des TS).
Du point de vue économique :
Erreur de spécification : la seule variable explicative n’est pas
suffisante pour rendre compte de la totalité du phénomène
expliqué.
Erreur de mesure : les données ne représentent pas
exactement le phénomène.
Erreur de fluctuation d’échantillonnage : les observations
comprises dans l’échantillon, et donc les estimations, peuvent
être différentes.
Conséquences des termes aléatoires
Licence 3

14/09/2013

1. • – – – – On peut obtenir une estimation de appelé résidu. y
1.
On peut obtenir une estimation de
appelé résidu.
y =
+
x +
i
1
2
i
i
Licence 3

perturbation stochastique) au processus.

;

Définition et modélisation économétrique

On remarque que la relation spécifiée entre y et x ne peut pas être déterministe.

Le processus de génération des données (PGD) est inconnu.

Il est souvent impossible d’observer la totalité des

variables y et x de la population. On doit ajouter un terme aléatoire, (terme d’erreur ou

le

estimé est

des variables y et x de la population. On doit ajouter un terme aléatoire, (terme d’erreur
1. c) Méthodes d’estimation • Méthode des moments – être estimé par les moments de
1.
c) Méthodes d’estimation
• Méthode des moments
être
estimé
par
les
moments
de
variance, …).
Licence 3

Définition et modélisation économétrique

Principe : l’estimation des moments de la population doivent

(moyenne,

l’échantillon

On estime plusieurs paramètres. Il doit y avoir autant de conditions sur les moments que de paramètres à estimer.

Dans le cas où le nombre de conditions sur le moments est supérieur au nombre de paramètres à estimer, le modèle est sur-identifié : utilisation de la méthode des moments généralisés (GMM).

Estimateurs robuste (problème des points aberrants).

Aucune hypothèse particulière concernant la distribution des écarts aléatoires est nécessaire.

des points aberrants). Aucune hypothèse particulière concernant la distribution des écarts aléatoires est nécessaire.
1. • – – – Licence 3
1.
Licence 3

Définition et modélisation économétrique

Méthode du maximum de vraisemblance

Principe : des populations différentes engendrent des échantillons différents. Il est plus vraisemblable qu’un échantillon donné provienne d’une population particulière.

La méthode consiste à estimer les paramètres inconnus de manière à maximiser la probabilité d’observer les y i sachant la valeur de x i .

On suppose que les y i ( i ) sont distribués normalement et indépendamment (nid) de moyenne 1 + 2 x i et de variance ².

i ) sont distribués normalement et indépendamment ( nid ) de moyenne 1 + 2 x
Exercices pratiques • Calculer la valeur théorique de demande d’essence sachant que : 1 =
Exercices pratiques
• Calculer la valeur théorique de demande
d’essence sachant que : 1 = – 0.117 et
2 = 0,168 ; dans le cas d’une régression linéaire.
Prix de
Demande
Demande
D obs – D th
l’essence
d’essence
théorique
0.054
0.011
Travailler avec la source des
données qui
est
sur
la
0.061
0.049
0.073
0.077
plateforme pédagogique.
Données en log ; période de
0.166
0.115
1960 à 1995.
0.469
0.054
D = f (P)
Moyenne
Licence 3

14/09/2013

1. • Méthode des moindres carrés – – Soit la régression suivante : y i
1.
• Méthode des moindres carrés
Soit la régression suivante :
y
i =
+
x
+
1
2
i
i
Licence 3

Définition et modélisation économétrique

Principe : estimation des moments de la distribution de la population autours de zéro.

On cherche les valeurs des coefficients 1 et 2 qui minimisent la somme des carrés des écarts aléatoires.

On cherche les valeurs des coefficients 1 et 2 qui minimisent la somme des carrés des
2. L’estimation des paramètres par les MCO a) La méthode des moindres carrés ordinaires (MCO
2.
L’estimation des paramètres par les MCO
a)
La méthode des moindres carrés ordinaires (MCO
/ OLS)
Cette méthode consiste à ajuster le nuage de points à
l’aide d’une droite en minimisant la distance au carré
entre chaque valeur observée et la droite d’estimation.
Cette
distance
mesure le résidu (ê) pour chaque
observation :
=
= y
i
i
i
i
Licence 3
2. L’estimation des paramètres par les MCO y y 4 . ^ ê { 4
2. L’estimation des paramètres par les MCO
y
y 4
. ^
ê
{
4
.
}
y 3
ê 3
.
y 2
{
ê 2
}
.
ê 1
y 1
x 1
x 2
x 3
x 4
x
Licence 3

^

E(y) = 1 + 2 x

{ 4 . } y 3 ê 3 . y 2 { ê 2 } .
2. L’estimation des paramètres par les MCO • On obtient les estimateurs 1 et 2
2. L’estimation des paramètres par les MCO
On obtient les estimateurs 1 et 2 à partir des équations normales :
n n
(
x
x
)(
y
y
)
x y
nxy
i
i
i
i
ˆ
= i = 1
=
i = 1
ˆ
ˆ
=
y
x
2
n
(
n 1
2
2
2
x
x
) 2
x
nx
i
i
i = 1
i = 1
C – Cm (y)
R - Rm (x)
(R – Rm)²
(C – Cm) * (R – Rm)
– 1 504
– 2 000
4
000 000
3
008 000
– 874
– 1 500
2
250 000
1
311 000
26
826
1 000
1
000 000
826 000
1 526
2 500
6
250 000
3
815 000
SOMME
13
500 000
8
960 000
Licence 3

14/09/2013

2. L’estimation des paramètres par les MCO b) Calcul des estimateurs Les estimateurs des coefficients
2. L’estimation des paramètres par les MCO
b) Calcul des estimateurs
Les estimateurs des coefficients sont obtenus en
minimisant la somme du carré des résidus (SCR)
N N
(
ˆ
ˆ
) 2
Min
2 Min
=
y
x
=
Min
i
i
1
2
i
,
1
2
i =
1
i = 1
Conditions de 1 er ordre
Conditions de 2 nd ordre
2
2 ∂
> 0
;
> 0
2
2
1
2
ˆ
ˆ
2
x y
x
i
x
2 = 0
i
1
i
2
i
Équations normales
i i
i
ˆ
ˆ
2
y
n
x
i = 0
i
1
2
i
i
Licence 3
2. • ^ – 1 = 2 373,26 (ordonnée à l’origine) ; ^ – 2
2.
^
– 1 = 2 373,26 (ordonnée à l’origine) ;
^
– 2 = 0,66 (pente de la droite)
asymétrique (y : aléatoire ; x : fixe).
Licence 3

L’estimation des paramètres par les MCO

En utilisant les données de consommation et revenu, on obtient les valeurs suivantes pour les estimateurs :

Le coefficient 2 mesure l’impact d’une variation du revenu sur la consommation ( 2 = y / x).

Interprétation (en supposant que x et y soient mesurés

en €) : Six varie d’1 point de %, y varie de 0,66 €.

Ne pas confondre régression et corrélation.

Dans une régression, les variables sont traitées de manière

Quant à la corrélation, les variables sont traitées de manière symétrique (x et y : aléatoires).

de manière Quant à la corrélation, les variables sont traitées de manière symétrique ( x et
2. L’estimation des paramètres par les MCO c) La corrélation • Lorsque deux phénomènes ont
2.
L’estimation des paramètres par les MCO
c)
La corrélation
Lorsque deux phénomènes ont une évolution commune, ils
sont « corrélés ».
La corrélation simple (multiple) mesure le degré de liaison
existant entre ces deux (plusieurs) phénomènes.
La corrélation entre les variables peut être positive, négative
ou non corrélées. Linéaire ou non linéaire.
Le coefficient de corrélation linéaire simple permet de
calculer l’intensité de la liaison. Il varie entre – 1 et 1.
N
(
x
x
)(
y
y
)
cov
(
i
i
x
,
y
)
i = 1
=
=
x y
,
N
N
x
y
(
2
(
2
x
x
)
y
y
)
i
i
i =
1
i
= 1
Licence 3
2. L’estimation des paramètres par les MCO • Limites de la corrélation – La relation
2.
L’estimation des paramètres par les MCO
Limites de la corrélation
La relation testée est linéaire.
Par exemple : l’équation d’un cercle donné par :
(x – x)² + (y – y)² = R²
Les variables x et y sont liées entre elles, mais leur
covariance est nulle, est donc = 0.
Une corrélation différente de 0, n’implique pas une
liaison d’ordre économique (ou physique ou autre) –
corrélation fortuite.
Par exemple : nombre de taches solaires et taux de
criminalité.
Licence 3

14/09/2013

2. L’estimation des paramètres par les MCO • • – Soit H0 : x,y =
2. L’estimation des paramètres par les MCO
Soit H0 : x,y = 0 ; HA : x,y π 0
*
2
t
>
t
n
2
Soit :
x , y
*
t
=
(
2
)
1
x , y
n
2
Licence 3

Ce coefficient est calculé à partir d’un échantillon d’observations et non pas sur la population.

On peut tester la significativité de ce coefficient à l’aide de la théorie des tests statistiques (t de Student empirique).

On rejette H0 ( est significativement différent de 0) au seuil ( = 0,05) et à N – 2 ddl, si :

empirique). On rejette H0 ( est significativement différent de 0) au seuil ( = 0,05) et
Exercices pratiques • Calculer le coefficient de corrélation. – Liaison entre rendement de maïs (x)
Exercices pratiques
• Calculer le coefficient de corrélation.
– Liaison entre rendement de maïs (x) d’une parcelle de terre et la
quantité d’engrais (y)
– Tracer le nuage de points, commenter, calculer le coefficient de
corrélation et tester sa signification ( = 5%)
Rendement
Engrais
Rendement
Engrais
Rendement
Engrais
16
20
28
32
32
41
18
24
29
28
34
41
23
28
26
32
24
22
31
36
Licence 3
3. a) Notion d’un estimateur • • y. • • x et/ou y peuvent être
3.
a) Notion d’un estimateur
y.
x et/ou y peuvent être continu ou discret.
ˆ
ˆ
(
)
=
, y
,
L
, y
;
x , x
,
L
, x
y 1
2
N
1
2
N
Licence 3

Identification et propriétés des estimateurs

Soit les variables aléatoires x et y, leurs distributions sont caractérisées par .

La population originale est composée de toutes les valeurs de x et

Le paramètre est une des caractéristiques paramétrique de cette population.

L’estimation de dépend de l’information de l’échantillon, on peut la décrire par une formule d’estimation : l’estimateur

L’estimateur a des propriétés que l’on distingue selon la taille de l’échantillon.

: l’estimateur L’estimateur a des propriétés que l’on distingue selon la taille de l’échantillon.
3. b) Propriétés sur petits échantillons • L’estimateur existe – – – Propriété proportion. –
3.
b) Propriétés sur petits échantillons
• L’estimateur existe
Propriété
proportion.
Niveau – niveau : y = 2 x
Log – niveau : % y
(100 2 ) x
Niveau – log : y = ( 2 / 100) % x
Log – log : % y
( 2 ) %
x
Licence 3

Identification et propriété des estimateurs

Modèle linéaire par rapport à ses paramètres.

Fonction couramment utilisé pour linéariser un modèle par rapport à ses paramètres : logarithme népérien (ou naturel).

importante : approximation d’une variation en

Différents types de fonctions et interprétation de 2

(ou naturel). importante : approximation d’une variation en Différents types de fonctions et interprétation de 2

14/09/2013

3. Identification et propriété des estimateurs Propriétés sur petit échantillon Propriétés sur échantillon de
3. Identification et propriété des estimateurs
Propriétés sur petit
échantillon
Propriétés sur échantillon de taille
infinie (propriétés asymptotiques)
Sans biais si
Asymptotiquement sans biais si
ˆ
E ( )=
(
lim
E
ˆ )=
n
Efficace si les 2 conditions
suivantes sont satisfaites:
Convergent si
ˆ
p lim
=
– Non-biaisé
(consistant en « franglais »)
– Variance minimale
Meilleur Estimateur linéaire
sans biais (BLUE) si les 3
conditions sont satisfaites:
Efficience asymptotique, si les 3
conditions sont satisfaites
– Distribution asymptotique avec
moyenne et variance finies
– Fonction linéaire des
– Convergent
observation de l’échantillon
– Variance asymptotique minimale
– Non-biaisé
– Variance minimale
Licence 3
3. Identification et propriété des estimateurs • L’estimateur est sans biais – L’erreur (conditionnelle)
3.
Identification et propriété des estimateurs
L’estimateur est sans biais
L’erreur (conditionnelle) est, en moyenne, nulle.
• E(
| x) = 0 → E( ) = 0
• , x) = 0 → E(
E(
| x) = 0 = E( ) → Cov(
. x) = 0
La variable x doit être strictement exogène par rapport au terme
d’erreur :
• x et ne sont pas corrélés au temps :
E( t | x t ) = 0 ⇒ Cov( t ,
x t ) = 0
• x n’a aucun effet décalé sur le terme d’erreur :
E( t | x t-s ) = 0 ⇒ Cov( t
,
x t-s ) = 0,
s > 0
• Le terme d’erreur n’a aucun effet décalé sur x :
E( t | x t+s ) = 0 ⇒ Cov( t ,
x t+s ) = 0 ⇒ Cov( t-s ,
x t ) = 0,
s > 0
Sous ces hypothèses la valeur moyenne des estimations est
égale à la valeur « vraie » du paramètre :
ˆ
E ( )=
Licence 3
3. Identification et propriété des estimateurs • L’estimateur est BLUE (best linear unbiased estimator) –
3.
Identification et propriété des estimateurs
L’estimateur est BLUE (best linear unbiased estimator)
La variance de l’erreur est constante (ou homoscédastique)
Elle ne dépend pas de x et ne varie pas au cours du temps
V(
| x) = V( ) = E(
²) =
²
Il n’y a pas de corrélation sérielle dans les erreurs
(indépendance sérielle des écarts)
Corr( t , s | x) = 0
Il n’y a pas de corrélation entre les erreur à l’instant t et une erreur
suivante (s > t) ou précédente (s < t).
Sous l’hypothèses de Gauss – Markov (existence, sans
biais et efficience), l’estimateur MCO est BLUE
Si une hypothèse est violée, l’estimateur n’est pas BLUE.
Licence 3
3. Identification et propriété des estimateurs c) Propriétés sur grandes échantillons de taille infinie
3.
Identification et propriété des estimateurs
c)
Propriétés sur grandes
échantillons de taille infinie
(propriété asymptotiques)
L’estimateur est « consistant »
(convergent)
– Un estimateur sans biais
est nécessairement
convergent, mais l’inverse
n’est pas vrai.
– Pour les données
(
ˆ
)
f
temporelles, il suffit que
E( t | x t ) = 0 pour qu’un
estimateur soit convergent.
– Un estimateur efficient ne
garantit pas, non plus, la
convergence d’un
estimateur.
ˆ
Licence 3

14/09/2013

3. f ( ˆ ) Illustrations graphiques Non-biaisé ( Efficience f ( ˆ ) ˆ
3.
f (
ˆ )
Illustrations graphiques
Non-biaisé
(
Efficience
f (
ˆ )
ˆ
Licence 3

Identification et propriété des estimateurs

( Efficience f ( ˆ ) ˆ Licence 3 Identification et propriété des estimateurs   ˆ
 

ˆ

) ˆ

= E

( Efficience f ( ˆ ) ˆ Licence 3 Identification et propriété des estimateurs   ˆ
3. Identification et propriété des estimateurs d) Caractéristiques de base de la distribution de ˆ
3.
Identification et propriété des estimateurs
d)
Caractéristiques de base de la distribution de
ˆ
(
ˆ
)
E
Moyenne
(
[
2
ˆ
)
ˆ
(
ˆ
)]
(
ˆ
2
)
[
(
ˆ
)] 2
Variance
Var
= E
E
= E
E
ˆ
Erreur d’échantillonnage
(
ˆ
)
Biais
E
Il peut avoir conflit entre
absence de biais et variance
Erreur Quadratique
(
ˆ
) 2
E
Moyen (MSE)
minimale. La minimisation de
l’EQM (MSE) est un moyen
d’arbitrer
Licence 3
3. Identification et propriété des estimateurs Variance minimale Biaisé Erreur Quadratique ( ˆ ) Moyen
3.
Identification et propriété des estimateurs
Variance minimale
Biaisé
Erreur
Quadratique
(
ˆ
)
Moyen (MSE)
f
Non-biaisé
Dispersion
(
ˆ
) 2
MSE = E
élevée
ˆ
[
(
)
(
)
]
2
ˆ
ˆ
ˆ
MSE
=
E
E
+
E
{[
[
(
2
ˆ
(
ˆ
)]
ˆ
)
]}
=
E
E
+
E
[
)]
2
ˆ
(
ˆ
[
(
ˆ
)
]
2
[
ˆ
(
ˆ
)][
(
ˆ
)
]
=
E
E
+
E E
+
2
E
E
E
Variance
(Biais)²
= 0
Licence 3
4. Inférence statistique b) Test sur un seul coefficient : t ratio • • 1.
4. Inférence statistique
b) Test sur un seul coefficient : t ratio
1.
2.
3.
4.
Licence 3

Estimation de 1 , 2 , 1 ² , 2 ² par MCO

Soit l’équation suivante : y i = 1 + 2 x i + i

Etapes pour effectuer un test sur un seul coefficient:

ˆ ˆ * * 2 2 t = ˆ ˆ 2
ˆ
ˆ
*
*
2
2
t
=
ˆ
ˆ
2

Calcul de la statistique t de Student empirique 2 * : valeur de 2 sous H0 Lorsque 2 * = 0 et que le test est bilatéral, t* est appelé le RATIO t de Student (t-ratio test).

Préciser les H0 et HA et choisir un seuil de significativité (taille du test, ). Seuil fréquent : 10%, 5% ou 1%.

Sous les hypothèses du modèle de régression classique, la statistique du t de Student empirique suit une loi de Student à N – K degrés de liberté (cte comprise ds k).

la statistique du t de Student empirique suit une loi de Student à N – K

14/09/2013

4. Inférence statistique a) Normalité des erreurs • • – Soit i → N(0, ²)
4. Inférence statistique
a) Normalité des erreurs
Soit i → N(0, ²)
ˆ
ˆ
i
i
(
)
i
i
N
0,1
t
, i
= (1,2)
(
n
2
V
i )
ˆ
ˆ
i
Licence 3

Sous les hypothèses du modèle de régression linéaire classique :

Les caractéristiques de l’échantillon reflètent, avec une certaine marge d’erreur, celles de la population.

Pour pouvoir induire les paramètres inconnus ( ) d’une population sur un échantillon issu de cette population, on pose l’hypothèse de normalités des erreurs

( ) d’une population sur un échantillon issu de cette population, on pose l’hypothèse de normalités
4. Inférence statistique 5. Pour un test bilatéral, avec k = 2, = ddl =
4. Inférence statistique
5.
Pour un test
bilatéral, avec
k
=
2,
=
ddl = N – K = 28
H0 : 2 = 2 *
Région de non
rejet (H0)
HA : 2 π 2 *
f(t)
H0
(1
)
½ ( %)
½ ( %)
90
%
t
- t /2
+ t /2
HA
HA
Licence 3
2 *

Utiliser la table statistique (Student) pour obtenir la valeur critique (quantile de la distribution, au-delà duquel l’hypothèse nulle est rejetée).

10%

et

N

=

30

;

Pour un test unilatéral : H0 : 2 = 2 * HA soit : 2
Pour un test unilatéral :
H0 : 2 = 2 *
HA soit : 2 > 2 * , si partie droite
HA soit : 2 < 2 * , si partie gauche
4. Inférence statistique 6. Utiliser la règle de décision suivante : – Pour un test
4. Inférence statistique
6. Utiliser la règle de décision suivante :
Pour un test bilatéral, H0 est rejetée si
ˆ *
2
2
2
ˆ > t
N
K
S
2
ˆ *
2
2
> t
ˆ
N
K
S
2
ˆ *
2
2
<
t
ˆ
N
K
S
2
Licence 3

Pour un test unilatéral dans la partie droite , H0 est rejetée si

Pour un test unilatéral dans la partie gauche, H0 est rejetée si

unilatéral dans la partie droite , H0 est rejetée si Pour un test unilatéral dans la
4. Inférence statistique d) Interprétation et observations • Les tests d’hypothèses permettent d’évaluer la
4. Inférence statistique
d) Interprétation et observations
Les tests d’hypothèses permettent d’évaluer la
estimé.
Licence 3

robustesse d’un modèle

Les tests d’hypothèses économiques sont conditionnés au non rejet de la spécification économétrique.

Le principe consiste à comparer des paramètres. Confrontation d’une hypothèse nulle (ou restreinte) – H0 à une hypothèse alternative (HA).

Rappel : Aucune hypothèse ne peut être définitivement infirmée. Elle est testé en liaison avec d’autres hypothèses auxiliaires.

Ne pas rejeter H0 contre HA signifie que H0 est provisoirement « acceptée ». Cela ne signifie nullement l’acceptation de H0.

Si une hypothèse nulle est rejetée à %, cela signifie que le résultat est qualifié de « significatif à % ».

Si H0 est rejetée à 1 %, elle sera aussi rejetée à 5 % et 10 %.

Un résultat peut être significatif au niveau statistique mais marginal sur le plan économique.

rejetée à 5 % et 10 %. Un résultat peut être significatif au niveau statistique mais

14/09/2013

4. Inférence statistique c) Intervalle de confiance 1. Estimation de 1 , 2 , 1
4. Inférence statistique
c) Intervalle de confiance
1.
Estimation de 1 , 2 , 1 ² , 2 ² par MCO
2.
3.
4.
L’intervalle de confiance est donnée par :
{(
ˆ
)
(
ˆ
)
}
t
S ˆ
,
+
t
S ˆ
2
N
K
2
N
K
2
2
5.
Licence 3

Choix du seuil de significativité, , pour obtenir un

intervalle de confiance à (1 – ) %. Par exemple si = 0,05, intervalle de confiance = 95%.

Utiliser la table statistique de Student pour obtenir la valeur critique, ddl = N – K.

On rejette H0, si 2 * se trouve à l’extérieur de l’intervalle de confiance

Le test bilatéral sur coefficient et l’intervalle de confiance aboutissent toujours aux mêmes conclusions.

confiance Le test bilatéral sur coefficient et l’intervalle de confiance aboutissent toujours aux mêmes conclusions.
4. Inférence statistique • Schématiquement : 2 sous-régions Rejet de H0 Non rejet de H0
4. Inférence statistique
• Schématiquement : 2 sous-régions
Rejet de H0
Non rejet de H0
Erreur de première espèce
Taille du test
seuil de signification
« p-value »
est la probabilité de
rejeter H0 sachant qu’elle
est vraie
Licence 3
4. Inférence statistique • • La décision se traduit par 2 erreurs : et antagonistes
4. Inférence statistique
La décision se traduit par 2 erreurs : et antagonistes
Décision
H0
HA
Hypothèses
H0
Pas d’erreur
vraies
HA
Puissance
d’un test
Plus la région d’acceptation est grande plus est élevée
Obs : ne pas confondre ici et avec les paramètres du modèle

Il n’est pas exclu d’accepter H0 sachant qu’elle est fausse – Erreur de deuxième espèce ( )

(1 – ) : puissance d’un test. Mesure de la probabilité de rejeter H0 sachant qu’elle est fausse

L’erreur de première espèce est plus grave que l’erreur de deuxième espèce

rejeter H0 sachant qu’elle est fausse L’erreur de première espèce est plus grave que l’erreur de
5. ANOVA b) Coefficient de détermination • • SCE SCR 2 R = =1 SCT
5.
ANOVA
b) Coefficient de détermination
SCE
SCR
2
R
=
=1
SCT
SCT
Le R² varie entre 0 et 1.
Licence 3

L’ajustement par la droite des MCO est meilleur quand SCE est proche de SCT

Pour mesurer la qualité d’ajustement (goodness-of-fit) on utilise le coefficient de détermination, R².

Plus le R² est proche de 1, mieux est l’ajustement de la droite de régression. Mais l’objectif n’est pas de maximiser le R².

est proche de 1, mieux est l’ajustement de la droite de régression. Mais l’objectif n’est pas

14/09/2013

5. ANOVA (ANalysis Of VAriance) a) Equation fondamentale N N 2 SCT = y ∑
5.
ANOVA (ANalysis Of VAriance)
a) Equation fondamentale
N
N
2
SCT
= y
(
)
2
y
i
SCR
=
(
y
y ˆ
)
=
i
i
i = 1
i
= 1
N
SCE
= y
(
2
y
ˆ
)
i
i = 1
SCT = SCE + SCR
Cf. démonstration dans
l’ABC d’E page 55
Somme des carrés expliquée
Licence 3

i

2

i

Somme des carrés des résidus
Somme des carrés des résidus
Exercices pratiques • • Licence 3
Exercices pratiques
Licence 3
Exercices pratiques • • Licence 3 Calculer le coefficient de détermination pour les modèle de consommation.

Calculer le coefficient de détermination pour les modèle de consommation.

Vous devez calculer : SCT, SCE et SCR à partir du tableau contenant, le revenu disponible et la consommation observée.

Calculer le coefficient de détermination pour les modèle de demande d’essence en fonction du prix.

observée. Calculer le coefficient de détermination pour les modèle de demande d’essence en fonction du prix.