Académique Documents
Professionnel Documents
Culture Documents
0.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
0.2 Estimation du Modèle . . . . . . . . . . . . . . . . . . . . . . . . . . 2
0.2.1 Position du Problème . . . . . . . . . . . . . . . . . . . . . . . 2
0.2.2 Écriture matricielle . . . . . . . . . . . . . . . . . . . . . . . . 2
0.2.3 Hypothèses spéciques pour l'estimation du modèle . . . . . . 3
0.2.4 Estimation par la méthode MCO . . . . . . . . . . . . . . . . 4
0.3 Notion de tests sur les paramètres . . . . . . . . . . . . . . . . . . . . 7
0.3.1 Test individuel des paramètres : Le test de Student . . . . . . 7
0.3.2 Test Global des coecients : le test de Fisher . . . . . . . . . 9
0.3.3 Tableau de l'analyse de la variance . . . . . . . . . . . . . . . 11
Le modèle linéaire multiple
0.1 Introduction
y1 1 a0 1 x1,1 x1,2 · · · x1,k
1 x2,1 x2,2 · · · x2,k
y2 2 a1
Y = .. ; ε = .. ; a = .. ; X = ..
. . . .
yn n ak 1 xn,1 xn,2 · · · xn,k
Y = Xa + ε
2) V ar(t ) = σ 2 ∀t 1 ≤ t ≤ n.(Homoscédasticité)
3) Cov(t , t0 ) = 0 ∀t 6= t0 .
2) et 3) ⇒ l'hypothèse
H3)t XX est inversible, c.a.d que (t XX)−1 existe ⇒ rg(t XX) = k, si ce n'est pas le
cas le système est défaillant
On rappelle cours d'Algèbre que le rang d'une matrice est le nombre de
vecteurs linéarements indépendants, et qu'une matrice est inversible si
son rang est égale au nombre de vecteurs linéarements indépendants.
H4) : Le nombre des composantes n est supérieur au nombre de variables expli-
catives c.a.d (n > k + 1).
Y = Xa + ε
Théorème 0.1. Gauss-Markov : L'estimateur MCO de a est â = (t XX)−1 )t XY .
Il est sans biais E(â) = a et de matrice de variance covariance Γ = V ar(â) =
σ 2 (t XX)−1 . En plus â est qualié de BLUES.
Pour n = 3
V ar(aˆ0 ) cov(aˆ0 , aˆ1 ) cov(aˆ0 , aˆ2 )
Γ = cov(aˆ1 , aˆ0 ) V ar(aˆ1 ) cov(aˆ1 , aˆ2 )
cov(aˆ2 , aˆ0 ) cov(aˆ2 , aˆ1 ) V ar(aˆ2 )
ATTENTION ! ! ! ! !
On distingue trois types d'écriture que vous devez pouvoir les nuancer.
1) Y = Xa + ce qu'on appelle le modèle théorique.
2) Y = Xâ + et le modèle estimé l'erreur et est connue, et qui dière de t qui
est une erreur aléatoire inconnue.
3) Ŷ = Xâ le modèle ajusté
Exemple 0.4. Dans le modèle linéaire simple du chapitre précédent, la consomma-
tion des ménages dépend d'un seul facteur observé, le revenu, et de facteurs non
observés captés par le terme d'erreur.
Or parmi les facteurs qui déterminent les diérences de niveaux de dépense entre
les ménages, nous pouvons aussi penser que la taille des ménages zt a une inuence
importante le modèle doit s'écrire alors :
Ct = a0 + a1 Rt + a2 Zt + t 1 ≤ t ≤ 60.
On est en présence d'un modèle linéaire multiple, à partir de la MCO évoquée dans
le théorème de Markov on va essayer d'estimer le vecteur a des paramètres donnés
par
a0
a = a1
a2
A partir des données récoltées de 60 ménages dans un panel pris dans la population
française les valeurs sont exprimées en Euros :
6 TABLE DES MATIÈRES
60 142328, 6 224
t
XX = 142328, 6 347583119, 55 546314, 1
224 546314, 1 910
127639, 4
t
XY = 310332128, 4
492674, 1
Vous avez bien réalisé via cet exemple l'intérêt de telle étude pour aider les or-
ganismes à dénir le montant des aides.
0.3 Notion de tests sur les paramètres 7
On a â ,→ N (ai , σ2 (t XX)−1
i,i ).
Soit Ti la statistique du test :
â θ̂i σ N (0, 1)
Ti = p i = p ,→ q 2 = Tn−k−1 .
σ̂ (t XX)i,i σ (t XX)i,i σ̂ χn−k−1
n−p
Remarque 0.3. Le test de Student est très important. En eet, si dans un modèle
estimé un des coecients (hormis le terme constant) n'est pas signicativement dif-
férent de zéro, il convient d'éliminer la variable correspondante à ce coecient et
refait l'estimation sans cette variable. Cette cause de non signicativité peut être due
à deux choses.
I Une absence de corrélation avec la variable à expliquer.
I Une colinéarité trop élevée avec une des variables explicative.
Exemple 0.5. Reprenons l'exemple de la fonction de consommation pour illustrer
ces résultats sur les tests d'hypothèses. Le modèle retenu pour la fonction de consom-
mation après estimation par la MCO est :
Exemple 0.6. un autre exemple en Économie, et qui n'est pas le moindre, concerne
la fonction de production de Cobb-Douglass qui est une relation non linéaire entre
les facteurs de Production L :travail, K :capital q'on écrit par :Qi = ALαi Kiβ . avec
α+β =1
On peut passer au modèle linéaire multiple en composant avec le Logarithme népé-
rien on aura donc :
ln(Qi ) = ln(ALαi Kiβ ) = ln(A) + α ln(Li ) + β ln(Ki ) + i après un changement de
variable on a
qi = a + bli + cki + .
On sait que α et β sont les élasticités travail et capital et que α + β = 1.
Dans ce cas les rendements d'échelle sont constants.
Si α + β > 1 les rendements d'échelle sont croissants.
Si α + β < 1 les rendements d'échelle sont décroissants.
On peut donc réaliser diérents tests pour vérier ces inrmations.
H0 : α + β = 1
H1 : α + β 6= 1
Rendement d'échelle constants.
H0 : α + β = 1
H1 : α + β > 1
Rendement d'échelle croissants.
H0 : α + β = 1
H1 : α + β < 1
Rendement d'échelle décroissants.
Denition 0.1. On dit que F suit une loi de Fisher-Snedecor à (n1 , n2 ) degrés de
libertés qu'on note F (n1 , n2 ) si :
V1
F = n1
V2
avec V1 ,→ χ2n1 et V2 ,→ χ2n2 . et V1 et V2 indépendantes.
n2
Pn
i=1 (Ŷ −Ȳ )2 SCE R2
n − k − 1 R2
Proposition 2. On pose F = Pn k 2 =
ddl(SCE
SCR
= k
(1−R2
=
i=1 (et )
ddl(SCR)
k 1 − R2
n−k−1 n−k−1
suit une loi de Fisher à k, n − k − 1 degrés de libertés F (k, n − k − 1)
Ici R2 est le coecient de détermination linéaire déjà déni pour le modèle linéaire
SCE SCR
simple et qui est donné ici pour mémoire par R2 = =1− .
SCT SCT
la question qu'on se pose estla suivante est ce que le revenu et la taille des ménages
n'inuent pas sur la consommation ? autrement dit a1 = a2 = 0.
il s'git de formuler le test suivant avec α = 5% :
H0 : a1 = a2 = 0
H1 : ∃a1 ou a2 6= 0
Comme expliqué auparavant, il s'agit d'un test de validité globale, donc on utilise le
test de Fisher.
Comme au niveau des données, on a la valeur de R2 , donc on utilise la statistique
du test :
n − k − 1 R2
F = ,→ F (k, n − k − 1) = F (2, 60 − 2 − 1) = F (2, 57).
k 1 − R2
on accepte H0 si F ≤ cα avec p(F (2, 57) ≤ cα = 1 − α = 1 − 0, 05 = 0, 95.En
regardant la table de la loi de Fisher on trouve cα = 3, 15.
57 0, 988 0, 988
On calcule F = = 28, 5 × = 2346, 5.
2 1 − 0, 988 0, 012
On remarque que cette valeur de F = 2346, 5 3, 15 de très loin ce qui signie
qu'on rejette H0 de très loin et on peut armer que le modèle ainsi dénit est très
signicatif et que les variables revenu e taille des ménages inuent sur la consom-
mation.
On pourra aussi utiliser une autre façon de calul en utlisnat le SCR, le SCE en
SCE SCR
utlisnat le fait que R2 = =1− .
SCT SCT
Vous avez en exemple une sortie du logiciel SAS, les autres sortie des logiciels
(SPSS, EViews) dièrent un peu mais ont pratiquement tous ANOVA et partie de
parameter estimates.