Académique Documents
Professionnel Documents
Culture Documents
Plan
1 Introduction
2 Modèle
4 Qualité d’ajustement
6 Commande R et interprétation
Objectif
Après avoir expliciter les hypothèses nécessaires et les termes du modèle, les notions
d’estimation des paramètres du modèle (moindres carrés) sont discutées de même
que les outils de diagnostics (graphe des résidus, colinéarité).
Introduction
Etudier la liaison entre une variable quantitative à expliquer Y et une suite
de variables quantitatives explicatives X1 , . . . , Xk .
Modèle
Y = β0 + β1 X1 + · · · + βk Xk + ε
où βj = paramètres fixes(mais inconnus)
ε = terme aléatoire de moyenne 0 et d’écart-type σ
Vocabulaire :
Y X1 , X2 , . . . , Xk
Variable à expliquer Variables explicatives
Variable dépendante Variables indépendantes
Variable endogène Variables exogènes
Exemples
Expliquer en fonction
• Superfice
• Standing
Prix d’un appartement • Quartier
• Sécurité
• Proximité de commerce
• Cylindrée
• Taille
Prix d’une voiture • Vitesse maximale
• Origine
• Niveau de finition
Modèle
Yi = β0 + β1 xi1 + · · · + βk xik + εi
☛ Les variables aléatoires ε1 , . . . , εn sont supposées êtres distribuées selon des lois
normales.
Objectif:
Prédire la consommation (Y ) en fonction des différents paramètres
Modèle
Ecriture du modèle: Sur un échantillon de n observations i.i.d
Y1 = β0 + β1 x11 + · · · + βk x1k + ε1
Y2 = β0 + β1 x21 + · · · + βk x2k + ε2
.. ..
. .
Yn = β0 + β1 xn1 + · · · + βk xnk + εn
Ecriture matricielle :
Y = X β + ε
n×1 n × (k + 1) (k + 1) × 1 n×1
Y1 1 x11 x12 . . . x1k β0 ε1
. . .. .. ..
. ; X = .. .. ; β = ... ; ε = ..
Y =
. . . . . .
Yn 1 xn1 xn2 . . . xnk βk εn
Modèle
2
L’ensemble des équations associées à chacune des observations, pour
i = 1, . . . , n, s’écrit matriciellement:
Y =X β+ε
2
Les hypothèses faites sur les termes aléatoires ε1 , . . . , εn s’écrivent:
E[ε] = 0 ; E[ε ε′ ] = σ 2 In
2
Enfin, on suppose
rang(X) = k + 1
Remarque:
Pour que les calculs soient possibles, il faut éviter qu’une(ou plusiuers) des vari-
abes explicatives soit une combinaison linéaire exacte des autres variables ex-
plicatives.
10
β0 , β1 , . . . , βk
11
βb = (X ′ X)−1 X ′ y
Remarque:
Cette expression est importante, elle montre qu’il est nécessaire d’inverser la
matrice X ′ X . Les problèmes pratiques rencontrés en régression (par exemple la
multicolinéarité) sont liés à cette inversion.
12
Exemple
Commande R:> lm
Modèle estimé
13
Qualité d’ajustement
n
X n
X n
X
2 2
(yi − y) = (ŷi − y) + (yi − ŷi )2
|i=1 {z } |i=1 {z } |i=1 {z }
14
Qualité d’ajustement
Coefficient de détermination:
SCE
R2 =
SCT
Remarque:
R2 est en fonction du nombre des variables explicatives dans le modèle.
p ↗ =⇒ R2 ↗
15
Exemple
Modèle estimé
16
17
18
Fonction R à utiliser
19
> summary(modele)
20
21
22
> plot(res$fitted.values,res$residuals,
+ ylab="Résidus",pch=16,cex=0.75,col="blue")
23