Académique Documents
Professionnel Documents
Culture Documents
Plan
1 Introduction
2 Modèle
4 Qualité d’ajustement
5 Application R
Exemple introductif
Objectif:
Trouver une relation affine entre Y et X de la forme :
Y =b+aX
@UP-Maths Test paramétrique:2 échnatillons Statistiques
Introduction Modèle Estimation des paramètres Qualité d’ajustement Application R
Modèle
On note
• Y la variable aléatoire réelle à expliquer: variable endogène,
dépendante ou réponse.
Hypothèses
2
La distribution de l’erreur ε est indépendante de X OU X est fixe.
2
L’erreur est centrée et de variance constante (homoscédasticité):
E(εi ) = 0 V ar(εi ) = σ 2 ∀i = 1, ...., n
2
a et b sont des constantes, pas de rupture du modèle.
2
Les εi sont indépendantes.
Objectif:
✓ Déterminer, suivant la méthode des moindres carrés, une équation de la
droite (D) passant "le plus proche" possible des points du nuage.
Pour une séquence d’observations {(xi , yi )}i=1,....,n , le critère des moindres carrés
s’écrit :
n
X
a,b (yi − b − axi )2
i=1
En considérant que les dérivées partielles d’ordre 1 doivent s’annuler en l’extrêmum,
on obtient :
n
X n
X n
X
xi y i = a x2i +b xi
i=1 i=1 i=1
n
X n
X
yi = a xi + n b
i=1 i=1
10
Notons
• X la variable qui prend les valeurs (xi )
• Y la variable qui prend les valeurs (yi )
La résolution du système associé conduit à :
n
1X
xi yi − xy
n i=1 cov(X, Y )
a = n = 2
1X σX
(xi − x)2
n i=1
b = y − ax
En fixant a = y − bx, on constate que cet extremum est un minimum .
11
ybi = b + a xi
ei = yi − ybi
12
➪ Plus la variabilité résiduelle est faible, plus la part expliquée est importante.
13
Coefficient de détermination :
Le coefficient de détermination est un indicateur de la qualité de la régression
défini par :
SCE
R2 =
SCT
14
Cov(X, Y ) σY
a= 2 = R
σX σX
D’où :
Cov(X, Y )
R=
σX σ Y
15
Application R
16
Application R
17
Correction
> shapiro.test(resid(modele))
3 Pour voir les principales statistiques du modèle et la qualité d’ajustement du
modèle.
> summary(modele)