Académique Documents
Professionnel Documents
Culture Documents
La corrélation La corrélation
Statistique descriptive de la relation entre X et Y: variation Covariance et nuage de points
conjointe (x i − x ) > 0
1. La covariance <0 (y i − y ) > 0
Contribution > 0
y
1 n
cov( x, y ) = ∑ ( xi − x )( yi − y )
n i =1 >0
<0
x
1 n
cov( x, y ) = ∑ xi yi − xy
n i =1
La corrélation La corrélation
2. Le coefficient de corrélation linéaire 2. Le coefficient de corrélation linéaire
« de Pearson » Indice de covariance absolu: -1 ≤ r ≤ 1
cov( x, y )
rxy =
s x2 s 2y X2 X2 X2
X2 X2 X2
X1
La corrélation La corrélation
3. Conditions d’utilisation 3. Conditions d’utilisation
Normalité
Homoscédasticité
La loi de probabilité du couple (X,Y) Y
est une loi normale à deux dimensions:
Notamment, pour chaque valeur de X, les valeurs Homoscédasticité
de Y sont normalement distribuées et vice-versa. La variance de Y est
indépendante de X et vice-
r=0 versa.
r = 0.8
Hétéroscédasticité
X
La corrélation La régression linéaire simple
Modèle: Yi = a + bXi + ei
La relation est linéaire
X = variable explicative
(« indépendante »), contrôlée
Y = variable expliquée
Y Y (dépendante ), aléatoire Y
Relation de causalité ≠
Linéarité Non-linéarité
interdépendance
X
X X
yi Mi
y = a+bx
On cherche le minimum de ∑( y i − ( a + bxi )) 2 = E ( a, b)
ei i =1
yˆ i ⎧ ∂E n
⎪ ∂a ∑
M’i
⎪ = 2(y i − (a + bx i ))(−1) = 0 (1)
ei = yi - (a + bxi)
Y ⎨ i=1
∑e ⎪⎩ ∂b ∑
2
i
minimale i i i
i=1
X xi
La régression linéaire simple La régression linéaire simple
2. L’estimation des paramètres 3. Qualité de l’ajustement
On peut alors prédire y pour x compris dans l’intervalle des Test a posteriori : étude du nuage de points/ du
graphe des résidus
valeurs de l’échantillon: yˆ i = aˆ + bˆ x i
Résidus
n
Relation non linéaire? SCET = ∑ ( yi − y ) 2 = ns y2
i =1
SCE Totale SCE reg.lin. (Expliquée) SCE hors reg.lin. (erreur) (cov( x, y )) 2
N N N
r2 =
∑ (Yi − Y )2 = ∑ (Y$i − Y )2 + ∑ (Yi − Y$i )2 s x2 s y2
i =1 i =1 i =1