Académique Documents
Professionnel Documents
Culture Documents
Corré Et Regré Lineaire PDF
Corré Et Regré Lineaire PDF
Chapitre 8
Corrélation et régression
linéaire simple
José LABARERE
Année universitaire 2011/2012
Université Joseph Fourier de Grenoble - Tous droits réservés.
Plan
Annexes
Plan
Corrélation :
Liaison entre 2 variables quantitatives X et Y
Rôle symétrique (on peut permuter X et Y)
Rôle asymétrique
Régression :
Liaison entre 2 variables quantitatives X et Y
Rôle asymétrique uniquement :
X = variable explicative / Y = variable expliquée
X = variable indépendante / Y = variable dépendante
(on ne peut pas permuter X et Y)
I.2. Corrélation versus régression
ventes glaces
ventes glaces ventes lunettes
I.2. Corrélation versus régression
ventes lunettes
3. Exemple : régression
• X = âge (de 0 à 15 ans)
• Y = taille (cm)
• Il existe une liaison entre X et Y :
– Quand l’âge augmente, la taille augmente
– Quand l’âge diminue, la taille diminue
• La liaison est asymétrique :
– la taille dépend de l’âge mais l’âge ne dépend pas de la taille
– on ne peut pas permuter X et Y en abscisses et en ordonnées
• On peut prédire la taille par l’âge à l’aide d’une équation de droite ou
de courbe de régression (cf carnet de santé)
I.2. Corrélation versus régression
Corrélation Régression
Cas 1
Cas 2
Il existe une liaison entre X et Y mais cette liaison n’est pas linéaire :
Y varie avec les valeurs de X.
Le nuage de points n’est pas résumé au mieux par une droite mais
plutôt par une fonction quadratique.
La condition d’application n’est pas vérifiée
→ Il ne faut pas utiliser le coefficient de corrélation ni la régression
linéaire simple pour quantifier la liaison entre les 2 variables
Coefficient de corrélation non nul
Pente de la droite de régression non nulle
Cas 3
Cas 4
La nature de la liaison n’est pas linéaire (le nuage de points n’est pas
résumé au mieux par une droite mais plutôt par une fonction
exponentielle)
La condition d’application n’est pas vérifiée
→ Il ne faut pas utiliser le coefficient de corrélation ni la régression
linéaire simple pour quantifier la liaison entre les 2 variables
I.3. Conditions d’application de la corrélation et de la
régression linéaire simple
X i µ X Yi µ Y
cov X, Y i 1
N
N N
X µ X X i µ X X µX
2
i i
cov X, X i 1
i 1
varX
N N
II.1. Covariance
• X et Y indépendantes
cas particulier Y constant quelle que soit la valeur de X
X i µ X Yi µ Y
cov X, Y i 1
0
N
n n
n
x i y i
i 1 i 1
x y
i i
n
covX, Y i 1
n
2
n
n xi
x i2 i 1
n
Rappel : varX i 1
n
Plan
covX, Y
ρ
varX varY
-1ρ+1
II.2. Interprétation du coefficient de corrélation
1. X et Y indépendantes : ρ = 0
ρ=0
covX, Y
ρ 0
varX varY
II.2. Interprétation du coefficient de corrélation
2. X et Y corrélées : ρ > 0
ρ>0
• Liaison linéaire croissante entre X et Y
• cov(X, Y) > 0
covX, Y
ρ 0
varX varY
2. X et Y corrélées : ρ < 0
ρ<0
• Liaison linéaire décroissante entre X et Y
• cov(X, Y) <0
covX, Y
ρ 0
varX varY
population
ρ
échantillon
r
m x y i m y y my
n n n
x x mx
2 2
i i i
cov X, Y i 1
s 2x i 1
s 2y i 1
n - 1 n - 1 n - 1
II.3. Estimation du coefficient de corrélation
m x y i m y
n
x i
r i 1
y my
n n
x mx
2 2
i i
i 1 i 1
II.3. Estimation du coefficient de corrélation
n n
n
x i y i
i 1 i 1
x y
i i
n
r i 1
x
n 2
y
n 2
n 2 i 1 i n 2 i 1 i
x i y
i
i 1 n i 1 n
Plan
population
ρ
échantillon
r
rρ
r
→ t (n-2)ddl
sr
1 r²
L’estimateur de l’écart-type du coefficient de sr
corrélation est égal à : n2
II.4. Test du coefficient de corrélation
r n2
to
1 r²
Conditions d’application
• indépendance des observations
• liaison linéaire entre X et Y
• distribution conditionnelle normale et de variance constante
1–α
(non-rejet de H0)
α/2 α/2
(rejet de H0 = acceptation de H1) (rejet de H0 = acceptation de H1)
r n2
t
1 r²
-t α tα
0
|to| > tα |to| tα |to| > tα
Exemple :
• to = 2.12
• n = 20
Annexes
III.1. Régression linéaire simple
Y = α + βX
Y
Y : variable dépendante (expliquée)
X : variable indépendante (explicative)
α : ordonnée à l’origine (valeur de Y pour
x = 0)
β : pente (variation moyenne de la valeur
de Y pour une augmentation d’une unité
X de X)
Plan
Annexes
III.2. Estimation par la méthode des moindres carrés
(xi, yi)
Y
(xi, yi)
Y
^)
(xi, yi
Y = α + βX
^
yi = α + βxi
X
La droite de régression Y = α + βX est la droite qui résume le mieux le
nuage de points. Intuitivement, il s’agit de la droite dont les points du
nuage sont en moyenne les plus proches (c’est-à-dire la droite qui
passe à la plus faible distance de chaque point du nuage, en
moyenne).
III.2. Estimation par la méthode des moindres carrés
^i
yi - y
(xi, yi)
Y
^)
(xi, yi
Y = α + βX
^
yi = α + βxi
^)
(xi, yi
Y = α + βX
^
yi = α + βxi
Y Y = α + βX
my
mx
X
Y Y = α + βX
a et b sont les estimations de
l’ordonnée à l’origine α et de la my
pente β de la droite de
régression.
L’estimation de la pente de la
droite de régression b est égale
mx
au rapport de la covariance de X X
et Y sur la variance de X.
m x y i m y
n
cov X, Y x i
b b i 1
var X
n
x mx
2
i
i 1
III.2. Estimation par la méthode des moindres carrés
Y Y = α + βX
my
mx
X
Annexes
III.3. Test de la pente de la droite de régression
population
b≈β β
échantillon
b
b
→ t (n-2)ddl
sb
s 2y
2
b 2
s
L’estimateur de l’écart-type de la pente est égal à : sb x
n2
III.3. Test de la pente de la droite de régression
Conditions d’application
• indépendance des observations
• liaison linéaire entre X et Y
• distribution conditionnelle normale et de variance constante
Corrélation et régression
Corrélation Régression
• Variance
• var(X) = E(X²) – [E(X)]²
2
1 2 1
varx x x
n n
2
x
n
n i
i 1
x 2
i
n
varx i 1
n
Annexe : variance et covariance
• Covariance
• cov(X,Y) = E(XY) – [E(X) x E(Y)]
1 1 1
covx, y xy x y
n n n
n n
n
x i y i
i 1 i 1
x y
i i
n
covX, Y i 1
n
Mentions légales
L'ensemble de cette œuvre relève des législations française et internationale sur le droit d'auteur et
la propriété intellectuelle, littéraire et artistique ou toute autre loi applicable.
Tous les droits de reproduction, adaptation, transformation, transcription ou traduction de tout ou
partie sont réservés pour les textes ainsi que pour l'ensemble des documents iconographiques,
photographiques, vidéos et sonores.
Cette œuvre est interdite à la vente ou à la location. Sa diffusion, duplication, mise à disposition du
public (sous quelque forme ou support que ce soit), mise en réseau, partielles ou totales, sont
strictement réservées à l’université Joseph Fourier (UJF) Grenoble 1 et ses affiliés.
L’utilisation de ce document est strictement réservée à l’usage privé des étudiants inscrits à
l’Université Joseph Fourier (UJF) Grenoble 1, et non destinée à une utilisation collective, gratuite
ou payante.
Ce document a été réalisé par la Cellule TICE de la Faculté de Médecine de Grenoble (Université Joseph Fourier – Grenoble 1)
en collaboration avec l’Equipe Audiovisuel et Production Multimédia (EAEPM) de l’Université Stendhal de Grenoble.