Académique Documents
Professionnel Documents
Culture Documents
Statistique Descriptive
Chapitre III : Corrélation
et ajustement linéaire
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Introduction
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Introduction
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
1. : Diagramme de disperssion
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Diagramme de dispersion
De…nition
Pour étudier les relations ou corrélations entre deux variables statistiques,
on peut les porter sur un graphe : Diagramme de disperssion.
Le diagramme de dispersion d’une variable Y en fonction d’une autre
variable X est formé des points (xi, yi), et donne une idée de la façon dont
varie, en moyenne, la variable Y en fonction de la variable X.
De façon analogue, on dé…nit le diagramme de régression de X en
fonction de Y.
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Exemple :
Tracer le diagramme de dispersion pour les deux variables : Y = f(X) . Les
notes de mathématique (X) et de statistique (Y) obtenues pour 12 étudiants.
N 1 2 3 4 5 6 7 8 9 10 11 12
xi 11 14 09 12 10 06 15 12 10 10 08 13
yi 10 15 11 11 09 08 14 13 11 12 10 12
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
2. : La covariance
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
De…nition
La covariance de deux variables statistiques est la moyenne arithmétique des
produits des di¤érences des observations par rapport à leur moyenne ;
x1 , x2 , x3 , . . . . . . xi , ......, xn
y1 , y2 , y3 , . . . . . . yi , ......, yn
n
1
Cov (X , Y ) =
n ∑ ( xi x )(yi y) (1)
i =1
n
1
=
n ∑ xi yi xy (2)
i =1
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Exemple :
Example
Les notes de mathématique (X) et de statistique (Y)
obtenues de 12 étudiants.
N 1 2 3 4 5 6 7 8 9 10 11 12
xi 11 14 09 12 10 06 15 12 10 10 08 13
yi 10 15 11 11 09 08 14 13 11 12 10 12
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
xi yi yi Y xi X xi X yi Y
1 11 10 -1,33 0,17 -0,23
2 14 15 3,67 3,17 11,63
3 9 11 -0,33 -1,83 0,6
4 12 11 -0,33 1,17 -0,39
5 10 9 -2,33 -0,83 1,93
6 6 8 -3,33 -4,83 16,08
7 15 14 2,67 4,17 11,93
8 12 15 1,67 1,17 1,95
9 10 11 -0,33 -0,83 0,27
10 10 12 0,67 -0,83 -0,56
11 8 10 -1,33 -2,83 3,76
12 13 12 0,67 2,17 1,45
130 136 47,67
Nous avons : X = 10, 83 et Y = 11, 33
On trouve :
n
1 47, 67
Cov (X , Y ) =
n ∑ ( xi x )(yi y) =
12
= 3, 97
i =1
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
1 Propriétés de la covariance :
- Symétrie : Cov (X , Y ) = Cov (Y , X )
- Bilinéarité : * Cov (X + Y , Z ) = Cov (X , Z ) + Cov (Y , Z )
Cov (aX , Y ) = a.Cov (X , Y ) a 2 IR
On en déduit :
Var (aX + bY ) = Cov (aX + bY , aX + bY )
= a2 .Var (X ) + b2 .Var (Y ) + 2a.b.Cov (X , Y )
2 Interprétation :
La relation entre deux variables statistiques est croissante ou décroissante, c’est
à dire selon que les valeurs élevées d’une série correspondent aux valeurs
élevées de l’autre ou l’inverse, selon que la covariance est positive ou négative.
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
3. : La corrélation
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Corrélation
Quand il s’agit de mettre en évidence le lien qui peut exister entre deux
variables quantitatives X et Y on utilise le coe¢ cient de corrélation
linéaire ρxy .
Mais lorsqu’il s’agit de déterminer le degré de liaison entre une variable
qualitative X et une autre quantitative Y , on choisit dans ce cas le
rapport de corrélation η Y /X .
Cette corrélation est détectée à l’aide d’un autre moyen le khi deux χ2 si
les variables sont toutes les deux qualitatives.
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
De…nition
On appelle coe¢ cient de corrélation linéaire entre deux variables
statistiques X et Y, le rapport de leur covariance par le produit de leurs
écarts-types : ρ ;
ρ a pour objet de mesurer l’intensité de la liaison linéaire entre deux
variables statistiques X et Y :
Cov (X , Y )
ρ(X ,Y ) = (3)
σ(X ) .σ(Y )
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Interprétation
1 ρ = +1 : dans ce cas les points se trouvent tous sur une même droite
croissante, on parle de corrélation linéaire positive parfaite.
2 ρ = 1 : dans ce cas les points se trouvent tous sur une même droite
décroissante, on parle de corrélation linéaire négative parfaite.
3 ρ = 0 : dans ce cas il n’y a aucune dépendance linéaire entre les deux
variables, on parle de corrélation linéaire nulle.
4 0 < ρ < +1 : dans ce cas les deux variables varient en même sens, la
relation linéaire est faible ou forte selon que le coe¢ cient de corrélation
linéaire est proche de 0 ou +1.
5 1 < ρ < 0 : dans ce cas les deux variables varient en sens inverse, la
relation linéaire est faible ou forte selon que le coe¢ cient de corrélation
linéaire est proche de 0 ou -1.
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Exercice :
Example
Les notes de mathématique (X) et de statistique (Y)
obtenues de 12 étudiants.
N 1 2 3 4 5 6 7 8 9 10 11 12
xi 11 14 09 12 10 06 15 12 10 10 08 13
yi 10 15 11 11 09 08 14 13 11 12 10 12
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Solution
∑12 12 12 2
i =1 xi = 130 ∑i =1 yi = 136 ∑i =1 xi = 1480 ∑i =1 yi = 1586
12 2
12 130 136
∑i =1 xi yi = 1521 x = 12 = 10, 83
p
y = 12 = 11, 33
Sx2 = 1480
12 10, 83 2 = 6, 04 S x = 6, 04 = 2, 46
2 1586 2
p
Sy = 12 11, 33 = 3, 8 Sy = 3, 8 = 1, 95
Cov (X , Y ) = 3, 97
Cov (X ,Y )
ρ(X ,Y ) = σ .σ = 2,463,971,95 = 0, 82
(X ) (Y )
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Notion de régression
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
De…nition
La méthode la plus utilisée est la Méthode des Moindres Carrés (MMC).
b = f (x ) qui
Le problème d’ajustement consiste à trouver une fonction y
corresponde le plus exactement possible aux données de la série
statistique.
La MMC est une méthode d’ajustement qui consiste à minimiser la
somme des carrés des di¤érences entre les valeurs observées, yi , et les
bi par l’équation de la droite de régression :
valeurs estimées, y
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
De…nition
Il s’agit de déterminer les constantes a et b telle que l’expression
∑(yi ybi )2 soit minimum. Avec ybi = axi + b
a est appelée coe¢ cient de régression linéaire ou pente de la droite de
régression, il mesure la variation de la variable dépendante lorsque la
variable indépendante varie d’une unité.
b est appelée ordonnée à l’origine, il correspond à la valeur de la variable
dépendante pour une valeur nulle de la variable indépendante.
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Soit la fonction :
f (a, b ) = ∑(yi ybi )2 (7)
f (a, b ) est minimum lorsque les dérivées partielles de f (a, b ) par rapport à a
et à b sont nulles.
df df
=0 et =0 (8)
da db
n
df
= 2 ∑ xi . ( yi axi b) (9)
da i =1
n
df
= 2 ∑ ( yi a.xi b) (10)
db i =1
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Cov (X , Y )
a0 = et b 0 = x a0 y (12)
SY2
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Var (yb)
R2 = 1 (14)
Var (y )
Var (yb )
Var (Y )
: Proportion des sommes des carrés des écarts par rapport à la
moyenne(SCEy ) expliquée par la droite de régression.
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
SCED
R2 = 1 (15)
SCEy
Où : SCED = Sommes des Carrés des Ecarts par rapport à la droite D = e21 +
e22 + ... + e2n = (y1 - (a.x1 +b))2 + (y2 - (a.x2 +b))2 + ... + (yn - (a.xn +b))2
et SCEy = Sommes des Carrés des Ecarts par rapport à la moyenne = (y1 -
y )2 + (y2 - y )2 + ... + (yn - y )2
Si SCED est petite == > R2 est proche de +1, donc la qualité
d’ajustement est bonne (la droite de régression est un bon ajustement du
nuage de points).
Au contraire, si SCED est grande == > R2 est proche de 0, donc la
droite de régression n’est pas un bon ajustement du nuage de points.
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
L’extrapolation est d’autant plus pertinente qu’elle est réalisée près des
limites de l’échantillon.
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Example
n xi yi
1 11 10
2 14 15
3 09 11
4 12 11
5 10 09
6 06 08
7 15 14
8 12 13
9 10 11
10 10 12
11 08 10
12 13 12
N 130 136
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Solution
n xi yi xi2 yi2 yi xi ybi yi ybi
1 11 10 121 100 110 11,44 -1,44
2 14 15 196 225 210 13,45 1,55
3 09 11 81 121 99 10,10 0,90
4 12 11 144 121 132 12,11 -1,11
5 10 09 100 81 90 10,77 -1,77
6 06 08 36 64 48 08,09 -0,09
7 15 14 225 196 210 14,12 -0,12
8 12 13 144 169 156 12,11 0,89
9 10 11 100 121 110 10,77 0,23
10 10 12 100 144 120 10,77 1,23
11 08 10 64 100 80 09,43 0,57
12 13 12 169 144 156 12,78 -0,78
N 130 136 1480 1586 1521 136 0
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Solution
∑12 12 12 2 12 2
i =1 xi = 130 ∑i =1 yi = 136 ∑i =1 xi = 1480 ∑i =1 yi = 1586
12
∑i =1 xi yi = 1521 x = 130 12 = 10, 83
p
y = 136
12 = 11, 33
2
Sx = 12 1480 2
10, 83 = 6, 04 Sx = 6, 04 = 2, 46
p
Sy2 = 1586
12 11, 332 = 3, 8 Sy = 3, 8 = 1, 95
cov (X , Y ) = n1 ∑ni=1 xi yi xy = 1521
12 10, 83 11, 33 = 4, 05
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Solution
Connaissant la note de mathématique d’un étudiant, on peut estimer sa note
de statistique par la droite d’équation :
Y = aX + b telle que :
COV (X ,Y )
a= S x2
= 4,05
6,04 = 0, 67
b = y ax = 11, 33 0, 67 10, 83 = 4, 07
ybi = 0, 67xi + 4, 07
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU
Diagramme de dispersion
Covariance
Chapitre III : Corrélation et ajustement linéaire
Corrélation
L’ajustement linéaire
Solution
Connaissant la note de statistique d’un étudiant, on peut estimer sa note de
mathématique par la droite d’équation :
X = a0 Y + b 0 telle que :
COV (X ,Y ) 4,05
a0 = S y2
= 3,8 = 1, 07
b0 = x a0 y = 10, 83 1, 07 11, 33 = 1, 29
b
xi = 1, 07xi 1, 29
Université Mohammed V-Rabat - FSJES -Agdal Statistique Descriptive Enseignant : Hassane BELBIJOU