Vous êtes sur la page 1sur 24

Chapitre II

Coefficient de corrélation
« correlation coefficient »
 Le coefficient de corrélation noté « r »
(coefficient de corrélation simple ; coefficient
de corrélation linéaire ; coefficient de
corrélation linéaire simple) est une mesure de
l’intensité (degré de liaison ) de la relation
linéaire entre deux variables (séries ;
caractères) quantitatives X et Y.

TOUFIK-Saïd_2017-2018 1
I. Aspects mathématiques

 On appelle coefficient de corrélation linéaire,


noté « rx,y » entre les variables quantitatives X et
Y, le nombre sans dimension, qui est égal au
quotient de la covariance entre X et Y par le
produit de leurs écarts-types :
n

cov( X , Y )
 ( x  x)( y  y)
i i
rx , y   i 1

 x y n n

 ( x  x)  ( y  y )
i 1
i
2

i 1
i
2

TOUFIK-Saïd_2017-2018 2
« suite » I. Aspects mathématiques

 où Cov(X,Y) est la covariance


mesurée entre X et Y ; σx et σy sont les
écarts-types respectifs de X et Y.
 Les valeurs possibles du coefficient
corrélation sont comprises entre -1
et 1. Donc, elles appartiennent à
l’intervalle [-1 ; 1].

TOUFIK-Saïd_2017-2018 3
« suite » I. Aspects mathématiques

 1 représente une relation positive


linéaire parfaite entre X et Y ;
 -1 représente une relation négative
linéaire parfaite entre X et Y ;
 0 représente l’absence de relation
linéaire entre X et Y (X et Y ne sont
pas corrélées) ;

TOUFIK-Saïd_2017-2018 4
« suite » I. Aspects mathématiques

 proche de 1, les variables X et Y sont


corrélées positivement (forte corrélation
linéaire ; corrélation forte ; corrélation
fortement positive). Ainsi, les deux
variables X et Y varient dans le même
sens : si X croît, Y croît ; si X décroît, Y
décroît) ;

TOUFIK-Saïd_2017-2018 5
« suite » I. Aspects mathématiques

 proche de -1, les variables X et Y sont


corrélées négativement (forte
corrélation linéaire ; corrélation forte ;
corrélation fortement négative). Ainsi, les
deux variables X et Y varient en sens
inverse : si X croît, Y décroît ; si X
décroît, Y croît) ;

TOUFIK-Saïd_2017-2018 6
« suite » I. Aspects mathématiques

 proche de 0, les variables X et Y sont


faiblement corrélées (faible corrélation
linéaire entre X et Y) ; il existe peut être
une liaison non linéaire entre X et Y.

TOUFIK-Saïd_2017-2018 7
« suite » I. Aspects mathématiques

+1
Corrélation forte Corrélation positive. Les deux variables
varient dans le même sens. Si X croît,
Y croît ; si X décroît, Y décroît.

Corrélation faible 0 Corrélation négative. Les deux variables


varient en sens inverse. Si X croit,
Y décroît ; si X décroît, Y croît.

Corrélation forte
-1

TOUFIK-Saïd_2017-2018 8
« suite » I. Aspects mathématiques

 Il n’en reste pas moins que l’on ne sait toujours


pas dire (pour l’instant), à partir de quel seuil la
liaison sera « bonne » ou « très bonne » ou «
mauvaise » ou « autre ».
 De façon calculée, on estime que, pour que la
corrélation linéaire entre deux variables
quantitatives soit reconnue comme bonne, il faut
que :

rx , y  0,866
TOUFIK-Saïd_2017-2018 9
« suite » I. Aspects mathématiques

 ce qui revient au même que rx,y soit supérieur à


+0,866, ou inférieur à -0,866 :
rx , y  0,866
 ou
rx , y  0,866

TOUFIK-Saïd_2017-2018 10
II. Visualisation graphique de la
corrélation

 Nous pouvons distinguer la corrélation linéaire,


lorsque tous les points du couple (x,y) des deux
variables semblent alignés sur une droite, de la
corrélation non linéaire lorsque le couple de
valeurs se trouve sur une même courbe d’allure
quelconque.
 En croisant les critères de linéarité et de
corrélation, nous obtenons cinq représentations
graphiques :

TOUFIK-Saïd_2017-2018 11
II.1. Visualisation graphique croisant la
corrélation positive et la relation linéaire

y Graphe 1

... .
.
. .
.

TOUFIK-Saïd_2017-2018 12
II.2. Visualisation graphique croisant la
corrélation négative et la relation linéaire

y Graphe 2

.
.. .
.
. .
.

TOUFIK-Saïd_2017-2018 13
II.3. Visualisation graphique croisant la
corrélation positive et la relation non linéaire

y
. Graphe 3
.
. .
. . .
. . .
. . .
. .
.
x

TOUFIK-Saïd_2017-2018 14
II.4. Visualisation graphique croisant la
corrélation négative et la relation non linéaire

y Graphe 4
.
. .
. .
.
.. .
.
..
. .. . .
..
x

TOUFIK-Saïd_2017-2018 15
II.5. Visualisation graphique de l’absence de
corrélation

y Graphe 5

. . .
. . .
. . .

TOUFIK-Saïd_2017-2018 16
III. Linéarité et corrélation

 Le tableau I (ci-dessous) croise les critères de


linéarité et de corrélation :

TOUFIK-Saïd_2017-2018 17
« suite » III. Linéarité et corrélation

 Tableau I : Linéarité et corrélation

Corrélation Corrélation Absence de


positive négative corrélation

Relation linéaire Graphe 1 Graphe 2 Graphe 5

Relation non Graphe 3 Graphe 4 Graphe 5


linéaire

TOUFIK-Saïd_2017-2018 18
IV. Remarques concernant l’interprétation du
coefficient de corrélation

 Quelques mises en garde dans l’interprétation


du coefficient de corrélation linéaire doivent être
effectuées :

TOUFIK-Saïd_2017-2018 19
« suite » IV. Remarques concernant
l’interprétation du coefficient de corrélation

 (1). Le coefficient de corrélation ne permet pas


d’établir une relation de causalité entre les
variables : on ne sait pas si X agit sur Y, ou si Y
agit sur X.
 Il appartient au spécialiste du domaine d’étude
de s’interroger sur un éventuel lien de causalité,
à partir de connaissances extérieures au
domaine statistique.

TOUFIK-Saïd_2017-2018 20
« suite » IV. Remarques concernant
l’interprétation du coefficient de corrélation

 En effet, l’ambition de l’étude de corrélation


n’est pas d’ «expliquer la causalité » mais de
mesurer l’intensité, la force des liaisons entre les
phénomènes réels.

TOUFIK-Saïd_2017-2018 21
« suite » IV. Remarques concernant
l’interprétation du coefficient de corrélation

 (2). L’absence de corrélation linéaire


(rx,y=0) ne signifie pas l’absence de lien
(indépendance). Il peut exister une
liaison fonctionnelle autre que linéaire
(parabolique, exponentielle, …etc.).
 Ainsi,

Pas de liaison linéaire,


mais possibilité d’une
rx,y = 0 liaison d’un autre type

TOUFIK-Saïd_2017-2018 22
« suite » IV. Remarques concernant
l’interprétation du coefficient de corrélation

 Voici un exemple de deux variables X et Y non


indépendantes (liées ; dépendantes) avec rx,y=0 :

X -2 -1 0 1 2

Y 4 1 0 1 4

TOUFIK-Saïd_2017-2018 23
« suite » IV. Remarques concernant
l’interprétation du coefficient de corrélation

 Le coefficient de corrélation linéaire entre deux


variables quantitatives indépendantes est nul,
mais la réciproque n’est pas vraie :

X et Y rx,y = 0
indépendantes

TOUFIK-Saïd_2017-2018 24

Vous aimerez peut-être aussi