Vous êtes sur la page 1sur 3

Nom :

2.3
Groupe : Date :
Manuel de l’élève, volume 1, p. 110

COEFFICIENT DE CORRÉLATION
Il est possible de quantifier l’intensité de la corrélation linéaire entre deux variables statistiques
à l’aide d’un nombre de l’intervalle [–1, 1]. Ce nombre est appelé le coefficient de corrélation
et on le désigne par la lettre r.

Coefficient de corrélation
Signification
Négatif Positif
Près de 0 Près de 0 Indique une corrélation linéaire nulle entre les deux variables.

Près de – 0,5 Près de 0,5 Indique une corrélation linéaire faible entre les deux variables.

Près de – 0,75 Près de 0,75 Indique une corrélation linéaire moyenne entre les deux variables.

Près de – 0,87 Près de 0,87 Indique une corrélation linéaire forte entre les deux variables.

Égal à –1 Égal à 1 Indique une corrélation linéaire parfaite entre les deux variables.

Il existe plusieurs méthodes pour approximer le coefficient de corrélation linéaire


d’une distribution à deux variables. L’une d’elles est une méthode d’estimation graphique
faisant intervenir un rectangle dans un nuage de points. Cette méthode consiste à :

1. représenter par un nuage de points la distribution à deux variables ;


2. tracer une droite représentative de la majorité des points ;
3. construire sur le nuage de points le rectangle de plus petites dimensions englobant tous
les points significatifs et dont deux des côtés sont parallèles à la droite ;
4. approximer le coefficient de corrélation linéaire entre les deux variables à l’aide
de la formule suivante :

r⬇ 1 ( mesure du petit côté


mesure du grand côté )

Ex. : Distribution à deux variables


y
41 mm 12 mm
12
r⬇1 ⬇ 0,71
41
La corrélation entre les deux variables est
donc positive et moyenne.

0 x

© 2008, Les Éditions CEC inc. • Reproduction autorisée Ressources supplémentaires • Savoirs ■ Vision 2 19
Nom :
2.3
Groupe : Date :
Manuel de l’élève, volume 1, p. 111

DROITE DE RÉGRESSION
Dans un nuage de points mettant en relation deux variables statistiques, la droite qui
représente le mieux l’ensemble des points est appelée la droite de régression. Il existe
différentes méthodes pour déterminer l’équation d’une droite de régression.

Méthode de la droite médiane-médiane


Voici comment déterminer l’équation d’une droite de régression à l’aide de la méthode
de la droite médiane-médiane :

1. Ordonner les couples de la distribution d’après leurs abscisses.

2. Diviser l’ensemble des couples en trois groupes égaux. Si cela est impossible,
les diviser de façon que le premier et le dernier groupe en comptent autant
l’un que l’autre.

3. Déterminer l’abscisse médiane et l’ordonnée médiane dans chacun des trois groupes
afin de former les couples médians M1(x1, y1), M2(x2, y2) et M3(x3, y3).

4. Déterminer les coordonnées du point P qui correspondent respectivement à la moyenne


des abscisses et à la moyenne des ordonnées des points M1, M2 et M3.

5. Déterminer la pente de la droite passant par les points M1 et M3.

6. La droite de régression est celle qui passe par le point P et qui a la même pente que
la droite passant par les points M1 et M3.

Ex. : Distribution à • La pente de la droite passant par les points M1 et M3


deux variables 6  13
est :  –0,5.
20  6
x y
• L’équation de la droite ayant une pente de –0,5
2 16 et passant par le point P est y  –0,5x  15, ce qui
5 14 correspond à l’équation de la droite de régression.
M1(6, 13)
7 12 Distribution à deux variables
7 12 y
8 11 18
9 9 16
M2(10, 8) P(12, 9) 14
11 7 12
y  -0,5x  15
13 6 10
8
15 7 6
18 7 4
M3(20, 6) 2
22 5
0 5 10 15 20 25 x
23 2

20 Ressources supplémentaires • Savoirs ■ Vision 2 © 2008, Les Éditions CEC inc. • Reproduction autorisée
Nom :
2.3
Groupe : Date :
Manuel de l’élève, volume 1, p. 112

Méthode de la droite de Mayer


Voici comment déterminer l’équation d’une droite de régression à l’aide de la méthode
de la droite de Mayer :
1. Ordonner les couples de la distribution d’après leurs abscisses.
2. Diviser l’ensemble des couples en deux groupes, si possible égaux.
3. Déterminer la moyenne des abscisses et la moyenne des ordonnées dans chacun des deux
groupes afin de former les couples moyens P1(x1, y1) et P2(x2, y2).
4. La droite de régression est celle qui passe par les points P1 et P2.

Ex. : Distribution à
deux variables
x y
6 23
7 26
10 39 P1(10, 36)
13 44
14 48
15 55
18 50
19 65 P2(20, 62)
23 68
25 72

L’équation de la droite passant par les points P1 et P2


est y  2,6x  10, ce qui correspond à l’équation
de la droite de régression.

Distribution à deux variables


y
80
70
60 y  2,6x  10
50
40
30
20
10

0 5 10 15 20 25 30 x

La droite de régression permet de prédire la ou les valeurs de l’une des variables à partir
des valeurs de l’autre, et le coefficient de corrélation permet de savoir jusqu’à quel point
cette prédiction est fiable.

© 2008, Les Éditions CEC inc. • Reproduction autorisée Ressources supplémentaires • Savoirs ■ Vision 2 21

Vous aimerez peut-être aussi