Académique Documents
Professionnel Documents
Culture Documents
Le coefficient de corrélation et de détermination sont des mesures d'association qui impliquent des
variables quantitatives. S'y ajoutent au niveau graphique le nuage de points et la droite de régression.
À la différence des mesures d'association impliquant des variables qualitatives (Khi deux et
coefficient de contingence), où le procédé consiste à travailler avec les fréquences et non avec les
modalités des variables, les mesures d'association impliquant des variables quantitatives se
déterminent à partir des valeurs de chacune des variables.
Il s'agit alors de regarder si les valeurs des deux variables, considérées simultanément, se
comportent comme une droite, dans le cas de la corrélation linéaire.
Procédure:
1- Déterminer la variable indépendante (x) et dépendante (y) Procédure Excel pour faire le diagramme de dispersion:
2- Construire un diagramme de dispersion. 1- Sélectionner la colonne des x et la colonne des y.
3- Calculer le coefficient de corrélation (r) et en faire son 2- Dans assistant graphique choisir nuage de points.
interprétation. 3- Ajouter les titres. Fermer la fenêtre.
4- Calculer la régression linéaire et application de cette dernière. 4- Cliquer sur un point avec le "piton" de droite de la souris
5- Calculer le coefficient de déternination (r2) et en faire son et choisir "ajouter une courbe de tendance". Sélectionner
interprétation. linéaire et option "afficher l'équation sur le graphique" et
"afficher les coefficient de détermination R² sur le
graphique" .
Régression linéaire:
Interprétation:
Si le lien est fort on peut trouver un modèle qui relie les 2 variables.
r est toujours entre -1 et 1
1 étant le lien parfait positif
y = Ax + b
-1 étant le lien parfait négatif (Ce qui signifie
que les deux variables ne varient pas dans
Application:
le même sens.)
Si je connais la valeur de x, je peux trouver la valeur de y en utilisant
les valeurs de a et b que vous aurez en faisant afficher l'équation de la
régression dans le graphique.
ie
s
Dans le cas d'un lien linéaire presque total, le coefficient atteint une valeur
voisine de 1 ou de -1.
Dans le cas de l'absence totale de lien linéaire, le coefficient prend comme valeu
0.
Dans le cas où le coefficient est négatif, l'alignement des valeurs se fait selon un
droite de pente négative.
Dans le cas où le coefficient est positif, l'alignement des valeurs se fait selon un
droite de pente positive.
y y
x
r=1
x
1 -1
x
c) y
d)
y -1 < r <0
1>r>0
0.91 -0.9
x x
e) f)
y r≈0 y r≈0
y r≈0 y r≈0
0.1 -0.02
x x
néaire entre deux
c) d)
1 1 1 5.5
1.5 2 1.5 5
2 1.5 2 4
2 3 2 5
2.5 3.5 2.5 4
3 3 3 4.5
3 4 3 4
3.5 4.5 3.5 3
4 4 4 3.5
4 5 4 3
4.5 4 4.5 1.5
5 5 5 2
5 5.5 5 1
e) f)
2.1 3 2.3 3.3
2.5 2 2.5 2
2.5 4 2.5 4
3 1.5 2.45 1.5
3 4.5 2.4 3
3.7 1.5 2.4 4.7
3.8 4 2.55 3.1
4.1 2.2 2.35 4
4.2 3
2.5 3
2.3 2.5
2.45 3.8
2.35 1.8
2.4 2
CORRÉLATION LINÉAIRE
On a noté l'âge de cinq individus ainsi que le nombre de tours de piste que
chacun peut effectuer à la course en 20 minutes.
Nbre de
Âge
Individu tours
1 17 25
2 19 35
3 31 21
4 40 15
5 50 14
r2 =
Dans le titre:
Y selon X
La variable dépendante selon la variable
indépendante
20
15
10
5
0
15 20 25 30 35 40 45 50 Âge55
Résultat: 25 tours
r2 = 75%