Exercice 1:
Actifs occupés dans le primaire (en %) et part du primaire dans le PIB (en %) dans 12 pays de l’OCDE :
Le nuage des points est un « graphique » où chaque individu peut être représenté par un point. Il existe 4 types de
nuage de point :
Dépendance linéaire Dépendance inverse Indépendance
Liaison fonctionnelle
En Pont En U
5 5
0 0
0 2 4 6 0 2 4 6
Les variables sont : X = variable « actif » et Y = variable « part » (la part du primaire signifie secteur agricole)
16
14
12
Variable Part
10
8
6 M
4
2
0
0 5 10 Variable
15 Actifs 20 25 30
Centre de gravité M (
Le centre de gravité M est le point moyen de X et Y, pour l’obtenir on fait la moyenne de X et la moyenne de Y, qui
nous donne les coordonnées du point M.
C'est-à-dire, il suffit de faire la moyenne des valeurs de X et la moyenne des valeurs de Y, ainsi on obtient un point
supplémentaire qu’on nomme M sur le graphique.
= +
- 7,508 x 4,333
= 19,310
= 34,019 => =
Variance de Y et écart-type :
= 12,058 => =
Donc r vaut :
r= 0,953 => On est tenté de dire que r est proche de 1, donc il y a une corrélation linéaire positive
entre X et Y
Quand on a un point isolée, il faut reconstruire le nuage de point et refaire les calculs, car il peut modifier la vision du
nuage.
Centre de gravité M (
= +
– 5,964 x 3,364
= 3,083
= 8,469 => =
Variance de Y et écart-type :
= 1,865 => =
Donc r vaut :
r= 0,776 => On est tenté de dire que r est proche de 1, donc il y a une corrélation linéaire positive
entre X et Y, on peut conclure cela quand r est supérieur à 0,7.
Exercice 2:
15 salariés interrogés au cours d’une enquête ont révélé leur revenu X et leur épargne Y sur l’année 2002.
= 1384,827 => =
Variance de Y et écart-type :
= 42,115 => =
Calcul de la covariance :
cov (x;y) =
– 102,8 x 14,867
= 212,373
Le signe de la covariance donne une information sur l’allure des variables, quand X augmente, Y augmente.
Nuage de points
30
25
20
15
10
0
50 70 90 110 130 150 170 190
On a l’impression que le nuage de points s’étend le long d’une droite imaginaire, r proche de 1 => les valeurs importantes
de Y sont associés aux valeurs importantes de X, et inversement. Il y a covariance et corrélation linéaire positive, donc
dépendance positive linéaire entre les deux variables.
Même s’il y a un point particulier (66 ; 0). Il faudrait refaire les calculs en l’absence de ce point, pour pouvoir confirmer
ou non les hypothèses précédentes.
Exercice 3:
Une enquête a été réalisée auprès de 900 clients d’un magasin. Elle porte sur la relation entre le nombre de fréquentations
mensuelles et le montant cumulé des achats (en euros). L’enquête a donné les résultats suivants:
Tableau :
X\Y [0 ; 75[ [75 ; 150[ [150 ; 300[
Total ni●
Centre 37,5 112,5 225
1 40 60 150 250
2 60 90 140 290
3 80 70 60 210
4 120 20 10 150
Total n●j 300 240 360 900
Coefficient de
corrélation linéaire
Calcul de la covariance :
cov (x;y) =
– 2,289 x 132,5
= -37,876
Il faut calculer :
Variance de X et écart-type :
= 1,094 => =
Variance de Y et écart-type :
= 6537,5 => =
=> On ne peut pas conclure, car dans ce genre de cas, on ne sait pas conclure, donc on ne peut pas dire s’il y a corrélation
linéaire.
Dans notre cas, r est ni proche de 1, ni de -1 => quand r est proche de 0, on ne donne pas de conclusion.