Académique Documents
Professionnel Documents
Culture Documents
Carthage
Filières : M2 _ Masters Pro IMVS
Matière : Analyse de Données Marketing
Enseignant : Adel Jalel Chekki 2H
Partie II : (4 points)
Dans une étude qui a porté sur l’observation de 11 ménagères dans l’usage mensuel des dérivés de céréales et de légumineuses
dans la cuisine tunisienne, on a relevé les données suivantes :
. C1 C2 C3 C4 L1 L2 L3 L4
1 10 10 10 8 8.04 9.14 7.46 6.58
2 8 8 8 8 6.95 8.14 6.77 5.76
3 13 13 13 8 7.58 8.74 12.74 7.71
4 9 9 9 8 8.81 8.77 7.11 8.84
5 11 11 11 8 8.33 9.26 7.81 8.47
6 14 14 14 8 9.96 8.10 8.84 7.04
7 6 6 6 8 7.24 6.13 6.08 5.25
8 4 4 4 19 4.26 3.10 5.39 12.50
9 12 12 12 8 10.84 9.13 8.15 5.56
10 7 7 7 8 4.82 7.26 6.42 7.91
11 5 5 5 8 5.68 4.74 5.73 6.89
Les dérivés des céréales : C1 (Couscous) ; C2 (riz); C3 (pâtes) ; C4 (autres : mhammes, dchich, etc.)
Les légumineuses : L1 (pois chiches); L2 (petits pois) ; L3 (haricots) ; L4 (autres : lentilles, fenugrec ou helba, fève, etc.).
Questions :
1. Calculer la moyenne et la variance des variables C1, C4, L1, L4.
Les moyennes sont toutes les mêmes pour les C d'un côté et les L de l'autre.
C1 : 9.000000 ; C4 : 9.000000 / L1 : 7.500909 L4 : 7.500909
Les variances aussi (on calcule la moyenne des carrés moins le carré de la moyenne)
C1 : 10.00 ; C4 : 10.00 / L1 : 3.75239 ; L4 : 3.748408
2. Calculer les coefficients de corrélation des couples (C1, L1) et (C4, L4). Que constate-t-on ?
On obtient encore des résultats uniformes :
Corrélation C1/L1= 0.816420516
Corrélation C4/L4 = 0.816521437
3. Tracer la représentation des couples (C1,L1) et (C4,L4) sur un graphique où on met les x en abscisse
et les y en ordonnées. Commenter.
L1
12
11 10.84
10 9.96
9 8.81
8 8.04 8.33
7 7.24 6.95 7.58
6 5.68
5 4.82
4 4.26
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
L4
14
13
12
11
10
9
8
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
On constate que les variables sont très différentes les unes des autres.
Le couple C1/L1 est linéaire, à part un point ; on a des données qui épousent l’allure d’une ligne (r = 0.81) et
corrélées.
Le couple C4/L4 marque une indépendance totale de l'abscisse par rapport à l'ordonnée (à part encore 1 point)
malgré le même r fort que le C1/L1.
Toutes ces courbes montrent à quel point il faut se méfier de l'interprétation des moyennes, variances et corrélation.
Un r fort n'est pas synonyme toujours de corrélation.
Annexes :
Tableau 1: Matrice des Corrélations
PAO PAA HUG HUO PAT LEC ARM PLP
PAO 1.0000 -.7737 0.9262 -.9058 0.6564 0.8886 -.8334 -.8558
PAA -.7737 1.0000 -.6040 0.9044 -.3329 -.6734 0.9588 0.7712
HUG 0.9262 -.6040 1.0000 -.7502 0.5171 0.7917 -.6690 -.8280
HUO -.9058 0.9044 -.7502 1.0000 -.4186 -.8386 0.9239 0.7198
PAT 0.6564 -.3329 0.5171 -.4186 1.0000 0.6029 -.4099 -.5540
LEC 0.8886 -.6734 0.7917 -.8386 0.6029 1.0000 -.8245 -.7509
ARM -.8334 0.9588 -.6690 0.9239 -.4099 -.8245 1.0000 0.8344
PLP -.8558 0.7712 -.8280 0.7198 -.5540 -.7509 0.8344 1.0000
Tableau 2 : Valeurs propres
Valeurs Pourcentage Pourc. cumulé
1 6.20794684 0.7760 0.7760
2 0.87968139 0.1100 0.8860
3 0.41596112 0.0520 0.9379
4 0.30645467 0.0383 0.9763
5 0.16844150 0.0211 0.9973
6 0.01806771 0.0023 0.9996
7 0.00344677 0.0004 1.0000
8 0.00000000 0.0000 1.0000
Tableau 5
Coordonnées des variables sur les axes
(corrélations entre les composantes principales et les variables initiales)
Axe 1 Axe 2
PAO -0.97498 0.12927
PAA 0.86875 0.41323
HUG -0.87004 0.18916
HUO 0.93092 0.24415
PAT -0.61385 0.69764
LEC -0.90898 0.12007
ARM 0.92949 0.30574
PLP 0.90114 -0.04711
Graphique 1
Graphique 2