Vous êtes sur la page 1sur 10

5 suite et 6 ANALYSE DE DONNES

Jean-Paul AIMETTI Valrie CHARRIERE

EXERCICE 1 : Une enqute sur les ptes alimentaires est ralise sur un chantillon reprsentatif. Les personnes interroges notent toutes les marques quils dclarent connatre ( selon une chelle daccord : 1. tout fait daccord 2. daccord 3.neutre 4. pas daccord 5. pas du tout daccord ) selon diffrents critres : une marque chre, pour les enfants, pour les adultes, pour la famille, de qualit, dorigine italienne, pour des amis, traditionnelles, avec la notation suivante : Pour chaque marque et chaque critre , la moyenne des notes obtenues est donn dans le tableau suivant. pour les enfants 3,02 3,11 2,7 3,58 3,15 3,17 3,24 pour les adultes 2,72 2,78 2,84 2,39 2,88 3,06 2,88 pour la famille 2,10 2,53 2,15 2,45 2,36 2,89 2,85 de qualit 2,06 2,38 2,06 1,64 2,98 3,04 2,72 d'origine italienne 2,36 3,8 3,97 1,67 3,83 2,8 2,61 pour les amis 2,76 2,99 2,92 2,23 3,20 3,10 3,02

Marque : Panzani Rivoire Lustucru Barilla MDD Roberto Rana

chre 2,82 2,87 2,73 2,23 4,00 3,02 2,84

traditionnelle 2,35 2,67 2,38 2,24 3,67 3,21 3,00

N.B. MDD signifie Marque De Distributeur 1)A partir du tableau indiquant ci-aprs les moyennes et les cart-types de chaque critre : Quel est le critre sur lequel les diffrentes marques de ptes se diffrencient le plus ? Quel critre discrimine le moins les marques ?
| NUM . IDEN - LIBELLE | MOYENNE ECART-TYPE | +---------------------------------------------------------+ | 1 . cher - chre | 2.93 0.49 | | | | | | | | 2 . enf - pour les enfants | | | | | | 3.14 2.79 2.48 2.41 3.01 2.89 2.79 0.24 0.19 0.29 0.49 0.81 0.30 0.49 | | | | | | | 3 . adul - pour les adultes 4 . fami - pour la famille 5 . qual - de qualit 7 . amis - pour les amis 8 . tra - traditionnelle

6 . ital - d'origine italienne |

2) Le tableau qui suit donne toutes les corrlations des critres entre eux | cher enf adul fami qual ital amis tra -----+-------------------------------------------------------cher | 1.00 enf | -0.24 1.00 adul | 0.60 -0.52 1.00 fami | 0.00 0.47 0.39 1.00 qual | 0.77 -0.10 0.87 0.59 1.00 ital | 0.59 -0.72 0.55 -0.20 0.40 1.00 amis | 0.79 -0.53 0.93 0.26 0.88 0.73 1.00 tra | 0.88 0.04 0.68 0.47 0.94 0.39 0.77 1.00 Daprs vous, lorsquune marque est perue comme une marque traditionnelle, elle sera aussi perue trs probablement, comme ______________ ? Lorsquune marque est perue comme une marque italienne, elle ne sera pas perue, gnralement, comme _____________ ? 3)Si les critres avaient t nots de 1, pour pas du tout daccord 5, pour tout fait daccord et non de 5 1, comment aurait t modifie la matrice de corrlation prcdente ? 1.

EXERCICE 2 : Sur 50 personnes, on a mesur cinq variables ordinales traites par la suite comme des variables quantitatives : X1 : Etes vous pour la peine de mort ? 1: pas du tout daccord ; 2: pas daccord ; 3: neutre ; 4: daccord ; 5: tout fait daccord X2 : Etes vous pour la prison perptuit ? 1: pas du tout daccord ; 2: pas daccord ; 3: neutre ; 4: daccord ; 5: tout fait daccord X3 : Etes vous pour le bagne ? 5 : pas du tout daccord ; 4 : pas daccord ; 3: neutre ; : daccord ; 1: tout fait daccord X4 : Etes vous pour la libert conditionnelle ? 5 : tout fait daccord ; 4 : daccord ; 3 : neutre ; 2 : pas daccord ; 1: pas du tout daccord X5 : Etes vous pour interdire lavortement ? -2 : tout fait daccord ; -1: daccord ; 0 : neutre ; 1: pas daccord ; 2: pas du tout daccord a) Que signifie Corr (X1, X2) = 0,9 ? vous vous exprimez en franais et non en termes statistiques : par exemple lorsquun individu est pour la peine de mort, il est alors (pour ou contre) la prison perptuit. b) Que signifie les corrlations suivantes : Corr (X1, X3) = - 0,9 Corr (X1, X4) = -0,8 Corr (X1, X5) = -0, 9 Corr(X3, X4) = 0,2 Corr(X3,X5)=0, 95 Corr(X4,X5)= 0 ,88

Tableau 1 | masculin | fminin | ENSEMBLE ---------------------+--------------+--------------+---------| 21 | 30 | 51 oui magn | | | | | ---------------------+--------------+--------------+-------------

| oui | non | ENSEMBLE | piano | piano | | | | ---------------------+--------------+--------------+-------------| 10 | 41 | 51 oui magn

Tableau 2

| non magn

117

147

264

| ---------------------+--------------+--------------+------------| 138 | 177 | 315 ENSEMBLE | | oui | non | ENSEMBLE | | | | rsidence | rsidence | ---------------------+--------------+--------------+------------| 10 | 24 | 34 oui piano ---------------------+--------------+--------------+------------| 32 | 249 | 281 non piano ---------------------+--------------+--------------+------------| 42 | 273 | 315 ENSEMBLE | Tableau 5 | oui piano | non piano | ENSEMBLE ---------------------+--------------+--------------+------------| 18 | 120 | 138 masculin ---------------------+--------------+--------------+------------| 16 | 161 | 177 fminin ---------------------+--------------+--------------+------------| 34 | 281 | 315 ENSEMBLE | Tableau 3

---------------------+--------------+--------------+-------------| 24 | 240 | 264 non magn ---------------------+--------------+--------------+-------------| 34 | 281 | 315 ENSEMBLE | Tableau 4 | oui | non | ENSEMBLE | rsidence | rsidence | ---------------------+--------------+--------------+-------------| 12 | 39 | 51 oui magn ---------------------+--------------+--------------+-------------| 30 | 234 | 264 non magn ---------------------+--------------+--------------+-------------| 42 | 273 | 315 ENSEMBLE |

| oui rsid | non rsid | ENSEMBLE Tableau 6 ---------------------+--------------+--------------+-------------| 24 | 114 | 138 masculin | ---------------------+--------------+--------------+-------------| 18 | 159 | 177 fminin | ---------------------+--------------+--------------+-------------| 42 | 273 | 315 ENSEMBLE |

EXERCICE 3 : En analysant les tableaux suivants Rpondez, en justifiant vos rponses, aux questions qui suivent : 1) Existe-t-il un lien entre le sexe de linterview et le fait de possder un magntoscope ? Tableau 1 2) Existe-t-il un lien entre le fait de possder un magntoscope et le fait de possder un piano ? Tableau 2

3) Existe-t-il un lien entre le fait de possder un piano et le fait de possder une rsidence secondaire ? Tableau 3

4) Existe-t-il un lien entre le fait de possder un magntoscope et le fait de possder une rsidence secondaire ? Tableau 4 5) Existe-t-il un lien entre le sexe de linterview et le fait de possder un magntoscope ? Tableau 5 6) Existe-t-il un lien entre le sexe de linterview et le fait de possder une rsidence secondaire ? Tableau 6

EXERCICE 4 :

Une entreprise commercialise 11 catgories de plats prpars possdant des noms diffrents (A, B, ..., K). On considre le tableau T N lignes et 11 colonnes codant, par 1 (ou 0), l'achat, mme pisodique, (ou le non achat) de chacun de ces 11 produits, par un chantillon de N consommateurs cibls. Le graphe 1 reprsente les projections de 9 de ces 11 produits sur les deux premiers axes F1 et F2 issus d'une analyse factorielle des correspondances sur le tableau T. Le tableau 2 donne par ailleurs une distance (issue du tableau T) entre les produits J et K d'une part ( non reprsents sur le graphe 1) et les dix autres produits.

F2
A
C I D Graphe 1 K 52 15 49 72 11 58 35 7 60 69 0 E

H
F1 J

45

61

58

16

76

18

56

72

24

69

a) Reprsentez, en les justifiant, les projections "plausibles" de J et K sur le graphe 1. b) Des considrations externes aux donnes analyses conduisent interprter : F1 comme un axe opposant des produits de consommation courante (valeurs ngatives de F1) des produits de luxe. F2 comme un axe opposant des produits plutt exotiques (valeurs ngatives de F2) des produits de "tradition franaise". Dans un souci de communication plus efficace, on souhaite dterminer un petit nombre de "marques ombrelles" pour ces catgories de plats prpars. Quel nombre, quelles connotations et quels noms de marques ombrelles proposez-vous ?

EXERCICE 5 : Dans un pays d'Europe de l'Est, une banque locale Z dsire s'associer avec une importante banque internationale, dj implante dans le pays considr. Quatre banques A, B, C, D sont candidates cette association. Pour augmenter les chances de russite de l'association, Z a le souci (parmi d'autres critres de dcision) de s'allier avec un organisme ayant une image voisine de la sienne. Une tude d'image, auprs de 5 chantillons de 500 clients des diffrentes banques, permet d'obtenir le tableau suivant, donnant le pourcentage de clients interrogs plutt d'accord pour caractriser les banques existantes et Z, selon 5 attributs.
A . proche de ses clients . bien gre . offrant des services de qualit . au service des particuliers . au service des entreprises 43 75 68 25 76 B 65 92 65 70 80 C 60 81 63 30 69 D 55 52 43 65 82 Z 63 86 58 62 85

a) Quel choix d'association conseillerez-vous Z ? Dtaillez les calculs permettant de fonder votre raisonnement. (on utilisera la distance city-block , sans diviser par le nombre de variables pour simplifier les calculs) b) Procdez une classification ascendante hirarchique des 4 banques internationales, partir de la matrice de distances city block suivante. A 0 93 40 106 B 93 0 69 79 C 40 69 0 102 D 106 79 102 0

A B C D

Vous utiliserez, comme indice dagrgation entre 2 groupes de banques, la moyenne des distances entre tous les couples de banques appartenant respectivement G1 et G2. : Exemple D ( B, (A,C) ) = moy ( d(B,A) , d(B,C) ) = ( 93 + 69 ) / 2 = 162 / 2 = 81

EXERCICE 6 :

Compltez les donnes manquantes dans l'arbre de segmentation ci-dessous, obtenu l'issue d'une enqute sur la consommation de vin par des hommes adultes.

22 L l

?
31.8 L 2000

S1

32 L

?
S3

?
600

S2

?
200

S4 notation xL
N

signifie que les N individus d'un segment donn consomment, en moyenne, x litres de vin par an

EXERCICE 7 : Donnes extraites de Probabilits, analyse des donnes et statistique Gilbert Saporta, d Technip (1990) Le tableau ci-aprs donne les consommations annuelles en 1972, exprimes en Francs, de 8 denres alimentaires selon 8 catgories socioprofessionnelles (CSP).
autre pain vin pommes lgumes raisin de ordinaire autre vin de terre secs table plats prpars

pain exploitant agricole salari agricole profession indpendante cadre suprieur cadre moyen Employ Ouvrier

167 162 119 87 103 111 130

1 2 6 11 5 4 3 7

163 141 69 63 68 72 76 117

23 12 56 111 77 66 52 74

41 40 39 27 32 34 43 53

8 12 5 3 4 6 7 8

6 4 13 18 11 10 7 12

6 15 41 39 30 28 16 20

Inactif

138

1) A partir des statistiques lmentaires que vous trouverez dans le tableau ci-aprs dterminez, pour chaque denre, les CSP fortement sur- et sous-consommatrices. +-------------------------------------------------------+---| NUM . IDEN - LIBELLE | MOYENNE ECART-TYPE | +-------------------------------------------------------+---| 1 . pain - pain | 127.13 26.10 | | 2 . paia - autre pain | 4.88 2.98 | | 3 . vino - vin ordinaire | 96.13 36.29 | | 4 . vina - autre vin | 58.88 29.29 | | 5 . pomt - pommes de terre | 38.63 7.36 | | 6 . legu - lgumes secs | 6.63 2.64 | | 7 . rais - raisin de table | 10.13 4.17 | | 8 . plat - plats prpars | 24.38 11.46 | +------------------------------------------------------------

2) A partir du tableau suivant, dterminez les groupes de variables qui varient dans le mme sens, celles qui varient en sens oppos, et celles qui ne semblent pas avoir de liens entre elles. MATRICE DES CORRELATIONS | pain paia vino vina pomt legu rais plat -----+-------------------------------------------------------pain | 1.00 paia | -0.77 1.00 vino | 0.93 -0.60 1.00 vina | -0.91 0.90 -0.75 1.00 pomt | 0.66 -0.33 0.52 -0.42 1.00 legu | 0.89 -0.67 0.79 -0.84 0.60 1.00 rais | -0.83 0.96 -0.67 0.92 -0.41 -0.82 1.00 plat | -0.86 0.77 -0.83 0.72 -0.55 -0.75 0.83 1.00 -----+-------------------------------------------------------| pain paia vino vina pomt legu rais plat

3) On ralise une analyse factorielle sur le tableau de donnes. A partir des rsultats cidessous, des positions gographiques des points et de leurs proximits, essayez de retrouver les conclusions de 2)

4) A partir des positions des CSP sur le graphique suivant, retrouvez vous les sur- et les sous-consommations des CSP ?. Comment interprtez les 2 premiers facteurs ?

Vous aimerez peut-être aussi