Vous êtes sur la page 1sur 40

prelim.fm Page I Vendredi, 25.

janvier 2008 3:04 15

Sciences de gestion

Synthse de cours

&

exercices corrigs

Analyse de donnes avec SPSS

Manu Carricano
INSEEC Paris

Fanny Poujol
IAE Valenciennes

Directeur de collection : Roland Gillet


Universit Paris I Panthon-Sorbonne

Avec la contribution de Laurent Bertrandias pour la relecture de fond


Institution dAdministration des Entreprises Universit Toulouse 1

Synthex

collection

Livre spss.book Page IV Vendredi, 25. janvier 2008 12:04 12

Livre spssTDM.fm Page V Vendredi, 25. janvier 2008 3:06 15

Sommaire
Prface ......................................................................... Introduction .................................................................. Les auteurs .................................................................... Chapitre 1 Chapitre 2 Chapitre 3 Chapitre 4 Chapitre 5 Chapitre 6 Chapitre 7 Chapitre 8 Analyser pour dcider .................................................. Dcrire les donnes ...................................................... Simplifier les donnes .................................................. Segmenter ................................................................... Lanalyse de variance .................................................. La rgression linaire ................................................... Lanalyse conjointe ...................................................... Communiquer les rsultats ........................................... Bibliographie gnrale .................................................. Index ............................................................................
VII IX XI 1 29 51 79 107 133 155 177 195 197

Sommaire V

Livre spss.book Page XII Vendredi, 25. janvier 2008 12:04 12

Livre spss.book Page 1 Vendredi, 25. janvier 2008 12:04 12

Chapitre

Analyser pour dcider


1. tudes et recherche en marketing...............................2 2. Des donnes aux variables...........7 3. Mesurer laide dun questionnaire.....................16

Exercices 1. Quand Pampers collecte des donnes..............................23 2. Laudience de la super star.........24 3. Lenqute point de vente .......25

Une bonne dcision consiste choisir la plus optimale des solutions parmi une srie dalternatives. Le marketing et en particulier sa dimension tudes sest longtemps cantonn un rle purement descriptif. Mais les bonnes dcisions narrivent pas par hasard : elles doivent tre fondes sur des informations ables et valides. Tour tour, les outils dtudes de marchs et les techniques danalyse se sont considrablement enrichis. Lavnement dInternet, la sophistication et lexhaustivit des donnes de panel, la monte en puissance des bases de donnes clients et du data mining ont repouss les limites des tudes de marchs traditionnelles, favorisant lmergence dune information marketing de grande qualit et danalyses explicatives, voire prdictives, des comportements. Ce chapitre prsente les grandes familles dtudes de marchs et pose les bases de lanalyse de donnes en marketing en abordant les concepts de donnes, de variables et de mesure.

Livre spss.book Page 2 Vendredi, 25. janvier 2008 12:04 12

(1)

tudes et recherche en marketing


Les tudes et recherche marketing ont pour but daider le responsable marketing rsoudre un problme spcique, contrler ses performances, planier les dcisions (Evrard, Pras et Roux, 2003). Leur objectif est de lier lentreprise son environnement en dveloppant des instruments de mesure, en collectant et en analysant des donnes, et en communiquant les rsultats et leur interprtation. Telle est la dnition du processus de recherche en marketing qui nous guidera tout au long des huit chapitres de cet ouvrage.

1.1 LA

DMARCHE DTUDE partir de la dnition prcdente, nous pouvons rsumer la dmarche dtude cinq tapes principales, reprises la gure 1.1 ci-aprs.

Figure 1.1
Les cinq tapes dune dmarche dtude.
Anticipation du problme

Dfinition du problme

Analyse de la situation

Collecte des donnes

Analyse et interprtation

Rsolution du problme

La premire tape de la dmarche dtude est didentier le problme managrial : le besoin dtude est donc dtermin par lexistence dun problme rsoudre. Plusieurs types de problmes et plusieurs types de rsolutions peuvent tre envisags, comme le montre le tableau 1.1. Tableau 1.1 : Du problme managrial la technique dtude
Problme managrial Existe-t-il un march potentiel pour un nouveau produit ? Objectifs dtude Tester les ractions des consommateurs lide Tester la composition du produit Estimer le taux dessai et de rachat Connatre les concurrents Techniques dtude Test de concept Test de formule March-test simul March-tmoin Analyse de la concurrence Panels

Analyse de donnes avec SPSS

Livre spss.book Page 3 Vendredi, 25. janvier 2008 12:04 12

Chapitre

Tableau 1.1 : Du problme managrial la technique dtude (suite)


Problme managrial Objectifs dtude Connatre les attentes des consommateurs Dtecter les forces et faiblesses de la marque Techniques dtude Identier les bnces recherchs par les consommateurs tude de segmentation tude du capital marque Analyse des images de marque des concurrents

Dterminer un prix de vente Test de prix psychologiques Analyse conjointe


Source : adapt de Vernette, 2000.

La formulation correcte dun problme permet de faire le lien entre un besoin de dcision et la mise en uvre dune dmarche de recherche, de collecte, danalyse et dinterprtation dinformations. La fonction tude doit donc tre envisage autour de ce paradigme informationnel. Son rle consiste transformer des informations brutes en donnes utiles dans la recherche de nouvelles opportunits, mettre en place des systmes dcoute du march et de veille concurrentielle, et prescrire les comportements adopter sur les marchs. Au conuent des ux dinformations de lentreprise, elle acquiert aujourdhui une dimension stratgique croissante. Si la collecte et lanalyse de donnes sont au cur du mtier danalyste en marketing, ces derniers font de plus en plus appel des donnes secondaires et des donnes stockes dans des entrepts de donnes (data warehouses). Cette tendance est accentue par le recours Internet qui, en combinant habilement sites de marque et techniques de marketing direct, savre tre une source inpuisable dinformations sur les marchs, les consommateurs, les concurrents. Lexistence de cette profusion de donnes fait voluer les besoins dtude dans lentreprise et modie par suite le recours aux diffrentes techniques. Auparavant, la conduite dune tude de march tait principalement entendue comme la ncessit de procder une collecte de donnes terrain, souvent par le biais du questionnaire, de lentretien ou de runions de consommateurs. Dornavant, laccs ais des donnes secondaires, la dissmination interfonctionnelle dune intelligence marketing dans lorganisation modie quelque peu la donne. Cette vaste quantit dinformations disponibles rend ncessaire, pour le charg dtude comme pour le chef de produit, une comptence accrue en analyse de donnes. Elle permettra dviter les erreurs dinterprtation et de matriser la qualit dtudes souvent ralises par des instituts. Un besoin croissant doprationnalit se fait sentir en la matire. Cette oprationnalit passe tout dabord par le dveloppement de mesures pertinentes et valides supportant des construits psychologiques (dcisions dachat, notorit, intrt pour la marque, le produit, etc.), an de bien mesurer ce qui se rapporte au problme managrial. Elle passe ensuite par la mise en uvre danalyses qui permettent dexpliquer et de prdire des comportements, an de bien comprendre le problme managrial pour le rsoudre et agir.

Analyser pour dcider 3

Livre spss.book Page 4 Vendredi, 25. janvier 2008 12:04 12

1.2 LES

TECHNIQUES DTUDES Les techniques dtudes sont regroupes en deux catgories principales, selon leurs objectifs et leurs limites. Les tudes quantitatives dominent largement le march des tudes, mme si, dernirement, les dpartements marketing ont manifest un intrt croissant pour les tudes qualitatives. Le tableau 1.2 montre la rpartition des diffrentes techniques en fonction des mthodes de collecte les plus frquemment utilises en marketing. Tableau 1.2 : Rpartition des diffrentes techniques dtude
Techniques Quantitatives tudes quantitatives via Internet tudes par tlphone Tests en salle tudes en face--face tudes postales 13 % 29 % 11 % 42 % 5% 20 % 30 % 10 % 37 % 4% 2005 2006

Qualitatives Runions de groupe Entretiens individuels tudes qualitatives via Internet Autres techniques qualitatives
Source : adapt de SEMO, 2008 (Syntec tudes Marketing et Opinion).

57 % 22 % 5% 16 %

55 % 22 % 17 % 5%

Parmi les techniques les plus largement utilises, on peut retenir : ltude ad hoc : tude quantitative ou qualitative ralise pour le compte dun seul client ; ltude omnibus : tude quantitative ralise date rgulire. Le questionnaire regroupe lensemble des questions de diffrents souscripteurs ; le baromtre : tude ralise date xe comme lomnibus, mais avec le mme questionnaire dune tude lautre, pour le compte dun ou de plusieurs clients ; le panel : investigation approfondie ralise priodiquement pour plusieurs clients. Les interviews sont identiques dune vague lautre. Il sappuie sur des chantillons importants de 2 000 10 000 individus ;

Analyse de donnes avec SPSS

Livre spss.book Page 5 Vendredi, 25. janvier 2008 12:04 12

Chapitre

le march-test : tude quantitative visant prvoir les ventes et parts de march dun nouveau produit ; on parle galement de march-test pour des observations de type exprimental en magasin ; lentretien individuel : tude qualitative dont lobjectif est de recueillir le discours individuel. On distingue lentretien non directif (libre propos), semi-directif (intervention et thmes), directif (guide dentretien strict, questions ouvertes), associatif ou projectif (analogie, associations de mots, complments de phrases, jeux de rle, etc.) ; la runion de groupe : tude qualitative libre et non structure dun groupe de 8 12 participants, conduite par un animateur. La discussion libre repose sur les phnomnes de psychologie collective des groupes restreints, fonde notamment sur les travaux de Kurt Lewin. Le tableau 1.3 reprsente les objectifs et les limites des approches qualitatives et quantitatives. Tableau 1.3 : Objectifs et limites des approches qualitative et quantitative
Approche Objectifs Rpertorier Explorer Gnrer Comprendre Dnombrer Hirarchiser Pondrer Rsumer Limites Gnralisation des rsultats

Qualitative

Quantitative

Biais dclaratifs Mmorisation des rpondants

Source : adapt de Vernette, 2000.

Les tudes qualitatives sont utilises dans une dimension principalement exploratoire, an de comprendre en profondeur des comportements de consommateurs par exemple. Si elles ne permettent pas de gnraliser les rsultats quelles produisent, elles nen sont pas moins utiles pour dpasser les mesures dattitudes des questionnaires. Elles permettent daccder une tude approfondie des processus lis aux comportements de consommation, grce notamment aux entretiens et aux runions de consommateurs, et daccder plus profondment lexplication de ces comportements, en levant le voile sur des facteurs inconscients (le non-verbal, le non-dit ), en dautres termes le monde interne des consommateurs et notamment leur rapport aux marques. Les tudes qualitatives se distinguent galement par la place quelles occupent dans la dmarche de recherche. Souvent considres comme un prlude ltude quantitative ou limites la conrmation des rsultats dune enqute par questionnaire, elles se substituent de plus en plus aux approches traditionnelles, grce notamment lutilisation dInternet et de ses potentialits multimdias, et la ncessit croissante pour le marketing dtre connect au terrain. Garnier, par exemple, a lanc, il y a peu, une vaste opration de type ethnographique baptise Consumer Connect, dont lobjectif tait avant tout dimmerger les chefs de produit parmi les consommateurs et dobserver leur utilisation du produit in situ. Lavnement dInternet a contribu repopulariser cette technique auprs des instituts dtude : on peut citer lmergence de la netnographie (voir ci-aprs) ou encore le Home Use Blog (HUB), dvelopp conjointement par Danone et la socit Repres.

Analyser pour dcider 5

Livre spss.book Page 6 Vendredi, 25. janvier 2008 12:04 12

EXEMPLE

La netnographie
On constate, depuis quelques annes, un intrt grandissant pour linformation collecte partir de lobservation de communauts virtuelles, nouvelles formes de communauts dont Internet a permis lmergence. Ainsi, de nombreuses rmes ont ralis des tudes sur la base dinformations issues de forums de discussion et nont pas tard saisir les opportunits offertes par ces nouveaux types dinteractions sociales. Kozinets a dvelopp rcemment une approche nouvelle lethnographie sur Internet ou netnographie quil dnit comme une nouvelle mthode de recherche qualitative qui adapte la mthode de lethnographie ltude des cultures et des communauts qui mergent grce aux communications informatises (Kozinets, 2002, p. 62). En tant que technique de recherche en marketing, la netnographie utilise linformation publique disponible sur les forums en ligne an didentier et de comprendre les besoins et les inuences qui psent sur les dcisions dachat de groupes de consommateurs prsents sur Internet. Pour Laurent Flors, CEO de la socit dtude crmmetrix, spcialiste de lcoute client, le canal Internet permet aux marques de participer de vritables conversations et de sappuyer sur un puissant levier du marketing : le bouche oreille. Il est dsormais possible de quantier le volume de ces conversations, danalyser leur contenu et le prol des intervenants, avec un avantage important sur les techniques traditionnelles, puisque cette approche naltre pas le contexte tudi par lintervention dun analyste mais collecte plutt une information en langage naturel.

Les techniques quantitatives, auxquelles cet ouvrage est essentiellement consacr, constituent la part dominante des tudes marketing. Leur objectif est avant tout de mesurer, de quantier et de permettre de gnraliser les rsultats partir de lchantillon de la population concerne. Ce type dtude repose gnralement sur un grand nombre dobservations et sur des informations structures (valeurs numriques, chelles ou valeurs nominales) par opposition aux informations non structures (discours, texte libre/questions ouvertes, etc.). Plus prcisment, trois types dtudes quantitatives peuvent tre distingus, en fonction du contexte de dcouverte de linformation : dcrire, expliquer, prdire. Les tudes descriptives sont fondes sur des mesures dont le but est de collecter des donnes brutes an de crer des structures dcrivant les caractristiques dune population cible ou dun march. Elles peuvent tre utiles, entre autres, pour faire la photographie dun march, de la satisfaction des consommateurs, de la notorit dune marque. La dimension descriptive est lobjectif premier traditionnellement assign aux tudes marketing. Cette tape importante a pour objet de mesurer la force dassociation entre deux variables, par exemple, et permet de poser un cadre danalyse ncessaire aux tudes explicatives et prdictives. Les tudes explicatives ont pour objet de transformer des donnes brutes en structures expliquant des relations de causalit entre deux ou plusieurs variables. Lapproche explicative est utile lorsque ltude a pour objectif de comprendre les causes directes dun phnomne. Ce type dtude peut permettre, par exemple, de modliser limpact de la publicit sur les ventes. Lapproche explicative est particulirement utile dans un contexte daide la dcision, o le but assign ltude nest plus simplement de dcrire mais aussi de comprendre, de la manire la plus able et la plus valide, les dterminants affectant la performance des dcisions marketing. Les tudes prdictives, quant elles, ont pour objet de transformer les donnes brutes collectes sur les caractristiques comportementales des consommateurs ou des entreprises/marchs pour crer des modles prdictifs des ns doptimisation. Ces approches,

Analyse de donnes avec SPSS

Livre spss.book Page 23 Vendredi, 25. janvier 2008 12:04 12

Chapitre

Exercices
EXERCICE 1
nonc

QUAND PAMPERS

COLLECTE DES DONNES

Scwallbach, prs de Francfort en Allemagne, plus de 1500 mres de famille frquentent chaque semaine le centre dinnovation de Procter & Gamble. Elles viennent prendre des couches pour les tester et remplissent, en change, des questionnaires. Dans lespace de jeu disposition, des chercheurs tudient les attitudes et comportements de bbs venus sy amuser une partie de leur journe. Plus loin, des pices au sol trs mou pour simuler la marche dun tout petit , et aux meubles gants, mettent les salaris du groupe dans la peau de jeunes enfants diffrents stades de leur volution. En France, les salaris en charge du marketing peuvent faire des sjours dimmersion dans des familles avec bbs, se levant la nuit avec les parents. Cette approche visant scruter les usages et leur volution sinscrit dans une nouvelle dmarche qui commence avec la traditionnelle bote remise la maternit. Des mailings prennent ensuite le relais. Les parents dun premier enfant sont en gnral avides dinformations : un site internet de la marque Pampers met en avant conseils et donnes, des jeux en ligne trs apprcis pour se mettre dans la peau dun bb, nourrissant dbats, changes, autant dinformations tudies de prs par les spcialistes de la marque. 1. Quel est le principal intrt de la dmarche de Pampers ? Quelle est la mthode utilise, et quels en sont les principaux avantages ? 2. Comment, votre avis, les quipes de Pampers valorisent-elles les donnes collectes ? Selon vous, quels outils danalyse ont-elles recours ? 3. Quel type de mthode, complmentaire, pourraient-elles mettre en place ? Argumentez.

* Solution

1. Le principal intrt de la dmarche de Pampers est de mettre le consommateur au centre du processus de collecte de donnes. La mthode utilise est lvidence qualitative. Elle permet dtudier en profondeur les processus de consommation en interrogeant les parents, plus particulirement les mres, et en observant les interactions mre-enfant. De plus, en simulant les attitudes et les comportements des bbs, elle permet surtout dimmerger les salaris du groupe dans la peau de jeunes enfants diffrents stades de leur volution. Nous sommes ici dans une dmarche oriente march, o la dissmination de linformation sur les consommateurs vers lensemble de lorganisation tient une place importante. Deux mthodes sont donc principalement utilises : une exprimentation Scwallbach, o les chercheurs peuvent observer et tester les comportements des bbs ; lethnographie en France, o les marketeurs font des sjours dimmersion dans des familles. Des outils quantitatifs denqute classiques prennent ensuite le relais partir des donnes collectes dans les maternits. 2. Deux dimensions doivent tre prises en considration. Les donnes issues des approches qualitatives font lobjet danalyses de plusieurs ordres : des analyses de contenu par exemple, an de faire merger des thmes, des discours, mais galement un traitement des

Analyser pour dcider 23

Livre spss.book Page 24 Vendredi, 25. janvier 2008 12:04 12

donnes issues de lexprimentation o il sagit dobserver limpact sur certaines variables dune variable dont on contrle les effets. Pour traiter des donnes dexprimentation, on pourra utiliser lanalyse de variance (voir chapitre 4) ou lanalyse conjointe (voir chapitre 7), par exemple, en fonction des contraintes lies la nature des variables. 3. Les donnes issues de la campagne de marketing direct et provenant du site de marque sont dune grande richesse et peuvent nourrir de nombreuses analyses. On peut tudier les retours de la campagne de marketing direct en mettant en relation les prols sociodmographiques des parents ayant reu la bote dchantillons avec la probabilit dachat. En ce qui concerne le site internet, les chiers logs, ou chiers regroupant lensemble des vnements survenus sur un serveur, peuvent servir de base des analyses pousses, comme le fait Amazon.com pour customiser sa page daccueil en fonction des prols de navigation des internautes.

EXERCICE 2
nonc

LAUDIENCE

DE LA SUPER STAR

Reprenons lexemple de la mesure daudience utilise pour illustrer lintervalle de conance. Un sondeur ralise une tude daudience par tlphone pour connatre les caractristiques sociodmographiques et les comportements des tlspectateurs de la Super Star, mission de tl-ralit diffuse en prime time sur le cble et le satellite. Il slectionne 1 000 numros de tlphone par tirage alatoire simple dans la base de donnes des abonns de la chane (qui en compte 120 000 sur le cble et 2 100 000 sur le satellite). On pose lhypothse que les 1 000 personnes rpondent effectivement aux enquteurs. On constate que lmission absorbe 36,8 % de laudience des personnes interroges de moins de 35 ans, et que le montant moyen dpens par cette cible en SMS et appels tlphoniques est de 6,2 , avec un cart type de 2,2 . 1. Quel aurait t lintervalle de conance si ltude daudience avait port sur 5 000 abonns de la chane ? 2. Un annonceur souhaite investir en devenant sponsor de lmission condition quelle ralise 40 % daudience sur les moins de 35 ans. Lui recommanderiez-vous linvestissement publicitaire ?

* Solution

1. Si lon avait interrog 5 000 abonns de la chane, on aurait calcul lintervalle de conance de la manire suivante : p = 0,368 q = 1 p = 0,632

Soit : 35,4 %

38,1 %

Le sondage ralis permet donc destimer cette proportion avec une prcision absolue de 2,99 % (au degr de conance 0,95). En augmentant la taille de lchantillon, on diminue lamplitude de lintervalle de conance.

24

Analyse de donnes avec SPSS

Livre spss.book Page 25 Vendredi, 25. janvier 2008 12:04 12

Chapitre

2. Dans le cadre de la premire tude daudience, lintervalle de conance se situait entre 33,8 % et 39,7 % (au degr de conance 0,95). La borne suprieure restant en de de la mesure plancher souhaite par lannonceur, il nest donc pas souhaitable de raliser linvestissement publicitaire. Il peut tre intressant de refaire le calcul pour un degr de conance plus faible, 0,90 (z = 1,64), titre dillustration. On obtient alors les rsultats suivants :

Soit : 34,3 %

39,3 %

EXERCICE 3
nonc

LENQUTE

POINT DE VENTE

Reprenons lexemple sur les points de vente que nous avons utilis dans la section 2.2 (pointdevente.sav). Si lon rsume lensemble des questions de lenqute dans le tableau suivant, on obtient : Frquentez-vous ce point de vente au moins toutes les deux semaines ? Quel montant moyen dpensez-vous par mois dans ce type de point de vente ? Seriez-vous prt faire vos achats dans ce (nouveau) point de vente ? combien estimez-vous le prix moyen dune paire de chaussures dans ce point de vente ? Vous dcririez-vous comme un auditeur rgulier de radio ? Quel type de programme de radio coutez-vous le plus souvent ? Regardez-vous rgulirement le journal tlvis ? Quel journal TV regardez-vous le plus frquemment ? Lisez-vous la presse quotidienne ? Quelle rubrique de presse quotidienne lisez-vous le plus souvent ? tes-vous abonn un titre de presse magazine ? La dcoration de la boutique est importante mes yeux. Je prfre un point de vente situ moins de 30 minutes de chez moi. Je prfre tre conseill(e) par des vendeurs(ses). Jaime que les collections soient originales. Jaime quil y ait de nombreuses rfrences dans les collections. Jaime quil y ait des marques connues dans les collections. Je prfre une dcoration sobre. Je prfre une dcoration sophistique. Je prfre une musique dambiance classique. Je prfre une musique dambiance rock. Quelle est votre anne de naissance ? Quel est votre niveau dtude ?

Analyser pour dcider 25

Exercices

Livre spss.book Page 26 Vendredi, 25. janvier 2008 12:04 12

1. 2.

Quel est votre statut marital ? En incluant les enfants de moins de 18 ans, quelle est la taille de votre foyer ? Quels sont approximativement les revenus de votre foyer ? Quel est votre sexe ? Possdez-vous une carte de dlit de lenseigne ? Dcrivez le type dchelle associ chacune des questions du tableau. Donnez trois exemples de tests que vous pourriez mettre en uvre partir de ces variables.

* Solution

1. Vous pouvez reprendre le tableau en y incluant le type de variable.


Frquentez-vous ce point de vente au moins toutes les deux semaines ? Nominale Quel montant moyen dpensez-vous par mois dans ce type de point de vente ? Seriez-vous prt faire vos achats dans ce (nouveau) point de vente ? Numrique chelle mtrique

combien estimez-vous le prix moyen dune paire de chaussures dans Numrique ce point de vente ? Vous dcririez-vous comme un auditeur rgulier de radio ? Quel type de programme de radio coutez-vous le plus souvent ? Regardez-vous rgulirement le journal tlvis ? Quel journal TV regardez-vous le plus frquemment ? Lisez-vous la presse quotidienne ? Quelle rubrique de presse quotidienne lisez-vous le plus souvent ? tes-vous abonn un titre de presse magazine ? La dcoration de la boutique est importante mes yeux. Je prfre un point de vente moins de 30 minutes de chez moi. Je prfre tre conseill(e) par des vendeurs(euses). Jaime que les collections soient originales. Jaime quil y ait de nombreuses rfrences dans les collections. Jaime quil y ait des marques connues dans les collections. Je prfre une dcoration sobre. Nominale Nominale (chelle) Nominale Nominale (chelle) Nominale Nominale (chelle) Nominale chelle mtrique chelle mtrique chelle mtrique chelle mtrique chelle mtrique chelle mtrique chelle mtrique

26

Analyse de donnes avec SPSS

Livre spss.book Page 27 Vendredi, 25. janvier 2008 12:04 12

Chapitre

Je prfre une dcoration sophistique. Je prfre une musique dambiance classique. Je prfre une musique dambiance rock. Quelle est votre anne de naissance ? Quel est votre niveau dtude ? Quel est votre statut marital ? En incluant les enfants de moins de 18 ans, quelle est la taille de votre foyer ? Quels sont approximativement les revenus de votre foyer ? Quel est votre sexe ? Possdez-vous une carte de dlit de lenseigne ?

chelle mtrique chelle mtrique chelle mtrique Numrique Nominale (chelle) Nominale (chelle) Numrique Nominale (chelle) Nominale Nominale

2. De nombreux tests sont envisageables : a. un tri crois entre le montant moyen dpens dans le point de vente et le niveau dtudes par exemple, an de mettre en vidence un impact de la CSP sur les achats ; b. une analyse typologique an de classer les individus de lenqute en fonction de leur prol de rponse ; c. une analyse de variance multiple (MANOVA) dont lobjet serait dexpliquer le montant moyen dpens par une srie de variables explicatives comme, par exemple, le niveau dtudes, le statut marital, etc.

Analyser pour dcider 27

Exercices

Livre spss.book Page 32 Vendredi, 25. janvier 2008 12:04 12

* Focus 2.1

Les fractiles
Les fractiles sont les valeurs dune variable quantitative qui divisent les donnes tries en classes par centime. Les quartiles (25e, 50e et 75e centiles) divisent les observations en quatre classes de taille gale. On les dnit dans SPSS partir de la bote de dialogue Effectifs > Statistiques (voir gure 1.1), en slectionnant Partition en n classes gales (n dnissant le niveau de partition souhait). Vous pouvez galement spcier des centiles particuliers (par exemple le 95e centile), autrement dit les valeurs au-dessus de 95 % des observations.

Mesures de la dispersion
Les mesures de la dispersion reposent sur les indicateurs suivants : ltendue, la variance, lcart type et le coefcient de variation. Ltendue (ou intervalle) est la diffrence entre la plus grande et la plus petite des valeurs observes. La variance est la mesure de la dispersion autour de la moyenne, gale la somme des carrs des carts par rapport la moyenne, divise par le nombre dobservations moins un. Lorsque les donnes se concentrent autour de la moyenne, la variance est faible. Si les donnes sont disperses autour de la moyenne, la variance est leve. Il sagit dune mesure plus ne de la dispersion, au sens o toutes les donnes sont prises en compte. En revanche, elle est sensible aux valeurs extrmes. Lcart type est la mesure de la dispersion autour de la moyenne, exprime dans la mme unit que la variable. Lcart type est la racine carre de la variance. On lcrit de la manire suivante :

s=

(Xi X )
i =1

n 1

Le coefcient de variation est le rapport de lcart type la moyenne (

), exprim

en pourcentage. Son objet est de mesurer le degr de variation de la moyenne dun chantillon lautre, lorsque ceux-ci sont issus de la mme distribution.

Mesures de la distribution
On mesure la symtrie et la forme de la distribution par lasymtrie et laplatissement. Ces statistiques sont prsentes avec leur erreur standard. Le coefcient de symtrie (skewness) mesure lasymtrie dune distribution. Une distribution normale est symtrique (voir gure 2.4), cest--dire que les valeurs sont les mmes de part et dautre du centre de la distribution, et possde une valeur de skewness de 0. Une distribution avec un skewness positif signicatif est une distribution asymtrique droite (la distribution prend la forme dune longue queue droite) et une distribution avec un skewness ngatif signicatif est une distribution asymtrique gauche (la distribution prend la forme dune longue queue gauche). Cette asymtrie sexplique par le fait que les carts sont plus importants dans une direction que dans lautre. Le coefcient daplatissement (kurtosis) permet de mesurer le relief ou la platitude dune courbe issue dune distribution de frquences. En dautres termes, le coefcient daplatissement permet de mesurer le degr de concentration des observations dans les queues de la courbe. Le coefcient de kurtosis est de 0 pour une distribution normale (gaussienne).

32

Analyse de donnes avec SPSS

Livre spss.book Page 33 Vendredi, 25. janvier 2008 12:04 12

Chapitre

Un kurtosis ngatif indique donc que les queues comptent un plus grand nombre dobservations que dans une distribution gaussienne. Les coefcients de kurtosis et de skewness peuvent tre utiliss pour sassurer que les variables suivent une distribution normale, condition ncessaire pour de nombreux tests statistiques. On estime que le coefcient de symtrie ou skewness doit tre infrieur 1 et le coefcient daplatissement ou kurtosis doit tre infrieur 1,5 pour considrer que la variable suit bien une loi normale. Figure 2.4
Reprsentation dune distribution normale.

Mo = Me = X

SPSS

Reprenons notre exemple avec SPSS (pointsdevente.sav) : rappelez la bote de dialogue de la procdure prcdente (Effectifs) en cliquant sur licne dans la barre doutils. Procdez aux mmes oprations mais cette fois pour la variable montant. Dans la bote de dialogue Effectifs que vous venez de rappeler, cliquez sur longlet Statistiques et cochez les statistiques de mesure de la tendance centrale, de dispersion et de distribution, puis slectionnez un graphique (un histogramme avec courbe gaussienne par exemple) pour reprsenter la distribution. Les gures 2.5 et 2.6 reprennent les statistiques descriptives de la variable montant.

Figure 2.5
Description de la variable montant.

Dcrire les donnes 33

Livre spss.book Page 40 Vendredi, 25. janvier 2008 12:04 12

3.1 LHYPOTHSE

STATISTIQUE

Une hypothse statistique est un nonc quantitatif concernant les caractristiques dune population ou, plus prcisment, une afrmation portant sur une ou plusieurs variables. Elle se prsente traditionnellement sous la double forme dune premire hypothse, appele hypothse nulle, et dune seconde hypothse, appele hypothse alternative. Son objectif est de rfuter lhypothse nulle, laquelle concerne le plus souvent un statu quo ou une absence de diffrence, au prot de lhypothse alternative. Exemple : on peut poser lhypothse nulle Ho quil nexiste pas de diffrence de ventes entre les points de vente situs en centre-ville et ceux de la priphrie urbaine, et lhypothse alternative H1 quelles sont diffrentes en centre-ville et en priphrie urbaine. Les tests statistiques tant conus pour la rfutation dhypothses et non pour leur conrmation, lhypothse alternative est celle qui sera accepte si lhypothse nulle est rejete. Accepter une hypothse revient donc dire que lhypothse est non rejete plutt quaccepte, cest--dire que les donnes recueillies au cours dune exprience particulire sont compatibles avec lhypothse alternative propose. Lobjectif de lanalyse de donnes est donc de prendre une dcision : en loccurrence, rejeter ou non lhypothse nulle Ho. Les tests tant fonds sur des informations incompltes issues dobservations portant sur un chantillon de la population, il est ncessaire de dnir le seuil de signication du test, seuil formul en pourcentage de chances de rejeter lhypothse nulle alors quen ralit celle-ci tait vraie. Le seuil de signication est habituellement not et exprim en pourcentage. Le choix du seuil est li au niveau de risque accept (1 % ou 5 % tant les valeurs usuelles). Son complment (1 ), appel seuil de conance, correspond au pourcentage de cas o on acceptera lhypothse nulle juste titre. On appelle erreur de type I le fait de rejeter, la suite des rsultats dun test statistique, une hypothse qui serait en ralit vraie (condamner un innocent) et erreur de type II lerreur lie au fait daccepter une hypothse qui serait en ralit fausse (innocenter un coupable). La probabilit de commettre ce type derreur est note ; on appelle puissance du test son complment (1 ), lequel correspond la probabilit de rejeter une hypothse qui serait rellement fausse (voir tableau 2.1). Tableau 2.1 : Types derreurs dans un test statistique
Situation dans la population Ho vraie Ho accepte Dcision Ho rejete Erreur de type I (seuil de signication = ) Dcision correcte (puissance du test = 1 ) Dcision correcte (seuil de conance = 1 ) Ho fausse Erreur de type II ()

Bien que l tablisse le niveau de signication du test, cest la puissance du test (1 ) qui donne une estimation de la probabilit de trouver des diffrences signicatives si elles existent dans les donnes. Pourquoi, ds lors, ne pas prendre en compte l et le en tant que niveaux de conance ? La raison voque est que lerreur de type I et lerreur de

40

Analyse de donnes avec SPSS

Livre spss.book Page 41 Vendredi, 25. janvier 2008 12:04 12

Chapitre

type II sont inverses : plus lerreur de type I devient restrictive (proche de 0) et plus la probabilit dune erreur de type II augmente ; de mme, rduire lerreur de type I rduit la puissance du test. Lanalyste doit donc trouver le juste quilibre entre le degr de conance () et la puissance du test qui en rsulte. La seule manire de faire baisser simultanment et est daugmenter la taille de lchantillon tudi.

3.2 LES

TESTS DHYPOTHSES Les tests dhypothses, ou tests dinfrence, ont pour objectif de mesurer leffet dune variable indpendante sur une variable dpendante, en fonction du nombre dchantillons et en fonction de la nature des variables tudies. On nomme tests paramtriques les approches reposant sur des donnes mtriques (et par suite sur des paramtres connus tels que la moyenne ou lcart type, par exemple), et tests non paramtriques les approches reposant sur des donnes non mtriques (et qui, par suite, peuvent saffranchir de conditions de distribution particulires). Les tests non paramtriques tant peu sensibles la taille de lchantillon et aux donnes aberrantes, ils sont utiliss en marketing o les chantillons peuvent parfois tre de petite taille (moins de 30 individus). Le nombre dchantillons joue galement un rle important dans le choix du test appropri. En effet, deux situations doivent tre distingues : lorsque lon tudie deux populations distinctes sur une mme variable, on parle de mesures indpendantes (comparer les clients et les non-clients) ; et lorsque les mmes individus sont mesurs sur une mme variable dans deux situations distinctes, on parle de mesures apparies (comparer les niveaux de prix deux priodes distinctes). Ces lments affectent de manire importante les statistiques de tests (voir gure 2.15).

Figure 2.15
Tests paramtriques et tests non paramtriques (Malhotra et al., 2007).
Tests dhypothses

Tests paramtriques

Tests non paramtriques

chantillon unique - Test t - Test z

Deux chantillons ou plus

chantillon unique - Khi-deux - Kolmogorov - Smirnov - Squenes - Binomial

Deux chantillons ou plus

chantillons indpendants - Test t deux classes - Test z

chantillons apparis - Extension du test t

chantillons indpendants - Khi-deux - Mann - Whitney - Mdiane - Kolmogorov - Smirnov

chantillons apparis - Signe - Wilcoxon - McNemar - Khi-deux

Dcrire les donnes 41

Livre spss.book Page 42 Vendredi, 25. janvier 2008 12:04 12

3.3 TESTS

PARAMTRIQUES Les deux principaux tests paramtriques sont le test t et le test Z, qui ont pour objet de tester des diffrences de moyenne. Ces tests sont souvent mis en uvre en marketing, car ils permettent, par exemple, de comparer la moyenne dune variable dpendante mtrique en fonction des modalits dune variable nominale. On formule alors une hypothse nulle qui sera vrie par le test t ou le test Z. Pour plus de simplicit, ces deux tests sont prsents ici pour des chantillons uniques.

Test t
Le test t est directement li la statistique t de Student, qui suppose que la variable adopte une distribution normale, que la moyenne soit connue et que la variance, lorsquelle est inconnue, soit estime sur lchantillon. On le calcule de la manire suivante :
: moyenne de lchantillon : moyenne de la variable : variance de lchantillon

t = ( X ) /s X

O :

Dans SPSS, ce test paramtrique peut tre estim avec la procdure suivante : menu Analyse > Comparer les moyennes > Test T pour chantillon unique, procdure que nous avons utilise au chapitre 1 pour estimer lintervalle de conance. Pour comparer les moyennes de deux chantillons indpendants (comparaison des clients et des non-clients par exemple), on utilisera une analyse de variance (ANOVA) 1 facteur (voir chapitre 4). Pour comparer les moyennes de deux chantillons apparis (comparaison de relevs de prix deux priodes distinctes par exemple), on suivra une extension du test t pour chantillons apparis qui est disponible dans la mme bote de dialogue.

Test Z
Le test Z peut tre mis en place lorsque la variance de lchantillon est connue. La valeur de Z sobtient par la formule suivante : Z= o : est lcart type de la population

Ce test peut galement tre tendu pour tester des proportions.

3.4 TESTS

NON PARAMTRIQUES Les tests non paramtriques sont souvent mis en uvre dans la pratique en marketing : ils sappliquent aux variables qualitatives et savrent relativement performants sur de petits chantillons, mme sils sont moins puissants que les tests paramtriques. Voici les principaux tests paramtriques prsents ici : un test dajustement (le test de KolmogorovSmirov), des tests de comparaison dchantillons indpendants (le test U de MannWhitney et le test de la mdiane), ainsi que des tests de comparaison dchantillons apparis (le test de Wilcoxon, le test du signe et le test de McNemar). Test de Kolmogorov-Smirov (K-S)

42

Analyse de donnes avec SPSS

Livre spss.book Page 43 Vendredi, 25. janvier 2008 12:04 12

Chapitre

Le test de Kolmogorov-Smirov est un test dit dajustement, car il permet dtablir si une population donne suit une distribution particulire (normale, uniforme ou poisson par exemple), condition exige par de nombreux tests. Le K-S est calcul partir de la plus grande diffrence (en valeur absolue) entre les fonctions de distribution thorique et observe cumules : K = Max |Ai-Oi| Le K-S pour un chantillon sobtient dans SPSS partir du menu Analyse > Tests non paramtriques > K-S 1 chantillon Test U de Mann-Whitney Le test de Mann-Whitney permet de vrier que deux chantillons (ou groupes) proviennent bien de la mme population. On peut lutiliser, par exemple, pour comparer les rponses dans un dpartement par rapport aux rponses nationales. La statistique du test U runit les deux chantillons et ordonne les observations par ordre croissant de taille. Le test calcule le nombre de fois o un rsultat du groupe 1 prcde un rsultat du groupe 2, ainsi que le nombre de fois o un rsultat du groupe 2 prcde un rsultat du groupe 1. U est dautant plus petit que les groupes sont diffrents. Pour calculer le U de Mann-Whitney dans SPSS, il faut dabord dnir la variable qui servira scinder les donnes en deux chantillons : Analyse > Test non paramtrique > 2 chantillons indpendants, puis slectionner une variable de regroupement (Facteur) et cliquer sur Dnir les niveaux. Pour dnir les groupes, vous devez indiquer les valeurs pour le groupe 1 et celles pour le groupe 2. Slectionnez ensuite le test U de Mann-Whitney dans la bote de dialogue. Test de la mdiane Ce test, moins puissant que le U de Mann-Whitney, permet de dterminer si deux groupes sont issus de populations ayant la mme mdiane, en estimant la position de chaque observation par rapport la mdiane globale des deux chantillons. Pour calculer le test de la mdiane dans SPSS, vous devez suivre la procdure suivante : Analyse > Test non paramtrique > K chantillons indpendants, puis slectionner le test de la mdiane dans le menu du type de test envisag. Test de Wilcoxon Le test de Wilcoxon est utilis dans le cas de la comparaison de deux chantillons apparis, cest--dire lorsque lon souhaite, par exemple, comparer deux types de rponses : avant/aprs lexposition un message publicitaire, attitude par rapport une marque A et une marque B, etc. La statistique z du test de Wilcoxon sobtient en calculant la diffrence entre les scores des deux observations par paires dobservations, puis en calculant le rang de toutes les diffrences, et enn la somme des rangs positifs et des rangs ngatifs. On rejette lhypothse nulle (absence de diffrence entre les deux groupes) sil y a une diffrence entre la somme des rangs positifs et la somme des rangs ngatifs. Le sens de la statistique indique le sens de la diffrence de la paire examine. Dans SPSS, ouvrez le menu Analyse > Test non paramtrique > 2 chantillons lis, puis slectionnez le test que vous souhaitez mettre en uvre (Wilcoxon, Signe, McNemar), comme le montre la gure 2.16. Test du signe Le test du signe est relativement proche du test de Wicoxon, mais il est plus limit et par suite moins puissant. Il ne sattache en effet qu une comparaison des signes des diffrences, sans procder un classement comme le fait le test de Wilcoxon.

Dcrire les donnes 43

Livre spss.book Page 52 Vendredi, 25. janvier 2008 12:04 12

(1)

Principes de validation dune chelle de mesure


Nous avons vu dans le chapitre 1 que les concepts taient mesurs avec plusieurs questions ou items. Par exemple, pour estimer lattitude du client lgard dun produit, le charg dtude pose des questions qui permettent de bien saisir les diffrentes facettes de ce concept (part affective, cognitive, etc..). Ensuite, il faut vrier que ces diffrentes questions ou items mesurent bien ce que lon cherche mesurer, an dobtenir au nal des rsultats plus proches de la ralit. Dans larticle intitul Un paradigme pour dvelopper de meilleures mesures des construits marketing , Churchill (1979) propose une procdure pour renforcer la validit et la abilit des mesures. Aprs avoir slectionn des chelles (jeu ditems pour mesurer un concept), il sagit, dans un premier temps, de les soumettre lanalyse factorielle exploratoire puis au test de la abilit 1.

1.1 LA

VALIDIT DUNE CHELLE DE MESURE La validit dune chelle de mesure dsigne sa capacit apprhender un phnomne (Hair et al., 2006). Les tests de validit ont pour objectif de vrier si les diffrents items dun instrument sont une bonne reprsentation du phnomne tudi : mesure-t-on ce que lon cherche mesurer ? (Evrard et al., 2003). La validit prend plusieurs formes ; il existe donc plusieurs techniques pour la vrier : la validit faciale ou de contenu : il sagit de savoir si la mesure capture les diffrents aspects du phnomne tudi. Elle est fonde sur le jugement du chercheur et de ses pairs. Par exemple, lors du test du questionnaire, des experts du domaine peuvent mettre un avis sur la capacit des items recouvrir tous les aspects dun concept ; la validit de trait ou de construit : est-ce que les diffrents indicateurs offrent une bonne reprsentation du phnomne tudi ? Il faut vrier si les indicateurs censs mesurer le mme phnomne sont corrls (validit convergente) et s'ils se distinguent des indicateurs censs mesurer des phnomnes diffrents (validit discriminante) (Evrard et al., 2003) : la validit convergente est tablie lorsque les mesures dun mme construit sont corrles ; la validit discriminante est destine sassurer que les indicateurs de mesure dun construit sont faiblement corrls aux indicateurs de mesure dautres construits, conceptuellement distincts du premier. Lanalyse factorielle exploratoire (AFE) permet de tester ces deux validits ; la validit nomologique ou prdictive rsulte de la conformit des relations entre les mesures dun concept et celles dautres concepts avec les prdictions de la thorie (Evrard et al., 2003). Cette tape de validation intervient au cours de la phase conrmatoire.

1. Puis, dans une phase de validation, les chelles modifies aprs suppressions dnoncs subissent une deuxime fois ces procdures, on parle danalyse confirmatoire. Cette seconde tape vise connatre les qualits psychomtriques des instruments de mesure.

52

Analyse de donnes avec SPSS

Livre spss.book Page 53 Vendredi, 25. janvier 2008 12:04 12

Chapitre

1.2 LA

FIABILIT DUNE CHELLE DE MESURE La abilit correspond au degr avec lequel les instruments utiliss mesurent de faon constante le construit tudi (Evrard et al., 2003). Par consquent, une chelle est dle si lon retrouve plusieurs fois les mmes rsultats sur les mmes sujets. Trois mthodes permettent de tester la abilit dune mesure : la mthode du test/retest : le questionnaire est administr deux fois la mme population et les rsultats obtenus sont compars. Cette technique est particulirement approprie pour la mise au point dinstrument de mesure ; la mthode du Split half , ou des deux moitis : le questionnaire est administr au mme moment des chantillons diffrents (lchantillon est scind en deux) et les rsultats sont compars. Il existe cependant un risque de slection ; les deux chantillons sont-ils apparis ? se ressemblent-ils ? la technique des formes alternatives : il sagit dintroduire dans le questionnaire plusieurs questions sur le mme phnomne mais formules diffremment. Le questionnaire est administr aux mmes individus. Le coefcient alpha de Cronbach est calcul pour vrier si les noncs partagent des notions communes, et sils sont en cohrence entre eux.

* Focus 3.1

Estimer la abilit avec le coefcient alpha de Cronbach


Lalpha de Cronbach est un coefcient de abilit qui mesure la cohrence interne dune chelle construite partir dun ensemble ditems. La pratique consiste rduire un grand nombre ditems initiaux dans un processus itratif de conservation/limination des items en fonction de la valeur du coefcient alpha, qui varie entre 0 et 1. Plus la valeur de lalpha est proche de 1, plus la cohrence interne de lchelle (sa abilit) est forte. On limine donc les items qui diminuent le score, et on conserve ceux qui contribuent augmenter lalpha. Lexamen de lalpha de Cronbach vite au charg dtude de tomber dans un travers frquent qui consiste reprendre un questionnaire existant sans se proccuper de ses problmes de mesure.

Le seuil dacceptabilit de lalpha varie selon lobjectif de la recherche. Pour une tude exploratoire, un coefcient plus faible est acceptable (0,7) alors que dans le cadre dune recherche fondamentale, il doit tre plus lev (> 0,8) (Nunnally et Bernstein, 1994). Lorsquune chelle est utilise pour comparer des groupes, un alpha de 0,8 est satisfaisant, et il est inutile dessayer dobtenir un niveau suprieur. De Vellis (2003) propose une typologie (voir tableau 3.1). Tableau 3.1 : Les valeurs de lalpha de Cronbach
< 0,6 entre 0,6 et 0,65 entre 0,65 et 0,7 entre 0,7 et 0,8 entre 0,8 et 0,9 > 0,9 Insufsant Faible Minimum acceptable Bon Trs bon Considrer la rduction du nombre ditems

Simplifier les donnes 53

Livre spss.book Page 54 Vendredi, 25. janvier 2008 12:04 12

Il existe une relation entre le nombre ditems et la valeur de lalpha : un nombre restreint ditems (de deux trois) donne un alpha gnralement plus faible (0,6) quune mesure de quatre noncs (0,7). Au-del de 0,9, lalpha risque, en revanche, de traduire davantage une redondance inter-items, appauvrissant ainsi le domaine conceptuel tudi (Peterson, 1995). Il est, par consquent, recommand de ne pas dpasser le seuil de 0,9. Le logiciel SPSS fournit les niveaux du coefcient dalpha de lchelle lorsque chaque item est supprim. Les items dont la suppression amliore sensiblement le coefcient ne sont gnralement pas retenus si la validit de contenu ne sen trouve pas amoindrie.

* Focus 3.2

Le traitement des items inverss


La conception dun questionnaire demande des prcautions (plusieurs items, non-rponse possible, clart de la question, ordre des questions, etc.) car la formulation des questions peut inuencer la mesure dun concept. Linversion ditem est souvent employe pour sassurer de la validit et de la abilit de la mesure (par exemple, la satisfaction lgard dun service est mesure par un item : je suis pleinement satisfait par ce service et un autre, invers, ce service ne me satisfait pas pleinement ). Nous cherchons valuer dans quelle mesure les items utiliss sont de bons indicateurs des concepts quils sont censs mesurer. Pour cela, il est gnralement conseill de raliser une analyse factorielle exploratoire pour vrier que les items se regroupent bien de la manire prvue, et de calculer ensuite le coefcient alpha de Cronbach qui value la abilit de chaque chelle (Churchill, 1979).

(2)

Lanalyse factorielle
Lanalyse factorielle est une mthode exploratoire danalyse des tableaux de contingence dveloppe essentiellement par J.-P. Benzecri durant la priode 1970-1990. Elle dsigne un ensemble de mthodes statistiques multivaries dont le principal objectif est de dnir la structure des corrlations entre un grand nombre de variables (par exemple, les rponses un questionnaire) en dterminant un ensemble de dimensions communes appels facteurs.

2.1 LES

UTILISATIONS DE LANALYSE FACTORIELLE Lanalyse factorielle sert identier les dimensions de la structure et dterminer dans quelle mesure chaque variable peut expliquer chaque dimension. Les deux objectifs de lanalyse factorielle sont : Rsumer les donnes. Lanalyse factorielle fait ressortir les dimensions sous-jacentes qui, une fois interprtes, dcrivent les donnes de manire synthtique. Rduire les donnes. Elle calcule des scores pour chaque dimension et les substitue aux variables originelles. Alors que dans les autres mthodes (rgressions, analyse de variance, etc.) les variables sont considres comme des variables soit dpendantes, soit indpendantes, dans lanalyse factorielle, toutes les variables sont considres chacune par rapport aux autres. Les facteurs sont forms pour maximiser lexplication de lensemble des variables et non pour prdire des variables dpendantes. Ds lors, lanalyse factorielle est approprie dans une optique exploratoire (analyse factorielle exploratoire ou AFE).

54

Analyse de donnes avec SPSS

Livre spss.book Page 55 Vendredi, 25. janvier 2008 12:04 12

Chapitre

EXEMPLE

Les critres importants dans lvaluation dun club de sport


Dans une enqute sur les attentes des clients vis--vis de leur salle de sport, on interroge les individus sur une vingtaine de critres. Lanalyse factorielle sert regrouper les attentes en trois ou quatre points plus simples. Elle agrge les variables en facteurs ou combinaisons de variables. Lobjectif est de rendre linformation plus synthtique et facile lire sur une carte factorielle (voir tableaux 3.2 et 3.3).

Tableau 3.2 : Exemple dapplication de lanalyse factorielle


Prise en charge Lieu agrable 2 1 2 2 3 Dfoulement Dynamisme Esthtisme Rencontre conomie 1 1 4 1 2 Facteur 3

1 2 3 4 5 6

4 1 2 3 1

1 2 4 4 4

4 4 2 2 3

2 5 4 4 4

4 4 3 3 4

1 1 1 3 4

1 1 1 3 4

titre dexemple, le confort, les aspects dfoulement, dynamisme et sant reprsentent peuttre en fait la mme chose : tre en forme.

Tableau 3.3 : Exemple dapplication de lanalyse factorielle (suite)


Facteur 1 Forme 1 2 3 4 5 6
La solution de lanalyse factorielle est trouve par essai/erreur et le jugement stablit en fonction des concepts (voir gure 3.1). Sur laxe horizontal de la gure, gauche les atten-

Facteur 2 Contact

Simplifier les donnes 55

Confort 2 1 2 2 3

Muscles

Sant

Livre spss.book Page 56 Vendredi, 25. janvier 2008 12:04 12

tes des clients portent sur la forme physique ; droite, sur le confort de la salle. Sur laxe vertical sopposent le ct sociable du club de sport et le besoin de sy dfouler. Au total, la variance restitue par ces deux axes (les deux premiers facteurs) est de 50,43.

Figure 3.1
Reprsentation graphique de lanalyse factorielle.

Lanalyse factorielle exploratoire permet didentier des groupes ditems qui covarient les uns avec les autres et semblent reprsenter des variables latentes pertinentes. Autrement dit, lAFE consiste explorer la relation entre des variables mesures, an de dterminer si ces relations peuvent tre rsumes par un nombre moins important de construits latents. LAFE permet de vrier le nombre de dimensions ou, plus souvent, lunidimensionalit dun concept. En effet, un concept peut comporter une ou plusieurs facettes. Par exemple, limplication comporte une composante affective, une composante calcule et une composante normative. Lorsque lon fait appel des chelles de mesure dj utilises, lAFE permet de vrier si lon retrouve, pour lchantillon tudi, la mme structure factorielle. Elle fera alors ressortir autant de facteurs que le construit a de dimensions (un seul facteur si le construit est unidimensionnel). Dans le cadre du dveloppement de nouveaux instruments, lAFE permet de constater si les items correspondent effectivement aux concepts prsents aux rpondants.

2.2 LES

CONDITIONS ET OPTIONS DE LANALYSE FACTORIELLE En fonction des caractristiques de lchantillon et des donnes collectes, plusieurs options sont possibles pour la ralisation dune AFE (analyse factorielle exploratoire). Nous verrons, dans un premier temps, la taille de lchantillon requise avant de prsenter les diffrentes options et tests permettant de valider les rsultats dune AFE.

La taille de lchantillon ncessaire


La taille de lchantillon dpend du nombre ditems soumis lAFE. Il faut un minimum de cinq observations par item (un ratio de 10 pour 1 est prfrable). Le nombre total dobservations doit tre dau moins 50 et il est souhaitable dinterroger au moins 100 individus.

56

Analyse de donnes avec SPSS

Livre spss.book Page 57 Vendredi, 25. janvier 2008 12:04 12

Chapitre

La mthode dextraction utilise


La mthode dextraction la plus employe est lanalyse en composantes principales (ACP). LACP a pour objet de rsumer lensemble des donnes quantitatives dun tableau individus/ variables. En effet, lACP synthtise les donnes en construisant un petit nombre de variables nouvelles, les composantes principales. Les lments critiques de la grille peuvent alors tre capts rapidement, laide de reprsentations graphiques tablies partir des ACP.

Le choix de la matrice des donnes


Il est possible de travailler sur la matrice de corrlation ou sur la matrice de covariance. Pour simplier, ce choix seffectue ainsi : matrice de corrlation : lorsque les variables sont mesures avec des chelles diffrentes ; matrice de covariance : lorsque lon applique lanalyse factorielle plusieurs groupes avec des variances diffrentes pour chaque variable.

Ladquation des donnes


Avant de raliser lanalyse, il est important de sassurer que les donnes sont factorisables. Elles doivent former un ensemble cohrent pour pouvoir y chercher des dimensions communes qui aient un sens et qui ne soient pas des artefacts statistiques (Evrard et al., 2003). La matrice des donnes doit comporter sufsamment de corrlations pour justier la ralisation dune AFE. Plusieurs indicateurs peuvent tre utiliss : La matrice des corrlations anti-image reprsente la valeur ngative des corrlations partielles. Des corrlations anti-image importantes indiquent que la matrice des donnes nest peut-tre pas adapte lAFE. Le test de Sphricit de Bartlett examine la matrice des corrlations dans son intgralit et fournit la probabilit de lhypothse nulle selon laquelle toutes les corrlations sont de zro. La Measure of Sampling Adequacy (MSA) ou Kaiser-Meyer-Olkin (KMO) indique dans quelle proportion les variables retenues forment un ensemble cohrent et mesurent de manire adquate un concept. Elle teste si les corrlations partielles entre les variables sont faibles. Des valeurs de KMO comprises entre 0,3 et 0,7 reprsentent des solutions factorielles acceptables. Ce test, dabord ralis pour chaque variable, doit ensuite tre repris avec lensemble des variables (Hair et al., 2006).

Lextraction des facteurs


Il nexiste pas de base quantitative exacte pour dterminer le nombre de facteurs extraire. Les critres sont souvent choisis sur la part de variance de chaque item quun facteur permet dexpliquer : l eigenvalue , ou rgle des valeurs propres > 1 ou rgle de Kaiser-Guttman : une valeur propre reprsente la quantit dinformations capture par un facteur. Un facteur qui aurait une valeur propre infrieure 1 reprsenterait moins dinformations quun simple item. le Scree Test , ou test du coude ou de lboulis : ce test se fonde galement sur les valeurs propres des facteurs mais dans une perspective relative et non absolue. tant

Simplifier les donnes 57

Livre spss.book Page 58 Vendredi, 25. janvier 2008 12:04 12

donn que chaque facteur est extrait dune matrice qui est le rsidu de lextraction prcdente, la quantit dinformations contenue dans les facteurs successifs dcrot. Lorsque, entre deux facteurs, la dcroissance en termes dinformations devient faible ou nulle, on peut estimer que le dernier facteur ne contient pas sufsamment dinformations pour tre retenu. le critre du pourcentage de variance : il sagit dune approche par laquelle on observe les pourcentages cumuls de la variance extraite par les facteurs successifs. Lobjectif est de sassurer quun facteur explique une quantit signicative de variance. Il est souvent conseill darrter lextraction lorsque 60 % de la variance explique est extraite (Hair et al., 2006).

La rotation des facteurs


An de pouvoir interprter les facteurs, il est gnralement ncessaire de raliser une rotation. Celle-ci permet didentier des groupes de variables fortement lis les uns aux autres. La rotation fait en sorte que chaque item ne soit fortement li qu un seul facteur. Cette opration est ralise par une redistribution de la variance des premiers facteurs extraits aux facteurs successifs, an daboutir une structure factorielle plus simple (Hair et al., 2006). Lorsque les axes sont maintenus 90 degrs, on parle de rotation orthogonale ; lorsque les axes ne sont pas contraints tre indpendants, on parle de rotation oblique. Il existe plusieurs mthodes de rotation : Varimax : rotation orthogonale qui minimise le nombre de variables ayant de fortes corrlations sur chaque facteur. Simplie linterprtation des facteurs. Oblimin direct : rotation oblique, cest--dire dans laquelle les axes se positionnent en fonction des items et ne sont donc pas orthogonaux. Quartimax : mthode qui minimise le nombre de facteurs requis pour expliquer chaque variable. Simplie linterprtation des variables observes. Equamax : mthode de rotation qui minimise la fois le nombre de variables qui psent fortement sur un facteur et le nombre de facteurs requis pour expliquer une variable (combinaison des mthodes Varimax et Quartimax).

* Focus 3.3

Lanalyse factorielle exploratoire : rotation orthogonale ou oblique ?


Les critres de choix entre la rotation orthogonale (Varimax) et la rotation oblique sont les suivants : La rotation orthogonale maintient les axes de lespace factoriel en angle droit. Ce type de rotation permet de minimiser le nombre ditems ayant des contributions leves sur un axe et donc de simplier les facteurs. Elle permet dobtenir une structure factorielle plus claire. Si la corrlation entre facteurs est faible, infrieure 0,15 (De Vellis, 2003) ou 0,3 (Nunnally et Bernstein, 1994), la rotation orthogonale sera prfre pour sa simplicit. Toutefois, si lon a des raisons de penser que des items ou facteurs sont corrls, il est logique de raliser une rotation oblique. On peut galement comparer la solution avec rotation oblique et rotation orthogonale. Sil est possible dassigner un item au mme facteur dans les deux cas, alors la rotation orthogonale sera choisie pour sa simplicit. Dans la grande majorit des cas, une rotation orthogonale est sufsante pour aboutir une structure simple. Hair et al. (2006) estiment cependant que la rotation oblique est conseille si lon souhaite dterminer des facteurs reprsentant des concepts qui seront analyss postrieurement car la structure factorielle obtenue possde une plus grande stabilit.

58

Analyse de donnes avec SPSS

Livre spss.book Page 59 Vendredi, 25. janvier 2008 12:04 12

Chapitre

2.3 LPURATION

DES DONNES

LAFE pour vrier le nombre de dimensions dun concept


Lanalyse factorielle est utilise pour vrier la validit de trait ou de construit. Il sagit de tester et de purier les chelles dun questionnaire. LAFE permet de sassurer que lchelle value prcisment et exclusivement le construit quelle est cense mesurer. Lorsque le construit est unidimensionnel, lAFE fera ressortir un seul facteur, plusieurs pour les construits multidimensionnels. Il est aussi possible de xer a priori le nombre de facteurs sous SPSS. Nous traitons ici de la question des items et facteurs retenir ou, au contraire, supprimer, suite une AFE. En effet, lorsque les facteurs sont extraits, il est ncessaire dvaluer la validit convergente et discriminante au niveau de litem ainsi que la abilit des chelles. La validit convergente concerne le fait que les rponses obtenues par diffrents indicateurs du mme construit soient fortement corrles ; la validit discriminante est dmontre lorsque la mesure dun construit dtermin est faiblement corrle une mesure dun autre construit. Ces analyses sont ralises pour chaque chelle. Les items prsums mesurer un mme construit doivent donc tre fortement corrls les uns aux autres (validit convergente) et faiblement corrls aux items censs mesurer dautres construits (validit discriminante). Le niveau du coefcient structurel de lAFE (composante) sert dterminer si litem satisfait au critre de validit convergente. Le tableau 3.4 prsente les niveaux de signicativit des contributions factorielles des items selon la taille de lchantillon tudi. Tableau 3.4 : Niveau de signicativit des coefcients structurels selon la taille de lchantillon
Niveau des coefcients structurels 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75
Source : adapt de Hair et al., 2006.

Taille de lchantillon ncessaire 350 250 200 150 120 100 85 70 60 50

Simplifier les donnes 59

Livre spss.book Page 60 Vendredi, 25. janvier 2008 12:04 12

Lpuration dune chelle de mesure se fait en deux temps : Dune part, pour les coefcients structurels ou composantes, un seuil est dtermin en fonction de la taille de lchantillon. Par exemple, pour un test dchelle sur un chantillon de 200 individus, un seuil de 0,40 sera retenu. Pour les chelles multidimensionnelles, sont limins les items dont les poids factoriels sont suprieurs 0,30 sur plusieurs facteurs et ceux nayant aucune contribution suprieure ou gale 0,50 sur lune des composantes principales identies. Ces seuils peuvent aussi varier en fonction de la taille de lchantillon (Hair et al., 2006). Dautre part, la formation des facteurs repose sur limportance des variables initiales sur ces facteurs. Les communalits (part de variance explique par litem) doivent dpasser 0,5 et si possible 0,7. Le niveau de reprsentation est considr comme moyen pour un seuil de 0,40, bon pour un seuil de 0,65 et excellent lorsque la communalit dpasse 0,80 (Evrard et al., 2003).
SPSS
Dans cet exemple, nous testons lchelle destine mesurer lambition professionnelle. Cette chelle unidimensionnelle de 10 items est issue de la littrature. Les rponses aux questions sont collectes grce une chelle de Likert cinq chelons allant de Pas du tout daccord Tout fait daccord (voir tableau 3.5). Tableau 3.5 : Exemple de lchelle destine mesurer lambition
Item 1 - Jaimerais avoir un poste plus important et que les autres menvient. Item 2 - Jaime bien discuter avec des gens importants. Item 3 - Je veux tre une personne importante dans la communaut. Item 4 - Jadmire beaucoup les gens qui ont gravi les chelons et sont au sommet. Item 5r1 - Si javais sufsamment dargent, je ne travaillerais plus*. Item 6 - Mme si je gagnais beaucoup dargent au jeu, je continuerais exercer mon mtier. Item 7r - Si je pouvais toucher le chmage, je prfrerais ne pas travailler*. Item 8 - Jaime tre admir(e) pour ma russite. Item 9r - Je naime pas tre remarqu(e)*. Item 10 - Jaime que des employs me demandent conseil.

1. Le r signie que cet item est invers.

Les 10 items sont, dans un premier temps, soumis une analyse factorielle exploratoire (mthode de lACP), an de vrier la structure du construit mesur. Cette chelle est teste avec un chantillon de 106 individus. Ouvrez le chier challenge 1. Allez dans le menu Analyse > Positionnement > Analyse factorielle. Une bote de dialogue apparat (voir gure 3.2).

1. Vous trouverez ce fichier ladresse : http://www.pearsoneducation.fr.

60

Analyse de donnes avec SPSS

Livre spss.book Page 61 Vendredi, 25. janvier 2008 12:04 12

Chapitre
Transfrez les items destins mesurer lambition en les slectionnant chacun leur tour et en cliquant sur la che.

Figure 3.2
Demande danalyse factorielle.

Avant de lancer lAFE, plusieurs commandes sont effectuer. An de vrier ladquation des donnes, on peut demander lindice KMO et le test de Bartlett par le bouton Descriptives dans la bote de dialogue prcdente. La structure initiale (prcoche) donne les communalits, les valeurs propres et la part de variance explique initiale (voir gure 3.3).

Figure 3.3
Demande de lindice KMO et du test de Bartlett.

Cliquez ensuite sur Poursuivre pour revenir la bote de dialogue initiale. Pour slectionner la mthode de lanalyse factorielle, cliquez sur Extraction et la bote de dialogue de la gure 3.4 apparat. Nous pouvons choisir la mthode de lanalyse factorielle (composantes principales ; facteurs communs, etc.). Nous slectionnons Composantes principales. Pour obtenir les facteurs, le logiciel prslectionne les valeurs propres suprieures 1. Mais il est aussi possible de dterminer le nombre de facteurs. Dans une optique exploratoire, nous laissons libre ce nombre de facteurs. Le choix de la matrice de dpart est aussi x dans cette bote de dialogue : la matrice de corrlation est prslectionne. Nous gardons cette matrice pour lanalyse. On peut demander un graphique des valeurs propres qui sert liminer des facteurs avec le test du coude. Cliquez ensuite sur Poursuivre pour revenir la bote de dialogue initiale.

Simplifier les donnes 61

Livre spss.book Page 156 Vendredi, 25. janvier 2008 12:04 12

(1)

Les principes de lanalyse conjointe


Les travaux de Green dans les annes 1970 marquent le dbut de la prise en compte de lanalyse conjointe dans la recherche en marketing. La mthode dite de l analyse des mesures conjointes , au dveloppement croissant depuis les annes 1980, vise mieux comprendre le comportement des individus et, en particulier, du consommateur. Le sketch de Coluche illustre la problmatique de lanalyse conjointe sur la prfrence entre tre grand, riche, beau et intelligent et petit, pauvre, moche et bte . Si lon prsente les combinaisons suivantes grand, riche, moche et bte ou petit, pauvre, beau et intelligent , lindividu est alors amen faire des compromis dans lesquels lavantage dune caractristique compense une autre quil doit rejeter. Lanalyse conjointe permet de rpondre aux questions suivantes : Quelle est limportance de tel ou tel attribut (prix, dimensions, etc.) du produit pour le consommateur ? Quelle est limportance de certains niveaux dattributs (niveau de prix, dimensions en cm, etc.) par rapport dautres dans lesprit du consommateur ? Cette mthode dtermine la fois limportance relative de chaque attribut et les niveaux des attributs prfrs des rpondants. Lorsquon dispose dinformations sur les rpondants (donnes dmographiques ou autres), lanalyse conjointe permet didentier les segments de march pour lesquels des produits spciques seront plus adapts. Par exemple, une personne appartenant une CSP+ et un tudiant peuvent avoir des gots diffrents auxquels des offres de produits distincts pourront rpondre. Lanalyse conjointe repose sur la dcomposition de la prfrence en utilits partielles. Pour dterminer lutilit totale dun produit, on suppose que lindividu additionne les utilits partielles des attributs du produit. On parle de modle additif. Au nal, lindividu choisit parmi les produits celui qui lui procure lutilit totale la plus leve. Lestimation permet ainsi dobtenir, pour chaque facteur et ses niveaux, des utilits partielles ainsi que limportance de chaque attribut. Ce qui compte est donc lindividu tel quil ragit dans une situation dtermine. Lanalyse conjointe appartient aux modles de dcomposition (voir focus 7.1 sur le modle compensatoire) o limportance des caractristiques est estime partir des prfrences dclares du consommateur et de ses notations des diffrents produits sur plusieurs caractristiques. Elle permet danalyser limportance des caractristiques du produit dans la formation des prfrences.

* Focus 7.1

Le modle compensatoire
Le modle dattitude implicite de lanalyse conjointe est un modle compensatoire, o lvaluation se fonde sur le principe du compromis, cest--dire quun peu moins dun attribut peut tre compens par un peu plus dun autre. Par exemple, un individu qui cherche un appartement peut avoir plusieurs critres : le montant du loyer, la supercie, le nombre de pices, la luminosit, la proximit des transports publics, etc. Si lun de ces critres nest pas satisfait (supercie insufsante), il peut tre compens par un montant du loyer plus faible dans un modle compensatoire (ce nest pas le cas dans le modle non compensatoire).

156

Analyse de donnes avec SPSS

Livre spss.book Page 157 Vendredi, 25. janvier 2008 12:04 12

Chapitre

1.1 LES

UTILISATIONS DE LANALYSE CONJOINTE EN MARKETING Lanalyse conjointe est largement utilise en marketing pour lidentication dun nouveau concept, pour divers tests (prix, produits, publicit, distribution, etc.), pour lanalyse concurrentielle ou la segmentation du march (voir tableau 7.1). Il sagit, par exemple : de dterminer limportance relative dattributs dans le processus de choix des consommateurs ; destimer la part de march des marques qui diffrent au niveau des attributs ; de dterminer la composition dobjets les plus apprcis ; de segmenter le march partir des similarits de prfrences pour des niveaux dattributs. Tableau 7.1 : Les applications de lanalyse conjointe
Pour les biens de consommation courante Nouveaux produits Prix Segmentation Publicit Distribution 72 % 61 % 48 % 39 % 7%

1.2 LES

CONDITIONS DAPPLICATION DE LANALYSE CONJOINTE Lanalyse des mesures conjointes ncessite que les variables explicatives soient qualitatives ou nominales et que les variables expliquer soient quantitatives. Ces dernires peuvent tre values : laide dune chelle de mesure ; laide dun ordre de prfrence (classement) entre diffrentes combinaisons de niveaux de facteurs. Par exemple, dans le cadre dune tude sur la prfrence des clients lgard dune offre de transport arien, on pourra demander aux individus dvaluer diffrentes offres de compagnies avec une note de 1 9, autrement dit de les classer. Ces offres incluront, par exemple, le prix du billet (bas, moyen, lev), la qualit du service bord (excellente, moyenne, mauvaise), le nombre descales, etc. Il sera ainsi possible destimer, parmi ces facteurs et leurs niveaux, celui qui a le plus dimportance pour les clients dans leur choix dune offre de transport arien. Lobjectif est ensuite dlaborer une offre optimale pour la clientle.

Lanalyse conjointe 157

Livre spss.book Page 158 Vendredi, 25. janvier 2008 12:04 12

1.3 LES

TAPES DE LANALYSE CONJOINTE La mthodologie de lanalyse conjointe est jalonne par trois grandes tapes (Green et Srinivasan, 1990) : collecte des donnes : choix du plan factoriel complet ou fractionn, de la forme des questions et de la mthode de recueil ; dnition de lchelle de mesure de la variable dpendante : choix de la mesure (classement, notation des combinaisons, comparaison de paires de combinaisons) ; estimation : tape lie la nature de la mesure de la variable dpendante (ANOVA si la variable dpendante est quantitative, analyse monotone de la variance si elle est ordinale). Ces tapes sont dveloppes au cours de la section suivante.

(2)

La prparation de lanalyse conjointe


Lanalyse conjointe demande au pralable la rsolution dun certain nombre de questions. En effet, avant mme de collecter les donnes, le charg dtude doit sinterroger sur les attributs quil cherche valuer et leurs niveaux. Cette premire slection des attributs ou facteurs les plus importants et de leurs niveaux ou modalits dterminera le plan dexprience et le mode de collecte des donnes. Le schma de la gure 7.1 prsente les diffrentes phases de la mthode de lanalyse conjointe et met laccent sur la premire tape de la slection des attributs et des niveaux.

Figure 7.1
Les tapes de lanalyse conjointe.

Source : adapt de Liquet et Benavent.

158

Analyse de donnes avec SPSS

Livre spss.book Page 197 Vendredi, 25. janvier 2008 12:04 12

Index
A
Abaques 11 Access panels 8 on-line 8 Accord, chelle de mesure 15 Ad hoc, tendue 4 Agrgation chane 91 des donnes 51 mthode 85 Ajustement courge 187 test 42 Alpha de Cronbach 53 seuil dacceptabilit 53 Analyse bivarie 20, 36 bivarie, variable dpendante 36 bivarie, variable indpendante 36 conjointe, tapes 158 de fiabilit 65 de variance 108 factorielle 54, 56 factorielle, mthode 61 multivarie 20 multivarie de la variance 115 rapport d 178 typologique 81, 90 univarie 20 ANCOVA 116 ANOVA un facteur 108 Aplatissement 32 coefficient d (Kurtosis) 32 Arbre de dcision 90 hirarchique 87 Association prdictive, coefficient 39 Asymtrie 32

B
Baromtre 4 Barycentres 85 Biais de lexprimentation 17, 121 effet de linstrument 121 effet de test 121 histoire 121 maturation 121 mortalit 121 Botes moustaches 31 Bonferroni, test de 109 Boule de neige, chantillonnage 11 Brief de ltude 178

C
Carr latin 123 Catgorisation 80 Centiles 32 Centres de groupes 91 mobiles 88 Chane des agrgations 91 Classification 80, 85 ascendante 84 descendante 84 hirarchique 84 hirarchique ascendante 85 hirarchique descendante 86 non hirarchique 84, 88 Clustering 80 Coefficient daplatissement (Kurtosis) 32 dassociation prdictive 39

Index 197

Livre spssIX.fm Page 198 Vendredi, 25. janvier 2008 3:16 15

de contingence 39 de corrlation multiple 136 de dtermination 137 de Pearson 134 de symtrie (Skewness) 32 de variation 32 phi 39 standardis 137 structurels 60 Collecte de donnes 3 Communalits 60 Comparaisons multiples 109 Composantes 60 principales 61 Comprhension, prtest 18 Concomitance 137 Conditions dapplication de la rgression 136 Confiance intervalle 12 seuil 40 Construits 16 multidimensionnels 59 Contamination, effet 18 Contingence, coefficient 39 Corrlation 137 de Pearson, mesure 84 linaire 134 matrice 57 multiple, coefficient 136 Corrlations anti-image, matrice 57 Courbe dajustement 187 Covariable 116 Covariance, matrice 57 Cramer, V de 39 Cronbach, Alpha de 53

Dispersion 31, 32 diagramme 187 Distance 83 de Minkowski, mesure 84 de Tchebycheff, mesure 84 du diamtre, mthode 85 euclidienne 83 mesure 83 moyenne, mthode 85 Distribution 31 normale 33 Donnes collecter 3 crire 20 expliquer 20 non structures 8 normalit 109 primaires 8, 9 saisir 130 secondaires 3, 7, 8 secondaires externes 7 secondaires internes 7 structures 8 textuelles 89 Duncan, test de 109

E
cart type 32 chantillonnage boule de neige 11 de convenance 11 mthode 10 stratifi 10 chantillons 9 alatoires 10 apparis 35, 41 indpendants 35, 41 non probablilistes 10 probabilistes 10 taille 11 uniques 41 chelle 17 dintention 16 dOsgood 15 de Likert 16 de Stapel 16 neutralit 18 chelle de mesure 16, 17 accord 15 diffrentiel smantique 15 intensit 15 intention 15

D
Data mining 7 Data warehouses 3 DDL (degrs de libert) 38 Dcrire les donnes 20 Degrs de libert (DDL) 38 Dmarche dtude 2 Dendogramme 86, 87, 91 Descriptive, mthode 20 Dtermination, coefficient 137 Diagramme de dispersion 187 en btons 31 en secteurs 31 gnrateur de 185 Diffrentiel smantique, chelle de mesure 15

198

Analyse de donnes avec SPSS

Livre spssIX.fm Page 199 Vendredi, 25. janvier 2008 3:31 15

Likert 15 mtrique 15 nominale 15 ordinale 15 Stapel 15 traduction 17 diteur de diagramme 186 Effectifs 30 Effets dinteraction 112 de contamination 18 de halo 18 de lassitude 18 principaux 112 galit des moyennes, hypothse 108 Eigenvalue 57 Embotement 184 Empiler 182 Entretien 3 individuel 5 puration des donnes 59 Equamax 58 Erreur 11 alatoire 18, 19 de type 1 40 de type 2 40 indpendance des termes 136 marge d 12 systmatique 18, 19 termes d 18 types 40 tapes de lanalyse conjointe 158 tendue 32 tude ad hoc 4 brief de l 178 daudience 12 de cas unique 121 dmarche 2 descriptive 6 explicative 6 exploratoire 18 omnibus 4 prdictive 6 projet 178 qualitative 5 quantitative 5, 6 Euclidienne, mesure de distance 83 Exprimentation 120 Explicative, mthode 21 Expliquer les donnes 20

F
Facettes 16 Facteurs 54 dinflation de la variance 142 Factorielle, analyse 54, 56 Factorisation 63 Fiabilit 19, 53 analyse 65 Formes alternatives, technique 53 Fractiles 32 Frquences 30

G
Gnrateur de diagramme 185 Graphiques 31, 181 Grco-latin 123 Groupe statique 121

H
Halo, effet 18 Hasard, tirage au 10 Hirarchique, mthode 84 Histogrammes 31 Homognit 109 Homoscdasticit 136 Hypothse alternative 40 dgalit des moyennes 108 nulle 40 statistique 40

I
Indpendance des termes derreur 136 Indice de Rogers et Tanimoto, mesure de 84 de Sokal et Michener, mesure de 84 de Sokal et Sneath, mesure de 84 Infrence, principe 39 Inflation de la variance, facteur 142 Intensit, chelle de mesure 15 Intention chelle 16 chelle de mesure 15 Interaction 112, 122 effet 112 Intervalle 32 de confiance 12 Items 16 Itinraires, mthode 11

Index 199

Livre spss.book Page 200 Vendredi, 25. janvier 2008 12:04 12

K
Kaiser-Guttman, rgle de 57 Kaiser-Meyer-Olkin (KMO) 57 Kolmogorov-Smirov, test de 42 Kurtosis (coefficient dapplatissement) 32

L
Lambda 39 Lassitude, effet 18 Libert, degrs de (DDL) 38 Likert, chelle de mesure 15, 16 Linarit 22, 136 Loi normale 33

M
MANCOVA 116 MANOVA 115 March-test 5 Marge derreur 12 Marketing de masse 80 individualis 80 segment 80 Matrice de corrlation 57 de covariance 57 des corrlations anti-image 57 McNemar 43 Measure of Sampling Adequacy (MSA) 57 Mdiane 31 Mesures apparies 41 de la dispersion 32 de proximit 83 indpendantes 41 outils 17 Mesures de distance 83 corrlation de Pearson 84 distance de Minkowski 84 distance de Tchebycheff 84 distance euclidienne 83 indice de Rogers et Tanimoto 84 indice de Sokal et Michener 84 indice de Sokal et Sneath 84 Mthode dagrgation 85 dchantillonnage 10 de lanalyse factorielle 61 de slection des variables de rgression 142 de Ward 86 des barycentres 85

des centres mobiles 88 des itinraires 11 des nues dynamiques 88 des quotas 10 des scnarios 121, 160 des vignettes 160 descriptive 20 distance du diamtre 85 distance moyenne 85 du plan dexprience 120 explicative 21 hirarchique 84 non hirarchique 84 non probabiliste 10 probabiliste 9 saut minimum 85 Mtrique, chelle de mesure 15 Minkowski, mesure de distance 84 Mode 31 Modle additif 156 compensatoire 156 de dcomposition 156 de la vraie valeur 18 statistique 121 Moyenne 31 Multicolinarit 142 Multivarie de la variance, analyse 115 analyse 20

N
Netnographie 5, 6 Neutralit dune chelle 18 Nominale, chelle de mesure 15 Non hirarchique, mthode 84 Non probabiliste, mthode 10 Normalit 136 des donnes 109 Nuage de points 81 Nues dynamiques 88 mthode 88

O
Oblimin direct 58 Observation 9 Ordinale, chelle de mesure 15 Orthogonalit 124 Osgood, chelles de mesure 15 Outils de mesure 17 Outliers 31

200

Analyse de donnes avec SPSS

Livre spssIX.fm Page 201 Vendredi, 25. janvier 2008 3:37 15

P
Panels 4, 8 daudience 9 de distributeurs 9 Pearson, coefficient 134 phi, coefficient 39 Plan complet 160 factoriel 122 factoriel complet 123 factoriel fractionn 123 fractionn 160 Plan dexprience, mthode 120 Points cls du rapport 180 Population 9 Prcision des rsultats 11 statistique dun test 12 Prtest de comprhension 18 Prtest/post-test et groupe de contrle 121 Principaux, effets 112 Principe dinfrence 39 Probabiliste, mthode 9 Projet dtude 178 Proximit, mesure de 83 Puissance du test 40

Risque dartefact 82 Rotation 62 des facteurs 58 oblique 58 orthogonale 58

S
Saisir les donnes 130 Saut minimum, mthode 85 Scnarios, mthode 121, 160 Scree Test 57 Segmentation 80 Slection des variables de rgression, mthode 142 Seuil dacceptabilit de lalpha 53 de confiance 40 de signification 40 Signe 43 Signification, seuil 40 Skewness, coefficient de symtrie 32 Sondage, taux 11 units de 9 Split half 53 Standardisation 84 coefficient 137 Stapel, chelle 15, 16 Statistique dun test, prcision 12 Structure dun rapport dtude 179 Structurel, coefficient 60 Symtrie 32 coefficient (Skewness) 32 dune chelle 18

Q
Quartiles 32 Quartimax 58 Questionnaire 3, 16 Quotas, mthode 10

R
R2 137 Rapport danalyse 178 dtude, structure 179 points cls 180 Rgle de Kaiser-Guttman 57 des valeurs propres 57 Rgression conditions dapplication 136 linaire 136 linaire multiple 141 linaire simple 136 multiple 141 Rsultats, prcision 11 Rtro-traduction 18 Runions de consommateurs 3

T
t de Student 42 Tableaux 181 croiss 36 personnaliss 182 pivotants 182 Taille de lchantillon 11 Taux de sondage 11 Taxinomie 80 Tchebycheff, mesure de distance 84 Techniques des formes alternatives 53 qualitatives 4 quantitatives 4, 6 Tendance centrale 31 Termes derreur 18 Test /retest 53 dajustement 42

Index 201

Livre spssIX.fm Page 202 Vendredi, 25. janvier 2008 3:37 15

dhypothses 35, 41 dinfrence 41 de Bonferroni 109 de comparaison dchantillons apparis 42 de comparaison dchantillons indpendants 42 de Duncan 109 de Kolmogorov-Smirov 42 de lboulis 57 de la mdiane 43 de Levene 109 de McNemar 44 de Scheff 109 de Sphricit de Bartlett 57 de Tukey 109 de Wilcoxon 43 du coude 57 du khi-deux 37 du signe 43 non paramtrique 35, 41, 42, 109 paramtriques 35, 41 post hoc 109 prcision statistique 12 puissance 40 statistiques 39 t 42 t pour chantillon unique 13 U de Mann-Whitney 43 Z 42 Tirage au hasard 10 Traduction dchelles de mesure 17 Tri plat 31 croiss 36, 37 Type danalyse de variance 108 derreurs 40 Typologie 80 analyse 81, 90

U
U de Mann-Whitney, test de 43 Units de sondage 9 Univarie, analyse 20

V-W
V de Cramer 39 Valeurs extrmes 31 propres, rgle des 57 Validit 19, 90 convergente 52 de contenu 52 discriminante 52 faciale 18, 52 nomologique 52 prdictive 52 Variable 30 de segmentation 81 dpendante 14 dpendante, analyse bivarie 36 explicative 14 explique 14 indpendante 14 indpendante, analyse bivarie 36 mdiatrice 14 modratrice 14 qualitative 14, 30 quantitative 15, 31 Variance 32 analyse de 108 coefficient 32 facteur dinflation 142 intragroupe 109 Varimax 58 Vignettes 121 mthode 160 Vraie valeur 19 Ward, mthode 86

202

Analyse de donnes avec SPSS