Vous êtes sur la page 1sur 9

Lanalyse typologique.

Objectifs de la section
Au terme de cette section vous serez en mesure : ! ! ! ! ! Dexpliquer comment se calcule la distance euclidienne De justifier pourquoi il est important de standardiser les mesures utilises Dnumrer diffrents critres pouvant servir constituer les groupes De prsenter les diffrentes tapes dune analyse typologique Dexcuter une analyse typologique sur SPSS et den interprter les rsultats

Introduction
L'analyse typologique est une technique statistique qui permet didentifier des regroupements dindividus (ou dobjets) qui partagent des attributs communs. On retrouve cette technique danalyse sous une trs grande varit de noms, incluant lanalyse typologique, lanalyse de regroupement, lanalyse classificatoire, lanalyse de type Q, lanalyse taxonomique, etc. Cette grande varit de noms sexplique probablement par la diversit des disciplines qui utilisent cette mthode danalyse: sciences conomiques, marketing, biologie et bien sr, psychologie. Une caractristique intressante de lanalyse typologique est quelle nest pas limite au classement dindividus (comme par exemple des patients psychiatriques), mais quelle peut tout aussi bien sappliquer classer des produits de consommation, des pays, des plantes, ou mme des uvres dart. En fait, ds que des objets ont t mesurs sur un certain nombre de variables pertinentes, il est possible dutiliser lanalyse typologique pour dcouvrir quels sont les objets qui se ressemblent le plus et ainsi constituer des regroupements relativement homognes de ces objets. cet gard, le choix des variables sur lesquelles sont mesurs les objets (ou individus) classer est critique parce que lanalyse typologique utilise ces variables telles quelles. Contrairement aux autres approches multivaries, ce type danalyse ne transforme pas les donnes en de nouveaux scores composites (composantes principales, facteurs communs, fonctions discriminantes ou autres), mais utilise les donnes brutes dans leur forme initiale. Une autre particularit intressante de lanalyse typologique est quelle ne requiert pas de connaissance a priori quant au nombre de regroupements prsents dans lchantillon tudi. En ce sens, la technique sert souvent doutil dexploration quand le chercheur fait face une masse de donnes complexes. Elle peut servir dcouvrir la structure des donnes et rduire sa complexit en
_____________________________________________________________________________
Tous droits rservs, Jacques Baillargeon Page 1 25 mars, 2003

permettant au chercheur de scinder son chantillon en plus petits groupes se distinguant clairement les uns des autres, mais lintrieur desquels les individus sont assez homognes. Alors que lanalyse factorielle sintressait la communalit entre les variables, lanalyse typologique mise plutt sur la communalit entre les individus. Cela en fait une technique assez diffrente de ce que lon a vu jusqu maintenant.

Quelques exemples rels dapplication


La perturbation du fonctionnement cognitif chez les schizophrnes est de plus en prsente dans la description de ce syndrome complexe. En particulier, les troubles de mmoire ont t signals comme tant prvalents chez un certain nombre de patients. Cependant, la schizophrnie est une condition plutt htrogne et il est possible quelle recoupe une typologie diversifie. Cest dans ce contexte que se situe la contribution de Turetsky et al. (2002) qui se sont donn comme objectif dexaminer les diffrents profils du fonctionnement mnsique de patients schizophrnes. Leur objectif plus spcifique tait de dterminer si des sous-groupes de patients atteints de schizophrnie pouvaient tre distingus en sappuyant sur la distinction classique entre dmences corticales et souscorticales. Dans le cas o une telle typologie base sur le fonctionnement mnsique serait mise en vidence, les chercheurs voulaient aussi tester lhypothse que ces diffrents types de patients manifesteraient des diffrences aux niveaux clinique, neuroanatomique et neurophysiologique. Leur chantillon tait constitu de 116 patients avec diagnostic de schizophrnie et 129 participants tmoins ne manifestant aucun trouble de sant particulier. Tous les participants furent soumis au CVLT dans le but dobtenir trois indices de fonctionnement mnsique. En plus des indices du CVLT, des rsultats dimagerie par rsonance magntique et des mesures de tomographie par mission de positrons taient aussi disponibles pour un certain nombre de participants. La premire tape de lanalyse a consist faire une analyse typologique sur les rsultats au CVLT. Cette analyse a permis de mettre en vidence lexistence de 3 groupes de patients distincts. Le premier groupe (n = 59) avait un profil mnsique ressemblant beaucoup au profil des participants en sant et leur test de rappel libre tait significativement meilleur que celui des deux autres groupes de patients. Le 2e groupe de patients (n = 21) tait trs faible au rappel libre et avait commis un nombre significativement plus lev derreurs dintrusion que tous les autres groupes; ce profil est typique dun dficit cortical. Enfin, le 3e groupe de patients (n = 36) se distinguait par une bonne capacit de reconnaissance malgr ses difficults en rappel libre; ce profil sapparente au dficit sous-cortical. La premire tape de lanalyse typologique a donc t concluante. Turetsky et al. (2002) ont ensuite procd une srie de comparaisons impliquant ces trois sous-groupes de patients de mme que le groupe tmoin. Il est impossible dentrer dans les dtails de toutes les analyses effectues, mais on peut souligner que des diffrences significatives intressantes ont t observes au niveau de la
_____________________________________________________________________________
Tous droits rservs, Jacques Baillargeon Page 2 25 mars, 2003

symptomatologie clinique, comme par exemple la forte prvalence de symptmes ngatifs chez les patients sous-corticaux. Dautres diffrences ont t obtenues au niveau des structures neuro-anatomiques et du mtabolisme crbral Dans lensemble, les rsultats de Turetsky et al. (2002) suggrent que le sous-groupe correspondant au profil cortical manifestait des dysfonctions impliquant les lobes temporaux, alors que les anormalits de fonctionnement du groupe profil souscortical se limitaient aux aires fronto-stries. Ces rsultats sajoutent une srie rcente de travaux qui ont tous mis profit lanalyse typologique pour mieux cerner la ralit complexe de la schizophrnie. Comme deuxime exemple dapplication de lanalyse typologique, nous examinerons brivement ltude de Curtiss, Kinder, Kalichman et Spana (1988) qui se sont penchs sur lexpression des affects chez les patients souffrant de douleur chronique. Ces auteurs mentionnent quel point lutilisation du MMPI a domin lavant-scne de la recherche portant sur les dimensions de personnalit associes au syndrome de la douleur chronique. Par exemple, plusieurs chercheurs ont not la prsence chez ces patients de la triade nvrotique caractrise par le profil en V des scores obtenus aux chelles Hypochondrie (Hs), Dpression (D) et Hystrie (Hy) du MMPI. En sappuyant sur des rsultats danalyse factorielle et danalyse typologique, plusieurs auteurs en sont arrivs la conclusion que le groupe des patients souffrant de douleur chronique pouvait en fait tre constitu de quatre sous-types distinguables par leurs profils caractristiques au MMPI. Lobjectif vis par Curtiss et al. (1988) tait double. Dans un premier temps ils voulaient vrifier nouveau lexistence des quatre types dj identifis dans la littrature parmi les patients souffrant de douleur chronique. Comme deuxime objectif, ils se proposaient de vrifier si ces groupes de patients manifesteraient des diffrences au niveau de lexpression des affects comme lanxit et la colre. Leur tude sest effectue auprs de 68 femmes et 76 hommes, tous rfrs pour des douleurs lombaires chroniques. En plus du MMPI qui devait servir dterminer la typologie des patients, on administra le State-Trait Personality Inventory et le Anger Expression Scale comme mesures de lexpression des affects. Les analyses de typologie furent menes sparment pour les hommes et les femmes. Dans les deux segments de lchantillon lanalyse mena la dcouverte de quatre types de patients. Le tableau 5.1 prsente succinctement les profils de ces diffrents types de patients. Les rsultats de lanalyse typologique ont donc men lobtention de diffrents profils reprsentatifs bass sur la performance au MMPI. La deuxime question de recherche consistait maintenant vrifier si ces groupes de patients se distingueraient par leur faon dexprimer leurs affects. Une analyse de variance multivarie a t mene simultanment sur les deux scores danxit (trait et tat) et les quatre scores de colre (trait, tat, in et out) en utilisant la typologie en quatre groupes comme variable indpendante.

_____________________________________________________________________________
Tous droits rservs, Jacques Baillargeon Page 3 25 mars, 2003

Tableau 5.1 Synthse de lanalyse typologique mene par Curtiss et al. (1998) Rsultats dans le groupe des femmes : Scores levs sur Hs, D et Hy Aucun score T au dessus de 70, mais scores levs sur Hs et Hy Scores levs sur Hs, D, Hy, Pd, Pt et Sc Score lev sur Hy et modrs sur Hs et D

Groupe A (n = 14) Groupe B (n = 23) Groupe C (n = 8) Groupe D (n = 13)

connu connu connu Nouveau

Groupe A (n = 22) Groupe B (n = 17) Groupe C (n = 14) Groupe D (n = 23)

Rsultats dans le groupe des hommes : Scores levs sur Hs, D, Hy et Pd. Scores levs sur Hs, D et Hy Scores levs sur F, Hs, Hy, Pd, Pt, Sc et Ma Scores levs sur Hs et Hy

connu nouveau connu connu

Cette analyse MANOVA a t calcule sparment pour les femmes et les hommes. Dans le premier cas, lanalyse a rvl que lappartenance aux groupes base sur la typologie des profils expliquait 73% de la variance des variables mesurant lexpression des affects; la proportion de variance correspondante tait de 60% dans le groupe des hommes. Curtiss et al (1988) ont ensuite examin plus en dtail quels taient les groupes qui se distinguaient et sur quels aspects particuliers de lexpression des affects. Ces rsultats ont confirm la validit de la typologie obtenue au MMPI et ont ouvert une perspective nouvelle propos des traitements spcifiques qui pourraient tre dvelopps pour prendre en compte les particularits des diffrents types de patients souffrant de douleur chronique. Comme troisime et dernier exemple nous dcrirons brivement ltude de Campbell et Johnson (1997) qui a elle-mme t utilise par Hair et Black (2000) dans leur excellent chapitre sur lanalyse typologique. Cette tude a t mene auprs dofficiers de police amricains dans le but de comprendre quelles attitudes ils manifestaient lgard du viol. Les rsultats de cette analyse sont assez troublants car ils ont permis de mettre en vidence lexistence de trois sousgroupes de policiers adoptant des dfinitions trs diffrentes du viol : le plus petit groupe (correspondant 19% de lchantillon) adoptait une dfinition o la force utilise tait critique. Cette dfinition correspondait essentiellement la dfinition lgale du viol dans ltat amricain o sest droule ltude. Le deuxime groupe (31% de lchantillon) tait compos de policiers qui insistaient sur la prsence de pntration pour dfinir le viol. Enfin, le troisime groupe (50% de lchantillon) comprenait des officiers de police qui privilgiaient des dfinitions trs varies du viol et sloignant de faon marque de la dfinition lgale. Ce troisime groupe comportait des individus qui endossaient divers strotypes comme Il arrive quun homme ne puisse plus sarrter quand il a t provoqu! La prise de conscience de lexistence mme de ces trois sous-groupes tait dj une
_____________________________________________________________________________
Tous droits rservs, Jacques Baillargeon Page 4 25 mars, 2003

retombe importante de ltude de Campbell et Johnson (1997). Toutefois, les chercheurs ont poursuivi leur analyse et ont en quelque sorte valid leur typologie en dmontrant que les trois groupes de policiers diffraient les uns des autres sur plusieurs variables qui navaient pas servi dterminer la typologie. Par exemple, ces policiers diffraient quant la formation quils avaient reue dans le domaine lgal, quant leurs attitudes gnrales lgard des femmes, et quant leur sensibilit lgard de la violence interpersonnelle. Vous aurez sans doute remarqu que malgr la diversit de leur thmatique, les trois exemples prsents ont en commun une mme approche gnrale. Une tude qui utilise lanalyse typologique cherche dabord identifier des sous groupes dindividus qui se ressemblent en fonction de certaines variables (par ex., CVLT, MMPI ou dfinition du viol). Une fois la typologie mise en vidence, le chercheur procde une interprtation de son regroupement en dcrivant les profils observs sur les variables utilises dans lanalyse typologique. Enfin, la validit du regroupement obtenu est appuye en dmontrant que les diffrents groupes se distinguent sur un certain nombre de variables pertinentes, autres que celles ayant servi dterminer la typologie. Sur une note plus critique il est important de noter que lanalyse typologique ne mne jamais une solution unique. En fait, lanalyse est tributaire dune srie de choix effectus par le chercheur, dont le plus important est videmment le choix des variables soumises lanalyse. Le simple ajout ou retrait dune variable peut provoquer un reclassement important des units dobservation. Aussi, il faut prendre conscience que lanalyse typologique aboutira toujours une certaine typologie, mme si le classement obtenu ne correspond aucune ralit bien valide. Enfin, il faut noter que lanalyse typologique ne possde aucune proprit infrentielle; ses rsultats sont toujours tributaires de lchantillon dans lequel ils ont t gnrs et seule une rplication indpendante de la solution dans un nouvel chantillon permet de mesurer la gnralit et la robustesse de la typologie. Voyons maintenant plus en dtail comment sutilise cette technique.

La mesure de la ressemblance entre les individus


Lide fondamentale de lanalyse typologique est de constituer des regroupements dindividus ou dobjets qui se ressemblent. Comment justement pouvons-nous mesurer la ressemblance entre des units dobservation qui, dune tude une autre, peuvent tre aussi diversifies que des patients psychiatriques, des sortes de plantes ou des marques de bires? Hair et Black (2000) mentionnent que la ressemblance entre deux individus peut soprationnaliser en mesurant la corrlation entre ces individus laide de leurs scores sur une srie de variables. Il sagit en fait dinverser lordre habituel des choses o lon a lhabitude de calculer la corrlation entre deux variables laide des scores de plusieurs individus. Cette premire faon de mesurer la ressemblance mne
_____________________________________________________________________________
Tous droits rservs, Jacques Baillargeon Page 5 25 mars, 2003

gnralement une technique que lon appelle lanalyse factorielle de type Q. Une deuxime faon de mesurer la ressemblance consiste examiner des indices dassociation entre les rponses des individus. Par exemple, si deux personnes ont rpondu une centaine de questions dichotomiques, il est possible dvaluer leur ressemblance en dterminant le pourcentage de fois o elles ont donn une rponse identique la mme question. Cette approche est gnralement rserve aux situations o les donnes disponibles sont de nature catgorielle. La troisime faon dvaluer la ressemblance entre deux individus est de mesurer la distance euclidienne 2 qui les spare dans un espace dtermin par lensemble des variables sur lesquelles ils ont t mesurs. Puisque cest la mthode la plus populaire en analyse typologique, nous examinerons dun peu plus prs cette mesure de distance. Le tableau 5.2 prsente des mesures de la valeur nergtique et du cot de trois bires diffrentes. On peut facilement constater que la Budweiser et la Miller Light se ressemblent beaucoup si lon tient compte uniquement du prix, mais que la Budweiser ressemble plutt la Lowenbrau si lon tient compte du nombre de calories. Quen est-il de leur ressemblance si lon veut tenir compte simultanment des deux traits mesurs? Tableau 5.2 Comparaison de la valeur nergtique et du cot de trois marques de bire. Calories Budweiser Lowenbrau Miller Light Moyenne : cart-type : 144 157 99 133.3 24.85 Cot 43 48 43 44.7 2.36

La faon de tenir compte simultanment des deux mesures est de calculer la distance euclidienne2 en utilisant la position des diffrentes bires dans un plan cartsien dfini par les variables calories et cot . Distance euclidienne2 132 + 52 = 194 2 2 58 + 5 = 3389 2 2 45 + 0 = 2025

Budweiser vs Lowenbrau Lowenbrau vs Miller Light Budweiser vs Miller Light

_____________________________________________________________________________
Tous droits rservs, Jacques Baillargeon Page 6 25 mars, 2003

Vous remarquerez que cette faon de calculer la distance ente les bires est fortement dpendante des units de mesure utilises. Dans le cas prsent, les distances seront majoritairement dtermines par la valeur nergtique des bires puisque ltendue de cette mesure couvre 58 units (157 99), alors que ltendue de la variable cot ne touche que 5 units de mesure (48 43). La solution la plus pratique consiste donc standardiser les mesures avant de procder au calcul de la distance euclidienne.

Tableau 5.3 Comparaison de la valeur nergtique et du cot de trois marques de bire aprs standardisation des mesures. Calories Budweiser Lowenbrau Miller Light Moyenne : cart-type : 0.43 0.95 -1.38 0.00 1.00 Cot -.72 1.40 -.72 0.00 1.00

Avec ces mesures standardises il est maintenant possible de recalculer les distances euclidiennes2 sans que lune ou lautre des mesures ne vienne influencer exagrment lvaluation de la distance inter bires : Distance euclidienne2 -0.522 + (-2.12)2 = 2.332 + 2.122 = 1.812 + 02 =

Budweiser vs Lowenbrau Lowenbrau vs Miller Light Budweiser vs Miller Light

4.76 9.92 3.28

La faon de constituer les groupes


Une fois que nous avons dtermin la distance qui spare chacune des units observes de toutes les autres, il faut ensuite procder au regroupement comme tel. Il y a plusieurs faons denvisager cette tape. Par exemple, il serait possible dimaginer que tous les individus font dabord partie dun seul et mme
_____________________________________________________________________________
Tous droits rservs, Jacques Baillargeon Page 7 25 mars, 2003

groupe que lon pourrait dabord fractionner en deux sous-groupes et continuer ainsi de suite jusqu lobtention dun nombre quelconque de groupes. Bien que cette faon de faire soit envisageable, elle nest pas la plus populaire. Gnralement, on privilgie la mthode par agglomration qui consiste faire exactement le processus inverse. Lalgorithme utilis est relativement simple; voici un peu comment il se prsente : tape 1 : tape 2 : tape 3 : il existe autant de groupes distincts quil y a dobjets classifier; les deux objets les plus proches dans lespace se joignent dans un mme groupe deux autres objets se joignent et constituent un nouveau groupe sils sont trs proches lun de lautre; cependant, il est aussi possible quun 3e objet aille se joindre la dyade dj prsente dans le premier groupe. Tout se dcide en fonction de la distance la plus courte dans lespace tudi. Le processus se poursuit de la mme faon jusqu puisement des objets regrouper. Au terme du processus, lespace ne contiendra plus quun seul groupe.

tape 4 :

La procdure par agglomration qui vient dtre dcrite laisse encore la place une prise de dcision critique dans le processus. En effet, ltape 3 on a vu quil est possible que deux objets sunissent pour former un nouveau groupe ou quun objet aille se joindre un groupe dj constitu. Puisque la dcision dpend de la distance entre les objets et les groupes, il faut donc aussi tre capable de mesurer la distance entre groupes. Il existe videmment plusieurs faons doprationnaliser cette mesure, mais la plus populaire tient compte de la distance moyenne entre les groupes ( average linkage between groups. Par exemple, supposons que le groupe A contient les individus 1 et 2 et que le groupe B est constitu des individus 3, 4 et 5, la distance entre les groupes A et B correspondra la moyenne des distances entre toutes les paires possibles inter-groupes : (1, 3), (1, 4), (1, 5), (2, 3), (2, 4) et (2,5). Les autres faons de mesurer la distance intergroupes considrent les voisins les plus proches, les voisins les plus loigns, etc. Comme vous le voyez, lanalyse typologique repose sur lapplication dun algorithme trs simple qui entrane une srie de solutions allant de n groupes distincts et trs homognes (o n = nombre dobjets classer) jusqu un groupe unique trs htrogne. La dcision quant au nombre de regroupements conserver pour la solution finale prendra en compte diffrents facteurs comme le niveau dhomognit intra-groupe et la facilit interprter chacune des solutions.

_____________________________________________________________________________
Tous droits rservs, Jacques Baillargeon Page 8 25 mars, 2003

Rfrences
Campbell, R., & Johnson, C. R. (1997). Police officers perceptions of rape: Is there consistency between state law and individual beliefs? Journal of Interpersonal Violence, 12(2), 255-274. Curtiss, G., Kinder, B. N., Kalichman, S., & Spana, R. (1988). Affective differences among subgroups of chronic pain patients. Anxiety Research, 1, 65-73. Hair, J. F. Jr., & Black, W. C. (2000). Cluster analysis. Dans Grimm, L. G. & Yarnold, P. R. (d.), Reading and understanding more multivariate statistics (pp. 147-205). Washington, DC: APA. Turetsky, B. I., Moberg, P. J., Mozley, L. H., Moelter, S. T., Agrin, R. N., Gur, R. C., & Gur, R. E. (2002). Memory-delineated subtypes of schizophrenia: Relationship to clinical, neuroanatomical, and neurophysiological measures. Neuropsychology, 16, 481-490.

_____________________________________________________________________________
Tous droits rservs, Jacques Baillargeon Page 9 25 mars, 2003