Vous êtes sur la page 1sur 238

Ludovic Lebart

Marie Piron
Jean-Franois Steiner

La Smiomtrie
Essai de statistique structurale

II

La Smiomtrie

La Smiomtrie

III

La Smiomtrie
Essai de statistique structurale

IV

La Smiomtrie

Avant-propos
Cet ouvrage sadresse aussi bien des statisticiens qu des psychosociologues, des spcialistes du marketing, de la communication, des
linguistes, et plus gnralement au grand public cultiv. La smiomtrie
est en effet la fois une curiosit philosophique, un outil du marketing et
un champ dexprimentation exceptionnel pour les statisticiens.
Dans ces diverses disciplines, louvrage devrait intresser un public
trs large allant des praticiens des bureaux dtudes ou des instituts de
sondage, aux tudiants, professeurs et chercheurs des universits ou des
grandes coles.
Plusieurs lectures sont possibles selon les connaissances du lecteur en
mathmatique et statistique, car des annexes et un glossaire, en fin
douvrage, permettent disoler les parties trs techniques du texte, tout en
en donnant une prsentation assez simple, renvoyant sur des rfrences
accessibles et plus compltes.
Lensemble doit beaucoup des collaborations et des cadres de travail
divers : au sein du dpartement Economie Gestion et Sciences Humaines
de lEcole Nationale Suprieure des Tlcommunications, dirig par
Laurent Gille, et de lURA 820 du Centre National de la Recherche
Scientifique (Laboratoire de Traitement et Communication de
lInformation, dirig par Henri Matre) ; au sein de lInstitut de
Recherche pour le Dveloppement (IRD).

VI

La Smiomtrie

Nous sommes redevables de trs nombreuses corrections, remarques,


et suggestions cinq personnes dont le travail de relecture et de critique
fut en fait un vritable travail de collaboration. Il sagit de Zysla Belliat
et Hlne Haering, toutes deux membres du Comit Scientifique du
Centre dEtude des Supports de Publicit ; de Belad Ghermani de
lUniversit de Paris-Crteil ; de Franoise Potier de lInstitut National
de Recherche sur les Transports et leur Scurit ; de Jacqueline Sultan de
la Socit EMSIS.
Nous remercions galement pour leurs remarques et observations
pertinentes Christine Bellavoine, Etienne Brunet, Michel Grojnowski,
Marie-Claude Lebart, Grard Miltelberg, Armand Morgenzstern,
Christine Tobin.
Nous restons videmment seuls responsables des erreurs ou omissions
qui pourraient subsister dans le texte.
Nous voudrions aussi dire toute notre gratitude Jeannine Bouvet qui
sest livre, avec une parfaite intelligence et le plus total
dsintressement aux multiples travaux de saisie qui ont t la base des
diffrentes expriences dcrites aux chapitres 3 et 4.
Nous sommes heureux dadresser ici nos remerciements Bruno
Colin, Directeur des Oprations de la Socit Taylor Nelson Sofres,
notamment pour laccs aux corpus de donnes smiomtriques.
Nos remerciements vont galement Jean Henriet, des ditions
Dunod, ainsi qu Virginie Catoni, pour laccueil quils ont rserv cet
ouvrage.
L. L., M. P, J.-F. S.
Paris, 2003

La Smiomtrie

VII

Sommaire
Prambule

Introduction : Quest-ce que la smiomtrie ?

Chapitre 1
Des mots, des individus une structure

1.1 Des mots, un questionnaire


1.2 Lenqute reprsentative
1.3 Lanalyse en composantes principales
1.4 Les axes principaux stables : axes smiomtriques
1.4.1 Axe 1 : Un axe mthodologique de participation
1.4.2 Axe 2 : Devoir / Plaisir
1.4.3 Axe 3 : Attachement / Dtachement
1.4.4 Le plan smiomtrique des axes 2 et 3
1.4.5 Axe 4 : Esprit / Matire
1.4.6 Axe 5 : Cur / Raison
1.4.7 Axe 6 : Humilit / Souverainet
1.4.8 Les axes suivants

1.5 Les plans smiomtriques


1.5.1 Les multiples facettes du Plaisir
1.5.2 Les multiples facettes du Devoir
1.5.3 Les dimensions smantiques des mots eux-mmes

1.6 Conclusion

Chapitre 2
Stabilit de la structure smiomtrique
2.1 Stabilit empirique
2.1.1 Stabilit dans le temps
2.1.2 Stabilit par pays
2.1.3 Stabilit selon le sexe
2.1.4 Stabilit selon lge

2.2 Intervalles de confiance des valeurs propres


2.3 Stabilit par rchantillonnage
2.3.1 Bootstrap partiel
2.3.2 Bootstrap total

2.4 Stabilit structurelle


2.5 Stabilit vis--vis du codage
2.6 Analyse en facteurs communs et spcifiques
2.7 Conclusion

10
14
17
19
19
21
22
24
24
25
26
27
29
29
35
36
37
39
40
40
41
51
53
55
58
59
59
64
67
69
71

VIII

La Smiomtrie

Chapitre 3
Structures smantiques et smiomtrie
3.1 Les champs smantiques internes
3.1.1 Reprsentation hirarchique des proximits smantiques
3.1.2 Reprsentation plane des proximits smantiques

3.2 Voisinage smantique du questionnaire smiomtrique


3.3 Rseau smantique des verbes franais

Chapitre 4
Choix spontan des mots
4.1 Mise en place de lexprience
4.2 Premires explorations des rponses
4.3 Etude des axes principaux des rponses spontanes
4.4 Choix spontan et caractristiques des rpondants
4.5 Rapprochement entre smiomtrie et questions ouvertes
4.6 Conclusion

Chapitre 5
Notations, participation, attitudes
5.1 Notation, participation et facteur de taille
5.1.1 Les effets notation
5.1.2 Les effets participation
5.1.3 Les facteurs de taille

5.2 Cration et positionnement de variables de contrle


5.3 Les notations dans quatre pays europens
5.4 Typologie partir des seules variables de contrle
5.5 Quels rapports entre les notes donnes aux mots,
la faon de noter, et les caractristiques des individus ?
5.6 Les plans de notation en Espagne, Grande Bretagne et
Allemagne
5.6.1 Effets notation en Espagne
5.6.2 Effets notation en Grande Bretagne
5.6.3 Effets notation en Allemagne

5.7 Correction des notes par double centrage


5.8 Evolution des notations, en France, de 1990 2002
5.9 Conclusion

Chapitre 6
Essais dinterprtation
6.1 Une premire approche
6.2 Une interprtation psychanalytique

73
75
76
77
81
86
93
94
99
102
105
110
116
119
120
120
120
121
121
124
127
130
135
135
136
137
138
142
145
147
148
152

La Smiomtrie

Chapitre 7
Quelques applications de la smiomtrie
7.1 Les mots caractristiques des hommes et des femmes
7.2 Les mots caractristiques de deux classes dge
7.3 Les grands amateurs de tlvision
7.4 Les mots caractristiques de deux classes de jeunes
7.5 Les mots caractristiques de deux classes dge
au del de 60 ans
7.6 Hommes et femmes ayant attribu la note 7 au mot Dieu
7.7 Evolution des valeurs des Franais entre 1996 et 1998
7.8 Conclusion

IX

159
161
162
163
165
166
168
170
173

Conclusion

175

Annexe 1
Quelques lments de statistique multidimensionnelle

183

A1.1 Rappel des principes des mthodes exploratoires


multidimensionnelles
A1.1.1 Reprsentation gomtrique et nuages de points
A1.1.2 Principe et mthodes danalyse

A1.2 Les mthodes factorielles : aspects techniques


A1.3 LAnalyse en Composantes Principales :
aspects techniques
A1.3.1 Interprtations gomtriques
A1.3.2 Problme dchelle de mesure et transformation des donnes
A1.3.3 Analyse du nuage des rpondants
A1.3.4 Analyse du nuage des variables (mots)

A1.4 LAnalyse des correspondances


A1.5 Lanalyse logarithmique
A1.6 Lanalyse factorielle en facteurs communs et spcifiques
A1.7 Mthodes de classification hirarchique
A1.8 Les cartes auto-organises de Kohonen
A1.9 Outils de validation
A1.9.1 Quest-ce quune valeur-test ?
A1.9.2 Le problme des comparaisons multiples
A1.9.3 Utilit des lments supplmentaires
A1.9.4 Intervalles de confiance dAnderson
A1.9.5. Les techniques de bootstrap

184
184
185
187
190
190
190
191
192
194
195
196
197
199
200
201
203
204
205
205

Annexe 2
Quelques lments et rsultats danalyse

211

A2.1 Dictionnaire multilingue des mots

211

La Smiomtrie

A2.2 Moyenne des notes


A2.3 Corrlations des mots par axe

216
218

Glossaire

221

Bibliographie

225

Prambule
A lorigine de la Smiomtrie
La Smiomtrie est ne dune exprience que tout homme a faite au
moins une fois dans sa vie, dune manire consciente et lucide ou si
fugace que lesprit nen a gard aucune trace mmorable.
Je veux parler de cet instant o, soudain, pour quelque raison
mystrieuse, nous cessons de communiquer avec les tres et les objets
qui nous entourent, o ils cessent de nous parler, o ils ne nous disent
plus rien, o nous nous retrouvons tout seuls au milieu dun monde
minral peupl dobjets morts, et dans lequel, les sens glacs, lesprit
fig, nous ne savons plus nous orienter. Quelques instants ou quelques
jours auparavant le phnomne se dclenche dune manire plus ou
moins brutale et sa dure est extrmement variable le monde tait plein
de vie, de sons, de couleurs, de saveurs, dodeurs, de sensations
agrables ou dsagrables, dobjets et dtres qui nous attiraient, dautres
qui nous repoussaient, que nous aimions ou que nous hassions, mais que
nous pouvions nommer et dont le nom signifiait quelque chose pour
nous, tait dou dun pouvoir vocateur qui faisait natre, sa seule
nonciation, un cortge de sensations qui en taient comme la signature :
un ami tait quelque chose de chaud et de prcieux, de rare aussi, de
solide, trs solide, et pourtant, en mme temps, de trs fragile ; une
maison tait aussi quelque chose de chaud, mais dune autre chaleur ;
alors que la chaleur de lami irradiait partir dun point situ au milieu
de la poitrine, celle de la maison semblait plutt descendre de quelque

Prambule

lieu inconnu et extrieur nous et nous pntrer lentement de bonheur ;


la chaleur de lami tait aussi plus intense, plus violente que celle de la
maison; ctait une chaleur rouge alors que celle de la maison tirait plutt
sur le bleu. Le mot guerre aussi signifiait quelque chose ; ctait un tout
autre monde de sensations qui semblaient appartenir une zone qui se
situait aux antipodes de celle laquelle appartenait le mot maison, mais
qui semblait avoir un territoire commun avec le mot ami. Le mot arbre
aussi avait une signification et le mot rivire et le mot chemin et le mot
cole et le mot t et le mot fort et le mot tristesse et mme le mot
ennui, et jusquau mot dsespoir.
Bref, grce aux signes qui permettent de le dcrire, le monde avait un
sens ; il nous tait intelligible ; nous savions nous y orienter ; il tait
notre milieu naturel, si naturel mme que la pense ne nous effleurait pas
que nous pourrions en tre exclus autrement que par la mort. Nous tions
si accoutums le retrouver chaque matin notre rveil, toujours
identique lui-mme lexception de quelques objets qui de temps en
temps, migraient dune zone dans une autre , que nous navions pas
rflchi cette vidence si forte, pourtant, ds lors quon la conoit
que le sens nest pas consubstantiel au monde qui nous entoure, quil
nen est quune proprit que nous lui attribuons, quune autre ralit que
nous projetons sur lui. Il avait fallu cette exprience de perte du sens
dans la triple acception du mot : sensation, signification et direction
pour nous faire apprhender ce fait bien banal que le sens est un
phnomne autonome et indpendant des objets travers lesquels il
sincarne, quil est une ralit, au moins psychique sinon physique, et
donc, quil doit pouvoir tre tudi indpendamment des objets auquel il
sert dattribut et par la mdiation desquels on le peroit gnralement.
Mais cette premire exprience en contenait une autre, qui en tait
comme la suite logique : non seulement il y avait DU sens, mais il y
avait aussi DES sens. Ainsi le mot chteau, non seulement pouvait tre
dou (ou dnu) de sens mais, ds lors quil possdait cette proprit, il
en dcoulait ncessairement quil possdait aussi UN (ou plusieurs) sens.
Et cette deuxime exprience, son tour, en contenait implicitement
une troisime : ces diffrents sens rvls par les mots taient plus ou
moins proches les uns des autres. Ainsi le sens du mot chteau tait
intuitivement plus proche de celui du mot maison que de celui du mot
mathmatique, mais plus proche encore de celui du mot palais. Le sens
du mot maison semblait quidistant de celui des mots chteau et palais.
Le sens du mot mathmatique tait si loign de celui de ces trois

La Smiomtrie

derniers quil tait difficile de dire sil tait plus proche de lun dentre
eux, de la mme manire que trois points trs proches semblent
pareillement distants dun quatrime, si celui-ci est situ une grande
distance ; quoique, y regarder de plus prs, le sens du mot chteau
paraissait trs lgrement moins loign de celui du mot mathmatique
que ne ltait celui du mot maison. Comme pour le sens des autres mots,
ce ntait quune intuition, mais si tnue, si subtile, si insaisissable
quelle svanouissait ds que nous essayions de la raisonner, et qui
pourtant renaissait presque instantanment, comme quelque tache
indlbile, ds que nous dtournions delle la lumire trop crue de notre
attention. Ces intuitions qui nous faisaient attribuer une distance de sens
entre les mots possdaient donc un fondement ; elles taient lexpression
dune ralit qui, pour apparemment inaccessible un instrument
dobservation objectif, nen tait pas moins stable et, donc,
thoriquement mesurable. On pouvait donc imaginer un espace qui
contiendrait lensemble des mots dune langue, disposs les uns par
rapport aux autres en fonction de la distance sparant leur sens. Ce serait
une sorte de dictionnaire gographique dans lequel les mots ne seraient
pas rangs dans lordre alphabtique ce qui, pour pratique quil soit,
nen est pas moins un classement relativement arbitraire mais disposs,
les uns par rapport aux autres, en fonction de leur sens, un dictionnaire
organique dans lequel chaque mot serait dfini (mathmatiquement) par
sa position dans lensemble de tous les autres. Par rfrence Ferdinand
de Saussure qui, imaginant une science des signes, avait propos de
lappeler smiologie, je baptisai mon entreprise, smiomtrie1.
*
* *
Jprouve une trs grande gratitude lgard des personnes qui mont aid
dans cette entreprise. Je voudrais dabord citer le nom de Philippe Court
dont lamiti indfectible et une foi inbranlable mont soutenu ds le
premier instant. Je voudrais aussi citer celui dEric Stemmelen, lpoque
ingnieur au Commissariat lEnergie Atomique, qui ma appris les
premiers rudiments de lanalyse de donnes, avant de diriger le
dpartement que la Sofrs avait cr pour dvelopper commercialement les
1. Lide quil existe un espace du sens pouvant tre modlis revient Charles E. Osgood.
Cest lui, en effet, qui, dans les annes 50, imagina le premier un dispositif destin
reconstruire cet espace. Ce dispositif diffre radicalement de celui mis en oeuvre par la
Smiomtrie et jignorais tout des travaux dOsgood lorsque je conus celui-ci. Mais il
convenait de citer le nom de celui qui avait introduit ce concept si riche despace de sens,
cf. Osgood (1965), Osgood et al (1957).

Prambule

applications de la smiomtrie. Dans lordre chronologique, il me faut


ensuite citer ceux de Georges Levitte et de Lon Szary qui a crit le premier
programme grce auquel jai pu procder aux premires exprimentations.
Sil ne fut pas mon premier mentor, Emeric Deutsch, lpoque lun des
dirigeants de la Sofrs, fut certainement le plus dcisif, grce la
profondeur de ses connaissances tant en psychanalyse et en linguistique que
dans le domaine des tudes de march.
Je dois aussi remercier la Sofrs, son Prsident, Pierre Weill qui a mis ma
disposition des moyens dont peu de chercheurs disposent, son DirecteurGnral, Henri Wallard, dont lamiti me fut bien prcieuse, Jean-Michel
Portier, Jean-Paul Aimetti, Jol Boillot, Mireille Gettler-Summa, JeanPierre Dreyfus, Valrie Morrisson, et tant dautres.

Jean-Franois Steiner

La Smiomtrie

Introduction :
Quest-ce que la smiomtrie ?
A la question Quest-ce que la smiomtrie ? , il est facile de
rpondre navement : Cest une longue liste de mots auxquels on fait
attribuer une note (selon leur caractre plus ou moins agrable ou
dsagrable) par des milliers de gens .
Tentons quand mme des caractrisations plus acadmiques :
-

la smiomtrie est une technique de description de certains types


de liens smantiques entre mots ;

la smiomtrie est un instrument de recherche plus fondamentale


permettant dapprocher (avec prudence et circonspection) des
notions telles que l inconscient collectif ou individuel,
permettant aussi de mettre en vidence et de valider des traits
structuraux (dont la finesse laisse parfois pantois) ;

la smiomtrie est un outil destin dcrire des systmes de


valeurs et des styles de vie, en vue dtudes psycho-sociologiques
ou dapplications en marketing.

La smiomtrie est en fait un peu tout cela, et, cest ce que cet
ouvrage propose de montrer.
La premire dfinition nave est lvocation dun protocole
exprimental labor et rigoureux, auquel sera dailleurs dvolu le
premier chapitre de cet ouvrage. Cette phase exprimentale qui
comporte de nombreuses enqutes rptes dans le temps et dans

Introduction

lespace (notamment dans plusieurs pays occidentaux) constitue la


base de toute la mthodologie smiomtrique, base qui sera valide
par des traitements statistiques puissants, mais aveugles, cest--dire
indpendants de tout cadre interprtatif. Notons que, au niveau de la
prsentation, dans ce premier chapitre comme dans ceux qui vont
suivre, les dveloppements techniques seront reports en annexe de
faon permettre une lecture plus directe du contenu, des rsultats, et
de la mthodologie gnrale, sans heurt ni digression.
Le thme de la stabilit de structures (stabilit dans le temps et
lespace) qui fait lobjet du deuxime chapitre, est central dans la
problmatique de la smiomtrie. Cette stabilit est tablie partir de
la rptition denqutes indpendantes, mais aussi partir dpreuves
de validit plus techniques (mthodes statistiques dites de
rchantillonnage). Cest cette stabilit qui permet daffirmer la ralit
de certains traits structuraux observs et qui donne aux cartes
smiomtriques, largement utilises lors des applications, leur valeur
de grilles de reprage.
La stabilit des structures pour un questionnaire donn (comportant
le choix dune liste de mots) tant tablie dans diffrents pays et
diffrents moments, il reste le problme du caractre intrinsque de
cette structure, cest--dire de son indpendance vis--vis du
questionnaire lui-mme, et non pas seulement vis--vis des
populations auxquelles ce questionnaire est soumis.
Les trois chapitres suivants voquent nos recherches
mthodologiques autour de ce thme. Pour mieux comprendre la
nature des faits statistiques observs, diverses expriences ont t
ralises : tude de certains rseaux smantiques attachs aux mots
choisis, puis tude de rseaux smantiques plus gnraux (chapitre 3),
questionnaire ouvert laissant la personne interroge choisir
spontanment, sans liste pralable, les mots quelle trouve agrables
ou dsagrables (chapitre 4). Ces expriences sont dailleurs
loccasion daborder dautres directions de recherche suscites par
loutil smiomtrique et la structure multidimensionnelle quil rvle.
Le cinquime chapitre est dvolu au problme technique, souvent
lud, du lien entre lattitude de la personne interroge par rapport au
questionnaire ou lenqute et le contenu mme du questionnaire ou
la finalit de lenqute.
Lgrement en retrait par rapport aux considrations empiriques et
techniques prcdentes, un essai dinterprtation de la partie stable des

La Smiomtrie

structures smiomtriques est propos au sixime chapitre. Quel que


soit le degr dadhsion du lecteur aux thses prsentes, il ne sera
probablement pas insensible aux tonnantes convergences
mentionnes.
Enfin, au cours du septime chapitre, dvolu aux applications de
loutil smiomtrique, nous serons amens prsenter des
applications pratiques ou pragmatiques (en gnral commerciales :
mdia-planning, positionnement ou caractrisation de marques), des
applications des problmes plus gnraux (volution des valeurs,
caractrisation de groupes socio-dmographiques particuliers).
Le chapitre 8 est en fait une conclusion, qui ne peut tre que
provisoire dans le cadre dun travail aussi prilleusement pluridisciplinaire ; cest aussi une invitation des recherches futures, dans
un domaine que nous proposons dappeler statistique structurale .
Viennent enfin les annexes, austres entrepts de matriaux, de
rsultats, de rappels techniques, o le lecteur motiv par les chapitres
prcdents pourra trouver des rponses beaucoup de questions
souleves au cours de son voyage dans cet espace multidimensionnel.

CHAPITRE 1
Des mots, des individus une structure
Les tudes socio-conomiques mettant en uvre des enqutes par
sondage caractrisent en gnral les individus interrogs (consommateurs,
usagers, lecteurs, justiciables, patients, pargnants, lecteurs) par ce
quon appelle usuellement les variables signaltiques, ou encore les
caractristiques socio-dmographiques de base (sexe, ge, niveau
dinstruction, profession, statut matrimonial, revenu, pour citer les plus
usuelles). Ces caractristiques ont incontestablement un certain pouvoir
prdictif des comportements. Dans le domaine des tudes marketing, il est
cependant apparu ncessaire, au cours des dcennies prcdentes, de dcrire
plus finement les personnes interroges partir de questionnaires faisant
intervenir des variables plus subjectives ou plus psycho-sociologiques.
Cest en gnral sous la dnomination dtudes de styles de vie ou de
courants socio-culturels quont t conduites ces tentatives de
description1.
Si lon devait trouver parmi les mthodologies existantes la dmarche la
plus proche de celle que nous dsignons ici par Smiomtrie , cest
probablement aux tudes styles de vie quil faudrait se rfrer, malgr de
sensibles divergences de motivation, de filiation, et mme de principes2.
1. On pourra trouver un panorama et une synthse critique de ces tudes dans louvrage de
Pierre Valette-Florence : Les styles de vie. Bilan critique et perspectives. Nathan, Paris, 1994.
2. Cf. Steiner et Auliard (1992).

10

Des mots, des individus, une structure...

Ces tudes mettent en uvre des questionnaires en gnral assez


volumineux, faisant une large part aux questions dopinion.
Prenons lexemple de deux familles denqutes apparentes aux tudes
styles de vie dont les questionnaires sont ou furent transparents, cest--dire
accessibles dans leur intgralit aux utilisateurs : le systme denqutes
Agoramtrie 1 et le systme denqutes sur les Conditions de vie et
aspirations des Franais 2.
Pour la premire famille cite, donnons titre dexemple le libell dune
des questions permanentes du questionnaire: Etes-vous : pas du tout
daccord, pas tellement daccord, peut-tre daccord, bien daccord,
entirement daccord, avec la phrase suivante : Il faut rtablir la peine de
mort .
Pour la seconde famille denqutes cite, et dans la mme veine, ct
de questions consistant galement consigner un degr daccord, figurent
des questions du type suivant : Parmi ces opinions, quelle est celle qui se
rapproche le plus de la vtre : Le mariage est : 1. Une union
indissoluble ; 2. Une union qui peut tre dissoute dans des cas trs
graves ; 3. Une union qui peut tre dissoute par simple accord des deux
parties ; 4. Ne sait pas .
Le questionnaire smiomtrique, lui, peut tre considr comme une
forme pure lextrme de questionnaire style de vie , puisque, comme
nous allons le voir, il ne sagit plus de donner son opinion sur des
propositions prsentes sous forme de phrases plus ou moins lapidaires,
mais dattribuer des notes des mots en fonction des sensations agrables
ou dsagrables que provoquent leurs vocations.
Nous allons prsenter dans ce chapitre le questionnaire, puis le
fonctionnement de loutil smiomtrique de base : lenqute par sondage
(comment et par qui fait-on remplir les questionnaires), et les traitements
statistiques avec lmergence de la structure smiomtrique de base.

1.1 Des mots, un questionnaire


La smiomtrie repose sur une liste de 210 mots (cf. tableau 1.1) censs
reprsenter, directement ou indirectement, les principales valeurs de la
1. Ce systme denqute a t fond et dirig par Jean-Pierre Pags et Georges Morlat (cf.
Fabre et al., 1981).
2. Sur le systme denqute sur les Conditions de vie et aspirations des Franais du Crdoc,
mis au point en 1978 avec la collaboration de Jacques Antoine, cf. Lebart et Houzel (1980), Lebart
(1986).

La smiomtrie

11

socit occidentale. Ils ont t choisis en fonction de quatre critres : nonconsensualit, univocit smantique, stabilit smantique et puissance
dvocation. Par ailleurs, et afin de lui assurer une certaine reprsentativit
tout en vitant, du moins partiellement, une trop grossire projection de la
subjectivit de lauteur, cette liste a t tablie, lorigine, partir des
quelque trois cents racines dont sont issus 95% des mots du Pentateuque
(cinq premiers livres de lAncien Testament)1. La liste originale qui
comprenait 306 mots a t ensuite retravaille en sappuyant sur les
rsultats, dune part danalyses statistiques successives destines mettre
en vidence les zones de trop forte et de trop faible densit et, dautre part,
de groupes de crativit qui il tait demand dimaginer les mots
manquants.
Cette premire liste a t ramene, par souci dconomie et dergonomie,
la liste actuelle de 210 mots. Si cette rduction a invitablement entran
une perte dinformation, elle na pas affect la stabilit de la structure mise
en vidence par la liste complte.
Ces mots comprennent des substantifs, des adjectifs et des verbes.
Certains substantifs sont accompagns de larticle dfini et dautres de
lindfini. Le choix qui a t fait de la forme du mot et de larticle est
intuitif et, donc, plus ou moins arbitraire. Il rpondait au souci de trouver le
signifiant qui, dune part, correspondrait le mieux au concept sous-jacent
quil sagissait de mesurer et, dautre part, dont leffet de stimulation serait
le plus fort, mais aussi qui serait le plus euphonique.
Si dans certains cas le choix simposait pour des raisons videntes : la
nudit et non une nudit, le thtre et non un thtre, une le et non lle, une
muraille et non la muraille, dans dautres, il tait moins immdiat : sduire
et non la (ou une) sduction, critiquer et non la (ou une) critique, le dsir et
non un dsir ou dsirer, un parfum et non le parfum, un mariage et non le
mariage, humble et non lhumilit, intime et non lintimit, le dsert et non
un dsert,.

1. La question de la dfinition dun corpus de mots qui pourrait prtendre une certaine
reprsentativit des concepts laide desquels lhomme peroit et dcrit le monde et ses
relations avec lui paraissait, Jean-Franois Steiner, aussi simple poser que difficile rsoudre
lorsquil eut, fortuitement, connaissance de cette particularit du texte biblique. La place
privilgie que ce texte avait occup dans la culture occidentale ainsi que sa vocation rendre
compte des principales expriences spirituelles, affectives, sensibles, etc. de lhomme entre le
moment de sa naissance et celui de sa mort, lui laissa penser qu partir du sens de ces 300 racines
pourrait tre tablie une liste de mots qui servirait de matrice au questionnaire imagin.

12

Des mots, des individus, une structure...

Tableau 1.1 : Les mots de la smiomtrie


labsolu
lacharnement
acheter
admirer
adorer
lambition
lme
lamiti
langoisse
un animal
un arbre
largent
une armure
lart
astucieux
lattachement
attaquer
laudace
aventurier
un btisseur
un bijou
bleu
bohme
un cadeau
la campagne
une caresse
une crmonie
une certitude
le changement
charitable
charnel
la chasse
un chercheur
commander
le commerce
concret
la confiance
le confort
conqurir
consoler
construire
le courage

un crateur
un cri
critiquer
le danger
un dfi
le dsert
le dsir
le dsordre
le dtachement
Dieu
diffrent
la discipline
la douceur
le doute
dynamique
leau
lcole
conomiser
crire
efficace
un effort
llgance
llite
une motion
lenfance
enseigner
ensemble
escalader
ternel
un tranger
une vasion
la famille
une faute
fconder
fminin
la fermet
le feu
la fidlit
une fleur
un fleuve
la foi
une frontire

un fusil
la gaiet
la gloire
gratuit
gurir
la guerre
hriter
un hros
honnte
lhonneur
humble
lhumour
une le
immense
immobile
un inconnu
lindustrie
linfini
interdire
interroger
intime
un inventeur
lironie
un jeu
la justice
un labyrinthe
la lgret
un livre
la logique
la loi
la lune
la magie
une maison
matriser
un mariage
un masque
matriel
maternel
la mfiance
mtallique
la minceur
la mode

la modration
la modestie
moelleux
une montagne
la morale
la mort
une muraille
la musique
un mystre
nager
la naissance
un nid
noble
un nud
noir
la nudit
obir
locan
lor
un orage
original
la paix
le pardon
un parfum
la patience
la patrie
la peau
la perfection
la posie
la politesse
prcieux
la prcision
un prtre
produire
la proprit
protger
la prudence
la puissance
punir
la puret
une question
raffine

la raison
une rcompense
le recueillement
rflchir
une rgle
le respect
rver
la rvolte
la richesse
rigide
rire
robuste
rompre
rouge
la ruse
sacr
un sacrifice
sauvage
la science
un secret
sduire
sensuel
soigner
un soldat
un sommet
la souplesse
souverain
sublime
la tendresse
le thtre
la tradition
trahir
le travail
utilitaire
vert
la victoire
le vide
vieillir
viril
la vitesse
volontaire
voluptueux

La smiomtrie

13

La formulation gnralement utilise dans les questions dattitude porte


sur lintrt ou lopinion de linterview lgard de litem propos, ce qui
a pour effet de placer celui-ci dans une position de juge extrieur et ainsi de
lamener rationaliser peu ou prou sa rponse. Pressentant que
linformation recueillie serait dautant meilleure qualit quelle serait
fournie partir dun niveau plus inconscient, il a sembl plus pertinent
dessayer de mesurer laffect dclench par le mot. Celui-ci jouant alors le
rle dune sorte de stimulus qui contournerait la conscience et djouerait
ainsi les invitables dformations que produisent les multiples censures que
celle-ci dresse entre le sujet et son inconscient. Cest ainsi quil est
demand aux interviews de noter les mots en fonction de la sensation,
agrable ou dsagrable, que provoque leur lecture1.
Toujours dans ce mme souci dobtenir des rponses les plus
naturelles possible, il leur est recommand, par ailleurs, dans un court
texte introductif, de rpondre en une seule fois, le plus spontanment
possible en se laissant guider par leurs ractions instinctives, et conseill,
dans le cas o ils viendraient hsiter certains mots provoquant
ncessairement des ractions ambivalentes , de donner nimporte quelle
note et de passer au mot suivant. Enfin, afin dviter les effets de halo et
dordre, on utilise vingt rotations de questionnaires dans lesquelles lordre
des mots est tir alatoirement.
Lchelle retenue comporte sept modalits variant de 3 +3, le signe (
), qui voque une frustration, tant assez naturellement assimil une
sensation dsagrable et le (+), qui connote, au contraire, des expriences
gratifiantes, une sensation agrable2. Mais devait-on proposer une
modalit centrale, le zro, qui correspond, en fait, une non-rponse ? Il
tait tentant de ne pas inclure cette modalit dans lchelle, afin de forcer
les rponses ; il a sembl cependant que le caractre impliquant du
questionnaire faisait un devoir douvrir aux interviews la possibilit de ne
pas se prononcer sur certains mots.
1. Dans la pratique, le questionnaire smiomtrique est auto-administr. Cette procdure a
certes des inconvnients connus, notamment en ce qui concerne les taux de retour, mais elle est
apparue comme constituant le protocole le plus adapt un questionnaire demandant de la part de
la personne interroge calme, concentration et discrtion ; ce mode de passation permet aussi
dviter les biais que pourrait crer la voix dun enquteur interprtant les mots en fonction de ses
propres sensations.
2. Du point de vue des traitements numriques qui vont suivre, cette chelle est strictement
quivalente une chelle de 1 7, choisie pour coder les rponses afin dliminer le signe moins () qui alourdit les fichiers de donnes ; et lon parlera habituellement de note 1 (plutt que de note
3), de note 2 (plutt que de note 2) jusqu la note 7 (correspondant la note +3). La note
mdiane 0 initiale devient alors la note 4.

14

Des mots, des individus, une structure...

Figure 1.1 : Extrait du questionnaire de mots

Ce questionnaire de mots est ultrieurement crois avec dautres


questionnaires comprenant des renseignements socio-dmographiques et
des rponses des questions dattitude ou de comportement recueillies
auprs de la population interroge. Ces sources dinformation sont mises en
relation afin de disposer simultanment pour chaque individu des deux
types dinformation : caractristiques de base et variables dintrt, dune
part, questionnaire smiomtrique renseign dautre part.

1.2 Lenqute reprsentative


Lenqute par sondage reste un des outils fondamentaux de connaissance
de la ralit conomique et sociale. Tous les instituts de statistique
nationaux et internationaux y font appel. Les sondages politiques et
dopinion, quelque peu galvauds au cours du troisime tiers du vingtime
sicle, ont peut-tre terni limage de cet outil auprs du grand public, mais
ils nont en aucune faon altr son utilit ni la demande ou lintrt des
professionnels concerns.

La smiomtrie

15

Le calcul des probabilits dit comment et avec quelle marge derreur


lobservation dune petite partie dune population peut renseigner sur la
population toute entire mais cette base mathmatique rigoureuse ne doit
surtout pas faire illusion. Lenqute par sondage reste un art au sens des
arts et mtiers ou des ouvrages dart : beaucoup de connaissances, de
savoir-faire, dexpertise, de dontologie sont ncessaires pour confrer cet
outil un statut scientifique.
Le physicien sait quil ne peut mesurer sans erreur de mesure ; de
surcrot, il ignore lerreur quil commet (sinon, il connatrait la vraie valeur
de ce quil mesure) mais il sefforce de connatre lordre de grandeur de
cette erreur. Et cest au prix de cette dmarche, somme toute modeste, que
se construit trs progressivement la connaissance scientifique.
;

Cest galement la dmarche du statisticien qui ralise une enqute par


sondage mais dans ce cas la complexit de loutil demande une vritable
enqute sur lenqute pour procder une valuation des rsultats.
La conception du questionnaire, le plan de sondage et le tirage de
lchantillon, la phase de recueil des donnes (sur le terrain en face face,
par tlphone, par courrier, par internet), la codification de linformation,
les tests de cohrence de cette information et les ventuelles procdures de
redressement ou de pondration sont autant dtapes ncessitant un contrle
en temps rel. Un tel contrle sera de prfrence ralis par une instance
indpendante la fois de linstitut qui ralise le sondage et des
commanditaires de lenqute1.
Un outil puissant et utile, complexe et fragile, voil comment peut tre
dcrite et qualifie lenqute reprsentative, et voil pourquoi ses rsultats
ne peuvent tre livrs sans un minimum de considrations et commentaires
mthodologiques. Que le lecteur ne soit donc pas surpris si les rsultats qui
vont lui tre prsents napparaissent que comme la partie merge dun
volumineux iceberg mthodologique.
Pour savoir ce quvoquent les mots pour les Franais (mais aussi les
Anglais, les Italiens, les Allemands, les Espagnols, les Canadiens, et
beaucoup dautres encore), il a t ainsi procd de nombreuses enqutes
par sondage. Ces enqutes ont eu lieu des moments diffrents pour un
mme pays (cest notamment le cas de la France), ou parfois simultanment
dans des pays diffrents.

1. Cest par exemple, le rle dvolu en France au CESP (Centre dEtude des Supports de
Publicit) pour ce qui concerne les enqutes de mesure daudience des mdias.

16

Des mots, des individus, une structure...

Tableau 1.2 : Les enqutes

Pays

Echantillon

(Anne)

France

2764
1849
2764
2983
2764
2606
3065
1062
2763
1865
2764
2763

(1990)
(1995)
(1996)
(1996)
(1998)
(1998)
(1999)
(2000)
(1999)
(2000)
(2001)
(2002)

Grande Bretagne

France
Espagne
France
Italie
Allemagne
Grce
France
Canada
France
France

Source : Groupe Taylor-Nelson-Sofres

Ces rptitions dans le temps et dans lespace sont certes coteuses, mais
elles donnent de prcieuses indications sur la stabilit des associations et
structures observes. Elles seront compltes, au chapitre suivant, par des
tudes plus techniques de stabilit.
Puisquil a t question de structure (et ce concept sera en fait un
leitmotiv tout au long de louvrage), prcisons ici que les enqutes
reprsentatives sont des outils plus robustes pour mettre en vidence des
structures que pour mesurer des moyennes. Une mesure de corrlation entre
deux variables, par exemple, sera beaucoup moins sensible la parfaite
reprsentativit de lchantillon quune mesure de la moyenne de ces
variables dans lchantillon. Cette proprit est difficile dmontrer en
toute gnralit, mais donne lieu des vrifications exprimentales
adaptes chaque situation concrte partir de simulations de perturbations
dchantillon.
Les instruments dobservation requis doivent alors tre capables de
structurer le corpus de mots. Pour ce faire, ils vont sappuyer sur des
techniques exploratoires qui fournissent des reprsentations synthtiques de
vastes ensembles de donnes sans faire rfrence des hypothses de nature
statistique ni un modle particulier. Ils ont, pour cela, la capacit de
rduire la dimension du tableau de donnes, par des calculs de distances

La smiomtrie

17

appropries. Ils permettent de visualiser sous forme de sries de cartes


planes les associations entre les mots et entre les individus ou groupes
dindividus.
Dans ce chapitre, on se rfrera principalement aux procdures
danalyses statistiques multidimensionnelles en considrant les mthodes
factorielles (cf. annexe A1.2), et plus particulirement lanalyse en
composantes principales (cf. annexe A1.3). Dautres techniques
(classification et cartes de Kohonen) interviendront dans les chapitres
suivants.
Les rsultats qui seront prsents sont fonds, en ce qui concerne la
France, sur les six chantillons indpendants des annes 1990, 1996, 1998,
1999, 2001 et 2002 regroupant les 16 582 individus interrogs,
reprsentatifs de la population franaise ge de 18 ans et plus et qui ont
rpondu au questionnaire de 210 mots1. Dautres rsultats concernant
notamment lAllemagne, lEspagne et le Royaume Uni seront prsents aux
chapitres 2 et 5.

1.3 Lanalyse en composantes principales


Cest une technique de description de tableaux de mesures
multidimensionnelles apparente la technique dite danalyse factorielle
(factor analysis) utilise par certains psychologues (les psycho-mtriciens)
depuis le dbut du vingtime sicle. Elle sera ici un instrument privilgi de
description du corpus des notes donnes aux 210 mots du questionnaire par
les 16 582 personnes interroges entre 1990 et 2002.
Le principe de lanalyse est simple et intuitif2 : il sagit de reprsenter
lensemble des rpondants lenqute dune part, et lensemble des mots du
questionnaire dautre part, comme deux nuages de points , lun tant
dfini par rapport lautre: les proximits entre mots seront dfinies par les
notes que leur ont attribues les rpondants (deux mots nots de faon
similaire seront proches, et dautant plus proches que la similarit sera plus
grande) alors que les proximits entre rpondants seront dfinies par
lensemble des 210 notes quils ont donnes (deux rpondants seront

1. Ces donnes sont donc traduites sous forme dun tableau rectangulaire 16 582 lignes
(rpondants) et 210 colonnes (mots).
2. Bien que reposant sur une thorie algbrique et gomtrique plus labore qui est esquisse
en annexe A1.1.

18

Des mots, des individus, une structure...

proches sils ont nots tous les mots dune faon similaire : on parlera alors
de personnes ayant des profils de rponse similaires).
Ces rsultats se prsentent graphiquement dans un espace rduit dont les
dimensions sappellent les composantes principales1. Celles-ci, associes
des axes principaux, permettent dobtenir la meilleure visualisation
approche des distances entre les rpondants dune part et entre les mots
dautre part2. Les rpondants tant anonymes, ils seront dcrits par leurs
caractristiques de base (variables signaltiques). Ainsi une visualisation
des proximits entre mots et catgories socio-professionnelles, sexe ou ge
par exemple pourra clairer la lecture des notations de chacune de ces
catgories.
Rgles de lecture des graphiques
La coordonne dune variable (mot) sur un axe est le coefficient de corrlation de cette
variable avec la nouvelle variable synthtique (appele facteur) que reprsente laxe. Les
axes sont qualifis par lensemble des mots qui leur sont bien corrls (coordonnes
factorielles leves). Des rpondants loigns sur une partie de cet axe auront bien not
les mots trs corrls avec cette mme partie ; a contrario, de tels sujets auront sous-not
les mots anticorrls (corrls ngativement) avec lautre partie de laxe. Lexamen dun
plan factoriel (plan engendr par deux axes) permet de visualiser les corrlations entre les
variables et didentifier les groupes dindividus ayant donn les mmes notes aux mmes
mots mis en vidence par ce plan.
Sur le plan factoriel, la proximit entre deux mots sinterprte en termes de
corrlations de notes : deux mots seront proches sils sont nots de faon similaire par les
rpondants ; au contraire, ils seront loigns si des notes opposes leur ont t attribues ;
deux rpondants seront proches si ils ont donn des notes voisines pour chacun des mots.
En fait, les rpondants (anonymes) ne nous intressent ici que par leur signaltique
(variables dites socio-dmographiques telles que ge, sexe, profession, etc.) ou par leurs
rponses une question dopinion, dattitude ou de comportement, pose dans la mme
enqute. On interprte alors le nuage des rpondants partir de ces variables ou de tout
autre thme abord par lenqute. Cette phase consiste positionner en lments
supplmentaires ces variables qui nappartiennent pas la partie purement smiomtrique
du questionnaire : ces variables ninterviennent pas dans la formation et dfinition de
laxe, elles lillustrent a posteriori.

1. Celles-ci sont des nouvelles variables (que lon peut dsigner par les expressions variables
latentes, ou variables caches, ou encore variables artificielles) qui sont en fait des combinaisons
linaires des variables initiales, cest dire des combinaisons linaires des notes donnes aux
mots.
2. Ces nouvelles variables de synthse sont quantitatives (ou encore : numriques),
indpendantes entre elles (plus exactement : non corrles), et dimportance dcroissante
(limportance tant mesure par la variance ou dispersion). Les premires composantes de
variances plus leves rendent compte des plus fortes structures. Elles sont alors hirarchises des
plus dominantes aux plus marginales.

La smiomtrie

19

Lencadr ci-dessus fournit les premires rgles dinterprtation des


composantes principales ; pour chaque axe, seront donns les principaux
mots qui lui sont corrls, positivement et ngativement, et les populations
quil discrimine1.

1.4 Les axes stables : axes smiomtriques


Seuls les six premiers axes principaux (ou encore: facteurs ) qui
semblent interprtables seront prsents. Le chapitre 2 montrera que ces six
axes ont des proprits de stabilit satisfaisantes (stabilit mesure selon
des critres exprimentaux - stabilit dans le temps, dans lespace - et selon
des critres statistiques plus techniques). Les axes suivants sont moins
stables sur des chantillons de taille usuelle (de 1 000 2 000 personnes),
mais cela ne signifie pas pour autant quils ne reprsentent que du bruit2.
On se limite en fait ici la partie la plus invariante et la plus robuste de la
structure observe.
Une premire tentative dinterprtation sera alors propose, et une
qualification de chaque axe sera suggre3. A chaque ple dun axe, merge
ainsi un concept. Chaque axe est alors dfini par deux concepts opposs.
Nous reviendrons au chapitre 6 dune manire beaucoup plus dtaille
sur les problmes poss par linterprtation et nous proposerons alors une
grille de lecture personnelle du sens des axes, et, au-del, une hypothse sur
la nature de lobjet que la smiomtrie observe.
1.4.1 Axe 1 : Un axe mthodologique de participation

Le premier axe auquel sera donn le nom d axe de participation na


pas le mme statut que les autres. Il sagit dun axe li la mthodologie
1. Ces populations sont identifies par la technique dite des variables nominales
supplmentaires : les caractristiques socio-dmographiques des sujets enquts sur laxe
apparaissent comme les point moyens des individus concerns (cf. annexe A1.9.3).
2. La stabilit des axes plus loigns dpend de la taille de lchantillon. Ainsi seuls les quatre
premiers facteurs sont explicites sur un chantillon de 500 sujets ; les six premiers axes le sont
partir dun chantillon de 1 000 enquts mais les deux autres axes (7 et 8) ne commencent se
clarifier qu partir de 5 000 individus.
3. Si les calculs apparaissent comme objectifs , linterprtation est de lordre du
commentaire plus libre suggrant plusieurs dnominations possibles des axes. Mais, rappelons
quil ne sagit que dtiquettes qui rsument et, donc, dforment la ralit smantique et
psychologique des axes, laquelle dpend de lensemble des mots qui leur sont corrls.

20

Des mots, des individus, une structure...

mme de lenqute qui traduit lattitude des personnes interroges lgard


du questionnaire, alors que les autres axes concernent le contenu mme du
questionnaire, cest--dire la structure smiomtrique proprement dite1.
Dun ct de laxe, on trouve les mots suivants2:
(+) Courage, Efficace, Dynamique, Rcompense, Protger, Honnte,
Robuste, Confiance, Elgance, Respect, Puret, Prcision, Douceur,
Admirer, Politesse, Construire, Charitable, Confort, Gaiet, Honneur,
Produire, Raison, Gurir, Prcieux, Maternel.
De lautre ct :
(-) Trahir, Dsordre, Guerre, Angoisse, Faute, Danger, Rompre, Vide,
Mort, Rvolte, Orage, Noir, Doute, Attaquer, Ironie, Labyrinthe, Critiquer,
Fusil, Cri, Vieillir, Dtachement, Muraille, Feu, Sauvage, Dsert.
Les catgories dindividus plus spcialement concernes par ces ples
sont respectivement :
(+) Femmes ; personnes ges ; personnes ayant un niveau dinstruction
peu lev ; retraits ; personnes habitant les rgions Est ou Nord et/ou des
petites communes.
(-) Jeunes ; hommes ; actifs ; personnes ayant fait des tudes
suprieures ; personnes habitant la rgion parisienne.
Cet axe oppose des mots qui exaltent des valeurs assez consensuelles et
expriment un certain conformisme social (Courage3, Efficace, Dynamisme,
Prcision, Rcompense) des mots qui voquent plutt des valeurs de
transgression de ce qui est socialement valoris (Trahir, Guerre, Dsordre,
Angoisse).
Au conformisme correspond une population plutt ge, fminine et
de niveau dinstruction peu lev oppose une population reprsente par
les hommes, les jeunes, les cadres et les diplms de lenseignement
suprieur.

1. Ce premier axe reprsente 12 % de la variance totale. Rappelons que, contrairement un


prjug technique assez rpandu, ce pourcentage ne peut en aucune faon tre interprt comme un
pourcentage dinformation. La variance totale est leste par un bruit statistique considrable, et ne
sert de mesure de rfrence que pour comparer des analyses entre elles (cf. annexe A1.9 consacre
aux outils de validation).
2. Lorientation des axes est arbitraire. Le fait que le signe (+) correspond des valeurs
communment considres comme positives est purement fortuit. Les catgories sont
ordonnes des plus significatives (statistiquement) aux moins significatives.
3. Par convention, dans le corps du texte, les mots du questionnaire smiomtrique sont crits
en italique avec une majuscule.

La smiomtrie

21

Toutefois, le fait que, gnralement, le premier axe dune analyse en


composantes principales effectue sur des notes centres rduites rend
compte dun effet de taille doit nous inciter la plus grande prudence dans
lexercice toujours prilleux de linterprtation1. En effet, les mots Efficace,
Dynamisme, etc., sont parmi les mots qui recueillent les meilleurs scores
tandis que Trahir, Guerre, etc., ont des scores parmi les plus faibles. Nous
reviendrons de faon beaucoup plus dtaille et plus technique sur
linterprtation de cet axe au chapitre 5 consacr aux problmes
mthodologiques lis la notation.
1.4.2 Axe 2 : Devoir / Plaisir

Dun ct de laxe, se trouvent les mots suivants :


(-) Discipline, Obir, Patrie, Morale, Soldat, Economiser, Industrie,
Prtre, Rgle, Loi, Fermet, Foi, Travail, Sacrifice, Honneur, Dieu, Elite,
Interdire, Rigide, Punir, Frontire, Chasse, Tradition, Recueillement,
Mtallique.
De lautre ct :
(+) Sensuel, Rver, Aventurier, Original, Ile, Nudit, Sauvage, Volupt,
Lgret, Ocan, Bohme, Dsir, Charnel, Emotion, Sduire, Evasion,
Lune, Humour, Moelleux, Orage, Rvolte, Magie, Mystre, Musique, Peau.
Les catgories dindividus plus spcialement concernes par ces deux
ples de laxe sont respectivement :
(-) Individus de plus de 55 ans ; retraits ou agriculteurs-exploitant.
(+) Individus de moins de 30 ans ; diplms entre 30 et 55 ans; cadres ou
employs.
Les mots Discipline, Morale, Patrie, Obir, Soldat, Prtre, voquent
des valeurs dordre et de tradition qui renvoient, de faon peut-tre
caricaturale, au mariage du sabre et du goupillon voqu certaines
poques de lhistoire de France, tandis que les mots Sensuel, Rver,
Lgret, Sauvage, Aventurier, Voluptueux, semblent correspondre un
autre volet, celui du mouvement et du plaisir qui connut son heure de gloire

1. Leffet de taille est en gnral d au fait que, dans beaucoup de recueils de mesures, les
corrlations sont, en grande majorit, positives : dans le cas de mensurations sur des individus ou
des animaux, la taille est en effet la principale source de dispersion: brivement, toutes les
mensurations sont grandes chez les individus grands, et petites chez les petits. Dans la plupart des
applications, laxe suivant le facteur de taille, facteur de forme, est plus structurel : il renseigne sur
le rseau plus subtil et cach de corrlations qui subsistent taille gale .

22

Des mots, des individus, une structure...

loccasion des vnements de mai 68. Par convention, nous appellerons


cet axe: Devoir / Plaisir 1.
Cet axe est fortement structur par lge ; le Devoir est une valeur qui
caractrise de faon assez nette les personnes ges et le Plaisir est une
valeur plus marque chez les plus jeunes. Mais cet axe subsiste si on
analyse seulement lensemble des individus ayant entre 35 et 55 ans. Cest
un axe certainement li lge, mais non caractris uniquement par lge.
Son interprtation est plus riche et plus complexe2.
1.4.3 Axe 3 : Attachement / Dtachement

Dun ct de laxe, se trouvent les mots suivants :


(+) Bijou, Cadeau, Confort, Rcompense, Or, Maison, Argent, Mariage,
Richesse, Gaiet, Famille, Parfum, Fidlit, Hriter, Fleur, Gratuit, Mode,
Tendresse, Douceur, Elgance, Gurir, Paix, Maternel, Caresse, Rire.
De lautre ct :
(-) Danger, Mort, Rompre, Orage, Angoisse, Vide, Punir, Labyrinthe,
Cri, Critiquer, Doute, Rvolte, Attaquer, Dsert, Dtachement, Faute, Feu,
Ironie, Vieillir, Muraille, Effort, Mfiance, Question, Interroger, Inconnu.
Les catgories dindividus plus spcialement concernes par les ples de
cet axe sont respectivement :
(+) Femmes ; personnes non titulaires du baccalaurat ; les ouvriers ou
employs.
(-) Hommes ; diplms ; cadres ; les artisans-commerants ou les
professions intermdiaires.
Les mots Bijou, Cadeau, Confort, Mariage, Famille, Maison, Gaiet...
semblent parler dun certain bonheur de vivre ensemble. Ce sont aussi des
mots surnots par les femmes par rapport aux hommes, tandis qu
loppos, les mots Danger, Mort, Punir, Vide, Rompre, Attaquer qui sont
plutt des mots surnots par les hommes, apparaissent comme des mots de
rupture et de drliction. Par convention, nous appelerons cet axe :
Attachement / Dtachement . Cet axe3 est marqu par une opposition
Homme / Femme. Il ne sagit cependant pas dun axe qui se limite une

1. Cet axe reprsente 5 % de la variance totale. Ce pourcentage est hautement significatif


statistiquement, comme les pourcentages relatifs aux axes dont la description va suivre.
2. Une interprtation plus complte est propose au chapitre 6.
3. Cet axe explique 4,2 % de la variance.

La smiomtrie

23

opposition entre les sexes. En effet, cet axe se retrouve si on procde des
analyses spares des rpondants hommes et des rpondants femmes1.
1.4.4

Le plan smiomtrique des axes 2 et 3

Ce plan smiomtrique (figure 1.2) sera appel le plan smiomtrique


principal (il est en effet engendr par les deux axes les plus importants, si
lon omet le premier axe qui est un axe de notation). Ce plan est trs utilis
dans liconographie et la communication des analyses smiomtrique2. Il
dcrit simultanment les axes Devoir / Plaisir (axe horizontal) et
Attachement / Dtachement (axe vertical). Cette reprsentation plane
permet en quelque sorte de complter linterprtation de chacun des ples
en les dclinant selon une dimension supplmentaire. On peut ainsi parler,
propos des quatre quadrants de ce plan, de Plaisir-Attachement , de
Plaisir-Dtachement , de Devoir-Attachement , de DevoirDtachement . Linterprtation est plus riche et plus nuance. Elle est
dtaille dans la cinquime section de ce chapitre consacre lanalyse de
quelques croisements daxes.
1.4.5

Axe 4 : Esprit / Matire

Dun ct de laxe, on trouve les mots suivants :


(+) Livre, Art, Posie, Thtre, Arbre, Ecole, Enseigner, Pardon, Ecrire,
Recueillement, Charitable, Etranger, Rflchir, Nid, Paix, Fleur, me,
Modration, Patience, Chercheur, Modestie, Consoler, Fleuve.
Et de lautre ct :
(-) Richesse, Puissance, Or, Argent, Gloire, Conqurir, Vitesse,
Ambition, Commander, Ruse, Fusil, Hriter, Sduire, Proprit, Attaquer,
Victoire, Bijou, Mode, Dsir, Prcieux, Sensuel, Armure, Rigide, Elite,
Gratuit.
Les catgories dindividus plus spcialement concernes
respectivement :
(+) personnes de plus de 55 ans ; diplms ; femmes ; cadres.

sont

1. Ce point sera dvelopp dans la section 2.1.3 du second chapitre consacr la stabilit des
structures observes.
2. Le chapitre 7 qui prsente un certain nombre dapplications de la smiomtrie fera souvent
appel une reprsentation des mots dans ce plan engendr par les axes 2 et 3.

24

DEVOIR

ATTACHEMENT

DTACHEMENT

PLA ISIR

Figure 1.2 : Plan smiomtrique (2,3) Croisement de Devoir / Plaisir avec Attachement / Dtachement (commentaires en section 1.5)

25

DEVOIR

ESPRIT

MATIRE

Figure 1.3: Plan smiomtrique (2,4) - Croisement de Devoir / Plaisir avec Esprit / Matire

PLAISIR

26

DEVOIR

COEUR

RAISON

Figure 1.4 : Plan smiomtrique (2,5) - Croisement de Devoir / Plaisir avec Cur / Raison

PLAISIR

27

DEVOIR

HUMILIT

SOUVERAINET

Figure 1.5 : Plan smiomtrique (2,6) - Croisement de Devoir / Plaisir avec Humilit / Souverainet

PLAISIR

28

Des mots, des individus, une structure...

(-) personnes de moins de 30 ans, non titulaires du baccalaurat ;


ouvriers, employs, artisans-commerants, agriculteurs-exploitant ;
hommes.
Les mots Richesse, Or, Argent, Gloire, Conqurir, Vitesse,
Commander voquent lattachement aux biens de ce monde, la foi dans
des valeurs matrialistes, en somme le culte de Mamon, tandis que les mots
qui sy opposent, lautre extrmit de laxe, Livre, Art, Thtre, Posie,
me, Ecole, Etranger, Rflchir, nous parlent dun autre systme de
valeurs, plus spirituelles, plus labores, plus sublimes qui seraient celles
dun royaume cleste scularis. Par convention, nous appellerons cet axe :
Esprit / Matire 1.
Cet axe (3.3 % de la variance) oppose deux profils trs distincts de
rpondants : les jeunes hommes non titulaires du baccalaurat aux femmes
plus ges et diplmes. Comme les axes prcdents, il ne se limite pas
une opposition entre ces catgories, car on retrouve un axe similaire si lon
procde une analyse lintrieur mme de ces catgories.
1.4.6 Axe 5 : Cur / Raison

Dun ct de laxe, se trouvent les mots suivants :


(+) Dieu, Foi, me, Prtre, Sacre, Recueillement, Eternel, Crmonie,
Souverain, Infini, Noble, Bijou, Posie, Absolu, Mariage, Adorer, Hros,
Lune, Magie, Lgret, Mode, Masque, Gloire, Puret, Mystre.
De lautre ct :
(-) Efficace, Prcision, Logique, Concret, Matriser, Astucieux,
Utilitaire, Robuste, Produire, Rflchir, Volontaire, Construire,
Dynamique, Matriel, Effort, Audace, Honnte, Btisseur, Inventeur,
Confiance, Fermet, Raison, Nudit, Science, Industrie.
Les catgories dindividus plus spcialement concernes par les deux
ples de cet axe sont respectivement :
(+) femmes ; jeunes ; personnes habitant les rgions Nord ou Est.
(-) hommes ; artisans-commerant, professions intermdiaires, cadres,
ouvriers ; personnes entre 40 et 50 ans ; personnes habitant la rgion
parisienne.

1. Cet axe sera ultrieurement nomm Sublimation / Matrialisme pour des raisons qui
seront explicites au chapitre 6 (Essais dinterprtation).

La smiomtrie

29

Les mots Dieu, Foi, me, Sacr, Eternel, Infini, etc., expriment une
aspiration une transcendance dont la raison ne saurait rendre compte, un
besoin de rechercher, au-del dune logique trop rigoureuse, des formes
dexpression plus oniriques ou irrationnelles ; tandis que les mots Efficace,
Prcision, Dynamique, Construire, Utilitaire, Volontaire, connotent un
souci de rationalisme, de pragmatisme et le dsir de vivre dans un monde
parfaitement logique et tout ddi laction, qui nest pas sans faire penser
lidal des Lumires. Par convention, cet axe sera appel :
Cur / Raison 1.
Ce cinquime axe2 oppose les hommes et les actifs aux femmes et aux
personnes jeunes.
1.4.7 Axe 6 : Humilit / Souverainet

Dun ct de laxe, on trouve les mots suivants :


(+) Naissance, Mfiance, Faute, Doute, Famille, Rigide, Tendresse,
Mariage, Interdire, Caresse, Masque, Obir, Enfance, Prudence, Maternel,
Cri, Angoisse, Immobile, Nud, Fidlit, Punir, Vide, Politesse, Crmonie.
De lautre ct :
(-) Crateur, Noble, Art, Dieu, Audace, Elite, Foi, Matriser, Robuste,
Btisseur, Efficace, Concret, Sacre, Volupt, Inventeur, me, Commander,
Recueillement, Astucieux, Absolu, Prtre, Souverain, Sublime, Thtre,
Certitude.
Les catgories dindividus plus spcialement concernes par ces deux
ples sont respectivement :
(+) ouvriers, employs ; personnes de moins de 40 ans ; personnes non
titulaires du baccalaurat ; femmes ; personnes vivant en rgion rurale.
(-) cadres ; personnes ges ; retraits ; personnes ayant un niveau
dinstruction lev ; personne habitant une agglomration importante dans
les rgions parisienne ou mditerranenne. Linterprtation de cet axe3 est
moins aise. En effet, si lon trouve lune de ses extrmits des mots
1. Il sagit ici du cur et de la raison pascaliens . En tout tat de cause, si les concepts
correspondant aux demi-axes peuvent tre considrs comme des ralits smantiques
relativement objectives puisque issus dune analyse statistique, les noms qui leur sont attribus ne
sont que des tiquettes provisoires qui seront justifies ou modifies ultrieurement dans le
chapitre 6 (Essais dinterprtation). Nous verrons quil peut tre galement nomm
Idalisation / Pragmatisme .
2. Cet axe correspond 2 % de la variance totale, pourcentage qui reste hautement significatif
statistiquement compte tenu notamment du nombre de variables.
3. Ce sixime axe correspond 1,8 % de la variance totale.

30

Des mots, des individus, une structure...

comme Noble, Crateur, Art, Dieu, Foi, Elite, Audace... qui voquent une
sorte dlitisme, une aspiration une certaine souverainet ou distinction,
pour reprendre la terminologie de Pierre Bourdieu, les mots de lautre
extrmit se dcomposent en deux sous-ensembles smantiques, Naissance,
Famille, Tendresse, Mariage, Enfance, Maternel, dune part et, Mfiance,
Faute, Doute, Rigide, Obir, Interdire, dautre part, dont la synthse
semble, premire vue, difficile raliser. Pourtant, le fait que cet axe
oppose des individus plutt gs et dun niveau culturel lev des
individus dont le statut social est plus modeste permet de penser quil rend
compte de la confrontation entre deux systmes de valeurs bien rels. Par
convention, et sans entrer plus avant dans son interprtation, cet axe sera
appel : Humilit / Souverainet .
1.4.8 Les axes suivants

Les axes suivants sont plus difficilement interprtables. Lorsque les


analyses statistiques portent sur des chantillons infrieurs mille
individus, les axes 7 et 8 napparaissent pas systmatiquement. Ils
nacquirent une bonne stabilit qu partir dun chantillon de cinq mille
individus1. On tente ici seulement une description de ces axes sans se
hasarder les interprter et sans chercher leur donner un nom2.
Axe 7
Dun ct de laxe, on trouve les mots suivants :
(-) Audace, Foi, Secret, Sublime, Ambition, Matriser, Puret, Charnel,
Dsir, Sduire, Consoler, Respect, Dfi, Ruse, Acharnement, Sacr, Adorer,
Eternel, Sensuel, Volontaire, Pardon, me, Intime.

1. Cette analyse, effectue ici sur un chantillon de plus 11 000 individus totalisant lensemble
des quatre premires enqutes franaises, a aussi t ralise sur un chantillon de 1 000, puis
5 000 individus. La taille de lchantillon amliore la qualit des axes de rang lev. Les axes 7 et
8 reprsentent respectivement 1,3 et 1,2 % de la variance totale (pourcentages hautement
significatifs statistiquement pour 210 variables et 5 000 individus).
2. Il faut bien faire la distinction entre : a) la mise en vidence de la stabilit dun axe qui
constitue un fait statistique tabli de faon objective, rptitive, automatique partir du recueil
de donnes ; b) la description de cet axe, qui comporte une part de subjectivit comme toute
description en langage naturel impliquant de choisir des mots et des concepts ; c) le fait de
nommer un axe, qui implique une simplification et un choix drastique, et donc une part
dinterprtation plus importante ; d) linterprtation proprement dite de laxe, qui nest pas
toujours possible, qui fait appel des catgories, des thories ou des modles, explicites ou
implicites. Dans ce chapitre, les six premiers axes ont t dcrits et nomms. Une interprtation
sera propos plus loin au chapitre 6. Les axes suivants seront simplement dcrits, avec des
commentaires interprtatifs qui nont dautre ambition que de rendre la description moins aride.

La smiomtrie

31

(+) Fleuve, Arbre, Montagne, Thtre, Livre, Ocan, Campagne, Fleur,


Nager, Eau, Mtallique, Maison, Animal, Sommet, Art, Science, Industrie,
Ile, Lune, Hriter, Commerce, Rouge, Bijou, Posie.
Les catgories dindividus plus spcialement concernes sont
respectivement :
(-) Personnes de moins de 30 ans et plus particulirement de la tranche
dge 15-19 ans; appartenant une famille de cadres ; personne ayant un
niveau dinstruction suprieur.
(+) Personnes de plus de 55 ans ; retrait(e)s et conjoint(e)s de
retrait(e)s ; niveau dinstruction bas ; Bassin Parisien Ouest et rgion
mditerranenne ;
Si lon distingue bien les deux groupes qui sopposent sur laxe 7, dune
part des personnes ges nayant plus dactivit professionnelle, sans
instruction et, dautre part, des jeunes issus de milieux intellectuellement
volus, tudiants ou lycens et, donc, non encore entrs dans la vie active,
il semble plus difficile didentifier les concepts et, derrire eux, les valeurs
sur lesquelles ils sopposent.
Il sagit plus dun clivage entre mentalits, les plus jeunes et les plus
instruits affectionnant les concepts abstraits, Audace, Foi, Secret, Sublime,
Ambition, Matriser, Puret, etc., sopposant aux plus gs, sans instruction,
stant dj confronts aux ralits de la vie, privilgiant les objets concrets
(et plus particulirement ceux voquant la nature), Fleuve, Arbre,
Montagne, Livre, Ocan, Fleur, Maison, Lune, Bijou, etc..
Axe 8
Dun ct de laxe on trouve les mots suivants :
(+) Thtre, Livre, Ecrire, Raffin, Posie, Art, Mode, Parfum, Bijou,
Elgance, Critiquer, Ecole, Noble, Enseigner, Minceur, Interroger, Doute,
Lgret, Justice, Ironie, Question, Prcieux, Rompre, Rflchir.
De lautre ct :
(-) Montagne, Campagne, Sommet, Fusil, Ile, Eau, Aventurier,
Escalader, Animal, Ocan, Fleuve, Foi, Armure, Nager, Dieu, Arbre,
Famille, Prtre, Chasse, Sacr, Vitesse, Sauvage, Orage, Soldat.
Les catgories dindividus plus spcialement concernes sont
respectivement :
(+) Femmes ges, dun niveau dinstruction lev ; cadres et conjointes
de cadres.

32

Des mots, des individus, une structure...

(-) Hommes de moins de trente ans ; ouvriers et agriculteurs ; niveau


dinstruction bas.
Cest un peu lopposition de la Belle et de la Bte ou des Prcieuses et
des ruffians, avec dun ct llgance et le raffinement fminin, Thtre,
Livre, Ecrire, Raffin, Posie, Art, Mode, Parfum, et, de lautre,
Montagne, Campagne, Sommet, Fusil, Aventurier, Escalader, Animal 1.
Comme le prcdent, cet axe napparat que lorsquon travaille sur des
chantillons de plus cinq mille individus.

1.5 Les plans smiomtriques


Nous venons de prsenter les six premires dimensions stables, et de
dcrire brivement les deux dimensions suivantes. La prise en compte
simultane des axes deux deux (il sagira donc de plans principaux, et non
plus daxes principaux) apporte un nouvel clairage sur la structure
smiomtrique. Elle nuance et affine la description des axes et leurs
interprtations. Lexemple du plan des axes 2 et 3 a dj t voqu (figure
1.2). Nous allons commenter de faon plus approfondie ce plan [not plan
(2,3)], puis examiner quelques autres plans.
1.5.1 Les multiples facettes du Plaisir

En croisant le deuxime axe Devoir / Plaisir avec le troisime axe


Attachement / Dtachement , on obtient deux composantes opposes du
Plaisir, que nous appellerons Plaisir-Attachement et PlaisirDtachement .
Le Plaisir-Attachement (en haut et droite de la figure 1.2)2 est
caractris par les mots : Douceur, Caresse, Parfum, Gaiet, Cadeau, Rire,
Tendresse, Moelleux, Sduire, le Plaisir-Dtachement (en bas et droite de
la figure 1.2) lest, lui, par les mots : Aventurier, Sauvage, Orage, Rvolte,
Mystre, Feu, Bohme, Original, Emotion.
Commentaires / Suggestions dinterprtation

1. Opposition qui, dailleurs, peut tre source, en certaines circonstances, dune troublante
attraction. On pense au couple form par Lady Chatterley et son garde chasse. Cette ambivalence
nous laisse penser que cet axe nest pas seulement sociologique (on veut dire ici : opposant des
catgories sociales) mais, dans une certaine mesure, psychologique.
2
Cette figure se trouve ci-dessus page 24.

La smiomtrie

33

Si le Plaisir-Attachement voque la joie de vivre travers une douce


exaltation des sens, un univers de batitude dans lequel chaque instant semble une
ternit de suave jouissance, le Plaisir-Dtachement a un got plus cre, il fait
entendre une note plus pre, plus rude, plus sombre, plus violente, plus tragique. Il
sagit bien de deux modalits du plaisir de vivre, mais celui-ci du guerrier et celuil . de son repos.

On voit alors quelle subtile contribution peut tre apporte ltude


smantique des mots par les rsultats dune enqute par sondage auprs
de la population gnrale ! Cette contribution est probablement assez
inattendue, voire incongrue, pour les linguistes et les smiologues. Elle est
dautant plus remarquable quelle ne relve absolument pas dune enqute
dopinion sur le thme abord ici le plaisir ou les proximits
smantiques (dont le protocole serait probablement trs lourd) mais dune
simple notation de mots un par un1.
Continuons notre dclinaison du Plaisir en croisant maintenant laxe 2
Devoir / Plaisir avec laxe 4 Esprit / Matire . La figure 1.3
reprsente le plan [2,4] ainsi obtenu.
On peut alors distinguer, dans la figure 1.3, le Plaisir-Esprit (en haut
et droite) qui est caractris par les mots : Art, Fleuve, Etranger, Musique,
Bohme, Arbre, Posie, et le Plaisir-Matire (en bas et droite), par les
mots : Sensuel, Dsir, Sduire, Charnel, Magie, Aventurier, Nudit,
Voluptueux, Lgret.
Commentaires / Suggestions dinterprtation
Le Plaisir-Esprit est celui, subtil, des sens apaiss par la contemplation des
beauts de lart et de la nature, tandis que le Plaisir-Matire recherche des
bnfices plus frustes, plus immdiats, plus proches de cette autre nature que
reprsentent nos instincts. On notera que cette diagonale oppose lart la sexualit
ou, plus exactement, une sexualit domestique, canalise, labore une
sexualit naturelle et spontane.

En croisant encore laxe 2 Devoir / Plaisir avec laxe 5


Cur / Raison , on obtient le Plaisir-Cur (en haut et droite de la
figure 1.4) qui est caractris par les mots : Ile, Rver, Lgret, Ocan,
Bohme, Lune, Magie, Mystre, Sublime, Parfum, Dsert, Infini, et le
1. Les 16 582 personnes interroges ne peuvent dailleurs souponner en donnant ces notes
que des faits statistiques stables de cette nature seront extraits automatiquement de la matrice des
corrlations des notes (matrice symtrique 210 lignes et 210 colonnes contenant les 21 945
coefficients de corrlation).

34

Des mots, des individus, une structure...

Plaisir-Raison (en bas et droite de la figure 1.4), caractris par les mots :
Nudit, Audace, Astucieux, Sensuel, Rvolte, Humour.
Commentaires / Suggestions dinterprtation
Le Plaisir-Cur est le plaisir li au rve et la contemplation de
phnomnes dont le territoire se situe aux marches vanescentes de la ralit, dans
ce no mans land o les objets semblent ne pas avoir pris encore une forme claire
et dfinitive.
Le Plaisir-Raison , au contraire, ne sen laisse pas conter et aime poser sur
les objets un regard cru et sans illusion.

Enfin, en croisant toujours laxe 2 Devoir / Plaisir avec laxe 6


Humilit / Souverainet , on obtient le Plaisir-Humilit (en haut et
droite de la figure 1.5 reprsentant le plan [2,6]) qui est caractris par les
mots : Rire, Dsir, Caresse, Douceur, Gaiet, Tendresse, Ruse, et le
Plaisir-Souverainet (en bas et droite de la figure 1.5), caractris par
les mots : Original, Voluptueux, Sublime, Feu, Sommet, Art.
Commentaires / Suggestions dinterprtation
Le Plaisir-Humilit nest pas sans rappeler le Plaisir-Attachement ,
quoiquen plus innocent, en plus enfantin, qui semble comme une rminiscence de
ltat paradisiaque davant le Pch . Le Plaisir-Souverainet se complairait,
lui, plutt, dans la recherche de sensations sublimes et capiteuses.

Bien que ces dclinaisons du Plaisir sestompent progressivement


lorsque lordre des axes augmente, rendant ainsi linterprtation et les
commentaires de moins en moins assurs, on peut stonner de la finesse et
de la cohrence de cette dcomposition smantique 1.
1.5.2 Les multiples facettes du Devoir

Lexamen des mmes plans factoriels (figures 1.2 1.5), en focalisant


cette fois sur la partie gauche de laxe horizontal (axe 2,
Devoir / Plaisir ) fournit de la mme manire les diffrentes facettes du
Devoir . Nous invitons cette fois le lecteur crire son propre
commentaire partir de la consultation des figures prcites.

1. Nos commentaires et suggestions sont illustratifs, et peut-on dire, facultatifs. Leur prsence
ne doit pas obrer le statut scientifique des figures 1.2 1.5, qui sont drives du tableau de
donnes de faon automatique et reproductible.

La smiomtrie

35

En croisant laxe 2 avec laxe 3, ( Attachement / Dtachement ), on


obtient le Devoir-Attachement (en haut et gauche de la figure 1.2),
caractris par les mots : Fidlit, Crmonie, Proprit, Politesse,
Mariage, Famille, et le Devoir-Dtachement , (en bas et gauche de la
figure 1.2), par les mots : Sacrifice, Interdire, Fermet, Loi, Rgle, Obir,
Punir, Rigide, Frontire, Mtallique, Muraille, Mort.
En croisant laxe 2 avec laxe 4 ( Esprit / Matire ), on obtient le
Devoir-Esprit (en haut et gauche de la figure 1.3), caractris par les
mots : Modestie, Recueillement, Charitable, Justice, Modration, Respect,
Dieu, me, et le Devoir-Matire (en bas et gauche de la figure 1.3),
par les mots : Proprit, Gloire, Argent, Puissance, Elite, Souverain,
Commerce.
En croisant laxe 2 avec laxe 5 ( Cur / Raison ), on obtient le
Devoir-Cur (en haut et gauche de la figure 1.4), caractris par les
mots : Eternel, Immobile, me, Sacr, Crmonie, Souverain, Tradition, et
le Devoir-Raison (en bas et gauche de la figure 1.4), caractris par les
mots : Proprit, Prudence, Matriel, Raison, Honnte, Produire,
Utilitaire.
En croisant laxe 2 avec laxe 6, Humilit / Souverainet , on obtient
le Devoir-Humilit (en haut et gauche de la figure 1.5), caractris par
les mots : Mfiance, Rigide, Fidlit, Prudence, Sacrifice, Mariage,
Honnte, Obir, et le Devoir-Souverainet (en bas et gauche de la
figure 1.5), par les mots : Sacr, Dieu, Souverain, Elite, Commander,
Hros, Perfection, Gloire.
Cette simple vocation des facettes ou dimensions du Devoir
confirme le constat fait propos des dimensions du Plaisir : constat de
cohrence, de finesse des rsultats. Ajoutons que cette procdure de
dclinaison systmatique dun concept suivant diffrents axes permet de
percevoir le caractre profondment multidimensionnel de la topographie
des mots, irrductible un axe ou un plan.
1.5.3 Les dimensions smantiques des mots eux-mmes

Aprs avoir dclin les concepts que reprsentent les demi-axes


principaux : Devoir , Plaisir , Attachement , Dtachement ,
Esprit , Matire , Humilit et Souverainet , nous allons nous
intresser aux mots mmes de la liste.
Un mme mot peut, bien sr, corrler avec plusieurs axes, chacune de ses
piphanies rvlant une de ses dimensions smantiques.

36

Des mots, des individus, une structure...

Le mot Mariage
Ainsi le mot Mariage du Devoir 1, que connotent les mots Fidlit,
Honnte, Respect, Politesse..., nest pas le mme que celui de
l Attachement , que connotent les mots Confort, Maternel, Naissance,
Confiance, Amiti, Tendresse et Douceur, celui-l voquant plutt le
mariage vu comme une institution, celui-ci, comme le cadre dune relation
damour entre deux tres (cf. figure 1.2).
Le mot Rvolte
De mme, la Rvolte du Plaisir , que connotent les mots Aventurier,
Original, Bohme, Evasion, nest pas la mme que celle du
Dtachement , que connotent les mots, Rompre, Critiquer, Doute,
Danger, Mort. Dans un cas, il sagit de la manifestation dun dsir
dchapper aux limites imposes par les contraintes sociales pour accder
une vie plus large, dans lautre, de briser ces contraintes quitte se dtruire
soi-mme (figure 1.2).
Le mot Frontire
De mme, la Frontire du Dtachement , que connotent les mots
Rigide, Fermer, Rompre, Muraille, Masque, nest pas la mme que la
Frontire du Devoir , que connotent les mots Mariage, Proprit, Rgle,
Morale. La premire est la frontire qui isole le sujet en rejetant lautre, la
seconde est celle qui distingue, organise, et garantit lordre, autant social
que mental (figure 1.2).
Le mot Thtre
De mme le Thtre du Cur ou encore de l Idalisation (axe 5),
que connotent les mots Crmonie, Bijou, Masque, Magie, nest pas le
mme que le Thtre de l Esprit (axe 4), que connotent les mots Art,
Livre, Musique, Posie, Ecrire. Lun est le spectacle auquel on assiste,
lautre, luvre que lon cre.
Le mot Dieu
Quant au mot Dieu, il corrle avec quatre des axes de la smiomtrie,
nous dcouvrant ainsi quelques unes de ses composantes smantiques : le
Dieu du Devoir (sur laxe 2) que connotent les mots Vertu, Sacrifice,
Rgle, Morale, Discipline ; le Dieu de l Esprit (sur laxe 4) que
connotent les mots Pardon, Consoler, Charitable ; le Dieu du Cur (sur

1. On dsigne par lexpression Mariage du Devoir la composante (ou encore : coordonne)


du mot Mariage sur laxe du Devoir . De mme, Rvolte du Plaisir veut dire : composante
du mot Rvolte sur laxe du Plaisir .

La smiomtrie

37

laxe 5) que connotent les mots Crmonie, Thtre, Magie, Mystre ; et le


Dieu de la Souverainet (sur laxe 6) que connotent les mots Absolu,
Crateur, Unique. Le premier voque le Dieu de la Loi de lAncien
Testament, le deuxime, celui damour, du Nouveau Testament, le
troisime, celui de la religion spectacle, et pour finir, le quatrime, le Dieu
ineffable de la transcendance.

1.6 Conclusion
Dressons un premier bilan des rsultats acquis, et aussi un inventaire des
questions qui se posent ce stade, inventaire qui annoncera, de faon
motive cette fois, la teneur des chapitres venir.
La dmarche suivie est trs empirique et exploratoire : quelques ides
simples, une coteuse campagne de mesures, puis un traitement statistique
assez classique et polyvalent destin extraire dventuels traits
structuraux.
Il restera bien sr sassurer de la ralit de ce qui a t observ, puis
comprendre la nature et la porte des nouvelles informations mises en
vidence.
Il a beaucoup t question de mots, et peu dindividus ou de rpondants.
On a bien mentionn quelles catgories dindividus caractrisaient certains
axes (les personnes ges plutt du ct du Devoir , les jeunes plutt de
celui du Plaisir , par exemple). Mais les individus interrogs sont
anonymes, et ne pouvaient intervenir cette tape de travail que par
lintermdiaire des catgories auxquelles ils appartenaient.
Or cest une des proprits de la mthode statistique utilise que de
positionner les individus sur les mmes axes le point moyen des
individus dune catgorie tant celui qui nous a servi positionner la
catgorie en question. On aura en gnral beaucoup dautres informations
sur ces individus en dehors des variables signaltiques : par exemple, la
marque de leur vhicule, les titres de magazines quils lisent
habituellement, le temps et les modes de transport domicile-travail, autant
dinformations que lon peut rapprocher des coordonnes smiomtriques
des individus sur les axes principaux1.

1. Ceci ouvre la voie aux applications marketing de la smiomtrie qui justifient le


rapprochement opr en dbut de chapitre avec les enqutes styles de vie.

38

Des mots, des individus, une structure...

Les rsultats des analyses ont mis en vidence des traits structuraux, sous
la forme dassociations privilgies de mots. Lexistence de ces traits
structuraux, cest--dire en fait leur stabilit, leur invariance, leur ventuelle
gnralisation (ou infrence statistique) lensemble des populations
concernes, sera tudie de faon dtaille sous trois angles : dans le temps,
par pays, et partir de procdures statistiques de validation dites de
rchantillonnage. Ce travail de validation des structures observes sera la
matire du chapitre 2.
La richesse et la finesse des structures observes en termes smantiques
tout au long des sections prcdentes posent le problme des relations entre
smantique et smiomtrie. La dmarche est difficile car la smantique
nest pas un champ disciplinaire balis, plutt un thme de recherche
cartel par son interdisciplinarit mme. Le chapitre 3 apportera ce
chantier quelques matriaux, fonds sur de nouvelles expriences.
Les rsultats obtenus en soumettant une liste de mots quelques milliers
de personnes tant prouvs, consolids et mieux compris, il reste tudier
leur degr de dpendance vis--vis de cette liste. Le caractre opratoire de
la liste est clairement tabli, mais quen est-il de son ventuelle
universalit ? Le chapitre 4, fond sur un nouveau recueil empirique, aborde
ce questionnement ambitieux.
Le lecteur intrigu tout au long du prsent chapitre par le traitement
particulier rserv au premier axe trouvera les explications requises au
chapitre 5 qui est une sorte de zoom technique sur les spcificits de cet
axe, avec le renfort de donnes internationales et des retombes qui
concernent en fait la mthodologie de toutes les enqutes par sondage.
Enfin, le chapitre 6 approfondira les interprtations esquisses
prcdemment, en toute conscience des risques que reprsente un tel travail,
alors que le chapitre 7 mettra le maon au pied du mur en montrant un petit
chantillon dapplications de la mthodologie.

CHAPITRE 2
Stabilit de la structure smiomtrique
Nous allons montrer dans ce chapitre que la structure mise en vidence
au chapitre premier est stable, cest--dire nest ni un accident statistique, ni
un artefact des mthodes utilises. Cette structure est un ensemble de six
axes principaux bien identifiables, auxquels nous avons donn des noms
conventionnels, mais que tout un chacun peut reconnatre, indpendamment
de cette dnomination, par les mots qui leurs sont associs.
Dans un premier temps, la stabilit sera prouve empiriquement sur
diffrents chantillons recueillis des moments diffrents pour un mme
pays (la France); il sagit donc de stabilit dans le temps. Puis des
chantillons relatifs des pays diffrents seront analyss ; on parlera alors
de stabilit dans lespace. Enfin, les axes smiomtriques seront recalculs
dans des sous-populations particulires lintrieur dun mme pays,
tudiant sparment les hommes et les femmes, puis diffrentes classes
dge. On parlera alors de stabilit interne. Quelques exceptions et
singularits seront nanmoins observes. Elles seront limites, mais
intressantes interprter, comme peuvent ltre de petites dviations par
rapport un modle ou une norme. On constatera ainsi quelques
diffrences subtiles entre Europe du nord et du sud. Les axes sont stables,
mais leur ordre dapparition peut varier. On constatera aussi, au chapitre 5
cette fois, la lente drive de la population franaise au sein de cette structure
au cours des douze dernires annes.
Dans un second temps, cette stabilit sera teste de faon plus technique,
utilisant les outils de la validation statistique et de la simulation. Les

40

Stabilit de la structure smiomtrique

chantillons seront perturbs par plusieurs variantes dune mthode de


rchantillonnage connue sous le nom de bootstrap1 pour mettre
lpreuve la structure smiomtrique. Celle-ci sera, disons-le demble,
largement insensible ces perturbations.
Evidemment, ce chapitre va se livrer un exercice peu captivant pour un
lecteur en qute daventures indites puisquil sagit en somme de
montrer que lon trouve toujours la mme chose, dans le temps, dans
lespace, voire lintrieur mme de certaines sous-catgories dindividus.
Le lecteur qui nous ferait confiance sur la surprenante stabilit de la
structure smiomtrique peut donc passer au chapitre suivant, et
simplement revenir consulter celui-ci si un doute le saisit lors de ses
cheminements venir dans la richesse et la complexit de lespace des
mots.

2.1 Stabilit empirique par sous-population


2.1.1 Stabilit dans le temps
Le questionnaire smiomtrique a t pass en France durant six annes
rparties sur une priode de dix ans (1990, 1996, 1998, 1999, 2001 et 2002)
en vue dapplications marketing2 et pour suivre certains aspects de
lvolution des valeurs des Franais. La comparaison de ces vagues
successives denqutes obtenues partir dchantillons indpendants met en
vidence une grande stabilit des structures (cf. tableau 2.1).
Mais, si les structures smiomtriques ne changent pas en elles-mmes,
on observe cependant de lgres diffrences au niveau du positionnement
de certaines catgories. Des modifications de faible amplitude peuvent tre
releves selon le sexe, lge mais surtout lactivit. Ainsi, les exploitantsagricoles expriment de plus en plus depuis ces dix dernires annes des
valeurs proches du ple Dtachement (un des ples de laxe 3 :
Attachement / Dtachement ) et semblent moins caractriss par le ple
Devoir de laxe 2 : Devoir / Plaisir . Les artisans-commerants et les
ouvriers se rapprochent en 1998 du ple Plaisir de ce mme axe,
caractris avant cette date surtout par les cadres et les professions
intermdiaires. Ces dplacements de catgories dans lespace
smiomtrique, faibles mais significatifs statistiquement, demandent pour
tre interprts un travail pluridisciplinaire impliquant aussi bien des
statisticiens que des sociologues et des conomistes. Un tel travail sort du
1. Le principe de la mthode bootstrap est esquiss en annexe A1.9.5.
2. Des exemples dapplication font lobjet du chapitre 7.

La smiomtrie

41

cadre de la prsentation plus spcifiquement mthodologique de cet


ouvrage.
Nous verrons au chapitre 5 que la manire de noter rend compte dune
autre volution significative quil nest pas possible de dceler ici sur la
simple comparaison danalyses effectues indpendamment sur chaque
chantillon. Nous renvoyons pour une analyse de lvolution des valeurs
des Franais au paragraphe 7.7 du chapitre 7 consacr aux comparaisons
diachroniques entre des chantillons dune mme population interrogs
des moments diffrents.
Bien que lon observe des mouvements significatifs de catgories dans
les plans smiomtriques, les positions des mots dans ces plans restent
stables, comme lattestent les tableaux 2.1 2.6 qui dcrivent
systmatiquement les volutions des axes 1 6 pour les quatre annes 2002,
1999, 1996, 1990. Dans cette srie de tableaux, chaque axe, pour chaque
anne, est dcrit par ses 20 mots les plus extrmes, cest--dire par les dix
mots qui lui sont le plus corrls positivement et les dix mots qui lui sont le
plus corrls ngativement.
2.1.2 Stabilit par pays
Le questionnaire smiomtrique a t soumis des chantillons
appartenant plusieurs pays europens1, toujours en vue dapplications de
type marketing. Une des inconnues, dans cette opration denvergure, tait
leffet de la traduction du questionnaire sur les rsultats. Le tableau A2.1
prsent en annexe A2 donne les correspondances entre mots dans les cinq
langues concernes. Il montre la fois ltendue et les limites des difficults
rencontres. Beaucoup de mots ne posent pas de gros problmes et dautres
conduisent faire des choix parfois difficiles2.

1. France, Grande Bretagne, Allemagne, Italie, Espagne, Finlande, Norvge, .


2. Ainsi, Dieu, Leau, Un arbre, Mtallique, Un nid, ne posent pas de gros problmes, en
premire approximation, et pour les pays concerns. En revanche, Argent, Rflchir, un Prtre,
sont des mots dont la traduction nest pas immdiate (Silver ou Money pour Argent en Anglais ?)
et ncessitent un choix raisonn, voire une convention arbitraire. Mais comme on le verra plus
loin, les rsultats seront galement stables par perturbation de la liste de mots, et la traduction peut
tre considre comme une opration entranant une perturbation dans des limites tolrables.

42

axe 2 : 2002

axe 2 : 1999 axe 2 : 1996 axe 2 : 1990

Tableau 2.2 :
Mots caractrisant les axes 2 de 1990 2002
Devoir / Plaisir

axe1 : 1990

Tableau 2.1 :
Mots caractrisant les axes 1 de 1990 2002
Axe de participation
axe 1 : 1999

sensuel
rver
voluptueux
le
lgret
moelleux
original
ocan
sauvage
nudit

sensuel
sensuel
rver
rver
lgret
aventurier
sauvage
nudit
aventurier
original
le
voluptueux
original
dsir
voluptueux
bohme
nudit
le
charnel
motion
zone centrale
conomiser
interdire
rgle
punir
loi
rgle
industrie
industrie
prtre
conomiser
soldat
morale
obeir
soldat
patrie
patrie
morale
discipline
discipline
obir

axe 1 : 1996

axe 1 : 2002
protger
puret
courage
honnte
rcompense
efficace
admirer
dynamique
respect
politesse

rgle
rigide
prtre
lite
soldat
industrie
patrie
obir
morale
discipline

prtre
loi
honneur
interdire
conomiser
soldat
patrie
discipline
morale
obir

sensuel
aventurier
rver
sauvage
original
nudit
bohme
lgret
voluptueux
orage

courage
dynamique
douceur
efficace
gaiet
respect
rcompense
honnte
confiance
lgance
doute
mort
vide
faute
danger
guerre
angoisse
rompre
dsordre
trahir

noir
mort
danger
rompre
faute
vide
angoisse
dsordre
guerre
trahir

courage
courage
efficace
protger
dynamique
efficace
prcision
dynamique
rcompense
robuste
lgance
honnte
robuste
politesse
charitable
puret
confiance
lgance
protger
rcompense
zone centrale
orage
doute
rompre
guerre
vide
faute
danger
angoisse
dsordre
trahir

faute
rompre
attaquer
mort
danger
vide
angoisse
guerre
trahir
dsordre

Exemple de lecture du tableau 2.1 : Pour laxe 1, en 2002, le mot le plus corrl positivement laxe est le mot courage, suivi par
dynamique, douceur, efficace, etc. Le mot le plus corrl ngativement ce mme axe est le mot dsordre, suivi de trahir, guerre,
angoisse, etc.

43

cole
recueillement
pardon
me
fleur
charitable
art
arbre
posie
livre

richesse
puissance
argent
or
gloire
conqurir
vitesse
proprit
ambition
hriter

Tableau 2.4 :
Mots caractrisant les axes 4 de 1990 2002
Esprit / Matire
richesse
puissance
or
gloire
vitesse
argent
ambition
conqurir
ruse
sduire

richesse
puissance
puissance
argent
or
richesse
argent
or
gloire
gloire
conqurir
ruse
vitesse
vitesse
commander
ambition
hriter
conqurir
ambition
fusil
zone centrale
pardon
cole
enseigner
enseigner
crire
art
arbre
pardon
tranger
charitable
cole
posie
posie
recueillement
thtre
nid
art
arbre
livre
livre

Tableau 2.3 :
Mots caractrisant les axes 3 de 1990 2002
Attachement / Dtachement
axe 3 : 1999
danger
doute
angoisse
rompre
cri
vide
labyrinthe
mort
orage
mfiance

paix
crire
enseigner
rflchir
cole
arbre
thtre
posie
art
livre

axe 4 : 2002 axe 4 : 1999 axe 4 : 1996 axe 4 : 1990

axe 3 : 2002

argent
richesse
rcompense
caresse
gat
maison
or
confort
cadeau
bijou

axe 3 : 1996 axe 3 : 1990

danger
orage
rvolte
critiquer
mort
attaquer
cri
feu
dtachement
vide

danger
danger
mort
orage
punir
mort
vide
dsert
rompre
labyrinthe
attaquer
rvolte
angoisse
rompre
labyrinthe
critiquer
critiquer
cri
rvolte
angoisse
zone centrale
fleur
mariage
or
gratuit
gat
hriter
maison
rcompense
rcompense
or
famille
argent
mariage
richesse
confort
cadeau
cadeau
bijou
bijou
confort

fidlit
richesse
mariage
rcompense
cadeau
maison
argent
confort
famille
bijou

44

Tableau 2.5 :
Mots caractrisant les axes 5 de 1990 2002
Cur / Raison

Tableau 2.6 :
Mots caractrisant les axes 6 de 1990 2002
Humilit / Souverainet

dieu
foi
prtre
me
ternel
sacre
recueillement
bijou
crmonie
noble

obir
fconder
rigide
faute
vide
mariage
mfiance
angoisse
famille
naissance

crateur
art
audace
robuste
inventeur
efficace
btisseur
prcision
voluptueux
noble

btisseur
noble
crateur
crateur
matriser
art
art
lite
robuste
dieu
concret
audace
inventeur
souverain
audace
foi
noble
me
efficace
robuste
zone centrale
cri
enfance
interdire
rigide
obir
obir
mariage
doute
famille
mariage
tendresse
interdire
mfiance
famille
doute
faute
faute
mfiance
naissance
naissance

enfance
famille
tendresse
angoisse
obir
rigide
faute
doute
mfiance
naissance

noble
lite
commander
audace
dieu
crateur
art
absolu
btisseur
matriser

axe 6 : 2002 axe 6 : 1999 axe 6 : 1996 axe 6 : 1990

industrie
volontaire
matriel
robuste
matriser
efficace
prcision
produire
concret
logique

axe 5 : 2002 axe 5 : 1999 axe 5 : 1996 axe 5 : 1990


dieu
dieu
dieu
foi
foi
foi
prtre
me
me
sacr
recueillement prtre
me
sacr
sacr
recueillement prtre
ternel
crateur
crmonie
crateur
ternel
ternel
recueillement
infini
noble
souverain
souverain
souverain
posie
zone centrale
volontaire
construire
produire
utilitaire
matriser
astucieux
utilitaire
produire
concret
rflchir
astucieux
matriser
construire
efficace
dynamique
prcision
prcision
concret
efficace
logique
confort
rflchir
matriel
matriser
volontaire
utilitaire
concret
logique
prcision
efficace

La Smiomtrie

45

Les rsultats prsents concernent six de ces pays : la France, la Grande


Bretagne, lAllemagne, lItalie, lEspagne, le Canada (Qubec). La stabilit
des structures peut tre vrifie la lecture des figures 2.1 2.5.
On relve cependant certaines singularits qui, sans remettre en cause la
stabilit densemble, la nuancent, mettant en vidence des particularits
culturelles sur lesquelles il est intressant de sarrter.
La premire de ces singularits concerne linterversion des axes 2 et 3,
Devoir / Plaisir et Attachement / Dtachement , entre les pays du sud
de lEurope et ceux du nord : pour les Espagnols, les Franais et les Italiens,
laxe Devoir / Plaisir apparat avant laxe Attachement /
Dtachement . A linverse, pour les Allemands, les Anglais et les
Canadiens, cest la dimension Attachement / Dtachement qui apparat
en seconde position, et qui prcde donc laxe Devoir / Plaisir occupant
maintenant la troisime position1. Ce ne sont pas les axes qui sont en cause,
mais leur hirarchie2.
Le chapitre 5 montrera que cette interversion daxes peut tre imputable,
du moins en partie, aux effets de notation qui caractrisent les premier et
troisime axes et qui traduisent des diffrences culturelles dattitude par
rapport lenqute et/ou son questionnaire ainsi que des diffrences de
comportement vis--vis dune chelle de notes.
Cette singularit se retrouve galement dans les analyses que lon peut
faire lintrieur de certaines classes dges. Ce point sera repris lorsque
seront prsentes ces analyses (section 2.1.4).
La deuxime singularit concerne laxe 4 appel conventionnellement
Esprit / Matire . Si, du ct du ple Matire , on retrouve, pour les
cinq pays considrs, un grand nombre de mots communs tels que Or,
Argent, Bijou (sauf Canada), Richesse, Conqurir, Victoire, Sduire, etc.,
qui expriment trs clairement la recherche dune jouissance travers la
conqute et la possession de bien matriels, les mots qui sy opposent
lautre extrmit de laxe diffrent assez nettement selon les pays.

1. Ce rsultat est confirm par les axes de la Norvge, de la Finlande et de la Rpublique


Tchque, dont il nest pas rendu compte ici.
2. On peut donc dire que, pour dcrire lensemble des corrlations entre mots, lopposition
Devoir / Plaisir est plus importante que lopposition Attachement / Dtachement dans le
sud de lEurope que dans le nord de lEurope.

46

DEVOIR

DTACHEMENT

ATTACHEMENT

Figure 2.1 : Plan smiomtrique (2,3) - Espagne

PLAISIR

47

DEVOIR

Figure 2.2 : Plan smiomtrique (2,3) - Italie

ATTACHEMENT

DTACHEMENT

PLAISIR

48

DTACHEMENT

PLAISIR

DEVOIR

Figure 2.3 : Plan smiomtrique (2,3) - Grande Bretagne

ATTACHEMENT

49

DTACHEMENT

PLAISIR

DEVOIR

Figure 2.4 : Plan smiomtrique (2,3) - Allemagne

ATTACHEMENT

50

DTACHEMENT

PLAISIR

DEVOIR

Figure 2.5 : Plan smiomtrique (2,3) - Canada

ATTACHEMENT

51

On peut diviser ceux-ci en trois groupes : la France o la notion


d Esprit ou encore de Sublimation est avant tout mais non
exclusivement exprime par lensemble des mots du questionnaire
voquant les activits artistiques (Livre, Art, Thtre et Posie), le Canada
mais surtout la Grande-Bretagne o cette notion est principalement rendue
par des mots lis la nature (Arbre, Montagne, Fleuve, Ocan, Lune et
Vert), et lEspagne et lItalie o apparaissent des mots comme Mort,
Sacrifice, Humble, Faute (sauf Espagne), Doute, qui sont compltement
absents dans les autres pays ; lAllemagne prsentant une synthse de ces
trois groupes1.
2.1.3 Stabilit selon le sexe
Nous avons vu au cours du chapitre prcdent que les axes 3 (intitul
conventionnel : Attachement / Dtachement ) et 5 (intitul conventionnel : Cur / Raison ), obtenus partir danalyses de la population
globale, opposaient des populations fminines et masculines. Si la variable
sexe est vraiment la variable explicative cache responsable des grandes
oppositions observes, les analyses ralises uniquement auprs dun
chantillon de femmes ou uniquement auprs dun chantillon dhommes
ne doivent plus faire apparatre daxes de ce type.
Or, lensemble des structures smiomtriques restent, quelques nuances
prs, conserves lors danalyses ne portant que sur des hommes ou sur des
femmes. Il y a l une stabilit et une permanence assez inattendues. La
structure est la mme pour les hommes et pour les femmes, mais certains
des traits de cette structure peuvent sparer de faon significative les
hommes des femmes2.

1. On pourrait, propos de tels rsultats, faire lhypothse que des particularits culturelles
peuvent tre lorigine des diffrences observes, les Franais opposant lart largent, les
Anglais, lor de la City la campagne anglaise, et les habitants des pays du sud opposant alors lor
la mort. Mais, conscients de nos limites dans un domaine aussi subtil, nous laisserons ce soin
nos lecteurs et aux spcialistes concerns.
2. Ce phnomne dapparition dune mme structure des chelles diffrentes voque
irrsistiblement les structures dites fractales. Ce phnomne, tout comme lanalogie qui y est
attache, fut dj remarqu et mentionn par Jean-Pierre Pags, dans le cadre des enqutes
Agoramtrie. Lanalogie avec le monde fractal est dautant plus prgnante quelle se prolonge, de
subdivision en subdivision de lchantillon, jusqu lindividu, qui porterait en lui une structure du
mme type. Nous reviendrons diverses reprises sur ce thme, et ce jusquau moment o il sagira
pour nous de conclure et dvoquer problmes ouverts et recherches futures.

52

Tableau 2.7 : Confrontation, axe par axe, des analyses ralises sparment sur les hommes et sur les femmes

naissance
mfiance
faute
doute
rigide
caresse
masque
tendresse
angoisse
cri

inventeur
btisseur
produire
astucieux
prcision
audace
matriser
robuste
concret
efficace

mariage
naissance
famille
crmonie
adorer
doute
enfance
ternel
dieu
foi

axe 6 : Humilit /
Souverainet
homme
femme

dieu
foi
me
sacre
prtre
recueillem.
noble
crateur
souverain
absolu

volupt
art
prtre
recueille
me
noble
sacre
foi
dieu
crateur

axe 5 :
Cur / Raison
homme
femme
dieu
foi
me
prtre
sacre
recueillem.
crmonie
ternel
bijou
adorer

confiance
ruse
gaiet
volontaire
honnte
punir
politesse
mfiance
effort
puissance

axe 4 :
Esprit / Matire
homme
femme
puissance
richesse
or
argent
gloire
conqurir
ruse
ambition
sduire
bijou

utilitaire
rflchir
produire
robuste
astucieux
logique
concret
matriser
prcision
efficace

axe 3 : Attachement /
Dtachement
homme
femme
puissance
richesse
or
argent
gloire
conqurir
vitesse
fusil
commander
attaquer

pardon
charitable
paix
posie
thtre
nid
recueillem
art
livre
arbre

axe 2 :
Devoir / Plaisir
homme
femme
sensuel
rver
voluptueux
nudit
aventurier
original
lgret
bohme
dsir
le
charitable
arbre
pardon
crire
enseigner
thtre
cole
art
posie
livre

danger
rompre
mort
cri
orage
dsert
critiquer
rvolte
punir
vide

sauvage
aventurier
sensuel
rver
orage
nudit
original
le
rvolte
ocan
sacrifice
caresse
acheter
rgle
richesse
hriter
prtre
argent
maison
conomiser
gratuit
rcompense
industrie
or
argent
soldat
gaiet
richesse
patrie
bijou
cadeau
morale
rcompense
or
obir
confort
confort
discipline
cadeau
bijou

punir
danger
mort
rompre
angoisse
labyrinthe
doute
cri
vide
critiquer

loi
dieu
foi
prtre
conomiser
soldat
morale
obir
discipline
patrie

53

Tableau 2.8 : Confrontation, axe par axe, des analyses ralises sparment sur deux classes d'ges

richesse
or
vitesse
puissance
sduire
argent
sensuel
dsir
conqurir
gloire

modestie
amiti
enseigner
livre
paix
consoler
charitable
cole
confiance
pardon

richesse
puissance
or
argent
conqurir
fusil
gloire
commander
hriter
vitesse

+ 45 ans

construire
rflchir
robuste
astucieux
utilitaire
logique
matriser
prcision
concret
efficace

dieu
foi
me
prtre
sacre
recueillem.
crmonie
ternel
bijou
souverain

- 45 ans

sensuel
dynamique
utilitaire
astucieux
produire
matriel
volontaire
efficace
logique
prcision

dieu
foi
me
prtre
sacre
recueillem.
ternel
absolu
infini
noble

+ 45 ans

audace
art
noble
me
sacre
prtre
recueillem.
crateur
foi
dieu

faute
naissance
rigide
doute
mfiance
caresse
nud
interdire
tendresse
masque

sublime
astucieux
noble
robuste
lite
audace
crateur
efficace
concret
matriser

naissance
doute
masque
caresse
tendresse
crmonie
faute
mariage
immobile
mfiance

axe 5 :
Cur / Raison

cadeau
parfum
moelleux
voluptueux
bijou
rire
rver
gaiet
sensuel
caresse

travail
vieillir
enseigner
dieu
obir
prtre
morale
foi
recueillem.
cole

axe 4 :
Esprit / Matire

fleur
gaiet
douceur
tendresse
paix
cadeau
maternel
caresse
parfum
rver
rigide
danger
interdire
cri
discipline
rompre
angoisse
sacrifice
obir
punir

axe 6 :
Humilit /
Souverainet
- 45 ans
+ 45 ans

rvolte
orage
sauvage
bohme
dsert
nudit
original
feu
aventurier
ironie
mfiance
vide
armure
rompre
muraille
angoisse
fusil
danger
punir
attaquer

- 45 ans

orage
sauvage
tranger
lune
rvolte
feu
bohme
mystre
dsert
diffrent
discipline
soldat
mariage
honneur
richesse
conomiser
hriter
patrie
proprit
argent

axe 2 :
axe 3 :
axe 3 :
axe 2 :
Devoir/ Attach. / Attach. / Devoir/
Plaisir Dtach. Dtach. Plaisir
- 45 ans
+ 45 ans
- 45 ans
+ 45 ans

conomiser
hriter
obir
mariage
patrie
proprit
gloire
richesse
discipline
argent

54

Stabilit de la structure smiomtrique

Les nuances releves proviennent essentiellement des classements des


mots dans lexplication des axes concerns, classements qui peuvent varier
lgrement sans perturber leur interprtation initiale. Le tableau 2.7
prsente, pour chaque axe1, les dix premiers mots qui leur sont le plus
fortement corrls.
Les trois premiers axes de la structure smiomtrique (axes 2-3-4) sont
stables. Les valeurs rvles par ces axes sont similaires chez les hommes et
chez les femmes et ce malgr des diffrences notables observes dans
lanalyse commune, notamment pour le troisime facteur. Aussi la notion
d Attachement de laxe 3 est une valeur plus fminine qui existe
cependant chez les hommes et celle de Dtachement est une valeur plus
masculine que lon retrouve aussi chez les femmes. On note pour le ple
Attachement , chez les femmes, la prsence des mots Acheter, Hriter,
Fidlit et labsence de Gaiet, Caresse, Rire, Douceur dans la liste des dix
premiers mots. Il existe donc des nuances dans la caractrisation de laxe,
nuances qui sestompent ou voluent si lon retient plus de mots pour
caractriser cette extrmit de laxe.
Cest sans doute pour les axes 5 et 6 que se produisent quelques
irrgularits dans la mesure o les quatre concepts mergeant de ces axes
dans lanalyse globale ne correspondent pas exactement aux axes de mme
rang dans lanalyse des hommes et dans celle des femmes. Mais, hormis ce
dcalage sur les deux derniers axes qui sestomperait sans doute avec un
chantillon plus grand, la structure smiomtrique observe sur ces deux
sous-populations est stable, stabilit que lon retrouve dailleurs dans
lanalyse suivante, celle par ge.
2.1.4 Stabilit selon lge
Nous venons de voir que les axes 3 Attachement / Dtachement et 5
Raison / Cur taient lis, dans lanalyse globale, au sexe des
rpondants, mais quils subsistaient lorsquon limine l effet sexe, cest-dire en travaillant sparment sur deux sous-populations de mme sexe. Or
laxe 2 ( Devoir / Plaisir ) et, dans une moindre mesure, laxe 4
( Esprit / Matire ) sont, eux, lis la variable ge . Que se passe-t-il
si lon scinde la population en deux catgories dge : les moins de 45
ans et les plus de 45 ans , et si lon procde aux analyses lintrieur
de chacune de ces deux sous-populations ?

1. Le premier facteur dont le statut est particulier nest pas pris en compte ici. Toutefois, il se
rvle tre galement stable.

La Smiomtrie

55

L encore, on observe une permanence des structures lexception dune simple


interversion des axes 2 et 3 pour les personnes de plus de 45 ans, mettant alors en
second plan le Plaisir / Devoir par rapport l Attachement / Dtachement
(cf. tableau 2.8)1.

Ainsi, la notion de Plaisir , chez les moins de 45 ans se rapproche,


du point de vue des mots qui la caractrise, de la notion d Esprit (Lune,
Mystre, Art, Inconnu, Fleuve, Ocan). De la mme faon, la notion de
Devoir pour cette mme sous-population, fait plus rfrence la notion
de discipline et une certaine russite matrielle, proche du ple
Matire de laxe 4.
L Attachement de laxe 3 est moins matriel chez les moins de 45
ans (absence, parmi les 15 premiers mots, des mots : Or, Rcompense,
Argent) et plus li aux mots du Plaisir chez les plus de 45 ans
(Voluptueux, Sensuel, Sduire). Le Dtachement est plus agressif et
guerrier pour les plus jeunes (Attaquer, Fusil, Armure, Guerre) et plus
oblatif pour les plus gs (Obir, Sacrifice, Interdire, Effort).
La notion d Esprit de laxe 4 est moins bien dfinie pour les moins de
45 ans dont les valeurs se retrouvent en partie dans le Plaisir de laxe 2.
Prcisons que pour ces tudes de stabilit selon lge, comme pour celles
relatives au sexe dans la section prcdente, la division en deux de
lchantillon dsquilibre fortement celui-ci, de faon vidente pour les
critres incrimins, mais aussi pour dautre critres (profession, niveau
dducation, rgion) qui ntaient pas forcment quilibrs lintrieur
de chaque tranche dge ou de chaque sexe. Les sous-chantillons ntant
plus reprsentatifs, la permanence globale des structures nen est que plus
surprenante, au contraire des petites diffrences observes qui paraissent
finalement modestes.

2.2 Intervalles de confiance des valeurs propres


Dans cette section, plus technique, ainsi que dans les sections suivantes,
la stabilit et la cohrence de la structure smiomtrique sera prouve en
utilisant les outils de la validation statistique et de la simulation. On est
naturellement conduit poser un certain nombre de questions sur la qualit
des reprsentations : Observe-t-on vraiment quelque chose ? Les donnes
ont-elle une structure ? Ou, au contraire, de simples fluctuations
1. On ne stonnera pas, compte tenu de linterversion daxes signale, de voir sur le tableau
2.8 laxe 2 des moins de 45 ans compar laxe 3 des plus de 45 ans (deux premires
colonnes) et rciproquement (deux colonnes suivantes).

56

Stabilit de la structure smiomtrique

dchantillonnage suffiraient-elles expliquer les pourcentages de variance


obtenus (pourcentages qui, rappelons-le, mesurent limportance des axes) ?
Cette question sera tout dabord traite dans un cadre statistique
classique : il existe en effet une procdure permettant dvaluer la confiance
que lon peut accorder aux premires valeurs propres, cest--dire
finalement aux premiers axes. Lampleur de lintervalle de confiance qui va
tre calcul donne une indication sur la stabilit de la valeur propre vis-vis des fluctuations dues lchantillonnage. Lintervalle de confiance
dAnderson (cf. annexe A1.9.4) pour chaque valeur propre dcrit en
quelque sorte lincertitude sur celle-ci. Le tableau 2.9, puis la figure 2.6
dans le cas des deux premires valeurs propres, prsentent les intervalles de
confiances pour les 6 premires valeurs propres dans le cas de trois
populations de tailles diffrentes.
Tableau 2.9 : Intervalles de confiance des 6 premires valeurs propres
(cas de trois tailles dchantillon diffrentes)

Echantillon
2 000

Echantillon
10 000

Echantillon
15 000

vp1
vp2
vp3
vp4
vp5
vp6
vp1
vp2
vp3
vp4
vp5
vp6
vp1
vp2
vp3
vp4
vp5
vp6

borne
infrieure
24.00
10.40
8.24
6.80
3.80
3.59
25.49
10.07
8.58
6.82
4.04
3.58
26.40
10.13
8.64
6.78
4.07
3.61

valeur
propre
25.35
10.98
8.70
7.18
4.01
3.79
26.19
10.35
8.82
7.01
4.15
3.68
26.99
10.36
8.84
6.93
4.16
3.69

borne
suprieure
26.77
11.60
9.19
7.58
4.23
4.00
26.91
10.63
9.06
7.20
4.26
3.78
27.59
10.59
9.03
7.09
4.26
3.77

Les calculs portent sur trois chantillons smiomtriques de 2 000,


10 000 et 15 000 individus. Les rsultats sont trs satisfaisants, en ce sens
que, pour une taille dchantillon donne, les intervalles de confiance des
premires valeurs propres nempitent pas, ce qui traduit bien que celles-ci
sont significativement distinctes.

La Smiomtrie

57

30
25
20

min

15

valeur propre
max

10
5
0
vp1

vp2

vp3

vp4

vp5

vp6

Figure 2.6 : Variations des intervalles de confiance des six premires valeurs
propres (vp1,...vp6) pour une taille de lchantillon de 2000.

On lit, par exemple, sur les deux premires lignes du tableau 2.9, comme
sur la figure 2.6, que la borne suprieure de lintervalle de la seconde valeur
propre (11.60) est plus petit que la borne infrieure de celui de la premire
24.00).
La figure 2.6 montre aussi, dans le cas le plus dfavorable (chantillon de
taille 2000), que les intervalles de confiance restent petits par rapport aux
valeurs propres. On note cependant que pour cette taille dchantillon, les
valeurs propres 5 et 6 sont voisines et que leurs intervalles de confiance
empitent.
Tout ceci prouve que les premiers axes principaux occupent des
directions significatives, et quils sont bien individualiss.
Ces mthodes sappliquent en fait des observations distribues selon
une loi normale, mais leur robustesse leur permet dtre utilises en dehors
de ce cadre. Pour tre plus rigoureux et saffranchir de ces hypothses,
nous allons utiliser des validations par la mthode de bootstrap non
paramtrique.
Nous verrons donc au paragraphe suivant comment les mthodes de
validation par rchantillonnage sappliquent ltude de la stabilit des
formes sans hypothse au pralable sur la distribution des donnes.

58

Stabilit de la structure smiomtrique

2.3 Stabilit par rchantillonnage


La permanence des structures observe sur des chantillons indpendants
devrait nous satisfaire et nous convaincre que, lorsquun ensemble de mots
a t choisi, une srie daxes ou de dimensions apparaissent assez
systmatiquement, pas toujours exactement dans le mme ordre, mais avec
des caractrisations par les mots trs voisines.
On ne sait que peu de choses, cependant, sur la stabilit des positions des
mots les uns par rapport aux autres. Leur classement sur les axes a bien
montr quils devaient tre proches dune population une autre. Mais on
peut se poser lgitimement la question de savoir quelle est la prcision de la
position dun mot sur les plans engendrs par deux axes principaux, compte
tenu des fluctuations dchantillonnage de nos recueils de rponses.
Les statisticiens ne pouvaient pas rpondre cette question de faon
satisfaisante jusqu une priode rcente au cours de laquelle la puissance
des nouveaux moyens de calcul a permis de systmatiser les mthodes dites
de rchantillonnage.
Parmi ces mthodes, une mthode statistique de validation, dsigne sous
le nom de bootstrap1 permet de vrifier la fois la stabilit des axes (ce qui
ne fera que confirmer les rsultats des sections prcdentes de ce chapitre),
et dvaluer la confiance que lon peut accorder la position de chaque
point dans les plans principaux.
La mthode de bootstrap classique utilise ici consiste perturber
lchantillon initial en simulant un grand nombre dchantillons de mme
taille2. Dans ce contexte, les simulations sont appeles rplications.
Deux variantes de cette mthode seront utilises, le bootstrap partiel3, et
le bootstrap total4.
Elles donneront des rsultats convergents, attestant la stabilit des
structures observes jusquau sixime axe.
1. Cette terminologie image due Efron (1979) se rfre lexpression to pull oneself up by
ones own bootstraps qui signifie littralement slever en tirant ses propres lanires de
bottes , ou encore progresser sans demander daide (cf. annexe A1.9.5).
2. Ces chantillons sont obtenus par n tirages au hasard avec remise des individus dans
lchantillon initial de n individus.
3. Le bootstrap partiel consiste projeter les colonnes des tableaux rpliqus (mots) comme
des lments supplmentaires sur les axes de lanalyse de rfrence, cest--dire lanalyse de
lchantillon initial non perturb. Avec 30 rplications, on obtient 30 positions (permettant de
calculer des ellipses de densit) pour chaque mot (cf. annexe A1.9.5).
4. Le bootstrap total consiste refaire des analyses en composantes principales compltes sur
chaque chantillon rpliqu. Comme dans le cas partiel, avec 30 rplications, on obtient 30
positions (permettant de calculer des ellipses de densit) pour chaque mot (cf. annexe A1.9.5).

La Smiomtrie

59

2.3.1 Bootstrap partiel


Les figures 2.6 et 2.7 montrent quelques ellipses de confiance obtenues
par la mthode de validation selon les principes du bootstrap partiel
respectivement pour les plans (2, 3) et (5, 6). Le plan (2, 3) est le premier
plan smiomtrique1, le plus utilis dans les visualisations, et le plan (5, 6)
est le dernier plan smiomtrique.
Il sagit dun chantillon France , regroupant les quatre chantillons
indpendants des annes 1990, 1996, 1998 et 1999, et totalisant 11055
individus, reprsentatifs de la population franaise ge de 18 ans et plus.
Les ellipses sont de tailles trs rduites, et donc les fluctuations de la
position des points sont trs faibles, malgr la svrit du principe des
rplications.
En effectuant un tirage avec remise dans lchantillon, on montre
quenviron 30% des individus sont exclus de chaque rplication ; dautres
individus en revanche apparaissent deux, trois fois, jusqu six fois dans
certains cas exceptionnels.
On note que les ellipses relatives au plan (5, 6) sont lgrement plus
grandes, tout en laissant la position des points une prcision acceptable.
2.3.2 Bootstrap total
Ce sont les figures 2.8 et 2.9 qui montrent les mmes plans principaux
que prcdemment, avec maintenant des ellipses plus grandes2.
Lexamen de la figure 2.9 montre que les zones de confiance des mots
interfrent peu. Il sagit pourtant dune preuve svre (le bootstrap total) et
dun plan smiomtrique a priori moins stable que le plan principal, le plan
(5, 6) ; les effets des fluctuations dchantillonnage sont donc faibles,
confirmant ainsi la stabilit de ces facteurs et des structures obtenues.

1. Les axes 2 et 3 sont les deux axes les plus importants, puisque laxe 1 ne fait pas partie de la
structure smiomtrique proprement dite.
2. En fait, le bootstrap total donne une vue pessimiste de la prcision des points, car les
analyses en composantes principales sont refaites pour chaque rplication, et donc les plans de
projection sont calculs sur des donnes perturbes : non seulement les donnes sont perturbes,
mais loutil de visualisation est lui-mme perturb (cf. annexe A1.9.5).

60

Stabilit de la structure smiomtrique

Figure 2.6 : Plan engendr par les axes 2 et 3 Quelques zones de confiances (Bootstrap partiel)

La Smiomtrie

61

Figure 2.7 : Plan engendr par les axes 5 et 6 Quelques zones de confiances (Bootstrap partiel)

62

Stabilit de la structure smiomtrique

Figure 2.8 : Plan engendr par les axes 2 et 3 Quelques zones de confiances (Bootstrap total)

La Smiomtrie

63

Figure 2.9 : Plan engendr par les axes 5 et 6 Quelques zones de confiances (Bootstrap total)

64

Stabilit de la structure smiomtrique

2.4 Stabilit structurelle


Dans la section prcdente de ce chapitre, cest la stabilit des structures
vis--vis des fluctuations dchantillonnage qui a t prouve sur
lensemble des individus selon la mthode de bootstrap.
Nous allons changer de registre et poser une question radicalement
diffrente, et beaucoup plus difficile : dans quelle mesure les structures
smiomtriques dpendent-elles du choix des mots ?
Cette question est effectivement plus difficile car il nexiste pas un
univers des mots comparable lunivers des individus susceptibles dtre
interrogs dans une enqute, univers constitu, par exemple, par lensemble
des individus gs de 18 ans ou plus dun pays donn. Les statisticiens ont
lhabitude de traiter la dimension individu ou observation laquelle
on peut associer la notion de tirage dans une urne et les modles
mathmatiques correspondant. Rares sont les situations o lon est amen
parler de tirage ou dunivers de variables1.
On va nanmoins chercher tester la stabilit des structures vis--vis de
lensemble des variables. On fait alors lhypothse que les variables (les
210 mots) sont choisies par un tirage alatoire sans remise dans une urne
contenant lensemble des mots smiomtrisables de la langue franaise2.
Un tirage dans cet univers suppose chaque fois la constitution dun
nouveau questionnaire et un nouveau travail de terrain, oprations dont le
cot serait prohibitif. Comme dans le cas des chantillons dindividus, le
bootstrap fournit une solution pragmatique et conomique ce problme :
on va construire des rplications de lensemble des mots en procdant des
tirages avec remise dans lensemble des 210 mots dj slectionns.
Alors que le bootstrap classique ralis sur les individus teste la stabilit
des patterns de variables, cest--dire de mots (cf. section 2.2), le bootstrap
ralis sur les variables permet dprouver les patterns observables au
niveau des individus. Or ceux-ci sont anonymes et nombreux (plusieurs
milliers). Les seules structures intressantes sont celles quils induisent sur
leurs caractristiques de base (sexe, ge, profession, niveau dducation,
activits, types dhabitats). La procdure dcrite en annexe A1.2.4 permet
1. Il est des circonstances o le problme de lchantillonnage se pose la fois pour les
variables et les individus. Ce problme ancien, pos par Hotelling (1933) [inventeur/dcouvreur de
lanalyse en composantes principales], a t en particulier tudi par Escoufier (1970).
2. Il sagit, rappelons-le, de mots pleins - pas de mots outils ou grammaticaux - faisant partie
du vocabulaire de base, non consensuels, non ambigus smantiquement - non polysmiques -,
chargs motionnellement ou axiologiquement - pas de mots neutres du type table, ni de mots
techniques comme magntoscope.

La Smiomtrie

65

cependant de positionner les mots correspondant chaque chantillon


rpliqu, y compris les mots qui sont absents de certaines rplications1.
Lensemble des variables (ici 210 mots) est beaucoup plus restreint que
celui des individus (plusieurs milliers). En moyenne, chaque tirage avec
remise, on dmontre quenviron deux tiers des variables initiales seront
prsentes, ce qui constitue une ponction trs svre dans lensemble initial,
et donc une perturbation que lon peut juger excessive du tableau de
donnes.
La figure 2.10 montre les rsultats de cette procdure sur le plan des axes
[2,3] : les ellipses de confiance des mots sont bien sr trs dilates par
rapport celles des graphiques prcdents, mais les rsultats nont rien de
catastrophique. Le long du second axe (horizontal), la zone de confiance
elliptique du mot Sensuel reste oppose celle du mot Patrie, de mme, le
long du troisime axe (vertical) la zone de confiance du mot Bijou reste
oppose celle du mot Danger. Les interprtations de ces axes rsistent aux
trs fortes perturbations imposes au recueil de mots.
Les axes suivants montrent une stabilit moins nette, mais on peut penser
quune liste de mots plus tendue (par exemple une liste de 306 mots, ce qui
tait le cas lors des premires versions de la smiomtrie) permettrait daller
plus loin dans lapplication de cette preuve de validit par ailleurs
extrmement svre.
Il faut retenir de cette section que cette procdure (novatrice) de
bootstrap sur variables fournit une prsomption - et non une preuve - de
stabilit de la structure vis--vis du choix des mots. Le chapitre 4, consacr
la smiomtrie ouverte apportera galement des contributions ce
problme de la stabilit vis--vis de la composition de la liste, problme
intressant et important, mais pas crucial si la smiomtrie nest utilise que
pour comparer et diffrencier, ce qui est le cas dans le cadre des
applications actuelles.

1. En bref : une rplication bootstrap consiste en un tirage avec remise au sein des 210 mots de
dpart. Certains mots seront absents (ils auront un poids nul), dautres apparatront une fois (poids
1), deux fois (poids 2), etc. En remplaant les poids nuls par des poids infinitsimaux, ce qui
ncessite quelques amnagements techniques supplmentaires, on verra se positionner
automatiquement les mots absents comme mots supplmentaires (cf. annexe A1.9.3).

66

Stabilit de la structure smiomtrique

Figure 2.10 : Plan engendr par les axes 2 et 3 Zones de confiances (Bootstrap sur variables),
ellipses de confiance des mots : Bijou, Danger, Dynamique, Loi, Patrie, Sensuel

67

Stabilit de la structure smiomtrique

2.5 Stabilit vis--vis du codage


La structure smiomtrique (existence et permanence de six axes
principaux caractriss par les mmes mots) se rvle stable dans lespace,
dans le temps, et vis--vis dventuelles fluctuations dchantillonnage.
On pourrait aussi objecter, assez lgitimement, que le codage de base
relve dune convention assez arbitraire : pour le rpondant, cest surtout
lordre des notes qui importe, et non la matrialisation de celles-ci sous
forme dchelle de 1 7, avec des notes en progression arithmtique.
Est-ce que la structure smiomtrique mise en vidence serait la mme si
le codage propos tait diffrent, en respectant toutefois lordre des notes ?
Notons dj que toute transformation y du codage initial x de la forme
y = ax + b laisse invariante les corrlations, et donc laisse identique toute la
structure smiomtrique. Ainsi, on ne change pas les rsultats en
remplaant (1, 2, 3, 4, 5, 6, 7) par (2, 4, 6, 8, 10, 12, 14) ou encore par (11,
12, 13, 14, 15, 16, 17).
Pour dformer encore plus le codage initial, il sera donc procd des
transformations non-linaires1 (voir figure 2.11). On va voir que la
structure est invariante pour une large famille de telles transformations.
Le rsultat est le suivant : pour toutes ces transformations, les six
premiers axes smiomtriques sont conservs. Ceci signifie que les axes
apparaissent dans le mme ordre et sont caractriss par les mmes mots.

1. Les transformations non-linaires suivantes du codage arithmtique de dpart ont t


ralises (voir figure 2.11) : a) y = x ; b) y = x 2 ; c) y = log10 (1 + x) ; d) codage ternaire selon
lequel y = 1 pour x = 1 ou 2 ; y = 2 pour x = 3 ou 4 ou 5 ; y = 3 pour x = 6 ou 7.
Sur la figure 2.11, le carr a t divis par 5 et le logarithme multipli par 10 pour ramener les
diffrents codages une chelle comparable celle du codage initial (ou codage de base, en
pointill).
Partant un chantillon de 5 527 individus (France), et donc dun tableau de notes (5 527 x 210),
quatre nouveaux tableaux de mmes dimensions ont t calculs en appliquant aux notes les
transformations prcdentes.

68

Stabilit de la structure smiomtrique

Transformations non linaires du codage laissant


invariante la structure smiomtrique
12
10

Racine carr
Ternaire
Carr / 5
10log(1+x)
Code base

8
6
4
2
0
0

Figure 2.11 : Diverses transformations de lchelle des notes


Tableau 2.10 : Valeurs propres des diffrents tableaux recods
Numro
1
2
3
4
5
6

Base
26.6
10.2
8.7
7.0
4.1
3.6

Carr
28.7
10.3
8.4
7.0
4.0
3.7

Log
23.5
9.6
8.7
6.4
4.0
3.3

Ternaire
22.1
8.2
7.1
5.9
3.6
3.2

Racine
25.1
9.9
8.8
6.8
4.1
3.5

On constate que la premire valeur propre est maximale pour les carrs des notes (codes
fortement dilats, de 1 49), est minimale pour le codage ternaire, qui contracte les 7 valeurs en
trois valeurs.

Ce sont les directions propres (ou axes principaux) qui sont stables,
cest--dire caractrises par les mmes groupes de mots. Les valeurs
propres, qui dcrivent les allongements le long de ces axes, sont, elles, plus
sensibles au codage, sans pour autant modifier lordre des axes.
Il est intressant de noter que le codage ternaire naltre pas la structure :
cela indique que lchelle en 7 positions est probablement assez redondante.
Mais cela ne prouve pas obligatoirement (il faudrait le vrifier, mais cela
impliquerait de retourner sur le terrain) quune chelle en trois positions,
propose directement aux personnes interroges, restituerait la structure
initiale.
En revanche, un codage binaire, (par exemple : y = 1 pour x = 1,2,3,4 ;
y = 2 pour x = 5,6,7) trop destructeur dinformation, altre sensiblement la
structure. Le premier axe est peu prs conserv (valeur propre 19.3,

La Smiomtrie

69

infrieure toutes les premires valeurs propres du tableau 2.4.1) mais on


observe une rotation lintrieur du plan (2,3). De faon surprenante, les
axes 4, 5, 6, sont cependant conservs. Avec un tel codage, certains mots
comme guerre, mort, trahir, nobtiennent que des notes 1 sur tous les
individus, dautres, comme paix ou tendresse nobtiennent que des notes 2.
De tels mots, dont les variances sont nulles, ninterviennent plus dans les
corrlations et sont exclus de la structure.

2.6 Analyse en facteurs communs et spcifiques


La mthode danalyse en facteurs communs et spcifiques, qui remonte
au tout dbut du vingtime sicle (cf. annexe A1.6), est apparente
lanalyse en composantes principales, mais intervient en gnral dans un
contexte fort diffrent : il ne sagit plus dun simple instrument
dobservation, mais dun modle.
Ce modle stipule ici que chacune des 210 notes (correspondant donc
chacun des mots) dpend dun petit nombre de facteurs communs et dun
facteur spcifique (voir la formulation exacte en annexe A1.6).
Les facteurs communs correspondraient, par exemple, aux six premires
dimensions1, et les facteurs spcifiques rsumeraient en quelque sorte les
204 axes suivants, qui ne sont pas pris en compte.
Ce modle analytique, qui exige dailleurs quelques contraintes
supplmentaires, a bien peu de chance dtre valid par un test statistique
rigoureux, mme en prenant une trentaine ou une cinquantaine de facteurs
communs, ne serait-ce que parce que les notes de dpart sont des variables
discrtes et non des variables continues. Et pourtant, lajustement dun tel
modle (en utilisant la procdure voque dans lannexe A1.6) avec, par
exemple, 12 facteurs communs, livre pour les six premiers facteurs (en fait
les coefficients des mots sur ces facteurs, appels saturations) les six
premiers axes de la structure smiomtrique.
Lapplication de cette mthode figure dans ce chapitre dvolu la
stabilit des rsultats car la quasi-totalit des conclusions prcdentes sur
linterprtation des axes sapplique aussi lanalyse factorielle en facteurs
communs et spcifiques. Les rsultats ont donc rsist des perturbations
importantes des donnes de base, des changement de codage, et galement
des modification notables de la mthode de rduction des donnes.

1. Lanalyse en composantes principales est dans ce cas un cas particulier danalyse en facteurs
communs et spcifiques avec 210 facteurs communs (on garde tous les axes) et aucun facteur
spcifique. Le facteur spcifique est prsent pour modliser les axes abandonns.

70

Stabilit de la structure smiomtrique

Un des sous-produits intressants de ce dernier type danalyse est le


calcul, pour chaque mot, de sa variance spcifique (variance non explique
par les facteurs communs) dont le complment 1 est la variance commune
(appele parfois communaut).

Tableau 2.11 : Mots ayant les variances communes


les plus fortes et les plus faibles
Communauts les plus fortes
Mot

Communauts les plus faibles

Spcificit Commun.

Mot

Spcificit Commun.

foi
dieu

0.332
0.362

0.668
0.638

justice
chasse

0.823
0.825

0.177
0.175

prtre

0.447

0.553

frontire

0.825

0.175

recueillement

0.480

0.520

dtachement

0.828

0.172

sacr

0.491

0.509

nager

0.829

0.171

puissance

0.525

0.475

interdire

0.832

0.168

discipline

0.538

0.462

mtallique

0.836

0.164

efficace

0.538

0.462

changement

0.839

0.161

sensuel

0.559

0.441

jeu

0.849

0.151

richesse

0.562

0.438

inconnu

0.853

0.147

argent

0.568

0.432

nud

0.854

0.146

gloire

0.571

0.429

vasion

0.856

0.144

or

0.585

0.415

noir

0.866

0.134

posie

0.587

0.413

acharnement

0.870

0.130

sduire

0.588

0.412

guerre

0.891

0.109

arbre

0.592

0.408

trahir

0.893

0.107

me

0.593

0.407

immobile

0.914

0.086

lgance

0.595

0.405

rouge

0.925

0.075

Le tableau 2.11 donne la liste des 18 mots dont les notes sont les mieux
expliques par les facteurs communs (mots ayant les communauts les plus
fortes) et des 18 mots dont les notes sont les moins bien expliques par les
facteurs communs (mots ayant les spcificits les plus fortes)1.

1. Un rsultat assez similaire pourrait tre trouv en sommant, pour les six premiers axes, les
carrs des coordonnes des mots sur les axes, qui sont dailleurs les corrlations des mots avec ces
axes (tableau A2.3 de lannexe 2). Ces sommes reprsentent, trs approximativement, les
communauts, alors que leur complment 1 reprsente les spcificits. Il ne sagit ici que dune
approximation car les vraies communauts de lanalyse factorielle en facteurs communs et
spcifiques sobtiennent par un processus itratif (annexe A1.6).

La Smiomtrie

71

On retrouve dans la premire colonne les mots bien expliqus par


lensemble des premiers axes de la smiomtrie, et dans la seconde des
mots qui sont peu ou mal expliqus par ces premiers axes.

2.7 Conclusion
Une fois dfinie la liste de mots et le protocole denqute (le
questionnaire et le libell de la question de base), la structure extraite du
tableau de donnes recueillies apparat stable. Cette structure, forme de six
directions principales ordonnes, ne change pas dun chantillon un autre,
dune anne une autre, ne subit pas de modifications (ou subit des
modifications minimes) dun pays un autre et ce malgr les risques pris
lors des traductions du questionnaire.
La structure smiomtrique se retrouve et se rpte lintrieur de souspopulations particulires (sexe, classes dge) suggrant un phnomne
fractal, mais il ne sagit ce stade que dune analogie.
Cette stabilit est galement confirme par les preuves statistiques
standards de rchantillonnage (bootstrap) qui confirment les expriences
plus empiriques prcdentes. Une preuve non standard (bootstrap sur
variables) fut une premire tentative dvaluation du degr de dpendance
de la structure obtenue vis--vis de la composition de la liste de mots.
Le codage numrique choisi pour les rponses peut-tre dclin suivant
plusieurs fonctions sans altration de la structure, ce qui lve lhypothque
dune sensibilit des corrlations au codage somme toute conventionnel de
dpart.
Enfin, lanalyse factorielle classique, ou analyse en facteurs communs et
spcifiques, reproduit les mmes premires dimensions, comme dailleurs
lanalyse logarithmique voque plus loin au chapitre 5. Il ne sagit plus
exactement de stabilit, mais de prsomption de robustesse de la structure
smiomtrique.
Les chapitres 3 et 4 qui vont suivre vont relater plusieurs expriences
apportant dautres lments de rponse la question beaucoup plus
complexe et ambitieuse de lventuel caractre intrinsque de la structure.

CHAPITRE 3
Structures smantiques et smiomtrie
La stabilit mise en vidence au chapitre prcdent suscite une srie de
questions, relatives aussi bien la nature qu lorigine mme des traits
structuraux.
Une des questions, fondamentale, concerne le rle et limportance des
relations de type purement smantique dans la structure smiomtrique.
Plusieurs travaux ont t raliss pour tenter de rpondre cette question.
Les relations smantiques ne sont certes pas faciles dfinir ni mesurer, et
dans la discipline connue sous le nom de Traitement du Langage Naturel1,
les questions qui touchent la smantique restent parmi les plus ardues.
En admettant que lon puisse vaincre ces difficults, il subsiste
linterrogation suivante : les proximits smantiques entre mots ne sont-elles
pas responsables de lessentiel de la structure observe ? Autrement dit, de
faon un peu sommaire, la structure que lon observe est-elle une structure
linguistique plutt que psychologique ou psycho-sociologique ?
Deux mots ayant des sens voisins seraient nots de faon similaire et donc
corrls, et le pattern observ ne serait autre que le rseau de ces liens
smantiques.
La stabilit de la structure en dcoulerait, puisque la langue est
relativement stable dans le temps. Elle est aussi pratiquement la mme pour

1. Discipline do sont drivs les produits usuels que sont les correcteurs dorthographe, les
logiciels de traduction, les moteurs de recherche documentaire.

74

Structure smantique et smiomtrie

les diffrentes classes dge, le sexe, etc.. Un tel rseau smantique doit aussi
rsister - plus ou moins - une traduction du questionnaire, do la relative
stabilit observe dun pays un autre1.
Pour apporter des lments de rponse ces interrogations, le prsent
chapitre relate trois sries de travaux, formant autant de parties.
La premire partie, intitule Les champs smantiques internes montre
comment les rponses au questionnaire smiomtrique et les corrlations
entre mots calcules partir de ces rponses dcrivent effectivement, et
assez finement, des liens de nature smantique. Ce rsultat ntait pas
vident a priori, car, ne loublions pas, les questions poses ne portent que
sur le caractre agrable ou dsagrable des mots de la liste.
La deuxime partie intitule Voisinage smantique du questionnaire
smiomtrique , est dvolue lexprience suivante : les 210 mots de la
smiomtrie vont tre dcrits par leurs synonymes, ou au moins par leurs
voisins smantiques, ceux-ci tant fournis par un dictionnaire de synonymes.
Autrement dit, plus de questionnaire faire remplir par un chantillon
reprsentatif cest la langue elle-mme qui rpond, travers certains des
outils qui ont t forgs pour la dcrire et la comprendre. Bien sr, les
dictionnaires de synonymes ne sont pas des instruments parfaits, et ils
diffrent notablement entre eux. Lexprience sera dailleurs loccasion de
voir ltendue des difficults qui nous attendent.
La troisime partie intitule Rseau smantique des verbes franais ,
relate une exprience beaucoup plus gnrale qui a consist prendre tous
les verbes de la langue franaise (en fait les 829 verbes les plus usuels
figurant dans le manuel classique de grammaire Bescherelle, parmi lesquels
se trouvent dj de nombreux verbes trs peu usits, voire quasi-inconnus) et
tudier la structure smantique de ces verbes partir de leurs voisins.
Cette exprience confirmera quil existe des proximits locales
smantiques, mais quil nexiste pas daxes principaux dominants et stables.

1. Disons demble, en anticipant sur les rsultats prsents dans ce chapitre, que la structure
smiomtrique ne se rduit que trs partiellement une structure smantique. Au niveau local,
autour dun point reprsentant un mot, on pourra trouver des voisins smantiques, mais les grandes
oppositions responsables daxes stables ne sont pas observes spontanment partir danalyses de
simples proximits smantiques.

La Smiomtrie

75

3.1 Les champs smantiques internes


On appellera champ smantique interne pour un mot donn lensemble
des mots (pris dans une liste de mots fixe a priori, do le qualificatif
dinterne) qui lui sont corrls. La distance utilise est dautant plus petite
que le coefficient de corrlation entre les deux mots est lev1. Cette
dnomination est justifie par linterprtation a posteriori des proximits
observes. Il ntait pas vident que des notes fondes seulement sur
lagrment ou le dsagrment engendrent des proximits smantiques. Cette
section montre la cohrence et la finesse des proximits observes.
Certains mots possdent un champ smantique interne riche et dense
dfini par des corrlations leves avec de nombreux autres mots de la liste.
Cest le cas pour les mots Efficace et Courage. Des mots comme Montagne,
Voluptueux, Mystre, proches dun petit nombre de mots, ont chacun un
champ plus restreint.
Un mme mot peut bien videmment, dans certaines limites, tre corrl
avec des mots non corrls entre eux. Cest ainsi que les champs
smantiques de Courage et Efficace ne sont pas les mmes malgr leur forte
corrlation et lappartenance de certains mots comme Robuste et
Dynamique aux deux champs.
Champ smantique du mot Efficace
Prcision (.51)2, Concret (.40), Robuste (.40), Courage (.39), Astucieux
Matriser (.38), Dynamique (.37), Raison (.37), Confiance (.35), Produire
Utilitaire (.35), Certitude (.34), Honnte (.34), Volontaire (.34), Construire
Logique (.32), Rcompense (.32), Rflchir (.32), Respect (.32), Btisseur
Fermet (.31), Honneur (.31), Douceur (.30).

(.38),
(.35),
(.33),
(.31),

Champ smantique du mot Courage


Honnte. (.41), Dynamique (.40), Respect (.40), Efficace (.39), Confiance (.38),
Honneur (.38), Elgance (.36), Politesse (.36), Amiti (.35), Gurir (.35), Robuste
(.35), Charitable (.34), Prcision (.33), Volontaire (.33), Douceur (.32), Protger
(.32), Puret (.32), Raison (.32), Gaiet (.31), Rcompense (.31), Certitude (.30).

1. Le carr de la distance entre deux mots a et b dont le coefficient de corrlation vaut r(a,b)
scrit d2(a,b) = (1 - r(a,b)).
2. Les quantits entre parenthses sont les coefficients de corrlation avec le mot en caractres
gras qui prcde. Notons que tous les coefficients de corrlation cits sont hautement significatifs
statistiquement compte tenu de la taille de lchantillon (11 055).

76

Structure smantique et smiomtrie

Champ smantique du mot Voluptueux


Sensuel (.47), Charnel (.45), Dsir (.34), Moelleux (.34), Nudit (.32), Sduire
(.31), Souplesse (.31), Sublime (.30), Fminin (.25), Rver (.24), Astucieux (.23),
Audace (.23), Douceur (.23), Intime (.23), Peau (.23), Caresse (.22), Lgret
(.22), Original (.22), Art (.20), Elgance (.20), Viril (.20).

Champ smantique du mot Montagne


Sommet (.47), Escalader (.34), Campagne (.33), Fleuve (.32), Arbre (.31),
Ocan (.31), Ile (.26), Lune (.26), Fleur (.24), Musique (.23), Eau (.22), Animal
(.21), Bleu (.21), Construire (.21), Nid (.21), Douceur (.20).

Champ smantique du mot Mystre


Orage (.26), Magie (.25), Aventurier (.24), Emotion (.24), Original (.24),
Secret (.24), Sauvage (.23), Infini (.22), Feu (.21), Ocan (.20).

Champ smantique du mot Dieu


Foi (.74), Prtre (.65), Recueillement (.60), Sacr (.55), Ame (.48), Crateur
(.33), Patrie (.32), Pardon (.29), Charitable (.27), Morale (.27), Hros (.26),
Honneur (.26), Noble (.26), Crmonie (.25), Eternel (.25), Tradition (.25),
Mariage (.23), Souverain (.22), Famille (.21), Puret (.21), Discipline (.20), Elite
(.20).

Ce premier cadrage dun espace des mots, par la constitution de quelques


champs smantiques internes, peut se gnraliser lensemble des mots du
questionnaire. On utilise pour cela les mthodes de classification qui
consistent effectuer une partition de lensemble des lments classer
cest--dire les mots. Cependant, dans ce cas, un mot ne peut appartenir
plusieurs champs.
3.1.1 Reprsentation hirarchique des proximits smantique
Les mots qui se ressemblent le plus quant leur manire dtre nots et
donc ressentis vont tre regroups maintenant de faon automatique. La
mthode danalyse en composantes principales prsente au premier
chapitre ralise une telle reprsentation globale des corrlations, et donc des
proximits. Mais les deux mthodes de classification appliques ici,
classification hirarchique1 et cartes auto-organises de Kohonen2,
dcrivent peut-tre avec plus de finesse les proximits locales qui sont, nous
le verrons, les seules tre interprtables en termes smantiques.
Pour ce faire, on ralise dans un premier temps une classification
hirarchique sur les 210 mots munis des distances dfinies prcdemment.
1. Le principe des mthodes de classification hirarchique est brivement prsent en
annexe A1.7.
2. Le principe des cartes auto-organises est brivement prsent en annexe A1.8.

La Smiomtrie

77

Le principe de ce traitement (lalgorithme, en fait) est de regrouper les mots


deux par deux par agglomration progressive fournissant ainsi une
hirarchie de partitions des mots. Nous retenons ici les partitions embotes
en 12, 24 et 36 classes reprsentes par le tableau 3.1 qui schmatise le
dendrogramme de la hirarchie.
Les rsultats parlent deux-mmes. Les classes obtenues regroupent des
mots qui ne sont pas de vrais synonymes1, mais appartiennent au mme
halo smantique.
Examinons, par exemple, la partition en 12 classes (la moins fine des
trois partitions) dont les classes sont repres dans la premire colonne du
tableau 3.1 par les symboles 1/12, 2/12, , 12/12.
Sont regroups au niveau de cette partition, les mots ayant trait au
concept de Sublimation (classe 1/12, Absolu, Immense, Infini, Admirer,
Adorer, , Secret, Sublime). Dautres classes correspondent des thmes
comme lart de lcriture (classe 3/12 : Art, Ecrire, livre, Posie, Thtre),
la nature (classe 4/12 ; Escalader, le, .., Sommet, Animal, ,Vert),
lmotion (classe 5/12 ; Emotion,, Rver, Humour,,Rouge, Bohme, ..,
Rvolte).
Notons, en passant, que lon retrouve dans la classe 28/36 le champ
smantique du mot Efficace ; le mot Courage nen fait pas partie et se
regroupe avec les mots Respect, Politesse, Honnte.
3.1.2 Reprsentation plane des proximits smantiques
La reprsentation des classes embotes du tableau 3.1 ne permet pas
dapprcier les distances relatives entre les groupements de mots obtenus
par la classification hirarchique. La carte de Kohonen (figure 3.1) est un
mode de visualisation de donnes qui regroupe les mots en classes en
conservant autant que faire se peut la topologie initiale de lespace des
mots. Elle rend compte ainsi des proximits entre classes qui se ressemblent
(cf. annexe A1.8).
Ainsi, les mots Thtre et Posie sont proches la fois des
regroupements Nid, Livre, Fleuve, Ecrire, Art , Vert, Sublime, Nager,
Musique, Montagne, Eau, Bleu , Sommet, Secret Lune, Immense ,
Justice , Recueillement, Crateur, Ame (cf. figure 3.1).

1. La liste de mots excluait a priori la prsence de synonymes qui auraient introduit des
redondances inutiles.

78

1/12
2/12
3/12
4/12

5/12

6/12

1/24
2/24
3/24
4/24
5/24
6/24
7/24
8/24
9/24
10/24
11/24
12/24

absolu, immense, infini


admirer, adorer, ternel, prcieux, secret, sublime
douceur, fminin, intime, moelleux, peau, souplesse
caresse, dsir, sduire
charnel, nudit, sensuel, voluptueux
art, crire, livre, posie, thtre
escalader, le, lune, montagne, ocan, sommet
animal, arbre, bleu, campagne, eau, fleur, fleuve, nager, nid, vert
motion, vasion, lgret, magie, original, rver
humour, jeu, musique, rouge
bohme, changement, diffrent, tranger, inconnu
acharnement, aventurier, dfi, ruse, vitesse
dsert, feu, mystre, noir, orage, sauvage
critiquer, dsordre, ironie, rvolte
guerre, trahir
angoisse,
cri,
danger,
dtachement,
doute,
faute,
labyrinthe,
mfiance, mort, rompre, vide, vieillir
armure, attaquer, chasse, fusil
immobile, masque, muraille, nud
frontire, interdire, mtallique, punir, rigide, sacrifice

Tableau 3.1 : Classification hirarchique en 12, 24 et 36 classes embotes (cf. annexe 1.7)
1/36
2/36
3/36
4/36
5/36
6/36
7/36
8/36
9/36
10/36
11/36
12/36
13/36
14/36
15/36
16/36
17/36
18/36
19/36

13/24

La Smiomtrie

7/12
14/24

20/36
21/36
22/36
23/36
24/36

19/24

18/24

17/24

16/24

30/36

29/36

28/36

27/36

26/36

25/36

20/24

15/24

21/24:

8/12

10/12
22/24

9/12

11/12
23/24

36/36

31/36
32/36
33/36
34/36
35/36

12/12
24/24

79

Tableau 3.1 (suite) : Classification hirarchique en 12, 24 et 36 classes embotes

bijou, lgance, minceur, mode, parfum


acheter, cadeau, confort, gratuit, maison, rcompense
ambition, conqurir, gloire, puissance, victoire
argent, hriter, or, proprit, richesse
noble, perfection, raffin
commander,
lite,
hros,
honneur,
patrie,
soldat,
souverain,
tradition, viril
commerce, industrie, matriel, produire, utilitaire
discipline, conomiser, fermet, loi, morale,
obir, rgle
astucieux, audace, certitude, concret, dynamique, efficace, logique,
matriser, prcision, raison, robuste, volontaire
effort, interroger, question, rflchir
btisseur,
chercheur,
construire,
cole,
enseigner,
inventeur,
science, travail
me, crateur, dieu, foi, prtre, recueillement, sacr
enfance, ensemble, fconder, maternel
crmonie, famille, mariage, naissance
courage, fidlit, honnte, politesse, respect
amiti, confiance, gaiet, gurir, paix, rire, tendresse
attachement,
charitable,
consoler,
humble,
justice,
modration,
modestie, pardon, patience, protger, prudence, puret, soigner

80

Structure smantique et smiomtrie

Figure 3.1 : Proximits entre mots dcrites par une carte de Kohonen

La Smiomtrie

81

La classe Recueillement, Crateur, me est elle-mme proche de


Modestie, Enseigner, Courage et Puret, Pardon, Charitable ,
Raffin, Mariage, Crmonie, Admirer , Sacr, Prtre, Foi, .
Les classes sont sans doute moins homognes et parfois moins
cohrentes que les partitions hirarchiques mais la reprsentation par la
carte auto-organise de Kohonen insiste davantage sur la cohrence entre
les classes.
Les cartes de Kohonen ont cependant linconvnient dtre plus instables
que les classifications ascendantes hirarchiques et sadressent davantage
des ensembles de donnes non structures. De fait, nous verrons au chapitre
suivant quelles sont mieux adaptes aux questionnaires ouverts qu
lanalyse de corpus de mots dj fortement structur.

3.2 Voisinage smantique du questionnaire smiomtrique


Dans cette premire exprience, chaque mot de la smiomtrie est dcrit
par ses synonymes , collationns partir dune source externe1. Le
tableau 3.2 nous donne un court extrait du recueil ainsi obtenu pour les
premiers mots de Absolu Angoisse. Comme on le voit, le nombre de voisins
smantiques est trs variable.
Ce nombre de voisins peut tre trs grand et peut atteindre 22 lignes de
texte pour le mot Changement qui ne figure pas dans lextrait du tableau 3.2,
ou trs court (voire inexistant, ainsi, ladjectif Maternel galement
extrieur au tableau 3.2 na pas de voisin smantique dans ce
dictionnaire).
A partir de ce nouveau recueil de textes est construit un tableau crois
contenant en lignes les 210 mots de base, et en colonnes tous les mots
rencontrs dans le recueil, cest--dire tous les voisins smantiques des 210
mots.
Le tableau, lintersection de la ligne i et de la colonne j contient la valeur
1 si le mot j figure parmi les voisins smantiques du mot i, et contient la
valeur 0 sinon.
Si certains mots ont des voisins smantiques communs, un calcul de
distance appropri les dsignera comme proches.

1. Synonymes et voisins smantiques ont t fournis par le Dictionnaire de synonymes et


contraires de Henri Bertaud du Chazaud, publi par Robert, 1994.

82

Structure smantique et smiomtrie

Tableau 3.2 :
Exemples de voisins smantiques des neuf premiers mots
Absolu
catgorique, complet, dirimant, discrtionnaire, dogmatique, entier, exclusif, foncier,
formel, impratif, imprieux, inconditionnel, indispensable, infini, parfait, plein, radical,
rdhibitoire, total, unilatral, autocratique, autoritaire, arbitraire, cassant, csarien,
despotique, dictatorial, dogmatique, exclusif, imprieux, intransigeant, jupitrien,
omnipotent, souverain, totalitaire, tyrannique, idal, infini, intgrit, intransigeance,
perfection, plnitude

Acharnement
ardeur, effort, nergie, persvrance, tnacit, cruaut, enttement, fureur, furie,
obstination, opinitret, rage, sadisme

Acheter
acqurir, corrompre, soudoyer

Admirer
apprcier, smerveiller, senthousiasmer, sextasier, louanger, louer

Adorer
aimer, bnir, glorifier, idoltrer, admirer, honorer, respecter, rvrer, vnrer, aduler,
courtiser, encenser, flagorner, flatter

Ambition
apptit, ardeur, aspiration, brigue, convoitise, dsir, faim, fringale, idal, passion,
prtention, qute, recherche, soif, arrivisme, mgalomanie, but, dessein, fin, mobile,
objet, rve, vise, vue

Ame
cur, conscience, dedans, esprit, fond, intrieur, mystre, pense, principe, secret,
spiritualit, transcendance, vie, air, ectoplasme, manation, essence, ther, tincelle, feu,
flamme, souffle, vapeur, motion, expression, intelligence, sensibilit, sentiment, agent,
animateur, centre, cerveau, chef, instigateur, matre, moteur, nud, organisateur, patron,
responsable

Amiti
accord, cordialit, entente, sympathie, amabilit, compliment, hommages, caresse,
flagornerie, flatterie, grimace, affection, affinit, amour, attachement, bont,
complaisance, dvotion, dvouement, dilection, douceur, inclination, inclination, intrt,
lien, penchant, pit, respect, sollicitude, tendresse, union, vnration, got, prdilection,
vocation, bienveillance, affabilit, altruisme, comprhension, convivialit, cordialit,
gentillesse, indulgence, mansutude, obligeance, prvenance, bont, charit, clmence,
compassion, gnrosit, indulgence, mansutude, misricorde, indulgence, piti,
serviabilit, socialit,

Angoisse
inquitude, anxit, apprhension, crainte, motion, ennui, malaise, peine, proccupation,
scrupule, souci, stress, supplice, tension, trac, transe, trouble, alarme, alerte, moi,
affolement, agitation, dsarroi, dtresse, effarement, effroi, pouvante, panique, peur,
terreur

La Smiomtrie

83

Selon une mthode dapplication courante pour les analyses statistiques de


texte, on peut donc construire un tableau des distances entre les mots, et
reprsenter graphiquement ces distances par des proximits entre points.
Le premier rsultat obtenu, dcevant, mais prvisible, est une sparation
entre les noms et les verbes qui ne peuvent pas tre synonymes, et assez
rarement voisins smantiques dans les dictionnaires usuels, alors que noms et
verbes figurent parmi les mots de la smiomtrie.
On procdera donc lanalyse des seuls noms et adjectifs, qui, au
nombre de 177, sont donc trs majoritaires dans la liste originale des 210
mots du questionnaire.
On nobserve plus des nuages de points rguliers et quilibrs comme
ceux des graphiques smiomtriques prsents dans les sections
prcdentes, mais des grappes de mots qui sopposent tous les autres.
Ce phnomne semble d la non-transitivit des similitudes
smantiques, et labsence de pertinence de la notion dloignement
smantique. La non-transitivit peut sexprimer de la faon suivante : si le
mot A a un sens voisin de celui du mot B, et si le mot B a un sens voisin de
celui du mot C, alors, A na pas forcment un sens voisin de celui du mot C.
On peut mme assez rapidement aboutir un antonyme de A1.
Lobservation des liens smantiques issus dun dictionnaire avec ceux
que lon peut driver des notes smiomtriques aide comprendre la nature
du fait statistique et de la structure que lon observe.
Tout dabord, il existe, parmi les 210 mots de la smiomtrie, des mots
qui nont pas de voisins smantiques communs avec les autres (en fait avec
plus de deux autres) comme par exemple les mots : Lune, Peau, Arbre,
Fusil, Ile, Thtre, Soldat. On comprend bien que pour Lune, par exemple,
ses synonymes (Artmis, Diane, Hcate, Phoeb, Sln2), trop particuliers,
ont peu de chance de se retrouver parmi les voisins, mme loigns, des
autres mots. De mme pour Fusil (carabine, lebel, mousqueton, arquebuse,
mousquet, tromblon).

1. Ainsi, abandonner est un voisin smantique de donner, voisin de partager, qui est lui-mme
un voisin de participer, son tour voisin de se joindre. On rencontre en gnral des chanes plus
longues, qui conduisent plus simplement une indiffrence smantique. Comme la squence
littrature posie musique vibration. Le premier et le dernier terme de la chane nont pas
ou peu - de rapports, sans pour autant avoir des sens contraires.
2. Bien que nappartenant pas au questionnaire smiomtrique, ces mots, tant des noms
propres, figurent avec une majuscule.

84

Structure smantique et smiomtrie

Les corrlations observes entre ces mots et les autres ne sont donc pas
des artefacts smantiques, elles relvent dun contexte perceptif plus
gnral.
Il existe, en revanche, des mots ou groupes de mots qui ont entre eux des
liens smantiques incontestables, lesquels vont se traduire simultanment
par des proximits sur les cartes smiomtriques et sur les graphes
smantiques1.
Ainsi, les mots Charnel, Sensuel, Voluptueux qui figurent dans le
questionnaire smiomtrique sont des voisins smantiques les uns des
autres, et ont plusieurs voisins smantiques en commun dans le dictionnaire
de synonymes que nous avons utilis (comme par exemple : animal, bestial,
rotique, lascif, libidineux, luxurieux). Il sagit cependant dune exception
dans le questionnaire. Il nexiste pas dautres groupes de trois mots aussi
proches smantiquement.
On pourrait alors objecter que cette redondance partielle (partielle car ces
mots ont malgr tout des sens clairement distincts) donne un poids excessif
aux notions sous-jacentes. Ce groupe de trois mots serait alors responsable
de certains des traits de structure observs et dcrits au chapitre prcdent.
Mais ce nest pas le cas : comme on le vrifie aisment, les axes de base
dont nous avons dcrit la stabilit ne sont pas modifis si lon supprime,
dans le fichier des notes, deux sur trois des mots incrimins.
Fait encore plus marquant, les six premiers axes sont conservs si lon
supprime de la liste lensemble des trois mots Charnel, Sensuel et
Voluptueux.
Le second axe, le plus corrl aux trois mots supprims, et donc le plus
susceptible dtre affect par cette suppression, est tonnament stable,
comme latteste le tableau 3.3, qui nous montre les mots les plus extrmes
sur laxe. Dans les deux cas, ces listes sopposent Patrie, Argent,
Proprit, Soldat, Rigide, Economiser, Obir, Discipline.
Ainsi, les proximits smantiques, particulirement importantes dans le
cas de ces trois mots, semblent jouer un rle secondaire dans
ltablissement de la structure stable sous-jacente.
Il existe aussi des couples de mots, comme Ironie et Humour, qui ont un
grand nombre de voisins smantiques communs (esprit, causticit, malice,
verve, spirituel, comique, drle, factieux, malicieux, piquant, satirique,
moquerie, saillie, satire) et qui sont donc trs proches smantiquement, que
1. Loutil retenu pour donner une apprciation visuelle agrable des graphes smantiques est de
nouveau la carte auto-organise de Kohonen. Cf. annexe A1.8 pour plus de dtails sur cette
mthode neuronale et la justification de son emploi dans ce contexte.

La Smiomtrie

85

la smiomtrie spare de faon significative. Ainsi, sur le troisime axe


Attachement / Dtachement , Ironie se situe du ct du Dtachement
et Humour , de celui de l Attachement .
Tableau 3.3 :

Liste des mots les plus corrls positivement avec


le deuxime axe
Avec 210 mots

Avec 207 mots

Art
Bohme
Livre
Original
Sensuel
Posie
Rvolte
Voluptueux
Orage
Sauvage
Ocan

Art
Bohme
Livre
Original
Posie
Orage
Thtre
Musique
Rvolte
Ocan
Sauvage

Autre exemple de proximit smantique non traduite par des proximits


smiomtriques : le mot Animal, dont on a vu quil figurait parmi les
voisins smantiques des mots Charne1l, Sensuel, Voluptueux ne leur est pas
voisin dans les plans smiomtriques. Il sen loigne notamment le long du
second axe ( Devoir /Plaisir ). Il faut cependant prciser quil y a ici
ambigut entre le substantif animal et ladjectif animal qui peuvent
incontestablement avoir des voisins smantiques diffrents. Le
questionnaire smiomtrique spcifie bien Un animal .
En conclusion de ce paragraphe, on retiendra que :
la structure smantique de la liste smiomtrique telle quelle est dcrite
(grossirement, il est vrai) par un dictionnaire de synonymes ne donne
pas lieu des axes (ou directions principales) stables.
localement, on retrouve des associations smantiques sur les cartes
smiomtriques, mais il existe aussi des exceptions notables.
les grandes oppositions stables observes dans le champ smiomtrique
ont un caractre psycho-sociologique, voire socio-dmographique
marqu (liens de certains axes avec le sexe, lge, la catgorie socio1

Le mot Charnel napparat pas dans le tableau 3.3 car il noccupe que le treizime rang sur le
deuxime axe.

86

Structure smantique et smiomtrie

professionnelle), et ne relvent pas ou peu du registre synonymieantonymie.

3.3 Un rseau smantique des verbes franais


Cette seconde exprience, contrairement la prcdente, est
indpendante du corpus de 210 mots. Cest lensemble des verbes franais
usuels (les 829 verbes les plus frquents figurant dans le manuel classique
de grammaire Bescherelle 1) qui est maintenant pris en considration.
La question pose est aussi beaucoup plus gnrale et ambitieuse : se
dgage-t-il une structure analogue celle observe lors des analyses
smiomtriques lorsque lon dcrit lensemble des distances smantiques
entre les verbes de la langue franaise ?
Chaque verbe sera encore dcrit par lensemble de ses synonymes, ce qui
va permettre de calculer des distances entre verbes, et donc dobserver la
structure induite par ces distances.
Pourquoi avoir choisi les verbes ? Parce que ceux-ci constituent un
ensemble beaucoup plus restreint et homogne que celui des noms ou des
adjectifs, et quil est donc possible dtre (quasi) exhaustif.
Les rsultats confirmeront ceux observs au paragraphe prcdent : la
structure smantique est essentiellement locale, et les grandes distances
smantiques ne donnent pas lieu des axes stables, ni des oppositions
interprtables.
Le corpus form par les verbes et leurs synonymes (analogue au texte du
tableau 3.2 ci-dessus, mais relatif cette fois 829 verbes) comporte 17 446
occurrences de mots (qui sont videmment tous des verbes).
Ce mme texte comporte 3 839 verbes distincts. Ce nombre est beaucoup
plus grand que les 829 verbes de dpart, car des verbes moins usits
peuvent figurer parmi les synonymes des verbes du Bescherelle. Le tableau
3.4 donne, titre dexemple, les synonymes retenus du verbe couper.
Deux verbes seront dautant plus proches quils auront beaucoup de
synonymes communs.
Evidemment, beaucoup de paires de verbes nauront aucun synonyme
commun, et les distances entre ces paires seront quivalentes.

1. Bescherelle, La conjugaison, Dictionnaire de 12 000 verbes, Hatier, Paris, 1990.

La Smiomtrie

87

Tableau 3.4 Synonymes du verbe couper


amputer, champlever, cisailler, coupailler, dbillarder, dcouper, diviser,
barber, laguer, entrecouper, hacher, inciser, massicoter, rsquer,
scarifier, sectionner, taillader, tailler, trancher, trononner, essoriller,
monder, sparer, supprimer, soustraire, censurer, exclure, chtrer, castrer,
chaponner, masculer, hongrer, traverser, franchir, mlanger, abattre,
scier, faucher.

Comme cela est habituel lors des analyses statistiques de textes, il est
ncessaire de faire intervenir un seuil de frquence minimale des mots.
Ne seront retenus ici dans un premier temps que les verbes apparaissant
au moins quatre fois dans le corpus form de lensemble des verbes et de
leurs synonymes. Ceci laisse 1 619 mots distincts, et rduit, dans une
proportion moindre, la taille du corpus global qui comporte maintenant
13 660 occurrences.
Cette frquence minimale de quatre laisse quand mme quelques verbes
relativement peu courants dans le corpus, tels que : contrister, lanciner,
transmuer, gourmander, conglutiner, pisser, dconfire, carguer, excaver,
ravauder, dsencombrer.
Le tableau 3.5 donne les verbes les plus frquents dans le corpus, en se
limitant maintenant, pour des questions dencombrement, aux verbes
apparaissant plus de 16 fois1.
Afin dobtenir rapidement une vue densemble du graphe smantique des
verbes de la langue franaise, on est finalement conduit procder une
analyse des correspondances (cf. annexe A1.4) dun tableau binaire ayant
1 619 lignes et 829 colonnes2.

1. Le tableau dans son intgralit est disponible auprs des auteurs.


2. Le terme situ lintersection de la ligne i et de la colonne j de ce tableau vaut 1 si le verbe i
est un des synonymes du verbe j, et vaut 0 sinon.

88

Structure smantique et smiomtrie

Tableau 3.5 : Extrait de la liste des verbes (classs ici par frquences
dcroissantes (de 50 17) du nombre de synonymes)
verbes

frequence

enlever
fixer
prendre
examiner
joindre
arrter
entraner
assembler
pousser
soutenir
abandonner
augmenter
atteindre
montrer
protger
maintenir
admettre
disposer
couper
couvrir
exposer
arranger
toucher
relever
gagner
appuyer
dcouvrir
agiter
dtruire
dgager
attacher
abattre
indiquer
saisir
observer
retenir
soustraire
craser
exciter
percevoir
tablir
associer
distinguer
runir
troubler

50
39
36
33
33
33
32
32
31
31
30
30
29
28
28
28
28
28
28
28
27
27
26
26
26
26
26
25
25
25
24
24
24
24
24
24
24
24
24
23
23
22
22
22
22

verbes

frequence

rgler
comprendre
conduire
encourager
assurer
lier
carter
cder
supprimer
diriger
trancher
garantir
dterminer
attirer
approuver
marquer
lever
dclarer
attaquer
retourner
former
dvelopper
renverser
unir
imaginer
apprcier
conclure
estimer
tenir
combiner
accorder
instruire
frapper
reprsenter
concevoir
reprendre
avancer
recueillir
animer
anantir
exprimer
donner
mener
rejeter
rapporter

22
22
22
22
22
22
22
22
22
22
21
21
21
21
21
21
21
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
19
19
19
19
19
19
19
19
19
18
18
18
18

verbes

frequence

organiser
incorporer
aider
entamer
accabler
apprendre
tendre
tirer
condamner
juger
signaler
remplir
transporter
communiquer
rassembler
emporter
percer
attraper
considrer
garder
ravir
loigner
renvoyer
discerner
assujettir
dire
mouvoir
diminuer
extraire
introduire
bouleverser
corriger
contraindre
exalter
valuer
ordonner
tudier
repousser
rapprocher
placer
remuer
scruter
dsigner
tourmenter

18
18
18
18
18
18
18
18
18
18
18
18
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17
17

Avec le seuil de frquence choisi de 4, le mme groupe de mots


(trpider, sagiter, trembler, grelotter, trembloter, frissonner, frmir)
soppose au groupe (crier, gmir, clamer, mander, confirmer, hurler,

La Smiomtrie

89

promettre, notifier, corroborer, certifier, tmoigner, narrer, relater,


proclamer, rciter) sur le premier axe, et au groupe (dmoraliser,
extnuer, ternir, lasser, massacrer, assombrir, abmer, dsesprer,
contrister, navrer, noircir, dsoler, dshonorer, corrompre, mchurer,
contaminer) sur le second axe.
En prenant un nouveau seuil de frquence minimale de 5 (on limine les
verbes ayant moins de cinq occurrences dans le corpus), il reste 1 265
verbes distincts dans un corpus form maintenant de 12 244 occurrences.
Avec ce nouveau seuil de cinq, cest le groupe de mots (dsirer, rver,
vouloir, esprer, ambitionner, souhaiter, songer, prier, se reprsenter,
supplier, implorer, demander) qui soppose deux nouveaux groupes sur
les deux premiers axes : le groupe moins homogne (manger,
dsesprer, mchurer, trembler, refroidir, dcourager, lasser, dprimer,
dmanteler, abmer, raser) sur le premier axe.
Le mme groupe de mots soppose au groupe (embrancher, agglutiner,
corrler, agrger, conjuguer, conjoindre, souder, jumeler, juxtaposer,
fusionner, raccorder, connecter, moiser, annexer, marier, braser) sur le
deuxime axe.
On pourrait encore incrmenter le seuil de frquence pour montrer que
lon continue obtenir des structures triangulaires (un groupe soppose
deux autres dans le premier plan factoriel engendr par les deux premiers
axes), et, de surcrot, des structures instables, puisque les groupes caractrisant les axes principaux changent lorsque le seuil de frquence minimale
change.
En fait, lanalyse gomtrique du nuage multidimensionnel de pointsverbes montre que ce nuage est presque sphrique1. Cette quasi-sphre
comporte la priphrie des grumeaux qui sont des amas de verbes
smantiquement voisins. Ces grumeaux crent les axes principaux au
gr de leur taille, qui dpend dailleurs du seuil de frquence minimale
choisi au dpart. On est donc trs loin de la structure elliptique du nuage de
mots de la smiomtrie2, avec ses axes principaux stables et
significativement distincts.
Pour des seuils de lordre de 12 18, cest dire pour des verbes
apparaissant de douze dix huit fois comme synonymes dautres verbes de
1. Cette sphricit se vrifie en particulier par la similitude des premire valeurs propres dont
les pourcentages de variance valent, pour les cinq premires : 0.77, 0.73, 0.69, 0.68, 0.66 (cas de
lanalyse avec le seuil 4).
2. Rappelons que la signification statistique des axes smiomtriques a t prouve par les
intervalles de confiance dAnderson, des rptitions dchantillons indpendants dans le temps et
dans lespace, et les mthodes de bootstrap, cf. chapitre 2.

90

Structure smantique et smiomtrie

la langue franaise1, on voit bien apparatre les groupements prcits, mais


les grandes oppositions observes sur les axes principaux sont dcevantes,
inattendues.
Ainsi, pour plusieurs de ces seuils, on voit apparatre, lextrmit dun
des axes, le groupe :
[conjoindre, annexer, marier, accoupler, allier, relier, rattacher,
rapprocher, rassembler, runir, associer, assembler, rallier, lier, mlanger,
joindre, enchaner, mler].
Mais ce groupe de verbes relativement homogne et assez li au ple
Attachement du troisime axe de la smiomtrie, soppose souvent au
regroupement :
[ rclamer, demander, souhaiter, requrir, aspirer, solliciter, explorer,
inspecter, sonder, scruter, fouiller, appeler, penser, estimer, considrer].
Il ne se retrouve jamais oppos au regroupement frquent pourtant plus
antonymique que le prcdent :
[dgager, sparer, distinguer, discerner, abandonner, carter, renvoyer,
rejeter, loigner, repousser].
En fait, la notion de synonymie telle quelle est traite dans les
dictionnaires ou les thsaurus nous loigne de lesprit du questionnaire
smiomtrique o il est demand si les mots prsents voquent des
sensations agrables ou dsagrables, et o le contexte mme du
questionnaire (liste de mots volontairement htroclite) et le temps imparti
sa compltion impliquent de prendre les mots suggrs dans un de leurs
sens les plus courants. Au contraire, un dictionnaire de synonymes sefforce
dtre exhaustif et de ne pas omettre les emplois secondaires,
mtaphoriques, familiers ou argotiques2.
Illustrons, en marge de ces analyses statistiques, ces difficults de la
notion dloignement smantique par une des rflexions de Gaston
Bachelard, reprise par Roland Barthes dans ses Mythologies, pour qui,
dune certaine faon, le vin est le contraire de leau 3. La distance est
ici plus axiologique que smantique, et leau pourra tre le contraire de la
1. Avec des seuils aussi levs, il nest pas question de voir apparatre les verbes rares absents
de la liste des 829 verbes de base de notre corpus.
2. Le lecteur aura peut-tre t surpris, lors de lanalyse prcdente avec le seuil 4, de voir le
verbe manger en compagnie de dmanteler, de raser cest que manger comporte aussi comme
synonyme dilapider, dissiper, gaspiller.
3. Bachelard a dj donn la psychanalyse substantielle de ce liquide (le vin) la fin de son
essai sur les rveries de la volont, montrant que le vin est suc de soleil et de terre, que son tat de
base est, non pas lhumide, mais le sec, et qu ce titre, la substance mythique qui lui est le plus
contraire, cest leau. (Roland Barthes, Mythologies, Seuil, 1957).

La Smiomtrie

91

scheresse pour un agriculteur, du froid pour un esquimau, du solide pour


un physicien, de la terre pour un marin, ou du vin pour le Franais moyen
de 1950 dont Barthes dcrypte avec humour les valeurs et les mythes qui
leurs sont associs.
Dans la mme veine, un simple proverbe comme le mieux est lennemi
du bien doit sa force lapidaire la remise en question lgrement
paradoxale de certaines proximits smantiques avres1.
A propos de lexprience sur lensemble des verbes franais et de sa
grande ambition : dcouvrir dans le rseau smantique de ces verbes une
structure stable qui aurait un rapport avec celle observe en smiomtrie, on
doit aussi constater, comme cela pouvait tre pressenti, que les verbes
porteurs de valeurs sont trs peu frquents dans lensemble des 829 verbes
retenus.
Par nature, le verbe est li laction, au mouvement, au temps, au
changement. Les verbes techniques ou descriptifs abondent et en quelque
sorte touffent, dans le cas de notre corpus de synonymes, les verbes plus
abstraits, affectifs ou relationnels (aimer, juger, connatre, soigner,
admirer, interdire).
Enfin, nous conclurons par une remarque qui concerne la fois les deux
expriences prcdentes : quil sagisse de noms, dadjectifs ou de verbes,
le rseau smantique nest pas homogne2.
Certains mots ont beaucoup de synonymes, dautres en ont peu, ou pas
du tout. Un mot qui na pas de synonyme nest pas moins important quun
autre. Cest le cas par exemple des verbes menacer ou voter, mais cest le
cas aussi du mot maternel. Il faudra, dans une phase de recherche ultrieure,
tendre les expriences prcdentes en utilisant des corpus faisant appel, au
del de la synonymie, des analogies, voire des dfinitions de
dictionnaire et des recueils de citations.

1. Beaucoup de clauses de style exploitent cette complexit topologique de lespace


smantique, qui, pour les statisticiens, plus prosaquement, est un espace que lon ne peut pas
munir facilement dune distance euclidienne.
2. En termes plus techniques, mais plus prcis, le graphe smantique est loin dtre un graphe
rgulier, ses sommets (les verbes) ont des degrs trs variables, certains sommets sont mme
isols.

CHAPITRE 4
Le choix spontan des mots
Ce chapitre tente de rpondre la question suivante : peut-on raliser une
sorte de smiomtrie ouverte, ou de smiomtrie spontane en demandant
directement aux personnes interroges de citer spontanment les mots qui
leur paraissent agrables ou dsagrables ?
Il ne sagit donc plus maintenant de compiler des dictionnaires de
synonymes comme au chapitre 3, mais de raliser une enqute spcifique
sur le terrain.
Lexprience a consist incorporer les deux questions ouvertes
suivantes dans une enqute par sondage auprs de la population gnrale :
Sans quon puisse expliquer pourquoi, peut-tre cause de ce quils
voquent, certains mots nous sont agrables, dautres dsagrables.
1. En ce qui vous concerne personnellement, quels sont les mots qui
vous sont le plus agrable ? (Citez le plus de mots possible).
2. Quels sont maintenant les mots qui vous sont le plus dsagrable ?
(Citez le plus de mots possible) .
Le principe de ce type de questionnement nest pas nouveau. Un
prcdent clbre concerne Albert Camus, qui on avait demand quels

94

Le choix spontan des mots

taient ses dix mots prfrs1. Les vocables agrable et dsagrable ont t
utiliss dessein ici dans le libell des questions pour rester le plus proche
possible de lesprit et de la formulation du questionnaire smiomtrique
(mais une enqute similaire portant sur des prfrences serait certainement
tout aussi intressante). Si lexercice nest pas nouveau dans son principe,
sa ralisation dans le cas dune enqute par sondage auprs dun chantillon
cens reprsenter la population gnrale est, notre connaissance, une
exprience nouvelle.

4.1 Mise en place de lexprience


On dispose des questionnaires de 1 191 rpondants2. Les rponses
correspondantes ont produit un texte artificiel long de 41 547 mots
(occurrences de mots, en fait) partir de 7 170 mots distincts cits.
Beaucoup de mots nont t cits quune fois, et donc ne jouent aucun
rle dans le calcul des distances entre rpondants.
Parmi les 7 170 mots distincts, il y en a 1 466, soit 20.4 %, qui sont cits
quatre fois ou plus. Si lon se restreint au texte artificiel form par ces 1 466
mots apparaissant au moins quatre fois, on obtient un texte de 33 950
occurrences, ce qui constitue 82 % du corpus initial (comme cest le cas
pour un texte courant, la distribution dissymtrique des frquences
dutilisation des mots permet de reconstituer une part notable du texte avec
un nombre restreint de mots).
Le tableau 4.1 donne, titre dexemple, les rponses des trois premiers
rpondants de lenqute (les mots prcds dun dise ( # ) sont les mots
cits comme dsagrables3). On retrouve, certes, parmi les mots cits, des
mots figurant dans le questionnaire smiomtrique, mais on trouve
videmment aussi beaucoup de mots consensuels , qui ont t limins,
par construction, de la liste des 210 mots.

1. Albert Camus, Carnets. Sa rponse fut : le monde, la douleur, la terre, la mre, les hommes,
le dsert, lhonneur, la misre, lt, la mer.
2. Lenqute a t ralise par la Sofres en 1995.
3. Certains mots, comme feu, argent, cigarette, pluie, ordre, peuvent figurer (pour des
individus diffrents) avec ou sans dise, cest--dire tre cits comme dsagrables par les uns, et
comme agrables par les autres. Il tait donc ncessaire de donner une codification particulire
lune des famille de mots. On a choisi daccoler un symbole particulier (#) aux mots considrs
comme dsagrables.

La Smiomtrie

95

Tableau 4.1 : Exemples de rponses libres


Rpondant 1:
doux mignon merveilleux charme plnitude enfant philosophie jardin plage animaux
chaud finesse soleil soie nature joie libert amie voyage gentillesse tendresse paisible
caresse srnit naturel sentiment amour musique vacances bonheur
#haine #mchancet #assoiff #vilain #dbecter #dsinvolture #serpent #nerf
#squelette #graisse #arnaque #trahison #ballonner #chrubin #vomir #solitude
#hypocrisie #hmoglobine #grosse #arrogance #ennemi #chagrin #dblatrer #vier
#entartrer #squestrer #salet #vicieux
Rpondant 2:
printemps soleil sant joie bonheur enfant voyage vacances argent maison crmonie
restaurant promenade ami fleur jardin beaut compagnie bricoler tricot loisirs magasin
fte visite dcouverte lecture mer montagne destine
#hiver #froid #neige #verglas #maladie #pollution #secte #drogue #solitude #inactivit
#laideur #mort #guerre #souffrance #pauvret #misre #corruption #attente
Rpondant 3:
amour fleur joie gentillesse tendre gaie aimable jolie souriant nature fort montagne
caresse beaut aide chocolat cerise lit sommeil pain vin femme enfant vie voyage famille
ami
#mchancet #tuerie #drame #hypocrite #goste #viol

Le tableau 4.2 donne la liste des mots apparaissant plus de 63 fois1. Les
quatre mots les plus frquemment cits sont absents du questionnaire
smiomtrique. Il sagit de trois mots cits comme agrables (amour, soleil,
vacances), et dun mot cit comme dsagrable ( #maladie).
Puis apparaissent les mots #guerre, #mort, amiti, enfant, famille, fleur,
figurant tous les six (Enfance2 pour enfant) dans le questionnaire
smiomtrique. Les trois mots suivants : bonheur, voyage, mer, en sont
absents (il y a bien Eau, Ocan, et Fleuve, dans le questionnaire
smiomtrique, mais pas : mer). Il y a videmment beaucoup de
redondances ou de relations dimplication dans les mots cits spontanment
comme (sant, #maladie, #cancer, #sida) ou encore (amiti, ami), (#mort,
#dcs), (#vol, #voleur), (#crime, #meurtre), (amour, aimer)3.
1. Ce seuil trs lev est encore ici choisi pour des raisons dencombrement. Le tableau est
disponible dans son intgralit auprs des auteurs.
2. Rappelons que les mots du questionnaire smiomtrique sont crits, par convention, en
italique avec majuscule.
3. Les mots prfrs dAlbert Camus apparaissent dans cet ordre de frquence : mer (286),
#douleur (104), #misre (99), t (91), mre (22), [#mre (1)], honneur (16), terre (14), dsert (11)
[#dsert (6)], homme (et non les hommes) (6) [#homme (2)], monde (1) [#monde (1)]. Ce
rapprochement avec les mots de Camus est certes anecdotique, mais il a cependant le mrite de

96

Le choix spontan des mots

Tableau 4.2 : Mots les plus frquents cits spontanment


mots
amour
soleil
vacances
#maladie
#guerre
#mort
amiti
enfant
famille
fleur
bonheur
voyage
mer
musique
#chmage
#accident
joie
nature
#violence
sant
tendresse
beaut
#mchancet
argent
#mensonge
libert
#racisme
#haine
paix
montagne
#cancer
rire
douceur
#froid
maison
sourire
fte
bb
travail

freq
731
628
498
475
439
421
379
366
358
328
305
292
286
277
265
263
258
209
191
189
184
180
173
171
167
167
165
165
156
156
156
153
151
148
147
145
143
141
137

mots
#pluie
fleurs
#drogue
#viol
printemps
gentillesse
jardin
vie
ami
promenade
#malheur
chaleur
naissance
#sida
#solitude
#noir
calme
#douleur
enfants
plaisir
#pauvret
chocolat
mariage
#misre
#pollution
repos
campagne
#impt
bleu
sport
#hpital
#divorce
#gosme
t
#hypocrisie
#injustice
#famine
#souffrance
#intolrance

freq
135
135
133
131
129
129
124
123
122
121
119
116
115
113
107
106
104
104
102
101
100
100
99
99
96
96
96
95
94
93
93
91
91
91
90
90
88
88
88

mots
fort
#bruit
#prison
animaux
manger
#peur
livre
#politique
#jalousie
lecture
eau
bonjour
tolrance
#tristesse
#secte
ciel
#pdophilie
#dcs
maman
lumire
plage
#vol
loisirs
beau
gentil
parfum
arbre
cinma
restaurant
chat
honntet
merci
#faim
#salet
#mchant
dormir
partage
#voleur
aimer

freq
88
87
86
85
83
83
82
82
82
80
80
80
78
78
77
76
75
75
72
71
71
70
69
69
68
68
67
67
67
67
65
64
64
64
64
64
63
63
63

On constate aussi que les substantifs constituent une crasante majorit


des mots cits ; les verbes et les adjectifs apparaissent dans cette liste
bien faire ressortir la vraie nature de notre questionnaire : il ne sagit pas de thmes de
proccupation, ni de concepts, ni de mots-cls renvoyant des problmes fondamentaux, mais
simplement de sensations, agrables ou dsagrables.

La Smiomtrie

97

dabord sous des formes ambigus ; rire (153) et sourire (145), sont
probablement cits la plupart du temps comme des substantifs et non
comme des verbes, compte tenu de leur contexte nous verrons que les
catgories grammaticales apparaissent souvent par squences dans une
mme rponse de mme que ami (122), plus souvent substantif
quadjectif. Les trois premiers adjectifs cits seraient alors #noir (106), bleu
(94), beau (69) (ce sont dailleurs aussi des substantifs), et les premiers
verbes cits manger (83), dormir (64), aimer (63).
On note galement des thmes plus conjoncturels ou lis lactualit
immdiate (#pdophilie, #impts (95), #drogue (133), #attentat (59), #secte
(77)) qui avaient t exclus a priori du questionnaire smiomtrique.
Une des constatations que lon peut faire en considrant lensemble du
corpus des rponses originales, et non seulement les mots les plus frquents,
est labsence totale de citation spontane de certains mots du questionnaire
smiomtrique ferm.
Pour cet chantillon de 1 191 rpondants, 173 mots (sur les 210 que
compte le questionnaire smiomtrique) sont cits spontanment comme
agrables ou dsagrables. Si lon ne retient que les 600 premiers
rpondants, seulement la moiti des mots du questionnaire smiomtrique
sont cits spontanment par les personnes interroges (certains dentre eux
peuvent cependant apparatre plus de 200 fois ce qui est le cas de : fleur,
guerre, mort, amiti). 1
Tableau 4.3 :
Les 37 mots du questionnaire smiomtrique non cits spontanment
absolu
acharnement
armure
astucieux
attachement
btisseur
crmonie
concret

conqurir
dfi
dtachement
lite
enseigner
escalader
fconder
fermet

humble
interroger
inventeur
labyrinthe
logique
magie
masque

modration
muraille
noeud
or
produire
question
recueillement

rflchir
rgle
rigide
robuste
sacr
utilitaire
viril

Cette exprience de citation spontane de mots dans une enqute


reprsentative est probablement assez originale, et l aptitude tre cit

1. Bien entendu, si lon accroissait la taille de lchantillon, on recueillerait de plus en plus de


mots distincts, et lon arriverait obtenir la liste exhaustive des mots du questionnaire. Toutefois,
comme cest le cas pour tout corpus de texte, le nombre de mots distincts du recueil de rponses
augmenterait beaucoup moins vite que le nombre total de leurs occurrences.

98

Le choix spontan des mots

spontanment de certains mots na pas t tudie, notre connaissance,


de faon systmatique. Il sagit, au moins en partie, de mots trs frquents
dans la langue courante, encore quil nexiste pas de corpus crits
permettant destimer ces frquences. Ce critre de frquence extrme na
pas t pris en considration pour composer la liste smiomtrique.
Il y a dans les rponses une concentration des frquences de mots
consensuels, et aussi une extrme dispersion sur les mots relativement rares
ou idiosyncratiques (par exemple : coquecigrue, chvrefeuille, abdomen,
Popocatepelt, clafoutis, candlabre) tenant parfois au caractre ludique de
lexercice de compltion dun tel questionnaire.
La probabilit de trouver des mots assez neutres (comme les mots du
questionnaire smiomtrique : enseigner, interroger, question, utilitaire) est
alors trs faible. Le nombre de mots qui napparaissent quune fois (ou :
hapax) dans ces rponses libres est considrable (4 266, pour 7 170 mots
distincts)1.
Le caractre ouvert des questions favorise la citation de synonymes, de
voisins smantiques (nappartenant pas forcment la liste smiomtrique)
ou de flexions dun mme mot (singulier pluriel, prsent infinitif,
masculin fminin, etc.). Il y a dispersion de la frquence sur les
synonymes et les flexions. Le synonyme le plus frquent cache alors les
autres. La frquence du premier est exagrment augmente, au dtriment
de celle des derniers2.
Les sections 4.2 et 4.3 qui suivent sont dvolues une premire
exploration du corpus de rponses. Puis la section 4.5 utilisera le fait quune
petite partie des rpondants avait rpondu au questionnaire smiomtrique
au cours de lanne prcdente pour tenter un rapprochement entre les deux
types de questionnaires.

1. Sur les problmes de distributions lexicales, cf. Muller (1977, 1979) ; il existe par ailleurs
une modlisation statistique des vnements rares applique au domaine lexicomtrique, cf. Efron
and Thisted (1976), Baayen (2000).
2. Le mot Armure prsent dans le questionnaire smiomtrique nest jamais cit spontanment
dans cet chantillon ; mais sont cites les formes graphiques suivantes de mme racine : #arme
(49), #armement (1), #armes (12), #arm (1), #arme (11). De mme ne sont jamais cits
spontanment les mots (absents aussi du questionnaire smiomtrique) cuirasse, bouclier, pe,
sabre, glaive, qui, comme Armure ou Muraille, voquent plus lhistoire ou la fiction quun danger
ou un dbat actuel. En revanche, on relve: #fusil (14), #bombe (34), #bombes (2), #canon (6),
#bombardement (3), #mitraillette (1), #mitrailleuse (1), #missile (1).

La Smiomtrie

99

4.2 Premires explorations des rponses


Les analyses qui suivent permettent de mieux comprendre la nature des
rponses ces questions ouvertes.
Comme dans les sections prcdentes, les tableaux croisant les mots et
les rponses sont dcrits en utilisant la technique danalyse des
correspondances, brivement prsentes en annexe A1.4. Lanalyse est
effectue dans un premier temps sur les mots cits comme agrables. Le
premier des tableaux analyss correspond au seuil de frquence minimale
quatre, cest--dire aux mots cits plus de quatre fois. Il a 1 191 lignes
(rpondants) et 592 colonnes (mots).
Le tableau 4.4 montre les mots caractristiques du premier axe principal
(ou factoriel) de ce tableau 1 191 lignes et 592 colonnes.
Tableau 4.4 : Mots extrmes sur le premier axe
(Analyse des rponses libres sur les mots agrables)
Partie gauche
dessin
-.48
copains
-.46
orage
-.44
horizon
-.44
concert
-.43
comte
-.41
lait
-.40
radio
-.40
plante
-.39
feu-de-bois
-.39
fille
-.39
train
-.39
farniente
-.39

Partie droite
polie
9.23
souriante
8.60
dynamique
7.81
courageux
7.03
serviable
6.58
adorable
5.35
gentille
5.23
propre
4.78
sincre
4.58
poli
4.55
juste
4.54
bonsoir
4.41
sociable
4.34

Fait remarquable, les mots de la colonne de droite (coordonnes


positives) sont beaucoup plus loigns de lorigine (prs de vingt fois pour
les premiers) que ceux de la colonne de gauche (coordonnes ngatives).
Dautre part, les mots de la colonne de droite sont assez homognes
smantiquement, alors que ceux de la colonne de gauche auraient pu
inspirer Jacques Prvert.
Lexplication du phnomne est simple, et rejoint les constatations faites
au cours des analyses du chapitre prcdent : la grosse masse des pointsmots est concentre autour de lorigine, et un petit sous-groupe (une
vingtaine de mots sur 592), parce quil est trs loign et form de mots
corrls, est seul responsable dun axe.

100

Le choix spontan des mots

On note, que, sur la droite de laxe, il ny a pratiquement que des


adjectifs, sopposant, gauche, la masse des substantifs, renvoyant
souvent des objets, des substances, des concepts matriels.
Les axes suivants mettent en exergue des petits groupes de mots, sans
quaucun axe ait une interprtation bipolaire. Il est clair, ici encore, quil
existe des regroupements privilgis, au niveau local, mais pas de
structuration globale de ces regroupements.
Pour prouver alors lhypothse selon laquelle la complexit structurelle
observe serait produite par les mots peu frquents, les analyses ont t
rptes en augmentant le seuil de frquence minimale.
En ne retenant que les 158 mots apparaissant plus de 25 fois dans le
corpus des rponses la premire question ouverte (mots agrables), on
amliore sensiblement la structure globale : les deux premiers axes restent
dfinis par trs peu de mots, mais ceux-ci ont le mrite dapparatre au
moins 25 fois, et donc les rsultats obtenus sont plus significatifs du point
de vue statistique.
Devant linsuffisance des mthodes factorielles pour dcrire les
structures de ce type1, on a de nouveau eu recours aux cartes de Kohonen,
qui, rappelons-le, fournissent une tentative de synthse entre une procdure
de classification et un plan factoriel (cf. annexe A1.8).
La figure 4.1 prsente une telle carte, dite carte auto-organise de
Kohonen . Il sagit donc dune description graphique des associations
entre mots apparaissant plus de 25 fois dans lensemble des rponses. Deux
mots appartenant une mme case sont souvent cits simultanment par la
mme personne. Ceci reste encore vrai, mais dans une moindre mesure,
sils sont situs dans des cases voisines. Si les cases sont trs loignes, les
mots correspondants sont, au contraire, rarement cits simultanment.
La premire constatation qui peut tre faite au vu de ce graphique a trait
une faiblesse du questionnaire spontan : le rle des associations dides
au moment du choix des mots. On observe de telles associations la simple
lecture des rponses brutes, mais la figure 4.1 confirme quil ne sagit pas
dun phnomne accidentel2.

1. Il sagit dans ce cas du manque de lisibilit imputables la surcharge des graphiques


(nombreux points superposs). Les analyses sont nanmoins intressantes.
2. Ce phnomne est encore plus visible avec un seuil plus bas, donc des mots moins frquents,
mais les cartes de Kohonen correspondantes sont alors trop encombrantes pour une publication de
format normal.

La Smiomtrie

101

Figure 4.1 : Carte de Kohonen reprsentant les associations entre mots dans
les rponses libres

Des regroupements comme (t, vacances), (papa, maman), (gteau,


chocolat), (pardon, merci, bonjour) peuvent en effet tre lindice dun
remplissage un peu automatique du questionnaire.
Voici trois exemples de rponses relles pour lesquelles ce type
dassociation est assez clair :

102

Le choix spontan des mots

aimable gentillesse agrable utile merci bonjour pardon excusez-moi


obissant
bonjour bonsoir merci pardon excusez-moi
bonjour merci sil vous plat pardon
On trouvera galement ci-dessous une rponse longue qui montre
comment les associations1 se sont progressivement formes au fil de la
rponse :
paysage campagne amiti bonheur intelligence sensibilit mesure
gard vieillard bb femme compagne mre pre enfant grand-mre
grand-pre oncle tante cousin herbe arbre rivire ruisseau ocan lune
toile aube crpuscule innocence .
Il est clair que le questionnaire ferm a le mrite dviter ces drives et
les surpondrations accidentelles de certains thmes. Cette tendance
lassociation des mots noncs conscutivement concerne aussi la catgorie
grammaticale des mots : on a vu que des adjectifs sopposaient des noms
sur le premier axe (tableau 4.4). Une liste qui commence par un adjectif (ou
un nom, ou un verbe) aura tendance se poursuivre avec des adjectifs (ou
des noms, ou des verbes).

4.3 Les axes principaux des rponses spontanes


En ne retenant que les mots apparaissant plus de 25 fois, on commence
apercevoir des dimensions stables qui se rapprochent de certains axes
smiomtriques.
Le plan principal plan (1, 2) de lanalyse ralise avec ce seuil de
frquence (analyse non reprsente ici) oppose la quasi-totalit des mots
deux petits conglomrats merci, pardon, bonjour dune part, et
agrable, gentil, aimable dautre part (structure triangulaire dj
voque au dbut de ce chapitre). Ce phnomne est bien visible sur la carte
de Kohonen (figure 4.1) qui concerne dailleurs le mme tableau (individus
mots). En effet, on trouve bien isoles dans le coin suprieur droit de la
figure 4.1 les trois formules de politesse prcdentes, entoures de cases
vides, et les autres mots voqus ( agrable, gentil, aimable ) dans le
coin infrieur gauche de la figure2.
1. Les mcanismes dassociations de mots ont t tudis, dans dautres contextes, par les
psychologues ; cf. notamment : Ferrand et Alario (1998).
2. Ceci permet de montrer en passant que les cartes de Kohonen ont un grand pouvoir de
compression, puisquon y lit des informations relatives plusieurs axes simultanment.

103

Figure 4.2 : Rponses spontanes : Plan principal (3, 4) - Proximits entre mots dans les rponses libres

104

Le choix spontan des mots

La figure 4.2 montre la disposition des mots dans le plan (3, 4), plan
engendr par les troisime et quatrime axes. On note dans ce plan
beaucoup de mots voquant des loisirs et des plaisirs sur la partie gauche de
laxe horizontal, (on verrait dailleurs le mot #travail , cest--dire le
rejet du travail, dans cette zone). Sur la partie droite, on peut lire des mots
tels que respect, politesse, galit, justice Voil une opposition
Devoir / Plaisir qui nest pas sans rappeler laxe 2 de la structure
smiomtrique obtenu ici sans faire appel une liste de mots. On verrait
de mme que laxe 4 (axe vertical de la figure 4.2) nest pas sans rapport
avec laxe 3 de la structure smiomtrique.
En conclusion de cette premire exploration des rponses aux deux
questions ouvertes, on doit relever le caractre extrmement bruit des
donnes recueillies de cette faon, par comparaison un recueil de notes
attribues une liste de mots identiques pour toutes les personnes
interroges. La distance entre individus va dpendre en fait du petit nombre
de mots quils peuvent avoir en commun, et les individus nayant aucun
mot en commun auront des distances indiffrencies. Lexistence de ce
bruit considrable nexclut pas de trouver des traits structuraux, mais la
taille actuelle de lchantillon limite la porte du travail sur donnes
individuelles.
On observe cependant des convergences qui laissent penser quune
structure apparente la structure smiomtrique peut apparatre
spontanment et indpendamment de tout questionnaire ferm.

4.4 Choix spontan et caractristiques des rpondants


Une technique utilise frquemment, dans le cadre du traitement
statistique des rponses aux questions ouvertes, consiste analyser non pas
les rponses elles-mmes, mais des tableaux de rponses regroupes, qui
sont moins sensibles aux importantes fluctuations individuelles. Les
rponses sont en effet trs bruites , mais on peut esprer trouver par
cette technique des rgularits indcelables directement partir des
rponses non agrges.
Des regroupements a priori des rpondants sont raliss partir de
quelques unes de leurs caractristiques disponibles. Ce sera loccasion de
voir que le sexe et lge, considrs isolment, ou mieux encore
simultanment, ne sont pas indpendants des mots cits comme agrables
ou dsagrables.

La Smiomtrie

105

La premire variable de base servant au regroupement des rponses sera


lge, pour lequel sont retenues deux catgories extrmes : les personnes
ges de moins de 30 ans et celles ges de plus de 55 ans (tableau 4.5).
Seuls sont pris en compte les mots agrables apparaissant au moins 16 fois.
Les mots caractristiques1 des jeunes (plaisir, manger, dormir,) et des
personnes plus ges (politesse, courage, fraternit,...) ne sont pas sans
rappeler les deux extrmits de laxe horizontal de la figure 4.2, axe assez
similaire laxe deux de la smiomtrie.
Tableau 4.5 : Mots caractristiques des ges extrmes
Mots spontans
caractristiques
Moins de 30 ans
1 plaisir
2 manger
3 dormir
4 clin
5 bb
6 repos
7 chocolat

Valeurs-test

Probabilits

4.00
3.78
3.48
2.63
2.37
2.29
2.22

.000
.000
.000
.004
.009
.011
.013

3.38
3.00
2.77
2.74
2.42
2.38
2.37
2.37
2.22

.000
.001
.003
.003
.008
.009
.009
.009
.013

Plus de 55 ans
1
2
3
4
5
6
7
8
9

politesse
courage
fraternit
voyage
merci
lecture
affection
propret
pardon

La seconde variable de base sera le sexe. Les mots les plus


caractristiques des hommes et des femmes figurent dans le tableau 4.6. Les
1. Ce sont les mots anormalement frquents dans la catgorie par rapport leur frquence
moyenne dans lensemble de lchantillon. La diffrence entre la frquence interne la catgorie
et la frquence globale est convertie en valeur-test, cest dire en variable normale centre rduite
dans lhypothse dindpendance des frquences (cf. annexe A1.9.1). La dernire colonne du
tableau 4.5 donne une information quivalente en termes de probabilits de dpassement
(information moins prcise mais peut-tre plus suggestive).

106

Le choix spontan des mots

valeurs-test, moins leves, montrent que le sexe est moins discriminant


que lge, lequel introduit une grande htrognit lintrieur mme de
chacun des deux groupes hommes et femmes.
Tableau 4.6 : Mots caractristiques des hommes et des femmes
Mots spontans
caractristiques

Valeurstest

Probabilits

Hommes
1
2
3
4

promenade
joie
courage
sport

2.82
2.41
2.30
2.25

.002
.008
.011
.012

3.32
2.53
2.20
2.09

.000
.006
.014
.018

Femmes
1
2
3
4

maman
chocolat
agrable
livre

Quatre nouvelles catgories de rpondants sont maintenant obtenues en


croisant le sexe avec deux classes dge : hommes de moins de 30 ans,
hommes de plus de 55 ans, femmes de moins de 30 ans, femmes de plus de
55 ans (tableau 4.7).
Les tableaux 4.6 et 4.7 ont alors peu de mots en commun : le croisement
ge-sexe est une variable plus pertinente que le sexe seul. Parmi les mots
communs aux deux tableaux, on note : courage pour les hommes, maman et
chocolat pour les femmes.
En revanche, les mots caractristiques des jeunes et des personnes plus
ges dans le tableau 4.5 caractrisaient en fait, soit les hommes, soit les
femmes, mais pas les deux. Ainsi, parmi les mots caractristiques des
jeunes, les mots plaisir, dormir, manger, caractrisent surtout les hommes,
et les mots clin, bb, chocolat, les femmes. Il tait donc important de
croiser les deux variables sexe et ge.
La taille de lchantillon ne permet cependant pas de prendre en compte
des croisements plus labors.
La figure 4.3 reprsente, sous forme de proximits graphiques, une
synthse des liens existant entre les six catgories (deux catgories proches

La Smiomtrie

107

ont des profils lexicaux communs) et entre les mots (deux mots proches ont
des profils socio-dmographiques similaires)1.
Tableau 4.7 : Mots caractristiques de quatre catgories sexe-ge
Mots spontans
caractristiques

Valeurs- Probatest
bilits

Homme moins de 30 ans


1
2
3
4

dormir
plaisir
manger
loisir

3.24
3.03
2.84
2.29

.001
.001
.002
.011

3.59
2.80
2.68
2.24

.000
.003
.004
.012

3.06
3.02
2.46
2.26
2.13
2.12

.001
.001
.007
.012
.016
.017

3.00
2.83
2.53
2.14

.001
.002
.006
.016

Homme plus de 55 ans


1
2
3
4

courage
fraternit
propret
sant

Femme moins de 30 ans


1
2
3
4
5
6

chocolat
bb
animaux
maman
clin
t

Femme plus de 50 ans


1
2
3
4

merci
affection
politesse
bonjour

La reprsentation obtenue confirme la complmentarit, on pourrait


presque dire ladditivit des effets de ces deux variables de base.
En effet, ces deux variables se dploient selon des directions
orthogonales, lge, horizontalement, opposant les catgories les plus ges
gauche, aux plus jeunes droite ; le sexe, selon une direction verticale,
1. Il sagit du premier plan principal dune analyse des correspondances de la table de
contingence (dite table lexicale) dont les lignes sont les mots apparaissant au moins 16 fois, et les
colonnes les six catgories sexe-ge, incluant, cette fois, la classe dge intermdiaire. Loutil de
description est le mme que celui de la figure 4.2, mais il sapplique maintenant des donnes
agrges, et non plus aux donnes individuelles.

108

Le choix spontan des mots

opposant les hommes, en bas, aux femmes, en haut. Fait remarquable, et qui
a pu chapper aux lecteurs peu familiers du fonctionnement de ces
mthodes de description : rien, dans les six colonnes du tableau dentre
soumis lanalyse, nindique quelles proviennent du croisement de deux
variables. La seule information qui dcide de la position des pointscolonnes sur le graphique est le profil lexical de ces colonnes, donc
lensemble des mots cits spontanment comme agrables par les catgories
correspondant ces colonnes.

Figure 4.3 : Citation spontane des mots selon le sexe et lge


(plan des deux premiers axes).

Finalement, cette figure est une synthse des rsultats lisibles sur les
tableaux 4.5, 4.6 et 4.7. Elle dcrit bien, dans le cadre dun continuum
nuanc, les oppositions entre sexes pour une classe dge donne, et
ltendue des variations lexicales internes chaque sexe, en fonction de
lge1.
Il reste apporter les lments de validation que nous fournissaient les
valeurs-test dans le cas des tableaux. Ce sont les ellipses de confiance

1. Rappelons que les axes 2 et 3 de la smiomtrie opposent respectivement, de la mme


manire, les hommes aux femmes et les jeunes aux personnes plus ges.

La Smiomtrie

109

bootstrap (dj utilises au chapitre deux, dans un cadre diffrent) qui nous
les fournissent1.
La figure 4.4 montre les ellipses de confiance des points-catgories
(petites ellipses dans la partie centrale du graphique) : il est clair que le
pattern observ est stable, malgr la taille modre de lchantillon.
Comme cela est toujours le cas pour ce type de tables lexicales, les ellipses
de confiance relatives aux mots sont beaucoup plus grandes (les ellipses
slectionnes titre dexemple concernent les mots politesse, propret,
livre, maman, chocolat, manger, dormir).

Figure 4.4 : Ellipses de confiance des catgories et de mots

Mais la grande taille de ces ellipses ne modifie pas foncirement


linterprtation des proximits observes. En bas droite du graphique, le
mot dormir reste caractristique des hommes jeunes, quelle que soit sa
place dans son ellipse de confiance, de mme, gauche, les mots propret
et politesse restent caractristiques des personnes ges, en haut, les mots
chocolat, livre et maman caractristiques des femmes.
En conclusion de cette section 4 consacre aux rapprochements entre les
mots cits spontanment et certaines caractristiques de base des
1. Sur les aspects techniques de la mthode, cf. annexe A1.4.

110

Le choix spontan des mots

rpondants, on prendra note de la richesse et de la cohrence du matriau


recueilli en laissant une libert totale de rponse aux personnes interroges.
Les rponses ont beau tre bruites, bigarres pourrait-on dire pour
certaines, leur regroupement fait apparatre des rgularits qui sont un
indice des potentialits de ce type de recueil.

4.5 Rapprochement entre smiomtrie et questions


ouvertes
Nous avons pu disposer des notes smiomtriques pour 335 personnes
parmi les 1 191 rpondants aux deux questions ouvertes invitant citer
spontanment des mots agrables ou dsagrables1.
La structure smiomtrique de ce groupe2, pourtant restreint, de 335
individus est bien conforme, au moins en ce qui concerne les quatre
premiers axes, celle prsente au chapitre I. Cela ne surprendrait pas outre
mesure si ce groupe avait t pris au hasard dans lchantillon du panel. Or
il sagit de personnes ayant accept de rpondre au questionnaire ouvert, et
lon aurait pu craindre quils ne constituent un chantillon biais.
Apparemment, il nen est rien.
Cela nous autorise rpondre la question suivante : quels sont les mots
cits spontanment qui caractrisent les premiers axes smiomtriques. Les
mots cits spontanment vont tre considrs comme des variables
nominales supplmentaires (au mme titre que le sexe ou lge) et seront
donc projets sur les axes principaux (cf. annexe A1.9.3).
On a vu que, sur la totalit du corpus des rponses aux questions
ouvertes, la moiti environ des mots du questionnaire smiomtrique
apparaissent au moins une fois. Mais une tude statistique de
rapprochement entre les deux questionnaires demande de ne retenir que les
mots cits avec une certaine frquence. Le rapprochement sera alors parfois
surprenant car peu de mots cits spontanment appartiendront au
questionnaire smiomtrique.
Alors que la position des mots de la smiomtrie sur les axes est
caractrise par leurs coefficients de corrlation avec les axes, la position
des mots cits spontanment projets comme des catgories
supplmentaires sur les mmes axes est caractrise par les valeurs-test qui

1. Ces 335 personnes appartiennent au panel do a t tir lchantillon de 1 191 personnes


qui avaient rpondu au questionnaire ouvert.
2. Structure issue de lanalyse en composantes principales du tableau de note (335 x 210).

La Smiomtrie

111

prennent en compte leffectif concern (nombre de personnes ayant cit le


mot) en convertissant la coordonne sur laxe en une variable normale
centre rduite1.
Le premier axe
Le premier axe qui est un axe mthodologique de participation
lenqute et que nous considrons comme extrieur aux structures
smiomtriques fait lobjet dun traitement particulier (chapitre 5).
La position des mots sur ce premier axe sera fort intressante dun point
de vue mthodologique. Cet axe oppose, en effet, les individus utilisant
pleinement lchelle propose pour les notes des individus qui nutilisent
que la partie centrale de lchelle.
Les mots les plus caractristiques des individus qui utilisent pleinement
lchelle des notes sont, pour lanalyse smiomtrique des 335 individus :
Courage, Politesse, Hros, Honneur, Protger, Robuste, Tradition,
Dynamique, Raffin, Elgance, Honnte, avec des coefficients de
corrlation avec laxe variant de 0.59 0.49.
Les mots caractrisant ceux qui nutilisent que la partie centrale de
lchelle sont : Trahir, Angoisse, Rvolte, Faute, Danger, Dsordre,
Mort, dont les coefficients de corrlation avec laxe, nettement plus
faibles, varient de 0.29 0.17.
Les mots cits spontanment caractrisant les individus qui utilisent
pleinement lchelle des notes sont, suivis de leurs valeurs-test entre
parenthses, confiance (2.9), aimer (2.8), bonjour (2.7), merci (2.4),
courtoisie (2.1), honnte (2.1). On retrouve bien les notions de politesse
et dhonntet. Notons galement, pour les mmes individus, les mots
considrs comme les plus dsagrables : #inceste (2.2), #assassin (2.1),
#pdophile (2.1). On ne pouvait videmment voir apparatre sur cet axe les
mots du questionnaire smiomtrique : Hros, Protger, Robuste,
Tradition, Raffin, Elgance, qui ne sont jamais cits spontanment comme
tant des mots agrables.
On a vu quil nexistait pas, partir du questionnaire smiomtrique, de
mots caractrisant fortement les rpondants occupant la partie positive de
laxe, cest--dire les rpondants utlisant la partie centrale de lchelle.
Lhypothse a t faite quil sagit de rpondants peu enclins se livrer, ou
encore ne jouant pas pleinement le jeu du questionnaire . Ces rpondants

1. Rappelons que la valeur de celle-ci sera approximativement comprise entre 2 et +2 si les


personnes ayant cit le mot sont rparties alatoirement sur laxe concern. (Voir annexe A1.9.1.)

112

Le choix spontan des mots

posent des problmes dans toutes les procdures denqutes par sondage.
Comme les abstentionnistes, dont ils constituent la frange encore
observable, ils sont le point faible ou la zone dombre de cet instrument
dobservation1.
On ne peut sattendre, non plus, voir citer comme agrables les mots
[Trahir, Angoisse, Rvolte, Faute, Danger, Dsordre, Mort]. De faon
dailleurs trs parlante, le mot le plus caractristique de ces rpondants est
#contrainte (considr donc ici comme un mot particulirement
dsagrable, avec une valeur-test de 3.7, qui est la plus leve de
lensemble des mots sur laxe). Puis viennent les mots vie (2.7), pluie (2.5),
ocan (2.5), intelligence ( 2.3), femme (2.2), et les mots dsagrables (outre
#contrainte dj cit) #tristesse (2.4), #araigne (2.3), #raciste (2.3),
#travail (2.2).
Il sagit par ailleurs de personnes plus jeunes, plus instruites, et ce sont le
plus souvent des hommes. On apprend maintenant quil sagit avant tout de
personnes qui rejettent les contraintes (traduction du fait statistique : qui
sont caractrises de faon trs significatives par la citation spontane du
mot contrainte comme mot dsagrable). Le rejet du mot travail (et
probablement des contraintes quil reprsente) va dans le mme sens. Les
mots vie, pluie, ocan, intelligence occupent galement des positions
significatives ( plus de 2.3 cart-types de ce que seraient leurs positions
dans lhypothse dune rpartition alatoire des rponses) mais
linterprtation est plus dlicate. Le mot pluie est intressant car il figure
beaucoup plus comme mot dsagrable (37 citations dans le souschantillon utilis ici) que comme mot agrable (seulement 5 citations).
Mais la position des personnes qui ont choisi pluie comme mot agrable
est suffisamment type sur ce premier axe pour que leur point moyen soit
significatif statistiquement. On peut regretter que la taille de lchantillon
de cette exprience ne permette pas de mieux caractriser ces rpondants,
qui semblent tre des personnes moins conventionnelles, plus
individualistes, mais qui acceptent pourtant de rpondre !

1. On dsigne parfois, non sans malaise, ces diffrences dattitudes sous le nom deffet
notation . On ne peut exclure un tel effet, mais le nommer ne rsout pas tous les problmes
mthodologiques poss par lattitude de la personne interroge par rapport au questionnaire et
lenqute (cf. chapitre 5).

La Smiomtrie

113

Les axes smiomtriques


Le tableau 4.8 donne les mots cits spontanment les plus
caractristiques des axes 2 4. Rappelons quil sagit des axes issus de
lanalyse en composantes principales des 210 mots de la smiomtrie, les
mots cits spontanment y tant projets a posteriori.
Les axes 5 et 6 ntant pas bien reconstitus sur notre petit chantillon de
335 rpondants, ils ne seront pas analyss ici. Les zones ombrages
correspondent des valeurs-test infrieures 2. Elles ne seront pas
interprtes, bien quelles fournissent un vivier de mots qui seraient peuttre candidats tre beaucoup plus significatifs statistiquement si
lchantillon tait plus grand.
Les mots en gras ont des valeurs-test suprieures ou gales 2.3, et
occupent donc des positions qui mritent dtre interprtes.
Laxe 2
La premire colonne de ce tableau concerne laxe 2,
conventionnellement dsign par axe Devoir / Plaisir dont on rappelle
quil oppose les mots : Discipline, Obir, Patrie, Morale, Soldat,
Economiser, Industrie, Prtre, Rgle aux mots : Sensuel, Rver,
Aventurier, Original, Ile, Nudit, Sauvage].
Les mots caractrisant la partie Devoir imposs dans le questionnaire
smiomtrique, ne sont pas cits spontanment comme mots agrables ; il
ne faut donc pas sattendre les retrouver dans les rponses notre question
ouverte.
On trouve en premier lieu ducation (2.7), heureux (2.4), gnreux (
2.3), union (2.3), qui sont, pourrait-on dire, les composantes agrables du
devoir (assez subtilement, heureux sopposera plaisir sur cet axe). En
revanche, la premire colonne contient beaucoup plus de mots significatifs
(ayant des valeurs-test suprieures ou gales 2.2) dans sa partie basse qui
correspond au demi-axe Plaisir .
Parmi les plus significatifs, on trouve #argent (donc citation du mot
comme dsagrable, avec une valeur test de 4.9), puis le mot plaisir (3.9),
qui nest pas un mot du questionnaire smiomtrique, mais qui a t choisi
pour caractriser laxe depuis pratiquement lorigine de la mthode, donc
bien avant cette exprience de questionnement ouvert. Puis on trouve les
mots musique, livre, sommeil, campagne, etc.. En tout plus de 28 mots cits
spontanment ont une valeur-test suprieure ou gale 2.2.

114

Le choix spontan des mots

Tableau 4.8 :
Projections sur les axes smiomtriques des mots cits spontanment
AXE 2

vtest

AXE 3

vtest

AXE 4

vtest

ducation
heureux
gnreux
union
propre
serviable
visite
merci
bonne-humeur
sagesse
sentiment
travail
avion
entraide
---------#arme
#racisme
bisou
dlice
verdure
chaleur
ocan
#pollution
couleur
clin
dsir
mari
toile
rire
vent
#obligation
bb
le
#intolrance
#violence
maman
#pdophile
campagne
sommeil
livre
musique
plaisir
#argent

-2,7
-2,4
-2,3
-2,3
-2,2
-2,2
-2,2
-2,1
-2
-2
-2
-2
-1,9
-1,9
---2,2
2,2
2,2
2,2
2,2
2,3
2,3
2,4
2,4
2,4
2,4
2,4
2,4
2,5
2,5
2,6
2,7
2,7
2,8
2,8
2,8
2,9
2,9
2,9
3,1
3,1
3,9
4,9

fille
randonne
rivire
#nazisme
#mpris
vent
#fatigue
#haine
manger
vitesse
affection
boire
farniente
pain
---------champagne
fte
runion
tlvision
vacances
amabilit
belle
#dsagrable
beau
mari
mignon
#divorce
jolie
russite
#tempte
agrable
bijou
t
#feu
anniversaire
cadeaux
chri
famille
mariage
naissance
aimable
gentillesse
#pluie

-3,4
-2,9
-2,8
-2,7
-2,4
-2,4
-2,3
-2,3
-2,2
-2,2
-2,1
-2,1
-2,1
-2,1
---1,8
1,8
1,8
1,8
1,8
1,9
1,9
2
2
2
2
2,1
2,1
2,1
2,2
2,2
2,2
2,2
2,3
2,3
2,3
2,4
2,4
2,4
2,8
3
3,1
3,2

grand-pre
#haine
grand-mre
paix
#alcoolisme
fraternit
travail
petits-enfants
#guerre
respect
rencontre
arbre
#drogue
vrit
---------dormir
manger
ocan
plaisir
sport
week-end
argent
belle
cheval
restaurant
soire
#angoisse
mignon
nourriture
#cauchemar
#chagrin
#payer
mariage
fille
joyeux
vacances
#obligation
gentillesse
chance
prairie
#facture
dsir
vitesse

-3,7
-3,1
-3
-3
-2,8
-2,8
-2,8
-2,7
-2,6
-2,6
-2,5
-2,4
-2,3
-2,3
---1,5
1,5
1,5
1,5
1,5
1,5
1,6
1,6
1,6
1,6
1,6
1,7
1,7
1,7
1,8
1,8
1,8
1,8
1,9
1,9
1,9
2
2
2,3
2,5
3
3,1
5,3

La Smiomtrie

115

En bref, les mots cits spontanment clairent linterprtation du premier


axe smiomtrique, et confirment celle du second.
Laxe 3
La seconde colonne du tableau 4.8 reprsente le positionnement des mots
le long du troisime axe smiomtrique, nomm conventionnellement axe
Attachement / Dtachement . Ici encore, les mots du Dtachement du
questionnaire smiomtrique (Danger, Mort, Rompre, Orage, Angoisse,
Vide, Punir) ont peu de chance dtre cits spontanment comme faisant
partie des mots les plus agrables.
On trouve, pour les individus situs du ct du Dtachement (qui
sont majoritairement des hommes, souvent jeunes), les mots cits
spontanment: fille (3.4), randonne (2.9), rivire (2.8), vent (2.4).
Cest un dtachement beaucoup moins inhumain et moins caricatural que
celui suggr par la smiomtrie, surtout si lon y ajoute manger, vitesse,
affection, boire, farniente, pain pour les mots agrables, et #nazisme,
#fatigue, #haine pour les mots cits comme dsagrables1.
Du ct de l Attachement (partie basse de la seconde colonne), en
revanche, on trouve des mots prsents dans le questionnaire smiomtrique
comme naissance (2.8), mariage (2.4), cadeau(x) (2.3), bijou (2.2). Les
mots les plus caractristiques sont #pluie (3.2) considr cette fois comme
mot dsagrable, et gentillesse (3.1).
Le questionnaire ouvert confirme bien, et enrichit, les interprtations de
la smiomtrie pour cet axe.
Laxe 4
Cet axe caractris par lopposition Esprit/Matire , dans sa partie
ngative ( Esprit ) contient parmi les mots cits spontanment grandpre, grand-mre, paix, fraternit, travail, petits-enfants, respect,
rencontre, arbre, vrit
On retrouve bien les mots arbre et paix qui sont communs avec ceux de
la smiomtrie. Le mot cit spontanment livre, on la vu, caractrisait
nettement la partie positive ( Plaisir ) de laxe 2, ct des mots plaisir et
musique. Lorsque le mot livre est cit spontanment comme un mot
agrable, il sagit bien du livre de loisir, et non du livre dcole ou
1. Rappelons encore une fois que les mots surnots en smiomtrie ne sont pas forcment des
mots bien nots, ce sont des mots qui obtiennent une note suprieure la moyenne (moyenne qui
peut tre trs basse, et quignore le rpondant, puisquelle est calcule a posteriori sur lensemble
des rponses).

116

Le choix spontan des mots

denseignement (ces deux derniers mots accompagnant livre sur laxe 4 de


la smiomtrie) . Alors que donner une note au mot Livre de la liste
smiomtrique, implique, peut-tre, une prise en compte de plus de facettes
smantiques du mot.
Grand-pre et grand-mre (comme petits-enfants) sont absents du
questionnaire smiomtrique, mais sont associs la paix et la srnit qui
caractrisent cet axe.
Du ct positif de laxe ( Matire ), le mot cit spontanment qui
caractrise le plus le demi axe : vitesse (avec la valeur-test exceptionnelle
de 5.3) est galement un des jalons smiomtriques de cette dimension,
comme dailleurs le second mot le plus caractristique : dsir (3.1)1.
Malgr la diffrence de nature des questionnements et la taille modeste
de cet chantillon, on observe donc une incontestable cohrence entre les
rponses aux deux types de questions fermes et ouvertes.

4.6 Conclusion
Ces expriences de questionnement ouvert sont riches denseignements.
Mentionnons seulement les trois principaux rsultats obtenus lissue de ce
recueil de donnes originales et du traitement statistique opr sur ce
recueil.
Le premier rsultat est quon ne peut obtenir, sur un chantillon de taille
modeste, une smiomtrie spontane par un questionnement ouvert du type
propos dans cette section, cest dire sans aucune contrainte. On obtient
bien des associations locales, schmatises par la carte de Kohonen de la
figure 4.1, des plans factoriels prsentant une parent assez marque avec
des plans de la smiomtrie (figure 4.2) mais pas toutes les dimensions
latentes stables et interprtables que rvle le questionnaire ferm.
Ce rsultat partiellement ngatif aide mieux comprendre quel peut tre
le rle dune liste de mots impose, identique pour chaque rpondant (ce
qui nexclut dailleurs pas de faire varier lordre des mots lintrieur de
cette liste de faon liminer un ventuel effet dordre).
La citation spontane induit une dispersion sans limite du vocabulaire,
rduisant de faon corrlative la signification des distances entre individus.
De plus, beaucoup de mots riches de sens et de valeurs ne sont, a priori, ni

1. Cette analyse de laxe 4 sera reue avec prudence compte tenu de la taille de lchantillon.

La Smiomtrie

117

agrables, ni dsagrables, et donc ont peu de chance dapparatre dans les


rponses spontanes. Notons aussi que les mots consensuels (amour,
vacances, etc.) lestent le recueil sans apporter une information dcisive.
Les rsultats suivants concernent ltude des rpondants au questionnaire
ouvert qui avaient aussi rpondu, antrieurement, au questionnaire
smiomtrique.
Le deuxime rsultat, qui est ici plus confirm que rvl, concerne le
rle des notes par opposition une simple mention de prsence ou
dabsence. La note permet de se rfrer une note moyenne pour chaque
mot, note moyenne qui nest pas connue des rpondants. On peut mal noter
un mot, et pourtant le noter au dessus dune note moyenne que lon ignore
au moment de linterview.
Ce traitement pourtant lmentaire permet de travailler exclusivement
sur des diffrences entre individus, et dobtenir des axes bipolaires ayant
des proprits de stabilit acceptables1. Ceci explique le caractre parfois
caricatural des axes smiomtriques.
Le troisime rsultat concerne la richesse du spontan comme
complment lillustration et linterprtation des axes smiomtriques.
Incapable de produire seule des axes bipolaires, le corpus des rponses aux
questions ouvertes permet dtoffer linterprtation des axes calculs
partir du questionnaire smiomtrique. Car, si la citation spontane ne peut
munir toutes les paires de rpondants dune distance opratoire (ainsi, par
exemple, toutes les paires dindividus nayant cit aucun mot commun sont
des distances comparables), elle permet de caractriser presque sans limite
ces individus2.
Il suffit, en effet, que quelques individus aient cit un mot pour que la
position de celui-ci puisse tre teste statistiquement sur les axes
smiomtriques.

1. Ainsi, pour laxe 3, Mort (note moyenne : 1.76), Angoisse (note moyenne : 1.84)
caractrisent les individus sur le demi-axe Dtachement , alors que Famille (note moyenne :
6.48) et Tendresse (note moyenne : 6.67) font partie des mots qui caractrisent le demi-axe
oppos, Attachement . Nous avons calcul ces notes moyennes sur lensemble des individus
partir de notes de 1 7. Il est clair dans ces conditions quun individu ayant mis la note 2 mort et
angoisse (donc au dessus de la moyenne des notes de ces mots) et 6 famille et tendresse (donc au
dessous des notes moyennes) pourra se trouver du ct Dtachement tout en ayant
lgitimement le sentiment davoir mal not les deux premiers mots et bien not les deux derniers.
2. En termes plus techniques, louvert fournit de mauvaises variables actives, mais
dinpuisables variables supplmentaires ou illustratives (cf. annexe A1.9.3).

118

Le choix spontan des mots

Ceci nous aura permis, par exemple, dhabiller de termes nuancs les
structures smiomtriques quelque peu austres du Devoir et du
Dtachement . Et aussi de mieux comprendre la nature du premier axe
qui fait lobjet du chapitre suivant.

CHAPITRE 5
Notations, participation, attitudes
Nous revenons, dans ce chapitre mthodologique, sur le premier axe
qualifi daxe de participation et de notation (chapitre 1), et exclu, au
cours des chapitres prcdents, de la structure smiomtrique proprement
dite. Il nous incombe en effet de rendre compte au lecteur des rsultats et
arguments ayant conduit donner un statut particulier cet axe. Ltude
des styles de notation et du degr de participation lenqute dbouche
naturellement sur le problme mal connu et souvent lud de la relation
entre, dune part lattitude par rapport une enqute et, dautre part, le
contenu et la qualit des rponses de cette enqute. Ce premier axe des
analyses smiomtriques est, on la vu, toujours stable et dominant1.
Ce chapitre confirmera lhypothse selon laquelle ce premier axe est
un axe que lon peut qualifier de mthodologique, cest--dire, en bref,
un axe qui ne concerne pas le contenu du questionnaire et qui est
beaucoup moins li que les axes suivants aux caractristiques sociodmographiques des personnes interroges.
Les spcialistes de traitements multidimensionnels de donnes
denqutes rencontrent souvent de tels axes, qui sont la plupart du temps
dominants en termes de variance explique.

1. Il reprsente toujours de lordre de 12% de la variance, alors que le second axe ne


dpasse que rarement 5%.

120

Notations, participation, attitudes

On parle parfois daxe de notation, daxe dattitude par rapport


lenqute, et, dans un contexte sensiblement diffrent (surtout en
biomtrie) de facteur de taille. Le premier axe des analyses
smiomtriques est tout cela la fois.
La richesse et ltendue de la base de donnes disponible a permis de
faire une tude approfondie de ce phnomne, et mme, ce faisant,
dapporter quelques contributions au problme gnral, souvent pineux
et pourtant crucial, de la participation des personnes interroges une
enqute.

5.1 Notation, participation et facteur de taille


5.1.1 Les effets notation
Certains effets notation sont connus et identifis lors de la ralisation
des tests psycho-sociologiques ou psychomtriques et des enqutes
dopinion et/ou de marketing. Le premier effet gnralement dcrit est
celui du niveau de notation. Il existerait - il existe des bons noteurs et
des mauvais noteurs1. Le second effet concerne lintervalle de notation :
certains individus utilisent tout lintervalle de notation propos (ici :
toutes les notes de 1 7)2, dautres nutilisent que la partie centrale de
lintervalle (par exemple les notes de 2 6, ou seulement les notes 3, 4,
5). La combinaison de ces deux effets produit des styles de notation
idiosyncrasiques conduisant une spcialisation sur des zones
particulires de lintervalle (par exemple les notes 1, 6, 7).
5.1.2 Les effets participation
Il sagit l dune notion fondamentale et trs drangeante pour les
statisticiens : cest une sorte de prolongement du refus dinterview
qui constitue probablement la plus grande menace vis--vis de la qualit
et de la prennit des systmes dinformation statistique en gnral, et
des enqutes par sondage en particulier. Est-on sr que le fait daccepter
de remplir un questionnaire (cette acceptation est en elle-mme
lorigine dun biais, mais sur lequel on ne sait que peu de choses)
1. Ou notateurs : les deux formes drives notateur et noteur existent ; nous avons choisi
dutiliser la plus courte.
2. Rappelons que les notes: 1, 2, 3, 4, 5, 6, 7, correspondent respectivement, au niveau du
questionnaire, aux notes: -3, -2, -1, 0, +1, +2, +3. Les deux codages sont quivalents pour les
calculs de corrlation et pour tous les traitements statistiques raliss.

La Smiomtrie

121

implique de la part de tous les rpondants une mme adhsion la rgle


du jeu, lesprit de lenqute ?1 Cette adhsion ne sera pas indpendante
des effets notation : un questionnaire truff de non-rponses ou de
rponses systmatiquement moyennes est finalement bien proche dun
refus dinterview. Cest mme un refus qui ne savoue pas, presque une
non-rponse sur le refus.
5.1.3 Les facteurs de taille
Il sagit l dun phnomne tout fait diffrent, parce que li la
composition mme du questionnaire, mais dans le cas de la smiomtrie,
il est indissolublement li aux effets notation. Les premires tudes sur
lanalyse factorielle au dbut du vingtime sicle ont concern des notes
des tests dintelligence ou des matires scolaires. Prenons ce dernier
exemple : le premier axe sera souvent le facteur gnral daptitude
baptis parfois, mais ce fut un sujet de dbat, intelligence (Spearman,
1904). de rares exceptions prs, toutes les notes sont corrles
positivement entre elles. Il y a, en premire approximation, de bons
lves et de mauvais lves. Les premiers ont des notes suprieures la
moyenne dans pratiquement toutes les matires, les seconds des notes
infrieures.
De faon beaucoup plus simple, si lon mesure la longueur et le
diamtre dufs de poules, on trouvera que ces deux mesures sont
corrles, car la principale source de variabilit est la taille de luf : le
premier axe principal va opposer les gros ufs aux petits ufs, do le
nom de facteur de taille. Le second axe principal, parfois dnomm
facteur de forme va au contraire montrer que, taille gale, les ufs
sont plus ou moins sphriques. Nous allons voir quun tel phnomne
vient se superposer aux effets notation dans le cas de la smiomtrie.

5.2 Cration et positionnement de variables de contrle


Chaque rpondant est, au dpart, caractris par ses 210 notes au
questionnaire smiomtrique et par ses rponses aux questions sociodmographiques (sexe, ge, etc.). partir des 210 notes, nous avons cr
de nouvelles variables techniques appeles variables de contrle.

1. En fait, on est sr du contraire, mais on a rarement notre disposition, dans les bases de
donnes recueillies, des lments pour le prouver ou lanalyser. De ce point de vue, les
diffrents fichiers smiomtriques disponibles et la nature gnraliste du questionnaire offrent
des circonstances favorables cette tude mthodologique.

122

Notations, participation, attitudes

Chaque individu est donc caractris galement par :


La somme de ses notes calcules sur lensemble des 210 mots (ou de
faon quivalente, sa note moyenne, qui sera note Note_moy)
Sept nouvelles variables qui sont : le nombre (not : Note_1) de notes
1 , le nombre (not : Note_2) de notes 2 , , le nombre (not :
Note_7) de notes 7 (la somme de ces 7 variables vaut 210,
nombre total de notes).
Deux variables drives des prcdentes qui sont les notes mdianes
regroupes, notes : Note_345 = Note_3 + Note_4 + Note_5, et les
notes fortes : Note_67 = Note_6 + Note_7.
Les statistiques de base de ces variables de contrle ont t calcules
sur un chantillon reprsentatif de 5 527 rpondants en France (cf.
tableau 5.1 pour les variables numriques).
On lit, par exemple, sur la premire ligne du tableau 5.1, que le
nombre de notes 1 utilises par un rpondant est en moyenne de 11.43
(ce qui reprsente 5.4 % des 210 notes). La colonne Min (minimum)
nous montre quil existe au moins un individu qui na jamais utilis la
note 1, puisque le minimum vaut 0. La colonne Max (maximum) nous
montre quil existe au moins un rpondant ayant utilis 89 fois la note 1,
et que personne na utilis cette note 1 plus souvent.
Tableau 5.1 : Statistique de base des variables de contrle
Moyenne

(%)

Minimum

Maximum

Note_1
11.43
( 5.4%)
Note_2
9.89
( 4.7%)
Note_3
15.51
( 7.4%)
Note_4
40.05
(19.1%)
Note_5
41.67
(19.8%)
Note_6
46.83
(22.3%)
Note_7
44.62
(21.2%)
(Total)(210.00) (100.0%)

0
0
0
0
0
0
0

89
69
78
146
124
139
148

Note_345 97.23
Note_67 91.45

0
0

188
156

(46.3%)
(43.5%)

___________________________

Note_Moy

4.95

2.39

6.21

Les trois premires notes sont moins employes que les notes 4 et 5,
elles mmes moins employes que les notes 6 (la plus frquente) et 7.

La Smiomtrie

123

La dernire ligne du tableau 5.1 est de nature trs diffrente, puisquil


ne sagit plus de comptages de notes par individu, mais de moyennes de
lensemble des notes donnes par un rpondant. On voit que la note
moyenne dcerne par un individu est de 4.95 (suprieure 4, moyenne
arithmtique des sept nombres 1 , 2 , 3 , 4 , 5 , 6 , 7) mais quelle peut
varier de 2.39, pour certains questionnaires, jusqu 6.211
Le tableau 5.2 montre, cette fois, les corrlations de ces variables de
contrle avec les six premiers axes smiomtriques tels que ceux-ci sont
calculs au cours des chapitres 1 et 2.
Au premier coup dil, on voit que les corrlations leves de toutes
ces variables (qui ne sont pas lies au contenu du questionnaire),
concernent principalement le premier axe (et, de faon bien moindre, le
troisime axe avec lequel la variable Note_1 a une corrlation de 0.48).
La variable de contrle note moyenne (rappelons quil sagit de la
moyenne des 210 notes attribues par chaque individu) est fortement
corrle (ngativement : -0.92) laxe 1, de mme que la frquence des
notes 6 et 7 (-0.91).
Tableau 5.2 :
Corrlations des variables de contrles avec les axes smiomtriques

Note_1
Note_2
Note_3
Note_4
Note_5
Note_6
Note_7
Note_345
Note_67
Note_moy

Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6


-.08
-.19
.48
-.13
-.16
.06
.31
-.07
.31
-.10
-.06
.20
.46
-.06
.12
-.03
.07
.14
.55
.17
-.01
.04
-.01
-.22
.41
.11
-.20
-.00
.07
.02
-.23
.11
-.15
.02
.02
.13
-.77
-.20
-.01
.02
-.01
-.02
.79
.18
-.09
.02
.06
-.11
-.91
-.12
-.11
.03
.00
.06
-.92
-.05
-.36
.10
.07
-.03

Toutefois, ces notes 6 et 7 ne sopposent pas sur cet axe aux notes 1
ou 2, comme on aurait pu le croire, mais lagrgat des notes 3, 4, et 5

1. Il ne faut pas confondre cette moyenne des notes pour un individu (calcules sur
lensemble des 210 notes attribues aux mots par cet individu) avec les moyennes des notes
donnes chacun des 210 mots (calcules sur lensemble des individus dun chantillon), qui
figurent en annexe A2.2. On apprend ainsi par exemple dans cette annexe que Guerre est le
mot le plus mal not en moyenne (1.26) suivi par Trahir (1.42), alors que Paix est le mot le
mieux not en moyenne (6.72), suivi de Tendresse (6.67).

124

Notations, participation, attitudes

(dont la corrlation de 0.79 avec le premier axe est la plus forte


corrlation positive).
Ainsi le premier axe, trs li aux frquences des notes les plus fortes
(6 et 7), et opposant celles-ci aux frquences des notes mdianes
(3, 4, 5), est la fois un facteur de taille et un facteur de notation.
Le fait que des individus choisissent de noter en nutilisant que la
partie centrale de lchelle (notes 3, 4, 5) alors que dautres nhsitent
pas utiliser des notes extrmes (7 ou 1) constitue le facteur notation. Le
fait que laxe 1 (et dans une moindre mesure laxe 3) soit fortement
corrl (en valeur absolue) avec la moyenne des notes constitue le
facteur de taille. Mais les notes extrmes ninterviennent pas de faon
quilibre, car les notes fortes sont beaucoup plus frquentes que les
notes faibles (les notes 6 et 7 reprsentent 43.5 % des notes attribues,
alors que les notes 1 et 2 ne reprsentent que 10.1 % de ces notes). Les
corrlations des variables de contrle avec laxe 1 (et laxe 3) montrent
que le facteur notation et le facteur de taille sont lis. Nous reviendrons
de faon dtaille sur ces liens complexes lors des sections 5.5 et 5.6.

5.3 Les notations dans quatre pays europens


Les variables de contrle qui caractrisent globalement la faon de
noter ont t calcules pour quatre pays (France, Espagne, Grande
Bretagne, Allemagne). Ce paragraphe montre que les faons de noter
sont minemment variables.
Tableau 5.3 : Styles de notation dans quatre pays europens.
Pays :

Espagne

France

note_1
note_2
note_3
note_4
note_5
note_6
note_7

14.71
9.67
14.89
33.31
39.72
44.17
53.32

11.43
9.89
15.51
40.05
41.67
46.83
44.62

Grande
Bretagne.
11.11
11.87
19.93
44.36
46.46
38.27
37.7

Allemagne

note_345
note_67

87.88
97.61

97.23
91.45

111.09
75.88

116.19
72.43

Taille dchantillon
Note_moy.

2984
5.0

5527
4.95

924
4.76

3066
4.73

10.07
11.21
22.49
43.01
50.4
40.15
32.4

La Smiomtrie

125

Leffet de ces styles de notation sur les structures smiomtriques est


cependant limit. Le tableau 5.3 donne un bilan gnralisant la premire
colonne du tableau 5.1.
On lit sur ce tableau 5.3, par exemple, que 14.71 est le nombre moyen
de notes 1 attribues par un rpondant espagnol, que 32.4 est le
nombre moyen de notes 7 attribues par un rpondant allemand.
Lordre des colonnes de ce tableau nest pas neutre : on a volontairement
class les pays par ordre de moyennes des notes dcroissantes (voir aussi
la figure 5.1, qui schmatise la dernire ligne du tableau 5.1) : lEspagne
est le pays qui donne en moyenne les notes les plus leves aux mots
(5.0), alors que lAllemagne donne les notes les plus faibles (4.73).

5.1
5
4.9
4.8
4.7
4.6
4.5
Espagne

France

Grande Allemagne
Bretagne

Figure 5.1 : Moyennes des notes donnes aux mots dans les quatre pays

On constate une opposition entre le Sud et le Nord de lEurope,


opposition souvent observe dans les enqutes internationales1.
- Noteurs frileux ou rsolus ?
La figure 5.2 illustre la varit de lventail des frquences de notes. Il
est clair par exemple que la barre de droite de lhistogramme, pour
chaque pays (cette barre correspond la note 7), dcrot rgulirement de
lEspagne lAllemagne, de mme que dcroissaient les notes
moyennes.
1. Ces diffrences entre notes moyennes sont statistiquement trs significatives pour tous
les couples de pays sauf pour le couple Grande Bretagne Allemagne (la taille de lchantillon
britannique ne permettant pas de conclure avec nettet). Pour la France, par exemple, lcarttype des notes moyennes (il sagit, rappelons-le, des moyennes calcules pour chaque individu
sur ses 210 notes) est de 0.38, la moyenne de ces notes moyennes tant de 4.95. Sur un
chantillon de 5527 rpondants, lintervalle de confiance au seuil de 5% de cette moyenne est
[4.94, 4.96]

126

Notations, participation, attitudes

note_1

note_2

note_3

note_4

note_5

note_6

note_7

60
50
40
30
20
10
0

Espagne

France

Grande Bretagne

Allemagne

Figure 5.2 : Bilan des frquences des sept notes par pays.

La figure 5.3, enfin, par les regroupements des notes 3, 4 et 5 dune


part, des notes 6 et 7 dautre part, met mieux en vidence les variations
transnationales de leffet notation : les pays du Nord de lEurope utilisant
beaucoup plus volontiers les notes intermdiaires, sans que lon puisse
vraiment dcider sil sagit de nuance dans la faon de noter, de
prudence, de mfiance, voire de dsintrt.
Dans tous les cas, nous avons affaire ici des diffrences culturelles
importantes, qui hypothquent la pertinence des comparaisons
internationales de niveaux ou de moyennes lintrieur mme de
lEurope, sous-continent qui reprsente pourtant un ensemble
relativement homogne lchelle mondiale (structure par ge, niveau
dducation, niveau de vie, etc.).
note_1

note_345

note_67

140
120
100
80
60
40
20
0
Espagne

France

Grande Bretagne

Allemagne

Figure 5.3 : Notes extrmes ( 1 et 6/7) et notes mdianes (3/4/5)

La Smiomtrie

127

Mais, curieusement peut-tre, ces effets notation ne parviennent pas


branler fortement la stabilit structurelle observe, qui dpend, elle, des
corrlations entre notes, et non du niveau des notes.

5.4 Typologie partir des seules variables de contrle


Pour approfondir cette tude sur le volet franais de lenqute, une
analyse de contrle va tre effectue. Il sagit dune nouvelle analyse
en axes principaux des individus. Ceux-ci ne seront plus caractriss par
leurs 210 notes, mais par les 7 variables de contrle, cest--dire par les
nombres de notes 1, 2, 7 quils ont donnes, sans se proccuper des
mots auxquels ils ont attribus ces notes.
Un des premiers sous-produits de cette analyse est la matrice des
corrlations des frquences des notes (tableau 5.4). Ces corrlations,
calcules sur 5 527 individus, sont toutes trs significatives
statistiquement ( deux exceptions prs : les valeurs 0.01 et -0.02)1.
Tableau 5.4 : Corrlation entre les frquences
de chacune des sept notes chez les rpondants
Note_1
Note_1
Note_2
Note_3
Note_4
Note_5
Note_6
Note_7

1.00
0.07
-0.22
-0.15
-0.49
-0.37
0.45

Note_2
1.00
0.31
-0.21
-0.02
0.17
-0.26

Note_3 Note_4

1.00
-0.24
0.46
0.01
-0.45

1.00
-0.11
-0.41
-0.34

Note_5 Note_6 Note_7

1.00
0.10
-0.65

1.00
-0.31

1.00

Les plus fortes corrlations positives concernent, dune part le nombre


de notes 5 et le nombre de notes 3 (0.46 : les personnes qui utilisent
beaucoup de notes 5 utilisent aussi beaucoup de notes 3, ce sont des
noteurs modrs), et, dautre part le nombre de notes 1 et le nombre de
notes 7 (0.45 : ce lien est dautant plus remarquable que la note 1 est,
selon le tableau 5.1, quatre fois moins frquente que la note 7 ; il sagit
ici de noteurs extrmes).
La plus forte corrlation ngative (-0.65) en valeur absolue concerne
la note 7 et la note 5, elle traduit une liaison ngative entre une note forte

1. Pour 5 527 individus, toute corrlation suprieure en valeur absolue la valeur 0.03 peut
tre considre comme significative au seuil 0.05.

128

Notations, participation, attitudes

et une note moyenne, cest--dire une opposition entre noteurs extrmes


et noteurs modrs.
Le premier axe principal de cette analyse de contrle , dduit de la
matrice de corrlation prcdente, est dcrit par le tableau 5.5, qui
contient les variables les plus caractristiques de laxe : des variables
actives (variables : Note_1, .Note_7 dfinies plus haut) et des variables
supplmentaires ou illustratives1 qui sont les notes composites
(Note_345, Note_67) et la moyenne individuelle des notes. Ce tableau
contient de plus les mots nots par les mmes 5 527 individus.
Le rsultat est assez spectaculaire si on garde en mmoire le fait que
les individus ont t caractriss par un simple bilan numrique des notes
donnes (les sept variables de contrle), sans se soucier des mots
auxquels ces notes ont t attribues.
Tableau 5.5 : Analyse des frquences des sept notes :
Description du premier axe de l analyse de contrle
Attention : les mots sont ici des variables supplmentaires
Variables les plus
corrles ngativement
au premier axe
Note_5
Note_3
Note_345
Note_6
Note_2
TRAHIR
ROMPRE
FAUTE
DESORDRE
PUNIR
ATTAQUER
ANGOISSE
CRITIQUER
DANGER
MURAILLE
DOUTE
VIDE

-.80
-.66
-.64
-.44
-.29
-.17
-.16
-.15
-.14
-.13
-.13
-.13
-.13
-.12
-.11
-.10
-.09

Variables les plus


corrles positivement
au premier axe
Note_7
Note_1
Note_67
Moyenne_des_notes
DOUCEUR
HONNETE
COURAGE
CONFIANCE
DYNAMIQUE
CONFORT
GAIETE
POLITESSE
RESPECT
PROTEGER
RECOMPENSE
TENDRESSE
AMITIE

.85
.68
.56
.42
.39
.36
.35
.35
.34
.34
.34
.34
.34
.34
.33
.31
.31

1. Voir annexe A1.9.3 pour quelques notions sur les lments supplmentaires : dans le cas
prsent de lanalyse en composantes principales, la coordonne dune variable supplmentaire
sur un axe est son coefficient de corrlation avec laxe, calcul sur lensemble des coordonnes
des individus sur laxe.

La Smiomtrie

129

Au niveau des variables actives, ce premier axe de contrle oppose


bien les nombres de notes extrmes (7 et 1) aux nombres de notes
moyennes (3, 4, 5).
Au niveau des variables supplmentaires, la moyenne des notes se
situe du ct des notes extrmes, et lagrgat des notes (3, 4, 5) du ct
des notes moyennes. Mais surtout, et cest l le fait le plus marquant, on
retrouve peu prs les mmes mots que ceux qui caractrisaient le
premier axe smiomtrique.
Si lon se rfre la description de ce premier axe (chapitre 1), on
trouve en commun, du ct positif, les onze premiers mots de la colonne
de droite du tableau 5.5. Du ct ngatif, on trouve sept mots communs
avec la colonne de gauche du mme tableau.
En ce sens, le premier axe smiomtrique mrite son nom daxe
mthodologique. Il nest pas ncessaire de disposer des 210 notes (cest-dire du tableau 5 527 x 210) pour le construire. Les sept variables de
contrle (tableau 5 527 x 7) suffisent.
Il reste maintenant comprendre pourquoi ces mots particuliers
caractrisent laxe.
Les noteurs dits modrs (les rpondants qui nutilisent que la
partie centrale de lchelle de notes) sont caractriss par des mots dont
la note moyenne est basse (colonne de gauche du tableau 5.5 ; voir le
tableau des notes moyennes des mots en annexe A2.2), et anticaractriss par des mots dont la note moyenne est forte (colonne de
droite du tableau 5.5). Il y a une premire raison simplement mcanique
cela : les variables mots sont centres par rapport la moyenne des
notes de chaque mot. Comme les noteurs modrs utilisent relativement
peu la partie basse de lchelle des notes, ils donnent des notes qui, une
fois centres, apparatront mcaniquement comme des notes leves1.
Mais si lon effectue un centrage des notes par individu, autrement dit si,
pour chaque rpondant, on retranche chaque note la moyenne de ses
210 notes (de faon ce que tous les rpondants aient mme note
moyenne), on obtient toujours la mme caractrisation du premier axe de
lanalyse de contrle par les mots figurant dans le tableau 5.5. Donc

1. Donnons encore un exemple de ce phnomne dj voqu au chapitre prcdent : Trahir


a une note moyenne de 1.42 sur lensemble des individus. Ceux qui donnent les notes 2 ou 3
Trahir se situent donc au dessus de la moyenne gnrale, et apparaissent donc comme ayant
relativement bien not ce mot. Le mot Douceur a, lui, une note moyenne de 6.37. Donc une
note 5 ou 6, cest--dire une bonne note pour un noteur modr, sera une mauvaise note par
rapport la moyenne.

130

Notations, participation, attitudes

leffet mcanique mentionn ne suffit pas expliquer pourquoi ces mots


caractrisent les deux styles de notation1. Nous reviendrons, plus bas, sur
cette procdure de centrage des notes par individu (section 5.7).

5.5 Quels rapports entre les notes donnes aux mots, la


faon de noter, et les caractristiques des individus ?
Les sections prcdentes ont montr que la moyenne des notes de
chaque individu (note Note_moy) tait fortement lie au premier axe
smiomtrique, et, dans une moindre mesure, au troisime axe. Nous
allons maintenant tudier de faon plus dtaille ces liaisons, tout
dabord partir de la nouvelle variable nominale 4 modalits notes
Moy1, Moy2, Moy3, Moy4, qui provient dune rpartition selon 4
classes des valeurs de la note moyenne Note_moy. Aprs consultation de
lhistogramme des notes moyennes, les 5 limites de classes choisies pour
cette rpartition sont : 1, 4.5, 4.95, 5.4, 7.
Le tableau 5.6 donne les valeurs-test2 de chacune des 4 modalits sur
les 5 premiers axes smiomtriques. On voit que le premier axe est
caractris par des valeurs-test exceptionnelles.
Tableau 5.6 : Importance de la moyenne individuelle des notes
Moyenne des notes
par individu
en 4 classes
Moy1
Moy2
Moy3
Moy4

moyenne_faible
moyenne_2
moyenne_3
moyenne_forte

Axes smiomtriques
Valeurs-test
axe 1 axe 2
41.9
28.8
-29.3
-39.9

axe 3

2.5 10.8
1.3 14.8
-1.7 -5.0
-1.9 -24.9

axe 4 axe 5
-3.0
-4.1
1.4
6.9

-2.0
-2.7
.3
5.5

1. On ne peut exclure lhypothse selon laquelle la faon de noter serait lie certains traits
psychologiques des rpondants, avec un effet sur le choix des mots, effet qui se superposerait
ce que nous avons dsign par effet mcanique. Le questionnaire smiomtrique lui-mme ne
permet pas de dissocier ces effets, mais le questionnaire ouvert complmentaire (section 5 du
chapitre 4) a donn lieu quelques rsultats en faveur de cette hypothse.
2. Rappelons que la valeur-test est une simple conversion de la coordonne sur laxe en une
quantit qui, dans lhypothse dindpendance (rpartition alatoire des individus de la
modalit concerne sur laxe) se comporte comme une variable normale centre rduite.
Autrement dit, si la modalit nest pas lie laxe (i.e. est forme dindividus rpartis de faon
alatoire sur laxe), la valeur-test doit tre (approximativement) comprise entre 2 et +2. Ce
paramtre permet donc de juger trs rapidement la signification statistique de la position dune
modalit sur un axe (cf. annexe A1.9.1).

La Smiomtrie

131

Le troisime axe se distingue galement, bien que lordre de grandeur


ne soit pas comparable. Lindpendance nest pas totale avec les autres
axes, mais la liaison est beaucoup plus faible.La figure 5.4, quant elle,
montre dans le plan des deux premiers axes smiomtriques, le
comportement des quatre modalits, notes Moy1_faible , Moy2 ,
Moy3 , Moy4_forte , par rapport celui dautres variables
nominales (croisement sexe-ge, croisement ge-ducation, croisement
sexe-ducation). On voit clairement que les modalits de la note
moyenne caractrisent le premier axe beaucoup plus que toute autre
variable socio-dmographique, et caractrisent peu le second axe,
contrairement toutes ces mmes variables. On retrouve dailleurs le
rsultat mentionn lors de la description de laxe 2 (chapitre 1) selon
lequel le deuxime axe oppose des personnes jeunes et instruites des
deux sexes des personnes plus ges1.

Figure 5.4 : Position des modalits de la moyenne des notes dans le plan (1,2)

La figure 5.5 montre que, contrairement au deuxime axe


smiomtrique, le troisime axe est li la moyenne des notes.
1. Sur les figures 5.4 et 5.5, les symboles -30 , 30-55 , +55 caractrisent les trois
classes dges, hom et fem les sexes, et moyen , lev , faible , les niveaux
dinstruction.

132

Notations, participation, attitudes

Figure 5.5 : Position des modalits de la somme des notes dans le plan (1,3)

Bien que trois fois moins important en termes de variance explique


que le premier axe (4.2 % contre 12 %) il est le seul axe, avec le premier,
tre nettement li cette moyenne. Cet axe 3 (vertical sur la figure 5.5)
qui oppose, on la vu au chapitre 1, des hommes (plutt instruits) des
femmes (plutt peu instruites), est quand mme beaucoup plus li aux
caractristiques socio-dmographiques que laxe 1.
Il a t montr, au chapitre 2, que cet axe subsistait sur des souschantillons forms uniquement dhommes ou de femmes.
Il est clair que le facteur de taille nest pas laxe 1 isol, mais une
direction peu prs diagonale (un peu plus proche de laxe 1 en fait, car
lchelle de laxe vertical est dilate sur cette figure) dans le plan (1, 3).
Cette direction diagonale est schmatise par la trajectoire des modalits
allant de Moyenne faible Moyenne forte.
Projetons maintenant sur ce mme plan (1,3) issu, rappelons-le, dune
analyse smiomtrique classique du tableau ayant 5 527 lignes et 210
colonnes, les mots (un extrait, pour plus de lisibilit) et les variables de
contrles (frquences de chacune des 7 notes pour chaque individu). La
figure 5.6 ainsi obtenue est une vue densemble de la richesse et de la

La Smiomtrie

133

complexit de la liaison entre notes et faon de noter, entre rsultat dune


enqute et attitude par rapport cette enqute1.
La position des mots dans le plan (1,3) trs dcentre par rapport
lorigine, est typique de lexistence dun facteur de taille. Les
rpondants, dont le point moyen est lorigine des axes ont donc des
attitudes trs diverses par rapport lensemble des notes : ceux qui sont
en haut droite donnent des notes faibles lensemble des mots. Ceux
qui sont en bas gauche des notes fortes.
Mais la trajectoire des frquences de notes montre que la note
moyenne cache des composantes trs diffrentes. Avec un simple facteur
de taille, cette trajectoire aurait d tre peu prs rectiligne, allant des
notes faibles en haut droite vers les notes fortes en bas gauche. Il nen
est rien, car leffet taille se superpose un effet attitude ou encore
participation : certains rpondants utilisant toutes les notes proposes,
dautres se cantonnant dans les notes moyennes, dautres enfin utilisant
prfrablement les notes extrmes.
1) Les rpondants situs dans le quadrant suprieur gauche (quadrant
I) sont de vrai bon noteurs qui donnent la note 7 lorsquun mot
leur est trs agrable (Cadeau, Gurir, Tendresse, Respect) et la
note 1 dans le cas contraire (Danger, Vide, Faute, Punir). Les mots
de la smiomtrie permettent de rapprocher les mots de
l Attachement de lacceptation de toute lchelle de notation.
On voit donc quil ny a pas indpendance entre contenu du
questionnaire et attitude par rapport au questionnaire.
2) Les rpondants situs dans le quadrant infrieur gauche (quadrant
III) sont de bons noteurs systmatiques ; leurs notes
contiennent moins de 1 et de 2, ils ne rejettent pas nettement les
mots.
3) Les rpondants situs dans le quadrant suprieur droit (vide de
mots) (Quadrant II) sont les mauvais noteurs systmatiques . Ils
utilisent le bas de lchelle de notation, mais rejettent aussi les
mots (Danger, Vide, Faute, Punir). Le facteur de taille au sens
classique oppose le quadrant II et le quadrant III.
4) Enfin, les rpondants situs dans le quadrant infrieur droit
(quadrant IV) utilisent surtout la partie centrale de lchelle de

1. La figure 5.6 nest quune esquisse. Les points reprsentant les notes 1 et 7 sont
lextrieur du cadre dans la direction indique par les flches (les coordonnes prcises des
points-notes sont donnes par les colonnes Axe 1 et Axe 3 du tableau 5.4).

134

Notations, participation, attitudes

notes. Ils utilisent relativement peu les notes 1 et 7. Les mots de la


smiomtrie permettent maintenant de rapprocher les mots du
Dtachement de ce refus de toute lchelle de notation.

Figure 5.6 : Position des mots et des frquences de notes dans le plan (1, 3)

Ce plan (1, 3) peut tre appel plan de notation. Ce sont en effet le


long des deux dimensions de ce plan que lon observe des positions
significatives et excentres des variables de contrle (frquences des
notes, moyenne des notes).
On a not au chapitre 2 des interversions dans lordre des axes pour
les axes 2 et 3, laxe qualifi conventionnellement daxe Attachement /
Dtachement occupant la troisime position en France, en Italie et en
Espagne) et la seconde position dans les pays du nord de lEurope
(Allemagne, Grande Bretagne, Finlande, Norvge). Cet axe tant le seul
tre concern par le style de notation (avec le premier axe que nous
avons exclu de la structure smiomtrique proprement dite), on peut faire
lhypothse que son changement de rang est prcisment li aux
diffrences culturelles de notation mises en vidence au cours du prsent
chapitre.

La Smiomtrie

135

5.6 Les plans de notations en Espagne, Grande Bretagne


et Allemagne
Nous allons vrifier que les traits structuraux observs dans le cas de
la France sont encore valides pour les trois pays supplmentaires que
nous avons slectionns1.
5.6.1 Effets notation en Espagne
La figure 5.7 est lanalogue de la figure 5.6 pour le recueil
smiomtrique espagnol, portant sur 2 984 individus. Seulement un mot
sur 4 (slection alatoire) figure sur le graphique.

Figure 5.7 : Schmatisation du plan (1, 3) (Espagne)

Comme prcdemment, les frquences de notes figurent avec le statut


dlments supplmentaires, les variables actives de lanalyse en
composantes principales tant les 210 mots.
Comme pour la France, cest le plan engendr par les axes 1 et 3 qui
rassemble les effets notation, avec les mmes interprtations2 : mots de

1. Des rsultats similaires relatifs lensemble des pays pour lesquels des donnes
smiomtriques sont disponibles ne sont pas publis ici, faute de place.
2. Cf. le tableau multilingue des mots en annexe A2.1 pour une traduction.

136

Notations, participation, attitudes

l Attachement (Tendresse, Naissance, Paix) du ct des frquences


leves des notes extrmes, mots du Dtachement (Attaquer,
Dominer, Vide, Guerre, Trahison) (plus proche des frquences leves
des notes moyennes (notes 4 et 5)).
5.6.2 Effets notation en Grande Bretagne
Le schma de la figure 5.8 est relatif un chantillon nettement plus
restreint (924 individus) et doit donc tre interprt avec plus de
prudence.

Figure 5.8 : Schmatisation du plan (1, 2) (Grande Bretagne)

En raison de linterversion daxes signale plusieurs reprises,


notamment dans la section 2.1.2 du chapitre 2, nous prsentons
maintenant non plus le plan engendr par les axes 1 et 3, comme ce fut le
cas pour la France et lEspagne, mais le plan engendr par les axes 1 et 2.
Les positions des points-mots dans ce plan sont tout fait analogues
celles observes dans les cas de la France et de lEspagne pour les plans
dfinis par les axes 2 et 3. Les points reprsentant les frquences de notes
(positionnes, rappelons-le, en tant qulments supplmentaires) ont,
eux, une configuration lgrement diffrente. Les notes (7, 6, 5, 4, 3)
schelonnent le long du premier axe, alors que pour la France et
lEspagne, ce ntait le cas que des seules notes (7, 6, 5).

La Smiomtrie

137

5.6.3 Effets notation en Allemagne


La figure 5.9 montre comment les mots et les frquences de notes se
structurent dans le plan (1, 2) de lAllemagne, pays dont lenqute est
effectue sur un chantillon de 3 066 rpondants.
Le coude de la courbe des frquences de notes se fait au niveau de la
note 4, alors quil se faisait au niveau de la note 5 pour la France et
lEspagne. Lorganisation gnrale reste cependant la mme dans les
quatre pays : concentration des effets notations dans un sous-espace
deux dimensions, comportement non-linaire des notes dont la trajectoire
sincurve de faon opposer les notes extrmes aux notes moyennes.
Prsence des mots de l Attachement chez les personnes utilisant toute
lchelle des notes, des mots du Dtachement du ct des notes
intermdiaires.

Figure 5.9 : Schmatisation du plan (1, 2) (Allemagne)

138

Notations, participation, attitudes

5.7 Correction des notes par double centrage


Il arrive souvent que le facteur taille soit corrig par un centrage au
niveau de chaque rpondant1. Afin dliminer les diffrences entre bons
noteurs et mauvais noteurs, on procde de cette faon un centrage par
individu qui sajoute au centrage habituel qui est le centrage des
variables : on retranche chacune des 210 notes dun rpondant la
moyenne de ses 210 notes. Les notes corriges de tous les individus ont
alors une moyenne nulle2.
On a vu plus haut (dernire ligne du tableau 5.1) que les notes
moyennes des individus schelonnaient entre 2.39 (pour le plus bas
noteur de lchantillon) et 6.21 (pour le plus haut noteur). Aprs la
transformation de centrage sur individu , tous les individus auront la
mme note moyenne.
Cette transformation va profondment affecter le premier axe
principal (en termes de variances) puisque cet axe tait essentiellement
li la note moyenne des rpondants (le tableau 5.2 a en effet montr
que la valeur absolue de la corrlation entre le premier axe et la note
moyenne est de 0.92).
Tableau 5.7 : Paramtres des analyses normales et centres par individu
(Echantillon France)
Valeur propre
(Analyse
normale)

Axe 1
Axe 2
Axe 3
Axe 4

26.64
10.24
8.79
7.05

Valeur propre
(centrage par
individu)

13.33
11.21
8.05
5.10

Pourcentage
(Analyse
normale)

12.69
4.88
4.19
3.36

Pourcentage
(centrage par
individu)

6.35
5.34
3.83
2.29

1. Des corrections analogues se font dans les enqutes de marketing, mais aussi lors de
certaines corrections dpreuves dexamens ou de concours, lorsque de nombreuses copies sont
rparties alatoirement entre correcteurs, et que lon dsire liminer un ventuel effet
correcteur sur les notes, en ramenant les notes relatives chaque correcteur une mme note
moyenne commune tous les correcteurs.
2. Cela nest peut-tre pas intuitif pour un non-mathmaticien, mais le fait de centrer en
colonnes (faire en sorte que tous les mots aient une mme note moyenne nulle) aprs avoir
centr en lignes (faire en sorte que tous les rpondants aient une mme note moyenne nulle) ne
dcentre pas le tableau en ligne. Autrement dit, on obtient immdiatement un tableau
doublement centr.

La Smiomtrie

139

On lit effectivement sur le tableau 5.7 que le nouveau premier axe est
deux fois moins important en termes de variance. Ce nest plus un axe
fortement dominant.
En bref, cette transformation va modifier lespace des premiers axes
de la faon suivante : le nouveau premier axe reste voisin de lancien
premier axe, tout en tant fortement corrl lancien axe 3
( Attachement / Dtachement ). Il apparat par ailleurs que les autres
axes sont peu prs conservs, mais dcals (le nouveau troisime tant
lancien quatrime, etc.) avec cependant quelques interversions dans leur
ordre.
La figure 5.10 montre le nouveau plan (1,2) qui est le lieu des
principaux changements. Les frquences demploi des notes sont
projetes dans ce plan ; puis sont encadrs, de deux faons diffrentes les
mots de l Attachement (partie haute et gauche du graphique) et du
Dtachement (partie basse et droite du graphique).
Le nouvel axe 1 aprs centrage par individu (axe horizontal de la
figure 5.10) est corrl1 lancien axe 1 (0.92) et lancien axe 3 (0.78).
Le nouvel axe 2 est fortement corrl lancien axe 2 (0.88) (axe
Devoir / Plaisir ) avec maintenant une lgre liaison avec lancien axe
3 (0.51), liaison dcelable sur la figure 5.10 partir de la position des
mots encadrs.
La trajectoire polygonale des frquences de notes nous montre que le
centrage par individu ne rsout videmment pas le problme de
lopposition entre noteurs extrmes (du ct Attachement du plan) et
noteurs moyens (du ct Dtachement ).
Fallait-il centrer a priori les notes de chaque individu ?
Nous avons choisi de ne pas effectuer de transformation a priori sur
les notes ( lexception de lopration de centrage et de rduction des
variables inhrente la technique danalyse en composantes principales)
pour plusieurs raisons, que nous pouvons maintenant expliciter la
lumire des expriences prsentes dans cette section.
Dans toutes les enqutes et tous les pays tudis, le niveau de
notation (note moyenne par individu) et la structure de notation
(frquences de chacune des sept notes) forment un pattern complexe
non-rductible une transformation non-linaire prliminaire.

1. Il sagit ici de corrlations calcules partir des coordonnes des 210 mots.

140

Figure 5.10 : Plan factoriel (1,2) aprs double centrage des notes en ligne et en colonne (France)

La Smiomtrie

141

Le centrage par individu limine le facteur taille (moyenne


individuelle des notes) mais pas leffet notation (spcialisation de la
notation dans la partie centrale de lchelle).
Lanalyse des donnes non-transformes montre la complexit de la
relation entre attitude par rapport au questionnaire et contenu du
questionnaire.
Loption prise danalyse les donnes brutes, qui consiste considrer
lattitude par rapport lenqute et le style de notation comme parties
intgrantes du phnomne tudier, sans simplification mcanique
pralable, nous parat plus riche heuristiquement, plus ambitieuse
scientifiquement. Elle se situe dans une optique exploratoire de
non-rduction a priori du champ de lobservable qui
nhypothque pas les recherches venir.
Une alternative intressante : lanalyse logarithmique
Parmi les diffrents essais de recodage et de transformation des
donnes, une technique a donn des rsultats intressants : lanalyse
logarithmique (cf. annexe A1.5).
Cest une transformation qui conduit directement aux diffrents axes
de la smiomtrie tels quils ont t tudis aux chapitres prcdents,
avec cependant limination du premier axe. Comme dans le cas du
double centrage, laxe 3 apparat en premier, suivi des axes (2, 4, 5, 6).
Mais les axes sont trs purs : cest exactement laxe
Attachement / Dtachement qui apparat en premier, puis laxe
Devoir / Plaisir , etc. (les coefficients de corrlations avec les axes
smiomtriques classiques sont suprieurs 0.95).
Cela dit, les rgles dinterprtation des rsultats sont moins connues et
moins diffuses que celles de lanalyse en composantes principales, et il
na pas paru opportun dutiliser cette mthode pour prsenter les axes
smiomtriques. Il sagit pour linstant dune piste de recherche
possible1.

1. La transformation logarithmique, dun usage frquent en conomie, a classiquement pour


effet de symtriser les distributions et de linariser les relations. Intuitivement, il nest donc pas
trop surprenant de la voir oprer avec succs dans un contexte que nous avons largement dcrit
au cours des chapitres prcdents comme non-linaire et non-symtrique.

142

Notations, participation, attitudes

5.8 Evolution des notations, en France, de 1990 2002


Nous avons vu que la faon de noter est variable selon les pays. Nous
allons maintenant voir que la faon de noter varie aussi dans le temps.
Ltude portera sur le seul pays pour lequel des sries statistiques
longitudinales sont disponibles : la France.
Le rsultat est assez spectaculaire, mais comme nous lavons fait
jusquici, nous nous attacherons sparer les faits statistiques que nous
mettons en vidence, tays par des procdures de validation adaptes, et
leur interprtation, pour laquelle nous ne faisons que des propositions,
ouvertes aux apports et aux critiques dautres quipes interdisciplinaires.
Le travail danalyse porte sur six enqutes deffectifs comparables
concernant les annes 1990, 1996, 1998, 1999, 2001, 2002, totalisant
15 684 individus.
La structure smiomtrique (les six premiers axes, et lordre
dapparition de ces axes, cest--dire leurs importances relatives en
termes de variance) est stable au cours des six annes, mais cette stabilit
cache une volution nette dans la faon de noter : les personnes
interroges utilisent de moins en moins de notes extrmes, et donc de
plus en plus de notes mdianes.
120

Note_7

Note_345

Frquences

100
80
60
40
20
0

1988

1990

1992

1994

1996

1998

2000

2002

2004

Figure 5.11 : Evolution des frquences des notes mdianes et de note 7.


La propension utiliser des notes modres augmente

La figure 5.11 illustre cette volution, qui oppose surtout la priode


90-96 aux quatre dernires annes. Un autre trait caractristique de cette

La Smiomtrie

143

diminution de la participation (ou de lengagement) des rpondants au


questionnaire est limportance croissante du premier axe, que nous avons
qualifi daxe mthodologique, axe qui oppose les rponses extrmes aux
rponses mdianes.
La figure 5.12 retrace lvolution de la premire valeur propre
(variance sur le premier axe) au cours de cette priode. Mais les
frquences de notes et limportance du premier axe ne traduisent quune
petite partie de lvolution observe de 1990 2002.
En fait, les points-annes occupent des positions trs types1 dans le
plan des axes 1 et 3, plan qui a t tudi en dtail dans les sections
prcdentes de ce chapitre.

35
30
25
20
15
10
5
0
1990

1996

1998

1999

2001

2002

Figure 5.12 : Evolution de la plus grande valeur propre : le premier axe


prend de plus en plus dimportance au cours du temps

Ces positions ont t reportes sur la figure 5.13 qui comporte


galement, en traits pointills, la parabole des frquences de notes
reprsente auparavant sur les figures 5.6 5.10, toutes dvolues ces
plans (1,3). La figure 5.13 contient galement une ellipse grise
reprsentant approximativement la zone occupe par les mots. Dans la
partie haute de cette ellipse se trouvent les mots : Elite, Crateur, Foi,
Sacr, Efficace, Robuste, Modration, Rcompense, Cadeau, Bijou. Ces
mots sont caractristiques des premires annes de la priode2.
1. Ces positions sont des projections des six catgories de la variable nominale anne
sur le plan smiomtrique [1,3] selon la technique des variables supplmentaires (Annexe
A1.9.3).
2. La proximit de la partie haute de lellipse avec les points reprsentant les premires
annes sur la figure 5.13 suggre une association entre les mots correspondants et ces
premires annes. On vrifie ensuite, indpendamment de lanalyse en composantes

144

Notations, participation, attitudes

On trouve parmi ces mots ceux qui caractrisent les bons noteurs
reprs par le premier axe, et les mots de l Attachement du troisime
axe.

Figure 5.13 : Esquisse de lvolution de la position des annes dans le plan


des axes (1,3). Lellipse grise schmatise la zone occupe par les mots.

Dans la partie basse de lellipse se trouvent les mots : Faute, Rgle,


Punir, Masque, Dsert, Danger, Angoisse, Dsordre, Trahir. Ces mots
caractrisent les dernires annes de la priode considre.
Ce sont pour les uns, les mots de la non-participation , un des ples
du premier axe, et pour les autres, les mots du Dtachement , un des
ples du troisime axe.
Malgr la position lgrement atypique de lanne 2001, la trajectoire
des annes est rsolument oriente vers le ple Dtachement , avec,
simultanment - et peut-tre corrlativement - une tendance noter de
faon plus centrale et moins type. En ce sens, la France se rapproche
progressivement des deux pays de lEurope du Nord tudis (Grande
Bretagne et Allemagne), dont nous avons vu la prdilection pour les
notes mdianes (cf. tableau 5.3 et figure 5.3). La frquence des notes (3,
principales, que les notes moyennes de ces mots pour les annes 1990 et 1996 sont trs
significativement suprieures leurs notes moyennes sur toute la priode (valeurs-test
suprieures 5).

La Smiomtrie

145

4, 5) varie en France de 91 102, sans atteindre cependant les 116 de


lAllemagne, ni mme les 111 de la Grande Bretagne. Le nombre moyen
de notes 7 dcrot de 47 39 entre 1990 et 2002, mais reste suprieur
aux 37 de la Grande Bretagne et au 32 de lAllemagne. En revanche,
lordre des axes ne varie pas au cours du temps, et lon nobserve pas
linterversion des axes 2 et 3 qui caractrise tous les pays de lEurope du
Nord pour lesquels nous disposons de donnes.
Il est assez dlicat de faire la part de ce qui serait une volution dans
la faon de noter (dans le sens dun dsengagement croissant se
manifestant par des notes de moins en moins diffrencies) et une
volution socio-culturelle plus gnrale vers le dsengagement et les
valeurs du Dtachement . Cette dernire volution aurait de toutes
faons des rpercussions sur les attitudes par rapport aux enqutes en
gnral, et par rapport aux enqutes smiomtriques en particulier.
Lintrt du cadre conceptuel et technique dans lequel nous travaillons
est de prsenter le fait statistique dans toute sa complexit, en amont de
toute modlisation, et donc de rendre le matriau de base lisible et ouvert
diverses interprtations.
Rappelons que cest lopposition sur le premier axe qui traduit
lopposition entre les notes extrmes et les notes moyennes. Or, il
apparat que les annes sont plus nettement (i.e. : significativement, au
sens statistique) spares par le troisime axe1. Ceci est une prsomption
forte en faveur dune volution structurelle vers les valeurs du
Dtachement qui ne serait pas un simple artefact de la faon de noter,
cette faon de noter pouvant tre elle-mme une des composantes dune
tendance plus gnrale.

5.9 Conclusion
Comme cela a t nonc ds le chapitre 2, les structures
smiomtriques (configurations de mots) sont stables. Les matriaux
statistiques et expriences de ce chapitre auront montr que cette stabilit
subsiste malgr des styles de notation assez diffrents dun pays un
autre.

1. Les valeurs- test des positions des annes 1990, 1996, 2002 valent respectivement 9.1,
7.7 et 10.6 sur le troisime axe (axe vertical de la figure 5.13) alors quelles valent 5.1, -5.1,
et 2.5 sur le premier axe (axe horizontal de la figure 5.13)..

146

Notations, participation, attitudes

En montrant que le premier axe des analyses pouvait tre obtenu


simplement partir de la frquence demploi de chacune des sept notes
(sans se soucier des mots auxquels sont attribues ces notes), le caractre
mthodologique de cet axe que nous avions jusquici tenu lcart de
la structure smiomtrique, a t tabli : il concerne essentiellement la
forme et non le contenu des questionnaires et des enqutes.
Les notes moyennes sont beaucoup plus affectes que les corrlations
entre notes par les styles de notation. Lordre des axes est sensible aux
codages de linformation, alors que les axes eux-mmes sont beaucoup
plus robustes.
Les interversions daxes observes entre les pays de lEurope du Sud
(France et Espagne dans ce chapitre) dune part, et les pays de lEurope
du Nord (Allemagne et Grande Bretagne dans ce chapitre) dautre part,
peuvent tre dues ces diffrences de styles de notation, ou des
diffrences structurelles plus profondes1.
Un des principaux enseignements de ce chapitre est que lattitude par
rapport un questionnaire fait partie intgrante de linformation
analyser et interprter ; que cette attitude conduit des patterns stables,
que lon peut difficilement carter sans mutiler linformation de base.
En gnral, les questionnaires denqutes ne comportent pas
dlments permettant de caractriser les attitudes par rapport aux
conditions mmes de recueil de linformation et ladhsion de la
personne interroge la problmatique du questionnaire.
Cest un peu le mrite du questionnaire gnraliste que constitue le
questionnaire smiomtrique de permettre cette caractrisation. On peut
tudier avec cet outil ce que disent les rponses, mais aussi, dans une
certaine mesure, ce que rpondre veut dire.

1. Le fait statistique est le suivant : laxe Devoir / Plaisir est moins important, en terme
de variance explique, en Europe du Nord quen Europe du Sud. Une des pistes
dinterprtation possible est, par exemple, la suivante: cet axe opposant des personnes jeunes
des personnes plus ges, on peut imaginer que, pour des raisons historiques, culturelles, (voire
climatiques, ethniques, etc.) lopposition entre les gnrations est moins marque dans
lEurope du Nord que dans celle du Sud.

CHAPITRE 6
Essais dinterprtation
Les chapitres prcdents ont prsent les structures smiomtriques
rvles par six dimensions stables. Ces structures ont t valides
partir dpreuves empiriques et partir de procdures techniques de
rchantillonnage. Toujours partir de nouvelles expriences de terrain
ou danalyses statistiques, la parent de cette structure avec certains
rseaux smantiques a t tudie, puis le recueil actuel de donnes a t
confront ce que serait un recueil par questions ouvertes. Enfin, les
problmes de notation et dattitudes vis--vis des questionnaires et des
enqutes ont t tudis, en insistant sur linteraction invitable entre,
dune part, ces effets notation et ces attitudes et, dautre part, le contenu
mme des rsultats.
Nous avons en quelque sorte labor un support objectif , un
ensemble de faits statistiques, en restant avares de commentaires
substantifs. Les ventuelles remarques interprtatives ont eu jusqu
prsent pour seul rle, pdagogique, de couvrir dun peu de chair un
squelette technique et mthodologique. Cest le caractre
pluridisciplinaire du champ tudi, et donc la multiplicit des
interprtations possibles, qui a conduit prserver autant que cela a t
possible le socle factuel, reproductible, partir duquel plusieurs
interprtations subjectives peuvent maintenant tre formules. Ce
chapitre, rdig plus particulirement par Jean-Franois Steiner, change
rsolument de ton et prend le risque de proposer et dargumenter en

148

Essais dinterprtation

faveur de quelques interprtations possibles des structures observes


situes plusieurs niveaux, historique, littraire et psychologique.

6.1 Une premire approche


Quand on la contemple un peu attentivement, la structure
smiomtrique, telle quelle apparat sur les cartes des diffrents plans
factoriels, provoque en nous cette curieuse impression quasi
proustienne faite dun mlange de sentiment dtranget et de
familiarit, que lon prouve face un objet, ou un tre, bien connu mais
que lon dcouvre dans une situation o on ne sattend pas le
rencontrer, comme, par exemple, lorsquon se trouve assis dans un
restaurant une table voisine dune personnalit clbre. On reconnat
parfaitement ses traits mais on nose croire que cest elle, car elle
appartenait pour nous jusque l un autre monde avec lequel le ntre ne
communiquait pas.
Ainsi, le deuxime axe Devoir / Plaisir , par exemple, avec dun
ct les mots Sensuel, Rver, Aventurier, Original, Nudit, Bohme,
Evasion, Rvolte et de lautre, Discipline, Obir, Morale, Soldat, Rgle,
Loi, Travail, Dieu, Famille, Tradition, etc., voque une opposition qui
nous semble traverser aussi bien notre propre vie que la vie politique,
tre au cur de nos conflits les plus intimes comme de ceux de la
socit.
Dun ct, cest le fameux Law and Order (Loi, Rgle, Discipline)
des Anglo-saxons mais aussi lillustre trilogie vichyssoise (Travail,
Famille, Patrie) ou encore la clbre, quoique quelque peu suranne,
alliance du sabre et du goupillon (Soldat, Prtre). De lautre ct, on
retrouve tous les thmes de mai 68, le rve dun monde tout ddi la
jouissance, sans contrainte et sans loi, o il est interdit dinterdire et o le
rve doit tre pris pour la ralit (Sensuel, Rver, Nudit, Bohme,
Evasion, Rvolte).
Mais cette opposition, et cest l o cette structure mise en vidence
par la smiomtrie ne cesse dtre troublante, nest pas seulement un
phnomne politique contemporain. Il y a deux sicles, Goethe lavait
dj dcrite, mais en la situant au cur de son tre : Deux mes,
hlas !, fait-il dire Faust, habitent ma poitrine et qui se repoussent lune
lautre. Lune assoiffe de plaisir, est attache au monde de toute la force

La Smiomtrie

149

de ma chair ; lautre, mue par une force inconnue, cherche mentraner


vers les hautes demeures de mes anctres 1.
Le troisime axe Attachement/Dtachement 2, avec dun ct les
mots Bijou, Cadeau, Mariage, Gaiet, Famille, Parfum, Fleur, Gratuit,
etc., et, de lautre, Danger, Mort, Rompre, Angoisse, Vide, Punir, Cri,
Doute, Rvolte, Question, Inconnu, etc., voque lultime injonction que
Dieu fait, par la bouche de Mose, au peuple hbreu, juste avant quil ne
pntre dans le pays de Canaan : Vois, jai mis devant toi la vie et le
bien, la mort et le mal 3, injonction dont le clbre slogan de beatniks,
Make love not war , peut tre considr, par certain ct, comme un
trs lointain avatar. Cette opposition entre ltat de drliction et celui de
plnitude de ltre est au cur de la problmatique biblique et dune
grande partie de la mystique juive avec les deux concepts antagonistes
fondamentaux de Shechina (prsence divine) et de Galouth (exil de
lme), Du fond de langoisse, jai cri vers toi et tu mas rpondu, tu
as dlivr mon me 4, dit le psalmiste. Toute la dramaturgie de la
descente en Egypte Mitzram, en hbreu, mot qui signifie littralement
les deux angoisses et de la remonte vers Canaan, le pays o coule le
lait et le miel , repose sur cette mme opposition entre les deux tats de
lme tantt glace dangoisse et tantt dilate de bonheur.
Le quatrime axe Esprit / Matire , de mme, avec son opposition
entre, dun ct, les mots Livre, Art, Posie, Enseigner, Ecrire, Rflchir,
Chercheur, Ame, Dieu, Foi, etc., et de lautre, Richesse, Or, Argent,
Gloire, Conqurir, Ambition, Sduire, Dsir, Sensuel, etc., dcrit une
opposition qui se retrouve dans de nombreux conflits intrieurs ou de
socit. Cest le conflit chrtien par excellence qui oppose lme au
corps, la richesse au salut, le monde dici-bas tout ddi au culte de
Mamon et lautre monde, plein de sublimes flicits, conflit que lon
1. Zwei Seelen wohnen, ach ! in meiner Brust,
die eine will sich von der andern trennen :
Die eine hlt, ein derber Liebeslust,
sich an die Welt mit klammernden Organen :
Die andre hebt ewaltsam sich vom Dunst
Zu den Gefilden hoher Ahnen.
2. Rappelons le phnomne dinterversion des axes Devoir / Plaisir et
Attachement / Dtachement entre les pays latins , France, Italie et Espagne et les pays
septentrionaux, Allemagne, Grande-Bretagne, Norvge, Finlande, Hongrie et Rpublique
Tchque, laxe Devoir / Plaisir ayant une valeur propre suprieure celle de laxe
Attachement / Dtachement dans les pays latins, et rciproquement.
3. Deutronome 30,15.
4. Psaume 120.

150

Essais dinterprtation

retrouve lacis de nos jours dans lopposition entre lart et largent, la


recherche et le commerce, les ONG et les multinationales, etc.. Chacun
trouvera, de Bossuet Tolsto, mille exemples dans la littrature
occidentale, duvres dont le ressort dramatique est organis autour de
ce conflit. Citons, pour la beaut de la langue, cette rponse dHenriette
Armande dans les Femmes Savantes de Molire :
Ainsi, dans nos desseins lune lautre contraire,
Nous saurons toutes deux imiter notre mre :
Vous, du ct de lme et des nobles dsirs,
Moi, du ct des sens et des grossiers plaisirs ;
Vous, aux productions desprit et de lumire,
1
Moi, dans celles, ma sur, qui sont de la matire.

Le cinquime axe Cur / Raison , avec les mots, Dieu, Foi, Ame,
Sacr, Eternel, Crmonie, Infini, Noble, Bijou, Posie, Absolu, Adorer,
Hros, Roi2, Reine, Chteau, Mode, Mystre, dun ct et : Efficace,
Prcision, Logique, Concret, Astucieux, Utilitaire, Produire, Volontaire,
Inventeur, Raison, Science, de lautre, voque lopposition entre notre
besoin de rve et de dpassement, notre besoin de croire en des ralits
dun autre ordre, magique ou transcendant, et notre besoin antagoniste de
comprendre et dagir dans un monde rationnel rgi par des lois simples et
entirement accessibles notre intelligence. On peut linterprter comme
laxe du conflit pascalien entre le cur, sige et source de la foi et la
raison pour laquelle ses mystres demeureront jamais impntrables ;
ou comme celui qui oppose don Quichotte, le chevalier errant qui fuit la
triste ralit de sa mlancolie et de son dnuement dans un monde peupl
de chimres o les moulins vents se confondent avec des gants, une
pauvre auberge espagnole avec un puissant chteau et une misrable fille
de ferme avec une princesse sans pareille , qui fuit la banale et
dsolante quotidiennet des choses dans la sublime beaut dun monde
reconstruit par le rve, avec le brave Sancho Pana qui tente
dsesprment dopposer son bon sens terre terre de paysan
limaginaire embourb dans la glbe au dlire onirique de son matre.
Mais, cet axe peut aussi sinterprter comme celui du conflit qui
opposa, partir de la Contre Rforme, les tenants de la grce et ceux qui
prtendaient, tels les molinistes, que le salut sobtenait par les uvres3,
1. Les Femmes Savantes, acte I scne 1.
2. Dans une version antrieure du questionnaire qui comprenait 286 mots, dont les mots
Roi, Reine et Chteau, ceux-ci corrlaient avec le demi axe Cur .
3. Cf. laffaire de la constitution Unigenitus qui empoisonna la fin du rgne de Louis XIV,
la Rgence et une grande partie du rgne de Louis XV, qui, sorte daffaire Dreyfus avant la

La Smiomtrie

151

ou, dans la seconde moiti du 18e sicle, le mouvement rationaliste des


Lumires qui affirmait que lhomme ne devait avoir dautre matre que
sa raison, au courant religieux qui posait, lorigine de la Cration,
lexistence dun mystre indpassable, mystre qutaient charges
dentretenir les somptueuses pompes de lEglise, la troublante et
mlancolique beaut de la musique baroque et lexubrance de son
architecture.
Le sixime axe Humilit / Souverainet , avec les mots Naissance,
Mfiance, Doute, Famille, Rigide, Interdire, Obir, Enfance, Maternel,
Immobile, Fidlit, Vide, Politesse, etc. auxquels il faut ajouter Peuple,
Foule et Egalit qui appartenaient au questionnaire de 286 mots, dun
ct, et Noble, Crateur, Art, Dieu, Audace, Elite, Matriser, Btisseur,
Commander, etc., de lautre, voque lopposition entre ce quil est
convenu dappeler les petites gens ou Les Humbles , comme les
appelle Jules Romains, qui subissent leur destin et dont lhorizon sest
trouv racorni par les pesanteurs sociologiques, par un dficit
dducation et, peut-tre, damour, et, pour reprendre une expression un
peu dsute mais trs parlante, les grands de ce monde ou Les
Superbes , toujours selon Jules Romains1 qui, au contraire, ont t
levs dans lide quils appartenaient une classe suprieure qui avait
vocation dominer les autres et matriser leur destin.
Dans un autre registre, cet axe est aussi un axe sociologique, puisquil
oppose les cadres, les personnes ges, les personnes rsidant dans les
agglomrations de plus de 200 000 habitants et les rgions parisienne et
mditerranenne, aux ouvriers et employs, aux personnes de moins de
quarante ans, aux non titulaires du baccalaurat et aux habitants des

lettre, dchira la socit franaise pendant plusieurs dcennies. La vhmence avec laquelle
Saint Simon lvoque dans ses Mmoires rsonne comme un cho lointain du sisme quelle
reprsenta pour la socit franaise : Ce mme mois de mars (1711) vit clore les premiers
commencements de laffaire qui produisit la constitution Unigenitus si fatale lEglise et
lEtat, si honteuse Rome, si funeste la religion, si avantageuse aux jsuites, aux sulpiciens,
aux ultramontains, aux ignorants, aux gens de nant, et surtout tout genre de fripons et de
sclrats, dont les suites, diriges autant quil leur a t possible sur le modle de celle de la
rvocation de ldit de Nantes, ont mis le dsordre, lignorance, la tromperie, la confusion
partout, avec une violence qui dure encore, sous loppression de laquelle tout le royaume
tremble et gmit, et qui, aprs plus de trente ans de la perscution la plus effrne, en prouve,
en tout genre et en toutes professions, un poids qui stend tout, et qui sappesantit toujours.
1. Les Hommes de bonne volont, livres 5 et 6.

152

Essais dinterprtation

rgions rurales ; et mme idologique1, ce qui rend son maniement


quelque peu scabreux.
Comme nous allons le voir, ci-dessous, dans une tentative
dinterprtation de la structure smiomtrique travers une grille de
lecture freudienne, cet axe peut aussi tre compris comme la projection,
sinon dun conflit intrieur, du moins dune tension intrapsychique
laquelle lhomme est soumis du fait de la ncessit dans laquelle il se
trouve, au cours de son dveloppement, de construire son moi par un
travail de colonisation de son univers pulsionnel.
Mais avant de nous lancer dans cette prilleuse aventure, notons, en
passant, que, peut-tre, contrairement ce quaffirmait Goethe, plus de
deux mes, en ralit, habitent notre poitrine, comme, dailleurs,
Nietzsche lavait dj pressenti, qui lui rpondait : Si un Allemand
disait : deux mes, hlas, habitent ma poitrine, il sen faudrait de
beaucoup quil dise la vrit 2.

6.2 Une interprtation psychanalytique


A partir de 1920, Freud labore une thorie, connue sous le nom de
deuxime topique , dans laquelle il dcrit lappareil psychique comme
constitu de trois grandes instances , le a, ple pulsionnel de la
personnalit, le moi, instance qui se pose en reprsentant des intrts de
la totalit de la personne (), le surmoi enfin, instance qui juge et
critique, constitue par intriorisation des exigences et des interdits
parentaux. 3.
Il nous semble que la description quil donne du a : il (le a)
comprend tout ce qui a t constitutionnellement dtermin, donc, avant
tout, les pulsions manes de lorganisation somatique , Il (le a) tend
satisfaire les besoins inns de lindividu , Le a obit linexorable
principe de plaisir , correspond assez bien au ple Plaisir de laxe 2
dont une grande partie des mots (Sensuel, Rver, Nudit, Sauvage,
Voluptueux, Dsir, Charnel, Caresse, Emotion, Moelleux, Orage, Peau,
Rvolte, Danger, etc.) qui le caractrisent voque justement lexpression

1. Dans le questionnaire de 286 mots, les mots Peuple, Foule et Egalit corrlaient avec le
demi axe Humilit et sopposaient, donc, aux mots Noble, Elite, Roi, Reine et Chteau.
2. Par-del le Bien et le Mal, F. Nietzsche.
3. Vocabulaire de la psychanalyse, J. Laplanche et J.-B. Pontalis.

La Smiomtrie

153

libre des pulsions, la satisfaction de besoins inns et la recherche du


plaisir, ou, plus exactement, la soumission son principe.
A loppos, la description du surmoi, Sorte de prcipit de la longue
priode denfance () par laquelle se prolonge linfluence parentale et
() transmise par eux, celle des traditions familiales, raciales,
nationales, ainsi que les exigences du milieu social immdiat quils
reprsentent , dont la tche essentielle consiste toujours rfrner les
satisfactions , qui dicte de svres interdictions et qui peut mme
se manifester sous un jour dur et cruel 1, correspond, de son ct,
assez fidlement au ple Devoir de ce mme axe avec les mots
Famille, Patrie, Loi, Tradition, Economiser, Interdire, Sacrifice, Punir,
Rigide, etc.
Rflchissant sur la nature des pulsions, leur orientation, la manire
dont elles sexpriment dans les conduites humaines, Freud proposait, ds
1920, den distinguer deux catgories principales : ce qui nous conduit
distinguer deux sortes de pulsions : celles qui cherchent conduire la
vie la mort et les autres, les pulsions sexuelles, qui indfiniment tendent
et parviennent renouveler la vie 2. En 1938, la veille de sa mort, il
revenait sur cette dichotomie et la prcisait : Aprs de longues
hsitations, de longues tergiversations, nous avons rsolu de nadmettre
lexistence que de deux pulsions fondamentales : lEros et la pulsion de
destruction. () Le but de lEros est dtablir de toujours plus grandes
units, donc de conserver : cest la liaison. Le but de lautre pulsion, au
contraire, est de briser les rapports, donc de dtruire les choses .
Notre propos nest videmment pas de nous prononcer sur la
pertinence de cette mtapsychologie. Elle a fait lobjet de nombreuses
polmiques, qui ont, dailleurs, t abandonnes aujourdhui, faute de
combattants et qui ne faisaient que ranimer le vieux dbat thologique
inaugur par Saint Augustin, entre les dualistes, qui prtendaient que le
monde avait t cr par deux forces, celles du bien et celles du mal, et
les monistes qui posaient lexistence de Dieu lorigine de toute chose.
Ce qui nous semble beaucoup plus intressant cest de montrer comment
cette dichotomie rend un compte assez fidle de lopposition qui
sexprime sur laxe 3 Attachement / Dtachement de la smiomtrie.
Et, en effet, on peut considrer que pratiquement tous les mots du ple
Attachement , Bijou, Cadeau, Rcompense, Maison, Mariage, Gaiet,

1. Abrg de psychanalyse, S. Freud.


2. Au-del du principe de plaisir, S. Freud.

154

Essais dinterprtation

Famille, Fidlit, Tendresse, Paix, Caresse, mais aussi Or, Argent,


Richesse, Mode, Parfum, dans un sens moins immdiat mais vident,
parlent dobjets destins crer des liens entre les tres ou entre les tres
et les choses, tandis que ceux du ple Dtachement , Danger, Mort,
Rompre, Orage, Angoisse, Vide, Punir, Critiquer, Doute, Rvolte,
Attaquer, Faute, Ironie, Vieillir, Muraille, Mfiance, Inconnu, etc.,
voquent tous la destruction des relations, par la violence ou labsence,
avec soi ou avec les autres.
Si les deux axes prcdents peuvent tre interprts assez aisment
partir de la deuxime topique freudienne, les deux suivants
( Esprit / Matire et Cur / Raison ) se laissent moins aisment
rduire une interprtation psychanalytique littrale. Pourtant, le ple
Esprit de laxe 4, avec les mots connotant la spiritualit religieuse,
Ame, Dieu, Prier, Recueillement, ceux dcrivant les activits
intellectuelles, Science, Chercheur, Inventeur, Rflchir, Question, et
ceux voquant les diffrentes expressions de lart, Posie, Livre, Art,
Musique, Thtre, nest pas sans faire penser au phnomne psychique
que Freud appelle sublimation : La sublimation est un processus
postul par Freud pour rendre compte dactivits humaines apparemment
sans rapport avec la sexualit, mais qui trouvent leur ressort dans la force
de la pulsion sexuelle. Freud a dcrit comme activits de sublimation
principalement lactivit artistique et linvestigation intellectuelle 1,
La pulsion sexuelle met la disposition du travail intellectuel des
quantits de force extraordinairement grandes et ceci par suite de cette
particularit, spcialement marque chez elle, de pouvoir dplacer son
but sans perdre, pour lessentiel de son intensit. On nomme cette
capacit dchanger son but sexuel originaire contre un autre but, qui
nest plus sexuel mais qui lui est psychiquement apparent, capacit de
sublimation 2, Les historiens de la civilisation semblent daccord pour
admettre que, grce ce dtournement des forces pulsionnelles sexuelles
loin des buts sexuels et cette orientation vers de nouveaux buts
processus qui mrite le nom de sublimation , de puissantes composantes
sont acquises, intervenants dans toutes les constructions
intellectuelles 3. Certes, aucun moment, Freud ne mentionne la
spiritualit religieuse comme tant une manifestation du mcanisme de
sublimation, mais on est en droit de penser quil ne faut voir l que

1. Vocabulaire de la psychanalyse, op. cit. Cest nous qui soulignons.


2. Gesammelte Werke, VII, 150, S. Freud.
3. Trois Essais sur la thorie sexuelle, S. Freud.

La Smiomtrie

155

leffet de la virulence de son athisme. En effet, les liens entre la religion


et lart, aussi bien que la science dans ses manifestations les plus pures,
sont trop connus pour quon ne sautorise pas lever cette exclusion.
Si lon retient cette interprtation du demi axe Esprit comme
correspondant au phnomne de sublimation, on peut comprendre son
demi axe antagoniste comme celui des activits humaines dans lesquelles
les pulsions sexuelles sexpriment sous une forme plus immdiate ou
moins labore, hypothse que le sens des mots, Richesse, Or, Argent,
Gloire, Conqurir, Ambition, Commerce, Commander, Attaquer,
Sduire, Dsir, Sensuel, Charnel, Voluptueux, etc., est loin de contredire.
Dans la perspective de cette interprtation, laxe 4 serait constitu par
lopposition entre les individus qui expriment leur sexualit sous une
forme relativement basique et ceux qui, plus sensibles aux contraintes
culturelles quils ont subies au cours de leur enfance et la multiplicit
des interdits que toute civilisation puissante et fconde ne cesse ddicter
lencontre de la sexualit sont parvenus la canaliser vers dautres buts
reprsentant, du moins jusqu une date rcente, des idaux socialement
plus valoriss.
Au fur et mesure o, dclinant les axes, on pntre plus
profondment dans la structure smiomtrique, linterprtation de ceuxci devient plus malaise, ce qui ne doit pas nous surprendre puisque la
quantit dinformation apporte par chacun deux ne cesse de
samenuiser. Cette difficult est encore accrue par le fait que, si le ple
Matire de laxe 4 et le ple Raison de laxe 5 sont dfinis par des
ensembles de mots radicalement diffrents (Or, Argent, Richesse, pour
celui-ci et Logique, Prcision, Efficace, pour celui-l), le ple Esprit
de laxe 4 et le ple Cur de laxe 5, prsentent, eux, des
ressemblances troublantes : mmes mots de spiritualit religieuse, Dieu,
Prier, Foi, Ame et mmes mots dexpression artistique, Posie,
Thtre, Musique, Art. Pourtant, malgr ces similitudes, on observe deux
diffrences importantes entre les ples Cur et Esprit , qui
montrent quils ne doivent pas tre confondus. Outre la prsence de mots
comme Roi, Reine et Chteau du ct du Cur , la grande diffrence
entre les ples Esprit et Cur rside dans le fait que les mots
voquant des activits intellectuelles, Inventeur, Chercheur, Rflchir,
Science, Raison, qui corrlaient positivement avec le demi axe Esprit ,
corrlent ngativement avec le demi axe Cur tandis que certains
mots de Matire Bijou, Or, Mode, Hros, Crmonie, qui corrlaient

156

Essais dinterprtation

ngativement avec le demi axe Esprit , corrlent maintenant


positivement avec le demi axe Cur .
Cette sorte de chass crois qui sopre lorsque lon passe de laxe 4
laxe 5, sil reprsenta longtemps pour nous un cueil sur lequel venait
buter nos tentatives dinterprtation, fournit peut-tre une clef de
comprhension de laxe 5 du point de vue de la thorie freudienne. En
effet, Freud note lexistence dun phnomne psychique qui prsente un
certain nombre de similitudes avec la sublimation, au point dtre parfois
confondu avec elle, mais qui doit pourtant tre considr comme
radicalement indpendant dans son mcanisme : lidalisation. Notre
hypothse est que, si le ple Esprit de laxe 4 correspond, du moins
en partie, la sublimation, le ple Cur de laxe 5, qui prsente tant
de points communs avec lui, correspond au phnomne didalisation.
Mais coutons Freud : La formation de lidal du moi, crit-il1, est
souvent confondue avec la sublimation des pulsions, au dtriment dune
claire comprhension. Tel qui a chang son narcissisme contre la
vnration dun idal du moi lev na pas forcment russi pour autant
sublimer ses pulsions libidinales. Lidal du moi requiert, il est vrai, cette
sublimation mais il ne peut lobtenir de force : la sublimation demeure un
processus particulier ; lidal peut bien linciter samorcer mais son
accomplissement reste compltement indpendant dune telle incitation
() La formation didal augmente () les exigences du moi, et cest
elle qui agit le plus fortement en faveur du refoulement ; la sublimation
reprsente lissue qui permet de satisfaire ces exigences sans amener le
refoulement .
Aprs avoir mis en vidence les liens qui existent entre les deux
phnomnes, Freud les dfinit, lun par rapport lautre, du point de vue
de sa thorie : La sublimation est un processus qui concerne la libido
dobjet et consiste en ce que la pulsion se dirige vers un autre but,
loign de la satisfaction sexuelle ; laccent est mis sur la dviation qui
loigne du sexuel. Lidalisation2 est un processus qui concerne lobjet et
1. Pour introduire le narcissisme, S. Freud.
2. Freud opre un glissement entre formation dun moi idal et idalisation de lobjet, sans
sen expliquer plus avant, comme si, pour lui, les deux mcanismes taient identiques. Le
terme manquant de lellipse est, sans doute, le phnomne didentification projective par lequel
le sujet se confond avec lobjet, cest dire que le sujet, en fait mal dbarrass de son
narcissisme, projetterait limage idal quil se fait de lui-mme sur lobjet, linvestissant ainsi
de libido narcissique. Freud confirme, dailleurs, cette hypothse qui crit par ailleurs : Dans
maintes formes de choix amoureux, il devient mme vident que lobjet sert remplacer un
idal du moi propre, non atteint. On laime cause des perfections auxquelles on a aspir pour

La Smiomtrie

157

par lequel celui-ci est agrandi et exalt psychiquement sans que sa nature
soit change. () Ainsi, pour autant que sublimation dsigne un
processus qui concerne la pulsion et idalisation un processus qui
concerne lobjet, on doit maintenir les deux concepts spars lun de
lautre 1.
Laxe 5 opposerait, donc, dun ct, lidalisation, processus
psychique par lequel les qualits et la valeur de lobjet sont portes la
perfection , (Dieu, Prier, Reine, Roi, Foi, Prtre, Posie, Crmonie,
Bijou, Thtre, Sacr, Ame, Chteau) la rationalisation, Procd par
lequel le sujet cherche donner une explication cohrente du point de
vue logique () une attitude, une action, une ide, un sentiment, dont
les motifs vritables ne sont pas aperus 2, (Efficace, Prcision,
Logique, Concret, Matriser, Astucieux, Utilitaire, Rflchir, Raison,
Science, etc.) On notera que lidalisation comme la rationalisation sont
souvent utilises dans des stratgies de dfense contre langoisse. Le fait
quelles ressortissent des stratgies psychiques de nature antinomique,
pourrait peut-tre expliquer, du moins en partie, le ct souvent
inexpiable des conflits qui se structurent autour de ces deux attitudes3.
Linterprtation du sixime axe du point de vue de la thorie
freudienne est beaucoup moins vidente. Comme nous lavons not cidessus, on pourrait y voir la trace dun conflit intrapsychique entre le
moi, dans son effort toujours recommenc darrachement la pesanteur
du monde pulsionnel4 (Noble, Elite, Crateur, Fort, Audace, Ouvert,
Commander), et la tentation de cder lappel dun retour impossible
ltat idyllique denfance et de nature (Famille, Naissance, Enfance, Eau,
Animal, Campagne).
le moi propre et quon voudrait maintenant se procurer par ce dtour pour satisfaire son
narcissisme (Psychologie des foules et analyse du moi).
1. Pour introduire la narcissisme, op. cit.
2. Vocabulaire de la psychanalyse, op. cit.
3. Les concepts d Esprit , de Cur et de Raison relevant dune topographie
psychologique plus potique que prcise et peu en accord avec les modes de pense
daujourdhui, nous proposons de renommer laxe 4 Esprit / Matire par Sublimation/
Matrialisme et laxe 5 Coeur / Raison par Idalisation / Pragmatisme . Mais, il est
bien vident quil ne sagit que dtiquettes qui rsument et, donc, dforment la ralit
smantique et psychologique des axes, laquelle est rendue par lensemble des mots qui
corrlent avec eux.
4. Cf. le clbre Wo es war, soll ich werden (O il y avait le a, le moi doit advenir) de
Freud, qui rsonne comme un cho lointain du premier commandement de Dieu lhomme
aprs lavoir cr partir de la poussire : Fructifiez et multipliez et emplissez la terre et
asservissez-la , que certains commentateurs interprtent comme une injonction faite
lhomme de dominer ses instincts.

158

Essais dinterprtation

Ce pourrait donc tre laxe de lopposition du moi et du a, ou plus


exactement laxe de lopposition entre les individus qui survalorisent leur
moi comme instance souveraine, ceux, peut-tre, que les marxistes
qualifiaient de petits bourgeois individualistes 1 et ceux qui prfrent
renoncer leur singularit et se fondre dans un tout qui les transcende et
les absorbe.
Mais, il sagit l dune interprtation trs libre que nous sommes
incapables dtayer sur aucun texte thorique, comme nous avons tent
de le faire, avec plus ou moins de succs, pour les axes prcdents.
Notre propos, dailleurs, ne tendait pas donner une interprtation
exhaustive et dfinitive des dimensions de lespace smiomtrique, mais
seulement en proposer quelques essais de lecture afin de faire partager
au lecteur le sentiment dmerveillement que nous prouvons parfois
devant la manire dont, partir dune simple note valuant la quantit de
plaisir (ou de dplaisir) qui sattache leurs connotations, les mots
sorganisent dans un espace smantique dune profondeur inattendue.

1. Lorsque lon projette les consommateurs des diffrents types de produits sur les axes, les
consommateurs de produits de luxe, dont la fonction sociale de valorisation du moi est bien
connue (marques de Champagne prestigieuses, montres de marque, etc.), apparaissent
systmatiquement sur laxe 6 du ct de la Distinction.

CHAPITRE 7
Quelques applications de la
smiomtrie
Conue, lorigine, comme un instrument permettant de reconstruire
un hypothtique espace symbolique qui structurerait, au moins
partiellement, notre perception inconsciente du monde, la Smiomtrie
sest rvle un jour, dune manire tout fait fortuite, tre un outil que
lon pourrait utiliser avec quelque profit dans des applications psychosociologiques et de marketing. Cest ainsi qu partir de 1986,
paralllement un programme de recherche plus thorique et une
rflexion sur la nature de la structure mise en vidence par la
smiomtrie, une collaboration sest instaure entre Jean-Franois
Steiner et le groupe international de communication Taylor Nelson
Sofres pour dvelopper cette approche dans le cadre dtudes dopinion
et de marketing.
Ce nest, bien sr, pas ici le lieu de prsenter un bilan des quelques
centaines dtudes ainsi ralises, tant dans le domaine du marketing que
dans ceux de la sociologie, de la psycholinguistique ou de la smantique.
Notre propos nest que dillustrer certaines de ces applications par
quelques exemples. Les cas prsents sont loin dtre exhaustifs de
lensemble des applications. Nous les avons choisis plus pour leur valeur
didactique (la valeur exemplaire de leur pouvoir descriptif et explicatif)

160

Applications de la smiomtrie

que pour leur intrt proprement oprationnel1. Les applications


commerciales, qui restent la proprit des organismes ayant commandit
les tudes, font intervenir des marques ou des noms pour lesquels une
certaine confidentialit est en gnral souhaite. Elles ne seront pas
prsentes ici. Le lecteur naura cependant aucune peine imaginer qu
la place des catgories utilises dans ce chapitre (sexe, classes dge) on
puisse faire intervenir les consommateurs de tel produit, les possesseurs
de telle marque de voiture, les lecteurs de tel candidat ou parti.
La mthode consiste comparer la note moyenne attribue par une
premire population (appele population tudie) aux 210 mots du
questionnaire smiomtrique, la note moyenne attribue ces mots par
une seconde population (appele population de rfrence2), puis
appliquer un test statistique aux carts de moyennes afin de dterminer
les mots significativement sur-nots et sous-nots par celle-l. Ces mots
sont ensuite prsents sur le plan principal (engendr par deux axes
principaux) le plus pertinent. Ce type de visualisation facilite la lecture
des rsultats, mais surtout permet dapprcier la cohrence smantique de
ces rsultats. On verra au fil des exemples que le regroupement des mots
caractristiques dans des zones particulires de lespace smiomtrique
permet une confirmation de la signification des rsultats par une prise en
compte des corrlations entre mots.
Une mthode alternative (et plus classique) pour comparer des souspopulations consiste, dans lespace dont les points sont les rpondants,
projeter les centres de gravit (ou points moyens ) des individus
appartenant ces sous-populations sur les plans principaux (cf. annexe
1. Il existe dautres applications qui reposent sur la facult que la smiomtrie offre de
mesurer des distances entre individus et groupes dindividus dans un espace stable dans le
temps et lespace. Elles ne seront cites ici que pour mmoire. Il sagit des applications dans le
domaine du mdiaplanning qualitatif et des ressources humaines. Dautres applications, enfin,
utilisent le pouvoir prdicteur des notes smiomtriques pour amliorer la qualit des fusions
de fichiers ou pour prdire des donnes manquantes (cf., par exemple, Auliard et Steiner,
1992).
2. Cette seconde population est, en gnral, le complment de la premire. Toutefois,
lorsque lon souponne quun effet de structure pourrait masquer le rsultat que lon cherche
mettre en vidence, on filtre les deux populations par la variable perturbatrice. Exemple,
lorsquon veut tudier des produits consomms essentiellement par des individus dun sexe
donn, on filtrera les deux populations par ce sexe. Cest ainsi que pour un magazine fminin,
si lchantillon sur lequel on travaille est reprsentatif de la population nationale, on opposera
ses lectrices lensemble des femmes et non pas au reste de la population. Car dans ce cas-l,
leffet de sexe tant infiniment plus prgnant que les valeurs vhicules par un organe de
presse, les mots qui caractriseraient ce lectorat seraient essentiellement des mots surnots par
les femmes.

La Smiomtrie

161

A1.9.3). Cette procdure est en fait complmentaire de celle qui vient


dtre dcrite, et, dans la pratique, doit tre mise en oeuvre
simultanment. Elle donne cependant des rsultats moins suggestifs, et
ne sera pas systmatiquement prsente dans le cas des exemples de ce
chapitre.

7.1 Les mots caractristique des hommes et des femmes

Figure 7.1 Mots caractristiques des hommes et des femmes


dans un plan smiomtrique schmatis [2, 3]

La figure 7.1 est tablie partir dune schmatisation du plan


smiomtrique [2,3] qui servira de trame pour la plupart des exemples.
Les mots sur fond noir sont les mots que les hommes sur-notent par
rapport aux femmes (et que celles-ci, donc, sous-notent), les mots

162

Applications de la smiomtrie

encadrs sur fond blanc, ceux quils sous-notent, et, donc, quelles surnotent1. Comme on peut le constater, le rsultat est assez caricatural.
Aux hommes, la violence, le danger, le dtachement et la sexualit ;
aux femmes, la douceur, llgance, la posie, lart et la mode. A noter
que le mot le plus caractristique des hommes est le mot Fusil (en partie
dissimul par le mot Armure)2 et le plus caractristique des femmes,
Bijou, qui sont tous deux gnralement considrs comme des symboles
sexuels de leur genre respectif. Rappelons, pour nuancer cette
interprtation, que le mme plan principal (croisant les axes 2 et 3) est
aussi obtenu lors danalyses conduites sparment pour les hommes et
pour les femmes, phnomne propos duquel nous avions parl de
fractalit. Il existe des hommes qui surnotent Bijou et des femmes qui
surnotent Fusil. Lorsque les deux sexes sont analyss simultanment, les
deux distributions des hommes et des femmes sur le troisime axe
Attachement / Dtachement empitent largement, mais sont trs
lgrement dcales3.

7.2 Les mots caractristiques de deux classes dge


Les deux classes dges choisies pour cet exemple sont les classes
(moins de 45 ans ; 45 ans ou plus). La figure 7.2, dont les rgles de
lecture sont les mmes que celles de la figure 7.1, met en vidence une
opposition trs nette entre les mots caractristiques des deux classes
dge. Les mots sur fond noir sont sur-nots par les moins de 45 ans.
Laxe 2 Devoir / Plaisir tant trs li lge, l encore le rsultat
na rien pour nous surprendre. La question que soulve un tel rsultat est
de savoir quels sont parmi ces mots ceux qui sont le produit dune
opposition dge et ceux dune opposition de gnration. En effet, si
Patrie et Soldat semblent rendre compte dune volution de la socit et
Modration et Recueillement dun mrissement de lindividu, quen estil de Politesse, de Morale ou de Travail ? On voudrait esprer que leur

1. Par souci de lisibilit, seuls les vingt premiers mots sont prsents ici.. En fait il y a 46
mots sur-nots par les hommes et 73 par les femmes, au seuil de 1.96. Pareillement, et pour la
mme raison, dans les exemples qui suivent ne figurent que les vingt premiers mots.
2. La taille des caractres est proportionnelle la valeur-test du mot, autrement dit, plus les
caractres dun mot sont grands, plus celui-ci est caractristique de la catgorie tudie .
3. Sur ce troisime axe, les centres de gravit (points moyens) des hommes et des femmes
sopposent, avec une valeur-test de 20.0 (pour lchantillon global de 15 686 individus).

La Smiomtrie

163

relatif rejet par la partie la plus jeune de la socit nest que momentan
et le fait de cette avidit de vivre propre la jeunesse.
La prsence du mot Thtre parmi les mots sur-nots par les plus gs
est assez surprenante. Si la valeur-test qui mesure sa significativit
ntait pas aussi leve (7.16), on pourrait penser quil sagit dun ala
statistique1. On verra dans un exemple prsent ultrieurement (cf.
section 7.5) que, loin dtre fortuite, elle rvle un phnomne dge
cycle de vie ou gnration ? non dnu dintrt.

Figure 7.2 Mots caractristiques de deux classes dges


dans un plan smiomtrique schmatis [2,3]

1. Les valeurs-test (cf. annexe A1.9.1) doivent tre en thorie extrieures lintervalle
[-1.96, +1.96] pour tre significatives au seuil statistique usuel de 5% (ou : 0.05) dans le cas
dune seule variable, cest--dire dun seul test. Mais nous avons affaire ici un phnomne dit
de comparaisons multiples, car nous faisons autant de tests quil y a de variables. Il sagit
dune difficult dapplication de la thorie des tests reconnue de longue date (cf. annexe
A1.9.2). Une flore de techniques est propose, qui aboutissent recommander un nouveau
seuil plus svre, le calcul de ce nouveau seuil dpendant du type de test utilis. Dans notre
cas, la situation est beaucoup plus complexe, car les mots ne sont pas indpendants, et il
nexiste pas doutil statistique permettant de prendre en compte cette interdpendance.

164

Applications de la smiomtrie

7.3 Les grands amateurs de tlvision


Ce rsultat est issu dune tude ralise pour une chane de tlvision
franaise qui portait sur la consommation des programmes. Le groupe
que nous dfinissons de faon conventionnelle comme les grands
amateurs TV nest pas constitu, comme cela est dusage, des plus gros
consommateurs, cest dire dindividus passant plus de cinq heures par
jour devant leur cran, mais du quartile suprieur des individus regardant
le plus grand nombre de programmes.

Figure 7.3 Mots caractristiques des grands amateurs de tlvision


dans un plan smiomtrique schmatis [2,4]

Laxe le plus discriminant tant laxe 4 ( Sublimation/


Matrialisme 1), les rsultats sont prsents cette fois dans le plan (2,4).
La figure 7.3 montre que les grands amateurs TV ne sur-notent
quun seul mot, Chasse, et encore au seuil de 2.53 ce qui nest pas
vraiment significatif, compte tenu des remarques prcdentes sur les
comparaisons multiples , pour 12 mots sous-nots, dont neuf, Livre,
1. Cet axe tait appel prcdemment Esprit / Matire .

La Smiomtrie

165

Posie, Chercheur, Rflchir, Science, Ecrire, Patience, Protger et


Arbre, corrlent significativement avec le demi axe Sublimation . Le
portrait que ce rsultat esquisse des grands amateurs est peu flatteur,
leur seule caractristique commune tant de rejeter ce qui, dune certaine
manire, fait la grandeur de lhomme, sa facult de matriser ses pulsions
et de les canaliser vers des buts dune plus grande valeur sociale.

7.4 Les mots caractristiques de deux classes de jeunes


(15-19 ans et les 20-24 ans)1
Dans cette application, on calcule les mots que les deux populations
sur-notent un mme moment (par rapport leur population de rfrence
respective) et lon fait apparatre ces mots sur le plan factoriel le plus
pertinent.

Figure 7.4 Mots caractristiques des 15-19 ans et des 20-24 ans
dans un plan smiomtrique schmatis [2,3]

1. Par souci de lisibilit, sur les cartes prsentant deux populations, on ne fait apparatre que
les mots sur-nots par celles-ci, distinguant trois catgories, les mots sur-nots par lune et pas
par lautre et les mots communs.

166

Applications de la smiomtrie

Avec les mots Sauvage, Mystre, Rvolte, Orage, Noir, les 15-19 ans
illustrent assez bien la phrase qui ouvre lAden Arabie de Paul Nizan :
Javais vingt ans, je ne laisserais personne dire que cest le plus bel ge
de la vie . Mais, pass le cap fatidique des 20 ans, les jeunes semblent
commencer prendre plus de plaisir vivre, Moelleux, Rire, Humour. La
cause en est, peut-tre, quils en dcouvrent les voies, Dsir, Sduire.
Ce rsultat na rien de surprenant et chacun, qui se rappelle ses
orageuses annes de ladolescence, en conviendra aisment. Mais que
lon puisse faire apparatre dune manire la fois aussi forte et vidente,
ce lent glissement de lpre dtachement, marqu par lexpression de la
pulsion de destruction, de ladolescent qui cherche encore son identit et
sa place dans la socit, vers une relation plus harmonieuse avec luimme et avec les autres, illustre ltonnant pouvoir de la statistique de
rvler des phnomnes dont la prsence, parce que trop diffuse, semble
parfois dfier lobservation.

7.5 Les mots caractristiques de deux classes dge au


del de 60 ans
Les deux tranches dge (60-64 ans ; 65 ans et plus), comme on
pouvait sy attendre, investissent toutes deux massivement les valeurs de
Devoir . Sur les vingt premiers mots les plus fortement sur-nots,
quinze, pour lune comme pour lautre, sont des mots de Devoir . Sur
ces quinze mots, neuf sont communs, Morale, Patrie, Industrie,
Honneur, Fermet, Tradition, Elite, Modration et Produire. Entre les
six mots sur-nots par lune et pas par lautre, il nexiste quune trs
faible nuance qui sestompe, dailleurs, si les mots suivants sont pris en
compte , la tranche des 60-64 ans se distinguant par des valeurs plus
relationnelles , Politesse, Respect, Honnte, celle de 65 ans et plus, se
dtachant de ces contingences pour porter son regard vers un au-del qui
se profile, Recueillement, Prtre, Sacr. Mais on observe des diffrences
plus sensibles sur les axes 4 ( Sublimation / Matrialisme ) et 5
( Idalisation / Pragmatisme ).
Si les personnes des deux tranches dge investissent pareillement des
valeurs de Sublimation et d Idalisation , plutt que de
Matrialisme et de Pragmatisme , les personnes de 65 ans et plus
le font beaucoup plus nettement : six mots de Sublimation , Livre,
Thtre, Art, Charitable, Recueillement et Prtre, contre quatre, pour les
60-64 ans, Justice, Maternel, Honnte, Dieu, et cinq mots dIdalisation,

La Smiomtrie

167

Thtre1, Noble, Recueillement, Prtre et Sacr contre un seul, Dieu


encore que le mot Dieu arrive en vingt-sixime position pour les 65 ans
et plus, et avec une valeur de test de 3.93.

Figure 7.5 Mots caractristiques des 60-64 ans et des 65 ans et plus
dans un plan smiomtrique schmatis [2,3]

1. Un mme mot, bien sr, peut corrler avec plusieurs axes, chacune de ses piphanies
rvlant une de ses dimensions smantiques. Il est clair que le Thtre de l"Idalisation", que
connotent les mots Crmonie, Reine, Roi, Bijou, Chteau, Parfum, Masque, Magie, etc., nest
pas le mme que celui de la Sublimation , que connotent les mots Chercheur, Enseigner,
Inventeur, Question, Art, Livre, Etranger, Paix, Pardon, Modestie, etc. De mme que le
Mariage du Devoir , que connotent les mots Fidlit, Honnte, Respect, Politesse, etc., nest
pas le mme que celui de l Attachement , que connotent les mots Confort, Maternel,
Naissance, Confiance, Amiti, Tendresse et Douceur, celui-l voquant plutt le mariage vu
comme une institution, celui-ci, comme le cadre dune relation damour entre deux tres. Il y a
pareillement une Frontire du Dtachement , que connotent les mots Rigide, Fermer,
Rompre, Muraille, Masque, Angoisse, etc., cest la frontire qui isole le sujet en rejetant lautre,
la mauvaise frontire, et une Frontire du Devoir , que connotent les mots Mariage,
Proprit, Rgle, Morale, etc., cest la frontire qui distingue et organise, cratrice et garantie
de lordre autant social que mental, la bonne frontire.

168

Applications de la smiomtrie

Ce glissement le long des axes 2, 4 et 5 est peut-tre un effet de


lge : aprs 65 ans, les pulsions commencent sexprimer moins
fortement et il est donc plus facile de les contrler et subsquemment, de
les sublimer. Ce glissement est aussi, vraisemblablement, d au passage,
avec la retraite, dune vie professionnelle active, qui laisse peu de place
au rve et la rflexion, une vie plus contemplative.

7.6 Hommes et femmes ayant attribu la note 7 au mot


Dieu
Pour bien comprendre les rsultats prsents sur la figure 7.6, il faut
avoir prsent lesprit la manire dont nous avons procd : afin
dliminer leffet de sexe dont la prgnance aurait masqu les subtiles
diffrences entre les notations fminines et masculines, nous avons
oppos sparment les hommes et les femmes ayant attribu la note 7 au
mot Dieu1 ceux lui ayant attribu une note infrieure. Les deux
rsultats ont t projets ensuite sur une mme carte.

1. Rappelons que les modalits proposes aux interviews varient de 3 (sensation trs
dsagrable) + 3 (sensation trs agrable) mais, pour des raisons de commodit de saisie et de
traitement, les notes sont ensuite recodes de 1 7.

La Smiomtrie

169

Figure 7.6. : Mots caractristiques des hommes / femmes ayant donn la


note 7 au mot Dieu dans un plan smiomtrique schmatis [2, 3]

Les mots sur fond noir sont ainsi les mots caractristiques des
hommes rpondant que les vocations du mot Dieu provoquent en eux
des sensations trs agrables par rapport ceux qui les trouvent moins
agrables, voire trs dsagrables. Les mots encadrs sur fond blanc sont
les mots caractristiques des femmes pour qui le mot Dieu provoque des
sensations trs agrables, par rapport aux autres femmes. Les mots sur
fond gris sont leurs mots communs.
Le rsultat tel quil apparat sur la carte est si paradoxal quon est,
dans un premier temps, tent de penser une quelconque erreur de
codage ou de manipulation.
En effet, les mots sur-nots par les hommes sont des mots voquant
des valeurs traditionnellement rputes fminines, Mariage, Fidlit,
Famille, Maternel, Consoler, tandis que les mots des femmes semblent

170

Applications de la smiomtrie

plutt appartenir au registre des valeurs masculines , Honneur, Hros,


Tradition, Btisseur, Perfection, Elite1.
Mais, vrifications faites, il nen est rien, et force est, donc, de nous
interroger sur cet trange rsultat.
On constate dabord que les mots qui caractrisent les hommes sont
plus de lordre de la relation la mre qu la femme dune manire
gnrale, quils expriment avant tout une demande de protection contre
labandon, Fidlit et le chagrin, Consoler, demande que le petit enfant,
dans sa dtresse, adresse sa mre ; et que, symtriquement, les mots qui
caractrisent les femmes expriment une mme demande de rassurance,
mais qui est, elle, adresse au pre, ce hros au regard si doux , ce
Btisseur gardien dune Tradition sur laquelle staye le moi fragile de
lenfant en voie ddification. Il sagit, bien sr, plus dimages idales du
pre et de la mre, produits de fantasmes infantiles, que dune ralit
objective. Mais ne dit-on pas que le concept de Dieu est le produit dune
image idale du pre (ou de la mre) ? Alors, ce que montrerait ce
rsultat, cest que, par leffet dun surprenant chass-crois, le Dieu des
hommes est, statistiquement, plutt maternel, ce serait le Dieu de
misricorde, tandis que le Dieu des femmes est plutt paternel, ce serait
le Dieu qui a dit laptre : Pierre tu es pierre, et sur cette pierre je
btirai mon Eglise, et les puissances du mal ne prvaudront pas contre
elle 2.
Mais nous ne sommes ni des thologiens ni des psychologues,
seulement des statisticiens qui sefforcent de mesurer des phnomnes
complexes avec le plus de prcision et dexactitude possible. Les
interprtations prsentes ninterviennent qu titre dillustration. Elles
voudraient attirer lattention des spcialistes concerns, et suggrer des
pistes de recherche.

1. Dans ltude, portant sur 8 292 individus reprsentatifs de la population franaise, do


ces donnes sont extraites, les six mots caractristiques des hommes aimant le mot Dieu, sont
tous des mots sur-nots par lensemble des femmes de lchantillon, et avec des valeurs test
non ngligeables : Maternel (16.08), Fidlit (7.53), Consoler (5.86), Famille (4.26), Mariage
(3.93) et Honnte (2.23). Les mots sur-nots par les femmes aimant le mot Dieu sont moins
nettement masculins . Seuls deux sont significativement sur-nots par les hommes de
lchantillon : Btisseur (4.46) et Elite (2.36).
2. Matthieu, 16, 18.

La Smiomtrie

171

7.7 Evolution des valeurs des Franais entre 1996 et 1998


Les deux derniers exemples prsents sont relatifs des comparaisons
entre deux chantillons dune mme population, interrogs deux
moments diffrents.
Comme on la vu prcdemment, dans les analyses synchroniques, la
population de rfrence est (pratiquement) toujours le complment de la
population tudie. Dans les analyses diachroniques, elle est constitue
par un second chantillon ayant la mme structure mais interrog
antrieurement. On prendra donc garde, en observant les rsultats, de ne
pas confondre les deux approches. La premire caractrise, un moment
donn, les valeurs dune population donne par rapport une autre. Si
cette autre population est le complment de la population tudie par
rapport la population totale, ce qui est gnralement le cas, on peut
considrer que les mots quelle sur-note reprsentent ce que lon peut
dsigner par son systme de valeurs relatif1. La seconde approche
caractrise une population donne par rapport un population
homothtique observe un moment antrieur. Dans ce cas, les mots
quelle sur-note nindiquent pas son systme de valeurs mais lvolution
de celui-ci pendant la priode sparant les deux observations. Elle est
donc une mesure doublement relative.
Ce type danalyses permet de mettre en vidence certains aspects de
lvolution travers le temps des valeurs dune population.
La prsente application a t ralise partir de deux chantillons
contrls pour leurs caractristiques de base de 2 764 individus
reprsentatifs de la population franaise. Ces chantillons sont extraits du
panel postal de T.N. Sofres appel Mtascope. Si ce panel, comme tout
panel, prsente des biais non identifiables dus au fait que, par dfinition,
il ne prend pas en compte les individus qui nacceptent pas den faire
partie, la constance des rgles qui prsident sa gestion en fait un terrain
propice des comparaisons temporelles. Il est a priori peu probable que
les diffrences observes entre les deux chantillons puissent tre
uniquement des artefacts induits par des modifications de structure entre
1. Nous posons que lensemble des mots sur-nots par une population par rapport un autre
dont elle est le complment peut tre considr comme reprsentant son systme de valeurs
relatif, si celle-ci est son complment par rapport une population reprsentative de lunivers
dans lequel on se place. Par exemple, les mots surnots par les lecteurs de tel titre de la presse
quotidienne nationale par rapport lensemble des lecteurs de cette presse reprsentent le
systme de valeurs de ceux-ci considr du point de vue de cet ensemble. Il est clair que si lon
oppose les lecteurs de ce titre lensemble des Franais, le rsultat sera notablement diffrent.

172

Applications de la smiomtrie

ces chantillons. Beaucoup dindices, au contraire, nous conduisent


penser quelles sont le reflet dune volution dans la sensibilit, sinon les
mentalits, des Franais au cours de cette priode. Les analyses ralises
dans la section 5.8 du chapitre 5 ont dailleurs mis en vidence la mme
tendance au cours de toute la priode 1990 2002, sur un ensemble
beaucoup plus tendu de six vagues denqutes.
Sur la figure 7.7 les mots sur fond noir reprsentent les mots sur-nots
par les Franais de 1998 par rapport ceux 1996.

Figure 7.7 : Mots caractristiques des annes 1996 et 1998


dans un plan smiomtrique schmatis [2, 3]

Ce glissement le long de laxe Attachement / Dtachement


caractrise, on la vu en section 5.8, lensemble de la priode 1990
2002. Nous avions not alors que lattitude par rapport au questionnaire,
matrialise par la faon de noter, variait pendant la mme priode dans
le sens dune indiffrence et dune distance accrue vis--vis de lenqute.
On pourrait interprter cette volution comme une crise de
pessimisme ou, dans la veine de lessai dinterprtation du chapitre 6, en

La Smiomtrie

173

nous plaant dun point de vue freudien, une mergence de la pulsion de


destruction dans la socit franaise.
Cette interprtation rejoint dailleurs des diagnostics manant
dhorizons extrmement divers, comme ceux dAlain Ehrenberg ou de
Tony Anatrella. De ce dernier, nous retiendrons surtout la description
suivante : Nous sommes dans le climat suicidaire dune socit qui
privilgie les ruptures et les dliaisons. Il faut rompre et briser pour se
donner limpression dexister (divorce et suicide pour saffranchir,
avortement et euthanasie par dtresse ou par compassion : de curieuses
motivations lies la pulsion de mort). Il faut sclater pour mieux fuir et
schapper de la vie en consommant des anesthsiants, des stimulants ou
des hallucinognes ; rester dans le primaire, le glauque () il faut casser
le lien social, vacuer des dsirs et des motions dont on ne sait que faire
et dtruire toute ralit institutionnelle. 1
Le trait peut paratre outr, mais notre rsultat, produit dune mesure
rigoureuse et aveugle, semble abonder dans le mme sens. Il faut
rompre et briser , casser le lien social , rester dans le primaire, le
glauque , mais nest-ce pas ce quexpriment les mots Muraille (valeurtest : 11.1), Dsert (10.1), Masque (8.7), Rigide (8.6), Punir (8.3),
Rompre (8), Doute (7.9), Danger (7.6), Faute (6.9), Immobile (6.6),
Sauvage (6.1), Cri (5.6). Il faut () vacuer des dsirs et des
motions dont on ne sait que faire , mais nest-ce pas ce quexprime le
rejet relatif des mots Sublime (-9.3), Voluptueux (-8.8), Emotion (-8.6),
Moelleux (-7.7), Douceur (-7.2), Rire (-7.1), et dtruire toute ralit
institutionnelle : Crateur (-11.6), Elite (-10.6), Robuste (-9.2),
Matriser (-7.8), Construire (-7), Efficace (-11), Respect (-8.9), Honnte
(-7.8), Honneur (-7.7) ?
Il nous semble quil y a comme un air de famille entre le discours
clinique prcdent et cette litanie de mots, slectionns selon des critres
statistiques aveugles. Les deux approches paraissent dcrire un mme
phnomne de socit, une mme ralit sociale dans laquelle nous
1. Dans son livre Non la socit dpressive (Champs, Flammarion, Paris, 1995), Tony
Anatrella, prtre, psychanalyste et professeur de psychiatrie sociale, tente une explication de
cette mergence de la pulsion de destruction dans les socits modernes, partir du dficit
didal. On lira aussi avec le plus grand intrt louvrage dAlain Ehrenberg, directeur de
recherches au CNRS, La fatigue dtre soi (Ed. Odile Jacob, Paris, 1998) qui montre dune
manire assez convaincante comment nous avons substitu la vieille culpabilit bourgeoise
(et ) la lutte pour saffranchir de la loi des pres (Oedipe), la peur de ne pas tre la hauteur,
le vide et limpuissance qui en rsultent (Narcisse) , cest dire comment nous avons
substitu la nvrose maladie de la loi , la dpression maladie de linsuffisance .

174

Applications de la smiomtrie

sommes immergs et que nous avons spontanment peine saisir dans sa


globalit, faute dtre capables de nous en extraire pour pouvoir
distinguer la part des faits et celle des fantasmes que nous projetons sur
eux dans lespoir hlas souvent du ! de neutraliser leurs effets
anxiognes.
Mais ce nest, bien sr, quune interprtation et nous laissons chaque
lecteur le soin de se faire la sienne.
Toutefois, ltude dvolution prsente dans la section 5.8 du
chapitre 5, qui prend, elle, en compte six annes denqutes rparties
entre 1990 et 2002, et qui porte sur plus de 15 000 interviews, confirme
ce glissement vers le Dtachement de lensemble de la population1.
Rappelons que ce Dtachement va de pair avec ce que lon peut
appeler un dtachement vis--vis des enqutes elles-mmes, un
dsengagement, se manifestant par une moindre utilisation des notes
extrmes.

7.8 Conclusion
Caractriser des groupes dindividus (cest--dire dans la pratique les
consommateurs dune marque ou dun produit, les clients dune grande
entreprise de service, les lecteurs dun quotidien ou dun magazine)
par des mots, et positionner ces mots dans un espace dont les dimensions
ont du sens, est le mode de valorisation de loutil smiomtrique qui a t
retenu dans les exemples de ce chapitre. Dans le contexte purement
mthodologique du prsent ouvrage, nous avons travaill avec des
groupes dindividus plus conventionnels dfinis par les variables sociodmographiques de base essentiellement, montrant ainsi les ouvertures et
potentialits de loutil dans les domaines des applications sociologiques
ou socio-conomiques.
Comme lors des chapitres prcdents, les commentaires et
interprtations sont surtout des invitations commenter et interprter. Ce
sont des exemples propos dexemples. Comment pourrait-il en tre
autrement compte tenu de la richesse et de la complexit de ce nouveau
paysage statistico-smantique ?

1. Notons que ce glissement concerne aussi bien les hommes que les femmes, bien que ces
deux catgories de rpondants occupent des positions significativement diffrentes le long de
laxe Attachement / Dtachement en dbut comme en fin de priode.

La Smiomtrie

175

Les interprtations des travaux plus commerciaux ou industriels,


sinscrivant dans une stratgie et un cadre dcisionnel bien circonscrits,
seront en gnral plus cibles. A lheure de lergonomie, des interfaces
hommes-machines, des analyses sensorielles, des mdias et du
multimdia, de la prise en compte gnralise de la qualit de la vie, les
positionnements que permet loutil smiomtrique apportent aux
dcideurs des matriaux pour la comprhension des maillons les plus
nigmatiques de la chane production-consommation.
Nous aurons cependant atteint notre but si, partir de ce choix
restreint dexemples, le lecteur peut avoir une ide de la richesse et de la
spcificit de lapproche smiomtrique, et sil peut maintenant mieux
entrevoir les perspectives offertes par en matire de description et
danalyse.

Conclusion
Jamais un questionnaire denqute naura t si simple dans la
conception de ses questions. Jamais un questionnaire naura t si neutre,
si primaire pourrait-on dire, pour ce qui est des ractions aux stimuli
proposs : agrables ou dsagrables. Cest donc une simple liste de mots
qui, bien quelle puisse paratre quelque peu arbitraire, a permis de
mettre en vidence des traits structuraux sous forme de dimensions
stables.
Il aura fallu procder des compltions de dizaines de milliers de
questionnaires pour valider ces traits structuraux dans le temps et dans
lespace et pour tablir un repre socio-culturel permettant de positionner
des individus et des groupes dindividus. Malgr lpreuve prilleuse de
la traduction, les mmes traits apparaissent dans plusieurs pays
diffrents, confirmant ainsi que les rsultats ne dpendent pas de la
composition exacte de la liste, et que la structure obtenue nest ni locale,
ni nationale.
Par sa transparence, sa distance vis--vis de lactualit, ce repre est
propice des comparaisons intergnrationnelles, interrgionales et
internationales. Mais on peut aussi positionner dans ce repre, en
procdant des enqutes ad hoc , des attitudes, des opinions, des
produits, des supports mdiatiques

176

Conclusion

Cet outil tonnant a lui-mme t objet de recherches, exposes en


dtail au cours des chapitres qui prcdent, et il continuera ltre.
La seule hypothque resterait le choix de la liste de mots. Plusieurs
des travaux prsents dans cet ouvrage montrent prcisment que ce
choix ne constitue pas une hypothque dirimante, et que le caractre
opratoire de cette liste laisse augurer dautres rsultats et dautres
dveloppements.
Une faon pragmatique de vivre cette hypothque , dfaut de la
lever, est de dire que lon observe non pas une structure universelle, mais
la trace de ce qui pourrait tre une structure universelle. Un
questionnaire total , aussi fictif et utopique que le doctorat total de
Ionesco, permettrait dobserver cette structure. La liste de mots retenue
nen retient quune trace qui en est une sorte de projection, conditionne
la fois par des critres de cot et de faisabilit. Sil est pratiquement
impossible de prouver que cette projection est optimale vis--vis de
ces critres, nous avons montr quelle nest ni fragile, ni sans intrt.
On ne stonnera pas de nous voir tirer des enseignements et tracer
des perspectives de travail et de recherche dans des registres trs
divers, relevant de la statistique mathmatique, de la sociologie, de la
linguistique, enfin de la mthodologie denqute.
Comment passe-t-on du plaisir au sens ?
Cette premire interrogation est suscite par la simplicit mme du
questionnement. Comment des questions fondes uniquement sur des
sensations agrables ou dsagrables peuvent-elles dboucher sur une
structure smantique locale aussi fine ou sur une architecture globale
de valeurs aussi stable ? Lmotion et la satisfaction jouent probablement
un rle important dans lacquisition du langage comme dans tout
apprentissage, et mme, certainement, dans la construction progressive
dune langue. Au niveau de cet atome linguistique quest le mot, peu
dautres qualifications bipolaires pouvaient sappliquer de faon
exhaustive. Le caractre opratoire des rponses obtenues fut une preuve
(agrable) du caractre judicieux de lchelle choisie.
Des travaux de recherche complmentaires restent cependant mener
pour mieux analyser les mcanismes qui ont effectivement conduit de
lagrable au pertinent. Dans le cas du questionnaire ouvert utilis au
chapitre 4, pour lequel il ne sagit plus de noter une liste fixe de mots, il
est possible que le concept d importance soit plus adquat que celui
d agrment , pour oprer une slection et un filtrage plus svres et

La Smiomtrie

177

limiter ce faisant le caractre peut-tre trop ludique, dans ce contexte


libre, de lexercice. Ce caractre ludique contribue, on la vu, lextrme
dispersion du vocabulaire dans les rponses individuelles.
Les travaux sur les questions ouvertes devraient donc susciter de
nouvelles recherches, comportant des phases dexprimentation assez
lourdes.
Enseignements sur les enqutes tendant mesurer les
volutions et aussi sur lvolution des enqutes
Il est gnralement admis que les mesures de diffrences entre
rponses des questions subjectives, diffrences dans le temps ou entre
catgories, sont beaucoup plus justifies et prudentes que des mesures
absolues. Les rsultats obtenus propos de la drive simultane de
linstrument dobservation et de la ralit observe sont une (petite)
pierre dans le jardin de ceux qui pensent quil est toujours licite
dobserver les volutions dune question dont le libell est fixe dans le
temps. Lextrme homognit et la relative intemporalit des
questions du questionnaire smiomtrique permet dtudier assez
finement ces phnomnes dattitudes ainsi que les problmes de
participation et de notations. Lvolution dans le temps1 illustre bien
labsence de neutralit et donc limplication de linstrument
dobservation la fois dans les rsultats observs et dans la qualit de ces
rsultats2.
Le modle smiomtrique et la double convergence
Parmi les apports fondamentaux des techniques statistiques connues
sous le nom danalyse des donnes3, nous citerons dune part le
renouveau dintrt apport aux individus dans les enqutes, ou plus

Section 5.8 du chapitre 5.


Notons que la dgradation trs progressive de la participation aux enqutes, qui concerne
la fois les refus a priori et la qualit des compltions est un phnomne assez largement
observ dans les instituts de sondage et dans les instances de contrles de la profession. Le
questionnaire smiomtrique, et aussi, nous lavons vu, le questionnaire ouvert du chapitre 4,
peuvent contribuer tudier certains aspects de ce phnomne, en particulier lengagement et
le degr de participation, pour les personnes ayant accept de rpondre.
3
Ces techniques sont apparues dans les annes 70, notamment en France, sous limpulsion
de Jean-Paul Benzcri (1973) qui prconisait une totale rcriture de la science statistique
prenant en compte les nouvelles possibilits de linformatique.
2

178

Conclusion

exactement la dimension individu 1, et, dautre part la prise en


considration de variables pouvant tre trs nombreuses.
Corrlativement, les modles probabilistes classiques, peu ralistes parce
que beaucoup plus contraignants dans le cas multivari que dans le cas
dune ou deux variables, sont moins utiliss, laissant souvent la place
des mthodes de validation empiriques base de calculs intensifs comme
les techniques de bootstrap auxquelles il a t largement fait appel dans
cet ouvrage. A la fois les individus gagnaient en importance, et les
variables se banalisaient, autrement dit, les lignes (en gnral : les
individus) et les colonnes (en gnral : les variables) du tableau classique
de donnes jouaient des rles de plus en plus symtriques2.
Do une potentialit de double convergence selon les lignes
(individus) et/ou les colonnes (variables) qui gnralise en quelque sorte
la loi des grands nombres et dautres lois limites de la statistique, fondes
sur la multiplication linfini des seuls individus Ces problmes sont
simplement voqus ici, mais appartiennent une direction de recherche
importante.
Ce nouveau regard sur les tableaux de donnes fut, et sera, car il sen
faut de beaucoup que ces innovations aient pntr toutes les disciplines,
trs enrichissant pour beaucoup dapplications en sciences humaines. La
multiplication des variables change la nature des problmes.
Les praticiens dtudes de march savent bien que quelques interviews
trs riches valent parfois mieux que des centaines dinterviews pauvres
ce que les cliniciens ont su de tous temps. A la limite, risquons la
boutade suivante : les Essais de Montaigne (chantillon de taille : 1) nous
apprennent beaucoup plus, sur lhomme en gnral et lhomme du
XVIme sicle en particulier, que ne laurait fait une enqute de
satisfaction auprs de quelques milliers de ses contemporains. Montaigne
en est dailleurs bien conscient lorsquil crit : Chaque homme porte la
forme entire de lhumaine condition , ce que Sartre exprimera de faon
plus lapidaire : Tout homme est tout lhomme 3.

Les individus statistiques (ou observations) ne servaient qu calculer des moyennes ou


des corrlations, et, dtail significatif, ntaient que rarement reprsents sur les graphiques
avec des identificateurs.
2
Dailleurs lopration mathmatique de compression qui est la base des mthodes
factorielles, la dcomposition aux valeurs singulires, fait jouer un rle symtrique aux lignes
et aux colonnes (cf. annexe A1.2).
3
Sartre J.-P. (1980) Les Mots, Gallimard, Paris.

La Smiomtrie

179

Et la smiomtrie dans tout a ? Elle constitue lexemple


emblmatique de ce paradigme, le leading case de la double
convergence1. En effet, il existe une population parente des lignes (la
population franaise, par exemple) et une population parente des
colonnes (le vocabulaire de la langue franaise, pour le mme exemple).
Peu de questionnaires se trouvent dans une situation thorique aussi
favorable. Mais prendre simplement des mots au hasard dans un
dictionnaire engendrerait, au centuple, les difficults2 rencontres
propos du questionnement ouvert du chapitre 4. Paralllement aux
travaux thoriques quil serait intressant de mener sur ce modle
statistique complexe, les exprimentations venir devront aussi porter
sur les problmes de slection et dchantillonnage de mots.
Structure globale, fractale ou individuelle ?
Si lon effectue des mesures sur des individus, les corrlations
traduisent bien une liaison mesure au niveau individuel. Certains notent
bien la fois les mots Discipline et Patrie, dautres les notent moins
bien, mais il y a peu dindividus qui notent bien Discipline et mal Patrie.
La corrlation vient prcisment de cette cohrence interne chaque
individu, cohrence que la composition du questionnaire permet de
vrifier, et que les quelques lgres redondances existant dans le
questionnaire permettent de conforter. Sil existe une structure de
corrlation, significative statistiquement, sur un chantillon de n
individus pris au hasard, on doit retrouver la mme structure sur un autre
chantillon au hasard, ou dans un sous chantillon pris galement au
hasard.
Ce nest pas propos de ce phnomne classique que lon a pu parler
de fractalit, mais propos du phnomne plus paradoxal suivant : des
catgories semblent sopposer sur certains axes de faon significative. En
segmentant selon ces catgories, on prend un sous-chantillon
dlibrment non alatoire. Et lon stonne, cette fois, de retrouver la
mme structure lintrieur de ces sous-catgories. Dans le cas de
1

Lexemple le plus pertinent permettant dtudier lvolution (la limite) du phnomne


lorsque le nombre de lignes et le nombre de colonnes augmentent indfiniment.
2
Ouvrons le Petit Robert au hasard et pointons, aveuglment, sur des mots : dmission,
hectare, monazite, papane, prlude, rabattre, toupie . Les limites de faisabilit sont tout de
suite perceptibles : il faut se restreindre aux mots connus a priori de tout chantillon de
rpondants (une petite fraction des entres dun dictionnaire), puis introduire une srie de
contraintes qui conduisent finalement un protocole analogue (mais pas forcment identique)
celui qui a prvalu lors des premiers essais smiomtriques (cf. chapitre 1).

180

Conclusion

lopposition homme-femme, la surprise vient peut-tre dune


identification htive de certains archtypes. La liaison trs significative
entre les mots de l Attachement et lappartenance au sexe fminin
fait penser que la diffrence entre sexes est seule responsable de la
formation de laxe Attachement / Dtachement . Lexistence de la
mme opposition lintrieur de chaque sexe montre donc que
lopposition entre sexes nest en aucune faon responsable de la
structure1.
En fait, ce que lon apelle ici fractalit pourrait tre simplement la
validit quasi-individuelle dune structure qui serait alors la fois
smantique et psycho-culturelle. Les proximits locales observes sur les
cartes smiomtriques sont influences par les liens smantiques qui sont
universels parce que propres au vocabulaire dune langue commune
tous les rpondants. Les grandes oppositions observes sur les axes
principaux proviennent de facteurs latents qui pourraient dpendre dune
organisation psychique indissociable dun cadre culturel gnral (de
rfrences, de valeurs) galement commun tous les rpondants, avec
parfois des nuances dclinables selon certaines catgories sociodmographiques. Le lecteur aura compris que les conditionnels dsignent
en fait des thmes dapprofondissement et de recherche venir.
Pour une statistique structurale
Ce nest pas une activit courante de la statistique que de mettre en
vidence des structures caches, bien que cette dmarche soit
historiquement apparue ds le dbut du vingtime sicle - dans le cadre
de modles spcifiques - avec les travaux des psychologues factorialistes.
Nous nous sommes intresss dans cet ouvrage la notion de fait
statistique, en considrant les outils utiliss (analyses en composantes
principales, classifications, cartes de Kohonen) comme de simples
instruments dobservation du multidimensionnel au mme titre que les
microscopes ou des appareils radiographiques2 sont des instruments
dobservation du petit ou de lopaque. En utilisant une importante

Celle-ci est stable mme lintrieur de la plupart des catgories socio-dmographiques


usuelles mais lordre des axes peut cependant tre modifi : ainsi le second axe, fortement li
lge des rpondants, passe au troisime rang si lon analyse une tranche dge troite comme
la tranche dge 40-45 ans.
2
Les thories et mcanismes qui prsident la ralisation dun microscope nont pas ou
peu de rapport avec les proprits morphologiques des animalcules, cellules ou autres objets
observs. Ils ne supposent aucune modlisation des objets observs.

La Smiomtrie

181

panoplie de procdures de validation (mthodes de rchantillonnage


spcifiques, recodages, transformations analytiques diverses, procdures
empiriques extensives), nous avons montr que lon pouvait extraire des
structures valides sans se contenter de contempler des patterns
suggestifs. En fait, on commence seulement pouvoir mettre en uvre
les outils qui permettent de donner un caractre de scientificit aux
techniques danalyse des donnes conues il y a plusieurs dcennies1
et cest cette dmarche de recherche de faits statistiques ou de traits
structuraux valids qui a t dsigne par lexpression statistique
structurale. Les travaux prsents dans les chapitres prcdents
pourraient paver le dbut dun chemin menant vers une telle branche
disciplinaire.

Si les statisticiens spcialistes ont utilis ces instruments dobservation avec le


discernement et le recul critique indispensable, beaucoup dusages malheureux furent
cependant dplorer, en particulier cause de labsence de cadre conceptuel pouvant accueillir
les nouvelles visualisations. Lanalogie est assez frappante avec la diffusion des premiers
microscopes telle que la dcrit Franois Jacob dans Logique du vivant : Quand
Leeuwenhoeck contemple pour la premire fois une goutte deau au microscope, il y trouve un
monde inconnu, des formes qui grouillent Mais la pense na alors que faire de tout ce
monde cette dcouverte permet seulement dalimenter les conversations .

ANNEXE 1
Quelques lments
de statistique multidimensionnelle
Les mthodes danalyse statistique exploratoire utilises au cours des
chapitres prcdents visent mettre en forme de vastes ensembles de
donnes, en dgager des structures et valider ces structures. Elles
relvent de la statistique exploratoire multidimensionnelle, de lanalyse
des donnes, ou encore du Data Mining, ces trois dsignations tant
peu prs quivalentes dans le cadre des utilisations de cet ouvrage. Nous
avons utilis leur propos lexpression statistique structurale pour
marquer limportance accorde la phase de validation des structures.
Ces mthodes gnralisent la statistique descriptive classique et utilisent
des outils mathmatiques assez intuitifs, mais plus complexes que les
moyennes, variances et coefficients de corrlations empiriques de la
statistique descriptive.
Sont prsents dans cette annexe les principes des techniques utilises
ou voques dans les chapitres prcdents, lanalyse en composantes
principales tant la technique danalyse factorielle de base des
applications smiomtriques. Certains dveloppements de louvrage not
[SEM 2006]1 seront repris ; ils seront complts par des travaux plus
rcents sur les mthodes de validation, et en particulier sur les techniques
1. Statistique Exploratoire Multidimensionnelle, [Visualisation et infrence en fouille de
donnes] , 4me ed. L.Lebart, M. Piron, A. Morineau. Dunod, 2006.

184

Annexe Statistique

dites de bootstrap, sur les cartes de Kohonen, ou sur des techniques


danalyse moins utilises comme lanalyse logarithmique.

A1.1 Rappel des principes des mthodes exploratoires


multidimensionnelles
Les mthodes exploratoires multidimensionnelles recouvrent un grand
nombre de techniques qui ont pour objectif de dcrire et synthtiser
linformation contenue dans de vastes tableaux de donnes.
A1.1.1 Reprsentation gomtrique et nuages de points
Au dpart, les donnes se prsentent sous forme de grands tableaux
rectangulaires, nots X. Les lignes (i=1,,n) du tableau reprsentent les
n individus, les sujets enquts par exemple, et les colonnes (j=1,m)
les m variables qui peuvent tre des mesures, des caractristiques ou
encore des notes releves sur les individus.
Afin de comprendre le principe des mthodes de statistique
exploratoire multidimensionnelle, il est utile de reprsenter de faon
gomtrique lensemble des n individus (n lignes) et lensemble des m
variables (m colonnes) comme deux nuages de points, chacun des deux
ensembles tant dcrit par lautre. On dfinit alors, pour les deux nuages,
des distances entre les points-lignes et entre points-colonnes qui
traduisent les associations statistiques entre les individus (lignes) et entre
les variables (colonnes).
Tableau A1.1 :
Exemple de tableau X de notes (de 1 7)
attribues : m = 7 mots, par n = 12 rpondants
mots arbre
Rpondants
R01
7
R02
6
R03
4
R04
5
R05
4
R06
5
R07
4
R08
4
R09
6
R10
6
R11
7
R12
2

cadeau
4
3
5
5
5
7
2
1
6
6
7
2

danger morale
2
1
3
1
2
1
1
5
2
3
6
1

2
2
4
7
7
5
3
4
4
5
7
2

orage
3
4
3
2
1
2
5
5
7
3
7
1

politesse
1
1
4
7
6
6
3
4
5
6
6
3

sensuel
6
7
3
1
2
5
6
7
5
6
7
2

La Smiomtrie

185

Dans le cas de la smiomtrie, un mot (variable) est un point dont les


coordonnes sont les notes donnes par les n individus (rpondants) : le
nuage des m mots se situe dans un espace n dimensions. De mme, un
individu est un point dont les coordonnes sont les notes attribues aux m
mots ; le nuage des n individus se trouve dans un espace m dimensions.
Les figures A1.1 et A1.2 illustrent, partir du tableau A1.1 contenant
les notes attribues 7 mots par 12 rpondants, la reprsentation de ces
deux nuages de points intrinsquement lis.
Le nuage des points-mots est construit dans lespace des individus, ici
partir seulement de deux individus, R04 et R08, car deux dimensions
rendent possible un graphique dans un plan (cf. figure A1.1).

R01
R02
R03
R04
R05
R06
R07
R08
R09
R10
R11
R12

arbre cadeau
7
4
6
3
4
5
5
5
4
5
5
7
4
2
4
1
6
6
6
6
7
7
2
2

danger
2
1
3
1
2
1
1
5
2
3
6
1

morale
2
2
4
7
7
5
3
4
4
5
7
2

orage
3
4
3
2
1
2
5
5
7
3
7
1

politesse
1
1
4
7
6
6
3
4
5
6
6
3

sensuel
6
7
3
1
2
5
6
7
5
6
7
2

Figure A1.1 : Reprsentation du nuage des mots


dans lespace des deux rpondants R04 et R08

186

Annexe Statistique

De la mme faon, le nuage des 12 rpondants est construit dans


lespace des variables, ici partir de deux mots, Morale et Sensuel, cest-dire dans un espace de deux dimensions (cf. figure A1.2).
Pour chacun des nuages est reprsent le point moyen appel aussi
centre de gravit. Il sagit de G pour le centre de gravit des notes
attribues par les rpondants (cf. figure A1.1) et de G pour celui des
rpondants ayant nots les deux mots retenus.
R01
R02
R03
R04
R05
R06
R07
R08
R09
R10
R11
R12

arbre
7
6
4
5
4
5
4
4
6
6
7
2

cadeau danger morale


4
2
2
2
3
1
4
5
3
7
5
1
5
2
7
7
1
5
3
2
1
1
5
4
6
2
4
6
3
5
7
6
7
2
1
2

orage
3
4
3
2
1
2
5
5
7
3
7
1

politesse
1
1
4
7
6
6
3
4
5
6
6
3

sensuel
6
7
3
1
2
5
6
7
5
6
7
2

Figure A1.2 : Reprsentation du nuages des rpondants dans


lespace des mots Sensuel et Morale

A1.1.2 Principe et mthodes danalyse


Sil est toujours possible de calculer des distances entre les lignes et
des distances entre les colonnes dun tableau X, il nest pas possible de
les visualiser de faon immdiate (les reprsentations gomtriques
associes impliquant en gnral des espaces plus de deux ou trois

La Smiomtrie

187

dimensions) : il est ncessaire de procder des transformations et des


approximations pour en obtenir une reprsentation plane.
Les tableaux de distances associs ces reprsentations gomtriques
(simples dans leur principe, mais complexes en raison du grand nombre
de dimensions des espaces concerns) peuvent tre dcrits par les deux
grandes familles de mthodes que sont les mthodes factorielles et la
classification. La premire consiste rechercher les directions
principales selon lesquelles les points scartent le plus du point moyen.
La seconde consiste rechercher des groupes ou classes dindividus qui
soient les plus homognes possibles (figure A1.3).

Mthode factorielle
(recherche des directions principales)

Mthode de classification
(recherche de groupes homognes)

Figure A1.3 : Deux grandes familles de mthodes

Ces mthodes impliquent souvent de la mme manire les individus


(lignes) et les variables (colonnes). La confrontation des espaces
dindividus et de variables enrichit les interprtations.

A1.2 Les mthodes factorielles : aspects techniques


Les mthodes factorielles1 permettent de grer simultanment des
quantits importantes de donnes et leur systme de corrlations et, par
une technique ralisant une sorte de compression, den dgager la
structure interne, notamment sous forme de graphique-plans.

1. Elles comprennent dans la littrature statistique franaise des trente dernires annes
toutes les techniques de reprsentation utilisant des axes principaux : analyse en
composantes principales, analyse des correspondances simples et multiples, analyse factorielle
dite classique (en anglais : factor analysis) ou analyse en facteurs communs et spcifiques.

188

Annexe Statistique

Recherche des sous-espaces factoriels


Lobjectif est de rechercher des sous-espaces de dimensions rduites
(entre trois et dix, par exemple) qui ajustent au mieux le nuage de pointsindividus et celui des points-variables, de faon ce que les proximits
mesures dans ces sous-espaces refltent autant que possible les
proximits relles. On obtient ainsi un espace de reprsentation, lespace
factoriel, dfini par les axes principaux dinertie et lon reprsente les
points du nuage dans ce systme daxes (cf. figure A1.4). Ces axes
ralisent les meilleurs ajustements de lensemble des points selon le
critre classique des moindres carrs, qui consiste rendre minimale la
somme des carrs des carts entre les points et les axes.

Figure A1.4 : Ajustement du nuage des points-individus


dans lespace des mots

Le premier de ces axes correspond la droite dallongement


maximum du nuage, le second maximise le mme critre en tant
assujetti tre orthogonal au premier, et ainsi de suite pour les axes
suivants qui sont tous orthogonaux entre eux. Cette orthogonalit traduit
lindpendance (en fait, la non-corrlation) des axes.
X dsigne le tableau de donnes ayant subi des transformations prliminaires
(variables centres rduites, par exemple), X son transpos.
Soit u1 le vecteur unitaire qui caractrise le premier axe. u1 est alors le vecteur
propre de la matrice XX correspondant la plus grande valeur propre 1 [cf.
SEM 2006].
Plus gnralement, le sous-espace q dimensions qui ajuste au mieux (au sens des
moindres carrs) le nuage est engendr par les q premiers vecteurs propres de la
matrice XX correspondant aux q plus grandes valeurs propres.

La procdure dajustement est exactement la mme pour les deux


nuages. On dmontre alors quil existe des relations simples liant les axes

La Smiomtrie

189

calculs dans les deux espaces, celui des individus et celui des variables
(relations de transition).
Le vecteur des coordonnes des points sur chacun des axes, appel
facteur, est une combinaison linaire des variables initiales. On dnote
par et les facteurs correspondant laxe respectivement dans
m

lespace not R (espace dont les n points ont pour coordonnes sont les
n

m mots) et dans lespace not R (espace dont les m points ont pour
coordonnes sont les n individus).
Les deux nuages de points, celui des mots et celui des rpondants, sont
intrinsquement lis et rvlent exactement les mmes structures : dans
un cas, les facteurs dcriront les corrlations entre les mots, dans lautre
les associations entre les rpondants.
Les plans factoriels de visualisation utiliss tout au long de cet
ouvrage correspondent chacun un couple de facteurs.
Le plan smiomtrique le plus utilis est le plan (2 , 3).
Les lments (mots ou individus) qui participent au calcul des axes
sont les lments actifs. On introduit aussi dans lanalyse des lments
supplmentaires (ou illustratifs) qui ne participent pas la formation des
axes, mais qui sont projets a posteriori dans les plans factoriels et
peuvent aider leur interprtation (cf. section A1.2.4).
Techniques de base et mthodes drives
La nature des informations, leur codage dans le tableau de donnes, les
spcificits du domaine dapplication vont introduire des variantes au
sein des mthodes factorielles.
Celles qui sont utilises ici ne sont en fait que des drives de deux
techniques fondamentales, lanalyse en composantes principales et
lanalyse factorielle des correspondances.
Lanalyse en composantes principales sapplique un tableau de mesures
numriques et sera utilise, dans le cadre de la smiomtrie, pour traiter
un tableau de notes.
Les exemples danalyse de donnes textuelles prsente au chapitre 4
reposent sur lanalyse factorielle des correspondances applique aux
tableaux de contingence lexicaux.

190

Annexe Statistique

A1.3 LAnalyse en Composantes Principales : aspects


techniques
LAnalyse en Composantes Principales (Hotelling, 1933) sapplique
des variables valeurs numriques (des mensurations, des taux, des mots
etc.) reprsentes sous forme dun tableau rectangulaire de mesures R de
terme gnral rij dont les colonnes sont les variables et les lignes
reprsentent les individus sur lesquels ces variables sont mesures. En
smiomtrie, les variables sont donc les mots; les lignes les rpondants et
les valeurs numriques, les notes.
A1.3.1 Interprtations gomtriques
Les reprsentations gomtriques entre les lignes dune part et entre
les colonnes dautre part du tableau de donnes permettent de visualiser
les proximits respectivement entre les individus et entre les variables
(cf. figures A1.1 et A1.2 ci-dessus).
m

Dans R , deux points-individus sont trs voisins si, dans lensemble,


leurs m coordonnes sont trs proches. Les deux rpondants concerns
sont alors caractriss par des valeurs presque gales pour chaque
variable. La distance utilise est la distance euclidienne usuelle.
n

Dans R , si les valeurs prises par deux variables particulires sont trs
voisines pour tous les rpondants, ces variables seront reprsentes par
deux points trs proches dans cet espace. Cela peut vouloir dire que ces
variables mesurent une mme chose ou encore quelles sont lies par une
relation particulire.
Mais les units de mesure des variables peuvent tre trs diffrentes et
rendre alors ncessaire des transformations du tableau de donnes.
A1.3.2 Problme dchelle de mesure et transformation
des donnes
On veut que la distance entre deux individus soit indpendante des
units des variables pour que chaque variable joue un rle identique.
Pour cela, on attribue chaque variable j la mme dispersion en divisant
1 n
chacune de ses valeurs par leur cart-type sj avec s 2j = (rij rj ) 2 .
n i =1
Par ailleurs on sintresse la manire dont les individus scartent de
la moyenne. On place alors le point moyen au centre de gravit du nuage

La Smiomtrie

191

des individus. Les coordonnes du point moyen sont les valeurs


1 n
moyennes des variables notes rj = rij . Prendre ce point comme
n i =1
origine revient soustraire pour chaque variable sa moyenne rj .
On corrige ainsi les chelles en transformant le tableau de donnes R
en un nouveau tableau X de la faon suivante :
xij =

rij rj
sj n

Les variables ainsi rduites et centres ont toutes une variance, s2(xj),
gale 1 et une moyenne, x j , nulle et deviennent comparables. Dautres
transformations pralables sont possibles (cf. section 2.5 du chapitre 2).
A1.3.3 Analyse du nuage des n rpondants
La transformation des donnes amne effectuer une translation de
lorigine au centre de gravit de ce nuage et changer (dans le cas de
lanalyse dite norme) les chelles sur les diffrents axes.
m

Pour raliser lanalyse du nuage des points-rpondants dans R , la


matrice XX diagonaliser dans cet espace, est la matrice des
corrlations (dont la figure A1.4 fournit un exemple) qui a pour terme
gnral :
n

c jj ' = xij xij ' =


i =1

1 n (rij rj )(rij ' rj ' )

n i
sjsj'

cjj est le coefficient de corrlation entre les variables j et j.


Les coordonnes des n points-individus sur laxe factoriel u sont les
n composantes du vecteur = Xu.
La figure A1.4-a illustre la reprsentation du nuage des rpondants
pour le tableau de 12 rpondants ayant not 7 mots (tableau dj prsent
en section A1.1) dans le plan principal (2, 3)1. Les rpondants R01 et
R02 ont donn, de la mme faon, des notes trs contrastes et ont donn
des notes leves Arbre et Sensuel et des notes faibles Morale et
Politesse ; ils sont par consquent proches dans le plan et se diffrencient

1. Le plan (2, 3) a t considr comme le plan smiomtrique principal compte tenu du


caractre particulier du premier axe (axe dit de taille, cf. chapitre 5).

192

Annexe Statistique

des rpondants R05 et R04 qui se sont exprims de faon inverse sur les
mots. Le rpondant R08 se distingue en ayant trs bien not Danger sans
pour autant bien noter les autres mots, alors que R11 a bien not tous les
mots.
A1.3.4 Analyse du nuage des variables (mots)
Les coordonnes factorielles j des points-variables sur laxe sont
les composantes de u et lon a :

j = cor ( j , )
La coordonne j dun point-variable j sur un axe nest autre que
le coefficient de corrlation de cette variable avec le facteur
(combinaison linaire des variables initiales) considr lui-mme comme
une variable artificielle dont les coordonnes sont constitues par les n
projections des individus sur cet axe.
Les axes factoriels tant orthogonaux deux deux, on obtient ainsi
une srie de variables artificielles non corrles entre elles, appeles
composantes principales1, qui synthtisent les corrlations de lensemble
des variables initiales.
Sur la figure A1.4-b, comme sur la matrice de corrlations
correspondante, Politesse et Morale sont trs corrls et dans une
moindre mesure Orage et Sensuel. On retrouve bien le comportements
des rpondants o R01 et R02 vont dans la direction des bons noteurs
dArbre et de Sensuel et des mauvais noteurs de Morale et Politesse
linverse de R04 et R05.
Les variables fortement corrles avec un axe vont contribuer la
dfinition de cet axe2. Cette corrlation se lit directement sur le
graphique puisquil sagit de la coordonne du point-variable j sur laxe
.

1. L'analyse en composantes principales ne traduit que des liaisons linaires entre les
variables. Un coefficient de corrlation faible entre deux variables signifie donc que celles-ci
sont indpendantes linairement, alors qu'il peut exister une relation non linaire.
2. L'exemple n'est bien videmment pas suffisamment reprsentatif pour que le plan puisse
tre interprt. Il a juste vocation rapprocher le tableau de donnes des rsultats.

La Smiomtrie

193

Tableau de notes (1 7) donnes 7 mots par 12 rpondants


R01
R02
R03
R04
R05
R06
R07
R08
R09
R10
R11
R12

arbre
7
6
4
5
4
5
4
4
6
6
7
2

cadeau
4
3
5
5
5
7
2
1
6
6
7
2

danger
2
1
3
1
2
1
1
5
2
3
6
1

morale
2
2
4
7
7
5
3
4
4
5
7
2

orage
3
4
3
2
1
2
5
5
7
3
7
1

politesse
1
1
4
7
6
6
3
4
5
6
6
3

sensuel
6
7
3
1
2
5
6
7
5
6
7
2

Matrice des corrlations


!
arbr
cade
dang
mora
orag
poli
sens
----+------------------------------------------------arbr !
1.00
cade !
.55
1.00
dang !
.29
.14
1.00
mora !
.16
.62
.36
1.00
orag !
.51
.09
.54
-.01
1.00
poli !
.00
.63
.23
.91
-.05
1.00
sens !
.56
-.08
.45
-.30
.68
-.37
1.00

Fig. A1.4-a: Reprsentation des


rpondants dans le plan factoriel (2,3)

Fig. A1.4-b: Reprsentation des


mots dans le plan factoriel (2,3)

Figure A1.4 : Analyse en composantes principales


sur le tableau de notes de 7 mots par 12 rpondants

194

Annexe Statistique

On sintresse surtout aux variables prsentant les plus fortes


coordonnes et lon interprtera les composantes principales en fonction
des regroupements de certaines de ces variables et de lopposition avec
les autres.
On notera alors que tous les points-variables sont sur une sphre de
rayon 1 centre lorigine des axes1. Les plans dajustement couperont la
sphre suivant de grands cercles (de rayon 1), les cercles de corrlations,
lintrieur desquels sont positionns les points-variables. Dans cet
ouvrage, les cercles ne sont pas tracs dans les plans factoriels
reprsentant les mots pour une meilleure lisibilit des libells (le cadrage
des plans factoriels aurait en effet entran une forte rduction dchelle).

A1.4 LAnalyse des correspondances


Lanalyse des correspondances2 sapplique en premier lieu une table
de contingence K, appel aussi tableau crois, n lignes et p colonnes,
qui ventile une population selon deux variables qualitatives n et p
modalits. Les lignes et les colonnes jouent donc des rles similaires.
Dans le chapitre 4, lanalyse est applique un tableau croisant les
1 191 rpondants spontanment aux questions ouvertes avec les 592 mots
cits au moins 4 fois comme tant agrables. Une deuxime analyse
porte sur 158 mots apparaissant plus de 25 fois.
Notations

Soit k = kij la somme de tous les lments kij de la table de


ij

contingence K. Dans le cas du tableau des questions ouvertes, k


reprsente le nombre de fois que les 592 mots ont t cits spontanment.
On note fij = kij k les frquences relatives avec

f
i

ij

=1 .

1. L'analyse du nuage des points-variables dans R ne se fait pas par rapport au centre de
gravit du nuage, contrairement celui des points-individus mais par rapport l'origine. La
n

distance d'une variable j l'origine O s'exprime par : d 2 (O, j ) = xij2 = 1


i =1

2. Prsente et tudie de faon systmatique comme une technique souple d'analyse


exploratoire de donnes multidimensionnelles par J.-P. Benzcri (1973), l'analyse des
correspondances s'est trouve depuis dautres prcurseurs, en particulier C. Hayashi (1956), et
a donn lieu des travaux disperss et indpendants les uns des autres.

La Smiomtrie

195

On note : f i. = f ij , f. j = f ij , les frquences marginales relatives.


i

La table de contingence K est transform en un tableau de profils-lignes


fij fi . et un tableau de profils-colonnes fij f. j .
m

Le point i de R a pour coordonnes : f ij fi . pour tout j m.


n

De mme, le point j de R a pour coordonnes : fij f. j pour tout i n.


Notons une diffrence importante entre lanalyse des correspondances
et lanalyse en composantes principales : les transformations opres sur
le tableau dans les deux espaces sont identiques (car les ensembles mis
en correspondance jouent des rles analogues).
Distance du Chi-deux et quivalence distributionnelle
Les distances entre deux points-lignes i et i dune part et entre deux
points-colonnes dautre part sont donnes par les quations suivantes :
m

d 2 (i, i ') =
j =1

1 f ij f i ' j

f. j f i. fi '.

d 2 ( j , j ') =
i =1

1 fij f ij '

f i. f. j f. j '

La distance du 2 offre lavantage de vrifier le principe


dquivalence distributionnelle. Ce principe assure la robustesse des
rsultats de lanalyse des correspondances vis--vis de larbitraire du
dcoupage en modalits des variables nominales. Il sexprime de la faon
suivante : si deux lignes (resp. colonnes) du tableau de contingence ont
mme profil (sont proportionnelles) alors leur agrgation naffecte pas la
distance entre les colonnes (resp. lignes). On obtient alors un nouveau
point-ligne (resp. point-colonne) de profil identique et affect de la
somme des frquences des deux points-lignes (resp. points-colonnes).
Cette proprit est importante car elle garantit une certaine invariance
des rsultats vis--vis de la nomenclature choisie pour la construction des
modalits dune variable qualitative.

A1.5 Lanalyse logarithmique


Lanalyse logarithmique, propose par J.-B. Kazmierczak (1985),
ralise la proprit de lquivalence distributionnelle de lanalyse des
correspondances sur des tableaux qui ne sont pas obligatoirement des
tables de contingence. J.-B. Kazmierczak reprend et gnralise le
principe de Yule qui stipule que lon ne change pas la distance entre

196

Annexe Statistique

deux lignes ni la distance entre deux colonnes dun tableau en


remplaant les lignes et les colonnes de ce tableau par dautres lignes et
colonnes qui leur sont proportionnelles (il sagit en fait dune
gnralisation du principe dquivalence distributionnelle).
Lanalyse logarithmique consiste prendre les logarithmes des (aprs
addition ventuelle dune constante en cas de donnes ngatives), puis,
aprs les avoir centres la fois en ligne et en colonne, les soumettre
une analyse en composantes principales non norme, qui concide ici
avec une dcomposition aux valeurs singulires [SEM, 2002].
Ainsi, si R est un tableau de donnes (n, m) et si A et B sont deux
matrices diagonales respectivement de dimensions (n, n) et (p, p)
lments diagonaux positifs, la matrice ARB donne lieu la mme
analyse logarithmique que la matrice R. Cette proprit dinvariance
forte a eu pour effet de supprimer le premier axe smiomtrique sans
altrer la suite des axes (section 5.7 du chapitre 5).

A1.6 Lanalyse factorielle en facteurs communs et


spcifiques
Lanalyse factorielle en facteurs communs et spcifiques (factor
analysis) est probablement le modle linaire de variables latentes le plus
ancien1. Ces modles ont t essentiellement dvelopps principalement
par les psychologues et psychomtriciens. Les dveloppements auxquels
ils donnent lieu sont complexes et diversifis. On pourra consulter sur ce
point les ouvrages classiques de Harman (1967), Mulaik (1972)2.
Mentionnons galement les travaux dAnderson et Rubin (1956) et de
Lawley et Maxwell (1963) qui ont plac lanalyse factorielle en facteurs
communs et spcifiques dans un cadre infrentiel classique.
Le modle de lanalyse factorielle

Ce modle se propose de reconstituer, partir dun petit nombre q de


facteurs, les corrlations existant entre m variables observes. On
suppose lexistence dun modle a priori :

3. A l'origine des principes de la mthode se trouvent Spearman (1904) (analyse


monofactorielle), puis Garnett (1919) et Thurstone (1947) (analyse multifactorielle).
2. En conomtrie, on distingue habituellement les modles fonctionnels, ou effet fixes
(comme la rgression multiple et le modle linaire dans son ensemble), et les modles
structurels ou effet alatoire (modles de variables latentes).

La Smiomtrie

197

x = fi + e i

i
( m ,1)

( m , q ) ( q ,1)

( p ,1)

Dans cette criture xi reprsente le i-me vecteur observ des m variables ; est un
tableau (m, q) de coefficients inconnus (avec q < m) ; fi est la i-me valeur du
vecteur alatoire et non observable de q facteurs communs ; et ei la i-me valeur du
vecteur non observable de rsidus, lesquels reprsentent leffet combin de facteurs
spcifiques et dune perturbation alatoire.
On dsigne par X le tableau (n,p) dont la i-me ligne reprsente lobservation i. De
'

mme F dsigne le tableau (n,q) non observable dont la i-me ligne est fi et E le
tableau (n,p) non observable dont la i-me ligne est ei' . Le modle liant lensemble
des observations aux facteurs hypothtiques scrit :

X = F ' + E

( n ,m )

( n ,q ) ( q ,m )

( n ,m )

Dans cette criture, seul X est observable, et le modle est par consquent
indtermin.

Lidentification de ce modle et lestimation des paramtres posent


des problmes complexes. Une cascade dhypothses a priori
supplmentaires permet cette identification. Lapplication dans le cadre
de cet ouvrage concerne la section 2.6 du chapitre 2.

A1.7 Mthodes de classification hirarchique


Les techniques de classification automatique1 sont destines
produire des groupements dobjets ou dindividus dcrits par un certain
nombre de variables ou de caractres. Les circonstances dutilisation sont
sensiblement les mmes que celles des mthodes danalyse factorielle
descriptive prsentes aux sections prcdentes. Dans le chapitre 3, la
classification est ralise sur lensemble des 210 mots partir des
coordonnes de ces mots sur les axes principaux.
Il existe plusieurs familles dalgorithmes de classification : les
algorithmes hirarchiques qui fournissent une hirarchie de partitions
des objets et les algorithmes conduisant directement des partitions
comme les mthodes dagrgation autour de centres mobiles. Les
principes communs aux diverses techniques de classification ascendante
hirarchique sont simples. Il sagit de crer, chaque tape de

1. La classification est une branche de l'analyse des donnes qui constitue une tape
fondamentale dans beaucoup de disciplines scientifiques. Elle a donn lieu des publications
nombreuses et diversifies dont : Sokal et Sneath (1963) et Benzcri (1973).

198

Annexe Statistique

lalgorithme, une partition obtenue en agrgeant deux deux les


lments les plus proches.
Lalgorithme de la Classification Hirarchique

Lalgorithme de base de la classification ascendante hirarchique


produit une hirarchie en partant de la partition dans laquelle chaque
lment classer constitue une classe, pour aboutir la partition forme
dune seule classe runissant tous les lments.
Pour n lments classer, il est compos de n tapes. A la premire
tape, il y a donc n lments classer. On construit la matrice de
distances entre les n lments et lon cherche les deux plus proches, que
lon agrge en un nouvel lment.
On construit une nouvelle matrice des distances qui rsultent de
lagrgation, en calculant les distances entre le nouvel lment et les
lments restants. On se trouve dans les mmes conditions qu ltape 1,
mais avec seulement (n-1) lments classer.
On cherche de nouveau les deux lments les plus proches, que lon
agrge. On ritre le processus jusqu navoir plus quun seul lment
regroupant tous les objets et qui constitue la dernire partition.

Figure A1.6: Dendrogramme ou arbre hirarchique

Lalgorithme ne fournit pas une partition en q classes dun ensemble


de n objets mais une hirarchie de partitions, se prsentant sous la forme
darbres appels galement dendrogrammes et contenant n - 1 partitions
(cf. figure A1.6). Lintrt de ces arbres est quils peuvent donner une
ide du nombre de classes existant effectivement dans la population.
Chaque coupure dun dendrogramme fournit une partition.
Dans le tableau 3.1 du chapitre 3, on a retenu trois coupures du
dendrogramme en 36, 24 et 12 classes. La coupure la moins fine en 12

La Smiomtrie

199

classes figure en premire colonne, celle en 24 classes en seconde


colonne et la coupure la plus fine en 36 classes en troisime colonne. Elle
est suivie de la liste des mots qui composent ces 36 classes.

A1.8 Les cartes auto-organises de Kohonen


Lobjectif des cartes auto-organises de Kohonen1 est de classer un
ensemble dobservations de faon conserver la topologie initiale de
lespace dans lesquelles elles sont dcrites. Comme les rseaux de
neurones auxquelles elles sont rattaches, ces cartes obtiennent de
bonnes performances pour la reconnaissance de formes. Elles ont t
utilises aux chapitres 3 (section 3.1) et 4 (section 4.2).
Le principe

Les cartes de Kohonen cherchent reprsenter dans un espace deux


(parfois trois) dimensions les lignes ou les colonnes dun tableau en
respectant la notion de voisinage dans lespace des lments classer.
Tout comme lanalyse en composantes principales, il est utile dimaginer
au dpart lensemble des donnes (les mots) comme un nuage de points
dans un espace de grande dimension (celui des individus ou rpondants).
Le principe est de considrer une carte comme une grille rectangulaire
(parfois hexagonale) aux mailles dformables, laquelle, une fois dplie
pouse au mieux les formes du nuage de points. Les nuds de la grille
sont les neurones de la carte. Chaque point du nuage est projet sur le
nud dont il est le plus proche. De fait, chaque point, dcrit initialement
dans un espace multidimensionnel est reprsent la fin par deux
coordonnes donnant la position du neurone sur la carte : lespace est
rduit. Lensemble des points affects un mme neurone sont proches
dans lespace initial. Ils dcrivent et regroupent des individus
semblables.
On dfinit a priori une notion de voisinage entre classes et les
observations voisines dans lespace des variables de dimension q
appartiennent aprs classement la mme classe ou des classes
voisines. Ces voisinages peuvent tre choisis de diverses manires mais
en gnral on les suppose directement contigus sur la grille rectangulaire
(ce qui reprsente alors 8 voisins pour un neurone).
1. Introduites en 1981 par Teuvo Kohonen, elles font partie des mthodes dites neuronales
(cf. Kohonen, 1989). Elles donnent lieu plusieurs applications relevant par exemple de
l'analyse de textes, les diagnostics mdicaux et industriels, les contrles de processus, la
robotique.

200

Annexe Statistique

Lalgorithme

Lalgorithme dapprentissage pour classer m points est itratif1.


Linitialisation consiste associer chaque classe k un centre provisoire
Ck q composantes choisi de manire alatoire dans lespace q
dimensions contenant les m mots classer. A chaque tape on choisit un
mot i au hasard que lon compare tous les centres provisoires et lon
affecte le mot au centre Ck0 le plus proche au sens dune distance donne
a priori. On rapproche alors du mot i le centre Ck0 et les centres voisins
sur la carte ce qui sexprime ltape t par :
Ck(t+1)=Ck(t)+(i(t+1)-Ck(t))
o i(t+1) est le mot prsent ltape t+1, un paramtre dadaptation
positif et infrieur 1. Cette expression nintervient que pour le centre
Ck0 et ses voisins.
Cet algorithme est analogue celui des centres mobiles [SEM 2006],
mais dans ce dernier cas, il nexiste pas de notion de voisinage entre
classes et on ne modifie chaque tape que la position du centre Ck0 .
Lauto-organisation de la carte de Kohonen est la consquence de la
notion de voisinage. Comme lalgorithme des centre mobiles, cet
algorithme est trs adapt aux applications o les donnes sont
importantes et o il nest pas utile de les stocker.

A1.9 Outils de validation


Tout au long du prsent ouvrage ont t utilises les notions de valeurtest et de variable supplmentaire.
Les valeurs-test (section A1.9.1) sont un outil dinfrence statistique
lmentaire, mais polyvalent et trs utile, surtout si lutilisateur est averti
des problmes de comparaisons multiples qui ne manquent pas
dintervenir (section A1.9.2).
La technique des variables supplmentaires (section A1.9.3) est un
outil fondamental de valorisation des mthodes factorielles, qui permet
une validation externe des rsultats, la fois preuve de cohrence et
enrichissement des interprtations.

1. On se rfre dans la prsentation de l'algorithme au cours de P.Letremy et M.Cottrell


(SAMOS-MATISSE, Universit Paris I). Voir aussi Thiria et al. (1997).

La Smiomtrie

201

Les deux autres outils de validation utiliss dans cet ouvrage sont les
intervalles de confiance dAnderson et les procdures de
rechantillonnage bootstrap.
Les intervalles de confiance dAnderson (section A1.9.4) sont utiliss
dans la section 2.2 du chapitre 2 pour valider des valeurs propres.
Les procdures de rechantillonnage bootstrap (section A1.9.5) sont
utilises aux sections 2.3 et 2.4 du chapitre 2 pour mettre en vidence la
stabilit des structures smiomtriques, et, dans la section 4.4 du
chapitre 4, pour valider une analyse textuelle.
A1.9.1 Quest-ce quune valeur-test ?

La valeur-test est un critre qui permet dapprcier rapidement si une


modalit dune variable nominale (i.e. : une catgorie de rpondants) a
une position significative sur un axe. Pour cela, on teste lhypothse
selon laquelle un groupe dindividus, correspondant une modalit
donne dune variable nominale supplmentaire (comme la modalit
profession librale, cadre suprieur pour la variable nominale catgorie
socio-professionnelle, par exemple), peut tre considr comme tir au
hasard, sans remise, dans la population.
Dans le cas dun vritable tirage au hasard, le centre de gravit du
sous-nuage reprsentant le groupe (i.e. : la modalit) sloigne peu du
centre de gravit du nuage global correspondant tout lchantillon.
On convertit alors la coordonne de cette modalit sur laxe en une
valeur-test qui est, sous cette hypothse, la ralisation dune variable
normale centre rduite. Autrement dit, dans lhypothse selon laquelle
une modalit a une composition alatoire, la valeur-test correspondante a
95% de chances dtre comprise dans lintervalle [-1.96, +1.96].
On considre alors comme occupant une position significative les
modalits dont les valeurs-test sont suprieures 2 (pour 1.96) en valeur
absolue, ce qui correspond approximativement au seuil usuel de
probabilit de 5%.
Souvent les valeurs-test sont largement suprieures ce seuil. On les
utilise alors pour trier les modalits, des plus significatives au moins
significatives. La valeur-test systmatise la notion de t-value souvent
utilise dans la littrature anglo-saxonne.

202

Annexe Statistique

Supposons quune modalit j concerne nj individus. Si ces nj individus sont tirs au


hasard (cest ce quon appelle lhypothse nulle H0) parmi les n individus analyss
(tirage suppos sans remise), la moyenne de nj coordonnes tires au hasard dans
lensemble fini des n valeurs i (coordonne du rpondant i sur laxe ) est une
variable alatoire X j : X = 1
i avec pour esprance E(Xj)=0 et pour
j
n j iI ( j )
1

variance VarH 0 ( X j ) =

n n j
n 1 nj

Dans la formule donnant X j , I(j) est le sous-ensemble des rpondants caractriss


par la modalit j de la variable nominale.
La coordonne aj de la modalit j est proportionnelle la variable alatoire X j
et scrit ainsi :

j =

X j

On a donc E ( j ) = 0 et VarH 0 ( j ) =
La quantit t j : t j = n j

n nj 1
n 1 n j

n 1
j mesure en nombre dcart-types la distance
n nj

entre la modalit j, cest--dire le quasi-barycentre des nj individus, et lorigine, sur


laxe factoriel . On appelle cette quantit valeur-test . Daprs le thorme de la
limite centrale (central limit theorem), sa distribution tend vers une loi de LaplaceGauss centre rduite.

On doit noter que les valeurs-test nont de sens que pour les modalits
supplmentaires (cf. section suivante), ou des modalits actives ayant des
contributions absolues faibles, cest--dire se comportant en fait comme
des modalits supplmentaires2.
Lorsque lon dispose dun nombre important de modalits
supplmentaires, les valeurs-test permettent de reprer rapidement les
modalits utiles linterprtation dun axe ou dun plan factoriel.

1. Il s'agit de la formule classique donnant la variance d'une moyenne lors d'un tirage sans
remise de nj objets parmi n, en fonction de la variance totale , qui est aussi, dans le cas des
coordonnes factorielles, la valeur propre correspondant laxe .
2. Les coordonnes sur un axe des individus correspondant une modalit active ne
peuvent tre considres comme tire au hasard, puisque cette modalit aura contribu
construire l'axe.

La Smiomtrie

203

A1.9.2 Le problme des comparaisons multiples

Le calcul simultan de plusieurs valeurs-test ou de plusieurs seuils de


probabilits se heurte lcueil des comparaisons multiples, bien connu
des statisticiens ; cf. ONeill et Wetherill (1971), Saville (1990), Westfall
et Young (1993), Westfall et al. (1999), Hsu (1996).
Supposons que lon projette 100 modalits supplmentaires (cf.
section suivante A1.9.3) qui soient vraiment tires au hasard. Les
valeurs-test attaches ces modalits sont alors toutes des ralisations de
variables alatoires normales centres rduites indpendantes.
Dans ces conditions, en moyenne, sur 100 valeurs-test calcules, cinq
seront en dehors de lintervalle [-1.96, +1.96] et seront, en apparence
seulement, significatives. Le seuil de 5% na de sens en fait que pour un
seul test, et non pour des tests multiples.
On rsout en pratique cette difficult en choisissant un seuil plus
svre1. Le seuil le plus svre et pessimiste que lon puisse imaginer est
le seuil de Bonferroni (on divise le seuil initial par le nombre de
tests : dans le cas de 210 tests : 0.05 / 210 = 2.4 10-4). La valeur-test
unilatrale correspondante est de 3.49. Cette valeur nous fournit un
garde-fou prudent lexcs2.
Comme cela a t signal dans le corps du texte (cf., par exemple, les
notes de la section 7.2 du chapitre 7), linterdpendance des mots ne
permet pas dappliquer aveuglment les rsultats concernant les
comparaisons multiples. Que conclure, en effet, lorsque plusieurs mots
de sens voisins ont simultanment des valeurs-test de lordre de 1.96 ?
Celles-ci ne sont pas significatives une par une en retenant le seuil de
Bonferroni, mais elles se confirment et se valident mutuellement.
Une solution pragmatique (cas multidimensionnel) : le bootstrap.
La technique de validation par bootstrap dont il sera question plus loin
dans cette annexe apporte une contribution intressante au difficile
problme des comparaisons multiples, car les rplications dchantillons
permettent de prendre en compte simultanment toutes les variables, et
donc linterdpendance des variables.
Il sagit dun test global, et non plus de tests spars pour chaque
variable. Une illustration en est donne par la figure 4.4 du chapitre 4 qui

1. Les valeurs-test permettent surtout de classer les modalits supplmentaires par ordre
d'intrt dcroissant, ce qui constitue une aide prcieuse l'interprtation des facteurs.
2. Cf., par exemple, Hochberg (1988), Perneger (1998).

204

Annexe Statistique

reprsente les zones de confiance simultanes des mots, dont certains


apparaissent comme significativement distincts. Dans ce cas, les tests ne
sont pas raliss isolment ni en srie, mais simultanment.
A1.9.3 Utilit des lments supplmentaires

Lanalyse factorielle permet de trouver des sous-espaces de


reprsentation des proximits entre points-individus ou entre pointsvariables. Elle sappuie pour cela sur des lments (individus ou
variables) dits actifs.
Il est possible dintroduire en supplmentaire dautres points (ou
lments) que lon ne souhaite pas faire intervenir dans la composition et
dfinition des axes mais dont on veut connatre les positions dans les
espaces factoriels1. On projette alors ces points aprs la construction des
axes factoriels dans ce nouveau repre. Cette projection se fait de faon
trs simple en utilisant les formules dites de transition, que ce soit en
analyse en composantes principales ou en analyse des correspondances.
Cest le cas lorsque lon veut positionner les mots, variables
numrique, dans lespace des variables de contrle (cf. section 5.4). On
calcule, a posteriori, leurs coordonnes sur les axes factoriels.
Cest galement le cas lorsque lon souhaite caractriser les axes
smiomtriques2 par les critres socio-dmographiques (variables
nominales) de la population enqute (cf. section 1.4).
Ces critres dfinissent en fait des groupes dindividus et sont
considrs soit comme des modalits de variables nominales, soit comme
des individus, mis en lments supplmentaires.
Ce sont les centres de gravit de ces groupes qui sont positionns dans
lespace des variables. La valeur-test permet den apprcier la
significativit sur laxe.
Cette procdure pourrait tre utilise comme mthode alternative pour
comparer des sous-populations dans le chapitre 7.

1. On peut citer trois raisons qui peuvent susciter la mise en supplmentaire d'un
point : 1) enrichir l'interprtation des axes par des variables (de nature ou de thmatique
diffrente de celle des lments actifs) n'ayant pas particip leur construction ; 2) adopter une
optique de prvision en projetant les variables supplmentaires dans l'espace des individus.
Celles-ci seront expliques par les variables actives ; 3) faire ressortir l'essentiel d'une
structure masque par l'existence d'un point actif, de faible masse, mais trs excentr qui
pourrait dformer le nuage.
2. Ces axes, rappelons-le, sont dfinis par les variables actives que sont les mots.

La Smiomtrie

205

A1.9.4 Intervalles de confiance dAnderson

Anderson (1963) a calcul les lois limites des valeurs propres dune
analyse en composantes principales sans ncessairement supposer que les
valeurs thoriques correspondantes sont distinctes.
Lampleur de lintervalle donne une indication sur la stabilit de la
valeur propre vis--vis des fluctuations dues lchantillonnage suppos
laplacien. Lempitement des intervalles de deux valeurs propres
conscutives suggrera donc lgalit de ces valeurs propres. Les axes
correspondants sont alors dfinis une rotation prs. Ainsi lutilisateur
pourra viter dinterprter un axe instable selon ce critre.
Si les valeurs propres thoriques de sont distinctes, les valeurs propres de
la matrice des covariances empiriques S suivent asymptotiquement des lois normales
desprance et de variance 22 (n 1) o n est la taille de lchantillon.
On en dduit les intervalles de confiance approchs au seuil 95% :

1 1.96 2 (n 1) ; 1 + 1.96 2 (n 1)

Les intervalles de confiance dAnderson concernent en fait aussi bien


les valeurs propres des matrices des covariances que des matrices de
corrlations. Les simulations entreprises montrent que les intervalles de
confiance obtenus sont en gnral prudent : le pourcentage de
couverture de la vraie valeur est le plus souvent suprieur au seuil de
confiance annonc.
Dans tous les cas, la nature asymptotique des rsultats et lhypothse
sous-jacente de normalit1 font considrer les rsultats comme indicatifs.
A1.9.5 Les techniques de bootstrap

Face aux rsultats dune analyse factorielle, certaines questions sur la


validit des axes obtenus se posent naturellement : Existe-t-il des critres
pour tester la stabilit dune structure et la valider ? Quelle est la part de
lchantillonnage des individus mais aussi, notion plus difficile, celle du
choix ou de la slection des variables ?
Nous avons vu au chapitre 2 que pour tenter de rpondre partiellement
ces questions, on avait recours aux mthodes empiriques de validation.
Elles consistent perturber le tableau initial par des ajouts ou retraits
1. Muirhead (1982) a montr que l'hypothse d'existence des quatre premiers moments pour
la loi thorique de l'chantillon suffisait pour valider ces intervalles.

206

Annexe Statistique

dlments du tableau, individus ou variables (poids, codage, etc.).


Lhypothse est la suivante : si les perturbations effectues sur les
chantillons naffectent pas les configurations observes dans les sousespaces, celles-ci sont supposes stables et la structure mise en vidence
est alors significative .
Les mthodes de rechantillonnage se proposent de systmatiser cette
dmarche1. Celle du bootstrap, non paramtrique, est bien adapte au
problme de la validit des formes observes dans un plan factoriel ; elle
calcule, partir de simulations, des zones de confiance pour les positions
des points-lignes et des points-colonnes.
Principe du bootstrap

La technique du bootstrap, introduite par Efron (1979), consiste


simuler s (s est gnralement suprieur 30) chantillons de mme taille
n que lchantillon initial. Ils sont obtenus par tirage au hasard avec
remise parmi les n individus observs au dpart, ceux-ci ayant tous la
mme probabilit 1/n dtre choisis. Certains individus apparatront
plusieurs fois et auront de ce fait un poids lev (2, 3,...) alors que
dautres seront absents (poids nul).
Cette mthode est employe pour analyser la variabilit de paramtres
statistiques simples en produisant des intervalles de confiance de ces
paramtres. Elle peut aussi tre applique de nombreux problmes pour
lesquels on ne peut pas estimer analytiquement la variabilit dun
paramtre. Ceci est le cas pour les caractristiques des mthodes
multidimensionnelles o les hypothses de multinormalit sont rarement
vrifies. Lanalyse en composantes principales est un domaine
dapplication qui a donn un grand nombre de travaux utilisant les
mthodes de rechantillonnage de bootstrap.
Prenons lexemple de lestimation du coefficient de corrlation r entre
deux variables ou entre une variable et un facteur. Le principe consiste
calculer le coefficient de corrlation pour chaque chantillon rpliqu
(pour lequel on effectue un tirage avec remise des couples
dobservations). On tablit alors la distribution des frquences du
coefficient de corrlation (reprsente par lhistogramme des s valeurs du
coefficient r correspondant aux s rplications). Puis on calcule partir de
1. Ce sont des mthodes de calculs intensifs qui reposent sur des techniques de simulations
d'chantillons partir d'un seul chantillon. Rendues possibles par la puissance de calcul des
ordinateurs, ces techniques se substituent dans certains cas aux procdures plus classiques qui
reposent sur des hypothses contraignantes. Elles sont les seules procdures possibles lorsque
la complexit analytique du problme ne permet pas d'infrence classique.

La Smiomtrie

207

lhistogramme la probabilit pour que le coefficient de corrlation dun


chantillon soit compris dans diffrentes fourchettes de valeurs
dfinissant ainsi les intervalles de confiance. On obtient une estimation
de la prcision de la valeur de r obtenue sur lchantillon de base sans
faire lhypothse dune distribution normale des donnes. Les bornes de
lintervalle de confiance peuvent tre estimes directement par les
quantiles de la distribution simule.
Pour estimer les coordonnes factorielles issus dune analyse en
composantes principales, le principe est le mme que pour le coefficient
de corrlation ; on effectue sur chaque chantillon simul, une analyse en
composantes principales puis on tablit une distribution de frquences
pour chacune des composantes1.
La mthode de bootstrap donne dans la plupart des cas une bonne
image de la prcision statistique de lestimation sur un chantillon. Les
recherches thoriques menes par Efron, en particulier, montrent que,
pour de nombreux paramtres statistiques, lintervalle de confiance
correspondant la distribution simule par bootstrap et celui
correspondant la distribution relle sont gnralement de mme
amplitude.
Mise en uvre et calcul des zones de confiance

Il existe plusieurs procdures pour tester, par la mthode de bootstrap,


la stabilit des coordonnes factorielles. Gifi (1981), Meulman (1982),
Greenacre (1984) ont ralis des premiers travaux dans le contexte de
lanalyse des correspondances simples ou multiples. Dans le cas de
lanalyse en composantes principales, Diaconis et Efron (1983), Holmes
(1989), Stauffer et al. (1985), Daudin et al. (1988) ont pos le problme
du choix du nombre daxes pertinent et ont propos des intervalles de
confiance pour les points du sous-espace dfini par les principaux axes.
Les paramtres correspondant sont calculs partir des chantillons
rpliqus et supposent des contraintes qui dpendent de ces chantillons.
Pour pallier ces difficults, il faut se rfrer un espace factoriel
commun. Plusieurs variantes sont possibles.
Nous nous sommes bass dans le chapitre 2 sur deux techniques
appeles ici le bootstrap total et le bootstrap partiel.
Le bootstrap total consiste raliser autant danalyses en
composantes principales quil y a de rplications, moyennant une srie
1. On trouvera des complments sur lintrt et les limites de cette mthode dans les
travaux de Diaconis et Efron (1983) et de Young (1994).

208

Annexe Statistique

de transformations afin de retrouver des axes homologues au cours des


diagonalisations successives des s matrices de corrlation rpliques Ck
(Ck correspond la k-me rplication). Ces transformations sont des
changements de signe des axes, rotations ou permutations daxes. Cette
mthode, propose par Milan et Whittaker (1995) est en dfaut sil existe
des valeurs propres trs voisines.
Dans le bootstrap partiel, propos par Greenacre (1984) dans le cas de
lanalyse des correspondances, il nest pas ncessaire de calculer les
valeurs et vecteurs propres pour lensemble des simulations : les axes
principaux calculs sur les donnes originales non perturbes, jouent un
rle privilgi (la matrice des corrlations initiale C est en effet
lesprance mathmatique des matrices perturbes Ck).
Le bootstrap partiel se fonde sur la projection en tant qulments
supplmentaires des points rpliqus sur les sous-espaces de rfrence
fournis par les axes principaux de la matrice de corrlation C=XX,
provenant de lchantillon initial, donns par :
uq =

X'v q

o uq, vq sont respectivement les q-mes vecteurs propres de XX et


XX et q la valeur propre associe.
La projection1 de la k-me rplication des m variables (mots) est
donne par le vecteur uq(k) de R m tel que :
u q (k ) =

X'Dk v q

et Dk dsigne la matrice diagonale (n, n) des poids bootstrap associe


la k-me rplication2.
Dans le cas du bootstrap partiel, les analyses des matrices Ck ne sont
en aucun cas ncessaires puisque les vecteurs propres sont obtenus
partir de lanalyse en composantes principales de la matrice C.
1. La projection des rplications Bootstrap, dans le contexte de l'analyse en composantes
principales, consiste utiliser le fait que la coordonne d'une variable sur un axe factoriel n'est
autre que son coefficient de corrlation avec la variable coordonnes des individus sur
l'axe . On calcule donc les rplications de ce coefficient, ce qui revient repondrer, pour
chaque rplication, les individus avec les poids Bootstrap qui caractrisent un tirage sans
remise. On obtient, comme sous-produit, des rplications de la variance sur l'axe, qui sont
videmment distinctes de ce que seraient des rplications des valeurs propres.
2. Cf. Chateau et Lebart (1996).

La Smiomtrie

209

La variabilit bootstrap sobserve donc mieux sur le repre fixe initial,


qui est dailleurs le moins mauvais, tant le seul navoir pas t
perturb. Cette technique, prouve empiriquement, rpond parfaitement
aux proccupations des utilisateurs dans le cas de lanalyse en
composantes principales.
Bootstrap sur lensemble des variables

Classiquement les rplications sont obtenues par des tirages avec


remises dans lensemble des n individus. Pour tester la stabilit des
structures vis--vis de lensemble des mots, nous proposons de rpliquer
cet ensemble par la mthode du bootstrap total.
Nous supposons ainsi implicitement que lensemble des mots du
questionnaire constitue un chantillon de m mots extrait alatoirement de
lensemble des mots smiomtrisables de la langue franaise.
Nous cherchons perturber cet chantillon de mots selon les mmes
principes que le bootstrap opr sur les individus.
Pour cela, on appelle Bk la matrice diagonale (m, m) dont les lments diagonaux
sont les poids des mots de la k-me rplication Bootstrap (1,0,2,0,). La matrice X
dordre (n, n) initiale tant suppose centre, la matrice diagonaliser est la matrice Tk
qui vaut :
Tk = XBkX = XBkBkX

On obtient donc :
XBkXvq(k) = qvq(k)

en multipliant chaque terme par BkX on a :


BkXXBkBkXvq(k) = qBkXvq(k)

et en posant uq(k) = BkXvq(k) alors :


BkXXBku(k) = qu(k)
Tk=XBkBkX a les mmes valeurs propres non nulles que la matrice
Tk* = BkXXBk . On diagonalisera la matrice Tk* de dimension (m, m)

En pratique, on remplace les poids bootstrap nuls par des poids


infinitsimaux, de faon ce que les variables absentes dune rplication
apparaissent quand mme avec le statut de variable supplmentaire.
Cette preuve de validation est videmment trs svre. On montre en
effet que le tirage sans remise suscite approximativement, en moyenne,
labandon dun tiers des lments (ici, des mots !) chaque rplication.

210

Annexe Statistique

La figure 2.10 de la section 2.4 du chapitre 2 illustre les effets de ces


fortes perturbations sur la position des points variables.

Tous les calculs des chapitres 1 5 (analyses factorielles diverses, classifications,


cartes de Kohonen, zones de confiances bootstrap), ont t raliss laide du logiciel
acadmique DtmVic spcialis dans la fouille de donnes numriques et textuelles.

ANNEXE 2
Quelques lments et rsultats
d'analyse

A2.1 dictionnaire multilingue des mots


FRANAIS
l'absolu
l'acharnement
acheter
admirer
adorer
l'ambition
l'me
l'amiti
l'angoisse
un animal
un arbre
l'argent
une armure
l'art
astucieux
l'attachement
attaquer
l'audace
aventurier

ANGLAIS
absolute
persistence
to buy
to admire
to love
ambition
soul
friendship
anguish
animal
tree
silver
armour
art
cunning
attachment
to attack
audacity
adventurer

ALLEMAND
absolut
hartnaeckig
kaufen
bewundern
anbeten
der Ehrgeiz
die Seele
die Freundschaft
die Angst
ein Tier
ein Baum
das Geld
die Ruestung
die Kunst
schlau
die Zuneigung
angreifen
die Kuehnheit
ein Abenteuer

ESPAGNOL
el absoluto
el empeo
comprar
admirar
adorar
la ambicin
el alma
la amistad
la angustia
un animal
un rbol
el dinero
una armadura
el arte
sagaz
el cario
atacar
la audacia
un aventurero

ITALIEN
l'assoluto
l'accanimento
comprare
ammirare
adorare
l'ambizione
l'anima
l'amicizia
l'angoscia
un animale
un albero
il denaro
un'armatura
l'arte
astuto
l'attaccamento
aggredire
l'audacia
avventuriero

212

FRANAIS
un btisseur
un bijou
bleu
bohme
un cadeau
la campagne
une caresse
une crmonie
une certitude
le changement
charitable
charnel
la chasse
un chercheur
commander
le commerce
concret
la confiance
le confort
conqurir
consoler
construire
le courage
un crateur
un cri
critiquer
le danger
un dfi
le desert
le dsir
le dsordre
le dtachement
Dieu
diffrent
la discipline
la douceur
le doute
dynamique
l'eau
l'cole
conomiser
crire
efficace
un effort
l'lgance

Annexe 2

ANGLAIS
a builder
a jewel
blue
wander
a present
countryside
a caress
ceremony
certainty
change
charitable
carnal
the hunt
researcher
to order
trade
solid
confidence
comfort
to conquer
to console
to build
brave
creator
a shout
to criticise
danger
a challenge
desert
desire
disorder
detachment
God
different
discipline
softness
doubt
dynamic
water
school
economise
to write
effective
effort
elegance

ALLEMAND
ein Erbauer
ein Schmuckstueck
blau
ein Lebenskuenstler
ein Geschenk
auf dem Land
eine Liebkosung
eine Zeremonie
eine Gewissheit
die Veraenderung
barmherzig
das sexuelle
die Jagd
ein Forscher
befehlen
der Handel
konkret
das Vertrauen
die Bequemlichkeit
erobern
trosten
bauen
der Mut
ein Schoepfer
ein Schrei
kritiseren
die Gefahr
eine Herausforderung
die Wueste
das Verlangen
die Unordnung
die Gleichgueltigkeit
Gott
verschieden
die Disziplin
die Sanfheit
der Zweifel
dynamisch
das Wasser
die Schule
sparen
schreiben
tuechtig
eine Anstrengung
die Eleganz

ESPAGNOL
un constructor
una joya
azul
bohemio
un regalo
el campo
una caricia
una ceremonia
une certeza
el cambio
caritativo
carnal
la caza
un investigador
mandar
el comercio
concreto
la confianza
el confort
conquistar
consolar
construir
el coraje
un creador
un grito
criticar
el peligro
un desafo
el desierto
el deseo
el desorden
el despego
Dos
diferente
la discipina
la suavidad
la duda
dinmico
el agua
la escuela
ahorrar
escribir
eficaz
un esfuerzo
la elegancia

ITALIEN
un costruttore
un gioiello
blu
anticonformista
un regalo
la campagna
una carezza
una cerimonia
una certezza
il cambiamento
caritatevole
carnale
la caccia
un ricercatore
comandare
il commercio
concreto
la fiducia
la comodita'
conquistare
consolare
costruire
il coraggio
un creatore
un grido
criticare
il pericolo
una sfida
il deserto
il desiderio
il disordine
il distacco
Dio
diverso
la disciplina
la dolcezza
il dubbio
dinamico
l'acqua
la scuola
risparmiare
scrivere
efficace
uno sforzo
l'eleganza

La Smiomtrie

FRANAIS
l'lite
une motion
l'enfance
enseigner
ensemble
escalader
ternel
un tranger
une vasion
la famille
une faute
fconder
fminin
la fermet
le feu
la fidlit
une fleur
un fleuve
la foi
une frontire
un fusil
la gaiet
la gloire
gratuit
gurir
la guerre
hriter
un hros
honnt
l'honneur
humble
l'humour
une le
immense
immobile
un inconnu
l'industrie
l'infini
interdire
interroger
intime
un inventeur
l'ironie
un jeu
la justice

213

ANGLAIS ALLEMAND
elite
die Elite
emotion
eine Gefuehlsbewegung
childhood
die Kindheit
to teach
unterrichten
together
miteinander
to climb
hochklettern
eternal
ewig
a stranger
ein Fremder
escape
eine Flucht
family
die Familie
a fault
ein Fehler
to fertilise
befruchten
feminine
weiblich
firmness
die Standhaftigkeit
fire
das Feuer
faith
die Treue
flower
eine Blume
river
ein Fluss
a belief
der Glaube
border
eine Grenze
gun
ein Gewehr
liveliness
die Froehlichkeit
glory
der ruhm
free
unentgeltlich
to recover
heilen
war
der Krieg
to inherit
erben
hero
ein Held
honest
ehrlich
honour
die Ehre
humble
demuetig
humour
der Humor
an island
eine Insel
huge
unermesslich
immobile
unbeweglich
an unknown ein Unbekannter
industry
die Industrie
infinity
die Endlosigkeit
to forbid
verbieten
to interrogate befragen
intimate
intim
inventor
ein Erfinder
irony
die Ironie
a game
ein Spiel
justice
die Justiz

ESPAGNOL
la lite
una emocin
la infancia
educar
juntos
escalar
eterno
un extranjero
una evasin
la familia
una falta
fecundar
femenino
la firmeza
el fuego
la fidelidad
una flor
un ro
la f
una frontera
un fusil
la alegra
la gloria
gratuito
curar
la guerra
heredar
un hroe
honesto
el honor
humilde
el humor
una isla
immenso
immovil
un desconocido
la industria
el infinito
prohibir
interrogar
intimo
un inventor
la irona
un juego
la justicia

ITALIEN
l'elite
un'emozione
l'infanzia
insegnare
insieme
arrampicarsi
eterno
uno straniero
un'evasione
la famiglia
una colpa
fecondare
femminile
la fermezza
il fuoco
la fedelta'
un fiore
un fiume
la fede
una frontiera
un fucile
l'allegria
la gloria
gratuito
guarire
la guerra
ereditare
un eroe
onesto
l'onore
umile
l'umorismo
un'isola
immenso
immobile
uno sconosciuto
l'industria
l'infinito
vietare
interrogare
intimo
un inventore
l'ironia
un gioco
la giustizia

214

FRANAIS
un labyrinthe
la lgret
un livre
la logique
la loi
la lune
la magie
une maison
matriser
un mariage
un masque
materiel
maternel
la mfiance
mtallique
la minceur
la mode
la modration
la modestie
moelleux
une montagne
la morale
la mort
une muraille
la musique
un mystre
nager
la naissance
un nid
noble
un nud
noir
la nudit
obir
l'ocan
l'or
un orage
original
la paix
le pardon
un parfum
la patience
la patrie
la peau
la perfection

Annexe 2

ANGLAIS
maze
lightness
book
logic
the law
moon
magic
house
to master
a wedding
mask
material
maternal
mistrust
metallic
thinness
fashion
moderation
modesty
soft
mountain
morals
death
wall
music
mystery
to swim
birth
nest
noble
a knot
black
nudity
to obey
ocean
gold
a storm
original
peace
forgiveness
perfume
patience
homeland
skin
perfection

ALLEMAND
ein Labyrinth
die Leichtigkeit
ein Buch
die Logik
das Gesetz
der Mond
die Magie
ein Haus
beherrschen
eine Heirat
eine Maske
materiell
muetterlich
das Misstrauen
metallisch
die Schlankeit
die Mode
die Maessigung
die Bescheidenheit
anschmiegsam
ein Berg
die Moral
der Tod
eine Mauer
die Musik
ein Mysterium
schwimmen
die Geburt
ein Nest
edel
ein Knoten
schwarz
die Nacktheit
gehorchen
der Ozean
das Gold
ein Gewitter
eigentuemlich
der Friede
die Verzeihung
ein Parfuem
die Geduld
das Vaterland
die Haut
die Vollkommenheit

ESPAGNOL
un laberinto
la ligereza
un libro
la lgica
la ley
la luna
la magia
una casa
dominar
una boda
una mscara
material
maternal
la desconfianza
metlico
la esbeltez
la moda
la moderacin
la modestia
blando
una montaa
la moral
la muerte
una muralla
la msica
un misterio
nadar
el nacimiento
un nido
noble
un nudo
negro
la desnudez
obedecer
el ocano
el oro
una tormenta
original
la paz
el perdn
un perfume
la paciencia
la patria
la piel
la perfeccin

ITALIEN
un labirinto
la leggerezza
un libro
la logica
la legge
la luna
la magia
una casa
dominarer
un matrimonio
una maschera
materiale
materno
la diffidenza
metallico
la snellezza
la moda
la moderazione
la modestia
morbido
una montagna
la morale
la morte
una muraglia
la musica
un mistero
nuotare
la nascita
un nido
nobile
un nodo
nero
la nudita'
obbedire
l'oceano
l'oro
un temporale
originale
la pace
il perdono
un profumo
la pazienza
la patria
la pelle
la perfezione

La Smiomtrie

FRANAIS
la posie
la politesse
prcieux
la prcision
un prtre
produire
la proprit
protger
la prudence
la puissance
punir
la puret
une question
raffin
la raison
une rcompense
le recueillement
rflchir
une rgle
le respect
rver
la rvolte
la richesse
rigide
rire
robuste
rompre
rouge
la ruse
sacr
un sacrifice
sauvage
la science
un secret
sduire
sensuel
soigner
un soldat
un sommet
la souplesse
souverain
sublime
la tendresse
le thtre
la tradition

215

ANGLAIS
poetry
politeness
precious
accuracy
priest
to produce
property
to protect
prudence
the power
to punish
purity
a question
refined
the reason
a reward
meditation
to think
a rule
respect
to dream
rebellion
wealth
rigid
to laugh
robust
to break
red
craftiness
sacred
sacrifice
wild
science
a secret
to seduce
sensual
to care
soldier
peak
flexibility
monarch
sublime
tenderness
theatre
tradition

ALLEMAND
die Poesie
die Hoeflichkeit
wertvoll
die Praezision
ein Priester
produzieren
der Besitz
beschuetzen
die Vorsicht
die Macht
strafen
die Reinheit
eine Frage
verfeinert
die Vernunft
eine Belohnung
die Besinnung
nachdenken
eine Regel
der Respekt
trauemen
der Aufstand
der Reichtum
starr
lachen
robust
abbrechen
rot
die List
heilig
ein Opfer
wild
die Wissenschaft
ein Geheimnis
verfurhren
sinnlich
pflegen
ein Soldat
ein Gipfel
die Geschmeidigkeit
souveraen
herrlich
die Zaertlichkeit
das Theater
die Tradition

ESPAGNOL
la poesa
la cortesa
valioso
la precisin
un sacerdote
producir
la propriedad
proteger
la prudencia
la potencia
castigar
la pureza
una pregunta
refinado
la razn
una recompensa
el recogimiento
reflexionar
una regla
el respeto
soar
la rebelin
la riqueza
rgido
rer
robusto
romper
rojo
la astucia
sagrado
un sacrificio
salvaje
la ciencia
un secreto
seducir
sensual
cuidar
un soldado
una cumbre
la flexibilidad
soberano
sublime
la ternura
el teatro
la tradicin

ITALIEN
la poesia
la cortesia
prezioso
la precisione
un prete
produrre
la proprieta'
proteggere
la prudenza
la potenza
punire
la purezza
una domanda
raffinato
la ragione
una ricompensa
il raccoglimento
riflettere
una regola
il rispetto
sognare
la rivolta
la ricchezza
rigido
ridere
robusto
rompere
rosso
la furbizia
sacro
un sacrificio
selvaggio
la scienza
un segreto
sedurre
sensuale
curare
un soldato
una vettat
la flessibilita
sovrano
sublime
la tenerezza
il teatro
la tradizione

216

Annexe 2

FRANAIS
trahir
le travail
utilitaire
vert
la victoire
le vide
vieillir
viril
la vitesse
volontaire
Voluptueux

ANGLAIS
to betray
work
practical
green
victory
space
to age
virile
speed
a volunteer
voluptuous

ALLEMAND
verraten
die Arbeit
praktisch
gruen
der Sieg
die Leere
alt werden
maennlich
die Geschwindigkeit
eigenwillig
lustvoll

ESPAGNOL
traicionar
el trabajo
utilitario
verde
la victoria
el vaco
envejecer
viril
la velocidad
voluntario
voluptuoso

ITALIEN
tradire
il lavoro
utilitario
verde
la vittoria
il vuoto
invecchiare
virile
la velocita'
volontario
voluttuoso

A2.2 Moyenne des notes


Mots

moyenne

GUERRE
TRAHIR
MORT
ANGOISSE
FUSIL
DESORDRE
ROMPRE
CHASSE
DANGER
VIDE
ATTAQUER
VIEILLIR
FAUTE
PUNIR
CRITIQUER
ARMURE
INTERDIRE
CRI
DOUTE
LABYRINTHE
MEFIANCE
MURAILLE
REVOLTE
IRONIE
NOIR
ORAGE
RIGIDE
SOLDAT
DETACHEM.
FRONTIERE
METALLIQUE

1.26
1.42
1.77
1.85
2.26
2.30
2.44
2.49
2.58
2.58
2.61
2.63
2.87
2.90
2.97
3.02
3.04
3.09
3.09
3.13
3.14
3.19
3.27
3.29
3.40
3.46
3.49
3.59
3.61
3.62
3.63

Mots
moyenne
IMMOBILE
3.65
MASQUE
3.65
SACRIFICE 3.66
NOEUD
3.71
RUSE
3.74
ACHARNEMENT3.75
FEU
3.78
DESERT
3.88
INCONNU
3.92
SOUVERAIN 4.02
SAUVAGE
4.08
OBEIR
4.15
ETRANGER
4.21
ELITE
4.28
INTERROGER 4.30
VITESSE
4.30
QUESTION
4.31
MYSTERE
4.32
MATERIEL
4.39
COMMANDER 4.41
DIFFERENT 4.41
REGLE
4.45
ESCALADER 4.47
ABSOLU
4.50
BOHEME
4.50
INDUSTRIE 4.51
ROUGE
4.51
LEGERETE
4.55
MAGIE
4.55
CHANGEMENT 4.56
PRETRE
4.56

Mots
moyenne
AVENTURIER 4.59
DEFI
4.60
NUDITE
4.64
COMMERCE
4.67
INFINI
4.71
NOBLE
4.74
LOI
4.75
FERMETE
4.79
FOI
4.80
RECUEILLEM.4.80
PRUDENCE
4.86
MODERATION 4.88
UTILITAIRE 4.89
DIEU
4.90
SACRE
4.90
IMMENSE
4.93
Moyenne

4.95

DISCIPLINE
SECRET
EMOTION
MODE
CEREMONIE
EFFORT
GLOIRE
ORIGINAL
VIRIL
AME
CONQUERIR
EVASION
CONCRET

4.98
4.98
4.99
4.99
5.01
5.01
5.01
5.05
5.05
5.06
5.06
5.06
5.07

La Smiomtrie

Mots
moyenne
PRODUIRE
5.07
ECONOMISER 5.08
LUNE
5.10
HEROS
5.11
CHARNEL
5.13
CERTITUDE 5.14
HUMBLE
5.14
SOMMET
5.14
MORALE
5.15
AUDACE
5.17
FLEUVE
5.17
AMBITION
5.18
CREATEUR
5.20
PATRIE
5.20
MINCEUR
5.21
BATISSEUR 5.23
ECOLE
5.24
VERT
5.25
HERITER
5.26
VOLUPTEUX 5.26
MAITRISER 5.27
PEAU
5.27
THEATRE
5.27
MODESTIE
5.28
ECRIRE
5.30
TRADITION 5.30
ETERNEL
5.31
JEU
5.33
ROBUSTE
5.33
JUSTICE
5.37
RAISON
5.38
NAGER
5.39
CHERCHEUR 5.41
PRECIEUX
5.42
ACHETER
5.43
ILE
5.44
INVENTEUR 5.46
TRAVAIL
5.46
ASTUCIEUX 5.48
PROPRIETE 5.48

217

Mots
moyenne
REFLECHIR 5.48
PUISSANCE 5.53
VOLONTAIRE 5.53
FECONDER
5.54
BLEU
5.55
ART
5.56
BIJOU
5.56
GRATUIT
5.56
OR
5.56
PERFECTION 5.56
SUBLIME
5.56
RICHESSE
5.57
CHARITABLE 5.58
POESIE
5.61
SOUPLESSE 5.61
ANIMAL
5.62
CONSOLER
5.63
MOELLEUX
5.64
PARDON
5.64
ARGENT
5.65
LOGIQUE
5.67
RAFFINE
5.67
MONTAGNE
5.68
SCIENCE
5.68
EFFICACE
5.69
OCEAN
5.69
PATIENCE
5.69
PRECISION 5.69
NID
5.70
ADMIRER
5.71
ENSEIGNER 5.72
CONSTRUIRE 5.73
SENSUEL
5.74
ADORER
5.75
ENSEMBLE
5.76
HONNEUR
5.76
ELEGANCE
5.81
SOIGNER
5.82
LIVRE
5.83
PARFUM
5.85

Mots
moyenne
SEDUIRE
5.86
FEMININ
5.89
INTIME
5.89
ARBRE
5.92
EAU
5.92
VICTOIRE
5.93
PROTEGER
5.95
RECOMPENSE 5.96
PURETE
5.97
MARIAGE
5.98
ATTACHEMENT6.00
DESIR
6.00
DYNAMIQUE 6.06
RESPECT
6.11
CONFORT
6.12
ENFANCE
6.13
REVER
6.13
MATERNEL
6.15
MUSIQUE
6.17
POLITESSE 6.24
CADEAU
6.25
HUMOUR
6.27
COURAGE
6.28
CAMPAGNE
6.30
MAISON
6.32
FLEUR
6.36
DOUCEUR
6.37
HONNETE
6.38
CONFIANCE 6.42
GAIETE
6.46
NAISSANCE 6.46
FIDELITE
6.48
GUERIR
6.48
FAMILLE
6.49
CARESS
6.51
RIRE
6.58
AMITIE
6.59
TENDRESSE 6.67
PAIX
6.72

218

Axe 1
0.27
0.17
0.42
0.51
0.4
0.41
0.36
0.45
-0.18
0.30
0.41
0.34
0.02
0.36
0.45
0.44
-0.07
0.36
0.13
0.48
0.41
0.33
0.07
0.46
0.36
0.33
0.42
0.49
0.17
0.51
0.26
0.02
0.45
0.31

Axe 2
0.08
-0.04
0.06
0.05
0.13
-0.06
-0.05
0.12
-0.12
0.17
0.21
-0.14
-0.17
0.23
0.16
-0.06
-0.05
0.15
0.44
-0.07
0.06
0.26
0.40
0.19
0.08
0.27
-0.17
-0.10
0.23
-0.13
0.39
-0.26
-0.03
-0.24

Axe 3
-0.26
-0.26
0.14
0.08
0.14
-0.03
-0.11
0.12
-0.44
0.03
-0.05
0.21
-0.32
-0.06
-0.09
0.07
-0.41
-0.25
-0.23
-0.13
0.29
0.04
-0.19
0.28
0.08
0.16
0.08
-0.02
-0.26
0.01
-0.06
-0.19
-0.16
-0.17

Axe 4
0.01
-0.14
-0.23
-0.13
-0.23
-0.37
0.22
0.16
-0.1
0.05
0.29
-0.48
-0.25
0.32
-0.05
0.12
-0.31
-0.06
-0.18
0.17
-0.29
0.04
0.11
-0.17
0.14
-0.06
-0.07
-0.09
-0.01
0.25
-0.21
-0.24
0.21
-0.35

Axe 5
0.21
-0.02
-0.07
0.14
0.19
-0.07
0.45
-0.07
0.06
-0.03
-0.1
-0.08
0.07
0.09
-0.23
-0.01
-0.06
-0.17
-0.02
-0.16
0.22
0.12
0.14
0.08
-0.05
0.03
0.30
-0.05
-0.04
0.06
-0.08
0.03
-0.13
-0.09

Axe 6
-0.17
-0.07
0.02
0.03
0.17
-0.01
-0.19
0.11
0.21
0.13
-0.09
0.05
-0.11
-0.26
-0.17
0.12
-0.11
-0.25
0.04
-0.22
0.10
0.02
0.05
0.1
0.17
0.24
0.19
-0.14
0.01
-0.02
-0.06
-0.06
-0.14
-0.18

A2.3 Corrlations entre mots et axes


absolu
acharnement
acheter
admirer
adorer
ambition
me
amiti
angoisse
animal
arbre
argent
armure
art
astucieux
attachement
attaquer
audace
aventurier
btisseur
bijou
bleu
bohme
cadeau
campagne
caresse
crmonie
certitude
changement
charitable
charnel
chasse
chercheur
commander

Annexe 2
commerce
concret
confiance
confort
conqurir
consoler
construire
courage
crateur
cri
critiquer
danger
dfi
dsert
dsir
dsordre
dtachement
dieu
diffrent
discipline
douceur
doute
dynamique
eau
cole
conomiser
crire
efficace
effort
lgance
lite
motion
enfance
enseigner
ensemble
escalader

Axe 1
0.4
0.43
0.53
0.5
0.41
0.42
0.51
0.58
0.46
-0.04
-0.07
-0.16
0.24
-0.01
0.31
-0.21
-0.02
0.33
0.11
0.38
0.52
-0.08
0.55
0.3
0.36
0.37
0.35
0.55
0.35
0.53
0.37
0.16
0.41
0.4
0.39
0.21

Axe 2
-0.17
-0.01
0.04
-0.02
-0.06
-0.01
0.01
-0.06
-0.01
-0.1
0.07
0.13
0.18
0.24
0.39
0.24
-0.03
-0.3
0.26
-0.49
0.24
-0.05
0.11
0.22
-0.24
-0.37
0.12
-0.06
-0.14
0.08
-0.3
0.38
0.07
-0.05
0.25
0.2

Axe 3
-0.04
-0.13
0.09
0.26
-0.02
-0.02
-0.04
0.03
-0.07
-0.43
-0.43
-0.54
-0.27
-0.40
0.03
-0.32
-0.39
0.01
-0.31
-0.16
0.17
-0.41
0.02
-0.07
-0.14
-0.07
-0.14
-0.06
-0.35
0.16
-0.1
-0.18
0.08
-0.12
0.01
-0.25

Axe 4
-0.23
0.07
0.19
-0.21
-0.4
0.2
0.08
0.04
0.15
-0.05
-0.02
-0.1
-0.21
0.03
-0.27
-0.05
0.07
0.19
0.11
0.01
0.06
-0.01
0.01
0.08
0.29
-0.1
0.26
-0.01
0.16
-0.21
-0.25
0.04
0.15
0.27
0.09
0.01

Axe 5
-0.07
-0.26
-0.15
-0.1
-0.01
0.04
-0.21
-0.11
0.15
0.04
-0.09
-0.01
-0.08
0.13
-0.06
0.06
0.11
0.55
-0.03
-0.07
-0.02
0.09
-0.19
0.01
-0.1
-0.08
0.06
-0.3
-0.17
0.06
0.06
0.07
0.05
-0.11
0.02
0.03

Axe 6
0.04
-0.2
0.05
0.04
-0.12
0.16
-0.05
0.01
-0.31
0.21
-0.03
0.10
-0.06
0.09
0.13
0.04
-0.07
-0.25
-0.02
0.17
0.13
0.3
0.01
0.07
0.08
0.15
-0.03
-0.2
0.06
-0.07
-0.24
0.09
0.23
0.07
0.04
-0.07

La Smiomtrie
ternel
tranger
vasion
famille
faute
fconder
fminin
fermet
feu
fidlit
fleur
fleuve
foi
frontire
fusil
gaiet
gloire
gratuit
gurir
guerre
hriter
hros
honnte
honneur
humble
humour
le
immense
immobile
inconnu
industrie
infini
interdire
interroger
intime
inventeur

Axe 1
0.36
0.15
0.17
0.42
-0.16
0.44
0.38
0.37
-0.01
0.44
0.48
0.34
0.38
0.15
-0.05
0.5
0.43
0.34
0.49
-0.19
0.37
0.48
0.53
0.5
0.38
0.29
0.2
0.32
0.02
0.09
0.37
0.26
0.05
0.28
0.42
0.47

Axe 2
0.03
0.22
0.35
-0.18
-0.01
0.12
0.23
-0.32
0.27
-0.15
0.12
0.25
-0.31
-0.26
-0.22
0.2
-0.16
0.14
-0.01
-0.04
-0.17
-0.21
-0.13
-0.3
-0.01
0.34
0.43
0.21
-0.11
0.19
-0.36
0.18
-0.28
-0.08
0.24
0.05

Axe 3
-0.02
-0.27
-0.13
0.2
-0.38
0.07
0.01
-0.28
-0.38
0.19
0.18
-0.16
0.01
-0.24
-0.32
0.2
0.05
0.17
0.16
-0.3
0.18
0.01
0.11
0.02
-0.09
-0.03
-0.07
-0.23
-0.22
-0.34
-0.16
-0.28
-0.28
-0.34
0.04
-0.18

Axe 4
-0.09
0.25
-0.01
0.12
-0.03
-0.01
-0.12
0.04
0.01
0.11
0.23
0.19
0.19
-0.17
-0.34
0.09
-0.44
-0.24
0.12
-0.22
-0.34
-0.18
0.15
-0.1
0.15
0.02
-0.08
-0.08
-0.07
0.08
-0.03
0.03
-0.04
0.06
-0.05
0.12

Axe 5
0.34
0.06
0.05
0.04
0.08
-0.02
-0.08
-0.15
0.03
0.04
0.06
0.02
0.52
0.1
-0.02
-0.1
0.16
-0.01
-0.13
0.04
0.02
0.19
-0.16
0.06
-0.01
-0.11
0.13
0.14
0.16
0.08
-0.14
0.24
0.05
-0.06
-0.03
-0.16

Axe 6
0.01
-0.01
-0.1
0.26
0.3
0.16
0.03
-0.09
-0.13
0.2
0.12
-0.06
-0.23
0.12
-0.11
0.14
-0.06
0.06
0.07
-0.1
-0.09
-0.12
0.09
-0.09
0.1
0.06
0.09
-0.05
0.21
0.01
-0.01
-0.05
0.24
0.07
0.08
-0.19

219
ironie
jeu
justice
labyrinthe
lgret
livre
logique
loi
lune
magie
maison
matriser
mariage
masque
matriel
maternel
mfiance
mtallique
minceur
mode
modration
modestie
moelleux
montagne
morale
mort
muraille
musique
mystre
nager
naissance
nid
noble
nud
noir
nudit

Axe 1
-0.07
0.31
0.3
-0.07
0.1
0.3
0.43
0.35
0.28
0.18
0.47
0.44
0.38
0.04
0.34
0.49
0.01
0.11
0.36
0.38
0.4
0.41
0.38
0.31
0.4
-0.12
-0.02
0.35
0.11
0.26
0.33
0.47
0.38
0.06
-0.09
0.07

Axe 2
0.19
0.22
-0.12
0.04
0.42
0.16
-0.13
-0.33
0.35
0.32
-0.05
0.03
-0.18
0.09
-0.2
0.02
-0.1
-0.25
0.11
0.05
-0.17
-0.02
0.34
0.25
-0.45
-0.06
-0.22
0.3
0.31
0.25
0.01
0.14
-0.11
-0.07
0.19
0.42

Axe 3
-0.38
-0.01
-0.12
-0.43
-0.11
-0.04
-0.13
-0.21
-0.16
-0.08
0.22
-0.16
0.21
-0.25
-0.14
0.16
-0.35
-0.27
0.13
0.17
-0.11
-0.07
0.13
-0.09
-0.11
-0.44
-0.36
0.03
-0.32
-0.03
0.15
0.08
-0.09
-0.33
-0.32
-0.15

Axe 4
-0.09
-0.1
0.18
-0.11
-0.15
0.36
0.05
0.07
0.1
-0.21
-0.04
-0.05
-0.05
-0.19
-0.18
0.19
-0.2
-0.17
-0.18
-0.28
0.22
0.2
-0.07
0.1
0.15
0.1
-0.18
0.16
-0.05
-0.03
0.09
0.23
0.01
-0.13
-0.09
-0.18

Axe 5
-0.04
-0.01
0.01
0.11
0.18
0.05
-0.27
-0.02
0.19
0.19
-0.06
-0.24
0.2
0.16
-0.19
0.08
0.00
-0.06
0.06
0.17
-0.13
-0.09
0.07
0.01
-0.01
0.02
0.12
0.09
0.16
-0.01
0.1
0.01
0.22
0.09
0.01
-0.14

Axe 6
-0.06
0.02
-0.05
0.17
0.11
-0.1
-0.05
0.08
0.03
0.01
0.15
-0.22
0.25
0.23
0.06
0.22
0.31
0.05
0.04
0.06
-0.05
0.02
-0.04
0.06
0.04
0.01
0.12
-0.08
-0.06
0.04
0.35
-0.02
-0.29
0.2
0.08
-0.05

220
obir
ocan
or
orage
original
paix
pardon
parfum
patience
patrie
peau
perfection
posie
politesse
prcieux
prcision
prtre
produire
proprit
protger
prudence
puissance
punir
puret
question
raffine
raison
rcompense
recueillement
rflchir
rgle
respect
rver
rvolte
richesse
rigide

Axe 1
0.31
0.26
0.37
-0.1
0.26
0.39
0.41
0.37
0.41
0.44
0.39
0.38
0.38
0.51
0.49
0.52
0.37
0.5
0.45
0.54
0.46
0.39
0.01
0.52
0.24
0.46
0.49
0.54
0.39
0.42
0.37
0.52
0.3
-0.11
0.37
0.15

Axe 2
-0.47
0.41
0.07
0.34
0.43
0.01
-0.05
0.27
-0.01
-0.45
0.29
-0.22
0.2
-0.24
0.02
-0.12
-0.35
-0.21
-0.23
0.02
-0.21
-0.11
-0.28
-0.01
0.04
-0.03
-0.16
-0.04
-0.25
0.01
-0.34
-0.13
0.47
0.32
-0.05
-0.28

Axe 3
-0.2
-0.13
0.23
-0.44
-0.17
0.16
0.02
0.19
-0.08
-0.01
-0.03
-0.04
-0.04
0.12
0.1
-0.1
-0.02
-0.1
0.11
0.03
-0.02
-0.06
-0.43
0.09
-0.34
0.04
-0.14
0.24
-0.09
-0.29
-0.23
0.06
0.07
-0.41
0.21
-0.25

Axe 4
0.02
0.01
-0.5
0.02
-0.01
0.23
0.27
-0.11
0.21
0.01
-0.03
-0.17
0.31
0.08
-0.26
-0.01
0.18
-0.13
-0.31
0.11
0.04
-0.53
-0.02
0.09
0.12
-0.06
0.09
-0.23
0.26
0.23
0.08
0.14
-0.04
0.05
-0.55
-0.25

Axe 5
0.04
0.14
0.14
-0.01
-0.04
-0.04
0.13
0.13
-0.04
0.1
-0.01
-0.01
0.21
-0.1
0.12
-0.3
0.44
-0.21
-0.1
-0.06
-0.1
0.03
-0.04
0.16
-0.06
0.04
-0.15
-0.01
0.4
-0.21
-0.07
-0.1
0.15
-0.13
0.03
-0.01

Axe 6
0.23
0.06
0.03
-0.04
-0.14
0.11
0.05
0.06
0.15
-0.08
0.1
-0.1
-0.06
0.19
-0.04
-0.11
-0.17
-0.12
-0.02
0.15
0.23
-0.11
0.2
0.07
0.06
-0.11
-0.1
0.02
-0.18
-0.06
0.09
0.12
0.11
-0.03
-0.07
0.26

Annexe 2
rire
robuste
rompre
rouge
ruse
sacre
sacrifice
sauvage
science
secret
sduire
sensuel
soigner
soldat
sommet
souplesse
souverain
sublime
tendresse
thtre
tradition
trahir
travail
utilitaire
vert
victoire
vide
vieillir
viril
vitesse
volontaire
voluptueux

Axe 1
0.42
0.53
-0.15
0.17
0.01
0.45
0.19
-0.01
0.42
0.32
0.37
0.28
0.42
0.21
0.33
0.47
0.32
0.42
0.45
0.32
0.42
-0.28
0.37
0.46
0.29
0.44
-0.15
-0.04
0.4
0.08
0.45
0.28

Axe 2
0.28
-0.1
-0.19
0.09
0.19
-0.23
-0.31
0.42
-0.06
0.09
0.35
0.51
0.01
-0.42
0.25
0.22
-0.23
0.27
0.14
0.14
-0.26
-0.04
-0.31
-0.21
0.25
-0.14
-0.02
-0.08
-0.06
0.2
0.06
0.42

Axe 3
0.15
-0.04
-0.44
-0.14
-0.2
-0.02
-0.3
-0.33
-0.15
-0.18
0.11
0.01
-0.09
-0.17
-0.22
0.03
-0.13
0.03
0.17
-0.05
-0.05
-0.25
-0.15
-0.04
-0.03
0.1
-0.43
-0.36
0.04
-0.19
-0.15
-0.01

Axe 4
0.04
-0.02
-0.01
-0.01
-0.35
0.08
0.06
-0.06
0.18
-0.1
-0.33
-0.25
0.18
-0.15
0.08
0.01
-0.21
-0.13
0.13
0.3
0.04
-0.2
0.16
-0.01
0.1
-0.31
-0.13
0.19
-0.23
-0.38
0.01
-0.16

Axe 5
-0.1
-0.22
0.01
0.03
-0.11
0.42
0.07
0.03
-0.14
0.15
-0.03
-0.11
-0.06
0.09
0.02
-0.07
0.24
0.15
0.02
0.15
0.11
0.12
-0.12
-0.22
0.02
0.04
0.05
0.1
-0.06
-0.04
-0.21
-0.04

Axe 6
0.15
-0.22
0.07
-0.02
0.14
-0.2
0.17
0.02
-0.12
0.14
0.1
0.02
0.17
-0.05
-0.13
-0.06
-0.16
-0.15
0.26
-0.14
0.06
0.06
0.08
-0.05
-0.02
-0.04
0.2
0.12
-0.1
-0.1
0.02
-0.2

Glossaire
Algorithme ensemble des rgles opratoires propres un calcul.
Analyse factorielle famille de mthodes statistiques d'analyse multidimensionnelle, s'appliquant des tableaux de nombres, qui
visent calculer un nombre rduit de "facteurs" rsumant
approximativement l'ensemble des informations contenues
dans le tableau de dpart (annexe A1.2).
Analyse en facteurs communs et spcifiques cette analyse
correspond au modle classique d'analyse factorielle. Elle
dcrit un ensemble de variables par une combinaison linaire
de facteurs communs sous-jacents et d'une variable (facteur
spcifique) synthtisant la part spcifique des variables
d'origine (annexe A1.6 ; chapitre 2, section 2.6).
Analyse en composantes principales mthodes d'analyse factorielle*
s'appliquant aux tableaux de mesures (annexe A1.3 ; chapitre 1,
section 1.3).
Analyse des correspondances mthode d'analyse factorielle
s'appliquant l'tude de tableaux double entre composs de
nombres positifs. L'analyse des correspondances est
caractrise par l'emploi d'une distance (ou mtrique)
particulire dite distance du chi-2 (ou 2) (annexe A1.4 ;
chapitre 4, sections 4.3 et 4.4).

222

Glossaire

Analyse logarithmique mthode qui consiste transformer les


donnes en logarithmes (aprs addition ventuelle d'une
constante en cas de donnes ngatives), puis, aprs les avoir
centres en ligne et en colonne, les soumettre une analyse
en composantes principales* non norme (annexe A1.5 ;
chapitre 5, section 5.7).
Bootstrap la technique du bootstrap consiste simuler s (s
gnralement suprieur 30) chantillons de mme taille n que
l'chantillon initial. Ils sont obtenus par tirage au hasard avec
remise parmi les n individus observs au dpart, ceux-ci ayant
tous la mme probabilit 1/n d'tre choisis. Cette mthode est
employe pour analyser la variabilit de paramtres statistiques
simples en produisant des intervalles de confiance* de ces
paramtres (annexe A1.9.5 ; chapitre 2, sections 2.3 et 2.4 ;
chapitre 4, section 4.4).
Bootstrap partiel variante du bootstrap* dans le cas des analyses
factorielles qui consiste projeter les colonnes des tableaux
rpliqus (mots) comme des lments supplmentaires* sur les
axes de lanalyse de rfrence, c'est--dire lanalyse de
lchantillon inital non perturb (annexe A1.9.5 ; chapitre 2,
section 2.3).
Bootstrap total variante du bootstrap dans le cas des analyses
factorielles qui consiste refaire des analyses en composantes
principales* compltes sur chaque chantillon rpliqu (annexe
A1.9.5 ; chapitre 2, section 2.3).
Bootstrap sur variables le bootstrap est ici ralis non pas sur les
individus, mais sur les variables, ce qui permet d'prouver les
structures observables au niveau des individus (annexe A1.9.5 ;
chapitre 2, section 2.4).
Carte auto-organise de Kohonen mthode de classification* qui
consiste reprsenter dans un espace deux (parfois trois)
dimensions un grand nombre de donnes en respectant la
notion de voisinage de l'espace des lments classer (annexe
A1.8 ; chapitre 3, section 3.1 ; chapitre 4 section 4.2).
Classification technique statistique permettant de regrouper en classes
homognes des individus ou observations entre lesquels a t
dfinie une distance.
Classification hirarchique technique particulire de classification*
produisant, par agglomration progressive, des classes ayant la

La smiomtrie

223

proprit d'tre, pour deux quelconques d'entre-elles, soit


disjointes, soit incluses lune dans lautre (annexe A1.7 ;
chapitre 3, section 3.1).
Coefficient de corrlation indice exprimant dans quelle mesure deux
variables numriques varient de faon concomitante. Cet indice
varie de 1 +1. Il est positif lorsque les valeurs leves (resp.
faibles) d'une variable tendent tre associes aux valeurs
leves (resp. faibles) de l'autre variable. Il est ngatif lorsque
les valeurs leves d'une variable tendent tre associes aux
valeurs faibles de l'autre variable (annexe A1.3 et passim).
Comparaison multiple un problme de comparaison multiple se pose
lorsquon ritre un test statistique conu, dans son principe,
pour ntre ralis quune seule fois (annexe A1.9.2).
Corpus ensemble limit des lments (noncs) sur lesquels se base
l'tude d'un phnomne linguistique.
Dendrogramme reprsentation graphique d'un arbre de classification
hirarchique*, mettant en vidence l'inclusion progressive des
classes (chapitre 3, section 3.1.1 ).
Distance du chi-2 distance entre profils* de frquences utilise en
analyse des correspondances* et dans certains algorithmes* de
classification* (annexe A1.4).
Elments actifs ensemble des lments servant de base au calcul des
axes factoriels, des valeurs propres* relatives ces axes et des
coordonnes factorielles.
Elments supplmentaires (ou illustratifs) ensemble des lments ne
participant pas aux calculs des axes factoriels, pour lesquels on
calcule a posteriori des coordonnes factorielles (annexe
A1.9.3).
Facteur variables artificielles construites par les techniques d'analyse
factorielle permettant de rsumer (de dcrire brivement) les
lments actifs* initiaux (variables actives et individus actifs).
Facteur taille Un tel facteur* apparat lorsque toutes les variables sont
corrles positivement entre elles. Cette caractristique apparat
le plus souvent sur le premier axe de l'analyse en composantes
principales*, que l'on appelle alors "facteur taille" (chapitre 5).
Intervalle de confiance Il permet d'valuer la prcision d'un
estimateur et s'interprte comme une marge d'erreur lie au
phnomne de la fluctuation d'chantillonnage.

224

Glossaire

Pourcentages d'inertie (ou de variance) quantits proportionnelles


aux valeurs propres*, dont la somme est gale 100. Notes
. Dans le cas dune analyse en composantes principales, les
pourcentages dinertie ne peuvent tre systmatiquement
interprts en termes de pourcentages dinformation . Ils
peuvent parfois tre trs faibles et cependant trs significatifs
statistiquement (cas de donnes fortement bruites).
Profil (d'une ligne ou d'une colonne d'un tableau de contingence*)
vecteur constitu par le rapport des effectifs composant une
ligne (resp. colonne) la somme des mmes effectifs.
Question ferme question dont les seules rponses possibles sont
proposes explicitement la personne interroge.
Question ouverte question pose sans grille de rponse prtablie,
dont la rponse peut tre numrique (ex: Quel est votre ge ?),
ou textuelle (exemple, aprs certaines questions fermes :
Pourquoi ?) (Chapitre 4).
Tableau de contingence synonyme de tableau de frquences ou de
tableau crois : tableau dont les lignes et les colonnes
reprsentent respectivement les modalits de deux questions
(ou deux variables nominales), et dont le terme gnral
reprsente le nombre d'individus correspondant chaque
couple de modalits (annexe A1.4).
Valeurs propres quantits permettant, lors dune analyse factorielle*,
de juger de l'importance des facteurs* successifs de la
dcomposition factorielle. La valeur propre note mesure
la dispersion (variance) des lments sur l' axe (annexe
A1.3).
Valeur-test quantit permettant d'apprcier la signification de la
position d'un lment supplmentaire* (ou illustratif) sur une
axe factoriel. Brivement, si une valeur-test dpasse 2 en valeur
absolue, la position de l'lment correspondant a peu de chance
dtre due au hasard (annexe A1.9.1, et passim) ; mais attention
aux comparaisons multiples* !

Bibliographie

Agoramtrie, Rapports de l'association Agoramtrie, 20 rue Rosenwald, 75015, Paris


Anatrella T. (1995), Non la socit dpressive, Champs, Flammarion, Paris.
Anderson T. W., Rubin H. (1956), Statistical inference in factor analysis, Proc. of the
3rd Berkeley Symp. on Math. Statist., 5, p 111-150.
Anderson T. W. (1963), Asymptotic theory for principal component analysis, Ann.
Math. Statist., 34, p 22-148.
Baayen R. H. (2001), Word Frequency Distributions, Kluwer Academic Publishers,
Dordrecht.
Barthes R. (1957), Mythologies, Editions du Seuil, Paris.
Benzcri J.-P. (1982), Histoire et prhistoire de l'analyse des donnes, Dunod, Paris.
Benzcri J.-P. (1989), Essai danalyse des notes attribues par un ensemble de sujets
aux mots dune liste, Cahiers de lAnalyse des Donnes, Vol XIV, 1, p 73-98.
Benzcri J-P. (1973), L'Analyse des Donnes, Tome 1 : La Taxinomie, Tome 2 :
L'Analyse des Correspondances, Dunod, Paris.
Brchon P. (2000), Les valeurs des Franais. Evolutions de 1980 2000, Armand
Colin, Paris.

226

Bibliographie

Chateau F., Lebart L. (1996), Assessing sample variability in the visualization


techniques related to principal component analysis: bootstrap and alternative
simulation methods, in : COMPSTAT96, A. Prats (ed), Physica Verlag, Heidelberg,
p 205-210.
Cottrell M., Rousset P. (1997), The Kohonen Algorithm: a powerful tool for analysing
and representing multidimensional qualitative and quantitative data, in: Biological
and Artificial Computation : From Neuroscience to Technology, J. Mira, R.
Moreno-Diaz, J. Cabestany, (eds), Springer, p 861-871.
Daudin J.-J., Duby C., Trcourt P. (1988), Stability of principal components studied
by the bootstrap method, Statistics, 19, p 241-258.
Diaconis P., Efron B. (1983), Computer intensive methods in statistics, Scientific
American, 248, p 116-130.
Efron B. (1979), Bootstraps methods : another look at the Jackknife, Ann. Statist., 7,
p 1-26.
Efron B. (1982), The Jackknife, the Bootstrap and other resampling plans, SIAM,
1982, p 116-130.
Efron B., Thisted R. (1976), Estimating the number of unseen species : how many
words did Shakespeare know ?, Biometrika, 63, p 435-437.
Ehrenberg A. (1998), La fatigue dtre soi. Odile Jacob, Paris.
Escoufier Y. (1970), Echantillonnage dans une population de variables alatoires
relles, Publications de l'Institut de Statistique de l'Universit de Paris, Vol XIX,
fasc. 4, p 1-47.
Fabre J., Morlat G., Pags J-P, Stemmelen B. (1981), Les Structures de l'Opinion
Publique, Le Progrs Technique, n 22-24, ANRT, Paris.
Ferrand L., Alario F.-X. (1998), Normes dassociations verbales pour 366 noms
dobjets concrets, Lanne psychologique, 98, p 659-709.
Freud S. (1978), Abrg de psychanalyse, PUF, Paris.
Freud S. (1985), Trois Essais sur la thorie sexuelle, Gallimard, Paris.
Garnett J.-C. (1919), General ability, cleverness and purpose, British J. of Psych.,
9, p 345-366.
Gifi A. (1981), Non Linear Multivariate Analysis, Department of Data theory,
University of Leiden, (updated version: 1990, same title, J. Wiley, Chichester).
Greenacre M. (1984), Theory and Applications of Correspondence Analysis,
Academic Press, London.
Harman H.H. (1967), Modern Factor Analysis, Chicago University Press, Chicago.
Hayashi C. (1956), Theory and examples of quantification, (II), Proc. of the Institute
of Statistical Mathematics, 4, (2), p 19-30.
Hochberg, Y. (1988), A sharper Bonferroni procedure for multiple tests of
significance, Biometrika, 75, p 800-803

La Smiomtrie

227

Holmes S. (1989), Using the bootstrap and the RV coefficient in the multivariate
context, in : Data Analysis, Learning Symbolic and Numeric Knowledge, E. Diday
(ed.), Nova Science, New York, p 119-132.
Hotelling H. (1933), Analysis of a complex of statistical variables into principal
components, J. Educ. Psy. 24, p 417-441, p 498-520.
Hsu, J. C. (1996), Multiple Comparisons: Theory and Methods, Chapman & Hall,
London.
Jacob F. (1970), La logique du vivant, Gallimard, Paris.
Kazmierczak J.-B. (1985), Analyse logarithmique : deux exemples d'application,
Revue de Statist. Appl., 33, (1), p 13-24.
Kleiweg P. (1996), Een inleidende cursus met practica voor de studie AlfaInformatica, Master's thesis, Rijksuniversiteit Groningen, 1996.
Kohonen T. (1989), Self-Organization and Associative Memory, Springer-Verlag,
Berlin.
Laplanche J., Pontalis J.-B. (1994), Vocabulaire de la psychanalyse, PUF, Paris.
Lawley D. N., Maxwell A. E. (1963), Factor Analysis as a Statistical Method,
Methuen, London.
Lebart L. (1986), Qui pense quoi en France ? Evolution et structure des opinions en
France de 1978 1984, Consommation, Revue de Socio-Economie, Dunod, p 3-22.
Lebart L., Houzel Y. (1980), Le systme denqute sur les conditions de vie et
aspirations des Franais, Consommation, Revue de Socio-Economie, Dunod, p 325.
Lebart L., Morineau A., Warwick K. (1984), Multivariate Descriptive Statistical
Analysis, J. Wiley, New York.
Lebart L., Morineau M., Piron M. (2002), Statistique exploratoire multidimensionnelle, Dunod, Paris.
Lebart L., Salem A. (1994), Statistique textuelle. Dunod, Paris.
Lebart, L., Salem, A., Berry, L. (1998), Exploring Textual Data, Kluwer Academic
Publishers, Dordrecht.
Meulman J. (1982), Homogeneity Analysis of Incomplete Data, DSWO Press, Leiden.
Milan L., Whittaker J. (1995), Application of the parametric bootstrap to models that
incorporate a singular value decomposition, Appl. Statist. 44, 1, p 31-49.
Muirhead R. J. (1982), Aspects of Multivariate Statistical Theory, J. Wiley, New
York.
Mulaik S. A. (1972), The Foundation of Factor Analysis, McGraw Hill, New York.
Muller C. (1977), Principes et mthodes de statistique lexicale, Hachette, Paris.
Muller C. (1979), Peut-on estimer ltendue dun lexique ? In : Langue Franaise et
Linguistique Quantitative, p 399-425, Slatkine, Genve.

228

Bibliographie

O'Neill, R., and G. B. Wetherill. (1971), The present state of multiple comparison
methods (with discussion), Journal of the Royal Statistical Society, Series B, 33,
p 218-250.
Osgood C. E. (1965), Cross-Cultural Comparability in Attitude Measurement via
Multilingual Semantic Differentials, in: Steiner I., Fishbein M. (Eds): Current
Studies in Social Psychology, Holt, Rinehart and Winston, New York.
Osgood C. E., Suci G. J., Tannenbaum P. H. (1957), The Measurement of Meaning,
University of Illinois, Urbana.
Perneger T.,V. (1998), What is wrong with Bonferroni adjustments, British Medical
Journal, 136, p 1236-1238
Riffault H. (1994), Les valeurs des Franais, PUF, Paris.
Saville, D. J. (1990), Multiple comparison procedures: The practical solution,
American Statistician, 44, p 174-180.
Sokal R. R., Sneath P. H. A. (1963), Principles of Numerical Taxonomy, Freeman and
co., San-Francisco.
Spearman C. (1904), General intelligence, objectively determined and measured,
Amer. Journal of Psychology, 15, p 201-293.
Stauffer D. F., Garton E. O., Steinhorst R. K. (1985), A comparison of principal
component from real and random data, Ecology, 66, p 1693-1698.
Steiner J.-F., Auliard, O. (1992), La smiometrie: un outil de validation des rponses,
In : La Qualit de l'Information dans les Enqutes / Quality of Information in
Sample Surveys, ASU, (L. Lebart ed.), Dunod, Paris, p 241-274.
Stoetzel J. (1983), Les valeurs du temps prsent : une enqute europenne, PUF, Paris.
Thiria S., Lechevallier Y., Gascuel O., Canu S. (1997), Statistique et mthodes
neuronales, Dunod, Paris.
Thurstone L. L. (1947), Multiple Factor Analysis, The University of Chicago Press,
Chicago.
Valette-Florence P. (1994), Les styles de vie. Bilan critique et perspectives, Nathan,
Paris.
Westfall, P. H., Young S. S. (1993), Resampling-Based Multiple Testing: Examples
and Methods for p-Value Adjustment, J. Wiley, New York.
Westfall P. H., Tobias R. D., Rom D., Wolfinger R. D., Hochberg Y. (1999), Multiple
Comparisons and Multiple Tests Using the SAS System, SAS Institute.
Young G. A. (1994), Bootstrap: more than a stab in the dark, Statistical Science, 9,
p 382-418.

Ludovic Lebart
Marie Piron
Jean-Francois Steiner

LA SMIOMTRIE
Essai de statistique structurale

Au-del de leur signification, les mots, par les souvenirs quils


mobilisent, ont le pouvoir de provoquer en nous des sensations
agrables ou dsagrables.
De cette observation simple est ne une mthode, la
Smiomtrie, largement utilise en marketing et dans les tudes
psychosociologiques. Mais, grce la puissance des outils statistiques actuels, son pouvoir dinvestigation va, bien au-del de
ces applications pratiques, jusquaux confins de la psychanalyse
et de la linguistique.
Il semblait indispensable quun ouvrage fasse le point sur les
principes de cette mthode, les travaux raliss et les applications potentielles. Le lecteur peut maintenant dcouvrir, au fil des
chapitres, ltendu du travail dexprimentation, la svrit des
preuves de validation, la profondeur et la finesse des rsultats
obtenus, enfin les promesses de cet outil transdisciplinaire.
Plusieurs niveaux de lecture sont possibles selon les connaissances mathmatiques et statistiques du lecteur ; les dveloppements plus techniques sont en effet regroups dans une annexe.
Ce livre sadresse aux spcialistes du marketing et de la communication, aux socio-conomistes, aux statisticiens, aux psychosociologues, aux linguistes. Il intresse un large public, allant des
socits dtudes et des instituts de sondage aux tudiants, professeurs et chercheurs des universits ou des grandes coles.

ISBN 2 10 008105 5

http://www.dunod.com

LUDOVIC LEBART
est directeur de recherches
au CNRS et professeur
lENST (cole nationale
suprieure des
tlcommunications)

MARIE PIRON
est charge de recherches
lIRD (Institut de
recherche pour le
dveloppement)

JEAN-FRANOIS STEINER
est crivain.

Vous aimerez peut-être aussi