Vous êtes sur la page 1sur 32

L’analyse de similitude

Boumedine Bouriche
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
L’objectif de ce chapitre est de présenter au lecteur les éléments théo-
riques et pratiques nécessaires à l’apprentissage et la maîtrise de l’analyse
de similitude.

LES ORIGINES

Les origines de l’analyse de similitude remontent aux années soixante


qui ont vu fleurir les interfaces entre sciences humaines et mathématiques.
Dans cette effervescence, Claude Flament avait le souci d’associer psy-
chologie sociale et formalisation. Il explorait la théorie des graphes pour
expliquer les biais de communication. Puis, associant sa pratique des ana-
lyses statistiques et les possibilités ouvertes par les mathématiques du dis-
cret, il invente l’analyse de similitude.
Alors que la méthode se développait, le trio des années soixante-dix 1
visait une formalisation mathématique de plus en plus sophistiquée. Ils
découvraient l’arbre maximum, les cliques et le filtrant des cliques. Ils
exploraient la possibilité d’utiliser la théorie des hypergraphes. La pratique
a eu aussi son rôle dans l’évolution de la méthode. En effet, utilisée par de
nombreux chercheurs, on découvrait les problèmes que posaient des don-
nées de formes bien différentes et des questionnaires toujours en évolu-
tion. Mais l’analyse de similitude, tout en se complexifiant, est restée

Boumedine Bouriche, laboratoire de psychologie sociale, université de Provence, Aix-en-Provence.


1. Claude Flament, Alain Degenne, Pierre Vergès.
222 Méthodes d’étude des représentations sociales

fidèle à ses origines. Elle a profité de tous ces moments où il a fallu


remettre en cause les intuitions initiales ou plus exactement les rapports
entre propriétés mathématiques et interprétations par les sciences sociales.
On avait fait, dans les années soixante-dix, un peu trop confiance aux
mathématiques, comme d’autres ont fait trop confiance aux statistiques,
pour dicter l’interprétation de l’analyste alors qu’il ne fallait que la guider
ou, plus exactement, s’interroger sur la traduction entre propriétés mathé-
matiques et propriétés du social.

L’ANALYSE AVANT TOUT

Aussi, le rôle de l’analyste est déterminant. Cette méthode est une


méthode générale d’analyse de données, elle est alternative ou complé-
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
mentaire des classiques analyses factorielles ou de classification. Mais elle
est aussi plus particulièrement adaptée à la théorie des représentations
sociales, ce qui n’étonnera personne quand on sait le rôle que joue son
inventeur dans le champ des représentations sociales. L’analyse de simili-
tude a la grande qualité de ne pas éliminer l’analyste des différentes phases
de l’analyse. À aucun moment, ne lui sont proposés les résultats d’une
boite noire. Au contraire, l’analyse de similitude demande à l’analyste de
prendre des décisions à chaque étape de la démarche. Elle propose des
descriptions qui doivent être validées et peuvent même être quelque fois
contradictoires à première vue. Elle le pousse alors à trouver son interpré-
tation au croisement de deux informations différentes. Ce chapitre illustre
comment à chaque instant la décision de l’analyste est réclamée.

ANALYSE DE SIMILITUDE ET REPRÉSENTATIONS SOCIALES

L’analyse de similitude n’a pas été élaborée et développée pour ses


simples vertus mathématiques et descriptives. C’est une analyse de don-
nées particulièrement en phase avec l’étude des représentations sociales. Il
est possible de mettre en correspondance les propriétés mathématiques
des graphes et les notions qui sont utilisées dans la théorie des représen-
tations sociales. Ainsi une représentation sociale est constituée d’éléments
sélectionnés parce qu’ils sont proches du thème dont on cherche la repré-
sentation. Mais la représentation n’est pas seulement œuvre de sélection
et d’amnésie, elle est fondamentalement une organisation, un ensemble
de relations entre ses éléments. Ces relations ne sont pas transitives (si A
va avec B et B avec C, A n’ira pas forcément avec C), ce sont des relations
de proximité dont les valeurs peuvent être fort diverses, exprimant la plus
ou moins grande proximité, et sont définies localement. Elles sont le plus
L’analyse de similitude 223

souvent symétriques. Pour illustrer ces relations, nous utilisons la théorie


des graphes 2. Elle nous permet de dire qu’à toute matrice symétrique cor-
respond un graphe valué non orienté. Un graphe, c’est des points et des
traits les reliant.
La théorie des représentations sociales a développé un ensemble de
notions telles celles de noyau central, de saillance, d’éléments périphé-
riques, de principes organisateurs etc. Les chercheurs dans ce domaine ont
trouvé dans l’analyse de similitude des correspondances permettant le
traitement des données issues de questionnaires visant l’expression de
représentations sociales. Cependant l’analyse de similitude ne se réduit
pas à l’étude des représentations sociales : c’est une méthode générale
d’analyse de données.
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
LA DÉMARCHE

Nous présentons les différentes étapes de l’analyse de similitude.


Celles-ci sont au nombre de 4 :
– la création et l’exploration de la matrice de similitude ;
– la visualisation de l’arbre maximum et des graphes au seuil ;
– la visualisation du filtrant des cliques maximales ;
– la comparaison de matrices de similitude de différentes sous-popula-
tions.
Une exploitation rapide des données se contente des deux premières
étapes. La troisième est nécessaire pour une analyse fouillée. La quatrième
est essentielle pour mettre en évidence les spécificités de certaines sous-
populations définies par une configuration particulière des patrons de
réponse.
Nous prendrons un exemple simple dont l’objectif se veut strictement
pédagogique : présenter la démarche et montrer comment à chaque ins-
tant la décision de l’analyste est réclamée. Cet exemple concerne la per-
ception de figures géométriques (Guimelli, 1989). Dans le souci d’illus-
trer au mieux la démarche, nous nous appuierons parfois sur des études
d’objets réels de représentation.
Supposons, pour les besoins de l’exemple, que l’objet de représenta-
tion étudié soit ici « l’arrondi ».
Nous avons présenté à cent étudiants (cinquante étudiants et cin-
quante étudiantes) un questionnaire qui visait à caractériser la « forme
arrondie » par le choix de figures dans une liste.

2. Théorie définie par Koening, 1925 et introduite en France par Berge, 1970.
224 Méthodes d’étude des représentations sociales

Figure 1. – Figures géométriques questionnaire de caractérisation.

01- Carré 02- Abri 1 03- Losange

04- Quartier 05- Cercle 06- Serpentin

07- Rectangle 08- Abri 2 09- Haricot

F1) Quelles sont à votre avis les 3 figures les plus caractéristiques de la forme arrondie ?
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
1 2 3

F2) Quelles sont à votre avis les 3 figures les moins caractéristiques de la forme arrondie ?

1 2 3

On peut donc classer, pour chaque sujet, les items sur une échelle
de trois degrés : plus caractéristique (3), non choisi (2), moins caractéris-
tique (1). Les résultats sont résumés dans le tableau 1 :

Tableau 1. – Figures géométriques moyennes et distributions par item.

Items Moyenne Le moins Non choisi Le plus


caractéristique caractéristique
01 CARRE 1,06 96 2 2
02 ABRI 1 2,61 0 39 61
03 LOSANGE 1,03 98 1 1
04 QUARTIER 2,14 0 86 14
05 CERCLE 2,94 0 6 94
06 SERPENTIN 2,37 2 59 39
07 RECTANGLE 1,00 100 0 0
08 ABRI 2 2,39 2 57 41
09 HARICOT 2,44 2 52 46

Selon Abric, un élément central est plus caractéristique de la repré-


sentation qu’aucun autre élément. Le critère caractéristique se traduit ici
par une moyenne forte (proche de 3).
L’analyse de similitude 225

Les items « Cercle » et « Abri1 » pourraient, compte tenu de leur


moyenne (respectivement 2,94 et 2,61) être considérés comme des élé-
ments probables du noyau central.
Cependant la prise en compte de la distribution des réponses est aussi,
sinon plus, essentielle au repérage d’un élément central. En effet, un item
choisi comme caractéristique par chacun des sujets doit se traduire par
une distribution dissymétrique avec une forme fortement penchée vers la
note 3 donnant une courbe dite en J (Vergès, 1995).
L’item « Cercle » répond très bien à cette condition. Il a une grande
probabilité d’appartenir au noyau central (un test de centralité conforte-
rait cette conclusion). L’item « Abri1 » satisfait beaucoup moins bien, il
serait plutôt un élément périphérique.
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Figure 2. – Figures géométriques distributions des sujets pour l’item « cercle ».

Figure 3. – Figures géométriques distributions des sujets pour l’item « Abri1 ».


226 Méthodes d’étude des représentations sociales

L’analyse de similitude va nous permettre de situer ces deux items aux


moyennes fortes mais aux statuts différents dans la structure de la repré-
sentation.

Étape 1 : la création de la matrice de similitude

On calcule l’indice de similitude pour chaque couple de figures (ici un


indice de distance qui nous permet d’illustrer, en plus de la proximité, des
oppositions entre différentes dimensions de la représentation).
L’indice de distance mesure l’intensité de la différence observée dans
le classement des figures par les sujets. Pour chaque couple de figures, le
calcul de cette différence est effectué à partir de la matrice des différences
présentée dans le tableau 2. Dans chaque case, figure la différence d en
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
valeur absolue entre les modalités des figures A et B.
Par exemple, si la figure A est classée parmi les figures les moins carac-
téristiques (score 1 sur l’échelle) et la figure B parmi les figures les plus
caractéristiques (score 3), la différence d est égale à 2 (différence maxi-
male). Si, au contraire, les deux figures obtiennent le même score, la dif-
férence d sera toujours égale à 0 (différence minimale).
Tableau 2. – Matrice des différences en valeur absolue entre les modalités des figures A et B.

Figure A Le moins caractéristique Non choisi Le plus caractéristique


Figure B 1 2 3
Le moins caractéristique
0 1 2
1
Non choisi
1 0 1
2
Le plus caractéristique
2 1 0
3

Tableau 3. – Croisement du classement des figures « Carré » et « Abri 1 » par les 100 sujets.

01 Carré Le moins Non choisi Le plus


caractéristique caractéristique Total
02 Abri 1 1 2 3
Le moins
caractéristique 0 0 0 0
1
Non choisi
39 0 0 39
2
Le plus
caractéristique 57 2 2 61
3
Total 96 2 2 100
L’analyse de similitude 227

Le tableau 3 donne la répartition des sujets dans le croisement des


figures « Carré » et « Abri 1 ».
On calcule alors, pour l’ensemble des sujets, la différence observée
dans le classement des figures « Carré » et « Abri 1 » en faisant la somme
du produit des différences en valeur absolue (tableau 2) et des effectifs
(tableau 3), que l’on nomme E o (écart observé) :
E o = (1×39)+(2×57)+(1×2)+(0×2) = 155
Il s’agit alors de comparer cette différence observée à la différence
maximale (Em, écart maximum). Em varie en fonction du nombre de sujets
et du nombre de degrés de l’échelle. Il se calcule de la manière suivante :
Em = n × e
où n est le nombre de sujets et e la différence maximale en valeur
absolue d’une échelle donnée.
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
ici, Em = 100 × 2 = 200.
L’indice de distance se calcule en posant le rapport :
D = [ 2 ((Em - E o) / Em) ] – 1
D varie entre –1 et +1.

Plus la valeur de D se rapproche de +1 et plus la relation de similitude


entre deux variables est forte. Plus D est proche de – 1 et plus la relation
d’opposition est forte.
Ici, D = [ 2 ((200 - 155) / 200) ] – 1 = – 0,55, la valeur de cet indice
marque une relation d’opposition importante entre les figures « Carré » et
« Abri 1 ».
Une fois les indices calculés pour tous les couples de figures, l’on
obtient la matrice de similitude présentée dans le tableau 4.
Lorsque les items de cette matrice sont ré-ordonnés, on voit apparaître
une structure binaire.
L’analyse de cette structure binaire montre l’opposition entre une
dimension « arrondis » (ensemble d’items A) et une dimension « angu-
laires » (ensemble B). Quelle que soit l’arête considérée entre les sommets
de chacune de ces deux dimensions, la valeur des indices est toujours
négative (en italique dans le tableau).
Par ailleurs, si la dimension « angulaires » présente une structure
simple et homogène (fortes valeurs positives des indices), la dimension
« arrondis » fait apparaître une structure plus complexe et beaucoup
moins homogène (hétérogénéité des valeurs et même valeur négative, bien
que faible –.02, pour l’arête (2,5)).
228 Méthodes d’étude des représentations sociales

Tableau 4. – Figures géométriques matrice de similitude.

05 02 09 08 06 04 01 03 07
05 CERCLE 0
02 ABRI 1 .64 0 A
09 HARICOT .40 .08 0
08 ABRI 2 .40 .74 .14 0
06 SERPENTIN .34 – .02 .88 .20 0
04 QUARTIER .14 .46 .44 .42 .52 0
01 CARRE – .90 – .55 – .46 – .42 – .40 – .12 0 B
03 LOSANGE – .92 – .58 – .46 – .40 – .38 – .14 .96 0
07 RECTANGLE – .94 – .60 – .44 – .40 – .36 – 1.4 .94 .96 0
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Cette structure binaire a également été obtenue dans une étude sur
l’image de la banque 3 ou l’on demandait aux sujets (506 personnes) de
caractériser la banque en général en choisissant, parmi 6 items (la banque
me fait confiance, on est en confiance, aide aux problèmes des particu-
liers, découvert rapporte à la banque, travailler l’argent à son profit, on
n’est qu’un numéro), les deux items les plus caractéristiques de la banque,
puis les deux items les moins caractéristiques, il restait alors deux items
non choisis. On obtient ici aussi une matrice de similitude qui présente
une structure binaire : d’un coté l’on trouve une vision positive et de
l’autre une vision plutôt négative de la banque (tableau 5).
Tableau 5. – Banque matrice de similitude.

1 2 3 4 5 6
1 La banque me fait confiance 0
2 On est en confiance .25 0
3 Aide problèmes particuliers .12 .10 0
4 Découvert rapporte à banque – .38 – .14 – .17 0
5 Travailler à son profit – .16 – .16 – .23 .21 0
6 On n’est qu’un numéro – .29 – .32 – .15 .15 .21 0

Nous allons voir comment l’analyse de similitude va nous permettre


d’étayer cette première lecture des données.
La matrice [X x X] où l’on rassemble les indices de similitude est
constituée de M↔(M – 1)/2 valeurs avec m le nombre de variables étu-

3. Abric, 1998.
L’analyse de similitude 229

diées. Dans l’exemple des figures géométriques, m est égal à 9, cela nous
donne 36 valeurs.
Il faut donc se donner un moyen de résumer ces données en perdant
le minimum d’informations pour répondre à la question : quelle organi-
sation d’un ensemble de variables cherche-t-on à décrire ?
L’on veut savoir tout d’abord si ces variables s’organisent autour de
dimensions.
Nous utiliserons la théorie des graphes et plus précisément la notion
de chaîne et la notion d’arbre comme ensemble de chaînes maximales.
La figure 4 représente un graphe. Ce graphe compte 6 sommets de
« a » à « f » reliés par des arêtes que l’on écrit : (a,d), (d,b), (b,c) etc.
Figure 4. – Graphe G.
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
b
d

e
a
c
f

L’ensemble des sommets est désigné par X et l’ensemble des arêtes par
U. le graphe est alors noté : G=(X,U).
Une chaîne est une séquence d’arêtes du graphe. Une chaîne permet
de passer d’un sommet (d’une variable) à un autre sommet par un par-
cours empruntant des arêtes toutes différentes. Il est possible de cheminer
dans le graphe G du sommet « a » au sommet « f » en passant par les som-
mets « d », « b » et « e ». La chaîne est ainsi constituée des arêtes (a,d),
(d,b), (b,e), (e,f ) et s’écrit (a,d,b,e,f ).
Si, à partir d’un sommet, le parcours d’une chaîne nous ramène sur le
sommet de départ, l’on parle d’un cycle.
Un sous-graphe GA est le graphe G dont certains sommets et les arêtes
correspondantes ont été éliminés (figure 5).
Figure 5. – Sous-graphe GA de G.

b
d

a
c
230 Méthodes d’étude des représentations sociales

Une arête entre deux sommets quelconques d’un sous-graphe, est


appelée une clique.
Un graphe partiel est le graphe G dans lequel tous les sommets ont été
conservés mais pas toutes les arêtes (figure 6).
Figure 6. – Graphe partiel de G.

b
d

e
a
c
f
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Si un groupe de sommets est tel que l’on peut toujours trouver une
chaîne pour joindre deux sommets quelconques de ce groupe, il est appelé
composante connexe.
Si l’on affecte une valeur aux différentes arêtes, l’on obtient une repré-
sentation graphique donnant la même information que la matrice de
similitude : des variables et des valeurs de similitude entre chaque paire de
variables qui deviennent, dans la théorie des graphes, des sommets et des
arêtes valuées (un graphe valué).
Un arbre est un graphe connexe (incluant une chaîne permettant d’al-
ler de n’importe quel point, ou sommet, à n’importe quel autre) et sans
cycle (le premier point d’une chaîne n’est pas identique au dernier). Un
arbre maximum est un arbre dont les arêtes ont les plus fortes valeurs. Il
donne une structure à l’ensemble des variables.
Nous utilisons pour construire cet arbre l’algorithme de Kruskal :
Nous ordonnons de manière décroissante (grâce à leur valeur) les
36 arêtes du graphe. L’ensemble de ces valeurs forme un préordre (il peut
y avoir plusieurs arêtes de même valeur).
On appelle préordonnance de similitude la liste ordonnée associant les
arêtes et leurs valeurs. Pour le graphe de cet exemple nous avons la préor-
donnance suivante avec comme première arête, l’arête rejoignant les som-
mets 7 et 8 dont la valeur est .96 et comme 36e et dernière arête, l’arête (1,9)
dont la valeur est – .94. L’objectif est de construire l’arbre maximum.
La méthode consiste à parcourir la préordonnance de manière décrois-
sante et à ne retenir que les arêtes qui ne construisent pas un cycle avec les
arêtes déjà retenues (tableau 6). Dès que l’on obtient un graphe connexe
et sans cycle, l’objectif est atteint (on ne prend donc jamais en compte
toutes les valeurs). On indique alors la valeur du seuil à partir de laquelle
l’on obtient l’arbre maximum (dans notre exemple – .12).
L’analyse de similitude 231

Tableau 6. – Figures géométriques préordonnance de similitude.


Valeurs Liste des arêtes Arêtes retenues Composantes connexes Éléments extérieurs
.96 (7,8), (8,9) (7,8), (8,9) (7-8-9) (1) (2) (3) (4) (5) (6)
.94 (7,9) non retenue car cycle (7,8,9) (7-8-9) (1) (2) (3) (4) (5) (6)
.88 (3,5) (3,5) (7-8-9) (3-5) (1) (2) (4) (6)
.74 (2,4) (2,4) (7-8-9) (3-5) (2-4) (1) (6)
.64 (1,2) (1,2) (7-8-9) (3-5) (1-2-4) (6)
.52 (5,6) (5,6) (7-8-9) (3-5-6) (1-2-4)
.46 (2,6) (2,6) (7-8-9) (1-2-3-4-5-6)
.44 (3,6) non retenue car cycle (3,5,6) (7-8-9) (1-2-3-4-5-6)
.42 (4,6) non retenue car cycle (2,4,6) (7-8-9) (1-2-3-4-5-6)
.40 (1,3) (1,4) non retenues car cycles (7-8-9) (1-2-3-4-5-6)
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
(1,2,3,5,6) (1,2,4)
.34 (1,5) non retenue car cycle (1,2,5,6) (7-8-9) (1-2-3-4-5-6)
.20 (4,5) non retenue car cycle (2,4,5,6) (7-8-9) (1-2-3-4-5-6)
.14 (1,6) (3,4) non retenue car cycles (7-8-9) (1-2-3-4-5-6)
(1,2,5,6) (2,3,4,5,6)
.08 (2,3) non retenue car cycle (2,3,5,6) (7-8-9) (1-2-3-4-5-6)
– .02 (2,5) non retenue car cycle (2,5,6) (7-8-9) (1-2-3-4-5-6)
– .12 (6,7) (6,7) (1-2-3-4-5-6-7-8-9)

La structure ainsi obtenue est minimale car on ne peut lui enlever une
arête sans détruire la connexité et donc l’arbre.

Étape 2 : la visualisation graphique de l’arbre maximum,


de la 3-analyse, des graphes seuil

Dans un premier temps, nous allons associer à la matrice de similitude


l’arbre maximum (figure 7).
L’arbre maximum est conçu pour donner un résumé des données avec
un minimum d’arêtes.
Cet arbre nous révèle plus simplement la lecture faite sur la matrice de
similitude.
En effet, il fait apparaître une valeur négative – .12 pour l’arête (carré,
quartier). Si l’on supprime cette arête, on met en évidence les deux
ensembles A et B d’items précédemment constatés dans la matrice de
similitude. Ces deux ensembles se distinguent (valeur négative de tous les
indices entre les deux ensembles, cf. tableau 2) dans leurs rapports à la
forme arrondie (l’objet de représentation) : le bloc B d’items qui regroupe
232 Méthodes d’étude des représentations sociales

Figure 7. – Figures géométriques arbre maximum.


Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Figure 8. – Banque arbre maximum.

les figures distantes de l’objet et le bloc A d’items constitués par les figures
caractérisant l’objet.
Pour l’exemple de la banque, l’arbre maximum est le suivant (figure 8).
L’on peut se demander si l’arbre maximum a un axe clairement arti-
culé ? Si c’est le cas, on peut avancer l’idée qu’il existe une seule dimen-
sion explicative des données. Dans notre exemple, il s’agirait du critère
utilisé par les sujets pour classer les figures. Ce critère serait révélé par un
arbre maximum décrivant un axe allant clairement des figures les moins
arrondies aux figures les plus arrondies.
L’analyse de similitude 233

Pour répondre à cette question, nous allons recourir à la méthode de


traitement du graphe dite « 3-analyse ». Elle est basée sur un algorithme
qui consiste à étudier tous les triangles du graphe complet et à éliminer,
dans chacun de ces triangles, l’arête dont la valeur est la plus faible.
On considère une arête du graphe complet, par exemple l’arête (hari-
cot, serpentin), et on explore tous les couples d’arêtes que l’on peut
former avec (haricot, serpentin), par exemple (haricot, quartier) et (ser-
pentin, quartier). Si (haricot, quartier) ou (serpentin, quartier) ont une
valeur supérieure à (haricot, serpentin), on supprime alors (haricot, ser-
pentin).
Le graphe qui résulte de cette procédure ne comportera aucun cycle
de trois arêtes mais il peut contenir des cycles de plus de trois arêtes.
Après l’exploration, par cet algorithme, de toutes les arêtes du graphe
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
G, l’on obtient un graphe dit « G3 ».
Si le graphe G3 est la copie conforme de l’arbre maximum, on peut
conclure que les données s’organisent autour d’un axe. On peut alors
rechercher la dimension organisatrice de cet axe.
Si le graphe G3 contient des cycles de 4 arêtes et plus, il faut aban-
donner l’idée d’une seule dimension explicative des données. L’existence
de cycles s’interprète souvent comme le produit de deux dimensions.

Figure 9. – Figures géométriques graphe G3.


234 Méthodes d’étude des représentations sociales

Le graphe G3 (figure 9) met en évidence une arête qui n’était pas pré-
sente dans l’arbre maximum : l’arête (haricot, cercle) au seuil de .40. La
présence de cette arête dans le graphe entraîne l’existence d’un cycle de
5 arêtes dans le bloc A (haricot-serpentin-quartier-abri1-cercle).
Par conséquent, l’arbre maximum n’a pas un axe clairement articulé,
notamment en ce qui concerne le bloc A. On peut penser que plusieurs
critères ont présidé à la structure de ce bloc, c’est-à-dire à l’organisation
des figures arrondies.
Nous prenons maintenant un exemple plus conséquent pour illustrer
la démarche de la 3-analyse. La matrice de similitude est ici une matrice
de corrélation calculée sur des données provenant d’une enquête sur
les « valeurs » à partir d’un questionnaire de Schwartz 4 passé auprès de
268 personnes. Leurs réponses au questionnaire ont permis de construire
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
une série de scores pour chaque personne : chaque score reflète l’opinion
d’une personne à propos d’une valeur.
Cette méthode identifie dix valeurs : B*Accomplissement, A*Pouvoir,
K*Sécurité, J*Conformisme, H*Tradition, G*Bienveillance, F*Universa-
lisme, D*Stimulation, E*Centration sur soi, C*Hédonisme. On obtient la
matrice suivante (tableau 7).
Tableau 7. – Les 10 valeurs de Schwartz matrice de similitude.
B A K J H G F D E C
B * Accomplissement 0
A * Pouvoir .41 0
K * Sécurité .34 .45 0
J * Conformisme .34 .41 .58 0
H * Tradition .13 .18 .28 .39 0
G * Bienveillance .12 – .04 .32 .27 .33 0
F * Universalisme .01 – .14 .19 .10 .29 .41 0
D * Stimulation .19 .12 .12 – .03 .06 .13 .20 0
E * Centration s/soi .13 .14 .13 .05 .11 .13 .13 .34 0
C * Hédonisme .09 – .01 0.5 – .11 – .06 .16 .07 .27 .13 0

On associe à cette matrice un graphe complet. Le résumé de l’infor-


mation contenue dans cette matrice, dans le graphe complet, doit être
conçu comme devant donner le maximum d’informations avec le mini-
mum d’arêtes. La première analyse consiste donc à construire un arbre
maximum (figure 10).

4. Enquête Eric Tafani, dans Beauvois, Doise et Dubois, 1999, La construction sociale de la personne,
tome 4, PUG.
L’analyse de similitude 235

Figure 10. – Les 10 valeurs de Schwartz arbre maximum.

Fw Universalisme
.20
.41
Dw Stimulation .27 Cw Hédonisme
G Bienveillance
w

.33
.34
Hw Tradition
Ew Centration
sur sol .39
Kw Sécurité .58
J Conformisme
w

.45

Aw Pourvoir

.41
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Bw Accomplissement

Cet arbre nous montre qu’il existe une sorte d’axe allant de la valeur
E*Centration sur soi à B*Accomplissement. Il faut vérifier ce premier résul-
tat à l’aide de la « 3-analyse » (figure 11).
Figure 11. – Les 10 valeurs de Schwartz Graphe G3.

Fw Universalisme
.41
Ew Centration .13 Gw Bienveillance
sur soi .33
.20
Hw Tradition
.34

.16 .39
Dw Stimulation .32
Jw Conformisme
.14
.27
.19 .58
Cw Hédonisme
Kw Sécurité
Bw Accomplissement .45
.41
Aw Pouvoir

La théorie sur laquelle repose ce questionnaire prédit l’existence d’un


cercle sur lequel se disposent les valeurs. On constate ici, par le graphique
de la 3-analyse, que ce cercle est à peu près respecté par les données
(A,B,C,D,E,F,G,H,J,K). Cependant le graphe G3 présente ici un grand
cercle où les sommets D et E rejoignent les sommets B et A. La centration
sur soi a d’une certaine façon des points communs avec le pouvoir et de
l’autre avec la stimulation, de même l’accomplissement personnel est associé
à la stimulation et au pouvoir. Ils ne sont pas aux deux bouts d’un axe. Les
valeurs de corrélation entre (BA) et (BD) sont bien différentes (.41 versus
.19 par exemple) mais ces arêtes ne sont jamais les plus petites dans tous
236 Méthodes d’étude des représentations sociales

les triangles possibles. Elles représentent un maximum « local ». Nous


reviendrons sur cette caractéristique de l’analyse de similitude : elle rai-
sonne localement (ici, sur les triangles). On peut aussi observer que
d’autres cycles existent tels (E,D,F,G), (D,F,G,C) (G,H,J,K) etc. Ils mon-
trent une certaine complexité autour de la chaîne de l’arbre maximum qui
va de E à G.
Ce constat constitue une première limite à l’arbre maximum : une
première lecture de l’arbre sur l’exemple des figures géométriques
(figure 7) nous aurait amenés à conclure à une forte homogénéité à l’in-
térieur des deux blocs A et B au vu des valeurs des indices. Or, il peut exis-
ter un important risque d’erreur. En effet, l’arbre maximum ne permet pas
toujours de résumer les données selon un axe clairement articulé. Ensuite,
il ne nous permet pas de disposer de toute l’information. L’on ne dispose
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
que du squelette (les arêtes dont les valeurs sont les plus fortes), qui plus
est mal articulé, et il nous manque la chair (toutes les autres arêtes).
En résumé, l’analyse de l’arbre maximum et la 3-analyse nous donnent
comme information :
– l’existence de deux blocs distincts ;
– ces deux blocs ne s’articulent pas clairement sur un axe, notamment le
bloc A contenant les figures arrondies qui s’organise autour de plusieurs
dimensions ;
– la figure quartier a un statut de figure intermédiaire entre ces deux
ensembles.
À ce stade de l’analyse, rien ne nous permet d’étayer le constat élaboré
sur la base de l’analyse de la matrice de similitude concernant la com-
plexité du bloc A et la simplicité structurelle du bloc B.
Par conséquent, il faut aller plus loin pour avoir plus d’informations
sur la structure des deux blocs A et B, c’est à dire donner de la chair au
squelette. Pour cela, l’on utilise la méthode du graphe à seuil pour faire
apparaître un plus grand nombre d’arêtes.
Le Graphe-Seuil Gs0 au seuil s0 est tel que l’on efface les arêtes de
valeur inférieure à un certain seuil s0. L’on ne garde que les arêtes supé-
rieures.
Nous allons prendre l’exemple d’une analyse de graphe à des seuils
successifs .40, .14, .08, –.02 : Ces différents seuils sont choisis pour révé-
ler des arêtes apportant des informations nouvelles dans la structure des
données.
Au seuil .40 (figure 12), on obtient deux ensembles de figures : Le pre-
mier représenté par la clique rectangle-carré-losange, le second représenté
par 3 cliques (haricot-serpentin-quartier, quartier-abri 1-abri 2 et abri 1-
abri 2-cercle).
L’analyse de similitude 237

Figure 12. – Figures géométriques Graphe seuil .40.


Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Au seuil .14 (figure 13), on a toujours les deux ensembles de figures :
le premier est inchangé, alors que la structure du second se complexifie
puisque l’on observe désormais 8 cliques,

Figure 13. – Figures géométriques Graphe seuil .14.


238 Méthodes d’étude des représentations sociales

puis 9 cliques au seuil .08 (figure 14) :


Figure 14. – Figures géométriques Graphe seuil .08.
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
À ce seuil tous les éléments de cet ensemble sont en relation les uns avec
les autres, excepté l’arête (abri1, serpentin) qui n’apparaît qu’au seuil sui-
vant avec une valeur négative de –.02 (figure 15).

Figure 15. – Figures géométriques Graphe seuil – .02.


L’analyse de similitude 239

Dans cet exemple, compte tenu du matériel présenté, il paraît plus aisé
de caractériser ce qui n’est pas l’objet (ici ce qui n’est pas arrondi) que ce
qui est l’objet (ce qui est arrondi).
Finalement, la méthode du graphe à seuil nous permet d’avoir des
informations nouvelles sur la structure des deux blocs A et B :
– quel que soit le niveau de seuil choisi, le bloc B s’organise autour d’une
structure simple et homogène composée du rectangle, du carré et du
losange (3 éléments seulement composant ce bloc et fortes valeurs posi-
tives des indices .96, .96, et .94) ;
– plus on diminue le seuil et plus la structure du bloc A devient complexe
et hétérogène (6 éléments et valeur des indices hétérogènes allant de .88 à
–.02 pour l’arête (abri 1, serpentin)) ;
– les figures abri 1 et serpentin entretiennent une relation « bizarre », se
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
trouvant dans le même ensemble A, leur arête fait apparaître un seuil
négatif. Ce qui nous amène à penser que ces deux figures ont un statut
particulier dans cet ensemble. Cela vient confirmer l’idée de l’existence de
deux dimensions explicatives dans la structure de ce bloc. Cependant, la
méthode du graphe à seuil ne nous permet pas de préciser la nature de ce
statut. Pour cela, on va utiliser la méthode du filtrant des cliques.
Pour l’étude de la banque, l’on peut étudier le graphe des arêtes posi-
tives (figure 16) qui complète la description de l’arbre maximum (figures 8).
Il montre que ces données sont constituées de deux sous-ensembles cor-
respondant à deux sous-graphes. On voit que la représentation de la
banque (ici caricaturale pour les besoins de l’illustration) repose pour une
partie de la population interrogée sur la confiance et pour une autre partie
sur le profit que fait la banque avec l’argent de ses clients.

Figure 16. – Banque Graphe des arêtes positives.


240 Méthodes d’étude des représentations sociales

Étape 3 : la visualisation graphique du filtrant des cliques

La notion de cliques et leur organisation en un « filtrant des cliques »


est le moyen de mettre en évidence un ensemble de groupements. Cette
dernière propriété, même si elle donne une certaine complexité à l’ana-
lyse, donne une souplesse et une richesse de description.
Une clique est un sous-graphe complet. Une clique est dite « clique
maximale » s’il n’est pas possible de rajouter un nouveau sommet sans
détruire sa propriété de sous-graphe complet.
En explorant pas à pas de manière décroissante la préordonnance de
similitude (cf. la construction de l’arbre maximum), on va faire apparaître
des cliques maximales qui forment un ensemble organisé par l’inclusion.
Cet ensemble est appelé « filtrant des cliques maximales ».
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Après avoir mis en évidence que la chaîne principale de l’arbre maxi-
mum n’est pas une bonne description des données, il convient de com-
pléter l’analyse. Pour cela, il nous faut explorer la préordonnance de simi-
litude. Cette préordonnance se présente sous la forme d’une liste d’arêtes
classées par ordre décroissant de leur valeur de similitude.
Pour l’étude sur les 10 valeurs de Schwartz, la préordonnance est :
.58 (K,J) .45 (A,K) .41 (B,A) .41 (A,J) .41 (G,F) .39 (J,H) .34 (B,K)
.34 (B,J) .34 (D,E) .33 (H,G) .32 (K,G) .29 (H,F) .28 (K,H) .27 (J,G)
.27 (D,C) .20 (F,D) .19 (K,F) .19 (B,D) .18 (A,H) .16 (G,C).
Tableau 8. – Les 10 valeurs de Schwartz pré-ordonnance de similitude.

Valeurs Arêtes Cliques maximales du filtrant


.58 (K, J) (K, J)
.45 (A, K) (K, J) ; (A, K)
.41 (A, B) (A, J) (G, F) (A, K, J) ; (B, A) ; (G, F) [Cf. figure 17]
.39 (J, H) (A, K, J) ; (B, A) ; (G, F) ; (J, H)
.34 (B, K) (D, E) (B, A, K, J) ; (G, F) ; (J, H) ; (D, E) [Cf. figure 18]
.33 (H, G) (B, A, K, J) ; (G, F) ; (J, H) ; (D, E) ; (H, G)
.32 (K, G) (B, A, K, J) ; (G, F) ; (J, H) ; (D, E) ; (H, G) ; (K, G)
.29 (H, F) (B, A, K, J) ; (H, G, F) ; (J, H) ; (D, E) ; (K, G)
.28 (K, H) (B, A, K, J) ; (H, G, F) ; (K, J, H) ; (K, H, G) ; (D, E)
.27 (J, G) (D, C) (B, A, K, J) ; (H, G, F) ; (K, J, H, G) ; (D, E) ; (D, C)
.20 (F, D) (B, A, K, J) ; (H, G, F) ; (K, J, H, G) ; (D, E) ; (D, C) ; (F, D)
.19 (K, F) (B, D) (B, A, K, J) ; (K, H, G, F) ; (K, J, H, G) ; (D, E) ; (D, C) ; (F, D) ; (B, D)
.18 (A, H) (B, A, K, J) ; (K, H, G, F) ; (K, J, H, G) ; (D, E) ; (D, C) ; (F, D) ; (B, D) ;
(A, K, J, H)
etc.
L’analyse de similitude 241

La construction du filtrant se fait pas à pas comme indiquée dans le


tableau 8.
Il faut parcourir la préordonnance de manière décroissante. À une
valeur donnée s0 correspond un graphe seuil Gs0. À la première valeur .58,
le graphe n’est composé que d’une seule arête. Au seuil .45, il est composé
de 2 arêtes. Au seuil .41 (figure 17), il est composé de 5 arêtes : (K,J),
(A,K), (B,A), (A,J), (G,F).
À ce seuil, une clique (A,K,J) s’est constituée. Cette clique a la valeur .41.
Figure 17. – Les 10 valeurs de Schwartz Graphe seuil .41.
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Si l’on poursuit le parcours de la préordonnance au seuil suivant .39
se rajoute l’arête (J,H), puis au seuil .34 (figure 18) se rajoutent les arêtes
(B,K), (B,J), (D,E). La notion de préordre prend ici tout son sens quand
on observe que plusieurs arêtes ont la même valeur.
Avec ce nouveau seuil, plusieurs triangles sont présents ainsi qu’une
clique maximale de quatre sommets (B,A,K,J) qui inclut la clique (A,K,J)
du seuil .41 précédent. Si l’on continue notre parcours décroissant, appa-
raissent successivement les cliques (H,G,F) au seuil de .29, puis (K,J,H) et
(K,H,G) au seuil .28. Ces deux cliques s’unissent au seuil suivant .27 pour
former la clique maximale (K,J,H,G).
Toutes les cliques ne se trouvent pas obligatoirement dans la liste des
cliques maximales. Ici les cliques (A,K,J) et (B,A,K,J) sont présentes dans
le filtrant des cliques maximales mais pas les cliques (B,A,K) et (B,K,J) car
elles apparaissent au seuil .34 et sont immédiatement absorbées, à ce seuil,
242 Méthodes d’étude des représentations sociales

Figure 18. – Les 10 valeurs de Schwartz Graphe seuil .34.


Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
par la clique (B,A,K,J). La liste des cliques maximales a donc des proprié-
tés particulières : elles existent entre le seuil de leur création et celui de
leur absorption. Si, pour une clique, ces deux seuils sont confondus, alors
elle ne fait pas partie du filtrant.
Le « filtrant des cliques maximales » représente cette suite de cliques
et leurs relations d’inclusion. Il est rare de dessiner le filtrant dans sa tota-
lité car la dernière clique est la clique du graphe complet, clique consti-
tuée par tous les sommets. Les arêtes qui sont des cliques maximales
(cliques de deux sommets) ne sont pas non plus représentées car ce sont
les arêtes du graphe G3.
Pour mettre en évidence les relations d’inclusion, les cliques maxi-
males sont positionnées au mieux sur l’axe vertical pour exprimer la
décroissance des seuils et, dans la mesure du possible, respecter la hiérar-
chie des valeurs des seuils (figure 19).
La variable K Sécurité, par exemple, apparaît parmi les cliques aux
seuils les plus élevés et participe à la quasi-totalité des cliques. Cela lui
confère un certain rôle organisateur.
Le filtrant met également en évidence le grand cercle constaté dans le
graphe G3 (page 11) : les variables D (Stimulation) et E (Centration sur
soi) sont associés aux variables des deux bouts de la chaîne (B-A / F-G).
À un seuil élevé (.18) (figure 20), il existe un axe sous la forme d’une
famille de recouvrement allant de la clique (F,G,H au seuil .29) à la clique
(B,A,K,J au seuil .34) par une suite de proximités représentée par une
ligne en zigzag dans le haut du filtrant. Cet axe montre qu’il y a entre
chaque clique successive une forte ressemblance (puisque à chaque nou-
L’analyse de similitude 243

Figure 19. – Les 10 valeurs de Schwartz filtrant des cliques maximales (limité au seuil de .11).
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Les cliques sont représentées par leur seuil (multiplié par 100) puis après l’astérisque par les lettres
correspondant aux sommets composant la clique (exemple : 11 * K.H.G.F.E est la clique
(K,H,G,F,E) créée au seuil .11).

Si l’on essaie de repérer la position des différentes variables sur le filtrant,


on constate qu’elles occupent prioritairement certaines zones :

K Sécurité
A Pouvoir
B Accomplissement
J Conformisme
H Tradition
G Bienveillance
F Universalisme
D D Stimulation
E E Centration sur soi
C Hédonisme

velle clique une seule variable disparaît ou vient se rajouter) mais presque
aucune entre la première (F,G,H) et la dernière (B,A,K,J). Ici les raisons
qui ont contribuées à la ressemblance des variables F (Universalisme) et G
(Bienveillance) ne sont pas celles qui ont contribué à la ressemblance des
variables B (Accomplissement) et A (Pouvoir).
244 Méthodes d’étude des représentations sociales

Figure 20. – Les 10 valeurs de Schwartz filtrant des cliques maximales (limité au seuil de .18).
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Le filtrant au seuil de .11 nous permet aussi de tenir compte de
groupes de cliques apparus à des seuils plus bas. Dans cet exemple, il y a
un important écart entre le premier ensemble de cliques (créé de .41
à .27) et un second ensemble qui se forme autour des seuils de .11 à .13.
Ce second ensemble met en évidence les liaisons des variables D, E et C
avec le reste du graphe. Il montre une certaine autonomie de ces variables
qui s’organisent d’abord de manière isolée et ne s’intègrent qu’avec la forte
décroissance du seuil.

Figure 21. – Les 10 valeurs de Schwartz graphe seuil .14.


L’analyse de similitude 245

Figure 22. – Les 10 valeurs de Schwartz graphe seuil .27.


Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Le graphe au seuil de .14 (figure 21) commence à montrer cette inté-
gration alors que celui dessiné au seuil de .27 (figure 22) montre au
contraire deux univers distincts de valeurs.
Pour revenir à l’exemple des figures géométriques (nous ne repren-
drons pas toute la démarche illustrée plus haut), le filtrant des cliques
(figure 23) nous donne de nouvelles informations.
Tout d’abord la figure Cercle apparaît parmi les cliques aux seuils les
plus élevés et participe à presque toutes les cliques. Cette figure organise
largement la structure du bloc A.
Quant au statut des figures abri1 et serpentin, on constate que :
– ces deux figures sont positionnées dans le haut du filtrant (au seuil de
.44 pour serpentin et de .42 pour abri 1) ;
– contrairement aux autres figures de ce bloc, elles font partie de deux
ensembles distincts de cliques ;
– cela nous amène à conclure que ces deux figures renvoient à deux
dimensions spécifiques qui organisent également la structure du bloc A.
246 Méthodes d’étude des représentations sociales

Figure 23. – Figures géométriques filtrant des cliques maximales au seuil .08.
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
La présence de ces deux dimensions dans la structure du bloc A
renvoie-t-elle à des spécificités de sous-populations ?

Serpentin Abri 1
Cercle Cercle
Quartier
Haricot
Abri 2

Étape 4 : la comparaison de sous-populations

On est souvent conduit à faire une étude comparative sur différentes


populations (hommes/femmes, pays différents, âges…). On se trouve
alors devant plusieurs matrices de similitude qu’il convient de comparer :
sont-elles la variété statistique d’une seule matrice ? Ont-elles des diffé-
rences significatives permettant d’identifier les spécificités de chaque
population ? On utilisera pour y répondre une démarche de test de signi-
fication.
L’analyse de similitude 247

Tableau 9. – Figures géométriques moyennes selon le sexe et test de Kolmogorog par item.
Figures Hommes Femmes Kolmogorof-Smirnof
carré 1,04 1,08 Ns
abri 1 2,34 2,88 .0,1
losange 1,02 1,04 Ns
quartier 2,14 2,14 Ns
cercle 2,90 2,98 Ns
serpentin 2,64 2,10 .01
rectangle 1,00 1,00 Ns
abri 2 2,26 2,52 .01
haricot 2,62 2,26 .01
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Si l’on considère les moyennes de ces deux figures dans chaque sous-
population, l’on constate que les sujets féminins privilégient davantage
l’item « abri 1 » dans la perception de la forme arrondie que les sujets mas-
culins. Alors que les sujets masculins trouvent l’item « serpentin » plus
caractéristique de la forme arrondie que les sujets féminins.
Le test de Kolmogorof-Smirnof qui compare la distribution des items
dans les deux sous-populations confirme ce constat (tableau 9).
En tenant compte du filtrant des cliques maximales, de la comparai-
son des moyennes et de la distribution des items dans chaque sous-popu-
lation, une information nouvelle nous est donnée sur le statut des figures
« serpentin » et « abri1 » au sein du bloc A :
– 1 serpentin est plutôt générateur chez les sujets masculins ;
– 2 abri 1 est plutôt organisateur chez les sujets féminins.
Il est possible d’approfondir cette différence et de comparer les
graphes de ces sous-populations en mettant en évidence les arêtes forte-
ment ou faiblement apparues dans une sous-population donnée.
L’on peut utiliser une méthode de comparaison globale portant sur
toutes les valeurs des matrices de similitude. On préférera adopter, ici, une
seconde démarche privilégiant le local (au niveau des arêtes) car elle se
trouve plus dans la logique de l’analyse de similitude. On va s’intéresser à
chaque arête du graphe d’une sous-population et se demander si sa valeur
dans cette sous-population est significativement différente des valeurs de
la même arête dans les autres sous-populations ?
Si c’est le cas, il est alors possible de construire le graphe des arêtes
dont les valeurs sont significativement différentes pour chaque sous-
population (les valeurs indiquées sur les arêtes sont des valeurs centrées
réduites multipliées par 100).
248 Méthodes d’étude des représentations sociales

Figure 24. – Figures géométriques graphe des arêtes significatives sujets masculins.
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Tableau 10. – Figures géométriques arêtes significatives sujets masculins.
Arêtes Valeur centrée Valeur dans Valeur dans la
réduite population totale sous-population
quartier-abri 1 2.19* 0.47 0.68
serpentin-cercle 1.79* 0.33 0.54
abri 1 - abri 2 1.86* 0.74 0.84
serpentin-haricot 6.00** 0.89 0.98

Figure 25. – Figures géométriques graphe des arêtes significatives sujets féminins.
L’analyse de similitude 249

Tableau 11. – Figures géométriques arêtes significatives sujets féminins.

Arêtes Valeur centrée Valeur dans Valeur dans la


réduite population totale sous-population
abri 1-cercle 3.55** 0.65 0.86
quartier-serpentin 2.36** 0.51 0.72

Le tableau 10 et le graphe des arêtes significatives (figure 24) nous


montrent que les sujets masculins privilégient davantage dans la structure
du bloc A (dimension « arrondis »), les relations serpentin-haricot, quar-
tier-abri1, abri 1-abri 2 et serpentin-cercle.
Ces arêtes ont une valeur significativement supérieure à la population
totale (*.05, soit 1,64 écart-type, **.01, soit 2,34 écart-type).
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
Alors que les sujets féminins accordent plus d’importance aux rela-
tions abri1-cercle et quartier-serpentin (tableau 11, figure 25).

INTÉRÊTS ET LIMITES DE L’ANALYSE DE SIMILITUDE

L’analyse de similitude fait partie des techniques d’analyse de données


qui reposent sur l’idée d’association. Son raffinement permet de mettre en
évidence, comme nous l’avons vu, des dimensions (des axes), des regrou-
pements (amas ou classes), des sous-populations différenciées. Elle peut,
sous certaines conditions, identifier les groupes de variables pouvant se
conformer à certains modèles (échelle d’attitude, composantes connexes).
Elle ne couvre cependant pas la totalité du champ des phénomènes
qui affectent les données. Elle ne vise pas la causalité car elle ne prend en
compte qu’une notion plus « pauvre » : celle de ressemblance, celle d’aller
ensemble. Elle ne rend pas théoriquement compte de la relation d’impli-
cation entre items.
Elle ne détecte pas l’existence de variables que l’on peut qualifier de
« synonymes » dans les questionnaires où l’on demande au sujet d’effec-
tuer un choix dans une liste. Deux items de cette liste peuvent être alter-
nativement choisis par les sujets car ils ont quasiment le même sens pour
eux (l’on choisit l’un ou l’autre). Pour les repérer, il faut tenir compte du
fait que ces items ne sont donc pas corrélés (puisqu’ils ne peuvent être
choisis ensemble) mais qu’ils peuvent avoir le même profil des coefficients
de similitude vis-à-vis des autres items (puisqu’ils qu’ils peuvent associés
aux mêmes autres items).
Elle ne peut projeter les variables et les sujets sur une seule figure
comme dans le cas de l’analyse factorielle de correspondance. Certes l’ana-
lyse « duale » des variables et des sujets (lignes/colonnes) peut être faite en
250 Méthodes d’étude des représentations sociales

transposant le tableau des données mais l’on obtient alors deux graphes :
celui des variables et celui des sujets. En outre la limitation des pro-
grammes ne permet pas de traiter des fichiers où le nombre de variables
dépassent 100. La limitation à 50 variables (au mieux 100 variables) ne
tient pas aux seules capacités informatiques. Elle a été volontairement
limitée pour que l’analyse ne mélange pas des données de nature trop dif-
férentes. Il vaut mieux faire plusieurs analyses sur des groupes de variables
exprimant une facette du phénomène analysé que de vouloir à tout prix
corréler des données hétérogènes.
Nous voulons également mettre en garde le lecteur contre une trans-
position trop rapide des propriétés mathématiques en qualité du social. Il
est par exemple trop souvent considéré que la propriété mathématique de
centralité dans un graphe peut conduire à considérer les éléments cen-
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
traux du graphe comme des éléments du noyau central d’une représenta-
tion sociale. Cela n’est pas aussi évident.
En effet, un certain nombre de chercheurs se sont servi de l’analyse de
similitude pour identifier les éléments centraux d’un ensemble de
variables à partir des propriétés graphiques de polarisation. Dans la théo-
rie des graphes, il s’agit d’éléments centraux ou de point d’articulation 5
pour traduire le fait que certains sommets ont de nombreuses relations 6
ou qu’ils sont nécessaires à la connexité du graphe. Cette mise en corres-
pondance des critères de centralité et de l’identification du noyau central
a été utilisée pour la première fois par Abric (1984) et a fait école sans
qu’une réflexion plus approfondie ait été réalisée. C’est ainsi que des tra-
vaux ont identifiés les éléments du noyau central d’une représentation
sociale aux sommets ayant une propriété de maximisation de certaines de
leurs caractéristiques (Aissani, 1991 ; Katérélos, 1993).
Flament (1996) a aussi montré que, à l’inverse de cette correspondance,
les éléments centraux de la représentation (identifiés par ailleurs) se trou-
vaient souvent en bout de chaîne (cf. position du cercle arbre maximum
figure 7). Ils étaient plus des éléments « générateurs » de dimensions de l’uni-
vers analysé que des éléments charnières entre ces dimensions. Il affirme :
« En fait, on peut se demander si la considération de l’excentricité n’est pas,
dans certains cas, plus importante que celle du degré de voisinage. »

5. On appelle point d’articulation le sommet nécessaire à la connexité du graphe. Si on enlève ce sommet


le graphe est alors constitué de deux ou plusieurs sous-graphes disjoints. On peut étendre cette notion à
un sous-ensemble de sommets. On parle alors de k-connexité : si on enlève k sommets le graphe est consti-
tué de deux sous-graphes disjoints : Cf. Berge, C., 1958.
6. Le nombre de relations qui ont pour origine un sommet donné est appelé en théorie des graphes demi-
degré extérieur de ce sommet. On peut alors hiérarchiser les sommets selon la valeur de ce demi-degré exté-
rieur.
L’analyse de similitude 251

Dans les études qui identifient propriétés graphiques de centralité et


noyau central de la représentation, les variables sélectionnées se trouvent
souvent dans des groupes intermédiaires lorsque l’on effectue des analyses
complémentaires du type classification ascendante hiérarchique (Katéré-
los, 1993 ). Dans le filtrant des cliques maximales, certains sommets se
trouvaient présents dans un très grand nombre de cliques. Cette propriété
ne leur donnait pas pour autant valeur de centralité.
Il ne faut donc pas mettre au même plan un terme polarisant son envi-
ronnement et un terme jouant le rôle intermédiaire entre deux sous-
ensembles. Il n’existe pas de calcul débouchant sur un indice de centralité
qui permette d’identifier ces deux propriétés, elles sont obligatoirement
confondues. Il se peut qu’il y ait congruence entre centralité graphique et
noyau central d’une représentation sociale mais cette congruence doit être
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
expertisée par un test complémentaire de centralité (Moliner, 1989, 1994,
Abric, 1994). La centralité dans le graphe recouvre en fait deux proprié-
tés sociales différentes : l’existence d’une variable recouvrant une notion
centrale et organisatrice de la représentation sociale et l’existence d’une
variable intermédiaire entre deux ou plusieurs dimensions de l’univers
représenté. Il est quelque fois possible de distinguer ces deux cas de figure
en indiquant sur le graphe la saillance d’une variable mesurée par la valeur
de chaque sommet du graphe (fréquence ou moyenne dans le tri à plat).
On repère alors la place des variables ayant les plus fortes valeurs : sont-
elles en bout de chaîne, dans une zone du graphe ou en son centre ? Dans
chaque cas, l’interprétation des propriétés mathématiques du graphe sera
différente.
Il ne faut pas utiliser les propriétés mathématiques du graphe sans
retour critique. Les critères statistiques de centralité, qu’ils soient calculés
sur l’arbre maximum ou sur la totalité des relations, ne donnent pas direc-
tement le noyau central d’une représentation sociale. Il nous paraît impor-
tant de pointer la nécessité de croiser les informations données par l’arbre
maximum, le filtrant ou tout autre graphe tiré de la matrice de similitude
avec des informations obtenues par des questionnaires construits spécia-
lement pour mettre en évidence le noyau central. La position dans les
graphes de similitude des éléments centraux, ainsi définis, est alors très
éclairante. Il faut en second confronter les différentes propriétés mathé-
matiques de la matrice de similitude. Par exemple si la matrice est
« Robinsonnienne 7 » il est illusoire de vouloir découvrir un élément cen-

7. Si on utilise l’indice de similitude calculé sur la distance euclidienne et si on ordonne les items par l’ordre
des moyennes, on obtient une matrice dont les valeurs sont décroissantes en ligne et en colonne à partir
de la valeur diagonale.
252 Méthodes d’étude des représentations sociales

tral car l’information importante est l’existence d’une dimension organi-


satrice des variables.
Quand on fait une analyse de similitude, et on peut dire la même
chose de toute autre méthode d’analyse de données, il faut avoir
conscience de ces limitations. Nous avons tout au long de ce chapitre
montré à la fois l’intérêt de l’analyse de similitude, ce qu’elle mettait en
évidence, la rigueur qu’elle exigeait, ce qu’elle ne pouvait pas faire. Ceci
restant à l’esprit, il convient de résumer son apport aux analyses de don-
nées.
Il est de plusieurs ordres :
– elle demande à l’analyste de prendre des décisions, de contrôler l’analyse
tout au long de son parcours ; à aucun instant une boite noire ne délivre
de résultats ;
Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES

Document téléchargé depuis www.cairn.info - Aix-Marseille Université - - 139.124.244.81 - 25/03/2020 11:12 - © ERES
– elle permet d’adapter les indices statistiques calculés à la forme des don-
nées et à la nature du phénomène recherché (majoritaire, spécificités liées
à des sous-populations) ;
– elle traite localement les ressemblances, elle tient compte des valeurs les
plus fortes sans être perturbée par les valeurs faibles statistiquement non
significatives ;
– elle identifie l’existence de modèles formels et distingue ce qui peut être
interprété comme des axes et ce qui est regroupement de variables.

Vous aimerez peut-être aussi