Vous êtes sur la page 1sur 79

UNIVERSITE VERSAILLES SAINT-QUENTIN

M1 SCIENCES POLITIQUES 2010/2011.


COURS DE NICOLAS KACIAF

Mthodes des sciences sociales 2.


La quantification du monde social

INTRODUCTION GENERALE :
Les mystres de la quantification

1. Lomniprsence des chiffres


Indicateurs statistiques, mesures chiffres et autres sondages dopinion sont aujourdhui
omniprsents dans le dbat public. La liste est longue de ces donnes qui peuplent les comptes-
rendus mdiatiques et qui servent de socle aux arguments changs entre acteurs politiques : taux
de chmage, points de croissance du produit intrieur brut, volution de la mortalit sur les
routes, popularit du prsident de la Rpublique et de ses ministres, chiffres de la dlinquance,
position des Universits franaises dans le classement de Shanghai ou dans tous les autres ranking
valuant la performance des systmes ducatifs, taux dinflation, indicateurs dvolution du
pouvoir dachat , part des Franais sous le seuil de pauvret, ge moyen du premier rapport
sexuel, pourcentages daudience respectives des chanes de tlvision, palmars des hpitaux les
plus srs, distribution des prnoms les plus frquemment donns chaque anne, etc.
Mais les donnes statistiques ne servent pas seulement nourrir les discussions politiques.
Elles sont au cur de lactivit de travail de trs nombreux secteurs conomiques. Dans les
entreprises prives, les services et les salaris sont ainsi valus partir dindicateurs qui mesurent
leur performance (productivit, valeur ajoute, marge oprationnelle, etc.). Mais cette valuation
quantitative de lactivit concerne galement de plus en plus le secteur public. Aujourdhui,
chaque service administratif doit satisfaire un certain nombre dobjectifs chiffrs, prciss dans le
projet de loi de finances ( travers les indicateurs de la LOLF - Loi organique relative aux lois de
finance), et qui peuvent servir dinstruments de comparaison de lefficacit du travail men et de

1
la bonne utilisation de largent public. Cette omniprsence des donnes chiffres semble traduire
une tendance actuelle gouverner par les nombres .
Une premire question se pose alors : pourquoi les chiffres sont-il ce point
omniprsents dans le dbat public et dans un nombre croissant de secteurs sociaux ? Pour le dire
autrement, sur quoi repose la force du chiffre ? Quatre hypothses, convergentes, peuvent tre
souleves :
(1) La force des chiffres tout dabord, cest leur apparente impartialit, neutralit,
objectivit, scientificit. Dun point de vue politique, lutilisation rcurrente de telles donnes
sarticule bien avec lide que, dsormais, lEtat (ou tout autre institution) doit tre gouvern
de faon apolitique, sans idologie mais avec pragmatisme, avec pour seul objectif de
produire du rsultat et dtre donc performant , ce que des indicateurs chiffrs
pourraient objectivement mesurer.
(2) Deuximement, lautre avantage des chiffres , cest leur communicabilit qui tient
notamment leur apparente simplicit. Pour les mdias, un pourcentage constitue une
information courte, lisible et utile pour cadrer un article ( Le chmage baisse de 3 % , la
dlinquance recule de 9 % , X % des enfants quittent le primaire sans savoir ni lire ni crire ). De la
mme manire, tableaux, graphiques et autres infographies chiffres offrent une commodit
de lecture prcieuse pour les dirigeants dans les mondes politiques, administratifs,
conomiques qui souhaitent disposer dinformations rapides lire et mmoriser. Ou
encore, comme le souligne la politiste Isabelle Bruno, le chiffre est utile dans un espace
comme lUnion europenne : il facilite la communication entre des interlocuteurs parlant une
vingtaine de langues diffrentes.
(3) Un troisime avantage des chiffres , cest leur comparabilit. En effet, les donnes
chiffres permettent assez facilement la comparaison dans lespace (entre pays, entre
dpartements, entre salaris, entre services, etc.) ou dans le temps (volutions).
(4) Enfin, et cest sans doute le point le plus important, un dernier avantage des chiffres
rside dans leur capacit rendre visible ce qui est invisible lil nu. Je vais y revenir.

2. Des donnes qui ne vont pas de soi


Pour ces diffrentes raisons, les donnes quantitatives sont dsormais incontournables sur
nimporte quel sujet, dans nimporte quel secteur. Mais si les indicateurs sont omniprsents, ils
sont aussi frquemment critiqus ou contests. On ne compte plus en effet les controverses
relatives aux chiffres officiels et leur utilisation par le pouvoir politique. Cf. quelques
exemples connus et sur lesquels vous aurez loccasion de travailler, notamment en TD : les

2
statistiques du chmage ; les chiffres de la dlinquance ; lvolution du pouvoir dachat des
mnages ; la fixation du seuil de pauvret ; les sondages mesurant la popularit des mesures
gouvernementales ; la mesure des discriminations face linterdiction de collecter des
informations sur lorigine ethnique des individus ; la comparaison internationale des systmes
ducatifs ou des performances de la recherche ; etc. Les critiques adresses aux sondages
dopinion ou aux statistiques officielles sont utiles parce quelles rappellent quil ne faut pas tre
naf face des donnes et ne pas les prendre pour argent comptant. Mais elles posent souvent
problmes parce quelles sont mal formules. En effet, on entend souvent dire que les
statistiques du chmage sont fausses , que les chiffres de la dlinquance sont truqus ou encore
qu on peut tout faire dire aux chiffres Si on prend lexemple du chmage, cette critique
laisse entendre quil existerait un vrai nombre de chmeurs et que les statistiques ne donneraient
pas ce vrai chiffre. Bien sr quil y a des cas flagrants de manipulations politiques. Bien sr
galement que les statisticiens font parfois des erreurs grossires.
Mais il faut adopter un autre point de vue. La bonne perspective face aux statistiques du
chmage, ce nest pas seulement de se demander si elles sont vraies ou fausses comme sil existait
dans la nature un vrai nombre de chmeurs que lon pourrait cueillir comme on cueille une
pomme sur un arbre. La bonne perspective, cest plutt de se demander : quest-ce que ces
donnes veulent dire ? Quest-ce que ces donnes refltent et quest-ce quelles ne refltent pas ?
Quest-ce quelles donnent voir et quest-ce quelles laissent dans lombre ? Que peut-on donc
en dduire ? Cela suppose donc de soulever un autre type de problmes : comment les donnes
ont-elles t recueillies ? Quelle a t la mthode ? Quest-ce qui est effectivement mesur ? Qui a
effectu cette mesure (un service administratif, des chercheurs, un cabinet daudit, etc.) ? Et dans
quel intrt ? Ainsi, pour reprendre lexemple des statistiques du chmage, les chiffres les plus
couramment donns dans les mdias nindiquent pas rellement le nombre de personnes sans
emploi mais le nombre dinscrits au Ple emploi dans une catgorie donne, ce qui est
sensiblement diffrent. De la mme manire, les donnes fournies par le ministre de lIntrieur
en matire de dlinquance nindiquent pas le niveau de dlinquance mais elles indiquent le
nombre de faits supposment dlictueux ou criminels constats par les services de police. Je suis
schmatique ici car ces comptages sont un peu plus complexes on y reviendra.
Autrement dit, lune des postures lgitimes face cette avalanche de chiffres est
doprer un travail de dconstruction. En effet, ces donnes sont naturalises, au sens o il parat
naturel aujourdhui de disposer du taux de chmage mensuel sur lensemble du territoire national,
o il parat naturel de disposer de la mesure de la dlinquance (comme sil y avait une chose
homogne qui sappelait la dlinquance et qui regrouperait des infractions routires, des vols, des

3
viols, des meurtres, des dtentions de produits stupfiants, etc.), o il parat naturel de mesurer
chaque mois la popularit du Prsident de la Rpublique dans lopinion publique (au singulier).
Dire quelles sont naturalises, cela signifie quon sy habitue au point de croire que le niveau de
chmage, la dlinquance ou la popularit du Prsident existeraient indpendamment de leur
mesure (je rpte : dans cette perspective, la mesure ne ferait que cueillir ce qui existe dans la
ralit). Or ces donnes, ces chiffres , ces mesures ne vont pas de soi ! Elles reposent sur des
constructions, des constructions mthodologiques et intellectuelles.
- Dabord des constructions mthodologiques. Toute quantification suppose la mise en place
dinstruments de mesure. Et pour que les rsultats soient scientifiquement solides, quils aient une
certaine pertinence, il faut une vritable rigueur mthodologique : rigueur dans le recueil des
informations (ce sont les techniques denqute comme les techniques dchantillonnage), rigueur
dans le traitement statistique des informations (ce sont les outils mathmatiques quutilisent les
statisticiens), rigueur dans lanalyse des rsultats et dans les conclusions (ce sont les thories
sociologiques qui rendent les rsultats significatifs).
- Les donnes quantitatives soulvent donc plus que de simples problmes techniques. En effet,
elles reposent aussi sur des constructions intellectuelles. Cela ne va pas de soi de tout vouloir
mesurer, compter et rduire quelques indicateurs.
Par exemple, cela ne pas de soi, idologiquement parlant, dvaluer et de comparer
la qualit des systmes ducatifs en sappuyant sur des indicateurs chiffrs comme le taux de
lecture lentre dans le secondaire, le niveau en mathmatique, le nombre denfants qui
sortent du systme sans diplme, etc. La gnralisation des classements ou du benchmarking
est le produit dun contexte social et politique particulier : ce nest pas une volution
ncessaire de lespre humaine !
Cela ne va pas de soi non plus de mesurer lopinion publique en faisant la somme
des opinions individuelles et en acceptant que lopinion dun grand bourgeois vaut autant
que lopinion dun proltaire. Pour accepter ce principe dquivalence gnralis (tous les
individus ont la mme valeur, statistiquement parlant), il a fallu plusieurs sicles de
dmocratisation. Une telle convention intellectuelle serait par exemple impensable dans une
socit organise en caste ou dans des socits traditionnelles dans lesquelles le chef de
famille peut parler au nom de lensemble de sa maisonne.
Les techniques denqute et les manires de compter ne sont donc pas neutres : elles
traduisent un point de vue sur le monde.

4
3. Les objectifs du cours
Ce cours de mthode des sciences sociales repose alors sur deux problmatiques qui
refltent lambigut de la quantification :
- Dun ct, on considre ici les outils statistiques comme de formidables outils de description
et danalyse scientifique du monde social ( condition davoir t rigoureusement. La
quantification est souvent un instrument indispensable pour dchiffrer le monde qui nous
entoure et pour rendre visible une ralit invisible par lobservation humaine (ne sont visibles que
des cas individuels). Les donnes statistiques sont des reprsentations qui donnent voir un autre
niveau de ralit que la ralit exprimente par chaque individu. On y reviendra dans le premier
chapitre.
- Dun autre ct, on considre aussi la production statistique comme une ressource de pouvoir
et de domination. Dailleurs, tymologiquement, la statistique est issue du mot Etat
(StaatState). Historiquement, la statistique publique est ne dans un contexte de centralisation
tatique : cest un instrument de pouvoir, un instrument de contrle de lEtat sur la socit. De la
mme manire, les enqutes marketing, ce sont des instruments dcisifs dans les mains des
entreprises prives. On reviendra sur cette question des usages de la quantification dans le
chapitre trois.

Dun point de vue pdagogique, ce cours vise donc satisfaire trois objectifs :
(1) Dabord, le premier objectif est pratique. Puisquil sagit dun cours de mthodes des
sciences sociales consacr plus prcisment aux mthodes dites quantitatives , le premier enjeu
est de vous apporter un certain nombre de ficelles (H. Becker) pour vous permettre dlaborer
une enqute statistique, de participer son laboration ou dtre capable de prendre de la distance
et dvaluer la pertinence scientifique dune enqute que vous aurez sous les yeux. videmment, il
est impossible en si peu de temps dentrer dans les dtails techniques. Il nest pas non plus
judicieux de vous apprendre appliquer mcaniquement un catalogue de recettes toutes faites
(parce que, je rpte, les mthodes ne sont pas neutres). De toute faon, seule une minorit
dentre vous se destine la recherche et / ou une activit professionnelle qui vous amne
devoir produire vous-mme des donnes statistiques. Lenjeu nest donc pas de faire de vous des
techniciens du questionnaire, des sondages ou des calculs mathmatiques. En revanche, il est
fort probable que vous allez tous tre confronts des donnes quanti dans votre vie
professionnelle. Si vous tes journalistes, communicants, fonctionnaires dans une collectivit
locale, assistant dlu, etc., vous risquez davoir affaire en permanence des donnes chiffres. Et
le but du jeu, cest que vous soyez capable de les comprendre et de savoir si elles reposent sur des

5
enqutes scientifiquement solides . Do le terme de ficelles , cest--dire quelques rflexes
intellectuels, quelques trucs mthodologiques garder en tte pour au moins savoir lire une
tude, interprter un sondage, bricoler quelques calculs statistiques, bref ne pas tre dmuni face
des statisticiens, des chercheurs ou des prestataires plus aguerris !
(2) Ensuite, le deuxime objectif est de vous apporter un regard critique sur les donnes
quantitatives. Critiquer ne signifie pas remettre en cause, mais tre capable de discerner les limites
et les apports dune enqute, en tant que professionnel certes, mais aussi en tant que citoyen.
Lenjeu est de rappeler quau-del de la plus ou moins grande rigueur mthodologique, chaque
technique de recueil dinformations comporte un certain nombre de limites indpassables quil
faut connatre pour ne pas faire de mauvaises interprtations des donnes. Quelles sont donc les
deux principales limites des mthodes quantitatives ?
Premirement, il faut avoir en tte que toute quantification appelle une
simplification du rel, un appauvrissement de la diversit du rel. Par exemple, si vous voulez
mesurer le nombre de chmeurs, un moment donn, vous devez dfinir qui est chmeur et qui
ne lest pas, donc tablir des frontires fixes, alors que dans la ralit, vous avez une multitude de
cas de figure. Est-ce que les personnes qui travaillent temps partiel mais qui souhaiteraient
travailler temps plein sont des chmeurs ? Est-ce que les personnes qui ont arrt de chercher
du travail parce quelles sont dcourages ou trs proches de la retraite sont des chmeurs ? Etc.
Autrement dit, toute quantification suppose de faire rentrer les personnes, les situations, les
opinions, les pratiques dans un nombre restreint de cases , de catgories .
La deuxime limite dj voque, cest que le rsultat dpend toujours en partie de
linstrument dobservation, denqute, de mesure. Chaque technique tend se focaliser sur un
aspect particulier de la ralit. Selon les mthodes choisies, vous ne mettez pas en vidence la
mme chose. Pour illustrer ce point crucial pour lensemble des sciences, prenons lexemple de
lobservation. Selon le niveau dobservation, vous ne dcouvrez pas les mmes phnomnes :
particules lmentaires, atomes, molcules, cellules, organes, corps humain, interactions
familiales, occupation de lespace (gographie), plaques tectoniques (gologie), plante, systme
solaire, galaxie, amas, univers. Pour revenir la quantification du monde social partir dun
exemple trivial, il va de soi que la reprsentation de la dlinquance est diffrente si elle est
taye par la mesure de lactivit policire ou si elle sappuie sur des enqutes de victimisation (cf.
textes de Bruno Aubusson dans le livret de TD), si elle est mesure partir de statistiques
recueillies lchelle internationale ou tudie partir dune enqute de terrain dans un quartier
donn. Autrement dit, il faut toujours garder en tte que les donnes ne sont pas naturelles mais
quelles sont en permanence construites par lenquteur et par ses choix de mthodes.

6
(3) Le troisime objectif est danalyser les enjeux politiques et sociaux sous-jacents la
production statistique. Cela suppose donc de dplacer le regard et de ne plus seulement
considrer la statistique comme un instrument de connaissance du monde mais aussi comme un
domaine explorer, un objet de sociologie politique, un fait social et historique . Il sagit
donc de sarrter sur les usages de la quantification, afin notamment de comprendre lmergence
et la gnralisation de ces techniques de gouvernement. Que signifie compter dans nos socits
dmocratiques ? Qui est le commanditaire dune enqute, quel est son intrt et comment peut-il
influer ou non sur les rsultats. Le problme majeur des enqutes quantitatives, cest souvent leur
cot norme. Donc les financeurs de ces enqutes sont le plus souvent des institutions
dominantes dans la socit (les institutions publiques bien sr, mais galement les trs grandes
entreprises, les principales entreprises mdiatiques, les grosses associations ou lobbies). Par
consquent, les enquteurs sadaptent aux attentes et aux prsupposs de ceux qui les financent.
Or pourquoi les lites politiques, conomiques, administratives ont-elles besoin de ces donnes
chiffres sur la population, sur la socit, sur lconomie, sur les opinions ? Quen font-elles ? En
quoi ces donnes participent-elles de leur autorit ? En quoi lomniprsence des statistiques, des
sondages ou du benchmarking modifient-ils les manires de gouverner ? Je vous renvoie aux
travaux de Michel Foucault ou dAlain Desrosires sur la naissance des statistiques en Europe.
Ainsi, les problmes statistiques (et leurs problmes mthodologiques sous-jacents) sont presque
toujours des problmes politiques. Les rsultats des recensements ont des incidences
considrables sur les manires daborder les politiques publiques. Par exemple, pour des
problmes de mthodes, le nombre de jeunes Noirs sont souvent sous-estims dans les
recensements aux Etats-Unis ; par consquent, il y a une surestimation de la proportion de Noirs
dans les statistiques de la dlinquance, ce qui peut engendrer une focalisation de lactivit policire
et judiciaire sur cette population.

7
Chapitre 1 Lobjectivation statistique

Section 1. Lobjectivation statistique et la rupture avec les fausses


vidences
Le sociologue amricain dorigine autrichienne Paul Lazarsfeld (1901-1976) a bien montr
dans quelle mesure des enqutes par questionnaires, en sappuyant sur un grand nombre de cas,
pouvaient remettre en cause bien des ides reues ou des fausses vidences. Dans un article
clbre, il livre ainsi six affirmations qui, spontanment, ne susciteraient aucune contestation.
1. Les individus dots dun niveau dinstruction lev prsentent plus de symptmes psychonvrotiques
que ceux qui ont un faible niveau dinstruction.
2. Pendant leur service militaire, les ruraux ont, dordinaire, meilleur moral que les citadins.
3. Les soldats originaires du sud des Etats-Unis supportent mieux le climat chaud des les du Pacifique que
les soldats du Nord.
4. Les simples soldats de race blanche sont davantage ports devenir sous-officiers que les soldats de
race noire.
5. Les Noirs du Sud prfrent les officiers blancs du Sud ceux du Nord.
6. Les soldats amricains taient plus impatients dtre rapatris pendant que lon combattait quaprs la
reddition allemande.

Tout cela nest-il pas ce point vident quil ne servirait rien de dpenser de largent dans des
enqutes pour aboutir de telles conclusions ? Or Lazarsfeld prend aussitt son lecteur contre-
pied : toutes ces propositions sont fausses ou, plus prcisment, toutes ces propositions sont
invalides par des enqutes empiriques ralises auprs de soldats amricains. Parmi les
diffrentes techniques denqutes en sciences sociales, les recherches quantitatives ont pour
intrt de tester la solidit des croyances et des reprsentations spontanes sur le monde social.
Rigoureusement menes, elles peuvent contribuer chasser les mythes (Norbert Elias) ou
remettre en cause les prnotions (mile Durkheim).

1. Le choix du conjoint
Dans nos socits modernes o la formation des couples ne relvent plus (ou presque
plus) darrangements familiaux, comment expliquer le choix du/de la conjoint(e) ? Les
justifications spontanes tendent mettre laccent sur le hasard (hasard dune rencontre, coup
de foudre qui ne sexplique pas). Largumentation mobilise aussi le rpertoire de la libert ,
via linvocation de lattirance, du got. Individuellement, ces raisons sont certainement valables :

8
en labsence dinjonctions familiales ou dobligations lgales pouser untel ou unetelle, il est
difficile de nier la part de choix dans la constitution des couples. Mais lorsquon se place non
plus lchelle individuelle mais lchelle collective, les statistiques permettent de montrer un
autre mcanisme. Elles mettent en vidence limportance de lhomogamie sociale, cest--dire le
fait que les individus ont statistiquement tendance pouser des personnes qui leur ressemblent
socialement parlant (voir Bozon et Hran, La Formation du couple).

Distribution des groupes socioprofessionnels des femmes, selon le groupe


socioprofessionnel de leur mari (cadre ou ouvrier) couples dont les membres ont entre
25 et 59 ans
Femmes dont mari Femmes dont mari
Ensemble femmes
Groupe socioprofessionnel de la femme cadre ouvrier
(%)
(%) (%)
Cadre 6,4 24,2 1
Profession intermdiaire 15,2 21,3 8,5
Employ 30 16,7 35,3
Ouvrier 8,5 1,4 16,7
Retrait / inactif 34 34,6 36,8
Autre (agriculteurs, commerants, etc.) 5,9 1,8 1,7
TOTAL 100 100 100

Distribution des groupes socioprofessionnels des hommes, selon le groupe


socioprofessionnel de leur femme (cadre ou ouvrire) couples dont les membres ont
entre 25 et 59 ans
Hommes dont Hommes dont
Ensemble hommes
Groupe socioprofessionnel de lhomme femme cadre femme ouvrire
(%)
(%) (%)
Cadre 15,2 57,3 2,5
Profession intermdiaire 21 19,5 13,1
Employ 8,3 3,2 7
Ouvrier 31,8 5 62,1
Retrait / inactif 10,7 4,1 8
Autre (agriculteurs, commerants, etc.) 13 10,9 9,8
TOTAL 100 100 100
Source : Insee, enqute FQP 1993

Ces tableaux mettent en vidence que, heureusement, lhomogamie sociale nest pas totale
(elle le serait si, par exemple, 100 % des maris de femmes cadres taient eux-mmes des cadres
en loccurrence, ils ne sont que 57,3 %) : il ny a pas de dtermination absolue. Mais
lhomogamie est malgr tout fortement marque. En effet, si la formation des couples reposait
effectivement sur le hasard , on retrouverait la mme proportion de cadres parmi les hommes
qui vivent avec une femme cadre que parmi lensemble des hommes vivant en couple (soit 15,2
% et non 57,3 %). Comment expliquer ce phnomne ? Plusieurs hypothses peuvent tre
formules, qui renvoient diffrentes grilles danalyse sociologiques :

9
- Lexplication la plus simple rside sans doute dans tout ce qui fait quune rencontre est
possible. Les individus sinscrivent dans des rseaux sociaux plus ou moins hermtiques les uns
aux autres en raison des cercles de connaissances des parents, des lieux dhabitation, des
tablissements scolaires frquents, des activits sportives ou culturelles pratiques, etc.
Lensemble de ces expriences dessine dune certaine manire les frontires des rencontres
possibles, statistiquement parlant on lexprime alors en termes de chances .
- Ensuite, lhomogamie sociale rsulte sans doute aussi des processus de construction
sociale des gots. Aprs tout, limage des gots en matire artistique ou culinaire (voir Pierre
Bourdieu, La Distinction), les gots en matire sexuelle , et donc les probabilits de coup de
foudre , sont certainement conditionns par le milieu social dorigine.
- Il est galement possible que lhomogamie sociale tienne en partie lanticipation de la
raction des proches. On tend sajuster ce quon estime tre attendu par son entourage. Ds
lors, mme si on prouve des sentiments pour une personne, il peut savrer dlicat daller loin
dans une relation lorsque cette personne est rejete par nos proches en raison de ses origines, ses
caractristiques sociales, etc.
- Enfin, la question de lajustement des valeurs se pose. En effet, il est possible de sortir
ensemble sans tre ncessairement proches mais, pour fonder un foyer, il y a une relative
ncessit de saccorder et daccorder ses dispositions en termes de conception du rle de la
femme et de lhomme, de rgles relatives lintimit, etc.

2. Corrlations statistiques et liens de dpendance


Quoiquil en soit, ces statistiques ne nous permettent pas, en elles-mmes, dexpliquer
lhomogamie sociale. Ces donnes se contentent (et cest dj beaucoup) de mettre jour une
corrlation statistique entre deux variables.
Une variable, cest une caractristique susceptible de prendre plusieurs formes
diffrentes (Philippe Alonzo). Ici, quelles sont les deux variables ? Il sagit du groupe
professionnel de la femme et du groupe professionnel de lhomme . Ici, le constat
dhomogamie signifie que ces variables sont corrles, autrement dit quelles prsentent un lien
de dpendance entre elles. linverse, si le groupe professionnel de la femme et le groupe
professionnel de lhomme navaient aucun lien statistique et que la formation des couples
reposeraient sur le hasard, on dirait que ces variables sont indpendantes (cest le cas, pour
prendre un exemple totalement fictif, entre deux variables PIB de la France et rsultats de
lquipe de France de basket dont aucune ne dpend de lautre).

10
Sil y avait indpendance, une femme cadre aurait 15,2 % de chances dpouser un
homme cadre, 21 % un homme profession intermdiaire, 8,3 % un homme employ, etc. Or les
statistiques nous montrent que ce nest pas le cas : la formation des couples ne repose pas sur le
hasard. Une femme cadre a statistiquement une probabilit importante dpouser un homme
cadre (57,3 %), en tout cas une probabilit beaucoup plus importante que si la formation des
couples reposait sur le hasard. On dit alors, pour dcrire ces tableaux, quil y a cart
lindpendance (synonyme de corrlations statistiques).
Ce constat statistique a une certaine robustesse, une certaine solidit parce quil est tabli
partir dune enqute de lINSEE, enqute ralise auprs dun trs vaste chantillon de
population (environ 40 000 personnes). On peut donc en tirer des conclusions gnrales sur la
socit franaise, cest--dire des enseignements sociologiques. Cette enqute met jour des
rgularits. Ce terme est important car il a un double sens : il voque non seulement lide de
frquence (lhomogamie sociale est frquente) mais galement lide de rgle extrieure qui
simpose aux individus (lhomogamie sociale nest pas le produit dune volont individuelle).
a ne veut pas dire que les individus se trompent ou mentent lorsquils disent tre tombs
amoureux par hasard ou par coup de foudre : cest leur point de vue, compte tenu de leur position.
Cest une interprtation, un regard subjectif sur la ralit et qui ne peut raliser quel point lespace
des possibles est restreint. Dans cet espace, il y a bien libert, situation de choix et part du hasard :
mais cest une ralit qui na de valeur qu lchelle individuelle. linverse, en tudiant un trs
grand nombre de cas, les statistiques permettent daccder un autre niveau de ralit. Elles
rendent visibles ce qui est invisibles lchelle de chaque individu (mme si on peut en avoir
lintuition partir de ses expriences). Elles mettent jour des rgularits, cest--dire des
phnomnes objectifs.
- Ces phnomnes sont objectifs parce quils ne dpendent pas des impressions de
lobservateur mais reposent sur une mthode dadministration de la preuve scientifiquement
fonde (avec les mmes donnes, tout le monde arrive aux mmes conclusions).
- Ces phnomnes sont objectifs aussi parce quils sont tablis partir dinstruments de
mesure identiques pour tous (cf. la classification des groupes socioprofessionnels ne
dpendent pas de la perception de chacun). De mme que le mdecin tablit son diagnostic en
sappuyant sur une valuation objective de ltat de sant du patient (via la mesure du pouls ou
de la tension) plus quen sappuyant sur lvaluation subjective tablie par le patient lui-mme.
- Ces phnomnes sont objectifs enfin parce quils ne dpendent pas de la volont de
quelques uns qui auraient invent lhomogamie sociale ou qui auraient pleinement choisi ce

11
mode de vie ( choisi au sens o ils se seraient retrouvs dans une vritable situation darbitrage
avec de relles marges de manuvre).

3. Lobjectivation des faits sociaux


En mettant jour des rgularits objectives, ces statistiques oprent donc un travail
dobjectivation du monde social. Lobjectivation, cest une dmarche scientifique consistant
saisir le caractre objectif des faits tudis (en loccurrence ici la formation des couples). En
utilisant les statistiques, donc en sappuyant sur la loi des grands nombres , le sociologue
montre que les faits tudis sont des phnomnes collectifs qui simposent aux personnes, qui
rpondent une certaine logique, qui ne se rduisent pas des cas individuels, qui ne sont pas
seulement le rsultat de limagination du chercheur. Par ce souci dobjectivation de la ralit
sociale, le sociologue respecte le prcepte du sociologue mile Durkheim (1858-1917) lorsque
celui-ci invite tudier les faits sociaux comme des choses .

Dfinition :
Fait social = ils consistent en des manires dagir, de penser et de sentir, extrieures lindividu,
et qui sont doues dun pouvoir de coercition en vertu duquel ils simposent lui. (Durkheim,
Les Rgles de la mthode sociologique, p. 5) ; toute manire de faire qui est gnrale dans ltendue
dune socit donne tout en ayant une existence propre, indpendamment de ses manifestations
individuelles (ibidem, p. 14)

Dailleurs cest partir dune dmarche de quantification que Durkheim va mettre en


application ses rgles de la mthode sociologique et pouvoir montrer quel point le suicide
constitue un fait social qui ne sexplique que par dautres faits sociaux (par exemple lanomie).
Cet objet dtudes est intressant car, premire vue, le suicide constitue une pratique totalement
lie des facteurs psychologiques, donc individuels. Et pourtant, ds que lanalyse se penche, non
plus sur des cas individuels, mais sur un grand nombre de cas, on dcouvre que le suscite peut
tre analys comme un fait social . En effet, en tudiant les statistiques du suicide (qui se
suicide ? quelle priode ? dans quelles circonstances ?), on observe des rgularits, des
corrlations entre diffrentes variables (le fait dhabiter en ville ou la campagne, le fait dtre
isol ou davoir une famille, le fait dtre catholique ou protestant, etc.), ce qui lui permet de
distinguer diffrents types de suicide. Autrement dit, le suicide peut sexpliquer non pas
seulement par les caractristiques psychologiques ou personnelles des suicids mais par des
caractristiques sociales. Je cite Durkheim : Si au lieu de ny voir que des vnements
particuliers, isols les uns des autres et qui demandent tre examins chacun part, on
considre lensemble des suicides commis dans une socit donne pendant une unit de temps
donne, on constate que le total ainsi obtenu nest pas une simple somme dunits indpendantes

12
() mais quil constitue par lui-mme un fait nouveau, qui a son unit et son individualit, sa
nature propre par consquent et que, de plus, cette nature est minemment sociale. Cette
approche est en partie critiquable. Nous y reviendrons.

condition dtre rigoureusement recueillies dun point de vue sociologique et


mthodologique, les statistiques permettent de dcrire scientifiquement de nombreux aspects du
monde social. Elles permettent notamment de mettre en vidence que des individus qui ne se
connaissent pas, et mme ne se voient pas, se ressemblent. Du fait de milieux dappartenance
similaires ou voisins, ils partagent un ensemble de prfrences en matire vestimentaire,
culturelle, politique, etc. Dans son article, Guy Desplanques souligne ainsi lensemble des
relations objectives entre le choix du prnom, le contexte historique et lidentit
socioprofessionnelle des individus (cf. livret de TD) : les rgularits quil met en avant indiquent
ainsi quel point la distribution des prnoms constitue un fait social qui chappe fortement
la volont des parents (mme lorsque ces derniers savent quun prnom est connot socialement
et choisissent de faon stratgique : ils ne dcident pas des connotations associes un
prnom mais sy adaptent ; ils ne dcident pas non plus dappartenir une poque o loriginalit
nest plus bannie mais recherche et o la loi ne dfinit plus le stock autoris de prnoms). De la
mme manire, Patrick Lehingue montre comment les nombreuses recherches quantitatives en
sociologie lectorale permettent dinvalider un grand nombre daffirmations relatives
l lectorat Front national : son enracinement gographie, son lien avec llectorat communiste,
son lien avec la personnalit charismatique de son leader, sa focalisation sur les seules questions
dimmigration, etc. (cf. livret de TD).
Enfin dernier exemple de lutilit dune dmarche dobjectivation et qui rejoint la question
de lhomogamie sociale : cest la mesure de la mobilit sociale . Il sagit l en effet dun enjeu
politique majeur. la diffrence des socits de castes dans lesquelles les individus occupent une
position en fonction du statut assign la naissance, les socits dmocratiques se prsentent
comme des socits mobiles o la position sociale occupe par chacun est suppose corrle
lutilit sociale, cest--dire au talent ou au mrite personnel lcole ou dans le monde du
travail. Cette conception rsulte dun double hritage idologique : lhritage rpublicain dun ct
(valorisant labsence de privilges), lhritage libral de lautre (valorisant la concurrence libre et
non fausse) reposent tous les deux sur la notion dgalit des chances lcole ou sur le march
du travail. Les catgories sociales dominantes peuvent ainsi lgitimer leur situation, en mettant
avant leur mrite (celui davoir mieux ou davantage travaill que les autres) et / ou leur
chance . Sil y a galit des chances, cela doit signifier que la position sociale dun individu nest
pas dtermine par la position de ses parents : les deux variables devraient tre strictement

13
indpendantes, leur relation organise par le seul hasard statistique. Or ce que montrent les
enqutes de mobilit sociale, cest que les destins des individus ne tiennent pas leur seul mrite
mais sont relativement corrls leurs milieux sociaux dorigine : il ny en effet pas
dindpendance en France entre le groupe socioprofessionnel des hommes de 40 ans et plus et
le groupe socioprofessionnel de leur pre . Pour ne prendre quun exemple, en 2003, 53,9 %
des fils de cadres, gs de 40 ans et plus, sont eux-mmes cadres (alors que les cadres ne
reprsentent que 19,9 % des hommes gs de 40 ans et plus). A linverse, 45,4 % des fils
douvriers, gs de 40 ans sont eux-mmes ouvriers (alors que les ouvriers reprsentent 31,3 %
des hommes gs de 40 ans et plus).

Section 2. De la problmatique aux indicateurs

1. Rpondre des questions


Les sciences sociales ont pour objectif de dvelopper la connaissance du monde social, en
mettant notamment en vidence les logiques ou les mcanismes qui gouvernent lorganisation des
socits et les relations entre individus. Elles articulent donc une ambition descriptive
(comment a marche ?) et une ambition explicative (pourquoi a marche comme a et pas
autrement ?). Mais la diffrence dapproches qui se focaliseraient sur un cas ou sur un
vnement donn, les sciences sociales visent produire des noncs (ou des affirmations) qui
ont une certaine prtention la gnralit : en tant que sciences, elles ont une ambition
nomologique (= prtention tudier les lois qui prsident aux phnomnes naturels ; ici,
prtention tudier les logiques qui prsident aux phnomnes sociaux).
Par consquent, les scientifiques nont pas la prtention doffrir une improbable
description exhaustive du rel. La littrature raliste du XIXe sicle a bien montr les apories
dune telle ambition : il faudrait des encyclopdies infinies pour mener bien un tel travail, si bien
que le gain dintelligibilit serait quasi-nul. Aussi les recherches scientifiques ont-elles
principalement pour objectif de rpondre des questions, des intrigues ou encore des
problmatiques dont lintrt se limite rarement des enjeux de pure connaissance. Sil y a
problmatisation, cest souvent parce quil y a lambition danalyser des phnomnes rigs en
problmes sociaux (voir Rmi Lenoir, Objet sociologique et problme social dans Patrick
Champagne et al., Introduction la pratique sociologique). Par exemple, si les chercheurs mettent en
relation les variables groupe socioprofessionnel des hommes de 40 ans et plus et groupe
socioprofessionnel des pres des hommes de 40 ans et plus , cest afin dapporter des lments

14
de rponse empirique la question de la mobilit sociale et notamment linterrogation suivante
(qui prsente un caractre politique vident) : les positions sociales et les ressources accumules
relvent-elles du mrite ? Ou bien assiste-t-on des phnomnes de reproduction sociale ?
On la vu, les statistiques sont souvent considres comme loutil le plus adquat pour
rpondre cette question, puisquelles offrent la possibilit dobjectiver la mobilit sociale .
Une fois les donnes recueillies, il est possible de mesurer le taux de mobilit sociale (il suffit
dadditionner lensemble des hommes de 40 ans et plus appartenant un groupe
socioprofessionnel distinct de celui de son pre, soit 64,9 % de mobiles en 1993 et 63,8 % en
2003). On peut alors tablir diffrentes conclusions selon le questionnement initial : prs de 2/3
des Franais de plus de 40 ans connaissent une situation de mobilit sociale ou bien la
mobilit sociale en France a peu volu entre 1993 et 2003 ou bien encore, si lon dispose de
donnes quivalentes pour dautres pays, la mobilit sociale est plus importante en France quau
Royaume Uni mais moins importante quau Danemark (donnes OCDE, 2007).
Ces conclusions sont recevables, condition dadmettre que lon peut tablir la position
sociale dun individu en sintressant uniquement son groupe socioprofessionnel ,
autrement dit admettre que la stratification sociale repose principalement sur la place des
individus dans le monde du travail. Certes, cette variable mle diffrentes dimensions puisquelle
identifie la place des individus dans la division du travail, sur les plans horizontal et vertical. Mais,
pour tudier la mobilit sociale, les sociologues pourraient utiliser dautres outils dobjectivation,
autrement dautres indices empiriques. Par exemple, dans lenqute cite plus haut de lOCDE,
cest le revenu qui sert tablir la position sociale. On pourrait mme imaginer dautres
indices, sans doute plus difficile recueillir : la rputation ou le prestige respectif des individus, le
niveau de diplmes, laccs aux biens culturels, etc. Dans cet exemple, il peut donc y avoir dbat
pour savoir quel est le meilleur moyen de mettre jour empiriquement la stratification sociale.
Mais que lon retienne la variable groupe professionnel ou la variable revenu , le lien entre
cette variable et lobjet de recherche, en loccurrence ici la position sociale ou la stratification
sociale nest pas trop contestable : il nest donc pas trop difficile ici dobjectiver statistiquement
ce phnomne social.

2. Convertir des concepts en indicateurs


Mais souvent, il nest pas simple doprer ce travail dobjectivation. Pourquoi ? Parce quil
nest pas toujours vident dapporter des lments de rponse empiriques une question, cest--
dire de traduire une question en objets de recherche qui puissent tre observs et mesurs, bref

15
qui puissent renvoyer un terrain denqute prcis. Autrement dit, il est souvent dlicat de
convertir un concept en indicateur.
Dabord, quest-ce quun concept ? Cest une Reprsentation mentale gnrale et
abstraite dun objet (Le Robert). Pour le dire autrement, cest un terme ou une expression utilise
pour catgoriser, cest--dire pour regrouper, sous une mme dsignation, une pluralit de cas, de
personnes, de choses, dvnements ou de situation. Dans leur activit de questionnement et
danalyse du monde social, les sciences sociales ont recours un nombre considrable de
concepts : lhomogamie sociale, la mobilit sociale, la stratification sociale, les ingalits sociales, la violence, la
violence symbolique, la dviance, la marginalit, la pauvret, la richesse, la prcarit, la prcarisation,
limmigration, la mondialisation, la bourgeoisie, la classe ouvrire, la productivit, la flexibilit, la bureaucratie, la
bureaucratisation, la dmocratie, la dmocratisation, la professionnalisation, la participation politique, lexode
rural, le libralisme, le no-libralisme, la libralisation, le conservatisme, la religiosit, la contestation, la
rvolution, etc. Certains de ces termes relvent uniquement du vocabulaire scientifique : ils
dsignent des objets de recherche part entire. Mais la plupart dentre eux sont utiliss aussi
dans dautres circonstances que dans un souci de description scientifique du monde. Et de fait, la
conceptualisation ou lutilisation de concepts est un acte de tous les jours ! Tout le monde
raisonne en permanence par lintermdiaire de concepts parce quil est indispensable, pour se
reprer et agir, de classer les choses, les personnes, les vnements (ce que Peter Berger et
Thomas Luckmann qualifient de typification ). Les concepts sont essentiels pour raisonner
car, sans eux, tout ne serait que cas singuliers : il ny aurait aucun appui sur lexprience pour agir !
La dmarche dobjectivation statistique repose donc sur la traduction dun concept en
mesure quantifie, bref sur la transformation dun concept en indicateur. Un indicateur, cest la
Manifestation multidimensionnelle quantifiable et mesurable dun concept (Philippe Alonzo).
Il sagit du regroupement dune ou plusieurs variables qui offre un rsum dinformations. Un
indicateur, cest donc un indice : ce nest pas la ralit mais une reprsentation quantifie de la
ralit qui permet dtablir des chelles et ainsi de comparer et classer les cas tudis. Ds lors,
certains concepts peuvent tre assez facilement convertis en indicateurs. Par exemple, la
richesse peut tre reprsente par un indicateur regroupant deux variables quantitatives (le
revenu et le patrimoine), ce qui permet de comparer lensemble des individus ou des mnages
partir dune unit de mesure commune (en loccurrence ici, lunit montaire du pays).
Mais cette opration apparat beaucoup plus dlicate pour dautres concept, du fait de leur
caractre plus abstrait ou quivoque (i.e. dont la signification est variable selon les individus).
Prenons lexemple de lintelligence que lon pourrait mesurer partir de tests supposment
universels et qui suscitent de fortes controverses. Ou encore prenons lexemple du bonheur.

16
Diffrents chercheurs (conomistes notamment) se sont efforcs de construire des indicateurs
censs mesurer le bonheur dun peuple, afin de concurrencer le Produit National Brut (jug
trop focalis sur les richesses matrielles et ne prenant pas suffisamment en compte les impacts
ngatifs dune forte croissance, par exemple sur lenvironnement ou la sant) par le Bonheur
national brut. Comment mesurer le bonheur et esprer ainsi classer les pays laune de cet
indice ? Quelles variables faut-il retenir pour construire lindicateur ? Quatre dimensions (qui
elles-mmes en comprennent plusieurs autres) ont t retenues par les promoteurs de lindice : la
croissance et le dveloppement conomique ; la conservation et promotion de la culture ; la
sauvegarde de l'environnement et utilisation durable des ressources ; la bonne gouvernance
responsable. Or dans quelle mesure ces critres sont-ils pertinents pour valuer le bonheur ? Et
comment convertir chacun dentre eux en mesure ? On le voit, le problme est dlicat, si bien que
le lien entre le concept bonheur et sa mesure repose sur des conventions arbitraires qui ne
suscitent pas de consensus dans la communaut scientifique.
Deux problmes sont soulevs dans cette opration de traduction dun concept en
indicateur.
(1) Tout dabord, on vient de le voir, il nest pas toujours ais de dterminer une unit de
mesure qui traduirait sans ambigut au concept en question ou lune de ses dimensions.
Par exemple, le classement de Shanghai des universits mondiales sappuie sur un
indicateur suppos reprsenter lexcellence respective des diffrentes institutions. Or
comment exprimer cette excellence ? Ce concept est lui-mme dclin en quatre
critres (qualit de lenseignement, qualit de linstitution, publications, taille de
linstitution) qui sont mesurs partir de six variables quantitatives. Premier problme
donc : toutes les dimensions de la vie sociale sont-elles mesurables, cest--dire
convertibles en donnes chiffres ? Cest ici la tendance la quantophrnie qui pose
question.
Critres Variables Pondration
Nombre de prix Nobel et de mdailles Fields
Qualit de l'enseignement 10 %
parmi les anciens lves
Nombre de prix Nobel et de mdailles Fields
20 %
parmi les chercheurs
Qualit de l'institution
Nombre de chercheurs les plus cits dans leurs
20 %
disciplines
Articles publis dans Nature et Science entre 2000
20 %
et 2004
Publications
Articles indexs dans Science Citation Index, et Arts
20 %
& Humanities Citation Index
Performance acadmique au regard de la taille de
Taille de l'institution 10 %
l'institution

17
(2) Le deuxime problme a dj t voqu et sera dvelopp plus en dtail dans la troisime
section : cest celui soulev par la catgorisation. Pour objectiver le concept de
chmage , tudier son volution et tablir des comparaisons (internationales
notamment), les statisticiens disposent dun indicateur lmentaire car nourri dune seule
variable : le taux de chmage. Celui-ci consiste tablir simplement la proportion de
chmeurs dans la population active. Mais pour mesurer le nombre de chmeurs, il faut
alors dfinir prcisment qui est chmeur et qui ne lest pas, autrement dit inscrire les
individus dans des cases aux frontires rigides, alors mme que la ralit du rapport au
travail est constitue dune infinie diversit de situations. Cette opration de conversion
des informations dans des modalits prdfinies constitue une opration de codage.
Intellectuellement, elle repose sur un double principe danonymisation (les cas rels
sont inscrits dans les cases, gnralement symboliss par des chiffres ou des lettres pour
permettre le traitement statistique : 0/1/2/3) et de mie en quivalence (par
convention, on considre que les individus regroups dans une mme catgorie sont
interchangeables).

3. Dfinir pour mesurer, mesurer pour dfinir


Les exemples de lexcellence universitaire ou du chmage montrent que la
conversion dun concept en indicateur statistique repose en premier lieu sur une tape de
dfinition du concept. Lenjeu nest videmment pas de produire la dfinition la plus sophistique
possible mais de dterminer les caractristiques ou les dimensions du concept les plus pertinentes
pour la recherche. Il sagit donc didentifier les traits qui se prteront le mieux lobservation,
lexprimentation ou la mesure scientifique.
Prenons lexemple dune recherche dOlivier Fillieule dont certains aspects
mthodologiques sont restitus dans larticle Archives policires, sources de presse et
manifestations de rue (cf. livret de TD). Ses travaux sinscrivent dans les domaines de la
sociologie de laction collective et de la sociologie des mouvements sociaux, cest--dire quil
sintresse aux formes de protestation collective dans lespace public. Plus prcisment, il cherche
rpondre aux intrigues suivantes : quelles sont les principales volutions des modes daction
collective en France depuis plusieurs dcennies ? Quels sont les groupes qui ont le plus
frquemment recours lexpression publique de leurs revendications ? La France se singularise-t-
elle lgard des autres pays ? Y a-t-il des spcificits territoriales dans le pays ? Etc. Rpondre
ces question suppose de disposer de donnes chiffres qui permettront une objectivation
statistique du phnomne. Pour dsigner son objet de recherche, il ne reprend pas les termes plus

18
classiques de contestation ou de manifestation : contestation est trop flou,
manifestation trop restrictif. Il privilgie le terme d vnements protestataires .
Mais pour identifier et recenser ces vnements protestataires , il lui faut dfinir ce
concept et notamment trouver les critres qui lui permettront de dire si tel vnement doit tre
retenu dans lanalyse ou pas. Car, ds lors que le chercheur ambitionne dutiliser loutil statistique
pour tayer sa dmonstration, il est contraint dtablir prcisment les frontires de son objet.
- Critre 1 = plus dune personne
- Critre 2 = prsence dans lespace public (pas une conspiration, pas une runion, etc.) donc
critre dexpressivit
- Critre 3 = nature politique de laction (avoir des revendications : pas fte de village)
- Critre 4 = pas une manifestation organise par les autorits politiques (caractre protestataire)
- Critre 5 = ne pas se limiter aux seules manifestations : inclure sit in, les rassemblements, les
barrages routiers, les occupations dadministration, etc.
Le cumul de ces cinq critres lui permet ensuite de proposer la dfinition suivante : Tout
vnement consistant en loccupation momentane par un acteur non gouvernemental dun lieu
ouvert public ou priv, et qui comporte directement ou indirectement lexpression dopinions
politiques. Cest partir de cette dfinition que Olivier Fillieule va ensuite pouvoir se plonger
dans ses sources (archives de presse et archives policires notamment) pour dabord recenser
les vnements protestataires et ensuite les analyser au regard de ses questions de recherche
(nombre de participants, modalits daction, intervention ou non des forces de lordre, prsence
ou non dun service dordre, nature des revendications, identit des groupes mobiliss, etc.)

Cette tape de la dfinition peut tre aussi qualifie dtape de construction de


lobjet . Elle est indispensable car cest elle qui sert de chanon entre la partie thorique et la
partie empirique du travail de recherche.
- Dabord, cest partir de la dfinition que vous allez pouvoir dterminer la mthode
dinvestigation (travail sur archives, production de questionnaire, utilisation des donnes
statistiques ou des sondages existants, etc.) et la nature de votre terrain denqute (quelles
archives ? quelle population adresser le questionnaire ? etc.). Par exemple, selon votre
dfinition de la dlinquance et / ou de la criminalit, les mthodes didentification des actes
dlictueux ou criminels et de leurs auteurs peuvent considrablement changer. Dun ct, si
vous concevez les actes dlinquants ou criminels comme lensemble des actes dfinis comme
des dlits ou des crimes par la loi et dcouverts par les services de police, vous allez tre
amens principalement tudier les statistiques policires, avec le risque de davantage mesurer

19
lactivit policires et les priorits politiques assignes la police que la ralit des pratiques
dlictueuses ou criminelles. Il est ainsi probable que vous ayez le sentiment dune soudaine
augmentation de la dlinquance routire , alors que laugmentation des dlits recenss renvoie
seulement un accroissement des effectifs policiers affects au contrle des routes. De la mme
manire, vous risquez davoir le sentiment que les dlinquants ou les criminels appartiennent
surtout aux catgories sociales domines, si la police tend se dsintresser de la dlinquance
en col blanc ! Dun autre ct, si vous adoptez une conception plus extensive, savoir tous
les actes dfinis comme des dlits ou des crimes par la loi , il vous faudra imaginer dautres
mthodes dinvestigation et notamment sefforcer de croiser diffrents terrains (cumuler
examen des statistiques policires, enqutes de victimation, enqutes de voisinage, etc.). On le
voit, il serait naf de croire que la dfinition prcde linterrogation sur le terrain denqute : bien
souvent, la dfinition est labore en ayant en tte le terrain denqute.
- Ensuite, ltape de construction / dfinition de lobjet est dterminante car elle participe du
travail de problmatisation. En effet, la dfinition du concept reflte le cadre thorique, cest--
dire le point de vue adopt sur lobjet. La dfinition ne soulve donc pas seulement des
problmes techniques . Elle contient une dimension idologique indniable : il faut en avoir
conscience pour ne pas la subir ! Reprenons lexemple de la stratification sociale , en
sappuyant sur le texte de Louis Chauvel ( La dynamique de la stratification sociale ). Dun
ct, la stratification pourrait tre dfinie partir du critre de la richesse, ce qui se justifierait
par la centralit des aspects financiers dans la vie collective (pour le dire vite, largent permet
daccder aux biens rares et convoits ; de maintenir une position dominante via laccs
lducation prive et la scurisation contre les alas professionnels ; dobtenir la reconnaissance
des autres). De cette dfinition, dcoule un indicateur qui cumule deux variables (revenus et
patrimoine) et qui permet de construire une chelle (mesure par dcile ou centile). Dun autre
ct, la stratification sociale pourrait se dfinir partir de la position des individus dans le
monde du travail, via la variable groupe socioprofessionnel . Cette dfinition tient compte du
fait que la position sociale ne constitue pas seulement un problme de revenu mais aussi un
problme de statut et de prestige que garantit principalement lintgration dans le monde du
travail.
Or, derrire ce dbat apparemment technique, se niche en ralit deux visions distinctes de la
socit. Dune part, une vision continue pour qui les ingalits svaluent en termes de
quantits de ressources (principalement financires) : il est alors difficile didentifier prcisment
dventuels clivages entre diffrents groupes (sauf si lon observait une trs forte polarisation de
la distribution des richesses). Dautre part, une vision discontinue pour qui les ingalits

20
renvoient davantage des logiques de domination, mettant en opposition des groupes sociaux
relativement hermtiques les uns aux autres. Les individus ne se diffrencient donc pas seulement
en termes de gradation mais plutt en termes dappartenance durable des catgories
potentiellement en situation de conflits (jusquau modle de la lutte des classes).
Pour conclure, il faut rappeler que les choix mthodologiques constituent aussi des choix
thoriques (mme sils chappent parfois leur auteur). Les rsultats et, par consquent, les
phnomnes sociaux mis jour dpendent toujours en partie de linstrument de mesure. Selon les
mthodes choisies, on nobjective pas exactement la mme chose. Il importe donc de ne jamais
chercher mesurer un phnomne sans lavoir dfini et identifi les implications thoriques
dune telle dfinition.

Section 3. La catgorisation et les dangers de lobjectivisme

1. Variables quantitatives et variables qualitatives


Quil sagisse de dcrire une population ou de rechercher dventuelles corrlations entre
variables, le travail statistique consiste tudier un grand nombre de cas, partir dinformations
standardises par des procdures de codages. Quil sagisse de personnes, de mnages, de
groupes, dentreprises, de pays, dvnements protestataires, etc., chaque cas est qualifi d unit
statistique ou d individu . Lensemble des units statistiques sur lesquels porte lenqute
forment la population. Chaque individu est donc soumis aux mmes questions, chacune des
questions correspondant une variable. Le recueil des informations permet alors de remplir le
tableau suivant : celui-ci indique, pour chaque individu, les formes de chacune des variables de
lenqute.
Variable 3 = statut Variable 4 =
Variable 1 = sexe ? Variable 2 = ge ?
dactivit ? revenus ?
Individu 1 H 35 Salari priv 2500
Individu 2 F 56 Chmeur 800
Individu 3 H 32 Salari priv 1200
Individu 4 H 18 tudiant 300
Individu 5 F 78 Retrait 1100
Individu 6 H 23 Salari public 1700
Individu 7 F 29 Femme au foyer 0
Individu 8 F 54 Salari public 2250
Individu 9 H 49 Indpendant 3600

Or il existe deux types de variables :

21
- Dabord, les variables quantitatives sont des variables qui sexpriment sous la forme dune
valeur mtrique (Philippe Alonzo), autrement dit la variable sexprime sous une forme
numrique, le nombre constituant la valeur de la variable (valeur rapporte une unit de
mesure). Lge, le revenu, le taux de chmage, le produit intrieur brut, lindice des prix ou encore
le nombre denfants sont des variables quantitatives.
- Ensuite, les variables qualitatives sont des variables dont les diffrentes formes sont des
attributs ou des catgories (Philippe Alonzo), autrement dit des qualits . Les diffrentes
formes dune variable qualitatives constituent les modalits de la variable. Par exemple, la
variable sexe comprend deux modalits : homme ou femme. La variable statut dactivit
comprend ici sept modalits : salari du priv, salari du public, indpendant, chmeur, retrait,
tudiant / lycen, femme au foyer. Il existe plus prcisment deux types de variables qualitatives :
* les variables ordinales sont des variables dans laquelle les modalits
peuvent tre hirarchises sur une chelle. Cest le cas, par exemple, des
variables qui correspondent aux questions dopinion o les interviews sont
invits juger une personnalit partir dune chelle o les quatre modalits
sont hirarchises de tout fait favorable pas du tout favorable . De la
mme manire, les notes un examen peuvent tre retenues en tant que
variables ordinales (dans la mesure o ces nombres pourraient tre remplacs
par des lettres).
* les variables nominales sont des variables qui ne fait que nommer les
individus quelle dcrit. Quil sagisse du sexe , du groupe
socioprofessionnel , de la rgion de linterview , lordre des modalits
importe peu. Cela nempche pas quil est possible, pour lanalyse, doprer des
regroupements et ainsi modifier les modalits de la variable (par exemple,
regrouper ouvriers et employs pour obtenir la modalit catgories
populaires ).
Tandis que les variables quantitatives posent le problme de la qualit de la mesure (et de
la pertinence de linstrument de mesure), les variables qualitatives soulvent, quant elles, deux
difficults : la pertinence des catgories utilises (ont-elles un sens ? correspondent-elles des
catgories existant dans la ralit ?) et larbitraire du classement (par exemple, dans une tude de
science politique oprant une comparaison de diffrents Etats, o placer la frontire entre
dmocratique et non dmocratique ? De mme, dans une enqute sur le logement en
France, quels critres permettent dattribuer un appartement la qualit de bonne ou
mauvaise qualit ?).

22
2. Catgories institues et catgories spontanes
La catgorisation constitue donc une opration indispensable mais problmatique. En
effet, quelles catgories le sociologue peut-il utiliser pour dcrire sa population ? En labellisant et
en classant les individus, le chercheur ne prend-il pas le risque doprer des regroupements
abusifs ? Ne risque-t-il pas de crer, dhomogniser et dopposer des groupes fictifs ? Bref, ny a-
t-il pas un danger dentretenir certains strotypes et ainsi de mettre mal lambition de rupture
pistmologique quvoquent Gaston Bachelard (1884-1962) et mile Durkheim ? Cet obstacle
est plus ou moins prononc selon le type de variables qui intressent le chercheur.

1. Catgories institues. Franois Hran rappelle en effet quil existe un premier


ensemble de catgories : les variables dEtat qui sont des variables tablies , tributaires de
ltat civil ou certifies sur lensemble du territoire national . Par exemple, personne en France ne
remettrait en cause la validit de la csure opposant une personne marie et une personne
clibataire : cette opposition repose en effet sur une institution codifie par lEtat, valable sur
lensemble du territoire national : le mariage. Ds lors que le maire signe le document et dclare
vous tes mari et femme , les individus changent soudainement de statuts et deviennent,
objectivement, aux yeux de tous, maris et femmes. Toutes les catgories dtermines dans le
droit sont objectives juridiquement ou institues : leur dlimitation repose sur des
critres juridiques, dtermins par la puissance publique souveraine, qui rendent les catgories
objectives , cest--dire ici socialement incontestables. Comme le rappelle Hran, tout leffort
du droit revient fixer des seuils dans le continuum social , produire des coupures
arbitraires .
Linstitution du diplme constitue aussi un bon exemple : appartenir la catgorie des
diplms du suprieur , cest dtenir un diplme dont la valeur est fixe par lEtat. En France,
personne ne remettrait en cause votre appartenance cette catgorie, tandis que, dans dautres
contextes gographiques ou historiques, il peut y avoir une opposition quant la valeur de ce
bout de papier qualifi diplme . De la mme manire, les variables dindications
gographiques sont elles aussi objectives juridiquement et ne suscitent aucune contestation :
vous appartenez des villes, des dpartements et des rgions dont lexistence et le dcoupage ne
suscitent aucune remise en question (ce qui nest pas le cas, par exemple, lorsquil y a un conflit
entre deux Etats pour savoir qui appartient un territoire et quel nom lui donner). On pourrait
multiplier les exemples : la nationalit (cest ltat qui dtermine qui est Franais et qui ne lest
pas, lappartenance cette catgorie tant par ailleurs objective par la Carte didentit), le

23
statut dadulte (cest ltat qui fixe la frontire entre une personne mineure et une personne
majeure, la validit du passage dune catgorie lautre tant assure par lacte de naissance, lui-
mme tabli par les agents de ltat), etc. Enfin, le statut socioprofessionnel dun individu
sinscrit dans des catgories objectives par des conventions collectives (ouvriers, techniciens,
cadres, etc.) dont la lgalit est dtermine par la certification tatique : ces titres de poste
dans les entreprises correspond des diffrences de statuts, de salaires, etc. qui, elles, peuvent tre
davantage remises en cause, puisque luniversalit de ces catgories sur le territoire national est
moins tablie que pour les variables dtat civil prcdemment cites. Pour conclure, on peut
donc admettre avec Hran qu Un phnomne social se laisse dautant mieux objectiver [et
mesurer statistiquement] quil lest dj dans le monde social .

2. Catgories fluides . Mais dautres formes de classement ne bnficient pas du


mme degr dinstitutionnalisation : toutes les catgories ne sont pas autant objectives dans le
monde social. La plupart de celles que nous mobilisons au quotidien reposent ainsi sur des
reprsentations spontanes, des impressions, des critres informels En effet, chaque jour, nous
utilisons des principes de catgorisation pour distinguer les personnes grandes des petites ,
les belles des moches , les doues des maladroites , les jeunes des vieux , les
svres des indulgentes , les intolrantes des tolrantes , etc. Or, pour chacune de ces
chelles de classement, il parat difficile didentifier des critres objectifs pour distinguer les
individus et dfinir ces catgories.
Sil est possible de mesurer une personne (la taille constitue une variable quantitative dont
la valeur sexprime en cm), est-il aussi vident de caractriser cette taille partir dune variable
qualitative ? Quel critre permettrait de diffrencier objectivement et universellement une personne
grande dune personne moyenne ? Dans Les Ficelles du mtier, Howard Becker souligne bien
les difficults dtablir un tel constat, alors mme la taille [est] la donne la plus concrte que
lon [peut] esprer jamais pouvoir connatre au sujet de quiconque. Il faut alors garder en tte
que chaque catgorie na de signification que relationnellement : on nest grand que par
rapport une moyenne, que par rapport des personnes plus petites. Une mme personne peut tre
dfinie comme grande par son entourage mais petite par ses partenaires de basket. La taille
moyenne varie selon les poques et selon les milieux sociaux, bref selon les contextes.
Cette ficelle peut ainsi tre gnralise lensemble des qualits utilises pour
cataloguer les individus : pour tre pertinentes, elles doivent tre (1) rapportes au contexte
spatial et historique dans lequel sinscrivent les individus (on est jug grand dans un
contexte donn) et (2) replaces dans un systme de relations (on est jug grand par

24
rapport des personnes plus petites). Pour prendre un autre exemple, tre pauvre en France
en 2010, ce nest videmment pas la mme chose qutre pauvre en Inde en 2010 ou qutre
pauvre en France en 1810. En valeur absolue, les pauvres en France aujourdhui peuvent
accder davantage de biens (alimentaires, vestimentaires, etc.) que les pauvres dautres
contextes sociohistoriques. Pour autant, il paratrait incongru de refuser de qualifier de
pauvres les mnages qui vivent sous le seuil de pauvret : il est de toute faon des individus
plus pauvres que dautres et des individus appartenant aux 10 %, 20 % ou 50 % les plus
pauvres . Il faut donc admettre le caractre relatif de la pauvret : celle-ci ne svalue que dans
le cadre dune socit donne, au regard de la richesse mdiane (le seuil de pauvret est fix 50
% des revenus mdians), et non en termes absolus (par exemple, au regard de la capacit
acqurir tels biens ou tels services). Autre exemple soulignant lide que les catgories nont de
significations que dans un contexte donn. Par exemple, ladolescence na de sens que dans
une socit marque par llvation gnrale du niveau scolaire (et donc le recul de lentre dans la
vie active et dans la vie matrimoniale). De la mme manire, la notion de chmeur na de sens
que dans une socit domine par le salariat. Enfin, en sociologie politique, les notions de
gauche et de droite ne renvoient pas exactement aux mmes ralits selon les pays et selon
les poques. Mieux : dans un mme pays, une mme poque, les frontires entre la gauche et
la droite ne sont pas quivalentes dans la tte de tous les individus. Pour certains militants
dextrme gauche, le Parti socialiste est envisag comme un parti de droite depuis que son
programme nentend plus remettre en cause les fondements de lconomie de march.
Il apparat donc dlicat dentreprendre des comparaisons dans le temps ou dans
lespace, en faisant comme si un mme mot dsignait la mme ralit partout. Il serait, par
exemple, naf dtudier la situation des pays selon le nom des partis qui les dirigent : si le Sngal
dispose, comme en France, de partis qui se revendiquent socialistes ou libraux , ces
formations reposent sur un socle idologique bien diffrent de celui tabli en France. Il serait
galement tout aussi naf de vouloir tudier la population des dlinquants comme sil sagissait
dune catgorie objective et identique dans le temps : en effet, le statut de dlinquant dpend
des qualifications juridiques en vigueur un moment donn. Or, du jour au lendemain, un acte
autoris peut devenir un dlit (et vice versa) : siffler lhymne national peut suffire aujourdhui
vous faire devenir un dlinquant. Analyser la catgorie dans le temps renvoie donc autant aux
volutions de la loi quaux volutions sociologiques de ceux qui la transgressent.

25
3. La catgorisation comme enjeu des luttes symboliques
On vient de le voir, il est dlicat dinscrire un individu dans une catgorie donne du fait
de son caractre relatif et de labsence de consensus quant la pertinence dune telle dsignation.
Pour reprendre les exemples dj donns, o placer la frontire entre Etats dmocratiques et
Etats non dmocratiques ? Comment distinguer les jeunes des autres ? Y a-t-il des critres
permettant de diffrencier objectivement les personnes de gauche et celles de droite ? Mais
cette difficult tient aussi et surtout au fait que peu de catgories sont dnotes et nimpliquent
aucun jugement de valeurs. Pour le dire autrement, la plupart des labels utilises pour classer
les individus sont socialement connots, soit positivement, soit ngativement. Bref, les
mots sont rarement neutres !
Cest ce que montre trs bien le sociologue amricain Everett Hughes (1897-1983) au
sujet des noms de mtier ( Le travail et le soi , 1951). Il rappelle en effet que ces noms
fonctionnent comme des tiquettes (au double sens dtiquettes de prix et de cartes de visite).
Ils servent donc indiquer la valeur et le statut dune personne, bref une identit qui peut
tre plus ou moins valorisante. Puisque le mtier dun homme constitue aujourdhui lune des
composantes les plus importantes de son identit sociale, de son moi et de son destin , Hughes
souligne les stratgies mises en uvre par certains mtiers pour bnficier de la dsignation la
plus favorable et ainsi tre positivement reconnus. Quelques exemples rcents permettent de se
rendre compte de ces jeux autour des dsignations : techniciens de surface et non homme de
mnage , htesse daccueil et non standardiste , agriculteur et non paysan (mais la
Confdration paysanne sest justement battue pour oprer le mouvement inverse), demandeur
demploi et non chmeur , etc. De la mme manire, les universitaires peuvent
stratgiquement modifier lintitul de leur mtier selon leur public : enseignant , chercheur ,
enseignant-chercheur , etc.
Mais les acteurs sociaux ne sefforcent pas seulement de modifier les noms ou les
connotations qui y sont associes : ils luttent aussi pour dplacer les frontires des groupes,
modifier les dcoupages, bref faire bouger les nomenclatures. Hughes voque en effet aussi les
efforts mens par les infirmires amricaines pour se rapprocher symboliquement du corps
mdical et sloigner inversement des aides-soignantes : leur enjeu est de modifier les
reprsentations qui diffrencient mdecins et autres personnels dhpitaux. Les classements
sociaux sont en permanence lobjet de luttes symboliques dont lenjeu est dimposer des
visions du monde. Longtemps sociologues lINSEE, Alain Desrosires et Laurent Thvenot
(Les Catgories socioprofessionnelles) ont bien montr comment llaboration des nomenclatures
socioprofessionnelles met aux prises de trs nombreux groupes dintrt, chacun cherchant

26
orienter le classement dans un sens favorable. Ainsi, la catgorie cadres ne constitue
aucunement une catgorie naturelle et vidente : pour preuve, il est bien dlicat didentifier une
catgorie quivalente dans les autres pays occidentaux (aux Etats-Unis, par exemple, les cadres
sont souvent diviss en managers et professionnels ). Au contraire, cest une construction
historique laquelle Luc Boltanski a consacr un passionnant ouvrage (Les Cadres). Il ne sagit ni
dun groupe homogne, ni dune pure fiction : mais bien du produit dun travail de mobilisation,
didentification, dinstitutionnalisation, bref de reprsentation, men dans un contexte singulier (
partir des annes 1930) par des groupes dindividus dsireux dimposer sur la scne politique des
valeurs et des intrts singuliers : dfendre lidentit des cadres , cest dfendre une vision
moderne de la socit qui vise au dpassement de la lutte des classes. Les porte-parole des
cadres vont se dfinir comme les reprsentants dune nouvelle lite dont la position se justifie
non plus au nom de la dtention du capital mais au nom dune comptence technique et
managriale.
Cest ici que le terme de reprsentation est prcieux : puisquil dsigne la fois les
images mentales (qui tmoignent du caractre plus ou moins vident de lexistence dun
groupe) et les mcanismes de dlgation (ce sont souvent les porte-parole qui font exister un
groupe puisquils le font parler, le structurent via des mouvements supposs reprsentatifs, lui
donnent une image, expriment des revendications bref, ils le personnifient, notamment dans le
cadre de conflits sociaux). On pourrait prendre lexemple des efforts visant promouvoir
lexistence dune classe moyenne et en dessiner de larges contours : la plupart des partis de
gouvernement (PS / UMP) se dsignent comme reprsentants des classes moyennes , ce qui
leur offre lavantage dlargir leur base lectorale suppose.
Il sagit l souvent dun acte performatif, acte de magie sociale dit Pierre Bourdieu
( La force de la reprsentation , in Ce que parler veut dire, p. 140) qui contribue donc au sentiment
dexistence objective et ternelle du groupe. Cest ce qu bien montr lhistorien britannique
Edward Thompson (1924-93) au sujet de La Formation de la classe ouvrire anglaise (1963). La classe
ouvrire qui merge aux XIXe rassemble, certes, des individus qui se ressemblent, partageant la
mme condition objective de proltaire, soumis aux cadences infernales des usines et la misre.
Mais pour exister et simposer dans les reprsentations comme un groupe part entire et distinct
des autres, la classe ouvrire ne devait pas seulement possder les traits dune classe en soi
mais devenir une classe pour soi , cest--dire consciente de son existence et organise dans
une lutte commune. Pour cela, il a fallu quun certain nombre dintellectuels, ouvriers, hommes
politiques, mnent un vritable travail de reprsentation pour parler au nom de la classe ouvrire
et faire accepter quils parlaient au nom de groupes souvent isols les uns des autres. Thompson

27
rappelle cette distinction dj tablie par Marx. Mais il va plus loin en montrant que cette notion
de classe ouvrire na pu merger que dans un jeu dopposition et de diffrenciation avec
dautres groupes sociaux. La classe ouvrire nexiste donc pas en soi : elle nexiste quau sein dun
systme conomique particulier (domin par le capitalisme industriel) et en rapport avec dautres
classes ou groupes (patrons, cadres, techniciens et contrematres, etc.).
Mais au-del des seules catgories socioprofessionnelles, cest lensemble des
catgories identitaires dont il faut dnaturaliser lapparente existence objective (au
sens de naturelle et dternelle). Aucune catgorisation nest totalement naturelle : mme la
division a priori vidente entre hommes et femmes peut poser problme. Dabord,
comment classer les transsexuels, travestis, trisomiques XXY et autres queers qui refusent une telle
assignation. Ensuite, sexe biologique et genre social ne se recouvrent pas automatiquement : dans
de nombreuses socits, il peut y avoir une dconnexion entre ces formes dappartenance. Par
exemple, la sexualit dans la Rome antique nest pas tant fonde sur la division entre hommes
et femmes quentre pntrants et pntrs , autrement dit entre dominants et
domins socialement (Graldine Puccini-Delbey, in La Vie sexuelle Rome, 2007). Si mme le
sexe suscite linterrogation, cela montre bien quaucune catgorie ne va de soi et ne correspond
un groupe clos, homogne et distinct des autres. Il faut donc admettre que toutes les catgories
sont le produit dune construction sociale et historique : elles sont construites par un travail
de dfinition juridique par les institutions, dimposition performative par certaines autorits
dsireuses de mobiliser en dsignant les allis et les ennemis, le nous et le eux . Elles sont
construites dans la tte des gens : cest limportance de la croyance (subjective) dans lobjectivit
dun groupe qui lui confre cette objectivit !
Il faut donc se mfier des lectures essentialistes des catgories et des identits. Ces
lectures entretiennent en effet la croyance en lexistence de groupes qui seraient immuables,
homognes et ternels (des essences dans le langage philosophique). Dans une perspective
essentialiste, les individus appartiennent pour toujours une catgorie donne, du fait de ses
gnes, de sa culture de naissance, de son tat civil, bref de critres supposment objectifs et
qui caractriseraient une fois pour toute une personne (et le distingueraient des autres). A
linverse, les sociologues des identits (tels Claude Dubar, dans La Crise des identits ou Jean-
Franois Bayart dans LIllusion identitaire) revendiquent une position nominaliste : ce qui existe,
ce sont des noms de catgories, des labels qui servent dsigner ou identifier. Mais il ny a pas
dessence ternelle. Tout est soumis au changement : lidentit dune personne dpend de
lpoque considre et du point de vue adopt. Les catgories utilises dpendent du systme de
mots en usage dans un contexte donn. Ces modes didentification sont historiquement et

28
gographiquement variables parce quelles sont historiquement et gographiquement
construites et objectives par certaines institutions et certains acteurs politiques. Il ny a pas de
diffrences infranchissables et ternelles entre individus, mme si certains peuvent en avoir
lintime conviction ! Il y a en revanche des sentiments dappartenance certaines catgories (et
dassignation des Autres dans dautres catgories).
Or, dune part, ces sentiments sont historiquement changeants. Par exemple, les
nations ont une histoire : elles nexistent pas depuis toujours. Elles forment des communauts
imagines , selon la formule de Benedict Anderson, qui ont merg lpoque moderne sous
leffet notamment du dveloppement des technologies de communication et des efforts de
centralisation des Etats. Dautre part, ces sentiments sont gnralement pluriels mais ils sont
plus ou moins intenses (et donc significatifs) selon les contextes. En effet, les individus disposent
tous dune diversit didentits, au sens ici didentifications par soi-mme (appartenance) et par
les autres (attribution, reconnaissance). Mais ces identits ne servent vritablement
caractriser une personne que lorsque celle-ci entre en interaction avec les autres. On se
sent homme au contact avec une femme, on se sent jeune au contact des personnes plus
ges, on se sent riche au contact avec des personnes moins fortunes, on se sent Franais au
contact avec des trangers, on se sent rural au contact avec des urbains. Autrement dit, cest
aux frontires que se construisent les sentiments dappartenance identitaire et que se forgent les
outils de dsignation et de classement des individus. Cest donc en situation que les identits
savrent plus ou moins mobilisables : on ne peut enfermer un individu une fois pour toutes dans
une catgorie dont les attributs seraient figs, comme si celle-ci suffisait caractriser son identit
et sa personnalit. Une telle perspective, fixiste , constitue lcueil principal des penses
culturalistes et, pour certaines, xnophobes ou racistes.

Le maniement des catgories constitue donc lune des principales difficults des sciences
sociales puisque ces sciences ont pour objectif de dcrire un monde social dj en permanence
ordonn et catgoris par les termes des institutions et les agents sociaux. Les sciences sociales
se trouvent donc confrontes un objet dj fortement balis par le langage ordinaire .
Il est souvent difficile de se rappeler que les notions apparemment les plus videntes et les plus
ordinaires sont le produit, banalis, dune intense activit de construction symbolique du monde
social. Il est souvent difficile de rsister la tentation dutiliser sociologiquement la notion de
jeunes et de se souvenir quelle dsigne une population extrmement htrogne sur le plan
des conditions dexistence. Ces obstacles, on la vu, sont plus particulirement dlicats dans le
cadre des mthodes quantitatives puisque celles-ci ont pour principe dinscrire les units

29
statistiques dans des modalits prdfinies et strictement dlimites. Puisquon ne peut pas se
passer des catgories, il faut tre vigilant sur leur construction et leur utilisation. Il faut
notamment fuir toute perspective objectiviste. Celle-ci consiste dterminer de lextrieur,
partir des instruments dobservation du monde social, quelques traits unifiant a priori
objectivement un groupe : le lieu de rsidence gographique, les catgories objectives par
ltat civil, lge mais aussi le nom de famille (utilis frauduleusement en guise de dtermination
de lorigine ethnique puisque cette variable ne peut figurer dans les enqutes de recensement),
lapparence physique (cf. critres didentification des personnes par la criminologie, discipline qui
merge au XIXe sicle).
Le danger dune telle perspective, cest larbitraire du classement, cest--dire lutilisation
de critres qui nont aucune signification sociologique dans la mesure o ils segmentent des
groupes qui, socialement, ne font sens pour personne. Ce caractre arbitraire sobserve dans la
construction des classes dge : aprs tout, pourquoi runir dans un mme groupe les 18-24 ans et
dcider qu 24 ans, lensemble des individus changeraient de catgories ? De mme, quel sens y
a-t-il de sappuyer sur la catgorie immigr (au sens de n tranger ltranger) sachant quun
tel ensemble regroupe des populations issues de pays aux situations extrmement contrastes et
dotes de statuts lgaux trs variables (quoi de commun en effet, en terme de parcours de vie,
entre un immigr belge et un immigr issu dAfrique subsaharienne) ?
Dans ses versions les plus rigides, une telle dmarche peut tre qualifie
d objectivisme , dans la mesure elle considre comme objectives (cest--dire ici stables,
videntes, naturelles, ternelles, etc.) des frontires qui, dans la ralit, sont socialement
construites, changeantes et enjeux de dbats. Les cueils de l objectivisme renvoient
notamment aux prtentions positivistes de nombreux savants du XIXe sicle qui prtendaient
tudier les phnomnes sociaux partir des outils et des modes de raisonnement issus des
sciences naturelles. L objectivisme sobserve en particulier dans les efforts mis en uvre pour
classer les langues, les races, les peuples, les croyances, etc. partir de critres dobservation
supposment objectifs et universels mais avant tout fonds sur des impressions mal matrises.
De mme que limpression tend montrer que le soleil tourne autour de la terre, de mme que
les impressions premires donnent voir des races aux frontires intangibles ! chaque
groupe mis en vidence est alors rattach un certain nombre de traits prsents comme naturels
et universels. Pour ne prendre quun exemple, voici quelques extraits dun ouvrage fondateur de
la criminologie, Le Crime politique et les rvolutions par Cesare Lombroso : Parmi les facteurs
anthropologiques des crimes politiques, le premier qui se prsente nous est la race ; cela ressort
avec vidence de la comparaison de lesprit rvolutionnaire trs accentu dans certains pays, avec

30
lapathie absolue que lon rencontre en dautres, mme gales conditions de climat et
dorganisation sociale. Nous en aurions une preuve () dans les caractres spciaux qui
distinguent, en France, les populations selon la prdominance du type brachycphale ou du type
dolichocphale : le premier est frugal, laborieux, prudent, attach aux traditions et aimant
luniformit ; le second a de grands besoins et travaille pour les satisfaire ; (). Ainsi, sur 89
grands novateurs et rvolutionnaires, () vingt brachycphales (Pascal, Mirabeau, Marat,
Desmoulins), contre 69 dolichocphales (Racine, Voltaire, Lavoisier, Diderot, Rousseau, []).

Ces perspectives prteraient sourire si elles navaient pas servi de lgitimation


scientifique aux entreprises racistes et, parfois, gnocidaires. Ainsi, au Rwanda, avant le gnocide
de 1994, ltat imposait sur la carte didentit les mentions Tutsis ou Hutus comme sil
sagissait de populations racialement ou ethniquement ou culturellement distinctes. Or, au-del
mme de la question des mariages mixtes qui rendent les frontires flottantes, ces catgories ne
reposent pas historiquement sur une distinction dordre culturelle (Tutsis et Hutus parlent la
mme langue et partagent les mmes religions). Il ne sagit pas non plus dune distinction
gographique : les deux groupes sont prsents conjointement sur lensemble du territoire
rwandais et burundais. Il sagit encore moins dune opposition fonde des critres
biologiques : malgr certaines thories cherchant dmontrer les origines ethniques
respectives de ces deux peuples, aucun argument solide na pu tayer cette hypothse
sociobiologique. Enfin la distinction nest pas historiquement lie la position sociale des
personnes : si le pouvoir politique tait domin par certains Tutsis avant et pendant la priode
coloniale, cela ne concernait pas tous les Tutsis (la plupart dentre eux noccupaient pas de
positions leves socialement). rebours de ces visions cherchant dmontrer le caractre
objectif et ternel de cette division, les historiens ont au contraire montr que celle-ci est
principalement le produit dune construction politique qui sest progressivement impose lors de
la colonisation belge. Il ne sagit videmment pas dune pure invention : ces catgories Tutsis
et Hutus existaient dans le Rwanda prcolonial. Elles reposaient entre autre sur une
opposition entre pasteur semi-nomade (Tutsis) et cultivateurs sdentaires mais elles ne sy
arrtaient pas. Ensuite, ces catgories savraient relativement fluides : les familles ny taient pas
enfermes une fois pour toutes. Enfin, elles ne constituaient que lun des critres de
diffrenciation sociale (au mme titre que les lignages ou les appartenances gographiques). Or,
anims dune approche scientiste des races humaines, porteurs dune vision religieuse qui les
prdisposaient rechercher les enfants de Cham aux bords du Nil (qui seront identifis aux
Tutsis) et, surtout, mus par des intrts politiques, les colons ont considr la distinction entre

31
Hutus et Tutsis comme une diffrenciation ethno-raciale objective et ternelle qui justifiait que
le pouvoir administratif et les privilges sociaux soient octroys ce peuple apprhend comme
suprieur : le peuple Tutsis . La dmarcation a donc t durcie non seulement par la
politique coloniale mais galement par les revendications indpendantistes des leaders Hutus qui
ont cherch la fois saffranchir de la tutelle belge et obtenir la dmocratisation du pays
(puisque les Hutus taient majoritaires).

Pour aller plus loin :


- Chrtien Jean-Pierre, Le dfi de l'ethnisme : Rwanda et Burundi, 1990-1996, Paris : Karthala, 1997.
- Franche Dominique, Gnalogie du gnocide rwandais, Paris : Tribord, 2004.
- Vidal Claudine, Situations ethniques au Rwanda , in Amselle Jean-Louis et MBokolo Elikia,
Au cur de lethnie, Paris : La Dcouverte, 1985.

32
Chapitre 2 La production statistique

Section 1. Population et chantillons

1. De la population lchantillon
On la vu, toute recherche quantitative repose sur lanalyse dune population compose
dindividus ou dunits statistiques. Si lenjeu est de tirer des enseignements gnraux sur la
population, il est, la plupart du temps, impossible de raliser une enqute exhaustive auprs de
lensemble des individus dune population. Deux raisons expliquent cet obstacle : dabord, une
enqute exhaustive savrerait souvent trop coteuse (en termes dargent, de temps, de formation
des enquteurs, etc.) ; ensuite, le risque derreur augmente mesure que le nombre de cas tudi
augmente. La plupart des recherches quantitatives travaillent donc partir dun
chantillon, ce qui suppose de contrler le choix des individus soumis lenqute. Il sagit
denqutes par sondage, cest--dire des enqutes sur une fraction de situations choisies parmi
toutes les situations possibles (le terme de sondage pouvant galement tre dfini en tant que
prlvement dun chantillon dune population , Philippe Alonzo). Comme le rappelle Patrick
Lehingue dans Subunda, ce terme vient des sciences naturelles : il fait rfrence la sonde
sous-marine charge, partir dun point de mesure, de dterminer la profondeur dune zone
donne.
Les principes thoriques des mthodes dchantillonnage viennent des mathmatiques
probabilistes. Celles-ci indiquent que, pour connatre les vnements qui peuvent survenir dans
une population donne, il est possible de ntudier quune petite partie de celle-ci, condition de
respecter des rgles rigoureuses de slection de cette fraction de population. Si cet chantillon est
bien construit, il est possible de gnraliser : les informations recueillies auprs de lchantillon
sont supposes gnralisables lensemble de la population. Cest un principe dinduction ou
dinfrence statistique qui commande le passage du particulier (lchantillon) au gnral (la
population). Or comment construire un chantillon pertinent ? Cette question sous-entend quil
faut faire face deux obstacles principaux :
- Un obstacle thorique : la reprsentativit des chantillons. Un chantillon est dit reprsentatif (1)
quand il possde la mme structure que la population de rfrence ; (2) quand tous les
membres de la population ont la mme probabilit de faire partie de lchantillon (cf. 2 et 3).
- Un obstacle pratique : laccs aux individus (cf. 4).

33
Il existe donc diffrentes techniques pour constituer un chantillon qui soit
scientifiquement pertinent. On en retiendra deux.

2. Les sondages alatoires


Les chantillons alatoires sont des chantillons qui sobtiennent par tirage au sort. Ils
reposent sur le seul hasard pour nintroduire aucun biais. Dun ct, les sondages alatoires sont
les plus pertinents dun point de vue mthodologique. De lautre, il sagit des enqutes les plus
dlicates raliser. Pourquoi ?
- Pour pouvoir tirer au sort, il faut dabord disposer dune liste exhaustive de la
population (cest--dire une base de sondage ). Seul lINSEE possde un fichier de lensemble
des rsidents en France grce au recensement de la population. Mais il nest pas tenu jour entre
deux recensements (qui dsormais soprent par tranches gographiques). Du fait des
ncessaires contraintes juridiques de protection des donnes individuelles (Loi Informatique et
libert ), laccessibilit ces donnes (et plus gnralement tout fichier recensant une
population) est strictement rglement. Or il nexiste pas dautres fichiers exhaustifs des mnages.
Pendant longtemps, lannuaire tlphonique a pu tre considr comme une base de sondage
adquate pour entreprendre un tirage au sort alatoire. Mais aujourdhui, cette perspective est
remise en cause : en 2006, seuls 83 % des foyers sont abonns un tlphone fixe (parmi ceux-ci,
14 % ne sen servent que pour naviguer sur internet et entre 15 % et 20 % figurent sur liste
rouge). Or cette population nest pas reprsentative de lensemble des personnes rsidant en
France. En revanche, pour tudier certaines pratiques lectorales, les listes lectorales peuvent
servir de base de sondage , quoiquelles ne contiennent pas les coordonnes des personnes.
Il sagit donc dune mthode judicieuse pour tudier les membres dun groupe dont lexistence
est institue (cest--dire objective par une institution comme les tudiants dune cole, les
adhrents dune association, etc.).
- Deuxime difficult : il est ncessaire de respecter absolument le tirage alatoire. Si une
personne est tire au sort, il est impossible statistiquement daller voir son voisin. Pourquoi ?
Tout simplement parce que si on ninterrogeait que les personnes prsentes, lchantillon serait
biais car constitu avant tout des personnes prsentes chez eux un moment T, ce qui implique
que ces personnes disposent dun profil sociologique particulier. On retrouve la mme
problmatique avec les refus de rpondre : les sans rponses ne sont pas distribus
alatoirement dans la population. Ils correspondent des catgories sociales particulires dont les
contours varient videmment selon le type denqute : les plus gs et notamment les femmes

34
ges, les personnes les moins diplmes, les personnes en situation dexclusion, etc. La mthode
alatoire suppose donc de multiplier les relances.

Malgr ces difficults, cette mthode prsente deux avantages majeurs. Le premier
avantage, cest que cette mthode ne prsuppose aucune connaissance pralable de la
structure sociologique de la population. Le deuxime avantage du sondage alatoire, cest la
possibilit de mesurer mathmatiquement la qualit des rsultats, cest--dire la marge
derreur. Le rsultat est une estimation dont les carts la vraie valeur peuvent tre mesurs
partir de lquation suivante :
Estimation marge < vraie valeur < estimation + marge
Cette quation est vraie avec une avec une probabilit p, cest--dire pour une part p des
chantillons tests. Cette probabilit p, cest ce quon appelle le niveau de confiance ou le
seuil de confiance : la probabilit que le vrai rsultat se situe dans cet intervalle. Gnralement,
le niveau de confiance privilgi par les statisticiens est de 95 %. Donc quand certains sondeurs
voquent une marge derreur de 2 %, ils oublient gnralement de dire quil y a 95 % de chances
que lestimation soit situe plus ou moins 2 % de la vraie valeur dans la population.
Les sondages alatoires reposent donc sur un raisonnement probabiliste, thoris entre
autres par le mathmaticien allemand Carl Gauss (1777-1855). Celui-ci montre que la qualit des
rsultats ne dpend pas (ou trs peu) de la taille de la population, ni de ce quon appelle le taux
de sondage (rapport entre lchantillon et la population). Bref, que 10 %, 1% ou 0,1 % de la
population ait t sonde ne change rien (ou presque) au problme. En revanche, ce qui
compte, cest la taille de lchantillon ! Pour le comprendre, il suffit de penser au lancer de ds
dont on sait que chaque face a thoriquement 1/6e de chance dtre tir. Pour que la distribution
obtenue se rapproche de la distribution thorique (16,66 % pour chaque face), il faut multiplier
les lancs et ainsi simmerger dans la loi des grands nombres . La marge derreur volue
galement selon la vraie distribution : plus on se rapproche dune proportion de 50 % des
sonds, plus la marge derreur est importante.
Pour conclure sur ce point, il faut souligner les srieuses difficults mthodologiques
lorsque certains enquteurs (comme les instituts de sondage) sautorisent utiliser des
chantillons numriquement faibles et le justifient par la petitesse de la population. Or, que lon
interroge 1000 personnes pour reprsenter la France entire ou pour reprsenter lagglomration
de Saint-Quentin-en-Yvelines, la marge derreur est (quasiment) la mme. De la mme manire,
ds quun sondage est ralis auprs de 1000 personnes, lanalyse des rsultats au sein des sous-
chantillons (les cadres , les 18-25 ans, les sympathisants du Front national, etc.) est souvent

35
problmatique, du fait de ces faibles effectifs. Cela explique pourquoi, par exemple, les opinions
mesures de faon baromtrique (cest--dire rgulirement) auprs des personnes qui se disent
sympathisants du Front national voluent souvent de faon erratique.

Tables la loi statistique (extrait dune table de Gauss seuil de confiance de 95 %)

Taille de lchantillon 100 400 800 1000 1600 2000 10 000


% dans lchantillon
2% 2,8 1,4 1 0,9 0,7 0,6 0,3
10 % 6 3 2,1 1,9 1,5 1,3 0,6
20 % 8 4 2,8 2,5 2 1,8 0,8
33 % 9,4 4,7 3,3 3 2,4 2,1 0,9
50 % 10 5 3,5 3,2 2,5 2,2 1

3. Les chantillons empiriques ou par quotas


Les chantillons par quotas sont, quant eux, des chantillons qui respectent des
critres de composition ou de structure. Ces chantillons ne reposent plus sur le hasard mais
sur une construction raisonne qui sappuie sur le principe suivant : si un chantillon est identique
la population totale en ce qui concerne la distribution statistique dun certain nombre de
critres, il ne sera pas diffrent en ce qui concerne la distribution des caractres inconnus que lon
cherche connatre. Cest une mthode qui na pas de justification thorique : elle ne repose pas
sur une loi mathmatique mais seulement sur lexprience, do le terme dchantillon
empirique . Empiriquement, certains enquteurs se sont rendu compte que cette mthode
marchait , cest--dire donnait des rsultats assez proches de ceux obtenus par un
chantillonnage alatoire. Cest donc avant tout pour des raisons pratiques que cette mthode est
frquemment utilise, notamment par les instituts de sondages franais. Elle permet en effet de
contourner les contraintes des chantillons alatoires. Cependant, elle souffre dun obstacle
important : il nexiste pas doutils statistiques permettant de mesurer la qualit des
rsultats. Cest uniquement par convention que certains instituts franais fournissent des marges
derreurs : dun point de vue mathmatique, a ne repose sur rien, sinon sur lexprience.
En contrepartie, cette technique permet aux enquteurs de savoir en temps rel quels sont
les critres de recrutement des interviews. Donc ils peuvent interviewer nimporte qui, pourvu
que ces personnes appartiennent aux catgories dont les quotas nont pas encore t
combls. Cette mthode suppose deux choses. Premirement, elle implique un fort contrle des

36
enquteurs pour sassurer quils ne trichent pas pour respecter leurs quotas. Deuximement, elle
suppose au pralable de connatre la composition sociale de la population, du moins ses
principales caractristiques, cest--dire les variables considres comme les plus discriminantes,
les plus prdictives de lopinion des sonds. Pour la majeure partie des enqutes par sondages
raliss auprs dun chantillon reprsentatif de la population franaise (ou de lune de ses
composantes), les variables les plus frquemment utilises sont le sexe, lge et le groupe
socioprofessionnel du chef de mnage (souvent arbitrairement considr comme le mari).

Quotas utiliss dans la majorit des sondages pour construire un chantillon


reprsentatif de la population franaise des 18 ans et plus (en 2006)

PROFESSION CHEF DE FAMILLE

AGE Agriculteur 2%
Artisan, commerant, chef dentre. 5%
SEXE
18-24 ans 12 % Cadre, profession intellectuelle sup. 11 %

25-34 ans 18 % Profession intermdiaire 14 %


35-49 ans 28 % Employ 10 %
Homme 48 % 50-64 ans 21 % Ouvrier 22 %
Femme 52 % 65 ans et plus 21 % Inactif, retrait 36 %
TOTAL 100 % TOTAL 100 % TOTAL 100 %

Par ailleurs, les chantillons sont gnralement stratifis en fonction de la rgion et


de la catgorie dagglomration. Lenjeu est davoir un chantillon qui ressemble le plus
fortement possible la population mre. Par exemple, il y a relativement peu dhabitants dans la
rgion Limousin (1,2 % de la population franaise). Si lon recherchait une proportionnalit
parfaite sur un chantillon de 1000 personnes, cela impliquerait peine 12 interviews du
Limousin, avec le risque quils prsentent des caractristiques spcifiques. Pour rpondre ce
problme, les enquteurs interviewent un peu plus dhabitants du Limousin (une vingtaine) puis
effectuent un redressement, cest--dire quils rtablissent ensuite, par calcul, la proportionnalit.
Plus gnralement, le redressement est souvent utilis pour respecter les quotas (en fin de
sondages, lorsquil manque des reprsentants de certaines catgories). Le redressement repose sur
un travail de pondration : on affecte aux catgories un coefficient appel coefficient de
redressement pour que les rsultats finaux respectent les proportions de la population mre
(selon les principes dun calcul en croix ).

37
Lutilisation des quotas, surtout dans le cadre de sondages industriels , soulve une
difficult dj entrevue : le flou des catgories mobilises dans les quotas. Ainsi, remplir les
quotas suffit-il tablir que cet chantillon est reprsentatif ? Cest ainsi largument mobilis
aujourdhui par certains sondeurs pour dfendre la pratique du sondage en ligne. Or avoir un
chantillon compos de 22 % dindividu appartenant un mnage dont le chef est ouvrier
suffit-il tablir que cet chantillon est reprsentatif ? Une telle perspective oublie quune
catgorie aussi vaste que la catgorie des ouvriers nest en rien homogne et quelle est
traverse dimportants clivages. Sil y a bien la mme proportion douvriers dans lchantillon que
dans la population, cela ne garantit en rien que les ouvriers interviews soient, eux, reprsentatifs
de la population ouvrire dans son ensemble. Dans une enqute ralise par Daniel Gaxie et son
quipe la fin des annes 1980, 1000 habitants de la Somme ont t interviews sur des questions
relatives la politique de protection sociale. Parmi ceux-ci, on compte 270 ouvriers.
Thoriquement, pour respecter la structure de la population du dpartement, il y aurait d y avoir
148 ouvriers qualifis et 121 non qualifis. Or, dans les faits, il y eut 183 qualifis et 87 non
qualifis. Autrement dit, lenqute est marque par une surreprsentation des ouvriers les mieux
pays, les plus dots en capital culturel, les moins fragiliss par les transformations
socioconomiques, etc. Or ces critres des capitaux conomiques, culturels et professionnels
clivent fortement la classe ouvrire et sont susceptibles davoir des effets sur la distribution des
opinions et, plus gnralement, sur la propension mme mettre publiquement des opinions sur
des questions complexes comme celles relatives la protection sociale. La non-reprsentativit en
termes de structure peut affecter la reprsentativit des opinions ou des pratiques mesures dans
lenqute.
De la mme manire, la catgorie cadres et profession intellectuelles suprieures
rassemble des individus au statut dactivit disparate : managers, mdecins indpendants, des
avocats et des enseignants du secondaire, etc. Pour les annes 2002-06 (baromtre mensuel TNS
Sofres-SIG), ces derniers sont en moyenne salaris du secteur priv (31 %), salaris du secteur
public (29 %), inactifs (dans le cas de conjoint[e]s de cadres qui ne travailleraient pas ou qui
seraient dj la retraite, 22 %), travailleurs indpendants (10 %) et chmeurs (8 %). Or ds lors
quon mesure des variations dans la distribution des opinions exprimes par les interviews de
cette catgorie (qui reprsente 12 % des chantillons lorsque la population est lensemble des
Franais de 18 ans et plus), il est dlicat de savoir si ces variations sont imputables lvolution
des reprsentations sociopolitiques des cadres ou des volutions dans la composition des
chantillons : il arrive frquemment que la rpartition, dans cette catgorie, entre salaris du
public , salaris du priv et travailleurs indpendants ne corresponde pas la rpartition

38
moyenne. De telles variations sont susceptibles davoir un impact certain sur les rsultats, tant on
sait que, sur de nombreux enjeux politiques et sociaux, les points de vue exprims par les cadres
du priv et les cadres du public peuvent tre, en moyenne, relativement distincts.
Ce constat peut tre fait au sujet de lensemble des modalits des variables utilises pour
les quotas. Pour prendre un dernier exemple, les 18-24 ans comprennent environ 53 % de jeunes
actifs et 47 % de jeunes scolariss. Selon les chantillons, cette proportion peut singulirement
varier, rendant les rsultats recueillis auprs de cette catgorie potentiellement problmatiques.
Plus gnralement, il faut se souvenir que la qualit des rsultats dpend du nombre
dinterviews : par consquent, lexamen des rsultats recueillis auprs des sous-chantillons (par
exemple, les seuls 18-24 ans qui reprsentent 12 % de lensemble des Franais de 18 ans et plus,
soit 120 interviews lorsque lchantillon comprend 1000 individus) doit prendre en compte cette
faiblesse numrique pour viter toute surinterprtation.

4. Les absents et le refus de rpondre


Au-del des problmes dchantillonnage (alatoire / quotas), se pose plus gnralement
le problme de laccs aux personnes et de lacceptation rpondre aux enqutes. Cette
difficult se pose videmment ds lors quil sagit datteindre des populations itinrantes ou
marginales (cf. le texte du livret de TD : LABERGE Danielle, ROY Shirley, Les enqutes
auprs ou propos des populations marginales ), de groupes aux frontires suffisamment floues
pour ne bnficier daucune comptabilisation statistique (les juifs sur lesquels travaille Sylvie
Strudel) ou, dans le cas franais, de minorits ethniques dont il est interdit doprer le
recensement.
Mais ces difficults daccs aux individus concernent galement les enqutes par
sondage ralises auprs dchantillons reprsentatifs de plus de 30 ans aux Etats-Unis et depuis
prs de vingt ans en France. Il est cependant difficile dtablir avec prcision quel est lampleur de
ce refus. Pour les instituts de sondage, cest en effet un secret industriel puisque leur raison
dtre est fonde sur leur rigueur mthodologique, elle-mme dtermine par la reprsentativit
de leurs chantillons. Dans une interview dj ancienne, lex-prsident de la SOFRES voquait
plus de 50 % de refus. Il existe toutefois une enqut ralise en 2000 qui sest efforc de
recueillir des donnes sur ce phnomne (voir GRUMBERG Grard et al. (dir.), La Dmocratie
l'preuve : une nouvelle approche de l'opinion des Franais, Paris : Presses de la FNSP, 2002). Cette
enqute par sondage a t ralise par la SOFRES pour le compte du laboratoire de recherche
CEVIPOF. Sur 8 305 appels, les enquteurs ont dnombr 473 faux numros, 1 283 non-
rponses (i.e. absence), 3510 refus, 750 impossibilits (car hors quotas) et 141 questionnaires

39
incomplets. Au final, il ny a donc eu que 2148 questionnaires valids, soit un taux dacceptation
de 46 % (3039 sur les 6549 personnes prsentes chez eux) et un taux de rponses brut de 26 %
(2148 sur 8305). Cette proportion est dailleurs sans doute plus forte que, dans la plupart des
autres enqutes, puisquil y a eu dans celle-ci jusqu 10 appels pour un mme numro en cas
dabsence.
Au-del des absences qui sexpliquent aussi par les difficults daccs aux personnes
(prsence sur liste rouge, pas de possession de tlphone fixe, digicodes lentre des immeubles,
scurisation des rsidences prives, inscurit dans certains quartiers qui dissuade les enquteurs
de sy rendre, etc.), comment comprendre ce refus de rpondre ? Quelles en sont les raisons ? A
cette question, on peut juste suggrer quelques hypothses puisque si les interviews ne
souhaitent pas rpondre, on ne peut leur demander pourquoi ! Ces hypothses sont notamment
regroupes par Patrick Lehingue (dans Subunda, pp. 92-93) :
Exaspration par rapport au tlmarketing (dont les oprateurs se prsentent de plus en plus
souvent comme des enquteurs)
Peur du fichage, des intrusions, de linterrogation scolaire ou administrative
Manque de temps ou de disponibilit : il est coteux de rpondre un sondage, alors quon
nobtient rien en change sinon la satisfaction davoir donn son avis ou racont sa vie (sauf
dans certaines enqutes en ligne ou enqutes dites qualitatives pour lesquels les enquts
peuvent tre rmunrs ce qui pose l des questions dordre thique ou politique :
comment justifier la rmunration de citoyens dans lexercice de leur rle politique [ie. Participer
une enqute dopinion dont les sondeurs louent les vertus dmocratiques dexpression populaire] ?)
Gnralisation du sentiment dtre manipul, que les sondeurs sont des menteurs, etc.

Pour conclure, il ne faudrait pas penser que ces difficults daccs et dacceptation
constituent seulement des obstacles pratiques (augmentation du temps donc du cot des
enqutes, etc.). Elles constituent, au contraire, des problmes mthodologiques majeurs
puisquelles mettent en jeu la pertinence mme des rsultats recueillis. En effet, face de tels taux
dabsence et de refus de rpondre, on peut mettre en doute la reprsentativit de nombreux
chantillons. tre accessible et accepter de rpondre aux enqutes forment ainsi deux
caractristiques ingalement partages dans lespace social : la population des rpondants effectifs
est une population non reprsentative de lensemble des rsidents franais. On constate ainsi une
sous-reprsentation des groupes sociaux situs aux deux ples de la pyramide sociale ; les
rpondants aux enqutes par sondage disposent en moyenne dun niveau dtudes suprieur au
niveau moyen enregistr sur lensemble de la population en France.

40
Comparaison entre les niveaux de diplme des interviews et les niveaux de diplme de
la population franaise

Population non scolarise Cumul des vagues du baromtre


Diffrence
de 15 ans ou plus (2007) SOFRES-SIG (2002-2005)
Sans diplme + CEP 31,5 % 22 % -9,5 %
BEPC, CAP, BEP 30,2 % 35 % +4,8 %
Bac 15,3 % 16 % -0,7 %
Ens. Suprieur 22,9 % 27 % +4,1 %
TOTAL 100 % 100 %

Les sondeurs utilisent souvent la mtaphore picturale : ils disent dresser un portrait des
Franais, un clich de lopinion publique... Or on constate ici que leur clich est flou ! Pour
reprendre une formule de Patrick Lehingue : dans la photo de famille, il manque le cousin de
province !

Section 2. La collecte des donnes : archives et questionnaires


Une fois les techniques dchantillonnage dfinies, les chercheurs peuvent entreprendre
linvestigation empirique, le travail de terrain . Or, si les enqutes qualitatives reposent
principalement sur des matriaux de premire main (cest--dire collects par le chercheur lui-
mme ou par son quipe), les enqutes quantitatives peuvent reposer sur des donnes
htrognes. En effet, le travail statistique peut sappuyer sur des donnes recueillies par
lenquteur ( travers le questionnaire) mais il peut aussi sappuyer sur des donnes collectes par
dautres institutions, et notamment les institutions administratives (archives). Dans tous les cas, le
chercheur doit tre extrmement sceptique et rigoureux dans cette opration de collecte des
donnes. Leur recueil ne va pas de soi (administrer un questionnaire ne constitue pas un acte
anodin et ordinaire). Aussi faut-il toujours se demander si les dispositifs de collecte et
dagrgation des donnes ne tendent pas produire des effets sur les rsultats eux-mmes.

1. Limpact des conditions de production statistique : biais et artefacts


Il faut, dans un premier temps, sarrter sur ces donnes statistiques que les chercheurs
utilisent sans avoir eux-mmes prsids leur collecte. De nombreuses institutions archivent le

41
produit de leur activit et/ou sappuient sur des instruments statistiques pour exercer leurs
missions. Cest notamment le cas des administrations publiques qui se nourrissent dune pluralit
dindicateurs pour dcrire et valuer leur action sur leurs secteurs respectifs (police, justice,
ducation, logement, sant, etc.). conomistes et sociologues peuvent alors semparer de ces
donnes statistiques pour rpondre leurs questions de recherche. Or la difficult
mthodologique, cest que ces institutions recueillent rarement des informations pour des raisons
purement scientifiques. Si le chercheur sappuie sur de telles sources, il doit alors prendre en
considration les procdures mises en uvre pour recueillir les informations, afin de ne pas
considrer que ce matriau lui livre la vrit. Autrement dit, les sciences sociales doivent ici
semparer de la mme prudence que lhistorien face ses archives : cest une critique des
statistiques officielles quil faut entreprendre.

1. Lexemple du suicide. A quels types dobstacles les chercheurs peuvent-ils faire face ?
Pour rpondre cette question, appuyons-nous sur lexemple des analyses quantitatives du
suicide. Cette illustration est judicieuse, puisque cest sur un tel objet qumile Durkheim a crit
lun des ouvrages fondateurs de la sociologie franaise et notamment dans son versant quantitatif
(Le Suicide). Il y met en application la dmarche intellectuelle et mthodologique expose dans Les
Rgles de la mthode sociologique. Aussi de trs nombreux chercheurs ont opr un diagnostic critique
du Suicide pour mettre lpreuve la validit des thses durkheimiennes : si les donnes posent
problme, cest tout ldifice sociologique qui menace de seffondrer. On ne compte donc plus les
recherches ayant rinvesti les statistiques du suicide afin de mettre en cause ou de dfendre le
travail de Durkheim. Lautre intrt de cet exemple, cest de rappeler que mme un acte aussi
intime que le suicide peut tre apprhend comme un fait social dont lexplication nest pas
rductible ni des facteurs psychologiques, ni une analyse purement individuelle (cf. chapitre 1,
section 1). Le suicide rpond des logiques sociologiques (Durkheim parle de lois ) que les
statistiques permettent de mettre jour. Il sempare alors des statistiques administratives
collectes dans diffrents pays, sur une longue priode, afin de mettre en vidence des
corrlations rgulires : ses donnes montrent que certaines situations, cultures ou positions
sociales prdisposeraient au suicide. Il existe alors diffrents types de suicides qui rsultent soit
dun excs (altruiste) ou dun dfaut (goste) dintgration sociale, soit dun excs (fataliste) ou
dun dfaut (fataliste) de rgulation sociale.
Mais sa thse a t fortement mise en question du fait des nombreux dfauts des sources
statistiques utilises : si ses donnes laissent dsirer, alors ses conclusions ne peuvent tre
valables ! Effectivement, Durkheim a conscience de certaines limites : il admet notamment que

42
les sources statistiques simposent de faon ngative : il est impossible dutiliser dautres
mthodes dinvestigation puisque, par principe, sil y a suicide, lindividu ne peut tre interrog.
Mais hormis quelques petites remarques en note, il ne va pas beaucoup plus loin dans lanalyse
critique des conditions pratiques de production des statistiques. En formulant dailleurs
lhypothse de la comparabilit des donnes dans le temps et dans lespace, il postule
implicitement lhomognit des procdures de recueil et dagrgation de linformation. Selon
Christian Baudelot et Roger Establet (Durkheim et le suicide), trois critiques ont t plus
prcisment adresses aux donnes collectes par Durkheim :
a) Bien quil prenne soin dapporter une dfinition proprement sociologique, il ne sassure
pas que les donnes quil utilise ont t collectes conformment sa dfinition. Par exemple, la
dfinition inclut les cas de sacrifice personnel commis par certains soldats hroques (il va ainsi
lencontre des prnotions qui dfinissent ces morts comme des sacrifices vertueux). Or jamais les
institutions ne considreront une telle mort comme un suicide (cela lui ferait perdre tout
prestige). Plus gnralement, les proccupations des instances qui qualifient la mort nest pas
dordre scientifique mais, selon les cas, dordre mdical ou judiciaire. Il y a des enjeux lourds :
faut-il que la police enqute ? Pourra-t-il y avoir versement dune assurance vie ? Nanmoins les
carts lis la divergence entre dfinition sociologique et dfinitions pratiques sont bien
moindres que pour dautres phnomnes beaucoup moins accessibles (actes de dlinquance par
exemple).
2. La comptabilit du suicide est affecte par le phnomne de la dissimulation. Qui plus
est, comme la dissimulation est plus marque dans certains milieux sociaux, les statistiques
rvlent davantage lingale capacit dissimuler que lingale propension au suicide. Cette
critique est cependant partiellement invalide par Baudelot et Establet qui rappellent le chanage
administratif aboutissant lattribution de la cause suicide dans les donnes dtat-civil. Le
nombre dintermdiaires impliqus dans cette procdure denregistrement rend peu probable un
phnomne de dissimulation massif et spcifique certains milieux sociaux.
3. Les diffrentes sources statistiques ne concident pas entre elles. Baudelot et Establet
confirment que les donnes collectes par la source tat civil INSERM INSEE (causes
mdicales de dcs) ne sont pas quivalentes celles collectes par ladministration judiciaire.
Mieux, la police et la gendarmerie ne grent pas les dossiers de la mme manire : il est alors
probable que le constat dun nombre plus important de dcs dans les petites communes que
dans les grandes agglomrations tient ces procdures diffrentes denregistrement (la police
tend moins transmettre lINSERM les causes de dcs en cas de mort violente que la
gendarmerie). Ds lors, il faut admettre que la comparaison internationale est encore plus

43
problmatique puisque chaque pays dispose de ses propres traditions en matire denregistrement
et de comptabilit des causes de dcs.
Comme le souligne Dominique Merlli (cf. texte du livret de TD) : Du suicide son
inscription statistique, il y a divers intermdiaires qui sont susceptibles de dfaillances et que la
question de la qualit ou de lexactitude des donnes ne retentit pas seulement sur
lvaluation densemble du phnomne (le nombre de suicides dans un pays) mais aussi sur la
signification de ses variations statistiques. Lexemple du suicide permet de distinguer deux types
d erreurs lis soit la production des donnes, soit une mauvaise interprtation des donnes

2. Les biais sont des formes derreurs systmatiques imputables linstrument de


mesure (Merlli, p. 126). Par exemple, linsuffisante transmission lINSERM des causes de
morts violentes par la police constitue un biais pour tout chercheur qui souhaiterait analyser le
suicide partir de cette source statistique.
On considre gnralement que les statisticiens travaillent biais constant , cest--dire
que, tant que le mode de recueil des informations et les principes de catgorisation ne varient pas,
les erreurs sont globalement toujours les mmes. Autrement dit, les carts observables dune
vague denqute lautre ne sont pas ou peu affects par les problmes mthodologiques car ces
derniers sont a priori identiques chaque vague. Par exemple, dans le cas de la mesure du suicide,
les procdures de comptage des morts et de leur cause restent les mmes pendant de longues
priodes dans chaque pays. Dans ce cas, les biais lis lattribution des causes ne changent pas ou
peu, si bien que les volutions observes dans un mme pays peuvent tre analyses comme des
volutions dans la pratique du suicide !
Autre exemple, les sondeurs ne parviennent pas connatre avec exactitude la proportion
de sonds qui se disent proches du Front national ou qui avouent avoir rcemment vot pour
le FN. Cest un biais invitable dans la mesure o le FN suscite de trs fortes critiques dans
lespace public : il est alors difficile dassumer publiquement son got pour un tel parti. Mais
ce biais nest pas trop dommageable dans la mesure o il est a priori le mme chaque sondage.
Ce nest videmment pas le cas dans des conjonctures au cours desquelles le FN noccupe plus
exactement la mme position dans lespace partisan. Sa prsence au second tour de llection
prsidentielle en 2002 rend sans doute plus dicible, en tout cas moins illgitime, lexpression de
cette prfrence partisane. De mme, le changement de leadership la tte du parti en 2011 peut
entraner certains changements en matire de discrdit associ lnonciation publique dune
proximit au FN. Toujours est-il quen dehors de ces squences problmatiques pour les

44
sondeurs, toute volution significative dans la proportion de personnes se dclarant proche du
FN peut alors sinterprter comme une volution proprement politique.

3. On parle dartefacts lorsque les variations de la mesure sont imputables plus aux
caractristiques de linstrument qu celles de lobjet mesur . Par exemple, il peut y avoir artefact
dans les carts entre les taux de suicides de diffrents pays si les procdures de comptage et
dattribution des causes de la mort divergent sensiblement. Face des rsultats qui voluent, le
danger est alors de croire lvolution du fait social lui-mme, alors quil sagit simplement dune
volution dans les conditions de la production statistique : cest la manire de mesurer qui a
chang et qui automatiquement modifie la mesure. Dans le cas du suicide, il est impossible de
savoir si les diffrences observes tiennent ces divergences mthodologiques ou bien des
rapports diffrencis au suicide. Autre exemple dartefact dj soulign : les fortes variations des
opinions des interviews regroups dans la catgorie sympathisants FN dune vague
denqute. Enfin, dernier exemple, enqutes internationales sur le niveau scolaire (exercices
traduits de lAnglais pas mmes rythmes dapprentissage selon les pays etc.)

Attention cependant : se focaliser sur les biais et les artefacts, on pourrait tre tent de
tomber dans une sorte de purisme mthodologique qui laisserait entendre quil existerait de
vrais chiffres que la science pourrait collecter en amliorant ses procdures de recueil
dinformation et de comptage. Or ne perdons pas de vue le constat suivant : les phnomnes
collectifs et autres faits sociaux nexistent qu travers les instruments qui permettent de les
mesurer. Sil y a partout des actes de dlinquance, la dlinquance en tant que fait social propre
une socit donne na pas de consistance tant quaucun instrument ne cherche la mesurer et
lui donner une certaine figure.

2. La construction du questionnaire
De nombreuses recherches ne peuvent sappuyer sur des donnes existantes. Le
chercheur doit alors lui-mme recueillir les donnes, partir dun questionnaire visant convertir
le questionnement (cest--dire la problmatique) en questions. Le questionnaire regroupe lensemble
des questions qui seront poses aux enquts et qui correspondent aux variables que lon cherche
tudier. Franois de Singly explique que le rle dun questionnaire, cest d expliquer ce que les
acteurs font par ce quils sont . On pourrait videmment ajouter : expliquer ce que les acteurs
pensent par ce quils sont. Autrement dit, les questionnaires visent mettre en vidence des
faits sociaux , des rgularits, des tendances objectives : il sagit ici dtablir la frquence de

45
certaines pratiques, le partage de certaines opinions, etc. Mais ils ont aussi et surtout pour objectif
didentifier les facteurs qui expliquent les pratiques et les reprsentations, cest--dire les facteurs
qui prdisposent les individus faire telle ou telle chose ou penser telle ou telle chose
(prdisposer au sens de rendre statistiquement probable). Par consquent, indpendamment du
mode de passation (face face, autoadministr, tlphone, etc.), tout questionnaire doit intgrer
deux types de questions, deux types de variables
- Des variables relatives lobjet tudi (par exemple, les comportements
politiques, le rapport aux institutions, lenvironnement ou lcole, les
reprsentations du travail ou de lordre social, les pratiques en matire de vacances,
de sant ou de sexualit, etc.). Lenjeu ici est alors de trouver des questions
mthodologiquement pertinentes pour objectiver les pratiques et les attitudes des
individus sur les thmatiques de lenqute.
- Des variables sociologiques, cest--dire des variables qui caractrisent
sociologiquement les individus (sexe, ge, position sociale, capital scolaire, salaire,
valuation subjective de sa position sociale, religion, position dans la famille,
environnement gographique, etc.). Ces questions appeles renseignements
signaltiques sont mthodologiquement pertinentes si le dcoupage des catgories
est entrepris de faon judicieuse (cf. chapitre 1, section 3).

A. Lartificialit de la situation denqute. Les enqutes par questionnaire sont


fondes sur une interaction entre un enquteur et un enqut. Cette interaction peut tre directe
(dans le cas du face--face), mdiatise (dans le cas du tlphone) ou simplement imagine (dans
le cas de questionnaires auto-administrs en ligne). Il nen demeure pas moins que, comme tout
contexte daction, la situation de recueil des informations est susceptible davoir un impact sur les
rponses recueillies.
Dune part, comme dans toute situation, les participants en ngocient la dfinition (G.
Bateson) : de cette dfinition dcoulent les rles quils sont supposs endosser lgitimement
(ceux denquteurs et denquts). Ici, la ngociation est souvent lavantage de lenquteur
puisque lenqut na dautre choix que de se soumettre la rgle du jeu (du jeu de rles !) ou de
ne pas jouer (via des stratgies dexit telles que le refus de rpondre). Lenquteur impose donc
non seulement les principes de linteraction ( je pose des questions / vous rpondez ) mais
galement son contenu ( vous devez rpondre aux questions que je me pose, en choisissant lune
des modalits de rponse que je vous suggre ). Dans le cas de sondages industriels, lenjeu des
commanditaires de lenqute est dailleurs de brider au maximum la latitude des interlocuteurs et,

46
par consquent, la teneur des interactions : lenquteur est tenu de lire un synopsis dont il ne peut
scarter (officiellement, pour ne pas orienter les rponses ; officieusement, pour garantir la
rapidit de passation du questionnaire). Or cette situation, artificielle, peut tre vcue par certains
interviews comme un rappel de situations plus familires comme celles rencontres lcole ou
face des agents administratifs. Tandis que certains vivent la saisie du questionnaire sur un mode
plutt ludique ou sympathique, dautres considrent quil sagit dune situation violente
symboliquement et/ou anxiogne (notamment pour ceux qui ont vcu douloureusement leur
scolarit ou leurs expriences face ladministration). Dans tous les cas, ce qui caractrise avant
tout lattitude des enquts dans la situation denqute, cest un souci de ne pas perdre la
face vis--vis de son interlocuteur (plus que de dire la vrit ou de rpondre en son for
intrieur). Les interviews engagent alors diffrentes stratgies (souvent intuitives) pour satisfaire
cet objectif de conserver la face. On ne peut donc analyser les rsultats dune enqute sans lire les
rponses sous ce prisme-l !
Dautre part, comme dans toute situation, les enqutes par questionnaire mettent en
relation des individus qui ne se rsument pas ces rles endosss dans le contexte denqute. Les
personnes sont galement positionnes, chacune, dans lchelle sociale. Elles sont ingalement
dotes en ressources (notamment ducatives et culturelles). Elles sont porteuses de dispositions
lies au pass social des individus et de leur famille, la socialisation, aux expriences accumules,
la trajectoire sociale. Autrement dit, ds lors quil y a face--face (ou, dans une moindre mesure,
interaction tlphonique), les relations denqute sont aussi et avant tout des relations
sociales au cours desquelles chacun tend typifier son interlocuteur (cest--dire se le
reprsenter socialement, le faire entrer dans des catgories), se positionner son gard
(souvent dans un rapport hirarchique, par exemple homme > femme , vieux > jeune ,
Franais de souche > immigr , CSP + > CSP , etc.) et agir selon ces typifications. Or les
situations denqute sont potentiellement asymtriques, ds lors que linterview se vit en
situation dinfriorit sociale face lintervieweur (sentiment dtre culturellement domin). Dans
ces situations, ne pas perdre la face signifie faire bonne figure et donner la bonne rponse ,
cest--dire celle dont on peut avoir le sentiment quelle est attendue par lenquteur ou bien celle
dont on sait quelle nest pas socialement illgitime (comme peut ltre linclinaison pour le Front
national) ou bien encore celle qui est a priori peu coteuse car plus facile justifier (les rponses
modales servent souvent de rponses refuges ). Cest le cas par exemple, de
lautopositionnement sur une chelle en 7 modalits incarnant laxe droite-gauche : beaucoup des
choix 4 ne correspondent pas un authentique positionnement centriste mais une incapacit
se positionner.

47
Cette tentation de vouloir donner la bonne rponse concerne donc principalement les
catgories de la population les plus dmunies socialement ou culturellement parlant.
- Soit elles savrent effectivement incomptentes , cest--dire effectivement
incapables de rpondre la question pose parce que cette dernire serait trop
complexe dans sa formulation ou dans son contenu, trop sotrique ou trop
loigne de lexprience vcue.
- Soit elles se sentent illgitimes ou incomptences, parce quhabituellement peu
autorise parler en leur nom propre et exprimer leurs propres opinions.

B. Des ficelles rdactionnelles. Il faut donc tre particulirement vigilant dans la


construction du questionnaire. Le propre des enqutes quantitatives de premire main (cest--
dire des enqutes qui ne travaillent pas ni sur des donnes dj recueillies, ni sur un corpus
documentaire existant) est de reposer sur un questionnaire standardis : il ne peut y avoir
dexploitation statistique des rsultats que si les enquts ont t soumis au mme questionnaire
(principe dquivalence prcdemment expos). Par consquent, la principale difficult des
enqutes par questionnaire, cest que celui-ci est fix une fois pour toute (on ne peut plus revenir
en arrire) et quil est cens tre soumis aux enquts dans un laps de temps relativement court
(sinon les enquts ne sont plus quivalents : la variable du temps intervient comme facteur
explicatif supplmentaire des variations, ce qui complique lanalyse des donnes). Cest l que
rside lune des diffrences majeures avec les enqutes par entretiens : le guide dentretien peut,
lui, tre amlior au fur et mesure des interviews car celles-ci ne sont pas mises en quivalence
et codes sous une forme statistique.
La qualit des rsultats dpend donc troitement de la pertinence du questionnaire.
Malheureusement, il est difficile de dire dans labsolu ce quest un bon questionnaire. La
pertinence dun questionnaire dpend fortement de la problmatique, de lidentit des interviews
(selon leur capital culturel ou leur proximit avec le sujet de lenqute) et des conditions de
passation du questionnaire (par tlphone, en face--face ou sur un mode auto-administr). Ici
lenjeu est donc nouveau didentifier les ventuels obstacles mthodologiques plutt que de
donner des rponses toutes faites.
La premire des interrogations se poser est de savoir sil vaut mieux privilgier
questions ouvertes (qui laissent linterview rpondre librement, par ses propres mots) ou
questions fermes (qui encadrent la rponse de linterview dans des modalits prdtermines

48
par lenquteur). Pour y rpondre, demandons-nous dabord pourquoi les questions fermes sont,
ce point, prdominantes dans les enqutes par questionnaire :
(a) Elles cotent moins chres (en termes de temps, de complexit, de finance). En effet, le
traitement statistique des rponses aux questions fermes est simple puisque les modalits
possibles sont en nombre limit et surtout sont prcodes. linverse, les questions ouvertes
gnrent souvent des rponses tellement htrognes et disperses quelles en deviennent
inexploitables.
(b) Comme le codage est fix lavance, il y a moins de risque derreurs de la part des enquteurs
(mauvaise retranscription des propos lie la prise de note rapide), ainsi que moins darbitraire
dans le regroupement des rponses des fins de traitement statistique. Ds lors quil y a une
pluralit denquteurs, il risque toujours dy avoir une pluralit dinterprtations des rponses.
Mais derrire ces rels avantages pratiques, les questions fermes sont souvent
critiquables sur un plan intellectuel. Face elles, les questions ouvertes prsentent en effet deux
qualits majeures :
(a) Elles permettent de privilgier les catgories travers lesquelles les individus eux-mmes
peroivent et classent le monde social. Si lenjeu de lenqute est de travailler sur les
reprsentations et les systmes de valeurs, les mots utiliss par les interviews ne sont
videmment ni anodins, ni interchangeables !
(b) Elles permettent de diversifier les perspectives de codage des informations. Le codage est
alors effectu a posteriori, une fois que les rponses ont t recueillies. Ce sont ces dernires (leur
frquence, leur distribution, leur diversit) qui peuvent amener lenquteur tablir les modes de
classement les plus pertinents au regard de la problmatique de lenqute. A ce titre, les questions
ouvertes peuvent savrer plus particulirement utiles dans une phase exploratoire. Par exemple,
si lenjeu de la recherche est de comprendre les modalits de construction des opinions publiques,
il peut tre plus judicieux, dans un premier temps, de laisser sexprimer les interviews (sur les
personnes qui ont compt dans la formation de leurs ides ou les propositions de campagne qui
les ont intresses). Ces rponses exploratoires pourront ensuite tre utilises pour laborer le
questionnaire et tester les arguments suggrs par les interviews (et non imposs par les
enquteurs partir de leurs propres points de vue). Les questions ouvertes sont ici prcieuses
pour construire des hypothses qui pourront tre (in)valides par lenqute quantitative
proprement dite.
Face cette ambivalence, Franois de Singly invite une position de compromis.
Premirement, il est possible (et souvent judicieux) de mler louvert et le ferm pour un mme
ordre de questions. Par exemple, dans un questionnaire sur la participation aux activits

49
associatives, on peut dabord demander aux interviews : Participez-vous la vie associative ? ,
puis Si oui, dans quelle mesure ? . Deuximement, dans une question ferme invitant les
interviews choisir une ou plusieurs modalits de rponses prdfinies, il faut toujours prvoir
une catgorie Autre et laisser la personne sexprimer si elle retient cette modalit.
Au-del de lalternative entre ouvert et ferm, il existe quelques ficelles pour faire face aux
deux difficults majeures de toute enqute par questionnaires : minimiser limposition de
problmatiques et favoriser lexpression personnelle. En somme, lenjeu est dattnuer le risque
dartefacts, cest--dire les effets associs lenqute. Les enquteurs font face en effet au
paradoxe de lobservateur : celui-ci doit dcouvrir comment les gens parlent et agissent quand on
ne les observe pas, mais la seule faon de le dcouvrir, cest de les observer. Douze
recommandations peuvent ainsi tre formules1.

1. Garantir la protection des personnes : il faut toujours souligner lanonymat et faire en sorte
que lexercice napparaisse pas scolaire ou administratif.

2. Ne pas livrer immdiatement la problmatique de lenqute. Par exemple, sil sagit dun
questionnaire sur lducation, il peut tre utile de dbuter par une question invitant les enquts
hirarchiser leurs sujets de proccupations (lducation tant noye parmi de nombreux
thmes). De la sorte, la mesure de lintrt de lenqut peut tre tudi en comparaison avec
dautres centres potentiels dintrt (et non comme si seul ce sujet pouvait le proccuper).

3. Toujours inclure une option sans rponse (et le suggrer). Cest utile la fois pour
amliorer la construction du questionnaire (sil y a une trop forte proportion de sans-rponses,
cela peut indiquer que la formulation des questions est trop complexe), pour tudier les sans-
rponses elles-mmes (qui sont-ils ?) et pour nanalyser les rsultats que sur les personnes qui
sexpriment.

4. tablir un quilibre entre modalits positives et modalits ngatives (en nombre et en


qualit). Comme les questionnaires sont souvent vcus comme la passation dun examen, cela
permet de ne pas indiquer par le choix des mots quelle pourrait tre la bonne rponse.

5. tre vigilant sur le choix des mots (et notamment les mots introductifs). En cas de doute, il
ne faut pas hsiter utiliser la technique du split, cest--dire diviser lchantillon en plusieurs
sous-chantillons auxquels on soumet diffrentes versions de questions afin de voir si la
formulation elle-mme ne produit pas deffets sur les rponses recueillies. Pour ne prendre quun

1 Ces recommandations sont principalement inspires de louvrage de Franois de SINGLY : LEnqute et ses mthodes :
le questionnaire (Paris : Nathan, 1992).

50
exemple, on ne recueille pas exactement les mmes rponses si la question porte sur
lacceptation de l autorisation ou de l interdiction des discours racistes.

6. Autoriser les doubles ou les triples rponses. Il faut faire en sorte que le questionnaire
ressemble le moins possible un problme scolaire : il ny a pas une bonne rponse ! Par
ailleurs, cela permet aux interviews de prsenter plusieurs facettes de leur personnalit et
dassumer des pratiques moins lgitimes (quon noserait pas forcment avouer sil fallait ne
retenir quune rponse). Enfin, au niveau de lexploitation des rsultats, cela permet de croiser les
rponses et de savoir quoi on par ailleurs rpondu ceux qui ont choisi telle ou telle modalit.

7. tre attentif lordre des rponses. Il faut privilgier la prsentation alatoire dans lordre
des modalits, ainsi que la rotation des items lorsque la mme question est pose pour diffrentes
situations. Il faut notamment se mfier de deux effets potentiels, susceptibles daffecter le recueil
des informations. Souvent peu engags dans la relation denqute, les interviews ont en effet
tendance retenir la dernire modalit cite par lenquteurs (hypothse de la rponse en cho)
mais ils ont surtout tendance retenir la premire modalit cite (hypothse du primary effect li
aux difficults de mmorisation ou au sentiment que les premires rponses suggres seraient les
plus lgitimes).
Selon vous, quels sont les deux problmes les plus graves ? (Jean-Paul Grmy, 1988).
Ordre direct Ordre inverse Diffrence
- Le chmage 34 19 -15
- Le terrorisme 8,5 7 -1,5
- La faim dans le monde 21 18 -3
- La guerre 15 18 +3
- La surpopulation du monde 1,5 2 +0,5
- Le racisme 5 8,5 +3,5
- Le non-respect des droits de l'homme 8 10 +2
- L'insuffisante formation professionnelle des jeunes 1 6 +5
- La dlinquance 1 8 +7

Cependant, il faut parfois respecter un ordre fixe dans la prsentation des modalits. En effet,
lorsquil sagit de questionner les individus sur le temps quils consacrent aux pratiques culturelles,
il faut placer la tlvision en tte. Comme toutes les enqutes montrent que la tlvision occupe
plusieurs heures par jour, la placer en milieu ou en fin de liste risquerait damener les interviews
sous-estimer le temps quils lui consacrent pour rester cohrent avec les autres rponses.

8. tre attentif lordre des questions. Il convient de garantir une cohrence globale dans le
questionnaire.
o Cela signifie dabord quil faut placer les questions les plus impersonnelles avant
questions les plus personnelles. Autrement dit, il faut mettre en tte les questions

51
les moins intimes, celles dont les rponses sont souvent publiques ou faciles
noncer publiquement. Comme pour toute relation, lenjeu est de gagner la
confiance de linterview pour lamener tre sincre. On ne peut donc pas
lamener immdiatement livrer ses facettes les plus intimes ou les moins
lgitimes socialement.
o Ensuite, les interviews sont souvent soucieux de produire de la cohrence dans
leurs rponses. Ils sont donc sensibles au contexte engendr par le questionnaire
(effet de halo). Par exemple, aux Etats-Unis au milieu des annes 1980, une affaire
despionnage sovitique men par de supposs journalistes occupe lactualit du
pays. Dans un sondage, seuls 44 % des Amricains interviews disent accepter la
prsence de journalistes sovitiques sur le sol amricain . Toutefois, une enqute
relativement similaire est propose un autre chantillon. On demande dabord
aux interviews sils acceptent la prsence de journalistes amricains sur le sol
sovitique (la quasi-totalit adhre cette proposition). Puis, on leur demande sils
acceptent la prsence de journalistes sovitiques sur le sol amricain : 70 % sont
dsormais favorables cette prsence !
o Le questionnaire produit enfin des effets de connaissance . Par exemple, une
enqute consacre aux relations parents-enfants interroge un chantillon de
parents sur les activits quils ont avec leur(s) enfant(s). La question est ouverte et
ceux-ci mentionnent trs rarement la discussion en tant quactivit. Lorsque la
mme enqute, reproduite quelques temps plus tard, demande dabord aux
parents sils ont des conversations avec leurs enfants (question ferme), une
majorit dentre eux incluent alors spontanment la discussion parmi les
activits quils ont avec leurs enfants.

9. Ne mettre quune question par question. Les rsultats ne sont interprtables que si la
question est la plus comprhensible et univoque possible. Par exemple, dans une enqute
consacre la scurit routire, figure la question suivante : tes-vous pour le port de la
ceinture larrire ? Cette question pose problme car on ne peut savoir prcisment quoi les
interviews ont rpondu :
- tes-vous pour le port de la ceinture (tout court) ?
- tes-vous pour le port de la ceinture (tout court) ?

10. Mnager la mmoire. Cela signifie, notamment dans des passations par tlphone, quil faut
limiter le nombre de modalits pour chaque question.

52
11. viter les ngations (ou pire les double ngations). Un exemple caricatural : Ne pensez-
vous pas quil aurait mieux valu que la France ne participe pas la guerre du Golfe ?

12. Inclure des rponses centristes dans les chelles dattitude. Il faut souvent viter de
placer les interviews face une alternative tranche (pour / contre), mme si un tel
questionnement peut ressembler une procdure rfrendaire (o lenjeu est seulement dobtenir
des majorits). Il convient alors de suggrer des rponses modales (chelle en quatre
comprenant des rponses modales). Cest le cas, par exemple, de cette question trs ancienne du
baromtre TNS Sofres / Le Figaro Magazine : Faites-vous tout fait confiance, plutt confiance,
plutt pas confiance ou pas du tout confiance Nicolas Sarkozy pour rsoudre les problmes qui
se posent en France actuellement ? . Voici les rponses de la vague doctobre :
- Tout fait confiance 5%
- Plutt confiance 25 %
Sous-total confiance 30 %
- Plutt pas confiance 24 %
- Pas du tout confiance 42 %
Sous-total pas confiance 66 %

Lintrt dune chelle en quatre modalits est doffrir une interprtation plus riche des rsultats.
Dun ct, il est possible de regrouper les confiants et les pas confiants pour mesurer la
popularit effective du chef de ltat. Mais il peut tre tout aussi intressant de comparer les
rponses intenses (tout fait / pas du tout : 47 %, contre 39 % pour Franois Fillon) avec les
rponses faible intensit (plutt / plutt pas : 42 %, contre 55 % pour F. Fillon). Toutefois, les
rponses modales pouvant servir de rponses refuges, le questionnaire doit permettre aux
interviews de ne pas se positionner. Il faut donc suggrer la possibilit de ne pas rpondre (rgle
n3).

3. La consistance des opinions


A. Les spcificits de lopinion publique sondagire . Les questionnaires sont
prcieux pour mesurer les pratiques sociales. Mais ils servent galement saisir des valeurs,
croyances, reprsentations, convictions. Sagit-il donc dune mthode adquate pour apprhender
des opinions ? Et par consquent, les enqutes quantitatives (au premier rang desquelles figurent
les sondages dopinion publis dans la presse) peuvent-elles permettre de mesurer lopinion
publique ? Mais quest-ce que lopinion publique ? Partons tout dabord dune boutade attribue
au fondateur du premier institut de sondage amricain, Georges Gallup qui, en 1936, a pu

53
prouver lefficacit de sa mthode en prdisant la victoire de F.D. Roosevelt lors de llection
prsidentielle amricaine :
Q : Docteur Gallup, quelle dfinition donneriez-vous dun sondage dopinion ?
R : Un instrument de mesure de lopinion publique.
Q : Oui, mais quentendez-vous par opinion publique ?
R : Tout simplement ce que mesurent les sondages.
Les sondages dopinion prtendent donc mesurer lopinion publique. Seulement, si tout
le monde sempare de ce terme, il est bien dlicat de le dfinir. Et surtout cette assimilation entre
opinion publique et rsultats des sondages nest accepte que depuis quelques dcennies. En
effet, historiquement, le concept dopinion publique ne correspond pas ce que mesurent les
sondages. Le terme est assez ancien mais sa conception positive apparat au milieu du XVIIIe
sicle, dans le cadre de la lutte contre labsolutisme, contre larbitraire royal. Lun des premiers
concevoir positivement cette notion, cest Jean-Jacques Rousseau. Initialement, lopinion
publique, cest une opinion restreinte, celle des lites claires. Cest le produit dune discussion
critique, au cours de laquelle des particuliers font un usage public de la raison : ce nest pas le sens
commun qui relve dans ce cas du vulgaire . Le XIXe sicle est toutefois marqu par un
processus de dmocratisation qui rsulte de l entre des masses dans la vie publique et
politique. Lopinion publique devient une opinion populaire. Mais elle est publique parce quelle
est exprime publiquement ( travers les manifestations, les mobilisations collectives ou lors dun
scrutin par exemple). Elle est donc dmonstrative, volontaire et collective. Or les sondages
reposent sur une conception diffrente de lopinion publique, une conception videmment en
lien avec lvolution des systmes politiques. Il faut donc analyser quelles sont les conceptions de
lopinion publique sous-jacentes la pratique des sondages (et diffrentes des anciennes
conceptions) :

La premire diffrence, cest que les opinions sont sollicites. Ce ne sont donc pas des opinions
publiques mais des rponses prives. La formule rcurrente de nombreux sondeurs ( Les Franais
nous disent que... ) est problmatique. En ralit, ils devraient dire : Les personnes
extrmement diffrentes que nous avons sollicites ont accept de rpondre aux questions que
nous leur avons poses et de choisir les modalits que nous leur avons imposes ! . Bien
souvent, il sagit de questions quils ne staient pas forcment poses ou alors des opinions quils
navaient pas cherch rendre publique. Bref, la situation denqute par sondage est une situation
artificielle : il sagit dune interaction fugitive entre deux personnes qui ne se connaissent pas mais
qui adoptent des rles denquteur et denqut (cf. prcdent). Cette situation transforme des
rponses prives en opinions publiques.

54
La deuxime diffrence, cest que les opinions sont recueillies individuellement : il ne sagit pas dune
expression collective comme dans le cadre dune manifestation, ou bien dune opinion qui
merge dun rapport de forces ou dune discussion, ou bien dune opinion qui slabore
progressivement dans un contexte de dbat. Ici, lopinion est prconstruite puisquelle est cense
sexprimer travers des cases prdfinies par lenquteur et prleve individuellement, en dehors
des situations habituelles dexpression des opinions. Or on sait que, selon le type de situations,
lexpression des opinions varie. Par exemple, nos opinions peuvent varier selon que lon est
conducteur dautomobile ou piton ! De mme, on ne sexprime pas de la mme faon devant ses
parents, ses collgues, ses amis ou ses suprieurs hirarchiques. Or l, on isole la personne de son
environnement social : cette situation na pas dquivalent socialement parlant... Il est difficile de
dire quoi correspondent ces opinions : sagit-il du for intrieur des individus ? Mais dans la
vraie vie , dans quelles circonstances met-on de telles opinions ? Habituellement, les opinions
sexpriment dans des situations dinteraction. Ici, les opinions sont atomises.

La troisime diffrence, cest que lopinion publique est simplement considre comme une agrgation, la
somme de toutes les opinions individuelles. Elle nest publique que parce quelle est plurielle. Or,
cela amne placer tous les individus sur le mme plan, indpendamment de leur poids social
respectif, ou de leur matrise du sujet de lenqute, ou encore de leur intrt personnel pour le
sujet de lenqute. Il y a un principe de mise en quivalence : tous les individus sont considrs
comme quivalents face lenqute. Donc cela ne permet pas rellement de mesurer le potentiel
de mobilisation ou dopposition : cela tend niveler les attitudes.

Pour rsumer, on peut dire que lun des principaux problmes soulevs par les sondages
dopinion est de convertir des principes dordre politique en principes dordre mthodologique.
Comme pour le vote, on considre quun homme = une voix. Comme pour le vote, la procdure
retenue (choix de la question et des modalits de rponse) est fixe par les commanditaires du
sondage et non par les individus eux-mmes. Donc de ce point de vue, il est souvent difficile de
dire si les opinions sont publiques. Il est mme difficile de dire sil sagit dopinions ! Le problme
rside donc la fois dun point de vue individuel (quelle est la consistance des opinions
recueillies, cest--dire quel est le statut des rponses ?) et dun point de vue collectif (quel est le
statut des rsultats agrgs ?).

B. Des postulats contestables. Dans un article clbre (1972), Pierre Bourdieu remet
en cause de manire radicale cette prtention des sondeurs mesurer lopinion publique . Pour
lui, lopinion publique saisie lors des enqutes par sondage nexiste pas : il sagit dun pur
artifice. Pour tayer sa dmonstration, il sefforce de montrer le caractre contestable des trois

55
postulats qui justifient la pratique sondagire : (1) tout le monde peut avoir une opinion ; (2)
toutes les opinions se valent ; (3) il y a un accord sur les questions qui mritent dtre poses.

(1) Tout le monde peut avoir une opinion. Il ne sagit pas ici de considrer que les
individus sont des idiots culturels. Mais plutt dindiquer que tout le monde na videmment pas
dopinions sur tous les sujets : la connaissance dun sujet et la capacit opiner personnellement
sur ce sujet nest pas universellement partage. Or il est souvent difficile didentifier la proportion
dinterviews dont les rponses renvoient des opinions solides , cest--dire prexistantes
lenqute et justifiables. Dune part, on la vu, pour faire bonne figure , certains enquts
peuvent avoir la tentation de rpondre mme dans les cas o le sujet leur est inconnu ou peu
comprhensible : il peut sagir de ne pas passer pour un ignare ou bien de vouloir faire plaisir
son interlocuteur Dautre part, les enquteurs eux-mmes ont souvent tendance minimiser les
sans-rponses. Cest notamment le cas des instituts de sondages : le faible taux de sans-rponse /
NSP constitue paradoxalement un argument commercial : ils peuvent se prsenter face leurs
clients comme ayant bien rempli leur rle. Or, cest un paradoxe parce que, au contraire, les
rsultats deviennent moins significatifs puisquon agrge des rponses motives et des rponses
hasardeuses.
Exemple incongru : la question Trouvez-vous que les chercheurs franais remplissent leur mission trs
bien, plutt bien, plutt mal, trs mal ? (CSA, avril 2006), seuls 2 % se placent dans les sans-rponses.

Les instituts mobilisent diffrents moyens pour rduire les sans-rponses : la multiplication des
consignes de relance ; labsence de la modalit Je nai pas dopinion ; la prsence dans la
question dun rappel prcd de vous savez que... (sous-entendu potentiellement violent
symboliquement : vous tes suppos savoir !) ; labsence de questions pralables qui demandent
aux personnes sils savent de quoi il sagit et quelles comprhensions ils ont du sujet.
Or, si tout le monde ne comprend pas les questions, ceux qui les comprennent ne les
comprennent pas toujours de la mme faon. Cest notamment le cas lorsque les questionnaires
utilisent des termes complexes, flous ou quivoques. Non seulement les interviews risquent
dtre heurts par cette complexit, mais en plus lagrgation des rponses savrera prcaire
puisque tout le monde naura pas choisi la mme modalit pour les mmes raisons (car tous
nauront pas compris la mme chose !).
Exemple trivial : sondage CSA / Marianne, 23 novembre 2005
Question 1. Pensez-vous que la France devrait ?
- Changer de modle social 46 %
- Prserver et renforcer le modle social existant 51 %
- Ne se prononcent pas 3%

56
Ici, jamais lenquteur ne demande aux sonds sils savent ce quest le modle social franais et ce
quils entendent par modle social franais. Au-del de cet exemple vident, il faut mme
admettre que cest lensemble des termes les plus couramment utiliss par les lites (et
notamment par les lites administratives) qui posent problme.
Exemple donn par Daniel Gaxie partir dune enqute par questionnaire ralise en
1986 auprs dun chantillon dinterviews picards, tabli selon la mthode des quotas. Dans ce
dense questionnaire, on peut dabord citer une question lie au contexte politique du moment et
donc apparemment vidente : Certains disent que, pour sen sortir, il faut introduire plus de libralisme
dans la socit franais. tes-vous tout fait daccord, plutt daccord, plutt pas daccord, pas du tout daccord,
sans rponse ? 28 % ne rpondent pas (modalit explicite), 48 % sont daccord, 24 % ne sont pas
daccord. Or, quelques questions plus loin, on demande ceux qui ont accept de rpondre
cette 1re question : Dites-moi ce que reprsente le libralisme pour vous ? Cest une question ouverte :
29 % ne rpondent pas
28 % assimilent libralisme libert (faire ce que lon veut, circuler plus librement, pouvoir
dire ce quon pense)
11 % se placent sur un terrain thique (se prendre en main, tre moins goste)
7 % oprent une confusion avec dautres termes
seulement 25 % fournissent une rponse qui cadre bien au dbat politique du moment (laisser
plus de place au libre march, rduire les impts, la bureaucratie, la rglementation, etc.).
Une autre exprience ralise en 1988 et cite par Patrick Lehingue vient confirmer ce problme
de consistance des opinions. Il sagit dun sondage command par Le Monde qui soumet aux
sonds une vingtaine de mots trs frquemment utiliss dans les dbats politiques du moment et
qui leur demande ensuite de dfinir ces termes. La question est donc ouverte. Le taux de sans-
rponse est trs lev pour certains termes : protectionnisme (24 %), alternance (26%),
drglementation (36 %), tat-providence (42 %), etc., ce qui nimplique pas ncessairement
incomptence mais, pour certains, sentiment dincomptence (peur de dire des btises, sentiment
dillgitimit, etc.). Lun de ses mots, cohabitation , suscite linverse seulement 8 % de sans
rponse mais seuls 31 % donnent ce mot un caractre politique et parmi ceux-ci seuls 10 %
disent le prsident dun bord, le Premier ministre de lautre . Sans surprise, lexprience na
jamais t renouvele dans la presse !

(2) Toutes les opinions se valent. La critique de ce postulat par Bourdieu comprend l
encore une dimension politique : en effet, Bourdieu reproche aux sondages daccorder le mme
poids aux personnes directement concernes par les questions du sondage avec des personnes qui
y sont indiffrentes. De mme, le sondage rend quivalent les individus explicitement mobiliss et

57
qui sexpriment dans lespace public et ceux qui ninterviennent pas. Les sondages tendent
oublier que les enjeux sociaux reposent sur des rapports de forces entre des collectifs et non sur
une simple agrgation dopinions individuelles. Cest une critique dj formule par les marxistes
contre le vote : le vote joue une fonction conservatrice puisquil fait appel aux majorits
silencieuses, peu politises et manipulables, partir dune procdure extrmement pauvre.

Sur un plan mthodologique, cette critique invite tre vigilant sur les contours de la
population enqute et donc de lchantillon. Qui doit tre interview ? Cela a-t-il du sens
dagrger des populations extrmement disparates du point de vue de leur proximit au sujet, de
leurs expriences, de leur connaissance, de leur potentiel de mobilisation ? Les rsultats ont-ils
alors une signification ? Ou ne sagit-il pas de donnes purement artificielles qui rassemblent des
chvres et des choux ?
Sondage IFOP-Acteurs publics (juillet 2006) : Diriez-vous que vous tes plutt daccord ou plutt pas
daccord avec la proposition suivante ? Il faut augmenter la dure lgale du travail.
Ensemble de la population Retraits Actifs
Plutt daccord 48 % 62 % 40 %
Plutt pas daccord 52 % 38 % 60 %
NSP 0% 0% 0%
En tout cas, si vous souhaitez recueillir lopinion de lensemble de la population, il faut
systmatiquement penser ajouter des variables permettant de trier lchantillon en fonction de
leur proximit au sujet. Par exemple, tout questionnaire sur lcole doit tre accompagn dans la
partie renseignements signaltiques de questions relatives la frquentation du systme
scolaire (parent dlves scolariss public / priv, niveau dtudes, etc.).

De la mme manire, il faut tre vigilant sur les questions relatives des pratiques (soit
pratiques effectives, soit pratiques potentielles). Prenons dabord les sondages prlectoraux : ces
derniers nont de relle valeur que peu de temps avant le scrutin. Les sondages raliss un an
auparavant posent problme car la majeure partie des sonds ne se sont pas encore investis dans
llection et placs en situation de choix : il ne sagit donc pas dintention, au sens o le sondeur
ne ferait quenregistrer des choix motivs. Donc le sondeur met en quivalence des attitudes qui
divergent fortement. Cest la mme chose concernant le potentiel protestataire. Il existe de
nombreux sondages qui demandent aux personnes si elles seraient prtes manifester, faire
grve, etc. Cela permet notamment de connatre le profil de ceux qui jugent ces attitudes lgitimes
(ou en tout cas qui ne les jugent pas illgitimes) mais cela ne permet pas de connatre le profil de
ceux qui rellement manifestent ou font grve. Une enqute pertinente sur le sujet doit donc
soprer non pas auprs dun chantillon reprsentatif de lensemble de la population mais sur
le terrain , cest--dire lors des manifestations.

58
(3) Il y a un accord sur les questions qui mritent dtre poses. Comment savoir
que les questions poses sont des questions que se posent rellement les personnes interroges ?
Ce qui est en revanche sr, cest que les questions poses sont les questions qui intressent les
commanditaires. Loutil nest donc pas neutre socialement et politiquement aux yeux de Bourdieu : les
problmatiques qui sont proposes par les sondages dopinion sont subordonnes des intrts
politiques, et cela commande la fois la signification des rponses et la signification qui est
donne la publication des rsultats. Les sondages peuvent donc tre analyss comme des
instruments proprement politiques dont la fonction consiste imposer lillusion quil existe une
opinion publique comme sommation dopinions individuelles, quil existe quelque chose qui
serait la moyenne des opinions ou lopinion moyenne. Le caractre artificiel du pourcentage a
pour fonction de dissimuler le fait que ltat de lopinion est le un systme de forces : ce nest pas
une sommation mais une opposition. Le rle politique des sondages sobserve particulirement
lorsque les hommes politiques sappuient sur les donnes denqute pour dire : lopinion
publique est avec nous . Le problme des sondages rside alors dans cette confusion entre des
opinions constitues, mobilises et des dispositions qui ne sont pas des opinions (= discours qui
peut se formuler avec une certaine prtention la cohrence). Cest cette opinion-l (celle admise
implicitement par ceux qui font des sondages dopinion) qui nexiste pas. Bourdieu critique donc
ce postulat pour des raisons politiques : il dnonce la capacit dimposition de problmatiques des
commanditaires des sondages. Dune certaine manire, il dnonce la capacit des acteurs
dominants dfinir quels sont les enjeux qui comptent et quelle est la manire de cadrer le
dbat autour de ces enjeux. On retrouve l encore une critique quivalente celles formules
contre le vote : la procdure est extrmement pauvre (juste un bulletin dans lurne, pas de mandat
impratif) et les lecteurs sont soumis aux alternatives proposs par les organisateurs du scrutin.
Ds lors, la prsentation de lenjeu tend bien souvent suggrer une rponse vidente
(parce que les arguments en prsence dans le dbat ne sont pas tous suggrs) : il y a un effet de
cadrage de la problmatique. Souvent, cet effet se produit lorsque on soumet les sonds une
alternative binaire qui oublie dautres positions ventuelles.
Sondage IFOP Mtro (juin 2007) :
Vous personnellement, si vous en aviez le choix, que prfreriez-vous ?
- Gagner moins dargent et avoir plus de temps libre 35 %
- Gagner plus dargent et avoir moins de temps libre 63 %
- NSP 2%
Or la question aurait pu tre formule de la sorte : Gagner plus dargent et avoir moins de
temps libre vs. Avoir plus de temps libre et gagner moins dargent ou bien Gagner plus
dargent et consacrer moins de temps sa famille vs. Gagner moins dargent et consacrer plus de
temps sa famille .

59
Enfin, les modalits proposes (cest--dire les rponses) tendent elles aussi conditionner lavis
des personnes. Il y a notamment de grandes diffrences entre les deux enqutes suivantes :
Sondage BVA-Le Figaro : Les syndicats de la SNCF et de la RATP appellent une journe de grve le jeudi 18
octobre pour protester contre la rforme des rgimes spciaux de retraite. Vous-mme pensez-vous que ce
mouvement est tout fait justifi, plutt justifi, pas vraiment justifi ou bien pas justifi du tout ?
Tout fait justifi 18 %
Plutt justifi 25 %
Pas vraiment justifi 24 %
Pas du tout justifi 31 %
NSP 4%

Sondage CSA-LHumanit : Vous savez que plusieurs syndicats de la SNCF, de la RATP, dEDF-GDF, de
lANPE, de lUNEDIC, de lducation nationale appellent une journe nationale daction et de grve le 18 octobre
prochain, notamment sur lavenir du systme de retraite et des rgimes spciaux. Quelle est votre attitude lgard de
ce mouvement ? Le soutien, la sympathie, lindiffrence, lopposition, et enfin lhostilit
Soutien 39 %
Sympathie 15 %
Indiffrence 17 %
Opposition 18 %
Hostilit 8%
NSP 3%

C. Mesurer la consistance des opinions. Ces exemples confirment que les rponses
recueillies dpendent beaucoup de la nature du questionnaire et de la manire dont les individus
vivent la situation denqute (se vivent-ils en situation dlve qui doit apporter de bonnes
rponses, cest--dire des rponses juges publiquement ou socialement dicibles ? Ou au contraire
profitent-ils du relatif anonymat de linterview pour noncer des opinions quils noseraient pas
livrer dans dautres circonstances ?).
Mais comment parvenir mesurer cette consistance des rponses, notamment lorsque les
questionnaires invitent les interviews exprimer leurs opinions ou rvler des comportements
privs ou secrets (vote, pratiques sexuelles, actes illgitimes ou illicites, etc.). Depuis les annes
1980, un certain nombre de recherches sefforcent de rpondre ces questions. Pour cela, elles
reposent sur un protocole exprimental. Mener une exprience consiste comparer deux
vnements que seule une dimension distingue. Il sagit de faire varier une variable ( toutes
choses gales par ailleurs ) et dobserver si cette variation pse sur les rsultats. En loccurrence,
en matire denqutes par questionnaire, ces expriences peuvent tre de deux natures :
Soit elles portent sur les effets des conditions dans lesquelles lenqute se droule (lieu de
lentretien, identit de lenquteur, etc.). Par exemple, lenquteur doit-il tre le plus effac
possible ou au contraire doit-il tre trs actif ?
Soit elles portent sur les effets du questionnaire lui-mme (lordre des questions ou leur
libell).

60
Ces recherches reposent sur la mthode du split. Le principe est de diviser lchantillon en deux
ou trois sous-chantillons dont la composition est identique. Chaque chantillon se voit proposer
une version diffrente du questionnaire ou alors une situation denqute spcifique.

(1) Les enqutes de Jean-Paul Grmy ralises en 1988 ont ainsi pu mettre jour
limportante proportion de rpondants flottants : ils rpondent mais sans disposer dun avis
vritablement solide sur le sujet de lenqute. Deux expriences permettent de le mettre jour.
Le problme de la rponse mdiane. Face une mme question, un premier chantillon
dispose de deux modalits (plus / moins) tandis que le second chantillon dispose de trois
modalits (plus / autant / moins).
Ltat devrait verser aux coles libres plus dargent quactuellement, [autant dargent quactuellement] ou moins
dargent quactuellement ?
- Plus 48 % 33,5 %
- Autant - 32 %
- Moins 19 % 14 %
- Sans avis 33 % 21 %
Cette exprience soulve le problme de lintensit de lopinion exprime. Les chercheurs sont
gnralement partags sur lide dintroduire une rponse mdiane comme celle-ci. Dun ct,
sans rponse mdiane, les interviews sont soumis une alternative binaire qui incite les hsitants
rpondre sans avis . De lautre, les rponses mdianes peuvent tre retenues par des
interviews sincrement convaincus du bien-fond de lactuelle distribution dargent public et
dautres indiffrents ou qui nont pas dopinions prexistantes lenqute : en somme, rpondre
autant est peu engageant (a ne mange pas de pain !). Il faut toutefois noter quil ny a pas de
modification de la distribution des rponses signifiantes (on reste dans les deux cas dans un
rapport de 70/30 entre les plus et les moins ).
La rponse sans avis. Lexprience consiste ici soumettre un premier chantillon la mme
question que prcdemment et placer un second chantillon face une question pralable
demandant si les personnes ont un avis sur la question (question filtre).
[En ce qui concerne largent que lEtat verse aux coles libres, avez-vous un avis sur la question ? Si oui,]
ltat devrait verser aux coles libres plus dargent quactuellement, autant dargent quactuellement ou moins
dargent quactuellement ?
- Plus 34 % 18 %
- Autant 31,5 % 21 %
- Moins 13 % 10 %

61
- Sans avis 22 % (pas de sans avis) 51 % (en filtre)
La majorit des chercheurs est favorable soit lutilisation dun tel filtre, soit la prsentation
explicite de la possibilit de ne pas rpondre, afin de diminuer le stress du rpondant. A nouveau,
si la distribution des rponses signifiantes volue (de 34/13 18/10), leur rapport varie peu (de
72/28 64/36).
Ces expriences montrent toutefois quau regard des 48 % dinterviews supposs
attendre de ltat davantage de moyens pour les coles publiques, lajout dun filtre et dune
rponse mdiane fait chuter cette proportion 18 %. Au-del de lide que les sondages
reposeraient sur des bases peu solides, il est surtout intressant de constater que ces rpondants
flottants ne se recrutent pas alatoirement dans lespace social : ils se distinguent des autres par
quelques traits sociologiques et notamment un plus faible niveau dinstruction. On peut alors se
demander, cest lhypothse de Grmy, si la rponse plus dargent nest pas survalorise car
apparaissant la plus conforme aux normes sociales (indpendamment du sujet en question).

(2) Lenqute mene par le CEVIPOF en 2000 porte sur lattitude des Franais lgard
de la dmocratie. Mais cette enqute rpond galement des enjeux mthodologiques : parvenir
mesurer la consistance des opinions exprimes par les interviews soumis au questionnaire.
Trois types dexpriences, inspires de travaux amricains, sont mens et prsentes par Nonna
Mayer (cf. article du livret) :
- Des expriences de mise en scne. Lenjeu est dviter dutiliser des notions
abstraites et dcontextualises. Il faut plutt raconter des petites histoires qui mettent en scne
les pouvoirs publics face aux problmes du moment puis de dcliner ces histoires en plusieurs
versions diffrentes. Lexprience consiste alors tester si les individus sorientent en fonction de
grands principes ou en fonction dun contexte. Par exemple, sagissant de lenseignement de
certains cours en langues trangres, les Franais se prononcent-ils sur lapprentissage de langues
diffrentes en gnral ou bien leur opinion varie-t-elle selon les langues en question ? Ici, cest la
seconde hypothse qui est la bonne : en effet, une majorit trouve normal que de tels cours
existent en breton (71 %), corse (66 %) ou portugais (54 %) mais cest une minorit qui adhre
la mme mesure lorsquil sagit de larabe (43 %).
- Des expriences dargumentation ou de contre-argumentation. Lenjeu ici
est de scarter de la neutralit habituelle et de fournir des arguments tirs des dbats du moment
pour tester le degr de conviction du rpondant. Il existe plusieurs variantes dans ce type
dexpriences. Lune dentre elle consiste poser une premire question puis, une fois la rponse
recueillie, soumettre linterview une contre-argumentation. Pour tester la solidit des

62
convictions, lchantillon est nouveau segment : une premire moiti fait face un argument
vide (si linterview change alors davis, cest uniquement par soumission lenquteur) tandis
que lautre moiti fait face un argument plein (si linterview change davis, cest soit par
soumission, soit par adhsion la contre-argumentation : on est alors davantage dans une
situation relle de formation et de construction des opinions, fondes sur lchange darguments
et parfois limposition dune vrit qui soumet les autres au silence)
Certains disent qu'il faudrait augmenter le montant des indemnits de chmage. Vous-mme, tes-
vous plutt d'accord ou pas d'accord du tout avec cette opinion ?
D'accord 54 %
Pas d'accord 46 %

A ceux qui ont rpondu d'accord :


D'accord Pas d'accord SR
Si les indemnits de chmage sont trop confortables, les chmeurs
ne seront pas encourags chercher du travail (puis reprise de la 60 37 3
question de dpart)
Si on pense tous les problmes que a pose puis reprise de la
81 15 4
question de dpart)

A ceux qui ont rpondu pas d'accord :


D'accord Pas d'accord SR
Avec les indemnits actuelles, il y a trop de familles qui n'arrivent
29 66 5
pas s'en sortir (puis reprise de la question de dpart)
Si on pense tous les problmes que a pose puis reprise de la
13 84 3
question de dpart)
Ici, 37 % de ceux qui taient favorables une augmentation des allocations chmage changent
davis face un argument contraire. Mais il faut surtout noter que ce changement davis est
fortement li au capital culturel, au niveau de diplme : ils sont 45 % chez ceux qui nont pas le
bac et 25 % chez ceux qui ont le bac.
On observe toutefois que lampleur de ces variations dopinion dpend du sujet test.
Ainsi, face une question relative lacceptation du port du voile islamique lcole, la
distribution des rponses demeure systmatiquement identique (autour de 70 / 30),
indpendamment des arguments utiliss pour justifier lune ou lautre des positions.
- Des expriences incitatives. Lexprience dite de la pommade enfin sert
tester le degr denracinement des opinions. Lenjeu est nouveau de quitter lhabituelle
neutralit et faire en sorte que linterview se sente suffisamment en confiance pour oser livrer
des prjugs souvent indicibles...

63
Version sans pommade : Nous arrivons la fin de l'entretien. Je voulais vous poser une dernire question.
Pensez-vous qu'il y a
trop de libert en France ?
trop de dmocratie en France ?

Version avec pommade : Nous arrivons la fin de l'entretien. Je voulais vous dire que j'ai beaucoup apprci
cet entretien et que vos rponses nous serons trs utiles. Finalement, ne pensez-vous pas, contrairement ce que l'on entend
souvent dire, que le vrai problme en France, c'est qu'il y a :
trop de libert ?
trop de dmocratie ?

Sans pommade Avec pommade cart


Libert
- Trop 28 40 +12
- Pas trop 70 57 -14
Dmocratie
- Trop 16 31 +15
- Pas trop 81 65 -16

Le problme ici, cest quil est difficile dinterprter les carts. En effet, certaines personnes sont-
elles mises en confiance par la pommade et expriment-elles alors des opinions quelles ne
revendiqueraient pas publiquement dans dautres circonstances ? Ou bien certaines personnes
cherchent-elles faire plaisir un interlocuteur qui sous-tend manifestement que la bonne
rponse est oui, il y a trop de libert ? Cet exemple est nanmoins intressant car il rappelle
quune exprience ne peut permettre de valider quune hypothse que si elle respecte la rgle dor
du protocole exprimental : ne faire varier quun seul facteur !

Section 3. Lanalyse des donnes statistiques


La production de donnes chiffres ne suffit videmment pas garantir la scientificit
dune enqute. Les statistiques nont en effet de valeur scientifique qu condition dtre articules
un raisonnement sociologique (qui ne se rduit pas des problmes purement techniques !).
Trois dimensions distinguent les approches sociologiques des simples comptages administratifs :
- Dabord, cest un rappel, le raisonnement sociologique implique une distance critique
par rapport aux donnes. Il faut tudier les conditions dans lesquelles elles ont t
recueillies, dterminer ce que les indicateurs mesurent rellement, etc.
- Ensuite, le raisonnement sociologique ne sarrte pas la description dun fait (par
exemple, le taux de chmage aujourdhui). Il sarticule des questions, si bien que le
travail prend un caractre scientifique quand les donnes permettent dtudier des
volutions (le taux de chmage dans le temps), deffectuer des comparaisons (le taux

64
de chmage dans diffrents pays), de distinguer des corrlations entre variables (le taux
de chmage des diffrentes PCS). Les statistiques ont un potentiel descriptif certain
mais elles ont aussi la capacit de mettre jour les relations objectives entre
phnomnes sociaux (par exemple, niveau de diplme et profession des parents, ge et
vote, etc.) : elles ont ce titre un potentiel explicatif.
- Enfin, le raisonnement sociologique ne se limite pas la simple mesure statistique,
mme lorsque celle-ci repose sur des outils mathmatiques complexes. Car si les
donnes quantitatives permettent de mettre jour des rgularits ou dtablir des
corrlations, elles ne permettent pas en elles-mmes dinterprter ces rgularits ou de
comprendre ces corrlations. Pour formuler des conclusions sociologiquement
pertinentes, il faut, le plus souvent, accompagner les lments chiffrs de modles
thoriques et denqutes de terrain de nature qualitative. On ne peut faire dire aux
donnes plus que ce quelles mettent jour !

1. La description des variables


La premire tape dans lanalyse des donnes statistiques consiste toujours dcrire les
rsultats pour chacune des variables tudies : lenjeu est didentifier les informations les plus
significatives, au regard notamment de la problmatique de lenqute. Par exemple, dans un
sondage ou une enqute par questionnaire, cela veut dire tudier la distribution des rponses
chaque question. Mais les principes de description varient selon la nature des variables.

(1) Principes de description des variables quantitatives. Rappelons que les variables
quantitatives sont des variables qui sexpriment sous la forme dune valeur mtrique (Philippe
Alonzo), autrement dit la variable sexprime sous une forme numrique, le nombre constituant la
valeur de la variable (valeur rapporte une unit de mesure). Lge, le revenu, le taux de
chmage (exprim en pourcentage), le produit intrieur brut, lindice des prix ou encore le
nombre denfants par femmes sont des variables quantitatives. Voici un exemple relativement
simple : lge des tudiants du master qui ont rpondu lenqute Les tudiants, les lections et
la politique (SPEL / CNRS / UPJV / UVSQ). Le corpus comprend 28 questionnaires remplis.
A cette question de lge, seuls 24 interviews ont correctement rempli le questionnaire. Lge
(mesurable partir du mois et de lanne de naissance) constitue la seule variable quantitative du
questionnaire.

65
ges Effectifs % brut % croissants % dcroissants
21 5 20,8% 20,8% 100,0%
22 5 20,8% 41,7% 79,2%
23 5 20,8% 62,5% 58,3%
24 3 12,5% 75,0% 37,5%
25 3 12,5% 87,5% 25,0%
28 1 8,3% 95,8% 12,5%
36 1 4,2% 100,0% 4,2%
Total 24 100,0% - -
Tableau. Rpartition des interviews selon lge

Comment dcrire les donnes du tableau ?


Dabord, lorsque la dispersion des valeurs est importante et nuit la lisibilit du tableau et
lidentification des informations, il est possible doprer des regroupements et dtablir des
classes dge. Ici, la variable ge ne comprenant que 7 valeurs, cette opration ne parat pas
indispensable (sauf, la rigueur, en regroupant les valeurs les plus leves 28 et 36 ans dans une
classe 28 ans et plus ).
Ensuite, il est souvent prcieux de transformer les donnes brutes en pourcentages. La
frquence relative de chaque valeur dans la population apparat alors de faon plus marquante
(car le poids en valeur absolu est peu significatif : 5 sur 28 parle moins que 21 % . Les
pourcentages permettent eux aussi doprer des regroupements. Parmi les regroupements
possibles, il peut tre utile de cumuler les pourcentages de faon croissante ou dcroissante : par
exemple, 62 % des tudiants ont 23 ans et moins et 58 % ont 23 ans et plus. tablir les
pourcentages permet notamment de faciliter la reprsentation graphique des donnes. Le choix
du graphique dpend l encore des hypothses et de la problmatique. Selon les cas, il peut tre
plus utile de constituer des histogrammes, des courbes ou des aires (camembert) :

66
Il existe ensuite dautres outils de description des donnes :
- Le mode = la valeur la plus frquemment distribue. Ici, cest 21, 22 et 23 ans.
- La moyenne = la valeur obtenue en divisant la somme des valeurs par le nombre dindividus.
Ici, cest 23,7 ans. Souvent, les moyennes sont biaises par deux paramtres. Dabord, la variable
ge est discrte et non continue (on na que les annes et non les annes et les mois il est
possible que les 23 ans soient plus proches de leur 24e anniversaire que de leur 23e). Ensuite, il est
frquent que les individus qui scartent trop de la norme soient regroups dans une seule
catgorie (par exemple, mettre les 28 ans et plus ensemble !), ce qui ne permet pas dtablir leur
ge exact.
- La mdiane = tendance centrale pour laquelle exactement la moiti des donnes se situent
au-dessus tandis que lautre moiti lui est infrieure. Ici, cest galement 23 ans.
Pourquoi faut-il distinguer moyenne et mdiane ? Parce que, comme le soulignent les
statisticiens de lINSEE, de nombreuses grandeurs conomiques sont limites vers le bas et non
vers le haut. Par exemple, le salaire horaire est limit vers le bas par le SMIC alors que certains
salaires peuvent tre trs levs. La moyenne est tire vers le haut par les salaires levs, mme
sils sont peu nombreux, et elle est pour cette raison gnralement suprieure la mdiane.
Par ailleurs, l'incertitude qui affecte les valeurs extrmes, en particulier les valeurs leves, se
reporte sur la moyenne mais n'affecte pas la mdiane. Celle-ci est de ce point de vue un indicateur
plus fiable. Par exemple, en France en 2008, le revenu disponible moyen mensuel par mnage est
de 2871 euros, tandis que le revenu disponible mdian mensuel par mnage est de 2380 euros. En
France en 2008, le revenu moyen mensuel par individu est de 1842 euros, tandis que le revenu

67
mdian mensuel par individu est de 1582 euros (source : INSEE). De la mme manire, en 2000,
la moyenne des patrimoines des mnages franais est de 100 000 euros, alors que le patrimoine
mdian est de 78 000 euros.
De telles disparits peuvent jouer un rle certain dans le dbat public : selon le champ de
rfrence (individu ou mnage ; revenus avant ou aprs impts ; etc.) et le type de mesure
(moyenne, mdiane), il est possible de lgitimer telle ou telle mesure pour son caractre
juste ou correspondant la moyenne ! Les dbats autour de la taxation du patrimoine ou
des successions mettent rgulirement en scne de tels affrontements.

- La variance = cart moyen entre la moyenne et les rsultats. V = (|moy-X1| + |moy-X2| +


|moy-X3| +...)/N. En loccurrence, la variance est ici de 2,13. Il est important en effet de ne pas
se proccuper seulement de la moyenne ou de la mdiane. Une mme moyenne peut en effet
renvoyer des ralits disparates. Dun ct, les valeurs peuvent tre toutes proches de la
moyenne et dessiner une population homogne. De lautre, la population peut tre extrmement
htrogne, la moyenne tendant masquer ces divergences ! Ltude de la variance est
notamment utile dans les tudes sur les revenus : elles peuvent fournir une premire indication
sur ltat des ingalits.

- Les quantiles : en plus de la mdiane, il est souvent prcieux didentifier les quantiles, cest-
-dire les valeurs qui divisent un ensemble dobservations en X parties gales . Les quartiles
impliquent 4 parties gales, les dciles 10 parties gales, les centiles 100 parties gales, etc. Chaque
groupe contient alors 25 %, 10 % ou 1 % des donnes. Ici, les bornes des quartiles sont 21-22
ans / 22-23 ans / 23-24,25 ans / 24,25-36 ans. Ce reprage des quartiles confirment la
concentration des individus autour des valeurs 22-24,25 ans !
Mais les quantiles sont surtout utiles pour saisir les ingalits de richesse et comparer
leurs volutions. Par exemple, tudions les revenus de lensemble des foyers et divisons ces foyers
en dix groupes de taille gale. Daprs lINSEE, en 2006, les 10 % des mnages les moins riches
dclarent moins de 1018 de revenus par mois (aprs impts et prestations sociales). A linverse,
les 10 % des mnages les plus riches dclarent plus de 4690 de revenus par mois. Le rapport
entre les deux est de 4690/1018 = 4,6. Il est alors possible dtudier lvolution de ce rapport
dans le temps ou bien entre pays afin dtudier lvolution des ingalits des revenus. Il est
galement possible de comparer les rapports inter-dciles entre eux pour identifier o rside la
principale cassure sociale. En loccurrence, en France aujourdhui, cette cassure rside
principalement entre le 9e et le 10e dcile : les 8 premires bornes sont beaucoup plus proches les

68
unes des autres que la 9e ! Thomas Piketty montre dailleurs que les ingalits sont encore plus
marques si ltude sintresse non plus aux dciles mais aux centiles (cest dailleurs les foyers
appartenant aux derniers centiles qui ont connu la plus nette envole des revenus depuis la
dernire dcennie : les 0,01 % des plus hauts salaires ont augment de 69 % entre 1998 et 2006,
soit un bonus mensuel de 34 000 euros en lespace de huit ans, cf. les travaux de Camille
Landais.).
Revenus dlimitant Diffrences entre dciles Rapports inter- Part du groupe dans
chaque dcile (en ) (en ) dciles la richesse nationale
10 % 1018 3,6 %
20 % 1308 290 0,65 5,3 %
30 % 1593 285 1,22 6,3 %
40 % 1913 320 1,2 7,2 %
50 % 2263 350 1,18 8,1 %
60 % 2641 378 1,17 9%
70 % 3051 410 1,15 10,1 %
80 % 3648 597 1,2 11,6 %
90 % 4690 1042 1,29 14,1 %
95 % 5974 - - -
100 % - - - 24,70%

Tableau. Revenus mensuels des mnages (en euros, aprs impts et prestations sociales).
Source, INSEE, 2006.

Enfin, plutt que sur les bornes inter-dciles, le calcul peut porter sur les revenus moyens au sein
de chacune des 10 fractions de population. Cela permet notamment de dessiner la courbe de
Lorenz : plus elle scarte de la diagonale et prend une forme exponentielle, plus les ingalits
sont prononces.

Courbe de Lorenz des revenus franais (2006)

69
Il est alors possible de mesurer le rapport entre les revenus moyens des deux fractions de
population aux marges de lespace social ou bien dobserver lvolution dans le temps de la part
du revenu des 10 % les mieux rmunrs dans le revenu national.

N.B. : Les indicateurs quantitatifs soulvent un problme spcifique : celui de la


pondration. En effet, les indicateurs agrgent des donnes diffrentes. Dans le cas de la
richesse, il est assez simple dagrger revenus du travail et patrimoine qui se cumulent
effectivement dans la vie de chacun. Parfois cependant, les diffrents lments qui composent un
indicateur ne psent pas la mme chose, rendant dlicat la constitution et la mesure de
lindicateur. Prenons deux exemples :
- La visibilit mdiatique : Chercheurs et spcialistes en communication analysent rgulirement
la mdiatisation des vnements, des mouvements sociaux ou des personnalits. Lanalyse peut
tre qualitative, tudiant les cadrages de lactualit et les apprciations positives ou ngatives
adresses aux protagonistes de la vie politique. Mais lanalyse peut galement tre strictement
quantitative, valuant la visibilit des acteurs dans les mdias. Seulement, comment mesurer cette
visibilit ? Dix secondes la radio valent-elles une interview pleine page dans les journaux ? Il est
possible daffecter chaque mention dune personnalit un coefficient correspondant laudience
moyenne du mdia. Chaque vocation est donc rapporte son poids en termes dampleur du
public. Mais comment diffrencier les mentions dans la presse crite selon quelles figurent en
une ou au cur dun article ? Selon quelles concernent tout un article ou une petite rfrence
dans une brve ? Cest l quintervient larbitraire du coefficient : on ne peut fixer de principes de
pondration objectifs au sens duniversellement accepts.
- Lindice des prix la consommation : L'indice des prix la consommation (IPC) est un
instrument de mesure de l'inflation labor par lINSEE. Il permet d'estimer, entre deux priodes
donnes, la variation moyenne des prix des produits consomms par les mnages. C'est une
mesure synthtique de l'volution de prix des produits, qualit constante. Publi chaque mois au
Journal Officiel, il joue un rle politique et social majeur puisquil sert indexer de nombreux
contrats privs, des pensions alimentaires, des rentes viagres et aussi revaloriser le SMIC.
L'indice retenu pour le SMIC est celui des mnages urbains dont le chef est ouvrier ou employ,
hors tabac . La constitution de cet indice est donc fondamental et suscite de nombreuses
crispations, notamment parce quil nest pas un indice du cot de la vie. Beaucoup le juge
inadapt. Pourquoi ?
Pour rpondre cette question, il faut dabord revenir sur les mthodes retenues par
lINSEE. Le plan de sondage est stratifi selon trois types de critres. (1) Gographique : les

70
relevs sont effectus dans 96 agglomrations de plus de 2 000 habitants disperses sur le
territoire mtropolitain et de toute taille ainsi que 10 agglomrations dans les DOM ; (2) type de
produit : un chantillon d'un peu plus de 1000 familles de produits, appeles "varits" est dfini
pour tenir compte de l'htrognit des produits au sein des postes. La varit est le niveau de
base pour le suivi des produits et le calcul de l'indice ; (3) type de point de vente : un chantillon
de 27 000 points de vente, stratifi par forme de vente, a t constitu pour reprsenter la
diversit des produits et modes d'achat des consommateurs et prendre en compte des variations
de prix diffrencies selon les formes de vente. Le croisement de ces diffrents critres aboutit
suivre un peu plus de 140 000 sries (produits prcis dans un point de vente donn) donnant lieu
prs de 160 000 relevs mensuels. A ces chiffres s'ajoutent environ 30 000 sries de type "tarif"
collectes de faon centralise. L'chantillon est mis jour annuellement pour tenir compte de
l'volution des comportements de consommation et, notamment, introduire des produits
nouveaux. Outre la composition de l'chantillon, les pondrations utilises pour agrger les 21
000 indices lmentaires (croisement varits x agglomration dans le cas gnral) sont galement
mises jour chaque anne. Ces pondrations reprsentent la part des dpenses associes
l'agrgat concern au sein de l'ensemble des dpenses de consommation des mnages couvertes
par l'indice. Elles sont obtenues, pour la plupart, partir des valuations annuelles des dpenses
de consommation des mnages ralises par la Comptabilit Nationale. Des traitements
spcifiques sont effectus pour les produits frais, les autres varits saisonnires, les varits
tarifaires et pour dterminer des volutions de prix "pures", qualit constante, lorsqu'un produit
disparu est remplac en cours d'anne par un autre. Les promotions et soldes offerts tous les
consommateurs sont pris en compte. L'IPC couvre l'ensemble des biens et services marchands
consomms sur le territoire, par les mnages rsidents et non-rsidents (comme les touristes).
Son champ thorique se dfinit comme celui de la consommation finale effective marchande
montaire des mnages. Les principaux dfauts de couverture portent encore sur certains types
d'assurances, les services hospitaliers privs, les jeux de hasard et l'assurance vie. (INSEE)
Pondration
Fonctions de consommation en 2009
(en %)
PRODUITS ALIMENTAIRES ET BOISSONS NON ALCOOLISES
14,99
BOISSONS ALCOOLISES ET TABAC 3,27
HABILLEMENT ET CHAUSSURES 4,93
AMEUBLEMENT, QUIPEMENT MNAGER ET ENTRETIEN COURANT DE LA
6,17
MAISON
SANTE 9,96
COMMUNICATIONS 2,99
LOISIRS ET CULTURE 9,20
EDUCATION 0,24
HTELLERIE, CAFS, RESTAURATION 6,78

71
AUTRES BIENS ET SERVICES 11,58
LOGEMENT, EAU, GAZ, LECTRICIT ET AUTRES COMBUSTIBLES 16,32
TRANSPORT 13,57
ENSEMBLE 100

Chaque bien est affect dun coefficient qui correspond sa part dans le budget des mnages. La
controverse tient ce que cette proportion nest pas la mme pour tout le monde : tout le monde
ne consomme pas la mme chose et dans les mmes proportions. Pour un mnage modeste, la
part du logement dans le budget est beaucoup plus lev que pour les mnages plus riches (plus
de 30 % pour les 20 % les plus pauvres, contre moins de 10 % pour les 20 % les plus riches).
Lindice des prix la consommation ne peut donc servir valuer lvolution du pouvoir dachat.
Un tel usage aurait dautant moins de sens que les problmes de pouvoir dachat tiennent, dune
part, autant la question de lvolution des revenus qu celle de lvolution des prix et que,
dautre part, ces difficults concernent avant tout certaines catgories de la population : cela a-t-il
un sens de mesurer une volution moyenne du pouvoir dachat ?

(2) Principes de description des variables nominales.


Professions et catgories Proportion (pour mille
Nombre (en milliers)
sociales (PCS) actifs)
Agriculteurs exploitants 1 475 63
Artisans, commerants et
1 835 78
chefs d'entreprise
Cadres et professions
1 895 81
intellectuelles suprieures
Professions intermdiaires 3 971 169
Employs 6 247 265
Ouvriers 7 749 329
Chmeurs n'ayant jamais
353 15
travaill

Population active 23 525 1 000

Tableau 1. Structure de la population active en 1982.

72
2. Lidentification des corrlations statistiques
Jusquici, nous avons analys chaque variable isolment afin den dgager les informations
principales. Mais lintrt de lobjectivation statistique est aussi de mettre en relation deux
variables et de voir sil y a ou non corrlation ou encore lien dinterdpendance. Prenons un
exemple fictif : une enqute mene auprs dun chantillon dtudiants franais dont lenjeu serait
notamment de saisir les liens entre le type de baccalaurat (Variable 1) et le type dtudes
suprieures (Variables 2). Ces deux variables sont nominales et comprennent chacune trois
modalits : il y a donc neuf croisements possibles. 1000 tudiants sont interviews : tous sont
issus soit dun bac gnral , soit dun bac techno. Le tableau crois ci-dessous indique la
distribution des interviews pour chaque variable.

Classe prpa IUT / BTS Universit Ensemble


Bac S 40 20 40 100
Bac ES L 50 190 160 400
Bac techno 10 90 400 500
Ensemble 100 300 600 1000

73
Tableau 1. Distribution de la population tudiante selon le baccalaurat et la filire de
l'enseignement suprieur (donnes fictives)

Comment identifier et mesurer les ventuelles corrlations entre ces deux variables ? Lune des
solutions consiste tablir ce que serait la distribution sil y avait indpendance entre variables,
autrement dit si laffectation des tudiants reposait sur le seul hasard et non sur leur bac dorigine.
Ainsi, parmi les 100 interviews qui intgrent une classe prparatoire, il faut retrouver la mme
distribution de bac dorigine que pour lensemble de la population. Les bac techno forment la
moiti des interviews (500/1000) : ils doivent alors former la moiti des tudiants de classe
prpa, soit 50/100. 50=100*(500/1000) ou 50=500*(100/1000).

Classe prpa IUT / BTS Universit Ensemble

Bac S 10 30 60 100

Bac ES L 40 120 240 400

Bac techno 50 150 300 500

Ensemble 100 300 600 1000

Tableau 2. Distribution thorique selon l'hypothse d'indpendance des variables (donnes fictives)
Sans surprise, les rsultats des tableaux 1 et 2 divergent sensiblement : il y a cart
lindpendance donc lien de dpendance donc corrlation statistique entre variables.

Classe prpa IUT / BTS Universit Ensemble

Bac S +30 -10 -20 0

Bac ES L +10 +70 -80 0

Bac techno -40 -60 +100 0

Ensemble 0 0 0 0

Tableau 3. carts la distribution thorique (donnes fictives)

Comment lire ces carts et convertir ces informations chiffres en informations


sociologiques ? Une lecture possible consiste dire que les titulaires du baccalaurat S sont
statistiquement surreprsents parmi les tudiants des classes prparatoires, alors qu linverse ils
sont sous-reprsents parmi les tudiants des filires courtes ou des filires universitaires. Une
autre lecture possible consiste dire les titulaires du baccalaurat S ont statistiquement plus de

74
chances daccder aux classes prparatoires que les tudiants des autres baccalaurats. Deux
petites remarques supplmentaires :
- Dabord, ce nest pas une surreprsentation dans labsolu : ils sont par
exemple moins nombreux que les titulaires des Bac ES et L. Cest une
surreprsentation par rapport leur effectif total.
- Ensuite, les rsultats nont de sens que dans la comparaison, que dans une
perspective relationnelle : les titulaires du Bac S sont surreprsents par
rapport aux titulaires dautres bac.

Le tableau 3 permet de mettre en vidence un lien de dpendances entre les deux variables : lune
dpend statistiquement de lautre. Les tudes suivies dpendent du type de bac. Variables
indpendante (type de baccalaurat) variables dpendantes (tude choisie). Ici, le lien de
corrlation est de type causal : lun dtermine lautre car lun est antrieur lautre.
Le tableau 3 nest quun point de dpart. En ltat, on ne peut rien dire de plus que
constater cette corrlation. Le travail doit tre poursuivi. Dune part, il faudrait mobiliser des
outils mathmatiques plus sophistiqus pour tablir quelle est lampleur de la corrlation (analyses
de rgression ou analyses factorielles). Dautre part, il faut essayer dexpliquer ou dinterprter ce
lien entre les deux variables, cest--dire suggrer des hypothses sociologiques et les vrifier.

3. Linterprtation des corrlations


Comment expliquer ces liens statistiques entre baccalaurat et tudes ? Dun ct,
la relation est directe : les personnes charges de recruter les lves en classes prpa ou dans les
filires courtes sappuient explicitement sur le critre du bac. Ce nest pas le seul pris en compte
mais il est souvent dterminant. Leffet de la variable indpendante sur la variable dpendante est
ici direct ! Mais dun autre ct, la variable type de baccalaurat dpend elle aussi de nombreux
facteurs sociaux (il ny a pas non plus de hasard sociologique dans laffectation des lves au
lyce). Elle dissimule dautres variables susceptibles dexpliquer lorientation dans les tudes :
le milieu social dorigine, le sexe, le capital culturel des parents, etc. A travers ce deuxime registre
explicatif, la relation entre les deux variables est indirectes : elles sont toutes deux dtermines par
une mme cause.
Lexemple choisi ici est simple. Mais il renvoie un problme rgulier et souvent plus
complexe rsoudre : comment expliquer ou interprter les corrlations statistiques mises
jour ? Il nest pas toujours ais de dterminer quelle variable est dpendante de lautre ! Il y a en
fait trois principaux scnarios explicatifs :

75
- Causalit : Une variable agit directement sur la seconde variable et produit un
effet (Philippe Alonzo).
- Concomitance ou cooccurrence : Nature du lien entre deux variables
prsentant un rapport de simultanit, souvent sous linfluence dune troisime variable .
(Philippe Alonzo) Autrement dit, les deux variables ont une mme cause. Pour prendre des
exemples triviaux mais parlants, pensons au lien entre sexualit aprs 65 ans et esprance
de vie : toutes deux sont dtermines par une tierce variable : la bonne sant. Autre
exemple trivial : la corrlation aprs 1945 entre consommation de bire en Californie et la
mortalit infantile au japon (la variable cache est ici un front caniculaire sur le Nord
Pacifique). Enfin exemple plus srieux : le lien entre race et QI aux tats-Unis. En fait, la
variable race masque une variable autrement discriminante : la position dans lespace
social A ce titre, lindicateur du QI lui-mme est problmatique parce quil dtermine
non pas ce que serait objectivement lintelligence mais la capacit rsoudre des problmes
qui figurent dans les programmes scolaires (dfinis donc par les catgories dominantes).
- Interdpendance : Nature du lien entre deux variables dont les variations sauto-
entretiennent. Un exemple assez simple : la conversion rciproque entre capital
conomique et capital culturel.
Il faut donc tre particulirement vigilant dans linterprtation de corrlations
apparemment videntes. Les trois exemples suivants renvoient trois difficults rcurrentes.

(1) La corrlation entre ge et suicide : effet dge ou effet de gnration ?


Le premier exemple est nouveau emprunt mile Durkheim. Celui-ci met en relation
deux variables : le taux de suicide des hommes clibataire en France entre 1889 et 1891 et lge.
Pourquoi indique-t-il une proportion (nombre de suicides pour un million de clibataires) plutt
que le nombre de suicids par classe dge en valeur absolue ? Tout simplement parce que les
classes dges ne sont pas homognes en taille. La conversion du nombre brut en proportion
permet de neutraliser leffet de cette htrognit.

76
Tableau 6. Taux de suicide moyen selon l'ge (hommes clibataires, France 1889-91).
(source : mile Durkheim, Le Suicide, 1987)

La lecture du tableau met en vidence un effet vident de lge sur le taux de suicide des hommes
clibataires. Ce taux progresse de faon continue (sauf pour la dernire classe dge). Mais
lorsquon convertit ce tableau en graphique merge une autre reprsentation de la corrlation
entre ge et taux de suicide des hommes clibataires : la progression du taux de suicide avec lge
nest pas seulement rgulire, elle est linaire !

Schma 2. Taux de suicide moyen selon l'ge (hommes clibataires, France 1889-91).
(source : mile Durkheim, Le Suicide, 1987)

Comment interprter ce graphique ? A premire vue, cela parat mettre en vidence un


effet dge . Pourtant il pourrait y avoir une seconde interprtation : il pourrait sagir dun
effet de gnration , cest--dire que ce nest pas tant lge qui serait dterminant mais la date
de naissance. Chaque gnration nat et grandit dans un contexte singulier ; les principes ducatifs
voluent ; les perspectives sociales galement. Autrement dit, la plus ou moins grande
permabilit au suicide pourrait rsulter de socialisations spcifiques : le taux de suicide dune
mme gnration ne varierait alors pas ou peu dans le temps.
Comment rsoudre ce dilemme ? Il faudrait oprer la mme tude sur une autre priode.
Les dates dobservation ne seraient plus 1889-91 mais 1910-12 par exemple. Soit la corrlation est
inchange et les deux graphiques sont trs ressemblants : dans ce cas, cest clairement leffet dge
qui prdomine. Soit les deux courbes sont parallles (du moins sur les gnrations vivants aux
deux priodes denregistrement) : dans ce cas, cest clairement leffet de gnration qui
prdomine. Il faudrait dailleurs sassurer que le lien entre ge et taux de suicide se vrifie dans
dautres configurations sociohistoriques. Si cest le cas, il est possible dtablir une thorie

77
gnrale. Sinon, cest une thorie rgionale qui peut tre tablie : lge ne pse sur la
probabilit de se suicider que dans un contexte donn (il y a donc congruence de facteurs).

(2) La prsence au but comme variable cran


Le deuxime exemple est fictif. Imaginez une quipe de football dans laquelle lensemble
des joueurs tournent au poste de gardien. Or, ds que lun des joueurs est gardien, lquipe de
ne prend plus de but. Pourquoi ? La raison la plus gratifiante pour ce joueur est de considrer
quil est le meilleur gardien de lquipe. Toutefois, une seconde hypothse est moins glorieuse
pour lui : il nest plus sur le terrain et ne handicape plus son quipe.
Pour dterminer laquelle des deux hypothses est la plus pertinente et ainsi interprter la
corrlation, il faudrait largir lespace dobservation et inclure dautres variables comme le nombre
de tirs au but de ladversaire. Si celui-ci est inchang voire augmente, cest alors clairement
lhypothse des qualits du gardien quil faut retenir. Si celui-ci diminue, cest lautre interprtation
qui semble la plus juste. On pourrait aussi imaginer un dispositif exprimental et voir comment
les choses se droulent lorsque le joueur nest ni sur le terrain, ni dans les buts. Soit lquipe se
prend toujours rgulirement des buts : dans ce cas, cest la qualit du gardien qui est la variable
explicative. Soit elle ne se prend plus (ou moins) de buts : dans ce cas, cest sa prsence dans le
jeu qui est la variable explicative.

(3) Salaires du public et salaires du priv : les effets de structure


Une corrlation suscite frquemment de vigoureuses polmiques : le lien entre statut
dactivit (variable 1) et salaire (variable 2). Ainsi, il semble apparemment tabli que les salaris du
secteur public gagnent plus que leurs collgues du priv. En 2006, le salaire net annuel moyen de
lensemble de la fonction publique dtat tait de 26 182 euros (soit un peu de moins de 2200
euros par mois), tandis que lquivalent pour les salaris du priv tait de 23 261 euros (soit un
peu plus de 1900 euros par mois). Le rflexe est alors didentifier un lien de causalit : la cause
dun tel cart rsulterait simplement du fait qu on est mieux pay dans le priv que dans le
public . Quel est le problme dune telle interprtation ?
En fait, la comparaison de ces salaires moyens na pas beaucoup dintrt. Dune part,
parce que la moyenne, on la vu, ne nous dit pas grand-chose de la distribution des salaires.
Dautre part, parce quon ne compare pas ici des populations identiques ! Les carts tiennent en
fait un effet de structure : la structure des deux populations nest pas la mme au regard de
deux variables dterminantes sur le salaire :

78
- Le niveau de qualification moyen est bien plus lev dans la fonction publique
dtat que dans lensemble du secteur priv : les emplois proposs sont alors
plus qualifis. Cest donc niveau de diplme gal ou catgorie
socioprofessionnel gal quil faudrait oprer la comparaison.
- Lge moyen est plus lev dans la fonction publique dtat que dans le
secteur priv. Idem : comparaison pertinente classe dge. (Voir graphiques)
Autrement dit, si lon souhaite revenir sur une comparaison globale des salaris du public et du
priv, celle-ci nest possible qu condition que toutes choses soient gales par ailleurs . Il faut
donc faire comme si la structure des deux tait identique, afin dliminer le bruit (le bruit tant
ici les divergences dans la distribution des ges et des niveaux de qualification).

79

Vous aimerez peut-être aussi