Vous êtes sur la page 1sur 79

UNIVERSITE VERSAILLES SAINT-QUENTIN M1 SCIENCES POLITIQUES 2010/2011.

COURS DE NICOLAS KACIAF

Mthodes des sciences sociales 2. La quantification du monde social

INTRODUCTION GENERALE : Les mystres de la quantification


1. Lomniprsence des chiffres
Indicateurs statistiques, mesures chiffres et autres sondages dopinion sont aujourdhui omniprsents dans le dbat public. La liste est longue de ces donnes qui peuplent les comptesrendus mdiatiques et qui servent de socle aux arguments changs entre acteurs politiques : taux de chmage, points de croissance du produit intrieur brut, volution de la mortalit sur les routes, popularit du prsident de la Rpublique et de ses ministres, chiffres de la dlinquance, position des Universits franaises dans le classement de Shanghai ou dans tous les autres ranking valuant la performance des systmes ducatifs, taux dinflation, indicateurs dvolution du pouvoir dachat , part des Franais sous le seuil de pauvret, ge moyen du premier rapport sexuel, pourcentages daudience respectives des chanes de tlvision, palmars des hpitaux les plus srs, distribution des prnoms les plus frquemment donns chaque anne, etc. Mais les donnes statistiques ne servent pas seulement nourrir les discussions politiques. Elles sont au cur de lactivit de travail de trs nombreux secteurs conomiques. Dans les entreprises prives, les services et les salaris sont ainsi valus partir dindicateurs qui mesurent leur performance (productivit, valeur ajoute, marge oprationnelle, etc.). Mais cette valuation quantitative de lactivit concerne galement de plus en plus le secteur public. Aujourdhui, chaque service administratif doit satisfaire un certain nombre dobjectifs chiffrs, prciss dans le projet de loi de finances ( travers les indicateurs de la LOLF - Loi organique relative aux lois de finance), et qui peuvent servir dinstruments de comparaison de lefficacit du travail men et de

la bonne utilisation de largent public. Cette omniprsence des donnes chiffres semble traduire une tendance actuelle gouverner par les nombres . Une premire question se pose alors : pourquoi les chiffres sont-il ce point omniprsents dans le dbat public et dans un nombre croissant de secteurs sociaux ? Pour le dire autrement, sur quoi repose la force du chiffre ? Quatre hypothses, convergentes, peuvent tre souleves : (1) La force des chiffres tout dabord, cest leur apparente impartialit, neutralit, objectivit, scientificit. Dun point de vue politique, lutilisation rcurrente de telles donnes sarticule bien avec lide que, dsormais, lEtat (ou tout autre institution) doit tre gouvern de faon apolitique, sans idologie mais avec pragmatisme, avec pour seul objectif de produire du rsultat et dtre donc performant , ce que des indicateurs chiffrs pourraient objectivement mesurer. (2) Deuximement, lautre avantage des chiffres , cest leur communicabilit qui tient notamment leur apparente simplicit. Pour les mdias, un pourcentage constitue une information courte, lisible et utile pour cadrer un article ( Le chmage baisse de 3 % , la dlinquance recule de 9 % , X % des enfants quittent le primaire sans savoir ni lire ni crire ). De la mme manire, tableaux, graphiques et autres infographies chiffres offrent une commodit de lecture prcieuse pour les dirigeants dans les mondes politiques, administratifs, conomiques qui souhaitent disposer dinformations rapides lire et mmoriser. Ou encore, comme le souligne la politiste Isabelle Bruno, le chiffre est utile dans un espace comme lUnion europenne : il facilite la communication entre des interlocuteurs parlant une vingtaine de langues diffrentes. (3) Un troisime avantage des chiffres , cest leur comparabilit. En effet, les donnes chiffres permettent assez facilement la comparaison dans lespace (entre pays, entre dpartements, entre salaris, entre services, etc.) ou dans le temps (volutions). (4) Enfin, et cest sans doute le point le plus important, un dernier avantage des chiffres rside dans leur capacit rendre visible ce qui est invisible lil nu. Je vais y revenir.

2. Des donnes qui ne vont pas de soi


Pour ces diffrentes raisons, les donnes quantitatives sont dsormais incontournables sur nimporte quel sujet, dans nimporte quel secteur. Mais si les indicateurs sont omniprsents, ils sont aussi frquemment critiqus ou contests. On ne compte plus en effet les controverses relatives aux chiffres officiels et leur utilisation par le pouvoir politique. Cf. quelques exemples connus et sur lesquels vous aurez loccasion de travailler, notamment en TD : les 2

statistiques du chmage ; les chiffres de la dlinquance ; lvolution du pouvoir dachat des mnages ; la fixation du seuil de pauvret ; les sondages mesurant la popularit des mesures gouvernementales ; la mesure des discriminations face linterdiction de collecter des informations sur lorigine ethnique des individus ; la comparaison internationale des systmes ducatifs ou des performances de la recherche ; etc. Les critiques adresses aux sondages dopinion ou aux statistiques officielles sont utiles parce quelles rappellent quil ne faut pas tre naf face des donnes et ne pas les prendre pour argent comptant. Mais elles posent souvent problmes parce quelles sont mal formules. En effet, on entend souvent dire que les statistiques du chmage sont fausses , que les chiffres de la dlinquance sont truqus ou encore qu on peut tout faire dire aux chiffres Si on prend lexemple du chmage, cette critique laisse entendre quil existerait un vrai nombre de chmeurs et que les statistiques ne donneraient pas ce vrai chiffre. Bien sr quil y a des cas flagrants de manipulations politiques. Bien sr galement que les statisticiens font parfois des erreurs grossires. Mais il faut adopter un autre point de vue. La bonne perspective face aux statistiques du chmage, ce nest pas seulement de se demander si elles sont vraies ou fausses comme sil existait dans la nature un vrai nombre de chmeurs que lon pourrait cueillir comme on cueille une pomme sur un arbre. La bonne perspective, cest plutt de se demander : quest-ce que ces donnes veulent dire ? Quest-ce que ces donnes refltent et quest-ce quelles ne refltent pas ? Quest-ce quelles donnent voir et quest-ce quelles laissent dans lombre ? Que peut-on donc en dduire ? Cela suppose donc de soulever un autre type de problmes : comment les donnes ont-elles t recueillies ? Quelle a t la mthode ? Quest-ce qui est effectivement mesur ? Qui a effectu cette mesure (un service administratif, des chercheurs, un cabinet daudit, etc.) ? Et dans quel intrt ? Ainsi, pour reprendre lexemple des statistiques du chmage, les chiffres les plus couramment donns dans les mdias nindiquent pas rellement le nombre de personnes sans emploi mais le nombre dinscrits au Ple emploi dans une catgorie donne, ce qui est sensiblement diffrent. De la mme manire, les donnes fournies par le ministre de lIntrieur en matire de dlinquance nindiquent pas le niveau de dlinquance mais elles indiquent le nombre de faits supposment dlictueux ou criminels constats par les services de police. Je suis schmatique ici car ces comptages sont un peu plus complexes on y reviendra. Autrement dit, lune des postures lgitimes face cette avalanche de chiffres est doprer un travail de dconstruction. En effet, ces donnes sont naturalises, au sens o il parat naturel aujourdhui de disposer du taux de chmage mensuel sur lensemble du territoire national, o il parat naturel de disposer de la mesure de la dlinquance (comme sil y avait une chose homogne qui sappelait la dlinquance et qui regrouperait des infractions routires, des vols, des

viols, des meurtres, des dtentions de produits stupfiants, etc.), o il parat naturel de mesurer chaque mois la popularit du Prsident de la Rpublique dans lopinion publique (au singulier). Dire quelles sont naturalises, cela signifie quon sy habitue au point de croire que le niveau de chmage, la dlinquance ou la popularit du Prsident existeraient indpendamment de leur mesure (je rpte : dans cette perspective, la mesure ne ferait que cueillir ce qui existe dans la ralit). Or ces donnes, ces chiffres , ces mesures ne vont pas de soi ! Elles reposent sur des constructions, des constructions mthodologiques et intellectuelles. - Dabord des constructions mthodologiques. Toute quantification suppose la mise en place dinstruments de mesure. Et pour que les rsultats soient scientifiquement solides, quils aient une certaine pertinence, il faut une vritable rigueur mthodologique : rigueur dans le recueil des informations (ce sont les techniques denqute comme les techniques dchantillonnage), rigueur dans le traitement statistique des informations (ce sont les outils mathmatiques quutilisent les statisticiens), rigueur dans lanalyse des rsultats et dans les conclusions (ce sont les thories sociologiques qui rendent les rsultats significatifs). - Les donnes quantitatives soulvent donc plus que de simples problmes techniques. En effet, elles reposent aussi sur des constructions intellectuelles. Cela ne va pas de soi de tout vouloir mesurer, compter et rduire quelques indicateurs. Par exemple, cela ne pas de soi, idologiquement parlant, dvaluer et de comparer la qualit des systmes ducatifs en sappuyant sur des indicateurs chiffrs comme le taux de lecture lentre dans le secondaire, le niveau en mathmatique, le nombre denfants qui sortent du systme sans diplme, etc. La gnralisation des classements ou du benchmarking est le produit dun contexte social et politique particulier : ce nest pas une volution ncessaire de lespre humaine ! Cela ne va pas de soi non plus de mesurer lopinion publique en faisant la somme des opinions individuelles et en acceptant que lopinion dun grand bourgeois vaut autant que lopinion dun proltaire. Pour accepter ce principe dquivalence gnralis (tous les individus ont la mme valeur, statistiquement parlant), il a fallu plusieurs sicles de dmocratisation. Une telle convention intellectuelle serait par exemple impensable dans une socit organise en caste ou dans des socits traditionnelles dans lesquelles le chef de famille peut parler au nom de lensemble de sa maisonne. Les techniques denqute et les manires de compter ne sont donc pas neutres : elles traduisent un point de vue sur le monde.

3. Les objectifs du cours


Ce cours de mthode des sciences sociales repose alors sur deux problmatiques qui refltent lambigut de la quantification : - Dun ct, on considre ici les outils statistiques comme de formidables outils de description et danalyse scientifique du monde social ( condition davoir t rigoureusement. La quantification est souvent un instrument indispensable pour dchiffrer le monde qui nous entoure et pour rendre visible une ralit invisible par lobservation humaine (ne sont visibles que des cas individuels). Les donnes statistiques sont des reprsentations qui donnent voir un autre niveau de ralit que la ralit exprimente par chaque individu. On y reviendra dans le premier chapitre. - Dun autre ct, on considre aussi la production statistique comme une ressource de pouvoir et de domination. Dailleurs, tymologiquement, la statistique est issue du mot Etat (StaatState). Historiquement, la statistique publique est ne dans un contexte de centralisation tatique : cest un instrument de pouvoir, un instrument de contrle de lEtat sur la socit. De la mme manire, les enqutes marketing, ce sont des instruments dcisifs dans les mains des entreprises prives. On reviendra sur cette question des usages de la quantification dans le chapitre trois. Dun point de vue pdagogique, ce cours vise donc satisfaire trois objectifs : (1) Dabord, le premier objectif est pratique. Puisquil sagit dun cours de mthodes des sciences sociales consacr plus prcisment aux mthodes dites quantitatives , le premier enjeu est de vous apporter un certain nombre de ficelles (H. Becker) pour vous permettre dlaborer une enqute statistique, de participer son laboration ou dtre capable de prendre de la distance et dvaluer la pertinence scientifique dune enqute que vous aurez sous les yeux. videmment, il est impossible en si peu de temps dentrer dans les dtails techniques. Il nest pas non plus judicieux de vous apprendre appliquer mcaniquement un catalogue de recettes toutes faites (parce que, je rpte, les mthodes ne sont pas neutres). De toute faon, seule une minorit dentre vous se destine la recherche et / ou une activit professionnelle qui vous amne devoir produire vous-mme des donnes statistiques. Lenjeu nest donc pas de faire de vous des techniciens du questionnaire, des sondages ou des calculs mathmatiques. En revanche, il est fort probable que vous allez tous tre confronts des donnes quanti dans votre vie professionnelle. Si vous tes journalistes, communicants, fonctionnaires dans une collectivit locale, assistant dlu, etc., vous risquez davoir affaire en permanence des donnes chiffres. Et le but du jeu, cest que vous soyez capable de les comprendre et de savoir si elles reposent sur des

enqutes scientifiquement solides . Do le terme de ficelles , cest--dire quelques rflexes intellectuels, quelques trucs mthodologiques garder en tte pour au moins savoir lire une tude, interprter un sondage, bricoler quelques calculs statistiques, bref ne pas tre dmuni face des statisticiens, des chercheurs ou des prestataires plus aguerris ! (2) Ensuite, le deuxime objectif est de vous apporter un regard critique sur les donnes quantitatives. Critiquer ne signifie pas remettre en cause, mais tre capable de discerner les limites et les apports dune enqute, en tant que professionnel certes, mais aussi en tant que citoyen. Lenjeu est de rappeler quau-del de la plus ou moins grande rigueur mthodologique, chaque technique de recueil dinformations comporte un certain nombre de limites indpassables quil faut connatre pour ne pas faire de mauvaises interprtations des donnes. Quelles sont donc les deux principales limites des mthodes quantitatives ? Premirement, il faut avoir en tte que toute quantification appelle une simplification du rel, un appauvrissement de la diversit du rel. Par exemple, si vous voulez mesurer le nombre de chmeurs, un moment donn, vous devez dfinir qui est chmeur et qui ne lest pas, donc tablir des frontires fixes, alors que dans la ralit, vous avez une multitude de cas de figure. Est-ce que les personnes qui travaillent temps partiel mais qui souhaiteraient travailler temps plein sont des chmeurs ? Est-ce que les personnes qui ont arrt de chercher du travail parce quelles sont dcourages ou trs proches de la retraite sont des chmeurs ? Etc. Autrement dit, toute quantification suppose de faire rentrer les personnes, les situations, les opinions, les pratiques dans un nombre restreint de cases , de catgories . La deuxime limite dj voque, cest que le rsultat dpend toujours en partie de linstrument dobservation, denqute, de mesure. Chaque technique tend se focaliser sur un aspect particulier de la ralit. Selon les mthodes choisies, vous ne mettez pas en vidence la mme chose. Pour illustrer ce point crucial pour lensemble des sciences, prenons lexemple de lobservation. Selon le niveau dobservation, vous ne dcouvrez pas les mmes phnomnes : particules lmentaires, atomes, molcules, cellules, organes, corps humain, interactions familiales, occupation de lespace (gographie), plaques tectoniques (gologie), plante, systme solaire, galaxie, amas, univers. Pour revenir la quantification du monde social partir dun exemple trivial, il va de soi que la reprsentation de la dlinquance est diffrente si elle est taye par la mesure de lactivit policire ou si elle sappuie sur des enqutes de victimisation (cf. textes de Bruno Aubusson dans le livret de TD), si elle est mesure partir de statistiques recueillies lchelle internationale ou tudie partir dune enqute de terrain dans un quartier donn. Autrement dit, il faut toujours garder en tte que les donnes ne sont pas naturelles mais quelles sont en permanence construites par lenquteur et par ses choix de mthodes.

(3) Le troisime objectif est danalyser les enjeux politiques et sociaux sous-jacents la production statistique. Cela suppose donc de dplacer le regard et de ne plus seulement considrer la statistique comme un instrument de connaissance du monde mais aussi comme un domaine explorer, un objet de sociologie politique, un fait social et historique . Il sagit donc de sarrter sur les usages de la quantification, afin notamment de comprendre lmergence et la gnralisation de ces techniques de gouvernement. Que signifie compter dans nos socits dmocratiques ? Qui est le commanditaire dune enqute, quel est son intrt et comment peut-il influer ou non sur les rsultats. Le problme majeur des enqutes quantitatives, cest souvent leur cot norme. Donc les financeurs de ces enqutes sont le plus souvent des institutions dominantes dans la socit (les institutions publiques bien sr, mais galement les trs grandes entreprises, les principales entreprises mdiatiques, les grosses associations ou lobbies). Par consquent, les enquteurs sadaptent aux attentes et aux prsupposs de ceux qui les financent. Or pourquoi les lites politiques, conomiques, administratives ont-elles besoin de ces donnes chiffres sur la population, sur la socit, sur lconomie, sur les opinions ? Quen font-elles ? En quoi ces donnes participent-elles de leur autorit ? En quoi lomniprsence des statistiques, des sondages ou du benchmarking modifient-ils les manires de gouverner ? Je vous renvoie aux travaux de Michel Foucault ou dAlain Desrosires sur la naissance des statistiques en Europe. Ainsi, les problmes statistiques (et leurs problmes mthodologiques sous-jacents) sont presque toujours des problmes politiques. Les rsultats des recensements ont des incidences considrables sur les manires daborder les politiques publiques. Par exemple, pour des problmes de mthodes, le nombre de jeunes Noirs sont souvent sous-estims dans les recensements aux Etats-Unis ; par consquent, il y a une surestimation de la proportion de Noirs dans les statistiques de la dlinquance, ce qui peut engendrer une focalisation de lactivit policire et judiciaire sur cette population.

Chapitre 1 Lobjectivation statistique

Section 1. Lobjectivation statistique et la rupture avec les fausses vidences


Le sociologue amricain dorigine autrichienne Paul Lazarsfeld (1901-1976) a bien montr dans quelle mesure des enqutes par questionnaires, en sappuyant sur un grand nombre de cas, pouvaient remettre en cause bien des ides reues ou des fausses vidences. Dans un article clbre, il livre ainsi six affirmations qui, spontanment, ne susciteraient aucune contestation.
1. Les individus dots dun niveau dinstruction lev prsentent plus de symptmes psychonvrotiques que ceux qui ont un faible niveau dinstruction. 2. Pendant leur service militaire, les ruraux ont, dordinaire, meilleur moral que les citadins. 3. Les soldats originaires du sud des Etats-Unis supportent mieux le climat chaud des les du Pacifique que les soldats du Nord. 4. Les simples soldats de race blanche sont davantage ports devenir sous-officiers que les soldats de race noire. 5. Les Noirs du Sud prfrent les officiers blancs du Sud ceux du Nord. 6. Les soldats amricains taient plus impatients dtre rapatris pendant que lon combattait quaprs la reddition allemande.

Tout cela nest-il pas ce point vident quil ne servirait rien de dpenser de largent dans des enqutes pour aboutir de telles conclusions ? Or Lazarsfeld prend aussitt son lecteur contrepied : toutes ces propositions sont fausses ou, plus prcisment, toutes ces propositions sont invalides par des enqutes empiriques ralises auprs de soldats amricains. Parmi les diffrentes techniques denqutes en sciences sociales, les recherches quantitatives ont pour intrt de tester la solidit des croyances et des reprsentations spontanes sur le monde social. Rigoureusement menes, elles peuvent contribuer chasser les mythes (Norbert Elias) ou remettre en cause les prnotions (mile Durkheim).

1. Le choix du conjoint
Dans nos socits modernes o la formation des couples ne relvent plus (ou presque plus) darrangements familiaux, comment expliquer le choix du/de la conjoint(e) ? Les justifications spontanes tendent mettre laccent sur le hasard (hasard dune rencontre, coup de foudre qui ne sexplique pas). Largumentation mobilise aussi le rpertoire de la libert , via linvocation de lattirance, du got. Individuellement, ces raisons sont certainement valables : 8

en labsence dinjonctions familiales ou dobligations lgales pouser untel ou unetelle, il est difficile de nier la part de choix dans la constitution des couples. Mais lorsquon se place non plus lchelle individuelle mais lchelle collective, les statistiques permettent de montrer un autre mcanisme. Elles mettent en vidence limportance de lhomogamie sociale, cest--dire le fait que les individus ont statistiquement tendance pouser des personnes qui leur ressemblent socialement parlant (voir Bozon et Hran, La Formation du couple). Distribution des groupes socioprofessionnels des femmes, selon le groupe socioprofessionnel de leur mari (cadre ou ouvrier) couples dont les membres ont entre 25 et 59 ans
Groupe socioprofessionnel de la femme Cadre Profession intermdiaire Employ Ouvrier Retrait / inactif Autre (agriculteurs, commerants, etc.) TOTAL Ensemble femmes (%) 6,4 15,2 30 8,5 34 5,9 100 Femmes dont mari cadre (%) 24,2 21,3 16,7 1,4 34,6 1,8 100 Femmes dont mari ouvrier (%) 1 8,5 35,3 16,7 36,8 1,7 100

Distribution des groupes socioprofessionnels des hommes, selon le groupe socioprofessionnel de leur femme (cadre ou ouvrire) couples dont les membres ont entre 25 et 59 ans
Groupe socioprofessionnel de lhomme Cadre Profession intermdiaire Employ Ouvrier Retrait / inactif Autre (agriculteurs, commerants, etc.) TOTAL Ensemble hommes (%) 15,2 21 8,3 31,8 10,7 13 100 Hommes dont femme cadre (%) 57,3 19,5 3,2 5 4,1 10,9 100 Hommes dont femme ouvrire (%) 2,5 13,1 7 62,1 8 9,8 100

Source : Insee, enqute FQP 1993 Ces tableaux mettent en vidence que, heureusement, lhomogamie sociale nest pas totale (elle le serait si, par exemple, 100 % des maris de femmes cadres taient eux-mmes des cadres en loccurrence, ils ne sont que 57,3 %) : il ny a pas de dtermination absolue. Mais lhomogamie est malgr tout fortement marque. En effet, si la formation des couples reposait effectivement sur le hasard , on retrouverait la mme proportion de cadres parmi les hommes qui vivent avec une femme cadre que parmi lensemble des hommes vivant en couple (soit 15,2 % et non 57,3 %). Comment expliquer ce phnomne ? Plusieurs hypothses peuvent tre formules, qui renvoient diffrentes grilles danalyse sociologiques : 9

- Lexplication la plus simple rside sans doute dans tout ce qui fait quune rencontre est possible. Les individus sinscrivent dans des rseaux sociaux plus ou moins hermtiques les uns aux autres en raison des cercles de connaissances des parents, des lieux dhabitation, des tablissements scolaires frquents, des activits sportives ou culturelles pratiques, etc. Lensemble de ces expriences dessine dune certaine manire les frontires des rencontres possibles, statistiquement parlant on lexprime alors en termes de chances . - Ensuite, lhomogamie sociale rsulte sans doute aussi des processus de construction sociale des gots. Aprs tout, limage des gots en matire artistique ou culinaire (voir Pierre Bourdieu, La Distinction), les gots en matire sexuelle , et donc les probabilits de coup de foudre , sont certainement conditionns par le milieu social dorigine. - Il est galement possible que lhomogamie sociale tienne en partie lanticipation de la raction des proches. On tend sajuster ce quon estime tre attendu par son entourage. Ds lors, mme si on prouve des sentiments pour une personne, il peut savrer dlicat daller loin dans une relation lorsque cette personne est rejete par nos proches en raison de ses origines, ses caractristiques sociales, etc. - Enfin, la question de lajustement des valeurs se pose. En effet, il est possible de sortir ensemble sans tre ncessairement proches mais, pour fonder un foyer, il y a une relative ncessit de saccorder et daccorder ses dispositions en termes de conception du rle de la femme et de lhomme, de rgles relatives lintimit, etc.

2. Corrlations statistiques et liens de dpendance


Quoiquil en soit, ces statistiques ne nous permettent pas, en elles-mmes, dexpliquer lhomogamie sociale. Ces donnes se contentent (et cest dj beaucoup) de mettre jour une corrlation statistique entre deux variables. Une variable, cest une caractristique susceptible de prendre plusieurs formes diffrentes (Philippe Alonzo). Ici, quelles sont les deux variables ? Il sagit du groupe professionnel de la femme et du groupe professionnel de lhomme . Ici, le constat dhomogamie signifie que ces variables sont corrles, autrement dit quelles prsentent un lien de dpendance entre elles. linverse, si le groupe professionnel de la femme et le groupe professionnel de lhomme navaient aucun lien statistique et que la formation des couples reposeraient sur le hasard, on dirait que ces variables sont indpendantes (cest le cas, pour prendre un exemple totalement fictif, entre deux variables PIB de la France et rsultats de lquipe de France de basket dont aucune ne dpend de lautre).

10

Sil y avait indpendance, une femme cadre aurait 15,2 % de chances dpouser un homme cadre, 21 % un homme profession intermdiaire, 8,3 % un homme employ, etc. Or les statistiques nous montrent que ce nest pas le cas : la formation des couples ne repose pas sur le hasard. Une femme cadre a statistiquement une probabilit importante dpouser un homme cadre (57,3 %), en tout cas une probabilit beaucoup plus importante que si la formation des couples reposait sur le hasard. On dit alors, pour dcrire ces tableaux, quil y a cart lindpendance (synonyme de corrlations statistiques). Ce constat statistique a une certaine robustesse, une certaine solidit parce quil est tabli partir dune enqute de lINSEE, enqute ralise auprs dun trs vaste chantillon de population (environ 40 000 personnes). On peut donc en tirer des conclusions gnrales sur la socit franaise, cest--dire des enseignements sociologiques. Cette enqute met jour des rgularits. Ce terme est important car il a un double sens : il voque non seulement lide de frquence (lhomogamie sociale est frquente) mais galement lide de rgle extrieure qui simpose aux individus (lhomogamie sociale nest pas le produit dune volont individuelle). a ne veut pas dire que les individus se trompent ou mentent lorsquils disent tre tombs amoureux par hasard ou par coup de foudre : cest leur point de vue, compte tenu de leur position. Cest une interprtation, un regard subjectif sur la ralit et qui ne peut raliser quel point lespace des possibles est restreint. Dans cet espace, il y a bien libert, situation de choix et part du hasard : mais cest une ralit qui na de valeur qu lchelle individuelle. linverse, en tudiant un trs grand nombre de cas, les statistiques permettent daccder un autre niveau de ralit. Elles rendent visibles ce qui est invisibles lchelle de chaque individu (mme si on peut en avoir lintuition partir de ses expriences). Elles mettent jour des rgularits, cest--dire des phnomnes objectifs. - Ces phnomnes sont objectifs parce quils ne dpendent pas des impressions de lobservateur mais reposent sur une mthode dadministration de la preuve scientifiquement fonde (avec les mmes donnes, tout le monde arrive aux mmes conclusions). - Ces phnomnes sont objectifs aussi parce quils sont tablis partir dinstruments de mesure identiques pour tous (cf. la classification des groupes socioprofessionnels ne dpendent pas de la perception de chacun). De mme que le mdecin tablit son diagnostic en sappuyant sur une valuation objective de ltat de sant du patient (via la mesure du pouls ou de la tension) plus quen sappuyant sur lvaluation subjective tablie par le patient lui-mme. - Ces phnomnes sont objectifs enfin parce quils ne dpendent pas de la volont de quelques uns qui auraient invent lhomogamie sociale ou qui auraient pleinement choisi ce

11

mode de vie ( choisi au sens o ils se seraient retrouvs dans une vritable situation darbitrage avec de relles marges de manuvre).

3. Lobjectivation des faits sociaux


En mettant jour des rgularits objectives, ces statistiques oprent donc un travail dobjectivation du monde social. Lobjectivation, cest une dmarche scientifique consistant saisir le caractre objectif des faits tudis (en loccurrence ici la formation des couples). En utilisant les statistiques, donc en sappuyant sur la loi des grands nombres , le sociologue montre que les faits tudis sont des phnomnes collectifs qui simposent aux personnes, qui rpondent une certaine logique, qui ne se rduisent pas des cas individuels, qui ne sont pas seulement le rsultat de limagination du chercheur. Par ce souci dobjectivation de la ralit sociale, le sociologue respecte le prcepte du sociologue mile Durkheim (1858-1917) lorsque celui-ci invite tudier les faits sociaux comme des choses . Dfinition : Fait social = ils consistent en des manires dagir, de penser et de sentir, extrieures lindividu, et qui sont doues dun pouvoir de coercition en vertu duquel ils simposent lui. (Durkheim, Les Rgles de la mthode sociologique, p. 5) ; toute manire de faire qui est gnrale dans ltendue dune socit donne tout en ayant une existence propre, indpendamment de ses manifestations individuelles (ibidem, p. 14) Dailleurs cest partir dune dmarche de quantification que Durkheim va mettre en application ses rgles de la mthode sociologique et pouvoir montrer quel point le suicide constitue un fait social qui ne sexplique que par dautres faits sociaux (par exemple lanomie). Cet objet dtudes est intressant car, premire vue, le suicide constitue une pratique totalement lie des facteurs psychologiques, donc individuels. Et pourtant, ds que lanalyse se penche, non plus sur des cas individuels, mais sur un grand nombre de cas, on dcouvre que le suscite peut tre analys comme un fait social . En effet, en tudiant les statistiques du suicide (qui se suicide ? quelle priode ? dans quelles circonstances ?), on observe des rgularits, des corrlations entre diffrentes variables (le fait dhabiter en ville ou la campagne, le fait dtre isol ou davoir une famille, le fait dtre catholique ou protestant, etc.), ce qui lui permet de distinguer diffrents types de suicide. Autrement dit, le suicide peut sexpliquer non pas seulement par les caractristiques psychologiques ou personnelles des suicids mais par des caractristiques sociales. Je cite Durkheim : Si au lieu de ny voir que des vnements particuliers, isols les uns des autres et qui demandent tre examins chacun part, on considre lensemble des suicides commis dans une socit donne pendant une unit de temps donne, on constate que le total ainsi obtenu nest pas une simple somme dunits indpendantes 12

() mais quil constitue par lui-mme un fait nouveau, qui a son unit et son individualit, sa nature propre par consquent et que, de plus, cette nature est minemment sociale. Cette approche est en partie critiquable. Nous y reviendrons. condition dtre rigoureusement recueillies dun point de vue sociologique et mthodologique, les statistiques permettent de dcrire scientifiquement de nombreux aspects du monde social. Elles permettent notamment de mettre en vidence que des individus qui ne se connaissent pas, et mme ne se voient pas, se ressemblent. Du fait de milieux dappartenance similaires ou voisins, ils partagent un ensemble de prfrences en matire vestimentaire, culturelle, politique, etc. Dans son article, Guy Desplanques souligne ainsi lensemble des relations objectives entre le choix du prnom, le contexte historique et lidentit socioprofessionnelle des individus (cf. livret de TD) : les rgularits quil met en avant indiquent ainsi quel point la distribution des prnoms constitue un fait social qui chappe fortement la volont des parents (mme lorsque ces derniers savent quun prnom est connot socialement et choisissent de faon stratgique : ils ne dcident pas des connotations associes un prnom mais sy adaptent ; ils ne dcident pas non plus dappartenir une poque o loriginalit nest plus bannie mais recherche et o la loi ne dfinit plus le stock autoris de prnoms). De la mme manire, Patrick Lehingue montre comment les nombreuses recherches quantitatives en sociologie lectorale permettent dinvalider un grand nombre daffirmations relatives l lectorat Front national : son enracinement gographie, son lien avec llectorat communiste, son lien avec la personnalit charismatique de son leader, sa focalisation sur les seules questions dimmigration, etc. (cf. livret de TD). Enfin dernier exemple de lutilit dune dmarche dobjectivation et qui rejoint la question de lhomogamie sociale : cest la mesure de la mobilit sociale . Il sagit l en effet dun enjeu politique majeur. la diffrence des socits de castes dans lesquelles les individus occupent une position en fonction du statut assign la naissance, les socits dmocratiques se prsentent comme des socits mobiles o la position sociale occupe par chacun est suppose corrle lutilit sociale, cest--dire au talent ou au mrite personnel lcole ou dans le monde du travail. Cette conception rsulte dun double hritage idologique : lhritage rpublicain dun ct (valorisant labsence de privilges), lhritage libral de lautre (valorisant la concurrence libre et non fausse) reposent tous les deux sur la notion dgalit des chances lcole ou sur le march du travail. Les catgories sociales dominantes peuvent ainsi lgitimer leur situation, en mettant avant leur mrite (celui davoir mieux ou davantage travaill que les autres) et / ou leur chance . Sil y a galit des chances, cela doit signifier que la position sociale dun individu nest pas dtermine par la position de ses parents : les deux variables devraient tre strictement 13

indpendantes, leur relation organise par le seul hasard statistique. Or ce que montrent les enqutes de mobilit sociale, cest que les destins des individus ne tiennent pas leur seul mrite mais sont relativement corrls leurs milieux sociaux dorigine : il ny en effet pas dindpendance en France entre le groupe socioprofessionnel des hommes de 40 ans et plus et le groupe socioprofessionnel de leur pre . Pour ne prendre quun exemple, en 2003, 53,9 % des fils de cadres, gs de 40 ans et plus, sont eux-mmes cadres (alors que les cadres ne reprsentent que 19,9 % des hommes gs de 40 ans et plus). A linverse, 45,4 % des fils douvriers, gs de 40 ans sont eux-mmes ouvriers (alors que les ouvriers reprsentent 31,3 % des hommes gs de 40 ans et plus).

Section 2. De la problmatique aux indicateurs


1. Rpondre des questions
Les sciences sociales ont pour objectif de dvelopper la connaissance du monde social, en mettant notamment en vidence les logiques ou les mcanismes qui gouvernent lorganisation des socits et les relations entre individus. Elles articulent donc une ambition descriptive (comment a marche ?) et une ambition explicative (pourquoi a marche comme a et pas autrement ?). Mais la diffrence dapproches qui se focaliseraient sur un cas ou sur un vnement donn, les sciences sociales visent produire des noncs (ou des affirmations) qui ont une certaine prtention la gnralit : en tant que sciences, elles ont une ambition nomologique (= prtention tudier les lois qui prsident aux phnomnes naturels ; ici, prtention tudier les logiques qui prsident aux phnomnes sociaux). Par consquent, les scientifiques nont pas la prtention doffrir une improbable description exhaustive du rel. La littrature raliste du XIXe sicle a bien montr les apories dune telle ambition : il faudrait des encyclopdies infinies pour mener bien un tel travail, si bien que le gain dintelligibilit serait quasi-nul. Aussi les recherches scientifiques ont-elles principalement pour objectif de rpondre des questions, des intrigues ou encore des problmatiques dont lintrt se limite rarement des enjeux de pure connaissance. Sil y a problmatisation, cest souvent parce quil y a lambition danalyser des phnomnes rigs en problmes sociaux (voir Rmi Lenoir, Objet sociologique et problme social dans Patrick Champagne et al., Introduction la pratique sociologique). Par exemple, si les chercheurs mettent en relation les variables groupe socioprofessionnel des hommes de 40 ans et plus et groupe socioprofessionnel des pres des hommes de 40 ans et plus , cest afin dapporter des lments 14

de rponse empirique la question de la mobilit sociale et notamment linterrogation suivante (qui prsente un caractre politique vident) : les positions sociales et les ressources accumules relvent-elles du mrite ? Ou bien assiste-t-on des phnomnes de reproduction sociale ? On la vu, les statistiques sont souvent considres comme loutil le plus adquat pour rpondre cette question, puisquelles offrent la possibilit dobjectiver la mobilit sociale . Une fois les donnes recueillies, il est possible de mesurer le taux de mobilit sociale (il suffit dadditionner lensemble des hommes de 40 ans et plus appartenant un groupe socioprofessionnel distinct de celui de son pre, soit 64,9 % de mobiles en 1993 et 63,8 % en 2003). On peut alors tablir diffrentes conclusions selon le questionnement initial : prs de 2/3 des Franais de plus de 40 ans connaissent une situation de mobilit sociale ou bien la mobilit sociale en France a peu volu entre 1993 et 2003 ou bien encore, si lon dispose de donnes quivalentes pour dautres pays, la mobilit sociale est plus importante en France quau Royaume Uni mais moins importante quau Danemark (donnes OCDE, 2007). Ces conclusions sont recevables, condition dadmettre que lon peut tablir la position sociale dun individu en sintressant uniquement son groupe socioprofessionnel , autrement dit admettre que la stratification sociale repose principalement sur la place des individus dans le monde du travail. Certes, cette variable mle diffrentes dimensions puisquelle identifie la place des individus dans la division du travail, sur les plans horizontal et vertical. Mais, pour tudier la mobilit sociale, les sociologues pourraient utiliser dautres outils dobjectivation, autrement dautres indices empiriques. Par exemple, dans lenqute cite plus haut de lOCDE, cest le revenu qui sert tablir la position sociale. On pourrait mme imaginer dautres indices, sans doute plus difficile recueillir : la rputation ou le prestige respectif des individus, le niveau de diplmes, laccs aux biens culturels, etc. Dans cet exemple, il peut donc y avoir dbat pour savoir quel est le meilleur moyen de mettre jour empiriquement la stratification sociale. Mais que lon retienne la variable groupe professionnel ou la variable revenu , le lien entre cette variable et lobjet de recherche, en loccurrence ici la position sociale ou la stratification sociale nest pas trop contestable : il nest donc pas trop difficile ici dobjectiver statistiquement ce phnomne social.

2. Convertir des concepts en indicateurs


Mais souvent, il nest pas simple doprer ce travail dobjectivation. Pourquoi ? Parce quil nest pas toujours vident dapporter des lments de rponse empiriques une question, cest-dire de traduire une question en objets de recherche qui puissent tre observs et mesurs, bref

15

qui puissent renvoyer un terrain denqute prcis. Autrement dit, il est souvent dlicat de convertir un concept en indicateur. Dabord, quest-ce quun concept ? Cest une Reprsentation mentale gnrale et abstraite dun objet (Le Robert). Pour le dire autrement, cest un terme ou une expression utilise pour catgoriser, cest--dire pour regrouper, sous une mme dsignation, une pluralit de cas, de personnes, de choses, dvnements ou de situation. Dans leur activit de questionnement et danalyse du monde social, les sciences sociales ont recours un nombre considrable de concepts : lhomogamie sociale, la mobilit sociale, la stratification sociale, les ingalits sociales, la violence, la violence symbolique, la dviance, la marginalit, la pauvret, la richesse, la prcarit, la prcarisation, limmigration, la mondialisation, la bourgeoisie, la classe ouvrire, la productivit, la flexibilit, la bureaucratie, la bureaucratisation, la dmocratie, la dmocratisation, la professionnalisation, la participation politique, lexode rural, le libralisme, le no-libralisme, la libralisation, le conservatisme, la religiosit, la contestation, la rvolution, etc. Certains de ces termes relvent uniquement du vocabulaire scientifique : ils dsignent des objets de recherche part entire. Mais la plupart dentre eux sont utiliss aussi dans dautres circonstances que dans un souci de description scientifique du monde. Et de fait, la conceptualisation ou lutilisation de concepts est un acte de tous les jours ! Tout le monde raisonne en permanence par lintermdiaire de concepts parce quil est indispensable, pour se reprer et agir, de classer les choses, les personnes, les vnements (ce que Peter Berger et Thomas Luckmann qualifient de typification ). Les concepts sont essentiels pour raisonner car, sans eux, tout ne serait que cas singuliers : il ny aurait aucun appui sur lexprience pour agir ! La dmarche dobjectivation statistique repose donc sur la traduction dun concept en mesure quantifie, bref sur la transformation dun concept en indicateur. Un indicateur, cest la Manifestation multidimensionnelle quantifiable et mesurable dun concept (Philippe Alonzo). Il sagit du regroupement dune ou plusieurs variables qui offre un rsum dinformations. Un indicateur, cest donc un indice : ce nest pas la ralit mais une reprsentation quantifie de la ralit qui permet dtablir des chelles et ainsi de comparer et classer les cas tudis. Ds lors, certains concepts peuvent tre assez facilement convertis en indicateurs. Par exemple, la richesse peut tre reprsente par un indicateur regroupant deux variables quantitatives (le revenu et le patrimoine), ce qui permet de comparer lensemble des individus ou des mnages partir dune unit de mesure commune (en loccurrence ici, lunit montaire du pays). Mais cette opration apparat beaucoup plus dlicate pour dautres concept, du fait de leur caractre plus abstrait ou quivoque (i.e. dont la signification est variable selon les individus). Prenons lexemple de lintelligence que lon pourrait mesurer partir de tests supposment universels et qui suscitent de fortes controverses. Ou encore prenons lexemple du bonheur.

16

Diffrents chercheurs (conomistes notamment) se sont efforcs de construire des indicateurs censs mesurer le bonheur dun peuple, afin de concurrencer le Produit National Brut (jug trop focalis sur les richesses matrielles et ne prenant pas suffisamment en compte les impacts ngatifs dune forte croissance, par exemple sur lenvironnement ou la sant) par le Bonheur national brut. Comment mesurer le bonheur et esprer ainsi classer les pays laune de cet indice ? Quelles variables faut-il retenir pour construire lindicateur ? Quatre dimensions (qui elles-mmes en comprennent plusieurs autres) ont t retenues par les promoteurs de lindice : la croissance et le dveloppement conomique ; la conservation et promotion de la culture ; la sauvegarde de l'environnement et utilisation durable des ressources ; la bonne gouvernance responsable. Or dans quelle mesure ces critres sont-ils pertinents pour valuer le bonheur ? Et comment convertir chacun dentre eux en mesure ? On le voit, le problme est dlicat, si bien que le lien entre le concept bonheur et sa mesure repose sur des conventions arbitraires qui ne suscitent pas de consensus dans la communaut scientifique. Deux problmes sont soulevs dans cette opration de traduction dun concept en indicateur. (1) Tout dabord, on vient de le voir, il nest pas toujours ais de dterminer une unit de mesure qui traduirait sans ambigut au concept en question ou lune de ses dimensions. Par exemple, le classement de Shanghai des universits mondiales sappuie sur un indicateur suppos reprsenter lexcellence respective des diffrentes institutions. Or comment exprimer cette excellence ? Ce concept est lui-mme dclin en quatre critres (qualit de lenseignement, qualit de linstitution, publications, taille de linstitution) qui sont mesurs partir de six variables quantitatives. Premier problme donc : toutes les dimensions de la vie sociale sont-elles mesurables, cest--dire convertibles en donnes chiffres ? Cest ici la tendance la quantophrnie qui pose question.
Critres Qualit de l'enseignement Qualit de l'institution Variables Nombre de prix Nobel et de mdailles Fields parmi les anciens lves Nombre de prix Nobel et de mdailles Fields parmi les chercheurs Nombre de chercheurs les plus cits dans leurs disciplines Articles publis dans Nature et Science entre 2000 et 2004 Articles indexs dans Science Citation Index, et Arts & Humanities Citation Index Performance acadmique au regard de la taille de l'institution Pondration 10 % 20 % 20 % 20 % 20 % 10 %

Publications Taille de l'institution

17

(2) Le deuxime problme a dj t voqu et sera dvelopp plus en dtail dans la troisime section : cest celui soulev par la catgorisation. Pour objectiver le concept de chmage , tudier son volution et tablir des comparaisons (internationales notamment), les statisticiens disposent dun indicateur lmentaire car nourri dune seule variable : le taux de chmage. Celui-ci consiste tablir simplement la proportion de chmeurs dans la population active. Mais pour mesurer le nombre de chmeurs, il faut alors dfinir prcisment qui est chmeur et qui ne lest pas, autrement dit inscrire les individus dans des cases aux frontires rigides, alors mme que la ralit du rapport au travail est constitue dune infinie diversit de situations. Cette opration de conversion des informations dans des modalits prdfinies constitue une opration de codage. Intellectuellement, elle repose sur un double principe danonymisation (les cas rels sont inscrits dans les cases, gnralement symboliss par des chiffres ou des lettres pour permettre le traitement statistique : 0/1/2/3) et de mie en quivalence (par convention, on considre que les individus regroups dans une mme catgorie sont interchangeables).

3. Dfinir pour mesurer, mesurer pour dfinir


Les exemples de lexcellence universitaire ou du chmage montrent que la

conversion dun concept en indicateur statistique repose en premier lieu sur une tape de dfinition du concept. Lenjeu nest videmment pas de produire la dfinition la plus sophistique possible mais de dterminer les caractristiques ou les dimensions du concept les plus pertinentes pour la recherche. Il sagit donc didentifier les traits qui se prteront le mieux lobservation, lexprimentation ou la mesure scientifique. Prenons lexemple dune recherche dOlivier Fillieule dont certains aspects mthodologiques sont restitus dans larticle Archives policires, sources de presse et manifestations de rue (cf. livret de TD). Ses travaux sinscrivent dans les domaines de la sociologie de laction collective et de la sociologie des mouvements sociaux, cest--dire quil sintresse aux formes de protestation collective dans lespace public. Plus prcisment, il cherche rpondre aux intrigues suivantes : quelles sont les principales volutions des modes daction collective en France depuis plusieurs dcennies ? Quels sont les groupes qui ont le plus frquemment recours lexpression publique de leurs revendications ? La France se singularise-telle lgard des autres pays ? Y a-t-il des spcificits territoriales dans le pays ? Etc. Rpondre ces question suppose de disposer de donnes chiffres qui permettront une objectivation statistique du phnomne. Pour dsigner son objet de recherche, il ne reprend pas les termes plus 18

classiques de contestation ou de manifestation : contestation est trop flou, manifestation trop restrictif. Il privilgie le terme d vnements protestataires . Mais pour identifier et recenser ces vnements protestataires , il lui faut dfinir ce concept et notamment trouver les critres qui lui permettront de dire si tel vnement doit tre retenu dans lanalyse ou pas. Car, ds lors que le chercheur ambitionne dutiliser loutil statistique pour tayer sa dmonstration, il est contraint dtablir prcisment les frontires de son objet. - Critre 1 = plus dune personne - Critre 2 = prsence dans lespace public (pas une conspiration, pas une runion, etc.) donc critre dexpressivit - Critre 3 = nature politique de laction (avoir des revendications : pas fte de village) - Critre 4 = pas une manifestation organise par les autorits politiques (caractre protestataire) - Critre 5 = ne pas se limiter aux seules manifestations : inclure sit in, les rassemblements, les barrages routiers, les occupations dadministration, etc. Le cumul de ces cinq critres lui permet ensuite de proposer la dfinition suivante : Tout vnement consistant en loccupation momentane par un acteur non gouvernemental dun lieu ouvert public ou priv, et qui comporte directement ou indirectement lexpression dopinions politiques. Cest partir de cette dfinition que Olivier Fillieule va ensuite pouvoir se plonger dans ses sources (archives de presse et archives policires notamment) pour dabord recenser les vnements protestataires et ensuite les analyser au regard de ses questions de recherche (nombre de participants, modalits daction, intervention ou non des forces de lordre, prsence ou non dun service dordre, nature des revendications, identit des groupes mobiliss, etc.) Cette tape de la dfinition peut tre aussi qualifie dtape de construction de lobjet . Elle est indispensable car cest elle qui sert de chanon entre la partie thorique et la partie empirique du travail de recherche. - Dabord, cest partir de la dfinition que vous allez pouvoir dterminer la mthode dinvestigation (travail sur archives, production de questionnaire, utilisation des donnes statistiques ou des sondages existants, etc.) et la nature de votre terrain denqute (quelles archives ? quelle population adresser le questionnaire ? etc.). Par exemple, selon votre dfinition de la dlinquance et / ou de la criminalit, les mthodes didentification des actes dlictueux ou criminels et de leurs auteurs peuvent considrablement changer. Dun ct, si vous concevez les actes dlinquants ou criminels comme lensemble des actes dfinis comme des dlits ou des crimes par la loi et dcouverts par les services de police, vous allez tre amens principalement tudier les statistiques policires, avec le risque de davantage mesurer

19

lactivit policires et les priorits politiques assignes la police que la ralit des pratiques dlictueuses ou criminelles. Il est ainsi probable que vous ayez le sentiment dune soudaine augmentation de la dlinquance routire , alors que laugmentation des dlits recenss renvoie seulement un accroissement des effectifs policiers affects au contrle des routes. De la mme manire, vous risquez davoir le sentiment que les dlinquants ou les criminels appartiennent surtout aux catgories sociales domines, si la police tend se dsintresser de la dlinquance en col blanc ! Dun autre ct, si vous adoptez une conception plus extensive, savoir tous les actes dfinis comme des dlits ou des crimes par la loi , il vous faudra imaginer dautres mthodes dinvestigation et notamment sefforcer de croiser diffrents terrains (cumuler examen des statistiques policires, enqutes de victimation, enqutes de voisinage, etc.). On le voit, il serait naf de croire que la dfinition prcde linterrogation sur le terrain denqute : bien souvent, la dfinition est labore en ayant en tte le terrain denqute. - Ensuite, ltape de construction / dfinition de lobjet est dterminante car elle participe du travail de problmatisation. En effet, la dfinition du concept reflte le cadre thorique, cest-dire le point de vue adopt sur lobjet. La dfinition ne soulve donc pas seulement des problmes techniques . Elle contient une dimension idologique indniable : il faut en avoir conscience pour ne pas la subir ! Reprenons lexemple de la stratification sociale , en sappuyant sur le texte de Louis Chauvel ( La dynamique de la stratification sociale ). Dun ct, la stratification pourrait tre dfinie partir du critre de la richesse, ce qui se justifierait par la centralit des aspects financiers dans la vie collective (pour le dire vite, largent permet daccder aux biens rares et convoits ; de maintenir une position dominante via laccs lducation prive et la scurisation contre les alas professionnels ; dobtenir la reconnaissance des autres). De cette dfinition, dcoule un indicateur qui cumule deux variables (revenus et patrimoine) et qui permet de construire une chelle (mesure par dcile ou centile). Dun autre ct, la stratification sociale pourrait se dfinir partir de la position des individus dans le monde du travail, via la variable groupe socioprofessionnel . Cette dfinition tient compte du fait que la position sociale ne constitue pas seulement un problme de revenu mais aussi un problme de statut et de prestige que garantit principalement lintgration dans le monde du travail. Or, derrire ce dbat apparemment technique, se niche en ralit deux visions distinctes de la socit. Dune part, une vision continue pour qui les ingalits svaluent en termes de quantits de ressources (principalement financires) : il est alors difficile didentifier prcisment dventuels clivages entre diffrents groupes (sauf si lon observait une trs forte polarisation de la distribution des richesses). Dautre part, une vision discontinue pour qui les ingalits

20

renvoient davantage des logiques de domination, mettant en opposition des groupes sociaux relativement hermtiques les uns aux autres. Les individus ne se diffrencient donc pas seulement en termes de gradation mais plutt en termes dappartenance durable des catgories potentiellement en situation de conflits (jusquau modle de la lutte des classes). Pour conclure, il faut rappeler que les choix mthodologiques constituent aussi des choix thoriques (mme sils chappent parfois leur auteur). Les rsultats et, par consquent, les phnomnes sociaux mis jour dpendent toujours en partie de linstrument de mesure. Selon les mthodes choisies, on nobjective pas exactement la mme chose. Il importe donc de ne jamais chercher mesurer un phnomne sans lavoir dfini et identifi les implications thoriques dune telle dfinition.

Section 3. La catgorisation et les dangers de lobjectivisme


1. Variables quantitatives et variables qualitatives
Quil sagisse de dcrire une population ou de rechercher dventuelles corrlations entre variables, le travail statistique consiste tudier un grand nombre de cas, partir dinformations standardises par des procdures de codages. Quil sagisse de personnes, de mnages, de groupes, dentreprises, de pays, dvnements protestataires, etc., chaque cas est qualifi d unit statistique ou d individu . Lensemble des units statistiques sur lesquels porte lenqute forment la population. Chaque individu est donc soumis aux mmes questions, chacune des questions correspondant une variable. Le recueil des informations permet alors de remplir le tableau suivant : celui-ci indique, pour chaque individu, les formes de chacune des variables de lenqute.
Variable 1 = sexe ? Individu 1 Individu 2 Individu 3 Individu 4 Individu 5 Individu 6 Individu 7 Individu 8 Individu 9 H F H H F H F F H Variable 2 = ge ? 35 56 32 18 78 23 29 54 49 Variable 3 = statut dactivit ? Salari priv Chmeur Salari priv tudiant Retrait Salari public Femme au foyer Salari public Indpendant Variable 4 = revenus ? 2500 800 1200 300 1100 1700 0 2250 3600

Or il existe deux types de variables :

21

- Dabord, les variables quantitatives sont des variables qui sexpriment sous la forme dune valeur mtrique (Philippe Alonzo), autrement dit la variable sexprime sous une forme numrique, le nombre constituant la valeur de la variable (valeur rapporte une unit de mesure). Lge, le revenu, le taux de chmage, le produit intrieur brut, lindice des prix ou encore le nombre denfants sont des variables quantitatives. - Ensuite, les variables qualitatives sont des variables dont les diffrentes formes sont des attributs ou des catgories (Philippe Alonzo), autrement dit des qualits . Les diffrentes formes dune variable qualitatives constituent les modalits de la variable. Par exemple, la variable sexe comprend deux modalits : homme ou femme. La variable statut dactivit comprend ici sept modalits : salari du priv, salari du public, indpendant, chmeur, retrait, tudiant / lycen, femme au foyer. Il existe plus prcisment deux types de variables qualitatives : * les variables ordinales sont des variables dans laquelle les modalits peuvent tre hirarchises sur une chelle. Cest le cas, par exemple, des variables qui correspondent aux questions dopinion o les interviews sont invits juger une personnalit partir dune chelle o les quatre modalits sont hirarchises de tout fait favorable pas du tout favorable . De la mme manire, les notes un examen peuvent tre retenues en tant que variables ordinales (dans la mesure o ces nombres pourraient tre remplacs par des lettres). * les variables nominales sont des variables qui ne fait que nommer les individus quelle dcrit. Quil sagisse du sexe , du groupe socioprofessionnel , de la rgion de linterview , lordre des modalits importe peu. Cela nempche pas quil est possible, pour lanalyse, doprer des regroupements et ainsi modifier les modalits de la variable (par exemple, regrouper ouvriers et employs pour obtenir la modalit catgories populaires ). Tandis que les variables quantitatives posent le problme de la qualit de la mesure (et de la pertinence de linstrument de mesure), les variables qualitatives soulvent, quant elles, deux difficults : la pertinence des catgories utilises (ont-elles un sens ? correspondent-elles des catgories existant dans la ralit ?) et larbitraire du classement (par exemple, dans une tude de science politique oprant une comparaison de diffrents Etats, o placer la frontire entre dmocratique et non dmocratique ? De mme, dans une enqute sur le logement en France, quels critres permettent dattribuer un appartement la qualit de bonne ou mauvaise qualit ?).

22

2. Catgories institues et catgories spontanes


La catgorisation constitue donc une opration indispensable mais problmatique. En effet, quelles catgories le sociologue peut-il utiliser pour dcrire sa population ? En labellisant et en classant les individus, le chercheur ne prend-il pas le risque doprer des regroupements abusifs ? Ne risque-t-il pas de crer, dhomogniser et dopposer des groupes fictifs ? Bref, ny at-il pas un danger dentretenir certains strotypes et ainsi de mettre mal lambition de rupture pistmologique quvoquent Gaston Bachelard (1884-1962) et mile Durkheim ? Cet obstacle est plus ou moins prononc selon le type de variables qui intressent le chercheur. 1. Catgories institues. Franois Hran rappelle en effet quil existe un premier ensemble de catgories : les variables dEtat qui sont des variables tablies , tributaires de ltat civil ou certifies sur lensemble du territoire national . Par exemple, personne en France ne remettrait en cause la validit de la csure opposant une personne marie et une personne clibataire : cette opposition repose en effet sur une institution codifie par lEtat, valable sur lensemble du territoire national : le mariage. Ds lors que le maire signe le document et dclare vous tes mari et femme , les individus changent soudainement de statuts et deviennent, objectivement, aux yeux de tous, maris et femmes. Toutes les catgories dtermines dans le droit sont objectives juridiquement ou institues : leur dlimitation repose sur des critres juridiques, dtermins par la puissance publique souveraine, qui rendent les catgories objectives , cest--dire ici socialement incontestables. Comme le rappelle Hran, tout leffort du droit revient fixer des seuils dans le continuum social , produire des coupures arbitraires . Linstitution du diplme constitue aussi un bon exemple : appartenir la catgorie des diplms du suprieur , cest dtenir un diplme dont la valeur est fixe par lEtat. En France, personne ne remettrait en cause votre appartenance cette catgorie, tandis que, dans dautres contextes gographiques ou historiques, il peut y avoir une opposition quant la valeur de ce bout de papier qualifi diplme . De la mme manire, les variables dindications gographiques sont elles aussi objectives juridiquement et ne suscitent aucune contestation : vous appartenez des villes, des dpartements et des rgions dont lexistence et le dcoupage ne suscitent aucune remise en question (ce qui nest pas le cas, par exemple, lorsquil y a un conflit entre deux Etats pour savoir qui appartient un territoire et quel nom lui donner). On pourrait multiplier les exemples : la nationalit (cest ltat qui dtermine qui est Franais et qui ne lest pas, lappartenance cette catgorie tant par ailleurs objective par la Carte didentit), le 23

statut dadulte (cest ltat qui fixe la frontire entre une personne mineure et une personne majeure, la validit du passage dune catgorie lautre tant assure par lacte de naissance, luimme tabli par les agents de ltat), etc. Enfin, le statut socioprofessionnel dun individu sinscrit dans des catgories objectives par des conventions collectives (ouvriers, techniciens, cadres, etc.) dont la lgalit est dtermine par la certification tatique : ces titres de poste dans les entreprises correspond des diffrences de statuts, de salaires, etc. qui, elles, peuvent tre davantage remises en cause, puisque luniversalit de ces catgories sur le territoire national est moins tablie que pour les variables dtat civil prcdemment cites. Pour conclure, on peut donc admettre avec Hran qu Un phnomne social se laisse dautant mieux objectiver [et mesurer statistiquement] quil lest dj dans le monde social . 2. Catgories fluides . Mais dautres formes de classement ne bnficient pas du mme degr dinstitutionnalisation : toutes les catgories ne sont pas autant objectives dans le monde social. La plupart de celles que nous mobilisons au quotidien reposent ainsi sur des reprsentations spontanes, des impressions, des critres informels En effet, chaque jour, nous utilisons des principes de catgorisation pour distinguer les personnes grandes des petites , les belles des moches , les doues des maladroites , les jeunes des vieux , les svres des indulgentes , les intolrantes des tolrantes , etc. Or, pour chacune de ces chelles de classement, il parat difficile didentifier des critres objectifs pour distinguer les individus et dfinir ces catgories. Sil est possible de mesurer une personne (la taille constitue une variable quantitative dont la valeur sexprime en cm), est-il aussi vident de caractriser cette taille partir dune variable qualitative ? Quel critre permettrait de diffrencier objectivement et universellement une personne grande dune personne moyenne ? Dans Les Ficelles du mtier, Howard Becker souligne bien les difficults dtablir un tel constat, alors mme la taille [est] la donne la plus concrte que lon [peut] esprer jamais pouvoir connatre au sujet de quiconque. Il faut alors garder en tte que chaque catgorie na de signification que relationnellement : on nest grand que par rapport une moyenne, que par rapport des personnes plus petites. Une mme personne peut tre dfinie comme grande par son entourage mais petite par ses partenaires de basket. La taille moyenne varie selon les poques et selon les milieux sociaux, bref selon les contextes. Cette ficelle peut ainsi tre gnralise lensemble des qualits utilises pour cataloguer les individus : pour tre pertinentes, elles doivent tre (1) rapportes au contexte spatial et historique dans lequel sinscrivent les individus (on est jug grand dans un contexte donn) et (2) replaces dans un systme de relations (on est jug grand par

24

rapport des personnes plus petites). Pour prendre un autre exemple, tre pauvre en France en 2010, ce nest videmment pas la mme chose qutre pauvre en Inde en 2010 ou qutre pauvre en France en 1810. En valeur absolue, les pauvres en France aujourdhui peuvent accder davantage de biens (alimentaires, vestimentaires, etc.) que les pauvres dautres contextes sociohistoriques. Pour autant, il paratrait incongru de refuser de qualifier de pauvres les mnages qui vivent sous le seuil de pauvret : il est de toute faon des individus plus pauvres que dautres et des individus appartenant aux 10 %, 20 % ou 50 % les plus pauvres . Il faut donc admettre le caractre relatif de la pauvret : celle-ci ne svalue que dans le cadre dune socit donne, au regard de la richesse mdiane (le seuil de pauvret est fix 50 % des revenus mdians), et non en termes absolus (par exemple, au regard de la capacit acqurir tels biens ou tels services). Autre exemple soulignant lide que les catgories nont de significations que dans un contexte donn. Par exemple, ladolescence na de sens que dans une socit marque par llvation gnrale du niveau scolaire (et donc le recul de lentre dans la vie active et dans la vie matrimoniale). De la mme manire, la notion de chmeur na de sens que dans une socit domine par le salariat. Enfin, en sociologie politique, les notions de gauche et de droite ne renvoient pas exactement aux mmes ralits selon les pays et selon les poques. Mieux : dans un mme pays, une mme poque, les frontires entre la gauche et la droite ne sont pas quivalentes dans la tte de tous les individus. Pour certains militants dextrme gauche, le Parti socialiste est envisag comme un parti de droite depuis que son programme nentend plus remettre en cause les fondements de lconomie de march. Il apparat donc dlicat dentreprendre des comparaisons dans le temps ou dans lespace, en faisant comme si un mme mot dsignait la mme ralit partout. Il serait, par exemple, naf dtudier la situation des pays selon le nom des partis qui les dirigent : si le Sngal dispose, comme en France, de partis qui se revendiquent socialistes ou libraux , ces formations reposent sur un socle idologique bien diffrent de celui tabli en France. Il serait galement tout aussi naf de vouloir tudier la population des dlinquants comme sil sagissait dune catgorie objective et identique dans le temps : en effet, le statut de dlinquant dpend des qualifications juridiques en vigueur un moment donn. Or, du jour au lendemain, un acte autoris peut devenir un dlit (et vice versa) : siffler lhymne national peut suffire aujourdhui vous faire devenir un dlinquant. Analyser la catgorie dans le temps renvoie donc autant aux volutions de la loi quaux volutions sociologiques de ceux qui la transgressent.

25

3. La catgorisation comme enjeu des luttes symboliques


On vient de le voir, il est dlicat dinscrire un individu dans une catgorie donne du fait de son caractre relatif et de labsence de consensus quant la pertinence dune telle dsignation. Pour reprendre les exemples dj donns, o placer la frontire entre Etats dmocratiques et Etats non dmocratiques ? Comment distinguer les jeunes des autres ? Y a-t-il des critres permettant de diffrencier objectivement les personnes de gauche et celles de droite ? Mais cette difficult tient aussi et surtout au fait que peu de catgories sont dnotes et nimpliquent aucun jugement de valeurs. Pour le dire autrement, la plupart des labels utilises pour classer les individus sont socialement connots, soit positivement, soit ngativement. Bref, les mots sont rarement neutres ! Cest ce que montre trs bien le sociologue amricain Everett Hughes (1897-1983) au sujet des noms de mtier ( Le travail et le soi , 1951). Il rappelle en effet que ces noms fonctionnent comme des tiquettes (au double sens dtiquettes de prix et de cartes de visite). Ils servent donc indiquer la valeur et le statut dune personne, bref une identit qui peut tre plus ou moins valorisante. Puisque le mtier dun homme constitue aujourdhui lune des composantes les plus importantes de son identit sociale, de son moi et de son destin , Hughes souligne les stratgies mises en uvre par certains mtiers pour bnficier de la dsignation la plus favorable et ainsi tre positivement reconnus. Quelques exemples rcents permettent de se rendre compte de ces jeux autour des dsignations : techniciens de surface et non homme de mnage , htesse daccueil et non standardiste , agriculteur et non paysan (mais la Confdration paysanne sest justement battue pour oprer le mouvement inverse), demandeur demploi et non chmeur , etc. De la mme manire, les universitaires peuvent stratgiquement modifier lintitul de leur mtier selon leur public : enseignant , chercheur , enseignant-chercheur , etc. Mais les acteurs sociaux ne sefforcent pas seulement de modifier les noms ou les connotations qui y sont associes : ils luttent aussi pour dplacer les frontires des groupes, modifier les dcoupages, bref faire bouger les nomenclatures. Hughes voque en effet aussi les efforts mens par les infirmires amricaines pour se rapprocher symboliquement du corps mdical et sloigner inversement des aides-soignantes : leur enjeu est de modifier les reprsentations qui diffrencient mdecins et autres personnels dhpitaux. Les classements sociaux sont en permanence lobjet de luttes symboliques dont lenjeu est dimposer des visions du monde. Longtemps sociologues lINSEE, Alain Desrosires et Laurent Thvenot (Les Catgories socioprofessionnelles) ont bien montr comment llaboration des nomenclatures socioprofessionnelles met aux prises de trs nombreux groupes dintrt, chacun cherchant

26

orienter le classement dans un sens favorable. Ainsi, la catgorie cadres ne constitue aucunement une catgorie naturelle et vidente : pour preuve, il est bien dlicat didentifier une catgorie quivalente dans les autres pays occidentaux (aux Etats-Unis, par exemple, les cadres sont souvent diviss en managers et professionnels ). Au contraire, cest une construction historique laquelle Luc Boltanski a consacr un passionnant ouvrage (Les Cadres). Il ne sagit ni dun groupe homogne, ni dune pure fiction : mais bien du produit dun travail de mobilisation, didentification, dinstitutionnalisation, bref de reprsentation, men dans un contexte singulier ( partir des annes 1930) par des groupes dindividus dsireux dimposer sur la scne politique des valeurs et des intrts singuliers : dfendre lidentit des cadres , cest dfendre une vision moderne de la socit qui vise au dpassement de la lutte des classes. Les porte-parole des cadres vont se dfinir comme les reprsentants dune nouvelle lite dont la position se justifie non plus au nom de la dtention du capital mais au nom dune comptence technique et managriale. Cest ici que le terme de reprsentation est prcieux : puisquil dsigne la fois les images mentales (qui tmoignent du caractre plus ou moins vident de lexistence dun groupe) et les mcanismes de dlgation (ce sont souvent les porte-parole qui font exister un groupe puisquils le font parler, le structurent via des mouvements supposs reprsentatifs, lui donnent une image, expriment des revendications bref, ils le personnifient, notamment dans le cadre de conflits sociaux). On pourrait prendre lexemple des efforts visant promouvoir lexistence dune classe moyenne et en dessiner de larges contours : la plupart des partis de gouvernement (PS / UMP) se dsignent comme reprsentants des classes moyennes , ce qui leur offre lavantage dlargir leur base lectorale suppose. Il sagit l souvent dun acte performatif, acte de magie sociale dit Pierre Bourdieu ( La force de la reprsentation , in Ce que parler veut dire, p. 140) qui contribue donc au sentiment dexistence objective et ternelle du groupe. Cest ce qu bien montr lhistorien britannique Edward Thompson (1924-93) au sujet de La Formation de la classe ouvrire anglaise (1963). La classe ouvrire qui merge aux XIXe rassemble, certes, des individus qui se ressemblent, partageant la mme condition objective de proltaire, soumis aux cadences infernales des usines et la misre. Mais pour exister et simposer dans les reprsentations comme un groupe part entire et distinct des autres, la classe ouvrire ne devait pas seulement possder les traits dune classe en soi mais devenir une classe pour soi , cest--dire consciente de son existence et organise dans une lutte commune. Pour cela, il a fallu quun certain nombre dintellectuels, ouvriers, hommes politiques, mnent un vritable travail de reprsentation pour parler au nom de la classe ouvrire et faire accepter quils parlaient au nom de groupes souvent isols les uns des autres. Thompson

27

rappelle cette distinction dj tablie par Marx. Mais il va plus loin en montrant que cette notion de classe ouvrire na pu merger que dans un jeu dopposition et de diffrenciation avec dautres groupes sociaux. La classe ouvrire nexiste donc pas en soi : elle nexiste quau sein dun systme conomique particulier (domin par le capitalisme industriel) et en rapport avec dautres classes ou groupes (patrons, cadres, techniciens et contrematres, etc.). Mais au-del des seules catgories socioprofessionnelles, cest lensemble des catgories identitaires dont il faut dnaturaliser lapparente existence objective (au sens de naturelle et dternelle). Aucune catgorisation nest totalement naturelle : mme la division a priori vidente entre hommes et femmes peut poser problme. Dabord, comment classer les transsexuels, travestis, trisomiques XXY et autres queers qui refusent une telle assignation. Ensuite, sexe biologique et genre social ne se recouvrent pas automatiquement : dans de nombreuses socits, il peut y avoir une dconnexion entre ces formes dappartenance. Par exemple, la sexualit dans la Rome antique nest pas tant fonde sur la division entre hommes et femmes quentre pntrants et pntrs , autrement dit entre dominants et domins socialement (Graldine Puccini-Delbey, in La Vie sexuelle Rome, 2007). Si mme le sexe suscite linterrogation, cela montre bien quaucune catgorie ne va de soi et ne correspond un groupe clos, homogne et distinct des autres. Il faut donc admettre que toutes les catgories sont le produit dune construction sociale et historique : elles sont construites par un travail de dfinition juridique par les institutions, dimposition performative par certaines autorits dsireuses de mobiliser en dsignant les allis et les ennemis, le nous et le eux . Elles sont construites dans la tte des gens : cest limportance de la croyance (subjective) dans lobjectivit dun groupe qui lui confre cette objectivit ! Il faut donc se mfier des lectures essentialistes des catgories et des identits. Ces lectures entretiennent en effet la croyance en lexistence de groupes qui seraient immuables, homognes et ternels (des essences dans le langage philosophique). Dans une perspective essentialiste, les individus appartiennent pour toujours une catgorie donne, du fait de ses gnes, de sa culture de naissance, de son tat civil, bref de critres supposment objectifs et qui caractriseraient une fois pour toute une personne (et le distingueraient des autres). A linverse, les sociologues des identits (tels Claude Dubar, dans La Crise des identits ou JeanFranois Bayart dans LIllusion identitaire) revendiquent une position nominaliste : ce qui existe, ce sont des noms de catgories, des labels qui servent dsigner ou identifier. Mais il ny a pas dessence ternelle. Tout est soumis au changement : lidentit dune personne dpend de lpoque considre et du point de vue adopt. Les catgories utilises dpendent du systme de mots en usage dans un contexte donn. Ces modes didentification sont historiquement et

28

gographiquement variables parce quelles sont historiquement et gographiquement construites et objectives par certaines institutions et certains acteurs politiques. Il ny a pas de diffrences infranchissables et ternelles entre individus, mme si certains peuvent en avoir lintime conviction ! Il y a en revanche des sentiments dappartenance certaines catgories (et dassignation des Autres dans dautres catgories). Or, dune part, ces sentiments sont historiquement changeants. Par exemple, les nations ont une histoire : elles nexistent pas depuis toujours. Elles forment des communauts imagines , selon la formule de Benedict Anderson, qui ont merg lpoque moderne sous leffet notamment du dveloppement des technologies de communication et des efforts de centralisation des Etats. Dautre part, ces sentiments sont gnralement pluriels mais ils sont plus ou moins intenses (et donc significatifs) selon les contextes. En effet, les individus disposent tous dune diversit didentits, au sens ici didentifications par soi-mme (appartenance) et par les autres (attribution, reconnaissance). Mais ces identits ne servent vritablement caractriser une personne que lorsque celle-ci entre en interaction avec les autres. On se sent homme au contact avec une femme, on se sent jeune au contact des personnes plus ges, on se sent riche au contact avec des personnes moins fortunes, on se sent Franais au contact avec des trangers, on se sent rural au contact avec des urbains. Autrement dit, cest aux frontires que se construisent les sentiments dappartenance identitaire et que se forgent les outils de dsignation et de classement des individus. Cest donc en situation que les identits savrent plus ou moins mobilisables : on ne peut enfermer un individu une fois pour toutes dans une catgorie dont les attributs seraient figs, comme si celle-ci suffisait caractriser son identit et sa personnalit. Une telle perspective, fixiste , constitue lcueil principal des penses culturalistes et, pour certaines, xnophobes ou racistes. Le maniement des catgories constitue donc lune des principales difficults des sciences sociales puisque ces sciences ont pour objectif de dcrire un monde social dj en permanence ordonn et catgoris par les termes des institutions et les agents sociaux. Les sciences sociales se trouvent donc confrontes un objet dj fortement balis par le langage ordinaire . Il est souvent difficile de se rappeler que les notions apparemment les plus videntes et les plus ordinaires sont le produit, banalis, dune intense activit de construction symbolique du monde social. Il est souvent difficile de rsister la tentation dutiliser sociologiquement la notion de jeunes et de se souvenir quelle dsigne une population extrmement htrogne sur le plan des conditions dexistence. Ces obstacles, on la vu, sont plus particulirement dlicats dans le cadre des mthodes quantitatives puisque celles-ci ont pour principe dinscrire les units

29

statistiques dans des modalits prdfinies et strictement dlimites. Puisquon ne peut pas se passer des catgories, il faut tre vigilant sur leur construction et leur utilisation. Il faut notamment fuir toute perspective objectiviste. Celle-ci consiste dterminer de lextrieur, partir des instruments dobservation du monde social, quelques traits unifiant a priori objectivement un groupe : le lieu de rsidence gographique, les catgories objectives par ltat civil, lge mais aussi le nom de famille (utilis frauduleusement en guise de dtermination de lorigine ethnique puisque cette variable ne peut figurer dans les enqutes de recensement), lapparence physique (cf. critres didentification des personnes par la criminologie, discipline qui merge au XIXe sicle). Le danger dune telle perspective, cest larbitraire du classement, cest--dire lutilisation de critres qui nont aucune signification sociologique dans la mesure o ils segmentent des groupes qui, socialement, ne font sens pour personne. Ce caractre arbitraire sobserve dans la construction des classes dge : aprs tout, pourquoi runir dans un mme groupe les 18-24 ans et dcider qu 24 ans, lensemble des individus changeraient de catgories ? De mme, quel sens y a-t-il de sappuyer sur la catgorie immigr (au sens de n tranger ltranger) sachant quun tel ensemble regroupe des populations issues de pays aux situations extrmement contrastes et dotes de statuts lgaux trs variables (quoi de commun en effet, en terme de parcours de vie, entre un immigr belge et un immigr issu dAfrique subsaharienne) ? Dans ses versions les plus rigides, une telle dmarche peut tre qualifie d objectivisme , dans la mesure elle considre comme objectives (cest--dire ici stables, videntes, naturelles, ternelles, etc.) des frontires qui, dans la ralit, sont socialement construites, changeantes et enjeux de dbats. Les cueils de l objectivisme renvoient notamment aux prtentions positivistes de nombreux savants du XIXe sicle qui prtendaient tudier les phnomnes sociaux partir des outils et des modes de raisonnement issus des sciences naturelles. L objectivisme sobserve en particulier dans les efforts mis en uvre pour classer les langues, les races, les peuples, les croyances, etc. partir de critres dobservation supposment objectifs et universels mais avant tout fonds sur des impressions mal matrises. De mme que limpression tend montrer que le soleil tourne autour de la terre, de mme que les impressions premires donnent voir des races aux frontires intangibles ! chaque groupe mis en vidence est alors rattach un certain nombre de traits prsents comme naturels et universels. Pour ne prendre quun exemple, voici quelques extraits dun ouvrage fondateur de la criminologie, Le Crime politique et les rvolutions par Cesare Lombroso : Parmi les facteurs anthropologiques des crimes politiques, le premier qui se prsente nous est la race ; cela ressort avec vidence de la comparaison de lesprit rvolutionnaire trs accentu dans certains pays, avec

30

lapathie absolue que lon rencontre en dautres, mme gales conditions de climat et dorganisation sociale. Nous en aurions une preuve () dans les caractres spciaux qui distinguent, en France, les populations selon la prdominance du type brachycphale ou du type dolichocphale : le premier est frugal, laborieux, prudent, attach aux traditions et aimant luniformit ; le second a de grands besoins et travaille pour les satisfaire ; (). Ainsi, sur 89 grands novateurs et rvolutionnaires, () vingt brachycphales (Pascal, Mirabeau, Marat, Desmoulins), contre 69 dolichocphales (Racine, Voltaire, Lavoisier, Diderot, Rousseau, []).

Ces perspectives prteraient sourire si elles navaient pas servi de lgitimation scientifique aux entreprises racistes et, parfois, gnocidaires. Ainsi, au Rwanda, avant le gnocide de 1994, ltat imposait sur la carte didentit les mentions Tutsis ou Hutus comme sil sagissait de populations racialement ou ethniquement ou culturellement distinctes. Or, au-del mme de la question des mariages mixtes qui rendent les frontires flottantes, ces catgories ne reposent pas historiquement sur une distinction dordre culturelle (Tutsis et Hutus parlent la mme langue et partagent les mmes religions). Il ne sagit pas non plus dune distinction gographique : les deux groupes sont prsents conjointement sur lensemble du territoire rwandais et burundais. Il sagit encore moins dune opposition fonde des critres biologiques : malgr certaines thories cherchant dmontrer les origines ethniques respectives de ces deux peuples, aucun argument solide na pu tayer cette hypothse sociobiologique. Enfin la distinction nest pas historiquement lie la position sociale des personnes : si le pouvoir politique tait domin par certains Tutsis avant et pendant la priode coloniale, cela ne concernait pas tous les Tutsis (la plupart dentre eux noccupaient pas de positions leves socialement). rebours de ces visions cherchant dmontrer le caractre objectif et ternel de cette division, les historiens ont au contraire montr que celle-ci est principalement le produit dune construction politique qui sest progressivement impose lors de la colonisation belge. Il ne sagit videmment pas dune pure invention : ces catgories Tutsis et Hutus existaient dans le Rwanda prcolonial. Elles reposaient entre autre sur une opposition entre pasteur semi-nomade (Tutsis) et cultivateurs sdentaires mais elles ne sy arrtaient pas. Ensuite, ces catgories savraient relativement fluides : les familles ny taient pas enfermes une fois pour toutes. Enfin, elles ne constituaient que lun des critres de diffrenciation sociale (au mme titre que les lignages ou les appartenances gographiques). Or, anims dune approche scientiste des races humaines, porteurs dune vision religieuse qui les prdisposaient rechercher les enfants de Cham aux bords du Nil (qui seront identifis aux Tutsis) et, surtout, mus par des intrts politiques, les colons ont considr la distinction entre

31

Hutus et Tutsis comme une diffrenciation ethno-raciale objective et ternelle qui justifiait que le pouvoir administratif et les privilges sociaux soient octroys ce peuple apprhend comme suprieur : le peuple Tutsis . La dmarcation a donc t durcie non seulement par la politique coloniale mais galement par les revendications indpendantistes des leaders Hutus qui ont cherch la fois saffranchir de la tutelle belge et obtenir la dmocratisation du pays (puisque les Hutus taient majoritaires). Pour aller plus loin : - Chrtien Jean-Pierre, Le dfi de l'ethnisme : Rwanda et Burundi, 1990-1996, Paris : Karthala, 1997. - Franche Dominique, Gnalogie du gnocide rwandais, Paris : Tribord, 2004. - Vidal Claudine, Situations ethniques au Rwanda , in Amselle Jean-Louis et MBokolo Elikia, Au cur de lethnie, Paris : La Dcouverte, 1985.

32

Chapitre 2 La production statistique

Section 1. Population et chantillons


1. De la population lchantillon
On la vu, toute recherche quantitative repose sur lanalyse dune population compose dindividus ou dunits statistiques. Si lenjeu est de tirer des enseignements gnraux sur la population, il est, la plupart du temps, impossible de raliser une enqute exhaustive auprs de lensemble des individus dune population. Deux raisons expliquent cet obstacle : dabord, une enqute exhaustive savrerait souvent trop coteuse (en termes dargent, de temps, de formation des enquteurs, etc.) ; ensuite, le risque derreur augmente mesure que le nombre de cas tudi augmente. La plupart des recherches quantitatives travaillent donc partir dun chantillon, ce qui suppose de contrler le choix des individus soumis lenqute. Il sagit denqutes par sondage, cest--dire des enqutes sur une fraction de situations choisies parmi toutes les situations possibles (le terme de sondage pouvant galement tre dfini en tant que prlvement dun chantillon dune population , Philippe Alonzo). Comme le rappelle Patrick Lehingue dans Subunda, ce terme vient des sciences naturelles : il fait rfrence la sonde sous-marine charge, partir dun point de mesure, de dterminer la profondeur dune zone donne. Les principes thoriques des mthodes dchantillonnage viennent des mathmatiques probabilistes. Celles-ci indiquent que, pour connatre les vnements qui peuvent survenir dans une population donne, il est possible de ntudier quune petite partie de celle-ci, condition de respecter des rgles rigoureuses de slection de cette fraction de population. Si cet chantillon est bien construit, il est possible de gnraliser : les informations recueillies auprs de lchantillon sont supposes gnralisables lensemble de la population. Cest un principe dinduction ou dinfrence statistique qui commande le passage du particulier (lchantillon) au gnral (la population). Or comment construire un chantillon pertinent ? Cette question sous-entend quil faut faire face deux obstacles principaux : - Un obstacle thorique : la reprsentativit des chantillons. Un chantillon est dit reprsentatif (1) quand il possde la mme structure que la population de rfrence ; (2) quand tous les membres de la population ont la mme probabilit de faire partie de lchantillon (cf. 2 et 3). - Un obstacle pratique : laccs aux individus (cf. 4).

33

Il existe donc diffrentes techniques pour constituer un chantillon qui soit scientifiquement pertinent. On en retiendra deux.

2. Les sondages alatoires


Les chantillons alatoires sont des chantillons qui sobtiennent par tirage au sort. Ils reposent sur le seul hasard pour nintroduire aucun biais. Dun ct, les sondages alatoires sont les plus pertinents dun point de vue mthodologique. De lautre, il sagit des enqutes les plus dlicates raliser. Pourquoi ? - Pour pouvoir tirer au sort, il faut dabord disposer dune liste exhaustive de la population (cest--dire une base de sondage ). Seul lINSEE possde un fichier de lensemble des rsidents en France grce au recensement de la population. Mais il nest pas tenu jour entre deux recensements (qui dsormais soprent par tranches gographiques). Du fait des ncessaires contraintes juridiques de protection des donnes individuelles (Loi Informatique et libert ), laccessibilit ces donnes (et plus gnralement tout fichier recensant une population) est strictement rglement. Or il nexiste pas dautres fichiers exhaustifs des mnages. Pendant longtemps, lannuaire tlphonique a pu tre considr comme une base de sondage adquate pour entreprendre un tirage au sort alatoire. Mais aujourdhui, cette perspective est remise en cause : en 2006, seuls 83 % des foyers sont abonns un tlphone fixe (parmi ceux-ci, 14 % ne sen servent que pour naviguer sur internet et entre 15 % et 20 % figurent sur liste rouge). Or cette population nest pas reprsentative de lensemble des personnes rsidant en France. En revanche, pour tudier certaines pratiques lectorales, les listes lectorales peuvent servir de base de sondage , quoiquelles ne contiennent pas les coordonnes des personnes. Il sagit donc dune mthode judicieuse pour tudier les membres dun groupe dont lexistence est institue (cest--dire objective par une institution comme les tudiants dune cole, les adhrents dune association, etc.). - Deuxime difficult : il est ncessaire de respecter absolument le tirage alatoire. Si une personne est tire au sort, il est impossible statistiquement daller voir son voisin. Pourquoi ? Tout simplement parce que si on ninterrogeait que les personnes prsentes, lchantillon serait biais car constitu avant tout des personnes prsentes chez eux un moment T, ce qui implique que ces personnes disposent dun profil sociologique particulier. On retrouve la mme problmatique avec les refus de rpondre : les sans rponses ne sont pas distribus alatoirement dans la population. Ils correspondent des catgories sociales particulires dont les contours varient videmment selon le type denqute : les plus gs et notamment les femmes

34

ges, les personnes les moins diplmes, les personnes en situation dexclusion, etc. La mthode alatoire suppose donc de multiplier les relances. Malgr ces difficults, cette mthode prsente deux avantages majeurs. Le premier avantage, cest que cette mthode ne prsuppose aucune connaissance pralable de la structure sociologique de la population. Le deuxime avantage du sondage alatoire, cest la possibilit de mesurer mathmatiquement la qualit des rsultats, cest--dire la marge derreur. Le rsultat est une estimation dont les carts la vraie valeur peuvent tre mesurs partir de lquation suivante : Estimation marge < vraie valeur < estimation + marge Cette quation est vraie avec une avec une probabilit p, cest--dire pour une part p des chantillons tests. Cette probabilit p, cest ce quon appelle le niveau de confiance ou le seuil de confiance : la probabilit que le vrai rsultat se situe dans cet intervalle. Gnralement, le niveau de confiance privilgi par les statisticiens est de 95 %. Donc quand certains sondeurs voquent une marge derreur de 2 %, ils oublient gnralement de dire quil y a 95 % de chances que lestimation soit situe plus ou moins 2 % de la vraie valeur dans la population. Les sondages alatoires reposent donc sur un raisonnement probabiliste, thoris entre autres par le mathmaticien allemand Carl Gauss (1777-1855). Celui-ci montre que la qualit des rsultats ne dpend pas (ou trs peu) de la taille de la population, ni de ce quon appelle le taux de sondage (rapport entre lchantillon et la population). Bref, que 10 %, 1% ou 0,1 % de la population ait t sonde ne change rien (ou presque) au problme. En revanche, ce qui compte, cest la taille de lchantillon ! Pour le comprendre, il suffit de penser au lancer de ds dont on sait que chaque face a thoriquement 1/6e de chance dtre tir. Pour que la distribution obtenue se rapproche de la distribution thorique (16,66 % pour chaque face), il faut multiplier les lancs et ainsi simmerger dans la loi des grands nombres . La marge derreur volue galement selon la vraie distribution : plus on se rapproche dune proportion de 50 % des sonds, plus la marge derreur est importante. Pour conclure sur ce point, il faut souligner les srieuses difficults mthodologiques lorsque certains enquteurs (comme les instituts de sondage) sautorisent utiliser des chantillons numriquement faibles et le justifient par la petitesse de la population. Or, que lon interroge 1000 personnes pour reprsenter la France entire ou pour reprsenter lagglomration de Saint-Quentin-en-Yvelines, la marge derreur est (quasiment) la mme. De la mme manire, ds quun sondage est ralis auprs de 1000 personnes, lanalyse des rsultats au sein des souschantillons (les cadres , les 18-25 ans, les sympathisants du Front national, etc.) est souvent

35

problmatique, du fait de ces faibles effectifs. Cela explique pourquoi, par exemple, les opinions mesures de faon baromtrique (cest--dire rgulirement) auprs des personnes qui se disent sympathisants du Front national voluent souvent de faon erratique. Tables la loi statistique (extrait dune table de Gauss seuil de confiance de 95 %)
Taille de lchantillon % dans lchantillon 2% 10 % 20 % 33 % 50 % 2,8 6 8 9,4 10 1,4 3 4 4,7 5 1 2,1 2,8 3,3 3,5 0,9 1,9 2,5 3 3,2 0,7 1,5 2 2,4 2,5 0,6 1,3 1,8 2,1 2,2 0,3 0,6 0,8 0,9 1 100 400 800 1000 1600 2000 10 000

3. Les chantillons empiriques ou par quotas


Les chantillons par quotas sont, quant eux, des chantillons qui respectent des critres de composition ou de structure. Ces chantillons ne reposent plus sur le hasard mais sur une construction raisonne qui sappuie sur le principe suivant : si un chantillon est identique la population totale en ce qui concerne la distribution statistique dun certain nombre de critres, il ne sera pas diffrent en ce qui concerne la distribution des caractres inconnus que lon cherche connatre. Cest une mthode qui na pas de justification thorique : elle ne repose pas sur une loi mathmatique mais seulement sur lexprience, do le terme dchantillon empirique . Empiriquement, certains enquteurs se sont rendu compte que cette mthode marchait , cest--dire donnait des rsultats assez proches de ceux obtenus par un chantillonnage alatoire. Cest donc avant tout pour des raisons pratiques que cette mthode est frquemment utilise, notamment par les instituts de sondages franais. Elle permet en effet de contourner les contraintes des chantillons alatoires. Cependant, elle souffre dun obstacle important : il nexiste pas doutils statistiques permettant de mesurer la qualit des rsultats. Cest uniquement par convention que certains instituts franais fournissent des marges derreurs : dun point de vue mathmatique, a ne repose sur rien, sinon sur lexprience. En contrepartie, cette technique permet aux enquteurs de savoir en temps rel quels sont les critres de recrutement des interviews. Donc ils peuvent interviewer nimporte qui, pourvu que ces personnes appartiennent aux catgories dont les quotas nont pas encore t combls. Cette mthode suppose deux choses. Premirement, elle implique un fort contrle des

36

enquteurs pour sassurer quils ne trichent pas pour respecter leurs quotas. Deuximement, elle suppose au pralable de connatre la composition sociale de la population, du moins ses principales caractristiques, cest--dire les variables considres comme les plus discriminantes, les plus prdictives de lopinion des sonds. Pour la majeure partie des enqutes par sondages raliss auprs dun chantillon reprsentatif de la population franaise (ou de lune de ses composantes), les variables les plus frquemment utilises sont le sexe, lge et le groupe socioprofessionnel du chef de mnage (souvent arbitrairement considr comme le mari). Quotas utiliss dans la majorit des sondages pour construire un chantillon reprsentatif de la population franaise des 18 ans et plus (en 2006)
PROFESSION CHEF DE FAMILLE AGE SEXE 18-24 ans 25-34 ans 35-49 ans Homme Femme TOTAL 48 % 52 % 100 % 50-64 ans 65 ans et plus TOTAL 12 % 18 % 28 % 21 % 21 % 100 % Agriculteur Artisan, commerant, chef dentre. Cadre, profession intellectuelle sup. Profession intermdiaire Employ Ouvrier Inactif, retrait TOTAL 2% 5% 11 % 14 % 10 % 22 % 36 % 100 %

Par ailleurs, les chantillons sont gnralement stratifis en fonction de la rgion et de la catgorie dagglomration. Lenjeu est davoir un chantillon qui ressemble le plus fortement possible la population mre. Par exemple, il y a relativement peu dhabitants dans la rgion Limousin (1,2 % de la population franaise). Si lon recherchait une proportionnalit parfaite sur un chantillon de 1000 personnes, cela impliquerait peine 12 interviews du Limousin, avec le risque quils prsentent des caractristiques spcifiques. Pour rpondre ce problme, les enquteurs interviewent un peu plus dhabitants du Limousin (une vingtaine) puis effectuent un redressement, cest--dire quils rtablissent ensuite, par calcul, la proportionnalit. Plus gnralement, le redressement est souvent utilis pour respecter les quotas (en fin de sondages, lorsquil manque des reprsentants de certaines catgories). Le redressement repose sur un travail de pondration : on affecte aux catgories un coefficient appel coefficient de redressement pour que les rsultats finaux respectent les proportions de la population mre (selon les principes dun calcul en croix ).

37

Lutilisation des quotas, surtout dans le cadre de sondages industriels , soulve une difficult dj entrevue : le flou des catgories mobilises dans les quotas. Ainsi, remplir les quotas suffit-il tablir que cet chantillon est reprsentatif ? Cest ainsi largument mobilis aujourdhui par certains sondeurs pour dfendre la pratique du sondage en ligne. Or avoir un chantillon compos de 22 % dindividu appartenant un mnage dont le chef est ouvrier suffit-il tablir que cet chantillon est reprsentatif ? Une telle perspective oublie quune catgorie aussi vaste que la catgorie des ouvriers nest en rien homogne et quelle est traverse dimportants clivages. Sil y a bien la mme proportion douvriers dans lchantillon que dans la population, cela ne garantit en rien que les ouvriers interviews soient, eux, reprsentatifs de la population ouvrire dans son ensemble. Dans une enqute ralise par Daniel Gaxie et son quipe la fin des annes 1980, 1000 habitants de la Somme ont t interviews sur des questions relatives la politique de protection sociale. Parmi ceux-ci, on compte 270 ouvriers. Thoriquement, pour respecter la structure de la population du dpartement, il y aurait d y avoir 148 ouvriers qualifis et 121 non qualifis. Or, dans les faits, il y eut 183 qualifis et 87 non qualifis. Autrement dit, lenqute est marque par une surreprsentation des ouvriers les mieux pays, les plus dots en capital culturel, les moins fragiliss par les transformations socioconomiques, etc. Or ces critres des capitaux conomiques, culturels et professionnels clivent fortement la classe ouvrire et sont susceptibles davoir des effets sur la distribution des opinions et, plus gnralement, sur la propension mme mettre publiquement des opinions sur des questions complexes comme celles relatives la protection sociale. La non-reprsentativit en termes de structure peut affecter la reprsentativit des opinions ou des pratiques mesures dans lenqute. De la mme manire, la catgorie cadres et profession intellectuelles suprieures rassemble des individus au statut dactivit disparate : managers, mdecins indpendants, des avocats et des enseignants du secondaire, etc. Pour les annes 2002-06 (baromtre mensuel TNS Sofres-SIG), ces derniers sont en moyenne salaris du secteur priv (31 %), salaris du secteur public (29 %), inactifs (dans le cas de conjoint[e]s de cadres qui ne travailleraient pas ou qui seraient dj la retraite, 22 %), travailleurs indpendants (10 %) et chmeurs (8 %). Or ds lors quon mesure des variations dans la distribution des opinions exprimes par les interviews de cette catgorie (qui reprsente 12 % des chantillons lorsque la population est lensemble des Franais de 18 ans et plus), il est dlicat de savoir si ces variations sont imputables lvolution des reprsentations sociopolitiques des cadres ou des volutions dans la composition des chantillons : il arrive frquemment que la rpartition, dans cette catgorie, entre salaris du public , salaris du priv et travailleurs indpendants ne corresponde pas la rpartition

38

moyenne. De telles variations sont susceptibles davoir un impact certain sur les rsultats, tant on sait que, sur de nombreux enjeux politiques et sociaux, les points de vue exprims par les cadres du priv et les cadres du public peuvent tre, en moyenne, relativement distincts. Ce constat peut tre fait au sujet de lensemble des modalits des variables utilises pour les quotas. Pour prendre un dernier exemple, les 18-24 ans comprennent environ 53 % de jeunes actifs et 47 % de jeunes scolariss. Selon les chantillons, cette proportion peut singulirement varier, rendant les rsultats recueillis auprs de cette catgorie potentiellement problmatiques. Plus gnralement, il faut se souvenir que la qualit des rsultats dpend du nombre dinterviews : par consquent, lexamen des rsultats recueillis auprs des sous-chantillons (par exemple, les seuls 18-24 ans qui reprsentent 12 % de lensemble des Franais de 18 ans et plus, soit 120 interviews lorsque lchantillon comprend 1000 individus) doit prendre en compte cette faiblesse numrique pour viter toute surinterprtation.

4. Les absents et le refus de rpondre


Au-del des problmes dchantillonnage (alatoire / quotas), se pose plus gnralement le problme de laccs aux personnes et de lacceptation rpondre aux enqutes. Cette difficult se pose videmment ds lors quil sagit datteindre des populations itinrantes ou marginales (cf. le texte du livret de TD : LABERGE Danielle, ROY Shirley, Les enqutes auprs ou propos des populations marginales ), de groupes aux frontires suffisamment floues pour ne bnficier daucune comptabilisation statistique (les juifs sur lesquels travaille Sylvie Strudel) ou, dans le cas franais, de minorits ethniques dont il est interdit doprer le recensement. Mais ces difficults daccs aux individus concernent galement les enqutes par sondage ralises auprs dchantillons reprsentatifs de plus de 30 ans aux Etats-Unis et depuis prs de vingt ans en France. Il est cependant difficile dtablir avec prcision quel est lampleur de ce refus. Pour les instituts de sondage, cest en effet un secret industriel puisque leur raison dtre est fonde sur leur rigueur mthodologique, elle-mme dtermine par la reprsentativit de leurs chantillons. Dans une interview dj ancienne, lex-prsident de la SOFRES voquait plus de 50 % de refus. Il existe toutefois une enqut ralise en 2000 qui sest efforc de recueillir des donnes sur ce phnomne (voir GRUMBERG Grard et al. (dir.), La Dmocratie l'preuve : une nouvelle approche de l'opinion des Franais, Paris : Presses de la FNSP, 2002). Cette enqute par sondage a t ralise par la SOFRES pour le compte du laboratoire de recherche CEVIPOF. Sur 8 305 appels, les enquteurs ont dnombr 473 faux numros, 1 283 nonrponses (i.e. absence), 3510 refus, 750 impossibilits (car hors quotas) et 141 questionnaires 39

incomplets. Au final, il ny a donc eu que 2148 questionnaires valids, soit un taux dacceptation de 46 % (3039 sur les 6549 personnes prsentes chez eux) et un taux de rponses brut de 26 % (2148 sur 8305). Cette proportion est dailleurs sans doute plus forte que, dans la plupart des autres enqutes, puisquil y a eu dans celle-ci jusqu 10 appels pour un mme numro en cas dabsence. Au-del des absences qui sexpliquent aussi par les difficults daccs aux personnes (prsence sur liste rouge, pas de possession de tlphone fixe, digicodes lentre des immeubles, scurisation des rsidences prives, inscurit dans certains quartiers qui dissuade les enquteurs de sy rendre, etc.), comment comprendre ce refus de rpondre ? Quelles en sont les raisons ? A cette question, on peut juste suggrer quelques hypothses puisque si les interviews ne souhaitent pas rpondre, on ne peut leur demander pourquoi ! Ces hypothses sont notamment regroupes par Patrick Lehingue (dans Subunda, pp. 92-93) :

Exaspration par rapport au tlmarketing (dont les oprateurs se prsentent de plus en plus souvent comme des enquteurs) Peur du fichage, des intrusions, de linterrogation scolaire ou administrative Manque de temps ou de disponibilit : il est coteux de rpondre un sondage, alors quon nobtient rien en change sinon la satisfaction davoir donn son avis ou racont sa vie (sauf dans certaines enqutes en ligne ou enqutes dites qualitatives pour lesquels les enquts peuvent tre rmunrs ce qui pose l des questions dordre thique ou politique : comment justifier la rmunration de citoyens dans lexercice de leur rle politique [ie. Participer
une enqute dopinion dont les sondeurs louent les vertus dmocratiques dexpression populaire] ?)

Gnralisation du sentiment dtre manipul, que les sondeurs sont des menteurs, etc. Pour conclure, il ne faudrait pas penser que ces difficults daccs et dacceptation

constituent seulement des obstacles pratiques (augmentation du temps donc du cot des enqutes, etc.). Elles constituent, au contraire, des problmes mthodologiques majeurs puisquelles mettent en jeu la pertinence mme des rsultats recueillis. En effet, face de tels taux dabsence et de refus de rpondre, on peut mettre en doute la reprsentativit de nombreux chantillons. tre accessible et accepter de rpondre aux enqutes forment ainsi deux caractristiques ingalement partages dans lespace social : la population des rpondants effectifs est une population non reprsentative de lensemble des rsidents franais. On constate ainsi une sous-reprsentation des groupes sociaux situs aux deux ples de la pyramide sociale ; les rpondants aux enqutes par sondage disposent en moyenne dun niveau dtudes suprieur au niveau moyen enregistr sur lensemble de la population en France.

40

Comparaison entre les niveaux de diplme des interviews et les niveaux de diplme de la population franaise
Population non scolarise de 15 ans ou plus (2007) Sans diplme + CEP BEPC, CAP, BEP Bac Ens. Suprieur TOTAL 31,5 % 30,2 % 15,3 % 22,9 % 100 % Cumul des vagues du baromtre SOFRES-SIG (2002-2005) 22 % 35 % 16 % 27 % 100 % Diffrence -9,5 % +4,8 % -0,7 % +4,1 %

Les sondeurs utilisent souvent la mtaphore picturale : ils disent dresser un portrait des Franais, un clich de lopinion publique... Or on constate ici que leur clich est flou ! Pour reprendre une formule de Patrick Lehingue : dans la photo de famille, il manque le cousin de province !

Section 2. La collecte des donnes : archives et questionnaires


Une fois les techniques dchantillonnage dfinies, les chercheurs peuvent entreprendre linvestigation empirique, le travail de terrain . Or, si les enqutes qualitatives reposent principalement sur des matriaux de premire main (cest--dire collects par le chercheur luimme ou par son quipe), les enqutes quantitatives peuvent reposer sur des donnes htrognes. En effet, le travail statistique peut sappuyer sur des donnes recueillies par lenquteur ( travers le questionnaire) mais il peut aussi sappuyer sur des donnes collectes par dautres institutions, et notamment les institutions administratives (archives). Dans tous les cas, le chercheur doit tre extrmement sceptique et rigoureux dans cette opration de collecte des donnes. Leur recueil ne va pas de soi (administrer un questionnaire ne constitue pas un acte anodin et ordinaire). Aussi faut-il toujours se demander si les dispositifs de collecte et dagrgation des donnes ne tendent pas produire des effets sur les rsultats eux-mmes.

1. Limpact des conditions de production statistique : biais et artefacts


Il faut, dans un premier temps, sarrter sur ces donnes statistiques que les chercheurs utilisent sans avoir eux-mmes prsids leur collecte. De nombreuses institutions archivent le 41

produit de leur activit et/ou sappuient sur des instruments statistiques pour exercer leurs missions. Cest notamment le cas des administrations publiques qui se nourrissent dune pluralit dindicateurs pour dcrire et valuer leur action sur leurs secteurs respectifs (police, justice, ducation, logement, sant, etc.). conomistes et sociologues peuvent alors semparer de ces donnes statistiques pour rpondre leurs questions de recherche. Or la difficult mthodologique, cest que ces institutions recueillent rarement des informations pour des raisons purement scientifiques. Si le chercheur sappuie sur de telles sources, il doit alors prendre en considration les procdures mises en uvre pour recueillir les informations, afin de ne pas considrer que ce matriau lui livre la vrit. Autrement dit, les sciences sociales doivent ici semparer de la mme prudence que lhistorien face ses archives : cest une critique des statistiques officielles quil faut entreprendre. 1. Lexemple du suicide. A quels types dobstacles les chercheurs peuvent-ils faire face ? Pour rpondre cette question, appuyons-nous sur lexemple des analyses quantitatives du suicide. Cette illustration est judicieuse, puisque cest sur un tel objet qumile Durkheim a crit lun des ouvrages fondateurs de la sociologie franaise et notamment dans son versant quantitatif (Le Suicide). Il y met en application la dmarche intellectuelle et mthodologique expose dans Les Rgles de la mthode sociologique. Aussi de trs nombreux chercheurs ont opr un diagnostic critique du Suicide pour mettre lpreuve la validit des thses durkheimiennes : si les donnes posent problme, cest tout ldifice sociologique qui menace de seffondrer. On ne compte donc plus les recherches ayant rinvesti les statistiques du suicide afin de mettre en cause ou de dfendre le travail de Durkheim. Lautre intrt de cet exemple, cest de rappeler que mme un acte aussi intime que le suicide peut tre apprhend comme un fait social dont lexplication nest pas rductible ni des facteurs psychologiques, ni une analyse purement individuelle (cf. chapitre 1, section 1). Le suicide rpond des logiques sociologiques (Durkheim parle de lois ) que les statistiques permettent de mettre jour. Il sempare alors des statistiques administratives collectes dans diffrents pays, sur une longue priode, afin de mettre en vidence des corrlations rgulires : ses donnes montrent que certaines situations, cultures ou positions sociales prdisposeraient au suicide. Il existe alors diffrents types de suicides qui rsultent soit dun excs (altruiste) ou dun dfaut (goste) dintgration sociale, soit dun excs (fataliste) ou dun dfaut (fataliste) de rgulation sociale. Mais sa thse a t fortement mise en question du fait des nombreux dfauts des sources statistiques utilises : si ses donnes laissent dsirer, alors ses conclusions ne peuvent tre valables ! Effectivement, Durkheim a conscience de certaines limites : il admet notamment que

42

les sources statistiques simposent de faon ngative : il est impossible dutiliser dautres mthodes dinvestigation puisque, par principe, sil y a suicide, lindividu ne peut tre interrog. Mais hormis quelques petites remarques en note, il ne va pas beaucoup plus loin dans lanalyse critique des conditions pratiques de production des statistiques. En formulant dailleurs lhypothse de la comparabilit des donnes dans le temps et dans lespace, il postule implicitement lhomognit des procdures de recueil et dagrgation de linformation. Selon Christian Baudelot et Roger Establet (Durkheim et le suicide), trois critiques ont t plus prcisment adresses aux donnes collectes par Durkheim : a) Bien quil prenne soin dapporter une dfinition proprement sociologique, il ne sassure pas que les donnes quil utilise ont t collectes conformment sa dfinition. Par exemple, la dfinition inclut les cas de sacrifice personnel commis par certains soldats hroques (il va ainsi lencontre des prnotions qui dfinissent ces morts comme des sacrifices vertueux). Or jamais les institutions ne considreront une telle mort comme un suicide (cela lui ferait perdre tout prestige). Plus gnralement, les proccupations des instances qui qualifient la mort nest pas dordre scientifique mais, selon les cas, dordre mdical ou judiciaire. Il y a des enjeux lourds : faut-il que la police enqute ? Pourra-t-il y avoir versement dune assurance vie ? Nanmoins les carts lis la divergence entre dfinition sociologique et dfinitions pratiques sont bien moindres que pour dautres phnomnes beaucoup moins accessibles (actes de dlinquance par exemple). 2. La comptabilit du suicide est affecte par le phnomne de la dissimulation. Qui plus est, comme la dissimulation est plus marque dans certains milieux sociaux, les statistiques rvlent davantage lingale capacit dissimuler que lingale propension au suicide. Cette critique est cependant partiellement invalide par Baudelot et Establet qui rappellent le chanage administratif aboutissant lattribution de la cause suicide dans les donnes dtat-civil. Le nombre dintermdiaires impliqus dans cette procdure denregistrement rend peu probable un phnomne de dissimulation massif et spcifique certains milieux sociaux. 3. Les diffrentes sources statistiques ne concident pas entre elles. Baudelot et Establet confirment que les donnes collectes par la source tat civil INSERM INSEE (causes mdicales de dcs) ne sont pas quivalentes celles collectes par ladministration judiciaire. Mieux, la police et la gendarmerie ne grent pas les dossiers de la mme manire : il est alors probable que le constat dun nombre plus important de dcs dans les petites communes que dans les grandes agglomrations tient ces procdures diffrentes denregistrement (la police tend moins transmettre lINSERM les causes de dcs en cas de mort violente que la gendarmerie). Ds lors, il faut admettre que la comparaison internationale est encore plus

43

problmatique puisque chaque pays dispose de ses propres traditions en matire denregistrement et de comptabilit des causes de dcs. Comme le souligne Dominique Merlli (cf. texte du livret de TD) : Du suicide son inscription statistique, il y a divers intermdiaires qui sont susceptibles de dfaillances et que la question de la qualit ou de lexactitude des donnes ne retentit pas seulement sur lvaluation densemble du phnomne (le nombre de suicides dans un pays) mais aussi sur la signification de ses variations statistiques. Lexemple du suicide permet de distinguer deux types d erreurs lis soit la production des donnes, soit une mauvaise interprtation des donnes 2. Les biais sont des formes derreurs systmatiques imputables linstrument de mesure (Merlli, p. 126). Par exemple, linsuffisante transmission lINSERM des causes de morts violentes par la police constitue un biais pour tout chercheur qui souhaiterait analyser le suicide partir de cette source statistique. On considre gnralement que les statisticiens travaillent biais constant , cest--dire que, tant que le mode de recueil des informations et les principes de catgorisation ne varient pas, les erreurs sont globalement toujours les mmes. Autrement dit, les carts observables dune vague denqute lautre ne sont pas ou peu affects par les problmes mthodologiques car ces derniers sont a priori identiques chaque vague. Par exemple, dans le cas de la mesure du suicide, les procdures de comptage des morts et de leur cause restent les mmes pendant de longues priodes dans chaque pays. Dans ce cas, les biais lis lattribution des causes ne changent pas ou peu, si bien que les volutions observes dans un mme pays peuvent tre analyses comme des volutions dans la pratique du suicide ! Autre exemple, les sondeurs ne parviennent pas connatre avec exactitude la proportion de sonds qui se disent proches du Front national ou qui avouent avoir rcemment vot pour le FN. Cest un biais invitable dans la mesure o le FN suscite de trs fortes critiques dans lespace public : il est alors difficile dassumer publiquement son got pour un tel parti. Mais ce biais nest pas trop dommageable dans la mesure o il est a priori le mme chaque sondage. Ce nest videmment pas le cas dans des conjonctures au cours desquelles le FN noccupe plus exactement la mme position dans lespace partisan. Sa prsence au second tour de llection prsidentielle en 2002 rend sans doute plus dicible, en tout cas moins illgitime, lexpression de cette prfrence partisane. De mme, le changement de leadership la tte du parti en 2011 peut entraner certains changements en matire de discrdit associ lnonciation publique dune proximit au FN. Toujours est-il quen dehors de ces squences problmatiques pour les

44

sondeurs, toute volution significative dans la proportion de personnes se dclarant proche du FN peut alors sinterprter comme une volution proprement politique. 3. On parle dartefacts lorsque les variations de la mesure sont imputables plus aux caractristiques de linstrument qu celles de lobjet mesur . Par exemple, il peut y avoir artefact dans les carts entre les taux de suicides de diffrents pays si les procdures de comptage et dattribution des causes de la mort divergent sensiblement. Face des rsultats qui voluent, le danger est alors de croire lvolution du fait social lui-mme, alors quil sagit simplement dune volution dans les conditions de la production statistique : cest la manire de mesurer qui a chang et qui automatiquement modifie la mesure. Dans le cas du suicide, il est impossible de savoir si les diffrences observes tiennent ces divergences mthodologiques ou bien des rapports diffrencis au suicide. Autre exemple dartefact dj soulign : les fortes variations des opinions des interviews regroups dans la catgorie sympathisants FN dune vague denqute. Enfin, dernier exemple, enqutes internationales sur le niveau scolaire (exercices traduits de lAnglais pas mmes rythmes dapprentissage selon les pays etc.) Attention cependant : se focaliser sur les biais et les artefacts, on pourrait tre tent de tomber dans une sorte de purisme mthodologique qui laisserait entendre quil existerait de vrais chiffres que la science pourrait collecter en amliorant ses procdures de recueil dinformation et de comptage. Or ne perdons pas de vue le constat suivant : les phnomnes collectifs et autres faits sociaux nexistent qu travers les instruments qui permettent de les mesurer. Sil y a partout des actes de dlinquance, la dlinquance en tant que fait social propre une socit donne na pas de consistance tant quaucun instrument ne cherche la mesurer et lui donner une certaine figure.

2. La construction du questionnaire
De nombreuses recherches ne peuvent sappuyer sur des donnes existantes. Le chercheur doit alors lui-mme recueillir les donnes, partir dun questionnaire visant convertir le questionnement (cest--dire la problmatique) en questions. Le questionnaire regroupe lensemble des questions qui seront poses aux enquts et qui correspondent aux variables que lon cherche tudier. Franois de Singly explique que le rle dun questionnaire, cest d expliquer ce que les acteurs font par ce quils sont . On pourrait videmment ajouter : expliquer ce que les acteurs pensent par ce quils sont. Autrement dit, les questionnaires visent mettre en vidence des faits sociaux , des rgularits, des tendances objectives : il sagit ici dtablir la frquence de 45

certaines pratiques, le partage de certaines opinions, etc. Mais ils ont aussi et surtout pour objectif didentifier les facteurs qui expliquent les pratiques et les reprsentations, cest--dire les facteurs qui prdisposent les individus faire telle ou telle chose ou penser telle ou telle chose (prdisposer au sens de rendre statistiquement probable). Par consquent, indpendamment du mode de passation (face face, autoadministr, tlphone, etc.), tout questionnaire doit intgrer deux types de questions, deux types de variables - Des variables relatives lobjet tudi (par exemple, les comportements politiques, le rapport aux institutions, lenvironnement ou lcole, les reprsentations du travail ou de lordre social, les pratiques en matire de vacances, de sant ou de sexualit, etc.). Lenjeu ici est alors de trouver des questions mthodologiquement pertinentes pour objectiver les pratiques et les attitudes des individus sur les thmatiques de lenqute. - Des variables sociologiques, cest--dire des variables qui caractrisent sociologiquement les individus (sexe, ge, position sociale, capital scolaire, salaire, valuation subjective de sa position sociale, religion, position dans la famille, environnement gographique, etc.). Ces questions appeles renseignements signaltiques sont mthodologiquement pertinentes si le dcoupage des catgories est entrepris de faon judicieuse (cf. chapitre 1, section 3). A. Lartificialit de la situation denqute. Les enqutes par questionnaire sont fondes sur une interaction entre un enquteur et un enqut. Cette interaction peut tre directe (dans le cas du face--face), mdiatise (dans le cas du tlphone) ou simplement imagine (dans le cas de questionnaires auto-administrs en ligne). Il nen demeure pas moins que, comme tout contexte daction, la situation de recueil des informations est susceptible davoir un impact sur les rponses recueillies. Dune part, comme dans toute situation, les participants en ngocient la dfinition (G. Bateson) : de cette dfinition dcoulent les rles quils sont supposs endosser lgitimement (ceux denquteurs et denquts). Ici, la ngociation est souvent lavantage de lenquteur puisque lenqut na dautre choix que de se soumettre la rgle du jeu (du jeu de rles !) ou de ne pas jouer (via des stratgies dexit telles que le refus de rpondre). Lenquteur impose donc non seulement les principes de linteraction ( je pose des questions / vous rpondez ) mais galement son contenu ( vous devez rpondre aux questions que je me pose, en choisissant lune des modalits de rponse que je vous suggre ). Dans le cas de sondages industriels, lenjeu des commanditaires de lenqute est dailleurs de brider au maximum la latitude des interlocuteurs et,

46

par consquent, la teneur des interactions : lenquteur est tenu de lire un synopsis dont il ne peut scarter (officiellement, pour ne pas orienter les rponses ; officieusement, pour garantir la rapidit de passation du questionnaire). Or cette situation, artificielle, peut tre vcue par certains interviews comme un rappel de situations plus familires comme celles rencontres lcole ou face des agents administratifs. Tandis que certains vivent la saisie du questionnaire sur un mode plutt ludique ou sympathique, dautres considrent quil sagit dune situation violente symboliquement et/ou anxiogne (notamment pour ceux qui ont vcu douloureusement leur scolarit ou leurs expriences face ladministration). Dans tous les cas, ce qui caractrise avant tout lattitude des enquts dans la situation denqute, cest un souci de ne pas perdre la face vis--vis de son interlocuteur (plus que de dire la vrit ou de rpondre en son for intrieur). Les interviews engagent alors diffrentes stratgies (souvent intuitives) pour satisfaire cet objectif de conserver la face. On ne peut donc analyser les rsultats dune enqute sans lire les rponses sous ce prisme-l ! Dautre part, comme dans toute situation, les enqutes par questionnaire mettent en relation des individus qui ne se rsument pas ces rles endosss dans le contexte denqute. Les personnes sont galement positionnes, chacune, dans lchelle sociale. Elles sont ingalement dotes en ressources (notamment ducatives et culturelles). Elles sont porteuses de dispositions lies au pass social des individus et de leur famille, la socialisation, aux expriences accumules, la trajectoire sociale. Autrement dit, ds lors quil y a face--face (ou, dans une moindre mesure, interaction tlphonique), les relations denqute sont aussi et avant tout des relations sociales au cours desquelles chacun tend typifier son interlocuteur (cest--dire se le reprsenter socialement, le faire entrer dans des catgories), se positionner son gard (souvent dans un rapport hirarchique, par exemple homme > femme , vieux > jeune , Franais de souche > immigr , CSP + > CSP , etc.) et agir selon ces typifications. Or les situations denqute sont potentiellement asymtriques, ds lors que linterview se vit en situation dinfriorit sociale face lintervieweur (sentiment dtre culturellement domin). Dans ces situations, ne pas perdre la face signifie faire bonne figure et donner la bonne rponse , cest--dire celle dont on peut avoir le sentiment quelle est attendue par lenquteur ou bien celle dont on sait quelle nest pas socialement illgitime (comme peut ltre linclinaison pour le Front national) ou bien encore celle qui est a priori peu coteuse car plus facile justifier (les rponses modales servent souvent de rponses refuges ). Cest le cas par exemple, de lautopositionnement sur une chelle en 7 modalits incarnant laxe droite-gauche : beaucoup des choix 4 ne correspondent pas un authentique positionnement centriste mais une incapacit se positionner.

47

Cette tentation de vouloir donner la bonne rponse concerne donc principalement les catgories de la population les plus dmunies socialement ou culturellement parlant. Soit elles savrent effectivement incomptentes , cest--dire effectivement incapables de rpondre la question pose parce que cette dernire serait trop complexe dans sa formulation ou dans son contenu, trop sotrique ou trop loigne de lexprience vcue. Soit elles se sentent illgitimes ou incomptences, parce quhabituellement peu autorise parler en leur nom propre et exprimer leurs propres opinions.

B. Des ficelles rdactionnelles. Il faut donc tre particulirement vigilant dans la construction du questionnaire. Le propre des enqutes quantitatives de premire main (cest-dire des enqutes qui ne travaillent pas ni sur des donnes dj recueillies, ni sur un corpus documentaire existant) est de reposer sur un questionnaire standardis : il ne peut y avoir dexploitation statistique des rsultats que si les enquts ont t soumis au mme questionnaire (principe dquivalence prcdemment expos). Par consquent, la principale difficult des enqutes par questionnaire, cest que celui-ci est fix une fois pour toute (on ne peut plus revenir en arrire) et quil est cens tre soumis aux enquts dans un laps de temps relativement court (sinon les enquts ne sont plus quivalents : la variable du temps intervient comme facteur explicatif supplmentaire des variations, ce qui complique lanalyse des donnes). Cest l que rside lune des diffrences majeures avec les enqutes par entretiens : le guide dentretien peut, lui, tre amlior au fur et mesure des interviews car celles-ci ne sont pas mises en quivalence et codes sous une forme statistique. La qualit des rsultats dpend donc troitement de la pertinence du questionnaire. Malheureusement, il est difficile de dire dans labsolu ce quest un bon questionnaire. La pertinence dun questionnaire dpend fortement de la problmatique, de lidentit des interviews (selon leur capital culturel ou leur proximit avec le sujet de lenqute) et des conditions de passation du questionnaire (par tlphone, en face--face ou sur un mode auto-administr). Ici lenjeu est donc nouveau didentifier les ventuels obstacles mthodologiques plutt que de donner des rponses toutes faites. La premire des interrogations se poser est de savoir sil vaut mieux privilgier questions ouvertes (qui laissent linterview rpondre librement, par ses propres mots) ou questions fermes (qui encadrent la rponse de linterview dans des modalits prdtermines

48

par lenquteur). Pour y rpondre, demandons-nous dabord pourquoi les questions fermes sont, ce point, prdominantes dans les enqutes par questionnaire : (a) Elles cotent moins chres (en termes de temps, de complexit, de finance). En effet, le traitement statistique des rponses aux questions fermes est simple puisque les modalits possibles sont en nombre limit et surtout sont prcodes. linverse, les questions ouvertes gnrent souvent des rponses tellement htrognes et disperses quelles en deviennent inexploitables. (b) Comme le codage est fix lavance, il y a moins de risque derreurs de la part des enquteurs (mauvaise retranscription des propos lie la prise de note rapide), ainsi que moins darbitraire dans le regroupement des rponses des fins de traitement statistique. Ds lors quil y a une pluralit denquteurs, il risque toujours dy avoir une pluralit dinterprtations des rponses. Mais derrire ces rels avantages pratiques, les questions fermes sont souvent critiquables sur un plan intellectuel. Face elles, les questions ouvertes prsentent en effet deux qualits majeures : (a) Elles permettent de privilgier les catgories travers lesquelles les individus eux-mmes peroivent et classent le monde social. Si lenjeu de lenqute est de travailler sur les reprsentations et les systmes de valeurs, les mots utiliss par les interviews ne sont videmment ni anodins, ni interchangeables ! (b) Elles permettent de diversifier les perspectives de codage des informations. Le codage est alors effectu a posteriori, une fois que les rponses ont t recueillies. Ce sont ces dernires (leur frquence, leur distribution, leur diversit) qui peuvent amener lenquteur tablir les modes de classement les plus pertinents au regard de la problmatique de lenqute. A ce titre, les questions ouvertes peuvent savrer plus particulirement utiles dans une phase exploratoire. Par exemple, si lenjeu de la recherche est de comprendre les modalits de construction des opinions publiques, il peut tre plus judicieux, dans un premier temps, de laisser sexprimer les interviews (sur les personnes qui ont compt dans la formation de leurs ides ou les propositions de campagne qui les ont intresses). Ces rponses exploratoires pourront ensuite tre utilises pour laborer le questionnaire et tester les arguments suggrs par les interviews (et non imposs par les enquteurs partir de leurs propres points de vue). Les questions ouvertes sont ici prcieuses pour construire des hypothses qui pourront tre (in)valides par lenqute quantitative proprement dite. Face cette ambivalence, Franois de Singly invite une position de compromis. Premirement, il est possible (et souvent judicieux) de mler louvert et le ferm pour un mme ordre de questions. Par exemple, dans un questionnaire sur la participation aux activits

49

associatives, on peut dabord demander aux interviews : Participez-vous la vie associative ? , puis Si oui, dans quelle mesure ? . Deuximement, dans une question ferme invitant les interviews choisir une ou plusieurs modalits de rponses prdfinies, il faut toujours prvoir une catgorie Autre et laisser la personne sexprimer si elle retient cette modalit. Au-del de lalternative entre ouvert et ferm, il existe quelques ficelles pour faire face aux deux difficults majeures de toute enqute par questionnaires : minimiser limposition de problmatiques et favoriser lexpression personnelle. En somme, lenjeu est dattnuer le risque dartefacts, cest--dire les effets associs lenqute. Les enquteurs font face en effet au paradoxe de lobservateur : celui-ci doit dcouvrir comment les gens parlent et agissent quand on ne les observe pas, mais la seule faon de le dcouvrir, cest de les observer. Douze recommandations peuvent ainsi tre formules1. 1. Garantir la protection des personnes : il faut toujours souligner lanonymat et faire en sorte que lexercice napparaisse pas scolaire ou administratif. 2. Ne pas livrer immdiatement la problmatique de lenqute. Par exemple, sil sagit dun questionnaire sur lducation, il peut tre utile de dbuter par une question invitant les enquts hirarchiser leurs sujets de proccupations (lducation tant noye parmi de nombreux thmes). De la sorte, la mesure de lintrt de lenqut peut tre tudi en comparaison avec dautres centres potentiels dintrt (et non comme si seul ce sujet pouvait le proccuper). 3. Toujours inclure une option sans rponse (et le suggrer). Cest utile la fois pour amliorer la construction du questionnaire (sil y a une trop forte proportion de sans-rponses, cela peut indiquer que la formulation des questions est trop complexe), pour tudier les sansrponses elles-mmes (qui sont-ils ?) et pour nanalyser les rsultats que sur les personnes qui sexpriment. 4. tablir un quilibre entre modalits positives et modalits ngatives (en nombre et en qualit). Comme les questionnaires sont souvent vcus comme la passation dun examen, cela permet de ne pas indiquer par le choix des mots quelle pourrait tre la bonne rponse. 5. tre vigilant sur le choix des mots (et notamment les mots introductifs). En cas de doute, il ne faut pas hsiter utiliser la technique du split, cest--dire diviser lchantillon en plusieurs sous-chantillons auxquels on soumet diffrentes versions de questions afin de voir si la formulation elle-mme ne produit pas deffets sur les rponses recueillies. Pour ne prendre quun
1

Ces recommandations sont principalement inspires de louvrage de Franois de SINGLY : LEnqute et ses mthodes : le questionnaire (Paris : Nathan, 1992).

50

exemple, on ne recueille pas exactement les mmes rponses si la question porte sur lacceptation de l autorisation ou de l interdiction des discours racistes. 6. Autoriser les doubles ou les triples rponses. Il faut faire en sorte que le questionnaire ressemble le moins possible un problme scolaire : il ny a pas une bonne rponse ! Par ailleurs, cela permet aux interviews de prsenter plusieurs facettes de leur personnalit et dassumer des pratiques moins lgitimes (quon noserait pas forcment avouer sil fallait ne retenir quune rponse). Enfin, au niveau de lexploitation des rsultats, cela permet de croiser les rponses et de savoir quoi on par ailleurs rpondu ceux qui ont choisi telle ou telle modalit. 7. tre attentif lordre des rponses. Il faut privilgier la prsentation alatoire dans lordre des modalits, ainsi que la rotation des items lorsque la mme question est pose pour diffrentes situations. Il faut notamment se mfier de deux effets potentiels, susceptibles daffecter le recueil des informations. Souvent peu engags dans la relation denqute, les interviews ont en effet tendance retenir la dernire modalit cite par lenquteurs (hypothse de la rponse en cho) mais ils ont surtout tendance retenir la premire modalit cite (hypothse du primary effect li aux difficults de mmorisation ou au sentiment que les premires rponses suggres seraient les plus lgitimes). Selon vous, quels sont les deux problmes les plus graves ? (Jean-Paul Grmy, 1988).
Ordre direct - Le chmage - Le terrorisme - La faim dans le monde - La guerre - La surpopulation du monde - Le racisme - Le non-respect des droits de l'homme - L'insuffisante formation professionnelle des jeunes - La dlinquance 34 8,5 21 15 1,5 5 8 1 1 Ordre inverse 19 7 18 18 2 8,5 10 6 8 Diffrence -15 -1,5 -3 +3 +0,5 +3,5 +2 +5 +7

Cependant, il faut parfois respecter un ordre fixe dans la prsentation des modalits. En effet, lorsquil sagit de questionner les individus sur le temps quils consacrent aux pratiques culturelles, il faut placer la tlvision en tte. Comme toutes les enqutes montrent que la tlvision occupe plusieurs heures par jour, la placer en milieu ou en fin de liste risquerait damener les interviews sous-estimer le temps quils lui consacrent pour rester cohrent avec les autres rponses. 8. tre attentif lordre des questions. Il convient de garantir une cohrence globale dans le questionnaire. o Cela signifie dabord quil faut placer les questions les plus impersonnelles avant questions les plus personnelles. Autrement dit, il faut mettre en tte les questions 51

les moins intimes, celles dont les rponses sont souvent publiques ou faciles noncer publiquement. Comme pour toute relation, lenjeu est de gagner la confiance de linterview pour lamener tre sincre. On ne peut donc pas lamener immdiatement livrer ses facettes les plus intimes ou les moins lgitimes socialement. o Ensuite, les interviews sont souvent soucieux de produire de la cohrence dans leurs rponses. Ils sont donc sensibles au contexte engendr par le questionnaire (effet de halo). Par exemple, aux Etats-Unis au milieu des annes 1980, une affaire despionnage sovitique men par de supposs journalistes occupe lactualit du pays. Dans un sondage, seuls 44 % des Amricains interviews disent accepter la prsence de journalistes sovitiques sur le sol amricain . Toutefois, une enqute relativement similaire est propose un autre chantillon. On demande dabord aux interviews sils acceptent la prsence de journalistes amricains sur le sol sovitique (la quasi-totalit adhre cette proposition). Puis, on leur demande sils acceptent la prsence de journalistes sovitiques sur le sol amricain : 70 % sont dsormais favorables cette prsence ! o Le questionnaire produit enfin des effets de connaissance . Par exemple, une enqute consacre aux relations parents-enfants interroge un chantillon de parents sur les activits quils ont avec leur(s) enfant(s). La question est ouverte et ceux-ci mentionnent trs rarement la discussion en tant quactivit. Lorsque la mme enqute, reproduite quelques temps plus tard, demande dabord aux parents sils ont des conversations avec leurs enfants (question ferme), une majorit dentre eux incluent alors spontanment la discussion parmi les activits quils ont avec leurs enfants. 9. Ne mettre quune question par question. Les rsultats ne sont interprtables que si la question est la plus comprhensible et univoque possible. Par exemple, dans une enqute consacre la scurit routire, figure la question suivante : tes-vous pour le port de la ceinture larrire ? Cette question pose problme car on ne peut savoir prcisment quoi les interviews ont rpondu : - tes-vous pour le port de la ceinture (tout court) ? - tes-vous pour le port de la ceinture (tout court) ? 10. Mnager la mmoire. Cela signifie, notamment dans des passations par tlphone, quil faut limiter le nombre de modalits pour chaque question.

52

11. viter les ngations (ou pire les double ngations). Un exemple caricatural : Ne pensezvous pas quil aurait mieux valu que la France ne participe pas la guerre du Golfe ? 12. Inclure des rponses centristes dans les chelles dattitude. Il faut souvent viter de placer les interviews face une alternative tranche (pour / contre), mme si un tel questionnement peut ressembler une procdure rfrendaire (o lenjeu est seulement dobtenir des majorits). Il convient alors de suggrer des rponses modales (chelle en quatre comprenant des rponses modales). Cest le cas, par exemple, de cette question trs ancienne du baromtre TNS Sofres / Le Figaro Magazine : Faites-vous tout fait confiance, plutt confiance, plutt pas confiance ou pas du tout confiance Nicolas Sarkozy pour rsoudre les problmes qui se posent en France actuellement ? . Voici les rponses de la vague doctobre : - Tout fait confiance - Plutt confiance Sous-total confiance - Plutt pas confiance - Pas du tout confiance Sous-total pas confiance 24 % 42 % 66 % 5% 25 % 30 %

Lintrt dune chelle en quatre modalits est doffrir une interprtation plus riche des rsultats. Dun ct, il est possible de regrouper les confiants et les pas confiants pour mesurer la popularit effective du chef de ltat. Mais il peut tre tout aussi intressant de comparer les rponses intenses (tout fait / pas du tout : 47 %, contre 39 % pour Franois Fillon) avec les rponses faible intensit (plutt / plutt pas : 42 %, contre 55 % pour F. Fillon). Toutefois, les rponses modales pouvant servir de rponses refuges, le questionnaire doit permettre aux interviews de ne pas se positionner. Il faut donc suggrer la possibilit de ne pas rpondre (rgle n3).

3. La consistance des opinions


A. Les spcificits de lopinion publique sondagire . Les questionnaires sont prcieux pour mesurer les pratiques sociales. Mais ils servent galement saisir des valeurs, croyances, reprsentations, convictions. Sagit-il donc dune mthode adquate pour apprhender des opinions ? Et par consquent, les enqutes quantitatives (au premier rang desquelles figurent les sondages dopinion publis dans la presse) peuvent-elles permettre de mesurer lopinion publique ? Mais quest-ce que lopinion publique ? Partons tout dabord dune boutade attribue au fondateur du premier institut de sondage amricain, Georges Gallup qui, en 1936, a pu 53

prouver lefficacit de sa mthode en prdisant la victoire de F.D. Roosevelt lors de llection prsidentielle amricaine : Q : Docteur Gallup, quelle dfinition donneriez-vous dun sondage dopinion ? R : Un instrument de mesure de lopinion publique. Q : Oui, mais quentendez-vous par opinion publique ? R : Tout simplement ce que mesurent les sondages. Les sondages dopinion prtendent donc mesurer lopinion publique. Seulement, si tout le monde sempare de ce terme, il est bien dlicat de le dfinir. Et surtout cette assimilation entre opinion publique et rsultats des sondages nest accepte que depuis quelques dcennies. En effet, historiquement, le concept dopinion publique ne correspond pas ce que mesurent les sondages. Le terme est assez ancien mais sa conception positive apparat au milieu du XVIIIe sicle, dans le cadre de la lutte contre labsolutisme, contre larbitraire royal. Lun des premiers concevoir positivement cette notion, cest Jean-Jacques Rousseau. Initialement, lopinion publique, cest une opinion restreinte, celle des lites claires. Cest le produit dune discussion critique, au cours de laquelle des particuliers font un usage public de la raison : ce nest pas le sens commun qui relve dans ce cas du vulgaire . Le XIXe sicle est toutefois marqu par un processus de dmocratisation qui rsulte de l entre des masses dans la vie publique et politique. Lopinion publique devient une opinion populaire. Mais elle est publique parce quelle est exprime publiquement ( travers les manifestations, les mobilisations collectives ou lors dun scrutin par exemple). Elle est donc dmonstrative, volontaire et collective. Or les sondages reposent sur une conception diffrente de lopinion publique, une conception videmment en lien avec lvolution des systmes politiques. Il faut donc analyser quelles sont les conceptions de lopinion publique sous-jacentes la pratique des sondages (et diffrentes des anciennes conceptions) :

La premire diffrence, cest que les opinions sont sollicites. Ce ne sont donc pas des opinions

publiques mais des rponses prives. La formule rcurrente de nombreux sondeurs ( Les Franais nous disent que... ) est problmatique. En ralit, ils devraient dire : Les personnes extrmement diffrentes que nous avons sollicites ont accept de rpondre aux questions que nous leur avons poses et de choisir les modalits que nous leur avons imposes ! . Bien souvent, il sagit de questions quils ne staient pas forcment poses ou alors des opinions quils navaient pas cherch rendre publique. Bref, la situation denqute par sondage est une situation artificielle : il sagit dune interaction fugitive entre deux personnes qui ne se connaissent pas mais qui adoptent des rles denquteur et denqut (cf. prcdent). Cette situation transforme des rponses prives en opinions publiques. 54

La deuxime diffrence, cest que les opinions sont recueillies individuellement : il ne sagit pas dune

expression collective comme dans le cadre dune manifestation, ou bien dune opinion qui merge dun rapport de forces ou dune discussion, ou bien dune opinion qui slabore progressivement dans un contexte de dbat. Ici, lopinion est prconstruite puisquelle est cense sexprimer travers des cases prdfinies par lenquteur et prleve individuellement, en dehors des situations habituelles dexpression des opinions. Or on sait que, selon le type de situations, lexpression des opinions varie. Par exemple, nos opinions peuvent varier selon que lon est conducteur dautomobile ou piton ! De mme, on ne sexprime pas de la mme faon devant ses parents, ses collgues, ses amis ou ses suprieurs hirarchiques. Or l, on isole la personne de son environnement social : cette situation na pas dquivalent socialement parlant... Il est difficile de dire quoi correspondent ces opinions : sagit-il du for intrieur des individus ? Mais dans la vraie vie , dans quelles circonstances met-on de telles opinions ? Habituellement, les opinions sexpriment dans des situations dinteraction. Ici, les opinions sont atomises.

La troisime diffrence, cest que lopinion publique est simplement considre comme une agrgation, la

somme de toutes les opinions individuelles. Elle nest publique que parce quelle est plurielle. Or, cela amne placer tous les individus sur le mme plan, indpendamment de leur poids social respectif, ou de leur matrise du sujet de lenqute, ou encore de leur intrt personnel pour le sujet de lenqute. Il y a un principe de mise en quivalence : tous les individus sont considrs comme quivalents face lenqute. Donc cela ne permet pas rellement de mesurer le potentiel de mobilisation ou dopposition : cela tend niveler les attitudes. Pour rsumer, on peut dire que lun des principaux problmes soulevs par les sondages dopinion est de convertir des principes dordre politique en principes dordre mthodologique. Comme pour le vote, on considre quun homme = une voix. Comme pour le vote, la procdure retenue (choix de la question et des modalits de rponse) est fixe par les commanditaires du sondage et non par les individus eux-mmes. Donc de ce point de vue, il est souvent difficile de dire si les opinions sont publiques. Il est mme difficile de dire sil sagit dopinions ! Le problme rside donc la fois dun point de vue individuel (quelle est la consistance des opinions recueillies, cest--dire quel est le statut des rponses ?) et dun point de vue collectif (quel est le statut des rsultats agrgs ?).

B. Des postulats contestables. Dans un article clbre (1972), Pierre Bourdieu remet en cause de manire radicale cette prtention des sondeurs mesurer lopinion publique . Pour lui, lopinion publique saisie lors des enqutes par sondage nexiste pas : il sagit dun pur artifice. Pour tayer sa dmonstration, il sefforce de montrer le caractre contestable des trois 55

postulats qui justifient la pratique sondagire : (1) tout le monde peut avoir une opinion ; (2) toutes les opinions se valent ; (3) il y a un accord sur les questions qui mritent dtre poses. (1) Tout le monde peut avoir une opinion. Il ne sagit pas ici de considrer que les individus sont des idiots culturels. Mais plutt dindiquer que tout le monde na videmment pas dopinions sur tous les sujets : la connaissance dun sujet et la capacit opiner personnellement sur ce sujet nest pas universellement partage. Or il est souvent difficile didentifier la proportion dinterviews dont les rponses renvoient des opinions solides , cest--dire prexistantes lenqute et justifiables. Dune part, on la vu, pour faire bonne figure , certains enquts peuvent avoir la tentation de rpondre mme dans les cas o le sujet leur est inconnu ou peu comprhensible : il peut sagir de ne pas passer pour un ignare ou bien de vouloir faire plaisir son interlocuteur Dautre part, les enquteurs eux-mmes ont souvent tendance minimiser les sans-rponses. Cest notamment le cas des instituts de sondages : le faible taux de sans-rponse / NSP constitue paradoxalement un argument commercial : ils peuvent se prsenter face leurs clients comme ayant bien rempli leur rle. Or, cest un paradoxe parce que, au contraire, les rsultats deviennent moins significatifs puisquon agrge des rponses motives et des rponses hasardeuses. Exemple incongru : la question Trouvez-vous que les chercheurs franais remplissent leur mission trs bien, plutt bien, plutt mal, trs mal ? (CSA, avril 2006), seuls 2 % se placent dans les sans-rponses. Les instituts mobilisent diffrents moyens pour rduire les sans-rponses : la multiplication des consignes de relance ; labsence de la modalit Je nai pas dopinion ; la prsence dans la question dun rappel prcd de vous savez que... (sous-entendu potentiellement violent symboliquement : vous tes suppos savoir !) ; labsence de questions pralables qui demandent aux personnes sils savent de quoi il sagit et quelles comprhensions ils ont du sujet. Or, si tout le monde ne comprend pas les questions, ceux qui les comprennent ne les comprennent pas toujours de la mme faon. Cest notamment le cas lorsque les questionnaires utilisent des termes complexes, flous ou quivoques. Non seulement les interviews risquent dtre heurts par cette complexit, mais en plus lagrgation des rponses savrera prcaire puisque tout le monde naura pas choisi la mme modalit pour les mmes raisons (car tous nauront pas compris la mme chose !).
Exemple trivial : sondage CSA / Marianne, 23 novembre 2005 Question 1. Pensez-vous que la France devrait ? - Changer de modle social - Prserver et renforcer le modle social existant - Ne se prononcent pas

46 % 51 % 3%

56

Ici, jamais lenquteur ne demande aux sonds sils savent ce quest le modle social franais et ce quils entendent par modle social franais. Au-del de cet exemple vident, il faut mme admettre que cest lensemble des termes les plus couramment utiliss par les lites (et notamment par les lites administratives) qui posent problme. Exemple donn par Daniel Gaxie partir dune enqute par questionnaire ralise en 1986 auprs dun chantillon dinterviews picards, tabli selon la mthode des quotas. Dans ce dense questionnaire, on peut dabord citer une question lie au contexte politique du moment et donc apparemment vidente : Certains disent que, pour sen sortir, il faut introduire plus de libralisme dans la socit franais. tes-vous tout fait daccord, plutt daccord, plutt pas daccord, pas du tout daccord, sans rponse ? 28 % ne rpondent pas (modalit explicite), 48 % sont daccord, 24 % ne sont pas daccord. Or, quelques questions plus loin, on demande ceux qui ont accept de rpondre cette 1re question : Dites-moi ce que reprsente le libralisme pour vous ? Cest une question ouverte :

29 % ne rpondent pas 28 % assimilent libralisme libert (faire ce que lon veut, circuler plus librement, pouvoir dire ce quon pense) 11 % se placent sur un terrain thique (se prendre en main, tre moins goste) 7 % oprent une confusion avec dautres termes seulement 25 % fournissent une rponse qui cadre bien au dbat politique du moment (laisser plus de place au libre march, rduire les impts, la bureaucratie, la rglementation, etc.).

Une autre exprience ralise en 1988 et cite par Patrick Lehingue vient confirmer ce problme de consistance des opinions. Il sagit dun sondage command par Le Monde qui soumet aux sonds une vingtaine de mots trs frquemment utiliss dans les dbats politiques du moment et qui leur demande ensuite de dfinir ces termes. La question est donc ouverte. Le taux de sansrponse est trs lev pour certains termes : protectionnisme (24 %), alternance (26%), drglementation (36 %), tat-providence (42 %), etc., ce qui nimplique pas ncessairement incomptence mais, pour certains, sentiment dincomptence (peur de dire des btises, sentiment dillgitimit, etc.). Lun de ses mots, cohabitation , suscite linverse seulement 8 % de sans rponse mais seuls 31 % donnent ce mot un caractre politique et parmi ceux-ci seuls 10 % disent le prsident dun bord, le Premier ministre de lautre . Sans surprise, lexprience na jamais t renouvele dans la presse ! (2) Toutes les opinions se valent. La critique de ce postulat par Bourdieu comprend l encore une dimension politique : en effet, Bourdieu reproche aux sondages daccorder le mme poids aux personnes directement concernes par les questions du sondage avec des personnes qui y sont indiffrentes. De mme, le sondage rend quivalent les individus explicitement mobiliss et 57

qui sexpriment dans lespace public et ceux qui ninterviennent pas. Les sondages tendent oublier que les enjeux sociaux reposent sur des rapports de forces entre des collectifs et non sur une simple agrgation dopinions individuelles. Cest une critique dj formule par les marxistes contre le vote : le vote joue une fonction conservatrice puisquil fait appel aux majorits silencieuses, peu politises et manipulables, partir dune procdure extrmement pauvre. Sur un plan mthodologique, cette critique invite tre vigilant sur les contours de la population enqute et donc de lchantillon. Qui doit tre interview ? Cela a-t-il du sens dagrger des populations extrmement disparates du point de vue de leur proximit au sujet, de leurs expriences, de leur connaissance, de leur potentiel de mobilisation ? Les rsultats ont-ils alors une signification ? Ou ne sagit-il pas de donnes purement artificielles qui rassemblent des chvres et des choux ?
Sondage IFOP-Acteurs publics (juillet 2006) : Diriez-vous que vous tes plutt daccord ou plutt pas daccord avec la proposition suivante ? Il faut augmenter la dure lgale du travail. Ensemble de la population Retraits Actifs Plutt daccord 48 % 62 % 40 % Plutt pas daccord 52 % 38 % 60 % NSP 0% 0% 0%

En tout cas, si vous souhaitez recueillir lopinion de lensemble de la population, il faut systmatiquement penser ajouter des variables permettant de trier lchantillon en fonction de leur proximit au sujet. Par exemple, tout questionnaire sur lcole doit tre accompagn dans la partie renseignements signaltiques de questions relatives la frquentation du systme scolaire (parent dlves scolariss public / priv, niveau dtudes, etc.). De la mme manire, il faut tre vigilant sur les questions relatives des pratiques (soit pratiques effectives, soit pratiques potentielles). Prenons dabord les sondages prlectoraux : ces derniers nont de relle valeur que peu de temps avant le scrutin. Les sondages raliss un an auparavant posent problme car la majeure partie des sonds ne se sont pas encore investis dans llection et placs en situation de choix : il ne sagit donc pas dintention, au sens o le sondeur ne ferait quenregistrer des choix motivs. Donc le sondeur met en quivalence des attitudes qui divergent fortement. Cest la mme chose concernant le potentiel protestataire. Il existe de nombreux sondages qui demandent aux personnes si elles seraient prtes manifester, faire grve, etc. Cela permet notamment de connatre le profil de ceux qui jugent ces attitudes lgitimes (ou en tout cas qui ne les jugent pas illgitimes) mais cela ne permet pas de connatre le profil de ceux qui rellement manifestent ou font grve. Une enqute pertinente sur le sujet doit donc soprer non pas auprs dun chantillon reprsentatif de lensemble de la population mais sur le terrain , cest--dire lors des manifestations.

58

(3) Il y a un accord sur les questions qui mritent dtre poses. Comment savoir que les questions poses sont des questions que se posent rellement les personnes interroges ? Ce qui est en revanche sr, cest que les questions poses sont les questions qui intressent les commanditaires. Loutil nest donc pas neutre socialement et politiquement aux yeux de Bourdieu : les problmatiques qui sont proposes par les sondages dopinion sont subordonnes des intrts politiques, et cela commande la fois la signification des rponses et la signification qui est donne la publication des rsultats. Les sondages peuvent donc tre analyss comme des instruments proprement politiques dont la fonction consiste imposer lillusion quil existe une opinion publique comme sommation dopinions individuelles, quil existe quelque chose qui serait la moyenne des opinions ou lopinion moyenne. Le caractre artificiel du pourcentage a pour fonction de dissimuler le fait que ltat de lopinion est le un systme de forces : ce nest pas une sommation mais une opposition. Le rle politique des sondages sobserve particulirement lorsque les hommes politiques sappuient sur les donnes denqute pour dire : lopinion publique est avec nous . Le problme des sondages rside alors dans cette confusion entre des opinions constitues, mobilises et des dispositions qui ne sont pas des opinions (= discours qui peut se formuler avec une certaine prtention la cohrence). Cest cette opinion-l (celle admise implicitement par ceux qui font des sondages dopinion) qui nexiste pas. Bourdieu critique donc ce postulat pour des raisons politiques : il dnonce la capacit dimposition de problmatiques des commanditaires des sondages. Dune certaine manire, il dnonce la capacit des acteurs dominants dfinir quels sont les enjeux qui comptent et quelle est la manire de cadrer le dbat autour de ces enjeux. On retrouve l encore une critique quivalente celles formules contre le vote : la procdure est extrmement pauvre (juste un bulletin dans lurne, pas de mandat impratif) et les lecteurs sont soumis aux alternatives proposs par les organisateurs du scrutin. Ds lors, la prsentation de lenjeu tend bien souvent suggrer une rponse vidente (parce que les arguments en prsence dans le dbat ne sont pas tous suggrs) : il y a un effet de cadrage de la problmatique. Souvent, cet effet se produit lorsque on soumet les sonds une alternative binaire qui oublie dautres positions ventuelles.
Sondage IFOP Mtro (juin 2007) : Vous personnellement, si vous en aviez le choix, que prfreriez-vous ? - Gagner moins dargent et avoir plus de temps libre 35 % - Gagner plus dargent et avoir moins de temps libre 63 % - NSP 2%

Or la question aurait pu tre formule de la sorte : Gagner plus dargent et avoir moins de temps libre vs. Avoir plus de temps libre et gagner moins dargent ou bien Gagner plus dargent et consacrer moins de temps sa famille vs. Gagner moins dargent et consacrer plus de temps sa famille . 59

Enfin, les modalits proposes (cest--dire les rponses) tendent elles aussi conditionner lavis des personnes. Il y a notamment de grandes diffrences entre les deux enqutes suivantes :
Sondage BVA-Le Figaro : Les syndicats de la SNCF et de la RATP appellent une journe de grve le jeudi 18 octobre pour protester contre la rforme des rgimes spciaux de retraite. Vous-mme pensez-vous que ce mouvement est tout fait justifi, plutt justifi, pas vraiment justifi ou bien pas justifi du tout ? Tout fait justifi 18 % Plutt justifi 25 % Pas vraiment justifi 24 % Pas du tout justifi 31 % NSP 4% Sondage CSA-LHumanit : Vous savez que plusieurs syndicats de la SNCF, de la RATP, dEDF-GDF, de lANPE, de lUNEDIC, de lducation nationale appellent une journe nationale daction et de grve le 18 octobre prochain, notamment sur lavenir du systme de retraite et des rgimes spciaux. Quelle est votre attitude lgard de ce mouvement ? Le soutien, la sympathie, lindiffrence, lopposition, et enfin lhostilit Soutien 39 % Sympathie 15 % Indiffrence 17 % Opposition 18 % Hostilit 8% NSP 3%

C. Mesurer la consistance des opinions. Ces exemples confirment que les rponses recueillies dpendent beaucoup de la nature du questionnaire et de la manire dont les individus vivent la situation denqute (se vivent-ils en situation dlve qui doit apporter de bonnes rponses, cest--dire des rponses juges publiquement ou socialement dicibles ? Ou au contraire profitent-ils du relatif anonymat de linterview pour noncer des opinions quils noseraient pas livrer dans dautres circonstances ?). Mais comment parvenir mesurer cette consistance des rponses, notamment lorsque les questionnaires invitent les interviews exprimer leurs opinions ou rvler des comportements privs ou secrets (vote, pratiques sexuelles, actes illgitimes ou illicites, etc.). Depuis les annes 1980, un certain nombre de recherches sefforcent de rpondre ces questions. Pour cela, elles reposent sur un protocole exprimental. Mener une exprience consiste comparer deux vnements que seule une dimension distingue. Il sagit de faire varier une variable ( toutes choses gales par ailleurs ) et dobserver si cette variation pse sur les rsultats. En loccurrence, en matire denqutes par questionnaire, ces expriences peuvent tre de deux natures :

Soit elles portent sur les effets des conditions dans lesquelles lenqute se droule (lieu de lentretien, identit de lenquteur, etc.). Par exemple, lenquteur doit-il tre le plus effac possible ou au contraire doit-il tre trs actif ? Soit elles portent sur les effets du questionnaire lui-mme (lordre des questions ou leur libell).

60

Ces recherches reposent sur la mthode du split. Le principe est de diviser lchantillon en deux ou trois sous-chantillons dont la composition est identique. Chaque chantillon se voit proposer une version diffrente du questionnaire ou alors une situation denqute spcifique. (1) Les enqutes de Jean-Paul Grmy ralises en 1988 ont ainsi pu mettre jour limportante proportion de rpondants flottants : ils rpondent mais sans disposer dun avis vritablement solide sur le sujet de lenqute. Deux expriences permettent de le mettre jour. Le problme de la rponse mdiane. Face une mme question, un premier chantillon dispose de deux modalits (plus / moins) tandis que le second chantillon dispose de trois modalits (plus / autant / moins). Ltat devrait verser aux coles libres plus dargent quactuellement, [autant dargent quactuellement] ou moins dargent quactuellement ? - Plus - Autant - Moins - Sans avis 48 % 19 % 33 % 33,5 % 32 % 14 % 21 %

Cette exprience soulve le problme de lintensit de lopinion exprime. Les chercheurs sont gnralement partags sur lide dintroduire une rponse mdiane comme celle-ci. Dun ct, sans rponse mdiane, les interviews sont soumis une alternative binaire qui incite les hsitants rpondre sans avis . De lautre, les rponses mdianes peuvent tre retenues par des interviews sincrement convaincus du bien-fond de lactuelle distribution dargent public et dautres indiffrents ou qui nont pas dopinions prexistantes lenqute : en somme, rpondre autant est peu engageant (a ne mange pas de pain !). Il faut toutefois noter quil ny a pas de modification de la distribution des rponses signifiantes (on reste dans les deux cas dans un rapport de 70/30 entre les plus et les moins ). La rponse sans avis. Lexprience consiste ici soumettre un premier chantillon la mme question que prcdemment et placer un second chantillon face une question pralable demandant si les personnes ont un avis sur la question (question filtre). [En ce qui concerne largent que lEtat verse aux coles libres, avez-vous un avis sur la question ? Si oui,] ltat devrait verser aux coles libres plus dargent quactuellement, autant dargent quactuellement ou moins dargent quactuellement ? - Plus - Autant - Moins 34 % 31,5 % 13 % 18 % 21 % 10 %

61

- Sans avis

22 %

(pas de sans avis)

51 % (en filtre)

La majorit des chercheurs est favorable soit lutilisation dun tel filtre, soit la prsentation explicite de la possibilit de ne pas rpondre, afin de diminuer le stress du rpondant. A nouveau, si la distribution des rponses signifiantes volue (de 34/13 18/10), leur rapport varie peu (de 72/28 64/36). Ces expriences montrent toutefois quau regard des 48 % dinterviews supposs attendre de ltat davantage de moyens pour les coles publiques, lajout dun filtre et dune rponse mdiane fait chuter cette proportion 18 %. Au-del de lide que les sondages reposeraient sur des bases peu solides, il est surtout intressant de constater que ces rpondants flottants ne se recrutent pas alatoirement dans lespace social : ils se distinguent des autres par quelques traits sociologiques et notamment un plus faible niveau dinstruction. On peut alors se demander, cest lhypothse de Grmy, si la rponse plus dargent nest pas survalorise car apparaissant la plus conforme aux normes sociales (indpendamment du sujet en question). (2) Lenqute mene par le CEVIPOF en 2000 porte sur lattitude des Franais lgard de la dmocratie. Mais cette enqute rpond galement des enjeux mthodologiques : parvenir mesurer la consistance des opinions exprimes par les interviews soumis au questionnaire. Trois types dexpriences, inspires de travaux amricains, sont mens et prsentes par Nonna Mayer (cf. article du livret) : - Des expriences de mise en scne. Lenjeu est dviter dutiliser des notions abstraites et dcontextualises. Il faut plutt raconter des petites histoires qui mettent en scne les pouvoirs publics face aux problmes du moment puis de dcliner ces histoires en plusieurs versions diffrentes. Lexprience consiste alors tester si les individus sorientent en fonction de grands principes ou en fonction dun contexte. Par exemple, sagissant de lenseignement de certains cours en langues trangres, les Franais se prononcent-ils sur lapprentissage de langues diffrentes en gnral ou bien leur opinion varie-t-elle selon les langues en question ? Ici, cest la seconde hypothse qui est la bonne : en effet, une majorit trouve normal que de tels cours existent en breton (71 %), corse (66 %) ou portugais (54 %) mais cest une minorit qui adhre la mme mesure lorsquil sagit de larabe (43 %). - Des expriences dargumentation ou de contre-argumentation. Lenjeu ici est de scarter de la neutralit habituelle et de fournir des arguments tirs des dbats du moment pour tester le degr de conviction du rpondant. Il existe plusieurs variantes dans ce type dexpriences. Lune dentre elle consiste poser une premire question puis, une fois la rponse recueillie, soumettre linterview une contre-argumentation. Pour tester la solidit des

62

convictions, lchantillon est nouveau segment : une premire moiti fait face un argument vide (si linterview change alors davis, cest uniquement par soumission lenquteur) tandis que lautre moiti fait face un argument plein (si linterview change davis, cest soit par soumission, soit par adhsion la contre-argumentation : on est alors davantage dans une situation relle de formation et de construction des opinions, fondes sur lchange darguments et parfois limposition dune vrit qui soumet les autres au silence)
Certains disent qu'il faudrait augmenter le montant des indemnits de chmage. Vous-mme, tesvous plutt d'accord ou pas d'accord du tout avec cette opinion ?

D'accord Pas d'accord

54 % 46 %

A ceux qui ont rpondu d'accord : D'accord Si les indemnits de chmage sont trop confortables, les chmeurs ne seront pas encourags chercher du travail (puis reprise de la question de dpart) Si on pense tous les problmes que a pose puis reprise de la question de dpart) A ceux qui ont rpondu pas d'accord : D'accord Avec les indemnits actuelles, il y a trop de familles qui n'arrivent pas s'en sortir (puis reprise de la question de dpart) Si on pense tous les problmes que a pose puis reprise de la question de dpart) 29 13 Pas d'accord 66 84 SR 5 3 60 81 Pas d'accord 37 15 SR 3 4

Ici, 37 % de ceux qui taient favorables une augmentation des allocations chmage changent davis face un argument contraire. Mais il faut surtout noter que ce changement davis est fortement li au capital culturel, au niveau de diplme : ils sont 45 % chez ceux qui nont pas le bac et 25 % chez ceux qui ont le bac. On observe toutefois que lampleur de ces variations dopinion dpend du sujet test. Ainsi, face une question relative lacceptation du port du voile islamique lcole, la distribution des rponses demeure systmatiquement identique (autour de 70 / 30), indpendamment des arguments utiliss pour justifier lune ou lautre des positions. - Des expriences incitatives. Lexprience dite de la pommade enfin sert tester le degr denracinement des opinions. Lenjeu est nouveau de quitter lhabituelle neutralit et faire en sorte que linterview se sente suffisamment en confiance pour oser livrer des prjugs souvent indicibles...

63

Version sans pommade : Nous arrivons la fin de l'entretien. Je voulais vous poser une dernire question. Pensez-vous qu'il y a trop de libert en France ? trop de dmocratie en France ? Version avec pommade : Nous arrivons la fin de l'entretien. Je voulais vous dire que j'ai beaucoup apprci cet entretien et que vos rponses nous serons trs utiles. Finalement, ne pensez-vous pas, contrairement ce que l'on entend souvent dire, que le vrai problme en France, c'est qu'il y a : trop de libert ? trop de dmocratie ? Sans pommade Libert - Trop - Pas trop Dmocratie - Trop - Pas trop 28 70 16 81 Avec pommade 40 57 31 65 cart +12 -14 +15 -16

Le problme ici, cest quil est difficile dinterprter les carts. En effet, certaines personnes sontelles mises en confiance par la pommade et expriment-elles alors des opinions quelles ne revendiqueraient pas publiquement dans dautres circonstances ? Ou bien certaines personnes cherchent-elles faire plaisir un interlocuteur qui sous-tend manifestement que la bonne rponse est oui, il y a trop de libert ? Cet exemple est nanmoins intressant car il rappelle quune exprience ne peut permettre de valider quune hypothse que si elle respecte la rgle dor du protocole exprimental : ne faire varier quun seul facteur !

Section 3. Lanalyse des donnes statistiques


La production de donnes chiffres ne suffit videmment pas garantir la scientificit dune enqute. Les statistiques nont en effet de valeur scientifique qu condition dtre articules un raisonnement sociologique (qui ne se rduit pas des problmes purement techniques !). Trois dimensions distinguent les approches sociologiques des simples comptages administratifs : Dabord, cest un rappel, le raisonnement sociologique implique une distance critique par rapport aux donnes. Il faut tudier les conditions dans lesquelles elles ont t recueillies, dterminer ce que les indicateurs mesurent rellement, etc. Ensuite, le raisonnement sociologique ne sarrte pas la description dun fait (par exemple, le taux de chmage aujourdhui). Il sarticule des questions, si bien que le travail prend un caractre scientifique quand les donnes permettent dtudier des volutions (le taux de chmage dans le temps), deffectuer des comparaisons (le taux 64

de chmage dans diffrents pays), de distinguer des corrlations entre variables (le taux de chmage des diffrentes PCS). Les statistiques ont un potentiel descriptif certain mais elles ont aussi la capacit de mettre jour les relations objectives entre phnomnes sociaux (par exemple, niveau de diplme et profession des parents, ge et vote, etc.) : elles ont ce titre un potentiel explicatif. Enfin, le raisonnement sociologique ne se limite pas la simple mesure statistique, mme lorsque celle-ci repose sur des outils mathmatiques complexes. Car si les donnes quantitatives permettent de mettre jour des rgularits ou dtablir des corrlations, elles ne permettent pas en elles-mmes dinterprter ces rgularits ou de comprendre ces corrlations. Pour formuler des conclusions sociologiquement pertinentes, il faut, le plus souvent, accompagner les lments chiffrs de modles thoriques et denqutes de terrain de nature qualitative. On ne peut faire dire aux donnes plus que ce quelles mettent jour !

1. La description des variables


La premire tape dans lanalyse des donnes statistiques consiste toujours dcrire les rsultats pour chacune des variables tudies : lenjeu est didentifier les informations les plus significatives, au regard notamment de la problmatique de lenqute. Par exemple, dans un sondage ou une enqute par questionnaire, cela veut dire tudier la distribution des rponses chaque question. Mais les principes de description varient selon la nature des variables. (1) Principes de description des variables quantitatives. Rappelons que les variables quantitatives sont des variables qui sexpriment sous la forme dune valeur mtrique (Philippe Alonzo), autrement dit la variable sexprime sous une forme numrique, le nombre constituant la valeur de la variable (valeur rapporte une unit de mesure). Lge, le revenu, le taux de chmage (exprim en pourcentage), le produit intrieur brut, lindice des prix ou encore le nombre denfants par femmes sont des variables quantitatives. Voici un exemple relativement simple : lge des tudiants du master qui ont rpondu lenqute Les tudiants, les lections et la politique (SPEL / CNRS / UPJV / UVSQ). Le corpus comprend 28 questionnaires remplis. A cette question de lge, seuls 24 interviews ont correctement rempli le questionnaire. Lge (mesurable partir du mois et de lanne de naissance) constitue la seule variable quantitative du questionnaire.

65

ges 21 22 23 24 25 28 36 Total

Effectifs 5 5 5 3 3 1 1 24

% brut 20,8% 20,8% 20,8% 12,5% 12,5% 8,3% 4,2% 100,0%

% croissants 20,8% 41,7% 62,5% 75,0% 87,5% 95,8% 100,0% -

% dcroissants 100,0% 79,2% 58,3% 37,5% 25,0% 12,5% 4,2% -

Tableau. Rpartition des interviews selon lge Comment dcrire les donnes du tableau ? Dabord, lorsque la dispersion des valeurs est importante et nuit la lisibilit du tableau et lidentification des informations, il est possible doprer des regroupements et dtablir des classes dge. Ici, la variable ge ne comprenant que 7 valeurs, cette opration ne parat pas indispensable (sauf, la rigueur, en regroupant les valeurs les plus leves 28 et 36 ans dans une classe 28 ans et plus ). Ensuite, il est souvent prcieux de transformer les donnes brutes en pourcentages. La frquence relative de chaque valeur dans la population apparat alors de faon plus marquante (car le poids en valeur absolu est peu significatif : 5 sur 28 parle moins que 21 % . Les pourcentages permettent eux aussi doprer des regroupements. Parmi les regroupements possibles, il peut tre utile de cumuler les pourcentages de faon croissante ou dcroissante : par exemple, 62 % des tudiants ont 23 ans et moins et 58 % ont 23 ans et plus. tablir les pourcentages permet notamment de faciliter la reprsentation graphique des donnes. Le choix du graphique dpend l encore des hypothses et de la problmatique. Selon les cas, il peut tre plus utile de constituer des histogrammes, des courbes ou des aires (camembert) :

66

Il existe ensuite dautres outils de description des donnes : - Le mode = la valeur la plus frquemment distribue. Ici, cest 21, 22 et 23 ans. - La moyenne = la valeur obtenue en divisant la somme des valeurs par le nombre dindividus. Ici, cest 23,7 ans. Souvent, les moyennes sont biaises par deux paramtres. Dabord, la variable ge est discrte et non continue (on na que les annes et non les annes et les mois il est possible que les 23 ans soient plus proches de leur 24e anniversaire que de leur 23e). Ensuite, il est frquent que les individus qui scartent trop de la norme soient regroups dans une seule catgorie (par exemple, mettre les 28 ans et plus ensemble !), ce qui ne permet pas dtablir leur ge exact. - La mdiane = tendance centrale pour laquelle exactement la moiti des donnes se situent au-dessus tandis que lautre moiti lui est infrieure. Ici, cest galement 23 ans. Pourquoi faut-il distinguer moyenne et mdiane ? Parce que, comme le soulignent les statisticiens de lINSEE, de nombreuses grandeurs conomiques sont limites vers le bas et non vers le haut. Par exemple, le salaire horaire est limit vers le bas par le SMIC alors que certains salaires peuvent tre trs levs. La moyenne est tire vers le haut par les salaires levs, mme sils sont peu nombreux, et elle est pour cette raison gnralement suprieure la mdiane. Par ailleurs, l'incertitude qui affecte les valeurs extrmes, en particulier les valeurs leves, se reporte sur la moyenne mais n'affecte pas la mdiane. Celle-ci est de ce point de vue un indicateur plus fiable. Par exemple, en France en 2008, le revenu disponible moyen mensuel par mnage est de 2871 euros, tandis que le revenu disponible mdian mensuel par mnage est de 2380 euros. En France en 2008, le revenu moyen mensuel par individu est de 1842 euros, tandis que le revenu

67

mdian mensuel par individu est de 1582 euros (source : INSEE). De la mme manire, en 2000, la moyenne des patrimoines des mnages franais est de 100 000 euros, alors que le patrimoine mdian est de 78 000 euros. De telles disparits peuvent jouer un rle certain dans le dbat public : selon le champ de rfrence (individu ou mnage ; revenus avant ou aprs impts ; etc.) et le type de mesure (moyenne, mdiane), il est possible de lgitimer telle ou telle mesure pour son caractre juste ou correspondant la moyenne ! Les dbats autour de la taxation du patrimoine ou des successions mettent rgulirement en scne de tels affrontements.

- La variance = cart moyen entre la moyenne et les rsultats. V = (|moy-X1| + |moy-X2| + |moy-X3| +...)/N. En loccurrence, la variance est ici de 2,13. Il est important en effet de ne pas se proccuper seulement de la moyenne ou de la mdiane. Une mme moyenne peut en effet renvoyer des ralits disparates. Dun ct, les valeurs peuvent tre toutes proches de la moyenne et dessiner une population homogne. De lautre, la population peut tre extrmement htrogne, la moyenne tendant masquer ces divergences ! Ltude de la variance est notamment utile dans les tudes sur les revenus : elles peuvent fournir une premire indication sur ltat des ingalits. - Les quantiles : en plus de la mdiane, il est souvent prcieux didentifier les quantiles, cest-dire les valeurs qui divisent un ensemble dobservations en X parties gales . Les quartiles impliquent 4 parties gales, les dciles 10 parties gales, les centiles 100 parties gales, etc. Chaque groupe contient alors 25 %, 10 % ou 1 % des donnes. Ici, les bornes des quartiles sont 21-22 ans / 22-23 ans / 23-24,25 ans / 24,25-36 ans. Ce reprage des quartiles confirment la concentration des individus autour des valeurs 22-24,25 ans ! Mais les quantiles sont surtout utiles pour saisir les ingalits de richesse et comparer leurs volutions. Par exemple, tudions les revenus de lensemble des foyers et divisons ces foyers en dix groupes de taille gale. Daprs lINSEE, en 2006, les 10 % des mnages les moins riches dclarent moins de 1018 de revenus par mois (aprs impts et prestations sociales). A linverse, les 10 % des mnages les plus riches dclarent plus de 4690 de revenus par mois. Le rapport entre les deux est de 4690/1018 = 4,6. Il est alors possible dtudier lvolution de ce rapport dans le temps ou bien entre pays afin dtudier lvolution des ingalits des revenus. Il est galement possible de comparer les rapports inter-dciles entre eux pour identifier o rside la principale cassure sociale. En loccurrence, en France aujourdhui, cette cassure rside principalement entre le 9e et le 10e dcile : les 8 premires bornes sont beaucoup plus proches les

68

unes des autres que la 9e ! Thomas Piketty montre dailleurs que les ingalits sont encore plus marques si ltude sintresse non plus aux dciles mais aux centiles (cest dailleurs les foyers appartenant aux derniers centiles qui ont connu la plus nette envole des revenus depuis la dernire dcennie : les 0,01 % des plus hauts salaires ont augment de 69 % entre 1998 et 2006, soit un bonus mensuel de 34 000 euros en lespace de huit ans, cf. les travaux de Camille Landais.).
Revenus dlimitant chaque dcile (en ) 1018 1308 1593 1913 2263 2641 3051 3648 4690 5974 Diffrences entre dciles (en ) 290 285 320 350 378 410 597 1042 Rapports interdciles 0,65 1,22 1,2 1,18 1,17 1,15 1,2 1,29 Part du groupe dans la richesse nationale 3,6 % 5,3 % 6,3 % 7,2 % 8,1 % 9% 10,1 % 11,6 % 14,1 % 24,70%

10 % 20 % 30 % 40 % 50 % 60 % 70 % 80 % 90 % 95 % 100 %

Tableau. Revenus mensuels des mnages (en euros, aprs impts et prestations sociales). Source, INSEE, 2006. Enfin, plutt que sur les bornes inter-dciles, le calcul peut porter sur les revenus moyens au sein de chacune des 10 fractions de population. Cela permet notamment de dessiner la courbe de Lorenz : plus elle scarte de la diagonale et prend une forme exponentielle, plus les ingalits sont prononces.

Courbe de Lorenz des revenus franais (2006)

69

Il est alors possible de mesurer le rapport entre les revenus moyens des deux fractions de population aux marges de lespace social ou bien dobserver lvolution dans le temps de la part du revenu des 10 % les mieux rmunrs dans le revenu national. N.B. : Les indicateurs quantitatifs soulvent un problme spcifique : celui de la pondration. En effet, les indicateurs agrgent des donnes diffrentes. Dans le cas de la richesse, il est assez simple dagrger revenus du travail et patrimoine qui se cumulent effectivement dans la vie de chacun. Parfois cependant, les diffrents lments qui composent un indicateur ne psent pas la mme chose, rendant dlicat la constitution et la mesure de lindicateur. Prenons deux exemples : - La visibilit mdiatique : Chercheurs et spcialistes en communication analysent rgulirement la mdiatisation des vnements, des mouvements sociaux ou des personnalits. Lanalyse peut tre qualitative, tudiant les cadrages de lactualit et les apprciations positives ou ngatives adresses aux protagonistes de la vie politique. Mais lanalyse peut galement tre strictement quantitative, valuant la visibilit des acteurs dans les mdias. Seulement, comment mesurer cette visibilit ? Dix secondes la radio valent-elles une interview pleine page dans les journaux ? Il est possible daffecter chaque mention dune personnalit un coefficient correspondant laudience moyenne du mdia. Chaque vocation est donc rapporte son poids en termes dampleur du public. Mais comment diffrencier les mentions dans la presse crite selon quelles figurent en une ou au cur dun article ? Selon quelles concernent tout un article ou une petite rfrence dans une brve ? Cest l quintervient larbitraire du coefficient : on ne peut fixer de principes de pondration objectifs au sens duniversellement accepts. - Lindice des prix la consommation : L'indice des prix la consommation (IPC) est un instrument de mesure de l'inflation labor par lINSEE. Il permet d'estimer, entre deux priodes donnes, la variation moyenne des prix des produits consomms par les mnages. C'est une mesure synthtique de l'volution de prix des produits, qualit constante. Publi chaque mois au Journal Officiel, il joue un rle politique et social majeur puisquil sert indexer de nombreux contrats privs, des pensions alimentaires, des rentes viagres et aussi revaloriser le SMIC. L'indice retenu pour le SMIC est celui des mnages urbains dont le chef est ouvrier ou employ, hors tabac . La constitution de cet indice est donc fondamental et suscite de nombreuses crispations, notamment parce quil nest pas un indice du cot de la vie. Beaucoup le juge inadapt. Pourquoi ? Pour rpondre cette question, il faut dabord revenir sur les mthodes retenues par lINSEE. Le plan de sondage est stratifi selon trois types de critres. (1) Gographique : les

70

relevs sont effectus dans 96 agglomrations de plus de 2 000 habitants disperses sur le territoire mtropolitain et de toute taille ainsi que 10 agglomrations dans les DOM ; (2) type de produit : un chantillon d'un peu plus de 1000 familles de produits, appeles "varits" est dfini pour tenir compte de l'htrognit des produits au sein des postes. La varit est le niveau de base pour le suivi des produits et le calcul de l'indice ; (3) type de point de vente : un chantillon de 27 000 points de vente, stratifi par forme de vente, a t constitu pour reprsenter la diversit des produits et modes d'achat des consommateurs et prendre en compte des variations de prix diffrencies selon les formes de vente. Le croisement de ces diffrents critres aboutit suivre un peu plus de 140 000 sries (produits prcis dans un point de vente donn) donnant lieu prs de 160 000 relevs mensuels. A ces chiffres s'ajoutent environ 30 000 sries de type "tarif" collectes de faon centralise. L'chantillon est mis jour annuellement pour tenir compte de l'volution des comportements de consommation et, notamment, introduire des produits nouveaux. Outre la composition de l'chantillon, les pondrations utilises pour agrger les 21 000 indices lmentaires (croisement varits x agglomration dans le cas gnral) sont galement mises jour chaque anne. Ces pondrations reprsentent la part des dpenses associes l'agrgat concern au sein de l'ensemble des dpenses de consommation des mnages couvertes par l'indice. Elles sont obtenues, pour la plupart, partir des valuations annuelles des dpenses de consommation des mnages ralises par la Comptabilit Nationale. Des traitements spcifiques sont effectus pour les produits frais, les autres varits saisonnires, les varits tarifaires et pour dterminer des volutions de prix "pures", qualit constante, lorsqu'un produit disparu est remplac en cours d'anne par un autre. Les promotions et soldes offerts tous les consommateurs sont pris en compte. L'IPC couvre l'ensemble des biens et services marchands consomms sur le territoire, par les mnages rsidents et non-rsidents (comme les touristes). Son champ thorique se dfinit comme celui de la consommation finale effective marchande montaire des mnages. Les principaux dfauts de couverture portent encore sur certains types d'assurances, les services hospitaliers privs, les jeux de hasard et l'assurance vie. (INSEE) Fonctions de consommation
PRODUITS ALIMENTAIRES ET BOISSONS NON ALCOOLISES BOISSONS ALCOOLISES ET TABAC HABILLEMENT ET CHAUSSURES AMEUBLEMENT, QUIPEMENT MNAGER ET ENTRETIEN COURANT DE LA MAISON SANTE COMMUNICATIONS LOISIRS ET CULTURE EDUCATION HTELLERIE, CAFS, RESTAURATION

Pondration en 2009 (en %)


14,99 3,27 4,93 6,17 9,96 2,99 9,20 0,24 6,78

71

AUTRES BIENS ET SERVICES LOGEMENT, EAU, GAZ, LECTRICIT ET AUTRES COMBUSTIBLES TRANSPORT ENSEMBLE

11,58 16,32 13,57 100

Chaque bien est affect dun coefficient qui correspond sa part dans le budget des mnages. La controverse tient ce que cette proportion nest pas la mme pour tout le monde : tout le monde ne consomme pas la mme chose et dans les mmes proportions. Pour un mnage modeste, la part du logement dans le budget est beaucoup plus lev que pour les mnages plus riches (plus de 30 % pour les 20 % les plus pauvres, contre moins de 10 % pour les 20 % les plus riches). Lindice des prix la consommation ne peut donc servir valuer lvolution du pouvoir dachat. Un tel usage aurait dautant moins de sens que les problmes de pouvoir dachat tiennent, dune part, autant la question de lvolution des revenus qu celle de lvolution des prix et que, dautre part, ces difficults concernent avant tout certaines catgories de la population : cela a-t-il un sens de mesurer une volution moyenne du pouvoir dachat ?

(2) Principes de description des variables nominales.


Professions et catgories sociales (PCS) Agriculteurs exploitants Artisans, commerants et chefs d'entreprise Cadres et professions intellectuelles suprieures Professions intermdiaires Employs Ouvriers Chmeurs n'ayant jamais travaill Population active Nombre (en milliers) 1 475 1 835 Proportion (pour mille actifs) 63 78

1 895 3 971 6 247 7 749 353 23 525

81 169 265 329 15 1 000

Tableau 1. Structure de la population active en 1982.

72

2. Lidentification des corrlations statistiques


Jusquici, nous avons analys chaque variable isolment afin den dgager les informations principales. Mais lintrt de lobjectivation statistique est aussi de mettre en relation deux variables et de voir sil y a ou non corrlation ou encore lien dinterdpendance. Prenons un exemple fictif : une enqute mene auprs dun chantillon dtudiants franais dont lenjeu serait notamment de saisir les liens entre le type de baccalaurat (Variable 1) et le type dtudes suprieures (Variables 2). Ces deux variables sont nominales et comprennent chacune trois modalits : il y a donc neuf croisements possibles. 1000 tudiants sont interviews : tous sont issus soit dun bac gnral , soit dun bac techno. Le tableau crois ci-dessous indique la distribution des interviews pour chaque variable.

Classe prpa Bac S Bac ES L Bac techno Ensemble 40 50 10 100

IUT / BTS 20 190 90 300

Universit 40 160 400 600

Ensemble 100 400 500 1000

73

Tableau 1. Distribution de la population tudiante selon le baccalaurat et la filire de l'enseignement suprieur (donnes fictives) Comment identifier et mesurer les ventuelles corrlations entre ces deux variables ? Lune des solutions consiste tablir ce que serait la distribution sil y avait indpendance entre variables, autrement dit si laffectation des tudiants reposait sur le seul hasard et non sur leur bac dorigine. Ainsi, parmi les 100 interviews qui intgrent une classe prparatoire, il faut retrouver la mme distribution de bac dorigine que pour lensemble de la population. Les bac techno forment la moiti des interviews (500/1000) : ils doivent alors former la moiti des tudiants de classe prpa, soit 50/100. 50=100*(500/1000) ou 50=500*(100/1000).

Classe prpa Bac S Bac ES L Bac techno Ensemble 10 40 50 100

IUT / BTS 30 120 150 300

Universit 60 240 300 600

Ensemble 100 400 500 1000

Tableau 2. Distribution thorique selon l'hypothse d'indpendance des variables (donnes fictives) Sans surprise, les rsultats des tableaux 1 et 2 divergent sensiblement : il y a cart lindpendance donc lien de dpendance donc corrlation statistique entre variables. Classe prpa Bac S Bac ES L Bac techno Ensemble +30 +10 -40 0 IUT / BTS -10 +70 -60 0 Universit -20 -80 +100 0 Ensemble 0 0 0 0

Tableau 3. carts la distribution thorique (donnes fictives) Comment lire ces carts et convertir ces informations chiffres en informations sociologiques ? Une lecture possible consiste dire que les titulaires du baccalaurat S sont statistiquement surreprsents parmi les tudiants des classes prparatoires, alors qu linverse ils sont sous-reprsents parmi les tudiants des filires courtes ou des filires universitaires. Une autre lecture possible consiste dire les titulaires du baccalaurat S ont statistiquement plus de

74

chances daccder aux classes prparatoires que les tudiants des autres baccalaurats. Deux petites remarques supplmentaires : Dabord, ce nest pas une surreprsentation dans labsolu : ils sont par exemple moins nombreux que les titulaires des Bac ES et L. Cest une surreprsentation par rapport leur effectif total. Ensuite, les rsultats nont de sens que dans la comparaison, que dans une perspective relationnelle : les titulaires du Bac S sont surreprsents par rapport aux titulaires dautres bac. Le tableau 3 permet de mettre en vidence un lien de dpendances entre les deux variables : lune dpend statistiquement de lautre. Les tudes suivies dpendent du type de bac. Variables indpendante (type de baccalaurat) variables dpendantes (tude choisie). Ici, le lien de corrlation est de type causal : lun dtermine lautre car lun est antrieur lautre. Le tableau 3 nest quun point de dpart. En ltat, on ne peut rien dire de plus que constater cette corrlation. Le travail doit tre poursuivi. Dune part, il faudrait mobiliser des outils mathmatiques plus sophistiqus pour tablir quelle est lampleur de la corrlation (analyses de rgression ou analyses factorielles). Dautre part, il faut essayer dexpliquer ou dinterprter ce lien entre les deux variables, cest--dire suggrer des hypothses sociologiques et les vrifier.

3. Linterprtation des corrlations


Comment expliquer ces liens statistiques entre baccalaurat et tudes ? Dun ct, la relation est directe : les personnes charges de recruter les lves en classes prpa ou dans les filires courtes sappuient explicitement sur le critre du bac. Ce nest pas le seul pris en compte mais il est souvent dterminant. Leffet de la variable indpendante sur la variable dpendante est ici direct ! Mais dun autre ct, la variable type de baccalaurat dpend elle aussi de nombreux facteurs sociaux (il ny a pas non plus de hasard sociologique dans laffectation des lves au lyce). Elle dissimule dautres variables susceptibles dexpliquer lorientation dans les tudes : le milieu social dorigine, le sexe, le capital culturel des parents, etc. A travers ce deuxime registre explicatif, la relation entre les deux variables est indirectes : elles sont toutes deux dtermines par une mme cause. Lexemple choisi ici est simple. Mais il renvoie un problme rgulier et souvent plus complexe rsoudre : comment expliquer ou interprter les corrlations statistiques mises jour ? Il nest pas toujours ais de dterminer quelle variable est dpendante de lautre ! Il y a en fait trois principaux scnarios explicatifs :

75

- Causalit : Une variable agit directement sur la seconde variable et produit un effet (Philippe Alonzo). - Concomitance ou cooccurrence : Nature du lien entre deux variables prsentant un rapport de simultanit, souvent sous linfluence dune troisime variable . (Philippe Alonzo) Autrement dit, les deux variables ont une mme cause. Pour prendre des exemples triviaux mais parlants, pensons au lien entre sexualit aprs 65 ans et esprance de vie : toutes deux sont dtermines par une tierce variable : la bonne sant. Autre exemple trivial : la corrlation aprs 1945 entre consommation de bire en Californie et la mortalit infantile au japon (la variable cache est ici un front caniculaire sur le Nord Pacifique). Enfin exemple plus srieux : le lien entre race et QI aux tats-Unis. En fait, la variable race masque une variable autrement discriminante : la position dans lespace social A ce titre, lindicateur du QI lui-mme est problmatique parce quil dtermine non pas ce que serait objectivement lintelligence mais la capacit rsoudre des problmes qui figurent dans les programmes scolaires (dfinis donc par les catgories dominantes). - Interdpendance : Nature du lien entre deux variables dont les variations sautoentretiennent. Un exemple assez simple : la conversion rciproque entre capital conomique et capital culturel. Il faut donc tre particulirement vigilant dans linterprtation de corrlations apparemment videntes. Les trois exemples suivants renvoient trois difficults rcurrentes. (1) La corrlation entre ge et suicide : effet dge ou effet de gnration ? Le premier exemple est nouveau emprunt mile Durkheim. Celui-ci met en relation deux variables : le taux de suicide des hommes clibataire en France entre 1889 et 1891 et lge. Pourquoi indique-t-il une proportion (nombre de suicides pour un million de clibataires) plutt que le nombre de suicids par classe dge en valeur absolue ? Tout simplement parce que les classes dges ne sont pas homognes en taille. La conversion du nombre brut en proportion permet de neutraliser leffet de cette htrognit.

76

Tableau 6. Taux de suicide moyen selon l'ge (hommes clibataires, France 1889-91). (source : mile Durkheim, Le Suicide, 1987)

La lecture du tableau met en vidence un effet vident de lge sur le taux de suicide des hommes clibataires. Ce taux progresse de faon continue (sauf pour la dernire classe dge). Mais lorsquon convertit ce tableau en graphique merge une autre reprsentation de la corrlation entre ge et taux de suicide des hommes clibataires : la progression du taux de suicide avec lge nest pas seulement rgulire, elle est linaire !

Schma 2. Taux de suicide moyen selon l'ge (hommes clibataires, France 1889-91). (source : mile Durkheim, Le Suicide, 1987)

Comment interprter ce graphique ? A premire vue, cela parat mettre en vidence un effet dge . Pourtant il pourrait y avoir une seconde interprtation : il pourrait sagir dun effet de gnration , cest--dire que ce nest pas tant lge qui serait dterminant mais la date de naissance. Chaque gnration nat et grandit dans un contexte singulier ; les principes ducatifs voluent ; les perspectives sociales galement. Autrement dit, la plus ou moins grande permabilit au suicide pourrait rsulter de socialisations spcifiques : le taux de suicide dune mme gnration ne varierait alors pas ou peu dans le temps. Comment rsoudre ce dilemme ? Il faudrait oprer la mme tude sur une autre priode. Les dates dobservation ne seraient plus 1889-91 mais 1910-12 par exemple. Soit la corrlation est inchange et les deux graphiques sont trs ressemblants : dans ce cas, cest clairement leffet dge qui prdomine. Soit les deux courbes sont parallles (du moins sur les gnrations vivants aux deux priodes denregistrement) : dans ce cas, cest clairement leffet de gnration qui prdomine. Il faudrait dailleurs sassurer que le lien entre ge et taux de suicide se vrifie dans dautres configurations sociohistoriques. Si cest le cas, il est possible dtablir une thorie

77

gnrale. Sinon, cest une thorie rgionale qui peut tre tablie : lge ne pse sur la probabilit de se suicider que dans un contexte donn (il y a donc congruence de facteurs). (2) La prsence au but comme variable cran Le deuxime exemple est fictif. Imaginez une quipe de football dans laquelle lensemble des joueurs tournent au poste de gardien. Or, ds que lun des joueurs est gardien, lquipe de ne prend plus de but. Pourquoi ? La raison la plus gratifiante pour ce joueur est de considrer quil est le meilleur gardien de lquipe. Toutefois, une seconde hypothse est moins glorieuse pour lui : il nest plus sur le terrain et ne handicape plus son quipe. Pour dterminer laquelle des deux hypothses est la plus pertinente et ainsi interprter la corrlation, il faudrait largir lespace dobservation et inclure dautres variables comme le nombre de tirs au but de ladversaire. Si celui-ci est inchang voire augmente, cest alors clairement lhypothse des qualits du gardien quil faut retenir. Si celui-ci diminue, cest lautre interprtation qui semble la plus juste. On pourrait aussi imaginer un dispositif exprimental et voir comment les choses se droulent lorsque le joueur nest ni sur le terrain, ni dans les buts. Soit lquipe se prend toujours rgulirement des buts : dans ce cas, cest la qualit du gardien qui est la variable explicative. Soit elle ne se prend plus (ou moins) de buts : dans ce cas, cest sa prsence dans le jeu qui est la variable explicative. (3) Salaires du public et salaires du priv : les effets de structure Une corrlation suscite frquemment de vigoureuses polmiques : le lien entre statut dactivit (variable 1) et salaire (variable 2). Ainsi, il semble apparemment tabli que les salaris du secteur public gagnent plus que leurs collgues du priv. En 2006, le salaire net annuel moyen de lensemble de la fonction publique dtat tait de 26 182 euros (soit un peu de moins de 2200 euros par mois), tandis que lquivalent pour les salaris du priv tait de 23 261 euros (soit un peu plus de 1900 euros par mois). Le rflexe est alors didentifier un lien de causalit : la cause dun tel cart rsulterait simplement du fait qu on est mieux pay dans le priv que dans le public . Quel est le problme dune telle interprtation ? En fait, la comparaison de ces salaires moyens na pas beaucoup dintrt. Dune part, parce que la moyenne, on la vu, ne nous dit pas grand-chose de la distribution des salaires. Dautre part, parce quon ne compare pas ici des populations identiques ! Les carts tiennent en fait un effet de structure : la structure des deux populations nest pas la mme au regard de deux variables dterminantes sur le salaire :

78

Le niveau de qualification moyen est bien plus lev dans la fonction publique dtat que dans lensemble du secteur priv : les emplois proposs sont alors plus qualifis. Cest donc niveau de diplme gal ou catgorie socioprofessionnel gal quil faudrait oprer la comparaison.

Lge moyen est plus lev dans la fonction publique dtat que dans le secteur priv. Idem : comparaison pertinente classe dge. (Voir graphiques)

Autrement dit, si lon souhaite revenir sur une comparaison globale des salaris du public et du priv, celle-ci nest possible qu condition que toutes choses soient gales par ailleurs . Il faut donc faire comme si la structure des deux tait identique, afin dliminer le bruit (le bruit tant ici les divergences dans la distribution des ges et des niveaux de qualification).

79