Vous êtes sur la page 1sur 102

1

Les carts l'indpendance.


Techniques simples pour analyser des
donnes d'enqute.

Philippe Cibois
Professeur de sociologie l'universit
de Versailles - St-Quentin en Yvelines

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

En hommage G. Th. Guilbaud

Introduction
Vous tudiez la sociologie (en formation initiale dans un
dpartement de sociologie, d'AES ou de Sciences politiques ; en
formation continue ou par intrt personnel) et vous tes confronts
dans vos lectures (ou dans vos cours) l'utilisation de techniques
statistiques appliques des donnes d'enqute. Ce livre voudrait vous
aider comprendre en quoi consistent, dans l'esprit de cette collection,
certaines de ces statistiques appliques la sociologie (pour reprendre
l'intitul du programme du Deug de sociologie). Je voudrais dans ce
texte introductif vous expliquer en quoi consiste la spcificit de cette
prsentation, ce que l'on trouvera dans ce livre, comment l'utiliser et ce
qu'on n'y trouvera pas.
Une prsentation tourne vers l'utilisateur
Les tudiants en sociologie n'aiment pas en gnral les
mathmatiques pour une raison simple, c'est que, comme le montre la
sociologie de l'ducation, ils ont t contraints de s'orienter pendant
leur secondaire soit vers les lettres, soit vers les sciences conomiques
et sociales, soit dans d'autres directions du fait de leur faible russite
en mathmatiques. Pour arriver faire ce tri social, l'enseignement des
mathmatiques est dans le secondaire d'un niveau d'abstraction fort,
voulu et efficace : il arrive persuader beaucoup de gens qu'ils sont
nuls en math, que ce n'est pas leur truc ou autres justifications aprs
coup qui tentent de rendre compte de ce qui est ressenti souvent
comme une humiliation ou un chec.
Il s'agit l d'une spcificit franaise d'ailleurs relativement rcente
et que je ne souhaite pas ternelle : dans beaucoup de pays,

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

l'enseignement des mathmatiques est destin simplement apprendre


les mathmatiques et non slectionner. De ce fait les tudiants du
monde anglo-saxon qui arrivent en sociologie ont beaucoup moins de
difficults apprendre les techniques quantitatives que leurs
homologues franais qui sont souvent bloqus devant toute
prsentation qui leur rappelle de trop mauvais souvenirs.
Si vous vous reconnaissez dans ce tableau, vous n'avez pas
culpabiliser mais simplement accepter de voir les choses
diffremment. Car pour s'adresser vous, il faut renouveler la manire
de faire et tout simplement prendre celle en vigueur dans les pays o
les mathmatiques servent simplement apprendre les mathmatiques.
Quand on prend l'usage anglo-saxon d'exposition des statistiques, on
fait en sorte de s'adresser des utilisateurs de statistiques en vue d'en
faire des utilisateurs avertis, non pour les former subrepticement aux
mathmatiques.
La technique pdagogique est simple, elle se trouve par exemple
dans les nombreux ouvrages de la collection Quantitative Applications
in the Social Sciences de l'diteur Sage o en gnral pour exposer une
technique statistique, on part d'un exemple numrique, on montre ce
qu'apporte la technique aux sciences sociales et on donne des
complments pour formaliser le cas chant. Quand on prsente un
exemple numrique, l'utilisateur n'est pas ce point born qu'il ne
comprenne pas que le cas prsent soit gnral et que la technique soit
adapte d'autres cas concrets.
Dans ce qui va suivre, l'expos ne cherchera pas valider
formellement les techniques statistiques : vrifier que tout est en ordre
de marche, sans vice cach, est le travail du mathmaticien et du
statisticien. Ce sont eux qui en tant que professionnels contrls par
leurs pairs sont mme de nous donner les instruments que nous
utiliserons. Notons cependant que parmi les grands noms de la
statistique, Pearson, Fisher, Spearman, tous ont t tourns vers les

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

applications et que le dernier tait d'abord un psychologue, ce qui ne


l'a pas empch d'tre le crateur d'une technique qui joue aujourd'hui
un grand rle dans le dpouillement d'enqute (l'analyse factorielle).
La validation d'une technique est une chose, son utilisation correcte
une autre : quand nous avons appris faire une division, nous n'avons
pas appris ce qui rend valide cette opration mais son fonctionnement,
son champ d'application et ses piges.
La prsentation qui va suivre est tourne vers l'utilisateur en ce sens
que les techniques statistiques appliques la sociologie ne sont bien
comprises que si on en voit l'intrt, c'est dire si, partir d'exemples
rels, on montre en quoi leur utilisation aide la comprhension
sociologique. De ce fait, il vaut mieux tre sociologue pour enseigner
la statistique aux sociologues.
L'analyse des donnes d'enqute
Cet ouvrage se veut d'introduction, il prsente des techniques
simples, ce qui qualifie un niveau de comprhension, et d'introduction
l'analyse des donnes d'enqute, ce qui dsigne un type de donnes.
En un mot il s'agit de l'analyse des tableaux croiss obtenus partir de
donnes d'enqute.
La procdure d'enqute commence faire partie du bagage commun
des savoirs. Il s'agit d'interroger un nombre limit de personnes : 25,
50, 100, 500, 1000 ou plus, et de poser aux interrogs des questions
sur leurs pratiques, leurs opinions, leur situation. Les renseignements
obtenus sont sous forme de modalits de rponses : par exemple la
question "sexe" est une question deux modalits de rponse
"masculin", "fminin". Souvent les rponses recueillies sous forme
purement numrique (ge, revenu, temps pass une activit) sont
ramenes galement des modalits, par exemple sous forme de
tranches d'ges : "18-24ans", "25-30ans", etc. Dans ce qui suit on
supposera que les donnes d'enqutes sont toutes ramenes des
modalits de rponse des questions. On laisse un autre ouvrage le

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

soin de traiter des statistiques appliques aux donnes numriques


comme telles (ouvrage qui constituerait par exemple le deuxime
semestre d'un cours de premire anne de Deug de sociologie, le
prsent ouvrage en constituant le premier semestre).
Pour que tout soit bien clair, prcisons le fonctionnement de la
procdure d'enqute : par exemple demandons aux 225 tudiants d'un
amphi de Deug 1 de sociologie de rpondre rapidement sur une feuille
aux deux questions suivantes : "fumez-vous au moins une cigarette par
jour ?" (deux modalits : "oui"/"non") et "quel est votre sexe ?"
("masculin"/"fminin"). A la fin du cours, quatre tas de rponses
pouvaient tre faits, d'paisseurs ingales : un premier tas de 29
feuilles qui reprsente les individus qui taient la fois masculin et
fumeurs (ayant rpondu "oui" la question sur le fait de fumer), puis
viennent les 17 masculin et non-fumeurs, les 70 fminin ne fumant pas
et les 109 fminin et ayant rpondu oui la question sur le fait de
fumer. Faire un tableau crois consiste rpartir ces 4 nombres en un
tableau deux dimensions o par exemple les lignes signalent les
modalits de sexe et les colonnes les modalits de rponse au fait de
fumer. En totalisant les lignes et les colonnes on a le tableau crois
suivant qui est classique et sur lequel nous reviendrons plus loin
(Enqute note FUM97).
Oui fume
Non ne fume pas
Total
Sexe masculin
29
17
46
Sexe fminin
70
109
179
-----------------------------------------------------------Total
99
126
225
Les marges du tableau sont les nombres en italique obtenus par
totalisation : la marge colonne nous indique que sur 225 tudiants
(total gnral en gras), 46 sont de sexe masculin et 179 de sexe
fminin et la marge ligne nous indique dj que les non-fumeurs sont
plus nombreux que les fumeurs.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

Le tableau crois est l'outil de base du sociologue ds qu'il est


confront des donnes d'enqute : certes le sociologue qui analyse ce
type de donnes commence toujours par regarder chaque question
individuellement par le biais de la rpartition des effectifs de chaque
modalit mais rapidement, on prouve le besoin de croiser des
questions. Les techniques pour aider la lecture des tableaux croiss
seront tudies dans le premier chapitre.
Le deuxime chapitre tentera de rpondre la question suivante :
les 225 de cet amphi de Deug sont-ils suffisamment nombreux pour
trancher la question de savoir s'il y a une liaison entre le sexe et le fait
de fumer. Si on voit une liaison dans le cas prsent, est-elle
gnralisable d'autres amphis comparables ?
Les deux chapitres de cet ouvrage rendent compte des deux
questions de base que se pose un sociologue face un tableau crois
qui cherche savoir : ce que dit le tableau ; si les rsultats aperus
sont fiables. D'autres techniques utilises par le sociologue pour
dpouiller des enqutes sont envisager : elles permettent de prendre
ensemble en considration non pas deux questions de l'enqute mais
davantage. Ce sont les techniques d'analyse factorielle et de rgression
sur donnes d'enqute : elles dpassent le cadre du prsent ouvrage.
Comment utiliser ce livre
La technique d'exposition partant toujours d'un exemple, il faut
refaire les calculs mais il faut surtout appliquer les mthodes sur
d'autres donnes. Le prsent expos ne trouve pleinement sa valeur
qu'associ des travaux pratiques sur des donnes d'enqutes. Il est en
gnral assez facile de s'en procurer car les enqutes faites des fins
pdagogiques et de recherche sont nombreuses. Pour le traitement, le
recours l'informatique semble aujourd'hui indispensable. Des
tableaux croiss peuvent tre obtenus avec tous les logiciels qui
traitent de donnes d'enqutes. Certaines techniques plus spcifiques
sont disponibles sur plusieurs de ces logiciels (Trideux, Modalisa).

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

Sources
La technique de lecture des tableaux croiss en utilisant les
pourcentages en ligne n'est pas ma connaissance attribue un
auteur particulier : elle fait partie du savoir commun d'une discipline.
J'ai propos la technique de lecture rapide dans L'analyse des donnes
en sociologie, paru en 1984 aux Presses Universitaires de France ; la
reprsentation des carts l'indpendance a t prsente d'une
manire formalise dans "Mthodes post-factorielles pour le
dpouillement denqute", Bulletin de Mthodologie sociologique,
n1, octobre 1983 et les indices de liaison d'une attraction dans "Le
PEM, pourcentage de l'cart maximum : un indice de liaison entre
modalits d'un tableau de contingence", Bulletin de mthodologie
sociologique, n40, septembre 1993.
Quant au Khi-deux, il est centenaire puisqu'il a t propos par Karl
Pearson en 1900. Dans le titre de la publication d'origine1, il propose
de trouver une manire de faire "raisonnable" pour tester si une liaison
observe est due ou non au hasard. Il n'est pas sr que depuis cette
date, la littrature qui traite du Khi-deux soit reste "raisonnable",
surtout dans les manuels qui l'enseignent. On essayera ici, dans la
ligne du crateur et de certains de ses successeurs de proposer une
pratique raisonnable de cet indicateur2.

"On the Criterion that a given System of Deviations from the Probable in the
case of a Correlated System of Variables is such that it can be reasonably
supposed to have arisen from Random Sampling", The London, Edinburgh and
Dublin Philosophical magazine and Journal of Science, 1900, vol. 50, p.157-175.
Rdit d'une manire plus accessible dans Kearl Pearson early Statistical
Papers, Cambridge University Press, 1956.
2

Ce texte a t orthographi en suivant les recommandations du Conseil


suprieur de la langue franaise approuves l'unanimit par l'Acadmie franaise
le 3 mai 1990 et que celle-ci a souhait, le 17 janvier 1991 soumettre " l'preuve

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

Chapitre 1
Attraction et indpendance
1 Lattraction
Lenqute 1989 sur les pratiques culturelles des franais3 nous
apprend que les 4997 enquts se rpartissent de la manire suivante si
lon considre le sexe et le fait daller la chasse4 :
Hommes allant la chasse
172
Femmes

23
Hommes nallant pas la chasse
2232
Femmes

2570
-----------------Total
4997
De cette distribution deffectifs nous pouvons dabord tirer le
pourcentage de ceux qui vont la chasse : 172 hommes + 23 femmes
soit 195 individus sur un total de 4997, soit donc une proportion de
195/4997 = 0,039 et un pourcentage de 3,9%. Il sagit donc dune
pratique assez rare.
Notons qu'une proportion est toujours comprise entre 0 et 1, un
pourcentage entre 0 et 100 : on calcule en proportion parce que cest
du temps". Ces modifications portent surtout sur des simplifications d'accent
(absence d'accent circonflexe sur le "i" et sur le "u" sauf cas d'ambigit et
rgularisations : "vnement" comme "avnement").
3

Nouvelle enqute sur les pratiques culturelles des franais en 1989, Paris,
1990, La Documentation franaise, dsigne dans la suite PRAT89.
4

Aller la chasse souvent ou de temps en temps

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

en gnral plus simple, mais on parle en pourcentage parce que depuis


lpoque contemporaine, cest le mode le plus habituel pour comparer
des grandeurs. Pour passer dune reprsentation lautre, on dplace
la virgule de deux rangs. Il faut se souvenir que lexpression 3,9 pour
cent est synonyme de 3,9/100, cest dire de la proportion
correspondante de 0,039.
A partir de cette distribution, nous pouvons galement rpondre la
question suivante : qui va le plus la chasse ? Les hommes ou les
femmes ? . La rponse semble vidente mais prcisons la en
disposant la distribution sous forme dun tableau crois5, o chaque
ligne correspond une catgorie de sexe et chaque colonne le fait
daller la chasse ou non. Sur les marges du tableau sont disposes les
sommes des lignes et des colonnes
Chasse
Non chasse Total
Hommes
172
2232
2404
Femmes
23
2570
2593
-----------------------------------------------------------Total
195
4802
4997
Calculons pour chaque ligne le pourcentage de chaque sexe dans les
deux catgories et le pourcentage moyen (dj calcul)
Chasse
Non chasse Total
Hommes
7,2
92,8
100
Femmes
0,9
99,1
100
-----------------------------------------------------------Total
3,9
96,1
100

appel aussi tableau de contingence. Ce terme semploie surtout dans les


milieux de la statistique (mathmatiques ou conomie). En sociologie cest plutt
le terme de tableau crois qui est employ.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

10

La chasse est une pratique rare (environ 4%) mais trs peu
frquente chez les femmes (moins de 1%) et proche de 7%6 chez les
hommes. Le pourcentage moyen de 3,9% nous sert de repre et la
comparaison se fait entre ce pourcentage et ceux de chacune des deux
catgories de sexe : il est plus fort que la moyenne pour les homme,
plus faible pour les femmes. On compare toujours
perpendiculairement au pourcentage en ligne.
Ce rsultat nest pas surprenant : chacun sait que la chasse est une
activit socialement marque comme masculine. Ce quil est
intressant de voir ici cest que nous pouvons, par la comparaison des
pourcentages, formaliser ce marquage social. Cest ce que nous
appellerons dsormais lattraction. Lattraction entre deux ralits
sociales est rvle par la diffrence au pourcentage moyen. Ici il y a
attraction entre le fait daller la chasse et dtre de sexe masculin.
En cherchant dans la mme enqute des activits marques cette
fois comme fminines, on retrouve le mme phnomne d'attraction
avec le fait de faire soi-mme des vtements.

172/2404 = 0,07154742097.... et il faut choisir une prcision. Ici, sur un total


correspondant 2404, 1% correspond 24 personnes ce qui est un manque
manifeste de prcision, 0,1% 2,4 personnes et 0,01% 0,24 personne, ce qui
devient incohrent car la prcision minimum ne peut tre que dune personne et
pas dun quart de personne. On choisit donc la prcision dun chiffre aprs la
virgule pour la prcision des pourcentages. On conservera cette prcision mme si
les effectifs de rfrence sont infrieurs afin de toujours distinguer
typographiquement entre les effectifs observs qui sont des entiers et les
pourcentages qui seront toujours dcimaux. Quant larrondi, il se fera toujours
au plus prs, non pour une prcision illusoire, mais pour rpartir les restes tantt
par excs et tantt par dfaut (on crira 7,1 pour 7,10 7,14 et 7,2 pour 7,15
7,19). Le total de 100 est une rfrence qui doit tre affiche comme telle, non la
somme des arrondis qui peut trs bien diffrer de 100.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

11

Fait des vtements


Nen fait pas
Total
Hommes
33
2371
2404
%
1,4
98,6
100
Femmes
472
2121
2593
%
18,2
81,8
100
-----------------------------------------------------------Total
505
4492
4997
%
10,1
89,9
100
En moyenne 10% de la population participe la fabrication de ses
vtements mais la proportion7 en est plus forte pour les femmes
(18,2%) que pour les hommes (1,4%). On peut ajouter cette
information simplifie sur le tableau en notant dun signe plus les
carts positifs au pourcentage moyen et dun signe moins les carts
ngatifs. On dispose ainsi dune lecture rapide du tableau

Hommes
Femmes

Fait des vtements Nen fait pas


+
+
-

Il y a attraction entre faire ses vtements et sexe fminin et


opposition entre faire ses vtements et sexe masculin (on a
inversion des signes pour la deuxime colonne). On notera quune
opposition nest pas une absence : des hommes font des vtements,
mais moins que la moyenne.
Que se passe-t-il si lon considre les pourcentages en colonnes :
cela change-t-il les rsultats et leur interprtation ?
Fait des vtements

Nen fait pas

Total

on suit le langage courant qui parle spontanment de proportion, mais on


visualise cette proportion par son pourcentage correspondant. Ce double langage
sera souvent employ dans la suite.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

12

%
%
%
Hommes
33
2371
2404
6,5
52,8
48,1
Femmes
472
2121
2593
93,5
47,2
51,9
-----------------------------------------------------------Total
505
4492
4997
100
100
100
En termes dattractions ou doppositions les rsultats sont les
mmes mais les rfrences de comparaisons sont diffrentes : la
moyenne est ici la rpartition des sexes, un peu en faveur des femmes,
ce qui est normal du fait de la surmortalit masculine pour une
enqute qui prend en compte toute la population partir de 18 ans.
Lattraction femmes - vtements est reprable car 93,5%
(proportion des femmes dans ceux qui font leurs vtements) est plus
fort que 51,9% (proportion moyenne des femmes). Tous les signes des
carts au pourcentage moyen sont les mmes bien que tous les
pourcentages soient diffrents.
Linconvnient de cette deuxime prsentation du tableau est
quelle masque le fait que la fabrication de vtements est un
phnomne plutt rare, quelque soit le sexe, ce qui tait bien mis en
relief dans la premire prsentation puisque ctait la base de la
comparaison. Par contre, ce qui sert de rfrence dans cette deuxime
prsentation, cest la comparaison des sexes qui nest pas le
phnomne que lon souhaite tudier car cest dj quelque chose de
connu. On trouve l la justification de la pratique habituelle des
sociologues de mettre par convention en ligne la variable
pralablement connue (variable dite aussi explicative ) et de mettre
en colonne la variable nouvelle, celle dont on veut rendre compte

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

13

(variable dite expliquer ), et de toujours calculer les pourcentages


en ligne.
Que lon travaille avec des pourcentages en ligne ou en colonne, et
cest un rsultat gnral, le signe des carts au pourcentage moyen est
le mme : il manifeste pour un signe plus lattraction entre la modalit
de ligne et celle de colonne (ou son opposition pour un signe moins).
Cest un invariant du tableau, il ne dpend pas de ce qui est mis en
ligne ou en colonne et comme tel il doit tre privilgi.
Lattraction, quand elle est suffisamment forte est dj repre par
le sens commun car certaines activits sont marques socialement et
perues comme telles : lexamen du tableau crois et des pourcentages
en ligne permet de formaliser la prsence de cette attraction. Avant
den tudier la force il faut envisager le cas de labsence dattraction.

2 Lindpendance
Toujours de la mme enqute on peut tirer le tableau crois entre le
sexe et le fait de s'occuper d'un jardin : on donne les effectifs et les
pourcentages en ligne.
S'occupe d'un jardin
Oui
Non
Total
Hommes
965
1439
2404
%
40,1
59,9
100
Femmes
1052
1541
2593
%
40,6
59,4
100
-----------------------------------------------------------Total
2017
2980
4997
%
40,4
59,6
100

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

14

En moyenne environ 40% des gens s'occupent d'un jardin et cette


proportion moyenne est celle des deux sexes : cette absence de
diffrence signifie quil ny a pas dattraction ni dopposition entre la
pratique tudie et le sexe : il y a indpendance entre les deux
variables. On retrouve le mme rsultat en comparant les
pourcentages de la deuxime colonne.
Cependant, si l'on regarde les choses de prs, on doit dire que les
hommes s'occupent moins d'un jardin que les femmes puisque ils s'en
occupent pour 40,1% d'entre eux contre 40,6% chez les femmes. Mais
cet cart est-il notable ou ngligeable ? Pour rpondre cette question,
mettons nous dans le cas de lindpendance stricte, de lgalit des
pourcentages de lignes au pourcentage moyen. Si la situation moyenne
de 40,4% de pratique du jardin sappliquait strictement aux 2404
hommes, combien serait-il exactement s'occuper de leur jardin ?
40,4% correspond une proportion plus exacte8 de 2017 / 4997 =
0,40364 qui applique par multiplication au 2404 hommes donne un
effectif de 970,4. Cet effectif, du simple fait quil ne soit pas un entier
est videmment hypothtique et cest pourquoi on lappelle effectif
thorique correspondant la situation hypothtique d'indpendance9.
Lcart entre leffectif observ et leffectif thorique est de
965 - 970,4 = -5,4 individus ce qui est faible et peut tre considr
comme ngligeable car une diffrence d'environ 5 individus par
rapport une population observe de 965 est peu de choses. Le calcul
est analogue pour les autres cases o l'on voit que les diffrences
positives ou ngatives par rapport l'effectif thorique correspondant
l'indpendance sont de 5,4 individus. Au total c'est donc environ une
8

pour ne pas avoir une drive darrondis dans les calculs, on prend ici pour les
oprations davantage de dcimales
9

ou, pour reprendre une terminologie courante, l'effectif thorique sous


l'hypothse d'indpendance

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

15

vingtaine d'individus qui est en cart l'indpendance (soit en positif,


soit en ngatif, ce qui par rapport une population totale d'environ
5000 individus reprsente 20 / 5000 = 0,004 soit 0,4%). On peut donc
conclure qu'il n'y a pratiquement pas d'carts entre ce qui est observ
et ce qu'il y aurait s'il y avait indpendance entre les deux variables.
Faire son jardin n'est pas une opration marque par le sexe, c'est une
opration aussi bien faite par des hommes que par des femmes.
On remarquera que :
1) la proportion de 0,40364 est le rapport du nombre de personnes qui
s'occupent d'un jardin (gal 2017) par rapport lensemble de la
population de 4997. Cest ce rapport de 2017/4997 que lon multiple
par le total du nombre d'hommes de 2404 : on peut rsumer
lopration en disant que le produit 2017 / 4997 2404 ou encore
2017 2404 / 4997 = 970,4 est le produit des effectifs des marges
(s'occuper d'un jardin et sexe masculin) divis par le total. Dune
manire stnographique on dit que leffectif thorique se calcule en
faisant le produit des marges divis par le total10.
2) ce calcul est symtrique. Si lon travaille en colonnes, la proportion
moyenne est de 2404 / 4997 que lon applique au 2017 qui s'occupent
de leur jardin et lon retrouve le mme rsultat de 970,4 comme
effectif thorique. Effectif thorique et effectif en cart
lindpendance sont galement des invariants du tableau, cest dire
quils ne dpendent pas de sa disposition concernant ce qui est mis en
ligne ou en colonne.
3) dans ce tableau, une autre manire de reprer que lcart
lindpendance est faible est de voir ce qui se passerait si les donnes
10

Formule retenir : thorique = produit des marges / total ; ou produit des


mages sur total, ou encore produit des marges par total (sous-entendu divis par)

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

16

taient trs peu diffrentes, par exemple si 8 hommes de plus taient


dans le camp de ceux qui s'occupent de leur jardin et 8 femmes dans
celui de ceux qui ne s'en occupent pas11. Les marges du tableau
seraient ainsi identiques et donc les effectifs thoriques seraient les
mmes. Dans ce cas, pour la case masculin-jardin, lobserv
(imaginaire) est de 965 + 8= 973, et le pourcentage des jardiniers chez
les hommes est dsormais de 973 / 2404 soit 40,5%, ce qui est
suprieur au pourcentage moyen. Lattraction se fait maintenant entre
sexe masculin et le fait de jardiner. Le mme phnomne est repr en
comparant leffectif observ (imaginaire) de 973 avec leffectif
thorique. Cette fois la diffrence effectif observ moins effectif
thorique est de 973 - 970,4 = 2,6 individus.
Cet cart positif est le reflet de cette attraction (imaginaire). En
conclusion si donc le changement de quelques individus a entrain
linversion des signes des carts, cest que ces signes sont ici peu
fiables du fait quon est trs proche de lindpendance.

3 Lcart lindpendance
Puisque l'effectif thorique est un invariant ne dpendant pas de
l'orientation ligne/colonne, il est possible de calculer pour chaque case
(des donnes relles et non imaginaires) l'effectif correspondant
l'indpendance (produit des marges par le total), puis par diffrence
avec l'observ12, l'cart l'indpendance. On retrouvera pour la

11

Attention : il s'agit d'une exprience fictive pour voir ce qui se passerait si on


tait dans cette situation. La situation observe est ce qu'elle est et on n'a jamais le
droit de la modifier : une exprience "de pense" doit rester virtuelle. Les donnes
sont intouchables.
12

abrviation classique d'effectif observ ; on dit aussi l'observation.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

17

premire case ce que nous avons dj donn : observ = 965 ;


thorique13 = 970,4, cart14 = -5,4

Homme : observ
thorique
cart

S'occupe d'un jardin


Oui
Non
965
1439
970,4
1433,6
-5,4
+5,4

Total
2404

Femme : observ
1052
1541
2593
thorique
1046,6
1546,4
cart
+5,4
-5,4
-------------------------------------------------Total
2017
2980
4997
Les quatre carts l'indpendance sont identiques en valeur absolu :
ce phnomne est li au format du tableau, le fait qu'il soit 2 lignes
et 2 colonnes. Quand l'une de ces dimensions devient suprieure 2,
le phnomne d'galit en valeur absolue disparait pour cette
dimension.
Prenons dans la mme enqute un tableau o les diffrences soient
plus marques : il suffit pour cela de ne pas prendre la pratique du
jardinage en gnral, mais le type de jardinage qui dans l'enqute tait
distingu en deux catgories : jardin potager et jardin d'agrment. Soit
le mme croisement pour la pratique du seul jardin d'agrment (fleurs,
pelouse) :

13

abrviation de effectif thorique sous l'hypothse d'indpendance

14

abrviation d'effectif d'cart entre l'observ et le thorique

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

18

S'occupe d'un jardin d'agrment


Oui
Non
Total
Hommes
745
1659
2404
%
31,0
69,0
100
Femmes
932
1661
2593
%
35,9
64,1
100
-----------------------------------------------------------Total
1677
3320
4997
%
33,6
66,4
100
La lecture rapide qui consiste reprer le signe des carts
l'indpendance (par le biais des carts au pourcentage moyen) nous
donne la structure suivante :
S'occupe d'un jardin d'agrment
Oui
Non
Hommes
+
Femmes
+
On voit que les femmes sont plus nombreuses que les hommes
s'occuper d'un jardin d'agrment, pratique qui est le fait d'un tiers de la
population. Le jardin d'agrment est marqu fminin.
Inversement on a les rsultats suivants pour le jardin potager :
S'occupe d'un jardin potager
Oui
Non
Total
Hommes
671
1733
2404
%
27,9
72,1
100
Femmes
520
2073
2593
%
20,1
79,9
100
-----------------------------------------------------------Total
1191
3806
4997
%
23,8
76,2
100

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

19

La situation est inverse : la lecture rapide nous donne la structure


suivante :
S'occupe d'un jardin potager
Oui
Non
Hommes
+
Femmes
+
Le jardin potager est marqu masculin avec tous les strotypes
associs : ncessit de la force physique, production utile, alors que les
strotypes associs au jardin d'agrment sont "la grce et la
dlicatesse fminine" associes la cueillette des roses. Le marquage
social est moins fort que dans le cas de la chasse ou de la fabrication
des vtements, il existe cependant, sauf quand on envisage le mlange
des deux activits o les tendances vers les attractions fminines ou
masculines s'annulent.15
Rsumons les outils mis au point : l'cart au pourcentage moyen
nous permet de rapidement reprer le signe des carts
l'indpendance (attraction ou rpulsion). Il ne faut pas confondre ces
deux outils : l'cart au pourcentage moyen est en gnral calcul en
ligne (c'est la diffrence entre le pourcentage de la ligne et le
pourcentage toutes lignes confondues) : c'est donc une diffrence de
pourcentage.
L'cart l'indpendance est un effectif et c'est un invariant,
indpendant du choix des lignes et des colonnes (c'est la diffrence
entre l'effectif observ et l'effectif thorique : le rsultat est donc un
effectif). Seuls les signes sont les mmes pour ces deux outils et c'est
ce qui permet d'utiliser l'cart au pourcentage moyen, particulirement
15

Le tableau initial (jardinage sans autre indication) n'est pas la somme des
deux tableaux spcifiques (potager et agrment), mais leur mlange qui ne peut
tre qu'observ et non calcul car 851 personnes pratiquent les deux types de
jardinages.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

20

simple calculer, pour arriver facilement une lecture rapide du


tableau o l'on ne considre et interprte que les signes des carts
l'indpendance.
Une lecture rapide est un instrument qui a les qualit et les limites
des techniques analogues de lecture des livres : elle permet de se faire
une ide approche de la structure des carts d'un tableau crois. Sa
rapidit est son avantage mais elle doit souvent tre complte par une
lecture exhaustive de l'ensemble des carts du tableau. C'est ce qui va
tre rendu possible par la technique de lecture intgrale d'un tableau
par le biais de sa visualisation graphique.

4 La visualisation de lcart lindpendance


Faire un graphique, c'est tirer d'un ensemble de nombres ceux que
l'on juge pertinents de reprsenter et, cette fin, on remplace en
gnral ces nombres par des longueurs (diagrammes en btonnets) ou
par des surfaces (diagrammes en part de gteaux16). Ces visualisations
graphiques sont efficaces pour des distributions simples (mme si elles
sont nombreuses) mais non pour des tableaux croiss dont on a vu que
l'lment utile et invariant tait l'cart l'indpendance.
Avant de reprsenter ces carts, nous allons montrer comment on
peut y arriver en commenant par reprsenter, non pas les carts, mais
l'ensemble des effectifs du tableau par des surfaces proportionnelles
aux effectifs de chaque case du tableau. Nous travaillerons sur un
tableau plus vaste que les prcdents : il sera 3 lignes et 4 colonnes.
Les donnes sont tires de lenqute LATIN9417. De cette enqute
faite auprs de 1058 rpondants de la rgion parisienne de classe

16

ou de camembert selon les cultures nationales

17

Enqute faite en 1994 dans le cadre de lenseignement de mthodologie du


Deug de Paris V en collaboration avec Franois de Singly. Elle est centre sur

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

21

moyenne ou suprieure (ni ouvriers, ni employs) parents dun enfant


en Cours moyen lcole primaire, on tire les deux questions
suivantes
1) proximit politique :"On classe habituellement les gens sur une
chelle de ce genre o, comme vous le voyez, on peut classer les gens
plus ou moins gauche ou plus au moins droite. Vous
personnellement, pouvez-vous me dire, par un numro, o vous vous
situez sur cette chelle ?" (montrer chelle politique)
1. extrme gauche
5. centre droit
2. gauche
6. droite
3. centre gauche
7. extrme droite
4. centre
(0. Non rponse)

l'enseignement du latin : on a fait l'hypothse que l'attitude vis vis de cet


enseignement pouvait avoir des liens avec les opinions politiques et religieuses.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

22

Cette question en 7 modalits est recode18 de la faon suivante :


1) gauche (anciennes modalits 1 3)
2) centre (anciennes modalits 4 ou non rponse 0)
3) droite (anciennes modalits 5 7)
2) positionnement religieux :
Vous considrez-vous comme :
1. catholique pratiquant
2. catholique non pratiquant
3. de tradition catholique mais
ni croyant ni pratiquant
4. sans religion

5. protestant
6. juif
7. autre religion (noter)
(0. Non rponse)

On limine les individus ayant pris les modalits 5 7 et 0 qui


correspondent des effectifs faibles et qui demanderaient une enqute
spcifique et lon obtient le tableau crois suivant :
Choix religieux
Choix pol. Pratiquant Non prat Tradition Sans religion
Gauche
34
95
170
149
Centre
51
113
93
52

18

Total
448
309

recoder signifie agrger dans un mme code ce qui tait auparavant dans des
modalits diffrentes : ces opration sont faites d'une manire logicielle (ici par
lintermdiaire du programme OUTILS du logiciel TRIDEUX)

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

23

Droite
Total

61
85
33
19
198
------------------------------------------------------------------146
293
296
220
955

on calcule les pourcentages en ligne et des marges :


Choix pol. Pratiquant Non prat Tradition Sans religion Total
Gauche
7,6
21,2
37,9
33,3
100 46,9
Centre
16,5
36,6
30,1
16,8
100 32,4
Droite
30,8
42,9
16,7
9,6
100 20,7
-----------------------------------------------------------------------Total
15,3
30,7
31,0
23,0
100 100
Pour faire une reprsentation graphique de l'ensemble, il faut dj
constater que la gauche, qui reprsente 46,9% de la population (marge
du total en colonne) doit reprsenter 46,9% de la surface du graphique,
le centre 32,4% et la droite 20,7%. A cette fin on considre une
surface carre (pour des essais sur papier millimtr par exemple de
10 cm sur 10 cm) que l'on divise en trois bandes, la premire de
gauche de 46,9 mm (arrondis 47 mm), puis de 32 mm pour le centre
et 21 mm pour la droite. Soit le graphique RELPOL1 qui respecte ces
proportions (mais non ces units).

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

24

Puisque l'ensemble de la surface correspond 100% de la


population, la premire bande qui reprsente 46,9% de la largeur
correspond cette proportion de la population et reprsente donc la
population qui se classe politiquement gauche. On a de mme les
deux autres bandes proportionnelles au Centre et la Droite.
Divisons maintenant l'autre dimension de la surface en tenant
compte de l'autre point de vue, celui de la pratique religieuse. On peut
diviser l'autre dimension proportionnellement aux pourcentages
marginaux comme ci-dessous dans le graphique RELPOL2:

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

25

Nous avons bien divis la surface totale proportionnellement aux


pourcentages des marges mais le rsultat obtenu n'est pas la
reprsentation du tableau crois mais une ralit qui ne dpend que
des marges, c'est dire un tableau proportionnel aux effectifs
thoriques. En effet, soit la surface de la premire case du tableau, les
pratiquants de gauche. De la bande de la Gauche (qui correspond
46,9% de la surface), on prend les 15,3% qui correspondent aux
pratiquants. Pour faciliter les calculs on utilise les proportions
correspondantes : prendre 15,3% de 46,9% cela revient multiplier
0,153 par 0,469 soit en revenant aux effectifs qui permettent de
calculer
ces
proportions
146 / 955 448 / 955 = 0,0717. Cette case des pratiquants de gauche
correspond 7,2% de la population. Pour retrouver l'effectif
correspondant, il suffit de multiplier la proportion par l'effectif total
soit 0,0717 955 = 68,5 individus. En multipliant la proportion avant
calcul (146 / 955 448 / 955) par l'effectif, il y a une simplification
par l'effectif 955 qui se retrouve une fois en bas et une fois en haut et

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

26

l'on retrouve le rsultat :


146 448 / 955 = 68,5 o l'on reconnait l'effectif thorique, produit
des marges par le total.
En conclusion, une surface quelconque du tableau est
proportionnelle l'effectif thorique de la case considre. Ce rsultat
est utilis par un certain nombre de reprsentations graphiques qui
visualisent dans la case l'intensit de l'attraction ou de la rpulsion,
mais le graphique ne visualise toujours pas les carts l'indpendance.
La raison en est simple, c'est que les diffrentes bandes de la surface
(qui correspondent au lignes du tableau), doivent avoir chacune leur
division propre exprime par le pourcentage de chaque ligne. On va
donc dans chaque bande faire la division selon la rpartition de chaque
ligne.

Dans le graphique RELPOL3, chaque bande est divise selon le


pourcentage en ligne : par exemple les sans religion de gauche
reprsentent 33,3% de la gauche, ce qui est davantage que le
pourcentage moyen de 23,0% que l'on a laiss comme repre droite.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

27

On a tram les surfaces correspondant aux cases extrmes du tableau :


par exemple, faisons un grossissement pour les sans religion :

Le pourcentage dans la gauche est de 33,3% (pourcentage en ligne),


donc plus que la moyenne qui est de 23,0% (pourcentage toutes lignes
confondues). Au centre le pourcentage est de 16,8% et droite de
9,6%.
Dans ces trois bandes, on peut reprer les surfaces qui
correspondent des carts au pourcentage moyen : dans la bande de
gauche, c'est la surface de largeur 46,9mm qui dpasse la hauteur
moyenne de 23,0mm (cart de 10,3mm). Dans la bande du centre, c'est
la surface de largeur 32,4mm comprise entre la hauteur de la case (
16,8mm) et la hauteur moyenne de 23,0 ; de hauteur gale la
diffrence entre le pourcentage de la ligne et le pourcentage moyen

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

28

toutes lignes confondues 16,8 - 23,0 = - 6,2 : le rsultat est ngatif car
c'est un dficit par rapport la moyenne (le pourcentage moyen).
Enfin pour la droite, la largeur est de 20,7mm et la hauteur gale 9,6
- 23,0 = -13,4
Vrifions : la base du premier rectangle est ce que nous appellerons
l'importance globale, ou le poids de la gauche. En pourcentage c'est
46,9% du total, en proportion c'est plus prcisment 448 personnes de
gauche sur 955 : 448 / 955 = 0,4691.
PoidsGauche = 0,4691 et de mme
PoidsCentre = 0,3236
PoidsDroite = 0,2073
la somme des poids est l'unit ( l'arrondi prs ventuellement).
La hauteur du premier rectangle, c'est la diffrence entre le
pourcentage de la ligne 33,3 et le pourcentage toutes lignes
confondues, 23,0. En proportion, appelons Proportion de la gauche
pour les sans religion (en abrg PropGaucheSR) le rapport
149 / 448 = 0,3326
PropGaucheSR = 0,3326 et de mme
PropCentreSR = 0,1683
PpropDroiteSR = 0,0960
la proportion des sans religion toute lignes confondues est :
PropSR
= 0,2304
La hauteur du premier rectangle est gale PropGaucheSR PropSR = 0,1022 c'est l'cart au pourcentage moyen que nous
nommons EcartGaucheSR.
La surface est le produit de la largeur par la hauteur, produit de
PoidsGauche par EcartGaucheSR soit 0,4691 0,1022 = 0,04794.
Cette proportion d'un effectif total de 955 (appel Total) correspond
un effectif de

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

29

0,04794 Total soit 0,04794 955 = 45,8 individus. Vrifions que


c'est bien l'effectif en cart l'indpendance :
L'effectif thorique produit des marges par le total :
448 220 / 955 = 103,2
L'effectif observ est de 149 ;
observ - thorique = 149 - 103,2 = 45,8 on retrouve bien la mme
valeur correspondant l'cart l'indpendance.
Pour les deux autres cases on a en proportion :
- EcartCentreSR = PoidsCentre(PropCentreSR - PropSR) = 0,02010
et en effectif EcartCentreSRTotal = -0,02010 955 = -19,2
- EcartDroiteSR = PoidsDroite(PropDroiteSR - PropSR) = -0,02786
et en effectif EcartDroiteSR Total = -0,02786 955 = -26,6
En rsum :
Effectif EcartGaucheSR = 45,8
Effectif EcartCentreSR = -19,2
Effectif EcartDroiteSR = -26,6
Somme des carts ngatifs = -45,8
On voit immdiatement que la surface en cart positif (au-dessus)
est gale la somme des carts ngatifs (en-dessous)
Pour visualiser les carts l'indpendance, il suffit donc de gommer
le bas du graphique et de ne retenir que les surfaces correspondants
aux carts l'indpendance : au-dessus de la moyenne pour la gauche,
en-dessous pour le centre et la droite. On a maintenant le graphique
RELPOL5 suivant :

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

30

Pour mieux faire apparaitre les attractions qui correspondent aux


carts positifs l'indpendance, on trame les surfaces correspondantes.
Il reste obtenir les profils correspondant aux autres colonnes du
tableau. Il n'est pas ncessaire de repasser par toutes les tapes
prcdentes puisqu'on constate qu'il suffit de prendre en compte les
carts au pourcentage moyen de chaque colonne et, sur un trait
horizontal affect au pourcentage moyen, de construire des rectangles,
de mmes bases pour tous les profils, au-dessus ou en-dessous du
pourcentage moyen selon le signe de l'cart, et de hauteur gal l'cart
au pourcentage moyen.
Soit le calcul des carts au pourcentage moyen :

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

31

Gauche
Centre
Droite

Pratiquant Non prat


-7,7
-9,5
+1,2
+5,9
+15,5
+12,2

Tradition
+6,9
-0,9
-14,3

Sans religion
+10,3
-6,2
-13,4

A titre dexemple, lcart positif qui marque lattraction entre


Droite et pratiquant pour base une longueur proportionnelle
20,7, pourcentage de la ligne droite et une hauteur positive
proportionnelle +15,5, cart au pourcentage moyen de cette case.
Finalement aprs avoir fait la mme opration pour les autres
colonnes, et avoir ajout une chelle19, on a la reprsentation en
surface des carts lindpendance du suivante :

19

Echelle obtenue de la manire suivante : si le carr initial de 100mm sur


100mm soit 10.000mm correspond au total de 955 individus, 1 individus
correspond une surface de 10.000/955 mm = 10,47 mm et donc un carr de
ct gal la racine carre de 10,47 soit 3,2mm. Pour 10 individus la surface est
de 104,7mm et le ct du rectangle est de 10,2mm ce qui est tout fait lisible.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

32

Interprtation
Le but dune reprsentation graphique est de permettre une lecture
simultane de tous les lments pertinents du tableau (attractions
notes par une surface au-dessus et souligns en noir car cest ce qui
est le plus intressant ; absence dcarts ou indpendance note par
une simple ligne horizontale ; oppositions notes par une surface en
dessous).
On voit aisment :
- que catholiques pratiquants et non-pratiquants sont plutt en
attraction avec la droite ;

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

33

- que sans religion et personnes de tradition catholique se situent


plutt en attraction avec la gauche.
Il sagit l dun phnomne bien connu20 et li lhistoire des
rapports entre catholicisme et vie politique en France depuis la
Rvolution. En effet la Rvolution dans ses dbuts na pas t
antireligieuse : le clerg a particip aux cahiers de dolances et la fte
de la fdration du 14 juillet 1790 a connu sa Grand-messe (clbre
par Talleyrand). Ce nest quau moment o les rvolutionnaires,
semble-t-il essentiellement pour des raisons financires, ont voulu
pousser bout les tendances gallicanes de lEglise de France, cest
dire faire une Eglise de France qui soit autonome vis--vis de Rome,
quune partie du clerg sest oppose cette rupture et a refus de
jurer fidlit au nouveau rgime. Prtres jureurs (soutenus par le
pouvoir) et rfractaires (recherchs et perscuts) ont divis la socit
d'une faon profonde. Le clerg rfractaire est rest dans un mme
geste fidle Rome et fidle au Roi. De lautre ct, le radicalisme
antireligieux de la Rvolution sappuie sur cette fidlit pour voir dans
le catholicisme un soutien de ltranger qui veut la mort de lide
rvolutionnaire.
Napolon calme le jeu par le Concordat de 1801 qui durera un
sicle pendant lequel lamalgame cr la Rvolution va se maintenir
: les forces qui ont impos la Restauration sont lies au catholicisme ;

20

cf. sur laspect politique : Ren Rmond, La droite en France, Paris, Aubier,
1963 ; Jean-Franois Sirinelli (dir.) Histoire des droites en France, Paris,
Gallimard, 1992, 3 volumes (repris partiellement en poche sous le titre : Les
droites franaises, folio histoire n63) ; sur la question scolaire, Alain Prost,
Lenseignement en France 1800-1967, Paris, Armand Colin, 1968 ; sur les
rapports spcifiques entre classe sociale et religion cf. Guy Michelat et Michel
Simon, Classe religion et comportement politique, Paris, Presses de la FNSP et
ed. sociales, 1977 et la nouvelle apprciation de : Jean-Marie Donegani, La libert
de choisir, Paris, Presses de la FNSP, 1993.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

34

les forces qui luttent pour continuer l'uvre de la Rvolution


sopposent la volont politique de lEglise catholique et luttent
contre elle pour cette raison. Sous la troisime Rpublique,
lopposition est forte entre gauche et droite de lpoque : entre le camp
rpublicain et le camp lgitimiste. Progressivement, les rpublicains
vont vouloir affranchir la politique franaise de la domination de
lEglise catholique, en particulier en ce qui concerne lcole car ils ont
bien conscience que lemprise sur les esprits passe par ce biais. Bien
que les catholiques aient fini par se rallier la Rpublique, soutenu
dans cette attitude par le Pape Lon XIII, cette tendance la
dissociation trouvera son point culminant avec la Sparation de
lEglise et de lEtat de 1904.
Depuis, lopposition sur la question scolaire sest amalgame
l'opposition gauche/droite. Il est symptomatique de voir que les
manifestations les plus importantes des annes 1980 et 1990 ont t
lies la question scolaire : manifestations de plus dun million de
personnes pour la dfense de lcole libre (cest dire essentiellement
catholique) quand les socialistes se sont installs au pouvoir en 81 et
ont voulu crer une cole unique qui intgrerait toutes les coles
touchant des fonds publics. Inversement la gauche a fait une
manifestation analogue par son ampleur quand, sous un gouvernement
de cohabitation de droite, une tentative de modification de la loi
Falloux a t envisage (cette loi de compromis faite au milieu du 19e
sicle nautorise pas actuellement un financement trop important des
coles par les collectivits locales)
On peut donc dire que les attractions entre gauche et opposition
lEglise, et droite et adhsion au catholicisme, que lon observe sur le
graphique RELPOL6 sont en quelque sorte le rsultat dune secousse
sociale vieille de deux sicles : on a clbr il y a quelques annes le
bicentenaire de la Rvolution mais sans vraiment que les gens se
sentent personnellement concerns alors que, paradoxalement,
beaucoup maintiennent fermement cette association ancienne entre

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

35

politique et religion. Cette association, assez spcifique de lhistoire


de France (ou des pays latins), est peu vcue comme telle dans les
pays anglo-saxons. Ce tri crois est la manifestation dune conjecture
politique qui se maintient en ltat, dcennies aprs dcennies, dune
manire analogue ces enregistrements du climat pass que nous
restituent les cernes de croissances des arbres et qui permettent de
dater un tronc darbre vieux de plusieurs sicles.
On peut aller plus loin et faire lhypothse que se dire sans
religion , ce nest pas tre sans religion, cest prendre ses distances
vis--vis de la religion dans laquelle on est n. Cette hypothse trouve
sa confirmation par exemple dans lenqute REL8621 faite auprs dun
chantillon reprsentatif de 1530 personnes de nationalit franaise : si
pratiquement tous les catholiques se disent baptiss, cette proportion
est encore de 83% pour ceux qui se sont dclars sans religion , ce
qui manifeste bien que la plupart dentre eux sont ns dans la religion
catholique, et que sils se dclarent sans religion, cest quils veulent
prendre leurs distances vis--vis de lEglise catholique et que pour
cela ils se situent gauche22.
Lapport propre de ce tableau par rapport cette problmatique se
trouve dans le paralllisme entre les deux profils de tradition
catholique et sans religion avec cette nuance que ceux qui ont
encore un rapport avec le catholicisme, rapport assez extrieur
puisquils se dfinissent comme ni pratiquant et ni croyant, sont plus
enclins que les sans religion choisir le centre (avec lequel ils sont en
21

Guy Michelat, Julien Potel, Jacques Sutter, Jacques Matre, Les Franais
sont-ils encore catholiques ?, Paris, Cerf, 1991, rend compte dune enqute
ralise par ces chercheurs en 1986 dsigne dans la suite par le sigle REL86
22

on raisonne ici en termes dattractions : il est vident quil existe des


catholiques de gauche et ils sont prsents dans le tableau crois, comme ils sont
prsents socialement dans divers institutions ( la CFDT, au PS, dans une revue
comme Esprit)

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

36

situation dindpendance et non dopposition). Leur position est moins


extrme. D'autre part, et de la mme manire que les sans religion sont
plus gauche que les catholiques de tradition, les catholiques
pratiquants sont plus droite que les non pratiquants o le centre est
plus marqu.
Ce qui est aussi intressant, cest de noter que les rpondants
tradition culturelle sont les plus nombreux : des 4 catgories
dappartenance, cest la plus importante avec 31%. Ce choix manifeste
que proposer cette rponse (ce qui ntait pas fait jusqu prsent dans
les enqutes de sociologie religieuse), tait cohrent avec les attentes
des rpondants. En effet, ce choix peut sembler logiquement
critiquable car quest-ce qutre catholique quand on nest ni croyant,
ni pratiquant ? Il faut bien voir que refuser le concept de "ni croyant ni
pratiquant", cest se situer dans le systme de croyance catholique o
cette position de catholique de tradition culturelle est ngatrice de
lidentit catholique de linstitution. Dailleurs, il est plus facile pour
linstitution catholique de penser les sans religion comme tels, plutt
que comme des catholiques en opposition avec lEglise. Pour une
institution quelconque, rejeter ses contestataires lextrieur est plus
facile que de les prendre en compte comme contestataires. On peut
penser que la lente rosion de la pratique catholique (30% de
pratiquants aprs la guerre contre 10% aujourdhui23) est un symptme
de cette prise de distance, de cette position dopposants concerns
qui se sentent solidaires dun pass sans se retrouver dans le discours
de linstitution prsente24. Par leur encrage gauche, par leur
acceptation dtre considr comme catholiques, ces tradition
culturelle sont en position intermdiaire entre les catholiques qui
23

Guy Michelat et al., Les Franais ... (REL86), p.35

24

cette existence dun christianisme culturel est bien mise en valeur par
Yves Lambert dans La religion : paysage en pleine volution in Hlne
Riffault (dir.), Les valeurs des franais, Paris, PUF, 1994.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

37

sont encore dans lemprise culturelle de lEglise (les croyant non


pratiquants) et ceux qui ne se sentent plus aucun lien avec lEglise (les
sans religion).
La conclusion de cette interprtation est que lon peut donner un
sens complmentaire lintitul de la question dappartenance
religieuse : on peut linterprter, dans toutes ses modalits, comme des
degrs dune chelle dappartenance ou de rejet de linstitution
catholique en France. Paradoxalement, la rponse permet de mieux
comprendre la question : cest souvent le cas car interprter, cest
appliquer la ralit sociale une grille de lecture (une problmatique,
une thorie), qui modifie une perception ordinaire ou la perception
dune autre problmatique.
Dans le cas prsent, lancienne problmatique est celle dun courant
de la sociologie religieuse qui est n lintrieur de lEglise
catholique et dont le but tait de se rendre compte objectivement de la
ralit de la pratique des fins de meilleure gestion du clerg. Il fallait
alors compter les gens en fonction de leur plus ou moins grand respect
des rgles dictes par lEglise : accepter de distinguer ceux qui
pratiquaient rgulirement de ceux qui avaient une pratique
occasionnelle (grandes ftes ou vnements sociaux comme mariages
ou enterrements) tait dj un progrs thorique dans la mesure o
cette sociologie religieuse admettait a priori que lon prenne ses
distances avec lobligation stricte de la pratique chaque dimanche.
La nouvelle problmatique est issue du fait quune nouvelle
distance peut tre prise vis--vis de linstitution religieuse en
proposant la possibilit dune appartenance catholique qui ne se
reconnaisse pas dans le discours daujourdhui de linstitution sans
pour autant se sentir lextrieur. Du point de vue thorique, ce qui
est paradoxal, cest que tant quon pose lancien style de question
(pratiquant, non pratiquant, sans religion), on en peut pas voir ce qui
relve de la nouvelle problmatique et on peut donc dire quelle na

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

38

aucune raison dtre ; alors que ds quon pose la nouvelle question, la


force du groupe tradition culturelle impose du mme fait cette
problmatique. On trouve sur cette exemple vrification du fait que
lon ne passe pas progressivement dune problmatique une autre,
mais par des sauts25. Dans lancienne problmatique, des difficults
apparaissaient car si lon tudie les croyances de ceux qui se dclarent
catholique, on constate que leurs valeurs sont situes en rfrence avec
dautres sources que lEglise26. Pour rsoudre ces problmes, une
nouvelle problmatique entrainant de nouvelles manire de poser les
questions a vu le jour et cest celle-ci dont on trouve une vrification
dans le prsent tableau crois.

5 Exemples de reprsentation en surface


Mobilit sociale
Soit le tableau suivant qui croise, pour une population de 6.022.000
hommes gs de 40 59 ans en 1993 ayant (ou ayant eu) un emploi, la
catgorie socioprofessionnelle (CSP) qui est la leur au moment de
l'enqute (colonnes du tableau) et la CSP de leur pre (en ligne). On
donne les effectifs (en milliers), les pourcentages en ligne et les
pourcentages des marges27. Les pourcentages en lignes suprieurs au

25

Thomas S. Kuhn, La structure des rvolutions scientifiques, Paris,


Flammarion, 1983, traduction de la nouvelle dition de 1970 (premire dition
1962)
26

Lambert 1994, p.136

27

Ce tableau, issu de l'enqute FQP 1993 de l'Insee (Enqute sur la Formation


et la Qualification Professionnelle), est donn dans le recueil de l'Insee Donnes
sociales 1996, p.311. Les CSP utilises sont les suivantes Agriculteurs, Artisans
commerants et chefs d'entreprise (ArCo), Cadres et professions intellectuelles
suprieures (CSup), Professions intermdiaires, Employs, Ouvriers.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

39

pourcentage moyen, et qui correspondent donc des attractions, ont


t mis en gras pour permettre une lecture rapide.
CSP
du pre
Agric
ArCo
CSup
Inter
Empl
Ouvr

Total

Catgorie socioprofessionnelle
du fils en 1993
Agric ArCo CSup Inter Empl Ouvr
Total
258
81
108
153
84
365
1049 (17.4)
24.6
7.7 10.3 14.6
8.0 34.8
100
14
246
180
168
56
167
831 (13.8)
1.7 29.6 21.7 20.2
6.7 20.1
100
3
54
266
104
42
34
503 (8.4)
0.6 10.7 52.9 20.7
8.3
6.8
100
5
56
225
190
61
97
634 (10.5)
0.8
8.8 35.5 30.0
9.6 15.3
100
1
49
148
215
74
180
667 (11.1)
0.1
7.3 22.2 32.2 11.1 27.0
100
19
204
228
568
251 1068
2338 (38.8)
0.8
8.7
9.8 24.3 10.7 45.7
100
-----------------------------------------------------------------300
690 1155 1398
568 1911
6022 (100)
5.0 11.5 19.2
23.2
9.4 31.7
100

On reprsente en surface les carts l'indpendance dans le


graphique MOB93 :

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

40

En plus de la reprsentation en surface des carts l'indpendance,


on trouve dans ce graphique MOB93 une chelle et, droite, une
reprsentation des pourcentages des marges du tableau afin de pouvoir
reprer visuellement l'volution des diffrentes CSP entre la
gnration des pres et celle des fils. On repre partir de cette
volution les changements profonds subis par la structure sociale entre
ces deux gnrations.
En effet puisqu'il s'agit d'hommes de 40 59 ans, leurs pres, au
moment de leur naissance, taient actifs des annes 1935 aux annes
1955, donc autour de la 2e guerre mondiale. On voit donc d'abord la
trace de l'exode rural : la CSP des agriculteurs reprsentait 17% des

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

41

pres, elle n'en reprsente plus que 5% pour les fils. Beaucoup d'actifs
ont donc d, entre les deux gnrations, quitter l'agriculture. La
proportion des ouvriers galement diminu passant de 39 32%.
Artisans-commerants et employs tant rests peu prs stables, les
augmentations se situent au niveau des CSP restantes : professions
intermdiaires (CSP qui passe de 11 23%) et cadres et professions
intellectuelles suprieures (8 19%).
Ces volutions, lies au dveloppement d'un salariat ouvrier (au
dtriment de l'agriculture), puis sa rduction au profit d'emplois plus
qualifis, nous permettent maintenant d'interprter le contenu du
tableau en examinant les diffrents profils qui correspondent aux CSP
des fils.
Un profil est trs plat : celui des employs. Ceci signifie qu'il y a
peu d'carts l'indpendance : la CSP employ reprsente 9% du total
et c'est ce pourcentage que l'on retrouve quelques points prs dans
les pourcentages en ligne de cette colonne du tableau (le plus bas
correspond un dficit d'Artisans-commerants de 2,7%, le plus haut
une attraction avec l'origine sociale du pre identique, employ,
+1,7%). Ceci manifeste que cette catgorie est alimente d'une
manire quivalente par toutes les autres catgories bien qu'il y ait
attraction faible avec l'origine ouvrire ou l'origine employ et
rpulsion faible avec les autres CSP. Par contre, si on considre, non
plus le profil employ (fils) mais l'empilement vertical des diffrents
rectangles employs (pres) dans les autres profils, on repre deux
attractions (en plus de celle employ pre et fils), c'est dire des
approvisionnements prfrentiels dans les profils Cadres et
Intermdiaires. Dans cette dernire catgorie, le rectangle employ est
mme de niveau suprieur au niveau intermdiaire (pre et fils en
ligne et en colonne), ce qui est le seul cas analogue dans tout le

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

42

tableau o le phnomne de continuation tel pre, tel fils28


(correspondant aux cases diagonales du tableau), est toujours le plus
fort. La catgorie d'employ est un sorte de plaque tournante : on y
vient plutt venant du monde ouvrier, on en sort plutt vers les
professions intermdiaires et vers les cadres.
Le mme phnomne se retrouve avec les professions
intermdiaires qui n'ont pas encore un profil aussi marqu que les
autres CSP. Ces professions, "intermdiaires" comme leur nom le
suggre, servent aussi d'tape entre le monde employ qui les alimente
particulirement et les cadres qu'elles alimentent.
Les autres profils sont spcifiques : les agriculteurs sont en priorit
des fils d'agriculteurs. Les ouvriers sont issus particulirement
d'ouvriers mais aussi d'agriculteurs. Les artisans-commerants se
recrutent en leur sein propre. Reste le profil des cadres et professions
intellectuelles suprieures : c'est la seule catgorie qui s'alimente
quatre CSP : auprs d'elle-mme, d'une manire privilgie (case
diagonale) mais aussi auprs des professions intermdiaires, des
employs et des artisans-commerants. Cette CSP a forte croissance a
ratiss large : de nombreuses opportunits ont t proposes des
jeunes de nombreuses origines.
Si l'on regarde l'ensemble du graphique, les grandes masses noires
s'inscrivent dans une logique tel pre, tel fils. Il y a beaucoup de
continuit sociale d'une gnration l'autre mais ce qui a frapp cette
gnration ne aux alentours de la 2e guerre mondiale et qui a connu
une croissance conomique importante jusqu'aux annes 70, c'est la
perception qu'il y avait des opportunits d'ascension sociale. Beaucoup

28

Cf. Claude Thlot, Tel Pre, tels fils ? Origine familiale et position sociale,
Paris, Dunod, 1982. On trouvera une bibliographie d'ensemble dans Dominique
Merlli, Les enqutes de mobilit sociale, Paris, Presses Universitaires de France,
1994

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

43

de pres de cette gnration qui taient dans une position basse leurs
yeux, ont pens, souvent avec raison, que leur fils pouvait avoir une
position sociale plus leve que la leur (et que leur fille pourrait peuttre arriver au mme rsultat par le biais d'un mariage avec quelqu'un
en monte sociale), la cl de l'ascension sociale se faisant par l'cole.
Ces cas de mobilit sociale se trouvent dans les cases hors diagonales
en cart positif, importantes dans les profils cadres et professions
intermdiaires.
On soulignera un aspect technique en conclusion de cette analyse :
en reprsentant les colonnes du tableau comme des profils, on fait le
choix de porter l'attention davantage sur les colonnes que sur les
lignes. En inversant lignes et colonnes, les nouveaux profils
reprsenteraient les mmes surfaces en cart l'indpendance (puisque
les carts l'indpendance sont des invariants) mais de faon
diffrente, ni les largeurs ni les hauteurs ne seraient les mmes bien
que leur produit corresponde aux mmes surfaces.
Cependant, on a vu que l'on peut "prendre le point de vue des
lignes" simplement en envisageant les empilements de rectangles de
mme largeur appartenant diffrents profils. Cela revient envisager
toutes les cases en cart positif (ou ngatif) d'une ligne du tableau
d'origine. Par exemple on a vu qu'en examinant l'empilement Pres
agriculteurs on a repr que les agriculteurs avaient eu des enfants
plutt agriculteurs ou ouvriers. On peut vrifier sur le graphique (et le
montrer formellement) que pour un empilement donn, la somme des
surfaces au-dessus de la moyenne est gal la somme des surfaces endessous ; de mme pour un profil donn, la somme des surfaces en
cart positif est gal la somme des surfaces en cart ngatif. Tout
cela vient du fait que dans un tableau quelconque, la somme

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

44

(algbrique29) des carts positifs l'indpendance est nulle pour une


ligne donne (empilements) ou pour une colonne donne (profils)
Nouveaux bacheliers
Examinons, dans le tableau NBAC0, la population des 257118
nouveaux bacheliers de 1997 selon le type de baccalaurat obtenu et
selon l'orientation qu'ils ont prise l'universit30.
Afin de comparer les modes de reprsentation, on trouvera dans le
graphique NBAC1 la reprsentation traditionnelle des documents
statistiques telle qu'elle tait dans le document d'origine. La lecture
d'un tel graphique est rendue difficile par le fait que les types de
baccalaurats, sauf pour la srie conomique gauche et le bac
professionnel droite, ne sont pas l'aplomb. Un tel type de
graphique permet de rpondre des questions lmentaires comme
"quel est la proportion de srie Economique et social en AES", mais il
ne donne que trs partiellement une vision d'ensemble.

29

c'est dire en tenant compte des signes plus ou moins.

30

Sources : Note d'information 98.09 du Ministre de l'Education nationale

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

45

Rpartition des nouveaux bacheliers selon le type de baccalaurat obtenu

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

AES
Droit sciences politiques
Langues
Professionnel

Lettres, sciences lang.


Staps

Technologique

Sciences co. gestion


Sciences humaines, soc.

Scientifique

Sciences nat. et vie


Sciences struct. mat.

Littraire

Sciences techn.ing.
Mdecine

Economique

Pharmacie
IUT
Total

NBAC1

Pour pouvoir lire l'ensemble des donnes on utilise la reprsentation


en surface du graphique NBAC2.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

46

Nouveaux bacheliers 1997 : type de bac et discipline


l'universit
Disciplines
Type Sc.hum Langues Lettres Droit, AES Sc.co. STAPS Sc.tech Phar- IUT Mde- Sc. de Sc. de la Total
de
science
gestion
ing- macie
et soc.
cine
la
matire
po
bac
nieur
nature

100
6581 2,6

0,0

0,0

0,0

228 13864

650

1417

1025

1,4

0,5

31,8

1,5

3,3

2,4

2153

49

38

8610

260

28

513

55674 21,7
100
56501 22,0

3,5

0,3

3,6

4,4

2,1

4,2

17,1

14,3

448

1083

1506

450

298

124

730

20,7

8,9

6,8

16,5

22,9

6,8

4,5

1,9

0,0

11,1

8152

3058

1721

5359

4516

1126

1855

594

18,7

7,0

4,0

12,3

10,4

2,6

4,3

Eco
& soc

11550

4854

1722 12016

6452

7429

13588

Total

38046
14,8

3377

28,7

1,5

583

24,0

311

1,8

1359

8,7

3302

15,2

3,6
Pro

20,7

1377

94797 36,9

3397

Tech

1699

27175

4141

1981

3945 16198 13526 14368

3,1

21,6

11,6

13,3

3,9

0,1

0,1

15,5

0,5

0,1

0,9

16989 14013

8552

597

225

828

25

38

1459

130

57

15,1

1,1

0,4

1,5

0,0

0,1

2,6

0,2

0,1

0,0

27183 19281 30312 13382

12607

9275

2773

4,9

3,6

1,1

30,1
10,6

24,8
7,5

11,8

5,2

4249 40861 14566 15870


1,7

15,9

5,7

Source : Note d'Information 98.09


du MENRT
NBAC0

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

6,2

100
43565 16,9
100

100

28713 257118 100


11,2

100

47

Le graphique NBAC2 permet de reprer :


1) des ressemblances entre les disciplines universitaires : on voit
que les sciences de la matire, les sciences naturelles et la mdecine
recrutent plutt des bacheliers scientifiques et ont un dficit pour les
autres types de bac. La ressemblance visuelle des profils manifeste la
fois les attractions et les rpulsions semblables mais aussi leur
importance numrique quivalente. Ce qui les diffrencie de la
pharmacie et des sciences de l'ingnieur o la faible importance
numrique dissuade de comparaisons avec de trop faibles effectifs.
Ces profils de faible importance numrique, qui semblent assez plats,
manifestent par ce biais leur peu d'cart l'indpendance. Cependant il

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

48

faut faire attention au fait que ces faibles carts, s'ils peuvent tre dus
une faible importance numrique peuvent tre dus aussi au fait
qu'une discipline recrute assez indiffremment dans tous les types de
bac. A cette fin on peut comparer les STAPS (Sciences et techniques
des activits physiques et sportives) et sciences co. qui ont des
effectifs du mme ordre (4 5%) mais o on voit un profil plat pour
les STAPS et des diffrenciations marques pour les sciences co.
Contrairement aux sciences co. qui recrutent de manire privilgie
dans la srie conomique et sociale du bac, les STAPS recrutent dans
tous les types de bac : ceci vient du fait que cette section, dont le
dveloppement est rcent, attire des sportifs qui peuvent venir de
toutes les formations, indpendamment des hirarchies de niveau entre
sections. En haut du graphique on repre les similitudes fortes entre
Langues et Lettres
2) le graphique permet de reprer des spcificits : par exemple on
dit souvent que les IUT ne rpondent pas leur vocation premire qui
est d'accueillir les sries technologiques du bac. On voit sur le
graphique la spcificit des IUT qui, bien plus que la moyenne,
accueillent ces types de bac, tout en accueillant aussi lgrement plus
que la moyenne les bac scientifiques, attraction qui leur vaut leur
rputation slective et litiste.
En plus des spcificits dj notes des bacs scientifiques pour les
sciences de la matire et de la vie, et celles des lettres pour les Lettres
et Langues, on repre plutt des cas particuliers :
- que si sciences co. est comparable AES (Filire administrative,
conomique et sociale), on note l'attraction entre sciences co. et
section ES commune aux deux, mais par contre la spcificit d'AES
qui recrute aussi dans les bacs technologiques. On peut comparer
galement avec la situation du Droit, fort recruteur en ES mais aussi
en Lettres. Enfin, la filire sciences humaines et sociale cumule les
attractions avec tous les types de bac sauf les sciences : c'est souvent

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

49

par un choix ngatif contre les mathmatiques que se fait le choix de


cette filire.
- les spcificits peuvent tre reprs dans l'autre sens en termes
d'empilements. On peut voit par exemple que les bacs pro. peu
nombreux d'ailleurs (moins de 3%) sont en attraction forte avec les
AES, puis avec sciences humaines et sociales et droit. Cette srie est
en opposition tant avec les Lettres et Langues qu'avec les disciplines
de sciences exactes. La filire des bacs professionnels, dernire venue
du systme, scolarise en dehors de la filire noble actuelle (les
sciences) et mme en dehors de l'ancienne filire noble (les lettres) et
donne un accs (limit) aux disciplines d'une nouvelle culture
(sciences humaines et sociales).

6 Force de lattraction
Le pourcentage de lcart maximum
Sur le graphique Religion et politique prcdent (RELPOL6), on
voit que les attractions entre gauche et tradition catholique ou
sans religion correspondent des effectifs dindividus en cart
lindpendance assez proches. Peut-on aller plus loin et estimer la
force de lattraction en lui donnant une valeur numrique ?
Pour rpondre cette question, il faut se donner des bornes et
replacer numriquement lobservation entre le cas d'une attraction
nulle qui aura la valeur zro et une liaison maximum qui aura par
convention la valeur 100.
Prenons le cas de lattraction gauche , sans religion : isolons
cette case du tableau en la donnant simplement avec ses marges et le
total :

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

50

Gauche
......
Total

Sans religion
149

......

Total
448

------------------------------------------220
955

Attraction nulle : la rponse, dans le cas de labsence dattraction,


est simple car on observerait pour cette case un effectif le plus proche
possible de leffectif thorique correspondant lindpendance
(produit des marges divis par le total, cf. plus haut).
Effectif thorique = 220 x 448 / 955 = 103,2
Lobserv le plus proche de lindpendance serait donc de 103, or
on observe un effectif de 149, donc on nest pas proche de
lindpendance.
Attraction maximum : mais est-on proche de la liaison maximum ?
Dans le cas prsent, la liaison serait maximum si :
- tous les gens de gauche taient sans religion
- ou si tous les sans religion taient de gauche
La premire option est incompatible avec les marges des donnes
observes puisquelle supposerait que les 448 de gauche soient sans
religion et il ny a dans notre enqute que 220 sans religion. Par contre
la deuxime est possible puisque les 220 sans religion peuvent tre
dans les 448 de gauche. Dune manire plus formelle, on voit quil
suffit de mettre comme effectif dans le cas du maximum la plus petite
des deux marges.
Si on avait un effectif de 220, comme leffectif thorique
correspondant lindpendance est de 103,2, on aurait un cart
lindpendance de 220 - 103,2 = 116,8 or lcart lindpendance
observ est de 149 - 103,2 = 45,8

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

51

Ce que reprsente cet cart observ de 45,8 par rapport au


maximum de 116,8 nous est donn par sa proportion de 45,8 / 116,8 =
0,392 cest dire un pourcentage de 39,2%. Ce pourcentage de lcart
observ par rapport lcart maximum sera appel dans la suite
Pourcentage de lEcart Maximum ou PEM, ici gal 39,2%.
Rsumons les calculs pour lautre case tudie : gauche tradition catholique :
Tradition
.....
Total
Gauche
170
448
......
------------------------------------------------Total
296
955
- Effectif observ : 170
- Effectif thorique : 296 x 448 / 955 = 138,9
- Ecart observ : 170 - 138,9 = 31,1
- Effectif maximum : 296
- Ecart maximum : 296 - 138,9 = 157,1
- PEM : 31,1 / 157,1 100 = 19,8%
Dans le cas des sans religion, le PEM tait de 39,2%, ici il nest
plus que de 19,8% soit une valeur beaucoup plus faible, que le
graphique ne nous permettait pas de reprer. Calculons les PEM pour
toutes les attractions positives du tableau :

Gauche
Centre
Droite

Pratiquant

Non prat

3,8%
26,6%

9,2%
17,7%

Tradition
19,8%

Sans religion
39,2%

On voit sur ce tableau des PEM que les plus fortes liaisons
correspondent aux extrmes ; que les sans religion sont plus lis la
gauche que les catholiques de tradition ; que les pratiquants sont plus
lis la droite que les non pratiquants ; quand au centre, il correspond

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

52

des liaisons trs faibles. Cependant, il ny a pas symtrie, les sans


religion sont plus lis la gauche que les pratiquants la droite ce qui
manifeste que la gauche est davantage une culture de rupture,
dopposition (donc plus radicale) que la droite qui est une culture de
statu quo.
Les valeurs du PEM varient de 3,8% 39,2%. Lexprience31
montre que :
- en dessous de 5% les PEM correspondent des attractions en gnral
ngligeables,
- que 10% constitue un seuil : au-dessus, les PEM sont en gnral
intressants, entre 5% et 10%, les liaisons peuvent ltre ou non,
- que des liaisons suprieures 50% sont exceptionnelles et
manifestent souvent quon a affaire deux indicateurs dun mme
phnomne. Si, dans un tableau 2 2 on croise une question avec
elle-mme, les PEM de la diagonale o se trouve les effectifs, sont
videmment gaux 100%.

7 Application du PEM
Le PEM est un indicateur simple calculer, facile interprter
puisque c'est un pourcentage, mais son utilit se rvle surtout quand
il est utilis d'une manire systmatique dans un logiciel de
dpouillement d'enqute : il permet en effet d'explorer
automatiquement un grand nombre de tris croiss et de slectionner,

31

L'exprience des utilisateurs est indispensable pour chaque usage d'un


pourcentage : ainsi celui qui grimpe une cte vlo sait que jusqu' 5% une pente
ne pose pas de problmes, que de 5 9% elle est notable, que de 9 13% elle est
redoutable et qu'au dessus de 13%, il faut tre trs bien entrain. Par contre quand
on parle de croissance de l'conomie d'un pays, 3% est bien mais 4% (et plus), est
exceptionnel. Chaque usage de pourcentages a sa plage d'utilisations spcifiques.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

53

pour chacune des modalits de rponse de l'enqute, les autres


modalits qui lui sont spcialement lies au sens du PEM.
Prenons titre d'exemple un extrait de l'enqute REL86 dj cite :
nous prenons la sous-population des 1432 baptiss catholiques pour
explorer les attractions entre les questions suivantes :
Vous-mme, vous considrez-vous comme : un croyant convaincu
(434), un croyant par tradition (386), un croyant incertain (194), un
sceptique (217), un incroyant (179), non-rponse (22).
Cette question forme une chelle en cinq points qui indique bien le
niveau de croyance ou des difficults de la croyance. On prend ensuite
une question situe au centre des croyances catholiques, la croyance
en la rsurrection du Christ laquelle on demandait si les gens y
croyaient (oui : 1023, non : 290, non-rponse : 119)
On utilise ensuite une question touchant le dsir d'tre enterr
religieusement ou non, dont on sait que mme pour beaucoup de gens
ns catholiques mais ayant pris leurs distances vis--vis de l'Eglise, ce
geste reste important. A la question "souhaitez-vous tre enterr
religieusement ?", 1056 rpondent oui, 221 non (155 non-rponses).
Sur le plan de la morale catholique, on teste le point de vue suivant
: "pensez-vous que l'on puisse se considrer comme catholique et
accepter le principe des relations sexuelles avant le mariage ?". 1023
pensent que oui, cela est possible, 290 non (119 non-rponses).
Enfin, pour clairer ces rponses par des modalits de statut social, on
utilise aussi les questions suivantes : sexe (masculin 679, fminin
753), ge (en 5 tranches d'ge) et une question portant sur le parti
politique dont on se sent le plus proche o l'on a recod d'une part les
proximits de gauche (567), d'autre part celles de droite (506), ce qui
laisse 359 individus qui refusent de se classer politiquement.
On a donc en tout 7 questions : si on envisageait un croisement de
ces questions deux deux, il y aurait 21 tableaux diffrents dont il

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

54

faudrait examiner les attractions intressantes. Plutt que de tenter


cette exploration, on fait calculer ces tableaux d'une manire
logicielle, on en fait calculer tous les PEM et, pour chaque modalit,
on donne la liste des autres modalits de l'enqute en attraction avec
cette modalit, par ordre dcroissant de PEM.
Question Croyance, modalit croyant convaincu
78.9%
Souhaite tre enterr religieusement
76,8%
Croit en la rsurrection du Christ
30,2%
Est politiquement proche de la droite
26,8%
On ne peut pas tre catholique et accepter les relation
sexuelles avant mariage
20,3%
Sexe fminin
17,8%
60 ans et plus
10,7%
45-59 ans
Ces PEM sont issus de 6 tableaux croiss diffrents : la croyance,
croise avec toutes les autres questions. Par exemple soit le tableau
croisant croyance et enterrement qui permet de calculer le premier
PEM.
Croyance
Convaincu
Tradition
Incertain
Sceptique
Incroyant

Souhait d'tre enterr religieusement


Oui
Non Non-rep Total
410
10
14
434 (30,3)
94,5
2,3
3,2
100
343
15
28
386 (27,0)
88,9
3,9
7,3
100
153
20
21
194 (13,5)
78,9 10,3 10,8
100
108
55
54
217 (15,2)
49,8 25,3 24,9
100
29
120
30
179 (12,5)

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

55

16,2 67,0 16,8


100
Non-rponse
13
1
8
22 (1,5)
59,1
4,5 36,4
100
----------------------------------------------------------------Total
1056
221
155
1432 (100)
73,7
15,4 10,8
100
On isole la ligne "convaincu", la colonne "oui" et les marges et on a
l'extrait de tableau suivant :
"Oui"
Total
Convaincu
410
434
-------------------------------------------Total
1056
1432
- Effectif observ : 410
- Effectif thorique : 1056 434 / 1432 = 320,0
- Ecart observ : 410 - 320,0 = 90,0
- Effectif maximum : 434
- Ecart maximum : 434 - 320,0 = 114,0
- PEM : 90,0 / 114,0 100 = 78,9%
Si nous examinons la modalit "convaincu" avec les sept modalits
en attraction plus ou moins forte avec elle, on voit que les attractions
ont t ranges par ordre de PEM dcroissant, les premires tant les
plus fortes comme l'attraction avec le souhait d'enterrement religieux
trs lev avec un PEM de prs de 80%.
On peut considrer l'ensemble des modalits associes
"convaincu" comme le profil de cette modalit : les modalits qui s'y
trouvent "clairent" la modalit de rfrence du fait qu'elles ont un lien
privilgi avec elle. Il s'agit d'une explication l'intrieur de l'univers
des modalits de l'enqute mais il n'y a l aucun inconvnient. Il en est
de mme dans un dictionnaire o un mot est expliqu par d'autres
mots de ce mme dictionnaire, ceux qui sont en relation smantique
privilgie avec lui.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

56

Ici, on voit que le fait d'tre "convaincu" est li non seulement


l'enterrement l'Eglise mais aussi d'une manire aussi forte avec une
croyance centrale du dogme catholique, la rsurrection du Christ, avec
le fait d'tre politiquement droite, de ne pas accepter les relations
sexuelles avant le mariage, d'tre de sexe fminin et d'une des deux
tranches d'ge les plus ges de l'enqute.
Continuons la suite de l'exploration des profils de modalits par
PEM dcroissants :
Question Croyance, modalit croyant par tradition
57,6%
Souhaite tre enterr religieusement
14,7%
On peut tre catholique et accepter les relation sexuelles
avant mariage
12,5%
Non-rponse sur la croyance en la rsurrection du Christ
8,9%
Sexe masculin
7,7%
Croit en la rsurrection du Christ
4,7%
60 ans et plus
Cette fois s'il s'agit de personnes plutt ges, elles sont de sexe
masculin : elles sont galement attaches aux obsques religieuses
mais sur les questions de dogme soit elles hsitent, soit leur attraction
est faible. Par contre, on voit apparaitre l'acceptation des relations
sexuelles avant le mariage. Sauf pour l'enterrement religieux, les
attractions sont beaucoup moins marques que dans la modalit
"convaincue".

Question Croyance, modalit croyant incertain


20,6%
On peut tre catholique et accepter les relation sexuelles
avant mariage

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

57

19,5%
Souhaite tre enterr religieusement
18,5%
Sexe fminin
8,4%
25-34 ans
7,8
35-44 ans
Question Croyance, modalit croyant sceptique
41,0%
Ne croit pas en la rsurrection du Christ
38,7%
On peut tre catholique et accepter les relation sexuelles
avant mariage
23,7%
Se situe politiquement gauche
23,2%
Non-rponse la question sur l'enterrement religieux
15,0%
Sexe masculin
11,7%
ne souhaite pas tre enterr religieusement
10,3%
Non-rponse la question sur la croyance en la
rsurrection du Christ
9,3%
25-34 ans
7,4%
24 ans et moins
Question Croyance, modalit incroyant
80,2%
Ne croit pas en la rsurrection du Christ
61,0%
Ne souhaite pas tre enterr religieusement
37,1%
Se situe politiquement gauche
28,8%
Sexe masculin
12,8%
25-34 ans
7,8%
Non-rponse la question sur l'enterrement religieux
6,7%
24 ans et moins
L'incroyance augmente avec un ge jeune, une orientation politique
gauche. On constate qu'on retrouve avec la modalit la plus extrme
du ct de l'incroyance, des niveaux levs de PEM sur le refus d'une
croyance centrale comme la Rsurrection o le refus d'tre enterr
religieusement. La force des convictions trouve son parallle avec la
force du PEM qui est toujours beaucoup plus fort quand il s'agit de lier
des croyances et des opinions que quand on lie des opinions et des
caractristiques sociales.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

58

On peut continuer ainsi explorer l'ensemble des profils. Chaque


PEM s'y trouve deux fois : par exemple si nous regardons les deux
profils de gauche et de droite, on y retrouvera des liaisons dj
rencontres plus haut (avec les modalits de croyance).
Question Proximit politique, modalit droite
43,5%
Souhaite tre enterr religieusement
36,2%
Croit en la rsurrection du Christ
30,2%
Croyant convaincu
12,0%
On ne peut pas tre catholique et accepter les relations
sexuelles avant mariage
Question Proximit politique, modalit gauche
37,1%
Se considre incroyant
37,1%
Ne souhaite pas tre enterr religieusement
23,7%
Se considre sceptique
22,8%
On peut tre catholique et accepter les relation sexuelles
avant mariage
21,7%
Ne croit pas en la rsurrection du Christ
10,3%
Non-rponse la question sur l'enterrement religieux
8,1%
Sexe masculin
9,3%
25-34 ans
Ces deux profils rejoignent ce que nous avions dit prcdemment
sur les rapports entre politique et religion : on remarquera que si les
deux profils sont cohrents l'un avec la croyance, l'autre avec son
refus, l'enterrement religieux est une question qui laisse sans rponse
des gens de gauche (ce dont on a trouv une illustration dans les
dernires volonts d'un prsident de la Rpublique de gauche qui
envisageait cette ventualit comme possible). L'enterrement religieux

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

59

est certes un rite religieux, et est refus ou accept comme tel, mais sa
signification dpasse l'affiliation une croyance religieuse32.
La technique des profils de PEM est la manire rapide d'explorer de
nombreux tableaux croiss : en faisant ainsi on trouve beaucoup
d'attractions dont on ne juge pas qu'elles apportent des informations
nouvelles, mais on peut ainsi rapidement reprer des choses
intressantes.
Cette technique, mise au point pour tudier des liaisons entre
modalits peut maintenant tre tendue pour tudier des modalits
entre questions dans leur ensemble.

8 Le PEM gnralis
On gnralise la dmarche du PEM en se demandant, non plus pour
une case mais pour un tableau tout entier, ce que serait la liaison
maximale et quelle serait dans ce cas la valeur de lensemble des
carts positifs lindpendance. Inversement on a facilement la
situation correspondant labsence de liaison puisque cest
lindpendance. Il restera placer lobservation, synthtise par la
valeur de la somme des carts positifs lindpendance, entre
labsence de liaison et la liaison maximum. Le PEM gnralis sera le
rapport entre la somme des carts positifs observs et la mme somme
dans le cas de la liaison maximum.
Reprenons le tableau croisant opinion politique et affiliation
religieuse :

32

Sur cette question cf les travaux de Jean-Hugues Dechaux et par exemple Le


souvenir des morts : essai sur le lien de filiation, Paris, Presses Universitaires de
France, 1997.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

60

Pratiquant Non prat Tradition Sans religion


Total
Gauche
34
95
170
149
448
Centre
51
113
93
52
309
Droite
61
85
33
19
198
-------------------------------------------------------------------Total
146
293
296
220
955
Par ltude des PEM locaux (c'est dire case par case), nous avons
dj observ que les attractions entre modalits se faisaient de la faon
suivante:
Pratiquant Non prat
Tradition Sans religion
Gauche
19,8%
39,2%
Centre
3,8%
9,2%
Droite
26,6%
17,7%
cest dire en suivant une diagonale du tableau (haut-droit basgauche). Cette diagonale nous indique la forme gnrale de la liaison :
aux extrmits, les liaisons sont fortes entre gauche et sans religion et
entre droite et pratiquant. Si la liaison tait son maximum, cest sur
cette diagonale, ou proximit delle, que se concentreraient les
effectifs observs. Par exemple, en commenant par la case situe en
haut et droite du tableau, si la liaison tait son maximum, on
pourrait y mettre les 220 sans religion. Pour cette colonne, tous les
effectifs seraient dans la ligne intitule gauche, mais celle-ci ne serait
pas puise pour autant puisquil en resterait 448 - 220 = 228 placer
au plus prs. Ils peuvent ltre dans la colonne tradition ce qui fait que
la ligne gauche est entirement place sur la diagonale ou au plus prs.
Sont dj placs les effectifs suivants :
Pratiquant
Gauche
0
Centre
-

Non prat
0
-

Tradition Sans religion


228
220
0

Total
448
309

Droite

198

Total

146

293

296

220

955

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

61

On alterne lignes et colonnes : aprs avoir termin la colonne sans


religion, puis la ligne gauche, on termine la colonne tradition en
mettant le plus prs possible de la diagonale du tableau leffectif
restant de 296 - 228 = 68 que lon met dans la ligne intitule centre. Il
reste 309 - 68 = 241 du centre que lon place prs de la diagonale cest
dire dans non pratiquant. Il reste 293 - 241 = 52 non pratiquant que
lon place droite et il reste enfin 198 - 52 = 146 droite que lon place
dans pratiquant. Le processus est termin avec le rsultat final
suivant, qui aurait t le mme si on tait parti du bas de la diagonale.

Gauche
Centre
Droite
Total

Pratiquant Non prat Tradition Sans religion


Total
0
0
228
220
448
0
241
68
0
309
146
52
0
0
198
-------------------------------------------------------------------146
293
296
220
955

Les marges nont pas chang par rapport au tableau de dpart. Ce


sont elles qui nous servent de cadre de rfrence, tant pour labsence
de liaison (effectifs thoriques correspondants lindpendance) que
pour la liaison maximum (o lon cherche placer ces effectifs de
marge au plus prs de la diagonale de rfrence).
Lobservation pralable des liaisons est indispensable pour savoir
quelle est la diagonale de rfrence : de plus il est indispensable, pour
que les diagonales soient bien identifies, quil existe un ordre sur les
lignes du tableau. Cette procdure du chargement dune diagonale est
toujours possible et conduit toujours au mme rsultat, une fois que la
diagonale de rfrence a t choisie au vu de lobservation.
Le tableau dindpendance est le suivant (c'est le mme que celui du
tableau d'origine puisqu'ils ont tous les deux les mmes marges.)

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

62

Pratiquant
Gauche
Centre
Droite
Total

68,5
47,2
30,3
146

Non prat
137,4
94,8
60,7
293

Tradition
138,9
95,8
61,4
296

Sans religion
103,2
71,2
45,6
220

Total
448
309
198
955

Les carts lindpendance par rapport lobservation sont :


Gauche
Centre
Droite

Pratiquant Non prat


-34,5
-42,4
3,8
18,2
30,7
24,3

Tradition
31,1
-2,8
-28,4

Sans religion
45,8
-19,2
-26,6

La somme des carts positifs de ce tableau est de 153,9


Les carts lindpendance par rapport la liaison maximum sont :
Gauche
Centre
Droite

Pratiquant Non prat


-68,5
-137,4
-47,2
146,2
115,7
-8,7

Tradition
89,1
-27,8
-61,4

Sans religion
116,8
-71,2
-45,6

La somme des carts positifs de ce tableau est de 467,9


L proportion des carts observs par rapport aux carts dans le cas
du maximum est de 153,9 / 467,9 = 0,329 soit un PEM gnralis de
32,9%. On dispose ainsi dun indicateur de liaison entre questions
ordonnes (et on peut toujours les ordonner33). Cet indicateur servira
dans la suite pour slectionner rapidement, dans une enqute, des
questions qui sont plus ou moins lies entre elles.

33

par exemple en utilisant l'ordre du premier facteur d'une analyse factorielle :


c'est ce que fait le logiciel Trideux.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

63

9 Application du PEM gnralis


Quittons les exemples finalit pdagogique pour voir comment le
PEM gnralis peut tre utilis dans une recherche en vraie grandeur
: il s'agit d'une enqute34 sur le choix par des parents de faire faire du
latin partir de la classe de 4e. Les donnes utilises sont celles d'une
enqute portant sur une cohorte d'lves suivis par les services
statistiques du Ministre de l'ducation nationale depuis leur entre en
6e en 198935. Pour un certain nombre de ces lves on possde un
certain nombre de renseignements sur leur russite scolaire mais aussi
sur la manire dont ils organisent leur journe, leur semaine, leurs
vacances et des renseignements sur leurs parents. On dispose ainsi de
plus de 250 questions : pour slectionner les questions qui sont le plus
lies au choix de l'option latin en 4e, on calcule le PEM gnralis
entre cette question prcise et l'ensemble de toutes les autres questions
de l'enqute : on obtient l aussi un profil de questions lies par PEM
dcroissant. Soit par exemple des extraits de la liste par ordre
d'importance dcroissant du PEM global avec sa valeur, l'intitul des
questions et celui des modalits de rponse.
Question Choix ou non de l'option latin en 4e
88%
Durant les vacances d't, t'est-il arriv de suivre des
sessions de rattrapage scolaire ? (oui/non)
82%
Les parents sont-ils membres d'une association de parents
d'lves ? (oui/non)
78%
Jusqu' quel ge les parents souhaitent-ils que leur enfant
poursuive ses tudes ? (16, 18, 20 et plus)

34

Cf. Philippe Cibois, "Le choix de l'option latin au collge", Education &
Formations, n48-1996, p.39-51
35

Cohorte appele le PANEL89

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

64

63%
Age (se trouve en avance, l'ge normal, en retard)
63%
Niveau en mathmatiques (bon, moyen, trs passable,
insuffisant)
58%
Les parents aident-ils habituellement leur enfant dans son
travail scolaire ? (oui, parce qu'il rencontre des difficults ; oui, bien
qu'il n'ait pas de difficults ; non, parce qu'il n'a pas besoin d'aide ;
non, par manque de temps ; non pour une autre raison)
Cette procdure des profils de PEM gnralis permet de reprer les
questions qui sont en rapport, elle ne permet pas de savoir dans quel
sens se fait la liaison. Prenons par exemple les deux plus forts PEM et
allons voir les tableaux croiss dont ils sont issus :
1) PEM de 88% entre le fait d'avoir choisi ou non l'option latin et le
fait d'avoir ou non suivi des cours de rattrapage pendant les vacances :
Option latin
non
oui
Total
Rattrapage pendant oui
29
1
30
les vacances
non
1497
338
1835
--------------------------------------Total
1526
339
1865
Sur cet exemple on voit que la liaison se fait presque parfaitement
entre le fait de faire du latin et le fait de ne pas avoir suivi de
rattrapage pendant les vacances. La liaison se fait entre le latin et la
non-pratique : ceux qui choisissent l'option latin n'ont pas besoin
d'aide car ce sont de bons lves.
Dans l'exemple suivant, on croise le latin avec l'appartenance des
parents une association de parents.
Option latin
non
oui
Total
Parents membre
oui
159
113
272
d'une association
non
1367
226
1593
de parents d'lves
-------------------------------------

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

65

Total

1526

339

1865

La situation est ici diffrente : le pourcentage de l'option latin est de


41,5% dans les familles qui sont membres d'une association, il n'est
que de 14,2% pour les autres. Il y a une attraction entre le fait de faire
du latin et le fait d'tre membre d'une association. On voit que les
parents de latinistes sont plus intgrs dans le systme scolaire qu'ils
connaissent mieux que les autres.
On verrait d'une manire similaire que ceux qui font l'option latin
sont plutt en avance, qu'ils sont bons en mathmatiques, que leurs
parents souhaitent leur faire faire des tudes longues et qu'ils ne sont
pas aids parce qu'ils n'en n'ont pas besoin. Mais ces rsultats ne
viennent pas directement du profil des PEM globaux qui ne servent
qu' slectionner les questions pertinentes, mais du profil de PEM
local (li une case d'un tableau, le premier PEM que nous ayons
tudi) obtenu en travaillant sur l'ensemble des modalits cette fois
engendr par l'ensemble des questions slectionnes. Le PEM global
constitue la premire tape d'une recherche dans un dpouillement
d'enqute, ensuite on passe au PEM local associ aux modalits.
Voici donc titre complmentaire le profil de PEM local associ
la modalit : a choisi l'option latin en 4e
Modalit "a choisi l'option latin en 4e"
43% A l'heure ou en avance l'entre en lmentaire
39% Niveau en mathmatiques le plus lev
35% A l'heure l'entre en sixime
34% A t au thtre depuis le dbut de l'anne
30% Poursuite des tudes envisage aprs 20 ans
28% A t au concert depuis le dbut de l'anne
28 % diplme mre : grandes coles ou 2e cycle univ.
25 % a t l'tranger Pques
24 % diplme pre : grandes coles ou 2e cycle univ.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

66

24 %
24 %
23 %
23 %
21 %
21 %
20 %
19 %
19%
18 %
17 %
17 %
16 %
15 %
15 %
14 %
14 %
13 %
13 %
13 %
13 %
13 %
13%
12 %
10 %
10 %
10 %

suit des cours de musique


parent dlgu
aime d'autres lectures que les lectures scolaires
lecture loisir favori
a lu plus de 10 livres depuis le dbut de l'anne
tudes utiles jusqu' un diplme d'enseignement suprieur
parent membre association de parents d'lves
est inscrit un conservatoire de musique
chef de famille cadre ou prof. intellectuelles suprieures
est trs intress par les langues vivantes
fait de l'allemand comme premire langue vivante
est trs intress par l'histoire
le collge a t choisi pour sa bonne rputation
n'oublie jamais ses affaires
est trs intress par le franais
a t au cinma depuis le dbut de l'anne
est parti en fvrier avec ses parents
l'enfant vit avec son pre et sa mre
est aid bien qu'il n'ait pas de difficults
est dans l'enseignement priv
dispose d'une chaine haute fidlit
trs intress par la gographie
chef de famille professeur
le mercredi va la bibliothque
trouve que lire c'est amusant
est inscrit en bibliothque
a t une exposition depuis le dbut de l'anne

Si l'on fait la synthse de toutes ces informations on peut dire que


choisissent plutt l'option latin en 4e des lves qui sont d'abord de
bons lves tant en mathmatiques qu'en franais. Dans le domaine
littraire, ils lisent beaucoup, y trouvent du plaisir et font d'autres
activits culturelles en dehors de l'cole (thtre, musique en

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

67

particulier). Leurs parents, de niveau social lev ont pour eux de


grandes ambitions. L'enfant prsente une "bonne volont scolaire" (il
n'oublie jamais ses affaires par exemple) qui le rend tout dispos
donner suite aux conseils de lecture de ses enseignants. Les parents,
qui prennent cur leur "mtier de parents" en s'investissant dans les
associations ou en ayant fait un choix spcifique pour le niveau du
collge (ou ont utilis cette fin l'enseignement priv). En conclusion
on voit que cette option latin est lie l'excellence scolaire d'lves
dont les parents insistent sur une culture littraire (franais et latin
l'cole) et artistique (en dehors de l'cole, mais dans la mme logique).

10 Rsum et conclusion
Dans des donnes recueillies lors d'une enqute on a des modalits
de rponses des questions (appeles quelquefois aussi variables). A
l'intersection d'une ligne et d'une colonne le nombre d'individus est dit
l'effectif observ.
Une attraction est une association, plus que la moyenne entre deux
modalits de rponse deux questions. Une rpulsion (ou dficit) est
une association moins que la moyenne. Attractions et rpulsions sont
repres par un cart la moyenne. L'cart la moyenne est la
diffrence entre le pourcentage d'une ligne et le pourcentage toutes
lignes confondues. Attractions, rpulsions, carts la moyenne sont le
reflet d'carts l'indpendance. Un effectif correspondant
l'indpendance, dit effectif thorique, correspond une situation
d'absence de lien, il est obtenu par produit des marges divis par le
total. L'cart l'indpendance est la diffrence entre l'effectif observ
et l'effectif thorique : il peut tre visualis sous forme graphique.
Le pourcentage de l'cart maximum (PEM) mesure, sous forme de
pourcentage, la part que reprsente l'effectif en cart l'indpendance
avec l'effectif correspondant si la liaison tait son maximum. Le

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

68

PEM peut tre soit local ( l'chelon d'une case d'un tableau) soit
global au niveau de l'ensemble du tableau.
Avec ces outils on a les instruments pour explorer des donnes
d'enqute o l'on a de nombreuses questions : dans une premire tape
on utilise le PEM global pour associer chaque question les autres
questions de l'enqute qui lui sont spcialement lies. Ensuite, pour
des modalits particulires, on peut utiliser des profils de PEM locaux
de modalits. On peut galement visualiser des tableaux intressants.
Cependant, quand les effectifs sont faibles il est raisonnable de se
demander si les liaisons observes ne seraient pas dues au hasard :
c'est ce que nous allons tudier plus particulirement.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

69

Chapitre 2
Hasard et signification
1 Les effets du hasard
Savez-vous ce qui sest pass dintressant New-York en 1966 ?
Probablement non, mais si je vous parle d'une panne de courant, il est
probable que cela vous voquera le fait que neuf mois aprs cette
panne, il y a eu une augmentation des naissances. Depuis dailleurs, le
fait sest semble-t-il rpt car chaque panne de courant analogue, on
prdit le mme effet, voire mme on lannonce comme ralis.
Or il nen est rien : il sagit dune pure rumeur base comme toutes
les rumeurs sur une attente et sur un fait dclencheur. Lattente est le
dsir de rupture des interdits que pourrait procurer lobscurit, comme
navement un sociologue osa le dclarer au New York Times36 : "La
lumire sest teinte, et les gens ont t abandonns des interactions
mutuelles". Quant llment dclencheur ce fut celui-ci, toujours
daprs le New York Times : "Une augmentation brutale du nombre
des naissances est signale par plusieurs grands hpitaux new-yorkais,
neuf mois aprs la grande panne dlectricit de 1965. A lhpital du
Mont-Sina, la moyenne journalire est de 11 naissances, il y en eut 28
le 8 aout. Cest le record de cet hpital ; le maximum enregistr
antrieurement ntait que de 18. A lhpital Bellevue, 29 bbs sont
ns le 9 aout contre seulement 11 une semaine auparavant, la moyenne
ntant que de 20. Lhpital Columbia-Presbyterian dont la moyenne
est de 11 naissances en a eu 15 le 8 aout. St-Vincent pour une

36

les lments de base de ce dossier sont issus de : Grard Calot, "Les effets de
la grande panne de courant New York (1965)", Economie et Statistique, 1970,
n18.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

70

moyenne de 7, en a eu 10 ; Brookdale : 10 en moyenne, 13 le 8 aout ;


Coney Island : 5 en moyenne, 8 le 8 aout.". Pourtant, si lon examine
le nombre des naissances de lagglomration de New York pendant les
6 semaines de juillet et aout 96 o auraient d se passer les naissances
lies la panne, on ne trouve aucune variation par rapport aux annes
antrieures.
Classons ces mmes donnes en considrant la moyenne des
naissances par jour, lobservation du jour, lcart par rapport la
moyenne et ce que reprsente cet cart par rapport la moyenne (en
pourcentage) :
Moyenne
Mont-Sina
11
Bellevue
20
Columbia Presb. 11
St-Vincent
7
Brookdale
10
Coney Island
5

Observation Ecart Ecart/moyenne


28
+17
154%
29
+9
45%
15
+4
36%
10
+3
43%
13
+3
30%
8
+3
60%

Les carts des 4 dernires cliniques qui sont de 3 ou 4 relvent du


quotidien, il ny a l que des variations trs ordinaires que lon
rencontre dans toute clinique. Pour la clinique de Bellevue, lauteur de
larticle a prouv le besoin damplifier le phnomne en mettant en
rapport lobservation du 9 aout (et non du 8 comme pour les autres, ce
qui laisse penser que celle du 8 tait moins spectaculaire) avec celle,
anormalement basse de la semaine prcdente de 11. Sur une moyenne
de 20, un cart de 9 ne reprsente que 45% ce qui classe cette clinique
dans la moyenne des autres.
Seul un cas sort de lordinaire : il sagit de la clinique du MontSina o lcart observ reprsente une fois et demie la moyenne alors
que les autres carts tournent aux alentours de la moiti de la
moyenne. On peut faire lhypothse que tout est parti de cette clinique
: les mdecins sont submergs, les sages-femmes aux abois, les

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

71

patientes attendent dans des lits de fortune installs dans les couloirs.
Pourquoi ? Serait-ce la pleine lune, source bien connue (bien que
mythique37) daugmentation des naissances ? Non, celle-ci naura lieu
que dans 4 jours, le 12 aout. Alors un interne a un trait de gnie : cest
la faute de la panne dil y a neuf mois. Pour sen assurer, il fait par
tlphone le tour de ses collgues et ne retient videmment que les
carts positifs la moyenne, chiffres qui ne sont pas dailleurs
mirifiques mais qui suffisent faire la matire dun coup de tlphone
aux journaux qui sautent sur loccasion.
Il a donc suffit dun seul cas sortant rellement de lordinaire pour
que se cre une lgende devenue depuis une rumeur puisquelle se
rpte de panne en panne et fait lobjet dune croyance bien tablie.
Ceci manifeste clairement que face un vnement qui sort beaucoup
de lordinaire, lon ne croie pas au hasard : on ne peut pas admettre
quun vnement exceptionnel arrive sans raison, simplement du fait
que, par hasard, la clinique du Mont-Sina ait reu une fois et demie
de patientes de plus que la moyenne. Le statisticien peut se lamenter
de ce fait38 mais le sociologue doit plutt en prendre acte : le trs
exceptionnel doit (socialement) sexpliquer autrement que par le
hasard. Si je lance 10 pices de monnaie sur la table et quelles
retombent toutes sur face, vous me demanderez mon truc alors quil
nest pas impossible que cela arrive par hasard (avec une probabilit
denviron une chance sur mille). Quand la probabilit de ce qui arrive
rellement devient trop faible, le hasard devient inacceptable et on

37

Cf. pour le cas franais : Frdric Saudron, Les naissances de la pleine lune,
Paris, LHarmattan, 1998
38

cest ce que fait Grard Calot dans larticle cit : "lpisode nous parait digne
dintrt parce quil montre combien est sujet caution le tmoignage que tout
individu pris isolment peut apporter sur la base dune information
ncessairement partielle (...) lattention de chacun est naturellement attire par
lexceptionnel, voire le sensationnel, et se dtourne du banal".(p.47)

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

72

cherche une autre explication : cest bien sur cette pratique que
sappuie lutilisation des tests statistiques que nous allons tudier mais
pour laquelle nous allons nous donner dabord un instrument de
mesure, lcart pondr.

2 Lcart pondr
Imaginons une population de 1000 tudiants classs selon leur srie
du bac et selon leur destination lanne suivante : universit, classes
prparatoires aux grandes coles et autres orientations (IUT et autres
formations finalits professionnelles).
Srie
Universit Classes prep. Prof.
Total
Littraire 130
20
50
200
Eco.et soc. 200
20
80
300
Scientifique 100
50
50
200
Tech.et pro. 70
10
220
300
---------------------------------------------------------Total
500
100
400
1000
Dans ce tableau, isolons deux cases : "littraires allant
luniversit" et "scientifiques allant dans une classe prparatoire", et
calculons pour chaque cas lcart lindpendance :
Littraires
Universit
Observ
130
Thorique 500 x 200 / 1000 = 100
Ecart
130 - 100 = 30

Scientifiques
Classes prparatoires
50
100 x 200 / 1000 = 20
50 - 20 = 30

Lcart pour les deux cases est bien le mme, gal trente
individus, mais ce mme cart lindpendance a-t-il la mme
signification dans les deux cas ? On peut considrer quil nen est pas
ainsi car pour les littraires allant luniversit, leffectif thorique
calcul partir des marges prend en compte limportance de

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

73

luniversit (la moiti des destinations). Leffectif thorique de ce fait


est aussi un effectif attendu : cest leffectif quil y aurait en cas
dindpendance, effectif qui ne dpend que des marges. Puisque la
moiti va luniversit, sil y a indpendance, cette proportion
sapplique aux 200 de la srie littraire soit 100 attendus.
On a donc un cart de 30 par rapport une attente de 100 : lcart
par rapport ce qui est attendu ne reprsente quune proportion de
30 / 100 = 0,3 soit environ un tiers de leffectif thorique. On attendait
un certain effectif, on en observe un tiers en plus, lvnement est de
peu dimportance.
Par contre pour les scientifiques allant dans une classe prparatoire,
comme cette destination ne reprsente que 10% des destinations,
leffectif thorique attendu ne reprsente que 10% des 200 de srie
scientifique soit 20. Or lcart en plus est de 30 individus ce qui
reprsente ici un rapport de 30 / 20 = 1,5. Lcart est de une fois et
demie leffectif thorique. On attendait un certain effectif, il en arrive
cette fois une fois et demie en plus, ce qui est tout fait notable.
Dans le premier cas, lcart de trente individus napporte pas
beaucoup de surprise tandis que le mme cart est trs surprenant dans
le deuxime cas : linformation apporte par le mme cart nest pas la
mme dans les deux cas. Pour manifester cette diffrence
dinformation apporte par les deux carts, on construit un indicateur
nouveau qui drive de lcart prcdent par une opration de
pondration, qui fasse en sorte que soit intgr dans le rsultat
numrique leffet de surprise (dans le deuxime cas), ou son absence
(dans le premier). A cette fin on se sert prcisment du rapport
cart/thorique (0,3 dans le premier cas, 1,5 pour le deuxime) comme
coefficient de pondration pour diminuer ou amplifier lcart, donc
pour le pondrer.
Littraire Universit

ScientiqueClasses prparatoires

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

74

Rapport cart/thorique
0,3
Ecart pondr
30 x 0,3 = 9

1,5
30 x 1,5 = 45

Cet cart pondr, produit dun effectif (lcart) par un coefficient


de pondration (rapport de deux effectifs donc sans unit de compte)
est un cart pondr dont lunit de compte peut tre pense comme
un individu. Dans le premier cas, lcart pondr est de 9 individus,
dans le deuxime il est de 45. Cet indicateur nous signale que dans le
premier cas, lcart brut de 30 individus napporte que peu de surprise
(il est donc pondr dans le sens de la diminution) tandis que dans le
deuxime cas il est pondr dans le sens de laugmentation. Le fait
daller dans les grandes coles est un phnomne plutt rare : les
bacheliers venant de la srie scientifique qui y vont, sy retrouvent
dune manire tout fait particulire, surprenante par son importance
par rapport leffectif attendu et cest dailleurs cette slection par le
petit nombre qui en fait tout lintrt dans le jeu social.
Cet cart pondr est appel le khi-deux dune case. Le crateur de
cette indice, Karl Pearson a employ pour le dsigner une lettre
grecque39 mise au carr , car cet indice est souvent prsent sous la
forme suivante o un carr intervient :
(observ - thorique)2 / thorique
or "observ - thorique" correspond lcart lindpendance et le
khi-deux peut s'crire :
cart2 / thorique
ou encore :
cart x (cart / thorique)
cest dire lcart brut lindpendance pondr par le rapport
cart / thorique.
39

les lettres grecques sont souvent utilises par les mathmaticiens pour
dsigner une valeur inconnue, dont on n'a qu'un "reflet", l'observation, en
rfrence au mythe de Platon, o les hommes sont dans une caverne et o ce qu'ils
voient ne sont que les reflets de la ralit idale.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

75

Le khi-deux dune case est la mme chose que lcart pondr : on


peut ainsi considrer le khi-deux de toutes les cases dun tableau
comme la somme des carts pondrs, la somme des "informations de
surprise" faibles ou fortes apportes par les diffrents carts du
tableau. Un cart apporte toujours une certaine information, mais pour
lindice khi-deux, elle est pondre par son rapport au thorique qui
lamplifie ou la rduit selon le cas. On passe de lcart brut, ordinaire,
linformation apporte par cet cart, note en nombre pondr
dindividus en cart lindpendance, avec donc une unit de compte
homogne un cart (et comparable lui de ce fait).

3 Exemple dutilisation : IUT


IUT : sexe - russite
Pour utiliser un exemple rel soit le tableau qui croise, pour une
population dtudiants dIUT40, un indicateur de la russite passe
dans le secondaire (pas de redoublement ou un seul, oppos deux
redoublements ou plus) avec le sexe du rpondant :
0 ou 1
2 redoublements Total
redoublement
ou +
Masculin
1083
318
1401
Fminin
325
98
423
--------------------------------------------------------------Total
1408
416
1824
En considrant le tableau dindpendance, on saperoit quil est trs
proche de lobserv:
0 ou 1

2 redoublements

40

Total

daprs Philippe Cibois et Janina Lagneau, Les tudiants dans


lenseignement suprieur court, Paris, OCDE, 1976, p.110.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

76

redoublement
ou +
Masculin
1081,5
319,5
1401
Fminin
326,5
96,5
423
--------------------------------------------------------------Total
1408
416
1824
lcart pour chacune des cases est en valeur absolue de 1,526. On est
trs proche de lindpendance : dailleurs le PEM du tableau nest que
de 0,5%41 : calculons le khi-deux de chaque case en pondrant lcart
de 1,526 par le rapport cart / effectif thorique de chaque case soit :
1,526 x 1,526 / 1081,5 = 0,002 pour la premire case :
0 ou 1
2 redoublements Total
redoublement
ou +
Masculin
0,002
0,007
0,009
Fminin
0,007
0,024
0,031
--------------------------------------------------------------Total
0,009
0,031
0,041
Comme les carts sont minimes par rapport aux effectifs thoriques,
la pondration des carts a jou dans le sens de la diminution : les
contributions de chaque case au khi-deux sont trs faibles et le khideux total est de 0,041 soit largement moins quun individu. Quelque
soit lindicateur considr : lcart lindpendance proche de un
individu, le PEM infrieur 1%, le khi-deux infrieur 1 individu ;
tout nous signale que nous sommes trs proche de lindpendance et
notre conclusion sera, sans que nous ayons ici besoin daller plus loin,
quil y a indpendance entre le sexe et la russite passe dans le
secondaire. Dans notre population dtudiants en IUT, la russite dans
le secondaire a t la mme pour les garons et les filles.
41

on peut parler de PEM du tableau, sans prciser si cest un PEM local ou


global puisquil sagit dun tableau 2 x 2 o ces deux PEM sont identiques.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

77

Cependant nous observons des carts par rapport cette hypothse,


mais ils sont tellement faibles quils ne remettent pas en cause
lhypothse dindpendance. Un cart pondr infrieur un individu
peut raisonnablement tre tenu pour ngligeable. Lobservation est
trop proche de lindpendance pour que nous ne prenions pas cette
hypothse comme guide dinterprtation : les deux sexes ont eu la
mme russite dans le secondaire. Ce ne sera pas le cas avec la mme
population prise selon un autre point de vue.
IUT :origine sociale - russite
Considrons maintenant en ligne non plus le sexe mais lorigine
sociale (infrieure / suprieure) avec le mme critre de russite dans
le secondaire en colonne :
0 ou 1
2 redoublements Total
redoublement
ou +
Suprieure
697
265
962
Infrieure
711
151
862
--------------------------------------------------------------Total
1408
416
1824
En considrant le tableau dindpendance, on saperoit maintenant
quil est beaucoup moins proche de lobserv que dans le cas
prcdent :
0 ou 1
2 redoublements Total
redoublement
ou +
Suprieure
742,6
219,4
1401
Infrieure
665,4
196,6
423
--------------------------------------------------------------Total
1408
416
1824
Lcart pour chacune des cases est en valeur absolue de 45,6 et le
PEM de 26,0% : nous somme dans un cas trs diffrent du prcdent,

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

78

ce qui nous invite regarder o se situent les attractions et les


rpulsions :

Suprieure
Infrieure

0 ou 1
redoublement
-45,6
45,6

2 redoublements
ou +
45,6
-45,6

On constate une attraction entre origine sociale infrieure et russite


scolaire dans lenseignement secondaire atteste par le fait de ne pas
avoir pris de retard (ou un an seulement) : comme ce rsultat semble
aller lencontre de ce quon sait sur la russite scolaire pendant le
secondaire, nous devons nous demander si nous ne sommes pas en
prsence dun tableau peu fiable o des fluctuations dchantillonnage
de lenqute nous interdiraient de donner trop dimportance aux
rsultats. Devons-nous remettre en cause les donnes ou notre
interprtation ? Pour rpondre cette question pralable, regardons les
carts, quils soient bruts ou pondrs.
Lcart brut est gal 45,6 en valeur absolue, soit 91,2 pour la
somme des carts positifs : avoir dans un tableau une centaine
dindividus en cart positif lindpendance nest pas rien et ce
simple fait nous incite considrer le tableau comme pertinent,
comme apportant une information, mme si elle nest pas
immdiatement intelligible ; considrer comme peu probable que
nous soyons dans la mme situation que dans le cas prcdent avec la
variable sexe et o il y avait indpendance. Cela semble
raisonnablement peu probable mais comment sortir du registre de
limpression, du sentiment raisonnable, de lintuition, toutes choses
qui aident le sociologue dans sa dmarche mais qui ne lui donnent pas
lassurance ncessaire pour conclure ? Cest ce que va nous apporter
lcart pondr ou khi-deux :
0 ou 1
redoublement

2 redoublements
ou +

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

Total

79

Suprieure
2,8
9,5
12,3
Infrieure
3,1
10,6
13,7
--------------------------------------------------------------Total
5,9
20,1
26,0
Le khi-deux total est de 26 : si lon compare carts bruts et carts
pondrs, on voit que pour toutes les cases la pondration sest faite
dans le sens de la rduction (puisque tous les carts taient infrieurs
au thorique), mais que, mme cette pondration faite, on se trouve
encore avec une somme pondre de 26 individus en cart
lindpendance. Cet cart est-il suffisant pour chercher interprter le
tableau, cest dire admettre quil y ait du sens au croisement, cest
dire refuser de dire que nous sommes, comme dans le cas prcdent,
dans la situation d'indpendance ? La rponse sera guide par
lexistence de tables statistiques du khi-deux qui a priori, vont nous
indiquer dans le cas prsent dun tableau 2 2 sil est lgitime ou non
de penser trouver du sens au tableau, de trouver les carts
suffisamment forts pour quils soient significatifs.
La table du khi-deux part de lhypothse que nous sommes dans
une population du type de notre premier exemple o il ny pas dcart
lindpendance : o il y a indpendance entre ce qui est en ligne et
ce qui est en colonne. Cependant, du fait des fluctuations
dchantillonnage, on peut avoir la malchance de tirer un chantillon
qui ne soit pas reprsentatif de cette population o lhypothse
dindpendance est vraie. Si lon tire un assez grand nombre
dchantillons de la population, 100 par exemple, il arrivera
malheureusement que pour un petit nombre dentre eux, bien que nous
soyons en situation dindpendance, on constatera cependant des
carts lindpendance.
Ce que nous dit la table du khi-deux cest que la somme des carts
pondrs atteindra au moins 0,5 dans la moiti des chantillons, ce qui

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

80

signifie quil y a habituellement quelques carts dans les chantillons,


mme sil y a indpendance et que :
- dans 10 chantillons sur 100 le khi-deux atteindra la valeur de 2,7
- " 5
"
3,8
- " 1
"
6,6
et mme que dans 1 cas sur 1000, il atteindra 10,8.
Dans notre exemple, le khi-deux observ est de 26 : il nest
videmment matriellement pas impossible que, avec une population
de rfrence en situation dindpendance, cette valeur soit obtenue,
simplement du fait des fluctuations dchantillonnage, peut-tre dans
un cas sur un million mais il devient plutt raisonnable de prendre
lattitude humaine standard, que nous avons vue l'uvre plus haut
(dans le cas de la panne de courant), qui est de refuser de croire au
hasard trop exceptionnel et de trouver une autre explication qui sera
ici tout simplement de rejeter lhypothse dindpendance entre les
deux questions. Ce serait vraiment un hasard trop incroyable davoir
un khi-deux de 26 alors que dans un cas sur 100 seulement il atteint
6,6 par hasard. Il vaut mieux dire que sil y a des carts
lindpendance, cest que dans la population de rfrence il y a un lien
entre origine sociale et russite scolaire et que l'hypothse
d'indpendance n'est pas admissible.
Nous sommes maintenant autoriss chercher comprendre le sens
de cette liaison qui nous signifie simplement que les tudiants dIUT
ont leur spcificit : sils ont choisi cette voie, cest pour des raisons
inverses selon leur origine sociale. Pour ceux dorigine sociale
suprieure, sils nont pas entrepris daller dans des prparations aux
grandes coles, cest que leur niveau scolaire ne le leur permettait pas.
Des redoublements ont fait que les IUT sont pour eux un filet de
rattrapage. Inversement pour les meilleurs lments dorigine sociale
infrieure, les IUT sont vus comme une filire moins alatoire que
luniversit, plus proche culturellement de ce qui est connu dans leur
milieu, facilement accessible grce leur bon niveau scolaire, moins

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

81

longue que les filires nobles et gage d'une bonne insertion


professionnelle. Cette spcificit des IUT fait que le mauvais niveau
scolaire est en attraction avec lorigine sociale suprieure et
inversement pour lorigine sociale infrieure.
Rsumons notre dmarche par le diagramme KD1 o le khi-deux
est croissant. Sil est nul ou trs faible, gauche du graphique, nous
navons aucune raison de remettre en cause lhypothse
dindpendance, nous sommes en zone dacceptation de lhypothse
dindpendance. Inversement droite, si le khi-deux est trs fort, il
devient invraisemblable de croire un hasard extraordinaire qui aurait
conduit cette valeur. Il est plus raisonnable de rejeter lhypothse
dindpendance et de chercher la signification de la liaison observe.
Nous sommes en zone de rejet de lindpendance. Entre les deux
zones, la frontire est floue (nous allons tudier ce cas) et elle est
balise en gnral par les trois valeurs du hasard que nous avons cit :
10 chances sur 100 (soit une sur dix), 5 chances sur 100, 1 chance sur
100. Cest ce quon appelle les seuils standards de 10%, 5%, 1%.

IUT : sexe - russite (nouveau codage)


Un exemple de khi-deux frontire nous est donn en reprenant le
premier exemple IUT mais en isolant ceux qui sont strictement

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

82

lheure et ceux qui sont en retard, mme dun an. On a alors


lobservation suivante :
lheure
en retard
Total
Masculin
419
982
1401
Fminin
149
274
423
--------------------------------------------------------------Total
568
1256
1824
Le PEM est de 5,9%, ce qui nest pas trs lev : on peut se
demander sil y a une liaison significative bien que faible, ou si nous
sommes dans le cas dcarts alatoires lindpendance ayant entrain
une liaison faible mais non significative. Pour trancher, nous utilisons
le khi-deux qui est pour ce tableau de 4,3 soit, dans le graphique KD1,
la frontire entre les zones dacceptation et de rejet de
lindpendance, entre les seuils de 5% et de 1%, ce qui veut dire que
la probabilit davoir un khi-deux de 4,3 (sil y a indpendance)
narrivera par hasard que dans moins de 5% des cas (environ 3% des
cas).
On peut tenir le raisonnement suivant : si jaccepte un risque de me
tromper de lordre de 3% (et donc davoir raison dans 97% des cas, ce
qui est assez satisfaisant), je peux dire que je suis lgitimement en
zone de rejet (de l'hypothse d'indpendance) et dire que la liaison a
du sens, que le tableau est significatif. Ici le sens est le suivant : il faut
reprer que lattraction se fait entre fminin et lheure, ce qui signifie
que des filles strictement lheure (donc dun bon niveau) sont plus
souvent que les garons pousss vers les IUT, vraisemblablement du
fait que les familles ont moins dambitions pour les filles que pour les
garons. Les garons de bon niveau sont moins tourns vers les IUT et
davantage vers des tudes plus longues et plus prestigieuses.
Lattraction est faible (PEM de 5,9%) mais cependant significative,
comme lon dit habituellement, au seuil de 5% ce qui signifie que le

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

83

khi-deux observ se trouve droite de ce seuil. Ce seuil de 5% est la


frontire retenue.
On peut tendre le raisonnement dautres valeurs : un khi-deux de
3 ou mme de 2,7 sera rput significatif au seuil de 10% et tout khideux suprieur 6,6 sera rput significatif au seuil de 1%. On voit
bien que plus le khi-deux baisse, plus lattraction baisse, plus on se
rapproche de lindpendance et il arrive un moment o il devient trs
risqu de rejeter lhypothse dindpendance, dabsence de liaison
entre lignes et colonnes. On dclarera alors, si le khi-deux est par
exemple infrieur 2,7 que le tableau est non significatif et lon ne
cherchera pas rendre compte des faibles attractions observes qui
sont alatoires. Tant quon est droite du seuil de 10%, le tableau est
rput significatif mais les risques pris sont plus ou moins grands,
dabord 10%, puis 5%, puis 1% et on ne cherche pas donner des
valeurs encore plus faibles : ces trois seuils sont dits standards.

4 Les tableaux qui ne sont pas 2 2


Dans un tableau 2 x 2 muni de ses marges, ds quune case est
dfinie, les autres sen dduisent par soustraction. Par exemple dans le
tableau prcdent muni de ses marges, si on ne donne que la case
masculin - lheure :
lheure
en retard
Total
Masculin
419
1401
Fminin
423
--------------------------------------------------------------Total
568
1256
1824
les cas "masculin en retard" se dduisent de 1401 - 419 = 982 ;
les cas "fminin lheure" par 568 - 419 = 149 ;

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

84

les cas "fminin en retard" par 1256 - 982 = 274.


On peut gnraliser ce rsultat : dans un tableau plus grand que
2 2, il ny a que la dernire ligne ou la dernire colonne qui puisse
de dduire par soustraction des marges. Dans le cas dun tableau 3
5 comme ci-dessous, il faut remplir les 8 cases marques de lintrieur
du tableau pour que la 3e colonne et la 5e ligne puisse se dduire des
marges : ce nombre de 8 est le nombre de colonnes = 3 diminu de 1
multipli par le nombre de lignes = 5 diminu de 1 soit 2 4 = 8.
Cest ce quon appelle communment le degr de libert dun tableau,
cest dire le nombre de cases quil faut fixer pour que les autres se
dduisent des marges.
Colonne 1

Colonne 2

Colonne 3

Marge

Ligne 1

XXXXXXX XXXXXXX

XXXXXXX

Ligne 2

XXXXXXX XXXXXXX

XXXXXXX

Ligne 3

XXXXXXX XXXXXXX

XXXXXXX

Ligne 4

XXXXXXX XXXXXXX

XXXXXXX

Ligne 5
Marge

XXXXXXX
XXXXXXX XXXXXXX XXXXXXX

XXXXXXX

Plus le degr de libert est grand est plus sont grandes les
fluctuations du khi-deux dues lchantillonnage : les tables du khideux tiennent compte de cet aspect en augmentant les valeurs du khideux aux seuils standards en fonction du degr de libert :
Degr de libert

42

Table du khi-deux42
Seuils
10%
5%

1%

on trouvera dans tout livre de statistique des tables plus tendues.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

85

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

2,7
4,6
6,3
7,8
9,2
10,6
12,0
13,4
14,7
16,0
17,3
18,5
19,8
21,1
22,3
23,5
24,8
26,0
27,2
28,4

3,8
6,0
7,8
9,5
11,1
12,6
14,1
15,5
16,9
18,3
19,7
21,0
22,4
23,7
25,0
26,3
27,6
28,9
30,1
31,4

6,6
9,2
11,3
13,3
15,1
16,8
18,5
20,1
21,7
23,2
24,7
26,2
27,7
29,1
30,6
32,0
33,4
34,8
36,2
37,6

5 Exemple dutilisation : PRAT89


Par exemple dans PRAT89 nous croisons lge du rpondant avec
le fait quil place lmission "enqutes du commissaire Maigret" dans
ses missions prfres. On a les rsultats suivants en effectifs, en
pourcentage en ligne, et en reprsentation graphique (graphique KD2)
:
Age

Maigret : mission prfre


oui
non

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

Total

86

15-17
18-24
25-34
35-49
50-64
65 et +
Total
Age
15-17
18-24
25-34
35-49
50-64
65 et +
Total

14
261
275
50
675
725
125
942
1067
190
1016
1206
219
754
973
195
556
751
--------------------------------------------------------------793
4204
4997
Maigret : mission prfre
oui
non
Total
5,1
94,9
100
6,9
93,1
100
11,7
88,3
100
15,8
84,2
100
22,5
77,5
100
26,0
74,0
100
--------------------------------------------------------------15,9
84,1
100

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

87

Le PEM global du tableau est de 22,2% et le khi-deux de 170,9. Le


degr de libert est de 5 puisque cest un tableau 2 6. Dans le
graphique dacceptation/rejet, il faut remplacer les valeurs des seuils
standards par ceux de la table de 5 degrs de libert.

On voit immdiatement que la valeur de 170,9 se trouve tout fait


en zone de rejet de lhypothse dindpendance : ce tableau est
significatif (au seuil de 1%), il a du sens, on peut se servir des
descriptions antrieures qui nous manifestent clairement que cette
mission est prfre par les gnrations ges. Plus lge augmente et
plus la proportion de ceux qui placent lmission dans leurs missions
prfres augmente.
Par contre si on croise cette mission avec le sexe de lindividu on a
les rsultats suivants :
Maigret : mission prfre
Sexe
oui
non
Total
Masculin
374
2030
2404
Fminin
419
2174
2593
--------------------------------------------------------------Total
793
4204
4997
Sexe

Maigret : mission prfre


oui
non

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

Total

88

Masculin
15,6
84,4
100
Fminin
16,2
83,8
100
--------------------------------------------------------------Total
15,9
84,1
100
La diffrence de pourcentage en faveur du sexe fminin est
extrmement faible (moins de 1%) : on est donc trs prs de
lindpendance. Le khi-deux du tableau est de 0,3 : en reprenant le
schma KD1 du khi-deux 1 degrs de libert, nous constatons que
nous sommes en zone dacceptation de lindpendance. Les carts sont
trop faibles pour que nous remettions en cause cette hypothse : il y a
indpendance entre le sexe et le choix de cette mission.

6 Variations
Prenons un exemple de lenqute FUM92:
Fumeurs
Non fumeurs
Total
Mre fume
18
13
31
Mre ne fume pas 39
57
96
-----------------------------------------------------------Total
57
70
127
Enqute pdagogique ralise en 1992 (tudiants de licence).
On peut y reprer une attraction entre "mre fume" et "fumeurs"
(PEM = 23,9) ; le khi-deux de ce tableau est de 2,9 soit, pour 1 degr
de libert, un tableau significatif au seuil de 10%. Linformation est
suffisante pour rejeter lhypothse dindpendance. Le fait que la mre
fume fait que l'tudiant est plus souvent fumeur.
Appliquons cependant la technique dj utilise du dplacement
lmentaire : si un individu de la case en attraction (deffectif 18)
changeait de catgorie et que ce changement se rpercute dans toutes

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

89

les cases de faon de laisser les marges inchanges, on aurait alors le


dplacement lmentaire suivant que lon ajoute au tableau prcdent :
Fumeurs
Mre fume
-1
Mre ne fume pas +1

Non fumeurs
+1
-1

Le rsultat du dplacement sera le suivant :


Fumeurs
Non fumeurs
Total
Mre fume
17
14
31
Mre ne fume pas 40
56
96
-----------------------------------------------------------Total
57
70
127
Le PEM a baiss puisquon a diminu la case en cart positif et
quon sest rapproch de lindpendance, il est maintenant de 18,1% et
le khi-deux de 1,6 : il nest donc plus significatif. Il a donc suffit dun
seul dplacement pour quon ne puisse plus exclure l'indpendance.
Continuons ce travail dans les deux sens, tout d'abord en se
rapprochant le plus possible de lindpendance qui est de 13,9 pour la
premire case du tableau ("Mre fume - fumeurs"). Comme nous
sommes dans un tableau un seul degr de libert, une fois cette case
fixe, toutes les autres sont dfinies. Lentier le plus proche est 14.
Voici le tableau le plus proche de lindpendance et ses voisins
jusqu'au tableau le plus extrme par dplacement lmentaire avec le
PEM et le Khi-deux :
Tableau

PEM

Khi-deux

14 17
43 53

0,5%

0,001

15 16
42 54

6,4%

tableau le plus proche de lindpendance


0,204

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

90

16 15
41 55

12,2%

0,751

17 14
40 56

18,1%

1,644

---------------23,9%
---------------29,8%

2,7 : seuil de 10%


2,881
tableau observ
3,8 : seuil de 5%
4,463

35,6%

6,391

---------------41,5%

6,6 : seuil de 1%
8,663

18 13
39 57
19 12
38 58
20 11
37 59
21 10
36 60
---------26 5
31 65
---------31 0
26 70

4 tableaux intercalaires sauts de premire case 22, 23, 24 et 25


70,7
25,201
4 tableaux intercalaires sauts de premire case 27, 28, 29 et 30
100%
50,364
tableau extrme (loin de lindpendance)

Examinons ce panorama de tableaux : le tableau "14" (on peut


dsigner les tableaux par leur premire case) est le plus proche de
lindpendance et le 31 le plus loign. Ceci se repre par un PEM qui
est trs proche de 0 pour le premier est gal 100% pour le dernier.
Entre ces deux extrmes se situe lobserv : le 18. Notons bien quun
dplacement vers lindpendance (vers le 17) rend le tableau nonsignificatif, quun dplacement vers la liaison maximum (jusquau 19)
le rend significatif au seuil de 5% et que deux dplacements (jusquau
21) le rendent significatif au seuil de 1%. Dun dplacement lautre,

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

91

le PEM croit denviron 6% chaque fois, le khi-deux dune manire


moins rgulire (dun peu plus dune unit autour de lobservation).
Ces fortes variations sont un effet du faible effectif. Un
dplacement de 1 individu fait franchir les frontires de significativ
du khi-deux et fait varier beaucoup le PEM. Si nous avions, avec la
mme structure, des effectifs plus forts, les variations seraient
beaucoup plus faibles. Prenons par exemple le tableau 16, non
significatif (khi-deux de 0,751 et PEM=12,2%). Pour conserver la
mme structure, multiplions simplement tous les effectifs par 10 et
examinons ses voisins pour un dplacement lmentaire :
Tableau

PEM

Khi-deux

159 151
411 549

11,6%

6,808

160 150
410 550

12,2%

7,511
tableau de rfrence (effectifs multiplis par 10)

161 149
409 551

12,8%

8,248

Le PEM maintenant est peu modifi, il reste aux alentours de 12%,


et le khi-deux qui varie lui aussi peu, dune unit environ, a t
multipli par 10 pour le tableau de rfrence : dun khi-deux de 0,75
on est pass un khi-deux de 7,5. Il ny a l aucun paradoxe43 : une
mme liaison sur un petit effectif est rpute non significative ; avec
un effectif 10 fois plus grand, linformation est plus grande, le khideux est plus grand et devient suffisant ici pour que le tableau soit

43

Si lcart est multipli par 10, le rapport cart/thorique reste inchang


puisque le numrateur et le dnominateur de la fraction ont t multiplis par 10.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

92

rput significatif au seuil de 1%. Ce nest pas la force de la liaison


qui a chang : le PEM est indiffrent aux effectifs, cest linformation
qui est devenue suffisante pour entrainer une autre dcision. Cela nest
dailleurs pas tranger au sens commun : si lon observe quune
personne observe sur 10 est rousse, il est difficile dextrapoler ce
rsultat. Si lon en a observ 10 sur une population de 100, la
prdiction devient meilleure, et si on arrive 100 sur 1000 la mme
prdiction devient excellente. Un faible cart lindpendance peut
facilement tre assimil des fluctuations dchantillonnage quand
leffectif observ est faible. Il peut tre mesur avec prcision bien
que faible, quand leffectif est important. Le khi-deux nest que le
reflet de leffectif car on peut le considrer comme un effectif
pondr.

7 Rgles de bonne utilisation


On trouve dans la plupart des livres de statistiques des rgles de
prcaution qui entourent l'utilisation du test du Khi-deux. Pour voir o
rside une ventuelle difficult, tudions l'exemple suivant, tableau
crois issu de l'enqute REL86 et qui croise le sexe avec la question
"Quand vous tiez enfant, vos parents taient-ils pratiquants ?" avec
les modalits de rponse suivantes (et leur effectif) : votre pre et
votre mre (653) ; votre pre seulement (20) ; votre mre seulement
(262) ; ni votre pre ni votre mre (560) ; tait orphelin (9) ; nonrponse (26). Il y par ailleurs dans l'enqute 726 hommes, 803 femmes
(et une non-rponse cette question). Le tableau est le suivant :
Sexe

Pre
+Mre
Masculin
309
Fminin
344
Non-rponse
0

Pre
8
12
0

Mre

Ni Pre Orph Non-rp.Total


ni Mre
128
265
5
11
726
134
295
4
14
803
0
0
0
1
1

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

93

-----------------------------------------------------------------Total

653

20

262

560

26

1530

Le khi-deux de ce tableau est de 58,9, ce qui, avec un degr de


libert de 10, nous met en zone de rejet de l'hypothse d'indpendance
tous les seuils standards (le seuil de 1% correspond une valeur de
23,2), ce qui indiquerait donc qu'il y aurait une relation entre le sexe et
la croyance des parents. Comme ceci semble absurde puisqu'il est peu
probable que le sexe de l'enfant dpende de la pratique religieuse des
parents, examinons les pourcentages en ligne.
Sexe

Pre
Pre Mre Ni Pre Orph Non-rp.Total
+Mre
ni Mre
Masculin
42,6
1,1
17,6 36,5
0,7
1,5
100
Fminin
42,8
1,5
16,7 36,7
0,5
1,7
100
Non-rponse
0
0
0
0
0
100
100
--------------------------------------------------------------------Total
42,7
1,3
17,1 36,6
0,6
1,7
100
On constate que les deux premires lignes de pourcentage sont
pratiquement identiques entre elles et avec le total : il n'y a
pratiquement pas d'carts au pourcentage moyen, donc d'carts
l'indpendance, donc il ne devrait pas y avoir d'carts pondrs et les
contributions au khi-deux devraient tre insignifiantes. Nous
examinons ce point en regardant le tableau des contributions au khideux de chaque case.
Sexe
P+M
Masculin
0,0
Fminin
0,0
Non-rponse 0,4

P
0,2
0,2
0,0

MNi P.ni M.
0,1
0,0
0,1
0,0
0,2
0,4

Orph NR.
0,1
0,1
0,1
0,0
0,0 56,9

On voit que les contributions sont effectivement insignifiantes sauf


sur la dernire case qui croise les non-rponses aux deux questions et

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

94

qui correspond un seul individu. Reprenons le calcul du khi-deux


pour cette case :
Observ : 1
Thorique : 26 1 / 1530 = 0,01699
Ecart l'indpendance = 1 - 0,01699 = 0,98300
Ecart au carr = 0,96630
Khi-deux = 0,96630 / 0,01699 = 56,9
On voit que cet cart infrieur 1 individu entraine un fort khi-deux
du fait du dnominateur de la division qui est trs faible : diviser par
0,01 revient multiplier par 100. L'amplification lie la pondration
par l'effectif thorique devient une majoration excessive, exagre.
Pratiquement tout le khi-deux du tableau (96,6%) vient de cette case.
On constate sur cet exemple que, lorsque l'on divise par des
effectifs thoriques trs faibles, les contributions au khi-deux
rsultantes sont exagres et risquent d'induire en erreur. Ceci nous
pousse donc considrer le test du khi-deux comme un garde-fou, un
clignotant qui s'allume dans certaines circonstances particulires et qui
doit mettre en veil l'utilisateur. Si on constate que le clignotant
s'allume tort, on l'teint. Concrtement, puisque ce risque vient de
trop faibles effectifs thoriques, il faut se mfier de ceux-ci quand ils
sont infrieurs 1 ce qui arrive quand l'une des marges est faible44. La
solution est simple, il suffit de procder une opration de recodage :
ici il faut agrger la non-rponse l'une des deux modalits ou
l'liminer. On recode ici avec le sexe masculin45. On a alors le tableau
suivant, trs peu diffrent du prcdent.

44

On retrouve ainsi la prcaution la plus indique dans les manuels qui est de
se mfier des tableaux o les thoriques sont infrieurs 1.
45

L'exprience montrant que ce cas d'oubli est le plus frquent.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

95

Sexe
Masculin
Fminin
Total

Pre
Pre Mre Ni Pre Orph Non-rp.Total
+Mre
ni Mre
309
8
128
265
5
12
727
344
12
134
295
4
14
803
--------------------------------------------------------------------653
20
262
560
9
26
1530

Le khi-deux de ce tableau est de 0,9 : il y a indpendance entre les


deux questions car le degr de libert est maintenant de 5 et au seuil
de 10% on a une valeur pour le khi-deux de 9,24. Le khi-deux observ
est en zone d'acceptation de l'indpendance.
En conclusion, et plutt que de donner des rgles de cuisine qui
s'apparentent rapidement des rgles de magie, nous invitons
l'utilisateur tre prudent quand une lecture des pourcentages ou du
graphique des carts semble en opposition avec le test du khi-deux.
Quand par exemple les profils des rponses sont plats alors que le khideux semble indiquer un rejet de l'indpendance. Dans cette situation,
il faut regarder les contributions au khi-deux et voir si l'une d'entre
elles ne serait pas lie un faible effectif thorique (infrieur 1). Si
c'est le cas, il faut recoder les faibles effectifs en les agrgeant la
modalit la plus proche par le sens.
Le khi-deux est un indicateur de l'information apporte par chaque
case, c'est un outil au service de l'interprtation : ce n'est pas une
guillotine qui s'abat sur un tableau pour l'liminer. Il faut observer le
contenu du tableau et comprendre d'o viennent des incohrences
ventuelles.
La procdure de recodage est d'ailleurs un outil qui sert non
seulement pour viter les aberrations comme celles vues l'instant,
mais galement pour rendre cohrent un khi-deux et une interprtation
dans l'autre sens, c'est dire quand l'utilisateur juge que le tableau est
le reflet d'une liaison qui a du sens entre questions alors que le test
n'est pas significatif, c'est dire qu'il nous suggre une acceptation de

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

96

l'hypothse d'indpendance. En effet, si le khi-deux ne nous invite pas


rejeter l'hypothse d'indpendance, on a vu qu'avec un effectif plus
fort et le mme niveau de liaison (PEM), le khi-deux deviendrait
significatif. On peut atteindre ce rsultat en rduisant le degr de
libert par diminution du nombre de lignes et de colonnes du tableau
(par recodage). Evidemment, si aprs ce recodage, le khi-deux reste
non-significatif, il faut abandonner cette hypothse si l'on n'a pas de
nouvelles observations. On va voir cette procdure l'uvre dans
l'exemple suivant.

8 Exemple d'utilisation : FUM97.


Soit donc l'enqute FUM97 dont nous avons parl en introduction :
on interroge les 225 tudiants d'un deug de sociologie et on leur pose
trois questions : s'ils fument ou non (au sens de l'INSEE, c'est dire au
moins une cigarette par jour), leur sexe et l'origine sociale de leurs
parents.
Soit le premier croisement entre le sexe et le fait de fumer :
Croisement question SEX et question FUM
Le Khi-deux du tableau est de
8.5 ***46 PEM=34%
COL: FUM FUM
FUM FUM
FUM
Modal. oui non TOT
oui non TOT
oui
MASC
29
17
46
63.0 37.0 100 20.4 MASC +
FEMI
70 109 179
39.1 60.9 100 79.6 FEMI TOT
99 126 225
44.0 56.0 100 100

FUM
non
+

Il y a donc un lien entre le fait de fumer et le sexe : le sexe masculin


fume plus que le sexe fminin (63% contre 39%). Etudions le lien
avec la catgorie socioprofessionnelle :

46

On note souvent le rsultat du test du khi-deux de la manire symbolique


suivante : *** significatif au seuil de 1% ; **=5% ; *=10% ;ns=non-significatif.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

97

Croisement question CSP et question FUM


Le Khi-deux du tableau est de
8.1 ns PEM=14%
COL: FUM FUM
FUM FUM
FUM FUM
Modal.oui non
TOT
oui non
TOT
oui non
CSP 0
0
4
4
0.0100.0 100
1.8 CSP0 - + NR
CSP 1
2
3
5
40.0 60.0 100
2.2 CSP1 - + Agri
CSP 2
11
8
19
57.9 42.1 100
8.4 CSP2 + - ArtCo
CSP 3
25
23
48
52.1 47.9 100 21.3 CSP3 + - Csup
CSP 4
11
12
23
47.8 52.2 100 10.2 CSP4 + - Inter
CSP 5
14
28
42
33.3 66.7 100 18.7 CSP5 - + Empl
CSP 6
36
48
84
42.9 57.1 100 37.3 CSP6 - + Ouvr
TOT
99 126 225
44.0 56.0 100 100

Si l'on examine les carts en lecture rapide, on voit que trois CSP
fument plus que les autres, les Artisans-commerants, les cadres et
professions intellectuelles suprieures et les professions
intermdiaires. Les autres, en particulier employs et ouvriers qui
reprsentent 60% du total, fument moins que la moyenne. Comme le
tableau n'est pas significatif et que l'on voit une logique d'opposition
qui a du sens, on tente un regroupement en deux catgories de CSP :
une CSP sup. (ArtCom, Csup, Inter) et une CSP inf. (empl, ouvr et le
reste). On a alors le rsultat suivant :
Croisement question CSP et question FUM
Le Khi-deux du tableau est de
4.1 ** PEM=15%
COL: FUM FUM
FUM FUM
FUM
Modal.oui non
TOT
oui non
TOT
oui
CSPsup
47
43
90
52.2 47.8 100 40.0 CSPsup +
CSPinf
52
83 135
38.5 61.5 100 60.0 CSPinf TOT
99 126 225
44.0 56.0 100 100

FUM
non
+

Cette fois, le rsultat est significatif, ce qui montre l'efficacit du


regroupement par rduction du degr de libert. Ceci signifie qu'avec
un codage moins fin, les effectifs sont suffisants pour apporter une
information fiable. Il y a une liaison entre CSP et fait de fumer, la
classe suprieure fumant davantage.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

98

On constate que d'un recodage l'autre, le PEM est rest stable.


Comme indice de liaison, le PEM est indpendant de l'effectif et peu
sensible aux recodages.
On va pouvoir maintenant prendre en compte les trois questions en
mme temps en regardant la liaison entre le sexe et le fait de fumer
pour deux sous-populations (analyse dite multivarie). Dans une
premier tableau on tudiera la sous-population de classe suprieure
(90 individus) puis dans un deuxime, celle de classe infrieure (135
individus). Soit la population de classe suprieure :
Variable test CSP modalit CSPsup
Croisement question SEX et question FUM
Le Khi-deux du tableau est de
0.1 ns PEM=6%
COL: FUM FUM
FUM FUM
FUM
Modal.oui non
TOT
oui non
TOT
oui
MASC
11
9
20
55.0 45.0 100 22.2
MASC +
FEMI
36
34
70
51.4 48.6 100 77.8
FEMI TOT
47
43
90
52.2 47.8 100 100

FUM
non
+

Garons et filles de classe suprieure ont peu prs le mme


comportement vis--vis du tabac, ils fument plus que la classe
infrieure (52% contre 39%) mais les deux sexes accusent peu de
diffrence en termes d'cart au pourcentage moyen. Le khi-deux n'est
pas significatif, le PEM faible : on peut admettre l'hypothse
d'indpendance.
Du point de vue de l'interprtation sociologique, ceci est cohrent
avec une tendance l'unification des comportements des sexes qui
vont en se rapprochant, particulirement dans la classe suprieure.
Garons et filles s'habillent de la mme faon, ont les mmes loisirs,
souvent les mmes dsirs en termes professionnels et cette tendance
est plutt encourage par leur milieu. Il est donc normal qu'ils aient le
mme comportement vis vis de la consommation de tabac. Il n'en est
pas de mme dans la classe infrieure :
Variable test CSP modalit CSPinf
Croisement question SEX et question FUM

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

99

Le Khi-deux du tableau
COL: FUM FUM
Modal.oui non
TOT
MASC
18
8
26
FEMI
34
75 109
TOT
52
83 135

est de
12.8 *** PEM=50%
FUM FUM
FUM
oui non
TOT
oui
69.2 30.8 100 19.3
MASC +
31.2 68.8 100 80.7
FEMI 38.5 61.5 100 100

FUM
non
+

On voit une diffrence trs nette entre le comportement des garons


qui fument 69% (c'est dire plus que garons et filles de la classe
suprieure) et les filles qui ne fument qu' 31%. L, l'uniformisation
des comportements n'est pas pratique, en matire ducative en
particulier : ce qui est admis pour les garons (le tabac en particulier
mais bien d'autres choses) ne l'est pas pour les filles. La diffrence est
significative, la liaison est forte.
Conclusion
On notera sur cet exemple que la lecture rapide est videmment trop
rapide dans les deux derniers tableaux et que d'autre part un tableau
rput non-significatif par le khi-deux est tout fait interprtable.
Qu'il n'y ait pas de diffrence entre garons et filles en classe
suprieure a du sens (le terme "non-significatif" signifie simplement
que l'cart l'indpendance n'est pas suffisant pour rejeter l'hypothse
d'indpendance). Ce qui doit guider l'interprtation, c'est la
signification sociologique donne au croisement. On observe les
donnes pour y trouver du sens, et on se sert cette fin des diverses
mthodes prsentes au chapitre premier : ensuite le test du khi-deux
n'est qu'un garde fou pour viter des accidents, un clignotant qui attire
notre attention sur de faibles effectifs.
Faire de la sociologie aujourd'hui, c'est tudier des donnes
empiriques : donnes d'archives, entretiens, textes, observations,
statistiques, et donnes d'enqutes. Ces dernires ncessitent des
techniques particulires pour tre dcrites. On a prsent ici des
techniques simples mais qui, du fait de leur informatisation, peuvent
traiter des enqutes importantes. Comme on l'a dit en introduction, il

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

100

existe des techniques plus complexes qui ncessitent


dveloppements particuliers (analyse factorielle et rgression).

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

des

101

Bibliographie
BERTIN, Jacques, 1977, La graphique et le traitement graphique de
l'information, Paris, Flammarion, 1977. Ce livre est consulter
par toute personne voulant rflchir sur des reprsentations
graphiques.
NOVI, Michel, 1988, Pourcentages et tableaux statistiques, Paris,
Presses Universitaires de France, coll. "Que sais-je ?", n3337.
Le but de ce livre est de faire le point sur des connaissances et
des pratiques souvent juges trop lmentaires pour tre
enseignes.
ROUANET Henry, LEROUX Brigitte, BERT Marie-Claude, 1987,
Statistique en sciences humaines : procdures naturelles,
Paris, Dunod, et :
ROUANET Henry, BERNARD Jean-Marc, LEROUX Brigitte, 1990,
Analyse inductive des donnes, Paris, Dunod. Ces deux livres
constituent des rfrences qui, bien que d'accs difficile par
rapport au niveau du prsent livre, devront tre utiliss en
particulier par les enseignants et les chercheurs qui
souhaiteraient approfondir ces questions.
SINGLY, Franois de, 1992, L'enqute et ses mthodes ; le
questionnaire, Paris, Nathan, coll. 128. Savoir lire et produire
des chiffres est considr comme une des comptences
possder pour les tudiants en sciences sociales. Ce livre veut
tre un soutien cet apprentissage de l'enqute par
questionnaire.

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

102

Enqutes utilises
FUM92 Enqute "pdagogique" sur 127 tudiants de licence de
sociologie en 1992
FUM97 Enqute "pdagogique" sur 225 tudiants d'un deug de
sociologie en 1997
PRAT89 Nouvelle enqute sur les pratiques culturelles des franais en
1989, Paris, 1990, La Documentation franaise. Enqute
ralise par le Ministre de la culture et portant sur 4997
individus.
LATIN94 Enqute faite en 1994 dans le cadre de lenseignement de
mthodologie du Deug de Paris V en collaboration avec
Franois de Singly. Elle est centre sur le choix du latin. 1058
rpondants.
PANEL89 Cohorte d'lves suivis par les services statistiques du
Ministre de l'ducation nationale depuis leur entre en 6e en
1989. Ici, sous-population de 1865 individus.
REL86 Guy Michelat, Julien Potel, Jacques Sutter, Jacques Matre, Les
Franais sont-ils encore catholiques ?, Paris, Cerf, 1991
Enqute portant sur 1530 rpondants dont a t tir ce livre.

Logiciel
TRIDEUX qui a t utilis pour les analyses de ce livre est un logiciel
libre ralis par l'auteur. Il est cd gratuitement et sa
reproduction est libre. Informations auprs de l'auteur
l'adresse : cibois@francenet.fr

Droits de reproduction et de diffusion rservs Sciences Humaines 2003

Vous aimerez peut-être aussi