Vous êtes sur la page 1sur 32

RESUME DE METHODO de LENQUETE

Ch 1.INTRODUCTION :Enqute et sondage


A.Distinction dun pt de vue historique a.Brve hist des enqutes - Lintro denqutes quant ds la pratique soc. remonte au 18-19s - Noms connus : BOOTH(UK),VILLERME ET LE PLAY(France),QUETELET ET DUCPETIAUX (Belgique). -Lors de ces enqutes =>abondant recours au questionnaire(voir ex inspecteur de la sant en Uk sur la classe ouvrire au 19s p 3-4).Toutefois ces questionnaires tenaient plus de linterrogatoire que de linterview avec des infos connues davance.Cependant,les rsultats de telles enqutes servaient guider le gvt dans le maintien de lordre soc. - Les enqutes relevant de la socio acadmique napparurent quau 20s.Aux alentours de 1930,la socio US fait surtout des enqutes sur les marginaux(Cest la tradition amricaine qui domine ds les enqutes socio). b.Etymologie du mot sondage -Employ ds le 13s, viendrait du mot nordique sund (mer,dtroit,appareil mesurant la profondeur de leau).Par aprs , qualifie aussi celui qui veut percer un secret et cest aussi un terme chirurgical.Le sondeur apparat en 1690 et le sondage en 1769.dans un crit de Balzac en 1841,sondage = investigation rapide. -Remarque : Alors quen franais, le terme sondage a des sens diffrents, en langue germanique, chacun de ces sens a des termes spcifiques. c.Brve hist des sondages -Sondage dopinion=dsir davoir des infos sur ltat desprit dune population Daniel DEFOE(UK) et le comte de la Valette en France mettent en place des rseaux de correspondants rpartis gographiquement. -Remarque : Vrai berceau du sondage dopinion= USA lors des couvertures de presse des lections prsidentielles ! Des 1824, publications denqutes prlectorales par consultation individuelle dlecteurs cd des votes de pailles par le Harrisburg Pennysylvania et le Raleigh Star. Dautres journaux vont les imiter.Toutefois,ces sondages ne sont pas reprsentatif et ont des chantillons de taille leve. En 1936,lors des lections prsidentielles, premier chec des votes de pailles employs par les journaux(lire p6-7). On abandonne les votes de pailles pour utiliser la mthode reprsentative par choix judicieux, on reproduit une mini Amrique en chantillon(grce CROSSLEY ,ROPER ,GALLUP).

-En Europe, il faut attendre 1938 pour voit les premiers instituts de sondage en UK et en France : -Jean STOETZEL fonde lIFOP avec Alfred Max. - En 1946,Guillaume JACQUEMYNS fonde lINSOC. Toutefois ,les sondages ne deviendront populaires que ds les annes 60 (V p 7-8). B.Distinction dun pt de vue mthodo :techniques et mthodes. -La technique du sondage est compose de plusieurs techniques pratiques : a. Lchantillonnage b. Le questionnaire c. Linterview d. Lencodage(codage) e. Le dpouillement f. Lanalyse statistique. Mthode de lenqute : conception intellectuelle qui coordonne lens. des oprations dans un but :obtenir des infos pour dcrire une situation sociale et si possible lexpliquer. Enqute par sondage : mthode sc. Permettant de connatre un grand ens. Dindividus et des caractristiques sur ceux-ci.Ces caractristiques viennent de : a. Lopinion au sens strict : comportement verbal consistant rpondre une question en donnant son avis(+ ce qui nest pas observable ou difficilement dfinissable c ce qui relve des attitudes,idologies,valeurs). b. Soit les sondages sarrtent aux opinions(ds la plupart des cas) soit ils vont plus loin.Cependant, un sondage est toujours dopinion car les lments les plus profonds ne peuvent tre connus qu travers des opinions grce un dispositif de recherche adquat(chelles dattitudes, tests projectifs) C.Les limites de lenqute par sondage. C le sondage repose sur lexpression dopinions, on est face des limites(thoriques). a. Il y a prsomption dIMPLICATION et stt de COMPETENCE chez tous les individus concerns car pour tudier un problme donn, il faut interroger les personnes concernes. b. On postule que ce que ces personnes nous disent est significatif et intressant si on leur pose les bonnes questions => on suppose quelles ont compris le sens des ? et quil est le mme que le ntre et quelles peuvent y rpondre immdiatement . c. On postule aussi que la condensation des rponses obtenues est assez reprsentatif de lensemble tudi.

d. On postule que lensemble des individus concerns par le problme peut tre reprsent par une FRACTION assez faible, appel ECHANTILLON. D.Les tapes dune enqute quantitative. a.15 tapes(v p11-12) b.Etapes de 1 5 1re tape :Dfinition de lobjet Dfini par lenquteur ou un commanditaire extrieur 2me tape :Inventaire des moyens matriels A.En argent B.En temps C.En personnel D.Sources documentaires E.Moyens matriels divers F(Autorisations) 3me Recherches pralables A.Rassemblement de la docu(DESK) B.Consultations des personnes comptentes C.Entretiens approfondis sur petit chantillon 4me tape :Objectifs et hypothses de travail A.Hypothses priori B.Pr-enqute sur petit chantillon non-reprsentatif Lire ex p 13-14 sur les conditions de travail des ouvriers et des employs de + et- 50 ans dans le secteur prive/public. On peut utiliser la mthode du carr latin pour constituer lchantillon Ouvrier Employ <50 ans Priv Public >50ans Public Priv 5me tape :Choix de la population parent -Echantillon :Ens des personnes interroger extrait dune population plus large appele population parent, de rfrence ou encore population-mre , univers ou simplement population. Cette population est dtermine par lobjet mme de lenqute. -Il y a des cas o la pop peut dlimite priori et dautres o une tude exploratoire est ncessaire.Pfois, lobjet mme de lenqute est de dfinir la pop ou bien la pop interroger ne correspond pas la pop objet. Trois situations : a. Pop dnombre et connue ss certains aspects b. Pop inconnue et a fortiori ses caractristiques c. Pop objet de lenqute inconnue mais pop interroger connue . Au sens strict, le choix de la pop-parent nest possible que si cette pop est connue .

Ch 2. La construction de lchantillon

Approches intuitives

- Lchantillonnage statistique repose sur la loi des grands nombres de Jacques Bernouilli et consiste en ceci : SI ON FAIT UN NOMBRE SUFFISAMMENT GRAND DEPREUVES , IL EST TRES PEU PROBABLE QUE LA PROPORTION DAPPARITION DUN EVENEMENT( OU FREQ REL) SECARTR NOTABLEMENT DE SA PROBABILITE (Cfr ex du potager p 16 et du sondage ifop p 16-17) Remarque : il faut au moins trente essais pour que la loi sapplique
Approches statistiques

Deux lments cls : la moyenne et lcart-type La moyenne Elle est gale :

Lcart-type Il est gal :

xi = N

(x x )
i i

(voir ex p 19) b. Population nombreuse Lorsquon veut calculer la moyenne dune population compose de milliers voire millions dlments, cest trs difficile =>on prlve un chantillon de celle-ci quon va soumettre un test . On va ensuite analyser cet chantillon et on va utiliser des mthodes de dduction stat : on calcule la moyenne et lcart-type puis on tire des infos de a grce des techniques stat.
Population N lments Moyenne de la population

Prlvement chantillon de n

Calcul de la moyenne de lchantillon

Calcul de lcart-type de lchantillon

Dduction stat de la moyenne de la pop

Lchantillon et la population

Question trs importante : ds quelle mesure lchantillon est-il reprsentatif ?Il se peut aussi quon surestime ou quon sous-estime la population tudie daprs les tests effectus sur lchantillon(ex piles). Rem : -dans le cas dchantillonnage avec remise, le nombre dch possible est gal : n

-dans le cas dchantillonnage sans remise, le nombre dch possible est gal :

n CN =

N! n!( N n )!

NB :dans ce cas-ci, on doit prendre en compte un facteur de correction. - Voir ex cotes p 24-25 (tirage avec remise) Exemple :
On prends les cotes obtenues par 5 tudiants fictifs (4,5,6,7,8). La moyenne de la population est 6. on va essayer de prendre un chantillon dans cette population et calculer les moyennes dchantillon. Pour savoir quelles sont les chances de trouver un chantillon dont la moyenne est de 6. si lchantillon est de 2, on peut mettre tous les chantillons possibles sur un tableau

- On va donc se concentrer sur la valeur de reprsentativit relative de la moyenne de lchantillon par rapport la moyenne de la population. - Quand on observe les moyennes des diffrents chantillons de lex p 24-25, on saperoit que la moyenne la plus frquente dch est aussi la moyenne de la population. -En fait, lorsquon a N>30,LA VALEUR LA PLUS PROBABLE DE MOYENNE DECHANTILLON EST LA MOYENNE DE LA POPULATION. Tableau des moyennes dchantillons
6 5 4 3 2 1 0 V :4 V :4,5 V :5 V :5,5 V :6 V :6,5 V :7 V :7,5 V :8 Srie1

Superficies relatives

-Daprs le diagramme p 25, on peut par ex constater que la moyenne dch 4 napparat quune fois et que donc elle a une chance/25 dapparatre(4%). -Quant au diagramme p 26, la courbe dessine reprsente la liaison des sommets des btons du diagramme p 25 . Elle est appele DENSITE DE PROBABILITE et sa surface est gale 1.

6 5 4 3 2 1 0 V :4 V :4,5 V :5 V :5,5 V :6 V :6,5 V :7 V :7,5 V :8 Srie1

-Pour un chantillonnage sans biais, la moyenne de la pop est gale :

E (x s ) = p(s )(x s )

cest la somme des produits de la probabilits des moyennes dch=la somme des produits de la proba des moyennes dch( esprance mathmatique). -Rem : Sachant que la moyenne de pop est 6,si on prenait un chantillon dont la valeur de la moyenne serait comprise entre 6-0.75(5.25) et 6+0.75 (6.75), on aurait un proba de 52%. -Lorsquon que N>100 et que lch a plus de 30 lments, les moyennes dchantillon suivent une courbe normale ou de Gauss( distribution normale).=> on peut faire certaines prvisions mathmatiques rien quen interprtant la courbe normale. On va utiliser la notion dcart-type des moyennes des chantillons(ce nest pas lcart-type de la pop !)
La courbe normale (courbe de Gauss) :

-Quand on regarde la courbe normale, on constate que 68.26% de sa surface( ce rapport est tjs le mme) correspond aux moyennes dch dont la valeur est comprise entre : la moyenne+ou-lcart-type des moyennes dchantillons. -Lcart-type des moyennes dchantillon est facile calculer partir des valeurs de lch. Si n>30, lcart-type des moy dch est gal :

Sx n
Rcapitulons : 1On recherche la moyenne et lcart-type de lchantillon 2En utilisant les rsultats sur lchantillon, on peut dire avec 68.26% de certitude que la moyenne de la population se trouve e ntre :

x
et avec 95% de certitude entre :

x 2
La table des valeurs de z (chantillon>30)

On a vu que lintervalle estim pour la moyenne dune population donne des limites de variation de la valeur de avec un degr spcifique de certitude : 68.26 % 95.00 % Il est possible de choisir le degr de certitude ; Il existe des tables de bases sur les superficies des diverses sections de la courbe normale. Ces tables (table de valeurs de z) permettent de calculer une marge pour avec le degr de certitude voulu. ( en socio, le degr de certitude est de 95%) . Procdure dutilisation des tables de z pour calculer la marge de 1.On se fixe un degr de certitude. 2.On cherche dans la table la valeur correspondante de z. 3.Un fois quon a z, on utilise la formule suivant pour prvoir la marge pour :

=x

Remarque: dans le cas dun chantillon important, on constate que Sx est trs proche de lcart-type de la population.

Estimation dune proportion

Approche intuitive Dans le cas de proportions

1.Supposons que lon pose une question laquelle on ne peut rpondre que oui ou non .Disons que 60% de la population rpond oui ( proportion p) et 40% non (proportion q) 2.Si on interroge quun seule personne, la proba quelle dise oui est 60% et quelle dise non est de 40%. 3. Mme chose si on interroge une deuxime personne.

P(E1 E 2 ) = P(E1 ) P(E 2 ); P(E1 E 2 ) = P(E1 ) P(E 2 ) + P(E 2 ) P(E1 )


Aprs 2 personnes, on pourra obtenir : -Soit 2 oui -Soit 2 non -Soit un non et un oui 4.Daprs les valeurs de p et de q, il est possible de calculer la proba davoir deux oui(36%), deux non(16%) et un non et un oui(48%). 5. ON peut calculer la proba pour 3,5 ou 1000 personnes. Calcul : P(p,p,q) = (60%*60%*40%) + (60%*40%*60%) + (40%*60%*60%) = 43.2% Plus le rsultat est proche de la proportion(si on a 1000 pers p.ex avoir 600 oui et 400 non ) relle plus sa proba est grande. (voir graphe p 33) Rem : Il est possible de gnraliser les calculs nimporte quel % de oui et de non et nimporte quel chantillon. -Lorsque la taille de lchantillon est grande et la valeur p pas trop proche de 0 ou de 100%, la rpartition obtenue est proche de la distribution normale (LaPlace-Gauss). Approche statistique -Rappel : la marge estime pour la moyenne dune population :
2 ( ) x x i

xz

Sx n

=xz

n 1 n

-Pour une proportion P, la marge estime=

pz

pq n

= pz

pq n

-Ltude dun pourcentage nest quun cas particulier de lestimation dune moyenne. -Il suffit de construire le caractre numrique X dont les valeurs Xi sont 0 ou 1 selon que Ui est absent ou prsent dans la catgorie considre.

-Les Ui sont les units U1,Un de la population deffectif N. -On a :

1 N P = X P =
-On note :

xi = 0

xi = 1 si U i C (catgorie)
si

U i C (hors de la catgorie)

-Exemple : 6 units appartiennent la catgorie et 4 pas. -x1,x6=1 et x7,x10=0 X :6/10=0.6 et P=6/10=0.6 -Lcart-type est de Sqrt(0.24)=0.49 si on regarde la dmonstration suivante, on saperoit bel et bien que lestimation dun pourcentage est un cas particulier de lestimation dune moyenne. EN SYNTHESE ON A : -Pour une moyenne :

=xz
-Pour une proportion :

Sx n

P= pz
-Etant donn que

pq n

X =P 1 P = i X i N

= =

1 2 ( ) X X = i n 1 Xi X 2 N

1 X i2 X 2 N

= P P2 = P(1 P ) = PQ pq n

P= pz

pq est appel lerreur type E de la distribution n

- Comme E=

pq n

-Pour que E diminue, il faut que le nombre n de personnes augmente mais comme E varie comme 1/ Sqrt(n),il faut quadrupler la taille de lch pour diminuer lerreur de moiti (voir ex. p 37). - Lerreur est inversment proportionnelle la taille de lch -Lorsque la taille de lch est donne, E varie suivant la valeur de p et atteint son max pour p= 0.5. La taille de lchantillon -Relatif la taille de lchantillon -Supposons quon veuille prlever un chantillon dont lintervalle de confiance nexcde pas + ou 5% au niveau de proba 95% ou .95. On met aussi lhypothse que les sujets se rpartissent selon une proportion 50/50 -Pour trouver la taille de lchantillon :

5=2(ou 1.96)* Sqrt((50*50)/X) 25= 4*2500/X=10000/X X=10000/25=400

Rem : Ds le cas dune population nombreuse, la prcision du sondage dpend seulement de leffectif de lchantillon et pas du taux de sondage( rapport entre les individus qui composent lchantillon et leffectif de la population).
10

n = f N
-Ce nest plus vrai quand : *Lchantillon est extrait dun ensemble faible effectif(chantillon de 100 personnes ds une population de 300) *Lchantillon reprsente une forte proportion de la population(2000 pers ds une pop de 3000 pers). Si on suppose que lch de n units est tir dun seul coup(tirage de n boules successive ds une urne qui en contient N, en ne remettant pas la boule tire aprs chaque tirage). -Dans une tirage ss remise, lcart-types des moyennes dchantillon est gal :

N n N 1

S
ou

1 f

et non

Sx n

tirage avec remise)

Rem : ds le cas du tirage ss remise o N est petit ou/et o n est important par rapport N, il faut tenir compte du rapport :

N n N 1

ou

1 f
S

(voir

ex p 39)

-Ds les sondages raliss pratiquement, N est grand et N-1 peut tre remplac par N ds la formule
x

N n N 1
N n est proche de 1. N 1

Dautre part n peut tre nglig cot de N puisque

x N n => n N 1 n sauf quand la pop est faible effectif et/ou lchantillon important par rapport la pop dans le cas dun tirage sans remise. La taille donner pour lchantillon est fonction des partitions prvues pour lanalyse des rsultats(lire fin p40).

=>

11

Ch 3. Le tirage de lchantillon
A. Mthodes de tirage, vue densemble ; On distingue 2 grandes familles de mthodes de tirage : 1. mthodes alatoires, 2. mthodes empiriques ou choix raisonn. La mthode est dite alatoire quand toute unit de la population a une probabilit non nulle et connue dappartenir lchantillon. Il existe des plans de tirage pour les mthodes alatoires ; Simples : le plan de tirage concerne la population considre comme un tout. plusieurs degrs : on rparti la population en sous-ensembles appels units primaires. Cas particulier dchantillonnage plusieurs degrs ; On tire un chantillon dans toute les units primaires (stratification). On tire un chantillon dunits primaires quon explore totalement, (sondage en grappes). Les tirages peuvent tre : probabilit gale ou ingales, Avec ou sans remise. schmas rcapitulatifs P. 42 du syllabus B. Les chantillons alatoires ou probabilistes. Dfinitions ; Le hasard interviens dans la dsignation des units statistiques, on parle de hasard statistique . la procdure du choix au hasard correspond au cas ou les units statistiques ont une probabilit gale dtre slectionne. Un chantillon est dit reprsentatif si les units qui le constituent ont t choisies par un procd tel que tous les membres de la population ont la mme probabilit de faire partie de lchantillon. Lunit de sondage est llment sur lequel porte le tirage au sort. Lunit statistique est llment susceptible dtre interrog. Units statistiques et units de sondage se confondent dans les chantillons simples au hasard ou par stratification. Elles sont distinctes dans les chantillons par grappes ou par degr, autre que la stratification. Le tirage peut se faire avec ou sans remises, les rsultats sont trs peut diffrents si la taille de lchantillon est faible par rapport a la population parente. *cf. : proche de 1.

La base de sondage ; liste sans omissions ni rptitions de toutes les units de sondage. Techniques de prlvement de lchantillon alatoire. Tirage simple ou au hasard ; La mthode consiste extraire directement de la base de sondage les units statistiques qui vont constituer lchantillon, chacune dentre elles ayant ici la mme probabilit dy figurer. Mthode lmentaire Tirage au sort dans lurne de Bernouilli, procdure ; On numrote les units de sondage de 1 N compltement,

12

On numrote de la mme faon N boules ou papiers que lon place dans lurne, La taille de lchantillon choisie, on tire N papiers ou boules de lurne et on note leur numro. Les lments correspondants aux N numros sortis constituent lchantillon. Si on remet la boule dans lurne chaque tirage, on obtiens un tirage indpendant, la mme unit de sondage peut figurer plusieurs fois dans lchantillon ; sans remise on a des tirages exhaustifs, la mme unit ne pouvant figurer quune fois dans lchantillon. En pratique on utilise une table de nombre alatoires ou on recours des tirages systmatiques. Table de nombre alatoires Des chercheurs ont procd a des milliers de tirages indpendants de nombres compris entre 1 et 10.000 ou 100.000 et en ont publi les rsultats sous le nom de table de nombres alatoires. Noms : table de Tippett (4 chiffres), table de Fisher et Yates (2 chiffres), p. 45 Extrait de la table de Kendall page 46 du syllabus. La table de nombres alatoires sutilise comme a ; On a besoin de nombres compris entre 1 et N, on relve dans la table en commenant ou on veut en lisant dans une colonne ou une mme ligne (ou en diagonale) mais en conservant toujours la mme faon de faire, la mme rgle, N nombre de chiffres en liminant les nombres suprieurs N. On interroge ensuite les personnes dsignes par le sort lexclusion de tous les autres. Le tirage dun chantillon par cette mthode lmentaire risque dtre long, pour pallier a, on procde au tirage systmatique. Tirage systmatique On peut utiliser le tirage systmatique si on est sur que la base de sondage est construite dans un ordre alatoire ou dans un ordre indiffrent quant aux caractristiques de la population retenue pour lenqute. Le tirage systmatique permet de gagner de prcision si on connat une variable auxiliaire corrle la variable dintrt. (exp., la consommation moyenne des mnages et leur taille). Le tirage systmatique consiste prendre pour units-chantillons les n units dont les rangs sont en progression arithmtique ( r ) partir dune unit prise pour base de cette progression ( b ). Cas ou on se donne la taille de lchantillon ; La raison r de la progression arithmtique est fonction de la taille de lchantillon dsir et du nombre dunits N de la base de sondage. On prends comme raison ( r ) le quotient de la division N / (n-1) Le rang de lunit de base est un nombre alatoire infrieur ou gal au reste de cette division.

Exemple : on veut tirer au sort 12 mnages dune commune parmis les 378 mnages que compte la commune.
Raison arithmtique : r = N / (n-1) = 378 / (12 1) = 34,36 Le reste est 4, on prends 34 comme raison de la progression et comme base un nombre alatoire infrieur ou gal 4.

Si ce nombre alatoire est pe 2, lchantillon comprends alors les units de rangs : 2, 36, 70, 104, 138, 172, 206, 240, 274, 308, 342, 376. Les 12 mnages portant ce numro constitueront lchantillon. Cas ou on se donne le taux de sondage
Si on se donne le taux de sondage, f = 1 / K qui nest autre que n / N , soit le rapport entre la taille de lchantillon et la taille de la population, on peut se ramener au problme prcdent en calculant n = N / K nombres dunits tirer. On dtermine alors comme prcdemment la raison et la base de progression.

13

Exemple : nous donnons comme taux de sondage 1 / 15, le nombre dunits tirer si la population de mnages est toujours de 378 est
n = 378 / 15 = 25.2 +/-25 r = N / (n-1) = 378 / 24 = 15, 18 on prends comme raison de progression arithmtique 15 et comme base un nombre >= 18. Il est plus commode, en pratique, de prendre linverse du taux de sondage f = 1 / K , tant gnralement un chiffre rond (10, 20, 50). On prends cet inverse K pour raison de la progression, ce qui facilite le tirage. Remarques ; Le sondage systmatique est assimilable un sondage alatoire, condition que la base de la progression arithmtique soit dtermine par tirage au sort. Avec des chantillons de mme taille, la variance de lestimation sera de mme ordre lorsque le rangement des units dans le fichier peut tre considre comme alatoire. Le sondage systmatique est mme plus efficace que le sondage ralis par la mthode lmentaire lorsque les units qui occupent des rangs voisins dans la base de sondage auront tendance se ressembler ( pe, voisins) Le sondage systmatique est moins efficace si la variable tudie prsente dans la base de sondage des variations priodiques et surtout si la priode de ces variations est un multiple de la raison de la progression arithmtique. La mthode de tirage systmatique est simple programmer. La mthode est applicable quand on ne connais pas priori la taille N de la population.

Le tirage par chiffre terminal


On suppose que les units de la base de sondage sont numrotes de 1 N. Pour tirer 20% des units, on choisi tous les lments portant un numro qui se termine pe par 2 ou par 9, pour retirer 40% on retiens 4 chiffres. Le tirage par lettre et le tirage par dates de naissance On retiens dans lensemble de la population toutes les personnes dont le nom de famille commence par une lettre dtermine ou toutes les personnes qui sont nes un jour dtermin. Ce type de tirage se base sur lhypothse quil nexiste aucun lien entre dune part les premires lettres du nom ou la date de naissance et dautre part les caractristiques tudies. Le tirage par algorithmes Il existe des algorithmes de gnration de nombre alatoire selon une loi uniforme (ou les units ont la mme probabilit dtre tire). a se trouve sur des logiciels comme SAS, ISML ou SPSS. Exemple de lignes de commande SAS p. 52

Remarques :
Des catgories non reprsentes dans la base de sondage peuvent tre incluses dans lchantillon si on peut les rattacher une des units tires. Mme si on ne retrouve pas les proportions relles de chaque catgorie, telles quelles existent dans la population parent, un chantillon alatoire assure de lui mme la reprsentativit. Lchantillon alatoire est en principe meilleur car obtenu par le procd le plus rigoureux, mais il faut disposer de la base de sondage.

Cas particuliers de sondage par degrs Le tirage stratifi Le tirage se fait aprs la stratification de la base de sondage, la procdure implique une classification de la population en sous-strates ; le choix au hasard des units de sondage se fait alors sparment pour chaque strates. Lchantillon est compos dautant de sous chantillons quil y a de strates dans la population parente.

14

La stratification de la base de sondage correspond lide intuitive quavant de remplacer lunivers observer par un simple chantillon, il serai indiqu de constituer dans cet univers des groupes homognes ou des groupes plus homognes que lunivers entier et de tirer un chantillon dans chacun de ces groupes de faon obtenir un chantillon global plus reprsentatif de lensemble. Exemple : on ralise un sondage dans une population dentreprises avec 100 grosses et 20.000 petites, la slection alatoire au sein de la population mre risque de ne fournir aucune unit de la catgorie grosse. Pour tre sur den avoir un dans lchantillon, on va constituer 2 groupes dans lunivers. Celui des 100 grosses entreprises, Celui des 20.000 petites entreprises.

Et on va tirer dans chacun deux un chantillon au 1/100 qui nous donnera dans lchantillon une grosse entreprise et 200 petites.
De cette faon, le taux de sondage reste identique dans les 2 strates. On peut dcider de choisir un taux de sondage diffrent dans chaque strate pour assurer la reprsentation des sous groupes, mais dans ce cas, les rsultats densemble devront tre pondrs au niveau des individus ou des strates pour rtablir la structure initiale. Avantages de la stratification ; Permet dobtenir des chantillons suffisants pour une analyse approfondie de chaque strate, elle est utile quand les facteurs explicatifs sont diffrents dans chaque strates, Permet une meilleure estimation de certaines grandeurs quand on prends des taux de sondage diffrent, Elle facilite les comparaisons entre groupes. Dcoupage de lunivers en strates ; Les strates peuvent se dfinir soit : Par la liste des units qui en font partie, chaque unit figure dans une strate, En choisissant un critre de contrle (qualitatif ou quantitatif) Dtermination du nombre de strates ; On peut faire, en thorie autant de strates que le permet leffectif de lchantillon, mais lchantillon doit tre suffisant dans chaque strates pour en estimer correctement la variance, et le gain apport par une sous stratification deviens vite ngligeable et ne se justifie plus devant les complication de calcul quelle entrane. Le tirage par grappes Une grappe est en ensemble dunits statistiques ayant entre elles un lien naturel. (ouvriers dune entreprise, mnages dune commune, ). La base de sondage dans ce cas est la liste des grappes de sujets ; les grappes sont les units de sondage, elles sont tires au hasard et on interroge tous les lments de la grappe. Cependant, les grappes doivent respecter des conditions ; La grappe ne doit pas tre trop importante pour pouvoir en tirer un nombre suffisamment grand pour que la loi des grands nombres sapplique, Les grappes doivent tre de taille aussi gale que possible, Du point de vue du caractre observ, chaque grappe doit tre aussi htrogne que possible. (pour viter leffet de grappe) Exemple deffet de grappe ;

Les membres dun mme mnage ont plus de chances de lire le mme journal que des individus pris isolment.
Le sondage arolaire Variante du sondage par grappes, les units statistiques (grappes) tires au sort sont des aires gographiques clairement dlimites. Cas particulier ; la mthode de KISH Le tirage dun chantillon dindividus adultes partir dun rpertoire des mnages ou des logements. La mthode pourrait consister tirer un chantillon des mnages et soumettre lenqute tous les adultes des mnages chantillons, mais la mthode est contre

15

indique si la nature de lenqute fait craindre de trop grandes ressemblances entre les individus dune mme grappe. (influences) La meilleure mthode est de procder un tirage deux degrs ; Tirer un chantillon de mnages, Dresser une liste des adultes de chaque mnages-chantillon, Tirer au sort dans cette liste un adulte.

La mthode de Kish
Mthode de tirage dun individu par mnage qui prsente un certain caractre automatique. Son principe postule que les mnages de plus de 6 adultes sont trs rares. On tablis 6 types de questionnaires dsigns par les lettres A, B, C, D, E, F qui ne diffrent que par le tableau de dsignation de ladulte interroger dont il va tre question. Chaque questionnaire comporte un tableau qui permet de dresser, au cours dune premire partie dinterview, la liste des personnes adultes du mnage en commenant par les adultes de sexe masculin et en classant dans chaque sexe les adultes dans lordre des ges dcroissant. Lenquteur attribue chacun des adultes un numro dans lordre de la liste en commenant par le plus g. Sondage plusieurs degrs (cas gnral) On a vu que lorsque lon tire un chantillon de grappes, il est contre indiqu (effet de grappes) dinterroger toutes les units constituant chacune des grappes. Lenqute peut alors tre limite quelques units tires au sort dans chaque grappe-chantillon, on a alors un sondage deux degrs ; Les grappes constituent des units primaires de sondage, Les lments constituant la grappe sont les units secondaires.

Avantages du tirage plusieurs degrs


Il nest ncessaire que de dresser la liste des units primaires de sondage, ce qui est plus facile que les units secondaires de la population. a simplifie lenqute et rduit son cot, mais il faut avoir un nombre suffisant dunits primaires car plus le nombre dunits primaires est grand, plus lchantillon sera prcis ; mme si en principe on est libre de fixer arbitrairement le nombre des units primaires et le nombre dunits secondaires par units primaires.

Modalits pratiques du tirage dun chantillon 2 degrs


Le principe est que chacune des units secondaires doit avoir la mme probabilit de figurer dans lchantillon. Il y deux mthodes ; Premire mthode On tire n units primaires avec des chances gales, ensuite on tire les units secondaires avec des chances gales dans les units primaires. Cette mthode donne des rsultats imprcis lorsque la taille des units primaires est trs variable. Deuxime mthode On tire n units primaires en donnant chacune une chance de sortie proportionnelle au nombre des units secondaires quelle contient ; ensuite on tire m units secondaires dans chacune des units primaires chantillons. Dans cette mthode, le nombre dunits secondaires est identique pour chaque unit primaire. Soit ; n nombre dunits primaires dans lchantillon, m nombre dunits secondaires dans chacune des units primaires-chantillons. Si N est le nombre total des units secondaires dans la population il faut vrifier que chacune a bien la mme probabilit de figurer dans lchantillon.

C. Les chantillons empiriques ou par choix raisonn ;

16

La mthode des quotas ; Principe Ce procd tente de construire un chantillon qui ressemble la population parente sur base dinformations statistiques sur la structure de cette population le principe de cette mthode est que un chantillon identique la population dans laquelle il est prlev, pour ce qui est de la rpartition de certains caractres importants (sexe, niveau dtude, ), sera peut diffrent pour ce qui est dautres caractres. (religion, avis sur IVG) On postule pour la non-indpendance des diffrents caractres entre eux. Les premiers caractres sont appels variables de contrle et les seconds variables noncontrles . Quand lutilise ton ? La mthode des quotas est utilise quand ; Quand on na pas de base de sondage, Quand il y a des difficults pratiques la mise en uvre des mthodes alatoires. On utilise gnralement cette mthode car elle est moins coteuse. Pratique Il faut disposer de sources documentaires utilisables et rcentes pour dterminer les quotas. Le plan dchantillonnage, reproduisant les distributions releves dans les statistiques, pour un chantillon de taille donne, le nombre dindividus de chaque catgorie interroger. Il y a deux faon de constituer les quotas ; De faon indpendante ; exp., si les quotas portent sur lge et le sexe, on fixe indpendamment les proportions dhommes et de femmes et les proportions entre les classes dges en esprant que la rpartition des hommes et des femmes correspondra a la rpartition de la population. En croisant les critres ; en pratique le nombre de critres est limit (5 quotas est le maximum)et on ne croise les critres que si on peut craindre une distorsion.

Lenquteur peut interroger qui il veut si il respecte les quotas, mais chaque unit de la population doit avoir les mmes chances de figurer dans lchantillon. Lenquteur doit alors respecter des consignes comme : Linterdiction dinterroger des personnes se connaissant ou connaissant lenquteur ou lobligation dune certaine dispersion gographique, La qualit dun chantillon par quota dpends de la manire dont les enquteurs cherchent les sujets et entrent en contact avec eux ; le porte porte semble tre une bonne mthode car lenquteur nest pas influenc par laspect du sujet. Mais cette mthode nexclu pas les biais temporels ou autres La mthode des quotas implique 4 conditions ; Connatre la distribution de quelques caractristiques simples dans la population, Ces caractristiques doivent tre faciles connatre pour lchantillon, Les variables de contrle doivent avoir quelque chose a voir avec lhypothse de lenqute, Les quotas doivent tre fixs de faon corriger les distorsions dues au fait que certaines catgories de la population sont plus accessibles que dautres. Avantages des quotas ; 1. la mthode est toujours applicable, 2. mthode moins onreuse. Inconvnients des quotas ;

17

1. lchantillonnage par quotas ne permet pas davoir des chantillons alatoires car il ny a pas de modles probabilistes des choix des enquteurs et les contraintes sont imposes, 2. le respect des quotas ne garanti pas labsence de biais systmatiques, 3. le respect des quotas ne garantis pas le respect de lchantillonnage spatial et temporel par les enquteurs, 4. le respect des quotas ne garantis pas une forte proportion de refus de rponse et cette proportion reste inconnue. La mthode des quotas peut tre associe un chantillonnage alatoire dans le cas de lchantillonnage plusieurs degrs. La mthode des itinraires (ou mthode de POLITZ) Le choix de lchantillon est fait sur le terrain, des rgles sont donnes lenquteur concernant son itinraire, la dsignation des logements visiter et la dsignation des personnes interroger. On rintroduis le hasard en liminant linfluence perturbatrice des prfrences de lenquteur. Mais il nest pas possible de mesurer la prcision dune tel chantillon car il sagit dun hasard thtique, on ne connais pas pour toutes les units la probabilit dtre interroges. Lchantillonnage sur place ; Ce nest possible que pour des catgories relativement importantes en volume, sinon lchantillon de la population est trop lev ou le nombre de contacts ncessaires pour constituer lchantillon est trop lev. On peut sappuyer sur le fait que certaines personnes se rencontrent dans des endroits particuliers. Il est possible de constituer un chantillon correct, en se rendant dans de tels lieux et en procdant sur place un tirage au sort parmis les personnes prsentes. La mthode nest pas dpourvue de biais ; On ne peut se placer a un seul endroit, il faut commencer par constituer un chantillonnage reprsentatif ou raisonn comprenant une varit suffisante de cas, cest lchantillonnage spatial. Il faudra effectuer lenqute des moments divers ou choisir ces moments par tirage au sort ou par choix raisonn, cest lchantillonnage temporel. Lchantillonnage spatial et temporel permet dviter un certain nombre e biais, mais ils nassurent pas ncessairement un chantillon reprsentatif.lchantillonnage sur place se heurte aussi a des difficults pratiques (autorisations de se poster un endroit) et les personnes abordes nont pas beaucoup de temps, il faut alors rduire au maximum le questionnaire. (5/7 question maximum).

D . La pondration ou le redressement de lchantillon. Il sagit du calage des chantillons sur des donnes de recensement, ce calage amliore la qualit des estimateurs. Les estimateurs sont les

18

statistiques calcules partir de lchantillon, ils ne servent qu se faire une bonne ide des paramtres de la population. La pondration ne permet pas de rcuprer des rsultats issus dun mauvais plan de sondage ; un mauvais plan tant celui ou des groupes importants dindividus ont une probabilit dinclusion nulle. Pe : dans un sondage par tlphone, le fait davoir ou non le tlphone ne doit avoir aucune incidence sur la variable tudie, sinon le plan de sondage est foireux. E. Quelle mthode choisir ? Il y a une controverse rcurrente entre les adeptes de la mthode alatoire (statisticiens, universitaires) et les adeptes de la mthode du sondage empirique (instituts de sondages et marketing). La mthode des quotas ne permet pas de mesurer les risques dans les estimations parce que l on ne peut utiliser le calcul des probabilits, cest son dfaut majeur. Ici, il y a un risque de sur reprsentation des sujets facilement accessibles. La mthode probabiliste est souvent juge de trop lourde, lente et coteuse, mais cest le risque de non rponse qui risque de ruiner la mthode. Finalement, lexprience acquise a permis daffiner les diffrentes mthodes ; Introduction de rgles alatoires de choix des enquts dans lchantillonnage proportionnel, Pondration des quotas pour amliorer la reprsentativit de certains sous-groupes, Procdures de redressement des chantillons probabilistes lacunaires, leffacement de ces controverses viens de linterpntration croissante des procdures probabilistes ou empiriques dans les plans dchantillonnages complexes. Remarques ; Il ne faut pas confondre biais systmatiques avec erreur dchantillonnage. Lerreur dchantillonnage est lie lcart toujours possible entre les caractristiques de lchantillon et celles de la population dont il est extrait. Lerreur non-systmatique peut tre estime ou rduite, le biais systmatique fausse toujours les rsultats dans la mme direction, ils sont ignors par les techniques statistiques. Lentretient non-directif ncessite moins de sujets a interroger pour avoir linformation ncessaire mais les biais sont aussi possibles (laisance verbale).

Ch 4. La Rdaction du questionnaire
Nature du questionnaire - Objectifs et passation.

19

Trois catgorise de donnes ; 1. les donnes factuelles : domaine personnel, environnement, comportement des individus. 2. jugement subjectif sur des faits, vnements, ides : il peut sagir dopinions - dattitudes - de motivations, dattentes, de prfrences. 3. des cognitions : des incdices de connaissance de divers objets tudis par lenqute. Trois types de questions ; 1. question de fait 2. question dopinion 3. question de connaissance. La distinction est malaise, en particulier quand il sagit de faits, il faut savoir si on sintresse aux faits objectifs ou la connaissance, la reprsentation qune ont les sujets de lenqute. La question de fait : fait unique ou rptitif ? Exactitude des questions de fait. viter les oublis et dformations (erreurs de mmoire) conduisant a une sur/ sous estimation de la frquence. Il faut dlimiter un priode sur laquelle porte le questionnaire. Influence de la dure dobservation, exemple de frquentation du cin et du thatre. Priode courte : (une semaine) relation ngative entre les 2 types de frquentation. Priode longue : (qqes mois) la relation deviens positive. Trois objectifs possibles au questionnaire ; 1. Estimer certaines grandeurs absolues ou relatives :dpences au cours dune priode) 2. Dcrire une population ou des sous populations : lecteurs dun tel parti 3. vrifier des hypothses sous la forme de relations entre 2 ou plusieurs variables : sentiment dappartenance diminue avec lage ? Conditions de passation du questionnaire ; 2 sortes de questionnaires : administration directe : enqut rponds seul administration indirecte : enquteur intermdiaire On pratique lauto administration lorsque le nombre de personnes a interroger est lev, si on sais que les personnes interroges sont capables de rpondre, et si le questionnaire suscite lintrt de la personne. 3modes dadministration ; Par correspondance ( infos technique explicites required) Entretient face face Entretient par tlphone ( temps rduit, on se grouille et pas bcp de questions)

20

Ebauche du questionnaire Trois conditions ; 1. Savoir prcisment ce que lon cherche 2. aborder le sujet sous ses diffrents angles 3. filtrer les personnes a intrroger ( avez vous entendu parler de X, si oui, quen pensez vous ?) Approche qualitative ; La mthode qualitative permet daborder un problme alors que lon a peut dinformations de peut dhypothses. Cela nous permet de comprendre comment le problme se pose pour la population intrese. Recherches pralables ; Processus : 1. dpouillement de la documentation ( chercher tt sur le sujet) 2. runion, discution de groupe (brain storming) 3. interview dexperts et de groupe.

Forme de questions I. Questions fermes ; question pour laquelle les rponces sont fixes a lavance par la personne qui interroge, les modalits de rponces sont prdfinies par cette personne. Le rpondant doit imprativement choisir dans lventail de rponces proposes . Les rponces se prsentent sous diffrentes formes : chelle de rponces gradues , choix dans une liste, classement des lments dune liste. Les chelles de rponces comportent des degrs chelonns : bipolaire : (pas du tout dac pas dac dac tout a fait dac) unipolaire : (jamais rarement de tps en tps souvent trs souvent) une fois la liste tablie il faut tablir les consignes de rponces (un ou +ieurs choix ?) Problmes lis a ces diffrentes formes ; Rponces dichotomiques : est ce que les alternatives proposes ne forcent elles pas le choix ? chelles bipolaires : lchelle bipolaire impose un choix engag, inconfortable. chelles de rponces : choix importants (nombre dintervalles, label verbal accord aux chelons, existence ou non dun point mdian) Liste ditems : il faut couvrir la totalit des choix possibles Modalits dabstention Ces modalits permettent dviter le choix ou la prise de position force. On peut reprocher aux questions fermes de crer les rponces soit parce que les personnes ny avai jamais envisag la question pose ou quils
21

ne lavaient pas envisag sous cet angle. Dans ces 2 cas, lenquteur nenregistre que une prise de position provoque artificiellement. La modalit de non rponce est a prvoir pour les questions dlicates, apportant une indications sur les ractions que suscite la question. Avantages des questions fermes : 1. dpouillement facile et pas de problmes dinterprtation, 2. les questions sont faciles et lenqut peut y rpondre facilement, 3. elles garantissent un certain anonymat
4. elles peuvent servir de filtres pour rpartir les rpondants (est ce que X ? si oui alors est ce que ?)

Inconvnient des questions fermes ; 1. danger de suggrer ou de dicter la rponce, 2. elle receuille des informations restreintes et limites. Modalits de passation ; Lenquteur doit poser les questions sans adaptation ni explications, pour que les informations soient comparables statistiquement. Lenquteru demande au sujet de qualifier la liste ditems comme le veulent les consignes. Voir page 92 II. Questions ouvertes ; Dfiniton : La queston ouverte est celle pour laquelle la rponce nest pas prvue et linterrog exprime ce quil veut avec ses propres mots. Elle est ouverte parce que elle autorise une multitude de rponces diffrentes. Modalits de rponce Emplacement rserv. Avantages de la question ouverte 1. le contenu des rponces est riche et vari, 2. les rponces sont mois contraintes, plus proches de lindividu qui les dbite, elles ont plus de valeur expressive, 3. les rponces aux questions ouvertes peuvent fournir un cadre de rfrence pour comprendre des rponces a dautres questions, 4. elles sont un bon moyen de constituer un bon ventail des rponces possibles, 5. sont plus aptes a dceler les opinions ambivalentes et peut structures. Inconvnients de la question ouverte 1. problmes de standardisation ; problmes au niveau de la passation et de lenregistrement. Lors de la passation, un enquteur attirera plus de confidences que dautres. 2. le rendement de la question ouverte est dpendant des capacits verbales et relationelles du sujet, aussi de sa motivation. 3. lenqut risque de ne pas donner les informations qui leurs semblent trop videntes, 4. le dpouillement de donnes qualitatives impose un codage a postriori qui est plus malais. La question ouverte est particulirement indique pour : prparer des questions sur un thme peu familier, les enqutes auprs de tmoins privillgis. Mais la question ouverte est a viter pour les chantillons trop grands.

22

III. Questions semi-fermes ; Ce sont des questions fermes qui laissent la passibilit dajouter des rponces libres en dehors de lventail propos ( ? caftria). Ces questions facilitent le dpouillement et permettent denregistrer les rponces des enquts marginaux, atypiques, mieux informs, Formulation des questions Le libell affecte la rponce ; Exemple : avril 1986, les USA lancent une expdition contre le colonel Kadhafi, comment ragis lopinion franaise ? 3 sondages raliss entre le 15 et le 19 avril 1986 donnent des informations contradictoires. Louis Harris demande : vous savez que laviation US bombard les villes lybienne de de Tripoli et de Benghazi, approuvez vous ou dsaprouvez vous ces actions ? 31% ok - 43% no ok Faits et opinion demande : approuvez vous ou dsapprouvez vous laction US contre Kadhafi ? 59% ok - 35% no ok. Analyse : la mauvaise rputation de Kadhafi en France lemporte sur la connaissance de la Lybie. Trois rgles gnrales ; 1. Le vocabulaire doit tre simple : le rdacteur du questionnaire risquera dutiliser un vocabulaire inhabituel ou artificiellement simplifi. Le danger rside aussi dans le fait que lenquteur est mieux inform que le sujet. 2. La question doit tre comprise de la mme faon pour tous : il faut au maximum viter les termes vagues (souvent, parfois), quand cest possible, il vaut mieu demander des estimations numriques ou de proposer des chelles de frquences. lemploi de termes ambigus peut tre utilis pour savoir comment cette frquence est ressentie. 3. il ne faut pas formuler de questions considrant certains prsupposs : lutilisation de prsupposs peut tre vu comme manipulation (volontaire ou involontaire) Le libell des questions : 7 rgles 1. il faut veiller a la structure logique de la question. (viter les ngations et les doubles ngations), 2. il faut viter quune mme rponce puisse tre donne pour des raisons trop diffrentes, 3. ne pas introduire 2 ides dans la mme question, 4. viter les questions qui argumentent, 5. viter les termes chargs daffectivit, jugements de valeur, modifiant le sens de la question et des rponces, 6. sassurer au pralable que la liste couvre bien toutes les positions possibles, 7. le libell de la question ne dois pas suggrer la rponce. Exemples de libell possible, les questions dopinion ;

23

La forme des questions et des rponces : les formes les plus souvent utilises sont : On voque un opinion en la prcdant de on dis souvent que . (exemple : parfois on entends dire que les sociologues sont indispensable la bonne marche de lentreprise : tes vous daccord pas daccord) On prsente la mme opinion sous forme de question, la rponce est oui ou non ; ( exemple : selon vous, le sociologue est il important a la bonne marche de lentreprise ?) On propose plusieurs opinions sur le mme thme et on demande a la personne laquelle leur correspond le mieux. On peut demander a la personne de choisir une ou plusieurs rponces. On peut demander aussi quils ordonnent les rponces. Le problme des rponces : les raisond de la dformation des rponces par lenqut. La raction de prestige ; Par peur dtre mal jug, le rpondant adopte un comportement faade . Cela se traduit par : Attnuation des opinions, Simulation, Lemploi de strotypes, La conformit aux attentes normatives. Lenqut donne les rponces socialement dsirables . Pour pallier a ces distortions, il faut Veiller formuler les questions ce quelle suscite moins cette raction de prestige, Construire des chelles valuant limportance de la faade et de la simullation. La contraction dfensive la question personalise ; Souvent le rpondant craint que sa rponce soit utilise contre lui, jugeant la question trop dlicate ou personnelle, cela se traduit dans des refus de rponces ou des fuites vers les rponces refuge (sans opinion). Pour viter le refus ou les rponces refuge, il faut : Ne pas commencer le questionnaire par des questions susceptible de le provoquer, Ne pas personnaliser la question quand le thme est dlicat, Utiliser autant que possible des questions indirectes.

Lattraction de la rponce positive ; Biais dacquiessement ou de positivit. De manire gnrale le rpondant prfrera dire oui que non, ce peut tre li au fait que le refus peut parfois apparatre comme un symptme de non intgration sociale, il y a donc

24

raction dans le sens de la conformit. Pour viter cet effet, il faut multiplier les modalits de rponces. (tout a fait ok-------------pas du tout ok) Lattraction ou le rejet des rfrences des personnalits ; Lintroduction de noms de personnalits peut provoquer des ractions didentification ou de rejet chez beaucoup de rpondants, surtout sils nont pas dopinion prcise sur le sujet trait. Bref dans la rdaction du questionnaire, il faut viter de provoquer chez les rpondants : 1. la crainte dtre mal jug, 2. le dsir de se conformer la norme sociale, 3. le refus de se laisser impliquer personnellement, 4. la suggestibilit au contenu des questions. Lconomie du questionnaire Lordre de succession des questions ; Exemple 1 : - Estimez vous souhaitable que lEtat contrle les prix des produits vendus aux consommateurs ? - Estimez vous souhaitable que lEtat exerce un contrle sur les licenciements dans les entreprises ? - Estimez vous souhaitable que lEtat exerce un contrle sur les risques de pollution de lenvironnement par les tablissments industriels ? Exemple 2 : - Avez vous le sentiment que lEtat fait bon usage des impots que vous versez ? - Selon vous, qui est le plus comptent pour fixer le niveau deffectif dune entreprise, ladministration ou le chef dentreprise ? - Des entreprises publiques ou des entreprises prives, lesquelles selon vous sont gres le plus efficacement ? Dans lexemple 1 les questions clairent sur le rle de ltat dans lconomie (rassurant), tandis que dans lexpemple 2 on parle de choses envers lesquelles se lancent volontiers toutes sortes danimosit. Le processus en cause chez les personnes interroges est ce que les psychologues sociaux appellent les structures cognitives shmatiques De faon gnrale, les questions peuvent se contaminer lune lautre par ce que lon appelle leffet de halo. Une question trop oriente ne biaisera pas que SA rponce. Le sujet se rfrant a une vue densemble gnrale plutot qua chaque critre sparment. Leffet de halo est daillerus renforc quand on demande en premier un jugement global.

Autres obstacles lconomie du questionnaire. 1. La dfiance lgard de la technique du questionnaire elle mme. Par peur de sengager, Par lassitude,

25

Pour raisons idologiques 2. La tentation du replis aux changements de thmes du questionnaire, 3. Lattrait de rponces dans les questions fermes bas sur leur position, on a observ que les rponces situes au dbut de la liste de choix bnficiaient dun attrait particulier, 4. La longueur et la complexit du questionnaire ; la longueur peut provoquer le dsintrt et la complexit peut entrainer des ractions de dsintrt, de refus ou de mauvaise humeur. Rgles observer pratiquement Questions a ne pas mettre en premier lieu ; Ne pas commencer le questionnaire par des questions ; 1. Pouvant provoquer des rponces faade (sauf si cest la rponce faade qui intresse), 2. Impliquant un engagement personnel du rpondant , 3. Provoquant des efforts particuliers de rflexion, 4. Traitant de problmes dlicats. Questions ne pas utiliser ; Ne pas utiliser de questions ; 1. abordant directement des thmes dlicats, 2. pouvant suggerer certainse rponces, 3. pouvant faire prfrer la rponce positive, 4. comportant des mots chargs affectivement, 5. comportant des noms de personnalits pouvant provoquer lidentification ou le rejet, 6. rdig dans un language compliqu, peu accessible, 7. trop longue. Conseils pratiques ; Veiller disperser les questions susceptible de faire un effet de halo, ce que le passage dun thme a lautre ou dune mthode dinterrogation a lautre ne provoque pas le retrait de la personne, ce que le questionnaire ne soit pas trop long, grouper les questions didentification ( les + dlicates la fin) commencer le questionnaire par des questions faciles, interlacer entre les groupes de questions dlicates des questions plus faciles, mnager les trasitions, donner au questionnaire un aspect cohrent, (on groupe les questions par thmes et les questions dordre gnral prcdent les questions prcises), prvoir des textes dintroductions et de liaison sur le questionnaire . Le questionnaire administr directement, sont accompagn dune lettre dintroduction prsentant lobjet de la recherche et tout le tralala, ce texte doit comprendre : 1. des indications sur le sujet trait,

26

2. des indications techniques (comment y f remplir) 3. des formules de politesse, encouragement, motivation, 4. des formules de prcaution (certifier la confidentialit,) La prsentation matrielle du questionnaire Maniable ; Facile lire ; Facile remplire ; Facile dpouiller ; Le pr-test du questionnaire Les points suivants sont tester : Toutes les questions sont elles comprises par tous de la mme faon et cette faon est elle bien celle escompte ? Les questions ne paraissent elles pas trop difficiles ? Les listes de choix proposs recouvrent ils toutes les rponces possibles ? Les questions sont elles bien acceptes par les sujets ? Les questions suivent elles un ordre cohrent ? Les sujets ragissent ils bien au questionnaire ?

CH5.Le traitement des donnes


Codage et encodage de linformation ; Le cadre de codage ; Dfinition ; le cadre de codage est un ensemble de rgles conventionnelles explicites, utilises comme base des classifications des observations faites propos des variables en terme de valeurs qui sont transforme en chiffre. Deux principes gnraux ; Le codage des catgories doit tre mutuellement exclusif, Le codage des catgories doit permettre une classification exhaustive de toutes les valeurs qui se prsentent dans une enqute. Le codage ; Dfinition : opration technique au moyen de laquelle on situe les donnes dans des catgories. Le codage permet de traduire les donnes brutes en symboles (chiffres) qui peuvent tre compts et compils. La transformation nest pas automatique ;

27

Elle fait appel au jugment de la personne qui code, gnralement les rponces sont prcodes par un questionnaires ferm. Pour ce qui est des questions ouvertes, le code peut tre ; Pralablement dtermin (prvision des rponces) tablis aprs le dpouillement manuel Lass ouvert, les catgories se construisent pendant le dpouillement Partiellement prtablis. La deuxiemme mthode est la plus couramment utilise. La description des donnes lors des tris plat Caractriser ce qui est typique dans la population tudie ; Supposons que lon tudie la frquentation des cinmas ; Il existe diffrentes mesures de la tendance centrale ; les principales sont : La moyenne arithmtique : nombre de fois que les personnes frquentent le cinma par mois / jours / La mdiane : si il fallai valuer les films sur une chelle de 1 4, la mdiane comme point au dessus duquel (au dessous duquel) se trouve 50% des observations. Le mode. : le score qui se prsente le plus frquement. Indiquer jusqu quel point les individus formants les groupes sont varis. Pour a on a recours aux mesures de dispersion et de variabilit, la mesure la plus frquement utilise est lcart type qui donne la distance moyenne des individus par rapport la moyenne du groupe . Lcart type sappuie sur le postulat que les donnes sont distribues sur une chelle intervalles. Calcul de lcart type dune population : = [ (i (xi - x)) / N ] ^1/2 N = nombre dlments dans la population Calcul de lcart type dun chantillon (Sx) Sx = [ ((Xi x)) / (n-1) ]^1/2 N = nombre dlments dans lchantillon. On utilise dans ce cas n-1 au dnominateur de lcart type de lchantillon qui donne une valeu Sx reprsentant une meilleure estimations de lcart type de la population dont est extrait lchantillon (pour les valeurs de n>30, la diffrence entre les deux calculs deviens minime). Le coficient de variation est lcart type comme pourcentage de la moyenne ; CV = * 100 M

28

Quand les donnes forment une chelle ordinale, la mesure de dispersion utiliser est lcart quartile. Procds montrant la distribution des individus en fonction de la variable mesure ; Exemple : sur un graphique, on place les taux de frquentation du cinma, sur laxe Y, et sur laxe X, le nombre de persones correspondant. La courbe obtenue peut prendre diffrentes formes : Rectangulaire : la courbe a lallure dune droite, les sujets sont rpartis en nombres gaux sur chaque points de lchelle. En cloche : distribution normale. Asymtrique : entassement des cas de lun ou lautre cot. Bimodale ou unimodale : les cas se situent en grand nombre deux ou plusieurs points de lchelle avec quelques rares exeptions. Exemple : Enqute page 132, on essaie de mettre une distance sociale entre le sujet et les nationalits ou les races en question. Ce qui importe ici est la forme de la distribution. la courbe normale annonce une distribution alatoire des opinions, dans ce cas, il y a pas de courant dopinion mais une diversit dopinions prives

Si la distribution prends la forme dun J , cest une prise de position ngative, un courant dfavorable.

La courbe en L atteste de lexistence dun courant favorable dopinion publique.

29

La distribution en U montre la prsence de deux courants dopinions oppos ;

les variables Dfinition intrinsque ; On peut diviser un groupe dindividus selon des caractristiques qui doient tre mutuellement exclusives et exhaustives. Cest a dire que chaque individu doit figurer dans une catgorie et que les catgories englobent tous les individus. Ces caractristiques constituent la variable et chaque caractristique est une valeur de la variable. Variables, subdivision ; Variable nominale : noms sans relations numrique entre eux (couleur des cheveux) Variable ordinale : les valeurs ont un ordre de rang sans mesures de distances entre elles. Variables continues : mesures numriques (age, salaire) , la variable continue peut tre caractrise comme chelle de valeurs ou chelle dintervalles. Autres subdivisions Les variables entires et les variables continues sont appelles quantitatives, Les variables nominales sont parfois appeles quantitatives. Les variables dichotomiques sont celles qui ne prennent que deux valeurs. Une variable qui prends plus de deux valeurs est dite polytomique. Dfinition extrinsque On peut aussi classer les variables somme variables dpendantes et variables indpendantes ; Les variables indpendantes : celles qui, manipules ou observes sont cense avoir une influence systmatique sur dautres variables. Les variables dpendantes : celles sur lesquelles sexerce linfluence systmatique des variables indpendantes.

30

On peut dire que la variable indpendante est lantcdent (cause prsume) et la variable dpendante est le consquent ( lefet prsum) que lon essaie dexpliquer. Partition des variables ; tris croiss Si on a une population se divisant selon deux types de caractristiques, deux variables (exemple : la population se divise selon lge et selon la lecture ou non des journaux) On a les deux variables binaires : age (jeune / ag) et lecteur / non lecteur
Variable A Age A1 A2 Jeunes ags (J) (A) Variable B lecteur / non-lecteur B1 lecteur (L) B2 non lecteur (NL)

On peut faire la partition croise de ces tableaux ; A1 A2 A1 ^ B1 A1 ^ B2 A2 ^ B1 A2 ^ B2

B1 B2

On a un tableau statistique a double entre, chaque cellule de la partition est une intersection des sous ensembles de A et de B.

Le coficient de Yule (Q) Pour A B C D La valeur de Q est : Q = AD - BC AD + BC

Dans le cas dune relation symtrique parfaite, la force de la relation entre les variables est maximum : Q = 1. Si il y a indpendance entre les variables, Q = 0 Mesure de la distance entre deux variables (CHI 2)

31

Pour mesurer la distance par rapport a lindpendance, pour mesurer mais quand les si il y a association entre 2 variables, on utilise le test de frquences sont faibles , on utilise alors le test de Fischer. X = (frquence observe - frquence attendue ) Frquence attendue

Interprtation des valeurs de Q et de X : Q : mesure la force de la relation, ne tiens compte que des proportions. X : mesure la distance par rapport a lindpendance ou lexistence dune relation / association entre les variables. Le X fait intervenir la valeur des frquences. La frquence attendue est obtenue en multipliant, pour une cellule donne, les frquences qui lui correspondent et en les divisant le produit ainsi obtenu par la frquence totale. Lanalyse multivarie Voir Syllabus.
---------------------------------------------------------------------------------------------------------------------------

32