Vous êtes sur la page 1sur 60

CM Enqutes quantitatives et statistiques

Licence 1 Semestre 2 Enseignante: Sophie Denave Sophie.Denave@univ-lyon2.fr Bureau L203

Objectifs du cours

1) La matrise de termes statistiques 2) Une initiation quelques outils statistiques 3) Une initiation la lecture critique de travaux utilisant des donnes chiffres

Partie 1 : La production des donnes par voie denqute

Chapitre 1: Des donnes chiffres la connaissance des phnomnes sociaux Chapitre 2 : Qui interroger?

Chapitre 3 : Comment interroger?

Partie 2: Lexploitation des donnes

Chapitre 4 : Les variables et leur reprsentation Chapitre 5 : les principales mesures

Chapitre 6 : Lire et interprter les tableaux statistiques

Quelques rfrences

ALONZO P.,2006, Initiation la statistique descriptive en sciences sociales, Vuibert DUPRAYS S., 2008, Dchiffrer les statistiques conomiques et sociales, Paris, Dunod EYRAUD C., 2008, Les donnes chiffres en sciences sociales, Paris, A. Colin PY B., 2010, La statistique sans mathmatique. Comprendre le logique et matriser les outils, Pearson

Introduction : Bref historique des statistiques

1. La statistique et les statistiques

2. Historique

Statistique -statistik (1749) -statista (XVIIe)

1er sens de la statistique : Etude mthodique des faits sociaux, par des procds numriques (classements, dnombrements, inventaires chiffrs, recensements) destins renseigner et aider les gouvernements (le robert)

Les statistiques : dfinition

Dans le sens commun, une statistique ou des statistiques, cest un ensemble de donnes numriques concernant une catgorie de faits . En sociologie, les statistiques apparaissent comme des mesures du phnomne social que lon cherche tudier, une reprsentation quantifie.

A retenir

La statistique : ensemble des mthodes qui permet de faire passer un message: elle est neutre, rigoureuse, norme. (jamais fausse) Les statistiques : ce sont les donnes ou les rsultats chiffrs, qui peuvent tre errons dans certains cas

Chapitre 1 : des donnes la connaissance des phnomnes sociaux

1. Sociologie et statistique

1.1. Comment dfinir la sociologie? 1.2. Pourquoi la socio utilise-t-elle la statistique?

2. Quest-ce que mesurer?


2.1. Les fonctions sociales de la mesures 2.2. Mesurer les faits sociaux : une activit sociale

3. Un pralable indispensable : dfinir les catgories

1. Sociologie et statistique
1.1. Comment dfinir la sociologie? La sociologie ne se dfinit pas par son objet dtudemais par sa dmarche 1.2. Pourquoi utilise-t-elle la statistique? -les stats pour dpasser le cas particulier -les stats pour viter le parti pris

2. Quest-ce que mesurer?

2.1. Les fonction sociales de la mesure

Rpartition de la population en prison unit : % (INSEE, 2000)


CSP Agriculteurs Artisans, commer. Cadres, PIS Rpartition de la population en prison Part dans la population

0.9 10.9

4.4 7.9 13.2 17.8 11.3 36.4 9 100

3.3 Professions Intermd. 9.6


Employs Ouvriers Sans profession Total

11.8 49.8 13.7 100

2.2. Mesurer les faits sociaux: une activit sociale


Mesurer cest rendre visible On mesure plusieurs choses en mme temps Multiplicit des sources, des mthodes et des instruments de mesure Mesurer peut modifier ce quon mesure Comparer les chiffres

Trois sites connatre

Linstitut national de la statistique et des tudes conomiques: www.insee.fr Linstitut national dtudes dmographiques : www.ined.fr

Lobservatoire des ingalits: www.inegalite.fr

3. Un pralable indispensable : dfinir les catgories


Catgorie a priori versus catgorie a posteriori Catgorie savante versus catgorie indigne Catgorie objective versus catgorie subjective Catgorie unidimensionnelle versus catgorie multidimensionnelle Ralisme versus nominalisme

Ex: Hughes Lagrange, Le dni des cultures, Seuil, 2010

Recherche mene en 7 ans sur 4339 adolescents de 16 ans environ dans les quartiers les plus ghettoiss, les plus en difficults de lle de France (Yvelines, le 93) Du grain moudre (mission France culture du 5 octobre 2010 de 18h20 19h) Article dans Le nouvel observateur n2395 du 30 sept au 6 oct 2010 Avec interventions de Laurent Mucchielli

Trois variables influent sur le comportement des adolescents


1) La structure familiale (famille monoparentale, biparentale, polygame) 2) La CSP (en 8 postes) 3) Lorigine gographique (pays de naissance des parents)

Interventions de L. Mucchielli

Il faut effectivement interroger les variables culturelles (lieu de naissance ou variables ethniques) : il ny a pas de statistiques racistes, il ny a que des interprtations Problme de la gnralisation : il ny a aucune possibilit dinfrence. Lchantillon sur les Yvelines et le 93 ne permet pas de gnraliser la France entire

Quel est le problme ?

Au Val-fourr Mantes, on compte peu prs 80 familles polygames. La moyenne denfants par famille tant de 15, a fait peu prs 1200. Sur 3500 collgiens, a reprsente donc un tiers (H. Lagrange, Nouvel observateur)

Chapitre 2: Qui interroger?


Intro: recensements ou sondage? 1. Choix de la population et de lchantillon 2. Lchantillon, le hasard et la reprsentativit 3. Deux types dchantillon

Dfinitions

Population-mre : Population de rfrence, sur laquelle on raisonne. Ex : pour un sondage prlectoral, la populationmre est lensemble des individus inscrits sur les listes lectorales Echantillon : sous-ensemble de la population-mre qui sera effectivement interrog. Ex : dans un sondage prlectoral, un chantillon est lensemble des individus inscrits sur les listes lectorales que lon va effectivement interroger. Base de sondage : cest la liste exhaustive des membres de la population tudier. Ex : dans le cas dun sondage prlectoral, la base de sondage est la liste lectorale.

2. Lchantillon le hasard et la reprsentativit


10 000 billes dans le sac, on en tire 100, le taux de sondage est de : 100/10 000=0,01 soit 1%

Le hasard

Le hasard, en statistique, exprime le fait quil existe une probabilit non nulle pour que chaque lment de la population mre (les billes du sac) fasse partie de lchantillon. Chaque bille a la mme chance que les autres dtre tire au sort.

Le biais et lala

On introduit un biais dans une statistique, en commettant une erreur systmatique ou accidentelle dapprciation, ou de mesure, dans la collecte de linformation Lala : cest quand le nombre dobservations possibles est trop faible et quon ne peut pas laugmenter

Echantillons alatoires

La mthode alatoire consiste slectionner, partir dune liste exhaustive de tous les individus dune population, certain dentre eux en les choisissant au hasard. Pour construire un chantillon alatoire, il faut que les individus soient choisis indpendamment de toutes leurs caractristiques ou proprits. Il est ncessaire que tous les individus de la population de rfrence aient une probabilit (une chance) de faire partie de lchantillon.

chantillons alatoires simples

Tous les membres dune population ont une probabilit identique de faire partie de lchantillon

Echantillons stratifis

On dcoupe la population en groupes (ou strates) et on ralise un chantillon alatoire au sein de chacun des groupes. Un tel chantillon nest pas reprsentatif de la population tudie mais chacune des strates lest (on peut redresser lchantillon pour le rendre reprsentatif).

chantillons en grappes

On suppose ici que les individus de la population sont naturellement regroups en paquets relativement homognes, appels grappes . Raliser un chantillon en grappes revient constituer un chantillon alatoire de ces grappes puis enquter lensemble (ou partie) des individus de chacune des grappes retenues.

chantillons arolaires

On dcoupe la zone soumise lenqute en aires gographiques partir de photos ariennes. On numrote ces aires et on pratique un tirage au sort. On interroge tout ou partie des individus qui appartiennent aux aires retenues.

2.2. chantillons empiriques

La procdure dchantillonnage est dire empirique quand les individus sont choisis en fonction de critres ne garantissant pas le caractre alatoire de lchantillon.

chantillons par quotas

Ce sont des chantillons respectant des critres de composition ou de structure : les individus ne sont pas choisis au hasard mais en fonction de leur capacit respecter ces critres. Lchantillon sera un modle rduit de la population selon les critres slectionns.

Exercice: plan de sondage

Constituer un chantillon par quota de sexe, dge et PCS avec 50% dhommes, 50% de femmes, 20% de personnes ges de 16 24 ans, 60% de 25 50 ans et 20% de 51 65 ans; 50% demploys; 30% de cadres et 20% de cadres suprieures Lenquteur doit sonder 50 personnes.

Plan de sondage: solution


Lenquteur doit interroger : 25 hommes et 25 femmes 10 jeunes de 16 24 ans, 30 personnes de 25 50 ans, 10 personnes de 51 65 ans 25 employs, 15 cadres, 10 cadres suprieurs

chantillons volontaires ou spontans

Ce sont des chantillons dont les membres ont eux-mmes dcid de se soumettre lenqute.

La mthode du panel

On constitue des groupes homognes de consommateurs selon leurs profils qui on demande de rpondre une srie de questions une fois par mois ou une autre frquence.

chantillons accidentels

Ce sont des chantillons constitus au gr des circonstances, sans rflexion sur les conditions de recrutement.

chantillon reprsentatif

Un chantillon est reprsentatif sil possde la mme structure que la population de rfrence. Cela signifie que les diffrents sousgroupes qui composent cet chantillon doivent respecter une part identique la part quils reprsentent dans la population.

Un chantillon est reprsentatif :


1) de quoi (de quelle population) 2) au sens de quels critres (quelles sont les variables dont les distributions sont respectes)

Redresser un chantillon

On a un chantillon comportant 50% dhommes et 50% de femmes alors que la reprsentativit impose respectivement 48% et 52%/ On peut le redresser en affectant un poids de 48/50e (soit 0,96) chaque homme et un poids de 52/50e (soit 1,04) aux femmes de lchantillon. Les pondrations (appeles coefficients de redressement) constituent le poids des rponses de chaque enqut dans les rsultats finaux.

Les chantillons suivants sont-ils reprsentatifs de la population vise ?

1.Pour connatre les opinions politiques de la population dune ville, on envoie 5 enquteurs interroger les gens la sortie de 5 grands magasins. Ils doivent questionner les clients jusqu ce quils runissent, chacun, un chantillon de 200 rponses.

Les chantillons suivants sont-ils reprsentatifs de la population vise ?

On dsire faire une enqute sur les gots musicaux de la population belge. Pour cela, on choisit au hasard 1000 numros de tlphone dans lensemble des annuaires et on les appelle pendant les heures de bureau. On obtient 583 rponses.

Exercice

Nous dsirons dterminer la taille moyenne des tudiants de premire anne de licence de socio qui taient prsents au 1er cours de statistique, partir dun chantillon de 10 individus. Mus par une bonne intention, sachant que les garons sont, en gnral, plus grands que les filles, nous choisissons un chantillon contenant autant de filles que de garons.

Exercice
Taille des filles (cm) 171 165 173 174 166 Taille des garons (cm) 193 187 180 185 178

A partir de cet chantillon de 10 individus, nous obtenons une taille moyenne de 177,2 cm, soit 3,2 cm de plus que la valeur exacte. Avons-nous procd correctement au choix de lchantillon, sachant que la population contient 51 filles et 35 garons ?

Rponse

Non, car chaque garon avait plus de chances dtre choisi que chaque fille. En effet, les 5 garons tant tirs au hasard dans une population de 35 individus, chacun deux avait 5 chances sur 35 dtre choisi, soit une probabilit de 5/35 0,143. Les 5 filles tant choisies dans une population de 51 individus, chacune dentre elles avait 5 chances sur 51 dtre choisie, soit une probabilit de 5/51 0,098, donc nettement plus faible que pour les garons.

Chapitre 3 : Comment interroger?


Intro: pourquoi produire des chiffres ? 1. Les trois parties du questionnaire 2. Les diffrents types de questions 3. La rdaction et la mise en page du questionnaire 4. Les modes de passation

Lannonce
Enqute sociologique : les sorties au cinma Bonjour, tudiant en deuxime anne de sociologie, je ralise une enqute sur le cinma. Pourriez-vous maccorder 5-6 minutes pour rpondre quelques questions. Les questionnaires sont totalement anonymes.

Questions (extrait)

Je vais commencer par vous poser des questions sur vos sorties au cinma actuelles 1) Combien de fois par an allez-vous au cinma ? Jamais De 1 5 fois De 6 12 fois Plus de 12 fois 2) Quel cinma frquentez-vous le plus souvent? : UGC, Path Cinmas de quartiers CNP Autres, prcisez :

Talon (extrait)

Pour finir je vais vous poser quelques questions afin de mieux vous connatre. Je vous rappelle que le questionnaire est anonyme. 57) Sexe de lenqute Homme Femme 58) Quel ge avez-vous ? .. 59) Quelle est votre situation matrimoniale ? Clibataire En couple Veuf Divorc

Questions ouvertes: avantages

Enquts plus libres de rpondre avec leurs mots (on privilgie les catgories dans lesquelles les individus peroivent le monde social) ouvrent potentiellement des perspectives de codage et dinformation plus grandes que les questions fermes

Questions ouvertes: inconvnients


Plus long et plus coteux que les questions fermes Effet de lenquteur plus grand Des rponses peuvent tre beaucoup trop floues et incodables Risque de non-rponse (n.r.) et ne sait pas (n.s.p.) plus important Rponses plus facilement strotypes

Questions fermes: avantages

1) Cotent moins cher en temps et en argent (le codage est fix lavance et lenquteur peut coder pendant la passation) 2) On peut orienter les rponses selon lintrt de la recherche (pas de rponses floues et incodables). 3) On y rpond facilement (cocher une case)

Questions fermes: inconvnients

1) On impose les catgories de lenquteur (ce sont des rponses avec les mots de lenquteur, avec ses catgories danalyse) 2) BIAIS si formulation mal pense. Risques de manipulation (souvent involontaires) de la part des concepteurs 3) Risque doublis de modalits de rponse

Lutter contre leffet dimposition dune problmatique


Pensez-vous quaujourdhui lEtat soriente rellement vers un changement de politique concernant les conomies dnergie ? Oui trs srieusement (4,5 %) Oui mais prudemment (22 %) Oui mais de faon ponctuelle (13 %) Oui mais de faon incohrente (26,5 %) Non (27 %) Ne sait pas (6 %) Pas de rponse (1 %)

Tonalit des mots

Viser la clart du vocabulaire : comprhensible par tous, univoque. Eviter les formules ambigus comme croyez-vous que qui a 2 sens : pensez-vous que et voulez-vous que 1) pensez-vous que les Etats-Unis devraient interdire les discours publics contre la dmocratie ? 2) Pensez-vous que les Etats-Unis devraient autoriser les discours publics contre la dmocratie ?

Etre attentif aux mots introductifs


a) les fonctionnaires sont-ils privilgis ? b) pensez-vous que les fonctionnaires privilgis ? c) trouvez-vous que les fonctionnaires privilgis ? d) estimez-vous que les fonctionnaires privilgis ? e) diriez-vous que les fonctionnaires privilgis ?

sont des

sont des
sont des sont des

Autoriser les double ou triple rponses Inclure la rponse sans opinion Ne mettre qu'une seule question par question. Proposer un continuum incluant des rponses extrmes et 'centristes' (tout fait d'accord, plutt d'accord) Savoir quil peut tre intressant davoir un nombre de modalits paires pour viter la modalits centrale comme rponse-refuge ( moyen ). Eviter les ngations et doubles ngations.

Conseils (suite)

Apprhender au mieux les intensits et frquences des pratiques Matriser l'ordre des questions Matriser la passation du questionnaire Clart de la prsentation (typographie, arer) Numroter ses questions pour faciliter la saisie quand une question ouverte est pose, mettre ce qui permet de signaler lenqut quil doit complter la rponse

4. Les modes de passation

4.1. Deux cas de passation par enquteur : le face--face / le tlphone 4.2. Deux cas de questionnaire auto-administr : par correspondance / distribu