Vous êtes sur la page 1sur 38

SOMMAIRE L'chantillonnage......................................................................................................................

2
Sommaire..........................................................................................................................................2

Notions de base..........................................................................................................................3
Population.........................................................................................................................................3

Les chantillons.........................................................................................................................3
chantillon reprsentatif.................................................................................................................3 chantillonnage alatoire................................................................................................................4 chantillonnage en strate................................................................................................................5 Conclusion........................................................................................................................................6

Introduction...............................................................................................................................6
Sommaire..........................................................................................................................................7

Erreurs d'chantillonnage et erreur type..................................................................................7 Estimation de l'erreur sur la moyenne......................................................................................8


Valeur critique Z et redressement pour la taille de la population................................................8

Exemple, calcul de l'erreur sur la moyenne...........................................................................10 Estimation de l'erreur sur le pourcentage..............................................................................11


Exemple de calcul de l'intervalle de confiance du pourcentage d'une population.....................12

Impact du nombre d'observations...........................................................................................13


Exemple de calcul de la taille de l'chantillon..............................................................................15 Conclusion......................................................................................................................................16

Comparaisons statistiques.......................................................................................................16 Ainsi, l'estimation de la moyenne d'une population calcule partir d'un chantillon s'exprime comme suit :............................................................................................................16 Zone de vrification de l'hypothse de recherche...................................................................16 Vrification bilatrale..............................................................................................................16 Vrification unilatrale............................................................................................................17 Reprenons l'hypothse nulle prcdente et changeons l pour :...........................................17 Les travailleurs immigrants ont une productivit moyenne suprieure 5 units .........17 Dans ce cas, on connat la direction. La vrification est alors unilatrale. L'expression anglaise s'crit comme ceci one tailed test ........................................................................17 Un niveau de confiance 95 % correspond un seuil de signification de 5 %. L'inverse est vrai, un seuil de signification de 1 % correspond un niveau de confiance de 99 %..........18 Gnralement, on tablit le niveau de confiance 95 % et mme 99 %. Dans des circonstances dfavorables, on se contente d'un niveau de 90 %..........................................18 Par exemple, la moyenne suivante pourrait tre fiable 95 %..............................................18 = 5 2....................................................................................................................................18

Ce qui signifie qu'il y a 95 % des chances que la moyenne de la population soit entre 3 et 7. Par contre, la fiabilit 99 % serait la suivante :..................................................................19 = 5 2,6.................................................................................................................................19 Il y a 99 % des chances que la moyenne de la population serait entre 2,4 et 7,6..................19 Comparer les observations la population ou une hypothse............................................19
Avertissements................................................................................................................................20 Sommaire........................................................................................................................................20

Comparaison de moyenne d'un groupe avec la population...................................................21 Formules mathmatiques .......................................................................................................21


Seuil de signification.......................................................................................................................22

Exemple ...................................................................................................................................23 Comparaison du pourcentage d'un groupe la population..................................................25 Formules mathmatiques pour le pourcentage......................................................................25 Exemple....................................................................................................................................26
Comparaison de la moyenne d'un groupe avec celle d'une population avec un logiciel...........27 Interprtation des rsultats...........................................................................................................28 Procdure pour les pourcentages..................................................................................................30

Raliser un questionnaire .......................................................................................................30


Combien faut-il interroger de personnes ?.................................................................................30

le contenu du questionnaire .................................................................................................32


Les rgles de base respecter......................................................................................................32

Le traitement du questionnaire ..................................................................................................36

L'chantillonnage
L'chantillonnage est une part importante des statistiques. Elle nous permet de comprendre ce qui se passe dans une population sans avoir interroger chacun des individus. Le principe tant qu'une cuillre suffit pour goter toute la soupe. Pour avoir de bonnes analyses statistiques, il est important de savoir et de comprendre le type d'chantillonnage utilis.

Sommaire
Notions de base

Population Les chantillons chantillon reprsentatif chantillonnage alatoire chantillonnage au hasard simple L'chantillonnage en grappes chantillonnage en strate Conclusion

Notions de base
Population
La population est le groupe que l'on tudie. Par exemple, pour Statistique Canada la population peut tre l'ensemble des canadiens. videmment, la population peut tre un ensemble plus rduit. Pour une enqute sur les travailleurs, la population sera la main-d'oeuvre active : les gens gs de 15 65 ans ce qui exclue les enfants et les retraits. La population est l'ensemble des units qui dfinissent l'objet d'tude. Les units peuvent tre des individus tels que des travailleurs, des patrons, des tudiants, etc. Ils peuvent tre aussi des objets tels que des organisations, des socits ou des quipements. Quelquefois, les microdonnes comportent toute une population, ce qui facilite grandement l'interprtation des donnes. Nous dfinissons la population que nous tudions pour notre travail de recherche ds le dbut de nos travaux dans le cadre opratoire.

Les chantillons
L'chantillon c'est une partie de la population. Peu d'organismes peuvent recueillir des donnes de toute la population. Cela cause des cots levs que suppose une telle opration et que gnralement il y a peu d'intrt le faire. En effet, les statistiques nous permettent de prendre un chantillon et de gnraliser nos mesures toute la population. Nous verrons comment un peu plus loin. Il existe plusieurs manires de faire l'chantillonnage, nous allons tudier quelquesunes d'entre elles.

chantillon reprsentatif

Un chantillonnage reprsentatif est un chantillon qui reproduit les caractristiques d'une population de manire ce que les conclusions obtenues avec cet chantillon se gnralisent la population. En utilisant des microdonnes produites par Statistiques Canada c'est gnralement le cas, mais pas toujours. Le problme vient du fait qu'il faut avoir une liste valable et complte de la population. Malheureusement, ce n'est pas toujours le cas. Par exemple, il n'existe pas de liste complte de travailleurs volant de l'quipement leur usine. Une enqute sur ce sujet ne peut donc pas tre base sur un chantillonnage reprsentatif, la population des voleurs tant discrte. Quand vous utilisez des microdonnes, vrifiez la documentation de l'enqute pour savoir si l'chantillonnage est reprsentatif.

chantillonnage alatoire
Mode d'chantillonnage sur une population qui rpond ces critres : 1. 2. 3. 4. Connaissance de l'ensemble des chantillons; Chaque chantillon a une probabilit connue de slection; Chaque chantillon a une probabilit non nulle de slection; Chaque chantillon est choisi alatoirement.

Une fois ces conditions remplies, les statisticiens pigent au hasard des chantillons. Les mthodes les plus connues sont :

L'chantillonnage au hasard simple; L'chantillonnage en grappes; L'chantillonnage au hasard stratifi.

chantillonnage au hasard simple


C'est la technique idale et la plus facile concevoir. Par exemple, un ordinateur pige les chantillons au hasard. Les rsultats obtenus par cette technique sont fiables et valides si la quantit d'chantillons est bonne. Il arrive que les microdonnes soient surabondantes pour vos tudes, vous pouvez utiliser cette technique pour en rduire le nombre. Les logiciels possdent des fonctionnalits permettant de faire la slection au hasard. Ne faites jamais ce travail la main, il est assur que d'une manire, ou de l'autre, vous allez introduire une distorsion statistique qui invalidera votre chantillon. Dans SPSS :

Menu Donnes --> Slectionner des observations, une fentre du mme nom s'ouvre; Slectionnez la case Par chantillonnage alatoire et cliquez sur le bouton chantillon . Une fentre intitule Slectionner des observations : chantillon alatoire ;

crivez le pourcentage d'observations et cliquez sur Poursuivre ; ou : o Cliquez sur Exactement , crivez le nombre d'observations dsires, crivez le nombre exact d'observations que vous avez et cliquez sur Poursuivre ; Cliquez sur OK .
o

L'chantillonnage en grappes
Imaginons que vous fassiez une enqute sur la productivit des travailleurs immigrants. Comme aucune liste de travailleurs n'existe pour votre ville, vous devrez vous promener d'usine en usine pour faire la liste et ensuite faire votre chantillonnage. Cela risque d'tre trs long et trop coteux mme pour Statistique Canada. Pour faire un chantillonnage en grappes, vous pouvez slectionner au hasard des quartiers dans la ville et dans ses quartiers slectionner des usines au hasard et dans les usines slectionner des ateliers au hasard. Si vous manquez d'immigrants au niveau de l'atelier, il se peut que vous soyez oblig de remonter au niveau de l'usine. Dans un monde compltement alatoire, ce mode de fonctionnement est lgitime. Mais on sait que les membres d'une mme famille travaillent ensemble dans la mme usine, ce qui apporte une distorsion statistique importante. Il faut donc se mfier de ce type d'chantillonnage. L'chantillonnage en grappes est un chantillonnage probabiliste reposant sur la slection alatoire de grappes. Une grappe est un ensemble d'units d'une population qu'on constitue l'aide de critres bien dfinis. Il peut s'agir d'un groupe qui existe dans la population (pts de maison, hpital, etc.) ou d'un groupe thorique (ensembles de rues sur une carte, etc.). Si vous lisez le plan d'chantillonnage associ aux microdonnes, on spcifie gnralement ce qu'il faut faire si l'chantillonnage est en grappe.

chantillonnage en strate
Reprenons l'exemple o vous analysez la productivit des travailleurs immigrants. Vous voulez comparer cette productivit celle des travailleurs locaux. Si vous considrez que la population aux fins de votre recherche est celle de tous les travailleurs au Canada, vous devrez recueillir un nombre norme d'observations pour avoir un sous-groupe contenant suffisamment de travailleurs immigrants. Plutt que de faire ce travail de collecte, vous pouvez considrer une population compose de deux groupes, de deux strates et faire l'chantillonnage pour chacune de ces strates. Dans le cas prcdent, nous avons un chantillonnage stratifi disproportionn o les strates de l'chantillon global reprsentent des proportions diffrentes de la population. Avant d'utiliser l'chantillon global, il faut faire un redressement, accorder

chacune des strates un coefficient de pondration en fonction de la proportion qu'elles reprsentent dans la population. Beaucoup d'enqutes sont stratifies. Prenons l'exemple d'une enqute canadienne o l'on veut avoir les rsultats par province. On sait qu'un chantillon de quelques milliers d'individus par province est ncessaire pour avoir une prcision statistique suffisante. Pour le Qubec et l'Ontario, cela reprsente une faible proportion de la population. Mais pour l'le-du-Prince-douard, avec moins de 200 000 habitants, le nombre est important. Pour avoir le rsultat canadien, il faut mettre les rsultats de l'le avec ceux des autres provinces, il faut pondrer les donnes par un facteur 30. On veut viter que les habitants de l'le-du-Prince-douard aient une importance plus grande que ceux du Qubec. Si vous lisez le plan d'chantillonnage associ aux microdonnes on spcifie gnralement ce qu'il faut faire si l'chantillonnage est en strate et comment faire la pondration.

Conclusion
Avant d'utiliser les microdonnes, il importe de lire le plan d'chantillonnage. Celui-ci a un impact direct sur la qualit des donnes et sur leur traitement. Importez toujours un maximum de microdonnes, autant que votre lien Internet et que votre ordinateur peuvent soutenir. Cela augmente la prcision et la valeur de vos travaux de recherche. Si vous chantillonnez des microdonnes, il est important de suivre la mthode d'chantillonnage alatoire, dcrite dans ce texte.

Voir aussi:
Pour estimer la taille des chantillons et les erreurs d'chantillonnage.

Introduction
L'chantillonnage permet de comprendre ce qui se passe dans une population sans avoir interroger chacun des individus. C'est trs pratique et trs conomique. Nous verrons que le plus le nombre d'chantillons est faible plus l'erreur est leve sur les mesures comme la moyenne et les pourcentages. Nous devons valuer ces erreurs.

Rciproquement la prcision de nos mesures, nous pouvons valuer le nombre d'observations ncessaires selon la prcision dsire pour la moyenne ou les pourcentages.

Sommaire
Erreurs d'chantillonnage et erreur type Estimation de l'erreur sur la moyenne Valeur critique Z et redressement selon la taille de la population Exemple, calcul de l'erreur sur la moyenne Estimation de l'erreur sur le pourcentage Exemple de calcul de l'intervalle de confiance du pourcentage d'une population Impact du nombre d'observations Exemple de calcul de la taille de l'chantillon

Erreurs d'chantillonnage et erreur type


Comme les observations varient au hasard d'un chantillon l'autre, il y a des diffrences que l'on appelle erreurs d'chantillonnage. Par exemple, prenez un chantillon de 20 personnes travers une population de 100 tudiants et calculez la moyenne. Refaites l'exprience en slectionnant un nouveau groupe de 20 personnes et recalculez la moyenne. cause des diffrences entre les deux chantillons, les moyennes de chaque groupe d'chantillons devraient tre diffrentes sans tre trs loigns l'une de l'autre. Cela est d l'erreur d'chantillonnage et on observe le mme phnomne avec les mesures sur le pourcentage comme le pourcentage de travailleurs bilingues. L'erreur type nous permet d'valuer l'ampleur de ces variations et se calcule comme suit :

x = o

s n

x Erreur type s n cart type de l' chantillon Taille de l' chantillon

Estimation de l'erreur sur la moyenne


L'estimation de la moyenne d'une population calcule partir d'un chantillon s'exprime comme suit :
= X erreur

Par exemple, l'expression suivante : =52=5-25+2=37 signifie que la moyenne varie de 3 7.

Valeur critique Z et redressement pour la taille de la population


Pour faire estimer l'erreur nous devons d'tablir le degr de confiance que nous avons besoin pour la moyenne de la population. Par exemple, la moyenne suivante pourrait tre fiable 95 % =52

Cela signifie qu'il y a 95 % des chances que la moyenne de la population soit entre 3 et 7. Pour garantir un rsultat 99 %, il faut se donner une marge d'erreur plus grande. Pour que la moyenne soit fiable 99 %, on augmente notre marge d'erreur : = 5 2,6 Il y a 99 % des chances que la moyenne de la population serait entre 2,4 et 7,6.

Selon l'intervalle de confiance, l'erreur sur la moyenne Em, se calcule comme suit : E m = Z x N n s =Z N 1 n N n N 1

o E m Erreur sur la moyenne Z x s N n Pondration selon le niveau de confiance Erreur type cart type de l' chantillon Taille de la population Taille de l' chantillon

Remarquez le coefficient Z, il prend les valeurs suivantes selon l'intervalle de confiance dsir : Niveau de confiance (%) Valeurs de Z 90 1,64

95 1,96 99 2,58 Si la taille de la population est plus de 20 fois celle de l'chantillon, on peut ngliger le calcul du radical et la formule s'crit : E m = Z x = Z s n

o E m Erreur sur la moyenne Z x s n Pondration selon le niveau de confiance Erreur type cart type de l' chantillon Taille de l' chantillon

Note : ces formules sont valides pour un minimum de 30 observations. En dessous de ce minimum, la valeur de Z n'est plus fiable. Certains livres de statistiques fournissent une procdure spcialement adapte pour ces cas difficiles traiter. Heureusement, les utilisateurs de microdonnes ont gnralement une abondance d'observations.

Exemple, calcul de l'erreur sur la moyenne


Nous avons un chantillon 100 personnes d'une population de 500 personnes. La moyenne de la productivit de cet chantillon est de 50 et son cart-type vaut 4. Quelle est la valeur de la moyenne pour la population et son intervalle de confiance 99 % ? Calculons d'abord Em :

N n s N n =Z N 1 n N 1 o pour cet exemple : Em Erreur sur la moyenne E m = Z x Z = 2,58 Pondration selon le niveau de confiance pour 99% x Erreur type s=4 cart type de l' chantillon N = 500 Taille de la population n = 100 Taille de l' chantillon En remplaant les symboles par les valeurs de cet exemple : E m = 2,58 4 100 500 100 = 0.92 500 1

La moyenne de la population s'exprime donc par : = 50 0,92 On peut affirmer que la moyenne de la population se trouve dans l'intervalle 49,08 50,92 avec une confiance de 99 %

Estimation de l'erreur sur le pourcentage


Il arrive aussi que des enqutes estiment des pourcentages. Cela est utile pour exprimer les intentions de vote, mais aussi pour valuer le pourcentage d'une population bilingue par exemple. Pour faire l'valuation de l'erreur, les statistiques nous fournissent un outil pour le calcul de l'intervalle de confiance semblable celui de la moyenne :
= p Z p o p Z p Pourcentage de la population Pourcentage de l' chantillon Pondration selon le niveau de confiance Estimation de l' erreur sur le pourcentage

Les valeurs de Z sont les mmes que pour l'estimation de la moyenne

Niveau de 90 1,64 95 1,96 99 2,58 L'estimation sur l'erreur de pourcentage se calcule comme suit : p = o p p n N p (100 p ) n N n N 1

Estimation de l' erreur sur le pourcentage Pourcentage de l' chantillon Taille de l' chantillon Taille de la population

Cette formule n'est pas assez prcise pour valuer les pourcentages infrieurs 10 %.

Exemple de calcul de l'intervalle de confiance du pourcentage d'une population


Imaginons que lors d'une enqute auprs des travailleurs immigrs, vous dcouvrez que 75 % d'entre eux sont bilingues. Vous aimeriez valuer la prcision de votre mesure pour la population soit l'ensemble des travailleurs immigrs. Vous avez un chantillon de 200 travailleurs sur une population de 800 individus. Calculons d'abord l'erreur p = o p p (100 p ) N n n N 1 Estimation de l' erreur sur le pourcentage

p = 75 Pourcentage de l' chantillon n = 200 Taille de l' chantillon N = 800 Taille de la population En remplaant les symboles par des chiffres :
p = 75(100 75) 800 200 = 2,65 200 800 1

D'aprs l'quation ci-dessus :


= p Z p o p = 75 Z = 1,96 Pourcentage de la population Pourcentage de l' chantillon Pondration selon le niveau de confiance 95%

p = 2,65 Estimation de l' erreur

En remplaant les symboles par des chiffres :


= 75 1,96 * 2,65 = 75% 5.19

On peut affirmer que le pourcentage de travailleurs immigrants de la population se trouve dans l'intervalle 69,81 80,19 avec une confiance de 95 %

Impact du nombre d'observations


Pour faire des analyses statistiques valables, il faut un nombre minimal de 30 observations. Mais cela risque tre insuffisant. Les formules mathmatiques nous montrent que plus le nombre d'chantillons est lev, meilleure est la prcision statistique. On peut estimer le nombre d'observations en fonction de l'intervalle de confiance Z et de la marge d'erreur Em en utilisant la formule ci-dessous : n= o n Em p Z Z 2 p (100 p ) 2 Em Taille de l' chantillon Marge d' erreur Pourcentage de l' chantillon Pondration selon le niveau de confiance

Pour nous donner une ide de l'erreur en fonction du nombre d'observations, examinons le tableau suivant, fait pour un intervalle de confiance de 95% : Erreur en % Nombre d'observations 20 24 19

27 18 30 17 33 16 38 15 43 14 49 13 57 12 67 11 79 10 96 9 119 8 150 7 196 6 267 5 384 4 600 3 1067 2 2401 1 9604 Le graphique est tout aussi instructif :

Le graphique et le tableau nous montrent que pour une prcision de 7 % moins de 200 observations suffisent, mais qu'au-del le nombre d'observations ncessaires pour diminuer l'erreur monte trs rapidement. Observez le nombre d'chantillons ncessaires pour abaisser l'erreur de 2 % 1 %.

Exemple de calcul de la taille de l'chantillon


Vous dsirez amasser des donnes sur les immigrants et vous aimeriez avoir une prcision de 3 % alors que les pourcentages aussi bas que 20%. Que recommandez-vous comme nombre d'observations, si vous voulez tre certain 95 % de vos rsultats ? Z 2 p (100 p ) n= 2 Em o n Em = 3 Taille de l' chantillon Marge d' erreur

p = 20 Pourcentage de l' chantillon Z = 1,96 Pondration selon le niveau de confiance 95%

En remplaant les symboles par des chiffres :

n=

(1,96) 2 20(100 20) = 683 32

Donc, un chantillon comprenant 700 personnes est ncessaire pour atteindre les objectifs de prcision.

Conclusion
Avant d'utiliser les microdonnes, il importe de s'informer du plan d'chantillonnage. Celui-ci a un impact direct sur la qualit des donnes et mme sur le traitement des donnes. Importez toujours un maximum de microdonnes, autant que votre lien Internet et que votre ordinateur peuvent le soutenir. Cela augmente la prcision et la valeur de vos travaux de recherche. Si vous chantillonnez des microdonnes, il est important de suivre la mthode d'chantillonnage alatoire, dcrite dans ce texte. Comparaisons statistiques Un chantillon n'est qu'une partie de la population. Comme les observations varient d'un chantillon l'autre au hasard, il y a des diffrences que l'on appelle erreurs d'chantillonnage. Ce qui fait que la valeur des paramtres statistiques comme la moyenne fluctue d'un chantillon l'autre. Ils ne sont connus qu'avec une marge d'erreur. Ainsi, l'estimation de la moyenne d'une population calcule partir d'un chantillon s'exprime comme suit
= X erreur

Zone de vrification de l'hypothse de recherche Vrification bilatrale Prenons le cas hypothtique que l'hypothse nulle de recherche est que la moyenne de la productivit d'un groupe de travailleurs est 5 : H0: = 2,5 l'analyse des rsultats, vous obtenez une moyenne de productivit des travailleurs de 5 units par heure et que l'erreur d'chantillonnage est de 2. Le graphique cidessous illustre la distribution normale de la probabilit de mesure de la moyenne selon les donnes recueillies :

En plein centre du graphique, on observe la moyenne valant 5. La zone colore contient les valeurs possibles qu'elle peut prendre, puisque la moyenne n'est pas connue avec une prcision absolue cause des erreurs d'chantillonnages. Les zones grises aux extrmits correspondent aux zones de rejets de l'hypothse ou rgion critique. C'est la zone ou il y a 5 % des chances que la moyenne mesure soit infrieure 3 ou suprieure 7. Comme notre hypothse nulle est dans la zone de rejet, nous rejetons l'hypothse nulle et acceptons notre hypothse de recherche. Comme il faut vrifier les zones de rejets de chaque extrmit, on dit que l'on doit faire une vrification bilatrale. L'expression anglaise s'crit comme ceci two tailed test . Vrification unilatrale Reprenons l'hypothse nulle prcdente et changeons l pour : Les travailleurs immigrants ont une productivit moyenne suprieure 5 units H0: >6 Dans ce cas, on connat la direction. La vrification est alors unilatrale. L'expression anglaise s'crit comme ceci one tailed test .

Dans cet exemple, la valeur de l'hypothse nulle n'est pas dans la zone de rejet, on ne peut donc pas la rejeter. Ce qui laisse notre hypothse de recherche en suspend. Le niveau signification Aprs avoir tabli votre hypothse, il faut tablir le seuil de signification. cause des erreurs d'chantillonnage, la moyenne d'une population n'est pas connue avec une prcision absolue. cette tape, on dtermine justement la prcision que l'on vise. C'est le seuil de signification, (alpha), la probabilit de commettre une erreur de mesure. Plus le seuil de signification est faible, plus la probabilit qu'on doive rejeter l'hypothse nulle est faible. Niveau de confiance Un niveau de confiance 95 % correspond un seuil de signification de 5 %. L'inverse est vrai, un seuil de signification de 1 % correspond un niveau de confiance de 99 %. Gnralement, on tablit le niveau de confiance 95 % et mme 99 %. Dans des circonstances dfavorables, on se contente d'un niveau de 90 %. Par exemple, la moyenne suivante pourrait tre fiable 95 % =52

Ce qui signifie qu'il y a 95 % des chances que la moyenne de la population soit entre 3 et 7. Par contre, la fiabilit 99 % serait la suivante : = 5 2,6 Il y a 99 % des chances que la moyenne de la population serait entre 2,4 et 7,6

Comparer les observations la population ou une hypothse Aprs avoir recueilli un chantillon de donnes et fait les analyses statistiques de base, on dsire comparer l'chantillon la population ou le confronter l'hypothse de recherche. Cette comparaison permet d'tablir si les observations sont statistiquement diffrentes de la population. Par exemple, si on recueille des donnes sur les travailleurs immigrants, ce qui forme un groupe, et les comparer la population canadienne pour tudier s'ils sont plus productifs. Ces comparaisons peuvent demander une connaissance assez prcise de la moyenne ou d'autres compilations statistiques de la population. Gnralement les sites de microdonnes, offrent des compilations statistiques sous forme de tableaux de donnes.

Pour bien comprendre les concepts que nous utilisons, nous vous suggrons de lire les explications sur l'chantillonnage et l'introduction sur les comparaisons statistiques.

Avertissements
Ces explications ne sont valides que pour des donnes respectant la distribution normale. Nous conseillons d'utiliser les formules et mthodes que nous dcrivons seulement si vous avez plus de trente observations dans votre chantillon. Avec moins de trente observations, vous devez utiliser d'autres techniques statistiques. Comme cela se produit rarement avec les microdonnes, nous ne traitons pas de ces cas difficiles ici. Advenant le cas o vous russissez obtenir toutes les observations de votre population, vous n'avez pas d'erreurs d'chantillonnage, vous avez la mesure exacte. Vous n'avez pas donc pas faire les calculs de cette page.

Sommaire
Comparaison de la moyenne d'un groupe avec la population Formules mathmatiques Seuil de signification Exemple Comparaison de la moyenne en utilisant un logiciel Procdure de calcul dans SPSS Interprtation des rsultats Procdure pour les pourcentages Comparaison du pourcentage d'un groupe la population Formules mathmatiques Exemple Procdure SPSS pour les pourcentages

Comparaison de moyenne d'un groupe avec la population


Prenons l'exemple fictif o vous voulez dmontrer que la productivit moyenne i des travailleurs immigrants est suprieure celle des travailleurs canadiens dont Statistique Canada value la moyenne p 4,5. Aprs avoir calcul la moyenne et la marge d'erreur de votre chantillon, vous avez ce rsultat : i = 7 2 95 % Cela signifie que la moyenne des travailleurs immigrs se situe quelque part entre 5 (la moyenne - 2) 9 (la moyenne + 2) avec une confiance de 95%. La valeur 2 est la marge d'erreur 95 %. Comme la moyenne de la population canadienne qui est de 4,5 se retrouve l'extrieur de l'intervalle, vous pouvez tre certain 95 % de votre hypothse : les moyennes sont statistiquement diffrentes. Nous tudions dans cette page les formules mathmatiques qui nous permettent de calculer la marge d'erreur ainsi que le niveau de confiance. Ceci afin d'valuer si la moyenne d'un groupe est statistiquement diffrente de la population.

Formules mathmatiques
Comparaison de la moyenne d'un groupe la population
Le rejet ou l'acceptation d'une hypothse de recherche base sur la moyenne de la population demande l'valuation de la moyenne et de l'cart-type de l'chantillon. Une fois ces informations obtenues, on value la valeur critique Z..Cette valeur nous indique si les moyennes, de l'chantillon et de la population (ou de votre hypothse), sont statistiquement diffrentes. Z est l'cart entre la moyenne de l'chantillon et la moyenne de la population que l'on pondre par l'erreur type de l'chantillon. Plus la valeur de Z est leve, plus il est probable que les moyennes de la population et de celle de votre hypothse sont statistiquement diffrentes. Le calcul de Z est relativement simple :

Z= o Z X X

X X Facteur critique Moyenne de l' chantillon Moyenne selon l' hypothse nulle Erreur type de l' chantillon

et l'erreur type x vaut :


x = o x Erreur type s n cart type de l' chantillon Taille de l' chantillon s n

Seuil de signification
C'est Z qui nous dit si les moyennes sont statistiquement diffrentes et si l'on doit rejeter ou accepter notre hypothse : Bilatral 2,58 1.96 1.64 Unilatral 2,33 1.64 1.28 On rejette l'hypothse si la valeur absolue de la valeur de Z dpasse celle du tableau ci-dessus selon que la vrification est bilatrale ou unilatrale. Certains prfrent utiliser l'expression Seuil de signification , il est gal 100 moins le Niveau de confiance . Donc, une confiance 95 % correspond un seuil de signification de 5 %. L'inverse est vrai, un seuil de signification de 1 % correspond un niveau de confiance de 99 %. Si le calcul de Z donne 2,25 et que je veux vrifier 95% de confiance si la moyenne de mon chantillon diffre de celle de la population, je consulte le tableau ci-dessus. Selon le tableau, la valeur minimum de Z est 1,96. Comme je dpasse cette valeur, ma moyenne diffre donc de manire certaine. Observez que je ne peux tre certain 99 % puisque Z devrait valoir au minimum 2,58.

Exemple
Comparaison de la moyenne d'un groupe la population
Refaisons l'exemple en suivant les tapes de recherche :

1 Formuler l'hypothse de recherche


Prenons comme hypothse de recherche que : La productivit des travailleurs immigrants est diffrente de 5 H1: 5

2 Formuler l'hypothse nulle


L'hypothse nulle prend le contre-pied de l'hypothse de recherche : La productivit des travailleurs immigrants est de 5 H0: = 5

3 Choisir le seuil de signification


Nous aimerions vrifier notre hypothse avec une confiance de 95%, c'est un choix personnel. Il importe de choisir le seuil de signification cette tape, puisqu'il influence la taille de l'chantillon. Une plus grande prcision demande un plus grand nombre d'observations dans notre chantillon.

4 Calcul de Z
Aprs avoir recueilli les informations, on calcule la moyenne et l'cart-type de l'chantillon pour faire l'valuation de la valeur critique Z . Supposons que la moyenne de l'chantillon vaut 7, que l'cart-type vaut 8 et que l'effectif est de 100, nous pouvons faire le calcul : Commenons par calculer l'erreur type :

x = o x s =8

s n Erreur type cart type de l' chantillon

n = 100 Taille de l' chantillon

x =

8 = 0,8 100

On peut maintenant calculer Z : Z= o Z X =7 =5 X = 0,8 X X Facteur critique Moyenne de l' chantillon Moyenne selon l' hypothse nulle cart type de l' chantillon

En remplaant les symboles par les valeurs de cet exemple : Z= 75 = 2,5 0,8

5 Vrification de l'hypothse nulle H0: a) H0: Bilatral et seuil de signification 5 %


Selon le tableau prcdent, la valeur critique de Z pour un test bilatral avec une probabilit de 95 % est de 1,96. Comme Z vaut 2,5, nous dpassons la valeur du seuil, nous pouvons donc rejeter l'hypothse nulle. Cela confirme, en quelque sorte, notre hypothse de recherche.

b) H0: Bilatral et seuil de signification 1 %


Supposons que le seuil de signification vaille 1 %. Selon le tableau prcdent, la valeur critique de Z pour un test bilatral avec une probabilit de 99 % est de 2,58. Comme notre mesure de Z = 2,5 est infrieure la valeur du seuil, nous ne pouvons rejeter l'hypothse nulle. Ne pouvant rejeter l'hypothse nulle notre hypothse de recherche ne peut tre confirme.

c) H0: Unilatral et seuil de signification 1 %


Supposons maintenant qu'en plus de choisir un seuil de signification de 1 %, nous changeons l'hypothse nulle pour H0: > 5. Nous affirmons maintenant que la productivit des travailleurs immigrs est plus grande que celle de la population. Selon le tableau prcdent, la valeur critique de Z pour un test unilatral avec une probabilit de 99 % est de 2,33. Comme notre mesure vaut Z = 2,5, nous dpassons la valeur du seuil, nous pouvons donc rejeter l'hypothse nulle ce qui confirme, en quelque sorte, notre hypothse de recherche.

Comparaison du pourcentage d'un groupe la population


On ne veut pas toujours comparer une moyenne, quelquefois il s'agit d'un pourcentage. Par exemple, si on dsire tudier le cas du bilinguisme chez les travailleurs immigrants, on aura alors un taux de bilinguisme et non une moyenne. L encore il faut utiliser les formules mathmatiques qui nous permettent de calculer le facteur Z. Ce dernier nous indique avec quelle confiance, ou incertitude, les pourcentages sont statistiquement diffrentes.

Formules mathmatiques pour le pourcentage


Pour la comparaison du pourcentage d'un groupe la population
Le calcul pour le pourcentage est similaire celui du calcul de la moyenne :
Z= o Z p p Facteur critique Pourcentage de l' chantillon Pourcentage selon l' hypothse nulle Estimation de l' erreur type sur le pourcentage p p

O le facteur d'estimation p vaut :

p = o p p n

p(100 p ) n Estimation de l' erreur type sur le pourcentage Pourcentage de l' chantillon Taille de l' chantillon

Une fois que la valeur de Z est dtermine, l'acceptation ou le rejet de l'hypothse nulle se fait selon la mme logique que pour la moyenne.

Exemple
Pour la comparaison du pourcentage d'un groupe la population

1 Formuler l'hypothse de recherche


Prenons comme hypothse de recherche que : Plus de 75 % travailleurs immigrants sont bilingues H1: > 75

2 Formuler l'hypothse nulle


L'hypothse nulle prend le contre-pied de l'hypothse de recherche : Chez les travailleurs immigrants, le bilinguisme est infrieur ou gal 75 % H0: <= 75

3 Choisir le seuil de signification


Nous aimerions vrifier avec une prcision de 95%. Il importe de faire ce choix cette tape puisqu'il influence le choix de la taille de l'chantillon. Une plus grande prcision demande un plus grand nombre d'observations dans notre chantillon.

4 Calcul de Z
Aprs avoir recueilli les informations, on doit calculer le pourcentage de bilinguisme dans notre chantillon et le nombre de participants. Supposons que nous obtenons 80 % de bilingue et que nous avons 200 participants.

Commenons par le calcul de p : p = o p p = 80 n = 200 p (100 p ) n Estimation de l' erreur type sur le pourcentage Pourcentage de l' chantillon Taille de l' chantillon

En remplaant les symboles par les valeurs de cet exemple :


p = 80(100 20) = 2,83 200

On peut maintenant calculer Z :


Z= o Z p = 80 = 75 Facteur critique Pourcentag e de l' chantillon Pourcentage selon l' hypothse nulle p p

p = 2,83 Estimation de l' erreur type sur le pourcentage

Z=

80 75 = 1,77 2,83

5 Vrification de l'hypothse nulle Unilatral et seuil de signification 5 %


Selon le tableau prcdent, la valeur critique de Z pour un test unilatral avec une probabilit de 95 % est de 1,64. Comme notre mesure vaut Z=1.77, nous dpassons la valeur du seuil. Nous pouvons donc rejeter l'hypothse nulle, ce qui confirme en quelque sorte, notre hypothse de recherche : les immigrants sont bilingues plus de 75 %.

Comparaison de la moyenne d'un groupe avec celle d'une population avec un logiciel

Logiciel utilis : SPSS version 10 en franais Entrez vos donnes dans SPSS. Les donnes utilises dans cette exemple sont fictives. Pour suivre cet exemple, tlchargez les donnes dans l'un des deux formats suivants : SPSS (prfrable) ou ASCII (difficile).

Description des tapes dans SPSS

Menu Analyse --> Comparer les moyennes --> Test T pour chantillon uniqu Une fentre du mme nom s'ouvre. En utilisant les flches en forme de triangles, placez la variable Productivit des travailleurs dans la bote Variables tester . crivez dans la case Valeur de test le chiffre 5. C'est la valeur contre laquelle la moyenne de la variable Productivit des travailleurs est teste.

Si vous cliquez sur le bouton Option , vous pouvez choisir l'intervalle de confiance :

Cliquer sur le bouton OK pour faire faire le calcul par SPSS.

Interprtation des rsultats


Dans l'explorateur de rsultats, cliquez sur Statistiques sur chantillon unique dans la section Test-t. Vous obtenez les statistiques pour notre variable. Cela vous permet de reconstituer facilement les calculs si vous le voulez.

La variable Productivit des travailleurs a un effectif de 22 observations, une moyenne de 7 et un cart-type de 2,16 et l'erreur standard que nous appelons Erreur type vaut 0,65;

Avec ces donnes, SPSS calcule les rponses pour notre analyse :

On remarque en haut du tableau le titre : Test sur chantillon unique. Il est important de remarquer en dessous le titre de l'analyse Valeur du test = 5 . C'est--dire que l'on compare notre chantillon avec la valeur de notre hypothse 5.

t = 3.086 : valeur critique Z, SPSS utilise le nom t au lieu de Z . Statistique utilise pour tester l'hypothse nulle selon laquelle deux populations ont la mme moyenne; ddl = 21 : degr de libert. Se calcule en soustrayant du nombre d'observations, 22 dans ce cas, le nombre de paramtres, 1 dans ce cas; Sig. (bilatrale) = 0,006. Le niveau de signification ou en d'autres mots la probabilit d'obtenir ce rsultat par hasard. Si le niveau de signification est trs petit, moins de 0,05, on rejette l'hypothse nulle. En d'autres termes, un niveau de signification faible indique que les rsultats ne sont probablement pas dus au hasard. Dans notre cas la probabilit est de 0,006, il y a donc 0,6 % de chance d'obtenir ce rsultat par hasard. Nos donnes tablissent clairement que les travailleurs immigrants ont une moyenne diffrente de 5.

Diffrence moyenne = 2. C'est la diffrence entre la moyenne de nos observations, 7 dans notre cas, et 5 la valeur de test que nous avons crit au dbut du test; Intervalle de confiance 95 % de la diffrence. Intervalle bas sur les diffrences entre les moyennes des chantillons. Si l'intervalle calcul par SPSS ne contient pas 0, la diffrence entre la moyenne de notre chantillon et celle de l'hypothse prsente une diffrence assez importante pour rejeter l'hypothse nulle : o Infrieur = 0,65. Borne infrieure de l'intervalle; o Suprieur = 3,35. Borne suprieure de l'intervalle.

Procdure pour les pourcentages


Avec des pourcentages, vous utilisez la mme procdure que pour les moyennes. Entrez la fraction au lieu du pourcentage dans la case valeurs de tests, c'est--dire 0,50 au lieu de 50.

Raliser un questionnaire
1. Raliser une enqute de terrain consiste interroger la clientle cible au moyen d'un questionnaire. Ce travail consiste : 1) Choisir un chantillon de personnes questionner. 2) Dfinir le type de questions poser : questions fermes, ouvertes, 3) Structurer le questionnaire. 4) Dterminer l'endroit o doit se drouler l'enqute (dans la rue, par courrier, sur internet, ). 5) Raliser l'enqute : choix de la date, des interviewer, etc... 6) Organiser la saisie et traiter les rsultats : tris plat, tris croiss, moyennes.

Les mthodes d'chantillonnage le contenu du questionnaire Les mthodes d'chantillonnage

Pour des raisons de temps et de cots, il est quasiment impossible d'interroger tous les clients potentiels prsents sur une zone d'enqute (recensement). Le porteur de projet doit donc calculer et dterminer un chantillon reprsentatif de la population tudier.

Combien faut-il interroger de personnes ?


On pourrait penser que plus un chantillon est important plus il donnera des rsultats satisfaisants. En fait, la taille de l'chantillon repose surtout sur un compromis entre : - le degr de prcision que l'on souhaite atteindre, - le budget affect l'enqute, - le temps dont on dispose pour raliser le sondage et analyser les rsultats. Un porteur de projet qui interroge 800 personnes n'obtiendra pas des rsultats deux fois plus fiables que s'il en interview 400. Par contre, les cots de l'tude doubleront invitablement. Ainsi pour dterminer la taille de l'chantillon, il est fortement recommand de se rapprocher d'un conseiller spcialis dans les enqutes, d'une junior-entreprise ou d'un cabinet conseil.

Quelle mthode d'chantillonnage utiliser ?


Aprs avoir dtermin le nombre de personnes interroger, il faut choisir la mthode qui dterminera les personnes interroger. Ce choix dpendra de la possession ou non d'une liste complte et de sa fiabilit. Par exemple l'annuaire "France Telecom" rfrence aujourd'hui moins de 90 % des abonns tlphoniques. En effet, les abonns sur liste rouge et ceux bnficiant de la tlphonie sur IP n'y figurent pas. Ainsi, utiliser un annuaire ne garantit pas d'obtenir une liste jour. Lorsque l'on ne dispose pas d'une liste complte et fiable, on choisit gnralement la mthode des quotas, trs utilise du fait de sa simplicit. Il suffit en effet : - de prendre en compte des statistiques dfinissant la rpartition d'une population globale : ge, sexe, catgories socioprofessionnelles, (Cf. Trouver des informations), - et de la reproduire l'image d'une maquette en "modle rduit" pour constituer l'chantillon. Exemple d'chantillon par la mthode des quotas : un porteur de projet souhaite installer une entreprise dans la rgion bordelaise. Il dsire interroger 400 consommateurs situs dans sa future zone d'implantation et prend comme modle la rpartition de la population en Aquitaine d'aprs les chiffres INSEE.
Rpartition population Hommes Femmes 20 39 ans 40 59 ans 60 74 ans 75 ans et plus Agriculteurs exploitants Artisans, commerants, chefs d'entreprise Cadres Professions intermdiaires Employs Ouvriers Retraits Autres personnes sans activit 48 % 52 % 33 % 36 % 19 % 12 % 2% 4% 5% 11 % 16 % 14 % 25 % 23 % Echantillon 192 208 132 144 75 49 0 8 16 21 44 65 54 101

Dans cet exemple, l'enquteur (qui est gnralement le porteur de projet) devra interroger 192 hommes et 208 femmes, et suivre, en fonction des objectifs qu'il s'est fixs, les autres cls de rpartition, afin de "coller" la population cible.
Un conseil : ne pas multiplier les critres de segmentation, ce qui pourrait rendre l'enqute ingrable sur le terrain.

Les autres mthodes


Il existe videmment d'autres mthodes mais celles-ci seront utiliser en fonction : - de l'importance de la taille de l'chantillon, - de la qualit et de l'existence de listes, - du temps ncessaire pour administrer l'enqute, - et bien-sr du budget dont on dispose. Ces diffrentes mthodes ne seront pas dveloppes dans la mesure o elles sont peu utilises par les novices.
Cette mthode pourrait s'apparenter un tirage au sort. En effet, des instructions prcises sont donnes et doivent tre appliques scrupuleusement. Par exemple "Interroger tous les personnes d'une rue habitant aux numros pairs. S'il s'agit d'un immeuble, interroger les appartements situs droite sur le palier" Contrairement la mthode des quotas, l'intervieweur ne peut pas influer sur le choix des personnes interroger. Cette mthode est utilise lorsqu'il est difficile de se procurer une liste exhaustive de la population tudie. Il est tout d'abord ncessaire de dcouper la population en grappes notamment gographique (par exemple les quartiers ou les arrondissements d'une ville) puis de tirer au hasard certaines de ces grappes. Enfin, il faut recenser tous les individus des grappes choisies. Si l'tablissement d'une liste exhaustive n'est pas possible dans l'une des grappes, un nouveau tirage au hasard devra tre ralis. Il s'agit d'une mthode qui requiert : l'utilisation d'une liste exhaustive, une trs bonne connaissance de la rpartition de la population tudie par des strates en lien avec l'objet de l'enqute. Il faut dterminer le nombre d'individus interroger par strate (sexe, ge,). La taille de l'chantillon sera fixe proportionnellement la population globale et un tirage au hasard sera effectu dans chaque strate.

La mthode des itinraires

L'chantillonnage en grappes

L'chantillonnage par strates

le contenu du questionnaire
Les rgles de base respecter
Ne jamais oublier les objectifs atteindre : quelles sont les informations accumuler ? A quoi vont-elles servir ? Ce sont les objectifs qui guident la rdaction du questionnaire. Toujours proposer des questions courtes, facilement comprhensibles de tous. Relire et faire relire le questionnaire : les questions doivent se suivre et s'enchaner sans problme. Un questionnaire structur permettra aux sonds de rpondre plus spontanment.

Inutile de rdiger un long questionnaire : l'interview se lassera trs vite et y mettra fin prmaturment ou rpondra sans forcment rflchir pour se dbarrasser d'un exercice devenu ennuyeux. Au sein d'un questionnaire, le choix du type de questions aura galement une incidence sur les rsultats de l'enqute. Voici les types les plus courants :
Type d'interrogation La question ferme choix unique Exemple : - Quel ge avez-vous ? - Possdez vous un ordinateur ? oui non La question ferme choix multiples Exemple : Comment avez-vous connu le site de l'APCE ? - par un moteur de recherche - par un organisme de conseil & d'accompagnement - par la presse La question ouverte Elle laisse la libre parole l'interview. Exemple : Que pensez-vous de l'installation d'une suprette dans le quartier ? Les chelles Elles mesurent, l'aide d'un rapport de grandeur, l'avis ou l'attente du sond sur certains points prcis de la satisfaction d'un service ou produit. Exemple : Dans quelle mesure tes-vous satisfait des services de votre garagiste ? |10 |9 |8 |7 |6 |5 |4 - Spontanit des rponses recueillies. - Richesse des contenus. - Difficile dpouiller et analyser les rsultats. - Risque d'un grand nombre de nonrponses. - Simplicit de traitement et de dpouillement. Avantages - Rapidit d'administration. - Simplicit de traitement. Inconvnients

- Ne se prte pas l'tude du comportement des sonds.

- Influence les personnes interroges par des rponses proposes. - Difficile pour le sond de mmoriser une longue liste d'lments. Les propositions cites en dbut ou en fin de liste sont souvent choisies par dpit, ou bien la question n'obtient pas de rponse.

- Nuance quantitativement les rponses aux questions qualitatives.

- Quelquefois difficile mettre en place. - Risque de retrouver des mesures mdianes pour les indcis sur une chelle compose d'un nombre impair de graduation.

|3 |2 |1 - Trs satisfait (8 10) - Plutt satisfait (4 7) - Plutt insatisfait (1 3)

La structuration du questionnaire Quelques rgles garder l'esprit : Plus le questionnaire sera long, plus il sera difficile de trouver un nombre important de personnes qui accepteront d'y rpondre. L'ordre des questions agit sur le rsultat de l'enqute. Il est donc ncessaire de structurer le questionnaire en utilisant notamment "la mthode de l'entonnoir", qui consiste : - dans un premier temps poser des questions d'ordre gnral, - puis, peu peu, aboutir des questions prcises, voire trs personnelles. Toujours remercier l'interview pour sa participation l'enqute. Insrer si possible une "question de contrle" permettant de vrifier le srieux ou la cohrence des rponses du sond, en l'interrogeant sur un sujet dj abord plus tt dans le questionnaire. Enfin, pour gagner en rapidit de saisie des rponses lors du traitement du questionnaire, numroter chaque question (Q1, Q2, ) et codifier les rponses. Exemple : On n'indiquera pas : Question 6 Consommez vous du pain ? : - si la rponse est oui, question suivante, - si la rponse est non, passer la question n 20 Mais : Q6 Consommez vous du pain ? a : Oui ==> Q7 b : Non ==> Q20 L'intervieweur entourera la rponse a ou b. Pour les questions ouvertes, leurs rponses seront codifier aprs l'administration du questionnaire.

Attention ! Tout questionnaire doit tre pralablement test auprs d'une petite partie de l'chantillon. Ce test en grandeur nature permet de reprer des incohrences dans le contenu et dans le "droul" du questionnaire. Les premires analyses des rponses peuvent galement mettre l'accent sur des problmes bien plus profonds : un mauvais ciblage de l'chantillon, l'utilisation d'une liste obsolte, un lieu inadapt pour administrer le questionnaire, Il vaut mieux se rendre compte d'une erreur au moment du test qu'au dpouillement final de l'enqute.

L'administration du questionnaire
Le type d'administration du questionnaire dpend de plusieurs facteurs : du type d'enqute, de la qualit et du nombre de personnes interroges, des informations releves, mais aussi et surtout du cot (on y revient toujours). Il est donc conseill de chiffrer le plus finement possible ces besoins techniques et humains.
C'est le type d'enqute le plus utilis. Ralis dans la rue, au domicile des sonds, etc., il permet de toucher directement le cur de la population cible. Il prsente galement l'avantage de recueillir les ractions et commentaires effectus par les interviews. Par contre, il ncessite de runir et de former une quipe plus importante qui doit tre disponible pendant un laps de temps plus ou moins long (une journe, une semaine,). Les cots de formation et d'immobilisation de ces enquteurs peuvent considrablement alourdir le budget de l'tude. On peut naturellement tre tent d'administrer seul son questionnaire sur un lieu de passage important situ proximit de son futur emplacement. Dans ce cas, il faut absolument vrifier que les sonds interrogs correspondent vritablement la cible recherche et s'obliger ne pas influer sur les rponses...

Le face face

C'est une mthode d'administration rapide et conomique. Toutefois plusieurs cueils peuvent rendre difficile la collecte des informations : - la liste des numros de tlphone des interviews est rarement jour, Les enqutes - en moyenne, plusieurs appels au mme numro seront ncessaires pour par contacter l'interlocuteur, tlphone - le nombre de "non rponses" : pour un sond, Il est plus facile de mettre fin au questionnaire au tlphone qu'en face face : "Je n'ai pas le temps de vous rpondre". Il sera donc important de raliser un questionnaire bref compos de questions courtes. Tout comme l'enqute tlphonique, l'enqute par courrier runit un cot attrayant et une simplicit de mise en place. Nanmoins, les taux de retour sont en gnral trs faibles (pas plus de 5 % dans certains cas). Il faut donc : Les enqutes prvoir une enveloppe T ou une enveloppe pr-timbre afin de faciliter le retour des questionnaires remplis, par voie rdiger un questionnaire compos de questions courtes et simples. postale Il est galement courant de motiver les interviews en leur proposant de participer un jeu par tirage au sort. Celui-ci est rserv aux seuls individus acceptant de rpondre au questionnaire.

Ces dernires annes, les enqutes en ligne ont pris une place de plus en plus importante sur le rseau. Il est vrai que cette formule rassemble de nombreux avantages : - le questionnaire est disponible auprs d'un nombre important de sonds simultanment partout dans le monde et tout moment du jour et de la nuit, - le traitement des rsultats (tris plat) peut tre ralis quasiment en temps rel, - le cot d'une telle enqute est trs attractif. Les enqutes Cependant, ces atouts ne doivent pas occulter que tout le monde n'est pas quip d'une connexion internet et que l'tude d'un march ne revt pas simplement une par internet porte nationale ou internationale. Bien souvent l'objectif d'un porteur de projet consistera acqurir des connaissances sur les attitudes de consommateurs voluant sur un march dont la zone gographique est locale voire rgionale. A visiter, deux sites (liste non exhaustive) spcialiss dans les tudes par internet : www.creatests.com www.opremys.net

Le traitement du questionnaire
Une fois les questionnaires remplis, un autre processus doit tre entam : le dpouillement des rsultats. Avant de se lancer dans ce long travail de saisie et d'analyse, il est fortement conseill de :

Choisir le bon outil de traitement d'enqute.


Pour faciliter la saisie des rponses et leur analyse, le traitement s'effectue exclusivement sur informatique en utilisant des logiciels spcialiss ou des applications "maisons". Plusieurs logiciels existent sur le march mais la plupart s'adressent aux professionnels du marketing ou aux cabinets d'tudes. Leur utilisation requiert une formation et une utilisation rgulire. Leur cot est galement en rapport avec leur puissance d'analyse et de fonctionnalit. S'adresser une junior-entreprise ou un cabinet est une solution pour ne pas avoir acqurir de tels logiciels. Par contre, si l'on souhaite grer seul cette phase de l'enqute, il faut dvelopper au pralable une application sur un tableur ou un gestionnaire de base de donnes. Il est vident que ce travail de dveloppement s'adresse des utilisateurs avertis de ces logiciels informatiques.

Codifier les rponses des questions ouvertes.


Comme cela a t prcis prcdemment, les questions ouvertes permettent de laisser la libre parole aux sonds. Toutefois pour faciliter leur saisie, ces riches informations vont devoir tre analyses et regroupes. L'exercice consiste relever toutes les rponses de ce type de question et ensuite les rassembler sous des groupes d'ides similaires. Par exemple la question "Comment jugez vous la qualit du pain vendu dans la

boulangerie situe rue de la Rpublique ?" , les interviews ont rpondus "franchement pas terrible" - "moyen" - "bon" - "passable" - "pas assez cuit" "immangeable", etc. Si les qualificatifs sont trs nombreux et diffrents, il est impossible de faire ressortir des ides phares. "Immangeable" et "pas terrible" pourrait donc tre regroups sous l'ide de "mauvaise qualit". Il est prfrable d'effectuer cet exercice plusieurs afin d'viter les interprtations "partisanes".

Organiser srieusement la saisie.


Afin d'viter de saisir deux fois le mme questionnaire, il est ncessaire de travailler dans le calme, en utilisant un plan de travail dgag. Une fois le questionnaire saisi, il faut le classer et le marquer d'un trait de couleur visible. La saisie termine, les rsultats tant attendus peuvent alors s'exprimer en chiffres. Pour faciliter l'analyse, les rsultats sont couramment traits sous la forme de tris plat, tris croiss et de moyennes. Les tris plat : ils sont les plus utiliss car trs simples mettre en place. Il s'agit d'une simple rpartition des rponses. Exemple : Q.1 Achetez vous du pain ? vvv a. Oui b. Non Totaux Nombre de rponses 154 11 165 % 93,3 % 6,7 % 100 %

Les tris croiss : il s'agit de runir sous un mme tableau le croisement des rsultats de deux variables ou plus. Le choix de croiser les rsultats d'une question une autre est motiv par l'analyse et la connaissance plus fine des rponses des personnes interroges. Attention la multiplication des tris croiss allonge le temps d'analyse des rsultats.

Exemple : Les rsultats des questions Q.1 et Q.20 sont croiss : Q.1 "Achetez vous du pain ?" a. Oui b. Non Q.20 "Quel est votre catgorie socioprofessionnelle ?" a. Agriculteurs exploitants b. Artisans, commerants, Chefs d'entreprise c. Cadres d. Professions intermdiaires e. Employs f. Ouvriers

g. Retraits h. Autres personnes sans activit


xxx a. Agriculteurs exploitants b. Artisans, commerants, Chefs d'Entreprise c. Cadres d. Professions intermdiaires e. Employs f. Ouvriers g. Retraits h. Autres personnes sans activit Totaux Les moyennes 1 5 26 38 40 28 13 3 154 a. Oui 0 1 4 2 1 1 1 1 11 b. Non 1 6 30 40 41 29 14 4 165 Totaux

Sur certaines questions ouvertes rpertoriant des informations chiffres, il est souvent ncessaire de faire ressortir les rsultats sous la forme de moyennes. C'est particulirement le cas lors de l'analyse de donnes portant sur l'ge de la population interroge, l'estimation du prix d'un produit ou d'un service, Une fois les rsultats de l'enqute connus et runis sous la forme de tableaux, le porteur de projet va devoir extraire les lments phares en rdigeant un rapport d'tude.