Vous êtes sur la page 1sur 5

Unité 5 : Sta+s+ques

Par+e 1 : Techniques et erreurs d’échan+llonnage :

A. Vocabulaire sta+s+que :
Une étude sta+s+que consiste en une collecte de données concernant des caractères rela+fs à un groupe
d’individus ou d’unités selon différentes techniques, suivie d’une analyse rigoureuse, d’une interpréta+on
mathéma+que et d’une représenta+on convenable des données collectées. Le tableau ci-dessous
comporte le vocabulaire u+lisé lors d’une étude sta+s+que.

Popula'on Ensemble des individus ou des unités sur lesquels on effectue une étude sta+s+que.
Recensement Recueil des données rela+ves à la totalité de la popula+on.
Échan'llon Sous-ensemble de la popula+on choisi au hasard.
Sondage Recueil des données rela+ves à un échan+llon.
Variable qualita've Caractère non quan+fiable pouvant être divisée en catégories.
Variable quan'ta've Caractère quan+fiable prenant des valeurs discrètes (isolées) ou con+nues.
Effec'f Nombre d’individus ayant la même modalités ou valeurs de la variable.
Effec'f cumulé croissant Somme de l’effec+f d’une valeur et des effec+fs des valeurs qui lui sont inférieurs.
Fréquence Rapport de l’effec+f d’une valeur et de l’effec+f total.
Fréquence cumulée croissante Somme de la fréquence d’une valeur et des fréquences des valeurs qui lui sont inférieurs.

N.B : Les effec'fs cumulés croissants et les fréquences cumulées croissantes concernent uniquement les
variables quan'ta'ves.

Exemple 1 :
1. Le type d’ailes d’une popula+on de drosophiles représente une variable qualita+ve dont les catégories
sont normales et ves+giales.
2. Le nombre de sépales d’une popula+on de fleurs représente une variable quan+ta+ve discrète.
3. Le poids en Kg d’une popula+on d’étudiants représente une variable quan+ta+ve con+nue.

B. Erreurs d’échan+llonnages:
Un recensement représente l’approche la plus précise lors d’une étude sta+s+que. Cependant, la collecte
de données de toute une popula+on est une tâche non pra+que. Pour cela, on a recours à des sondages.
Pourtant, lors des sondages des erreurs d’échan+llonnages reliées à la fiabilité des sources et les biais
d’échan+llonnages se présentent. Quelles sont les types de ces erreurs et comment les éviter ?

a) Erreurs aléatoires d’échan7llonnages : ces erreurs se produisent en raison de la variabilité naturelle


des échan+llons. Ces erreurs sont inévitables.

Exemple 2 :
Si vous prenez plusieurs échan+llons de la même popula+on, vous ob+endrez probablement des
résultats légèrement différents en raison de la variabilité naturelle des individus.

b) Erreurs de mesures : la valeur mesurée est différente de la valeur exacte ou une ques+on est
structurée de façon à favoriser une réponse par rapport aux autres.
Exemple 3 :
1. Lors de la collecte des données sur la taille des individus d’un échan+llon, les tailles enregistrées
sont légèrement différentes des tailles exactes de chaque individu. Pour minimiser ces erreurs on
peut mesurer avec le plus de précision possible.
2. À la suite d’une décision du gouvernement de réduire le financement consacré au domaine de
l’éduca+on en faveur du domaine de la santé publique, un journaliste pose la ques+on suivante :
« Êtes-vous d’accord avec le plan du gouvernement à réduire le financement consacré à
l’éduca+on? », ce qui incite les individus à répondre par un Non. Pour éviter une telle erreur, la
ques+on doit être : « Qu’en pensez-vous quant à la décision du gouvernement à diminuer le
financement de l’éduca+on en faveur de la santé publique ? »

c) Erreurs de couverture : ce\e erreur se produit quand l’échan+llon choisit n’est pas représenta+f de la
popula+on étudiée.

Exemple 4 :
Dans le cadre d’une étude sta+s+que menée sur la santé des abeilles sur une certaine île :
1. Si on choisit un échan+llon de 10 abeilles, alors notre résultat n’est pas fiable puisque la taille de
notre échan+llon n’est pas suffisamment large. Afin de résoudre ce problème, il suffit de choisir
un échan7llon de taille suffisamment large.
2. Si on choisit un échan+llon formé de toutes les abeilles d’une seule ruche, alors notre résultat
n’est pas fiable puisque la ruche choisie peut-être dans un état de stress, par suite, les résultats
obtenus sont biais. Afin de résoudre ce problème, il faut choisir plusieurs ruches localisées dans
des zones différentes de l’îles ce qui nous donne des résultats non biais.

d) Erreurs de non-réponse : où un grand nombre d’individus ne répond pas au sondage. Afin d’éviter de
telles erreurs, on doit s’assurer que notre sondage est accessible à tous.

Exemple 5 :
Tout individu non familier avec la technologie se trouve incapable de répondre un sondage en ligne.
Ce\e par+e de la popula+on serait alors mal représentée.

C. Techniques d’échan+llonnage :
a) Échan7llonnage aléatoire simple : Ce\e technique consiste à choisir un échan+llon de taille n à par+r
d’une popula+on tel que :
- Chaque individu à la même chance d’être sélec+onné que les autres.
- Chaque combinaison de n individu à la même chance d’être sélec+onnée que les autres.

Example 6:
Supposons qu’on doit choisir un échan+llon de 3 élèves parmi les 30 élèves d’une classe. Un
échan+llonnage aléatoire simple consiste à donner un numéro à chaque élève, placer ces numéros
dans un bocal et +rer au hasard 3 numéros. De ce\e façon :
!
- Chaque élève a une chance "# d’être sélec+onné.
- Chaque combinaison de 3 élèves, a la même chance d’être sélec+onnée que les autres.
b) Échan7llonnage systémique : Ce\e technique consiste à choisir les individus de l’échan+llon sur des
intervalles réguliers.

Example 7 :
! è%&
Supposons qu’une entreprise de comptabilité désire choisir les dossiers de !# de leurs clients au
hasard. Un échan+llonnage systémique consiste à choisir un dossier au hasard parmi les 10 premiers
dossiers, par exemple le dossier numéro 3, ensuite on choisit le 13ème, 23ème, 33ème, 43ème …… dossiers.

c) Échan7llonnage de commodité : Ce\e technique consiste à choisir les individus de façon pra+que
pour l’enquêteur : ceux qui vont surement répondre, les plus accessible …. Ce\e technique laisse place
au biais.

Example 8 :
Lors d’un sondage sur les enjeux environnementaux, l’enquêteur décide de passer dans un « mall »
pour faire son sondage. Ensuite, il ques+onne les individus :
- Marchant près de lieu.
- Marchant lentement.
- Non engagé sur leurs portables ou dans des conversa+ons.

d) Échan7llonnage par quotas et stra7fié: Ce\e technique consiste à subdiviser un groupe en plusieurs
sous-groupes pour que chaque sous-groupe soit bien représenté. Si les individus de chaque sous-
groupe sont choisis aléatoirement on parle d’échan+llonnage stra+fié, s’ils sont choisis de façon
pra+que (comme l’échan+llonnage de commodité) on parle d’échan+llonnage par quotas.

Example 9 :
Une école effectue un sondage auprès des étudiants concernant les repas servi à la can+ne. Pour
s’assurer que chaque niveau est bien représenté, l’école subdivise les étudiants en sous-groupe selon
les niveaux. Si dans chaque sous-groupe, les étudiants sont choisis au hasard alors il s’agit d’un
échan+llonnage stra+fié, cependant, si les élèves de chaque sous-groupe sont choisis d’une façon qui
convient à l’enquêteur alors il s’agit d’un échan+llonnage par quotas.

Exercice commenté 1 :
Une entreprise désire connaître l’opinion de ses clients en ce qui concerne le nouvel emballage d’un de
ses produits. Ce\e entreprise décide de faire le sondage auprès de 5% de ses clients en u+lisant la
technique d’échan+llonnage systémique. Expliquez comment l’échan+llonnage aura lieu.

Solu'on :
' !
5% = !## = (# .
Donc chaque 20 clients, un individu serai choisi pour faire par+e du sondage.
Si pour les 20 premiers clients ont choisi le client numéro 7, donc on choisit ensuite le 27ème, 47ème, 67ème
clients et ainsi de suite.
Exercice commenté 2 :
Dans une école, les étudiants sont partagés entre 137 étudiants de niveau 8, 152 étudiants de niveau 9,
174 étudiants de niveau 10, 168 étudiants de niveau 11 et 121 étudiants de niveau 12. Un échan+llon de
50 étudiants doit être sélec+onné pour un sondage sur les repas servi à la can+ne. Expliquez comment
choisir cet échan+llon de façon que chaque niveau soit bien représenté en évitant le biais.

Solu'on :
Il s’agit d’un échan+llonnage stra+fié.
Nombre total des étudiants : 137 + 152 + 174 + 168 + 121 = 752
Pour l’échan+llon :
!")
- Niveau 8 : )'( × 50 ≈ 9
!'(
- Niveau 9 : )'( × 50 ≈ 10
!)*
- Niveau 10 : )'( × 50 ≈ 12
!+,
- Niveau 11 : × 50 ≈ 11
)'(
!(!
- Niveau 12 : × 50 ≈ 8
)'(

Exercices :
1. Préciser le type de chacune des variables ci-dessous :
a) Le nombre des pompes de pétroles dans une sta+on.
b) Le marque de la voiture qu’une personne conduit.
c) La température moyenne dans différentes villes.
2. Parmi 50 personnes ques+onnées dans un « shopping mall » de Toronto, 20 avaient regardé en directe
une par+e de Hockey l’année précédente. En se basant sur ce sondage, on a conclu que 40% de la
popula+on du Canada regarde une par+e de Hockey en directe chaque année. Donnez deux raisons
pour jus+fier que ce\e conclusion est non fiable et deux proposi+ons afin de la rendre plus fiable.
3. Jennifer veut es+mer la masse moyenne de 2000 moutons dans sa ferme. Elle choisit 10 moutons et
mesure leur masse moyenne puis elle considère la valeur obtenue comme étant celle des 2000
moutons. Donnez deux types d’erreurs dans cet échan+llonnage.
4. Un sondage sur les condi+ons de travail a été effectué auprès de 5000 employés. Précisez un type
d’erreurs possibles dans ce cas.
5. Une usine de chocolat produit 80 000 table\es de chocolats par jour. L’usine désire faire un contrôle
de qualité sur 2% de sa produc+on journalière en u+lisant un échan+llonnage systémique.
L’échan+llonnage commence par la 17ème table\e de chocolat.
a) Trouvez les 5 premières table\es qui seront échan+llonnées.
b) Trouvez la taille totale de l’échan+llon.
6. Le directeur d’une entreprise désire faire un sondage auprès de ses employés en ce qui concerne les
condi+ons de travail. L’entreprise comporte 10 chefs de département, 24 superviseurs, 65 spécialistes,
98 assistants et 28 internes. Sachant que le directeur désire sélec+onner un échan+llon de 30
employés, proposez une technique d’échan+llonnage qui permet une bonne représenta+on de tous
les postes sans laisser place au biais et expliquez la démarche à faire.
7. Une parade annuelle est effectuée dans une certaine ville. En moyenne 3540 visiteurs se présentent
chaque année. L’organisateur de l’évènement désire faire un sondage concernant la propor+on des
individus qui dépensent plus que 20$ sur la nourriture durant la parade. L’organisateur se met alors à
la porte d’entrée de l’évènement et ques+onne les 40 premiers visiteurs.
a) Préciser la technique d’échan+llonnage u+lisée et préciser un problème qu’elle peut présenter.
b) Proposez une meilleure technique d’échan+llonnage.

Solu7on :
1. a) Variable discrète b) Variable qualita+ve c) variable con+nue
2. L’échan+llon est de pe+te taille et on doit donc choisir un échan+llon de plus grande taille.
L’échan+llon est pris seulement au shopping mall de Toronto donc les individus qui ne fréquentent pas
ce mall ou vivent dans d’autres endroits du Canada sont mal représentés pour cela on doit mener
l’enquête dans différentes régions du Canada et non pas seulement dans les mall.
3. L’échan+llon est de pe+te taille : erreur de couverture.
Erreur de mesure.
4. Erreur de non-réponse.
5. a) 17, 67, 117, 167, 217 b) 1600 table\es.
6. 1 chef de département, 3 superviseurs, 9 spécialistes, 13 assistants, 4 internes.
7. a) Échan+llonnage de commodité. Un problème qui se présente est que les visiteurs qui arrivent au
début sont plus suscep+bles de dépenser plus que 20$ vu qu’ils restent plus de temps.
b)Une meilleure technique est un échan+llonnage systémique.

Vous aimerez peut-être aussi