Vous êtes sur la page 1sur 13

Département STAIC MASTER DPEIC

Recherche sur :

Théorie de l’échantillonnage

Réalisé par :
AIT OUMGHAR HOUDA
CHARKI SOUMIA
MAKHCHANE SOUKAINA
EL OUAD EL HABIBA

Année universitaire 2023- 20


Département STAIC MASTER DPEIC

L’échantillonnage, définition :

Échantillonnage est une technique qui consiste à sélectionner des membres individuels ou un sous-
ensemble de la population afin d’en tirer des conclusions statistiques et d’estimer les caractéristiques
de l’ensemble de la population. Différentes méthodes d’échantillonnage sont largement utilisées par
les chercheurs dans les domaines suivants études de marché de sorte qu’ils n’ont pas besoin d’étudier
l’ensemble de la population pour obtenir des informations exploitables.

Il s’agit également d’une méthode rapide et rentable, qui constitue donc la base de tout plan de
recherche. Les techniques d’échantillonnage peuvent être utilisées dans les logiciels d’enquête de
recherche pour une dérivation optimale.

Exemple

Supposons qu’un fabricant de médicaments souhaite étudier les effets secondaires


indésirables d’un médicament sur la population du pays. Dans ce cas, il est presque impossible
de mener une étude de recherche impliquant tout le monde. Dans ce cas, le chercheur décide
d’un échantillon de personnes de chaque pays démographique et les étudie, ce qui lui donne
des indications sur le comportement du médicament.

Les méthodes d’échantillonnage :

L’échantillonnage dans les études de marché est de deux types : l’échantillonnage probabiliste et
l’échantillonnage non probabiliste. Examinons de plus près ces deux méthodes d’échantillonnage.

1. Échantillonnage des probabilités : Échantillonnage probabiliste est une technique


d’échantillonnage dans laquelle le chercheur sélectionne quelques critères et choisit les
membres d’une population de manière aléatoire. Tous les membres ont une chance égale de
participer à l’échantillon avec ce paramètre de sélection.
2
Département STAIC MASTER DPEIC

Par exemple : dans une population de 1000 membres, chaque membre a 1/1000 de
chances d’être sélectionné pour faire partie d’un échantillon. L’échantillonnage
probabiliste élimine le biais d’échantillonnage dans la population et permet d’inclure
tous les membres dans l’échantillon.

2. Échantillonnage non probabiliste : Dans le cadre de l’échantillonnage, le chercheur sélectionne


au hasard des membres pour la recherche. Cette méthode d’échantillonnage n’est pas un
processus de sélection fixe ou prédéfini. Il est donc difficile pour tous les éléments de la
population d’avoir des chances égales d’être inclus dans un échantillon.

Types d’échantillonnage probabiliste avec exemples :

• L’échantillonnage aléatoire simple : L’une des meilleures techniques d’échantillonnage


probabiliste qui permet de gagner du temps et d’économiser des ressources est
l’échantillonnage aléatoire simple. l’échantillonnage aléatoire simple méthode. Il s’agit d’une
méthode fiable pour obtenir des informations lorsque chaque membre d’une population est
choisi de manière aléatoire, simplement par hasard. Chaque individu a la même probabilité
d’être choisi pour faire partie d’un échantillon.

3
Département STAIC MASTER DPEIC

Exemple : dans une organisation de 500 employés, si l’équipe des ressources humaines décide
d’organiser des activités de renforcement de l’esprit d’équipe, elle préférera probablement tirer
des jetons d’un bol. Dans ce cas, chacun des 500 employés a une chance égale d’être sélectionné.

• L’échantillonnage en grappes : L’échantillonnage en grappes est une méthode par laquelle les
chercheurs divisent l’ensemble de la population en sections ou grappes représentant une
population. Les grappes sont identifiées et incluses dans un échantillon sur la base de
paramètres démographiques tels que l’âge, le sexe, la localisation, etc. Il est donc très facile
pour un créateur d’enquête de tirer des conclusions efficaces à partir du retour d’information.

Exemple : Supposons que le gouvernement des États-Unis souhaite évaluer le nombre


d’immigrants vivant dans la partie continentale du pays. Dans ce cas, ils peuvent le diviser en
groupes basés sur des États tels que la Californie, le Texas, la Floride, le Massachusetts, le
Colorado, Hawaï, etc. Cette façon de mener une enquête sera plus efficaces car les résultats
seront organisés par État et fourniront des données éclairantes sur l’immigration.

• L’échantillonnage systématique : Les chercheurs utilisent la méthode d’échantillonnage


systématique choisir les membres d’un échantillon d’une population à intervalles réguliers. Elle
nécessite la sélection d’un point de départ pour l’échantillon et la détermination de la taille de
l’échantillon qui peut être répétée à intervalles réguliers. Ce type de méthode d’échantillonnage
a une portée prédéfinie ; c’est donc la technique d’échantillonnage qui prend le moins de
temps.
Exemple : un chercheur a l’intention de collecter un échantillon systématique de 500 personnes
dans une population de 5 000 personnes. Il numérote chaque élément de la population de 1 à
5000 et choisit un individu sur 10 pour faire partie de l’échantillon (population totale/taille de
l’échantillon = 5000/500 = 10).
• Échantillonnage aléatoire stratifié : Échantillonnage aléatoire stratifié est une méthode dans
laquelle le chercheur divise la population en groupes plus petits qui ne se chevauchent pas mais
qui représentent la population entière. Lors de l’échantillonnage, ces groupes peuvent être
organisés, puis un échantillon peut être tiré de chaque groupe séparément.
Exemple : un chercheur cherchant à analyser les caractéristiques des personnes appartenant à
différentes catégories de revenus annuels créera des strates (groupes) en fonction du revenu
familial annuel. (moins de 20 000 $, 21 000 $ – 30 000 $, 31 000 $ – 40 000 $, 41 000 $ – 50 000

4
Département STAIC MASTER DPEIC

$, etc. Ce faisant, le chercheur conclut les caractéristiques des personnes appartenant à


différents groupes de revenus. Les spécialistes du marketing peuvent analyser les groupes de
revenus à cibler et ceux à éliminer pour créer une feuille de route qui produira des résultats
fructueux.)

Utilisations de l’échantillonnage probabiliste :

L’échantillonnage probabiliste a de multiples usages :

• Réduire les biais de l’échantillon : En utilisant la méthode d’échantillonnage probabiliste,


le biais de recherche dans l’échantillon dérivé d’une population est négligeable, voire inexistant.
La sélection de l’échantillon reflète principalement la compréhension et l’inférence du
chercheur. L’échantillonnage probabiliste permet d’obtenir une meilleure qualité la collecte de
données car l’échantillon représente correctement la population.
• Population diversifiée : Lorsque la population est vaste et diversifiée, il est essentiel d’avoir une
représentation adéquate afin que les données ne soient pas biaisées en faveur d’un seul groupe
démographique. démographique . Supposons, par exemple, que Square souhaite connaître les
personnes susceptibles de fabriquer ses dispositifs de point de vente. Dans ce cas, une enquête
menée auprès d’un échantillon de personnes aux États-Unis issues de différents secteurs
d’activité et milieux socio-économiques s’avère utile.
• Créer un échantillon précis : L’échantillonnage probabiliste aide les chercheurs à planifier et à
créer un échantillon précis. Cela permet d’obtenir des données bien définies.

Types d’échantillonnage non probabiliste et exemples

• Échantillonnage de commodité : Cette méthode dépend de la facilité d’accès aux sujets,


comme l’enquête auprès des clients d’un centre commercial ou des passants dans une rue très
fréquentée. Il est généralement appelé échantillonnage de commodité en raison de la facilité
pour le chercheur de la réaliser et d’entrer en contact avec les sujets. Les chercheurs n’ont
pratiquement aucune autorité pour sélectionner les éléments de l’échantillon, et cela se fait
uniquement sur la base de la proximité et non de la représentativité. Cette méthode
d’échantillonnage non probabiliste est utilisée lorsque le temps et le coût de la collecte du
retour d’information sont limités. Dans les situations où les ressources sont limitées, comme
5
Département STAIC MASTER DPEIC

dans les phases initiales de la recherche, l’échantillonnage de commodité est utilisé.


Par exemple : les startups et les ONG procèdent généralement à un échantillonnage de
commodité dans un centre commercial pour distribuer des brochures sur les événements à venir
ou la promotion d’une cause – elles se tiennent à l’entrée du centre commercial et distribuent
des brochures au hasard.
• Échantillonnage au jugé ou à dessein : Échantillons au jugé ou à dessein sont formés à la
discrétion du chercheur. Les chercheurs doivent tenir compte de l’objectif de l’étude et de la
compréhension du public cible.

Par exemple, lorsque des chercheurs souhaitent comprendre le processus de réflexion des
personnes intéressées par l’obtention d’un master. Les critères de sélection seront les suivants :
« Êtes-vous intéressé(e) par un master en … ? » et les personnes ayant répondu « Non » sont
exclues de l’échantillon.

• L’échantillonnage en boule de neige : L’échantillonnage en boule de neige est une méthode


d’échantillonnage que les chercheurs appliquent lorsque les sujets sont difficiles à retrouver. Par
exemple, il sera extrêmement difficile d’enquêter auprès des personnes sans abri ou des
immigrés clandestins. Dans ce cas, en utilisant la théorie de la boule de neige, les chercheurs
peuvent sélectionner quelques catégories à interroger et en tirer des résultats. Les chercheurs
utilisent également cette méthode d’échantillonnage lorsque le sujet est très sensible et ne fait
pas l’objet d’une discussion ouverte –

Par exemple, les enquêtes visant à recueillir des informations sur le VIH/sida. Peu de victimes
répondront d’emblée à ces questions. Toutefois, les chercheurs peuvent contacter des personnes
qu’ils connaissent ou des bénévoles associés à la cause pour entrer en contact avec les victimes
et recueillir des informations.

• Échantillonnage par quotas : En Échantillonnage par quotas Dans cette technique


d’échantillonnage, la sélection des membres se fait sur la base d’une norme préétablie. Dans ce
cas, comme un échantillon est formé sur la base d’attributs spécifiques, l’échantillon créé aura
les mêmes qualités que celles trouvées dans la population totale. Il s’agit d’une méthode rapide
de collecte d’échantillons.

6
Département STAIC MASTER DPEIC

Utilisations de l’échantillonnage non probabiliste

L’échantillonnage non probabiliste est utilisé dans les cas suivants :

• Créer une hypothèse : Les chercheurs utilisent la méthode d’échantillonnage non


probabiliste de créer une hypothèse lorsque l’on ne dispose que d’informations préalables
limitées ou inexistantes. Cette méthode permet un retour immédiat des données et constitue
une base pour des recherches ultérieures.

• Recherche exploratoire : Les chercheurs utilisent largement cette technique d’échantillonnage


lorsqu’ils mènent des recherches qualitatives, des études pilotes ou des recherches
exploratoires. recherche exploratoire.
• Contraintes budgétaires et temporelles : La méthode non probabiliste lorsqu’il y a des
contraintes de budget et de temps, et que certaines données préliminaires doivent être
collectées. Le plan d’enquête n’étant pas rigide, il est plus facile de choisir les répondants au
hasard et de leur faire remplir l’enquête ou le questionnaire.

Différence entre les méthodes d’échantillonnage probabiliste et non probabiliste

Méthodes d’échantillonnage probabiliste Méthodes d’échantillonnage non probabiliste

Définition L’échantillonnage probabiliste est une L’échantillonnage non probabiliste est une
technique d’échantillonnage dans laquelle technique d’échantillonnage dans laquelle le
des échantillons d’une population plus large chercheur sélectionne des échantillons sur la
sont choisis à l’aide d’une méthode basée sur base de son jugement subjectif plutôt que sur la
la théorie des probabilités. base d’une sélection aléatoire.

Également Méthode d’échantillonnage aléatoire. Méthode d’échantillonnage non aléatoire


connu sous le
nom de

7
Département STAIC MASTER DPEIC

Sélection de La population est sélectionnée au hasard. La population est sélectionnée arbitrairement.


la population

Nature La recherche est concluante. La recherche est exploratoire.

Echantillon Comme il existe une méthode pour La méthode d’échantillonnage étant arbitraire,
déterminer l’échantillon, les caractéristiques la représentation démographique de la
démographiques de la population sont population est presque toujours faussée.
représentées de manière concluante.

Temps Prend plus de temps à réaliser car la Ce type de méthode d’échantillonnage est
nécessaire conception de la recherche définit les rapide car ni l’échantillon ni les critères de
paramètres de sélection avant le début de sélection de l’échantillon ne sont indéfinis.
l’étude de marché.

Résultats Ce type d’échantillonnage n’est absolument Ce type d’échantillonnage est entièrement


pas biaisé ; les résultats sont donc également biaisé, et donc les résultats le sont également,
concluants. ce qui rend la recherche spéculative.

Hypothèse Dans l’échantillonnage probabiliste, il existe Dans l’échantillonnage non probabiliste,


une hypothèse sous-jacente avant le début de l’hypothèse est dérivée après avoir mené
l’étude, et cette méthode vise à prouver l’étude de recherche.
l’hypothèse.

Limites de l’´échantillonnage

L’´échantillonnage a pour but de fournir suffisamment d’informations pour pouvoir faire des
d´éductions sur les caractéristiques de la population. Mais bien entendu, les résultats obtenus d’un
échantillon à l’autre vont être en général différents et différents ´également de la valeur de la
caractéristique correspondante dans la population. On dit qu’il y a des fluctuations d’´échantillonnage.
Comment, dans ce cas, peut-on tirer des conclusions valables ? En d´exterminant les lois de
probabilités qui régissent ces fluctuations. C’est l’objet de ce chapitre.
8
Département STAIC MASTER DPEIC

Application : lois d’échantillonnage

En statistiques, il est en général impossible d’étudier un caractère sur toute une population de taille
N élevée. La théorie de l’échantillonnage se pose la question suivante : En supposant connus les
paramètres statistiques de la population, que peut-on en déduire sur les échantillons prélevés dans la
population ? On suppose que ces échantillons sont prélevés au hasard et que le tirage de ces
échantillons est effectué avec remise. L’ensemble de ces échantillons de taille n est appelé
échantillonnage de taille n.

On peut étudier dans ces conditions :

• la loi d’échantillonnage des moyennes,

• la loi d’échantillonnage des fréquences,

❖ Loi d’échantillonnage des moyennes

Loi d’échantillonnage des moyennes Étant donné une population de taille N et X une variable aléatoire
telle que E(X) = m et σ(X) = σ. Pour prélever les échantillons de taille n, on a procédé à n épreuves
indépendantes de variables aléatoires X1, X2, . . ., Xn de même loi que X. La variable aléatoire X̄n = (X1
+ X2 + · · · + Xn)/n associe à tout échantillon de taille n sa moyenne. D’après le théorème de la limite
centrée, pour n assez grand, on a :

Propriété 1

La loi d’échantillonnage de taille n de la moyenne X̄ n quand n ≥ 30, peut être approchée par la loi
normale N (m, σ /√n)

❖ Loi d’échantillonnage des fréquences

On étudie, dans une population de taille N, un caractère X suivant une loi de Bernoulli B(p), c’est-à-dire
que les éléments possèdent une certaine propriété d fréquence p. Dans un échantillon de taille n, on
répète n fois la même épreuve de façon indépendante. On obtient n variables aléatoires X1, X2, . . ., Xn
de même loi que X.

La variable aléatoire fn = (X1 + X2 + · · · + Xn) /n associe à tout échantillon de taille n la fréquence de


succès sur cet échantillon.

9
Département STAIC MASTER DPEIC

Propriété 2

La loi d’échantillonnage de taille n de la fréquence fn pour n « assez grand » peut être approchée par la
loi normale N

La densité :

La densité en théorie de l'échantillonnage fait référence à la densité de probabilité d'une variable


aléatoire dans le contexte de la collecte d'échantillons à partir d'une population. La théorie de
l'échantillonnage est une branche de la statistique qui étudie les méthodes d'obtention d'échantillons à
partir d'une population plus large, ainsi que les propriétés statistiques des échantillons obtenus.

La densité de probabilité est une fonction qui décrit la probabilité relative que la variable aléatoire
prenne une certaine valeur. Dans le contexte de l'échantillonnage, on s'intéresse souvent à la
distribution de la moyenne d'un échantillon, par exemple. Si la population d'origine suit une
distribution normale, la distribution de la moyenne des échantillons suivra également une distribution
normale.

La formule de la densité de probabilité de la moyenne d'un échantillon (lorsque les échantillons sont
suffisamment grands en vertu du théorème central limite) peut être donnée par la distribution normale
(ou gaussienne) :

Cette formule est basée sur le théorème central limite, qui stipule que la distribution des moyennes
d'échantillons tend vers une distribution normale, quelle que soit la distribution de la population
d'origine, à condition que la taille de l'échantillon soit suffisamment grande. La densité de probabilité
décrit la forme de cette distribution normale.

10
Département STAIC MASTER DPEIC

Exercices d’application :
Supposons que la durée de vie d'une ampoule électrique soit une variable aléatoire suivant une
distribution normale avec une moyenne de 800 heures et un écart-type de 50 heures. On
souhaite tirer un échantillon de 25 ampoules et estimer la durée de vie moyenne de l'ensemble
des ampoules produites.
1. Quelle est la distribution de la moyenne de l'échantillon (en termes de moyenne et d'écart-
type) selon la théorie de l'échantillonnage?
2. Si on tire un échantillon de 25 ampoules, quelle est la probabilité que la durée de vie moyenne
de l'échantillon soit inférieure à 790 heures?

Correction :
1. Distribution de la moyenne de l'échantillon :
Selon le théorème central limite, la distribution de la moyenne de l'échantillon suit une distribution
normale avec une moyenne égale à la moyenne de la population (μ=800) et un écart-type égal à l'écart-
type de la population divisée par la racine carrée de la taille de l’échantillon (σ/racine (n)). Dans ce cas,
la formule est la suivante :
Moyenne de l’échantillon ∼N (μ, (σ/racine(n)))
Où μ=800, σ=50, et n=25.

2. Calcul de la probabilité :
On souhaite trouver P(xˉ<790), c'est-à-dire la probabilité que la durée de vie moyenne de l'échantillon
soit inférieure à 790 heures. On utilise la table de la distribution normale standard ou un logiciel
statistique pour trouver cette probabilité.
P(xˉ<790)=P(Z< ((790−μ)/(σ/racine (n)))
En utilisant les valeurs données, on peut calculer cette probabilité.
Correction numérique :
1. La distribution de la moyenne de l'échantillon est N(800,50/25), soit N(800,10).
2. Calcul de la probabilité :
P(xˉ<790)=P(Z<(790−800)/10))=P(Z<−1)
En utilisant une table de distribution normale standard, on trouve que : P (Z<−1)≈0.1587.
Donc, la probabilité que la durée de vie moyenne de l'échantillon soit inférieure à 790 heures est
d'environ 0.1587, soit environ 15.87%.

11
Département STAIC MASTER DPEIC

Supposons qu'un fabricant de médicaments souhaite étudier la durée d'efficacité d'un nouveau
médicament sur la population du pays. La durée d'efficacité du médicament suit une
distribution normale avec une moyenne de 36 heures et un écart-type de 5 heures. Le fabricant
décide de tirer un échantillon de 30 patients pour estimer la durée moyenne d'efficacité du
médicament.

1. Quelle est la distribution de la moyenne de l'échantillon (en termes de moyenne et d'écart-


type) selon la théorie de l'échantillonnage?

2. Si on tire un échantillon de 30 patients, quelle est la probabilité que la durée moyenne


d'efficacité du médicament soit inférieure à 34 heures?

Correction :

1. Distribution de la moyenne de l'échantillon :

Selon le théorème central limite, la distribution de la moyenne de l'échantillon suit une distribution
normale avec une moyenne égale à la moyenne de la population (μ=36) et un écart-type égal à l'écart-
type de la population divisée par la racine carrée de la taille de l’échantillon (σ/racine (n)). Dans ce cas,
la formule est la suivante :

Moyenne de l’échantillon ∼N (μ, (σ/racine(n)))

Où μ=36, σ=5, et n=30.

2. Calcul de la probabilité :

On souhaite trouver P (xˉ<34), c'est-à-dire la probabilité que la durée moyenne d'efficacité du


médicament soit inférieure à 34 heures. On utilise la table de la distribution normale standard ou un
logiciel statistique pour trouver cette probabilité.

P(xˉ<34)= P(Z< ((34−μ)/(σ/racine (n)))

En utilisant les valeurs données, on peut calculer cette probabilité.

Correction numérique :

1. La distribution de la moyenne de l'échantillon est N (36,5/racine(30)), soit N(36,0.9129).

2. Calcul de la probabilité :
12
Département STAIC MASTER DPEIC

P (xˉ<34)=P (Z<0.912934−36)=P(Z<−2.19)

En utilisant une table de distribution normale standard, on trouve que P (Z<−2.19)≈0.014.

Donc, la probabilité que la durée moyenne d'efficacité du médicament soit inférieure à 34 heures est
d'environ 1.4%.

13

Vous aimerez peut-être aussi