Vous êtes sur la page 1sur 4

Introduction

Supposons que vous travailliez pour une grande entreprise et que votre superviseur vous demande de décider
si une nouvelle version d'un smartphone doit être produite et vendue. Vous commencez par réfléchir aux
innovations et aux nouvelles fonctionnalités du produit. Ensuite, vous vous arrêtez et réalisez les conséquences
de la décision. Le produit devra générer des bénéfices, alors la tarification et les coûts de production et de
distribution sont donc très importants. La décision d'introduire le produit repose sur de nombreuses
alternatives. Alors, comment saurez-vous? Par où commencer ?

Sans avoir une grande expérience dans l'industrie, il est essentiel de commencer à développer une intelligence
qui fera de vous un expert. Vous choisissez trois autres personnes avec qui travailler et vous les rencontrez. La
conversation porte sur ce que vous devez savoir et sur les informations et données dont vous avez besoin. Lors
de votre réunion, de nombreuses questions sont posées. Combien de concurrents sont déjà sur le marché? Comment sont
évalués les smartphones? Quelles sont les caractéristiques de conception des produits concurrents? Quelles sont les fonctionnalités
requises par le marché? Que veulent les clients dans un smartphone? Qu'est-ce que les clients aiment des produits existants? Les
réponses s'appuieront sur une veille stratégique constituée de données et d'informations collectées au
moyen d'enquêtes auprès des clients, d'analyses techniques et d'études de marché. En fin de compte,
votre présentation pour étayer votre décision concernant l’introduction d’un nouveau smartphone repose sur
les statistiques que vous utilisez pour résumer et organiser vos données, les statistiques que vous utilisez
pour comparer le nouveau produit aux produits existants, et les statistiques pour : estimer les ventes, les
coûts et les revenus futurs. Les statistiques seront au centre de la conversation que vous aurez avec votre
superviseur au sujet de cette décision très importante.

En tant que décideur, la statistique intervient comme un outil pour soutenir la prise de décision. N’a de bons
arguments que celui ou celle dont le raisonnement est appuyé par des statistiques bien choisies et bien
présentées (c’est la statistique descriptive). Ne peut définir de stratégie pertinente ou ne peut prévoir efficacement
les quantités à produire, acheter ou vendre, que celui ou celle qui sait modéliser les données et en extraire les
lois des phénomènes en jeu (c’est la statistique inférentielle). Ainsi donc, l’analyse statistique appliquée aide les
managers à prendre des décisions efficientes. Le programme à aborder s’articule comme suit :

Chapitre 1 : Théorie de l’échantillonnage


Chapitre 2 : Estimation
Chapitre 3 : Tests statistiques (Paramétriques)
Chapitre 4 : Tests statistiques (non paramétriques)

1
Chapitre 1 : Théorie de l’échantillonnage
1. Introduction

La problématique de l’inférence statistique consiste, à partir d’un échantillon de données


provenant d’une population de caractéristiques inconnues, à déduire des propriétés sur la
population en contrôlant au mieux le risque de se tromper.

Le problème général est le suivant : on souhaite étudier une caractéristique (appelée aussi
caractère ou variable statistique) associée à des individus appartenant à une population. Rappelons
qu'une population est un ensemble, fini ou non, d'éléments que l'on souhaite étudier. Il peut s'agir par exemple
d'êtres humains (adultes, enfants, chômeurs, salariés, etc.), d'animaux ou encore d'objets
(entreprises, voitures, ordinateurs, incendies, accidents, etc.). La caractéristique étudiée peut être
qualitative (par exemple la catégorie socio-professionnelle de 1'individu : cadre, employé, etc.) ou
quantitative (par exemple la taille ou le salaire de l’individu). Pour mener à bien cette étude, la
statistique propose deux solutions : le recensement et l'échantillonnage.

Un recensement consiste à mesurer, ou observer, la (ou les) caractéristique(s) d'intérêt de façon exhaustive pour
tous les individus de la population. Une telle solution n'est bien évidemment applicable que lorsque la
taille de la population étudiée est relativement faible. Dans la plupart des cas, il est nécessaire de
recourir à la seconde solution: l'échantillonnage.
L'échantillonnage se définit comme la méthode de construction d'un échantillon, qui est un
sous ensemble de la population. Au sens strict, un échantillon consiste en une collection d'individus
sélectionnés dans la population statistique étudiée. Le nombre d'individus sélectionnés dans
l'échantillon correspond à la taille de l'échantillon, notée . On parle alors de −échantillon.

Quel est l'intérêt de constituer un échantillon ? L'idée est d'étudier les caractéristiques d'intérêt
pour les individus sélectionnés dans l'échantillon afin d'en tirer de l'information sur ces mêmes
caractéristiques pour l'ensemble de la population. Par conséquent, d'un côté la dimension de
l'échantillon doit être suffisamment importante pour que l'on puisse obtenir une information fiable
sur la population, mais d' un autre côté elle doit être la plus petite possible afin de limiter le coût
de l'enquête.

2
Une question se pose à ce stade : comment choisir les individus qui composent l'échantillon
? La réponse à une telle question renvoie aux différentes méthodes d’échantillonnage.

2. Méthodes d’échantillonnage
Un échantillonnage correspond à des tirages indépendants et équiprobables d’individus au sein de la
population statistique. On associe alors à chaque individu une variable aléatoire X i , dont on
observe une seule réalisation xi .

Il y a plusieurs manières de choisir un échantillon d’une population, qu’on peut regrouper dans
deux catégories :
─ Échantillonnage non aléatoire (ou déterministe),
─ Échantillonnage aléatoire
Échantillonnage non aléatoire (ou sur la base du jugement)
Dans ce cas, le statisticien ou l’analyste utilise son expérience et ses connaissances personnelles
pour choisir les unités statistiques devant faire partie de l’échantillon pour avoir un échantillon
représentatif de la population statistique.
─ par quota (reproduire les caractéristiques de la population statistique)
─ de convenance (les unités sont faciles à toucher ou à contacter)
─ selon le jugement du statisticien
─ boule de neige (un répondant de référer à un autre qui présente les mêmes caractéristiques)

Échantillonnage aléatoire
Un échantillon aléatoire est obtenu en utilisant un mécanisme probabiliste, de telle sorte que l’on
connait par avance la probabilité qu’une unité donnée de la population soit incluse dans
l’échantillon. Pour obtenir un échantillon représentatif de la population, il faut procéder par
échantillonnage aléatoire. Cette forme d’échantillonnage permet de calculer précisément l’erreur
due à l’échantillonnage et par conséquent, de juger de la valeur de l’information partielle ainsi
obtenue. Les techniques utilisées en statistique inférentielle reposant sur des concepts probabilistes,
l’information que techniques utilisent comme élément de base doit absolument provenir d’un
échantillon aléatoire. Selon Dagnelie (1998), « un échantillon est dit aléatoire quand tous les individus de
la population ont une même probabilité de faire partie de l'échantillon ». Parmi les diverses méthodes utilisées
pour obtenir un échantillon aléatoire, les principales sont les suivantes : l’échantillonnage aléatoire
simple, l’échantillonnage stratifié, l’échantillonnage par grappes, et l’échantillonnage systématique.
• Échantillonnage aléatoire simple : un échantillon est dit aléatoire simple si il est choisi par
un processus de sélection de objets d’une population de sorte que chaque membre de la
population ait la même probabilité d’être sélectionné, la sélection d’un membre de la
population étant indépendante de la sélection de tout autre membre, et chaque échantillon
possible de taille a la même probabilité d’être choisit.
Les échantillons aléatoires sont idéals. Il est souvent important que l’échantillon soit
représentatif de la population. L’échantillonnage aléatoire est l’assurance contre les biais
pouvant influencer la sélection des échantillons. Dans la pratique, les analystes développent
des méthodes d’échantillonnage alternatives pour minimiser le cout de l’échantillonnage. Mais

3
la base pour savoir si ces méthodes alternatives soient acceptables, c’est lorsqu’elles
aboutissent aux résultats sont proches de l’échantillonnage aléatoire simple.
• Échantillonnage aléatoire stratifié : la population est découpée en sous populations
(strates) homogènes. Les individus sont ensuite sélectionnés de manière aléatoire dans chaque
strate.
• Échantillonnage par grappes : la population est découpée en sous-populations (grappes)
hétérogènes. On sélectionne ensuite de manière aléatoire les grappes à retenir.
• Échantillonnage systématique : les individus sont tirés de manière régulière dans la base
de sondage. On se sert souvent d’un seul nombre aléatoire pour établir un point de départ
séquentiel, et on choisit les unités dans la population à des intervalles fixe en termes de temps,
d’espace ou d’ordre d’occurrence. Dans certains cas, l’échantillonnage systématique peut
s’avérer plus commode et plus efficace que l’échantillonnage aléatoire simple.
Pour la suite dans ce cours, on s’intéressera essentiellement à l’échantillonnage aléatoire simple. La
définition d’un échantillon aléatoire simple et la procédure de sélection d’un tel échantillon varient
selon que la population est finie ou infinie.

Vous aimerez peut-être aussi