Vous êtes sur la page 1sur 70

THEME DU MODULE :

METHODES STATISTIQUES
DE GESTION

MR BENLAMARA HOCINE
I. EXPOSES DE STATISTIQUE DESCRIPTIVE

II. EXPOSÉS DE STATISTIQUE INDUCTIVE :


1. MÉTHODES D’ÉCHANTILLONNAGE
2. METHODES D’ESTIMATION
3. TESTS STATISTIQUES

III.EXERCICES D’ APPLICATION
INTRODUCTION A LA STATISTIQUE
APPLIQUEE
1- DÉFINITION DE LA STATISTIQUE
APPLIQUÉE :
La statistique est la discipline scientifique qui étudie des
phénomènes, en les quantifiant, à travers :
 d’abord, l’observation des faits et la collecte des données, très
souvent nombreuses ;
 ensuite, leur dépouillement et leurs présentations sous une
forme synthétisée, numérique et/ou graphique ;
 enfin, leur traitement et leur compression en un nombre réduit
de paramètres qui facilitent la compréhension et la prise décision
2- COMPOSANTES DE LA
STATISTIQUE :
La statistique fait partie des sciences exactes et constitue une
branche des mathématiques appliquées, avec sa démarche
empirique et son approche inductive, ainsi qu’un ensemble de
techniques qui forment une composante importante du Système
d’Information et d’Aide à la Décision S.I.A.D.
L'avènement de l’informatique et son essor rapide, a permis
de traiter un plus grand nombre de données, mais aussi de
croiser entre elles des séries de données diverses.
Aujourd'hui, elle s'inscrit dans un champ disciplinaire plus vaste
et transverse appelé la Science des Données (Data Science),
et dans laquelle l'ordinateur occupe une place importante.
Le but de la statistique est ainsi d'extraire des informations
pertinentes d'une liste de nombres nombreuse et difficile à
interpréter par une lecture simple et primaire.
DEUX GRANDES FAMILLES DE MÉTHODES : sont alors utilisées
selon les circonstances; on les utilise de façon
complémentaire dans un problème ou un cas concret,
sans omettre qu’ils résolvent des problèmes de natures
distinctes.
Selon la terminologie classique, ce sont ‘LA STATISTIQUE
DESCRIPTIVE’ et ‘LA STATISTIQUE INDUCTIVE’ , appelée
aussi ‘L’INFÉRENCE STATISTIQUE’.
Cette dernière est basée sur la ‘STATISTIQUE MATHÉMATIQUE’ ; car
un changement radical se produit lorsque les données collectées ne
sont plus considérées comme une information complète à
décrypter selon les règles classiques; mais comme une information
partielle à généraliser sur une population plus importante.
Et pour induire des informations sur la population inconnue, il faut
introduire la notion de loi de probabilités : les données collectées
ne constituent, dans ce cas, qu’une réalisation sur un échantillon
représentatif, qui est un sous-ensemble de variables aléatoires,
supposées indépendantes.
LA THÉORIE DES PROBABILITÉS : permet alors :
 d'associer les propriétés de l'échantillon à celles qui
sont prêtées à la loi de probabilité, inconnue en toute
rigueur : c'est la Théorie de l‘Echantillonnage ;
 de déduire inversement les paramètres de la loi de probabilité
des informations que donne l'échantillon : c'est la Théorie de
l’Estimation, avec son Intervalle de Confiance qui mesurent la
validité de l'estimation et son Degré d’Erreur ;
 de procéder à différents tests statistiques : c'est la Théorie des
Tests d’Hypothèses et de la Décision pour confirmer ou infirmer
l’hypothèse étudiée, avec un Seuil de Sécurité ou un Niveau
d’Erreur.
Cette STATISTIQUE APPLIQUÉE est utilisée ainsi dans tous les
divers domaines de l'activité humaine : physique, chimie,
ingénierie, biologie, sociologie, économie, management,
marketing, Audit…
John W. Turkey, grand statisticien américain contemporain,
les classe selon 2 approches statistiques qu’il a dénommées:
‘statistiques exploratoires’ et ‘statistiques confirmatoires’
(exploratory and confirmatory statistics, en anglais) :
• D’abord, on explore les données pour avoir une idée expérimentée
du fonctionnement du système qu'elles représentent ; ce qui va
permettre de formuler des hypothèses cognitives sur les
phénomènes étudiée et leurs propriétés.
• Ensuite, à partir de ces hypothèses de comportement, on élabore
des tests qui permettent de les confirmer ou de les infirmer, en
recourant à d'autres techniques statistiques.
DEMARCHE & CONTENU DE LA STATISTIQUE
1.RECUEIL DES DONNÉES : L'enquête statistique est toujours
précédée d'une phase où sont déterminés les différents caractères
à étudier.
L'étape suivante consiste à choisir la population à étudier. Il se
pose alors le problème de l'échantillonnage : choix de la partie de
la population à sonder; c.à.d., l’échantillon, avec sa taille et sa
représentativité.
- Que ce soit pour un recueil total sur toute la population étudiée,
appelé ‘RECENSEMENT’, rarement utilisé pour le temps et les
moyens qu’il exige.
- Ou un recueil partiel sur une partie réduite de la population,
appelé ‘SONDAGE’ OU ‘ECHANTILLONNAGE’, réalisable et
pertinent.
- Des protocoles sont à mettre en place pour éviter les erreurs de
mesures, qu'elles soient d’ordre accidentel ou répétitif (le biais
statistique).
2.LE PRÉ TRAITEMENT DES DONNÉES : il est important, car une
transformation des données initiales peut considérablement
faciliter les traitements statistiques qui suivront.
3.LE TRAITEMENT DES DONNÉES : Le résultat de l'enquête
statistique se traduira par :
une série de données quantitatives, mesurables, appelées
variables statistiques xi
 et/ou de données qualitatives, non mesurables, dénommées
attributs mi.
Pour pouvoir les exploiter, il va être nécessaire d'en faire un
classement et une synthèse numérique. Il sera aussi nécessaire
d'opérer une compression ou résumé des données collectées.
Cette étude sera différente, selon qu’elle porte sur une seule
variable ou sur plusieurs à étudier simultanément.
4. ÉTUDE D'UNE SEULE VARIABLE STATISTIQUE xi :
Le regroupement des données, le calcul des effectifs et des fréquences,
la construction de graphiques permettent un premier résumé visuel
du caractère statistique étudié. Dans le cas d'un caractère quantitatif
continu, l’histogramme, le polygone des fréquences et les courbes
cumulatives… en sont les représentations graphiques les plus
usuelles.
En statistique, on est en général en présence d'un grand nombre de données
collectées. Or, si l'intégralité de ces valeurs forme l'information, il n'est
pas aisé de manipuler plusieurs centaines ou milliers de données, ni d'en
tirer des conclusions : Il faut donc calculer quelques paramètres qui vont
permettre de résumer et analyser ces données ; c'est le rôle des
réductions ou des synthèses statistiques. Celles-ci peuvent être
extrêmement concises et réduites à un seul paramètre : ce sont les
caractéristiques de tendance centrales, de position, de dispersion, de
forme, de concentration …
Certaines d'entre elles sont liées par des lois de probabilités et élaborées
pour permettre une exploitation plus théorique et plus globale des
données.
 INTERPRÉTATION ET ANALYSE DES DONNÉES:

La statistique inductive ou l'inférence statistique a pour but de


faire émerger des propriétés d'un ensemble de variables, connues
uniquement à travers quelques unes de ses réalisations, tirées d’un
échantillon de données collectées.

Elle s'appuie sur les résultats de la statistique mathématique, qui


applique des calculs mathématiques rigoureux concernant la
théorie des probabilités et la théorie de l'information aux
situations où on n'observe que quelques réalisations
d’expériences du phénomène étudié.
Sans cette statistique mathématique, un calcul sur un seul
paramètre (moyenne, dispersion, fréquence), ne peut être
qu’un indicateur.
C'est la statistique mathématique qui lui donne le statut global
d’un estimateur pour lequel on peut maîtriser le biais ou
l'incertitude : On cherche en règle général à ce que cet
estimateur soit sans biais, convergent et efficace : c’est ce qu’on
appelle l’estimation statistique.
On peut aussi émettre des hypothèses sur la loi générant le
phénomène global étudié. Dans ce cas, l'étude de l'échantillon va
alors confirmer ou infirmer cette hypothèse : c'est ce qu'on
appelle les tests d'hypothèses. Ces derniers permettent de
quantifier la probabilité avec laquelle des variables (connues
seulement sur un échantillon) vérifient une propriété cherchée
sur une population.
TOUT CE TRAVAIL RELÈVE DE LA STATISTIQUE INDUCTIVE
Statistique mathématique
Cette branche des mathématiques, liée aux calculs des probabilités, est
indispensable pour valider les modèles élaborés dans l’inférence statistique.
Les lois de probabilités formalise les phénomènes étudiés. Cette
statistiques se consacrent à l'étude de phénomènes aléatoires que l'on
connaît, via quelques unes de ses réalisations.
• Le point de vue probabiliste est de modéliser le phénomène étudié par
une distribution de probabilité associée aux événements de plusieurs
expériences. La théorie des probabilités nous dit ce phénomène est décrit
par une telle distribution de probabilité : Normale, Binomiale, de Student,
de Tchebychev, du Khi-deux …
• Les statistiques s'intéressent alors à ce genre de question : Si au bout de
‘n’ expériences effectuées avec leurs résultats constatés, est-ce-qu’ on peut
avoir une valeur objective sur la valeur des probabilités ? Avec quel niveau
de confiance ou quel degré d’erreur ?
• Si la règle est établie, elle peut être utilisée en inférence statistique.
CE TRAVAIL RELÈVE DE LA STATISTIQUE MATHEMATIQUE
APPROCHE
2- APPROCHE INDUCTIVE DE
INDUCTIVE DE LALA STATISTIQUE
STATISTIQUE
1- INFÉRENCE
STATISTIQUE
RECENSEMENT
Population - Faute de temps
- Faute de moyens
(beaucoup
d’individus) - Faute de possibilités
Difficile à réaliser

??? ??
3- STATISTIQUE
? MATHÉMATIQUE
(LOIS DE PROBABILITÉS)
Échantillon SONDAGE
sur un Echantillon
(peu individus)
Représentatif
Facile à réaliser
2- STATISTIQUE DESCRIPTIVE

‘n’
Individus
Caractère Quantitatif

V.S. discrète N (mesurable)


Variable statistique xi
V.S. continue R
(Moyenne/Ecart-type) Caractère(s)
Caractère Qualitatif
(non mesurable)
Attribut mi
(Fréquence/%)

Exhaustives
& Modalités
Incompatibles
LA PROBLÉMATIQUE DE L’INFÉRENCE STATISTIQUE peut se décliner
à travers par les deux questions ci-après :
Question 1 : Comment choisir un échantillon de façon qu’il soit
représentatif de la population-mère ?
 Réponse : Elle est donnée par la théorie de l’Echantillonnage
 Question 2 : Comment généraliser les résultats obtenus sur
l’échantillon à toute la population-mère ?
 Réponse : Elle est donnée, selon le problème posé, par :
La théorie de l’Estimation
La théorie de la Décision (Tests d’hypothèse)
LES OBJECTIFS DE CETTE STATISTIQUE INDUCTIVE SONT
ALORS DES TROIS (03) TYPES SUIVANTS :

 Déterminer les principaux paramètres d’une population,


à partir des caractéristiques correspondantes
calculées sur un échantillon représentatif
 Tester une hypothèse émise sur une population, en se
basant sur les résultats obtenus sur un échantillon
représentatif
 Comparer les paramètres de deux populations, en se
basant sur les caractéristiques de deux échantillons
représentatifs tirés de ces deux populations-mères
PRINCIPE FONDAMENTAL DE L’ECHANTILLONNAGE,
& CALCUL DU RISQUE COURU (EXEMPLE
ILLUSTRATIF)
Une urne contient 1000 boules blanches et 1000 boules noires ; on ne le sait pas !
On se propose de déterminer son contenu, en tirant au hasard n=11 boules :
N° Nombre Résultats obtenus : Erreur en Degré Niveau de
de Total de rouge et Exact en vert d’Erreur Confiance
Tirage Possibilités = (2/n) = (n-2)/n
n=1 21 = 2 N ou B 2/2=100% 0%
n=2 22 = 4 NN NB BN BB 2/4=50% 50%
NNN NNB NBN BNN
n=3 23 = 8 NBB BNB BBN 2/8=25% 75%
BBB
……. ….… …………. ……. …….
NNNNNNNNNN 2/1024 1022/1024
n=10 210 = 1024 1022 Mélanges de B & N
NNNNNNNNNNN = 0,2% = 99,8%
BBBBBBBBBB 2/2048 1022/1024
n=11 211 = 2048 2046 Mélanges de B & de = 0,1% = 99,9%
N BBBBBBBBBBB
ANALYSE ET CONCLUSIONS A TIRER DE CET
EXEMPLE :
1- On peut estimer, avec des résultats très probants, les données
d’une population qui contient beaucoup d’individus, sur la base
d’un échantillon très réduit de ces individus.
2- L’erreur d’estimation peut être mesurée, et elle dépend du nombre
‘n’ d’individus que contient l’échantillon ; mais cette erreur baisse de
façon exponentielle décroissante, au fur et à mesure que le nombre
d’individus de l’échantillon s’élève.
3- Cette erreur d’estimation dépend aussi de la dispersion ‘σ’ qui existe
entre les données des individus (écarts entre toutes les données).
4- Cette erreur d’estimation dépend également de la loi de probabilité
utilisée pour représenter le hasard (l’aléa) du tirage, et qui se traduit
par un coefficient critique ‘k’, selon le degré d’erreur toléré.
5- Cette erreur varie, de façon insignifiante, par rapport à la taille la
population étudiée ‘N’; si cette taille est très élevée par rapport à
celle de l’échantillon ‘n’ : on la néglige si N>20n.
PRESENTATION DES MÉTHODES
Les résultats d’uneD’ECHANTILLONNAGE
enquête par sondage ne sont extrapolables
à la population tout entière que si l’échantillon est
représentatif. Or cette représentativité est liée à la méthode
d’échantillonnage appliquée, probabiliste ou empirique. Quelles sont
ces méthodes ?
Nous allons aborder un sujet et des concepts théoriques essentiels
dans le monde des enquêtes et sondages.
 Les principaux concepts de l’échantillonnage : Population, base de
sondage, couverture, échantillon, erreur d’échantillonnage
 La Représentativité de l’Echantillon : Qui permet d’extrapoler les
résultats de l’enquête à la population entière
 Les méthodes aléatoires ou probabilistes d’échantillonnage :
Présentation de quelques méthodes, avec les lois de probabilités
 Les méthodes raisonnées ou empiriques d’échantillonnage :
Présentation de quelques méthodes applicables
I. PRINCIPAUX CONCEPTS DE L’ÉCHANTILLONNAGE
 POPULATION: La population est l’ensemble des individus que
l’on veut étudier ; autrement dit, c’est le groupe entier, tel que
défini dans les objectifs de l’enquête.
 BASE DE SONDAGE : La base de sondage disponible pour réaliser
l’enquête correspond très rarement à la population ; c’est très
souvent: L’ECHANTILLON. Et dans certains cas, à défaut de liste, la
base de sondage se résume à une série d’HYPOTHÈSES formulées sur
la population.
 ÉCHANTILLON : L’échantillon est le sous-ensemble de la population
élaboré pour représenter la population entière.
 ERREUR D’ÉCHANTILLONNAGE : On appelle erreur
d’échantillonnage tout type d’erreur lié à la méthode
d’échantillonnage.
 UNITÉ D’ÉCHANTILLONNAGE : On appelle unité d’échantillonnage
L’UNITÉ STATISTIQUE de l’enquête ou L’INDIVIDU.
II. REPRÉSENTATIVITÉ DE L’ÉCHANTILLON
L’essentiel à retenir, c’est que les résultats obtenus sur l’échantillon
ne sont valablement extrapolables à la population entière que si
l’échantillon est représentatif. Or la représentativité de
l’échantillon dépend essentiellement de la méthode
d’échantillonnage adoptée.
En théorie, seul un échantillonnage aléatoire permet d’obtenir des
résultats représentatifs et scientifiquement acceptables. Ceci sous
réserve de l’absence d’autres biais, comme par exemple l’erreur de
couverture. Il est également appelé probabiliste, car il repose sur la
théorie des probabilités.
En pratique, comme le recours aux méthodes de sondages
aléatoires est difficile à mettre en œuvre, on se tourne le plus
souvent vers une méthode de sondage empirique, comme par
exemple la méthode des quotas qui est la plus utilisée.
MÉTHODES ALEATOIRES D’ÉCHANTILLONNAGE
Basées sur les lois du calcul des probabilités, ces méthodes
supposent qu’on dispose d’une base de sondage correspondant
à la population étudiée, et que tous les individus (unités de
base) de la population ont la même probabilité d’être retenus
pour faire partie de l’échantillon.
Si on ne peut pas être dans ce cas de figure, on doit passer aux
méthodes non aléatoires qui peuvent s’avérer représentative ;
mais on ne peut pas valablement évaluer le niveau de confiance
et le degré d’erreur des résultats énoncés.
ECHANTILLON ALÉATOIRE (EXHAUSTIF ET NON EXHAUSTIF) :
DÉFINITION: Un échantillon est dit aléatoire, si les individus qui le
compose sont tirés au hasard, en donnant la même probabilité
à tous les individus de la population d’en faire partie. Dans ce
cas, on peut mesurer son degré de représentativité, grâce à
des lois de probabilités ; et on peut donc évaluer le niveau de
confiance ou le degré de précision de ses résultats, ou encore le risque
d’erreur.
TYPOLOGIE: On distingue les 2 types d’échantillon aléatoire suivants :
 L’échantillon aléatoire exhaustif, si le tirage des individus se fait
sans remise ; cela signifie qu’un même individu ne peut être tiré
qu’une seule fois
 L’échantillon aléatoire dit non exhaustif, si le tirage est fait avec
remise ; un même individu peut être tiré plusieurs fois.
N.B.: Ces 2 types se différencient par un facteur d’exhaustivité, dont
la formulation se présente comme suit : √(N-n)/(N-1). Ce coefficient
tend vers 1 ; et il est souvent négligé, lorsque N > 20xn
1- ÉCHANTILLONNAGE ALÉATOIRE SIMPLE
Le sondeur utilise des nombres tirés au hasard, à partir d’une
liste énumérative de tous les individus à étudier.
On peut utiliser l’aide d’un logiciel statistique, la fonction aléa d’Excel,
l’usage des tables de nombres aléatoires, le sondage systématique
ou toute autre méthode de sélection aléatoire qui garantit que tous
les individus de la population ont la même probabilité de faire partie
de l’échantillon.
Exemple : le tirage des boules du loto !
Cette méthode favorise et mesure la représentativité de l’échantillon.
Mais elle peut être impossible à réaliser, lorsqu'il n'existe pas de
liste connu de tous ses éléments et qu'il faut la construire; ou tout
au moins difficile d'utilisation, car elle peut demander beaucoup de
temps et couter beaucoup d’argent.
2- ÉCHANTILLONNAGE STRATIFIÉ
Lorsque la population peut être décomposée en plusieurs
sous-groupes caractérisés par des facteurs
discriminants, le sondeur commence d’abord par
l’identification de ces sous-groupes qu’on appelle
des strates.
Ensuite, il procède à un sondage aléatoire simple au niveau de
chacune des strates.
Le nombre d’individus sélectionnés dans les strates peut ou
non représenter les proportions de la population.
Cette méthode, qui est la plus raffinée, permet d'assurer une
des meilleures représentativités.
Elle permet aussi de comparer les strates.
3- ÉCHANTILLONNAGE SYSTÉMATIQUE
Le sondeur s’appuie sur une base de sondage répertoriant
les membres de la population pour choisir un point de
départ aléatoire (de 1 à 10) pour le premier élément de
l’échantillon.
Pour sélectionner tous les autres individus de l’échantillon, on
utilise alors une série arithmétique de raison r=N/n, calculé
en divisant la taille de la population par la taille de
l’échantillon : à partir du nombre de départ, on ajoute
chaque fois la raison ‘r’ calculée pour déterminer les ‘n’
individus de l’échantillon.
La formule de calcul de la taille ‘n’ de l’échantillon en fonction
du niveau de confiance souhaité et de la marge d’erreur
tolérée, sera donnée ultérieurement.
4- ÉCHANTILLONNAGE A PLUSIEURS NIVEAUX
Cette méthode est utilisée lorsque la population peut être
structurée par niveau, de façon pyramidale. Le sondeur va
s’appuyer sur une méthode de tirage au hasard des niveaux
successifs; puis au sein des niveaux à un tirage au sort des
individus de l’échantillon.
Par exemple, pour estimer les résultats d’un scrutin de vote
national, le sondeur va constituer son échantillon de la façon
suivante : tirage aléatoire des wilayas au niveau du pays,
puis des daïras au niveau des wilayas, puis des villes
au niveau des daïras, puis des bureaux de votes au niveau
des villes et enfin des électeurs au niveau des
bureaux de vote.
Cette méthode est économique en temps et en argent, mais
ses résultats sont moins rigoureux que ceux de la méthode
aléatoire simple.
5- ÉCHANTILLONNAGE PAR GRAPPES
La base de sondage est divisée en sous-groupes de la population
appelées grappes, qui doivent partager de fortes similarités :
• le sondeur peut sélectionner au hasard quelques grappes pour
lesquelles il interroge tous les individus (échantillonnage en 1
degré) ;
• il peut aussi choisir davantage de grappes au hasard et constituer
des échantillons dans chaque grappe (échantillonnage en 2 degrés).
Cette méthode est à privilégier dans le cas de grappes très similaires
pouvant être identifiées facilement.
Elle est utilisée lorsque les éléments sont naturellement groupés ou
encore quand il n'est pas possible d'obtenir la liste de tous les
éléments de la population cible.
Elle est également économique en temps et en argent, mais ses
résultats sont tout aussi moins rigoureux que ceux de la
méthode aléatoire simple.
MÉTHODES EMPIRIQUES D’ÉCHANTILLONNAGE

Ces méthodes d’échantillonnage ne sont pas basées sur les lois


de probabilités ; car les individus de la population qui vont le
composer ne sont pas tirés au hasard ; ils sont souvent choisis
sur la base de certains critères préalables connus les concernant.
Ces sondages sont moins représentatifs de la population. Et quand
ils sont représentatifs, on ne peut valablement pas utiliser les lois
du calcul des probabilités pour évaluer le niveau de confiance et le
degré d’erreur des résultats obtenus.
Cependant, ce qui peut contraindre le plus souvent à utiliser
un sondage non aléatoire, c’est quand les conditions ne sont
pas réunies pour constituer un échantillon aléatoire :
 Il n’existe pas de base de sondage de la population étudiée
 On ne peut pas garantir que toutes les unités de l’échantillon
constitué vont effectivement répondre à l’enquête
Le recueil de l’information serait trop coûteux et/ou trop long.
Dans la pratique, c’est lorsque les unités statistiques interrogées sont
des êtres humains qu’il est extrêmement rare que les conditions
soient réunies pour mettre en œuvre un sondage aléatoire.
On utilise alors des méthodes empiriques ou raisonnées.
Mais au niveau de l’analyse des réponses, il faut toujours garder à
l’esprit la façon dont l’échantillon a été constitué, pour pouvoir
généraliser valablement les résultats obtenus sur l’échantillon à la
population tout entière. Des tests statistiques, comme par exemple,
le test du Khi-deux, peuvent s’avérer alors précieux.
1- ÉCHANTILLONNAGE PAR QUOTAS
Cette méthode empirique est probablement la plus utilisée
dans les sondages raisonnés. Le sondeur identifie quelques
caractéristiques (critères spécifiques, par exemple) qui
permettent de découper la population en sous-groupes, avec
des quotas pour chaque catégorie.
Puis, on choisit les individus des sous-groupes, avec des techniques
d’échantillonnage empiriques et non probabilistes. La taille
des quotas est proportionnelle à la taille de chaque sous-
groupe au sein de la population.
La méthode des quotas permet de reproduire plus fidèlement la
population et ainsi de réduire les biais.
Elle sert souvent à s’assurer que la méthode des échantillons de
convenance respectent la structure de la population, avec ses
quotas.
2- ÉCHANTILLONNAGE DE CONVENANCE
On parle d’un échantillon de convenance quand, par exemple,
on choisit un endroit fréquenté, comme un carrefour
piéton très emprunté ou un centre commercial,
pour constituer la base de sondage à interroger.
Ce type d’échantillon présente souvent des biais, dont il faut tenir
compte pour l’exploitation des résultats de l’enquête.
L’erreur de couverture concerne les membres de la population qui
ne fréquentent pas régulièrement ou pas du tout l’endroit
choisi (carrefour, centre commercial, plate-forme internet…).
On peut souligner une autre erreur liée à la méthode arbitraire
utilisée par l’enquêteur pour sélectionner les personnes à
interroger.
3- ÉCHANTILLONNAGE AU JUGÉ
Le sondeur fait appel à son jugement ou à celui d’une autre
personne compétente pour identifier les personnes à inclure
dans l’échantillon.
Les critères de sélection sont subjectifs et pratiques ; cela implique
nécessairement que certains membres de la population auront
moins de chances d’être sélectionnés que d’autres.
Comme l’échantillon de convenance, l’échantillon constitué au
jugé présente des risques de biais importants.
4- ÉCHANTILLONNAGE BOULE DE NEIGE
Les individus sont choisis par rapport au profil recherché.
Puis elles sont invitées à fournir les nom et coordonnées
d’autres personnes ‘similaires’ qu’elles jugent aptes à
donner des informations pertinentes.
De façon évidente, tous les membres de la population n’ont
pas la même probabilité d’être sélectionnés.
Les individus sont souvent choisis à travers les réseaux sociaux,
d’amitiés…
Par exemple, pour le lancement d’un nouveau produit pour les
sportifs, on veut savoir quelles sont les attentes des clients.
les résultats obtenus sur l’échantillon. On commence à
envoyer le questionnaire à quelques sportifs que l’on
connait ; et on leur demande de le diffuser dans leur
propre entourage.
5- Échantillon par choix raisonné
 Choix des éléments basé sur le jugement du
chercheur par rapport à leur caractère typique ou
atypique (cas extrêmes ou déviants)
 Permet d'étudier des phénomènes rares ou inusités ;
par conséquent, la représentativité de l'ensemble de
la population peut être très réduite.
EN CONCLUSION :
Quand on utilise une méthode d’échantillonnage non aléatoire,
comme la méthode des quotas ou un échantillon de convenance,
on ne peut pas, en principe, extrapoler valablement à toute la
population-mère les résultats obtenus sur l’échantillon.
Cela dit, en pratique, si on dispose de données de calage sur la
population (par exemple, la structure par certaines de ses
caractéristiques), on peut contrôler l’échantillon à posteriori,
et éventuellement lui appliquer un redressement pour que sa
structure corresponde à la structure de la population, comme les
instituts de sondage le font souvent avec la méthode des quotas.
BASES THÉORIQUES DU SONDAGE ALÉATOIRE
Soit un échantillon aléatoire de taille ‘n’ :
 dont le caractère quantitatif est évalué par la variable statistique
xi de moyenne x et d’écart-type s
 et dont le caractère qualitatif est évalué par la fréquence p (en %).
 Le théorème central limite des probabilités énonce que :
I. Si la taille de l’échantillon est grande (n≥30), la distribution
d’échantillonnage de la moyenne suit une loi normale N ,
de moyenne µ= x et d’erreur-type σ = s/√(n-1)
II. Si la taille de l’échantillon est petite (n<30), la distribution
d’échantillonnage de la moyenne suit une loi de Student à (n-1) degré de
liberté, de moyenne µ= x et d’erreur-type σ = s/√(n-1)
III. Si la taille de l’échantillon est grande (n≥30) et si (nxp>5), la
distribution d’échantillonnage de la fréquence suit une loi Binomiale qui
tend vers une loi normale N de moyenne µ=p et d’écart-type σ = √ p.(1-
p)/(n-1)
IV. Pour la variance, la variable aléatoire χ2 = ns2/σ2 suit la distribution
d’échantillonnage du khi-deux à (n-1) degré de liberté.
I. LOIS DE PROBABILITÉS POUR L’ANALYSE D’UN CARACTÈRE
QUANTITATIF
Taille de Population Normale Population Quelconque
Echantillon σ connue σ inconnue σ connue σ inconnue

Taille: n≥30 Loi Normale Loi Normale Loi Normale Loi Normale

Taille: n<30 Loi normale Loi Student Tchebychev Tchebychev


z : table de t : table de loi
Coefficients loi normale, Student à (n-1) k, tel que : k, tel que :
critiques : c selon N.C. ddl, selon N.C. 1-1/k = N.C. 1-1/k = N.C.
2 2

II. LOIS DE PROBABILITÉS POUR L’ANALYSE D’UN


CARACTÈRE QUALITATIF
Echantillon Lois de Probabilités Coefficients critiques
Taille n ≥ 30 & (nxp>5) Loi Normale Table Loi normale
Taille : n < 30 Loi Binomiale Table Loi Binomiale
METHODES D’ESTIMATION DES PARAMETRES
D’UNE POPULATION

I - Estimation ponctuelles des paramètre :


Il faut prendre pour chacun de ces paramètres un estimateur sans
biais, convergent et efficace :
 Pour un caractère quantitatif :
1. La Moyenne : µ = x
2. La Variance : σ2 = s2xn/(n-1)

3. L’Ecart-type : σ = √s2xn/(n-1)

Pour un caractère qualitatif :


4. La Fréquence : π = p
2- Estimation par un intervalle de Confiance :
A- La moyenne (pour un caractère quantitatif) :
µ=x ±e
‘e’ : représente le demi intervalle de confiance. Il dépend de:
 la loi de la probabilité adéquate: Normale, de Student, de Chebychev
 la dispersion de l’échantillon
 la taille de l’échantillon
 la taille de la population, à un degré bien moindre 1

La formulation est : µ = x ± e = x ± cxs/√(n-1) x√(N-n)/(N-1)


• x : moyenne de l’échantillon
• c : coefficient de la loi de probabilité à utiliser, avec la précision désirée
• s : écart-type de l’échantillon
• n : taille de l’échantillon
• N : taille de la population
B- La fréquence (pour un caractère qualitatif) :
π=p±e
où e: représente le demi intervalle de confiance. Il dépend de:
 la loi de la probabilité adéquate à utiliser (Binomiale, Normale)
 la dispersion de la population : σ = √p.(1-p)
 la taille de l’échantillon ‘n’
 la taille de la population ‘N’, à un degré moindre 1

La formulation est : π = p ± e = p ± cx√p/(1-p)/n) x√(N-n)/(N-1)


• c : coefficient de la loi de probabilité à utiliser, pour la précision désirée
• p : fréquence de l’échantillon
• n : taille de l’échantillon
• N : taille de la population
EXEMPLE D’UN PROBLEME GLOBAL A RÉSOUDRE :

 DE STATISTIQUE DESCRIPTIVE
POUR ÉLABORER ET ÉTUDIER L’ÉCHANTILLON

 DE STATISTIQUE INDUCTIVE

POUR ÉTENDRE LES RÉSULTATS À LA POPULATION


AU TITRE D’UN EXEMPLE ILLUSTRATIF POUR LES STATISTIQUES
ÉTUDIÉES
On se propose d’effectuer une analyse préliminaire et rapide
des résultats obtenus à un concours d’entrée dans une grande
école auquel ont participé une population totale de 1036
candidats et pour lequel ne seront retenus qu’environ un
tiers des participants.
Les deux caractères étudiés pour chaque candidat sont :
- pour le caractère quantitatif : la moyenne obtenue sur 20
- pour le caractère qualitatif de ‘réussite’ : la note ≥ 12/20.
Il est intéressant d'en tirer un paramètre de tendance centrale
(moyenne) qui donnera une idée globale sur le niveau des étudiants,
et un autre de dispersion (écart-type) qui mesurera l'homogénéité du
groupe, ainsi que sur le pourcentage (fréquence) des candidats reçus.
Et pour avoir rapidement les premières conclusions préliminaires sur
cette population, on a tiré au hasard un échantillon représentatif de
37 postulants pour lesquels on a pris les notes obtenues au
concours.
L’échantillon aléatoire de n=37 candidats sur une
population de n=1036 postulants a été élaboré par la
méthode du sondage probabiliste systématique sans
remise : il a donné lieu aux informations brutes suivantes :
x10 x38 x66 x94 x122 x150 x178 x206 x234 x262
5.0 9.0 11.5 14.5 17.0 19.0 18.0 7.0 10.0 12.0
x290 x318 x346 x374 x402 x430 x458 x486 x514 x542
16.5 16.5 7.0 7.0 9.0 10.0 10. 13.0 15.5 13.0
x570 x598 x626 x654 x682 x710 x738 x766 x794 x822
11.5 11.5 6.0 7.5 8.0 10.5 13.0 11.5 14.0 10.5
x850 x878 x906 x934 x962 x990 x1018
11.5 8.0 12.0 14.5 7.5 11.0 12.0
Peut-on fournir une première idée globale et synthétisée
valide sur le niveau de ces étudiants, sur leur homogénéité
et sur le pourcentage des candidats reçus?
A première vue, ce n’est pas évident du tout !
APPLICATION DE LA DÉMARCHE EMPIRIQUE DE LA
STATISTIQUE
 1ÈREÉTAPE : OBSERVATIONS DES FAITS ET COLLECTE DES DONNÉES:
Les sources d’informations sont de 2 types, selon la disponibilité:
1- Source Documentaire Desk Research, quand l’information est
générale et disponible quelque part.
2- Source Terrain Field Research, quand l’information est spécifique, donc
souvent non disponible ; on la crée par une Enquête par sondage.
 2ÈMEÉTAPE : DÉPOUILLEMENT DES DONNÉES - PRÉSENTATION DES
RÉSULTATS:
Dépouiller = Ordonner + Grouper(par classe ou modalité) + Compter
La présentation des résultats peut se faire selon 2 catégories :
1- Présentations numériques: Série statistique ou Tableau de chiffres
2- Présentations graphiques: Diagramme – Courbes – Autres Graphes…
 3ÈMEÉTAPE : DÉTERMINATION DES PRINCIPALES CARACTÉRISTIQUES :
1- Caractéristiques de Tendance Centrale
2- Caractéristiques de Dispersion
 4ÈMEÉTAPE : INDUCTION DES RÉSULTATS DU SONDAGE À LA POPULATION-
MÈRE
PREMIERE ETAPE : LA STATISTIQUE
DESCRIPTIVE

POUR ANALYSER ET MAITRISER


L’ECHANTILLON :
1- ORDONNER LES DONNÉES
COLLECTÉES DE LA PLUS PETITE A
LA PLUS GRANDE
N° xi N° xi N° xi N° xi
1 5,0 11 9,0 21 11,5 31 14,5
2 6,0 12 10,0 22 11,5 32 15,5
3 7,0 13 10,0 23 12,0 33 16,5
4 7,0 14 10,0 24 12,0 34 16,5
5 7,0 15 10,5 25 12,0 35 17,0
6 7,5 16 10,5 26 13,0 36 18,0
7 7,5 17 11,0 27 13,0 37 19,0
8 8,0 18 11,5 28 13,0 ∑ 421,0
9 8,0 19 11,5 29 14,0
10 9,0 20 11,5 30 14,5
N° xi collectées xi ordonnées xi-X (xi-X)2
1 5,0 Ine( -6,5 42,25
2 9,0 6 -5,5 30,25
3 11,5 7 -4,5 20,25
4 14,5 7 -4,5 20,25
5 17,0 7 -4,5 20,25
6 19,0 7,5 -4 16
7 18,0 7,5 -4 16
8 7,0 8 -3,5 12,25
9 10,0 8 -3,5 12,25
10 12,0 9 -2,5 6,25
11 16,5 9 -2,5 6,25
12 16,5 10 -1,5 2,25
13 7,0 10 -1,5 2,25
14 7,0 10 -1,5 2,25
15 9,0 10,5 -1 1
16 10,0 10,5 -1 1
17 10,0 11 -0,5 0,25
18 13,0 11,5 0 0
19 15,5 11,5 0 0
20 13,0 11,5 0 0
21 11,5 11,5 0 0
22 11,5 11,5 0 0
23 6,0 12 0,5 0,25
24 7,5 12 0,5 0,25
25 8,0 12 0,5 0,25
26 10,5 13 1,5 2,25
27 13,0 13 1,5 2,25
28 11,5 13 1,5 2,25
29 14,0 14 2,5 6,25
30 10,5 14,5 3 9
31 11,5 14,5 3 9
32 8,0 15,5 4 16
33 12,0 16,5 5 25
34 14,5 16,5 5 25
35 7,5 17 5,5 30,25
36 11,0 18 6,5 42,25
37 12,0 19 7,5 56,25
TOTAL - 421,0 - 437,75
DETERMINATION DES PRINCIPALES CARACTERISTIQUES
I - CARACTÉRISTIQUES DE TENDANCE CENTRALE : Leur objectif est de
synthétiser l’ensemble des données collectées par une seule mesure
1- Le Mode? Donnée la plus répétée : Mo = 11,5 (5 fois)
2- La Médiane? Donnée du milieu : Me = x(n+1)/2 = x19 = 11,5
3- La Moyenne? Formulation : m = X = ∑xi/n = 421/37 = 11,4

II - CARACTÉRISTIQUES DE DISPERSION : Leur objectif est de synthétiser


l’écart entre toutes les données collectées par une seule mesure.
1- L’Etendue? Ecart global de toute la série : E = xmax – xmin = 19 – 5 = 14,0

2- La Variance? Formulation : s2 = V(x) = ∑(xi-x)2/n = 437,75/37 = 11,83

& L’Ecart-Type? Formulation : s = ET(x) = √ V(x) = √(11,8) = 3,44


3- Le Coefficient de Variation? CV(x) = ET(x)/x = 3,4/11,4 = 30,2%
PRÉSENTATION NUMÉRIQUE SOUS FORME DE
SÉRIE STATISTIQUES DE PONDÉRÉE

Classes Milieux Effectifs Fréquences


Ci xi ni fi = ni/n
[5 ; 7] 6 2 5,4%
[7 ; 9] 8 7 18,9%
[9 ; 11] 10 7 18,9%
[11 ; 13] 12 9 24,4%
[13 ; 15] 14 6 16,2%
[15 ; 17] 16 3 8,1%
[17 ; 19] 18 3 8,1%
Total : ∑ = - n=37 100%
PRÉSENTATION NUMÉRIQUE SOUS
FORME DE TABLEAU STATISTIQUE
PONDÉRÉ
Classes Ci Milieux Effectifs Fréquences Effectif cumulé Effectif cumulé
xi ni fi = ni/n croissant fi↑ décroissant fi↓
[5 ; 7] 6 2 5,4% 2 37
[7 ; 9] 8 7 18,9% 9 35
[9 ; 11] 10 7 18,9% 16 28
[11 ; 13] 12 9 24,4% 25 21
[13 ; 15] 14 6 16,2% 31 12
[15 ; 17] 16 3 8,1% 34 6
[17 ; 19] 18 3 8,1% 37 3
Total : ∑ = - n=37 100% - -
REPRÉSENTATIONS
GRAPHIQUES 1 :

Les deux diagrammes différentiels :


1- L’Histogramme
2- Le Polygone des Fréquences
REPRÉSENTATIONS
GRAPHIQUES 2 :

Les deux diagrammes intégraux :


C- La Courbe Cumulée Croissante
D- La Courbe Cumulée Décroissante
DÉTERMINATION DES PRINCIPALES CARACTÉRISTIQUES
POUR LA SERIE STATISTIQUE PONDEREE (CLASSES)

I.CARACTÉRISTIQUES DE TENDANCE CENTRALE :


L’objectif des ces caractéristiques c’est de synthétiser tout la série
statistique des données collectées par un seul paramètre représentatif :
1. Le Mode ? C’est la donnée de la série statistique qui est la plus fréquente :
Pour la calculer dans une série statistique pondérée, il faut :
- identifier la classe modale qui est la classe qui a le plus grand effectif
- et appliquer la formule d’interpolation suivante :
Mo = L + ix(d1)/(d1+d2) = 11 + 2x[2/(2+3)] = 11,8
L : limite inferieure de la classe modale
i : intervalle de la classe modale
d1: effectif de la classe modale - effectif de la classe précédente
d2 : effectif de la classe modale - effectif de la classe suivante
Remarque : une série statistique peut présenter plusieurs modes, tout
comme elle peut n’avoir aucun mode.
2. La Médiane Me: Donnée du milieu de la série qui la divise en
deux parties égales.
Déterminer la classe médiane qui contient la valeur du milieu: xn/2 ;
puis appliquer la formule d’interpolation suivante :
Me = L + i×(n/2 -S)/ni = 11 + 2× (19.5-16)/9 = 11,6
L : limite inferieure de la classe médiane
i : intervalle de la classe modale
S : Somme des effectifs avant la classe médiane
ni : effectif de la classe médiane
Remarque : La médiane est une caractéristique de tendance centrale ; mais elle
est appelée aussi caractéristique de positon ou encore ‘fractile’, car elle
fractionne la S.S. en 2 parties égales. Il y a lieu de préciser qu’il existe
également d’autres types de fractiles utilisées pour une meilleure maitrise de la
S.S. étudiée ; on peut citer :
• Les 3 quartiles divisent la S.S en 4 parties égales: Q1,Q2,Q3
• Les 9 déciles divisent la S.S en 10 parties égales: D1, D2…D9
• Les 99 centiles divisent la S.S en 99 parties égales: C1, C2, C99
N.B. Pour le calcul des différents fractiles, on utilise en les adaptant les formules
de la médiane.
3. La moyenne (arithmétique) ou Espérance mathématique

On la symbolise par : ‘µ’ pour la population et ‘m’ ou ‘x’ pour


l’échantillon :
Elle est la plus significative et la plus utilisée, car elle prend en
compte toutes les données collectées, sans exception :
Sa formulation pour une série statistique pondérée est :
E(x) = m = x = ∑ni.xi /n = 432/37 = 11,7
II - CARACTÉRISTIQUES DE DISPERSION :
Leur objectif est de synthétiser la dispersion ou l’écart de
toutes les données collectées par une seule mesure.
1. Etendue : cet indicateur ne prend en compte que les deux valeurs
extrêmes données collectée et fournit ainsi une estimation globale
de la dispersion de la S.S. étudiée.
E = xmax – xmin = 19 – 5 = 14
1’- Intervalles Inter-fractiles : les valeurs extrêmes n’étant pas
représentatives de la S.S., on est tenté d’améliorer cet écart global et
pour avoir une meilleure idée de la dispersion; on utilise alors les
intervalles inter-fractiles, tels que :
Intervalle inter-quartile = Q3 – Q1
Intervalle inter-décile = D3 – D1
Intervalle inter-centile = C99 – C1
2- La Variance & l’Ecart-Type : σ2 & σ pour la population
et s2 & s pour l’échantillon

L’écart-type est plus significatif pour mesurer les écarts entre toutes
les données collectées, car il prend en compte toutes ces données,
sans exception.
Pour une série statistique pondérée, leur formulation est la suivante :
1- V(x) = ∑ ni.(xi-x)2/n = 388,1/37 = 10,5

2- L’Ecart-Type : s = ET(x) = √ V(x) = √(10,5) = 3,24

3- La Dispersion Relative & le Coefficient de Variation :


CV(x) = ET(x)/x = 3,24/10,5 = 28% (> à 15%)
REMARQUE IMPORTANTE :

Ces 2 indicateurs importants que sont la moyenne et


l’écart-type, se présentent comme des indicateurs de
variables aléatoires, qui sont liés entre eux par des lois
de probabilités, et qui font que nous pouvons avoir une
certaine maitrise statistique de toute une série de
données collectées, quelque soit sa taille, si nous
déterminons leurs valeurs.
DÉTERMINATION DES PRINCIPALES
CARACTÉRISTIQUES DE LA SÉRIE
STATISTIQUE PONDÉRÉE
Ci xi ni ni*xi xi-X ni(xi-X) ni(xi-X)2
[5 ;7 ] 6 2 12 -5,68 -11,35 64,43
[7 ; 9] 8 7 56 -3,68 -25,73 94,59
[9 ; 11] 10 7 70 -1,68 -11,73 19,66
[11 ; 13] 12 9 108 0,32 2,92 0,94
[13 ; 15] 14 6 84 2,32 13,94 32,41
[15 ; 17] 16 3 48 4,32 12,97 56,09
[17 ; 19] 18 3 54 6,32 18,97 119,98
Total - 37 432,0 - 0,0 388,10
Mo =11,8 X=11,7 - V(x) =10,5
Me =11,6 - - - ET(x) =3,2
E =14,0 CV(x) =28%
INTERPRÉTATION & COMMENTAIRES SUR
L’ECHANTILLON
• La note moyenne de l’échantillon est de X = 11,7/20 ; ce qui est
appréciable car elle avoisine la mention assez-bien (12/20).
• La dispersion des notes est importante et le groupe est
hétérogène, car le coefficient de variation est de : CV(x) = 28% ;
donc nettement supérieure à la norme des 15% ; ce que confirme,
par ailleurs, l’étendue des notes qui va de 5/20 à 19/20.
• En outre, cette série statistique est pratiquement symétrique,
car les 3 caractéristique de tendance centrale sont pratiquement
égales:
(Me=11,6) ≈ (x=11,7) ≈ (Mo=11,8)
N.B.: Cette caractéristique de symétrie est celle de la Loi Normale.
SECONDE ETAPE : LA STATISTIQUE
INDUCTIVE :

POUR EXTRAPOLER LES RÉSULTATS ET

LES COMMENTAIRES DE L’ECHANTILLON


À LA POPULATION-MÈRE
2- APPROCHE INDUCTIVE DE LA STATISTIQUE

RECENSEMENT
-Faute de temps &
Population
de moyens
1036 étudiants
Ne peut pas se
réaliser

? STATISTIQUE ?
MATHÉMATIQUE (LOIS DE
PROBABILITÉS)
Échantillon
37 étudiants SONDAGE
sur Echantillon
Représentatif
Peut se réaliser
2- APPROCHE DESCRIPTIVE DE LA
STATISTIQUE

37
Caractère Quantitatif
Individus

V.S. continue (note/20)


Variable statistique xi
Moyenne?
Ecart-type? Caractères
Caractère Qualitatif
Etudiants admis
Attribut mi
Pourcentage réussite%?

Exhaustives
& Modalités
Incompatibles
COMMENT UTILISER LES TABLES STATISTIQUES
1- TABLE DE LA LOI NORMALE
2- TABLE DE LA LOI DE STUDENT
3- TABLE DE LA LOI DU KHI-DEUX
4- TABLE DE LA BINOMIALE
5- TABLE DES NOMBRES ALÉATOIRES
APPLICATION POUR L’ESTIMATION DE L’ETUDE
DE CAS
Problématique : Comment estimer les paramètres de la population
mère sur la base des résultats de l’échantillon ?
1- Etude du caractère quantitatif xi : notes/20
 Résultats de l’échantillon: moyenne x=11,7/20 et écart-type s=3,4/20
• Estimation ponctuelle pour la population ? µ = E(x) = 11,7/20
• Estimation avec un intervalle de confiance N.C.=95% ?
N >30 : La loi de probabilité à utiliser est la loi normale. Pour NC=95%, on
lit sur la table statistique de la loi normale, le coefficient critique: z=1,96.
On applique la formule : µ = x ± zxs/√(n-1) = 11,7 ± 1,96x3,4/√36
Soit : µ = 11,7 ± 1,1.
NC = 95% : Je suis sûr à 95% que la moyenne µ ϵ [10,6 ; 12,8]/20
N.B.: De même, on peut trouver avec d’autres niveaux de confiance :
NC = 90% : Je suis sûr à 90% que la moyenne µ ϵ [10,8 ; 12,6]/20
.

NC = 99% : Je suis sûr à 99% que la moyenne µ ϵ [10,3 ; 13,2]/20


Comment déterminer la taille de l’échantillon pour un certain
degré de précision voulu de l’estimation de la moyenne ?
Application : on veut une meilleure estimation de la moyenne : au niveau
de confiance de NC=99% et un intervalle de confiance de e=±0,5/20 ?
La formule de la taille de l’échantillon est n = z2xs2/e2 + 1.
A.N. : n = 2,582x3,42/0,52 + 1 = 315 candidats
1- Etude du caractère qualitatif mi = réssite au concours (xi>12/20):

 Résultats de l’échantillon: pourcentage p = 30,2%


• Estimation ponctuelle pour la population? π = E(p) = 0,302 = 30,2%
• Estimation avec un intervalle de confiance N.C.=90% ?
N >30 : La loi de probabilité à utiliser est la loi normale. Pour NC=90%, on
lit sur la table statistique le coefficient critique : z=1,65.
Formule : π = p ± z.√p(1-p)/n = 0,302 ± 1,65.√3 √0,302x0,698/37
Soit : π = 0,302 ± 0,075
Résultat : Je suis sûr à 90% que le pourcentage π ϵ [22,7% ; 37,7%]
Comment déterminer la taille de l’échantillon pour améliorer le
degré de précision de l’estimation de la fréquence ?
Application: On veut une meilleure estimation de la fréquence au niveau
de confiance de NC=95% et avec un intervalle de confiance de e=±5% ?
La formule de la taille de l’échantillon est n = z2xpx(1-p)/e2.
A.N.: n = 1,962x(0,302x0,698)/0,052 = 385 candidats

Vous aimerez peut-être aussi