Vous êtes sur la page 1sur 103

Statistique appliquée

RAMCHOUN Hassan
hassanramchoun@gmail.com
2022/2023

RAMCHOUN Hassan cours de statistique appliquée


1
2022/2023
Plan

1 Quelques Rappels en probabilité et statistique

2 Méthodes d’ échantillonnage

3 Distribution d’ échantillonnage

4 Estimation ponctuelle et par IC

5 Tests d’hypothèse

RAMCHOUN Hassan cours de statistique appliquée 2022/2023 2


Quelques Rappels en
Chapitre 1
probabilités et statistique

RAMCHOUN Hassan cours de statistique appliquée 2022/2023 3


Introduction
Statistique
1. Quelques
Rappels en
probabilité et
statistique
Statistique descriptive Statistique inférentielle
2 . Méthodes
d’échantillonnage s'occupe de la description des s'occupe de tirer des
conclusions générales à
données: tableau, graphique, partir d'expériences et de
3 . Distribution pourcentage, ... faire des prévisions.
d’échantillonnage

4 . Estimation
ponctuelle et par IC Domaines d’application

5 . Te s t s d ’ h y p o t h è s e
Economie, démographie, biologie, intelligence artificielle,

Elle permet de comprendre les phénomènes étudiés, porter


des jugements etHassan
RAMCHOUN prendre
cours deainsi des
statistique décisions
appliquée convenables
2022/2023
4
Notions de base
1. Quelques
Rappels en Population : On appelle population l’ensemble sur lequel porte notre étude
probabilité et statistique. Cet ensemble est noté Ω.
statistique Exemples: l’ensemble des étudiants d’une classe, l’ensemble des véhicules
susceptibles de circuler dans une ville,…
2 . Méthodes
d’échantillonnage Echantillon: Tous sous ensemble de la population Ω

3 . Distribution Individu : On appelle individu tout élément de la population Ω, il est noté ω


d’échantillonnage (ω dans Ω)
Exemples: un étudiant, une voiture ,…
4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

5
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Notions de base
1. Quelques Caractère : On appelle caractère (ou variable statistique, dénotée V.S) toute
Rappels en application X : Ω → E.
probabilité et w →X(w)=x
statistique Définissant un critère observé sur les individus d’une population

L’ensemble E est dit : ensemble des valeurs du caractère X (c’est ce qui est
2 . Méthodes
d’échantillonnage mesuré ou observé sur les individus) appelé modalité

3 . Distribution
Exemple 1: Les employés d’une entreprise par exemple peuvent être étudiés
d’échantillonnage selon l’âge, le sexe, le nombre d’enfants à charge, état matrimonial… ce sont
les caractères.
4 . Estimation Exemple 2: Les produits agro-alimentaire fabriqués par la société « ALPHA»
ponctuelle et par IC
peuvent être étudiés selon leur qualité, leur poids, …
5 . Te s t s d ’ h y p o t h è s e
Exemples divers: Taille, température, nationalité, couleur des yeux

6
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Quelques méthode d’observation
statistique
1. Quelques
Rappels en Le recensement
probabilité et
statistique On parle de recensement lorsque l’observation statistique porte
sur tous les individus de la population.

2 . Méthodes Le sondage
d’échantillonnage
Observation statistique d’une partie de la population appelé échantillon
3 . Distribution
d’échantillonnage On doit considérer des échantillons représentatifs
On distingue plusieurs types de sondage: aléatoire, raisonné
4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

7
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Types des variables
1. Quelques Variable statistique
Rappels en Susceptible d’être mesurée
probabilité et
statistique

Qualitative Quantitative
2 . Méthodes
d’échantillonnage Ses valeurs peuvent être des Ses valeurs sont des nombres réels
états, des opinions, des et correspondent à des quantités.
3 . Distribution propriétés,... des modalités qui Taille, âge,...
d’échantillonnage correspondent à des "qualités".

4 . Estimation
ponctuelle et par IC Nominale Ordinale Discrète Continue
Couleur, lettre Qualité du café,
5 . Te s t s d ’ h y p o t h è s e …
alphabétique, Ses valeurs a priori sont des Les valeurs se situent
marque de nombres isolés les uns des donc dans des intervalles
voiture,… autres de la droite réelle.
8
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Série statistique
Soit 𝑋 un caractère quantitatif discret et Ω une population finie, si on pose 𝑋 Ω =
1. Quelques *𝑥1 , 𝑥2 , … , 𝑥𝑖 , … , 𝑥𝑝 + alors pour chaque valeur 𝑥𝑖 de modalité constaté, on détermine le
Rappels en nombre d’individu 𝑛𝑖 ayant présenté cette valeur du caractère, nombre appelé effectif
probabilité et associé à la modalité.
statistique

2 . Méthodes Série statistique


d’échantillonnage
L’ensemble des couples (𝑥𝑖 ; 𝑛𝑖 )
3 . Distribution
d’échantillonnage
À un caractère À deux caractères
4 . Estimation
ponctuelle et par IC
𝑋 Ω est un sous ensemble de ℝ À Chaque individu on associe deux
si 𝑋 est quantitatif caractères
5 . Te s t s d ’ h y p o t h è s e 𝑋 Ω est un sous ensemble de ℝ2 si
𝑋 est quantitatif

9
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Paramètres statistiques
1. Quelques
Rappels en
probabilité et
statistique
Paramètres statistiques
2 . Méthodes Les paramètres statistiques permettent de résumer la distribution
d’échantillonnage d'une variable quantitative ( les tableaux et les graphiques)
Il y a 2 types de paramètres : position et dispersion.
3 . Distribution
d’échantillonnage • Paramètres de position: Médian, Mode et Moyenne,..
• paramètres de dispersion: écart type, variance…
4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

10
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
La moyenne
1. Quelques Définition 0:
Rappels en
probabilité et Soit 𝑥𝑖 , (𝑖 = 1 , . . . , 𝑝) les modalités d’une série brute, d’effectifs
statistique
𝑛𝑖 , (𝑖 = 1 , . . . , 𝑝) , la moyenne arithmétique pondérée notée 𝑥 est
donnée par
2 . Méthodes
𝑝
d’échantillonnage 1
𝑥= 𝑛𝑖 𝑥𝑖
𝑁
𝑖=1
3 . Distribution
d’échantillonnage

4 . Estimation Remarque
ponctuelle et par IC
Si les données sont regroupées en classes, les 𝑥𝑖 ne sont en général pas
observées. Ces valeurs sont alors remplacées par les centres des
5 . Te s t s d ’ h y p o t h è s e
classes, notés 𝑐𝑖 pour 𝑖 = 1 , . . . , 𝑝.

11
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
La variance
1. Quelques Ecart-type et variance
Rappels en
probabilité et • La variance est la moyenne arithmétique pondérée des écarts à la moyenne
statistique au carré. L’écart-type est la racine carrée de la variance.
• Interprétation: Plus l’écart-type (ou variance) est grand(e) et plus la série
observée est dispersée.
2 . Méthodes
d’échantillonnage
𝑝
1
𝑉𝑎𝑟 𝑥 = 𝑛𝑖 (𝑥𝑖 − 𝑥 )2
3 . Distribution 𝑛
d’échantillonnage 𝑖=1
𝜎𝑥 = 𝑉𝑎𝑟(𝑥)
4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

12
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Variables aléatoires et lois de probabilité
 On appelle expérience aléatoire tout processus qui engendre des résultats ou
1. Quelques
des observation dont il est impossible de connaitre à l’avance l’issue.
Rappels en
probabilité et
statistique  On note Ω l’ensemble des résultats possible d’une expérience aléatoire que l’on
appelle univers et Ƥ (Ω) l’ensemble des parties possibles de Ω

2 . Méthodes  Toute partie de Ω s’appelle événement


d’échantillonnage

On appelle variable aléatoire réelle toute application X de Ω dans ℝ ayant la


3 . Distribution
d’échantillonnage
propriété suivante: pour tout intervalle 𝐼 de ℝ, l’ensemble 𝑋 −1 𝐼 = *𝑤 ∈ Ω: 𝑋(𝑤) ∈
𝐼+ est un événement de Ω , c’est le résultat caractéristique d’une expérience
4 . Estimation aléatoire.
ponctuelle et par IC
Remarque: de façon conventionnelle, on notera toujours par une majuscule
5 . Te s t s d ’ h y p o t h è s e (exemple 𝑋) la variable aléatoire et par des minuscules (exemple 𝑥) les valeurs
qu’elle peut prendre.

13
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Variables aléatoires et lois de probabilité
o Soit 𝑋 une v.a.r discrète , l’application 𝑓 ∶ 𝑋 Ω ⟶ ,0, 1-
1. Quelques
𝑥 ⟶ 𝑓 𝑥 = 𝑃(𝑋 = 𝑥)
Rappels en
probabilité et
statistique S’appelle la loi de probabilité de 𝑋
On appelle loi de probabilité d’une v.a discrète la relation qui permet de
déterminer la probabilité que cette variable prenne une valeur donnée.
2 . Méthodes
d’échantillonnage
o Espérance mathématique de 𝑋 𝐸 𝑋 = +∞ 𝑖=0 𝑥𝑖 𝑃(𝑋 = 𝑥𝑖 )
C’est le résultat moyen que l’on doit s’attendre à obtenir sur un grand
3 . Distribution
d’échantillonnage
nombre d’expériences.
+∞
o Variance de 𝑋 𝑉 𝑋 = 𝑖=0 (𝑥𝑖 − 𝐸(𝑋))2 𝑃(𝑋 = 𝑥𝑖 )
4 . Estimation
ponctuelle et par IC o On appelle fonction de répartition de 𝑋 la fonction numérique 𝐹 définie sur ℝ
par:
5 . Te s t s d ’ h y p o t h è s e 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥)

14
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Variables aléatoires et lois de probabilité
Cas continu
1. Quelques
Rappels en
o On appelle loi de probabilité d’une v.a continue la fonction qui permet de
probabilité et
statistique
déterminer la probabilité que cette variable appartienne à un intervalle.
Cette fonction sera dit densité de probabilité et on a la relation suivante:
𝑥
𝐹𝑋 𝑥 = −∞ 𝑓 𝑡 𝑑𝑡
2 . Méthodes
d’échantillonnage
ou 𝐹𝑋 est la fonction de répartition associé à 𝑋 et 𝑓 sa densité de probabilité

𝑏
3 . Distribution o ∀ 𝑎, 𝑏 ∈ ℝ ; P 𝑎 ≤ X ≤ 𝑏 = 𝐹𝑋 𝑏 − 𝐹𝑋 𝑎 = 𝑎
𝑓 𝑡 𝑑𝑡
d’échantillonnage o Espérance et Variance:
+∞
4 . Estimation 𝐸 𝑋 = 𝑥𝑓 𝑥 𝑑𝑥
ponctuelle et par IC −∞
+∞
𝑉 𝑋 = (𝑥 − 𝐸(𝑋))2 𝑓 𝑥 𝑑𝑥
5 . Te s t s d ’ h y p o t h è s e
−∞

15
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Loi normal ou loi de Laplace-Gauss
 Loi fondamentale en probabilité et statistiques. Elle constitue un modèle
1. Quelques très utilisé dans plusieurs domaines
Rappels en  Loi de caractéristique liés à un échantillons de grande taille
probabilité et
statistique
Définition 1
2 . Méthodes On dit que la v.a.r 𝑋 suit la loi normale centré réduite si elle a pour
d’échantillonnage densité la fonction 𝑓 définie par:
1
1 −2𝑥 2
∀ 𝑥 ∈ ℝ: 𝑓 𝑥 = 𝑒
3 . Distribution 2𝜋
d’échantillonnage On note 𝑋 ∼ 𝒩(0,1)

4 . Estimation
ponctuelle et par IC
Proposition
5 . Te s t s d ’ h y p o t h è s e Soit 𝑋 ∼ 𝒩(0,1) alors on a
1. ∀ 𝑥 ∈ ℝ; 𝑃 𝑋 ≤ 𝑥 = 𝑃 𝑋 ≥ −𝑥 = 1 − 𝑃 𝑋 ≤ −𝑥
i.e 𝐹(−𝑥) = 1 − 𝐹(𝑥)
16
2. 𝑃 𝑋 ≤ 𝑥 = 2𝐹 𝑥 − 1 et 𝑃 𝑋 ≥ 𝑥 = 2(1 − 𝐹 𝑥 )
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Loi normal ou loi de Laplace-Gauss
1. Quelques
Rappels en
probabilité et Définition 2
statistique
On dit que la v.a.r 𝑋 suit la loi normale de paramètre m et 𝜎 si elle a
pour densité la fonction 𝑓 définie par:
2 . Méthodes 1 1 𝑥−𝑚
−2( 𝜎 )2
d’échantillonnage ∀ 𝑥 ∈ ℝ: 𝑓 𝑥 = 𝑒
𝜎 2𝜋
On note 𝑋 ∼ 𝒩(𝑚, 𝜎)
3 . Distribution
d’échantillonnage

4 . Estimation Théorème
ponctuelle et par IC
𝑋−𝑚
𝑋 ∼ 𝒩(𝑚, 𝜎) ⟺ ∼ 𝒩(0,1)
𝜎
5 . Te s t s d ’ h y p o t h è s e

Propriété:
Si 𝑋 ∼ 𝒩(𝑚, 𝜎) alors 𝐸(𝑋) = 𝑚 et 𝑉(𝑋) = 𝜎 2 17
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Loi normal ou loi de Laplace-Gauss
1. Quelques
Rappels en
probabilité et Exercice
statistique
Supposons que la v.a 𝑋 égale au poids d’un nouveau-né suive une loi normale de
moyenne 3,2 kg et d’écart-type 0,4 kg. Quelle est la probabilité
2 . Méthodes 1. Qu’un nouveau-né pèse plus de 4 kg?
d’échantillonnage
2. Qu’un nouveau-né pèse moins de 3 kg?
3. Que son poids soit compris entre 2,8 kg et 3,6kg?
3 . Distribution
d’échantillonnage

4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

18
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distributions dérivées de la loi normale
1. Quelques Distribution de Khi-deux
Rappels en Soient n variables aléatoires indépendantes 𝑈1 , 𝑈2 , 𝑈3 ,…, 𝑈𝑛 suivant
probabilité et chacune la loi normale centrée réduite.
statistique Ainsi la somme 𝑛𝑖=1 𝑈𝑖 2 est une variable aléatoire suivant la loi de Khi-deux
a 𝑛 degrés de liberté noté 𝜒 2 (𝑛)
2 . Méthodes
d’échantillonnage Distribution de Student
Soient 𝑛 + 1 variables aléatoires indépendantes 𝑈1 , 𝑈2 , 𝑈3 ,…, 𝑈𝑛 et 𝑈𝑛+1
3 . Distribution suivant chacune la loi normale centrée réduite. Ainsi la quantité suivante :
d’échantillonnage 𝑈𝑛+1
𝑇=
4 . Estimation 1 𝑛 2
𝑈
ponctuelle et par IC 𝑛 𝑖=1 𝑖
Représente une variable aléatoire dont la distribution est celle d’une loi de
5 . Te s t s d ’ h y p o t h è s e Student à 𝑛 degrés de liberté (𝑛 = 𝑑𝑑𝑙). Cette loi se note 𝑇(𝑛) ou 𝑇𝑛 .

19
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Inégalité de Bienaymé-Tchebychev

1. Quelques
Rappels en
probabilité et
statistique
Soit X une v.a admettant une espérance et une variance, alors
Pour tout 𝜀 > 0
2 . Méthodes 𝜎2
d’échantillonnage 𝑃 𝑋 − 𝐸(𝑋) < 𝜀 ≥ 1 −
𝜀2

3 . Distribution
d’échantillonnage

4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

20
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Chapitre 2 Méthodes d’échantillonnage

RAMCHOUN Hassan cours de statistique appliquée 2022/2023 21


Introduction
1. Quelques  Pour effectuer une étude statistique (enquête, observation ou expérimentation),
Rappels en
probabilité et
on se sert généralement d'un échantillon. Celui-ci doit refléter le plus
statistique exactement possible l'image de la population.

2.Méthodes  Choisir un échantillon, c'est mettre ensemble un certain nombre d'individus


d’échantillonnage qui composeront une sorte de modèle réduit de la population à laquelle ils
appartiennent.

3 . Distribution  L’opération qui consiste à choisir ces individus est appelée échantillonnage
d’échantillonnage
 Mais comment choisir ces individus? C'est à cette question que nous
4 . Estimation
ponctuelle et par IC
répondrons dans ce chapitre, en présentant les méthodes d'échantillonnage
les plus courantes.
5 . Te s t s d ’ h y p o t h è s e

22
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Objectif de l’échantillonnage
1. Quelques
Rappels en  Etudier les caractéristiques d’une population de grande taille à partir
probabilité et
statistique
d’échantillon, en vue d’en prévoir l’évolution

 La procédure d’échantillonnage permet d’un sous groupe recouvrant les


2.Méthodes
d’échantillonnage caractéristiques des paramètres que l’on veut estimer

 Disposant d’observations sur un échantillon de taille 𝑛, on désire en déduire des


propriétés de la population dont il est issu
3 . Distribution
d’échantillonnage
 On cherchera par exemple à estimer la moyenne 𝑚 d’une population à partir de
4 . Estimation la moyenne d’un échantillon
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

23
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Problèmes liés à l’échantillonnage
1. Quelques
Rappels en
probabilité et
statistique

2. Méthodes
La taille de la population est trop grande  l’étude est difficile voir impossible
d’échantillonnage

L’échantillon doit être représentatif de la population


3 . Distribution
d’échantillonnage
Comment déterminer la taille de l’échantillons?

4 . Estimation Quelle est la méthode d’échantillonnage convenable?


ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

24
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Problèmes liés à l’échantillonnage
1. Quelques
Rappels en
probabilité et
statistique
Erreur d’échantillonnage : écart entre les résultats obtenus auprès d’un
échantillon et ce que nous apprendrait un recensement comparable de la
population.
2. Méthodes
d’échantillonnage  Plus la taille de l’échantillon est grande plus l’erreur d’échantillonnage diminue.

Fraction ou taux de sondage : proportion des unités de la population qui font


partie de l’échantillon. C’est le rapport entre la taille de l’échantillon n, et la taille
3 . Distribution 𝑛
d’échantillonnage de la population N: 𝑓 = × 100
𝑁

4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

25
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
La taille de l’échantillon

1. Quelques
Rappels en
Le nombre n’est pas une garantie absolue de représentativité. La détermination de la
probabilité et taille d’échantillon dépend essentiellement de deux facteurs:
statistique - La précision souhaitée: plus on souhaite des résultats précis plus l’échantillon
nécessaire est important
2. Méthodes - Le budget disponible: plus on augmente la taille, plus le cout de l’enquête
d’échantillonnage s’accroit.
La taille de l’échantillon doit être celle qui permet d’atteindre le meilleur équilibre
entre le risque de commettre des erreurs d’échantillonnage, le cout induit par ces
3 . Distribution erreurs, et le cout de l’échantillonnage lui-même
d’échantillonnage

4 . Estimation
 On doit tenir compte deux facteur:
ponctuelle et par IC - la taille de la pop mère
- la variabilité des caractéristiques de la pop mère: plus la pop est diverse et
5 . Te s t s d ’ h y p o t h è s e présente des caractéristiques variées plus il faudra interroger plus de personne et
inversement plus la pop est homogène moins de personnes suffit.

26
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
La taille de l’échantillon: Cas ou la variable
aléatoire estimé suit une loi normale
1. Quelques
Rappels en
-Cas des prélèvements dans une population finie avec remise ou dans une
probabilité et population infinie sans remise:
statistique A partir d’une proportion, on peut calculer la taille de l’échantillon par la formule
suivante
2. Méthodes 𝑧 2 × 𝑝(1 − 𝑝)
d’échantillonnage 𝑛=
𝜀2
𝑧: niveau de confiance, généralement z = 1,96 pour un taux de confiance de 95%
𝑝: proportion estimative de la population présentant la caractéristique étudiée dans
3 . Distribution l’étude. Lorsque cette proportion est ignoré on prend 𝑝 = 0,5
d’échantillonnage
𝜀 ∶ marge d’erreur généralement fixé à 5%
4 . Estimation
ponctuelle et par IC Remarques
la taille de l’échantillon ne dépend pas de la taille de la population la taille de
5 . Te s t s d ’ h y p o t h è s e l’échantillon se définit par rapport au degré de précision recherché et au
phénomène que l’on étudie. C’est ce qui apparait dans la formule de calcul ci-
dessus. Par exemple si on définit un seuil de confiance de 95% et une marge
d’erreur de 2%, cela signifie que l’échantillon permettra d’extrapoler le résultat
27
avec 5% de risques de se
RAMCHOUN tromper
Hassan destatistique
cours de plus ou moins 2%.
appliquée 2022/2023
Taille de l’échantillon et estimation d’une
proportion
1. Quelques
Rappels en
probabilité et Exemple
statistique vous étudiez le marché pour un nouveau produit à lancer, vous investirez pour le
mettre en marché si la proportion des répondants intéressés par ce produit est
2. Méthodes suffisamment grande.
d’échantillonnage Revenons à nos calculs pour vous montrer en exemples ce que cela donne :
Pour calculer une proportion avec un niveau de confiance de 95% et une marge
d’erreur à 5% :
3 . Distribution n = (1,96)² x (0,5)(1-0,5) / (0,05)² = 384,16
d’échantillonnage

4 . Estimation
ponctuelle et par IC Si vous interrogez un échantillon de 400 répondants environ et que vous trouvez
une proportion p de répondants prêts à acheter vos produits, vous pourrez dire :
5 . Te s t s d ’ h y p o t h è s e “avec 95% de confiance, la proportion de la population prête à acheter mes
produits est entre p – 5% et p + 5%”.
Avec 200 répondants seulement, vous pourrez dire : “avec 95% de confiance, la
proportion de la population prête à acheter mes produits est entre p – 7% et
p + 7%”, le niveau de confiance
RAMCHOUN estde le
Hassan cours même
statistique mais la précision
appliquée 2022/2023 est moindre. 28
La taille de l’échantillon: Cas ou la variable
aléatoire estimée suit une loi normale
1. Quelques
Rappels en
probabilité et -Cas des prélèvements dans une population finie avec remise ou dans une
statistique population infinie sans remise:

2. Méthodes A partir d’une moyenne, on peut calculer la taille de l’échantillon par la formule
d’échantillonnage suivante
𝑧2𝜎2
𝑛= 2
𝜀
3 . Distribution 𝑧: niveau de confiance, généralement z = 1,96 pour un taux de confiance de 95%
d’échantillonnage
𝜎:écart-type de l’échantillon.
4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

29
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
La taille de l’échantillon: Cas ou la loi de la
variable aléatoire estimée est inconnue
1. Quelques
Rappels en
Taille de l’échantillon et estimation d’une proportion
probabilité et D’après l’Inégalité de Bienaymé Tchebychev on a
statistique 𝑝(1 − 𝑝)
𝑃 𝑝𝑛 − 𝑝 < 𝜀 ≥ 1 −
𝑛𝜀 2
2. Méthodes 𝑝𝑛 :: proportion ou fréquence relative dans l’échantillon
d’échantillonnage 𝑝: proportion dans la population
𝜀: précision souhaitée;
n: taille de l’échantillon
3 . Distribution
d’échantillonnage
En fixant un seuil de confiance 1 − 𝛼, représentant la probabilité minimale pour
que la proportion calculée à partir de l’échantillon ne s’écarte pas de proportion
4 . Estimation
ponctuelle et par IC dans la population de plus de 𝜀
𝑃 𝑝𝑛 − 𝑝 < 𝜀 ≥ 1 − 𝛼
5 . Te s t s d ’ h y p o t h è s e
𝑝(1−𝑝)
D’où 𝛼 =
𝑛𝜀2
𝑝(1 − 𝑝)
⟹𝑛=
𝛼𝜀 2 30
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
La taille de l’échantillon: Cas ou la variable
aléatoire estimée est inconnue
1. Quelques
Rappels en
Taille de l’échantillon et estimation d’une moyenne
probabilité et D’après l’Inégalité de Bienaymé Tchebychev on a
statistique 𝜎2
𝑃 𝑋−𝑚 <𝜀 ≥1− 2
𝑛𝜀
2. Méthodes 𝑋: moyenne de l’échantillon
d’échantillonnage 𝑚: moyenne de la population
𝜀: précision souhaitée;
𝜎:écart-type de l’échantillon.
3 . Distribution n: taille de l’échantillon
d’échantillonnage

4 . Estimation
En fixant un seuil de confiance (1 − 𝛼), représentant la probabilité minimale pour
ponctuelle et par IC que la moyenne calculée à partir de l’échantillon ne s’écarte pas de la moyenne
de la population de plus de 𝜀
5 . Te s t s d ’ h y p o t h è s e 𝑃 𝑋−𝑚 <𝜀 ≥1−𝛼

𝜎2
⟹𝑛= 2
𝛼𝜀 31
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Différents types d’échantillonnage
1. Quelques
Rappels en
probabilité et Méthodes d’échantillonnage probabilistes ou aléatoire
statistique
- L'échantillonnage aléatoire simple
- L'échantillonnage aléatoire stratifié
2. Méthodes
- L'échantillonnage aléatoire systématique
d’échantillonnage
- L'échantillonnage aléatoire en grappe

Méthodes d’échantillonnage non probabilistes


3 . Distribution
d’échantillonnage
- L'échantillonnage par quotas
- Echantillonnage boule de neige
4 . Estimation - L'échantillonnage à l'aveuglette (accidentel ou de convenance)
ponctuelle et par IC - L'échantillonnage de volontaires

5 . Te s t s d ’ h y p o t h è s e

32
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en
probabilité et
statistique
L'échantillonnage aléatoire simple
L'échantillonnage aléatoire simple consiste à choisir des individus de telle sorte que
2. Méthodes
chaque membre de la population ait une égale chance de figurer dans l'échantillon.
d’échantillonnage
Ce choix peut se faire avec ou sans remise: avec remise, un individu peut être choisi
plusieurs fois; sans remise, un individu déjà choisi ne peut l'être de nouveau.
L'échantillonnage aléatoire simple est habituellement fait sans remise.
3 . Distribution
d’échantillonnage
L’adoption de cette méthode est appropriée lorsque la population est nombreuse et
4 . Estimation relativement homogène
ponctuelle et par IC
Procédure à suivre:
5 . Te s t s d ’ h y p o t h è s e 1. Définir clairement la nature de la pop
2. Assigner un numéro à chaque individu de la pop
3. Sélectionner l’échantillon en choisissant n’importe quelle méthode qui donne une
chance égale à tous les numéros d’être tirés
33
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en
probabilité et Exemple:
statistique Le responsable d’une école de 1000 élèves souhaite mener une enquête sur la qualité
des aliments servis à la cafétéria, il décide d’interroger un échantillon de 50 élèves.
2. Méthodes Pour obtenir l’échantillon, il attribue à chaque élève de l’école un numéro compris
d’échantillonnage entre 1 et 1000 et avec une table de numéro générés au hasard, il extrait 50 numéros
entre 1 et 1000 générés aléatoirement de cette table

3 . Distribution
d’échantillonnage Remarques
Avantage: Méthode plus couramment utilisées, il n’exige pas de données
4 . Estimation
ponctuelle et par IC additionnelles dans la base de sondage autres que la liste complète des individus de
la pop.
5 . Te s t s d ’ h y p o t h è s e Inconvénient: Il se peut que des éléments de la pop qui présentent plus les
caractéristiques étudiés ne soient pas compris dans l’échantillon choisi

34
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en Echantillonnage stratifié
probabilité et
statistique La méthode repose sur une division de la population en groupes relativement
homogènes, appelés strates, puis sur la sélection d'un échantillon dans chaque
2. Méthodes strate. C'est une méthode qui permettra d'obtenir un échantillon représentatif,
d’échantillonnage c'est-à-dire un échantillon qui possédera les mêmes caractéristiques que la
population dont il a été extrait.
La stratification permet d’obtenir une homogénéité à l’intérieur des sous groupes
3 . Distribution
d’échantillonnage
Démarche à suivre:
1) Définir clairement la nature de la pop
4 . Estimation
ponctuelle et par IC 2) Déterminer les sous groupes à représenter dans l’échantillon
3) Assigner un numéro à chaque individu de chaque sous groupe
4) Déterminer le pourcentage que représente chaque sous groupe dans la population
5 . Te s t s d ’ h y p o t h è s e
5) Sélectionner l’échantillon en choisissant n’importe quelle méthode qui donne une chance
égale à tous les numéros d’être tirés à l’intérieur d’un sous groupe .
6) Il faut s’assurer que chaque sous groupe est représenté proportionnellement à sa
représentation dans la pop 35
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en
probabilité et
statistique Exemple

2. Méthodes On veut choisir par échantillonnage stratifié 10 élèves dans un groupe de 60, en
d’échantillonnage tenant compte du fait que 50 % d'entre eux sont en première année, 30 % en 2ème
année et 20 % en 3e année. Chaque année sera une strate dans laquelle on ira
chercher des élèves en tenant compte des pourcentages qu'occupe chaque strate
3 . Distribution dans la population. Ainsi, on choisira au hasard:
d’échantillonnage 5 élèves en 1ère année, puisque 10 x 50% = 5 ;
3 élèves en 2ème année, puisque 10 x 30% = 3 ;
4 . Estimation
ponctuelle et par IC 2 élèves en 3ème année, puisque 10 x 20% = 2.
Il ne reste plus qu'à sélectionner un échantillon dans chaque strate, ce qui pourrait
5 . Te s t s d ’ h y p o t h è s e être fait par échantillonnage aléatoire simple ou systématique.
Dans une population peu homogène, le découpage en strates sera d'autant
plus avantageux qu'existera une certaine homogénéité à L'intérieur de chaque strate.

36
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en
probabilité et
statistique Echantillonnage Systématique
L'échantillonnage systématique suppose l'existence d'une liste de la population où
2. Méthodes chaque individu est numéroté de 1 jusqu'à N.
d’échantillonnage
Notons n, le nombre d'individus que doit comporter l'échantillon.
L'entier N/n sera noté r et appelé la raison de sondage (ou le pas de sondage)
La raison de sondage est de r=N/n
3 . Distribution Choisissons ensuite au hasard un entier 𝑑 entre 1 et N. cet entier sera le point de
d’échantillonnage
départ.
4 . Estimation Pour former l'échantillon, il s'agira de choisir un premier individu comme point de
ponctuelle et par IC départ; ce sera l'individu dont le numéro correspond à d.
Pour sélectionner les autres, il suffit d'ajouter à d le pas de sondage r:
5 . Te s t s d ’ h y p o t h è s e Les individus choisis seront alors les individus dont les numéros correspondent à:
d ; d + r; d + 2r; d + 3r; …… ; d + (n-1)r.
II faudra reprendre au début lorsque la liste sera épuisée.
37
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en Exemple:
probabilité et
statistique On veut choisir par échantillonnage systématique 8 entreprises parmi un groupe de
80.
2. Méthodes 1. Numérotez les entreprises de 1 à 80.
d’échantillonnage 2. Calculez La raison de sondage (r=N/n) qui sera 10, car (N=80/n=8) = 10.
3. Ensuite, on tire un numéro d au hasard de 1 à 80. supposons que d=3, Alors
l’entreprise qui a le numéro 3 est sélectionnée.
3 . Distribution 4. Pour avoir les 7 autres entreprises qui vont former l’échantillon, on ajoute chaque
d’échantillonnage fois la raison de sondage.
- l’échantillon sera alors:
4 . Estimation 3ième entreprise ; 13;23;33;43;53;63;73
ponctuelle et par IC
- Si par exemple: d=55 ième entreprise
- l’échantillon est constitué de :
5 . Te s t s d ’ h y p o t h è s e
- 55;65;75;85-80=5;15;25;35;45.
Selon la raison de sondage et le point de départ choisi, il peut arriver que un
nombre obtenu se situe à l'extérieur de la liste. En pareil cas, il faut revenir au début
de la liste. RAMCHOUN Hassan cours de statistique appliquée 2022/2023
38
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en
probabilité et Remarques
statistique
Avantages:
2. Méthodes - L'échantillon est facile à sélectionner car un seul nombre est choisi au hasard.
d’échantillonnage - Cette méthode tend à répartir l'échantillon sur l'ensemble de la liste de la
population, ce qui permet d'obtenir une assez bonne précision.
-Inconvénient:
3 . Distribution
- On ne peut obtenir qu'un nombre limité d'échantillons différents à partir de la
d’échantillonnage même liste. Dans l’exemple précédent, on constatera qu'il ne peut y avoir que 10
échantillons différents de taille 8.
4 . Estimation - Les échantillons possibles risquent de ne pas être représentatifs de la pop s’il
ponctuelle et par IC
existe un certain cycle sur le plan du mode d’ordonnancement de la pop inscrite sur
une liste et si ce cycle coïncide d’une façon quelconque avec l’ intervalle
5 . Te s t s d ’ h y p o t h è s e
d’échantillonnage

39
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en
probabilité et Echantillonnage en grappe
statistique
Cette méthode consiste à choisir au hasard des groupes d’individus de la population,
2. Méthodes appelés grappes, pour qu’ils fassent partie de l’échantillon. Les grappes sont des
d’échantillonnage sous-ensemble de la population.

Pour que cette méthode d’échantillonnage fournisse un échantillon représentatif, il


3 . Distribution
faut que chacune des grappes soit composée d’individus ayant des caractéristiques
d’échantillonnage diversifiées.

4 . Estimation Cependant, il faudra que l’ensemble des grappes soient relativement semblables,
ponctuelle et par IC
tant par leur taille que par leur composition.
5 . Te s t s d ’ h y p o t h è s e

40
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en
probabilité et
statistique
Les étapes à suivre:
1. On sépare la population en grappe hétérogènes de taille semblable qu’on
2. Méthodes
numérote.
d’échantillonnage 2. On détermine la taille de l’échantillon 𝑛 voulu.
3. On calcule le nombre de grappes qu’il faudra choisir pour constituer l’échantillon

3 . Distribution 𝑛
d’échantillonnage Nombre de garappe =
𝑁𝑜𝑚𝑏𝑟𝑒 𝑚𝑜𝑦𝑒𝑛 𝑑 ′ 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢 𝑝𝑎𝑟 𝑔𝑟𝑎𝑝𝑝𝑒
4 . Estimation
ponctuelle et par IC 4. On choisit le nombre de grappes nécessaire par la méthode d’échantillonnage
aléatoire simple.
5 . Te s t s d ’ h y p o t h è s e

41
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage probabilistes ou
aléatoires
1. Quelques
Rappels en
probabilité et
statistique
Exemple
2. Méthodes Au moyen de l'échantillonnage par grappes. On veut choisir 12 salariés; dans un
d’échantillonnage groupe de 60.
1. On demande aux salariés de se regrouper par 6. on aura alors 10 grappes de 6
salariés.
3 . Distribution
2. La taille de l’échantillon est n=12;
d’échantillonnage 3. Nombre de grappe à choisir=12/6=2;
4. On choisit ensuite au hasard deux regroupements, par exemple les grappes
4 . Estimation numéro 4 et 7 en retenant tous les individus de ces deux grappes, on constitue un
ponctuelle et par IC
échantillon de 12 salariés.
5 . Te s t s d ’ h y p o t h è s e

42
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage non probabilistes
1. Quelques
Rappels en
probabilité et
statistique

2. Méthodes - Des techniques où les éléments de l’échantillon sont choisis sur le


d’échantillonnage terrain en fonction de jugements sur les caractéristiques de la
population. Elles ne nécessitent pas de base de sondage.

3 . Distribution - Elles sont rapides, et pas très chères.


d’échantillonnage

4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

43
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage non probabilistes
1. Quelques
Rappels en
probabilité et
L ’échantillonnage par quotas ou proportionnel
statistique
C’est l’une des techniques les plus répandues. Elle repose sur le principe de
2. Méthodes reproduction, le plus fidèlement possible, des caractéristiques de la population
d’échantillonnage étudiée grâce à l’application de règles très précises.
Par ce procédé, on va chercher à construire un échantillon qui ressemble à la
population mère.
3 . Distribution
d’échantillonnage Exemple :
Dans une population de salarié, il y a 52% d’hommes et 48% de femmes. Pour
4 . Estimation n=100. on retiendra alors 52 hommes et 48 femmes.
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

44
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage non probabilistes
1. Quelques
Rappels en
probabilité et
statistique
Les inconvénients de la méthode sont ceux des méthodes non aléatoires en
général :
2. Méthodes - Existence de biais (même avec les consignes). La qualité des enquêtes repose sur
d’échantillonnage celle du travail de l’enquêteur.
- Impossibilité de calculer des marges d’erreur;
Les avantages sont essentiellement :
- des coûts et des délais de réalisations plus faibles que ceux d’une enquête aléatoire
3 . Distribution
d’échantillonnage - des résultats que l’on peut qualifier de fidèles.

4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

45
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage non probabilistes
1. Quelques Echantillonnage boule de neige:
Rappels en
probabilité et
statistique  Méthode par laquelle on constitue un échantillon en choisissant d’abord
arbitrairement un petit groupe d’individus ayant les caractéristiques
2. Méthodes recherchées pour l’étude. Par la suite, on demande à ces individus de
d’échantillonnage sélectionner d’autres personnes de leur entourage qui présentent les mêmes
caractéristiques pour qu’ils prennent partie à l’échantillon.

3 . Distribution  Cette méthode est particulièrement utile lorsqu’on veut atteindre une
d’échantillonnage
population difficile à rejoindre. Ou on veut étudier leurs réseaux sociaux.
4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

46
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage non probabilistes
1. Quelques
Rappels en
probabilité et
statistique
Les échantillons « accidentels » ou à l’aveuglette:
2. Méthodes
d’échantillonnage Il s’agit d’un échantillon constitué d’individus qui se trouvaient accidentellement
à l’endroit et au moment où l’information a été collectée.

3 . Distribution Exemple : - Enquêtes réalisées dans la rue, les lieux publics, en sortie de super
d’échantillonnage marché …
4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

47
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Méthodes d’échantillonnage non probabilistes
1. Quelques
Rappels en
probabilité et
statistique
Les échantillons de volontaires:
2. Méthodes
d’échantillonnage  Dans le cas d'expériences psychologiques ou médicales, d'enquêtes sur les
habitudes de consommation, il ne serait pas pratique de choisir au hasard des
individus dans toute la population.
3 . Distribution
d’échantillonnage  Comme l'enquête sera longue, exigeante, quelquefois même désagréable, on
préfère réunir des volontaires, d'où le nom d'échantillonnage de volontaires.
4 . Estimation
ponctuelle et par IC Néanmoins, il faut toujours craindre un écart entre les caractéristiques des
volontaires et celles de la population.
5 . Te s t s d ’ h y p o t h è s e

48
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Chapitre 3 Distribution d’échantillonnage

RAMCHOUN Hassan cours de statistique appliquée 2022/2023 49


Définitions
1. Quelques
Rappels en
probabilité et
statistique
Les n variables aléatoire 𝑋1 , 𝑋2 , … 𝑋𝑛 constituent un échantillon aléatoire simple
2. Méthodes de la v.a X ssi 𝑋1 , 𝑋2 , … 𝑋𝑛 sont indépendantes et de même loi que X
d’échantillonnage

On appelle statistique toute fonction de v.a 𝑋1 , 𝑋2 , … 𝑋𝑛


3 . Distribution
d’échantillonnage Exemple
1 𝑛
La moyenne arithmétique 𝑋 = 𝑖=1 𝑋𝑖
𝑛
𝑋𝑛
4 . Estimation La proportion:
ponctuelle et par IC 𝑛
1 𝑛
La variance empirique: 𝑖=1(𝑋𝑖 − 𝑋)2
𝑛
5 . Te s t s d ’ h y p o t h è s e

50
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage
1. Quelques
Rappels en Prenons tous les échantillons possibles de taille n tirés d’une population P
probabilité et
statistique

2. Méthodes
d’échantillonnage Population

3 . Distribution
d’échantillonnage

4 . Estimation Echantillon 1 Echantillon 2 ……………………… Echantillon p


ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e
Pour chaque échantillon on peut calculer une statistique (moyenne , proportion,
écart-type, …) qui varie selon l’échantillon, pour tous les échantillons on obtient une
distribution de la statistique que l’on nomme la distribution d ’échantillonnage
51
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage
1. Quelques
Rappels en
probabilité et
statistique

2. Méthodes
d’échantillonnage

Remarque
3 . Distribution A partir d’une population de N éléments on distingue deux tirage possible
d’échantillonnage Tirage exhaustif (sans remise): nombre d’échantillons 𝐶𝑁𝑛
Tirage non exhaustif (avec remise): nombre d’échantillons 𝑁 𝑛

4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

52
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage d’une moyenne

1. Quelques Si nous prélevons tous les échantillons possibles de même taille n d’une
Rappels en
probabilité et
population P. la moyenne arithmétique 𝑋 calculé sur chaque échantillon variera
statistique d’une échantillon à l’autre. Ces moyenne auront des valeurs autours d’une valeur
centrale m qui est celle de la moyenne de la population
2. Méthodes On considère alors les moyennes de chaque échantillon comme des réalisations
d’échantillonnage
d’une variable aléatoire (𝑋) qui possèdent une distribution dite distribution
d’échantillonnage des moyennes
3 . Distribution Si la variance de la pop est connue
d’échantillonnage la population est infinie ou le tirage est non exhaustif (avec remise)
 On a 3 possibilités pour donner la forme de distribution de la moyenne
𝜎
 La pop possède une distribution normale alors 𝑋 ~𝑁(𝑚, )
4 . Estimation 𝑛
ponctuelle et par IC  Si la distribution est inconnue et 𝑛 ≥ 30
𝜎
𝑋 ~𝑁(𝑚, )
𝑛
5 . Te s t s d ’ h y p o t h è s e
 Si la distribution est inconnue et 𝑛 < 30 𝑋 ~𝑇(𝑛 − 1)
Si la population est finie de taille N et le tirage est exhaustif (sans remise)
𝜎 𝑁−𝑛
𝑋 ~𝑁(𝑚, ) 53
𝑛 𝑁−1
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage d’une moyenne

1. Quelques Si la variance de la pop est inconnue


Rappels en
probabilité et
la population est infinie ou le tirage est non exhaustif (avec remise)
statistique On utilise la variance d’échantillonnage 𝑆 2
 On a 3 possibilités pour donner la forme de distribution de la moyenne
𝑋−𝑚
2. Méthodes
d’échantillonnage
 La pop possède une distribution normale alors Z = ~𝑁(0; 1)
𝑆/ 𝑛
 Si la distribution est inconnue et 𝑛 ≥ 30
𝑆
𝑋 ~𝑁(𝑚; )
3 . Distribution 𝑛
d’échantillonnage 𝑋−𝑚
 Si la distribution est inconnue et 𝑛 < 30 T = ~𝑇(𝑛 − 1)
𝑆/ 𝑛

4 . Estimation Si la population est finie de taille N et le tirage est exhaustif (sans remise)
ponctuelle et par IC
𝑆 𝑁−𝑛
𝑋 ~𝑁(𝑚; )
𝑛 𝑁
5 . Te s t s d ’ h y p o t h è s e
Remarque
La loi de Student est généralement utilisée pour les petits échantillons
lorsque la variance de la population est inconnue.
54
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage d’une moyenne

1. Quelques
Rappels en
probabilité et
statistique
Loi (Distribution) de la moyenne d’échantillonnage
2. Méthodes
d’échantillonnage
La loi de 𝑋 dépend de :

3 . Distribution  Loi de la population (Normale ou quelconque)


d’échantillonnage
 Variance de la population (Connue ou inconnue)
4 . Estimation
ponctuelle et par IC  Taille de l'échantillon (n petite ou grande)

5 . Te s t s d ’ h y p o t h è s e

55
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage d’une moyenne

1. Quelques
Rappels en
probabilité et
statistique
Remarques

2. Méthodes  Si n est petit devant N, la distinction entre exhaustivité et non exhaustivité est
d’échantillonnage 𝑁−𝑛
sans objet car ≈1
𝑁−1

3 . Distribution
d’échantillonnage  Si la taille des échantillons est assez grande (en pratique ≥ 30), la
distribution d’échantillonnage de la moyenne approche la distribution
normale quelle que soit la distribution de la population.
4 . Estimation
ponctuelle et par IC
 Si la population est normalement distribuée, la distribution
5 . Te s t s d ’ h y p o t h è s e d’échantillonnage de la moyenne est une loi normale quelle que soit la
valeur 𝑛 de la taille des échantillons.

56
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage d’une moyenne
Exemple
1. Quelques La Taille des étudiants d’une université, Notée X est une Variable Normale de
Rappels en
probabilité et
moyenne 170 cm et d’écart type 7 cm .On tire au hasard avec remise un
statistique échantillon de taille n=49. Calculer la probabilité que la moyenne de
l’échantillon soit :
2. Méthodes a- inférieure à 172 cm
d’échantillonnage
b-comprise entre 168cm et 172cm ?

3 . Distribution Solution
7
d’échantillonnage a) On a 𝑋~𝑁(170; ) par suite
49
𝑋 − 170
𝑍= ~𝑁(0; 1)
4 . Estimation 1
ponctuelle et par IC D’après la table de la loi normale centrée réduite on trouve
𝑝 𝑋 < 172 = 𝑝 𝑍 < 2 = 0,977
5 . Te s t s d ’ h y p o t h è s e b) Il s’agit de calculer
𝑝 168 < 𝑋 < 172 = 𝑝 −2 < 𝑍 < 2 = 2𝐹 2 − 1 = 0,954

57
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage d’une moyenne

1. Quelques Exercice 1
Rappels en
probabilité et
On a une population finie composée de 3 éléments, P={1, 2, 3}
statistique - Calculer la moyenne et l’écart-type de cette population.
On va effectuer des prélèvements des échantillons de taille (n=2), on fait le
2. Méthodes prélèvement dans les deux cas (tirage exhaustif et tirage non exhaustif).
d’échantillonnage
- Quelle est le nombre des échantillons qui peuvent être prélevés à partir de cette
population ?
3 . Distribution - Effectuez le prélèvement de ces échantillons.
d’échantillonnage - Etablir une distribution d’échantillonnage des moyennes.
- Calculez la moyenne de la distribution d’échantillonnage des moyennes.
- Calculez l’écart-type de la distribution d’échantillonnage des moyenne .
4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

58
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage d’une moyenne

1. Quelques Exercice 2:
Rappels en
probabilité et
statistique Une machine découpe des rondelles de diamètre moyen m= 20 mm et d’écart-type 2
mm, on prélève un échantillon de 100 pièce.
2. Méthodes Déterminer la probabilité que le diamètre moyen de ces 100 pièce soit inférieur à 20,4
d’échantillonnage
mm

3 . Distribution Exercice 3:
d’échantillonnage La moyenne des notes d’une épreuve de statistique de 300 étudiants est égale à 9,8 et
l’écart- type est de 3,68. Trouver la probabilité qu’un échantillon aléatoire de notes de
40 étudiants extrait de l’ensemble ait une moyenne :
4 . Estimation
ponctuelle et par IC 1. Comprise entre 10 et 13.
2. Inférieure à 10.
5 . Te s t s d ’ h y p o t h è s e NB : Trouver la probabilité dans les deux cas (tirage exhaustif et non exhaustif)

59
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage des fréquences

1. Quelques On considère les échantillons de taille n extraits, d’une population de taille


Rappels en
probabilité et
N. à chaque échantillon extrait correspond une fréquence 𝑓𝑛 de réalisation de
statistique l’évènement considéré.

2. Méthodes On a :
d’échantillonnage
Si le tirage est avec remise :
𝐸(𝑓𝑛 )= 𝑝
𝑝𝑞
3 . Distribution 𝑉(𝑓𝑛 ) = avec 𝑞 = 1 − 𝑝
𝑛
d’échantillonnage Si le tirage est sans remise :
𝐸(𝑓𝑛 )= 𝑝
𝑝𝑞 𝑁 − 𝑛
4 . Estimation 𝑉(𝑓𝑛 ) =
ponctuelle et par IC 𝑛 𝑁−1

5 . Te s t s d ’ h y p o t h è s e
Si n≥ 30; 𝑛𝑝 ≥ 5; 𝑛𝑞 ≥ 5 alors 𝑓𝑛 ~N p; 𝑉(𝑓𝑛 )

60
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution d’échantillonnage des fréquences
Exemple
1. Quelques
Rappels en
probabilité et L’institut de marketing alimentaire révèle que 17% des ménages dépensent plus
statistique de 100 DH par semaine en épicerie. Supposant que la proportion de la population
soit p=0, 17 et qu’un échantillon aléatoire simple de 800 ménage soit sélectionné
2. Méthodes
d’échantillonnage
parmi cette population
1. Déterminer la distribution d’échantillonnage de F : la proportion des
ménages qui dépensent plus de 100 DH par semaine en épicerie.
3 . Distribution 2. Quelle est la probabilité que la proportion d’échantillon F s’écarte au plus de
d’échantillonnage plus au moins 0, 02 de la proportion de la population
3. Reprendre la question 2) dans le cas de 1600 ménages
4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

61
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Distribution de Khi deux valeurs de k pour F (k) donné
Degré de liberté n de 1 à 50

1. Quelques
Rappels en
probabilité et
statistique

2. Méthodes
d’échantillonnage

3 . Distribution
d’échantillonnage

4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

62
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Loi de student, valeur de t pour F(t) donné

1. Quelques
Rappels en
probabilité et
statistique

2. Méthodes
d’échantillonnage

3 . Distribution
d’échantillonnage

4 . Estimation
ponctuelle et par IC

5 . Te s t s d ’ h y p o t h è s e

63
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Chapitre 4 Estimation ponctuelle et par
intervalle de confiance

RAMCHOUN Hassan cours de statistique appliquée 2022/2023 64


Introduction

1. Quelques
Rappels en
probabilité et Estimer certaines caractéristiques statistiques de la loi (moyenne, variance) au
statistique travers d’une série d’observations (𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ). C’est la problématique
inverse de l’échantillonnage.
2. Méthodes
d’échantillonnage
À partir des caractéristiques d’un échantillon, que peut-on déduire des
caractéristiques de la population dont il est issu ?
3 . Distribution
d’échantillonnage
L’estimation consiste à donner des valeurs approximatives aux paramètres d’une
4 . Estimation population à l’aide d’un échantillon de 𝑛 observations issues de cette population.
ponctuelle et par On peut se tromper sur la valeur exacte, mais on donne la “meilleure valeur”
IC possible que l’on peut supposer.

5 . Te s t s d ’ h y p o t h è s e

65
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Introduction

1. Quelques
Rappels en
probabilité et
statistique L’estimation consiste en l’évaluation d’un paramètre de la population à partir de
l’observation d’un E.A. La théorie de l’estimation se divise en deux parties:
2. Méthodes
d’échantillonnage
L’estimation ponctuelle: permet d’obtenir une valeur unique calculée à partir
d’un E.A., valeur qui sera prise comme estimation du paramètre inconnu.
3 . Distribution
d’échantillonnage L’estimation par intervalle: permet de déterminer un intervalle qui, avec une
grande probabilité fixée a priori, contient la vraie valeur du paramètre inconnu
4 . Estimation
ponctuelle et par
IC

5 . Te s t s d ’ h y p o t h è s e

66
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimateur et estimation
1. Quelques
Rappels en On souhaite estimer un paramètre 𝜃 d’une population (cela peut être sa moyenne
probabilité et
statistique 𝑚 , son écart-type 𝜎 ,une proportion 𝑝 .
Un estimateur de 𝜃 est une statistique T (donc une fonction de 𝑋1 , 𝑋2 , … , 𝑋𝑛 )
2. Méthodes dont la réalisation est envisagée comme une “bonne valeur” du paramètre 𝜃 . On
d’échantillonnage
parle d’estimation de 𝜃 associée à cet estimateur la valeur observée lors de
l’expérience, c’est-à-dire la valeur prise par la fonction au point observé
3 . Distribution (𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ).
d’échantillonnage
Exemple:
4 . Estimation pour estimer l’espérance 𝐸(𝑋) d’une v.a 𝑋, un estimateur naturel est la moyenne
ponctuelle et par
IC empirique 𝑋qui produit une estimation 𝑥 , moyenne descriptive de la série des
valeurs observées.
5 . Te s t s d ’ h y p o t h è s e

67
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimateur et estimation

1. Quelques
Définition de l’estimateur
Rappels en
probabilité et On appelle estimateur du paramètre 𝜃 noté 𝑇 toute statistique utilisée dans
statistique le but d’approcher la valeur inconnue de 𝜃. Un estimateur est donc une
Variable aléatoire, c’est une fonction des éléments de l’échantillon
2. Méthodes 𝑇 = 𝑓(𝑋1 , 𝑋2 , … , 𝑋𝑛 )
d’échantillonnage

3 . Distribution
d’échantillonnage Définition de l’estimation
4 . Estimation C’est la valeur prise par l’estimateur dans l’échantillon réalisé
ponctuelle et par
IC (𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ).
Une estimation du paramètre 𝜃 est une réalisation d’un estimateur de ce
5 . Te s t s d ’ h y p o t h è s e
paramètre. Une estimation est donc une valeur numérique.

68
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimateur et estimation
Estimation ponctuelle
1. Quelques L’estimation ponctuelle ou l’estimation de point d’un paramètre est la
Rappels en
probabilité et
connaissance de la seule valeur estimée de ce paramètre. Les paramètres les
statistique plus recherchés sont la moyenne, la variance et la proportion.

2. Méthodes Soit 𝑇𝑛 un estimateur d’un paramètre inconnu 𝜃. Une estimation ponctuelle


d’échantillonnage
de 𝜃 est la réalisation 𝑡𝑛 = 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 ) de 𝑇𝑛 (obtenue après le tirage
de l’échantillon).
3 . Distribution On appelle estimations les valeurs numériques 𝑡1 , 𝑡2 , …de cette variable
d’échantillonnage aléatoire 𝑇𝑛 .
4 . Estimation
ponctuelle et par
IC Biais d’un estimateur
On rappelle que le biais de T pour 𝜃 la valeur 𝐵(𝑇) = 𝐸 𝑇 − 𝜃
5 . Te s t s d ’ h y p o t h è s e
Si 𝐵 = 0 on dit que 𝑇 estime 𝜃 (estimateur sans biais)
Si B > 0 on dit que T sur estime 𝜃
Si B < 0 on dit que T sous estime 𝜃
69
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimateur et estimation
1. Quelques
Rappels en
probabilité et Soit m et 𝜎 la moyenne et l’écart-type respectivement d’une population P et
statistique 𝑋1 , 𝑋2 , … 𝑋𝑛 un échantillon de P
Si E(𝑋)=m on dit que la statistique 𝑋 est un estimateur sans biais de m
2. Méthodes
d’échantillonnage

Remarque
1 𝑛
3 . Distribution Soit la variance empirique 𝑆𝑒2 = 𝑖=1 (𝑋𝑖 − 𝑋)2
d’échantillonnage 𝑛
On démontre que E(𝑆𝑒 ) ≠ 𝜎 et on dit que 𝑆𝑒2 est un estimateur biaisé de 𝜎 2
2 2

 Le bon estimateur de la variance d’une population est plutôt


4 . Estimation 1 𝑛
𝑆2 = 2
𝑖=1(𝑋𝑖 − 𝑋 ) car E 𝑆
2 = 𝜎2
ponctuelle et par IC 𝑛−1

5 . Te s t s d ’ h y p o t h è s e

70
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimateur et estimation
Estimateur consistant
1. Quelques Un estimateur T est dit convergent si E(T) tend vers 𝜃 lorsque n tend vers
Rappels en
probabilité et l’infini. Il sera dit consistant si T converge en probabilité vers 𝜃 lorsque n
statistique tend vers l’infini.
Si de plus T est convergent et de variance tendant vers 0 lorsque n tend vers
2. Méthodes l’infini alors T est consistant.
d’échantillonnage

Qualité d’un estimateur


3 . Distribution
d’échantillonnage La qualité d’un estimateur se mesure également par l’erreur quadratique
moyenne (ou risque quadratique) définie par 𝐸 𝑇 − 𝜃 2 .
4 . Estimation 𝐸 𝑇 − 𝜃 2 = 𝑉 𝑇 + (𝐸 𝑇 − 𝜃)2
ponctuelle et par
IC = 𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 + 𝐵𝑖𝑎𝑖𝑠 2

5 . Te s t s d ’ h y p o t h è s e Remarque
Entre deux estimateurs sans biais, le “meilleur” sera celui dont la variance est
minimale.
71
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimateur et estimation
1. Quelques
Rappels en Exemples
probabilité et i) 𝑋 est un estimateur sans biais de la moyenne 𝑚 de 𝑋 sur la population . Son
statistique
estimation 𝑥 est la moyenne observée dans une réalisation de l’échantillon.
1 𝑛
2. Méthodes ii) 𝑆𝑒2 = 2 2
𝑖=1(𝑋𝑖 − 𝑋 ) est un estimateur consistant de 𝜎 (mais biaisé).
𝑛
d’échantillonnage 1 𝑛
iii) 𝑆 2 = 𝑛−1 𝑖=1(𝑋𝑖 − 𝑋)2 est un estimateur sans biais et consistant de 𝜎 2 .
𝑛
Son estimation est 𝑠 2 = 𝜎𝑒 2 ou 𝜎𝑒 2 est la variance observé dans une
3 . Distribution 𝑛−1
d’échantillonnage réalisation de l’échantillon.
iv) On choisit la proportion 𝑓 des éléments possédant une certaine propriété
4 . Estimation dans un échantillon prélevé aléatoirement dans une population comme
ponctuelle et par meilleure estimation ponctuelle de la proportion inconnue p des éléments de
IC
cette population ayant cette propriété.
5 . Te s t s d ’ h y p o t h è s e

72
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimateur et estimation

1. Quelques
Rappels en
probabilité et
statistique
Méthodes d’estimation
2. Méthodes
d’échantillonnage Plusieurs méthodes d’estimation existe. Les plus courantes sont:
L’ estimation par la méthode du Maximum de vraisemblance;
L’estimation par la méthode des Moments
3 . Distribution
d’échantillonnage

4 . Estimation
ponctuelle et par
IC

5 . Te s t s d ’ h y p o t h è s e

73
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimation par maximum de vraisemblance (EMV)
Notion de vraisemblance et principe de EMV
1. Quelques
Rappels en
Soit 𝑋 une variable aléatoire réelle de loi paramétrique (discrète ou
probabilité et continue), dont on veut estimer le paramètre 𝜃. On appelle fonction de
statistique vraisemblance de 𝜃 pour une réalisation 𝑥1 , 𝑥2 , … 𝑥𝑛 d’un échantillon, la
fonction de 𝜃 :
2. Méthodes 𝑛
d’échantillonnage
𝐿 𝑥1 , 𝑥2 , … 𝑥𝑛 , 𝜃 = 𝑓 𝑥1 , 𝑥2 , … 𝑥𝑛 , 𝜃 = 𝑓(𝑥𝑖 , 𝜃)
𝑖=1
3 . Distribution C’est la probabilité ou la densité de probabilité relative aux valeurs
d’échantillonnage observées 𝑥1 , 𝑥2 , … , 𝑥𝑛 .
La méthode consistant à estimer 𝜃 par la valeur qui maximise L s’appelle
4 . Estimation
méthode du maximum de vraisemblance. On cherche ce maximum en
ponctuelle et par
IC annulant la dérivée de la fonction par rapport à 𝜃 ou en annulant la dérivée
de son logarithme.
5 . Te s t s d ’ h y p o t h è s e
Remarque
Il est préférable d’optimiser le logarithme de vraisemblance Log(L)
74
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimation par maximum de vraisemblance (EMV)
Exemple 1
1. Quelques
Pour une population normale, la densité de probabilité est :
1 𝑥−𝑚
Rappels en 1 −2( 𝜎 )2
probabilité et
𝑓 𝑥; 𝑚 = 𝑒 ; 𝜃 = (𝑚, 𝜎)
𝜎 2𝜋
statistique Donc la fonction de vraisemblance correspondante est
𝑛
1 1
2. Méthodes 𝐿 𝑥, 𝜃 = exp(− 2 (𝑥𝑖 − 𝑚)2 )
d’échantillonnage (𝜎 2𝜋)𝑛 2𝜎
𝑖=1
𝑛
1 1
3 . Distribution ⟹ ln 𝐿 = − ln 2𝜋 − ln 𝜎 − (𝑥𝑖 − 𝑚)2
d’échantillonnage
2 2𝑛𝜎 2
𝑖=1
Le gradient de ln 𝐿 est nulle alors
4 . Estimation 𝑛
1
ponctuelle et par 𝜕ln(𝐿) (𝑥𝑖 − 𝑚) = 0
IC =0 𝑛𝜎 2
𝜕𝑚 ⟹ 𝑖=1
𝜕ln(𝐿) 𝑛
=0 1 1
5 . Te s t s d ’ h y p o t h è s e − 3 (𝑥𝑖 − 𝑚)2 = 0
𝜕𝜎 𝜎 𝑛𝜎
𝑖=1
On obtient
𝑚=𝑥 75
1 𝑛
𝜎2 = − 𝑥 )2 Hassan
(𝑥 RAMCHOUN cours de statistique appliquée 2022/2023
Estimation par maximum de vraisemblance (EMV)
Exemple 2
1. Quelques On considère une v.a X de densité 𝑓 𝑥 = 𝜃𝑥 −𝜃−1 définie sur une population
Rappels en avec 𝜃 > 1
probabilité et
statistique
Déterminer une estimation de 𝜃 en utilisant le principe de maximum de
vraisemblance sur une réalisation (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) d’un échantillon aléatoire de X
2. Méthodes de taille n.
d’échantillonnage

3 . Distribution
d’échantillonnage

4 . Estimation
ponctuelle et par
IC

5 . Te s t s d ’ h y p o t h è s e

76
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimation par IC

1. Quelques Dans la partie précédente, nous avons établi qu’un estimateur ponctuel est
Rappels en
probabilité et une statistique d’échantillon utilisée pour estimer un paramètre d’une
statistique population. Par exemple, la moyenne d’échantillon 𝑥 et la proportion 𝑓 dans
l’échantillon sont respectivement des estimations ponctuelles de la moyenne de
2. Méthodes la population 𝑚 et de la proportion de la population 𝑝.
d’échantillonnage

 Puisqu’on ne peut s’attendre à ce qu’une estimation ponctuelle soit


3 . Distribution exactement égale à la valeur du paramètre de la population correspondant, une
d’échantillonnage
estimation par intervalle est souvent réalisée en ajoutant et en soustrayant une
marge d’erreur à l’estimation ponctuelle.
4 . Estimation
ponctuelle et par La forme générale d’une estimation par intervalle est :
IC Estimation ponctuelle ± Marge d’erreur

5 . Te s t s d ’ h y p o t h è s e

77
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimation par IC

Le but d’une estimation par intervalle est de fournir des informations sur l’écart
1. Quelques entre l’estimation ponctuelle fournie par l’échantillon et la valeur du paramètre
Rappels en
probabilité et de la population.
statistique Dans cette partie, nous montrerons comment réaliser des estimations par
intervalle de la moyenne d’une population m et de la proportion d’une
2. Méthodes population p.
d’échantillonnage

Remarque
3 . Distribution Les distributions d’échantillonnage de 𝑋 et 𝐹 jouent un rôle clé dans le calcul
d’échantillonnage
de ces estimations par intervalle.
4 . Estimation
ponctuelle et par
IC

5 . Te s t s d ’ h y p o t h è s e

78
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Estimation par IC

1. Quelques
Rappels en
probabilité et  Elle permet d’estimer le paramètre 𝜃 par un intervalle
statistique  Elle tient compte de l’erreur d’échantillonnage.
2. Méthodes
d’échantillonnage

Définition
3 . Distribution
d’échantillonnage On dit que ,𝑎, 𝑏- est un intervalle de confiance au niveau 1 − 𝛼 pour le
paramètre 𝜃 à partir de l’échantillon réalisé (𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 ) si on a :
4 . Estimation 𝑝 𝜃 ∈ 𝑎, 𝑏 = 1 − 𝛼
ponctuelle et par
IC
1 − 𝛼 est appelé niveau de confiance de l’intervalle.

5 . Te s t s d ’ h y p o t h è s e

79
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Etapes de construction d’un intervalle de confiance

1. Quelques
Rappels en
probabilité et
statistique

2. Méthodes
d’échantillonnage

3 . Distribution
d’échantillonnage

4 . Estimation
ponctuelle et par
IC

5 . Te s t s d ’ h y p o t h è s e

80
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Intervalle de confiance de la moyenne
Cas d’une population normale de variance connue
1. Quelques
Rappels en Si on s’intéresse à la moyenne inconnue m d’une population normale
probabilité et d’écart type connu 𝜎, l’estimation par intervalle de confiance consiste à
statistique
déterminer de part et d’autre de l’estimateur 𝑋 les bornes 𝐵1 et 𝐵2 d’un
intervalle qui a un niveau de confiance (1−𝛼) de contenir 𝑚.
2. Méthodes
d’échantillonnage 𝜎 𝜎
𝑚 ∈ 𝑥 − 𝑧1−𝛼 , 𝑥 + 𝑧1−𝛼
2 𝑛 2 𝑛
Avec m est la moyenne d’une variable 𝑋 aléatoire définit sur une population
3 . Distribution
d’échantillonnage , 𝜎 son écart-type supposé connue et 𝑥 une estimation de m relativement à
un échantillon (𝑋1 , 𝑋2 , … , 𝑋𝑛 )
4 . Estimation
ponctuelle et par
IC

5 . Te s t s d ’ h y p o t h è s e

81
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Intervalle de confiance de la moyenne
Cas d’une population de distribution inconnue
1. Quelques Pour une population de distribution de probabilité inconnue (écart type 𝜎
Rappels en
probabilité et
inconnu), on utilise la quasi-variance comme estimation de la variance de la
statistique population. L’intervalle de confiance de la moyenne sera défini selon les cas
i) Cas d’un échantillon d’effectif inférieur à 30 (n < 30) :
2. Méthodes Dans ce cas, la moyenne d’un échantillon peut toujours être considérée
d’échantillonnage
comme une variable T de Student à (n-1) degré de liberté.
Un intervalle de confiance au niveau 1−𝛼 pour 𝑚 est :
3 . Distribution 𝑠 𝑠
d’échantillonnage 𝑚 ∈ 𝑥 − 𝑡𝛼 , 𝑥 + 𝑡𝛼
𝑛 𝑛
4 . Estimation
ii) Cas d’un échantillon d’effectif supérieur ou égal à 30 (n ≥30) :
ponctuelle et par Dans ce cas, la moyenne d’un échantillon peut toujours être considérée
IC comme une variable approximativement normale. L’intervalle de confiance
𝑠 𝑠
est alors : 𝑚 ∈ 𝑥 − 𝑧1−𝛼 ,𝑥 + 𝑧1−𝛼
𝑛 2 𝑛
5 . Te s t s d ’ h y p o t h è s e 2

82
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Intervalle de confiance de la moyenne
Exemple
1. Quelques
Dans une entreprise produisant un article déterminé on veut estimer sa durée de vie en
Rappels en heures. À cette fin on a observé un échantillon aléatoire et simple de 16 unités dont
probabilité et les résultats sont (en 1000 heures) :
statistique
1,10 1,05 1,25 1,08 1,35 1,15 1,30 1,25
2. Méthodes
1,30 1,35 1,15 1,32 1,05 1,25 1,10 1,15
d’échantillonnage Déterminer un intervalle de confiance de la moyenne à un niveau de confiance de
1 − 𝛼 = 95%
Solution
3 . Distribution
d’échantillonnage L’estimation ponctuelle de la moyenne de la population est : 𝑥 = 1,2
L’estimation ponctuelle de l’écart type de la population est : s = 0,11
4 . Estimation La distribution de la population parent étant inconnue et la taille de l’échantillon
ponctuelle et par inférieure à 30, l’intervalle de confiance de la moyenne est défini par :
IC 𝑠
𝑥 ± 𝑡𝛼
𝑛
5 . Te s t s d ’ h y p o t h è s e D’après la table de la loi de Student on trouve la valeur de 𝑡𝛼 , à 15 degrés de liberté,
est 𝑡0,05 = 2,131 par suite l’intervalle de confiance sera IC= 1,14; 1,26
C à d que IC à une probabilité de 95% de contenir la vraie valeur de la moyenne de la
population 83
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Intervalle de confiance de la proportion

1. Quelques
Rappels en
probabilité et
statistique Ca
Si on s’intéresse à la proportion p, l’estimation par intervalle de confiance
2. Méthodes
consiste à déterminer de part et d’autre de l’estimateur 𝐹 les bornes 𝑝1 et 𝑝2
d’échantillonnage d’un intervalle qui a un niveau de confiance (1−𝛼) de contenir 𝑝.
𝑓(1 − 𝑓) 𝑓(1 − 𝑓)
p ∈ 𝑓 − 𝑧1−𝛼 , 𝑓 + 𝑧1−𝛼
3 . Distribution 2 𝑛 2 𝑛
d’échantillonnage
condition que la taille de l’échantillon soit supérieure ou égale à 30 et le
produit 𝑛𝑓 ≥5, 𝑛(1 − 𝑓) ≥5
4 . Estimation
ponctuelle et par
IC

5 . Te s t s d ’ h y p o t h è s e

84
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Intervalle de confiance de la proportion
Exemple
1. Quelques
On étudie le pourcentage d'utilisation d'une machine. 400 observations ont été
Rappels en effectuées qui ont donné le résultat suivant :
probabilité et Machines qui marchent : 320 observations.
statistique
Machines arrêtées : 80 observations.
2. Méthodes
d’échantillonnage Déterminer un intervalle de confiance de la proportion à un niveau de confiance de
1 − 𝛼 = 95%
Solution
3 . Distribution
d’échantillonnage L’estimation ponctuelle de la proportion d’utilisation de la machine est:
320
𝑓= = 0,8
400
4 . Estimation
ponctuelle et par
L’intervalle de confiance de la proportion à un niveau de confiance de 95 % est défini
IC 𝑓(1−𝑓)
par : 𝑓 ± 𝑧1−𝛼
2 𝑛
D’après la table de la loi normale on trouve la valeur de 𝑧1−𝛼 = 𝑧0,975 = 1,96
5 . Te s t s d ’ h y p o t h è s e 2

L’intervalle [76 % ; 84 %] a une probabilité de 95% de contenir le vrai taux


d’utilisation de la machine.
85
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Chapitre 5
Les tests d’hypothèses

RAMCHOUN Hassan cours de statistique appliquée 2022/2023 86


Introduction
Un test statistique est une méthode permettant de prendre une décision à partir
1. Quelques d’informations fournies par un échantillon.
Rappels en
probabilité et
statistique les tests d’hypothèses ou les tests statistiques ont pour but de vérifier, à
partir de données observées dans un ou plusieurs échantillons, la validité de
2. Méthodes certaines hypothèses relatives à une ou plusieurs populations.
d’échantillonnage

On peut distinguer différents types de tests, en fonction des hypothèses


3 . Distribution auxquelles on a affaire.
d’échantillonnage i) Les tests de comparaison à une norme ou tests de conformité sont
4 . Estimation
destinés à comparer entre eux une population théorique et un échantillon
ponctuelle et par IC observé. Ils servent à vérifier si un échantillon donné peut être considéré
comme extrait d’une population possédant telle caractéristique particulière
5 . Te s t s (telle moyenne, telle variance, …).
d’hypothèses

87
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Introduction

1. Quelques
Rappels en ii) Les tests d’homogénéité ou d’égalité ont pour but de comparer entre
probabilité et
statistique
elles un certain nombre de populations, à l’aide d’un même nombre
d’échantillons.
2. Méthodes
d’échantillonnage iii) Les tests d’ajustement sont destinés à vérifier si un échantillon observé
peut être extrait d’une population donnée.
3 . Distribution
d’échantillonnage iv) Les tests d’indépendance ont pour but de contrôler, à partir d’un
échantillon, l’indépendance de deux ou plusieurs variables, généralement
4 . Estimation qualitatifs.
ponctuelle et par IC

5 . Te s t s
d’hypothèses

88
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Tests : la procédure à suivre
1. Quelques
Rappels en 1. Formuler les hypothèses 𝐻0 et 𝐻1 (𝐻0 est l’hypothèse à laquelle on
probabilité et
statistique
croît le plus)

2. Méthodes 2. Choisir le seuil de signification α (typiquement 1% ou 5%)


d’échantillonnage
3. Déterminer la statistique utilisée ainsi que sa distribution
3 . Distribution
d’échantillonnage 4. Définir la région critique (région de rejet de 𝐻0 )

4 . Estimation 5. Adopter une règle de décision (à partir des valeurs critiques)


ponctuelle et par IC
- Si la valeur observée à partir de l’échantillon appartient à la région
5 . Te s t s critique, on rejette 𝐻0 sinon on accepte cette hypothèse.
d’hypothèses
7. Décider

89
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Risque du test, puissance de test et région critique
Définition
1. Quelques
Rappels en Supposons qu’on veut effectuer le test suivant
probabilité et
statistique
𝐻0 : 𝜃 = 𝜃0
𝐻1 : 𝜃 ≠ 𝜃0
2. Méthodes
La décision va s’effectuer sur la base des résultats d’un échantillon. Deux
d’échantillonnage types de décisions erronées que l’on appellera erreurs peuvent être prises :
- On appelle erreur de première espèce le fait de rejeter à tort l’hypothèse 𝐻0 .
La probabilité correspondante à cette erreur est appelée risque de première espèce :
3 . Distribution
d’échantillonnage α =P(rejeter 𝐻0 /𝐻0 vraie )=P(décider 𝐻1 / 𝜃 = 𝜃0 )
- On appelle erreur de seconde espèce le fait de rejeter à tort l’hypothèse
4 . Estimation 𝐻1 . La probabilité correspondante à cette erreur est appelée risque de seconde
ponctuelle et par IC
espèce :
β= P (rejeter 𝐻1 / 𝐻1 vraie) = P(décider 𝐻0 / 𝜃 ≠ 𝜃0 )
5 . Te s t s
d’hypothèses - On appelle puissance du test : η= 1- β
- On appelle région critique d’un test, la région de rejet de l’hypothèse 𝐻0

90
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Risque du test, puissance de test et région critique

1. Quelques
Rappels en 𝛼 = p(R𝐻0 /𝐻0 ) et 𝛽 = p(A𝐻0 /𝐻1 )
probabilité et
statistique
Le risque de première espèce 𝛼 est appelé aussi seuil de signification du test, fixé très
souvent à 5 %. La probabilité contraire de 𝛼 désigne le niveau de confiance du test.
2. Méthodes 1- 𝛼 = p(A𝐻0 /𝐻0 )
d’échantillonnage
La probabilité contraire de 𝛽 désigne la puissance du test.
1- 𝛽 = p(R𝐻0 /𝐻1 )
3 . Distribution
d’échantillonnage

4 . Estimation
ponctuelle et par IC

5 . Te s t s
d’hypothèses

91
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test bilatéral

1. Quelques Les hypothèses formulées du test bilatéral sont :


Rappels en
probabilité et 𝐻0 : 𝜃 = 𝜃0 et 𝐻1 : 𝜃 ≠ 𝜃0
statistique La règle de décision peut être représentée ainsi :

2. Méthodes 𝜃 ≠ 𝜃0 𝜃 = 𝜃0 𝜃 ≠ 𝜃0
d’échantillonnage
Région de rejet de 𝐻0 Région d’acceptation de 𝐻0 Région de rejet de 𝐻0

3 . Distribution 𝐴1 𝐴2
d’échantillonnage

4 . Estimation
𝐴1 et 𝐴2 désigne les valeurs critiques qui délimitent la région d’acceptation.
ponctuelle et par IC La région d’acceptation est donc l’intervalle [𝐴1 ; 𝐴2 ].

5 . Te s t s p(𝐴1 ≤ 𝑋 ≤ 𝐴2 ) = 1 − 𝛼
d’hypothèses

92
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test unilatéral à droite

1. Quelques Les hypothèses formulées du test unilatéral à droite sont :


Rappels en
probabilité et 𝐻0 : 𝜃 = 𝜃0 et 𝐻1 : 𝜃 > 𝜃0
statistique
La règle de décision peut être représentée ainsi :
2. Méthodes
d’échantillonnage 𝜃 ≤ 𝜃0 𝜃 > 𝜃0
Région d’acceptation de 𝐻0 Région de rejet de 𝐻0
3 . Distribution A
d’échantillonnage

4 . Estimation
A désigne la valeur critique qui délimite la région d’acceptation.
ponctuelle et par IC La région d’acceptation est donc l’intervalle ]−∞; 𝐴- .

5 . Te s t s p(𝑋 ≤A) = 1 − 𝛼
d’hypothèses

93
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test unilatéral à gauche

1. Quelques Les hypothèses formulées du test unilatéral à gauche sont :


Rappels en
probabilité et 𝐻0 : 𝜃 = 𝜃0 et 𝐻1 : 𝜃 < 𝜃0
statistique La règle de décision peut être représentée ainsi :

2. Méthodes 𝜃 < 𝜃0 𝜃 ≥ 𝜃0
d’échantillonnage
Région de rejet de H0 Région d’acceptation de H0

3 . Distribution A
d’échantillonnage

4 . Estimation
A désigne la valeur critique qui délimite la région d’acceptation.
ponctuelle et par IC La région d’acceptation est donc l’intervalle [A ; +∞ [.

5 . Te s t s p(𝑋< A) = 𝛼
d’hypothèses

94
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test de conformité sur une moyenne

1. Quelques
Formulation de l’hypothèse nulle
Rappels en
probabilité et On attribue la valeur 𝑚0 pour la moyenne dans une population dont la
statistique
vraie moyenne 𝑚 est inconnue, et on veut juger la validité de cette hypothèse.
2. Méthodes
d’échantillonnage Ce test a pour but de vérifier si la moyenne 𝑚 d’une population est ou n’est pas
égale à une valeur donnée 𝑚0 .
3 . Distribution
d’échantillonnage L’hypothèse nulle est donc : 𝐻0 : 𝑚 = 𝑚0

4 . Estimation Variable de décision


ponctuelle et par IC
On extrait de la population un échantillon aléatoire et simple dans lequel la
moyenne observée 𝑥 est en général différente de 𝑚0 , il s’agit d’expliquer cette
5 . Te s t s
d’hypothèses différence.

 La variable de décision (VD) du test correspond à l’estimateur de m sa


réalisation sera la moyenne de l’échantillon : vd = 𝑥
95
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test de conformité sur une moyenne

1. Quelques
Région d’acceptation
Rappels en La région d’acceptation dépend de l’hypothèse alternative 𝐻1 .
probabilité et
statistique
a) Test bilatéral
2. Méthodes
𝐻0 : m= 𝑚0 et 𝐻1 : m≠ 𝑚0
d’échantillonnage Les valeurs critiques qui délimitent la région d’acceptation sont, pour une
distribution normale réduite ou asymptotiquement normale réduite, Z1 et Z2
telles que :
3 . Distribution
d’échantillonnage p(𝑍1 ≤ 𝑉𝐷𝑅 ≤ 𝑍2 ) = 1 − α
Avec VDR est la variable de décision réduite si on suppose que 𝐻0 est acceptée
4 . Estimation
ponctuelle et par IC
La région d’acceptation est donc l’intervalle ,𝑍1 , 𝑍2 - ou
𝑍1 = −𝑍1−𝛼
5 . Te s t s 2
d’hypothèses 𝑍2 = 𝑍1−𝛼
2
On accepte l’hypothèse nulle si la réalisation de la variable de décision
réduite appartient à la région d’acceptation. Sinon, c’est l’hypothèse
alternative qui est acceptée. 96
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test de conformité sur une moyenne
b) Test unilatéral à droite :
1. Quelques 𝐻0 : m= 𝑚0 et 𝐻1 : m > 𝑚0
Rappels en
probabilité et La valeur critique qui délimitent la région d’acceptation est, pour une
statistique distribution normale réduite ou asymptotiquement normale réduite, Z telle que :
p(𝑉𝐷𝑅 ≤ 𝑍) = 1 − α ⟹ 𝑍 = 𝑍1−𝛼
2. Méthodes La région d’acceptation est donc l’intervalle - − ∞, 𝑍1−𝛼 -
d’échantillonnage

c) Test unilatéral à gauche


3 . Distribution 𝐻0 : m= 𝑚0 et 𝐻1 : m < 𝑚0
d’échantillonnage
La valeur critique qui délimitent la région d’acceptation est, pour une
4 . Estimation distribution normale réduite ou asymptotiquement normale réduite, Z telle que :
ponctuelle et par IC p(𝑉𝐷𝑅 ≤ 𝑍) = α ⟹ 𝑍 = 𝑍𝛼
La région d’acceptation est donc l’intervalle ,𝑍𝛼 , +∞,
5 . Te s t s
d’hypothèses

97
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test de conformité sur une moyenne
1. Quelques
Rappels en
probabilité et
statistique Remarque
Pour une distribution de probabilité inconnue, et lorsque la taille de l’échantillon
2. Méthodes est inférieur à 30, la variable de décision réduite VDR peut toujours être
d’échantillonnage
considérée comme une variable de Student à (n-1) degré de liberté. Les valeurs
de Z sont remplacées par les valeurs de T de la loi de Student avec (n-1) degré de
3 . Distribution liberté.
d’échantillonnage

4 . Estimation
ponctuelle et par IC Région d’accéptation

Type de test 𝐻0 𝐻1 Cas de loi Cas de loi de


5 . Te s t s normal student
d’hypothèses
Bilatérale m= 𝑚0 m ≠ 𝑚0 −𝑍1−𝛼 ; 𝑍1−𝛼 −𝑡1−𝛼 ; 𝑡1−𝛼
2 2 2 2
Unilatéral à droite m= 𝑚0 m > 𝑚0 - − ∞, 𝑍1−𝛼 - - − ∞, 𝑡1−𝛼 -
Unilatéral à gauche m= 𝑚0 m < 𝑚0 ,𝑍𝛼 , +∞, ,𝑡𝛼 , +∞, 98
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test de conformité sur une moyenne
Exemples
Le diamètre des billes fabriquées par une machine est en moyenne de 6 mm. Pour
1. Quelques contrôler si la machine est bien réglée, on a prélevé un échantillon de 50 billes et on
Rappels en 2
probabilité et a mesuré leur diamètre. On a trouvé : 50 𝑖=1 𝑑 𝑖 = 350 ; 𝑒𝑡 50
𝑖=1 𝑑 𝑖 = 2462
statistique La machine est-elle bien réglée au seuil de signification de 𝛼 =5 %?
Solution
2. Méthodes Pour répondre à cette question, on doit vérifier si le diamètre moyen des 50 billes
d’échantillonnage
observées, est conforme à la norme de 6 mm. Il s’agit donc de faire un test de
conformité de la moyenne.
3 . Distribution Il s’agit d’un test bilatéral 𝐻0 m = 6 ; 𝐻1 : m≠6
d’échantillonnage
La variable de décision du test correspond à l’estimation de 𝑚 qui est la
350
4 . Estimation moyenne de l’échantillon : vd= =7
50
ponctuelle et par IC
La variable de décision peut être considérée comme une variable approximativement
normale.
5 . Te s t s
d’hypothèses La variance de la population peut être estimée par la quasi-variance.
2
𝑛 2
50 2462
𝑠 = 𝜎𝑒 = − 72 = 0,24
𝑛−1 49 50
𝑥−𝑚0
D’où vdr= = 14,43 or I = ,𝑍1 , 𝑍2 - =,−𝑍1−𝛼 , 𝑍1−𝛼 ]=[-1,96; 1,96]
𝑆/ 50 2 2 99
Et puisque vdr ∉ 𝐼 donc on rejette H0, La machine n’est donc pas bien réglée au
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test de conformité d’une variance
Formulation de l’hypothèse nulle
1. Quelques
Rappels en
probabilité et
Ce test a pour but de vérifier si la variance 𝜎 2 d’une population est ou n’est
statistique pas égale à une valeur donnée 𝜎0 2 , appelée norme.
L’hypothèse nulle est donc : 𝐻0 𝜎 2 = 𝜎0 2
2. Méthodes Variable de décision
d’échantillonnage
On extrait un échantillon aléatoire non exhaustif de taille n. La variable de
décision du test correspond à :
𝑛 2
3 . Distribution 𝑖=1(𝑋𝑖 −𝑋)
VD=
d’échantillonnage 𝜎0 2
La variable de décision sous l’hypothèse 𝐻0 possède une distribution de khi
4 . Estimation deux à (n-1) degrés de liberté.
ponctuelle et par IC
𝑛 2
𝑖=1(𝑋𝑖 −𝑚)
5 . Te s t s Si m est connue VD = La variable de décision sous l’hypothèse
𝜎0 2
d’hypothèses
𝐻0 possède une distribution khi deux à (n) degrés de liberté.

100
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test de conformité d’une variance
1. Quelques Région d’acceptation :
Rappels en
probabilité et La région d’acceptation dépend de l’hypothèse alternative 𝐻1 .
statistique
Test bilatéral : 𝐻0 : 𝜎 2 = 𝜎0 2 ; 𝐻1 𝜎 2 ≠ 𝜎0 2
2. Méthodes Les valeurs critiques qui délimitent la région d’acceptation sont 𝒳12 et 𝒳22
d’échantillonnage
telles que :
p(𝒳12 ≤VD≤ 𝒳22 )=1-𝛼
3 . Distribution La région d’acceptation est donc l’intervalle [𝒳𝛼2 , 𝒳1−
2
𝛼]
d’échantillonnage 2 2
On accepte l’hypothèse nulle si la variable de décision appartient à la région
4 . Estimation d’acceptation. Sinon, c’est l’hypothèse alternative qui est acceptée.
ponctuelle et par IC

5 . Te s t s
d’hypothèses

101
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test de conformité d’une variance
1. Quelques
Rappels en Test unilatéral à droite
probabilité et
statistique
𝐻0 : 𝜎 2 = 𝜎0 2 ; 𝐻1 𝜎 2 > 𝜎0 2
La valeur critique qui délimitent la région d’acceptation est 𝒳 2 telle que:
2
2. Méthodes P(VD ≤ 𝒳 2 )=1−𝛼 ⟹ 𝒳 2 = 𝒳1−𝛼
d’échantillonnage
2
La région d’acceptation est donc l’intervalle -0, 𝒳1−𝛼 -
3 . Distribution
d’échantillonnage Test unilatéral à gauche
𝐻0 : 𝜎 2 = 𝜎0 2 ; 𝐻1 𝜎 2 < 𝜎0 2
4 . Estimation
ponctuelle et par IC
La valeur critique qui délimite la région d’acceptation est 𝒳 2 telle que :
P(VD ≤ 𝒳 2 )=𝛼 ⟹ 𝒳 2 = 𝒳𝛼2
5 . Te s t s
d’hypothèses La région d’acceptation est donc l’intervalle [𝒳𝛼2 , +∞ [

102
RAMCHOUN Hassan cours de statistique appliquée 2022/2023
Test de conformité d’une variance
1. Quelques
Rappels en
probabilité et Exemple
statistique On souhaite vérifier, au seuil de signification de 5 %, si le peuplement, dans
lequel on a mesuré la hauteur d’un échantillon de 12 arbres, appartient à un type
2. Méthodes
d’échantillonnage
de forêt dont l’écart type est de 1,4 m. Les résultats en mètre sont :
5,1 ; 5,2 ; 5,2 ; 5,4 ; 5,9 ; 6,3 ; 6,3 ; 6,8 ; 6,9 ; 6,9 ; 7,0 ; 7,0
Pour répondre à cette question, on doit réaliser un test de conformité de la
3 . Distribution variance.
d’échantillonnage

4 . Estimation
ponctuelle et par IC

5 . Te s t s
d’hypothèses

103
RAMCHOUN Hassan cours de statistique appliquée 2022/2023

Vous aimerez peut-être aussi