Vous êtes sur la page 1sur 179

Module: Echantillonnage et

Estimation
Professeur: Sara GOTTI
s.gotti@uca.ma

Filière Economie et Gestion (Semestre 3)


Faculté des sciences juridiques économiques et
sociales kelaa des Sraghna
2021-2022
PLAN DU COURS

1. Chapitre 1: Rappels sur les concepts statistiques


2. Chapitre 2: Lois de probabilité
3. Chapitre 3: Théorie d’échantillonnage
4. Chapitre 4: Estimation
5. Chapitre 5: Tests d’hypothèses

Sara GOTTI SEG S3, 2021-2022 2


CHAPITRE 1
Rappels sur les concepts statistiques

✓Définitions

Sara GOTTI SEG S3, 2021-2022 3


Chapitre 1: Rappels sur les concepts statistiques

Définitions

• Variable aléatoire: c’est une variable X associée à une expérience


aléatoire dans le but de caractériser le résultat de cette expérience. On
distingue les variables aléatoires discrètes et les variables aléatoires
continues.
• Variable aléatoire discrète: c’est une variable qui prend un nombre
fini ou dénombrable de valeurs.
o la loi de la variable aléatoire X est la loi de probabilité sur l'ensemble des
valeurs possibles de X qui calcule la probabilité P(X=xk ) pour chaque valeur
xk .
o Le total des probabilités est égal à 1.

Sara GOTTI SEG S3, 2021-2022 4


Chapitre 1: Rappels sur les concepts statistiques

Définitions

• Variable aléatoire continue: c’est une variable dont le résultat d'une


expérience aléatoire n’est pas un entier et n'appartient pas à un
ensemble fini, c’est un nombre réel défini sur ℝ sur un intervalle de ℝ.
o Pour une variable aléatoire continue, on calcule la probabilité d'observer une
valeur comprise dans un intervalle donné.
o la probabilité d’appartenance à un intervalle se calcule à l’aide de l’aire de la
fonctions densité sur cet intervalle.
• Esperance mathématique: c’est la valeur moyenne d’une variable.
o Dans le cas d’une variable aléatoire discrète: 𝐸(𝑋)=∑𝑝𝑖 𝑥𝑖
o Dans le cas d’une variable aléatoire X qui suit une loi uniforme sur [a, b]:
E(X) = (𝑎+𝑏)/2

Sara GOTTI SEG S3, 2021-2022 5


Chapitre 1: Rappels sur les concepts statistiques

Définitions

• Lorsqu’il s’agit d’une variable statistique, sa valeur moyenne est la


moyenne arithmétique.
• Moyenne arithmétique: La moyenne arithmétique (noté 𝑥ҧ ) ou
moyenne empirique d'une série statistique est la moyenne ordinaire,
elle est définie par la somme des valeurs 𝑥𝑖 divisée par l’effectif total.
σ𝑛
𝑖=1 𝑛𝑖 ×𝑥𝑖
Elle est égale à: 𝑥ҧ =
𝑁
• Fréquence: C’est le nombre ou l’effectif d’individus possédant un
caractère spécial divisé par l’effectif total de la population. On le note
𝑛𝑖
𝑓𝑖 . Elle est égale à: 𝑓𝑖 = σ
𝑛𝑖

Sara GOTTI SEG S3, 2021-2022 6


Chapitre 1: Rappels sur les concepts statistiques

Définitions

• Écart-type: L'écart-type mesure la dispersion autour de la moyenne. Il


est noté σ ou s et correspond à la racine carrée de la variance, comme
dans la formule :
𝜎 = 𝑉𝑥
σ𝒏
𝒊=𝟏 𝒏𝒊 ×𝒙𝑖
𝟐
Avec 𝑉𝑥 = σ𝒏
ഥ2
−𝒙
𝒊=𝟏 𝒏𝒊

Sara GOTTI SEG S3, 2021-2022 7


CHAPITRE 2
Lois de probabilité
• Lois de probabilité discrètes
✓Loi de Bernoulli
✓Loi Binomiale
• Lois de probabilité continues
✓Loi Normale
✓La loi normale centrée réduite
✓Approximation de la loi binomiale par la loi normale

Sara GOTTI SEG S3, 2021-2022 8


Chapitre 2: Lois de probabilités

Lois de probabilité discrètes


Loi de Bernoulli
• Une variable aléatoire X qui suit une loi de Bernoulli se caractérise par
une expérience aléatoire comportant deux issues (ou résultats)
possibles: succès ou échec.
• On définit alors la variable aléatoire X comme étant le nombre de
points obtenus; 1 en cas de succès, 0 en cas d’échec => X(Ω)={0, 1}
• La fonction de probabilité de la variable X est de la forme:
1 avec probabilité 𝒑
𝑋=ቊ
0 avec probabilité 𝟏−𝒑
• où p est la probabilité de succès et 1-p est la probabilité d’échec.
• On note 𝑋↝ℬ(𝑝)

Sara GOTTI SEG S3, 2021-2022 9


Chapitre 2: Lois de probabilités

Lois de probabilité discrètes


Loi de Bernoulli
• L'Esperance mathématique de la loi de Bernoulli est le paramètre p de
la loi:
𝐸(𝑋)= σ2𝑖=1 𝑥𝑖 𝑝𝑖 = (0×𝑃(𝑋=0))+(1×𝑃(𝑋=1))=𝑝
• La variance de la loi de Bernoulli est:
𝑽 𝑿 = σ𝟐𝒊=𝟏 𝑿𝟐𝒊 𝑷𝒊 − 𝒑 𝟐 = 𝟎 + 𝟏. 𝐩 − 𝒑𝟐
𝑽 𝑿 = 𝒑 𝟏−𝒑
• L’écart-type 𝜎 (𝑋 ):
𝜎 (𝑋 )= 𝑉(𝑥)

Sara GOTTI SEG S3, 2021-2022 10


Chapitre 2: Lois de probabilités

Lois de probabilité discrètes


Loi de Bernoulli
Exemple
• On lance une pièce de monnaie et on s’intéresse au résultat pile.
• Si on obtient pile on réussit
• Si on obtient face on échoue
• La variable aléatoire X associé au résultat obtenu suit une loi de Bernoulli
de paramètre 0,5 (la probabilité en cas de succès).
𝑋↝ℬ(0,5)
E(X)=p=0,5
V(X)=p(1-p)=0,5×0,5=0,25
𝜎 (𝑋 )= V(X)= 0,25=0,5
Sara GOTTI SEG S3, 2021-2022 11
Chapitre 2: Lois de probabilités

Lois de probabilité discrètes


Loi Binomiale
• Si on répète un schéma de Bernoulli n fois c-à-d on répète une
expérience aléatoire à deux issues, on parle d’une loi binomiale; à
condition que les répétitions soient indépendantes.
• Autrement dit, la loi binomiale correspond au comptage des succès en
s’arrêtant à un nombre de répétitions fixé à l’avance.
• La loi binomiale dépend de deux paramètres n et p, et dont les valeurs
possibles sont: 𝑋(Ω)= {0, 1, 2, …, 𝑛}; n est le nombre de répétitions et
p est la probabilité en cas de succès.
• On note 𝑋↝ℬ(n, 𝑝)

Sara GOTTI SEG S3, 2021-2022 12


Chapitre 2: Lois de probabilités
Lois de probabilité discrètes
Loi Binomiale
• Une variable aléatoire X suit une loi binomiale de paramètres n et p si sa
fonction de probabilité est de la forme :
𝑥 𝑥 𝑛−𝑥 𝑛!
𝑃(𝑋=𝑥) = 𝐶𝑛 𝑝 (1 − 𝑝) = 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝑥! 𝑛−𝑥 !
Avec 𝑥 ∈{0,1,2,3,…𝑛} et 𝑝 : 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡é 𝑑𝑒 𝑠𝑢𝑐𝑐è𝑠,
• L'Esperance mathématique de𝑛 la loi Binomiale
𝑛
est égal à:
𝐸 𝑋 = ෍ 𝐸 𝑋𝑖 = ෍ 𝑝 = 𝑛𝑝
𝑖=1 𝑖=1
• La variance de la loi de Binomiale est égal à:
𝑉 𝑋 = σ𝑛𝑖=1 𝑉 𝑋𝑖 = σ𝑛𝑖=1 𝑝(1 − 𝑝) = 𝑛𝑝(1 − 𝑝)
• L’écart-type 𝜎 (𝑋 ):
𝜎 (𝑋 )= 𝑉(𝑥) = 𝑛𝑝(1 − 𝑝)
Sara GOTTI 13
Chapitre 2: Lois de probabilités

Lois de probabilité discrètes


Loi Binomiale
Exemple
• On lance 10 fois une pièce de monnaie. Soit la variable aléatoire X
représentant le nombre de piles apparues.
1
𝐴𝑙𝑜𝑟𝑠, 𝑋↝ 𝐵 (𝟏𝟎; ),
2
1 1 1
• 𝐸(𝑋)=𝑛𝑝=10× =5 et V(𝑋)=𝑛𝑝(1-p)=10× × =2,5
2 2 2
• La probabilité d’obtenir exactement 8 fois piles est donc égale à
8 1 8 1 2
𝑃(𝑋=8)=𝐶10 ×( ) ×( ) =0,044
2 2

Sara GOTTI SEG S3, 2021-2022 14


Chapitre 2: Lois de probabilités

Lois de probabilité continues


Loi Normale
• La loi normale est la loi continue la plus importante et la plus
utilisée dans le calcul de probabilité.
• Elle est aussi appelée loi de LAPLACE GAUSS.
• On appelle variable normale toute variable aléatoire continue
X définie dans l'intervalle ]−∞,+∞[par la fonction de densité
de probabilité suivante :
1 1 𝑥−𝜇 2
𝑓 𝑥 = 𝑒 2( 𝜎 )
𝜎 2𝜋

Sara GOTTI SEG S3, 2021-2022 15


Chapitre 2: Lois de probabilités

Lois de probabilité continues


Loi Normale
• 𝜇 et 𝜎 sont des paramètres quelconques qui représentent
respectivement la moyenne (ou espérance) et l'écart type de la
variable.
• L’aire totale sur la courbe de la fonction densité (délimitée
par la courbe de la fonction et l’axe des X) est égale à 1.
• La loi normale dépend de deux paramètres 𝜇 et 𝜎.
• Une variable aléatoire X qui suit une loi normale de
paramètres 𝜇 et 𝜎 est notée comme suit: 𝑋 ↝ 𝑁(𝜇, 𝜎²)

Sara GOTTI SEG S3, 2021-2022 16


Chapitre 2: Lois de probabilités

Lois de probabilité continues


Loi Normale
• La courbe de la loi Normale possède la forme en «CLOCHE»
• La distribution normale est symétrique par rapport à la droite verticale:
x=μ
• Points d’inflexion sont situés à une
distance 𝜎 de cet axe de symétrie.
• f atteint son maximum lorsque x=μ
• il est difficile de calculer sa fonction de
répartition f(x).
• Pour tous les calculs, on se ramène à
la fonction de répartition de la loi
normale centrée réduite (une loi TABULÉE).
Sara GOTTI SEG S3, 2021-2022 17
Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite
• La loi normale centrée réduite est le cas particulier de la loi
normale générale.
• On appelle variable normale réduite toute variable aléatoire
normale Z de paramètres 𝜇 = 0 et 𝜎 = 1. Elle est notée comme
suit: 𝑋 ↝ Ν(0,1)
• La loi normale centrée réduite est la loi de probabilité absolument
continue dont la densité de probabilité est donnée par la fonction:
1 𝑥2

𝑓 𝑥 = 𝑒 2
2𝜋
Sara GOTTI SEG S3, 2021-2022 18
Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite
• En particulier la loi normale réduite est symétrique par rapport à l'axe
des abscisses (x=0) et caractérisée par l'existence d'un maximum en
1
z = 0 et f(z) = ≈ 0,40 .
2𝜋
• La fonction de répartition correspond
à l'aire comprise entre cette courbe et l'axe
des abscisses.

Sara GOTTI SEG S3, 2021-2022 19


Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite

• Pour le calcul de probabilités sans utiliser la fonction de densité,


la table de la loi normale centrés réduite a été élaborée.
• En raison de la symétrie de la distribution, ces tables sont limitées
aux valeurs positives de z.
𝑋−𝜇
• Par le changement de variable Z= la variable normale X se
𝜎
ramènent à la loi normale centrée réduite.

Sara GOTTI SEG S3, 2021-2022 20


Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite

F(X)
𝐹 1,96 = 𝑃 𝑋 < 1,96 = 0,975

1
2𝜋

0 1,96 X

Sara GOTTI SEG S3, 2021-2022 21


Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite
• Pour une variable normale quelconque X de paramètres 𝜇 et 𝜎:
X−𝜇 a−𝜇 a−𝜇
P(X≤a) = f(a) = P( ≤ ) = P(Z ≤ ) = P(Z ≤t)=𝜋(𝑡)
𝜎 𝜎 𝜎
a−𝜇
avec t=
𝜎
• Pour lire une valeur 𝜋(𝑡) dans la table, il suffit de lire l'intersection
entre la ligne correspondante à la valeur de t et la colonne
correspondante au deuxième chiffre après la virgule de t.
• La valeur de P(Z ≤1,29) (ou 𝜋(1,29)) correspond à l’intersection entre
la ligne correspondante à 1,2 et la colonne correspondante à 0,09, on
peut lire la valeur 0,9015.

Sara GOTTI SEG S3, 2021-2022 22


Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite

Sara GOTTI SEG S3, 2021-2022 23


Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite

• La loi Normale centrée réduite est symétrique, c. à. d pour tout


t ∈ ℝ: P(X≤ 𝑡) = P(X≥ −𝑡)
1
• En particulier P(X≤0) = P(X≥0) =
2
• On peut aussi écrire que:
P(X≤ 𝑡) = 1− P(X≥ 𝑡) = 1− P(X≤ −𝑡)
P(a≤X≤ 𝑏) = 1−P(X≤a)−P(X≥b) = P(X≤ b)−P(X≤a)

Sara GOTTI SEG S3, 2021-2022 24


Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite
• Dans une table statistique de la loi centrée réduite, on ne peut lire
que P(X≤x) pour (x≥0).
• Comment calculer par exemple P(X≥ −1,87) et P(X≤ −0,93) ?
• Il suffit d'appliquer la remarque précédente et utiliser la table
statistique :
• D'une part: P(X≥ −1,87) = P(X≤1,87) = 0,9693
• D'autre part:
P(X≤ −0,93) = P(X≥0,93) = 1− P(X≤0,93) = 1−0,8238= 0,1762

Sara GOTTI SEG S3, 2021-2022 25


Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite
Exemple:
• Pour qu'une pièce fabriquée par une machine soit utilisable, sa
longueur doit être comprise entre 14,7 et 15,3 cm, sinon elle est
rejetée. Sachant que la longueur de cette pièce est une variable
normale de moyenne 𝜇 =15 cm et d’ecart-type 𝜎 =0,2 cm.
Quelle est la probabilité de pièces pouvant être rejetées?
• Si on désigne par la variable X la longueur des pièces, X suit une loi
normale :
𝑋 ↝ Ν(15; 0,2)
• La probabilité de rejet d'une pièce est : P(rejet) = 1 − P(acceptation)
Et la probabilité d’acceptation est: P(acceptation)= P(14,7 ≤ X ≤ 15,3)
Sara GOTTI SEG S3, 2021-2022 26
Chapitre 2: Lois de probabilités

Lois de probabilité continues


La loi normale centrée réduite
Exemple:
14,7−μ X−μ 15,3−μ 14,7−15 X−μ 15,3−15
P(14,7 ≤ X ≤ 15,3) = P( ≤ ≤ ) = P( ≤ ≤ )
𝜎 𝜎 𝜎 0,2 𝜎 0,2
X−15
On pose Z= , alors Z ↝ Ν(0; 1)
0,2
14,7−15 15,3−15
P(14,7 ≤ X ≤ 15,3) = P( ≤𝑍≤ )
0,2 0,2
15,3−15 14,7−15
= P(𝑍 ≤ ) − P(𝑍 ≤ )
0,2 0,2
= P(𝑍 ≤ 1,5) − P(𝑍 ≤ −1,5)
= P(𝑍 ≤ 1,5) −(1− P(𝑍 ≤ −1,5))
= 2 × P(𝑍 ≤ 1,5)−1 = 2 × 0,9332 −1 = 0,8664
P(rejet) = 1 − 0,8664 = 0,1336
Il y a un risque de rejet de 13,36% des pièces fabriquées.
Sara GOTTI SEG S3, 2021-2022 27
Chapitre 2: Lois de probabilités

Lois de probabilité continues


Approximation de la loi binomiale par la loi normale
• Parfois les problèmes relatifs à la loi binomiale se rapportent
aux calculs de probabilités dans un ou plusieurs intervalles
donnés : p(X < x) p(X > x) ou p(xl < X < x2 )
• La recherche de ces probabilités est souvent longue, car il faut
déterminer individuellement et d'additionner les différentes
probabilités p(X = x).
Ex: p(X < 10) = p(0)+p(1)+p(2)+p(3)+p(4)+p(5)+p(6)+p(7)+p(8)+p(9)
• On peut effectuer ce calcul d'une manière approchée à l'aide de
la loi normale de paramètres 𝜇 =np et σ = 𝑛𝑝𝑞.
• On écrit alors: 𝑋 ↝ 𝐵 𝑛, 𝑝 ≈ 𝑋 ↝ 𝑁 𝑛𝑝, 𝑛𝑝𝑞 .
Sara GOTTI SEG S3, 2021-2022 28
Chapitre 2: Lois de probabilités

Lois de probabilité continues


Approximation de la loi binomiale par la loi normale
• Trois conditions à vérifier avant d’approximer une loi
binomiale 𝑋↝𝐵(𝑛,𝑝) par une loi normale 𝑋↝𝑁(𝑛𝑝, 𝑛𝑝𝑞):
✓La taille de l’échantillon ou le nombre de fois de répétitions n
doit être supérieur ou égale à 30 c- à-d 𝑛≥30
✓La probabilité relative à la survenance d’évènement p multipliée
par n doit être supérieure ou égale à 5 c-à-d n𝑝≥5
✓La probabilité relative à la non survenance d’évènement q
multipliée par n doit être supérieure ou égale à 5 c-à-d n𝑞≥5
• Autrement dit : Si 𝑛≥30 𝑒𝑡 𝑛𝑝≥5 𝑒𝑡 n𝑞≥5
Sara GOTTI SEG S3, 2021-2022 29
Chapitre 2: Lois de probabilités

Lois de probabilité continues


Approximation de la loi binomiale par la loi normale
Exemple:
• On suppose que la probabilité qu'un étudiant réussisse un examen est de 0,8.
Quelle est la probabilité qu'au moins 75 étudiants parmi 100 étudiants réussissent
l'examen ?
• Désignons par X le nombre d'étudiants qui réussissent l'examen.
• X est une variable discrète qui prend les valeurs entières de 0 à 100.
• Elle suit une loi binomiale de paramètres 100 et 0,8. X ↝ B(100 ; 0,8)
• La probabilité qu'au moins 75 étudiants parmi 100 étudiants réussissent l'examen
est : p(X≥75)
• Les produits np et nq sont respectivement 100x0,8 = 80 et 100x0,2 = 20, ils sont
supérieurs à 5.
Sara GOTTI SEG S3, 2021-2022 30
Chapitre 2: Lois de probabilités

Lois de probabilité continues


Approximation de la loi binomiale par la loi normale
Exemple:
On peut donc effectuer le calcul de cette probabilité d'une manière approchée à
l'aide de la loi normale de paramètres np = 80 et 𝜎 = 𝑛𝑝𝑞 = 4.
X ↝ B(100 ; 0,8)≈ N(80 ; 4)
X−80
On pose Z= , alors Z ↝ Ν(0; 1)
4
X−80 75−80
p(X≥75) = p( ≥ ) = p(𝑍 ≥ −1,25)
4 4
= 1 − p(𝑍 ≤ −1,25)
= 1 − (1 − p(𝑍 ≤ 1,25) )
= p(𝑍 ≤ 1,25) = 0,8944
la probabilité qu'au moins 75 étudiants parmi 100 étudiants réussissent l'examen est
de 0,8944.
Sara GOTTI SEG S3, 2021-2022 31
CHAPITRE 3
Théorie d’échantillonnage

✓Introduction
✓Définitions
✓Méthodes d’échantillonnage
✓Distributions d’échantillonnage

Sara GOTTI SEG S3, 2021-2022 32


Chapitre 3: Théorie d’échantillonnage

Introduction

• Pour collecter les informations sur une population, deux possibilités


s'offrent :
❑L’enquête complète: (enquête exhaustive) elle consiste à observer ou
interroger tous les éléments de la population.
❑L’enquête partielle: (sondage) elle consiste à observer ou interroger
une partie de la population. Les éléments de la population qui sont
réellement observés constituent l'échantillon et l'opération qui
consiste à choisir ces éléments est appelée échantillonnage.
• L’échantillonnage a pour but d’étudier des propriétés caractéristiques
d’une population quand on ne dispose pas encore de données. Il
nécessite d’examiner et d’observer une partie de la population.
Sara GOTTI SEG S3, 2021-2022 33
Chapitre 3: Théorie d’échantillonnage

Introduction

• L’échantillonnage offre une série d'avantages:


✓ Le coût global de l'enquête partielle (l’échantillonnage) est en
général plus réduit que le coût global d'une enquête complète.
✓L'enquête partielle est plus rapide que l'enquête complète, surtout
lorsque la caractéristique étudiée présente des modifications assez
importantes au cours du temps.
✓Les erreurs d'observations dans l'enquête partielle sont plus
réduites que dans l'enquête complète.

Sara GOTTI SEG S3, 2021-2022 34


Chapitre 3: Théorie d’échantillonnage

Définitions

• Enquête: ensemble d’opérations de collecte et de traitement de données


relatives à quelques domaines.
• Population: ensemble des unités statistiques (personnes ou objets) aux
quelles on s'intéresse et sur lesquelles porte une étude. Et on appelle
individu chaque élément (entité) de cette population pour lequel des
données sont collectées.
• Paramètres de la population: Ce sont les paramètres observés de la
population statistique:
➢Moyenne de la population (μ);
➢Ecart-type de la population (σ);
➢Proportion de la population (P)
• La taille de la population (N): est le nombre d’unités de la population.

Sara GOTTI SEG S3, 2021-2022 35


Chapitre 3: Théorie d’échantillonnage
Définitions
• Unité de base: unité d'échantillonnage ou unité de sondage, c'est
l'élément pris en considération dans l'enquête.
• Recensement: Enquête complète ou enquête exhaustive, c'est une
enquête au cours de laquelle toutes les unités de base de la population
sont observées.
• Sondage: Enquête incomplète, enquête partielle ou enquête par
échantillonnage, c'est une enquête au cours de laquelle seulement une
partie des unités de base de la population sont observée.
• Echantillonnage: ensembles des opérations permettant de
sélectionner de façon organisée les éléments de l’échantillon.
• Erreur d’échantillonnage: écart entre les résultats obtenus auprès
d’un échantillon et ce que nous apprendrait un recensement
comparable de la population. Plus la taille de l’échantillon est grande
plus l’erreur d’échantillonnage diminue.
Sara GOTTI SEG S3, 2021-2022 36
Chapitre 3: Théorie d’échantillonnage

Définitions

• Echantillon: une partie (sous ensemble) représentative de la


population statistique observée. La population d’où on tire
l’échantillon s’appelle «population mère» ou «population
échantillonnée».
• Paramètres de l’échantillon: Ce sont les caractéristiques
statistiques calculées de l’échantillon:

➢Moyenne de l’échantillon (𝑋);
➢Ecart-type de l’échantillon (s);
➢Proportion de l’échantillon (f)
• La taille de l’échantillon (n): est le nombre d'unités de
l’échantillon.
Sara GOTTI SEG S3, 2021-2022 37
Chapitre 3: Théorie d’échantillonnage

Définitions

Exemple 1:
• Les membres d’un parti politique marocain sont supposés
soutenir un candidat particulier aux élections du parlement, et les
responsables du parti voudraient estimer la proportion d’électeurs
favorables à leur candidat. Un échantillon de 400 électeurs a été
sélectionné et 160 de ces électeurs ont indiqué être favorables au
candidat. Une estimation de la proportion d’électeurs favorables
au candidat est donc 160 sur 400 soit 0,40.

Sara GOTTI SEG S3, 2021-2022 38


Chapitre 3: Théorie d’échantillonnage

Définitions

Exemple 2:
• Un fabriquant de pneu a conçu un nouveau type de pneu
permettant d’accroitre le kilométrage effectué. Pour estimer le
nombre moyen de kilomètres effectués avec les nouveaux pneus,
le fabricant a sélectionné un échantillon de 120 nouveaux pneus,
dans le but de les tester. D’après les résultats du test, la moyenne
de l’échantillon est égale a 36500 kilomètres. Par conséquent, une
estimation du kilométrage moyen pour la population des
nouveaux pneus est de 36500 kilomètres.

Sara GOTTI SEG S3, 2021-2022 39


Chapitre 3: Théorie d’échantillonnage
Méthodes d’échantillonnage
• Pour que les résultats d'une enquête par sondage puissent être
généralisés à l'ensemble de la population faisant l'objet de l'étude, il est
indispensable que cette enquête soit conduite selon des règles bien
définies et que les calculs conduisant à ces synthèses soient conformes
à la procédure d'échantillonnage utilisée.
• L'échantillon choisi doit être le plus représentatif possible de la
population étudiée.
• Avec des méthodes d’échantillonnage adéquates, les résultats de
l’échantillons fournissent de «bonnes» estimations des paramètres de
la population (une moyenne d’échantillon fournit une estimation de la
moyenne de la population, une proportion d’échantillon fournit une
estimation de la proportion de la population)

Sara GOTTI SEG S3, 2021-2022 40


Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage

• Méthode d’échantillonnage (ou de sondage) : Procédure par


laquelle on choisit dans une population un sous-groupe
représentatif.
✓Objectif : avoir un échantillon suffisamment représentatif
pour que les données puissent être affectées à la population.

Sara GOTTI SEG S3, 2021-2022 41


Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage

1. Echantillonnages aléatoires

• Un échantillon aléatoire fournit un échantillon


représentatif dont chaque individu de la population a
une probabilité connue et non nulle d’être inclus dans
l’échantillon.

Sara GOTTI SEG S3, 2021-2022 42


Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages aléatoires
a. Echantillonnage aléatoire simple

• Il consiste simplement à choisir des individus au hasard


parmi ceux de la base de sondage (liste des individus à partir
de laquelle on prélève un échantillon par exemple l'annuaire
téléphonique). Les étapes sont les suivantes :
➢Numéroter les unités statistiques de 1 à n.
➢Tirer au hasard des unités statistiques de la population qui feront
partie de l'échantillon.

Sara GOTTI SEG S3, 2021-2022 43


Chapitre 3: Théorie d’échantillonnage
Méthodes d’échantillonnage
1. Echantillonnages aléatoires
b. Echantillonnage systématique
• C'est une technique où les unités statistiques sont choisis à intervalle
régulier dans la base de sondage. Les étapes de cette technique sont les
suivantes :
1. Numéroter les unités statistiques de 1 à N.
2. Calculer l'intervalle de sélection que l'on appelle aussi le pas de
sondage. On le calcule en divisant la taille totale de la population
N
observée par la taille de l'échantillon recherchée k = .
n
3. Tirer au hasard une unité statistique entre la première et la kème unité.
Par exemple la ième unité avec 1 ≤i ≤k.
4. 4 Pour compléter l'échantillon, on choisit la (i + k) ème unité, et la
(i + 2k)ème .....jusqu’à (i + (n−1)k)ème . On constitue ainsi un
Sara GOTTI échantillon de taille (n-1+1=n)
SEG S3, unités.
2021-2022 44
Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages aléatoires
b. Echantillonnage systématique

• Exemple:
On veut sélectionner un échantillon de 30 entreprises au sein d'une
population de 1800 entreprises.
1800
K= = 30
60
Ainsi on va tirer une entreprise toutes les 60 en partant d'un nombre tiré
aléatoirement entre 1 et 60.
Supposons ce nombre est le 15. On va donc sélectionner la 15 ème
entreprise puis la 75 ème , la 135 ème jusqu'à la 1755ème ce qui nous
donnera l'échantillon de 30 entreprises.
Sara GOTTI SEG S3, 2021-2022 45
Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages aléatoires
c. Echantillonnage par grappe
• Il consiste à choisir des groupes (toute une grappe de raisin)
plutôt que de choisir des unités statistiques isolées (un seul
raisin).
• Une grappe est un sous-ensemble non homogènes de la
population défini selon la proximité (par exemple un groupe
d’élèves faisant partie de la même classe, des habitants du même
immeuble, des habitants du même quartier ou même des équipes
sportives d'une ligue amateur).
• Il est plus facile de faire une liste des groupes et de choisir au
hasard parmi ces dizaines de groupes et d'interroger toutes les
unités statistiques du groupe.

Sara GOTTI SEG S3, 2021-2022 46


Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages aléatoires
c. Echantillonnage par grappe

• Cette méthode permet de sauver beaucoup de temps en


déplacement. Les étapes de cette techniques sont :
1. Diviser la population en grappes.
2. Choisir de façon aléatoire simple un certain nombre de grappes.
3. L'échantillon sera alors composé de toutes les unités statistiques
appartenant aux grappes choisies.
• la méthode peut entrainer des résultats imprécis (moins précis que
les méthodes précédentes) puisque les unités voisines ont
tendance de se rassembler. De plus elle ne permet pas de
contrôler la taille finale de l’échantillon.
Sara GOTTI SEG S3, 2021-2022 47
Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages aléatoires
d. Echantillonnage stratifié

• L'échantillonnage stratifié est une technique qui consiste à


subdiviser une population hétérogène en sous groupes plus
homogènes selon un critère ( Caractère qualitatif ou
quantitatif: des étudiants par leur sexe, âge ou diplôme
préparé, des entreprises par chiffre d’affaires ou secteur
d'activités …) lié à la nature et aux objectifs de l'étude. Ces
différents groupes sont appelés des strates.
• Les strates sont des sous-ensembles de la population ayant
des caractéristiques communes.
Sara GOTTI SEG S3, 2021-2022 48
Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages aléatoires
d. Echantillonnage stratifié

• Pour la répartition de l’effectif n, de l’échantillon dans les


différentes strates, la solution proportionnelle consiste à conserver
la même fraction de sondage dans chacune des strates.
• Désignons par 𝑤𝑖 le poids de la strate et par 𝑓 la fraction de
sondage constante:
𝑛 𝑁𝑖
𝑓= 𝑤𝑖 =
𝑁 𝑁
• Le nombre d’unités à choisir dans chacune des strates est donc:
𝑛𝑖 = 𝑓 × 𝑁𝑖 = 𝑤𝑖 × 𝑛

Sara GOTTI SEG S3, 2021-2022 49


Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages aléatoires
d. Echantillonnage stratifié
• Exemple:
Dans une population de 10000 entreprises, reparties en 5000 petites
entreprises, 3000 moyenne entreprises et 2000 grandes entreprises, on
souhaite avoir un échantillon de 500 entreprises.
500
Fraction de sondage constante: 𝑓 = = 0,05
10000
Strate Effectif de la strate (𝑁𝑖 ) Taille de l’échantillon
Petite 5000 5000 × 0,05 = 250
Moyenne 3000 3000 × 0,05 = 150
Grande 2000 2000 × 0,05 = 200
Total 10000 500
Sara GOTTI SEG S3, 2021-2022 50
Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages non aléatoires
• On parle d’un échantillon non aléatoire (ou empirique ou par
choix raisonné) lorsque l’échantillon est construit par des
procédés comportant une part d’arbitraire et ne permettant pas
l’évaluation de la précision d’estimation.
• Ces méthodes sont beaucoup moins coûteuses, plus rapides et
plus simples. Il est par contre, peu recommandé de généraliser les
résultats provenant de ces méthodes à l'ensemble de la
population, puisque toutes les unités statistiques n'ont pas la
même chance d'être choisi ce qui influence la représentativité de
l'échantillon.
• On peut citer deux exemples de ce type d'échantillonnage :
a. échantillonnage à l'aveuglette
b. échantillonnage au volontariat
Sara GOTTI SEG S3, 2021-2022 51
Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages non aléatoires
a. Echantillonnage à l'aveuglette

• L'échantillonnage à l'aveuglette est une technique simple et peu


coûteuse.
• Cet échantillonnage n'est pas normalement représentatif de la
population cible, parce qu'on ne sélectionne des unités
d'échantillonnage dans son cas que si on peut y avoir facilement
et commodément accès.
• Les reporters des stations de télévision sont, en outre, souvent à la
recherche de soi-disant « interviews de gens de la rue » pour
déterminer comment la population perçoit un enjeu ou une
question.
Sara GOTTI SEG S3, 2021-2022 52
Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage
1. Echantillonnages non aléatoires
b. Echantillonnage au volontariat

• C'est une des méthodes les plus utilisées actuellement sur le


• marché des médicaments.
• Les compagnies pharmaceutiques sont les pionniers en la
matière.
• Les unités statistiques décident de faire partie de l'étude de
leur propre gré.

Sara GOTTI SEG S3, 2021-2022 53


Chapitre 3: Théorie d’échantillonnage

Méthodes d’échantillonnage

• Toutes les méthodes d’échantillonnage peuvent être combinées.


• La complexité de la procédure d’échantillonnage entraine une
complexité des calculs.
• Il n’y a pas un critère standard de choix: appel au bon sens et à
l’expérience.
• Cependant, il est recommandé d’utiliser les méthodes aléatoires
au détriment des méthodes non aléatoires, car des formules
permettent d’évaluer la qualité des estimations des
caractéristiques de la population, fournies par les résultats de
l’échantillon.

Sara GOTTI SEG S3, 2021-2022 54


Chapitre 3: Théorie d’échantillonnage

Distributions d’échantillonnage

• Dans toute la suite, on traite le cas de l’échantillonnage


aléatoire simple.
• Les concepts fondamentaux et les formules importantes
découlent de cette méthode.

Sara GOTTI SEG S3, 2021-2022 55


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Modélisation d'échantillonnage aléatoire simple

• L'échantillonnage simple consiste à extraire un échantillon de


taille n dans une population de taille N par des tirages aléatoires
équiprobables et indépendants (tirages avec remise).
• Ω = {𝜔1 , 𝜔2 , … , 𝜔𝑛 }: la population constituée d'éléments appelés
unités d'observation.
• X: le caractère que l'on voudrait étudier sur l'ensemble de cette
population.
• Xk : le résultat aléatoire du kème tirage est une V.A qui suit la
même loi que X.
• (𝑋1 , … , 𝑋𝑛 ) : les résultats aléatoires des n tirages modélisant
l'échantillon étudié.
Sara GOTTI SEG S3, 2021-2022 56
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Modélisation d'échantillonnage aléatoire simple

• 𝑋1 , … , 𝑋𝑛 sont n V.A. indépendantes et de même loi (celle de


X) ; il est appelé n-échantillon ou échantillon de taille n de X.
• Une réalisation (𝑥1 , … , 𝑥𝑛 ) de l'échantillon (𝑋1 , … , 𝑋𝑛 ) est
l'ensemble des valeurs observées.
• Une statistique Y sur un échantillon (𝑋1 , … , 𝑋𝑛 ) est une V.A.,
fonction mesurable des 𝑋𝑘 :
Y = 𝜑(𝑋1 , … , 𝑋𝑛 )
• Après réalisation, la statistique Y prend la valeur 𝜑(𝑥1 , … , 𝑥𝑛 )
• Exemple de valeur statistique: la moyenne empirique.
Sara GOTTI SEG S3, 2021-2022 57
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Modélisation d'échantillonnage aléatoire simple

• En supposant que l'échantillon est aléatoire et simple, la variable


aléatoire X possède une distribution de probabilité, dite
distribution d 'échantillonnage. On peut donc calculer l'espérance
E(X) (la moyenne) et l’écart-type 𝜎(X) de cette distribution.
• La distribution d'échantillonnage est donc la distribution des
différentes valeurs que peut prendre la variable aléatoire X, pour
les différents échantillons possibles. Son écart type 𝜎𝑡 est appelé
erreur standard.
• Les principales distributions d'échantillonnage sont la distribution
d'échantillonnage de la moyenne, la distribution d'échantillonnage
de l’écart-type et la distribution d'échantillonnage de la
proportion.
Sara GOTTI SEG S3, 2021-2022 58
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
• Supposons que dans une population infinie quelconque, on ait prélevé
au hasard un premier échantillon de n observations :
𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛
σ𝑛
𝑖=1 𝑥𝑖
• et qu'on ait calculé la moyenne : 𝑥ҧ = 𝑛
• Si on prélève, dans les mêmes conditions, un deuxième échantillon de
même effectif :
𝑥1′ , 𝑥2′ , 𝑥3′ , … , 𝑥𝑛′
σ 𝑛 ′
𝑥
• La moyenne correspondante 𝑥ഥ′ = 𝑖=1 𝑖
sera généralement différente
𝑛
de la première moyenne observée.
• Il en sera de même pour les moyennes d’autres échantillons prélevés
dans les mêmes conditions.
σ 𝑛 ′′
𝑥
𝑖=1 𝑖
𝑥1′′ , 𝑥2′′ , 𝑥3′′ , … , 𝑥𝑛′′ 𝑥 ′′ =
𝑛
Sara GOTTI SEG S3, 2021-2022 59
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
• On peut considérer la suite des premières observations 𝑥1 ,
𝑥1′ , 𝑥1′′ , ... des différents échantillons comme des valeurs
observées d'une même variable aléatoire 𝑋1 , la suite des
deuxièmes observations des différents échantillons comme
des valeurs observées d'une même variable aléatoire 𝑋2 ,
etc.
• Les moyennes observées 𝑥,ҧ 𝑥ഥ′ , 𝑥 ′′ , ... sont alors des valeurs
observées d'une même variable aléatoire X ഥ qui est fonction
de 𝑋1 , 𝑋2 , …, 𝑋𝑛 .
𝑛
σ𝑖=1 𝑋𝑖
𝑋ത =
𝑛
Sara GOTTI SEG S3, 2021-2022 60
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne

• Comme 𝑋1 , 𝑋2 , …, 𝑋𝑛 , la variable aléatoire X possède une


distribution de probabilité, dite distribution
d'échantillonnage de la moyenne.
• On peut donc calculer la moyenne et l’écart-type de cette
distribution, en supposant que l'échantillon est aléatoire et
simple, les variables aléatoires 𝑋1 , 𝑋2 , …, 𝑋𝑛 ont toutes la
même distribution de probabilité, dont la moyenne est
désignée par 𝜇 (la moyenne de la population) et l’écart-type
par 𝜎 (l’écart-type de la population).

Sara GOTTI SEG S3, 2021-2022 61


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne

On a E(𝑋𝑖 ) = 𝜇
• On démontre alors que la moyenne de la distribution de la
moyenne est:
σ𝑛
𝑖=1 𝑋𝑖 1 1
𝜇𝑋ത = E( ) = × σ𝑛𝑖=1 𝐸(𝑋𝑖 ) = ×𝑛×𝜇 =𝜇
𝑛 𝑛 𝑛
• Donc:
𝜇𝑋ത = 𝜇

Sara GOTTI SEG S3, 2021-2022 62


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
On a 𝑉(𝑋𝑖 )=𝜎 2
• L’écart-type de la distribution de la moyenne est:
σ𝑛
𝑖=1 𝑋𝑖
𝜎𝑋ത = ത
𝑉(𝑋)= V( )
𝑛
1
= × σ𝑛𝑖=1 𝑉(𝑋𝑖 )
𝑛2
1 𝜎2
= × 𝑛 × 𝜎2 =
𝑛2 𝑛
• Donc:
𝜎
𝜎𝑋ത =
𝑛
Sara GOTTI SEG S3, 2021-2022 63
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne

• Dans le cas d'une population finie d'effectif N, au sein de


laquelle est prélevé, sans remise, un échantillon aléatoire est
simple d'effectif n, l’écart-type de la distribution de la
moyenne est :
𝜎 𝑁−𝑛
𝜎𝑋ത =
𝑛 𝑁−1
𝑁−𝑛
Avec est le coefficient d’exhaustivité.
𝑁−1

Sara GOTTI SEG S3, 2021-2022 64


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
Loi de la distribution d’échantillonnage de la moyenne
• La loi de 𝑋ത dépend de:
✓La loi de la population (Normale ou quelconque)
✓la taille de l'échantillon (n petite ou grande)
• La distribution d’échantillonnage de la moyenne est donnée
par :
𝜎

❑Si X suit une loi normale 𝑁(𝜇; 𝜎), alors 𝑋 ↝ 𝑁 𝜇;
𝑛
❑Si la loi de X est quelconque avec la taille de l’échantillon
n≥30, par le théorème central limite, 𝑋ത suit approximativement
𝜎
une loi normale 𝑁 𝜇;
𝑛
Sara GOTTI SEG S3, 2021-2022 65
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
• Exemple 1:
Prenons la population P{1, 2, 3}. On prélève des échantillons de taille
n=2.
On considère cette population infinie (on effectue des tirages
successives avec remise pour construire les échantillons).
• La moyenne de la population 𝜇?
1+2+3 6
𝜇= = =2
3 3
• L’écart-type de la population 𝜎?
σ 𝑥𝑖 2
𝜎= − 𝑋ത 2 𝑎𝑣𝑒𝑐 𝑋=
ത 𝜇
𝑛
1+4+9 2
𝜎= − 22 =
3 3

Sara GOTTI SEG S3, 2021-2022 66


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
• Exemple 1: (suite)
Tous les échantillons possibles sont:
11 12 13
21 22 23
31 32 33
1+1 1+2 1+3
𝑋11 = = 1 ; 𝑋12 = = 1,5 ; 𝑋13 = =2
2 2 2
2+1 2+2 2+3
𝑋21 = = 1,5 ; 𝑋22 = = 2 ; 𝑋23 = = 2,5
2 2 2
3+1 3+2 3+3
𝑋31 = = 2 ; 𝑋32 = = 2,5 ; 𝑋33 = =3
2 2 2
Sara GOTTI SEG S3, 2021-2022 67
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne

• Exemple 1: (suite)
Nous somme face à une distribution d’échantillonnage de
moyenne.
σ 𝑋𝑖 1+1,5+2+1,5+2+2,5+2+2,5+3
La moyenne 𝜇𝑥ҧ = = =2=μ
𝑛 9
σ 𝑋𝑖 2 39 1
L’écart-type 𝜎𝑋ത = − 𝜇𝑥ҧ = 2 −4=
𝑛 9 3
2
2 𝜎 3 1
On a trouvé 𝜎 = alors = = = 𝜎𝑋ത
3 𝑛 2 3

Sara GOTTI SEG S3, 2021-2022 68


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
• Exemple 2:
Une machine fabrique des rondelles d’un diamètre moyen 𝜇 = 20 𝑚𝑚
et d’écart-type 𝜎 = 2 𝑚𝑚 . On suppose que la production est très
importante (c-à-d. la population est infinie). On prélève un échantillon
de 100 pièces.
Quelle est la loi de probabilité de la moyenne des diamètres de ces 100
pièces?
Quelle est la probabilité que la moyenne des diamètres de l’échantillon
soit inferieure à 20,4?
Quelle est la probabilité que cette moyenne soit comprise entre 19,8 et
20,2?

Sara GOTTI SEG S3, 2021-2022 69


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
• Exemple 2: (suite)
• La moyenne de la distribution d’échantillonnage de la moyenne des
diamètres est 𝜇𝑋ത = 𝜇 = 20
• L’écart-type de la distribution
𝜎 2
d’échantillonnage de la moyenne des
diamètres est 𝜎𝑋ത = = = 0,2
𝑛 100
• La loi de probabilité de la moyenne des diamètres de ces 100 pièces?
ത Examinons la situation.
On cherche la loi suivie par 𝑋.
La taille de l’échantillon est: n = 100. Nous sommes en présence d’un
échantillon (n>30). Donc 𝑋ത suit une loi normale
𝜎

𝑋 ↝ 𝑁 𝜇; = 𝑁(20, 0,2).
𝑛
𝑋ത −20
On en déduit que Z = suit 𝑁(0, 1).
0,2
Sara GOTTI SEG S3, 2021-2022 70
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
• Exemple 2: (suite)
• La probabilité que la moyenne des diamètres de
l’échantillon soit inferieure à 20,4?
On cherche à déterminer P(𝑋ത ≤ 20,4).
𝑋ത −20
On a 𝑋ത ↝ 𝑁 20; 0,2 . On en déduit que Z = suit 𝑁(0, 1).
0,2
𝑋ത −20 20,4 −20
P(𝑋ത ≤ 20,4)=P( ≤ )
0,2 0,2
=P(Z≤2)
=0,9772
Sara GOTTI SEG S3, 2021-2022 71
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la moyenne
• Exemple 2: (suite)
• La probabilité que cette moyenne soit comprise entre 19,8
et 20,2?
On cherche à déterminer P(19,8 ≤ 𝑋ത ≤ 20,2).
19,8−20 𝑋ത −20 20,2 −20
P(19,8 ≤ 𝑋ത ≤ 20,2)=P( ≤ ≤ )
0,2 0,2 0,2
=P(−1 ≤Z≤ 1)
= 2×P(≤Z≤ 1)−1
= 2× 0,8413 − 1
=0,6826
Sara GOTTI SEG S3, 2021-2022 72
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la proportion

• Si on considère une population infinie et si on y prélève un


échantillon aléatoire et simple d'effectif n, on désigne par X
le nombre d'individus possédant, dans l'échantillon, le
caractère étudié.
𝑋𝑛
• 𝑓𝑛 = est la fréquence ou proportion des individus
𝑛
possédant, dans l'échantillon, le caractère étudié.
• On désigne par 𝑝 la proportion des individus possédant,
dans la population, le caractère étudié.

Sara GOTTI SEG S3, 2021-2022 73


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la proportion
• De la même manière que la moyenne, chacun des échantillons
possède une fréquence :
𝑋𝑛 𝑋 𝑛′ 𝑋𝑛′′
• 𝑓𝑛 = 𝑓𝑛 ′ = 𝑓𝑛′′ =
𝑛 𝑛 𝑛
• Ces fréquences peuvent être considérées comme des valeurs
observées d'une même variable aléatoire 𝐹𝑛 :
𝑋𝑛
𝐹𝑛 =
𝑛
• La variable aléatoire 𝐹𝑛 possède une distribution de probabilité,
dite distribution d'échantillonnage de la proportion.
• On peut donc calculer la moyenne et l’écart-type de cette
distribution, en supposant que l'échantillon est aléatoire et
simple.
Sara GOTTI SEG S3, 2021-2022 74
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la proportion

• On peut démontrer alors la moyenne de la distribution de la


proportion:
𝑋𝑛 1 1
𝜇𝐹 = E( 𝑛 ) = × 𝐸 𝑋𝑛 = × 𝑛𝑝 = 𝑝
𝑛 𝑛
• Donc:
𝜇𝐹 = 𝑝

Sara GOTTI SEG S3, 2021-2022 75


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la proportion

• L’écart-type de la distribution de la proportion est:


𝑋𝑛
𝜎𝐹 = 𝑉(F)= V( )
𝑛
1
= × 𝑉(𝑋𝑛 )
𝑛2
1 𝑝𝑞
= × 𝑛 × 𝑝𝑞 =
𝑛2 𝑛
• Donc:
𝑝𝑞
𝜎𝐹 =
𝑛
Sara GOTTI SEG S3, 2021-2022 76
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la proportion

• Dans le cas d'une population finie d'effectif N, au sein de


laquelle est prélevé, sans remise, un échantillon aléatoire est
simple d'effectif n, l’écart-type de la distribution de la
proportion est :
𝑝𝑞 𝑁−𝑛
𝜎𝐹 =
𝑛 𝑁−1
𝑁−𝑛
Avec est le coefficient d’exhaustivité.
𝑁−1

Sara GOTTI SEG S3, 2021-2022 77


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la proportion
Loi de la distribution d’échantillonnage de la proportion
• La loi de 𝐹 dépend de:
✓la taille de l'échantillon (n petite ou grande)
• La distribution d’échantillonnage de la moyenne est donnée
par :
❑Si la taille de l’échantillon n≥30, le produit 𝑛𝑝 ≥ 5 et 𝑛𝑞 ≥ 5,
par le théorème central limite, 𝐹 suit approximativement une loi
𝑝𝑞
normale 𝑁 𝑝;
𝑛

Sara GOTTI SEG S3, 2021-2022 78


Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la proportion

• Exemple:
Une machine fabrique des rondelles d’un diamètre moyen
𝜇 = 20 𝑚𝑚 et d’écart-type 𝜎 = 2 𝑚𝑚. On suppose que la
production est très importante (c-à-d. la population est
infinie). On trouve 8% des rondelles sont défectueuses. On
prélève un échantillon de 100 pièces.
Quelle est la loi de probabilité de la proportion des rondelles
défectueuses de ces 100 pièces?
Quelle est la probabilité que la proportion des rondelles
défectueuses de l’échantillon dépasse 10%?
Sara GOTTI SEG S3, 2021-2022 79
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la proportion

• Exemple: (suite)
• La moyenne de la distribution d’échantillonnage de la proportion des
rondelles défectueuses est 𝜇𝐹 = 𝑝 = 0,08
• L’écart-type de la distribution d’échantillonnage de la proportion des
𝑝𝑞 0,08×0,92
rondelles défectueuses est 𝜎𝐹 = = = 0,02713
𝑛 100
• La loi de probabilité de la proportion des rondelles défectueuses de ces 100
pièces?
On cherche la loi suivie par 𝐹. Examinons la situation.
La taille de l’échantillon est: n = 100. Nous sommes en présence d’un
échantillon (n>30), en plus 𝑛𝑝 = 100 × 0,08 = 8 > 5, 𝑒𝑡 𝑛𝑞 = 100 ×
0,92 = 92 > 5.
𝑝𝑞
Donc 𝐹 suit une loi normale F ↝ 𝑁 𝑝; 𝑛
= 𝑁(0,08; 0,02713).
Sara GOTTI SEG S3, 2021-2022 80
Chapitre 3: Théorie d’échantillonnage
Distributions d’échantillonnage
Distribution d'échantillonnage de la proportion

• Exemple: (suite)
• La probabilité que la proportion des rondelles défectueuses de
l’échantillon dépasse 10%?
On cherche à déterminer P(𝐹 ≥ 0,1).
F −0,08
On aF ↝ 𝑁(0,08; 0,02713). On en déduit que Z = suit
0,02713
𝑁(0, 1).
F−0,08 0,1 −0,08
P(𝐹 ≥ 0,1)=P( ≥ )
0,02713 0,02713
=P(Z≥ 0,74)
=1−P(Z≤ 0,74)
=1−0,7704= 0,2296
Sara GOTTI SEG S3, 2021-2022 81
CHAPITRE 4
Estimation

✓Introduction
✓Estimation ponctuelle
✓Estimation par intervalle de confiance

Sara GOTTI SEG S3, 2021-2022 82


Chapitre 4: Estimation
Introduction
• Après avoir prélevé l’échantillon, et étudié les distributions
d’échantillonnage, on peut alors généraliser, à la population, les
résultats expérimentaux obtenus à partir de l’échantillon.
• L’estimation consiste en l’évaluation d’un paramètre de la population à
partir des valeurs calculées sur les échantillons.
• Les paramètres à estimer sont:
❑ 𝜇 la moyenne de la population.
❑ 𝜎 l’écart type de la population.
❑ 𝑝 pour la proportion dans la population.
• La théorie de l’estimation se divise en deux parties:
❑L’estimation ponctuelle
❑L’estimation par intervalle de confiance
Sara GOTTI SEG S3, 2021-2022 83
Chapitre 4: Estimation

Estimation ponctuelle

• L’estimation ponctuelle ou l’estimation de point d’un


paramètre est la connaissance de la seule valeur estimée de ce
paramètre.
• Les paramètres recherchés sont: la moyenne, l’écart-type et la
proportion de la population.

Sara GOTTI SEG S3, 2021-2022 84


Chapitre 4: Estimation
Estimation ponctuelle
Généralités sur les estimateurs

• Un estimateur T = f (𝑋1 ; …; 𝑋𝑛 ) d'un paramètre 𝜃 est une


statistique et sa réalisation f ( 𝑥1 ; …; 𝑥𝑛 ) sera appelée
estimation ponctuelle de 𝜃.
• On appelle erreur d'estimation la différence entre l'estimateur
et le paramètre : Erreur = T − 𝜃.
• Cette Erreur peut être décomposer de la façon suivante :
Fluctuation autour de la moyenne

𝑇 − 𝜃 = 𝑇−𝐸 𝑇 + 𝐸 𝑇 −𝜃
Biais de l'estimateur

Sara GOTTI SEG S3, 2021-2022 85


Chapitre 4: Estimation
Estimation ponctuelle
Généralités sur les estimateurs

• Un estimateur T de 𝜃 est dit sans biais si E(T) = 𝜃.


• Sinon, on dit que c'est un estimateur biaisé :
❑ Si le biais 𝐸(𝑇) − 𝜃 est positif, ( E(T) > 𝜃), alors l'estimateur
surestime la valeur du paramètre.
❑ Si le biais 𝐸(𝑇) − 𝜃 est négatif, ( E(T) < 𝜃), alors l'estimateur
sous-estime la valeur du paramètre.
• Un estimateur T de 𝜃 est dit asymptotiquement sans biais si
𝐸(𝑇) → 𝜃 quand 𝑛 → ∞.

Sara GOTTI SEG S3, 2021-2022 86


Chapitre 4: Estimation
Estimation ponctuelle
Généralités sur les estimateurs

• Un estimateur T de 𝜃 est dit convergent si 𝑉𝑎𝑟 𝑇 →


0 quand 𝑛 → ∞.
• Soit T et 𝑇 ′ deux estimateurs sans biais de 𝜃. On dit que T est
plus efficace que 𝑇 ′ si Var (T)≤Var (𝑇 ′ ).
• L'estimateur sans biais et de variance minimale est appelé
estimateur efficace.

Sara GOTTI SEG S3, 2021-2022 87


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’une moyenne

• Soit X un caractère (une variable aléatoire) dont on veut


estimer la moyenne 𝜇 à partir d'un échantillon (𝑋1 ; …; 𝑋𝑛 ) de
même loi que X. La loi de X est inconnue.
𝑋1 + 𝑋2 + …+ 𝑋𝑛
• La moyenne empirique 𝑿 ഥ= est un estimateur
𝑛
efficace de la moyenne 𝝁.

Sara GOTTI SEG S3, 2021-2022 88


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’une moyenne

• Justification:
ഥ est
o En fait, l'estimateur X
❑sans biais car E(X ഥ ) = 𝜇.
Var (X)
❑convergeant car 𝑉𝑎𝑟 (X) = ഥ → 0; quand n tend
𝑛
vers ∞.
o On peut montrer qu'il est de variance minimale.

Sara GOTTI SEG S3, 2021-2022 89


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’une moyenne

• Exemple:
Afin d'étudier le salaire horaire des ouvriers d'un secteur d'activité,
on prélève un échantillon aléatoire (X1 ; X2 ; …; X15 ) de réalisation
(en dhs)
9,8 8,6 9,7 10,2 8,9 10,1 9,9 9,7
8,7 9,8 10,2 9,3 10,4 9,5 10,9
On suppose que la loi suivie par le salaire horaire est normale de
moyenne 𝜇 et d’écart-type 𝜎.
1. Donner une estimation de 𝜇.

Sara GOTTI SEG S3, 2021-2022 90


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’une moyenne

• Exemple: (suite)
Une estimation ponctuelle de la moyenne 𝜇:
σ15
𝑖=1 𝑋𝑖
𝜇 = 𝑋ത =
15
9,8+8,6+9,7+10,2+8,9+10,1+9,9 +9,7 +8,7 +9,8+10,2 +9,3+10,4+9,5 +10,9
=
15
145,7
=
15
= 9,71

Sara GOTTI SEG S3, 2021-2022 91


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’un écart-type
• On considère maintenant l’estimation de la variance (écart-type)
par la variance empirique de l’échantillon:
2 1 σ𝑛 ത 2 1 𝑛
σ 2 ത 2
𝑆 = (𝑋 − 𝑋) = 𝑋 − 𝑋
𝑛 𝑖=1 𝑖 𝑛 𝑖=1 𝑖
• S est un estimateur de l’écart-type.
• Déterminons le biais de cet estimateur:
1 𝑛 2 1 𝑛 2
2
𝐸(𝑆 ) = 𝐸 σ 𝑋 − 𝑋ത 2
= σ 𝐸 𝑋 − 𝐸 𝑋ത 2
𝑛 𝑖=1 𝑖 𝑛 𝑖=1 𝑖
= 𝐸(𝑋 2 ) − 𝐸(𝑋ത 2 )
= 𝑉𝑎𝑟(𝑋) + 𝐸(𝑋)2 − 𝑉𝑎𝑟(𝑋) ത − 𝐸(𝑋)ത 2
Var(X)
= 𝑉𝑎𝑟(𝑋) + 𝐸(𝑋) − 2 ത 2
− 𝐸(𝑋)
𝑛
1 𝑛−1 2
= (1 − )𝑉𝑎𝑟(𝑋)= 𝜎 ≠ 𝜎2
𝑛 𝑛
Sara GOTTI SEG S3, 2021-2022 92
Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’un écart-type

• Donc contrairement à ce qu’on pourrait croire, l’écart-type


empirique S n’est pas un estimateur sans biais de 𝜎.
• Cet estimateur n’est qu’asymptotiquement sans biais.
• Pour corriger le biais on prend l'estimateur
2 𝑛
S′ = 𝑆2
𝑛−1
′2 𝑛 2 𝑛 𝑛−1 2
On remarque que: E(S ) = 𝐸(𝑆 ) = × 𝜎 = 𝜎2
𝑛−1 𝑛−1 𝑛

Sara GOTTI SEG S3, 2021-2022 93


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’un écart-type
• La statistique ( la variance
𝑛
corrigée ):
′2
𝑛 1
S = 2
𝑆 = ෍(𝑋𝑖 − 𝑋) ത 2
𝑛−1 𝑛−1
𝑖=1
𝑛
𝑆2est un estimateur efficace de la variance 𝜎 2 qui est sans biais et
𝑛−1
convergeant.

𝒏
• Alors, 𝑺 × est un estimateur efficace de l’écart-type 𝝈 de la
𝒏−𝟏
population qui est sans biais et convergeant.
• L'écart-type estimé est noté 𝑆𝑐 et on l’appelle l’écart-type corrigé.
𝒏
𝑆𝑐 = 𝑺 ×
𝒏−𝟏

Sara GOTTI SEG S3, 2021-2022 94


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’un écart-type

• Exemple:
L'objet d'une enquête menée sur la région Larache-El Ksar El
Kebir est d'étudier la variable X représentant la dépense
moyenne de foyer. On choisit au hasard 100 foyers, les
réalisation de l'échantillon permettent d’affirmer que
1 100 2
σ100
𝑖=1 𝑋𝑖 = 3007 𝑒𝑡 σ𝑖=1 𝑋𝑖 = 940,4
100
• Donner une estimation de l’écart-type 𝜎

Sara GOTTI SEG S3, 2021-2022 95


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’un écart-type

• Exemple: (suite)
Une estimation ponctuelle de l'écart-type σ:
𝑛 100 1 2
𝑆𝑐 = × 𝑆= × σ100 𝑋 − 𝑋ത 2
𝑛−1 99 100 𝑖=1 𝑖
100 1 2 σ100
𝑖=1 𝑋𝑖 2
= × σ100 𝑋 − ( )
99 100 𝑖=1 𝑖 100
100 3007 2
= × 940,4 − ( )
99 100
= 6,05

Sara GOTTI SEG S3, 2021-2022 96


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’une proportion

• Soit une population ayant des individus possédant une


certaine caractéristique A. On veut estimer à partir d'un
échantillon de taille n la proportion d'individus possédant
cette caractéristique A.
• Soit K la V.A qui représente le nombre d'individus dans
l'échantillon possédant la caractéristique A.
• On rappelle que p est la proportion d'individus de la
population possédant la modalité A.

Sara GOTTI SEG S3, 2021-2022 97


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’une proportion

K
• En fait, f = est un estimateur sans biais car:
n
comme X1 ; X2 ; …; Xn sont des variables de Bernoulli, alors:
E(X1)+E(X2 )+ …+E(Xn )
E(f)=
𝑛
𝑝+𝑝+ ……+𝑝 𝑛×𝑝
= = =𝑝
𝑛 𝑛

Sara GOTTI SEG S3, 2021-2022 98


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’une proportion

• En plus f est un estimateur convergeant, car:


Var(X1 )+Var(X2)+ …+Var(Xn)
• Var (f) = 2
𝑛
𝑝(1−𝑝)+𝑝(1−𝑝)+ ……+𝑝(1−𝑝) 𝑝(1−𝑝)
= =
𝑛2 𝑛
alors 𝑉𝑎𝑟 (𝑓) → 0, quand 𝑛 → +∞.
K
• Alors, la fréquence empirique f= est l'estimateur efficace
x n
de p.

Sara GOTTI SEG S3, 2021-2022 99


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’une proportion

• Exemple:
On s'intéresse à la proportion p des étudiants ayant un
Baccalauréat Sciences-économiques inscrit en première année
à la FSJES de Kelaa des sraghna. On a prélevé
indépendamment un échantillon de taille n=120. On constate
que 48 étudiants de l’échantillon ont une un bac Sciences
économiques.
Donner une estimation ponctuelle de p.

Sara GOTTI SEG S3, 2021-2022 100


Chapitre 4: Estimation
Estimation ponctuelle
Estimation ponctuelle d’une proportion

• Exemple: (Suite)
Une estimation ponctuelle de la proportion p des étudiants
ayant un Baccalauréat Sciences-économiques :
48
𝑝=𝑓= = 0,4
120

Sara GOTTI SEG S3, 2021-2022 101


Chapitre 4: Estimation

Estimation par intervalle de confiance

• L'estimation d'un paramètre inconnu par une seule valeur est


quelque fois insuffisante, on préfère souvent donner un
intervalle de valeurs.
• On cherche des intervalles dit "intervalle de confiance" qui
contiennent
❑ La moyenne 𝜇 inconnue
❑ La proportion p d'une certaine propriété que possède la
population.

Sara GOTTI SEG S3, 2021-2022 102


Chapitre 4: Estimation

Estimation par intervalle de confiance

• L'estimation par intervalle de confiance consiste à déterminer


autour de la valeur estimée un intervalle dont on a de fortes
chances de croire qu'il contient la vraie valeur du paramètre
recherché.
• Si on s'intéresse à un paramètre 𝜃, dont on possède un estimateur
T, l'estimation par intervalle de confiance consiste à déterminer
de part et d'autre de T les bornes T1 et T2 d'un intervalle qui a une
forte probabilité de contenir 𝜃.
• Cette probabilité est appelée niveau de confiance 𝛽 et désignée
par (𝛽 = 1 − 𝛼), avec 𝛼 est un risque d'erreur.

Sara GOTTI SEG S3, 2021-2022 103


Chapitre 4: Estimation

Estimation par intervalle de confiance

• Soit X une V.A. dont la loi dépend d'un paramètre inconnu 𝜃.


• On appelle intervalle de confiance de niveau de confiance 𝛽
(𝛽 = 1 − 𝛼 ou de seuil de risque 𝛼), un intervalle qui a la
probabilité 𝛽 de contenir la vraie valeur de 𝜃.
• Autrement dit, [T1 ; T2 ] est intervalle de confiance pour un
niveau 𝛽 du paramètre 𝜃 si:
P(T1 ≤ 𝜃 ≤ T2 ) = 𝛽 = 1 − 𝛼

Sara GOTTI SEG S3, 2021-2022 104


Chapitre 4: Estimation

Estimation par intervalle de confiance

• 𝛽(= 1 − 𝛼) est appelé le niveau de confiance, et 𝛼 est le


seuil ou le risque.
• Plus le niveau de confiance est élevé, plus la certitude est
grande que la méthode d'estimation produira une estimation
contenant la vraie valeur de 𝜃.
• Les niveaux de confiance les plus utilisés sont 90%, 95% et
99%.
• Une estimation par intervalle est souvent réalisée en ajoutant
une marge d’erreur à l’estimation ponctuelle.

Sara GOTTI SEG S3, 2021-2022 105


Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
• Soit X une variable aléatoire et (X1 ; X2 ; …; Xn ) un échantillon de X.
• On a vu que la moyenne X ഥ d'un échantillon aléatoire permet d'estimer
la vraie moyenne de la population.
• On voudrait estimer également la précision de cette moyenne, c'est-à-
dire donner une marge d'erreur ou un intervalle de confiance.
• On peut distinguer deux cas :
1. La taille de l'échantillon est petite (n < 30) et X ↝ 𝑁(𝜇; 𝜎):
a. L’écart-type 𝜎 de la population est connu
b. L’écart-type 𝜎 de la population est inconnu
2. La taille de l’échantillon est grande (n≥30) et X de loi quelconque.
Sara GOTTI SEG S3, 2021-2022 106
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• 𝝈 de la population est connu :
On se fixe le niveau de confiance 𝛽 (ou le risque 𝜑). On peut écrire
donc que:
𝜎

Si X suit une loi normale 𝑁(𝜇; 𝜎), alors 𝑋↝𝑁(𝜇; )
√𝑛
𝑋ത −𝜇
On pose Z = 𝜎 suit 𝑁(0, 1)
√𝑛
β+1
P(−𝑡β ≤ 𝑍 ≤ 𝑡β ) = β ⇒ 2×P(Z≤ 𝑡β )−1= β ⇒ P(Z≤ 𝑡β ) =
2
⇒ on cherche dans la table de la loi normale centrée et réduite la valeur
β+1
de 𝑡β par lecture inverse de .
2
Sara GOTTI SEG S3, 2021-2022 107
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)

• 𝝈 de la population est connu :


P(−𝑡β ≤ 𝑍 ≤ 𝑡β )= β
𝑋ത −𝜇
=P(−𝑡β ≤ 𝜎 ≤ 𝑡β )= β
√𝑛
𝜎 𝜎
=P(−𝑡β ≤ 𝑋ത −𝜇 ≤ 𝑡β )= β
√𝑛 √𝑛
𝜎 𝜎
=P(−𝑡β − 𝑋ത ≤ −𝜇 ≤ 𝑡β − 𝑋)= ത β
𝑛 √𝑛
𝜎 𝜎
=P(𝑋ത − 𝑡β ≤𝜇 ≤ ത
𝑋 + 𝑡β )= β
𝑛 √𝑛

Sara GOTTI SEG S3, 2021-2022 108


Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)

• 𝝈 de la population est connu :


Conclusion : Si x est une réalisation de X, l'intervalle de confiance
de la moyenne 𝜇 de seuil ou de niveau 𝛽(= 1 − 𝛼) est:
𝜎 𝜎
𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]
𝑛 𝑛
En remplaçant 𝑋ത par sa valeur calculée sur l'échantillon, on obtient
l'intervalle de confiance sur la moyenne 𝜇.
𝜎
• La grandeur 𝑡β ajoutée à l’estimation ponctuelle 𝑋ത est appelée
𝑛
𝜎
la marge d’erreur notée 𝜀. On écrit: 𝜀 = 𝑡β
𝑛
Sara GOTTI SEG S3, 2021-2022 109
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)

• Exemple 1:
Afin d'étudier le salaire horaire des ouvriers d'un secteur d'activité, on
prélève un échantillon aléatoire (X1 ; X2 ; …; X15 ) de réalisation (en
dhs)
9,8 8,6 9,7 10,2 8,9 10,1 9,9 9,7
8,7 9,8 10,2 9,3 10,4 9,5 10,9
On suppose que la loi suivie par le salaire horaire est normale de
moyenne 𝜇 et d’écart-type 𝜎 = 1.
1. Estimer le salaire horaire moyen dans la population par un intervalle
de confiance de niveau 95%.
Sara GOTTI SEG S3, 2021-2022 110
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• Exemple 1: (suite)
la moyenne de l’échantillon:𝑋ത = 9,71
L’écart-type 𝜎 = 1
l'intervalle de confiance de la moyenne 𝜇 de niveau 95% est:
𝜎 𝜎 1 1
𝐼0,95 = [𝑋ത − 𝑡0,95 ; 𝑋ത + 𝑡0,95 ] = [9,71 − 𝑡0,95 ; 9,71 + 𝑡0,95 ]
𝑛 𝑛 15 15
Calculer 𝑡0,95 :
β+1 0,95+1
On a P(Z≤ 𝑡β ) = alors P(Z≤ 𝑡0,95 ) = = 0,975 ⇒ 𝑡0,95 =1,96
2 2
1 1
𝐼0,95 = [9,71 − 1,96 × ; 9,71 + 1,96 × ]
15 15
𝐼0,95 = [9,20; 10,22]
Sara GOTTI SEG S3, 2021-2022 111
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• 𝝈 de la population est inconnu :
𝒏
L'écart type 𝜎 étant inconnu, on l'estime par son estimateur ponctuel 𝑆𝑐 = 𝑺 𝒏−𝟏

L'intervalle de confiance de la moyenne 𝜇 de seuil ou de niveau 𝛽(= 1 − 𝛼) devient:


𝒏 𝒏
𝑺× 𝒏−𝟏 𝑺× 𝒏−𝟏
𝑆𝑐 𝑆𝑐
𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]= [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]
𝑛 𝑛 𝑛 𝑛
𝑺 𝑺
𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]
𝑛−1 𝑛−1
𝑆𝑐
Avec la marge d’erreur 𝜀 = 𝑡β
𝑛
En remplaçant 𝑋ത et S par leurs valeurs calculées sur l'échantillon, on obtient l'intervalle
de confiance sur la moyenne 𝜇.
Sara GOTTI SEG S3, 2021-2022 112
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)

• Exemple 2:
Afin d'étudier le salaire horaire des ouvriers d'un secteur d'activité, on
prélève un échantillon aléatoire (X1 ; X2 ; …; X15 ) de réalisation (en
dhs)
9,8 8,6 9,7 10,2 8,9 10,1 9,9 9,7
8,7 9,8 10,2 9,3 10,4 9,5 10,9
On suppose que la loi suivie par le salaire horaire est normale de
moyenne 𝜇 et d’écart-type 𝜎.
1. Estimer le salaire horaire moyen dans la population par un intervalle
de confiance de niveau 95%.
Sara GOTTI SEG S3, 2021-2022 113
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)

• Exemple 2: (suite)
la moyenne de l’échantillon:𝑋ത = 9,71
𝒏
𝜎 est inconnu. On l’estime par son estimateur ponctuel 𝑆𝑐 = 𝑺
𝒏−𝟏

1 15 1
𝑆= σ𝑖=1 𝑋𝑖 2 − 𝑋ത 2 = × 1420,93 − (9,71)2 =0,67
15 15
l'intervalle de confiance de la moyenne 𝜇 de niveau 95% est:
𝑺 𝑺 0,67 0,67
𝐼0,95 = 𝑋ത − 𝑡0,95 ; 𝑋ത + 𝑡0,95 = [9,71 − 1,96 × ; 9,71 + 1,96 × ]
𝑛−1 𝑛−1 14 14
𝐼0,95 = [9,36; 10,06]
Sara GOTTI SEG S3, 2021-2022 114
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
2. (n≥30) et X de loi quelconque

• Lorsque la taille n de l'échantillon est grande (pratiquement dès


que n > 30), on appliquera les formules de l'intervalle de
confiance sur 𝜇, même si l'échantillon n'est pas issu d'une
population normale.
• En effet, le théorème central limite nous permet de dire que 𝑋ത
𝜎
est approximativement de loi 𝑁(𝜇; ) lorsque n est grand.
𝑛

Sara GOTTI SEG S3, 2021-2022 115


Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
2. (n≥30) et X de loi quelconque

• l'intervalle de confiance de la moyenne 𝜇 de niveau 𝛽:


• Si 𝜎 est connue :
𝜎 𝜎
𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]
𝑛 𝑛
• Si 𝜎 est connue :
𝑺 𝑺
𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]
𝑛−1 𝑛−1
𝑺
Avec la marge d’erreur 𝜀 = 𝑡β
𝑛−1
Sara GOTTI SEG S3, 2021-2022 116
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
2. (n≥30) et X de loi quelconque

• Exemple 1:
L'objet d'une enquête menée sur la région Larache-El Ksar El Kebir est
d'étudier la variable X représentant la dépense moyenne de foyer
sachant que l’écart-type 𝜎 = 5. On choisit au hasard 100 foyers, les
réalisation de l'échantillon permettent d’affirmer que
1 2
σ100
𝑖=1 𝑋𝑖 = 3007 𝑒𝑡 σ100 𝑋 = 940,4
100 𝑖=1 𝑖
1. Estimer la dépense moyenne dans la population par un intervalle de
confiance de niveau 95%.

Sara GOTTI SEG S3, 2021-2022 117


Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
2. (n≥30) et X de loi quelconque
• Exemple 1: (suite)
σ100
𝑖=1 𝑋𝑖 3007
la moyenne de l’échantillon:𝑋ത = = = 30,07
100 100
l'intervalle de confiance de la moyenne 𝜇 de niveau 95% est:
𝜎 𝜎 5 5

𝐼0,95 = [𝑋 − 𝑡0,95 ത
; 𝑋 + 𝑡0,95 ] = [30,07 − 𝑡0,95 ; 30,07 + 𝑡0,95 ]
𝑛 𝑛 100 100
Calculer 𝑡0,95 :
β+1 0,95+1
On a P(Z≤ 𝑡β ) = alors P(Z≤ 𝑡0,95 ) = = 0,975 ⇒ 𝑡0,95 =1,96
2 2
5 5
𝐼0,95 = [30,07 − 1,96 × ; 30,07 + 1,96 × ]
100 100
𝐼0,95 = [29,09; 31,05]
Sara GOTTI SEG S3, 2021-2022 118
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
2. (n≥30) et X de loi quelconque

• Exemple 2:
L'objet d'une enquête menée sur la région Larache-El Ksar El Kebir est
d'étudier la variable X représentant la dépense moyenne de foyer. On
choisit au hasard 100 foyers, les réalisation de l'échantillon permettent
d’affirmer que
1 2
σ100
𝑖=1 𝑋𝑖 = 3007 𝑒𝑡 σ100 𝑋 = 940,4
100 𝑖=1 𝑖
1. Estimer la dépense moyenne dans la population par un intervalle de
confiance de niveau 95%.
2. Combien d’observations doit-on effectuer pour obtenir une marge
d’erreur de 1 au seuil de confiance de 95% ?
Sara GOTTI SEG S3, 2021-2022 119
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
2. (n≥30) et X de loi quelconque
• Exemple 2: (suite)
σ100
𝑖=1 𝑋𝑖 3007
la moyenne de l’échantillon:𝑋ത = = = 30,07
100 100
𝒏
𝜎 est inconnu. On l’estime par son estimateur ponctuel 𝑆𝑐 = 𝑺 = 6,05
𝒏−𝟏
avec S=6,02
l'intervalle de confiance de la moyenne 𝜇 de niveau 95% est:
𝑺 𝑺
𝐼0,95 = [𝑋ത − 𝑡0,95 ; 𝑋ത + 𝑡0,95 ]
𝑛−1 𝑛−1
6,02 6,02
= [30,07 − 1,96 × ; 30,07 + 1,96 × ]
99 99
Sara GOTTI 𝐼0,95 SEG
= [28,88;
S3, 2021-2022 31,26] 120
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une moyenne
2. (n≥30) et X de loi quelconque
• Exemple 2: (suite)
Combien d’observations doit-on effectuer pour obtenir une marge d’erreur
de 1 au seuil de confiance de 95% ?
𝑺 𝑺 6,02
On a la marge d’erreur 𝜀 = 𝑡β = 𝑡0,95 = 1,96
𝑛−1 𝑛−1 𝑛−1
6,02
𝜀=1 alors: 1,96 =1
𝑛−1
6,02 1
= ⇒ 𝑛 − 1 = 6,02 × 1,96
𝑛−1 1,96

𝑛 − 1=(6,02 × 1,96)2 ⇒ n= 1+ (6,02 × 1,96)2 ⇒ n= 140,22


On effectue alors 140 observation pour obtenir une marge d’erreur de 1.
Sara GOTTI SEG S3, 2021-2022 121
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une proportion

• Soit une population ayant des individus possédant une certaine


caractéristique A. On veut estimer à partir d'un échantillon de
taille n la proportion p d'individus possédant cette
caractéristique A.
• Si n est grand (n≥30) ou si la fréquence observée f telle que
nf ≥5 ou n(1−f ) ≥5, alors F la V.A. associée à la proportion
des individus possédant la caractéristique A suit une loi
normale de paramètres:
𝑝𝑞 F-p
alors F↝𝑁(p; ) ; On pose Z = 𝑝𝑞 suit 𝑁(0, 1)
𝑛
𝑛
Sara GOTTI SEG S3, 2021-2022 122
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une proportion

On se fixe le niveau de confiance 𝛽 (ou le risque 𝜑). On peut


écrire donc que:
β+1
P(−𝑡β ≤ 𝑍 ≤ 𝑡β ) = β ⇒ 2×P(Z≤ 𝑡β )−1= β ⇒ P(Z≤ 𝑡β ) =
2
⇒ on cherche dans la table de la loi normale centrée et réduite la
β+1
valeur de 𝑡β par lecture inverse de .
2

Sara GOTTI SEG S3, 2021-2022 123


Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une proportion
P(−𝑡β ≤ 𝑍 ≤ 𝑡β )= β
F−p
=P(−𝑡β ≤ 𝑝𝑞 ≤ 𝑡β )= β
𝑛

𝑝𝑞 𝑝𝑞
=P(−𝑡β ≤ F−p ≤ 𝑡β )= β
𝑛 𝑛

𝑝𝑞 𝑝𝑞
=P(−𝑡β − 𝐹 ≤ −p ≤ 𝑡β − 𝐹)= β
𝑛 𝑛

𝑝𝑞 𝑝𝑞
=P(𝐹 − 𝑡β ≤ p ≤ 𝐹 + 𝑡β )= β
𝑛 𝑛

𝑓 est l'estimateur ponctuel de 𝑝. Alors F=𝑓. On remplace dans la formule:


𝑝𝑞 𝑝𝑞
P(𝑓 − 𝑡β ≤ p ≤ 𝑓 + 𝑡β )= β
𝑛 𝑛
Sara GOTTI SEG S3, 2021-2022 124
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une proportion
𝑝𝑞
L’écart-type est inconnu, alors je le remplace par son estimateur
𝑛
ponctuel
𝒏
𝑆𝑐 = 𝑺 avec S est l’écart-type dans l’échantillon
𝒏−𝟏

𝑓(1−𝑓)
Alors S=
𝑛
𝑓(1−𝑓) 𝒏 𝑓(1−𝑓)
d’où 𝑆𝑐 = = on remplace dans la formule de
𝑛 𝒏−𝟏 𝑛−1
probabilité:
𝑓(1−𝑓) 𝑓(1−𝑓)
Alors P(𝑓 − 𝑡β ≤ p ≤ 𝑓 + 𝑡β )= β
𝑛−1 𝑛−1
Sara GOTTI SEG S3, 2021-2022 125
Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une proportion

• l'intervalle de confiance de la proportion 𝑝 au niveau 𝛽 est


donné par:
𝑓(1 − 𝑓) 𝑓(1 − 𝑓)
𝐼𝛽 = [𝑓 − 𝑡β ; 𝑓 + 𝑡β ]
𝑛−1 𝑛−1
𝑓(1−𝑓)
Avec la marge d’erreur 𝜀 = 𝑡β
𝑛−1

Sara GOTTI SEG S3, 2021-2022 126


Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une proportion

• Exemple:
Dans une production, on veut évaluer la proportion 𝑝 d’articles
de qualité A. On prélève un échantillon de taille n=50 avec
lequel on trouve f=28% la proportion des articles de qualité A.
on veut estimer la valeur de 𝑝 par intervalle de confiance de
95%.

Sara GOTTI SEG S3, 2021-2022 127


Chapitre 4: Estimation
Estimation par intervalle de confiance
Estimation par intervalle de confiance d’une proportion

• Exemple: (suite)
l'intervalle de confiance de la proportion 𝑝 de niveau 95% est:
𝑓(1 − 𝑓) 𝑓(1 − 𝑓)
𝐼0,95 = [𝑓 − 𝑡0,95 ; 𝑓 + 𝑡0,95 ]
𝑛−1 𝑛−1
Avec 𝑡0,95 = 1,96 , on remplace par les valeurs:
0,28×0,72 0,28×0,72
𝐼0,95 = 0,28 − 1,96 ; 0,28 + 1,96
49 49
𝐼0,95 = [0,15; 0,41]
Sara GOTTI SEG S3, 2021-2022 128
CHAPITRE 5
Tests statistiques
✓Introduction
✓Principe d’un test de conformité
✓Mécanisme des tests d’hypothèses
✓Hypothèses statistiques
✓Test et région d'acceptation
✓Méthodologie (générale) pour effectuer un test
✓Test de conformité sur une moyenne
✓Test de conformité sur une proportion

Sara GOTTI SEG S3, 2021-2022 129


Chapitre 5: Tests statistiques
Introduction
• Un test statistique est une méthode permettant de prendre une décision à
partir d'informations fournies par un échantillon.
• Les tests statistiques ou les tests d'hypothèses ont pour but de vérifier, à
partir de données observées dans un ou plusieurs échantillons, la validité
de certaines hypothèses relatives à une ou plusieurs populations.
• Les tests de conformité sont destinés à comparer entre une population
théorique et un échantillon observé. Ils servent à vérifier si un
échantillon donné peut être considéré comme extrait d'une population
possédant telle caractéristique particulière (telle moyenne, telle
proportion, ...).
• Le test se fait en vérifiant si la différence entre la valeur observée et la
valeur théorique du paramètre considéré peut être attribuée au hasard ou
non.
Sara GOTTI SEG S3, 2021-2022 130
Chapitre 5: Tests statistiques
Principe d’un test de conformité

• Pour commencer, on émet une certaine hypothèse à tester, appelée


hypothèse nulle, généralement désignée par H0 . Celle-ci suppose
toujours l'égalité des caractéristiques comparées.
• L'hypothèse qui diffère de H0 est dite hypothèse alternative,
généralement désignée par H1 .
• On mesure ensuite l'écart observé entre les caractéristiques comparées, et
on calcule la probabilité d'observer, si l'hypothèse nulle est vraie, un
écart aussi important.
• L'ensemble des valeurs observées pour lesquelles l'hypothèse nulle est
admissible forme la région d'acceptation. Les autres valeurs constituent
la région de rejet. Les valeurs limites sont appelées valeurs critiques.

Sara GOTTI SEG S3, 2021-2022 131


Chapitre 5: Tests statistiques

Principe d’un test de conformité

• Le jugement d’une hypothèse se fait sur un ou plusieurs


échantillons.
• Ne pas oublier que la conclusion d’un test n’est pas certaine,
elle est associée à un risque d’erreur (faible).
• Ainsi qu'elle que soit la décision prise, le hasard de
l'échantillonnage peut fausser les conclusions.

Sara GOTTI SEG S3, 2021-2022 132


Chapitre 5: Tests statistiques

Principe d’un test de conformité

• Exemple :
Une entreprise utilise une machine qui met du café dans les
sachets. La machine a été réglée sur une norme qui est égale à
250g, c-à-d la machine est censée mettre 250g du café en norme
dans les sachets. Mais, on se demande si la machine a mis par
erreur 249g ou 250g dans les sachets. On sait que la machine
fournie une légères variation.

Sara GOTTI SEG S3, 2021-2022 133


Chapitre 5: Tests statistiques

Principe d’un test de conformité

• Exemple :
Les problèmes rencontrés sont les suivants:
1. Si un sachet pris au hasard dans le lot pèse exactement 250g,
est-on sûr que le lot est bon ?
2. Si il fait exactement 258g, est-on sûr que le lot est mauvais ?
3. Est-ce la même chose si, sur 10 sachets pris au hasard, on a
un poids moyen de 258g?
4. A partir de quelle valeur du poids moyen peut on dire que le
lot est mauvais ?
Sara GOTTI SEG S3, 2021-2022 134
Chapitre 5: Tests statistiques
Mécanisme des tests d’hypothèses

• Le principe général du test statistique peut s'énoncer comme suit :


1. Formuler les hypothèses (H0 ) et (H1 ) : Soit un caractère d'une
population dont la valeur du paramètre (moyenne, proportion, etc.) est
inconnue. Une hypothèse nulle est alors formulée sur ce paramètre
inconnu, elle résulte de considérations théoriques, pratiques ou encore
plus simplement basée sur un pressentiment.
2. Choisir le risque ou le niveau de confiance : Pour effectuer le test
statistique, il faudra choisir un certain risque d'erreur qui est la
probabilité de se tromper en prenant la décision retenue.
3. Il faut définir la statistique qui convient pour effectuer le test appelée
« variable de décision ».

Sara GOTTI SEG S3, 2021-2022 135


Chapitre 5: Tests statistiques

Mécanisme des tests d’hypothèses

4. Déterminer la région d’acceptation qui est l'ensemble des valeurs


prises par la variable de décision qui conduiront à accepter (H0 )
5. On calcule la réalisation de la variable de décision à partir des valeurs
observées (d’un échantillon).
6. Conclusion finale.

Sara GOTTI SEG S3, 2021-2022 136


Chapitre 5: Tests statistiques

Hypothèses statistiques

• Hypothèse nulle H0 : hypothèse selon laquelle on fixe a priori un


paramètre de la population à une valeur particulière.
• Hypothèse alternative H1 (ou contre-hypothèse) : n'importe quelle autre
hypothèse qui diffère de l'hypothèse nulle H0 .
• La formulation des hypothèses peut être écrite comme:
𝜃 = 𝜃0 (𝐻0 ) 𝜃 = 𝜃0 (𝐻0 ) 𝜃 = 𝜃0 (𝐻0 )
𝜃 ≠ 𝜃0 (𝐻1 ) 𝜃 > 𝜃0 (𝐻1 ) 𝜃 < 𝜃0 (𝐻1 )
• La détermination des valeurs limites de la région d’acceptation de
l’hypothèse nulle dépend de l’hypothèse alternative H1 , ainsi on
distingue le test bilatéral et le test unilatéral.
Sara GOTTI SEG S3, 2021-2022 137
Chapitre 5: Tests statistiques
Test et région d'acceptation
Test bilatéral

• Un test est dit bilatéral si la condition de rejet est indépendante


du signe de l’écart observé entre les caractéristiques comparées
𝜃 et 𝜃0 .
• Les hypothèses formulées du test bilatéral sont :
𝜃 = 𝜃0 (𝐻0 )
𝜃 ≠ 𝜃0 𝐻1

Sara GOTTI SEG S3, 2021-2022 138


Chapitre 5: Tests statistiques
Test et région d'acceptation
Test bilatéral

𝜃 < 𝜃0 𝜃 = 𝜃0 𝜃 > 𝜃0
Rejet de 𝐻0 Acceptation de 𝐻0 Rejet de 𝐻0

𝑨𝟏 𝐴2
• Le niveau de risque 𝛼 est appelé aussi seuil de risque ou de signification
du test, fixé très souvent à 5%. La probabilité contraire (𝛽 = 1 − 𝛼)
désigne le niveau de confiance du test.
• 𝐴1 𝑒𝑡 𝐴2 sont les valeurs critiques qui délimitent la région d’acceptation.
• La région d’acceptation est donc [𝐴1 ; 𝐴2 ], avec:
P(𝐴1 < 𝜃0 < 𝐴2 )= 𝛽
𝛼
P(𝜃0 < 𝐴1 ) = P(𝜃0 > 𝐴2 )=
2
Sara GOTTI SEG S3, 2021-2022 139
Chapitre 5: Tests statistiques
Test et région d'acceptation
Test unilatéral

• Un test est dit unilatéral si l'hypothèse alternative désigne


qu'une caractéristique est strictement supérieure ou inférieure à
l'autre. On parle respectivement de test unilatéral à droite ou à
gauche.

Sara GOTTI SEG S3, 2021-2022 140


Chapitre 5: Tests statistiques
Test et région d'acceptation
Test unilatéral
Test unilatéral à droite
• Les hypothèses formulées du test unilatéral à droite sont:
𝜃 = 𝜃0 (𝐻0 )
𝜃 > 𝜃0 𝐻1
• La règle de décision peut être représentée ainsi :
𝜃 ≤ 𝜃0 𝜃 > 𝜃0
Acceptation de 𝐻0 Rejet de 𝐻0
𝑨
• A est la valeur critique qui détermine la région d'acceptation.
• La région d’acceptation est donc l’intervalle: ]−∞; 𝐴]
P(𝜃0 ≤ 𝐴)= 1 − α = 𝛽 𝛼 est le seuil de risque
P(𝜃0 > 𝐴) = α
Sara GOTTI SEG S3, 2021-2022 141
Chapitre 5: Tests statistiques
Test et région d'acceptation
Test unilatéral
Test unilatéral à gauche
• Les hypothèses formulées du test unilatéral à droite sont:
𝜃 = 𝜃0 (𝐻0 )
𝜃 < 𝜃0 𝐻1
• La règle de décision peut être représentée ainsi :
𝜃 < 𝜃0 𝜃 ≥ 𝜃0
Rejet de 𝐻0 Acceptation de 𝐻0
𝑨
• A est la valeur critique qui détermine la région d'acceptation.
• La région d’acceptation est donc l’intervalle: [A;+∞[
P(𝜃0 ≥ 𝐴)= 1 − α = 𝛽 𝛼 est le seuil de risque
P(𝜃0 < 𝐴) = α
Sara GOTTI SEG S3, 2021-2022 142
Chapitre 5: Tests statistiques
Méthodologie (générale) pour effectuer un test
1. Mise en place du test:
• On écrit les deux hypothèses du test : H0 hypothese nulle et H1 hypothèse alternative,
• H0 est du type " 𝜃 = 𝜃0 "
• H1 remet en question H0 en fonction de la question posée.
𝜃 ≠ 𝜃0 bilatéral
H1 est de la forme 𝜃 < 𝜃0 unilatéral à gauche
𝜃 > 𝜃0 unilatéral à droite
2. Détermination de la zone d’acceptation de H0 :
• On formule la statistique du test sous H0 . Une certaine V.A suit une certaine loi en fonction des
conditions du test.
• On détermine au niveau 1 − 𝛼, la région d’acceptation 𝐼𝛼 telle que:
[A;+∞[ si H1 : 𝜃 < 𝜃0
P(𝐼𝛼 ) = 1 − 𝛼 Avec 𝐼𝛼 = [𝐴1 ; 𝐴2 ] si H1 : 𝜃 ≠ 𝜃0
]−∞; 𝐴] si H1 : 𝜃 > 𝜃0
3. Critère de décision:
• Décision du test, en fonction de la valeur numérique expérimentale et la région d’acceptation 𝐼𝛼 .
Sara GOTTI SEG S3, 2021-2022 143
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)

• On suppose que X suit une loi Normale de moyenne 𝜇 et


d’écart-type 𝜎.
• 𝝈 est connu : La variable X étudiée au niveau de la population
suit une loi Normale N(𝜇; 𝜎) avec 𝜎 connu. Ainsi la distribution
de 𝑋ത (des moyennes) au niveau de l'échantillon sera:
𝜎 ത
𝑋−𝜇
𝑋ത ↝𝑁(𝜇; ) et Z = 𝜎 ↝𝑁(0; 1)
𝑛
𝑛

Sara GOTTI SEG S3, 2021-2022 144


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
1. Mise en place du test:
• Les hypothèses du test se présentent sous la forme :
𝐻0 : μ = 𝜇0
𝐻1 : μ ≠ μ0
2. Détermination de la zone d’acceptation:
• On considère comme variable de décision 𝑋. ത
𝜎

• Si 𝐻0 est vraie (μ = 𝜇0 ) alors 𝑋↝𝑁(𝜇0 ; )
𝑛
• La région d'acceptation du test est un intervalle symétrique autour de
μ0 de la forme 𝐼𝛼 = [c1 ; c2 ]; avec
𝜎 𝜎
Sara GOTTI
c1 = 𝜇0 − 𝑡SEG
𝛼 S3, et c2
2021-2022
= 𝜇0 + 𝑡𝛼 145
𝑛 𝑛
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
2. Détermination de la zone d’acceptation:
• Démonstration:
On se fixe le niveau de risque 𝛼 (ou le niveau de confiance 𝛽 = 1 − 𝛼). On peut écrire
donc que:
𝜎 ത 0
𝑋−𝜇

𝑋↝𝑁(𝜇 0; ); On pose Z = 𝜎 suit 𝑁(0, 1)
𝑛
𝑛
β+1 2−𝛼
P(−𝑡𝛼 ≤ 𝑍 ≤ 𝑡𝛼 ) = 1 − 𝛼 = β ⇒ 2×P(Z≤ 𝑡𝛼 )−1= β ⇒ P(Z≤ 𝑡𝛼 ) = =
2 2
⇒ on cherche dans la table de la loi normale centrée et réduite la valeur de 𝑡𝛼 par
β+1 2−𝛼
lecture inverse de = .
2 2

Sara GOTTI SEG S3, 2021-2022 146


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
2. Détermination de la zone d’acceptation:
• Démonstration: (suite)
P(−𝑡𝛼 ≤ 𝑍 ≤ 𝑡𝛼 )= β
ത 0
𝑋−𝜇
=P(−𝑡𝛼 ≤ 𝜎 ≤ 𝑡𝛼 )= β
𝑛
𝜎 𝜎
=P(−𝑡𝛼 ത 0 ≤ 𝑡𝛼
≤ 𝑋−𝜇 )= β
𝑛 𝑛
𝜎 𝜎
=P(−𝑡𝛼 − 𝑋ത ≤ −𝜇0 ≤ 𝑡𝛼 − 𝑋)=ത β
𝑛 𝑛
𝜎 𝜎 𝒄𝟏 𝑨𝒄𝒄𝒆𝒑𝒕𝒂𝒕𝒊𝒐𝒏 𝒄𝟐
=P(𝑋ത − 𝑡𝛼 ≤ 𝜇0 ≤ 𝑋ത + 𝑡𝛼 )= β
𝑛 𝑛

• D’où la région d'acceptation autour de μ0 est 𝐼𝛼 = [c1 ; c2 ]; avec


𝜎 𝜎
c1 = 𝜇 0 − 𝑡𝛼 et c2 = 𝜇0 + 𝑡𝛼
𝑛 𝑛
β+1 2−𝛼
NB: la valeur de 𝑡𝛼 se déduit par lecture inverse
SEG S3, 2021-2022 de = 147
2 2
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
3. Critère de décision:
• On calcule la réalisation de la variable de décision (തx) à partir des
valeurs observées (d’un échantillon).
• Si xത , la valeur de la moyenne sur l'échantillon, appartient à la zone
d'acceptation (തx ∈ 𝐼𝛼 = [c1 ; c2 ]) alors on accepte (H0 ), sinon, on rejette
H0 .

Sara GOTTI SEG S3, 2021-2022 148


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
• Exemple:
• Une entreprise A utilise une machine qui met du café dans les sachets. La
machine a été réglée sur une norme (𝜇0 ) qui est égale à 250g, c-à-d la
machine est censée mettre 250g du café en norme dans les sachets. On
suppose que les poids des sachets sont distribués selon une loi Normale
de moyenne 𝜇 et d'écart-type 𝜎 = 20g.
• Le contrôleur a prélevé un échantillon de taille n=20, l’échantillon a
donné un poids moyen 𝑥1 = 249,5𝑔.
• Apres un mois, le contrôleur a prélevé un 2ème échantillon avec un poids
moyen 𝑥2 = 259,3𝑔.
• Peut on considérer, à un niveau de risque de 5%, que la machine
Sara GOTTIfonctionne correctement? SEG S3, 2021-2022 149
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
• Exemple: (suite)
1. Mise en place du test:
Les hypothèses du test : 𝐻0 : μ = 𝜇0 = 250
𝐻1 : μ ≠ 250
2. Détermination de la zone d’acceptation:
𝜎 𝜎
𝐼0,05 = [𝜇0 − 𝑡0,05 ;𝜇0 + 𝑡0,05 ]
𝑛 𝑛
avec 𝜇0 = 250 ; 𝜎 = 20 ; 𝑛 = 20 ;
2−0,05
𝑡0,05 = lecture inverse de = 0,957 d’où 𝑡0,05 = 1,96
2

Sara GOTTI SEG S3, 2021-2022 150


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
• Exemple: (suite)
𝜎 𝜎
Alors 𝐼0,05 = [𝜇0 − 𝑡0,05 ;𝜇0 + 𝑡0,05 ]=[241,23;258,77]
𝑛 𝑛
3. Critère de décision:
• Pour le 1er échantillon on a 𝑥1 = 249,5 et 𝑥1 ∈ 𝐼0,05 alors on accepte 𝐻0 .
On peut dire que la machine fonctionne correctement.
• Tandis qu’après un mois avec le 2ème échantillon 𝑥2 = 259,3 et
𝑥2 ∉ 𝐼0,05 alors on rejette 𝐻0 .
On dit alors qu’il y a un problème avec la machine qu’il faut régler.

Sara GOTTI SEG S3, 2021-2022 151


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
b. Test unilatéral à droite
1. Mise en place du test:
• Les hypothèses du test se présentent sous la forme :
𝐻0 : μ = 𝜇0
𝐻1 : μ > μ0
2. Détermination de la zone d’acceptation:
• On considère comme variable de décision 𝑋. ത
𝜎

• Si 𝐻0 est vraie (μ = 𝜇0 ) alors 𝑋↝𝑁(𝜇0 ; )
𝑛
• La région d'acceptation du test est un intervalle de la forme
𝜎
𝐼𝛼 = ]−∞; 𝐴]; avec 𝐴 = 𝜇0 + 𝑧𝛼
𝑛
Sara GOTTI SEG S3, 2021-2022 152
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
b. Test unilatéral à droite
2. Détermination de la zone d’acceptation:
• Démonstration:
On se fixe le niveau de risque 𝛼 (ou le niveau de confiance 𝛽 = 1 − 𝛼).
On peut écrire donc que:
𝜎 ത 0
𝑋−𝜇

𝑋↝𝑁(𝜇 0; ); On pose Z = 𝜎 suit 𝑁(0, 1)
𝑛
𝑛

⇒ P(Z≤ 𝑧𝛼 ) =1−𝛼
⇒ on cherche dans la table de la loi normale centrée et réduite la valeur de
𝑧𝛼 par lecture inverse de 1−𝛼.

Sara GOTTI SEG S3, 2021-2022 153


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
b. Test unilatéral à droite
2. Détermination de la zone d’acceptation:
• Démonstration: (suite)
P(𝑋ത ≤ 𝐴)=1 − 𝛼
ത 0
𝑋−𝜇 𝐴−𝜇0
=P( 𝜎 ≤ 𝜎 )=1 − 𝛼
𝑛 𝑛
𝐴−𝜇0
=P(𝑍 ≤ 𝜎 )=1 − 𝛼
𝑛
A
𝐴−𝜇0
⇒ 𝜎 = 𝑧𝛼 (la valeur de 𝑧𝛼 par lecture inverse de 1−𝛼.)
𝑛
𝜎
⇒ 𝐴 = 𝜇0 + 𝑧𝛼
𝑛
𝜎
D’où la région d'acceptation de test est 𝐼𝛼 = ]−∞; 𝐴]; avec 𝐴 = 𝜇0 + 𝑧𝛼
𝑛
Sara GOTTI SEG S3, 2021-2022 154
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
b. Test unilatéral à droite

3. Critère de décision:
• On calcule la réalisation de la variable de décision (തx) à partir des
valeurs observées (d’un échantillon).
• Si xത , la valeur de la moyenne sur l'échantillon, appartient à la zone
d'acceptation (തx ∈ 𝐼𝛼 = ]−∞; 𝐴]) alors on accepte (H0 ), sinon, on rejette
H0 .

Sara GOTTI SEG S3, 2021-2022 155


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
b. Test unilatéral à droite
• Exemple:
• Un fournisseur reçoit les sachets du café de l’entreprise A. ce fournisseur
va considérer la livraison comme normale que si le poids moyen est
inferieur à 250g. On suppose que les poids des sachets sont distribués
selon une loi Normale de moyenne 𝜇 et d'écart-type 𝜎 = 20g.
• Le contrôleur a prélevé un échantillon de taille n=20, l’échantillon a
donné un poids moyen 𝑥1 = 248,2𝑔.
• Apres un mois, le contrôleur a prélevé un 2ème échantillon avec un poids
moyen 𝑥2 = 260,2𝑔.
• Peut on considérer, à un niveau de risque de 1,5%, que la livraison a bien
Sara GOTTI
respecter la norme? SEG S3, 2021-2022 156
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
b. Test unilatéral à droite
Exemple: (suite)
1. Mise en place du test:
Les hypothèses du test : 𝐻0 : μ = 𝜇0 = 250
𝐻1 : μ > 250
2. Détermination de la zone d’acceptation:
𝜎
𝐼0,015 = ]−∞ ; 𝜇0 + 𝑧0,015 𝑛
]
avec 𝜇0 = 250 ; 𝜎 = 20 ; 𝑛 = 20 ;
𝑧0,015 = lecture inverse de (1 − 0,015 = 0,985) d’où 𝑧0,015 =2,27
Alors la région d’acceptation 𝐼0,015 = ]−∞ ; 260,15]
Sara GOTTI SEG S3, 2021-2022 157
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
b. Test unilatéral à droite

Exemple: (suite)
3. Critère de décision:
• Pour le 1er échantillon on a 𝑥1 = 248,2 et 𝑥1 ∈ 𝐼0,015 =]−∞;260,15]
alors on accepte 𝐻0 .
On peut dire que la livraison a bien respecter la norme.
• Tandis qu’après un mois avec le 2ème échantillon 𝑥2 = 260,2 et
𝑥2 ∉ 𝐼0,015 alors on rejette 𝐻0 .
On dit alors que la livraison n’a pas respecter la norme.

Sara GOTTI SEG S3, 2021-2022 158


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
c. Test unilatéral à gauche
1. Mise en place du test:
• Les hypothèses du test se présentent sous la forme :
𝐻0 : μ = 𝜇0
𝐻1 : μ < μ0
2. Détermination de la zone d’acceptation:
• On considère comme variable de décision 𝑋. ത
𝜎

• Si 𝐻0 est vraie (μ = 𝜇0 ) alors 𝑋↝𝑁(𝜇0 ; )
𝑛
• La région d'acceptation du test est un intervalle de la forme
𝜎
𝐼𝛼 = [ 𝐴; +∞[; avec 𝐴 = 𝜇0 − 𝑧𝛼
𝑛
Sara GOTTI SEG S3, 2021-2022 159
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
c. Test unilatéral à gauche
2. Détermination de la zone d’acceptation:
• Démonstration:
On se fixe le niveau de risque 𝛼 (ou le niveau de confiance 𝛽 = 1 − 𝛼).
On peut écrire donc que:
𝜎 ത 0
𝑋−𝜇

𝑋↝𝑁(𝜇 0; ); On pose Z = 𝜎 suit 𝑁(0, 1)
𝑛
𝑛
P(𝑋ത ≥ 𝐴)=1 − 𝛼
𝐴−𝜇0
=P(𝑍 ≥ 𝜎 )=1 − 𝛼
𝑛
𝐴−𝜇0
=1−P(𝑍 ≤ 𝜎 )=1 − 𝛼
𝑛
𝐴−𝜇0
=P(𝑍 ≤
Sara GOTTI 𝜎 )=𝛼 SEG S3, 2021-2022 160
𝑛
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
c. Test unilatéral à gauche
2. Détermination de la zone d’acceptation:
• Démonstration: (suite)
𝐴−𝜇0
P(𝑍 ≤ 𝜎 ) = 𝛼(sachant que 𝛼<0,5)
𝑛
𝐴−𝜇0
=1−P(𝑍 ≤ − 𝜎 )=𝛼
𝑛
𝜇0 −𝐴
=P(𝑍 ≤ 𝜎 )=1 − 𝛼
𝑛
A
𝜇0 −𝐴
⇒ 𝜎 = 𝑧𝛼 (la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼.)
𝑛
𝜎
⇒ 𝐴 = 𝜇0 − 𝑧𝛼
𝑛
𝜎
D’où la région d'acceptation de test est 𝐼𝛼 2021-2022
= [𝐴; +∞[; avec 𝐴 = 𝜇0 − 𝑧𝛼
Sara GOTTI SEG S3, 𝑛 161
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
c. Test unilatéral à gauche

3. Critère de décision:
• On calcule la réalisation de la variable de décision (തx) à partir des
valeurs observées (d’un échantillon).
• Si xത , la valeur de la moyenne sur l'échantillon, appartient à la zone
d'acceptation (തx ∈ 𝐼𝛼 = [𝐴; +∞[) alors on accepte (H0 ), sinon, on rejette
H0 .

Sara GOTTI SEG S3, 2021-2022 162


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
c. Test unilatéral à gauche
• Exemple:
• Un client reçoit les sachets du café de l’entreprise A. Ce client va
considérer la livraison comme normale que si le poids moyen n’est pas
inferieur à 250g. On suppose que les poids des sachets sont distribués
selon une loi Normale de moyenne 𝜇 et d'écart-type 𝜎 = 20g.
• Le contrôleur a prélevé un échantillon de taille n=20, l’échantillon a
donné un poids moyen 𝑥1 = 240,2𝑔.
• Peut on considérer, à un niveau de risque de 1,5%, que la livraison a bien
respecter la norme?

Sara GOTTI SEG S3, 2021-2022 163


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
c. Test unilatéral à gauche
Exemple: (suite)
1. Mise en place du test:
Les hypothèses du test : 𝐻0 : μ = 𝜇0 = 250
𝐻1 : μ < 250
2. Détermination de la zone d’acceptation:
𝜎
𝐼0,015 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛
avec 𝜇0 = 250 ; 𝜎 = 20 ; 𝑛 = 20 ;
𝑧0,015 = lecture inverse de (1 − 0,015 = 0,985) d’où 𝑧0,015 =2,27
Alors la région d’acceptation 𝐼0,015 = [239,85; +∞[
Sara GOTTI SEG S3, 2021-2022 164
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
c. Test unilatéral à gauche
Exemple: (suite)
3. Critère de décision:
• On a 𝑥1 = 240,2 et 𝑥1 ∈ 𝐼0,015 =[239,85; +∞[ alors on accepte 𝐻0 .
On peut dire que la livraison a bien respecter la norme.

Sara GOTTI SEG S3, 2021-2022 165


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)

• 𝝈 est inconnu : La variable X étudiée au niveau de la population suit


une loi Normale N(𝜇; 𝜎) avec 𝜎 inconnu.
• La démarche est la même que pour les tests précédents mais l’écart-type
de la population n'étant pas connue, il est estimé par l’écart-type corrigé
𝒏
𝑆𝑐 = 𝑺 × .
𝒏−𝟏

• Rappelons que la distribution de 𝑋ത (des moyennes) au niveau de


𝑆𝑐 S ത
𝑋−𝜇
l'échantillon sera :𝑋ത ↝ 𝑁(𝜇; )=𝑁(𝜇; ) et Z = S ↝𝑁(0; 1)
𝑛 𝑛−1
𝑛−1

Sara GOTTI SEG S3, 2021-2022 166


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
1. Mise en place du test:
• Les hypothèses du test se présentent sous la forme :
𝐻0 : μ = 𝜇0
𝐻1 : μ ≠ μ0
2. Détermination de la zone d’acceptation:
S S
𝐼𝛼 = [𝜇0 − 𝑡𝛼 ; 𝜇0 + 𝑡𝛼 ]
𝑛−1 𝑛−1
β+1 2−𝛼
NB: la valeur de 𝑡𝛼 se déduit par lecture inverse de =
2 2
3. Critère de décision:
• Si xത la valeur de la moyenne sur l'échantillon, appartient à la zone d'acceptation
(തx ∈ 𝐼𝛼 ) alors on accepte (H0 ), sinon, on rejette H0 .
Sara GOTTI SEG S3, 2021-2022 167
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
b. Test unilatéral à droite
1. Mise en place du test:
• Les hypothèses du test se présentent sous la forme :
𝐻0 : μ = 𝜇0
𝐻1 : μ > μ0
2. Détermination de la zone d’acceptation:
S
𝐼𝛼 = ]−∞; 𝜇0 + 𝑧𝛼 ]
𝑛−1
NB: la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
3. Critère de décision:
• Si xത la valeur de la moyenne sur l'échantillon, appartient à la zone
x ∈ 𝐼𝛼 ) alors onSEGaccepte
Sara GOTTId'acceptation (ത (H0 ), sinon, on rejette H0 .
S3, 2021-2022 168
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
c. Test unilatéral à gauche
1. Mise en place du test:
• Les hypothèses du test se présentent sous la forme :
𝐻0 : μ = 𝜇0
𝐻1 : μ < μ0
2. Détermination de la zone d’acceptation:
S
𝐼𝛼 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛−1
NB: la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
3. Critère de décision:
• Si xത la valeur de la moyenne sur l'échantillon, appartient à la zone
x ∈ 𝐼𝛼 ) alors onSEGaccepte
Sara GOTTId'acceptation (ത (H0 ), sinon, on rejette H0 .
S3, 2021-2022 169
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• Exemple:
Dans une étude réalisée l'an dernier, on a observé que la
consommation en électricité des habitants d'une résidence
composée d'appartements de trois pièces est en moyenne de
215dh. Cette année, sur un échantillon de 29 appartements, les
consommation en électricité (𝑋1 , 𝑋2 , … , 𝑋25 ) vérifient:
σ25 𝑋 2
σ25
𝑖=1 𝑋𝑖 = 6400 et
𝑖=1 𝑖
= 49007
29
Supposons que l'échantillon suit une loi N(𝜇; 𝜎).
À un niveau de risque de 2,5%, peut on dire que la
consommation
Sara GOTTI
moyenne est inférieure
SEG S3, 2021-2022
à 215 dh ? 170
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
Exemple: (suite)
1. Mise en place du test:
Les hypothèses du test : 𝐻0 : μ = 𝜇0 = 215
𝐻1 : μ < 215
2. Détermination de la zone d’acceptation:
S
𝐼0,025 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛−1
6400
avec𝜇0 = 215; 𝑋ത = 29 = 220, 69 ; 𝑆 = 49007 − 220,692 = 17,41 ; 𝑛 = 29 ;
𝑧0,025 = lecture inverse de 1 − 0,025 = 0,975 d’où 𝑧0,025 =1,96
Alors la région d’acceptation 𝐼0,025 = [208,55; +∞[
Sara GOTTI SEG S3, 2021-2022 171
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
Exemple: (suite)
Alors la région d’acceptation 𝐼0,025 = [208,55; +∞[
3. Critère de décision:
On a xത = 220, 69 et xത ∈ 𝐼0,025 =[208,55; +∞[ alors on accepte 𝐻0 .
On peut dire que la consommation moyenne n’est pas inférieure à 215 dh.

Sara GOTTI SEG S3, 2021-2022 172


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
2. (n≥30) et X de loi quelconque

• Si la taille de l'échantillon est grande (en pratique n≥30), on


distingue deux cas :
❑𝜎 est connu : les résultats du paragraphe précèdent restent
valables.
❑𝜎 est inconnu : on l'estime par 𝑆𝑐 .

Sara GOTTI SEG S3, 2021-2022 173


Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
2. (n≥30) et X de loi quelconque

• 𝝈 est connu :
σ σ
❑Test bilatéral : 𝐼𝛼 = [𝜇0 − 𝑡𝛼 ; 𝜇0 + 𝑡𝛼 ]
𝑛 𝑛
β+1 2−𝛼
la valeur de 𝑡𝛼 se déduit par lecture inverse de =
2 2
σ
❑Test unilatéral à droite : 𝐼𝛼 = ]−∞; 𝜇0 + 𝑧𝛼 ]
𝑛
la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
σ
❑Test unilatéral à gauche : 𝐼𝛼 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛
la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
Sara GOTTI SEG S3, 2021-2022 174
Chapitre 5: Tests statistiques
Test de conformité sur une moyenne
2. (n≥30) et X de loi quelconque

• 𝝈 est inconnu :
𝑆 𝑆
❑Test bilatéral : 𝐼𝛼 = [𝜇0 − 𝑡𝛼 ; 𝜇0 + 𝑡𝛼 ]
𝑛−1 𝑛−1
β+1 2−𝛼
la valeur de 𝑡𝛼 se déduit par lecture inverse de =
2 2
𝑆
❑Test unilatéral à droite : 𝐼𝛼 = ]−∞; 𝜇0 + 𝑧𝛼 ]
𝑛−1
la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
𝑆
❑Test unilatéral à gauche : 𝐼𝛼 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛−1
la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
Sara GOTTI SEG S3, 2021-2022 175
Chapitre 5: Tests statistiques

Test de conformité sur une proportion

• Soit p la proportion de la population possédant le caractère


considéré. On veut effectuer un test:
H0 : p = p 0
H1 : p > p 0 ; p ≠ p 0 ; p < p 0
• On prend comme variable de décision F.
p0(1−p0)
Si p = p0 , alors la loi de F est normale N(p0 ; )
𝑛
Si et seulement si n≥ 30; np0 ≥ 5; et n(1−p0 )≥ 5

Sara GOTTI SEG S3, 2021-2022 176


Chapitre 5: Tests statistiques
Test de conformité sur une proportion
Test bilatéral
• Mise en place du test:
H0 : p = p 0
H1 : p ≠ p 0
• L′intervalle d′acceptation pour F au risque 𝛼 est:
p0(1−p0) p0(1−p0)
𝐼𝛼 = [𝑝0 − 𝑡𝛼 ; 𝑝0 + 𝑡𝛼 ]
𝑛 𝑛
β+1 2−𝛼
la valeur de 𝑡𝛼 se déduit par lecture inverse de =
2 2
• Critère de décision:
Si la fréquence f sur l'échantillon appartient à 𝐼𝛼 , on accepte (H0 ). Sinon,
on rejette (H0 ).
Sara GOTTI SEG S3, 2021-2022 177
Chapitre 5: Tests statistiques
Test de conformité sur une proportion
Test Unilatéral à droite
• Mise en place du test:
H0 : p = p 0
H1 : p > p 0
• L′intervalle d′acceptation pour F au risque 𝛼 est:
p0(1−p0)
𝐼𝛼 = [0; 𝑝0 + 𝑧𝛼 ]
𝑛
la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
• Critère de décision:
Si la fréquence f sur l'échantillon appartient à 𝐼𝛼 , on accepte (H0 ). Sinon,
on rejette (H0 ).
Sara GOTTI SEG S3, 2021-2022 178
Chapitre 5: Tests statistiques
Test de conformité sur une proportion
Test Unilatéral à gauche
• Mise en place du test:
H0 : p = p 0
H1 : p < p 0
• L′intervalle d′acceptation pour F au risque 𝛼 est:
p0(1−p0)
𝐼𝛼 = [𝑝0 − 𝑧𝛼 ;1]
𝑛
la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
• Critère de décision:
Si la fréquence f sur l'échantillon appartient à 𝐼𝛼 , on accepte (H0 ). Sinon,
on rejette (H0 ).
Sara GOTTI SEG S3, 2021-2022 179

Vous aimerez peut-être aussi