Cours Échantillonnage Et Estimation

Module: Echantillonnage et
Estimation
Professeur: Sara GOTTI
s.gotti@uca.ma
Filière Economie et Gestion (Semestre 3)

Faculté des sciences juridiques économiques et
sociales kelaa des Sraghna
2021-2022
PLAN DU COURS
1. Chapitre 1: Rappels sur les concepts statistiques

2. Chapitre 2: Lois de probabilité
3. Chapitre 3: Théorie d’échantillonnage
4. Chapitre 4: Estimation
5. Chapitre 5: Tests d’hypothèses
Sara GOTTI SEG S3, 2021-2022 2

CHAPITRE 1
Rappels sur les concepts statistiques
✓Définitions

Chapitre 1: Rappels sur les concepts statistiques
Définitions
• Variable aléatoire: c’est une variable X associée à une expérience

aléatoire dans le but de caractériser le résultat de cette expérience. On
distingue les variables aléatoires discrètes et les variables aléatoires
continues.
• Variable aléatoire discrète: c’est une variable qui prend un nombre
fini ou dénombrable de valeurs.
o la loi de la variable aléatoire X est la loi de probabilité sur l'ensemble des
valeurs possibles de X qui calcule la probabilité P(X=xk ) pour chaque valeur
xk .
o Le total des probabilités est égal à 1.

Définitions
• Variable aléatoire continue: c’est une variable dont le résultat d'une

expérience aléatoire n’est pas un entier et n'appartient pas à un
ensemble fini, c’est un nombre réel défini sur ℝ sur un intervalle de ℝ.
o Pour une variable aléatoire continue, on calcule la probabilité d'observer une
valeur comprise dans un intervalle donné.
o la probabilité d’appartenance à un intervalle se calcule à l’aide de l’aire de la
fonctions densité sur cet intervalle.
• Esperance mathématique: c’est la valeur moyenne d’une variable.
o Dans le cas d’une variable aléatoire discrète: 𝐸(𝑋)=∑𝑝𝑖 𝑥𝑖
o Dans le cas d’une variable aléatoire X qui suit une loi uniforme sur [a, b]:
E(X) = (𝑎+𝑏)/2

Définitions
• Lorsqu’il s’agit d’une variable statistique, sa valeur moyenne est la

moyenne arithmétique.
• Moyenne arithmétique: La moyenne arithmétique (noté 𝑥ҧ ) ou
moyenne empirique d'une série statistique est la moyenne ordinaire,
elle est définie par la somme des valeurs 𝑥𝑖 divisée par l’effectif total.
σ𝑛
𝑖=1 𝑛𝑖 ×𝑥𝑖
Elle est égale à: 𝑥ҧ =
𝑁
• Fréquence: C’est le nombre ou l’effectif d’individus possédant un
caractère spécial divisé par l’effectif total de la population. On le note
𝑛𝑖
𝑓𝑖 . Elle est égale à: 𝑓𝑖 = σ
𝑛𝑖

Définitions
• Écart-type: L'écart-type mesure la dispersion autour de la moyenne. Il

est noté σ ou s et correspond à la racine carrée de la variance, comme
dans la formule :
𝜎 = 𝑉𝑥
σ𝒏
𝒊=𝟏 𝒏𝒊 ×𝒙𝑖
𝟐
Avec 𝑉𝑥 = σ𝒏
ഥ2
−𝒙
𝒊=𝟏 𝒏𝒊

CHAPITRE 2
Lois de probabilité
• Lois de probabilité discrètes
✓Loi de Bernoulli
✓Loi Binomiale
• Lois de probabilité continues
✓Loi Normale
✓La loi normale centrée réduite
✓Approximation de la loi binomiale par la loi normale

Chapitre 2: Lois de probabilités
Lois de probabilité discrètes

Loi de Bernoulli
• Une variable aléatoire X qui suit une loi de Bernoulli se caractérise par
une expérience aléatoire comportant deux issues (ou résultats)
possibles: succès ou échec.
• On définit alors la variable aléatoire X comme étant le nombre de
points obtenus; 1 en cas de succès, 0 en cas d’échec => X(Ω)={0, 1}
• La fonction de probabilité de la variable X est de la forme:
1 avec probabilité 𝒑
𝑋=ቊ
0 avec probabilité 𝟏−𝒑
• où p est la probabilité de succès et 1-p est la probabilité d’échec.
• On note 𝑋↝ℬ(𝑝)


Loi de Bernoulli
• L'Esperance mathématique de la loi de Bernoulli est le paramètre p de
la loi:
𝐸(𝑋)= σ2𝑖=1 𝑥𝑖 𝑝𝑖 = (0×𝑃(𝑋=0))+(1×𝑃(𝑋=1))=𝑝
• La variance de la loi de Bernoulli est:
𝑽 𝑿 = σ𝟐𝒊=𝟏 𝑿𝟐𝒊 𝑷𝒊 − 𝒑 𝟐 = 𝟎 + 𝟏. 𝐩 − 𝒑𝟐
𝑽 𝑿 = 𝒑 𝟏−𝒑
• L’écart-type 𝜎 (𝑋 ):
𝜎 (𝑋 )= 𝑉(𝑥)


Loi de Bernoulli
Exemple
• On lance une pièce de monnaie et on s’intéresse au résultat pile.
• Si on obtient pile on réussit
• Si on obtient face on échoue
• La variable aléatoire X associé au résultat obtenu suit une loi de Bernoulli
de paramètre 0,5 (la probabilité en cas de succès).
𝑋↝ℬ(0,5)
E(X)=p=0,5
V(X)=p(1-p)=0,5×0,5=0,25
𝜎 (𝑋 )= V(X)= 0,25=0,5

Loi Binomiale
• Si on répète un schéma de Bernoulli n fois c-à-d on répète une
expérience aléatoire à deux issues, on parle d’une loi binomiale; à
condition que les répétitions soient indépendantes.
• Autrement dit, la loi binomiale correspond au comptage des succès en
s’arrêtant à un nombre de répétitions fixé à l’avance.
• La loi binomiale dépend de deux paramètres n et p, et dont les valeurs
possibles sont: 𝑋(Ω)= {0, 1, 2, …, 𝑛}; n est le nombre de répétitions et
p est la probabilité en cas de succès.
• On note 𝑋↝ℬ(n, 𝑝)

Loi Binomiale
• Une variable aléatoire X suit une loi binomiale de paramètres n et p si sa
fonction de probabilité est de la forme :
𝑥 𝑥 𝑛−𝑥 𝑛!
𝑃(𝑋=𝑥) = 𝐶𝑛 𝑝 (1 − 𝑝) = 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝑥! 𝑛−𝑥 !
Avec 𝑥 ∈{0,1,2,3,…𝑛} et 𝑝 : 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡é 𝑑𝑒 𝑠𝑢𝑐𝑐è𝑠,
• L'Esperance mathématique de𝑛 la loi Binomiale
𝑛
est égal à:
𝐸 𝑋 = ෍ 𝐸 𝑋𝑖 = ෍ 𝑝 = 𝑛𝑝
𝑖=1 𝑖=1
• La variance de la loi de Binomiale est égal à:
𝑉 𝑋 = σ𝑛𝑖=1 𝑉 𝑋𝑖 = σ𝑛𝑖=1 𝑝(1 − 𝑝) = 𝑛𝑝(1 − 𝑝)
• L’écart-type 𝜎 (𝑋 ):
𝜎 (𝑋 )= 𝑉(𝑥) = 𝑛𝑝(1 − 𝑝)
Sara GOTTI 13

Loi Binomiale
Exemple
• On lance 10 fois une pièce de monnaie. Soit la variable aléatoire X
représentant le nombre de piles apparues.
1
𝐴𝑙𝑜𝑟𝑠, 𝑋↝ 𝐵 (𝟏𝟎; ),
2
1 1 1
• 𝐸(𝑋)=𝑛𝑝=10× =5 et V(𝑋)=𝑛𝑝(1-p)=10× × =2,5
2 2 2
• La probabilité d’obtenir exactement 8 fois piles est donc égale à
8 1 8 1 2
𝑃(𝑋=8)=𝐶10 ×( ) ×( ) =0,044
2 2

Lois de probabilité continues

Loi Normale
• La loi normale est la loi continue la plus importante et la plus
utilisée dans le calcul de probabilité.
• Elle est aussi appelée loi de LAPLACE GAUSS.
• On appelle variable normale toute variable aléatoire continue
X définie dans l'intervalle ]−∞,+∞[par la fonction de densité
de probabilité suivante :
1 1 𝑥−𝜇 2
𝑓 𝑥 = 𝑒 2( 𝜎 )
𝜎 2𝜋


Loi Normale
• 𝜇 et 𝜎 sont des paramètres quelconques qui représentent
respectivement la moyenne (ou espérance) et l'écart type de la
variable.
• L’aire totale sur la courbe de la fonction densité (délimitée
par la courbe de la fonction et l’axe des X) est égale à 1.
• La loi normale dépend de deux paramètres 𝜇 et 𝜎.
• Une variable aléatoire X qui suit une loi normale de
paramètres 𝜇 et 𝜎 est notée comme suit: 𝑋 ↝ 𝑁(𝜇, 𝜎²)


Loi Normale
• La courbe de la loi Normale possède la forme en «CLOCHE»
• La distribution normale est symétrique par rapport à la droite verticale:
x=μ
• Points d’inflexion sont situés à une
distance 𝜎 de cet axe de symétrie.
• f atteint son maximum lorsque x=μ
• il est difficile de calculer sa fonction de
répartition f(x).
• Pour tous les calculs, on se ramène à
la fonction de répartition de la loi
normale centrée réduite (une loi TABULÉE).

La loi normale centrée réduite
• La loi normale centrée réduite est le cas particulier de la loi
normale générale.
• On appelle variable normale réduite toute variable aléatoire
normale Z de paramètres 𝜇 = 0 et 𝜎 = 1. Elle est notée comme
suit: 𝑋 ↝ Ν(0,1)
• La loi normale centrée réduite est la loi de probabilité absolument
continue dont la densité de probabilité est donnée par la fonction:
1 𝑥2
−
𝑓 𝑥 = 𝑒 2
2𝜋

• En particulier la loi normale réduite est symétrique par rapport à l'axe
des abscisses (x=0) et caractérisée par l'existence d'un maximum en
1
z = 0 et f(z) = ≈ 0,40 .
2𝜋
• La fonction de répartition correspond
à l'aire comprise entre cette courbe et l'axe
des abscisses.


• Pour le calcul de probabilités sans utiliser la fonction de densité,

la table de la loi normale centrés réduite a été élaborée.
• En raison de la symétrie de la distribution, ces tables sont limitées
aux valeurs positives de z.
𝑋−𝜇
• Par le changement de variable Z= la variable normale X se
𝜎
ramènent à la loi normale centrée réduite.


F(X)
𝐹 1,96 = 𝑃 𝑋 < 1,96 = 0,975
1
2𝜋
0 1,96 X


• Pour une variable normale quelconque X de paramètres 𝜇 et 𝜎:
X−𝜇 a−𝜇 a−𝜇
P(X≤a) = f(a) = P( ≤ ) = P(Z ≤ ) = P(Z ≤t)=𝜋(𝑡)
𝜎 𝜎 𝜎
a−𝜇
avec t=
𝜎
• Pour lire une valeur 𝜋(𝑡) dans la table, il suffit de lire l'intersection
entre la ligne correspondante à la valeur de t et la colonne
correspondante au deuxième chiffre après la virgule de t.
• La valeur de P(Z ≤1,29) (ou 𝜋(1,29)) correspond à l’intersection entre
la ligne correspondante à 1,2 et la colonne correspondante à 0,09, on
peut lire la valeur 0,9015.




• La loi Normale centrée réduite est symétrique, c. à. d pour tout

t ∈ ℝ: P(X≤ 𝑡) = P(X≥ −𝑡)
1
• En particulier P(X≤0) = P(X≥0) =
2
• On peut aussi écrire que:
P(X≤ 𝑡) = 1− P(X≥ 𝑡) = 1− P(X≤ −𝑡)
P(a≤X≤ 𝑏) = 1−P(X≤a)−P(X≥b) = P(X≤ b)−P(X≤a)


• Dans une table statistique de la loi centrée réduite, on ne peut lire
que P(X≤x) pour (x≥0).
• Comment calculer par exemple P(X≥ −1,87) et P(X≤ −0,93) ?
• Il suffit d'appliquer la remarque précédente et utiliser la table
statistique :
• D'une part: P(X≥ −1,87) = P(X≤1,87) = 0,9693
• D'autre part:
P(X≤ −0,93) = P(X≥0,93) = 1− P(X≤0,93) = 1−0,8238= 0,1762


Exemple:
• Pour qu'une pièce fabriquée par une machine soit utilisable, sa
longueur doit être comprise entre 14,7 et 15,3 cm, sinon elle est
rejetée. Sachant que la longueur de cette pièce est une variable
normale de moyenne 𝜇 =15 cm et d’ecart-type 𝜎 =0,2 cm.
Quelle est la probabilité de pièces pouvant être rejetées?
• Si on désigne par la variable X la longueur des pièces, X suit une loi
normale :
𝑋 ↝ Ν(15; 0,2)
• La probabilité de rejet d'une pièce est : P(rejet) = 1 − P(acceptation)
Et la probabilité d’acceptation est: P(acceptation)= P(14,7 ≤ X ≤ 15,3)

Exemple:
14,7−μ X−μ 15,3−μ 14,7−15 X−μ 15,3−15
P(14,7 ≤ X ≤ 15,3) = P( ≤ ≤ ) = P( ≤ ≤ )
𝜎 𝜎 𝜎 0,2 𝜎 0,2
X−15
On pose Z= , alors Z ↝ Ν(0; 1)
0,2
14,7−15 15,3−15
P(14,7 ≤ X ≤ 15,3) = P( ≤𝑍≤ )
0,2 0,2
15,3−15 14,7−15
= P(𝑍 ≤ ) − P(𝑍 ≤ )
0,2 0,2
= P(𝑍 ≤ 1,5) − P(𝑍 ≤ −1,5)
= P(𝑍 ≤ 1,5) −(1− P(𝑍 ≤ −1,5))
= 2 × P(𝑍 ≤ 1,5)−1 = 2 × 0,9332 −1 = 0,8664
P(rejet) = 1 − 0,8664 = 0,1336
Il y a un risque de rejet de 13,36% des pièces fabriquées.

Approximation de la loi binomiale par la loi normale
• Parfois les problèmes relatifs à la loi binomiale se rapportent
aux calculs de probabilités dans un ou plusieurs intervalles
donnés : p(X < x) p(X > x) ou p(xl < X < x2 )
• La recherche de ces probabilités est souvent longue, car il faut
déterminer individuellement et d'additionner les différentes
probabilités p(X = x).
Ex: p(X < 10) = p(0)+p(1)+p(2)+p(3)+p(4)+p(5)+p(6)+p(7)+p(8)+p(9)
• On peut effectuer ce calcul d'une manière approchée à l'aide de
la loi normale de paramètres 𝜇 =np et σ = 𝑛𝑝𝑞.
• On écrit alors: 𝑋 ↝ 𝐵 𝑛, 𝑝 ≈ 𝑋 ↝ 𝑁 𝑛𝑝, 𝑛𝑝𝑞 .

• Trois conditions à vérifier avant d’approximer une loi
binomiale 𝑋↝𝐵(𝑛,𝑝) par une loi normale 𝑋↝𝑁(𝑛𝑝, 𝑛𝑝𝑞):
✓La taille de l’échantillon ou le nombre de fois de répétitions n
doit être supérieur ou égale à 30 c- à-d 𝑛≥30
✓La probabilité relative à la survenance d’évènement p multipliée
par n doit être supérieure ou égale à 5 c-à-d n𝑝≥5
✓La probabilité relative à la non survenance d’évènement q
multipliée par n doit être supérieure ou égale à 5 c-à-d n𝑞≥5
• Autrement dit : Si 𝑛≥30 𝑒𝑡 𝑛𝑝≥5 𝑒𝑡 n𝑞≥5

Exemple:
• On suppose que la probabilité qu'un étudiant réussisse un examen est de 0,8.
Quelle est la probabilité qu'au moins 75 étudiants parmi 100 étudiants réussissent
l'examen ?
• Désignons par X le nombre d'étudiants qui réussissent l'examen.
• X est une variable discrète qui prend les valeurs entières de 0 à 100.
• Elle suit une loi binomiale de paramètres 100 et 0,8. X ↝ B(100 ; 0,8)
• La probabilité qu'au moins 75 étudiants parmi 100 étudiants réussissent l'examen
est : p(X≥75)
• Les produits np et nq sont respectivement 100x0,8 = 80 et 100x0,2 = 20, ils sont
supérieurs à 5.

Exemple:
On peut donc effectuer le calcul de cette probabilité d'une manière approchée à
l'aide de la loi normale de paramètres np = 80 et 𝜎 = 𝑛𝑝𝑞 = 4.
X ↝ B(100 ; 0,8)≈ N(80 ; 4)
X−80
On pose Z= , alors Z ↝ Ν(0; 1)
4
X−80 75−80
p(X≥75) = p( ≥ ) = p(𝑍 ≥ −1,25)
4 4
= 1 − p(𝑍 ≤ −1,25)
= 1 − (1 − p(𝑍 ≤ 1,25) )
= p(𝑍 ≤ 1,25) = 0,8944
la probabilité qu'au moins 75 étudiants parmi 100 étudiants réussissent l'examen est
de 0,8944.
CHAPITRE 3
Théorie d’échantillonnage
✓Introduction
✓Définitions
✓Méthodes d’échantillonnage
✓Distributions d’échantillonnage

Chapitre 3: Théorie d’échantillonnage
Introduction
• Pour collecter les informations sur une population, deux possibilités

s'offrent :
❑L’enquête complète: (enquête exhaustive) elle consiste à observer ou
interroger tous les éléments de la population.
❑L’enquête partielle: (sondage) elle consiste à observer ou interroger
une partie de la population. Les éléments de la population qui sont
réellement observés constituent l'échantillon et l'opération qui
consiste à choisir ces éléments est appelée échantillonnage.
• L’échantillonnage a pour but d’étudier des propriétés caractéristiques
d’une population quand on ne dispose pas encore de données. Il
nécessite d’examiner et d’observer une partie de la population.
Introduction
• L’échantillonnage offre une série d'avantages:

✓ Le coût global de l'enquête partielle (l’échantillonnage) est en
général plus réduit que le coût global d'une enquête complète.
✓L'enquête partielle est plus rapide que l'enquête complète, surtout
lorsque la caractéristique étudiée présente des modifications assez
importantes au cours du temps.
✓Les erreurs d'observations dans l'enquête partielle sont plus
réduites que dans l'enquête complète.

Définitions
• Enquête: ensemble d’opérations de collecte et de traitement de données

relatives à quelques domaines.
• Population: ensemble des unités statistiques (personnes ou objets) aux
quelles on s'intéresse et sur lesquelles porte une étude. Et on appelle
individu chaque élément (entité) de cette population pour lequel des
données sont collectées.
• Paramètres de la population: Ce sont les paramètres observés de la
population statistique:
➢Moyenne de la population (μ);
➢Ecart-type de la population (σ);
➢Proportion de la population (P)
• La taille de la population (N): est le nombre d’unités de la population.

Définitions
• Unité de base: unité d'échantillonnage ou unité de sondage, c'est
l'élément pris en considération dans l'enquête.
• Recensement: Enquête complète ou enquête exhaustive, c'est une
enquête au cours de laquelle toutes les unités de base de la population
sont observées.
• Sondage: Enquête incomplète, enquête partielle ou enquête par
échantillonnage, c'est une enquête au cours de laquelle seulement une
partie des unités de base de la population sont observée.
• Echantillonnage: ensembles des opérations permettant de
sélectionner de façon organisée les éléments de l’échantillon.
• Erreur d’échantillonnage: écart entre les résultats obtenus auprès
d’un échantillon et ce que nous apprendrait un recensement
comparable de la population. Plus la taille de l’échantillon est grande
plus l’erreur d’échantillonnage diminue.
Définitions
• Echantillon: une partie (sous ensemble) représentative de la

population statistique observée. La population d’où on tire
l’échantillon s’appelle «population mère» ou «population
échantillonnée».
• Paramètres de l’échantillon: Ce sont les caractéristiques
statistiques calculées de l’échantillon:
ത
➢Moyenne de l’échantillon (𝑋);
➢Ecart-type de l’échantillon (s);
➢Proportion de l’échantillon (f)
• La taille de l’échantillon (n): est le nombre d'unités de
l’échantillon.
Définitions
Exemple 1:
• Les membres d’un parti politique marocain sont supposés
soutenir un candidat particulier aux élections du parlement, et les
responsables du parti voudraient estimer la proportion d’électeurs
favorables à leur candidat. Un échantillon de 400 électeurs a été
sélectionné et 160 de ces électeurs ont indiqué être favorables au
candidat. Une estimation de la proportion d’électeurs favorables
au candidat est donc 160 sur 400 soit 0,40.

Définitions
Exemple 2:
• Un fabriquant de pneu a conçu un nouveau type de pneu
permettant d’accroitre le kilométrage effectué. Pour estimer le
nombre moyen de kilomètres effectués avec les nouveaux pneus,
le fabricant a sélectionné un échantillon de 120 nouveaux pneus,
dans le but de les tester. D’après les résultats du test, la moyenne
de l’échantillon est égale a 36500 kilomètres. Par conséquent, une
estimation du kilométrage moyen pour la population des
nouveaux pneus est de 36500 kilomètres.

Méthodes d’échantillonnage
• Pour que les résultats d'une enquête par sondage puissent être
généralisés à l'ensemble de la population faisant l'objet de l'étude, il est
indispensable que cette enquête soit conduite selon des règles bien
définies et que les calculs conduisant à ces synthèses soient conformes
à la procédure d'échantillonnage utilisée.
• L'échantillon choisi doit être le plus représentatif possible de la
population étudiée.
• Avec des méthodes d’échantillonnage adéquates, les résultats de
l’échantillons fournissent de «bonnes» estimations des paramètres de
la population (une moyenne d’échantillon fournit une estimation de la
moyenne de la population, une proportion d’échantillon fournit une
estimation de la proportion de la population)

• Méthode d’échantillonnage (ou de sondage) : Procédure par

laquelle on choisit dans une population un sous-groupe
représentatif.
✓Objectif : avoir un échantillon suffisamment représentatif
pour que les données puissent être affectées à la population.

1. Echantillonnages aléatoires
• Un échantillon aléatoire fournit un échantillon

représentatif dont chaque individu de la population a
une probabilité connue et non nulle d’être inclus dans
l’échantillon.

a. Echantillonnage aléatoire simple
• Il consiste simplement à choisir des individus au hasard

parmi ceux de la base de sondage (liste des individus à partir
de laquelle on prélève un échantillon par exemple l'annuaire
téléphonique). Les étapes sont les suivantes :
➢Numéroter les unités statistiques de 1 à n.
➢Tirer au hasard des unités statistiques de la population qui feront
partie de l'échantillon.

b. Echantillonnage systématique
• C'est une technique où les unités statistiques sont choisis à intervalle
régulier dans la base de sondage. Les étapes de cette technique sont les
suivantes :
1. Numéroter les unités statistiques de 1 à N.
2. Calculer l'intervalle de sélection que l'on appelle aussi le pas de
sondage. On le calcule en divisant la taille totale de la population
N
observée par la taille de l'échantillon recherchée k = .
n
3. Tirer au hasard une unité statistique entre la première et la kème unité.
Par exemple la ième unité avec 1 ≤i ≤k.
4. 4 Pour compléter l'échantillon, on choisit la (i + k) ème unité, et la
(i + 2k)ème .....jusqu’à (i + (n−1)k)ème . On constitue ainsi un
Sara GOTTI échantillon de taille (n-1+1=n)
SEG S3, unités.
2021-2022 44
b. Echantillonnage systématique
• Exemple:
On veut sélectionner un échantillon de 30 entreprises au sein d'une
population de 1800 entreprises.
1800
K= = 30
60
Ainsi on va tirer une entreprise toutes les 60 en partant d'un nombre tiré
aléatoirement entre 1 et 60.
Supposons ce nombre est le 15. On va donc sélectionner la 15 ème
entreprise puis la 75 ème , la 135 ème jusqu'à la 1755ème ce qui nous
donnera l'échantillon de 30 entreprises.
c. Echantillonnage par grappe
• Il consiste à choisir des groupes (toute une grappe de raisin)
plutôt que de choisir des unités statistiques isolées (un seul
raisin).
• Une grappe est un sous-ensemble non homogènes de la
population défini selon la proximité (par exemple un groupe
d’élèves faisant partie de la même classe, des habitants du même
immeuble, des habitants du même quartier ou même des équipes
sportives d'une ligue amateur).
• Il est plus facile de faire une liste des groupes et de choisir au
hasard parmi ces dizaines de groupes et d'interroger toutes les
unités statistiques du groupe.

c. Echantillonnage par grappe
• Cette méthode permet de sauver beaucoup de temps en

déplacement. Les étapes de cette techniques sont :
1. Diviser la population en grappes.
2. Choisir de façon aléatoire simple un certain nombre de grappes.
3. L'échantillon sera alors composé de toutes les unités statistiques
appartenant aux grappes choisies.
• la méthode peut entrainer des résultats imprécis (moins précis que
les méthodes précédentes) puisque les unités voisines ont
tendance de se rassembler. De plus elle ne permet pas de
contrôler la taille finale de l’échantillon.
d. Echantillonnage stratifié
• L'échantillonnage stratifié est une technique qui consiste à

subdiviser une population hétérogène en sous groupes plus
homogènes selon un critère ( Caractère qualitatif ou
quantitatif: des étudiants par leur sexe, âge ou diplôme
préparé, des entreprises par chiffre d’affaires ou secteur
d'activités …) lié à la nature et aux objectifs de l'étude. Ces
différents groupes sont appelés des strates.
• Les strates sont des sous-ensembles de la population ayant
des caractéristiques communes.
• Pour la répartition de l’effectif n, de l’échantillon dans les

différentes strates, la solution proportionnelle consiste à conserver
la même fraction de sondage dans chacune des strates.
• Désignons par 𝑤𝑖 le poids de la strate et par 𝑓 la fraction de
sondage constante:
𝑛 𝑁𝑖
𝑓= 𝑤𝑖 =
𝑁 𝑁
• Le nombre d’unités à choisir dans chacune des strates est donc:
𝑛𝑖 = 𝑓 × 𝑁𝑖 = 𝑤𝑖 × 𝑛

• Exemple:
Dans une population de 10000 entreprises, reparties en 5000 petites
entreprises, 3000 moyenne entreprises et 2000 grandes entreprises, on
souhaite avoir un échantillon de 500 entreprises.
500
Fraction de sondage constante: 𝑓 = = 0,05
10000
Strate Effectif de la strate (𝑁𝑖 ) Taille de l’échantillon
Petite 5000 5000 × 0,05 = 250
Moyenne 3000 3000 × 0,05 = 150
Grande 2000 2000 × 0,05 = 200
Total 10000 500
1. Echantillonnages non aléatoires
• On parle d’un échantillon non aléatoire (ou empirique ou par
choix raisonné) lorsque l’échantillon est construit par des
procédés comportant une part d’arbitraire et ne permettant pas
l’évaluation de la précision d’estimation.
• Ces méthodes sont beaucoup moins coûteuses, plus rapides et
plus simples. Il est par contre, peu recommandé de généraliser les
résultats provenant de ces méthodes à l'ensemble de la
population, puisque toutes les unités statistiques n'ont pas la
même chance d'être choisi ce qui influence la représentativité de
l'échantillon.
• On peut citer deux exemples de ce type d'échantillonnage :
a. échantillonnage à l'aveuglette
b. échantillonnage au volontariat
a. Echantillonnage à l'aveuglette
• L'échantillonnage à l'aveuglette est une technique simple et peu

coûteuse.
• Cet échantillonnage n'est pas normalement représentatif de la
population cible, parce qu'on ne sélectionne des unités
d'échantillonnage dans son cas que si on peut y avoir facilement
et commodément accès.
• Les reporters des stations de télévision sont, en outre, souvent à la
recherche de soi-disant « interviews de gens de la rue » pour
déterminer comment la population perçoit un enjeu ou une
question.
b. Echantillonnage au volontariat
• C'est une des méthodes les plus utilisées actuellement sur le

• marché des médicaments.
• Les compagnies pharmaceutiques sont les pionniers en la
matière.
• Les unités statistiques décident de faire partie de l'étude de
leur propre gré.

• Toutes les méthodes d’échantillonnage peuvent être combinées.

• La complexité de la procédure d’échantillonnage entraine une
complexité des calculs.
• Il n’y a pas un critère standard de choix: appel au bon sens et à
l’expérience.
• Cependant, il est recommandé d’utiliser les méthodes aléatoires
au détriment des méthodes non aléatoires, car des formules
permettent d’évaluer la qualité des estimations des
caractéristiques de la population, fournies par les résultats de
l’échantillon.

Distributions d’échantillonnage
• Dans toute la suite, on traite le cas de l’échantillonnage

aléatoire simple.
• Les concepts fondamentaux et les formules importantes
découlent de cette méthode.

Modélisation d'échantillonnage aléatoire simple
• L'échantillonnage simple consiste à extraire un échantillon de

taille n dans une population de taille N par des tirages aléatoires
équiprobables et indépendants (tirages avec remise).
• Ω = {𝜔1 , 𝜔2 , … , 𝜔𝑛 }: la population constituée d'éléments appelés
unités d'observation.
• X: le caractère que l'on voudrait étudier sur l'ensemble de cette
population.
• Xk : le résultat aléatoire du kème tirage est une V.A qui suit la
même loi que X.
• (𝑋1 , … , 𝑋𝑛 ) : les résultats aléatoires des n tirages modélisant
l'échantillon étudié.
• 𝑋1 , … , 𝑋𝑛 sont n V.A. indépendantes et de même loi (celle de

X) ; il est appelé n-échantillon ou échantillon de taille n de X.
• Une réalisation (𝑥1 , … , 𝑥𝑛 ) de l'échantillon (𝑋1 , … , 𝑋𝑛 ) est
l'ensemble des valeurs observées.
• Une statistique Y sur un échantillon (𝑋1 , … , 𝑋𝑛 ) est une V.A.,
fonction mesurable des 𝑋𝑘 :
Y = 𝜑(𝑋1 , … , 𝑋𝑛 )
• Après réalisation, la statistique Y prend la valeur 𝜑(𝑥1 , … , 𝑥𝑛 )
• Exemple de valeur statistique: la moyenne empirique.
• En supposant que l'échantillon est aléatoire et simple, la variable

aléatoire X possède une distribution de probabilité, dite
distribution d 'échantillonnage. On peut donc calculer l'espérance
E(X) (la moyenne) et l’écart-type 𝜎(X) de cette distribution.
• La distribution d'échantillonnage est donc la distribution des
différentes valeurs que peut prendre la variable aléatoire X, pour
les différents échantillons possibles. Son écart type 𝜎𝑡 est appelé
erreur standard.
• Les principales distributions d'échantillonnage sont la distribution
d'échantillonnage de la moyenne, la distribution d'échantillonnage
de l’écart-type et la distribution d'échantillonnage de la
proportion.
Distribution d'échantillonnage de la moyenne
• Supposons que dans une population infinie quelconque, on ait prélevé
au hasard un premier échantillon de n observations :
𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛
σ𝑛
𝑖=1 𝑥𝑖
• et qu'on ait calculé la moyenne : 𝑥ҧ = 𝑛
• Si on prélève, dans les mêmes conditions, un deuxième échantillon de
même effectif :
𝑥1′ , 𝑥2′ , 𝑥3′ , … , 𝑥𝑛′
σ 𝑛 ′
𝑥
• La moyenne correspondante 𝑥ഥ′ = 𝑖=1 𝑖
sera généralement différente
𝑛
de la première moyenne observée.
• Il en sera de même pour les moyennes d’autres échantillons prélevés
dans les mêmes conditions.
σ 𝑛 ′′
𝑥
𝑖=1 𝑖
𝑥1′′ , 𝑥2′′ , 𝑥3′′ , … , 𝑥𝑛′′ 𝑥 ′′ =
𝑛
• On peut considérer la suite des premières observations 𝑥1 ,
𝑥1′ , 𝑥1′′ , ... des différents échantillons comme des valeurs
observées d'une même variable aléatoire 𝑋1 , la suite des
deuxièmes observations des différents échantillons comme
des valeurs observées d'une même variable aléatoire 𝑋2 ,
etc.
• Les moyennes observées 𝑥,ҧ 𝑥ഥ′ , 𝑥 ′′ , ... sont alors des valeurs
observées d'une même variable aléatoire X ഥ qui est fonction
de 𝑋1 , 𝑋2 , …, 𝑋𝑛 .
𝑛
σ𝑖=1 𝑋𝑖
𝑋ത =
𝑛
• Comme 𝑋1 , 𝑋2 , …, 𝑋𝑛 , la variable aléatoire X possède une

distribution de probabilité, dite distribution
d'échantillonnage de la moyenne.
• On peut donc calculer la moyenne et l’écart-type de cette
distribution, en supposant que l'échantillon est aléatoire et
simple, les variables aléatoires 𝑋1 , 𝑋2 , …, 𝑋𝑛 ont toutes la
même distribution de probabilité, dont la moyenne est
désignée par 𝜇 (la moyenne de la population) et l’écart-type
par 𝜎 (l’écart-type de la population).

On a E(𝑋𝑖 ) = 𝜇
• On démontre alors que la moyenne de la distribution de la
moyenne est:
σ𝑛
𝑖=1 𝑋𝑖 1 1
𝜇𝑋ത = E( ) = × σ𝑛𝑖=1 𝐸(𝑋𝑖 ) = ×𝑛×𝜇 =𝜇
𝑛 𝑛 𝑛
• Donc:
𝜇𝑋ത = 𝜇

On a 𝑉(𝑋𝑖 )=𝜎 2
• L’écart-type de la distribution de la moyenne est:
σ𝑛
𝑖=1 𝑋𝑖
𝜎𝑋ത = ത
𝑉(𝑋)= V( )
𝑛
1
= × σ𝑛𝑖=1 𝑉(𝑋𝑖 )
𝑛2
1 𝜎2
= × 𝑛 × 𝜎2 =
𝑛2 𝑛
• Donc:
𝜎
𝜎𝑋ത =
𝑛
• Dans le cas d'une population finie d'effectif N, au sein de

laquelle est prélevé, sans remise, un échantillon aléatoire est
simple d'effectif n, l’écart-type de la distribution de la
moyenne est :
𝜎 𝑁−𝑛
𝜎𝑋ത =
𝑛 𝑁−1
𝑁−𝑛
Avec est le coefficient d’exhaustivité.
𝑁−1

Loi de la distribution d’échantillonnage de la moyenne
• La loi de 𝑋ത dépend de:
✓La loi de la population (Normale ou quelconque)
✓la taille de l'échantillon (n petite ou grande)
• La distribution d’échantillonnage de la moyenne est donnée
par :
𝜎
ത
❑Si X suit une loi normale 𝑁(𝜇; 𝜎), alors 𝑋 ↝ 𝑁 𝜇;
𝑛
❑Si la loi de X est quelconque avec la taille de l’échantillon
n≥30, par le théorème central limite, 𝑋ത suit approximativement
𝜎
une loi normale 𝑁 𝜇;
𝑛
• Exemple 1:
Prenons la population P{1, 2, 3}. On prélève des échantillons de taille
n=2.
On considère cette population infinie (on effectue des tirages
successives avec remise pour construire les échantillons).
• La moyenne de la population 𝜇?
1+2+3 6
𝜇= = =2
3 3
• L’écart-type de la population 𝜎?
σ 𝑥𝑖 2
𝜎= − 𝑋ത 2 𝑎𝑣𝑒𝑐 𝑋=
ത 𝜇
𝑛
1+4+9 2
𝜎= − 22 =
3 3

• Exemple 1: (suite)
Tous les échantillons possibles sont:
11 12 13
21 22 23
31 32 33
1+1 1+2 1+3
𝑋11 = = 1 ; 𝑋12 = = 1,5 ; 𝑋13 = =2
2 2 2
2+1 2+2 2+3
𝑋21 = = 1,5 ; 𝑋22 = = 2 ; 𝑋23 = = 2,5
2 2 2
3+1 3+2 3+3
𝑋31 = = 2 ; 𝑋32 = = 2,5 ; 𝑋33 = =3
2 2 2
Nous somme face à une distribution d’échantillonnage de
moyenne.
σ 𝑋𝑖 1+1,5+2+1,5+2+2,5+2+2,5+3
La moyenne 𝜇𝑥ҧ = = =2=μ
𝑛 9
σ 𝑋𝑖 2 39 1
L’écart-type 𝜎𝑋ത = − 𝜇𝑥ҧ = 2 −4=
𝑛 9 3
2
2 𝜎 3 1
On a trouvé 𝜎 = alors = = = 𝜎𝑋ത
3 𝑛 2 3

• Exemple 2:
Une machine fabrique des rondelles d’un diamètre moyen 𝜇 = 20 𝑚𝑚
et d’écart-type 𝜎 = 2 𝑚𝑚 . On suppose que la production est très
importante (c-à-d. la population est infinie). On prélève un échantillon
de 100 pièces.
Quelle est la loi de probabilité de la moyenne des diamètres de ces 100
pièces?
Quelle est la probabilité que la moyenne des diamètres de l’échantillon
soit inferieure à 20,4?
Quelle est la probabilité que cette moyenne soit comprise entre 19,8 et
20,2?

• La moyenne de la distribution d’échantillonnage de la moyenne des
diamètres est 𝜇𝑋ത = 𝜇 = 20
• L’écart-type de la distribution
𝜎 2
d’échantillonnage de la moyenne des
diamètres est 𝜎𝑋ത = = = 0,2
𝑛 100
• La loi de probabilité de la moyenne des diamètres de ces 100 pièces?
ത Examinons la situation.
On cherche la loi suivie par 𝑋.
La taille de l’échantillon est: n = 100. Nous sommes en présence d’un
échantillon (n>30). Donc 𝑋ത suit une loi normale
𝜎
ത
𝑋 ↝ 𝑁 𝜇; = 𝑁(20, 0,2).
𝑛
𝑋ത −20
On en déduit que Z = suit 𝑁(0, 1).
0,2
• La probabilité que la moyenne des diamètres de
l’échantillon soit inferieure à 20,4?
On cherche à déterminer P(𝑋ത ≤ 20,4).
𝑋ത −20
On a 𝑋ത ↝ 𝑁 20; 0,2 . On en déduit que Z = suit 𝑁(0, 1).
0,2
𝑋ത −20 20,4 −20
P(𝑋ത ≤ 20,4)=P( ≤ )
0,2 0,2
=P(Z≤2)
=0,9772
• La probabilité que cette moyenne soit comprise entre 19,8
et 20,2?
On cherche à déterminer P(19,8 ≤ 𝑋ത ≤ 20,2).
19,8−20 𝑋ത −20 20,2 −20
P(19,8 ≤ 𝑋ത ≤ 20,2)=P( ≤ ≤ )
0,2 0,2 0,2
=P(−1 ≤Z≤ 1)
= 2×P(≤Z≤ 1)−1
= 2× 0,8413 − 1
=0,6826
Distribution d'échantillonnage de la proportion
• Si on considère une population infinie et si on y prélève un

échantillon aléatoire et simple d'effectif n, on désigne par X
le nombre d'individus possédant, dans l'échantillon, le
caractère étudié.
𝑋𝑛
• 𝑓𝑛 = est la fréquence ou proportion des individus
𝑛
possédant, dans l'échantillon, le caractère étudié.
• On désigne par 𝑝 la proportion des individus possédant,
dans la population, le caractère étudié.

• De la même manière que la moyenne, chacun des échantillons
possède une fréquence :
𝑋𝑛 𝑋 𝑛′ 𝑋𝑛′′
• 𝑓𝑛 = 𝑓𝑛 ′ = 𝑓𝑛′′ =
𝑛 𝑛 𝑛
• Ces fréquences peuvent être considérées comme des valeurs
observées d'une même variable aléatoire 𝐹𝑛 :
𝑋𝑛
𝐹𝑛 =
𝑛
• La variable aléatoire 𝐹𝑛 possède une distribution de probabilité,
dite distribution d'échantillonnage de la proportion.
• On peut donc calculer la moyenne et l’écart-type de cette
distribution, en supposant que l'échantillon est aléatoire et
simple.
• On peut démontrer alors la moyenne de la distribution de la

proportion:
𝑋𝑛 1 1
𝜇𝐹 = E( 𝑛 ) = × 𝐸 𝑋𝑛 = × 𝑛𝑝 = 𝑝
𝑛 𝑛
• Donc:
𝜇𝐹 = 𝑝

• L’écart-type de la distribution de la proportion est:

𝑋𝑛
𝜎𝐹 = 𝑉(F)= V( )
𝑛
1
= × 𝑉(𝑋𝑛 )
𝑛2
1 𝑝𝑞
= × 𝑛 × 𝑝𝑞 =
𝑛2 𝑛
• Donc:
𝑝𝑞
𝜎𝐹 =
𝑛
• Dans le cas d'une population finie d'effectif N, au sein de

laquelle est prélevé, sans remise, un échantillon aléatoire est
simple d'effectif n, l’écart-type de la distribution de la
proportion est :
𝑝𝑞 𝑁−𝑛
𝜎𝐹 =
𝑛 𝑁−1
𝑁−𝑛
Avec est le coefficient d’exhaustivité.
𝑁−1

Loi de la distribution d’échantillonnage de la proportion
• La loi de 𝐹 dépend de:
✓la taille de l'échantillon (n petite ou grande)
• La distribution d’échantillonnage de la moyenne est donnée
par :
❑Si la taille de l’échantillon n≥30, le produit 𝑛𝑝 ≥ 5 et 𝑛𝑞 ≥ 5,
par le théorème central limite, 𝐹 suit approximativement une loi
𝑝𝑞
normale 𝑁 𝑝;
𝑛

• Exemple:
Une machine fabrique des rondelles d’un diamètre moyen
𝜇 = 20 𝑚𝑚 et d’écart-type 𝜎 = 2 𝑚𝑚. On suppose que la
production est très importante (c-à-d. la population est
infinie). On trouve 8% des rondelles sont défectueuses. On
prélève un échantillon de 100 pièces.
Quelle est la loi de probabilité de la proportion des rondelles
défectueuses de ces 100 pièces?
Quelle est la probabilité que la proportion des rondelles
défectueuses de l’échantillon dépasse 10%?
• Exemple: (suite)
• La moyenne de la distribution d’échantillonnage de la proportion des
rondelles défectueuses est 𝜇𝐹 = 𝑝 = 0,08
• L’écart-type de la distribution d’échantillonnage de la proportion des
𝑝𝑞 0,08×0,92
rondelles défectueuses est 𝜎𝐹 = = = 0,02713
𝑛 100
• La loi de probabilité de la proportion des rondelles défectueuses de ces 100
pièces?
On cherche la loi suivie par 𝐹. Examinons la situation.
La taille de l’échantillon est: n = 100. Nous sommes en présence d’un
échantillon (n>30), en plus 𝑛𝑝 = 100 × 0,08 = 8 > 5, 𝑒𝑡 𝑛𝑞 = 100 ×
0,92 = 92 > 5.
𝑝𝑞
Donc 𝐹 suit une loi normale F ↝ 𝑁 𝑝; 𝑛
= 𝑁(0,08; 0,02713).
• La probabilité que la proportion des rondelles défectueuses de
l’échantillon dépasse 10%?
On cherche à déterminer P(𝐹 ≥ 0,1).
F −0,08
On aF ↝ 𝑁(0,08; 0,02713). On en déduit que Z = suit
0,02713
𝑁(0, 1).
F−0,08 0,1 −0,08
P(𝐹 ≥ 0,1)=P( ≥ )
0,02713 0,02713
=P(Z≥ 0,74)
=1−P(Z≤ 0,74)
=1−0,7704= 0,2296
CHAPITRE 4
Estimation
✓Introduction
✓Estimation ponctuelle
✓Estimation par intervalle de confiance

Chapitre 4: Estimation
Introduction
• Après avoir prélevé l’échantillon, et étudié les distributions
d’échantillonnage, on peut alors généraliser, à la population, les
résultats expérimentaux obtenus à partir de l’échantillon.
• L’estimation consiste en l’évaluation d’un paramètre de la population à
partir des valeurs calculées sur les échantillons.
• Les paramètres à estimer sont:
❑ 𝜇 la moyenne de la population.
❑ 𝜎 l’écart type de la population.
❑ 𝑝 pour la proportion dans la population.
• La théorie de l’estimation se divise en deux parties:
❑L’estimation ponctuelle
❑L’estimation par intervalle de confiance
Estimation ponctuelle
• L’estimation ponctuelle ou l’estimation de point d’un

paramètre est la connaissance de la seule valeur estimée de ce
paramètre.
• Les paramètres recherchés sont: la moyenne, l’écart-type et la
proportion de la population.

Généralités sur les estimateurs
• Un estimateur T = f (𝑋1 ; …; 𝑋𝑛 ) d'un paramètre 𝜃 est une

statistique et sa réalisation f ( 𝑥1 ; …; 𝑥𝑛 ) sera appelée
estimation ponctuelle de 𝜃.
• On appelle erreur d'estimation la différence entre l'estimateur
et le paramètre : Erreur = T − 𝜃.
• Cette Erreur peut être décomposer de la façon suivante :
Fluctuation autour de la moyenne
𝑇 − 𝜃 = 𝑇−𝐸 𝑇 + 𝐸 𝑇 −𝜃
Biais de l'estimateur

• Un estimateur T de 𝜃 est dit sans biais si E(T) = 𝜃.

• Sinon, on dit que c'est un estimateur biaisé :
❑ Si le biais 𝐸(𝑇) − 𝜃 est positif, ( E(T) > 𝜃), alors l'estimateur
surestime la valeur du paramètre.
❑ Si le biais 𝐸(𝑇) − 𝜃 est négatif, ( E(T) < 𝜃), alors l'estimateur
sous-estime la valeur du paramètre.
• Un estimateur T de 𝜃 est dit asymptotiquement sans biais si
𝐸(𝑇) → 𝜃 quand 𝑛 → ∞.

• Un estimateur T de 𝜃 est dit convergent si 𝑉𝑎𝑟 𝑇 →

0 quand 𝑛 → ∞.
• Soit T et 𝑇 ′ deux estimateurs sans biais de 𝜃. On dit que T est
plus efficace que 𝑇 ′ si Var (T)≤Var (𝑇 ′ ).
• L'estimateur sans biais et de variance minimale est appelé
estimateur efficace.

Estimation ponctuelle d’une moyenne
• Soit X un caractère (une variable aléatoire) dont on veut

estimer la moyenne 𝜇 à partir d'un échantillon (𝑋1 ; …; 𝑋𝑛 ) de
même loi que X. La loi de X est inconnue.
𝑋1 + 𝑋2 + …+ 𝑋𝑛
• La moyenne empirique 𝑿 ഥ= est un estimateur
𝑛
efficace de la moyenne 𝝁.

• Justification:
ഥ est
o En fait, l'estimateur X
❑sans biais car E(X ഥ ) = 𝜇.
Var (X)
❑convergeant car 𝑉𝑎𝑟 (X) = ഥ → 0; quand n tend
𝑛
vers ∞.
o On peut montrer qu'il est de variance minimale.

• Exemple:
Afin d'étudier le salaire horaire des ouvriers d'un secteur d'activité,
on prélève un échantillon aléatoire (X1 ; X2 ; …; X15 ) de réalisation
(en dhs)
9,8 8,6 9,7 10,2 8,9 10,1 9,9 9,7
8,7 9,8 10,2 9,3 10,4 9,5 10,9
On suppose que la loi suivie par le salaire horaire est normale de
moyenne 𝜇 et d’écart-type 𝜎.
1. Donner une estimation de 𝜇.

Une estimation ponctuelle de la moyenne 𝜇:
σ15
𝑖=1 𝑋𝑖
𝜇 = 𝑋ത =
15
9,8+8,6+9,7+10,2+8,9+10,1+9,9 +9,7 +8,7 +9,8+10,2 +9,3+10,4+9,5 +10,9
=
15
145,7
=
15
= 9,71

Estimation ponctuelle d’un écart-type
• On considère maintenant l’estimation de la variance (écart-type)
par la variance empirique de l’échantillon:
2 1 σ𝑛 ത 2 1 𝑛
σ 2 ത 2
𝑆 = (𝑋 − 𝑋) = 𝑋 − 𝑋
𝑛 𝑖=1 𝑖 𝑛 𝑖=1 𝑖
• S est un estimateur de l’écart-type.
• Déterminons le biais de cet estimateur:
1 𝑛 2 1 𝑛 2
2
𝐸(𝑆 ) = 𝐸 σ 𝑋 − 𝑋ത 2
= σ 𝐸 𝑋 − 𝐸 𝑋ത 2
𝑛 𝑖=1 𝑖 𝑛 𝑖=1 𝑖
= 𝐸(𝑋 2 ) − 𝐸(𝑋ത 2 )
= 𝑉𝑎𝑟(𝑋) + 𝐸(𝑋)2 − 𝑉𝑎𝑟(𝑋) ത − 𝐸(𝑋)ത 2
Var(X)
= 𝑉𝑎𝑟(𝑋) + 𝐸(𝑋) − 2 ത 2
− 𝐸(𝑋)
𝑛
1 𝑛−1 2
= (1 − )𝑉𝑎𝑟(𝑋)= 𝜎 ≠ 𝜎2
𝑛 𝑛
• Donc contrairement à ce qu’on pourrait croire, l’écart-type

empirique S n’est pas un estimateur sans biais de 𝜎.
• Cet estimateur n’est qu’asymptotiquement sans biais.
• Pour corriger le biais on prend l'estimateur
2 𝑛
S′ = 𝑆2
𝑛−1
′2 𝑛 2 𝑛 𝑛−1 2
On remarque que: E(S ) = 𝐸(𝑆 ) = × 𝜎 = 𝜎2
𝑛−1 𝑛−1 𝑛

• La statistique ( la variance
𝑛
corrigée ):
′2
𝑛 1
S = 2
𝑆 = ෍(𝑋𝑖 − 𝑋) ത 2
𝑛−1 𝑛−1
𝑖=1
𝑛
𝑆2est un estimateur efficace de la variance 𝜎 2 qui est sans biais et
𝑛−1
convergeant.
𝒏
• Alors, 𝑺 × est un estimateur efficace de l’écart-type 𝝈 de la
𝒏−𝟏
population qui est sans biais et convergeant.
• L'écart-type estimé est noté 𝑆𝑐 et on l’appelle l’écart-type corrigé.
𝒏
𝑆𝑐 = 𝑺 ×
𝒏−𝟏

• Exemple:
L'objet d'une enquête menée sur la région Larache-El Ksar El
Kebir est d'étudier la variable X représentant la dépense
moyenne de foyer. On choisit au hasard 100 foyers, les
réalisation de l'échantillon permettent d’affirmer que
1 100 2
σ100
𝑖=1 𝑋𝑖 = 3007 𝑒𝑡 σ𝑖=1 𝑋𝑖 = 940,4
100
• Donner une estimation de l’écart-type 𝜎

Une estimation ponctuelle de l'écart-type σ:
𝑛 100 1 2
𝑆𝑐 = × 𝑆= × σ100 𝑋 − 𝑋ത 2
𝑛−1 99 100 𝑖=1 𝑖
100 1 2 σ100
𝑖=1 𝑋𝑖 2
= × σ100 𝑋 − ( )
99 100 𝑖=1 𝑖 100
100 3007 2
= × 940,4 − ( )
99 100
= 6,05

Estimation ponctuelle d’une proportion
• Soit une population ayant des individus possédant une

certaine caractéristique A. On veut estimer à partir d'un
échantillon de taille n la proportion d'individus possédant
cette caractéristique A.
• Soit K la V.A qui représente le nombre d'individus dans
l'échantillon possédant la caractéristique A.
• On rappelle que p est la proportion d'individus de la
population possédant la modalité A.

K
• En fait, f = est un estimateur sans biais car:
n
comme X1 ; X2 ; …; Xn sont des variables de Bernoulli, alors:
E(X1)+E(X2 )+ …+E(Xn )
E(f)=
𝑛
𝑝+𝑝+ ……+𝑝 𝑛×𝑝
= = =𝑝
𝑛 𝑛

• En plus f est un estimateur convergeant, car:

Var(X1 )+Var(X2)+ …+Var(Xn)
• Var (f) = 2
𝑛
𝑝(1−𝑝)+𝑝(1−𝑝)+ ……+𝑝(1−𝑝) 𝑝(1−𝑝)
= =
𝑛2 𝑛
alors 𝑉𝑎𝑟 (𝑓) → 0, quand 𝑛 → +∞.
K
• Alors, la fréquence empirique f= est l'estimateur efficace
x n
de p.

• Exemple:
On s'intéresse à la proportion p des étudiants ayant un
Baccalauréat Sciences-économiques inscrit en première année
à la FSJES de Kelaa des sraghna. On a prélevé
indépendamment un échantillon de taille n=120. On constate
que 48 étudiants de l’échantillon ont une un bac Sciences
économiques.
Donner une estimation ponctuelle de p.

• Exemple: (Suite)
Une estimation ponctuelle de la proportion p des étudiants
ayant un Baccalauréat Sciences-économiques :
48
𝑝=𝑓= = 0,4
120

Estimation par intervalle de confiance
• L'estimation d'un paramètre inconnu par une seule valeur est

quelque fois insuffisante, on préfère souvent donner un
intervalle de valeurs.
• On cherche des intervalles dit "intervalle de confiance" qui
contiennent
❑ La moyenne 𝜇 inconnue
❑ La proportion p d'une certaine propriété que possède la
population.

• L'estimation par intervalle de confiance consiste à déterminer

autour de la valeur estimée un intervalle dont on a de fortes
chances de croire qu'il contient la vraie valeur du paramètre
recherché.
• Si on s'intéresse à un paramètre 𝜃, dont on possède un estimateur
T, l'estimation par intervalle de confiance consiste à déterminer
de part et d'autre de T les bornes T1 et T2 d'un intervalle qui a une
forte probabilité de contenir 𝜃.
• Cette probabilité est appelée niveau de confiance 𝛽 et désignée
par (𝛽 = 1 − 𝛼), avec 𝛼 est un risque d'erreur.

• Soit X une V.A. dont la loi dépend d'un paramètre inconnu 𝜃.

• On appelle intervalle de confiance de niveau de confiance 𝛽
(𝛽 = 1 − 𝛼 ou de seuil de risque 𝛼), un intervalle qui a la
probabilité 𝛽 de contenir la vraie valeur de 𝜃.
• Autrement dit, [T1 ; T2 ] est intervalle de confiance pour un
niveau 𝛽 du paramètre 𝜃 si:
P(T1 ≤ 𝜃 ≤ T2 ) = 𝛽 = 1 − 𝛼

• 𝛽(= 1 − 𝛼) est appelé le niveau de confiance, et 𝛼 est le

seuil ou le risque.
• Plus le niveau de confiance est élevé, plus la certitude est
grande que la méthode d'estimation produira une estimation
contenant la vraie valeur de 𝜃.
• Les niveaux de confiance les plus utilisés sont 90%, 95% et
99%.
• Une estimation par intervalle est souvent réalisée en ajoutant
une marge d’erreur à l’estimation ponctuelle.

Estimation par intervalle de confiance d’une moyenne
• Soit X une variable aléatoire et (X1 ; X2 ; …; Xn ) un échantillon de X.
• On a vu que la moyenne X ഥ d'un échantillon aléatoire permet d'estimer
la vraie moyenne de la population.
• On voudrait estimer également la précision de cette moyenne, c'est-à-
dire donner une marge d'erreur ou un intervalle de confiance.
• On peut distinguer deux cas :
1. La taille de l'échantillon est petite (n < 30) et X ↝ 𝑁(𝜇; 𝜎):
a. L’écart-type 𝜎 de la population est connu
b. L’écart-type 𝜎 de la population est inconnu
2. La taille de l’échantillon est grande (n≥30) et X de loi quelconque.
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• 𝝈 de la population est connu :
On se fixe le niveau de confiance 𝛽 (ou le risque 𝜑). On peut écrire
donc que:
𝜎
ത
Si X suit une loi normale 𝑁(𝜇; 𝜎), alors 𝑋↝𝑁(𝜇; )
√𝑛
𝑋ത −𝜇
On pose Z = 𝜎 suit 𝑁(0, 1)
√𝑛
β+1
P(−𝑡β ≤ 𝑍 ≤ 𝑡β ) = β ⇒ 2×P(Z≤ 𝑡β )−1= β ⇒ P(Z≤ 𝑡β ) =
2
⇒ on cherche dans la table de la loi normale centrée et réduite la valeur
β+1
de 𝑡β par lecture inverse de .
2
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)

P(−𝑡β ≤ 𝑍 ≤ 𝑡β )= β
𝑋ത −𝜇
=P(−𝑡β ≤ 𝜎 ≤ 𝑡β )= β
√𝑛
𝜎 𝜎
=P(−𝑡β ≤ 𝑋ത −𝜇 ≤ 𝑡β )= β
√𝑛 √𝑛
𝜎 𝜎
=P(−𝑡β − 𝑋ത ≤ −𝜇 ≤ 𝑡β − 𝑋)= ത β
𝑛 √𝑛
𝜎 𝜎
=P(𝑋ത − 𝑡β ≤𝜇 ≤ ത
𝑋 + 𝑡β )= β
𝑛 √𝑛

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)

Conclusion : Si x est une réalisation de X, l'intervalle de confiance
de la moyenne 𝜇 de seuil ou de niveau 𝛽(= 1 − 𝛼) est:
𝜎 𝜎
𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]
𝑛 𝑛
En remplaçant 𝑋ത par sa valeur calculée sur l'échantillon, on obtient
l'intervalle de confiance sur la moyenne 𝜇.
𝜎
• La grandeur 𝑡β ajoutée à l’estimation ponctuelle 𝑋ത est appelée
𝑛
𝜎
la marge d’erreur notée 𝜀. On écrit: 𝜀 = 𝑡β
𝑛
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• Exemple 1:
Afin d'étudier le salaire horaire des ouvriers d'un secteur d'activité, on
prélève un échantillon aléatoire (X1 ; X2 ; …; X15 ) de réalisation (en
dhs)
9,8 8,6 9,7 10,2 8,9 10,1 9,9 9,7
8,7 9,8 10,2 9,3 10,4 9,5 10,9
moyenne 𝜇 et d’écart-type 𝜎 = 1.
1. Estimer le salaire horaire moyen dans la population par un intervalle
de confiance de niveau 95%.
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
la moyenne de l’échantillon:𝑋ത = 9,71
L’écart-type 𝜎 = 1
l'intervalle de confiance de la moyenne 𝜇 de niveau 95% est:
𝜎 𝜎 1 1
𝐼0,95 = [𝑋ത − 𝑡0,95 ; 𝑋ത + 𝑡0,95 ] = [9,71 − 𝑡0,95 ; 9,71 + 𝑡0,95 ]
𝑛 𝑛 15 15
Calculer 𝑡0,95 :
β+1 0,95+1
On a P(Z≤ 𝑡β ) = alors P(Z≤ 𝑡0,95 ) = = 0,975 ⇒ 𝑡0,95 =1,96
2 2
1 1
𝐼0,95 = [9,71 − 1,96 × ; 9,71 + 1,96 × ]
15 15
𝐼0,95 = [9,20; 10,22]
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• 𝝈 de la population est inconnu :
𝒏
L'écart type 𝜎 étant inconnu, on l'estime par son estimateur ponctuel 𝑆𝑐 = 𝑺 𝒏−𝟏
L'intervalle de confiance de la moyenne 𝜇 de seuil ou de niveau 𝛽(= 1 − 𝛼) devient:

𝒏 𝒏
𝑺× 𝒏−𝟏 𝑺× 𝒏−𝟏
𝑆𝑐 𝑆𝑐
𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]= [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]
𝑛 𝑛 𝑛 𝑛
𝑺 𝑺
𝑛−1 𝑛−1
𝑆𝑐
Avec la marge d’erreur 𝜀 = 𝑡β
𝑛
En remplaçant 𝑋ത et S par leurs valeurs calculées sur l'échantillon, on obtient l'intervalle
de confiance sur la moyenne 𝜇.
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• Exemple 2:
Afin d'étudier le salaire horaire des ouvriers d'un secteur d'activité, on
prélève un échantillon aléatoire (X1 ; X2 ; …; X15 ) de réalisation (en
dhs)
9,8 8,6 9,7 10,2 8,9 10,1 9,9 9,7
8,7 9,8 10,2 9,3 10,4 9,5 10,9
moyenne 𝜇 et d’écart-type 𝜎.
1. Estimer le salaire horaire moyen dans la population par un intervalle
de confiance de niveau 95%.
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
la moyenne de l’échantillon:𝑋ത = 9,71
𝒏
𝜎 est inconnu. On l’estime par son estimateur ponctuel 𝑆𝑐 = 𝑺
𝒏−𝟏
1 15 1
𝑆= σ𝑖=1 𝑋𝑖 2 − 𝑋ത 2 = × 1420,93 − (9,71)2 =0,67
15 15
𝑺 𝑺 0,67 0,67
𝐼0,95 = 𝑋ത − 𝑡0,95 ; 𝑋ത + 𝑡0,95 = [9,71 − 1,96 × ; 9,71 + 1,96 × ]
𝑛−1 𝑛−1 14 14
𝐼0,95 = [9,36; 10,06]
2. (n≥30) et X de loi quelconque
• Lorsque la taille n de l'échantillon est grande (pratiquement dès

que n > 30), on appliquera les formules de l'intervalle de
confiance sur 𝜇, même si l'échantillon n'est pas issu d'une
population normale.
• En effet, le théorème central limite nous permet de dire que 𝑋ത
𝜎
est approximativement de loi 𝑁(𝜇; ) lorsque n est grand.
𝑛

• l'intervalle de confiance de la moyenne 𝜇 de niveau 𝛽:

• Si 𝜎 est connue :
𝜎 𝜎
𝑛 𝑛
• Si 𝜎 est connue :
𝑺 𝑺
𝑛−1 𝑛−1
𝑺
𝑛−1
• Exemple 1:
L'objet d'une enquête menée sur la région Larache-El Ksar El Kebir est
d'étudier la variable X représentant la dépense moyenne de foyer
sachant que l’écart-type 𝜎 = 5. On choisit au hasard 100 foyers, les
réalisation de l'échantillon permettent d’affirmer que
1 2
σ100
𝑖=1 𝑋𝑖 = 3007 𝑒𝑡 σ100 𝑋 = 940,4
100 𝑖=1 𝑖
1. Estimer la dépense moyenne dans la population par un intervalle de
confiance de niveau 95%.

σ100
𝑖=1 𝑋𝑖 3007
la moyenne de l’échantillon:𝑋ത = = = 30,07
100 100
𝜎 𝜎 5 5
ത
𝐼0,95 = [𝑋 − 𝑡0,95 ത
; 𝑋 + 𝑡0,95 ] = [30,07 − 𝑡0,95 ; 30,07 + 𝑡0,95 ]
𝑛 𝑛 100 100
Calculer 𝑡0,95 :
β+1 0,95+1
On a P(Z≤ 𝑡β ) = alors P(Z≤ 𝑡0,95 ) = = 0,975 ⇒ 𝑡0,95 =1,96
2 2
5 5
𝐼0,95 = [30,07 − 1,96 × ; 30,07 + 1,96 × ]
100 100
𝐼0,95 = [29,09; 31,05]
• Exemple 2:
L'objet d'une enquête menée sur la région Larache-El Ksar El Kebir est
d'étudier la variable X représentant la dépense moyenne de foyer. On
choisit au hasard 100 foyers, les réalisation de l'échantillon permettent
d’affirmer que
1 2
σ100
𝑖=1 𝑋𝑖 = 3007 𝑒𝑡 σ100 𝑋 = 940,4
100 𝑖=1 𝑖
1. Estimer la dépense moyenne dans la population par un intervalle de
confiance de niveau 95%.
2. Combien d’observations doit-on effectuer pour obtenir une marge
d’erreur de 1 au seuil de confiance de 95% ?
σ100
𝑖=1 𝑋𝑖 3007
la moyenne de l’échantillon:𝑋ത = = = 30,07
100 100
𝒏
𝜎 est inconnu. On l’estime par son estimateur ponctuel 𝑆𝑐 = 𝑺 = 6,05
𝒏−𝟏
avec S=6,02
𝑺 𝑺
𝐼0,95 = [𝑋ത − 𝑡0,95 ; 𝑋ത + 𝑡0,95 ]
𝑛−1 𝑛−1
6,02 6,02
= [30,07 − 1,96 × ; 30,07 + 1,96 × ]
99 99
Sara GOTTI 𝐼0,95 SEG
= [28,88;
S3, 2021-2022 31,26] 120
Combien d’observations doit-on effectuer pour obtenir une marge d’erreur
de 1 au seuil de confiance de 95% ?
𝑺 𝑺 6,02
On a la marge d’erreur 𝜀 = 𝑡β = 𝑡0,95 = 1,96
𝑛−1 𝑛−1 𝑛−1
6,02
𝜀=1 alors: 1,96 =1
𝑛−1
6,02 1
= ⇒ 𝑛 − 1 = 6,02 × 1,96
𝑛−1 1,96
𝑛 − 1=(6,02 × 1,96)2 ⇒ n= 1+ (6,02 × 1,96)2 ⇒ n= 140,22

On effectue alors 140 observation pour obtenir une marge d’erreur de 1.
Estimation par intervalle de confiance d’une proportion
• Soit une population ayant des individus possédant une certaine

caractéristique A. On veut estimer à partir d'un échantillon de
taille n la proportion p d'individus possédant cette
caractéristique A.
• Si n est grand (n≥30) ou si la fréquence observée f telle que
nf ≥5 ou n(1−f ) ≥5, alors F la V.A. associée à la proportion
des individus possédant la caractéristique A suit une loi
normale de paramètres:
𝑝𝑞 F-p
alors F↝𝑁(p; ) ; On pose Z = 𝑝𝑞 suit 𝑁(0, 1)
𝑛
𝑛
On se fixe le niveau de confiance 𝛽 (ou le risque 𝜑). On peut

écrire donc que:
β+1
P(−𝑡β ≤ 𝑍 ≤ 𝑡β ) = β ⇒ 2×P(Z≤ 𝑡β )−1= β ⇒ P(Z≤ 𝑡β ) =
2
⇒ on cherche dans la table de la loi normale centrée et réduite la
β+1
valeur de 𝑡β par lecture inverse de .
2

P(−𝑡β ≤ 𝑍 ≤ 𝑡β )= β
F−p
=P(−𝑡β ≤ 𝑝𝑞 ≤ 𝑡β )= β
𝑛
𝑝𝑞 𝑝𝑞
=P(−𝑡β ≤ F−p ≤ 𝑡β )= β
𝑛 𝑛
𝑝𝑞 𝑝𝑞
=P(−𝑡β − 𝐹 ≤ −p ≤ 𝑡β − 𝐹)= β
𝑛 𝑛
𝑝𝑞 𝑝𝑞
=P(𝐹 − 𝑡β ≤ p ≤ 𝐹 + 𝑡β )= β
𝑛 𝑛
𝑓 est l'estimateur ponctuel de 𝑝. Alors F=𝑓. On remplace dans la formule:

𝑝𝑞 𝑝𝑞
P(𝑓 − 𝑡β ≤ p ≤ 𝑓 + 𝑡β )= β
𝑛 𝑛
𝑝𝑞
L’écart-type est inconnu, alors je le remplace par son estimateur
𝑛
ponctuel
𝒏
𝑆𝑐 = 𝑺 avec S est l’écart-type dans l’échantillon
𝒏−𝟏
𝑓(1−𝑓)
Alors S=
𝑛
𝑓(1−𝑓) 𝒏 𝑓(1−𝑓)
d’où 𝑆𝑐 = = on remplace dans la formule de
𝑛 𝒏−𝟏 𝑛−1
probabilité:
𝑓(1−𝑓) 𝑓(1−𝑓)
Alors P(𝑓 − 𝑡β ≤ p ≤ 𝑓 + 𝑡β )= β
𝑛−1 𝑛−1
• l'intervalle de confiance de la proportion 𝑝 au niveau 𝛽 est

donné par:
𝑓(1 − 𝑓) 𝑓(1 − 𝑓)
𝐼𝛽 = [𝑓 − 𝑡β ; 𝑓 + 𝑡β ]
𝑛−1 𝑛−1
𝑓(1−𝑓)
𝑛−1

• Exemple:
Dans une production, on veut évaluer la proportion 𝑝 d’articles
de qualité A. On prélève un échantillon de taille n=50 avec
lequel on trouve f=28% la proportion des articles de qualité A.
on veut estimer la valeur de 𝑝 par intervalle de confiance de
95%.

l'intervalle de confiance de la proportion 𝑝 de niveau 95% est:
𝑓(1 − 𝑓) 𝑓(1 − 𝑓)
𝐼0,95 = [𝑓 − 𝑡0,95 ; 𝑓 + 𝑡0,95 ]
𝑛−1 𝑛−1
Avec 𝑡0,95 = 1,96 , on remplace par les valeurs:
0,28×0,72 0,28×0,72
𝐼0,95 = 0,28 − 1,96 ; 0,28 + 1,96
49 49
𝐼0,95 = [0,15; 0,41]
CHAPITRE 5
Tests statistiques
✓Introduction
✓Principe d’un test de conformité
✓Mécanisme des tests d’hypothèses
✓Hypothèses statistiques
✓Test et région d'acceptation
✓Méthodologie (générale) pour effectuer un test
✓Test de conformité sur une moyenne
✓Test de conformité sur une proportion

Chapitre 5: Tests statistiques
Introduction
• Un test statistique est une méthode permettant de prendre une décision à
partir d'informations fournies par un échantillon.
• Les tests statistiques ou les tests d'hypothèses ont pour but de vérifier, à
partir de données observées dans un ou plusieurs échantillons, la validité
de certaines hypothèses relatives à une ou plusieurs populations.
• Les tests de conformité sont destinés à comparer entre une population
théorique et un échantillon observé. Ils servent à vérifier si un
échantillon donné peut être considéré comme extrait d'une population
possédant telle caractéristique particulière (telle moyenne, telle
proportion, ...).
• Le test se fait en vérifiant si la différence entre la valeur observée et la
valeur théorique du paramètre considéré peut être attribuée au hasard ou
non.
Principe d’un test de conformité
• Pour commencer, on émet une certaine hypothèse à tester, appelée

hypothèse nulle, généralement désignée par H0 . Celle-ci suppose
toujours l'égalité des caractéristiques comparées.
• L'hypothèse qui diffère de H0 est dite hypothèse alternative,
généralement désignée par H1 .
• On mesure ensuite l'écart observé entre les caractéristiques comparées, et
on calcule la probabilité d'observer, si l'hypothèse nulle est vraie, un
écart aussi important.
• L'ensemble des valeurs observées pour lesquelles l'hypothèse nulle est
admissible forme la région d'acceptation. Les autres valeurs constituent
la région de rejet. Les valeurs limites sont appelées valeurs critiques.

• Le jugement d’une hypothèse se fait sur un ou plusieurs

échantillons.
• Ne pas oublier que la conclusion d’un test n’est pas certaine,
elle est associée à un risque d’erreur (faible).
• Ainsi qu'elle que soit la décision prise, le hasard de
l'échantillonnage peut fausser les conclusions.

• Exemple :
Une entreprise utilise une machine qui met du café dans les
sachets. La machine a été réglée sur une norme qui est égale à
250g, c-à-d la machine est censée mettre 250g du café en norme
dans les sachets. Mais, on se demande si la machine a mis par
erreur 249g ou 250g dans les sachets. On sait que la machine
fournie une légères variation.

• Exemple :
Les problèmes rencontrés sont les suivants:
1. Si un sachet pris au hasard dans le lot pèse exactement 250g,
est-on sûr que le lot est bon ?
2. Si il fait exactement 258g, est-on sûr que le lot est mauvais ?
3. Est-ce la même chose si, sur 10 sachets pris au hasard, on a
un poids moyen de 258g?
4. A partir de quelle valeur du poids moyen peut on dire que le
lot est mauvais ?
Mécanisme des tests d’hypothèses
• Le principe général du test statistique peut s'énoncer comme suit :

1. Formuler les hypothèses (H0 ) et (H1 ) : Soit un caractère d'une
population dont la valeur du paramètre (moyenne, proportion, etc.) est
inconnue. Une hypothèse nulle est alors formulée sur ce paramètre
inconnu, elle résulte de considérations théoriques, pratiques ou encore
plus simplement basée sur un pressentiment.
2. Choisir le risque ou le niveau de confiance : Pour effectuer le test
statistique, il faudra choisir un certain risque d'erreur qui est la
probabilité de se tromper en prenant la décision retenue.
3. Il faut définir la statistique qui convient pour effectuer le test appelée
« variable de décision ».

Mécanisme des tests d’hypothèses
4. Déterminer la région d’acceptation qui est l'ensemble des valeurs

prises par la variable de décision qui conduiront à accepter (H0 )
5. On calcule la réalisation de la variable de décision à partir des valeurs
observées (d’un échantillon).
6. Conclusion finale.

Hypothèses statistiques
• Hypothèse nulle H0 : hypothèse selon laquelle on fixe a priori un

paramètre de la population à une valeur particulière.
• Hypothèse alternative H1 (ou contre-hypothèse) : n'importe quelle autre
hypothèse qui diffère de l'hypothèse nulle H0 .
• La formulation des hypothèses peut être écrite comme:
𝜃 = 𝜃0 (𝐻0 ) 𝜃 = 𝜃0 (𝐻0 ) 𝜃 = 𝜃0 (𝐻0 )
𝜃 ≠ 𝜃0 (𝐻1 ) 𝜃 > 𝜃0 (𝐻1 ) 𝜃 < 𝜃0 (𝐻1 )
• La détermination des valeurs limites de la région d’acceptation de
l’hypothèse nulle dépend de l’hypothèse alternative H1 , ainsi on
distingue le test bilatéral et le test unilatéral.
Test et région d'acceptation
Test bilatéral
• Un test est dit bilatéral si la condition de rejet est indépendante

du signe de l’écart observé entre les caractéristiques comparées
𝜃 et 𝜃0 .
• Les hypothèses formulées du test bilatéral sont :
𝜃 = 𝜃0 (𝐻0 )
𝜃 ≠ 𝜃0 𝐻1

Test bilatéral
𝜃 < 𝜃0 𝜃 = 𝜃0 𝜃 > 𝜃0
Rejet de 𝐻0 Acceptation de 𝐻0 Rejet de 𝐻0
𝑨𝟏 𝐴2
• Le niveau de risque 𝛼 est appelé aussi seuil de risque ou de signification
du test, fixé très souvent à 5%. La probabilité contraire (𝛽 = 1 − 𝛼)
désigne le niveau de confiance du test.
• 𝐴1 𝑒𝑡 𝐴2 sont les valeurs critiques qui délimitent la région d’acceptation.
• La région d’acceptation est donc [𝐴1 ; 𝐴2 ], avec:
P(𝐴1 < 𝜃0 < 𝐴2 )= 𝛽
𝛼
P(𝜃0 < 𝐴1 ) = P(𝜃0 > 𝐴2 )=
2
Test unilatéral
• Un test est dit unilatéral si l'hypothèse alternative désigne

qu'une caractéristique est strictement supérieure ou inférieure à
l'autre. On parle respectivement de test unilatéral à droite ou à
gauche.

Test unilatéral
Test unilatéral à droite
• Les hypothèses formulées du test unilatéral à droite sont:
𝜃 = 𝜃0 (𝐻0 )
𝜃 > 𝜃0 𝐻1
• La règle de décision peut être représentée ainsi :
𝜃 ≤ 𝜃0 𝜃 > 𝜃0
Acceptation de 𝐻0 Rejet de 𝐻0
𝑨
• A est la valeur critique qui détermine la région d'acceptation.
• La région d’acceptation est donc l’intervalle: ]−∞; 𝐴]
P(𝜃0 ≤ 𝐴)= 1 − α = 𝛽 𝛼 est le seuil de risque
P(𝜃0 > 𝐴) = α
Test unilatéral
Test unilatéral à gauche
• Les hypothèses formulées du test unilatéral à droite sont:
𝜃 = 𝜃0 (𝐻0 )
𝜃 < 𝜃0 𝐻1
• La règle de décision peut être représentée ainsi :
𝜃 < 𝜃0 𝜃 ≥ 𝜃0
Rejet de 𝐻0 Acceptation de 𝐻0
𝑨
• A est la valeur critique qui détermine la région d'acceptation.
• La région d’acceptation est donc l’intervalle: [A;+∞[
P(𝜃0 ≥ 𝐴)= 1 − α = 𝛽 𝛼 est le seuil de risque
P(𝜃0 < 𝐴) = α
Méthodologie (générale) pour effectuer un test
1. Mise en place du test:
• On écrit les deux hypothèses du test : H0 hypothese nulle et H1 hypothèse alternative,
• H0 est du type " 𝜃 = 𝜃0 "
• H1 remet en question H0 en fonction de la question posée.
𝜃 ≠ 𝜃0 bilatéral
H1 est de la forme 𝜃 < 𝜃0 unilatéral à gauche
𝜃 > 𝜃0 unilatéral à droite
2. Détermination de la zone d’acceptation de H0 :
• On formule la statistique du test sous H0 . Une certaine V.A suit une certaine loi en fonction des
conditions du test.
• On détermine au niveau 1 − 𝛼, la région d’acceptation 𝐼𝛼 telle que:
[A;+∞[ si H1 : 𝜃 < 𝜃0
P(𝐼𝛼 ) = 1 − 𝛼 Avec 𝐼𝛼 = [𝐴1 ; 𝐴2 ] si H1 : 𝜃 ≠ 𝜃0
]−∞; 𝐴] si H1 : 𝜃 > 𝜃0
3. Critère de décision:
• Décision du test, en fonction de la valeur numérique expérimentale et la région d’acceptation 𝐼𝛼 .
Test de conformité sur une moyenne
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• On suppose que X suit une loi Normale de moyenne 𝜇 et

d’écart-type 𝜎.
• 𝝈 est connu : La variable X étudiée au niveau de la population
suit une loi Normale N(𝜇; 𝜎) avec 𝜎 connu. Ainsi la distribution
de 𝑋ത (des moyennes) au niveau de l'échantillon sera:
𝜎 ത
𝑋−𝜇
𝑋ത ↝𝑁(𝜇; ) et Z = 𝜎 ↝𝑁(0; 1)
𝑛
𝑛

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
• Les hypothèses du test se présentent sous la forme :
𝐻0 : μ = 𝜇0
𝐻1 : μ ≠ μ0
2. Détermination de la zone d’acceptation:
• On considère comme variable de décision 𝑋. ത
𝜎
ത
• Si 𝐻0 est vraie (μ = 𝜇0 ) alors 𝑋↝𝑁(𝜇0 ; )
𝑛
• La région d'acceptation du test est un intervalle symétrique autour de
μ0 de la forme 𝐼𝛼 = [c1 ; c2 ]; avec
𝜎 𝜎
Sara GOTTI
c1 = 𝜇0 − 𝑡SEG
𝛼 S3, et c2
2021-2022
= 𝜇0 + 𝑡𝛼 145
𝑛 𝑛
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
• Démonstration:
On se fixe le niveau de risque 𝛼 (ou le niveau de confiance 𝛽 = 1 − 𝛼). On peut écrire
donc que:
𝜎 ത 0
𝑋−𝜇
ത
𝑋↝𝑁(𝜇 0; ); On pose Z = 𝜎 suit 𝑁(0, 1)
𝑛
𝑛
β+1 2−𝛼
P(−𝑡𝛼 ≤ 𝑍 ≤ 𝑡𝛼 ) = 1 − 𝛼 = β ⇒ 2×P(Z≤ 𝑡𝛼 )−1= β ⇒ P(Z≤ 𝑡𝛼 ) = =
2 2
⇒ on cherche dans la table de la loi normale centrée et réduite la valeur de 𝑡𝛼 par
β+1 2−𝛼
lecture inverse de = .
2 2

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
• Démonstration: (suite)
P(−𝑡𝛼 ≤ 𝑍 ≤ 𝑡𝛼 )= β
ത 0
𝑋−𝜇
=P(−𝑡𝛼 ≤ 𝜎 ≤ 𝑡𝛼 )= β
𝑛
𝜎 𝜎
=P(−𝑡𝛼 ത 0 ≤ 𝑡𝛼
≤ 𝑋−𝜇 )= β
𝑛 𝑛
𝜎 𝜎
=P(−𝑡𝛼 − 𝑋ത ≤ −𝜇0 ≤ 𝑡𝛼 − 𝑋)=ത β
𝑛 𝑛
𝜎 𝜎 𝒄𝟏 𝑨𝒄𝒄𝒆𝒑𝒕𝒂𝒕𝒊𝒐𝒏 𝒄𝟐
=P(𝑋ത − 𝑡𝛼 ≤ 𝜇0 ≤ 𝑋ത + 𝑡𝛼 )= β
𝑛 𝑛
• D’où la région d'acceptation autour de μ0 est 𝐼𝛼 = [c1 ; c2 ]; avec

𝜎 𝜎
c1 = 𝜇 0 − 𝑡𝛼 et c2 = 𝜇0 + 𝑡𝛼
𝑛 𝑛
β+1 2−𝛼
NB: la valeur de 𝑡𝛼 se déduit par lecture inverse
SEG S3, 2021-2022 de = 147
2 2
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
• On calcule la réalisation de la variable de décision (തx) à partir des
valeurs observées (d’un échantillon).
• Si xത , la valeur de la moyenne sur l'échantillon, appartient à la zone
d'acceptation (തx ∈ 𝐼𝛼 = [c1 ; c2 ]) alors on accepte (H0 ), sinon, on rejette
H0 .

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
• Exemple:
• Une entreprise A utilise une machine qui met du café dans les sachets. La
machine a été réglée sur une norme (𝜇0 ) qui est égale à 250g, c-à-d la
machine est censée mettre 250g du café en norme dans les sachets. On
suppose que les poids des sachets sont distribués selon une loi Normale
de moyenne 𝜇 et d'écart-type 𝜎 = 20g.
• Le contrôleur a prélevé un échantillon de taille n=20, l’échantillon a
donné un poids moyen 𝑥1 = 249,5𝑔.
• Apres un mois, le contrôleur a prélevé un 2ème échantillon avec un poids
moyen 𝑥2 = 259,3𝑔.
• Peut on considérer, à un niveau de risque de 5%, que la machine
Sara GOTTIfonctionne correctement? SEG S3, 2021-2022 149
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
Les hypothèses du test : 𝐻0 : μ = 𝜇0 = 250
𝐻1 : μ ≠ 250
𝜎 𝜎
𝐼0,05 = [𝜇0 − 𝑡0,05 ;𝜇0 + 𝑡0,05 ]
𝑛 𝑛
avec 𝜇0 = 250 ; 𝜎 = 20 ; 𝑛 = 20 ;
2−0,05
𝑡0,05 = lecture inverse de = 0,957 d’où 𝑡0,05 = 1,96
2

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
𝜎 𝜎
Alors 𝐼0,05 = [𝜇0 − 𝑡0,05 ;𝜇0 + 𝑡0,05 ]=[241,23;258,77]
𝑛 𝑛
• Pour le 1er échantillon on a 𝑥1 = 249,5 et 𝑥1 ∈ 𝐼0,05 alors on accepte 𝐻0 .
On peut dire que la machine fonctionne correctement.
• Tandis qu’après un mois avec le 2ème échantillon 𝑥2 = 259,3 et
𝑥2 ∉ 𝐼0,05 alors on rejette 𝐻0 .
On dit alors qu’il y a un problème avec la machine qu’il faut régler.

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
b. Test unilatéral à droite
𝐻0 : μ = 𝜇0
𝐻1 : μ > μ0
𝜎
ത
𝑛
• La région d'acceptation du test est un intervalle de la forme
𝜎
𝐼𝛼 = ]−∞; 𝐴]; avec 𝐴 = 𝜇0 + 𝑧𝛼
𝑛
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• Démonstration:
On se fixe le niveau de risque 𝛼 (ou le niveau de confiance 𝛽 = 1 − 𝛼).
On peut écrire donc que:
𝜎 ത 0
𝑋−𝜇
ത
𝑛
𝑛
⇒ P(Z≤ 𝑧𝛼 ) =1−𝛼
⇒ on cherche dans la table de la loi normale centrée et réduite la valeur de
𝑧𝛼 par lecture inverse de 1−𝛼.

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
P(𝑋ത ≤ 𝐴)=1 − 𝛼
ത 0
𝑋−𝜇 𝐴−𝜇0
=P( 𝜎 ≤ 𝜎 )=1 − 𝛼
𝑛 𝑛
𝐴−𝜇0
=P(𝑍 ≤ 𝜎 )=1 − 𝛼
𝑛
A
𝐴−𝜇0
⇒ 𝜎 = 𝑧𝛼 (la valeur de 𝑧𝛼 par lecture inverse de 1−𝛼.)
𝑛
𝜎
⇒ 𝐴 = 𝜇0 + 𝑧𝛼
𝑛
𝜎
D’où la région d'acceptation de test est 𝐼𝛼 = ]−∞; 𝐴]; avec 𝐴 = 𝜇0 + 𝑧𝛼
𝑛
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
d'acceptation (തx ∈ 𝐼𝛼 = ]−∞; 𝐴]) alors on accepte (H0 ), sinon, on rejette
H0 .

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• Exemple:
• Un fournisseur reçoit les sachets du café de l’entreprise A. ce fournisseur
va considérer la livraison comme normale que si le poids moyen est
inferieur à 250g. On suppose que les poids des sachets sont distribués
selon une loi Normale de moyenne 𝜇 et d'écart-type 𝜎 = 20g.
• Apres un mois, le contrôleur a prélevé un 2ème échantillon avec un poids
moyen 𝑥2 = 260,2𝑔.
• Peut on considérer, à un niveau de risque de 1,5%, que la livraison a bien
Sara GOTTI
respecter la norme? SEG S3, 2021-2022 156
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
Exemple: (suite)
𝐻1 : μ > 250
𝜎
𝐼0,015 = ]−∞ ; 𝜇0 + 𝑧0,015 𝑛
]
avec 𝜇0 = 250 ; 𝜎 = 20 ; 𝑛 = 20 ;
𝑧0,015 = lecture inverse de (1 − 0,015 = 0,985) d’où 𝑧0,015 =2,27
Alors la région d’acceptation 𝐼0,015 = ]−∞ ; 260,15]
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
Exemple: (suite)
• Pour le 1er échantillon on a 𝑥1 = 248,2 et 𝑥1 ∈ 𝐼0,015 =]−∞;260,15]
alors on accepte 𝐻0 .
On peut dire que la livraison a bien respecter la norme.
• Tandis qu’après un mois avec le 2ème échantillon 𝑥2 = 260,2 et
𝑥2 ∉ 𝐼0,015 alors on rejette 𝐻0 .
On dit alors que la livraison n’a pas respecter la norme.

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
c. Test unilatéral à gauche
𝐻0 : μ = 𝜇0
𝐻1 : μ < μ0
𝜎
ത
𝑛
• La région d'acceptation du test est un intervalle de la forme
𝜎
𝐼𝛼 = [ 𝐴; +∞[; avec 𝐴 = 𝜇0 − 𝑧𝛼
𝑛
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• Démonstration:
On se fixe le niveau de risque 𝛼 (ou le niveau de confiance 𝛽 = 1 − 𝛼).
On peut écrire donc que:
𝜎 ത 0
𝑋−𝜇
ത
𝑛
𝑛
P(𝑋ത ≥ 𝐴)=1 − 𝛼
𝐴−𝜇0
=P(𝑍 ≥ 𝜎 )=1 − 𝛼
𝑛
𝐴−𝜇0
=1−P(𝑍 ≤ 𝜎 )=1 − 𝛼
𝑛
𝐴−𝜇0
=P(𝑍 ≤
Sara GOTTI 𝜎 )=𝛼 SEG S3, 2021-2022 160
𝑛
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
𝐴−𝜇0
P(𝑍 ≤ 𝜎 ) = 𝛼(sachant que 𝛼<0,5)
𝑛
𝐴−𝜇0
=1−P(𝑍 ≤ − 𝜎 )=𝛼
𝑛
𝜇0 −𝐴
=P(𝑍 ≤ 𝜎 )=1 − 𝛼
𝑛
A
𝜇0 −𝐴
⇒ 𝜎 = 𝑧𝛼 (la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼.)
𝑛
𝜎
⇒ 𝐴 = 𝜇0 − 𝑧𝛼
𝑛
𝜎
D’où la région d'acceptation de test est 𝐼𝛼 2021-2022
= [𝐴; +∞[; avec 𝐴 = 𝜇0 − 𝑧𝛼
Sara GOTTI SEG S3, 𝑛 161
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
d'acceptation (തx ∈ 𝐼𝛼 = [𝐴; +∞[) alors on accepte (H0 ), sinon, on rejette
H0 .

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• Exemple:
• Un client reçoit les sachets du café de l’entreprise A. Ce client va
considérer la livraison comme normale que si le poids moyen n’est pas
inferieur à 250g. On suppose que les poids des sachets sont distribués
selon une loi Normale de moyenne 𝜇 et d'écart-type 𝜎 = 20g.
• Peut on considérer, à un niveau de risque de 1,5%, que la livraison a bien
respecter la norme?

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
Exemple: (suite)
𝐻1 : μ < 250
𝜎
𝐼0,015 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛
avec 𝜇0 = 250 ; 𝜎 = 20 ; 𝑛 = 20 ;
𝑧0,015 = lecture inverse de (1 − 0,015 = 0,985) d’où 𝑧0,015 =2,27
Alors la région d’acceptation 𝐼0,015 = [239,85; +∞[
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
Exemple: (suite)
• On a 𝑥1 = 240,2 et 𝑥1 ∈ 𝐼0,015 =[239,85; +∞[ alors on accepte 𝐻0 .
On peut dire que la livraison a bien respecter la norme.

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• 𝝈 est inconnu : La variable X étudiée au niveau de la population suit

une loi Normale N(𝜇; 𝜎) avec 𝜎 inconnu.
• La démarche est la même que pour les tests précédents mais l’écart-type
de la population n'étant pas connue, il est estimé par l’écart-type corrigé
𝒏
𝑆𝑐 = 𝑺 × .
𝒏−𝟏
• Rappelons que la distribution de 𝑋ത (des moyennes) au niveau de

𝑆𝑐 S ത
𝑋−𝜇
l'échantillon sera :𝑋ത ↝ 𝑁(𝜇; )=𝑁(𝜇; ) et Z = S ↝𝑁(0; 1)
𝑛 𝑛−1
𝑛−1

1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
a. Test bilatéral
𝐻0 : μ = 𝜇0
𝐻1 : μ ≠ μ0
S S
𝐼𝛼 = [𝜇0 − 𝑡𝛼 ; 𝜇0 + 𝑡𝛼 ]
𝑛−1 𝑛−1
β+1 2−𝛼
NB: la valeur de 𝑡𝛼 se déduit par lecture inverse de =
2 2
• Si xത la valeur de la moyenne sur l'échantillon, appartient à la zone d'acceptation
(തx ∈ 𝐼𝛼 ) alors on accepte (H0 ), sinon, on rejette H0 .
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
𝐻0 : μ = 𝜇0
𝐻1 : μ > μ0
S
𝐼𝛼 = ]−∞; 𝜇0 + 𝑧𝛼 ]
𝑛−1
NB: la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
• Si xത la valeur de la moyenne sur l'échantillon, appartient à la zone
x ∈ 𝐼𝛼 ) alors onSEGaccepte
Sara GOTTId'acceptation (ത (H0 ), sinon, on rejette H0 .
S3, 2021-2022 168
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
𝐻0 : μ = 𝜇0
𝐻1 : μ < μ0
S
𝐼𝛼 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛−1
NB: la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
• Si xത la valeur de la moyenne sur l'échantillon, appartient à la zone
x ∈ 𝐼𝛼 ) alors onSEGaccepte
Sara GOTTId'acceptation (ത (H0 ), sinon, on rejette H0 .
S3, 2021-2022 169
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
• Exemple:
Dans une étude réalisée l'an dernier, on a observé que la
consommation en électricité des habitants d'une résidence
composée d'appartements de trois pièces est en moyenne de
215dh. Cette année, sur un échantillon de 29 appartements, les
consommation en électricité (𝑋1 , 𝑋2 , … , 𝑋25 ) vérifient:
σ25 𝑋 2
σ25
𝑖=1 𝑋𝑖 = 6400 et
𝑖=1 𝑖
= 49007
29
Supposons que l'échantillon suit une loi N(𝜇; 𝜎).
À un niveau de risque de 2,5%, peut on dire que la
consommation
Sara GOTTI
moyenne est inférieure
SEG S3, 2021-2022
à 215 dh ? 170
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
Exemple: (suite)
𝐻1 : μ < 215
S
𝐼0,025 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛−1
6400
avec𝜇0 = 215; 𝑋ത = 29 = 220, 69 ; 𝑆 = 49007 − 220,692 = 17,41 ; 𝑛 = 29 ;
𝑧0,025 = lecture inverse de 1 − 0,025 = 0,975 d’où 𝑧0,025 =1,96
1. (n < 30) et X ↝𝑁(𝜇; 𝜎)
Exemple: (suite)
On a xത = 220, 69 et xത ∈ 𝐼0,025 =[208,55; +∞[ alors on accepte 𝐻0 .
On peut dire que la consommation moyenne n’est pas inférieure à 215 dh.

• Si la taille de l'échantillon est grande (en pratique n≥30), on

distingue deux cas :
❑𝜎 est connu : les résultats du paragraphe précèdent restent
valables.
❑𝜎 est inconnu : on l'estime par 𝑆𝑐 .

• 𝝈 est connu :
σ σ
❑Test bilatéral : 𝐼𝛼 = [𝜇0 − 𝑡𝛼 ; 𝜇0 + 𝑡𝛼 ]
𝑛 𝑛
β+1 2−𝛼
la valeur de 𝑡𝛼 se déduit par lecture inverse de =
2 2
σ
❑Test unilatéral à droite : 𝐼𝛼 = ]−∞; 𝜇0 + 𝑧𝛼 ]
𝑛
la valeur de 𝑧𝛼 se déduit par lecture inverse de 1−𝛼
σ
❑Test unilatéral à gauche : 𝐼𝛼 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛
• 𝝈 est inconnu :
𝑆 𝑆
❑Test bilatéral : 𝐼𝛼 = [𝜇0 − 𝑡𝛼 ; 𝜇0 + 𝑡𝛼 ]
𝑛−1 𝑛−1
β+1 2−𝛼
2 2
𝑆
❑Test unilatéral à droite : 𝐼𝛼 = ]−∞; 𝜇0 + 𝑧𝛼 ]
𝑛−1
𝑆
❑Test unilatéral à gauche : 𝐼𝛼 = [𝜇0 − 𝑧𝛼 ; +∞[
𝑛−1
Test de conformité sur une proportion
• Soit p la proportion de la population possédant le caractère

considéré. On veut effectuer un test:
H0 : p = p 0
H1 : p > p 0 ; p ≠ p 0 ; p < p 0
• On prend comme variable de décision F.
p0(1−p0)
Si p = p0 , alors la loi de F est normale N(p0 ; )
𝑛
Si et seulement si n≥ 30; np0 ≥ 5; et n(1−p0 )≥ 5

Test bilatéral
• Mise en place du test:
H0 : p = p 0
H1 : p ≠ p 0
• L′intervalle d′acceptation pour F au risque 𝛼 est:
p0(1−p0) p0(1−p0)
𝐼𝛼 = [𝑝0 − 𝑡𝛼 ; 𝑝0 + 𝑡𝛼 ]
𝑛 𝑛
β+1 2−𝛼
2 2
• Critère de décision:
Si la fréquence f sur l'échantillon appartient à 𝐼𝛼 , on accepte (H0 ). Sinon,
on rejette (H0 ).
Test Unilatéral à droite
H0 : p = p 0
H1 : p > p 0
p0(1−p0)
𝐼𝛼 = [0; 𝑝0 + 𝑧𝛼 ]
𝑛
on rejette (H0 ).
Test Unilatéral à gauche
H0 : p = p 0
H1 : p < p 0
p0(1−p0)
𝐼𝛼 = [𝑝0 − 𝑧𝛼 ;1]
𝑛
on rejette (H0 ).

Cours Échantillonnage Et Estimation

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Échantillonnage Et Estimation

Transféré par

Droits d'auteur :

Formats disponibles

Module: Echantillonnage et

Filière Economie et Gestion (Semestre 3)

1. Chapitre 1: Rappels sur les concepts statistiques

Sara GOTTI SEG S3, 2021-2022 2

Sara GOTTI SEG S3, 2021-2022 3

• Variable aléatoire: c’est une variable X associée à une expérience

Sara GOTTI SEG S3, 2021-2022 4

• Variable aléatoire continue: c’est une variable dont le résultat d'une

Sara GOTTI SEG S3, 2021-2022 5

• Lorsqu’il s’agit d’une variable statistique, sa valeur moyenne est la

Sara GOTTI SEG S3, 2021-2022 6

• Écart-type: L'écart-type mesure la dispersion autour de la moyenne. Il

Sara GOTTI SEG S3, 2021-2022 7

Sara GOTTI SEG S3, 2021-2022 8

Lois de probabilité discrètes

Sara GOTTI SEG S3, 2021-2022 9

Lois de probabilité discrètes

Sara GOTTI SEG S3, 2021-2022 10

Lois de probabilité discrètes

Lois de probabilité discrètes

Sara GOTTI SEG S3, 2021-2022 12

Lois de probabilité discrètes

Sara GOTTI SEG S3, 2021-2022 14

Lois de probabilité continues

Sara GOTTI SEG S3, 2021-2022 15

Lois de probabilité continues

Sara GOTTI SEG S3, 2021-2022 16

Lois de probabilité continues

Lois de probabilité continues

Lois de probabilité continues

Sara GOTTI SEG S3, 2021-2022 19

Lois de probabilité continues

• Pour le calcul de probabilités sans utiliser la fonction de densité,

Sara GOTTI SEG S3, 2021-2022 20

Lois de probabilité continues

Sara GOTTI SEG S3, 2021-2022 21

Lois de probabilité continues

Sara GOTTI SEG S3, 2021-2022 22

Lois de probabilité continues

Sara GOTTI SEG S3, 2021-2022 23

Lois de probabilité continues

• La loi Normale centrée réduite est symétrique, c. à. d pour tout

Sara GOTTI SEG S3, 2021-2022 24

Lois de probabilité continues

Sara GOTTI SEG S3, 2021-2022 25

Lois de probabilité continues

Lois de probabilité continues

Lois de probabilité continues

Lois de probabilité continues

Lois de probabilité continues

Lois de probabilité continues

Sara GOTTI SEG S3, 2021-2022 32

• Pour collecter les informations sur une population, deux possibilités

• L’échantillonnage offre une série d'avantages:

Sara GOTTI SEG S3, 2021-2022 34

• Enquête: ensemble d’opérations de collecte et de traitement de données

Sara GOTTI SEG S3, 2021-2022 35

• Echantillon: une partie (sous ensemble) représentative de la

Sara GOTTI SEG S3, 2021-2022 38

Sara GOTTI SEG S3, 2021-2022 39

Sara GOTTI SEG S3, 2021-2022 40

• Méthode d’échantillonnage (ou de sondage) : Procédure par

Sara GOTTI SEG S3, 2021-2022 41

• Un échantillon aléatoire fournit un échantillon