Vous êtes sur la page 1sur 25

Estimation_S3_N.

GUEHAIR 14/11/2022 1
1) Notions importantes
A – Population
B- Echantillon
2) Etude d’échantillonnage (échantillonnage et
distributions d’échantillonnage)
2.1) La moyenne d’échantillonnage 𝑿ഥ
2.2) La variance d’échantillonnage
2.3) La fréquence d’échantillonnage

Estimation_S3_N.GUEHAIR 14/11/2022 2
1) Notions importantes
A) Population
Population statistique: ensemble des unités statistiques (personnes ou
objets) auxquelles on s'intéresse et sur lesquelles porte une étude. Et
on appelle individu chaque élément de cette population pour lequel des
données sont collectées.
Variable Aléatoire Parente (V.A.P): caractère (ou variable aléatoire)
étudié dans la population statistique (poids, CA, salaire, taille,
bénéfice,…), noté X , Y, Z,…La loi de la V.A.P s’appelle « loi de la
population »

Estimation_S3_N.GUEHAIR 14/11/2022 3
B) Échantillon
Constituer un échantillon =pouvoir de collecter des données pour
répondre à une question concernant une population.
Exemple 1 :Estimer la proportion d’électeurs favorables à un
candidat A du parti de l’US. A partir de la sélection d’un
échantillon de 500 électeurs, on y trouve que 200 de ces
électeurs sont favorables au candidat. La proportion d’électeurs
favorables au candidat A est alors 210 sur 500 soit 42%
Exemple 2: Goodyear a conçu un nouveau type de pneu
permettant d’accroître le kilométrage effectué,
comparativement au nombre de kilomètres effectués avec les
pneus actuellement fabriqués par l’entreprise. Pour estimer le
nombre moyen de kilomètres effectués avec les nouveaux
pneus, le fabricant a sélectionné un échantillon de 150
nouveaux pneus, dans le but de les tester. D’après les résultats
du test, la moyenne de l’échantillon est égale à 36 800
kilomètres. Par conséquent, une estimation du kilométrage
moyen pour la population des nouveaux pneus est de 36 800
kilomètres.
Estimation_S3_N.GUEHAIR 14/11/2022 4
Le choix adéquate de méthodes d’échantillonnage permet de fournir
de «bonnes» estimations des paramètres de la population (une
moyenne d’échantillon fournit une estimation de la moyenne de la
population, une proportion d’échantillon fournit une estimation de la
proportion de la population)
Un tirage non exhaustif consiste à remettre chaque individu tiré après
analyse (on dit souvent tirage avec remise)
Un tirage exhaustif ou tirage sans remise
C) Méthodes d'échantillonnage
Principe : prélever les éléments de l’échantillon de la manière la plus
aléatoire possible.
✓ Échantillonnage aléatoire simple : prélèvement aléatoire directement
dans la population. Ainsi, tous les individus seront tirés de manière
indépendante et auront une chance égale de faire partie de
l’échantillon (la même probabilité d’être sélectionné).
Estimation_S3_N.GUEHAIR 14/11/2022 5
✓Échantillonnage stratifié : consiste à diviser la population en strates
disjointes, elles mêmes suffisamment homogènes. On distingue :
✓ Échantillonnage stratifié représentatif : où la taille de chaque échantillon de
chaque strate est proportionnel à l’effectif de celle-ci :

✓ L’échantillonnage stratifié optimal : où la taille de l’échantillon de chaque


strate est plus proportionnelle à l’écart type estimé de celle-ci :

Exemple 1 : Soit un stock de 800 pièces dans trois ateliers X, Y et Z avec les effectifs respectifs :
N1 = 200, N2 = 500 et N3 = 100 ; la population de chaque atelier est considérée comme homogène. Afin
d'étudier la production on procède à un échantillonnage de taille n = 40, représentant 5% de la production.

Estimation_S3_N.GUEHAIR 14/11/2022 6
2) Etude d’échantillonnage :
Soit P la population supposée connue dont on étudie un caractère X.
❑ Pour un caractère quantitatif, on admet connaître son espérance mathématique E(X)
= µ et sa variance V(X) = 𝜎 2 .
Soit l’ensemble de tous les échantillons de taille n qu’on prélève dans P. On considère
une variable aléatoire X défini sur une population donnée de loi quelconque notée :
X=LQ(µ, σ2)
Pour un échantillon quelconque (non effectivement prélevé), les valeurs (X1, X2, X3,…, Xn)
que prendra le caractère X sont des variables aléatoires.
On dit qu’un échantillon (X1, X2, X3,…, Xn) est aléatoire simple si et seulement si :
◦ Quelque soit i= 1, 2, 3,…,n; la loi de Xi est la même que celle de la V.A.P (X), d’où:
 E (Xi)= E(X)= µ
 V(Xi )= V(X)= σ2
◦ Et les Xi sont indépendants
De même la moyenne: et la variance: 𝑺𝟐𝒆 = 𝑛 σ𝑛𝑖=1(𝑋𝑖 - µ)2
1

sont des variables aléatoires dont nous étudierons la moyenne et la variance

Estimation_S3_N.GUEHAIR 14/11/2022 7
❑Pour une population dont les individus possèdent une propriété
donnée dans une proportion connue p, on étudiera la fréquence
d’apparition de cette propriété dans l’échantillon. Pour un échantillon
non encore prélevé, la fréquence F est une variable aléatoire dont on
étudiera l’espérance mathématique et la variance
2.1) Moyenne de la distribution

Estimation_S3_N.GUEHAIR 14/11/2022 8
Exemple 2 : On effectue une étude démographique sur la fécondité
chez la femme citadine et on considère la variable aléatoire X qui
désigne le nombre d’enfants par famille. On s’intéresse au nombre
moyen d’enfants par famille. Pour cela, on prélève 5 échantillons
aléatoires et on observe la réalisation des 9 V.A 𝑋1 𝑋2 , 𝑋3 ,…, 𝑋9 . Pour
chacun des 5 échantillons on a:

Estimation_S3_N.GUEHAIR 14/11/2022 9
Espérance mathématique :

Variance mathématique :
Tirage non exhaustif : puisqu’il y a remise, les Xi sont indépendants
Alors :

Estimation_S3_N.GUEHAIR 14/11/2022 10
Tirage exhaustif :

2.1) La moyenne d’échantillonnage 𝑿 ഥ


2.1.1) Caractéristiques de 𝑿
La distribution des moyennes d’échantillon est centrée sur la moyenne
µ de la population.
Lorsque n, la taille de l’échantillon augmente, la variabilité de ഥ
𝑿 tend
vers 0 et donc 𝑿 ഥ → µ (loi des grands nombres)

Estimation_S3_N.GUEHAIR 14/11/2022 11
2.1.2) Distribution d’échantillonnage de la statistique 𝑿
ഥ ( Loi de 𝑿
ഥ)
La distribution des diverses valeurs que peut prendre la moyenne des
valeurs de la variable X qui serait obtenue dans tous les échantillons
possibles de même taille n, qu’il est possible d’extraire d’une
population de taille N.
A) la variable parente X est distribuée normalement dans la
population

B) la loi de la variable parente X est inconnue mais on prélève un


grand échantillon
C’est-à-dire le cas où X suit une Loi Quelconque (LQ), la variance 𝝈𝟐 de la
population est connue et n>30
Estimation_S3_N.GUEHAIR 14/11/2022 12
On applique dans ce cas alors le théorème central limite :
Si n≥30, les fluctuations de 𝑿
ഥ suivent approximativement la loi
𝜎2
normale de paramètre (µ, ) (même si la population d’origine n’est pas considérée
𝑛
comme normale c’est X suit une LQ de variance connue 𝝈𝟐 )

Remarque : Dans le cas où X suit une Loi Quelconque (LQ), la variance 𝜎 2 de la


𝑆 𝑋ത −𝜇
population est inconnue et n>30, on aura X → N (𝜇, ) ⇔ 𝑆 → N 0; 1 . On remplace 𝜎 2
𝑛
𝑛
par 𝑆 2 (la variance corrigée de la variance d’échantillonnage)

Estimation_S3_N.GUEHAIR 14/11/2022 13
C) La variable parente X est distribuée normalement dans la population, mais
on ne connaît pas l’écart-type σ de la variable X dans la population (n<30)
On va se contenter de la variance observée dans l’échantillon pour remplacer
cette valeur inconnue. Dans ce cas on travaille avec la statistique de Student :
𝑛𝑆𝑒2 2
→ 𝑥 𝑛
𝜎2
Exercice 1 :
Des paquets de poudre d’amandes de 1,1 kilogramme remplis par une machine en bon état de fonctionnement
ont des poids distribués normalement, avec une moyenne µ, et un écart-type de 0,005kg. Un contrôleur tire un
échantillon de n paquets dans la production pour déterminer leur poids moyen.
Si leur poids moyen n’est pas au moins égal à 1,1kg, l’entreprise risque de perdre son contrat avec son seul
client.
Déterminer quelle doit être la valeur du poids moyen des paquets, notée µ, pour que la société ait moins de 1,5
% de chances de perdre le contrat lorsque la taille de l’échantillon est égale à 17.

Estimation_S3_N.GUEHAIR 14/11/2022 14
2.2) la variance d’échantillonnage
La variance d’un n échantillon est la réalisation
de la variable aléatoire
On peut se demander si cette variable possède la même
propriété que la variable moyenne d’´échantillon, c’est-a-
dire si l’espérance de cette variance est égale à la variance
de la population.
2.2.1) Caractéristiques de la variance d’échantillonnage

(𝑛−1)
E(𝑆𝑒2 ) = 𝜎 2 et
𝑛
Estimation_S3_N.GUEHAIR 14/11/2022 15
2.2.2) Distribution de la variance et de l’écart-type de X
dans un échantillon gaussien
A) Cas où µ = E (X), moyenne de X dans la population est
connue
Les fluctuations des valeurs observées dans un échantillon
de la variable X autour de la moyenne µ sont aléatoires et
caractérisées par la statistique:
1 𝑛
𝟐
𝑺𝒆 = σ𝑖=1(𝑋𝑖 - µ)2 ( c’est la variance mesurée dans un
𝑛
échantillon de taille n est une réalisation de cette statistique)
Estimation_S3_N.GUEHAIR 14/11/2022 16
Si les variables 𝑋ⅈ sont indépendantes et normalement
distribuées (avec µ est connue), on a :

1 𝑛
Si 𝑋ⅈ = N(𝜇; 𝜎) 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑎𝑙é𝑎𝑡𝑜𝑖𝑟𝑒
𝑆𝑒2 = σ𝑖=1(𝑋𝑖 - µ)2 est telle que :
𝑛
𝑛𝑆𝑒2 2
2 → 𝑥𝑛
𝜎
B) Cas où µ = E (X), moyenne de X dans la population est
inconnue
Si maintenant on ne connait pas la moyenne de X dans la
population, on utilise, à défaut, celle des valeurs de la variable
mesurées dans l’échantillon X.

Estimation_S3_N.GUEHAIR 14/11/2022 17
1
Dans ce cas, on utilise la statistique 𝑺𝟐 = σ𝑛𝑖=1(𝑋𝑖 - ഥ )2
𝑿
𝑛−1
B.1) Caractéristiques de la variable 𝑺𝟐
E(𝑆 2 ) = 𝜎 2 ( centré sur la variance 𝜎 2 de la population) et on en déduit la
variance

B.2) Distribution d’échantillonnage de la variable S ² dans le cas d’une


population d’origine normale (quelque soit n)
Les variables 𝑋et
ത 𝑆 2 sont indépendantes.
1
Si 𝑋ⅈ = N(𝜇; 𝜎) 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑎𝑙é𝑎𝑡𝑜𝑖𝑟𝑒 𝑆 =
2
σ𝑛𝑖=1(𝑋𝑖 - 𝑋)
ത 2 est telle que :
𝑛−1
(𝑛−1)𝑆 2 2
→ 𝑥𝑛−1
𝜎2
Estimation_S3_N.GUEHAIR 14/11/2022 18
Exercice 2 :
Soit une lampe dont la durée de vie X est supposée suivre une loi normale de
paramètres µ et σ = 2 unités temps. Des tests sont faits sur un échantillon de taille
n = 15. Déterminer la probabilité d’observer une variance comprise entre 3,8 et 6
unités temps.
C) Fluctuations de la moyenne d’échantillon X dans le cas où
𝜎 2 est inconnue, si la loi de X est normale
Dans le cas où :
La population est d’origine normale : X = N(µ; σ)
𝜎 2 variance de la population inconnue.
n <30, l’échantillon est petit.

Estimation_S3_N.GUEHAIR 14/11/2022 19
Si X=N(µ; σ) et 𝜎 2 est inconnue
Donc
ഥ −µ
𝑿
𝑠 → 𝑇𝑛−1 (Student de degré de liberté n-1)
𝑛
Exercice 3 :
Un téléphérique est conçu pour une charge totale limite de 400 kilogrammes. Le nombre
maximal de personnes est égal à 5 personnes. 0n suppose que le poids d’un individu est
distribué normalement, avec une moyenne égale à 72 kilogrammes.
On admet que la variance des poids des individus de l’échantillon est
𝑺𝟐𝟓 =σ𝒏𝒊=𝟏(𝑿𝒊 − 𝟕𝟎)𝟐 =16 kg
Quelle est la probabilité que le poids d’un groupe de 5 personnes choisies au hasard soit
plus élevé que la charge limite de 400 kilogrammes ?

Estimation_S3_N.GUEHAIR 14/11/2022 20
2.3) Loi de la fréquence d’échantillonnage
Soit p la proportion d’individus dans la population mère satisfaisant un critère A.
On considère la variable aléatoire F, fréquence d’échantillon.
Soit X1, X2, X3,…, Xn est un échantillon aléatoire indépendant de taille 𝑛 , la statistique de la
fréquence d’échantillonnage est :

𝑋𝑖 est une variable de Bernoulli qui prend la valeur 1 si l’individu observé satisfait le critère A, et
la valeur 0 si l’individu observé ne satisfait pas le critère.
F = 𝑓1 , … . . 𝑓𝑛 c’est les valeurs prises par la variable aléatoire F
1 𝑛
Si 𝑥1 , 𝑥2 , 𝑥3 …….,𝑥𝑛 est une réalisation de l’échantillon , avec 𝑓𝑖 = σ𝐼=1 𝑥𝑖 proportion
𝑛
d’individus qui satisfont A dans un échantillon observé)

Estimation_S3_N.GUEHAIR 14/11/2022 21
A) Caractéristiques de F
𝑝(1−𝑝)
E(F) = p et V(F) =
𝑛
B) Loi de F

Si (Les conditions de TCL sont vérifiées)


𝑝(1−𝑝)
alors F → N(p ; ) ( avec q=1-p)
𝑛

Estimation_S3_N.GUEHAIR 14/11/2022 22
2
Caractéristiques Loi de 𝑋ത (ou F) Loi de 𝑆𝑒2 Loi de
Nature du caractère Taille de
des statistiques de Loi de X 𝜎 Variable Variable Variable
étudié X l'échantillon n transformée
Loi
transformée
Loi
transformée
Loi
l'échantillonnage
𝑛 𝑿ഥ −
1 n>30
𝑋ത 𝑋𝑖 𝜎
Connu
𝑖=1 n≤30
si µ est connu si µ est inconnu
𝜎 2
E (𝑋ത) = µ et V (𝑋ത) = 𝑛 𝑿ഥ −
1 X= N(𝜇;𝜎) n>30 𝑆
𝑆𝑒2 = σ𝑖 1(𝑋𝑖 - µ)2
Inconnu
X V.parente est (𝑛−1) 2 𝑿ഥ −
E(𝑆𝑒2) = 𝜎
quantitative 𝑛 n≤30 𝑆
1
2
= 𝑛−1 σ𝑛𝑖=1(𝑋𝑖 - 𝑿
ഥ )2
𝑿ഥ −
𝜎
Connu
E( 2) = 𝜎 2 Quelconque avec E(X)
n>30 D'après T.C.L
= μ et V(X)= 𝑿ഥ −
Inconnu 𝑆

X V.parente est X=Bernoulli de


n≥30 et np≥5 et nq≥5 (T.C.L)
qualitative paramètre P
connu
Estimation_S3_N.GUEHAIR 14/11/2022 23
Exercice 4:
On admet que les notes obtenues à un examen sont distribuées normalement. Un étudiant est reçu si
sa note est supérieure ou égale à 10. On admet que la proportion d’étudiants reçus est égale à 60
%.On tire un échantillon de 50 copies. Quelle est la probabilité que la proportion d’étudiants reçus
soit supérieure à 70 % dans l’échantillon ?
Exercice 5 :
Selon une étude faite par une entreprise sur le comportement des consommateurs, 25% de ceux-ci
sont influencés par la marque lors de l’achat des biens.
1- Si le responsable du service de promotion interroge 100 consommateurs choisis au hasard,
quelle est la probabilité pour :
a- qu’au moins 35 d’entre eux se déclarent influencés par la marque ?
b- que le nombre de consommateur influencés par la marque soit compris entre 35 et 45 ?
2- Déterminez la taille de l'échantillon minimale qui permet d'avoir la probabilité de la question (a)
inférieure ou égale à 1% (on suppose que les conditions du T.C.L sont vérifiées).
Estimation_S3_N.GUEHAIR 14/11/2022 24
EXERCICE 6
Les tubes fluorescents fabriqués par une entreprise ont une durée de vie
moyenne de 750 heures. L’écart type de la durée de vie est évaluée à 50. On
prélève un échantillon aléatoire de 50 tubes dans la production d’une
journée.
Quelle est la probabilité d’obtenir une durée de vie moyenne comprise entre
700 et 800 heures?
Exercice 7:
Un comptable procède à la vérification des écritures comptables. Il s’avère
que 2% de ces dernières peuvent être fasses.
Le comptable en vérifie 500. Quel est le nombre maximum d’opérations
auquel le comptable doit s’attendre pour un risque d’erreur de 5%.

Estimation_S3_N.GUEHAIR 14/11/2022 25

Vous aimerez peut-être aussi