Académique Documents
Professionnel Documents
Culture Documents
CHIKHI EL MOKHTAR
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
•
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Chapitre 3 : Estimation et Échantillonnage
Introduction
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Chapitre 3 : Estimation et Échantillonnage
Introduction
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Chapitre 3 : Estimation et Échantillonnage
Introduction
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Chapitre 3 : Estimation et Échantillonnage
Introduction
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Population à caractère quantitatif Echantillon de taille n
μ : la moyenne de la population ̅ : la moyenne de l’échantillon
σ : l’écart type de la population : l’écart type de l’échantillon
Echantillonnage
cv Echantillon aléatoire
Estimation
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I Estimation ponctuelle
Soit X une variable aléatoire étudiée sur une population dont la loi
de probabilité dépend d'un (ou plusieurs) paramètre θ inconnu
(paramètre d'intérêt).
θ peut-être égal :
I µ la moyenne de la population à caractère quantitatif ;
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I Estimation ponctuelle
Soit X une variable aléatoire étudiée sur une population dont la loi
de probabilité dépend d'un (ou plusieurs) paramètre θ inconnu
(paramètre d'intérêt).
θ peut-être égal :
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I Estimation ponctuelle
Soit X une variable aléatoire étudiée sur une population dont la loi
de probabilité dépend d'un (ou plusieurs) paramètre θ inconnu
(paramètre d'intérêt).
θ peut-être égal :
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Objectif de l'estimation ponctuelle
b n = hn (X 1, . . . , Xn)
Θ
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Estimation
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Remarque 2
• Nous distinguons la variable aléatoire Θ
b n de sa valeur
observée, notée θn .
b
• Nous utiliserons les notations suivantes :
(i) (X1 , . . . , Xn ) désigne l'échantillon aléatoire de
taille n et les n observations ne sont pas encore à
disposition.
(ii) (x1 , . . . , xn ) désigne une réalisation de
l'échantillon aléatoire et les n observations sont à
disposition
• Il faut systématiquement se demander : suis-je entrain de
manipuler une variable aléatoire ou l'une de ses réalisations ?
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• D'après la dénition d'un estimateur d'un paramètre θ qui est :
b n = hn (X 1, . . . , Xn)
Θ
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• D'après la dénition d'un estimateur d'un paramètre θ qui est :
b n = hn (X 1, . . . , Xn)
Θ
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• D'après la dénition d'un estimateur d'un paramètre θ qui est :
b n = hn (X 1, . . . , Xn)
Θ
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Propriétés d'un estimateur
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Propriétés d'un estimateur
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Propriétés d'un estimateur
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• Écart quadratique moyen
Si Θ
b n est un estimateur de θ, nous mesurons la précision de
b n par l'écart quadratique moyen, noté EQM :
Θ
b n − θ)2 = V (Θ
EQM (Θ b n ) = E (Θ b n ) + b(n, θ)2
Remarque
(i) Si Θ
b n est un estimateur sans biais, c'est-à-dire si
b(n, θ) = 0, alors :EQM (Θ b n ) = V (Θ
b n );
(ii) Entre deux estimateurs de θ, nous choisissons
celui dont l'écart quadratique moyen ou le risque
est le plus faible.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• Estimateur relativement plus ecace
Un estimateur Θb 1 est relativement plus ecace qu'un
n
b 2 s'il est plus précis que le second, c'est-à-dire si :
estimateur Θ n
b1
EQM Θ ≤ EQM Θ b2
n n
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• Estimateur convergent
Un estimateur Θ b n est un estimateur convergent s'il converge
en probabilité vers θ quand n tend vers l'inni.
i.e.
lim p(| Θb n − θ |< ) = 1 ∀ > 0
n→+∞
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I.1 Estimation ponctuelle de la moyenne µ et de l'écart-type
σ de la population
Soit X une variable aléatoire étudiée sur une population de moyenne
µ et de variance σ 2 . X1 , . . . , Xn un n− échantillon aléatoire tiré de
la population de même loi que X . et x1 , . . . , xn sa réalisation.
• µ inconnue (paramètre d'intérêt)
•• Estimateur de la moyenne µ de la population
(i) L'estimateur de µ est X n qu'est égal à :
n
1X
Xn = Xi
n
i=1
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
• σ inconnu (paramètre d'intérêt)
•• Estimateur de l'écart-type σ de la population
• • • Cas où µ est connue
(i) l'estimateur de σ 2 est :
n
1X
Sn2 = (Xi − µ)2
n
i=1
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Exemple :
Lors d'un contrôle d'une chaîne de médicaments, on s'intéresse au
nombre de comprimés défectueux dans un lot. L'étude de 200 lots a
donné les résultats suivants :
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Réponse :
I Calcul de la moyenne x 200 de l'échantillon :
1 241
x 200 = {0∗75+1∗53+2∗39+3∗23+4∗9+5∗1} = = 1.205
200 200
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Réponse :
i=1
alors
585
q
2
se = − 1.2052 = 1, 473 ⇒ se = se2 = 1.214
200
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I L'estimation ponctuelle de la moyenne µ est la moyenne x 200
b = x 200 = 1.205
de l'échantillon,i.e µ
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I L'estimation ponctuelle de l'écart type σ est s t.q.
6
1 200
s2 = ni xi2 − x 2 = 1.48
X
200 − 1 200 − 1 200
i=1
√
alors s = s 2 = 1.217 et σ
b = 1.217
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I Remarque,on a :
n 2
s2 = s
n−1 e
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I.2 Estimation ponctuelle de la proportion p inconnue d'un
caractère dans une population
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Estimation par intervalle de conance
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Dénition
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Remarque
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Intervalle de conance pour la moyenne µ
Soit X une variable aléatoire de moyenne µ inconnue et
d'écart-type σ. X1 , . . . , Xn un échantillon indépendants et de même
loi que X . x n est l'estimation ponctuelle de µ
1) Cas des petits échantillons (n < 30)
on suppose que X suit une loi normale
(i) Cas où σ est connu
L'intervalle de conance de µ à 1 − α est :
σ σ
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n
avec n est la taille de l'échantillon et zα/2 est le fractile de la
loi N (0, 1) tel que :
p Z < zα/2 = 1 − α/2
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
(ii) Cas où σ est inconnu
L'intervalle de conance de µ à 1 − α est :
s s
IC1−α (µ) = x n − tα/2,n−1 √ , x n + tα/2,n−1 √
n n
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
2) Cas des grands échantillons (n ≥ 30)
La loi de X est supposée quelconque
(i) σ connu
σ σ
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n
(ii) σ inconnu
s s
IC1−α (µ) = x n − zα/2 √ , x n + zα/2 √
n n
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
On donne les valeurs de zα/2 pour quelque valeurs de α
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Intervalle de conance de la proportion p
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Exercices
Exercice 1 :
Cent patients ont reçu un nouveau traitement contre la migraine. A
la n du traitement, le médecin leur a demandé s'ils avaient perçu
une amélioration de leur état migraineux.La proportion de réponses
favorables était de 57%. Quel est l'intervalle de conance au risque
de 5% du proportion des patients satisfaits par ce nouveau
traitement ?
Exercice 2 :
Soit X le poids du nouveau-né. On suppose que X suit une loi
normale. Un échantillon des nouveau-nés de taille 20 donne :
xi = 62 kg et xi2 = 202.2.
P P
1) donner l'estimation ponctuelle de la moyenne et l'écart-type de
la population.
2) donner l'intervalle de conance à 95% de la moyenne de la
population.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
III Détermination de la taille de l'échantillon
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
1. Utilisation de l'inégalité de Bienaymé Tchebyche (I.B.T)
Cette inégalité n'est utilisée que si la loi de la variable aléatoire
étudiée est complètement inconnue. Cette méthode aboutit à des
échantillons de tailles élevés.
σ2
p(| X n − µ |< ) ≥ 1 −
n2
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I n : taille de l'échantillon ;
I : precision souhaitée ;
I X n : moyenne de l'échatillon ;
I µ : moyenne de la population ;
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
En pratique :
I On se xe la precision souhaitée (une marge d'erreur) ;
p(| X n − µ |< ) ≥ 1 − α
σ2
1− = 1 − α;
n2
σ2
n=
α2
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
1.2 Taille d'échantillon pour estimer une proportion.
I n : taille de l'échantillon ;
I : precision souhaitée ;
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
I p : proportion de la population ; elle est souvent inconnue. IL faut
avoir des informations antérieurs ou il faut l'estimer à partir d'un
échantillon auxiliaire ou on utilise une proportion de 50%.
p(1 − p)
1− = 1 − α,
n2
p(1 − p)
n=
α2
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
2. Utilisation de la loi normale
On applique cette méthode si la variable suit la loi normale ou si
elle peut être approchée une loi normale.
2.1 Taille d'échantillon pour estimer une moyenne
2 σ2
n = zα/2
2
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Si σ est inconnu , il faut le remplacer son estimation calculée à
partir d'un échantillon auxiliaire.
Remarque :
Si n ≥ 30 et n
N ≤ 5% on peut considérer ESAR ∼
= ESSR.
I ESAR : échantillon aléatoire simple avec remise ;
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
un calcul assez long nous donne
2 σ2N
zα/2
n= 2 σ2
2 N + zα/2
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
2.2 Taille d'échantillon pour estimer une proportion
2 f (1 − f )
n = zα/2
2
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
b) cas des prélèvements dans une population nie
sans remise
N−n p(1−p)
dans ce cas on a : E (F ) = p et V (F ) = N−1 n
un calcul assez long nous donne
2 p(1 − p)N
zα/ 2
n= 2 p(1 − p)
2 N + zα/2
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
III Quelques méthodes d'échantillonnages
Terminologie
• Population : ensemble des unités sur lesquelles porte l'étude
(notons N la taille de la population).
• Échantillon : sous-ensemble d'unités de population (notons n la
taille de l'échantillon).
• Sondage : toute forme d'échantillonnage qui permet de constituer
un échantillon à partir de la population.
• Taux de sondage : rapport entre la taille de l'échantillon et la taille
de la population.
• Estimation : résultat estimé à partir des données observées dans
l'échantillon qui représente la valeur vraie du phénomène dans la
population, avec un certain degré d'incertitude.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
On distingue deux types d'échantillonnages :
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
3.1 Quelques méthodes d'échantillonnages probabilistes
a) Échantillon aléatoire simple EAS.
Un échantillon est aléatoire simple si tous les individus de la
population ont la même probabilité de gurer dans l'échantillon.
I Pour prélever un échantillon aléatoire simple dans une population
nie,il faut procéder les démarches suivantes :
1) constituer la base de sondage qui correspond à la liste
complète et sans répétition des éléments de la
population ;
2) numéroter ces éléments de 1 à N;
3) procéder à l'aide d'un générateur de nombres
aléatoires à la sélection des unités diérentes qui
constitueront l'échantillon.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
3.1 Quelques méthodes d'échantillonnages probabilistes
b) Échantillonnage stratié.
On utilise ce type d'échantillonnage, lorsque la population est très
hétérogène, cette procédure permet d'améliorer la précision des
estimateurs retenus à partir d'un sondage aléatoire. La stratication
consiste à découper la population étudiée en groupes homogènes
(i.e variance interne est petite ; variance externe est grande) ,
appelés strates, et à tirer indépendamment un échantillon aléatoire
dans chaque strate.
I Avantages : Il est peu probable de choisir un échantillon absurde
puisqu'on s'assure de la présence proportionnelle de tous les divers
sous-groupes composant la population.
I Désavantages : La méthode suppose l'existence d'une liste de la
population. Il faut aussi connaître comment cette population se
répartit selon certaines strates.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
Principe
I On divise la population en k strates Si , i = 1; . . . ; k;
Soit ωi = Ni
N le poids de la strate Si par rapport au population. donc
n
ni = ωi ∗ n = ∗ Ni
N
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
2) Répartition optimale :
- Poids de la strate Si , ωi ;
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
On choisit dans chaque strate ni individus tels que :
ni = k ∗ ω√i Cσi avec k = P ω Gσ √C
i i i i
c) Échantillonnage par grappe : Si la population est constituée
de plusieurs groupes hétérogène (i.e variance intra-groupe est
grande et variance inter-groupes est petite), on utilise dans ce cas
l'échantillonnage par grappe. Le sous-groupe de la population
dénit une grappe. Ce sont les grappes qui sont tirées au sort dans
la population et l'ensemble des sujets d'une grappe tirée au sort
sera enquêté.
I Avantages : il n'est pas nécessaire de disposer d'une base de
sondage des individus, une liste des grappes sut ce qui permet de
réduire les coûts de déplacement, de suivi et de supervision.
I Désavantages : le sondage est moins précis que le sondage aléatoire
simple et l'analyse doit prendre en compte l'eet grappe, ce qui est
plus complexe.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.
d) Échantillonnage systématique :
Sondage systématique : est une méthode qui exige aussi l'existence
d'une liste de la population où chaque individu est numéroté de 1
jusqu'à N . L'entier voisin de N/n sera noté r et appelé raison de
sondage ou pas de sondage.
Pour constituer l'échantillon, on choisit au hasard un entier naturel
i entre 1 et r (cet entier sera le point de départ). L'individu dont le
numéro correspond à i est le premier individu, pour sélectionner les
autres, il sut d'ajouter à i la raison de sondage : les individus
choisis seront alors ceux dont les numéros correspondent à i + r ,
i + 2r , i + 3r ,...,i + (n − 1)r .
I Avantages : facile à sélectionner parce qu'un seul individu est choisi
au hasard, ainsi on peut obtenir une bonne précision parce que la
méthode permet de répartir l'échantillon dans l'ensemble de la liste.
I Désavantages : Les données peuvent être biaisées à cause de la
périodicité.
Cours de Probabilité et Statistique pour la deuxième année des conseillers en planication et en orientation C.O.P.E.