Vous êtes sur la page 1sur 12

Leçon 5 

: Estimation Statistique

SOW Tierno

06-04-2017
1.0
Table des
matières

Objectifs 3

I - Définitions 4

II -

1. Echantillonage ........................................................................................................................ 4

2. Distribution d'échantillonnage ............................................................................................ 5

III - Estimateurs 8

IV -

1. Statistique ............................................................................................................................... 8

2. Définition ................................................................................................................................ 8

3. Estimation ............................................................................................................................... 9
Objectifs

A la fin de ce chapitre il faut :


- Avoir eu une bonne connaissance des estimateurs des paramètres principaux (moyenne, proportion,
variance etc.)
- Savoir les appliquer à l'estimation de ceux - ci

3
Définitions

Définitions
I
1. Echantillonage

La procédure d'échantillonnage est à la base de toute la Statistique. C'est la façon la plus


courante de récolter des informations. Il est en effet, le plus souvent, impossible de mesurer
tous les objets ou individus d'une population donnée, pour trois raisons :
- la population considérée peut contenir une infinité d'unités statistiques;
- le coût d'une observation (ou mesure) est non nul, et limite la taille de l'échantillon;
- la mesure peut, dans certain cas, détruire l'objet mesuré.
Si la procédure est souvent incontournable, elle "se trompe" : un échantillon apporte une
information partielle sur la population et il y a un écart entre le résultat obtenu sur l'échantillon
et celui qu'on aurait eu si on avait mesuré toute la population ; c'est l'erreur d'échantillonnage
L'objet de la théorie de l'échantillonnage est de déterminer l'erreur d'échantillonnage(1), la
contrôler et faire en sorte qu'elle soit la plus faible possible, pour un coût fixé.
On distingue, à cet effet :
- l'échantillonnage aléatoire simple,
- l'échantillonnage stratifié,
- le sondage à plusieurs degrés

Définition : Unités statistiques (individus)


La définition de l'unité ne pose aucun problème dans une population humaine ou animale, ou dans
l'industrie par exemple, si on considère un ensemble de produits (voitures, boulons,
microprocesseurs, etc.)

4
Définitions

La définition de l'unité est plus délicate quand il s'agit d'un liquide, ou d'un matériel en vrac (un tas
de charbon par exemple).
Définition : Population
C'est un ensemble d'unités sur lesquelles porte l'étude: une bonne question à poser avant toute
procédure d'échantillonnage est : " Quelle est la population étudiée ? "
Définition : Un échantillon
Un échantillon de taille n est une liste de n individus ( ω 1, ω2, . . .ωn) extraits de la population
(appelée parfois population-mère).
Définition : Un échantillonnage
On appelle échantillonnage le prélèvement des échantillons. Le rapport t de l'effectif n de
l'échantillon à l'effectif N de la population, dans laquelle il a été prélevé, est appelé taux

d'échantillonnage ou taux de sondage : .

Définition : Base de sondage


On appelle base de sondage la liste exhaustive des individus de la population – mère. Elle est
théoriquement nécessaire pour procéder à des tirages au hasard corrects. Mais elle n'existe pas
toujours ou bien elle peut être fausse ou incomplète.
Définition : échantillon aléatoire
C'est un prélèvement de n individus dans une population - mère de façon que toutes les
combinaisons possibles de n individus aient la même probabilité d'être prélevées. Cela peut être
obtenu à l'aide d'une table de nombres au hasard.
Définition : échantillon raisonné
On réalise un échantillon raisonné lorsqu'on impose à l'échantillon d'avoir une structure identique à
celle de la population - mère pour un certain nombre de facteurs dont on pense qu'ils influencent
le phénomène étudié. Pour chaque modalité des différents caractères qualitatifs retenus pour
décrire ces facteurs, l'échantillon doit contenir un nombre précis d'individus présentant cette
modalité ( méthode des quotas).
Définition : échantillonnage exhaustif ou sans remise
C'est un prélèvement de n individus en une seule fois, ou successivement sans remise, dans la
population - mère.
Définition : échantillonnage non exhaustif ou avec remise
lorsque chaque individu prélevé est remis dans la population - mère avant le tirage de l'individu
suivant.
Lorsque le taux f d'échantillonnage aléatoire exhaustif est suffisamment petit (f < 0,05), on peut
assimiler l'échantillonnage exhaustif à un échantillonnage avec remise.

2. Distribution d'échantillonnage
Soit X une variable aléatoire telle que : E(X) = m et x =
On considère un échantillon (X1, X2, . . . , Xn) de X. On s'intéresse aux variables aléatoires
suivantes (appelées Statistiques) :

Exemple
Quatre étudiants A, B, C, et D passent un examen composé de 20 questions. Le nombre de bonnes

5
Définitions

réponses de chacun est donné par le tableau suivant.

Etudiant A B C D

Nombre de 4 8 12 20
bonnes réponses

On constitue des échantillons de taille 2.


1. Si le tirage se fait sans remise, il y a C42= 6 échantillons {(A, B), A, C); (A, D); (B, C); . }
2. Si le tirage se fait avec remise, on obtiendra 24 = 16 échantillons{(A, A); (A, B) ; ( A,C);...}

Distribution de la moyenne d'échantillon :

1. (tirage avec remise) - On obtient les valeurs suivantes :


4 6 8 12 6 8 10 14 8 10 12 16 12 14 16 20
Et la distribution correspondante est :

4 6 8 10 12 14 16 20 ni

ni 1 2 3 2 3 2 2 1 16

En calculant la moyenne et l'écart - type de cette distribution, on obtient :

2. ( tirage sans remise) - Les valeurs de sont les suivantes:


6, 8, 10, 12, 14 et 16,
dont la distribution est la suivante :

6 8 10 12 14 16 ni

ni 1 1 1 1 1 1 6

Et on a :

Résultats théoriques
Soit C un caractère défini sur une population - mère Ω.
S'il est quantitatif, on peut lui associer une variable aléatoire X, de moyenne m ( c'est – à -
dire E(X) = m ) et d'écart – type ( V(X) = 2 ).
Et on démontre que pour un échantillon obtenu par tirage avec remise :
1. O n a, quelle que soit la loi de X, :

: E(V) = 2

2. Si X suit une loi N(m, ),

suit une loi normale centrée et réduite N(0, 1).

suit une loi de Student à n-1 degrés de liberté. S étant l'estimation de .

suit une loi du 2 à n-1 degrés de liberté.

6
Définitions

suit une loi du 2 à n degrés de liberté.


S'il est qualitatif, on peut lui associer une variable aléatoire K, nombre d'apparitions de l'une
des modalités dans un échantillon de taille n, issu d'une population - mère d'effectif N. La
variable aléatoire est appelée fréquence d'échantillon.

On démontre que pour des tirages avec remise, E(F) = p, , et nF suit une loi B(n,
p) qui peut être approximée par une loi N(np,

7
Estimateurs

Estimateurs
II
1. Statistique
Une Statistique est une application T, qui à un échantillon aléatoire ( X1, X2, , Xn) tiré d'une
variable X, associe une variable aléatoire Y =T( X1, X2, . ,Xn).

2. Définition
Définition
Soit P une population étudiée selon un caractère C; soit n la taille d'un échantillon. Et on cherche à
connaître la valeur d'une caractéristique θ de la population (m ou par exemple), à partir d'une
valeur α calculée en fonction de x1, x2, . . . , xn valeurs observées dans l'échantillon.
Soit X une variable aléatoire dont la loi de probabilité dépend d'un paramètre θ. Un Estimateur de θ
est une Statistique Y=T( X1, X2, ., Xn).

Exemple

Estimateur de la moyenne : est un estimateur de la moyenne m; et

est une estimation de m.

Propriétés de l'estimateur

Estimateurs de la variance : sont

des estimateurs de 2. S2 est appelé variance d'échantillon ( ou empirique) et S'2 la quasi


variance d'échantillon. Et S et S' sont des estimateurs de l'écart - type (1)

Propriétés de S2 et S ' 2 -

Estimateur d'une proportion . où les xi sont indépendantes et suivent une loi de

Bernouilli B(1, ρ) est un estimateur de p.

Propriétés de F : E(F) = p et V(F) =

8
Estimateurs

Qualités d'un estimateur

Estimateur sans biais (ou centré)

Y est sans biais si E(Y) =θ. Ainsi est un estimateur sans biais de m.

et S'2 sont des estimateurs centrés : E ( )= m; E(S'2) =V(X) = 2

Estimateur convergent
Si Y est centré et V(Y) tend vers zéro, on dit que Y est un estimateur convergent :

est S '2 un estimateur convergent :

3. Estimation
Connaissant (moyenne ) et s ( écart - type) d'un échantillon de taille n, il s'agit d'estimer la
moyenne m (ou la proportion p) inconnue, de la population mère P. Deux méthodes sont
possibles :
l'estimation ponctuelle - on choisit une valeur m = m0.
l'estimation par intervalle de confiance - On choisit un intervalle de R contenant m avec
une probabilité donnée.

Estimation ponctuelle

Estimation ponctuelle d'une moyenne :

Estimation ponctuelle d'une proportion.

Estimation ponctuelle d'une variance.

Estimation d'une moyenne et d'une variance à partir de deux échantillons.


On considère deux échantillons E1 et E2, de tailles respectives n1 et n2.

Les moyennes de ces deux échantillons sont respectivement : 1 et 2 Les estimations sont les
suivantes :

9
Estimateurs

Estimation par intervalle de confiance

Intervalle de confiance pour la moyenne m


X N (m, ), étant connu l'intervalle de confiance pour m est un intervalle ]a, b[ tel que :

, 1 - α est appelé le niveau de confiance;

Cet intervalle est de la forme suivante :

X N (m, ), étant inconnu et n  30 -  inconnu, on remplace par son estimation s


ou s '.

Et dans ce cas on a : , loi de Student

X N (m, ), étant inconnu et n > 30 - inconnu, on remplace par son estimation s

Et dans ce cas on a :

X ne suit pas N(m, ), et n  30 -

Intervalle de confiance pour une proportion p .

Si n est faible (n < 30 ), on utilise la méthode de l'ellipse. l'intervalle de confiance s'obtient en


résolvant l'équation suivante en p : Il s'agit de l'équation d'une ellipse.

Application : Détermination de la taille d'un échantillon pour une estimation dont la précision
est fixée.

Soit une estimation de m telle que : on veut déterminer la taille n, de l'échantillon,

requise.

Si on cherche à estimer p avec une incertitude Δp pour un niveau de confiance 1-α, à risques

symétriques.

Si f est inconnu, on obtient une majoration de n pour f = 0,5 ( cas le plus défavorable pour un

sondage)

10
Estimateurs

Exemple

Dans le cas d'un intervalle à 95%,

Tableau des valeurs de nMax

Δp \ 1-α 0,90 0,95 0,98

0,01 6760 9600 13 530

0,02 1700 2400 3 380

0,05 270 380 540

Intervalle de confiance pour la différence de deux moyennes


Soient X1 N(m1, 1) et X2 N(m2, 2), indépendantes; et soit D = X1 - X2
L'intervalle de confiance pour m1 - m2 est :

Intervalle de confiance pour la différence de deux proportions

avec

NB : On peut prendre

Intervalle de confiance pour la variance 2 X N(m, )

Exemple
Une population est caractérisée par une variable aléatoire X N(m, ). Déterminer les intervalles
de confiance des paramètres dans les cas suivants :
1°) Intervalle de confiance pour m à 90% :
n=20;
n=100
l'écart - type  est inconnu. Déterminer un intervalle de confiance pour m au niveau de 95%.

L'écart - type  est inconnu; déterminer un intervalle de confiance pour 2, sachant que :

11
Estimateurs

En déduire un intervalle de confiance pour , au niveau 95%.


Solution
X N(m, ) 1-α=0,90 1-α/2 =0,95 et u0,95 = 1,645. L'intervalle de confiance pour m est de la

forme :

On trouve :

est inconnu

m et inconnus

Exemple
Lors d'un sondage précédant des élections, 500 personnes ont été interrogées. Bien que ce ne soit
pas en pratique, on suppose pour simplifier les calculs que les 500 personnes représentent un
échantillon indépendant et identiquement distribué de la population.
Sur les 500 personnes, 150 ont répondu vouloir voter pour le candidat C1 et 140 pour le candidat C
2.
1. Donner une estimation ponctuelle des intentions de votes, sous forme de pourcentage.
2. Donner un intervalle de confiance à 95% pour les intentions des votes de chacun des deux.
Solution – n=500 ; k1=150 ; k2=140
Estimation ponctuelle des votes

L'estimateur d'une proportion est la variable (fréquence d'échantillon) ; lorsque

n>30, F suit une loi ; et o obtient :

Intervalles de confiance à 95% ; ils sont de la forme suivante :

Ainsi au niveau de confiance de 95%, les chances de C1sont comprises entre 25,98% et 34,02 %. Et
pour C2 entre 24,06% et 31,94%.

12

Vous aimerez peut-être aussi