Vous êtes sur la page 1sur 20

ECOLE DES HAUTES ETUDES COMMERCIALES

Module : Statistique de Gestion


Niveau : 1re anne Master (TC)
Groupes : 1, 2, 7 et 8

Anne Acadmique : 2013/2014


Enseignant : KHERRI Abdenacer
Site web : www.sg-ehec.jimdo.com

Support pdagogique de cours N 03 :

Estimation
Plan du cours :
1. Introduction.
2. Terminologie.
3. Symboles utiliss.
4. Formules de la variance et de lcart-type.
5. Estimation.
6. Estimateur.
6.1. Dfinition.
6.2. Proprits.
6.2.1. Convergence.
6.2.2. Biais dun estimateur.
6.2.3. Variance dun estimateur.
7. Types destimation.
7.1. Estimation ponctuelle.
7.1.1. Estimation dune moyenne.
7.1.2. Estimation dune variance.
7.1.3. Estimation dune proportion.
7.2. Estimation par intervalle de confiance.
7.2.1. Estimation dune moyenne.
7.2.2. Estimation dune variance.
7.2.3. Estimation dune proportion.
8. Synthse.
9. Etude de cas.

[ Page 1 sur 20 ]

1. Introduction :
La statistique est lensemble des mthodes scientifiques partir desquelles on recueille,
organise, rsume, prsente et analyse des donnes, et qui permettent den tirer des conclusions
et de prendre des dcisions judicieuses.
Au lieu dexaminer lensemble des donnes possible quon appelle encore "la
population", en pratique, on en tudie une toute petite partie appele "chantillon". partir des
rsultats mesurs sur cet chantillon, nous essayons dinduire des conclusions valables pour
lentiret de la population : cest la partie de la statistique que lon appelle "statistique
inductive" ou "statistique infrentielle". De manire gnrale, linfrence statistique est ltude
des conclusions que lon peut tirer dun chantillon pour une population dont lchantillon est
issu, ainsi que le degr de prcision des conclusions.
Dans ce cadre, les problmes qui se posent sont ceux de lestimation des paramtres
(moyenne, variance, cart-type et proportion) dune population partir des chantillons issus de
cette mme population.
Pour que les conclusions soient valables, il faut que lchantillon soit reprsentatif de la
population. Cela signifie quil doit tre prlev dune manire alatoire, cest--dire que tous les
lments de la population ont la mme probabilit dtre choisis.

[ Page 2 sur 20 ]

2. Terminologie :
Terme

Dfinition

Estimation

Une estimation est une valeur particulire prise par un estimateur.

Estimateur

Statistique dfinie partir dun chantillon (fonction des Xi de lchantillon)


qui permet destimer un paramtre.

Estimation ponctuelle

La valeur de lestimateur calcule partir de lchantillon spcifique qui a t


observ.

Estimation par intervalle


de confiance

Au lieu destimer le paramtre par une seule valeur, on prfrera donner un


intervalle de valeurs pour celui-ci. On pourra ainsi fixer un niveau de
confiance notre estimation et dterminer le degr de prcision ou la marge
derreur qui lui est associe.

Intervalle de confiance

Intervalle qui permet de dfinir une marge d'erreur entre les rsultats
d'un sondage et un relev de la population.

Marge derreur

Valeur ajoute ou soustraite lestimation ponctuelle pour construire


lintervalle de confiance dun paramtre de la population.

connu

Cas o des donnes historiques ou dautres informations fournissent une


valeur de lcart-type de la population avant tout chantillonnage. La
procdure destimation par intervalle utilise cette valeur de dans le calcul de
la marge derreur.

inconnu

Cas le plus courant caractris par labsence bonne base destimation de


lcart-type de la population avant lchantillonnage. La procdure
destimation par intervalle utilise lcart-type de lchantillon pour calculer
la marge derreur.

Tirage exhaustif

Tirage sans remise.

Tirage non exhaustif

Tirage avec remise.

Grands chantillons

La taille de lchantillon est suprieure ou gale 30.

Petits chantillons

La taille de lchantillon est infrieure 30.

Biais et non-biais

"Biais" dsigne un cart entre la valeur dun paramtre et la valeur estime de


ce paramtre.

[ Page 3 sur 20 ]

3. Symboles utiliss :

Symbole

Signification
Lcart-type de la population

La variance de la population
Lcart-type estim de la population
Variance biaise dun chantillon
Variance non biaise dun chantillon

Ecart-type biais dun chantillon


Ecart-type non biais dun chantillon
Valeur estime dun paramtre
Estimateur
La moyenne de la population

Le coefficient de risque
Le coefficient de confiance
La valeur critique (lcart rduit)

4. Formules de la variance et de lcart-type dun chantillon :

La variance biaise :

La variance non biaise :


Lcart-type biais :

Lcart-type non biaise :

[ Page 4 sur 20 ]

5. Estimation :
Pour bien comprendre le sens du mot "estimation", on va citer 3 dfinitions diffrentes
ensuite on donne une dfinition de synthse.
Df (01) : Action destimer, de dterminer une valeur1.
Df (02) : Recherche de la valeur d'un ou de plusieurs paramtres d'une loi statistique
partir d'observations ou de sondages sur un ou plusieurs chantillons d'une population2.
Df (03) : une estimation est une valeur particulire prise par un estimateur3.
Donc on peut dire que :
Lestimation est le procd par lequel on dtermine les valeurs inconnues des
paramtres de la population partir des donnes de lchantillon. Pour cela, on utilise des
distributions thoriques, cest dire des variables alatoires dont on connait les lois de
probabilit.
6. Estimateur :
Un estimateur est une statistique permettant d'valuer un paramtre inconnu relatif une
loi de probabilit (comme son esprance ou sa variance). Il peut par exemple servir estimer
certaines caractristiques d'une population totale partir de donnes obtenues sur
un chantillon.
6.1. Dfinition :
Soient
, , , , , , n ralisations indpendantes de la variable alatoire X
(discrte ou continue) et
un paramtre associ la loi de probabilit suivi par X, un
estimateur du paramtre
est une variable alatoire
fonction des
:
=
, ,, ,,

Si on considre n observations :
estimation de note galement :
=
, ,, ,,

,, ,,

1 . http://www.le-dictionnaire.com/definition.php?mot=estimation
2 . http://www.larousse.fr/dictionnaires/francais/estimation
3 . http://fr.wikipedia.org/wiki/Estimation

[ Page 5 sur 20 ]

, lestimateur

fournira une

Lestimation dun paramtre inconnu, not est fonction des observations rsultant dun
chantillonnage alatoire simple de la population.
Lestimateur est donc une nouvelle variable alatoire construite partir des donnes
exprimentales et dont la valeur se rapproche du paramtre que lon cherche connatre.
Lestimateur de est une variable alatoire
dont la distribution de probabilit
sappelle la distribution dchantillonnage du paramtre .
Lestimateur

admet donc une esprance

et une variance

6.2. Proprits :
6.2.1. Convergence :
Lestimateur
doit tendre vers la valeur relle du paramtre
dindividus tudi augmente. On dit que "lestimateur est convergent".

lorsque le nombre

Si ! > # $ | | > ! # lorsque


Ceci quivaut dire quen limite

lorsque

6.2.2. Biais dun estimateur :

Le biais dun estimateur not /


est la diffrence moyenne entre sa valeur et celle du
paramtre quil estime. Le biais doit tre gal 0 pour avoir un bon estimateur.
/
=/
=/
/
=/
=#
Ainsi lestimateur sera "sans biais" si son esprance est gale la valeur du paramtre de
la population.
/
=
6.2.3. Variance dun estimateur :
Si deux estimateurs sont convergents et sans biais, le plus efficace est celui qui a "la
variance la plus faible" car ses valeurs sont en moyenne plus proches de la quantit estime.
=

[ Page 6 sur 20 ]

7. Types destimation :
La distribution exacte dune variable X modlisant le caractre qui intresse le statisticien
est gnralement partiellement connue. Souvent la loi de X dpend dun paramtre inconnu, on
cherche se faire une ide sur ce paramtre partir des donnes observes sur lchantillon.
Attribuer au paramtre une valeur numrique unique est une estimation ponctuelle, mais
quelles sont les chances pour que cette estimation ponctuelle soit exacte ?
Plutt que destimer un paramtre laide dun seul nombre, il arrive frquemment que lon
fasse lestimation en donnant un intervalle de valeurs, Un intervalle de confiance est dfini de
telle sorte que lon puisse affirmer avec un degr de confiance fix que le paramtre vis se
trouve dans cet intervalle.
7.1. Lestimation ponctuelle :
A partir de lexamen dun chantillon, on essaye dobtenir une information quantitative
sur des paramtres de la population estimer (gnralement et )
est un estimateur de si converge en moyenne vers :
E( ) et V( ) 0 quand n
Un estimateur de est dit sans biais si : E( ) =
Par exemple est un estimateur ponctuel non biais de car E( ) =
=
0 est estimateur biais de

car

Si on utilise la variance 01 =

201 3 =

0 donc

estimateur sans biais de

dans ce cas on dit que 01 est un

7.1.1. Estimation dune moyenne :


La "moyenne arithmtique" constitue le meilleur estimateur de , esprance de la loi de
probabilit de la variable alatoire X :
=

4
5

7.1.2. Estimation dune variance :


connu :

La "variance observe" constitue le meilleur estimateur de 2, variance de la loi de


probabilit de la variable alatoire X lorsque lesprance est connue :
=

4
5

[ Page 7 sur 20 ]

inconnu :

Le meilleur estimateur de 2, variance de la loi de probabilit de la variable alatoire X


lorsque lesprance est inconnue est :
=

0 =

4
5

Exemple : Lors dun concours radiophonique, on note X le nombre des rponses reues
chaque jour, on suppose que 6 , . Durant 10 jours on a obtenu :
200
240
190
150
220
180
170
230
210
210
Calculer la moyenne , lcart-type biais et lcart-type non biais
Donner une estimation ponctuelle de la moyenne et de lcart-type .
Rponse :

......
...

...
...
...

...
...
...

[ Page 8 sur 20 ]

7.1.3. Estimation dune frquence (proportion) :


Soit le schma de Bernoulli dans lequel le caractre A correspond au succs. On not 7 e la
proportion des individus de la "population" possdant le caractre A. La valeur de ce paramtre
tant inconnu, on cherche estimer la frquence 7 partir des donnes observables sur un
chantillon.
A chaque chantillon non exhaustif de taille n, on associe lentier k, nombre dindividus
possdant le caractre A.
Soit K une variable alatoire discrte suivant une loi binomiale B(n,p) et pour laquelle on
souhaite estimer "la proportion 7 ".
La "proportion observe" du nombre de succs observ dans un chantillon de taille n
constitue le meilleur estimateur de 7 :
9
7=8=
Exemple (01) :
On a prlev au hasard, dans une population de pices 100 units, Sur ces 100 units, 20
sont dfectueuses. Estimer la proportion de la population dans ce cas.
Rponse :

....
.....

7.2. Estimation par intervalle de confiance :


Lestimation par intervalle associe un chantillon alatoire, un intervalle :
recouvre avec une certaine probabilit.

; qui

Cet intervalle est appel lintervalle de confiance du paramtre car la probabilit que
dont la valeur est inconnue se trouve compris entre
et
est gale le coefficient de
confiance $
=
< <
Son complment correspond au coefficient de risque

; =

Un intervalle de confiance indique la prcision dune estimation car pour un risque


donn, lintervalle est dautant plus grand que la prcision est faible.
[ Page 9 sur 20 ]

7.2.1. Estimation dune moyenne :


On veut estimer la moyenne de la population laide dun chantillon alatoire (si la
taille de lchantillon est grande ?# la distribution dchantillonnage de la moyenne est
normale quelle que soit la distribution de la population).
6
=
=

On a :

,
avec :
(si le tirage est non exhaustif)

(si le tirage est exhaustif)

suit une loi normale centre rduite N(0,1)

On cherche un intervalle centr sur avec une probabilit gale : $ A

<

B=

On peut distinguer entre les cas suivants :


connue :

, +

Exemple (01) :
La taille moyenne dun chantillon alatoire de 40 personnes extrait dune population de
780 individus est de 170 cm, lcart-type pour toute la population vaut 24 cm. Trouver
lintervalle de confiance pour la taille moyenne de la population 95 %1.
Rponse :

......
...

...
...
...

...
...
...
1 . KHALDI Khaled, Mthodes statistiques et probabilits, OPU, Alger, Algrie, 2000, P175.

[ Page 10 sur 20 ]

inconnue ( ?#) :
avec

, +

Exemple (01) :
Cinq cent tudiants se prsentent un examen, un chantillon alatoire de 38 notes donne
une moyenne gale 8,65 et un cart-type gal 2,82.
Trouvez lintervalle de confiance pour la moyenne des notes de la population 1 :
0,90
0,95
0,99
Rponse :

...
......

...
...
...

...
...
...
1 . KHALDI Khaled, Mthodes statistiques et probabilits, Op.cit, P175.

[ Page 11 sur 20 ]

.
inconnue ( < ?#) :

D G

, + G

Exemple (01) :
Les notes de statistique dune promotion nombreuses dtudiants sont distribues
normalement. De cette promotion on extrait un chantillon de 9 notes. La note moyenne est
9,55 avec un cart-type de 3,65.
Trouvez lintervalle de confiance pour la moyenne des notes de la population 1 :
0,90
0,95
0,99
Rponse :

...
......

...
...
...

...
...
...

1 . KHALDI Khaled, Mthodes statistiques et probabilits, Op.cit, P176.

[ Page 12 sur 20 ]

7.2.2. Estimation dune variance :


On suppose que la distribution de la population est normale. On sait que la variable

suit une loi de H (khi-deux) degrs


On sait que :
$ AH D ;

de libert.

H D ;

FB =

On prend linverse des parties de linquation, on obtient (avec le changement de la


direction de linquation) :
$K

H D

H D ;

L=

On multiplie les parties de linquation par


$M
Donc :

H D
$M

H D

0
0

0 , on obtient :

H D ;

H D ;

[ Page 13 sur 20 ]

F
N=

N=

On dsigne les points a et b sachant que :


O=H D ;

F et P = H D ;

On dtermine les valeurs de a et b partir de la lecture de la table de la loi H


degrs de libert.

Exemple (01) :
Echantillon alatoire de taille 20 prlev dune population qui suit la loi normale, cet
chantillon a donn une variance de
= Q.
Trouvez lintervalle de confiance pour la variance de la population seuil de 95% 1 :
Rponse :

......
...

...
...
...

...
...
...

.321 2009 i [dk lm]oZ qrstZ uvdtwZ[ vZ FHIJKLM PQR XZ[\ ]` ^ab\ cdae .1

[ Page 14 sur 20 ]

7.2.3. Estimation dune proportion :


7 R8

8S

, 8 +

8S
@ T

Exemple (01) :
Un chantillon alatoire de 150 individus sur les 10.000 personnes dune population a
montr que 27 individus possdaient un certain caractre1.
Estimez lintervalle de confiance de la proportion dindividus ayant le caractre dans la
population avec un seuil de confiance = #, :
Rponse :

......
...

...
...
...

...
...
...

1 . KHALDI Khaled, Mthodes statistiques et probabilits, Op.cit, P178.

[ Page 15 sur 20 ]

8. Synthse :
Table de lcart-rduit
Coefficient du risque ()

Ecart-rduit (UV W )
UV

= 0,01

UV

= 0,05

UV

= 0,10
Paramtre estimer
Moyenne de la population (`)

W
W
W

= 2,576
= 1,960
= 1,645

Estimateur

Moyenne de lchantillon (a =

Variance de la population (i W )

Variance de lchantillon (j W =

e
dfg cd
h

k l
e
dfg cd c

Ecart-type de lchantillon (j = @

Ecart-type de la population (i)

h m

k l
e
dfg cd c
h m

Le tableau ci-dessous envisage tous les cas auxquels vous pouvez tre confronts1.
Paramtre estimer

Loi de la population

i W connu

Normale

i W inconnu

Moyenne
Quelconque
n > 30

Variance
Proportion $

Normale

i W connu

i W inconnu
` connu

` inconnu

n > 50

Statistique

Loi
N(0,1)
Student(n-1)
~ N(0,1)
~ N(0,1)
n d.d.l.
n-1 d.d.l.
~ N(0,1)

1 . http://www.iutbayonne.univ-pau.fr/~grau/2A/stat/cadre3.html

[ Page 16 sur 20 ]

9. Etude de cas :

Etude de cas : Machine automatique


Une machine automatique remplit des paquets dont la masse thorique doit tre de 250g.
Les masses observes pour un chantillon de 100 paquets pris au hasard et avec remise la
sortie de la machine, ont donn les rsultats suivants :
Masse en grammes

Nombre de paquets

[ 215 - 225 [
[ 225 - 235 [
[ 235 - 245 [
[ 245 - 255 [
[ 255 - 265 [
[ 265 - 275 [
[ 275 - 285 [

7
11
19
26
18
13
6

Aprs lanalyse de ces donnes par SPSS, on a obtenu les valeurs de la moyenne, la
variance et lcart-type de cet chantillon, la figure suivante montre les rsultats obtenus :

Travail faire :

1. Calculer la moyenne , lcart-type biais et lcart-type non biais et comparer


vos rsultats avec ceux qui ont t obtenus par SPSS.
2. Soit la variable alatoire qui, un paquet prlev au hasard et avec remise la
sortie de la machine, associe son poids en grammes. On suppose que suit une loi
normale de paramtres
et . partir des rsultats obtenus pour lchantillon
prcdent, proposer une estimation ponctuelle de la moyenne et de lcart-type .

3. Soit
la variable alatoire qui, chaque chantillon de 100 paquets prlevs au
hasard et avec remise la sortie de la machine, associe le poids moyen des paquets
[ Page 17 sur 20 ]

de cet chantillon. On sait que suit une loi normale de moyenne et dcart-type
. En utilisant lchantillon prcdent et en prenant pour la valeur de
##

lestimation ponctuelle obtenue la 3me question, dterminer un intervalle de


confiance de la moyenne des poids des paquets au risque de 5 %.

4. Dmontrer que 7 A

B=

5. Dterminer un intervalle de confiance de la moyenne des poids des paquets au


coefficient de confiance 75,4 %.
6. Mme question avec le coefficient de confiance 99 %.
7. Calculer la longueur de chaque intervalle et commenter vos rsultats.
8. Quelle doit tre la taille minimale de lchantillon pour connaitre, avec le coefficient
de confiance 95 %, la moyenne de la population 2 grammes prs ?
NB : tous les rsultats approchs seront arrondis 10-2.

Rponse :

......
...

...
...
...

...
...
...

.
[ Page 18 sur 20 ]

...
...
...

...
...
...

...
...
...

...
...
...

......
...

...
...
...

...
....
..

...
...
...

[ Page 19 sur 20 ]

...
...
...

...
...
...

...
...
...

...
...
...

...
...
...

....
.....

...
...
...

...
...
...

...
...

[ Page 20 sur 20 ]