Vous êtes sur la page 1sur 17

FIIFO 3

PROBABILITES - STATISTIQUES

ESTIMATION DE PARAMTRES

1.

INTRODUCTION
Estimer ne cote presque rien, Estimer incorrectement cote cher. Vieux proverbe chinois.

Dans de nombreux domaines (scientifiques, conomiques, pidmiologiques...), on a besoin de connatre certaines caractristiques dune population. Mais, en rgle gnrale, on ne peut pas les valuer facilement du fait de leffectif trop important des populations concernes. La solution consiste alors estimer le paramtre cherch partir de celui observ sur un chantillon plus petit. Lide de dcrire une population partir dun chantillon rduit, laide dun multiplicateur , na t imagine que dans la seconde moiti du XVIIIme sicle, notamment par lcole arithmtique politique anglaise. Elle engendra une vritable rvolution : lobservation dchantillons permettait dviter des recensements dune lourdeur et dun prix exorbitants. Toutefois, on saperut rapidement que les rsultats manquaient dexactitude. Nous savons maintenant pourquoi : on ne prenait en considration ni la reprsentativit de lchantillon, ni les fluctuations dchantillonnage. Cest l que le hasard intervient. La premire prcaution prendre est donc dobtenir un chantillon reprsentatif. Nous pourrons en obtenir un par tirage au sort (voir le chapitre prcdent sur lchantillonnage alatoire simple) : le hasard participe donc au travail du statisticien qui lutilise pour pouvoir le matriser ! Mais , mme tir au sort, un chantillon nest pas limage exacte de la population, en raison des fluctuations dchantillonnage. Lorsque, par exemple, on tire au sort des chantillons dans un urne contenant 20 % de boules blanches, on obtient des chantillons o la proportion de boules blanches fluctue autour de 20%. Ces fluctuations sont imprvisibles : le hasard peut produire nimporte quel cart par rapport la proportion de la population (20%). Cependant, on sen doute, tous les carts ne sont pas galement vraisemblables : les trs grands carts sont trs peu probables. Au moyen du calcul des probabilits, le statisticien dfinit un intervalle autour du taux observ, intervalle qui contient probablement le vrai taux : cest lintervalle de confiance ou, plus couramment, la fourchette . Si lon ne peut connatre le vrai taux par chantillonnage, peut-on au moins le situer avec certitude dans la fourchette ? Non. Le hasard tant capable de tous les caprices, on ne peut raisonner quen termes de probabilits, et la fourchette na de signification quassortie dun certain risque derreur. On adopte souvent un risque de 5% : cinq fois sur cent, le taux mesur sur lchantillon nest pas le bon, le vrai taux tant en dehors de la fourchette. On peut diminuer le risque derreur mais alors la fourchette grandit et perd de son intrt. Bien entendu, il existe une infinit de fourchettes, une pour chaque risque derreur adopt. On doit trouver un compromis entre le risque acceptable et le souci de prcision.
J-P LENOIR Page 83 CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

J-P LENOIR

Page 84

CHAPITRE 5

FIIFO 3 Exemple :

PROBABILITES - STATISTIQUES

Mesure du taux de sropositifs pour le sida dans une population. On a observ 25 sropositifs sur un chantillon de 5000 sujets, soit un taux de 5/00. Ce taux observ na de signification quassorti dune fourchette : le risque que le vrai taux sorte dune fourchette comprise entre 3/ 00 et 7/ 00 est acceptable (figure du haut). On peut diminuer ce risque, mais alors la fourchette est plus large, et devient moins intressante (figure du bas). Dans ce cours, nous allons apprendre estimer laide dun chantillon : Dans le cas dun caractre quantitatif la moyenne m et lcart-type pop dune population. Dans le cas dun caractre qualitatif, la proportion p de la population. Ces estimations peuvent sexprimer par une seule valeur (estimation ponctuelle), soit par un intervalle (estimation par intervalle de confiance). Bien sr, comme lchantillon ne donne quune information partielle, ces estimations seront accompagnes dune certaine marge derreur.

2.

LESTIMATION PONCTUELLE
2.1. DEFINITION

Estimer un paramtre, cest en chercher une valeur approche en se basant sur les rsultats obtenus dans un chantillon. Lorsquun paramtre est estim par un seul nombre, dduit des rsultats de lchantillon, ce nombre est appel estimation ponctuelle du paramtre. Lestimation ponctuelle se fait laide dun estimateur , qui est une variable alatoire dchantillon. Lestimation est la valeur que prend la variable alatoire dans lchantillon observ. 2.2. PROPRIETES DES ESTIMATEURS PONCTUELS

Lorsquon utilise frquemment des estimateurs ponctuels on souhaite quils possdent certaines proprits. Ces proprits sont importantes pour choisir le meilleur estimateur du paramtre correspondant, cest--dire celui qui sapproche le plus possible du paramtre estimer. Un paramtre inconnu peut avoir plusieurs estimateurs. Par exemple, pour estimer le

J-P LENOIR

Page 85

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

paramtre m, moyenne dune population, on pourrait se servir de la moyenne arithmtique, de la mdiane ou du mode. Les qualits que doit possder un estimateur pour fournir de bonnes estimations sont dcrites ci-aprs.

J-P LENOIR

Page 86

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

2.2.1. Estimateur non biais. On notera : le paramtre de valeur inconnue, $ lestimateur de .

Dfinition :

Un estimateur est sans biais si la moyenne de sa distribution dchantillonnage est gale la valeur du paramtre de la population estimer, cest--dire si $) = E(

$) Si lestimateur est biais, son biais est mesur par lcart suivant : BIAIS = E( $ La figure suivante reprsente les distributions dchantillonnage dun estimateur sans biais 1 $ . et dun estimateur biais 2

Exemples :

On a vu au chapitre 4 que E( X) = m . Donc la moyenne dchantillon X est un estimateur sans biais du paramtre m, moyenne de la population. En revanche, la mdiane dchantillon M e est un estimateur biais lorsque la population chantillonne est asymtrique.
n 1 2 . Donc ech 2 est un Nous avons vu galement que E( ech 2 ) = n pop estimateur biais du paramtre pop 2 , variance de la population. Cest pour cette n 2 qui est un raison que lon a introduit la variance dchantillon S 2 = n 1 ech estimateur sans biais de pop 2 , puisque E(S2 ) = pop 2 .

Labsence de biais, elle toute seule, ne garantit pas que nous avons un bon estimateur. En effet, certains paramtres peuvent avoir plusieurs estimateurs sans biais. Le choix parmi les estimateurs sans biais seffectue en comparant les variances des estimateurs. En effet, un estimateur sans biais mais variance leve peut fournir des estimations trs loignes de la vraie valeur du paramtre.

J-P LENOIR

Page 87

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

2.2.2. Estimateur efficace Dfinition : Un estimateur sans biais est efficace si sa variance est la plus faible parmi les $ et $ sont deux variances des autres estimateurs sans biais. Ainsi, si 1 2 $ estimateurs sans biais du paramtre , lestimateur 1 est efficace si : $ ) < V( $ ) $ ) = E( $ ) = . V( E( et 1 2 1 2

La notion destimateur efficace peut sillustrer de la faon suivante :

2.2.3. Estimateur convergent Dfinition :


$ est convergent si sa distribution tend se concentrer autour Un estimateur de la valeur inconnue estimer, , mesure que la taille dchantillon augmente, $) = 0. cest--dire si lim V(
n +

Par exemple, X est un estimateur convergent pop 2 = 0. puisque lim V( X) = lim n + n + n

Remarque : Un estimateur sans biais et convergent est dit absolument correct

Ces trois proprits sont les principales qualits que nous recherchons pour un estimateur. Nous ninsisterons pas sur les proprits mathmatiques que doivent possder les estimateurs.

J-P LENOIR

Page 88

CHAPITRE 5

FIIFO 3 Consquences :

PROBABILITES - STATISTIQUES

Ltude du chapitre 4 nous a appris que :


E( X ) = m E(S 2 ) = pop 2 E( F) = p et et et V(X) = V(S ) =
2

pop 2 n 2pop 4

n 1 pq V(F) = n

On peut donc affirmer que : X est un estimateur absolument correct de la moyenne m pour un caractre quantitatif. S_ est un estimateur absolument correct de la variance pop 2 pour un caractre quantitatif. F est un estimateur absolument correct de la proportion p pour un caractre qualitatif. Nous pourrons donc estimer m par X , pop 2 par S_, p par F. Mais les estimations ponctuelles bien quutiles, ne fournissent aucune information concernant la prcision des estimations, cest--dire quelles ne tiennent pas compte de lerreur possible dans lestimation, erreur attribuable aux fluctuations dchantillonnage. Quelle confiance avons-nous dans une valeur unique ? On ne peut rpondre cette question en considrant uniquement lestimation ponctuelle obtenue des rsultats de lchantillon. Il faut lui associer un intervalle qui permet denglober avec une certaine fiabilit, la vraie valeur du paramtre correspondant.

3.

ESTIMATION PAR INTERVALLE DE CONFIANCE


3.1. DEFINITION

Lestimation par intervalle dun paramtre inconnu consiste calculer, partir dun $ , un intervalle dans lequel il est vraisemblable que la valeur correspondante estimateur choisi du paramtre sy trouve. Lintervalle de confiance est dfini par deux limites LI et LS auxquelles est associe une certaine probabilit, fixe lavance et aussi leve quon le dsire, de contenir la valeur vraie du paramtre. La probabilit associe lintervalle de confiance et exprime en pourcentage est gale S o S est le seuil de confiance ou niveau de confiance de lintervalle, exprim galement en pourcentage.
P( LI LS) = S

avec :

LI : limite infrieure de lintervalle de confiance. LS : limite suprieure de lintervalle de confiance S : probabilit associe lintervalle dencadrer la vraie valeur du paramtre.

J-P LENOIR

Page 89

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

LI et LS sont appeles les limites de confiance de lintervalle et sont des quantits qui $ et du seuil de confiance S. tiennent compte des fluctuations dchantillonnage, de lestimateur La quantit 1 - S est gale la probabilit, exprime en pourcentage, que lintervalle nencadre pas la vraie valeur du paramtre. On note = 1 S . sappelle le risque ou le seuil de signification de lintervalle. A quoi correspond lintervalle de confiance ? Si nous rptons lexprience un grand nombre de fois (prlever un grand nombre de fois un chantillon de taille n de la mme population), dans 100S cas sur 100 les intervalles obtenus (diffrents chaque ralisation de lexprience) recouvrent la vraie valeur du paramtre. Remarques : Lintervalle ainsi dfini est un intervalle alatoire puisquavant lexprience, les limites de lintervalle sont des variables alatoires (elles sont fonctions des observations de lchantillon). Le niveau de confiance est toujours associ lintervalle et non au paramtre inconnu . nest pas une variable alatoire : il est ou nest pas dans lintervalle [LI, LS]. Le niveau de confiance doit tre choisi avant que ne seffectue lestimation par intervalle. Il arrive souvent que le chercheur non averti calcule plusieurs intervalles destimation des niveaux de confiance diffrents et choisisse par la suite lintervalle qui lui semble le plus appropri. Une telle approche constitue en ralit une interprtation inacceptable des donnes en ce quelle fait dire aux rsultats chantillonnaux ce que lon veut bien entendre. Il y a une infinit de solutions possibles pour dterminer lintervalle [LI, LS]. On choisira de prendre des risques symtriques, cest--dire de choisir LI et 1 S P( LI) = 2 LS tels que : . P( LS) = 1 S 2 Pour calculer lintervalle de confiance, on doit connatre la distribution dchantillonnage (distribution de probabilit) de lestimateur correspondant, cest--dire connatre de quelle faon sont distribues toutes les valeurs possibles de lestimateur obtenues partir de tous les chantillons possibles de mme taille prlevs de la mme population. Ce travail a t effectu au chapitre prcdent. Nous allons voir prsent comment dduire des distributions dchantillonnage la construction des intervalles de confiance. 3.2. ESTIMATION DUNE MOYENNE PAR INTERVALLE DE CONFIANCE

On se propose destimer, par intervalle de confiance, la moyenne m dun caractre mesurable dune population. Il sagit donc de calculer, partir de la moyenne x (valeur prise par lestimateur X ) de lchantillon, un intervalle dans lequel il est vraisemblable que la vraie valeur de m sy trouve. Cet intervalle se dfinit daprs lquation suivante : P(A m B) = S .
J-P LENOIR Page 90 CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

Les limites A et B de cet intervalle sont des quantits alatoires et prendront, aprs avoir prlev lchantillon et calcul lestimation x , la forme suivante : LI m LS. Nous allons dterminer LI et LS en utilisant la distribution dchantillonnage de X . Ltude du chapitre 4 nous amne donc distinguer deux cas : 3.2.1. On dispose dun grand chantillon ( n 30 ) ou dun petit chantillon (n<30) dont la distribution est normale dcarttype connu pop . Dans ces conditions on considre que la variable alatoire X suit une loi normale : pop Xm X > N ( m, ) . Donc T = suit la loi N(0,1). pop n n P ( On cherche dterminer A et B tels que A m B) = S . Puisquon choisit des risques symtriques, on va dterminer dans la table de la loi normale centre rduite la valeur t
2

telle que : P( t T t ) = S ,
2 2

ce qui peut scrire :


Xm t ) = S 2 2 pop n X m t pop ) = S. soit encore P( t pop n n 2 2 m X + t pop ) = S , qui est Finalement, on peut crire : P( X t pop n n 2 2 A = X t pop n 2 bien de la forme cherche en posant. . B = X + t pop n 2 P( t

Signification : Avant toute exprience, la probabilit que lintervalle alatoire [ X t pop , X + t pop ] contienne la vraie valeur de m est S. Ces deux n n 2 2 limites sont des variables alatoires qui prendront des valeurs numriques particulires une fois que lchantillon est choisi et quon a obtenu la valeur de x (ralisation de la variable alatoire X ). On en dduit par la suite un intervalle dextrmits fixes (et non m x + t pop plus un intervalle alatoire) qui scrit : x t pop et on n n 2 2 lui attribue, non pas une probabilit, mais un niveau de confiance de S = 1 de contenir la vraie valeur de m.

Conclusion : A partir dun chantillon de grande taille (n 30) ou partir dun chantillon de petite taille (n < 30), prlev partir dune population normale de
J-P LENOIR Page 91 CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

moyenne m (inconnue) et de variance pop 2 connue , on dfinit un intervalle de confiance ayant un niveau de confiance S de contenir la vraie valeur de m par : [ x t pop , x + t pop ] n n 2 2 Remarque : Dans le cas dun grand chantillon, si la variance pop 2 de la population est inconnue, on peut lestimer sans problme par la variance n 2 dchantillon s2 ( s2 = (voir chapitre 4 2.2.3.1). n 1 ech 3.2.2. On dispose dun petit chantillon (n<30) et la distribution de X est normale dcart-type inconnu. Dans ces conditions, ltude du chapitre 4 nous a appris que nous ne disposions pas Xm directement de la loi de X mais de celle de T = . T suit une loi de Student ech (n - 1) degrs de libert : T > Tn-1.
n 1

Pour trouver lintervalle de confiance de m au risque ,nous allons procder comme dans le cas prcdent : On dtermine dans la table de la loi de Student la valeur t , (o = n 1) telle
2

que : P( t

2 ,

T t , ) = S
2

ce qui peut scrire :


Xm t , ) = S ech 2 n 1 X m t , ech ) = S. soit encore P( t , ech n 1 n 1 2 2 m X + t , ech ) = S. Finalement, on peut crire :, P( X t , ech n 1 n 1 2 2 P( t
2 ,

Aprs avoir choisi lchantillon, X a pris la valeur x et ech la valeur ech . On en dduit par la suite un intervalle dextrmits fixes (et non plus un intervalle alatoire) m x + t ech qui scrit x t ech et on lui attribue, non pas n 1 n 1 2 2 une probabilit, mais un niveau de confiance de S = 1 de contenir la vraie valeur de m.

Conclusion : A partir dun chantillon de petite taille (n < 30), prlev partir dune population normale de moyenne m (inconnue) et de variance pop 2 inconnue , on

J-P LENOIR

Page 92

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

dfinit un intervalle de confiance ayant un niveau de confiance S de contenir la vraie [ x t , ech , x + t , ech ] valeur de m par : n 1 n 1 2 2 o = n 1 est le nombre de degrs de libert de la distribution de Student s On pourra bien sr remplacer : ech par . n 1 n REMARQUES :

1. Lintervalle de confiance pourra tre numriquement diffrent chaque fois quon prlve un chantillon de mme taille de la population puisque lintervalle est centr sur la moyenne de lchantillon qui varie de prlvement en prlvement.

2. Le niveau de confiance est associ lintervalle et non au paramtre m. Il ne faut pas dire que la vraie valeur de m a, disons 95 chances sur 100, de se trouver dans lintervalle mais plutt que lintervalle de confiance a 95 chances sur 100 de contenir la vraie valeur de m ou encore que 95 fois sur 100, lintervalle dtermin contiendra la vraie valeur de m. Une fois que lintervalle est calcul, m est ou nest pas dans lintervalle (pour une population donne, m est une constante et non une variable alatoire).

3. Plus le niveau de confiance est lev, plus lamplitude de lintervalle est grande. Pour la mme taille dchantillon, on perd de la prcision en gagnant une plus grande confiance.

4. Dans le cas o la variance de la population est inconnue, des chantillonnages successifs de la population peuvent conduire pour une mme taille dchantillon et le mme niveau de confiance, des intervalles de diverses amplitudes parce que lcart-type s variera dchantillon en chantillon.

3.3.

ESTIMATION CONFIANCE

DUNE

VARIANCE

PAR

INTERVALLE

DE

On se propose destimer, par intervalle de confiance, la variance pop 2 dun caractre mesurable dune population. Il sagit donc de dterminer, partir de la variance de lchantillon ech 2 , un intervalle dans lequel il est vraisemblable que la vraie valeur de pop 2 sy trouve. On cherche un intervalle [A, B] vrifiant : P(A pop 2 B) = S .

J-P LENOIR

Page 93

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

Les limites de cet intervalle prendront, aprs avoir prlev lchantillon et calcul lestimation les valeurs prises par les deux quantits alatoires A et B, la forme suivante :
a pop 2 b .

Nous allons dterminer A et B en utilisant la distribution dchantillonnage de la variance dchantillon S_. Nous supposerons par la suite que la population est normale , cest--dire que le caractre X suit une loi normale. Ltude du chapitre 4 nous amne donc distinguer deux cas :

J-P LENOIR

Page 94

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

3.3.1. La population est normale et on dispose dun grand chantillon ( n 30)


n ech 2 ) suit approximativement une loi La variance dchantillon S_ (S 2 = n 1 normale (voir chapitre 4 3.2.2). 2 ) S_ > N (pop 2 , pop 2 n 1

Donc T =

S 2 pop 2 pop
2

2 n 1

suit une loi normale centre rduite.

On peut dterminer dans la table de la loi normale centre rduite la valeur t


2

telle que : P( t T t ) = 1
2 2

ce qui peut scrire : P( t


2

S 2 pop pop
2

2 n 1

t ) = 1 .
2

n 2 . Comme on a un grand chantillon, on peut estimer pop 2 par s2 = n 1 ech

Soit encore P(S 2 t s 2


2

2 2 2 pop S 2 + t s 2 ) = 1 qui est bien de la forme 2 n 1 n 1

cherche. Ces deux limites sont des variables alatoires qui prendront des valeurs numriques particulires une fois que lchantillon est choisi et quon a obtenu la valeur de s_ (ralisation de la variable alatoire S_). On en dduit par la suite un intervalle dextrmits fixes(et non 2 2 2 pop s 2 + t s 2 plus un intervalle alatoire) qui scrit : s 2 t s 2 et on lui 2 2 n 1 n 1 attribue, un niveau de confiance S de contenir la vraie valeur de pop 2 .

Conclusion : A partir dun chantillon de grande taille (n 30)), prlev partir dune population normale de variance pop 2 inconnue, on dfinit un intervalle de confiance ayant un niveau de confiance 1- de contenir la vraie valeur de pop 2 par :
[s 2 t s 2
2

2 2 ,s2 + t s2 ] 2 n 1 n 1

J-P LENOIR

Page 95

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

3.3.2. La population est normale et on dispose dun petit chantillon ( n < 30)

n ech 2 ( n 1)S 2 La variable Y = suit une loi du 2 (n-1) degrs de libert (voir 2 = 2 pop pop chapitre 4 3.2.2). Y > n12 .

Nous allons chercher un intervalle [ a 2 , b 2 ] de valeurs telles que

P( a 2 < Y < b 2 ) = S .

On choisit un intervalle correspondant des risques symtriques, cest--dire tel que :

1 S 2 P(Y < a ) = = 2 2 1 S 2 P(Y > b ) = = 2 2

Les deux valeurs a 2 et b 2 se dterminent laide des tables. nech 2 2 < b 2 ) = S et donc que On peut alors crire que P( a < pop 2
P( nech 2 nech 2 2 < < ) = S. pop b2 a2

Ces deux limites sont des variables alatoires qui prendront des valeurs numriques particulires une fois que lchantillon est choisi et quon a obtenu la valeur de ech 2 (ralisation de la variable alatoire ech 2 ). On en dduit par la suite un intervalle dextrmits fixes qui nech 2 nech 2 2 < < scrit : et on lui attribue un niveau de confiance S de contenir la vraie pop b2 a2 valeur de pop 2 .

Conclusion : A partir dun chantillon de petite taille (n < 30)), prlev partir dune population normale de variance pop 2 inconnue, on dfinit un intervalle de confiance ayant un niveau de confiance S de contenir la vraie valeur de pop 2 par :
[ nech 2 nech 2 , ] b2 a2

J-P LENOIR

Page 96

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

3.4.

ESTIMATION DUNE PROPORTION PAR CONFIANCE

INTERVALLE DE

On se propose destimer, par intervalle de confiance, la proportion p dun caractre quantitatif dune population. Il sagit donc de dterminer, partir de la proportion de lchantillon f, un intervalle dans lequel il est vraisemblable que la vraie valeur de p sy trouve. On cherche un intervalle [A, B] vrifiant : P(A p B) = S . Les limites de cet intervalle prendront, aprs avoir prlev lchantillon et calcul les valeurs prises par les deux quantits alatoires A et B, la forme suivante : a p b . Nous allons dterminer A et B en utilisant la distribution dchantillonnage de la proportion dchantillon F. Nous supposons que nous sommes en prsence dun grand chantillon (n 30 ) et que p (que nous devons estimer) nest pas trop petit ( np 15 et nq 15) . La frquence dchantillon F suit approximativement une loi normale (voir chapitre 4 4.2). pq ) F > N ( p, n Donc T =
F p suit approximativement une loi normale centre rduite. pq n

On peut dterminer dans la table de la loi normale centre rduite la valeur t


2

telle que : P( t T t ) = S
2 2

ce qui peut scrire :


P( t
2

F p t ) = S . 2 pq n

Le problme est quon ignore la valeur de p et quelle intervient dans lcart-type. Comme n est grand, il est correct destimer p par la valeur f (prise par lestimateur F) trouve dans lchantillon; En effet, la grande taille de lchantillon garantit que f ne fluctue pas trop dchantillon en chantillon. f (1 f ) f (1 f ) p F + t ) = S qui est bien de la forme cherche. soit encore P( F t 2 n 2 n Ces deux limites sont des variables alatoires qui prendront des valeurs numriques particulires une fois que lchantillon est choisi et quon a obtenu la valeur de f (ralisation de la variable alatoire F). On en dduit par la suite un intervalle dextrmits fixes qui scrit :

J-P LENOIR

Page 97

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

f (1 f ) f (1 f ) p f + t et on lui attribue un niveau de confiance S de contenir 2 n 2 n la vraie valeur de p. Conclusion : A partir dun chantillon de grande taille (n 30)), prlev partir dune population dont la proportion p dun caractre qualitatif est inconnue mais pas trop petite, on dfinit un intervalle de confiance ayant un niveau de confiance S de contenir la vraie valeur de p f (1 f ) f (1 f ) [f t , f + t ] par : 2 n 2 n f t

3.5.

COMMENT CONTROLER LERREUR ?

Il arrive souvent que la prcision de lestimation soit spcifie avant mme que lchantillon ne soit prlev. Par exemple, vous voulez vrifier un lot de pices de machinerie : ces pices doivent avoir un certain diamtre et lerreur tolre dans la fabrication doit tre trs petite, sinon plusieurs dentre elles seront inutilisables. Pour vrifier le lot, vous prlevez un chantillon, mais vous voulez que lestimation se fasse avec la plus petite erreur dchantillonnage possible : vous voulez une estimation prcise. Dune trop grande erreur dchantillonnage rsulte une longueur dintervalle trop grande et cela rend souvent inutile lintervalle de confiance construit. Nous pouvons contrler lerreur dchantillonnage en choisissant une taille dchantillon approprie. Lerreur dchantillonnage survient lorsque lchantillon ne prend pas en considration la population dans sa totalit. Chaque fois quun chantillon est prlev, nous perdons une certaine partie de linformation concernant la population, ce qui entrane immanquablement une erreur dans lestimation. Par consquent, si nous voulons un trs haut niveau de prcision, nous devons prlever un chantillon dont la taille permet dextraire de la population linformation suffisante pour raliser lestimation avec la prcision dsire.

Nous verrons en travaux dirigs sur des exemples comment procder.

J-P LENOIR

Page 98

CHAPITRE 5

FIIFO 3

PROBABILITES - STATISTIQUES

J-P LENOIR

Page 99

CHAPITRE 5