Vous êtes sur la page 1sur 10

Distributions dchantillonnage et Estimation.

b
b
b
b
b

b
b

b
b

b
b
b

b
b

b
b

Echantillon
b
b

b
b

b
b

b
b

b
b

b
b

b
b

b
b

b
b

b
b

b
b

b b
b

b
b

b
b

Population

1. Echantillonnage.
OBJECTIF
On considre une population.
On eectue un recensement mais cest couteux, risqu (mdicaments).
On eectue un chantillonnage ou sondage (on tudie une partie de la population.

1.1. Dfinition dun chantillonnage


DFINITION
Constituer un chantillon consiste prlever un certains nombre dindividus dans une population de base.
2 types dchantillons :
n!
exhaustifs (sans remise)
chantillons possibles.
(n p)!
n
non exhaustifs (avec remise) N chantillons possibles.

1.2. Tirage au hasard dun chantillon dans une population


Le hasard est une ralisation dlicate. On utilise une calculatrice avec RAN# ou RND# , un logiciel comme un
tableur avec la fonction Alea() ou enfin la lecture dune table de nombres au hasard.

EXEMPLE 1
Tirage de pieds de vignes pour prlever le Taux de Botrytis par numro (600 pieds).

1.3. Les sondages.


1.3.1.Classement des enqutes par sondage.
Classement daprs :
Lunit statistique : individu, foyer, exploitant agricole.
Objet de ltude : enqutes agricoles, enqutes dopinion.
Mode dobservation : observation directe, par interview, par lettre.
le mode dchantillonnage utilis :
mthode empirique (par choix raisonn)
mthode alatoires
1.3.2.Sondage alatoire
Sondage lmentaire
On numrote N individus et on prlve un chantillon de taille n (en utilisant la table).
Sondage systmatique
Sondage lmentaire coteux parfois. Prenons un nombre k tel que N = kn + r. Prenons un individus i entre 1 et
k, les autres seront alors i + k, i + 2k, ...
La stratification
Rpartir la population en groupes supposs influencer lenqute.

EXEMPLE 2
Classes dge.
Taille de lentreprise industrielle, commerciale ou agricole.
Sondage par grappe
Le groupe est un groupement dindividus lis entre eux dune certaine manire prlevs dans la population et
incorpors tel quel dans lchantillon.

EXEMPLE 3
un quartier est une grappe dappartement.
une commune rurale est une grappe dexploitations viticoles.

1.3.3.Sondage par choix raisonn. Mthode des quotas


1942 : les cantons de lINSEE - 600 rgions agricoles. Inconvnients : Importance de larbitraire dans le choix des
individus-type. Division de la population en classe homogne pour un certain nombre de variables.
Sexe M : 46% et F : 54%
Localisation rurale : 30% et urbaine : 70%
Si on dsire un chantillon de n individus, on prendra dans chaque catgorie un nombre de personnes proportionnel
au pourcentage attribu cette catgorie.
2. Distribution dchantillonnage
On suppose une population de moyenne , dcart type et de proportion f. Chaque chantillon aura sa propre
moyenne etc... On obtient ce quon appelle une distribution des moyennes dchantillonnage.


2.1. Distribution dchantillonnage des moyennes X
DFINITION
=x
1 , ..., x
n suit une loi normale de paramtres X et X
Si n 30 alors X
tirage avec remise

tirage sans remise

Nn
N1

Nn
est le facteur dexhaustivit.
N1

EXERCICE 1
On admet que dans un levage de poulets fermiers gs de 3 mois, la variable alatoire X, qui associe chaque
poulet sa masse en grammes, est distribue selon la loi normale de moyenne = 1325 g et dcart-type = 175 g.
On prlve un chantillon alatoire simple de 16 poulets dans cet levage.
qui associe chaque chantillon de 16 poulets la
1) Dterminer la loi de probabilit de la variable alatoire X,
masse moyenne des poulets de cet chantillon.
2) Calculer la probabilit que la masse moyenne dun chantillon de 16 poulets
22000
)
2.1) dpasse 22 kg, cest dire P(X >
16
20000
2.2) soit infrieure 20 kg, cest dire P(X
)
16
20000
22000
2.3) soit comprise entre 20 kg et 22kg, cest dire P(
X
)
16
16

EXERCICE 2
Une machine fabrique des pices en grande srie. La variable alatoire X, qui associe chaque pice tire au hasard
sa longueur, est distribue selon la loi normale de moyenne = 28, 20 mmm et dcart-type = 0, 027 mm. On admet
prenant pour valeurs les moyennes des chantillons de mme taille n est distribues selon
que la variable alatoire X
une loi normale de moyenne et dcart-type n .
On prlve un chantillon alatoire simple de taille n dans cette production.
appartiennent lintervalle
Quelle doit tre la taille de lchantillon pour que les valeurs de la variable alatoire X
[28, 195; 28, 205] avec une probabilit suprieure ou gale 0,95 ?

EXERCICE 3
Soit une variable alatoire X de moyenne = 120 et dcart-type = 40. On prlve dans cette population des
chantillons de taille 100.
moyenne des chantillons ?
1) Quelle est la loi suivie par la variable alatoire X

2) Dterminer un intervalle centr sur et contenant 95% des valeurs de X.

EXERCICE 4
Une entreprise produit des fils de mtal. En moyenne la charge de rupture est de 851 g avec un cart-type de 75 g.
On tire un chantillon de 100 fils.
1) Dterminer un intervalle centr sur la moyenne et contenant 95% des moyennes des chantillons.
2) Mme questions avec un intervalle contenant 99% des moyennes des chantillons.

EXERCICE 5
Sachant que la charge de rupture dun fil suit une loi Normale, refaire lexercice prcdent en tirant des chantillons
de taille n = 20.

2.2. Distribution dchantillonnage des proportions F


DFINITION
Si n 30 alors F = f1 , ..., fn suit une loi normale de paramtres F et F
tirage avec remise
F
F

pq
n

tirage sans remise

pq

Nn
N1

EXERCICE 6
1) Au cours dune lection prsidentielle, 51% des lecteurs ont vot pour Monsieur Plus. Si un sondage de 1000
lecteurs choisis au hasard, avait t ralis partir de cette population, quelle aurait t la probabilit de
prvoir, tort, la dfaite de Monsieur Plus ?
2) Si le risque de se tromper dans la question 1) doit tre rduit moins de 1%, quelle doit tre la taille minimale
de lchantillon ?
NB On admettra que, la population tant trs grande, les chantillons peuvent tre considrs comme alatoires
simples.

EXERCICE 7
Dans un pays indtermin, le Sida atteint 5% de la population. Soit un groupe de 200 personnes que lon considre
comme un chantillon alatoire simple de taille n = 200 extrait de la population.
1) Par quelle loi est distribue la variable alatoire P qui, tout chantillon de taille 200, associe la proportion
de personnes atteintes du Sida ?
2) Dterminer lintervalle centr sur = 0, 05 tel que la variable alatoire P prenne ses valeurs dans cet intervalle
avec la probabilit de 0,99.
3) Quelle est la probabilit que, sur un groupe de 200 personnes, on observe un nombre de personnes atteintes
du Sida suprieur ou gal 15 ?

EXERCICE 8
1) On a observ dirents sicles, la frquence des naissances de garons et de filles. On constate que, de faon
constante, cette frquence est de 516 garons sur 1000 enfants. On tire au hasard, dans la population mondiale,
des chantillons de taille n = 100. Soit F la variable alatoire gale la frquence des garons dans chaque
chantillon. Quelle est la loi suivie par F ?
2) Donner un intervalle contenant 95% des valeurs de F et centr sur p=0,516.

EXERCICE 9
Combien de fois doit-on jeter un d 6 faces pour que la frquence du nombre dobtentions de las soit connue au
1 eme
prs avec une probabilit de 0, 99.
50

EXERCICE 10
Dans une population dont la frquence du caractre A est p = 0, 40 on tire un chantillon de taille n = 100.
Dterminer, pour cet chantillon, un intervalle contenant 95% des valeurs de la frquence de ce caractre.

3. Estimation
OBJECTIF
On dsire recueillir des informations sur une population.
Recensement de la population mais cest une mthode exhaustive
On examine un chantillon de la population, cest la mthode par sondage.
Connaissant les paramtres de lchantillon que peut-on dire des paramtres de la population ?

3.1. Estimation ponctuelle


3.1.1.Estimation de la moyenne et de lcart-type
THORME
.
Lchantillon ayant pour :
taille : n
e
moyenne : x
cart-type : e

La population ayant pour :


taille : N
moyenne :
cart-type :

e
b=x
On suppose
et inconnus, alors les meilleurs estimateurs ponctuels de et sont respectivement
n
b=
et
e . On dit que
n1
b est un estimateur sans biais de

b est un estimateur sans biais de

Remarque
Sur la calculatrice, il faut utiliser la touche n1 ou sx

EXERCICE 11
Dans latelier de rparation de tlviseurs dun centre commercial on veut tudier la dure des interventions sur
les appareils dune marque A : on tire au hasard et avec remise 50 fiches correspondants 50 rparations de tels
appareils ; on obtient les rsultats suivants :
Dures (en min)

[0,20[

[20,40[

[40,60[

[60,80[

[80,100[

[100,120[

Nombres dintervention

11

15

10

A combien peut-on estimer la moyenne et lcart-type des dures dintervention pour la population constitue de
tous les tlviseurs de la marque A rpars dans cet atelier ?

3.1.2.Estimation de la frquence
THORME
.
Lchantillon ayant pour :
taille : n
proportion des individus possdant un
caractre A : fe

La population ayant pour :


taille : N
proportion des individus possdant un
caractre A : p

b = fe
On suppose p inconnus. Aussi le meilleur estimateur ponctuel de p est p

EXERCICE 12
Afin dtudier une modification des modalits de rmunration des dpts sur certains de ses comptes, une banque
fait eectuer une premire enqute rapide : on tire au hasard 45 comptes du type considr dans une agence. On
constate que 14 ont un solde qui est rest suprieur 10 000 francs au cours des trois derniers mois. A combien
peut-on estimer le pourcentage des 432 comptes du type considr dont le solde est rest suprieur 10 000 francs
pendant les trois derniers mois ?

3.2. Estimation par intervalles de confiance


3.2.1.Estimation par intervalles de confiance de la moyenne
e et e . Nous voulons estimer la moyenne de la
Soit un chantillon de taille n (n > 30) dont la moyenne x
population.
Soit X la variable alatoire qui tout chantillon altoire de taille n associe la moyenne de cet chantillon : donc
1 , x
2 , ...
X prend successivement les valeurs x

X
Donc X , N (, ) en posant T = , alors T , N (0, 1)
n

n
On sait que P(t T t) = 2(t) 1
2(t) 1 = 95% signifie que t=1,96.
Donc 95% des valeurs prises par T sont comprises dans lintervalle [1, 96; 1, 96]
P(1, 96 T 1, 96) = 0, 95
X
1, 96) = 0, 95

P(1, 96 X 1, 96 ) = 0, 95
n
n
P(1, 96

P(1, 96 X X + 1, 96 ) = 0, 95
n
n

P(X 1, 96 X + 1, 96 ) = 0, 95
n
n
donc avant de prlever un chantillon de taille n dans la population, il y a 95 chances sur 100 pour que soit dans
lintervalle

[X 1, 96 ; X + 1, 96 ]
n
n
Cet intervalle sappelle : Intervalle de confiance de la moyenne 95%
= 100% 95% = 5% est appel seuil de risque ou dincertitude ou encore risque derreur.
THORME
e et dcart-type e . Lintervalle de confiance de la
Soit un chantillon de taille n (n 30) de moyenne x
moyenne au seuil de % est donn par :

[xe u ; xe + u ]
n
n
avec u dfini par 2(u ) 1 = 1

100

EXERCICE 13
A laide de lExercice sur latelier de rparation de tlviseurs, dterminer un intervalle de confiance avec un risque
de 5%

EXERCICE 14
La compagnie de tuyaux D. Boucher vient de recevoir une livraison de tuyaux et elle veut estimer le diamtre moyen
de ces tuyaux. On sait que dans le pass lcart type du diamtre tait de 0,07 cm. Un chantillon de 50 longueurs
de tuyaux a donn une moyenne de 2, 55 cm. Construisez un intervalle de confiance pour un niveau de confiance
de 99% .

EXERCICE 15
La compagnie de papier Papyrus veut estimer le temps moyen requis par une nouvelle machine pour produire une
rame de papier. Pour un chantillon de 36 rames, le temps requis moyen fut de 1,5 min par rame. En supposant que
= 0, 30 min, construisez un intervalle de confiance pour ayant un niveau de confiance de 95 %.

EXERCICE 16
Sur une parcelle de soja on a mesur la hauteur en centimtres de 100 plantes lge de 6 semaines. Les rsultats
obtenus sont les suivants :
hauteurs en cm
eectifs

36
6

37
11

38
26

39
32

40
14

41
11

1) Calculer la hauteur moyenne dune plante, exprime en centimtres. Calculer lcart-type de cette srie statistique.
2) Estimer la hauteur moyenne de la parcelle. On donnera lintervalle de confiance 95%.

3.2.2.Estimation par intervalles de confiance dune proportion


THORME
Soit un chantillon de taille n (n 30) dont une proportion fe dindividus possdent un caractre donn.
Lintervalle de confiance de la proportion au seuil de % est donn par :

fe (1 fe )
fe (1 fe )
[fe u
; fe + u
]
n
n
avec u dfini par 2(u ) 1 = 1

100

EXERCICE 17
A laide de lExercice sur la rmunration des dpts, dterminer un intervalle de confiance avec un risque de 5%

EXERCICE 18
On considre un chantillon de 169 brebis de race Ile de France. Ces brebis ont t mises la lutte. On a obtenu 108
brebis pleines. Donner un intervalle de confiance 95 % du taux de fertilit de cette race.

3.2.3.Estimation par intervalles de confiance de la moyenne dans le cas de petits chantillons


e et dcart-type e Dterminons un intervalle de confiance
Soit un chantillon de taille (n < 30) de moyenne x
pour

n
Donc X ne suit plus une loi normale, =
e .
n1
X
alors on dit que T suit une loi de Student n 1 degr de libert.
Posons le changement de variable T = e

n1
On utilise une table qui dpend de 2 facteurs : et le seuil .
De la mme manire que dans le cas dune loi normale, on
P(t T t ) = 1

100

o t est lu dans la table de Student.


THORME
et dcart-type e . Lintervalle de confiance de la
Soit un chantillon de taille n (n < 30) de moyenne x
e

+ t e ] o t tant lu dans la table de


moyenne au seuil de % est donn par : [
x t
;x
n1
n1
Student

EXERCICE 19
La compagnie Crote que Crote veut estimer la quantit moyenne de farine quelle utilise quotidiennement pour
faire son pain. Pour un chantillon de 14 jours, la moyenne de lchantillon de xe est de 173 kg avec e = 45 kg.
Construisez un intervalle de confiance 95% pour . (On suppose la distribution de la population normale.)

EXERCICE 20
Le propritaire de lauberge Le Verre Sous veut estimer le nombre de litres de vin quil vend quotidiennement. Pour
20 jours dopration, la moyenne est de 32 L et lcart type e est de 12 L. Construisez un intervalle de confiance
99 % pour la vritable moyenne du nombre de litres vendus par jour. (On suppose que la distribution du nombre de
litre vendus quotidiennement est normale.)

EXERCICE 21
Un fournisseur de produits agricoles commercialise un substrat horticole S. On dsigne par X la variable alatoire
dfinie par le pH de ce substrat. Un contrle du pH a t ralis sur 12 prlvements : on a obtenu une moyenne
e = 5, 34 et un cart-type e = 0, 15. On admet la normalit de la distribution de X. Donner un intervalle de
x
confiance 95% de .

3.3. La loi de Student et la calculatrice


3.3.1.Fonction de rpartition de la Loi de Student k degrs de libert
PRINCIPE
T est une variable alatoire de loi de Student k degrs de libert de fonction de rpartition F.
F(t) = P(T t) = p
.
Sur TI, 2nde, distrib, studentFRp(1E99, t, k)
Sur Casio, OPTN, STAT, DIST,t, tcd, tCD(1E99, t, k)
w
3.3.2.Rciproque de la fonction de rpartition de la Loi de Student k degrs de libert
PRINCIPE
T est une variable alatoire de loi de Student k degrs de libert. Pour chaque valeur de p, le tableau
donne la valeur de tp telle que
P(T tp ) = p
Sur TI, 2nde, distrib, invT (p, k)
Sur Casio, OPTN, STAT, DIST,t,Invt, InvT CD(1 p, k)

3.4. Rciproque de la fonction de rpartition de la Loi de Student k degrs de libert

T est une variable alatoire de loi de Student k


degrs de libert.
Pour chaque valeur de p, le tableau donne la valeur
de tp telle que P(T tp ) = p.
Sur TI, 2nde, distrib, invT(p,k)
Sur Casio, Menu STAT, (F5)DIST, (F2)t, (F3)invt,
(F2)Var, remplir dans lordre 1 p, k, puis execute

HH
p
HH
k
H
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
80
100
200
500
1000
10000

p
tp

0,9

0,95

0,975

0,99

0,995

0,999

0,9995

3,08
1,89
1,64
1,53
1,48
1,44
1,41
1,40
1,38
1,37
1,36
1,36
1,35
1,35
1,34
1,34
1,33
1,33
1,33
1,33
1,32
1,32
1,32
1,32
1,32
1,31
1,31
1,31
1,31
1,31
1,31
1,30
1,30
1,30
1,30
1,29
1,29
1,29
1,28
1,28
1,28

6,31
2,92
2,35
2,13
2,02
1,94
1,89
1,86
1,83
1,81
1,80
1,78
1,77
1,76
1,75
1,75
1,74
1,73
1,73
1,72
1,72
1,72
1,71
1,71
1,71
1,71
1,70
1,70
1,70
1,70
1,69
1,68
1,68
1,68
1,67
1,66
1,66
1,65
1,65
1,65
1,65

12,71
4,30
3,18
2,78
2,57
2,45
2,36
2,31
2,26
2,23
2,20
2,18
2,16
2,14
2,13
2,12
2,11
2,10
2,09
2,09
2,08
2,07
2,07
2,06
2,06
2,06
2,05
2,05
2,05
2,04
2,03
2,02
2,01
2,01
2,00
1,99
1,98
1,97
1,96
1,96
1,96

31,82
6,96
4,54
3,75
3,36
3,14
3,00
2,90
2,82
2,76
2,72
2,68
2,65
2,62
2,60
2,58
2,57
2,55
2,54
2,53
2,52
2,51
2,50
2,49
2,49
2,48
2,47
2,47
2,46
2,46
2,44
2,42
2,41
2,40
2,39
2,37
2,36
2,35
2,33
2,33
2,33

63,66
9,92
5,84
4,60
4,03
3,71
3,50
3,36
3,25
3,17
3,11
3,05
3,01
2,98
2,95
2,92
2,90
2,88
2,86
2,85
2,83
2,82
2,81
2,80
2,79
2,78
2,77
2,76
2,76
2,75
2,72
2,70
2,69
2,68
2,66
2,64
2,63
2,60
2,59
2,58
2,58

318,29
22,33
10,21
7,17
5,89
5,21
4,79
4,50
4,30
4,14
4,02
3,93
3,85
3,79
3,73
3,69
3,65
3,61
3,58
3,55
3,53
3,50
3,48
3,47
3,45
3,43
3,42
3,41
3,40
3,39
3,34
3,31
3,28
3,26
3,23
3,20
3,17
3,13
3,11
3,10
3,09

636,58
31,60
12,92
8,61
6,87
5,96
5,41
5,04
4,78
4,59
4,44
4,32
4,22
4,14
4,07
4,01
3,97
3,92
3,88
3,85
3,82
3,79
3,77
3,75
3,73
3,71
3,69
3,67
3,66
3,65
3,59
3,55
3,52
3,50
3,46
3,42
3,39
3,34
3,31
3,30
3,29

10