Vous êtes sur la page 1sur 260

Adil ELMARHOUM

Mohamed DIOURI

Docteur en statistique
et informatique applique

Docteur Ingnieur
Prsident Fondateur de lIGA

STATISTIQUES DECISIONNELLES
Exercices corrigs avec rappels de cours

COLLECTION SCIENCES TECHNIQUES ET MANAGEMENT

STATISTIQUES DECISIONNELLES
Exercices corrigs avec rappels de cours

Tous les droits sont rservs


Dpt lgal N 2003/2163
I.S.B.N. 1954-409-51-3
Premire dition 2003
Deuxime dition 2008

Les livres de la collection Sciences, Techniques et Management sont co-dits


par les ditions TOUBKAL et lInstitut suprieur du Gnie Appliqu, IGA.

A la mmoire de Myriam
Pour que la mmoire demeure
Lorsque une me
Pleure
Une autre me
Est-il plus grand malheur !
M. DIOURI

A ma fille Zineb
A. ELMARHOUM

SOMMAIRE

LIMINAIRE

PARTIE 1 : ECHANTILLONNAGE STATISTIQUE

CH. 1. DETERMINATION DE LECHANTILLON


1.1. Position du problme.
1.2. Dtermination de la taille de lchantillon.
1.3. Mthodes dchantillonnage.
1.4. Enoncs des exercices dapplication.
1.5. Solutions des exercices dapplication.

11
11
11
15
19
22

PARTIE 2 : LOI DE PROBABILITE DECHANTILLON

35

CH. 2. LOI DE PROBABILITE DE LA MOYENNE DECHANTILLON


2.1. Position du problme.
2.2. Population avec moyenne, variance et loi de probabilit. Connues.
2.3. Population avec moyenne et loi de probabilit. Connues.
2.4. Population avec moyenne, variance et loi de probabilit. Inconnues.
2.5. Loi de probabilit de la diffrence de deux moyennes.
2.6. Enoncs des exercices dapplication.
2.7. Solutions des exercices dapplication.

37
37
38
39
39
40
41
43

CH. 3. LOI DE PROBABILITE DE LA VARIANCE DECHANTILLON


3.1. Position du problme.
3.2. Enoncs des exercices dapplication.
3.3. Solutions des exercices dapplication.

55
55
56
58

CH. 4. LOI DE PROBABILITE DE LA PROPORTION DECHANTILLON


4.1. Position du problme.
4.2. Loi de probabilit selon lchantillon.
4.3. Enoncs des exercices dapplication.
4.4. Solutions des exercices dapplication.

71
71
72
73
74

PARTIE 3 : PRINCIPE DE LESTIMATION

89

CH. 5. ESTIMATION DE LA MOYENNE DUNE POPULATION


5.1. Estimation dune moyenne.
5.2. Estimation de la somme de moyennes.

91
91
93

5.3. Enoncs des exercices dapplication.


5.4. Solutions des exercices dapplication.

94
98

CH. 6. ESTIMATION DE LA VARIANCE DUNE POPULATION


6.1. Estimation dune variance.
6.2. Estimation de la somme de variances.
6.3. Enoncs des exercices dapplication.
6.4. Solutions des exercices dapplication.

115
115
117
117
118

CH. 7. ESTIMATION DE LA PROPORTION DUNE POPULATION


7.1. Estimation ponctuelle.
7.2. Estimation par intervalle de confiance.
7.3. Enoncs des exercices dapplication.
7.4. Solutions des exercices dapplication.

129
129
129
130
131

PARTIE 4 : TESTS STATISTIQUES

137

CH. 8. TESTS SUR LES MOYENNES


8.1. Test sur un chantillon.
8.2. Test sur deux chantillons.
8.3. Test sur plusieurs chantillons : analyse de la variance (ANOVA).
8.4. Enoncs des exercices dapplication.
8.5. Solutions des exercices dapplication.

143
143
145
150
156
161

CH. 9. TESTS SUR LES VARIANCES


9.1. Test sur un chantillon.
9.2. Test sur deux chantillons.
9.3. Enoncs des exercices dapplication.
9.4. Solutions des exercices dapplication.

183
183
184
186
188

CH. 10. TESTS SUR LES PROPORTIONS


10.1. Test sur un chantillon.
10.2. Test sur deux chantillons.
10.3. Test sur plusieurs chantillons.
10.4. Enoncs des exercices dapplication.
10.5. Solutions des exercices dapplication.

199
199
201
203
206
208

CH. 11. TESTS NON PARAMETRIQUES


11.1. Test de validit de loi de probabilit dune distribution.
11.2. Test dindpendance.
11.3. Enoncs des exercices dapplication.
11.4. Solutions des exercices dapplication.

223
223
225
226
230

TABLES STATISTIQUES

245

BIBLIOGRAPHIE

259

LIMINAIRE

Ce livre est sa 2me dition, il est le 3e dune trilogie des mmes auteurs, dont 2 livres ont dj
t dits, savoir : Statistique descriptive et Probabilits .
Dans le prsent ouvrage, les auteurs sintressent aux problmes de lchantillonnage
statistique, tant du point de vue des mthodes dchantillonnage que de celui des estimations et
de tests statistiques.
Lorsquon souhaite collecter des informations sur une population, deux possibilits soffrent :
- La premire solution consiste observer ou interroger tous les lments de la population,
cest ce quon appelle une enqute complte ou enqute exhaustive ou recensement ;
- La seconde solution consiste observer ou interroger une partie de la population, cest ce
quon appelle enqute partielle ou sondage. Les lments de la population qui sont rellement
observs constituent lchantillon et lopration qui consiste choisir ces lments est appele
chantillonnage.
Lalternative dcrite ci-dessus se prsente dans beaucoup de situations et le recours la
deuxime solution cest--dire lenqute partielle est la pratique la plus courante.
Par rapport lenqute complte, lenqute partielle offre une srie davantages :
- Le cot global de lenqute partielle est en gnral plus rduit que le cot global dune
enqute complte ;
- Lenqute par sondage est plus rapide que lenqute complte, surtout lorsque la
caractristique tudie prsente des modifications assez importantes au cours du temps ;
- Les erreurs dobservations sont plus rduites que dans lenqute exhaustive, du fait quil y
a moins de donnes manipuler ;
- Lenqute partielle est, dans certaines situations particulires, la seule solution possible,
cest le cas lorsque lobservation prsente un caractre destructif.

Ainsi, la problmatique des statistiques dcisionnelles sera tudie sous ses 3 aspects :
- Dabord, la dtermination de lchantillon (en taille et en qualit), en vue davoir les
informations sur la population mre tudier. Ceci fera lobjet de la partie 1 avec son unique
chapitre 1.
- Ensuite, la dtermination des lois de probabilit suivie par les paramtres de lchantillon
(moyenne, variance et proportion). Ceci fera lobjet de la partie 2 et de ses chapitres 2, 3 et 4.
- Enfin, une fois lchantillon et les lois de probabilit des paramtres dtermins,
ralisation des calculs sur les paramtres de la population mre tudie. Ceci fera lobjet de la
partie 3 avec ses chapitres 5, 6 et 7 et de la partie 4 avec ses chapitres 8, 9, 10 et 11.

Statistiques dcisionnelles

Partie 1. Echantillonnage statistique

PARTIE 1
ECHANTILLONNAGE STATISTIQUE

Dans cette 1re partie, nous nous proposons de rsoudre tous les cas types de problmes
dchantillons extraits dune population mre en respectant un certain nombre de contraintes.
- Contraintes de prcision ;
- Contrainte de budget.
Nous aurons ainsi dterminer la taille et la nature de lchantillon qui donne les informations
souhaites sur la population mre tudier, avec la prcision, fixe, au pralable et tout en
veillant ne pas dpasser le budget allou ltude.

Statistiques dcisionnelles

Partie 1. Echantillonnage statistique

10

Statistiques dcisionnelles

1. Dtermination de lchantillon

CHAPITRE 1
DETERMINATION DE LECHANTILLON

1.1. POSITION DU PROBLEME.


La dtermination dun chantillon ncessite la dtermination :
- de sa taille : nombre dlments extraire de la population mre ;
- de la qualit de ses lments : nature des lments extraire.
Les objectifs essentiels que doit remplir un chantillon sont de 2 sortes :
- Il doit tre reprsentatif de la population mre, cest--dire quil doit donner des
informations sur cette population avec la prcision exige ;
- Il doit avoir un cot compatible avec le budget disponible.
1.2. DETERMINATION DE LA TAILLE DE LECHANTILLON.
La dtermination de la taille dun chantillon dpend essentiellement de deux facteurs :
- La prcision souhaite : plus on souhaite des rsultats prcis, plus lchantillon ncessaire
est important.
- Le budget disponible : plus on augmente la taille de lchantillon, plus le cot de
lenqute saccrot.
La taille de lchantillon doit tre celle qui permet datteindre le meilleur quilibre entre le
risque derreurs dchantillonnage, le cot induit par ces erreurs, et le cot de lchantillonnage
lui-mme.

11

Statistiques dcisionnelles

1. Dtermination de lchantillon

1.2.1. Cas ou la loi de probabilit de la variable alatoire nest pas connue.


Dans ce cas on utilise lingalit de Bienaym Tchebycheff, elle aboutit, en gnral, des
chantillons de tailles leves.
1.2.1.1. Taille dchantillon pour estimer une moyenne.
- La taille de lchantillon dpend de la prcision souhaite pour la gnralisation des
rsultats.
- La prcision (ou erreur dchantillonnage) sexprime en valeur absolue ou relative. Elle
reprsente la largeur de lintervalle de confiance de la moyenne. Soit la moiti de cette
largeur.
Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marge
d'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente la
probabilit minimale pour que la moyenne calcule partir de lchantillon ne scarte pas de
la moyenne de la population de plus de . Ceci scrit :

P( X m < ) 1-

Ce qui donne :

2
2 .

avec :
n

: Taille de lchantillon ;
: Prcision souhaite ;

: Dfinit le seuil de confiance (1 - )

: Ecart- type dchantillon, il est souvent inconnu, il faut avoir des informations
antrieures ou mener une tude pilote.
1.2.1.2. Taille dchantillon pour estimer une proportion.
- La taille de lchantillon dpend de la prcision souhaite pour la gnralisation des
rsultats.
- La prcision (ou erreur dchantillonnage) sexprime en valeur absolue ou relative. Elle
reprsente la largeur de lintervalle de confiance de la proportion. Soit la moiti de cette
largeur.
12

Statistiques dcisionnelles

1. Dtermination de lchantillon

Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marge
d'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente la
probabilit minimale pour que la frquence calcule partir de lchantillon ne scarte pas de
la proportion dans la population de plus de . Ceci scrit :
P( f n p < ) 1-
Ce qui donne : n

p.q
2 .

avec :
n
: Taille de lchantillon ;

: Prcision souhaite ;

: Dfinit le seuil de confiance (1 - )


p
: Proportion dans la population (q = 1 p). Elle est souvent inconnue, il faut avoir des
informations antrieures ou mener une tude pilote, sinon on utilise une proportion de 50 %.
1.2.2. Cas ou la loi de probabilit de la variable alatoire est une loi normale.
Dans ce cas, on utilise la loi normale.
1.2.2.1. Taille dchantillon pour estimer une moyenne.
1.2.2.1.1. Cas des prlvements dans une population finie avec remise ou dans une population
infinie sans remise.

Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marge
d'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente la
probabilit minimale pour que la moyenne calcule partir de lchantillon ne scarte pas de
la moyenne de la population de plus de . Ceci scrit :
P( X m < ) 1-
Ce qui donne : n Z 2

2
2

13

Statistiques dcisionnelles

1. Dtermination de lchantillon

1.2.2.1.2. Cas des prlvements dans une population finie sans remise.

De la mme manire, on trouve :

Z
n

1-

N Z
1-

1.2.2.2. Taille dchantillon pour estimer une proportion.


Pour obtenir un maximum de fiabilit dans les rsultats, on commence par se fixer une marge
d'erreur "" que l'on accepte ; on se fixe ensuite un seuil de confiance (1-), qui reprsente la
probabilit minimale pour que la frquence calcule partir de lchantillon ne scarte pas de
la proportion dans la population de plus de . Ceci scrit :
P(

f n p < ) 1-

1.2.2.2.1. Cas des prlvements dans une population finie avec remise ou dans une population
infinie sans remise.

On trouve : n Z 2

p.q
2

avec :
n
: Taille de lchantillon ;

: Prcision souhaite ;
p
: Proportion dans la population (q = 1 p). Elle est souvent inconnue, il faut avoir des
informations antrieures ou mener une tude pilote, sinon on utilise une proportion de 50 %.
1.2.2.2.2. Cas des prlvements dans une population finie sans remise.

Z
On trouve : n

1-

pq N

N Z
1-

pq

14

Statistiques dcisionnelles

1. Dtermination de lchantillon

1.3. METHODES DECHANTILLONNAGE.


Pour que les rsultats dune enqute par sondage puissent tre extrapols lensemble de la
population faisant lobjet de ltude, il est indispensable que cette enqute soit conduite selon
des rgles bien dfinies et que les calculs conduisant ces extrapolations soient conformes la
procdure dchantillonnage utilise.
Lchantillon choisi doit tre le plus reprsentatif possible de la population tudie, cest--dire
le degr de correspondance entre linformation recueillie et ce que nous apprendrait un
recensement complet de la population dpend en grande partie de la faon dont lchantillon a
t choisi.
La thorie moderne de lchantillonnage nous propose une distinction fondamentale entre
chantillons bass sur la probabilit : chantillons probabilistes et chantillons non bass sur la
probabilit : chantillons non probabilistes ou empiriques.
1.3.1. METHODES DECHANTILLONNAGE PROBABILISTES.
1.3.1.1. Echantillonnage alatoire simple.
Un chantillonnage est alatoire si tous les individus de la population ont la mme chance de
faire partie de lchantillon ; il est simple si les prlvements des individus sont raliss
indpendamment les uns des autres.
En particulier, si la population est finie, cette dfinition correspond au tirage alatoire avec
remise, qui permet de traiter les populations finies comme des populations infinies.
Pour prlever un chantillon alatoire et simple il faut :
- Constituer la base de sondage qui correspond la liste complte et sans rptition des
lments de la population ;
- Numroter ces lments de 1 N ;
- Procder, laide dune table de nombres alatoires ou dun gnrateur de nombres
pseudo alatoires la slection des units diffrentes qui constitueront lchantillon.
1.3.1.2. Echantillonnage stratifi.
Lchantillonnage stratifi est une technique qui consiste subdiviser une population
htrogne, deffectif N, en P sous populations ou strates plus homognes deffectif Ni de
telle sorte que N= N1+N2+. +Np. Un chantillon, deffectif ni, est par la suite, prlev
indpendamment au sein de chacune des strates en appliquant un plan dchantillonnage au
choix de lutilisateur. Le plus souvent, on procdera par un chantillonnage alatoire et simple
lintrieur de chaque strate.
15

Statistiques dcisionnelles

1. Dtermination de lchantillon

La stratification peut entraner des gains de prcision apprciables, elle facilite en outre les
oprations de collecte des donnes et fournit des informations pour diffrentes parties de la
population.
Pour la rpartition de leffectif total, n, de lchantillon dans les diffrentes strates, la premire
solution, dite proportionnelle, consiste conserver la mme fraction dchantillonnage dans
chaque strate. Une seconde solution, dite optimale, tient compte du budget de lenqute.
1.3.1.2.1. Rpartition proportionnelle.
La rpartition proportionnelle consiste rpartir la taille de lchantillon n en utilisant la mme
fraction de sondage f dans chacune des strates. Cette solution tient compte dun seul facteur qui
est le poids de chaque strate.
Dsignons par wi le poids de la strate et par f la fraction de sondage constante.

n
N

wi

Ni
N

Le nombre dunits choisir dans chacune des strates est donc :

n i w i .n f .N i
1.3.1.2.2. Rpartition optimale.
Cette deuxime solution consiste rpartir leffort dchantillonnage de faon ingale dans les
diffrentes strates. Elle tient compte de quatre facteurs :
- Budget total de lenqute, G
- Poids de la strate, wi
- Cot de la collecte de linformation dans la strate, ci
- Dispersion lintrieur de la strate, mesure par lcart type i.
Le nombre dunits choisir dans chacune des strates est :

ni k

w i i

avec

ci

16

G
w i i

ci

Statistiques dcisionnelles

1. Dtermination de lchantillon

1.3.1.3. Echantillonnage par degrs.

Lchantillonnage par degrs regroupe toute une srie de plans dchantillonnage caractriss
par un systme ramifi et hirarchis dunits.
Dans le cas de deux degrs, par exemple, on considre que la population est constitue dun
certain nombre dunits de sondage du premier degr (units primaires), chacune de ces units
tant constitue dun certain nombre dunits du second degr. (Units secondaires).
On ralise dabord un chantillonnage dunits du premier degr. Ensuite, dans chaque unit
slectionne au premier degr, on prlve un chantillon dunits du second degr. Le mode de
slection pouvant varier dun degr lautre.
Lchantillonnage par degrs simpose lorsquil est impossible dinventorier les lments de
toute la population et quil est possible dnumrer les units prleves au premier degr. Il
permet une concentration du travail sur le terrain et donc une rduction des cots.
Pour un mme nombre total dobservations, il faut indiquer que lchantillonnage alatoire et
simple est plus prcis que lchantillonnage par degr.
1.3.1.4. Echantillonnage systmatique.
Lchantillonnage systmatique est une technique qui consiste prlever des units
dchantillonnage situes intervalles gaux. Le choix du premier individu dtermine la
composition de tout lchantillon.
Si on connat leffectif total de la population N et quon souhaite prlever un chantillon
deffectif n, lintervalle entre deux units successives slectionner est donn par :

N
(arrondi lentier le plus proche)
n

Connaissant k, on choisit le plus souvent, pour dbuter, un nombre alatoire, i, compris entre 1
et k. Le rang des units slectionnes est alors i, i+k, i+2k, i+3k,
Lchantillonnage systmatique est facile prparer et, en gnral facile excuter, il rduit le
temps consacr la localisation des units slectionnes.
Si les lments de la population se prsentent dans un ordre alatoire (pas de tendance)
lchantillonnage systmatique est quivalent lchantillonnage alatoire et simple. Par contre
si les lments de la population prsentent une tendance, lchantillonnage systmatique est
plus prcis que lchantillonnage alatoire.

17

Statistiques dcisionnelles

1. Dtermination de lchantillon

1.3.2. METHODES DECHANTILLONNAGE EMPIRIQUES.


1.3.2.1 Echantillonnage accidentel (ou de convenance).
Il sagit dun chantillon constitu dindividus qui se trouvaient accidentellement lendroit et
au moment o linformation a t collecte.
Les chantillons accidentels ne peuvent tre considrs reprsentatifs daucune population. Il
est risqu de gnraliser une population donne des rsultats obtenus par un chantillon
accidentel.
1.3.2.2. Echantillonnage priori.
Cest un chantillonnage par jugement priori. Il consiste slectionner des individus dont on
pense, avant de les interroger, quils peuvent dtenir linformation.
Le risque de ce type dchantillonnage est de considrer des individus, apparemment
reprsentatifs de la population tudie.
1.3.2.3. Echantillonnage Boule de neige
Cette mthode est rserve aux populations composes dindividus dont lidentification est
difficile ou qui possdent des caractristiques rares.
La mthode consiste faire construire lchantillon par les individus eux-mmes. Il suffit den
identifier un petit nombre initial et de leur demander de faire appel dautres individus
possdant les mmes caractristiques.
1.3.2.4. Echantillonnage par Quotas.
Lchantillonnage par quotas est lchantillonnage non probabiliste le plus connu, et finalement
le mieux accept comme substitut aux mthodes probabilistes dans le cas o ces dernires
rencontreraient des contraintes de base de sondage. Mais la reprsentativit de la population
tudie reste douteuse.
Lchantillonnage par quotas consiste tudier la structure de la population selon des critres
choisis (quotas) empiriquement. Lchantillon est ensuite construit de manire constituer une
reproduction en miniature de la population sur ces critres.
Lchantillonnage par quotas est une forme simplifie de lchantillonnage stratifi fraction
de sondage constante. Les quotas reprsentent les variables de stratification.
Une fois les quotas fixs, les individus sont slectionns la convenance de lenquteur.
18

Statistiques dcisionnelles

1. Dtermination de lchantillon

Les critres servant de base la dfinition des quotas ne doivent pas tre nombreux. Au-del de
3 critres, la dmarche devient complexe. Les quotas doivent tre construits sur une base de
donnes fiables (statistiques disponibles) indiquant la rpartition de la population sur les
critres choisis. Les critres les plus utiliss dans les tudes de march sont conomiques et
sociodmographiques en particulier lge, le sexe, la catgorie socioprofessionnelle, etc.
1.4. ENONCES DES EXERCICES DAPPLICATION.
1.4.1. Une enqute sur l'emploi a pour but destimer le taux d'activit dans un pays. Dans les
statistiques disponibles, la population active du pays est estime 10 millions de personnes sur
une population totale de 40 millions de personnes.
Dterminer la taille de l'chantillon si l'on accepte une erreur de 1%, avec une probabilit de
0,95.
1.4.2. On dsire estimer le revenu mensuel moyen dans un secteur de production. Quelle doit
tre la taille de lchantillon de salaris interroger pour que la moyenne empirique ne
sloigne pas de la moyenne de la population de 100 DH avec une probabilit au moins gale
0,95 sachant que lcart type est de 500 DH par salari ?
1.4.3. On souhaite raliser une enqute sur la consommation des mnages afin destimer la
dpense moyenne par mnage. Quelle doit tre la taille de lchantillon de mnages si la
population est compose de 5 millions de mnages et que lerreur admise ne doit pas dpasser
10 DH avec une probabilit de 0,99 ?
Lcart type de la dpense des mnages est de 2000 DH.
1.4.4. On souhaite raliser une enqute sur lemploi afin destimer le taux de chmage. La
population active est de 5 millions de personnes. Quelle doit tre la taille de lchantillon pour
que la frquence empirique ne sloigne pas du vrai taux de chmage de plus de 2% et ce avec
une probabilit de 0,95 ?
Une enqute rcente avait donn un taux de chmage de 12 %.
1.4.5. Dans le cadre d'une tude socio-conomique, on s'intresse aux habitants de 18 units
urbaines, rparties en deux rgions.
a) En supposant que la variable alatoire laquelle nous nous intressons suive une loi
normale et que lenqute se droule, au sein dune population finie et nexclut pas la possibilit
de sonder la mme personne plusieurs fois, dterminer la taille n de lchantillon.
On donne comme hypothses de travail : une marge derreur admissible gale 1% avec une
probabilit de 95% et un cart type du revenu gal 0,114 calcul daprs un 1 er chantillon.

19

Statistiques dcisionnelles

1. Dtermination de lchantillon

b) L'enqute doit donc comporter n interviews. Comme on dispose de 10 enquteurs et qu'on


souhaite que chaque enquteur n'opre que dans une seule unit urbaine et donc dans la mme
rgion, on souhaite se limiter l'tude de 10 units urbaines. On suppose qu'un enquteur peut
raliser 10 interviews dans la mme journe et que tous les enquteurs ne ralisent pas
ncessairement le mme nombre denqutes. En fonction de la rpartition des units urbaines
par rgion et de leurs nombres d'habitants, dterminer le nombre n1 et n2 dunits par rgion
sonder (voir tableau page suivante).
c) En nous limitant aux units les plus importantes dans chaque rgion, dterminer les units
sonder ainsi que le nombre dinterviews raliser dans chacune dentre elles. Quel est le
nombre de jours ncessaire une telle opration ?
Rgion 1
N Units
urbaines
N 1
N 2
N 3
N 4
N 5
N 6
N 7
N 8

Rgion 2

Nombres dhabitants

N Units urbaines

Nombres dhabitants

93600
45400
38900
36500
35100
32900
28100
26400

N 09
N 10
N 11
N 12
N 13
N 14
N 15
N 16
N 17
N 18

117100
107100
61200
51000
43800
38900
37800
33500
25800
25300

1.4.6. Dans une rgion regroupant environ 3 millions dhabitants runis en 1530 communes, on
dsire raliser une enqute relative la consommation moyenne des mnages pour le poste
alimentation.
a) Dterminer la taille de l'chantillon si l'on accepte une erreur de 1,16, avec une probabilit
de 0,95 et que lon estime lcart type gal 10.
b) En effectuant une stratification base sur la distribution de frquences donne dans le
tableau ci-dessous, combien dinterviews devrait-on raliser dans chacune des catgories de
communes ?
c) Si de plus pour des raisons de facilit, on dcidait de ne pas effectuer moins de 10 interviews
par commune, dans combien de communes diffrentes de chacune des catgories les
enquteurs devraient-ils se rendre ?

20

Statistiques dcisionnelles

1. Dtermination de lchantillon

Nombre dhabitants
Moins de 1000[
[ 1000 2000[
[ 2000 5000[
[ 5000 10000[
[10000 20000[
plus de 20000
Total

Nombre de communes
900
300
200
80
40
10
1530

1.4.7. Un sondage vise tudier la notorit dune marque. Pour cela on dispose de 12
enquteurs durant un mois.
a) Sachant que le rendement par jour et par enquteur est distribu selon une loi normale
de moyenne 5, et dcart type 1, dterminer la taille n o de l'chantillon retenu tel que : p(n
> no) = 0,025.
b) On propose de stratifier la population selon lge. Sachant que la population se rpartit
comme indiqu, dans le tableau ci-dessous, dterminer la rpartition de l'chantillon :
Age
Effectifs

Moins de 20
ans
5500000

Entre 20 et 30 Entre 30 et 60
ans
ans
2500000
1250000

Plus de 60
ans
250000

1.4.8. On sintresse au pourcentage de fusibles dfectueux dans un lot de 50 sacs contenant


chacun 10000 fusibles. Les sacs proviennent de diffrents fournisseurs qui affirment en gnral
que la proportion de fusibles dfectueux ne dpasse pas 1%. Lerreur accepte sur ce
pourcentage est de 0,1% avec un niveau de confiance 0,95.
a) Dterminer la taille de cet chantillon en utilisant l'ingalit de Bienaym Tchebycheff, et en
supposant la normalit de la variable. Laquelle de ces deux tailles doit-on retenir ? et
pourquoi ?
b) Prciser dans chaque cas, le type de sondage dont il s'agit :
b1) Si on tire n fusibles en prlevant n/50 par sac.
b2) Si on choisit d'abord k sacs et on tire ensuite ni fusibles par sac.
b3) Si on mlange le contenu des 50 sacs, et on tire n fusibles.
c) Quel est le procd de tirage, le mieux adapt ?
1.4.9. Un sondage vise une population dentreprises rparties en quatre rgions contenant
respectivement 360, 840, 600 et 1200 entreprises. Le budget rserv pour cette enqute est de
44 320 DH. Les cart-types sont estims 0,2 ; 0,1 ; 0,2 ; 0,4 respectivement pour les quatre
rgions. Les cots de ralisation par questionnaire sont respectivement de 225 DH, 196 DH,
400H et 324 DH.
a) Etablir une stratification optimale de lchantillon dterminer.
b) Prciser le niveau derreur que lon doit accepter avec la taille de lchantillon calcule, en
admettant un niveau de confiance de 0,99 et une proportion de 0,3.

21

Statistiques dcisionnelles

1. Dtermination de lchantillon

1.4.10. Le budget allou une enqute est de 132500 DH. Cette enqute est destine estimer
le taux de chmage quon pense tre priori gal 10 %. Les frais de dplacement quotidien
sont valus 1000 DH par enquteur. La rmunration dun enquteur est de 170 DH par
jour. Les charges fixes sont de 20000 DH.
a) Dterminer la taille de lchantillon si on tolre une erreur de moins de 1 % avec un niveau
de confiance de 95%
b) Dterminer la taille maximale permise par le budget allou si le rendement par enquteur est
de 6 questionnaires par jour.
c) Quel niveau derreur faut-il accepter si on ralise lenqute avec le budget allou ?
1.4.11. Nous disposons dun montant de 10 000 dh pour enquter auprs dune population
stratifie en deux strates ayant les caractristiques suivantes :

Strates

Effectif

Poids de la
strate

Ecart type

Cot de
lobservation

Strate 1
Strate 2

2000
3000

0,4
0,6

2
0,7

25
36

Etablir la rpartition optimale de lchantillon.


1.4.12. Une machine automatique fabrique des entretoises destines un montage de
roulements. La longueur de ces entretoises doit tre comprise, au sens large, entre 37,45 et
37,55 mm. La variable alatoire X, qui associe chaque entretoise sa longueur, est une variable
gaussienne de moyenne 37,50 mm.
a) Quel doit tre lcart type de la variable alatoire X pour que 998 sur 1000 des pices
fabriques soient bonnes ?
b) On prlve un chantillon non exhaustif dans la production. Quel doit tre leffectif de cet
chantillon pour que la moyenne des longueurs des pices prleves appartienne lintervalle
ferm [37,495 ; 37,505] avec une probabilit de 0,95 ?
1.5. SOLUTIONS DES EXERCICES DAPPLICATION.
1.5.1. Solution de lexercice 1.4.1.
Nous sommes dans le cas o la loi de probabilit du taux dactivit nest pas connue. Nous
utilisons donc lingalit de Bienaym Tchebycheff.

avec

p.q
2 .
p = 0,25

q = 0,75

= 1% et = 5%

ce qui donne n = 37 500


22

Statistiques dcisionnelles

1. Dtermination de lchantillon

Comme on le voit, lingalit de Bienaym Tchebycheff aboutit des chantillons de tailles


leves.
1.5.2. Solution de lexercice 1.4.2.
Nous sommes dans le cas o la loi de probabilit des revenus mensuels nest pas connue. Nous
utilisons donc lingalit de Bienaym Tchebycheff.

2
2 .

= 500

avec

= 100

et

= 5%

ce qui donne n = 500


1.5.3. Solution de lexercice 1.4.3.
Nous sommes dans le cas o la loi de probabilit de la dpense des mnages nest pas connue.
Nous utilisons donc lingalit de Bienaym Tchebycheff.

2
2 .

avec

= 2 000

= 10

et

= 1%

ce qui donne n = 4 000 000


Comme on le voit, lingalit de Bienaym Tchebycheff aboutit ici un chantillon de taille
trop leve, puisquil fait 4 millions pour une population de 5 millions. Nous devons, par
consquent recourir au thorme central limite et accepter lhypothse vraisemblable que la loi
de probabilit que suit la variable alatoire, dpense moyenne des mnages, peut tre
approche par une loi normale du fait que la population concerne est de 5 millions dmes.
Dans ce cas, on utilise lgalit relative aux prlvements sans remise dans une population
finie.

Z
n

1-

N Z
1-

23

Statistiques dcisionnelles

= 2 000

avec

= 10

1. Dtermination de lchantillon

= 1%

N = 5 millions

et

Z = 2,58
1-

ce qui donne n = 252 795. Un tel chantillon reprsente environ 6,3 % de la taille de
lchantillon trouve grce lingalit de Bienaym Tchebycheff et donc une trs grande
conomie, dans son traitement, par rapport au 1er chantillon.
1.5.4. Solution de lexercice 1.4.4.
Nous sommes dans le cas o la loi de probabilit du taux de chmage nest pas connue. Nous
utilisons donc lingalit de Bienaym Tchebycheff.

p.q
2 .

avec

p = 0,12

q = 0,88

= 2%

et

= 5%

ce qui donne n = 5 280 un tel chantillon reprsente environ 1 pour mille de la population
totale de 5 millions. Dans ce cas il nest pas ncessaire de recourir au thorme central limite
pour essayer de rduire la taille de lchantillon.
1.5.5. Solution de lexercice 1.4.5.
a) Nous sommes dans le cas o la loi de probabilit de la variable alatoire est la loi normale, la
population est finie et le tirage se fait avec remise. On utilise donc lgalit :

n Z2

avec

2
2

= 0,05

= 0,114

= 0,01

et

1
2

= 1,96

ce qui donne n = 500


b) Considrons les 2 rgions et essayons de dterminer, au prorata des nombres dunits de
chaque rgion, les 10 units qui seront concernes par les interviews.

24

Statistiques dcisionnelles

Rgions
Nombre
dunits total
%
Nombre
dunits de
lchantillon

1. Dtermination de lchantillon

CHOIX DES 10 UNITES


R1
R2

Total

10

18

44,44%

55,56%

100%

10

c) Considrons les 2 rgions et essayons de rpartir, au prorata de leurs nombres dhabitants,


les 500 interviews.
REPARTITION DES 500 INTERVIEWS
Rgions
R1
R2
Total
Nombre dhabitants
336900
541500
878400
total
%
38,35%
61,65%
100%
Nombre dhabitants
192
308
500
de lchantillon
Arrondi 10 prs
190
310
500
Nous avons arrondi 10 prs pour que chacun des enquteurs puissent raliser 10 enqutes par
jour.
Nous devons, dabord choisir les 4 units de la 1re rgion et ensuite choisir les 190 personnes
dans ces 4 units. On choisira les 4 plus grandes units comme indiqu dans lnonc, nous
dterminerons enfin le nombre dhabitants interviewer, dans chaque unit, au prorata de
limportance des 4 units choisies.
Rgion N1 : Rpartition des 190 interviews sur 4 units et leurs
habitants
Nombre
Nombre
Arrondis
Units
dhabitants
%
dhabitants
10 prs
total
interviews
U1
93600
44,67%
85
90
U2
45400
21,17%
40
40
U3
38900
18,14%
34
30
U4
36500
16,03%
31
30
Total
211400
100%
190
190

25

Statistiques dcisionnelles

1. Dtermination de lchantillon

De mme, nous devons, dabord choisir les 6 units de la 2me rgion et ensuite choisir les 310
personnes dans ces 6 units. On choisira les 6 plus grandes units, nous dterminerons enfin le
nombre dhabitants interviewer, dans chaque unit, au prorata de limportance des 6 units
choisies.
Rgion N2 : Rpartition des 300 interviews sur 6 units et leurs
habitants
Nombre
Nombre
Arrondis
Units
dhabitants
%
dhabitants
10 prs
total
interviews
U09
117100
27,94%
87
90
U10
107100
25,55%
80
80
U11
61200
14,60%
45
40
U12
51000
12,17%
39
40
U13
43800
10,45%
32
30
U14
38900
9,29%
27
30
Total
419100
100%
310
310
Ainsi, on mobilisera 4 enquteurs pour la 1re rgion, 1 enquteur pour chaque unit, celui de
lunit 1 passera plus de temps, 9 jours (10 interviews par jour) ; de mme, on mobilisera 6
enquteurs pour la 2me rgion, 1 enquteur pour chaque unit, celui de lunit 09 passera plus
de temps, 9 jours (10 interviews par jour). Lopration durera donc 9 jours.
1.5.6. Solution de lexercice 1.4.6.
a) Nous sommes dans le cas o la loi de probabilit de la consommation moyenne nest pas
connue. Nous utilisons donc lingalit de Bienaym Tchebycheff.

n
avec

2
2 .

= 10

= 1,16

et

= 5%

ce qui donne n = 1487 quon peut arrondir 1500


b) Effectuons une stratification o les catgories de commune constituent les strates.
Lchantillon de 1500 interviews sera rparti de faon proportionnelle sur les diffrentes
strates. En conservant la mme fraction de sondage de chaque strate.
On dtermine le nombre dhabitants dans chaque strate en se basant sur les centres de classes.

26

Statistiques dcisionnelles

Nombre
dhabitants
Moins de 1000[
[ 1000 2000[
[ 2000 5000[
[ 5000 10000[
[10000 20000[
plus de 20000
Total
La fraction de sondage : f =

1. Dtermination de lchantillon

Centre de
classe
500
1500
3500
7500
15000
30000

Nombre de
communes
900
300
200
80
40
10
1530

Nombre
dhabitants
450000
450000
700000
600000
600000
300000
3100000

Nombre
dinterviews
218
218
339
290
290
145
1500

1500 = 0,00048387
3100000

c) Pour visiter le plus grand nombre de communes, on fixe le nombre dinterviews raliser
par commune 10 sauf pour la dernire catgorie de communes car elle ne contient que 10
communes qui seront toutes visites, on ralisera alors 14 interviews par commune. Pour
dterminer le nombre de communes visiter dans chacune des catgories de communes, il
suffit de diviser le nombre dinterviews par 10.
Catgories de
communes
Moins de 1000[
[ 1000 2000[
[ 2000 5000[
[ 5000 10000[
[ 10000 20000[
plus de 20000
Total

Nombre de
Nombre
Nombre
communes
dinterviews
dinterviews
visiter
218
22
220
218
22
220
339
34
340
290
29
290
290
29
290
145
10
140
1500
1500

1.5.7. Solution de lexercice 1.4.7.


a) Le rendement de chaque enquteur pendant 1 mois est de 150 interviews avec un cart type
de 5,5 interviews. Pour les 12 enquteurs ce rendement est en moyenne de 1800 interviews
avec un cart type de 19 interviews.
p(n >no ) = 0,025 => p(n <no ) = 0,975

n 0 1800 = Z = 1,96
0,975
19
ce qui donne : no = 1838

27

Statistiques dcisionnelles

1. Dtermination de lchantillon

b) Reprenons les donnes et calculons le poids de chaque tranche dge en effectuant une
rpartition proportionnelle des 1838 interviews.
Age
Effectifs
Poids en %
Taille
chantillon

Moins de
20 ans
5500000
57,9
1064

Entre 20
et 30 ans
2500000
26,3
484

Entre 30
et 60 ans
1250000
13,2
242

Plus de 60
Total
ans
250000 9500000
2,6
100
48
1838

1.5.8. Solution de lexercice 1.4.8.


a) Dans le cas de lutilisation de lingalit de Bienaym Tchebycheff, on trouve :

n
avec

p.q
2 .
p = 0,01

q = 0,99

= 0,1% et = 5%

ce qui donne n = 198000


Dans le cas de prlvements sans remise dans une population finie, on trouve :

Z
n

1-

p.q N

N Z
1-

avec

p = 0,01

p.q

q = 0,99

= 0,1%

N = 500000

= 1%

et

Z = 1,96
1-

ce qui donne n = 35344


Comme on le voit, lingalit de Bienaym Tchebycheff aboutit ici un chantillon de taille
trop leve. Nous devons, par consquent recourir au thorme central limite et accepter
lhypothse vraisemblable que la loi de probabilit que suit la variable alatoire peut tre
approche par une loi normale du fait que la population concerne est grande.
b) Type de sondage.
b1) Si on tire n fusibles en prlevant n/50 par sac, il sagit dun chantillonnage stratifi
avec rpartition proportionnelle.
28

Statistiques dcisionnelles

1. Dtermination de lchantillon

b2) Si on choisit d'abord k sacs et on tire ensuite ni fusibles par sac, il sagit
dchantillonnage deux degrs.
b3) Si on mlange le contenu des 50 sacs, et on tire n fusibles, il sagit dchantillonnage
alatoire simple.
c) Le procd de tirage, le mieux adapt est lchantillonnage stratifi. Si le contenu des 50
sacs est homogne, on peut procder par chantillonnage deux degrs.
1.5.9. Solution de lexercice 1.4.9.
a) La rpartition optimale tient compte de quatre facteurs :
- Budget total de lenqute, G = 44 320 dh
- Poids de la strate, wi
- Cot de la collecte de linformation dans la strate, ci
- Dispersion lintrieur de la strate, mesure par lcart type i.
Le nombre dunits choisir dans chacune des strates est :

ni k

w i i

avec

ci

G
w i i

ci

Reprenons les donnes de lexercice dans un tableau synthtique.


Rgions
Nombre dentreprises
Poids de la strate, wi %
Cot unitaire ci
lcart type i.

R1
360
12%
225
0,2

R2
840
28%
196
0,1

R3
600
20%
400
0,2

A partir de ces donnes, nous pouvons calculer n :

k=

G
w i i

ci

44320
0,12.0,2. 225 0,28.0,1. 196 0,2.0,2. 400 0,4.0,4. 324
k = 10000

29

R4
1200
40%
324
0,4

Total
3000
100%

Statistiques dcisionnelles

1. Dtermination de lchantillon

ce qui donne :

n 1 10000

0,12.0,2

n 3 10000

0,2.0,2

= 16

225
= 20

400

n 2 10000

0,28.0,1

n 4 10000

0,4.0,4

= 20

196
= 89

324

ce qui donne n = n1 + n2 + n3 + n4 = 145


Ce qui nous permet de raliser une stratification des entreprises de lchantillon, rgion par
rgion :
Rgions
Nombre dentreprises
Echantillon

R1
360
16

R2
840
20

R3
600
20

R4
1200
89

Total
3000
145

b) Nous sommes dans le cas o la loi de probabilit nest pas connue. Nous utilisons donc
lingalit de Bienaym Tchebycheff.

avec

p.q
.
p = 0,3

ce qui donne

soit

q = 0,7

n = 145

p.q
n.

= 1%

et

=?

= 38 % ce qui est une marge derreur inacceptable.

1.5.10. Solution de lexercice 1.4.10.


a) Nous sommes dans le cas o la loi de probabilit nest pas connue. Nous utilisons donc
lingalit de Bienaym Tchebycheff.

n
avec

p.q
2 .
p = 0,1

q = 0,9

= 5%

et

= 1%

ce qui donne n = 18 000

30

Statistiques dcisionnelles

1. Dtermination de lchantillon

b) Supposons n la taille de lchantillon, NE le nombre denquteurs et NJ le nombre de jours


ncessaires pour faire lensemble des interviews.
Nous avons les galits suivantes :
132 500 = 20 000 + NE.(1000 + 170).NJ
n = 6 . NE . NJ
De ces 2 galits, nous pouvons dduire :

n
6

ce qui donne pour n = 576


112 500 1170
c) Si lon ralise lenqute avec le budget allou, c'est--dire avec un chantillon de 576
lments seulement, la marge derreur est :

p.q

soit

.
2

avec

p = 0,1

q = 0,9

p.q
n.

= 5%

et n = 576

ce qui donne = 5,6% une telle marge derreur est acceptable.


On peut donc se contenter dun chantillon de 576 au lieu dun chantillon de 18 000.
1.5.11. Solution de lexercice 1.4.11.
La rpartition optimale tient compte de quatre facteurs :
- Budget total de lenqute, G = 10 000 dh.
- Poids de la strate, wi
- Cot de la collecte de linformation dans la strate, ci
- Dispersion lintrieur de la strate, mesure par lcart type i.
Le nombre dunits choisir dans chacune des strates est :

ni k

w i i
ci

avec

G
w i i

ci

31

Statistiques dcisionnelles

1. Dtermination de lchantillon

Reprenons les donnes de lexercice.

Strates

Effectif

Poids de la strate

Ecart-type

Cot de lobservation

Strate 1
Strate 2

2000
3000

0,4
0,6

2
0,7

25
36

A partir de ces donnes, nous pouvons calculer n :

G
w i i

10000

0,4.2. 25 0,6.0,7. 36

ci

= 1533,74

ce qui donne :

n 1 1533,74

0,4.2

= 245

25

ce qui donne

n 2 1533,74

0,6.0,7

= 107

36

n = n1 + n2 = 352

1.5.12. Solution de lexercice 1.4.12.


a) La longueur des entretoises est une variable normale de moyenne 37,50 mm et dcart type
inconnu.
998 sur 1000 des pices fabriques sont bonnes si :
p(37,45 < X < 37,55) = 0,998
(

37,55 37,5
37,45 37,5
) - (
) = 0,998

0,05
0,05
) - (
) = 0,998

2.(

0,05
) - 1 = 0,998

0,05
= Z0,999 = 3,09

0,05
) = 0,999

=>

= 0,016

32

Statistiques dcisionnelles

1. Dtermination de lchantillon

b) La moyenne des longueurs des pices prleves appartient lintervalle ferm [37,495 ;
37,505] et signifie que :
= (37,505 37,495) / 2 = 0,005
Nous sommes dans le cas o la loi de probabilit est la loi normale, on utilise donc lgalit :

n Z2

avec

2
2

= 0,05

ce qui donne

= 0,016

= 0,005

et Z

n = 40

33

= 1,96

Statistiques dcisionnelles

1. Dtermination de lchantillon

34

Statistiques dcisionnelles

Partie 2. Loi de probabilit dchantillon

PARTIE 2
LOI DE PROBABILITE DECHANTILLON

La notion de distribution dchantillonnage est la base des mthodes dinfrence statistique


dont les deux principales applications sont les problmes destimation et ceux des tests
dhypothses.
Les premiers ont pour but destimer, partir dun chantillon, la valeur numrique dun ou de
plusieurs paramtres de la population, et de dterminer la prcision de cette ou de ces
estimations. Cela fera lobjet de la 3e partie avec ses chapitres 5, 6 et 7.
Les seconds ont pour but de vrifier la vracit dune hypothse, mise au dpart, au sujet
dune ou de plusieurs populations. Cela fera lobjet de la 4e partie avec ses chapitres 8, 9, 10 et
11.
Mais avant daborder les calculs destimation et de tests statistiques, il nous faudra dterminer
les lois de probabilits des paramtres dchantillon, en effet :
A tout paramtre de population , on peut associer une srie infinie de valeurs observes t, t,
t , , calcules partir dchantillons successifs de mme effectif, prlevs dans des
conditions identiques. Ces valeurs peuvent tre considres comme des valeurs observes
dune mme variable alatoire T et cette variable est fonction des diffrentes variables
alatoires correspondant chacun des individus de lchantillon :
T = f (X1, X2, , Xn)
En supposant que lchantillon est alatoire et simple, la variable alatoire T possde une
distribution de probabilit, dite distribution dchantillonnage. On peut donc calculer
lesprance E(T) et la variance V(T) de cette distribution.
La distribution dchantillonnage est donc la distribution des diffrentes valeurs que peut
prendre la variable alatoire T, pour les diffrents chantillons possibles. Son cart type T est
appel erreur standard.

35

Statistiques dcisionnelles

Partie 2. Loi de probabilit dchantillon

Les principales distributions dchantillonnage sont :


- la distribution dchantillonnage de la moyenne,
- la distribution dchantillonnage de la variance,
- la distribution dchantillonnage de la proportion.
Cette partie sera consacre la dtermination, chapitre aprs chapitre, des lois de distribution
dchantillonnage sus-cites.

36

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

CHAPITRE 2
LOI DE PROBABILITE DE LA MOYENNE DECHANTILLON

2.1. POSITION DU PROBLEME.


Dans ce chapitre, nous considrons une population mre do lon extrait, successivement, des
chantillons de n lments dont on dtermine les moyennes :
n

a) x1, x2, x3, ., xn

avec

x
i 1

n
n

x'

avec

x'

b) x1, x2, x3, ., xn

i 1

Les moyennes

x ''
i

c) x1, x2, x3, ., xn avec

x''

i 1

x , x' et x' ' sont gnralement diffrentes.

On peut considrer la suite des premires observations x1, x1, x1, des diffrents
chantillons comme des valeurs observes dune mme variable alatoire X1, la suite des
deuximes observations des diffrents chantillons comme des valeurs observes dune mme
variable alatoire X2, etc.

Les moyennes observes

x , x ' , x ' ' , sont alors des valeurs observes dune mme variable

alatoire

X qui est fonction de X1, X2, , Xn.


n

X
i 1

n
37

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

Comme X1, X2, , Xn, la variable alatoire X possde une distribution de probabilit, dite
distribution dchantillonnage de la moyenne. On peut donc calculer lesprance et la variance
de cette distribution, en supposant que lchantillon est alatoire et simple, les variables
alatoires X1, X2, , Xn ont toutes la mme distribution de probabilit, dont la moyenne est
dsigne par m et la variance par .
E(Xi) = m

et

V(Xi) =

2.2. CAS DUNE POPULATION DONT ON CONNAIT LA MOYENNE, LA VARIANCE


ET LA LOI DE PROBABILITE.
2.2.1. Echantillon exhaustif.
Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, un
chantillon alatoire simple deffectif n, lesprance mathmatique et la variance de la
moyenne sont :
n

Xi

E( X ) = E(

i 1

)=

1 E(Xi) = 1 nm = m
n
n
i 1

V( X ) =
Lerreur standard est alors :

N n 2
N 1 n

X N n
n N 1

Dans ce cas, la loi de probabilit de la moyenne est normale de moyenne m et dcart type

Nn
.
N 1

2.2.2. Echantillon non exhaustif.


n

Xi

E( X ) = E(

i 1

)=

n
1
E(Xi) = 1 nm = m
n
n i 1

Xi

V( X ) = V(

i 1

Lerreur standard est alors :

)=

n
1
V(Xi) = 1 n =
n
n
n i 1

n
38

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

Dans ce cas la loi de probabilit de la moyenne est normale de moyenne m et dcart type


.
X
n

2.3. CAS DUNE POPULATION DONT ON CONNAIT LA MOYENNE ET LA LOI DE


PROBABILITE.

E( X ) = m

et

V( X ) =
n

n v(x) =
n 1

Avec :

(x i x)
i 1

n 1

Lerreur standard est alors : X


n

Dans ce cas la loi de probabilit de la moyenne est normale de moyenne m et dcart type
^

X .
n

2.4. CAS DUNE POPULATION DONT ON NE CONNAIT NI LA MOYENNE, NI LA


VARIANCE NI LA LOI DE PROBABILITE.

E( X ) = m

avec :

n v(x) =
n 1

et

(x i x)
i 1

n 1
^

Lerreur standard est alors : X


n

39

V( X ) =
n

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

Si la distribution de la population mre est inconnue, le thorme central limite permet


daffirmer que la distribution de la moyenne est asymptotiquement normale. Pour un effectif
suffisamment lev, la moyenne dun chantillon peut toujours tre considre comme une
variable approximativement normale. Cest gnralement le cas lorsque leffectif est suprieur
30. Dans le cas contraire (n 30), la moyenne dun chantillon peut toujours tre considre
comme une variable de Student (n-1) degr de libert.
2.5. LOI DE PROBABILITE DE LA DIFFERENCE DE DEUX MOYENNES
DECHANTILLONS INDEPENDANTS.

La diffrence entre les moyennes observes des deux chantillons indpendants est :

x1 - x 2

Une distinction est faite entre le cas de deux populations de variances ingales et le cas de deux
populations de variances gales.
2.5.1. Cas de deux populations de variances ingales

E( x1 -

x 2 ) = m1-m2

V( x1 -

x 2 ) = 1 2
n1 n 2

Pour des populations normales (variances connues), les variables


x1 , x2 sont des variables

normales de moyennes respectivement m1 et m2 et dcarts types respectivement

1 et
n1

2 . La diffrence entre les moyennes observes des deux chantillons indpendants est ellen2
mme normale de moyenne (m1-m2) et dcart type

1 2 .
n1 n 2

Si les distributions des populations mres sont inconnues, pour des effectifs suffisamment
levs, la diffrence entre les moyennes peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs
30. Dans le cas contraire, la diffrence entre les moyennes peut toujours tre considre comme
une variable de Student (n1 + n2 - 2) degrs de libert.
2.5.2. Cas de deux populations de variances gales
Dans le cas o les populations sont de variances gales, une estimation de la variance
commune aux deux populations est donne par :

40

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

(x

x 1 )

x 2 )

E( x1

n1 n 2 2

(x

x 2 ) = m1 - m2
^

^
V( x1 - x 2 ) = = ( 1 1 )
n1 n 2
n1 n 2

Pour des populations normales, la diffrence entre les moyennes observes des deux
chantillons indpendants est elle-mme normale de moyenne (m1-m2) et dcart type
^
( 1 1 ) .
n1 n 2

Si les distributions des populations mres sont inconnues, pour des effectifs suffisamment
levs, la diffrence entre les moyennes peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs
30. Dans le cas contraire, la diffrence entre les moyennes peut toujours tre considre comme
une variable de Student (n1 + n2 - 2) degrs de libert.
2.6. ENONCES DES EXERCICES DAPPLICATION.
2.6.1. Quelle est l'esprance mathmatique et quelle est la variance des rsultats qu'on peut
obtenir quand on choisit au hasard et indpendamment dix nombres entiers de 1 9 et qu'on en
calcule la moyenne, en supposant que chacun des nombres de 1 9 a une mme probabilit
d'tre choisi et qu'un mme nombre peut tre choisi plusieurs fois sans aucune restriction ?
2.6.2. Une population est constitue des cinq nombres 2, 3, 6, 8, 11. On considre tous les
chantillons non exhaustifs possibles de taille deux de cette population. Trouver :
a) La moyenne de la population.
b) Lcart type de la population.
c) La moyenne de la distribution d'chantillonnage des moyennes.
d) Lcart type de la distribution d'chantillonnage des moyennes, c'est--dire l'erreur
quadratique moyenne des moyennes.
e) Reprendre les mmes questions dans le cas dun chantillon exhaustif.
2.6.3. On suppose que les poids de 3000 ttes dovins d'une ferme suivent une loi normale de
moyenne 38,0 kilogrammes et dcart type 5,0 kilogrammes. Si l'on extrait 80 chantillons de
25 ttes chacun, quelle est la moyenne et lcart type thoriques de la distribution
d'chantillonnage des moyennes pour :
a) Un chantillonnage non exhaustif ?
b) Un chantillonnage exhaustif ?

41

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

c) Pour combien d'chantillons peut-on s'attendre trouver une moyenne comprise entre 36,8
et 38,3 kilogrammes ?
2.6.4. Cinq cents rondelles ont un poids moyen de 5,02 grammes et un cart type de 0,30
gramme. Trouver la probabilit pour quun chantillon de 100 rondelles choisies au hasard ait
un poids total :
a) Compris entre 496 et 500 grammes.
b) Plus grand que 510 grammes.
2.6.5. Les batteries d'un fabricant A ont une dure de vie moyenne de 1400 heures avec un
cart-type de 200 heures, et celles d'un fabricant B ont une dure de vie moyenne de 1200
heures avec un cart-type de 100 heures. Si l'on teste des chantillons de 125 batteries pour
chaque marque, quelle est la probabilit pour que la marque A ait une dure de vie moyenne
qui soit au moins suprieure celle de la marque B de :
a) 160 heures ?
b) 250 heures ?
2.6.6. Les piles d'une marque donne psent 0,50 gramme avec un cart-type de 0,02 gramme.
Quelle est la probabilit pour que deux lots de 1000 piles chacun diffrent entre eux de plus de
2 grammes ?
2.6.7. Un certain type dampoule lectrique a une dure de vie moyenne de 1500 heures et un
cart type de 150 heures. Trois ampoules sont branches de telle manire que, si lune delles
est grille, les autres continuent fonctionner. En supposant que les dures de vie suivent une
loi de Laplace Gauss, quelle est la probabilit pour que lclairage fonctionne, en moyenne :
a) Au moins pendant 5000 heures ?
b) Au plus pendant 4200 heures ?
2.6.8. Les poids de 1500 pices suivent une loi de probabilit normale de moyenne 22,40 kg et
dcart type 0,048 kg Dterminer pour 300 chantillons alatoires de taille 36 de cette
population la moyenne et l'cart type thorique de la distribution d'chantillonnage des
moyennes :
a) L'chantillonnage tant non exhaustif.
b) Lchantillonnage tant exhaustif.
c) Combien d'chantillons alatoires ont leur moyenne comprise entre 22,39 et 22,41 kg ?
2.6.9. Les poids des colis reus dans un grand magasin ont une moyenne de 300 kg et un cart
type de 50 kg, Quelle est la probabilit pour que 25 colis reus au hasard et chargs sur un
monte-charge dpassent la limite de scurit du monte-charge, qui est 8200 kilogrammes.

42

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

2.6.10. A et B fabriquent deux types de cbles ayant comme charges de rupture respectives
4000 et 4500 kilogrammes avec des carts-types de 300 et 200 kilogrammes. Si l'on teste 100
cbles de la marque A et 50 cbles de la marque B, quelle est la probabilit pour que la
rsistance de rupture moyenne de B ait :
a) Au moins 600 kilogrammes de plus que A ?
b) Au moins 450 kilogrammes de plus que A ?
2.6.11. Une firme fabrique un bien dont la dure de vie est en moyenne 1800 heures avec un
cart type de 200 heures.
a) Trouver la probabilit qu'un chantillon alatoire de 100 units de ce bien ait une moyenne
de vie suprieure 1825.
b) Trouver la probabilit qu'un chantillon alatoire de 100 Units de ce bien ait une moyenne
de vie de pas plus de 1775 et pas moins de 1760.
2.7. SOLUTIONS DES EXERCICES DAPPLICATION.
2.7.1. Solution de lexercice 2.6.1.
Il sagit du cas dune population dont on connat la moyenne et la variance. Lchantillon est
non exhaustif.

E( X ) = m =

1 23 45 6 7 89 = 5
9

x i x 2 = 1 2 3 4 5 6 7 8 9
2

V( X ) =

= 6,67 = 0,667
n
10

Lerreur standard est alors :

X = 0,667 = 0,82
n

2.7.2. Solution de lexercice 2.6.2.


a) La moyenne de la population.
m=

- 5 = 6,67

23 6811 = 6
5

43

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

b) Lcart type de la population.

x i x 2 = 2 3 6 8 11
2

- 6 = 10,80

c) La moyenne de la distribution d'chantillonnage des moyennes.

E( X ) = m = 6
d) Lcart type de la distribution d'chantillonnage des moyennes, c'est--dire l'erreur standard.
Il sagit du cas dune population dont on connat la moyenne et la variance. Lchantillon est
non exhaustif.

V( X ) =

= 10,80 = 5,40
n
2

Lerreur standard est alors :

X = 5,40 = 2,32
n

e) Cas dun chantillon exhaustif.


- Moyenne de la distribution d'chantillonnage des moyennes.

E( X ) = m = 6
- Ecart type de la distribution d'chantillonnage des moyennes.

V( X ) =

N n = 5 2 10,80 = 4,05
N 1 n
51 2

Lerreur standard est alors :

4,05 = 2,01

2.7.3. Solution de lexercice 2.6.3.


Dsignons par X le poids des ovins. X suit une loi normale de moyenne 38 kg et dcart type 5
kg.
La taille de lchantillon est n = 25
44

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

a) Cas dun chantillon non exhaustif.


Il sagit dune population dont on connat la moyenne, la variance et la loi de probabilit.
- Moyenne de la distribution d'chantillonnage des moyennes.

E( X ) = m = 38 kg
- Ecart type de la distribution d'chantillonnage des moyennes.

V( X ) = =

5 = 1
25

Lerreur standard est alors :

1 = 1 kg.

b) Cas dun chantillon exhaustif.


Il sagit dune population dont on connat la moyenne, la variance et la loi de probabilit.
- Moyenne de la distribution d'chantillonnage des moyennes.

E( X ) = m = 38 kg
- Ecart type de la distribution d'chantillonnage des moyennes.

V( X ) =

Nn
N 1

= 3000 25 5 = 0,992
n
3000 1 25

Lerreur standard est alors :

0,992 = 0,996 kg.

c) Nombre d'chantillons dont la moyenne est comprise entre 36,8 et 38,3 kilogrammes.
Calculons la probabilit que la moyenne soit comprise entre 36,8 et 38,3 kg. La moyenne suit
une loi normale de moyenne 38 et dcart type 1 kg.

38,338
36,838
) - (
)
1
1

p(36,8 <

x < 38,3) = (

p(36,8 <

x < 38,3) = (0,3) - (-1,2)

p(36,8 <

x < 38,3) = 0,6179 0,1151 = 0,5028

45

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

Nombre d'chantillons dont la moyenne est comprise entre 36,8 et 38,3 kilogrammes =
0,5028x80 = 40,22.
On peut sattendre avoir 40 41 chantillons dont la moyenne est comprise entre 36,8 et 38,3
kilogrammes.
2.7.4. Solution de lexercice 2.6.4.
Dterminons la loi de probabilit de la moyenne.
Il sagit dune population dont on connat la moyenne, la variance et la loi de probabilit.
- Moyenne de la distribution d'chantillonnage des moyennes.

E( X ) = m = 5,02 g
- Ecart type de la distribution d'chantillonnage des moyennes.

V( X ) =

Nn
N 1

= 500 100 0,3 = 0,0007


n
500 1 100

Lerreur standard est alors :

0,0007 = 0,027 g.

a) Un poids total compris entre 496 et 500 g est quivalent une moyenne comprise entre 4,96
et 5 g.

5 5,02
4,96 5,02
) - (
)
0,027
0,027

p(4,96 <

x < 5) = (

p(4,96 <

x < 5) = (-0,74) - (-2,22)

p(4,96 <

x < 5) = 0,2296 0,0132 = 0,2164

b) Un poids total plus grand que 510 g est quivalent une moyenne plus grande que 5,10 g.

p( x > 5,10) = 1 - (

5,10 5,02
)
0,027

p( x > 5,10) = 1 - (2,96) = 1 0,9985 = 0,0015


46

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

2.7.5. Solution de lexercice 2.6.5.


Il sagit de la diffrence de deux moyennes dchantillons indpendants.
La diffrence entre les dures de vie moyennes observes des deux chantillons indpendants
1 2
suit une loi normale de moyenne (m1-m2) et dcart type
.

n1
n2

E( x1

V( x1 -

x 2 ) = m1 - m2 = 1400 1200 = 200 h

x2 ) =

1 2
200 100

=
= 400
125 125
n1
n2

Lcart type est donc

400 = 20 h

La diffrence entre les dures de vie moyennes observes des deux chantillons indpendants
suit une loi normale de moyenne 200 heures et dcart type 20 heures.
a) Probabilit pour que la marque A ait une dure de vie moyenne qui soit au moins suprieure
celle de la marque B de 160 heures.

p( x1

p( x1 -

x 2 > 160) = 1 - ( 160 200 )


20

x 2 > 160) = 1 - (-2) = 0,9772

b) Probabilit pour que la marque A ait une dure de vie moyenne qui soit au moins suprieure
celle de la marque B de 250 heures.

p( x1

p( x1 -

x 2 > 250) = 1 - ( 250 200 )


20

x 2 > 250) = 1 - (2,5) = 0,0062

47

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

2.7.6. Solution de lexercice 2.6.6.


Il sagit de la diffrence de deux moyennes dchantillons indpendants.
La diffrence entre les poids moyens observs des deux chantillons indpendants suit une loi
1 2
normale de moyenne (m1-m2) et dcart type
.

n1
n2

E( x1 -

x 2 ) = m1 - m2 = 0,5 0,5 = 0 g

V( x1 -

x2 ) =

1 2
0,02 0,02

=
= 0,0000008
1000 1000
n1
n2

Lcart type est donc 0,00089 g.


La diffrence entre les poids moyens observs des deux chantillons indpendants suit une loi
normale de moyenne nulle et dcart type 0,00089 gramme.
Les deux lots de 1000 pices chacune diffrents de plus de 2 g ce qui donne un cart absolu
entre les moyennes de plus de 0,002 g.

p( x1 -

x 2 > 0,002) = p(-0,002 < x1 - x 2 < 0,002)

p(-0,002 < x1

p(-0,002 < x1

p(-0,002 < x1 -

x 2 < 0,002) = (

0,002
0,002
) - ()
0,00089
0,00089

x 2 < 0,002) = 2. (2,25) 1

x 2 < 0,002) = 2. 0,9878 1 = 0,9756

2.7.7. Solution de lexercice 2.6.7.


Dsignons par X la dure de vie dune ampoule. X suit une loi normale de moyenne 1500
heures et dcart type 150 heures. Lclairage va durer pendant le total des dures de vie des
trois ampoules.

48

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

Dsignons par Y la dure de vie totale.


Y=X+X+X
E(Y) = E(X) + E(X) + E(X) = 4500 h
V(Y) = V(X) + V(X) + V(X) = 150+150+150 = 67500
Lcart type de Y est donc

67500 = 259,81 h.

Lclairage Y suit une loi normale de moyenne 4500 heures et dcart type 259,81 heures.
a) Probabilit que lclairage fonctionne, en moyenne, au moins pendant 5000 heures.
p(Y >5000) = 1 - ( 5000 4500 )

259,81

p(Y >5000) = 1 - (1,92) = 0,0274


b) Probabilit que lclairage fonctionne, en moyenne, au plus pendant 4200 heures.
p(Y < 4200) = ( 4200 4500 )

259,81

p(Y < 4200) = (-1,15) = 0,1251


2.7.8. Solution de lexercice 2.6.8.
Dsignons par X le poids des pices. X suit une loi normale de moyenne 22,40 kg et dcart
type 0,048 kg.
La taille de lchantillon est n = 36
a) Cas dun chantillon non exhaustif.
Il sagit dune population dont on connat la moyenne, la variance et la loi de probabilit.
- Moyenne de la distribution d'chantillonnage des moyennes.

E( X ) = m = 22,40 kg

49

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

- Ecart type de la distribution d'chantillonnage des moyennes.

V( X ) = =

0,048
= 0,0001
36

Lerreur standard est alors :

0,0001 = 0,008 kg.

b) Cas dun chantillon exhaustif.


Il sagit dune population dont on connat la moyenne, la variance et la loi de probabilit.
- Moyenne de la distribution d'chantillonnage des moyennes.

E( X ) = m = 22,40 kg
- Ecart type de la distribution d'chantillonnage des moyennes.

V( X ) =

N n = 150036 0,048 = 0,00006


N 1 n
15001 36

Lerreur standard est alors :

0,00006 = 0,00791 kg.

c) Nombre d'chantillons dont la moyenne est comprise entre 22,39 et 22,41 kilogrammes.
Calculons la probabilit pour que la moyenne soit comprise entre 22,39 et 22,41 kg. La
moyenne suit une loi normale de moyenne 22,40 et dcart type 0,008 kg.

22,41 22,40
22,39 22,40
) - (
)
0,008
0,008

p(22,39 <

x < 22,41) = (

p(22,39 <

x < 22,41) = (1,25) - (-1,25)

p(22,39 <

x < 22,41) = 0,8944 0,1056 = 0,7888 = 78,88 %

Ce qui veut dire que 78,88 % des 300 chantillons qui ont leur moyenne comprise entre 22,39
kg et 22,41 kg soit : 0,7888 x 300 = 236,64.
On peut sattendre avoir 236 ou 237 chantillons dont la moyenne est comprise entre 22,39 et
22,41
kilogrammes.
50

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

2.7.9. Solution de lexercice 2.6.9.


Le poids des 25 colis reus au hasard et chargs sur un monte-charge dpassent la limite de
scurit du monte-charge, qui est 8200 kilogrammes si le poids moyen dun colis dpasse 328
kg.
Dterminons la loi de probabilit de la moyenne.
Il sagit dune population dont on connat la moyenne et la variance.
- Moyenne de la distribution d'chantillonnage des moyennes.

E( X ) = m = 300 kg
- Ecart type de la distribution d'chantillonnage des moyennes.

V( X ) =

= 50 = 100
n
25

Lerreur standard est alors :

100 = 10 kg.

p( x > 328) = 1 - ( 328300 )

10

p( x > 328) = 1 - (2,80) = 1 0,9974 = 0,0026 = 0,26 %


2.7.10. Solution de lexercice 2.6.10.
Il sagit de la diffrence de deux moyennes dchantillons indpendants.
La diffrence entre les dures de vie moyennes observes des deux chantillons indpendants
suit une loi normale de moyenne (m2-m1) et dcart type

E( x 2

V( x 2 -

x1 ) = m2 - m1 = 4500 4000 = 500 kg

x1 ) = 1 2 = 300 200 = 1700


n1 n 2
100 50

51

1 2 .
n1 n 2

Statistiques dcisionnelles

Lcart type est donc

2. Loi de probabilit de la moyenne dchantillon

1700 = 41,23 kg

La diffrence entre les dures de vie moyennes observes des deux chantillons indpendants
suit une loi normale de moyenne 500 kg et dcart type 41,23 kg.
a) Probabilit pour que la marque B ait une charge de rupture dau moins 600 kg de plus que la
marque A.

p( x 2

p( x 2 -

x1 > 600) = 1 - ( 600500 )


41,23

x1 > 600) = 1 - (2,43) = 0,0075

b) Probabilit pour que la marque B ait une charge de rupture dau moins 450 kg de plus que la
marque A.

p( x 2

p( x 2 -

x1 > 450) = 1 - ( 450500 )


41,23

x1 > 450) = 1 - (-1,21) = 0,8869

2.7.11. Solution de lexercice 2.6.11.


Dsignons par X la dure de vie de moyenne 1800 heures avec un cart type de 200 heures.
Dterminons la loi de probabilit de la moyenne.
Il sagit dune population dont on connat la moyenne et la variance.
- Moyenne de la distribution d'chantillonnage des moyennes.

E( X ) = m = 1800 h
- Ecart type de la distribution d'chantillonnage des moyennes.

V( X ) =

= 200 = 400
n
100

Lerreur standard est alors :

400 = 20 h.

52

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

a) Probabilit qu'un chantillon alatoire de 100 units de ce bien ait une moyenne de vie
suprieure 1825.

p( x > 1825) = 1 - ( 18251800 )

20

p( x > 1825) = 1 - (1,25) = 0,1056


b) Probabilit qu'un chantillon alatoire de 100 units de ce bien ait une moyenne de vie de
pas plus de 1775 et pas moins de 1760.

p(1760 <

x < 1775) = ( 17751800 ) - ( 17601800 )


20
20

p(1760 <

x < 1775) = (-1,25) - (-2)

p(1760 <

x < 1775) = 0,1056 0,0228 = 0,0828

53

Statistiques dcisionnelles

2. Loi de probabilit de la moyenne dchantillon

54

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

CHAPITRE 3
LOI DE PROBABILITE DE LA VARIANCE DECHANTILLON

3.1. POSITION DU PROBLEME.


De la mme manire que pour la moyenne, chacun des chantillons possde une variance :

(x i x)

v(x) i 1

(x i' x')

v(x') i 1

(x " x")
i

v(x") i 1

Ces variances peuvent tre considres comme des valeurs observes dune mme variable
alatoire :

(Xi X)

V(X) i 1

Comme X1, X2, , Xn, la variable alatoire V(X) possde une distribution de probabilit, dite
distribution dchantillonnage de la variance. On peut donc calculer lesprance mathmatique
et la variance de cette distribution, en supposant que lchantillon est alatoire et simple, les
variables alatoires X1, X2, , Xn ont toutes la mme distribution de probabilit, dont la
moyenne est dsigne par m et la variance par .
E(Xi) = m

et

V(Xi) =

on peut dmontrer alors :

E(V(X)) =

n 1

n

55

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

Pour la variance de la distribution dchantillonnage de la variance, on dmontre, dans le cas


dune population normale :
V(V(X)) =

2(n 1) 4
.
n

Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, un
chantillon alatoire est simple deffectif n, lesprance mathmatique de la variance est :

E(V(X)) =

N
n 1


N 1
n

En ce qui concerne la forme de la distribution dchantillonnage de la variance, on peut


dmontrer que dans le cas particulier dune population normale, la variable alatoire

(Xi X)
i 1

possde une distribution khi deux (n-1) degr de libert.

3.2. ENONCES DES EXERCICES DAPPLICATION.


3.2.1. Calculez la moyenne et l'cart type de la variance S, ainsi que la probabilit p(10 < S
<20), en supposant que S dsigne la variance observe d'chantillons alatoires et simple
d'effectif 10 extraits d'une population normale de moyenne gale 15 et dcart type gal 4.
3.2.2. Quelle est l'esprance mathmatique et quelle est la variance des rsultats qu'on peut
obtenir quand on choisit au hasard et indpendamment dix nombres entiers de 1 9 et qu'on en
calcule la variance, en supposant que chacun des nombres de 1 9 a une mme probabilit
d'tre choisi et qu'un mme nombre peut tre choisi plusieurs fois sans aucune restriction ?
3.2.3. Une population est constitue des cinq nombres 2, 3, 6, 8, 11. On considre tous les
chantillons non exhaustifs possibles de taille deux de cette population. Trouver :
a) La moyenne de la population.
b) Lcart type de la population.
c) La moyenne de la distribution d'chantillonnage des variances.
d) Lcart type de la distribution d'chantillonnage des variances.
e) Trouver la moyenne de la distribution d'chantillonnage des variances dans le cas dun
chantillon exhaustif.

56

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

3.2.4. On suppose que les poids de 3000 ttes dovins d'une ferme suivent une loi normale de
moyenne 38,0 kilogrammes et dcart type 5,0 kilogrammes. Si l'on extrait 80 chantillons de
25 ttes chacun :
a) Quelle est la moyenne et lcart type thoriques de la distribution d'chantillonnage des
variances ?
b) Pour combien d'chantillons peut-on s'attendre trouver un cart type compris entre 4 et 7
kilogrammes ?
3.2.5. Cinq cents rondelles ont un poids moyen de 5,02 grammes et un cart type de 0,30
gramme. Trouver la probabilit pour quun chantillon de 100 rondelles choisies au hasard ait
un cart type :
a) Compris entre 0,25 et 0,35 grammes.
b) Plus grand que 0,3 grammes.
3.2.6. Un certain type dampoule lectrique a une dure de vie moyenne de 1500 heures et un
cart type de 150 heures. Trois ampoules sont branches de telle manire que, si lune delles
est grille, les autres continuent fonctionner. En supposant que les dures de vie suivent une
loi de Laplace Gauss, quelle est la probabilit pour que lcart type de lclairage ne dpasse
pas :
a) 260 heures ?
b) 200 heures ?
3.2.7. Les poids de 1500 pices suivent une loi de Laplace-Gauss de moyenne 22,40 kg et cart
type 0,048 kg.
a) Dterminer pour 300 chantillons alatoires de taille 36 de cette population, la moyenne et
l'cart type thoriques de la distribution d'chantillonnage des variances.
b) Combien d'chantillons alatoires ont-ils leur cart type compris entre 45 grammes et 50
grammes ?
3.2.8. Les poids des colis reus dans un grand magasin ont une moyenne de 300 kg et un cart
type de 50 kg
a) Dterminer pour 25 colis reus au hasard et chargs sur un monte-charge, la moyenne et
l'cart type thoriques de la distribution d'chantillonnage des variances.
b) Quelle est la probabilit pour que 25 colis reus au hasard et chargs sur un monte-charge
aient un cart type qui dpasse 40 kg ?
3.2.9. A et B fabriquent deux types de cbles ayant comme charges de rupture respectives 4000
et 4500 kilogrammes avec des carts-types de 300 et 200 kilogrammes. Si l'on teste 100 paires
de cbles des deux marques, quelle est la probabilit pour que la diffrence de rsistance de
rupture entre les deux marques ait un cart type de :
a) Moins 350 kilogrammes ?
b) Moins 300 kilogrammes ?

57

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

3.2.10. Une firme fabrique un bien dont la dure de vie est en moyenne 1800 heures avec un
cart type de 200 heures.
a) Quelle est la moyenne et lcart type thoriques de la distribution d'chantillonnage des
variances pour des chantillons de taille 20 ?
b) Quelle est la moyenne et lcart type thoriques de la distribution d'chantillonnage des
variances pour des chantillons de taille 50 ?
c) Trouver la probabilit qu'un chantillon alatoire de 20 units de ce bien ait un cart type de
vie suprieur 220.
d) Trouver la probabilit qu'un chantillon alatoire de 50 units de ce bien ait un cart type de
vie suprieur 220.
3.3. SOLUTIONS DES EXERCICES DAPPLICATION.
3.3.1. Solution de lexercice 3.2.1.
Il sagit dune population normale de moyenne gale 15 et dcart type gal 4.
m = 15

=4

et

n = 10

E (V(X)) =

n 1
10 1
=
4 = 14,4
n
10

V(V(X)) =

2(n 1) 4 2(101) 4
=
4 = 46,08
n
10

Lerreur standard est alors :

46,08 = 6,8

Dans le cas dune population normale, la variable alatoire


deux 9 (n-1) degrs de libert.
p(10 < S <20) = p( 10.10 <

10.S < 10.20 )


4
4

p(10 < S <20) = p(6,25 < < 12,50)


p(10 < S <20) = p( < 12,50) - p( < 6,25)

58

n.S possde une distribution khi

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

En consultant la table de la fonction de rpartition de la loi Khi deux, 9 degrs de libert, on


trouve :
0,8 < p( < 12,50) < 0,9 aprs interpolation linaire on trouve :
p( < 12,50) = 0,812
0,2 < p( < 6,25) < 0,3 aprs interpolation linaire on trouve :
p( < 6,25) = 0,2861
p(10 < S <20) = 0,812 0,2861 = 0.5259
3.3.2. Solution de lexercice 3.2.2.
Il sagit du cas dune population dont on connat la moyenne et la variance. Lchantillon est
non exhaustif.
La moyenne et la variance de la population sont :
m=

1 23 45 6 7 89 = 5
9

x i x 2 = 1 2 3 4 5 6 7 8 9
2

m=5

= 6,67

et

n = 10

E(V(X)) =

n 1
10 1
=
6,67 = 6,003
10
n

V(V(X)) =

2(n 1) 4 2(101)
=
.6.67 = 8,01
n
10

Lerreur standard est alors :

8,01 = 2,8

59

- 5 = 6,67

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

3.3.3. Solution de lexercice 3.2.3.


a) La moyenne de la population.
m=

23 6811 = 6
5

b) Ecart type de la population.

x i x 2 = 2 3 6 8 11
2

- 6 = 10,80

c) La moyenne de la distribution d'chantillonnage des variances.


m=6

E(V(X)) =

= 10,8

et

n=2

n 1
2 1
=
10,8 = 5,4
n
2

d) Lcart type de la distribution d'chantillonnage des variances, c'est--dire l'erreur standard.


V(V(X)) =

2(n 1) 4 2(21)
=
.10,8 = 58,32
n
2

Lerreur standard est alors :

58,32 = 7,64

e) Cas dun chantillon exhaustif.


- Moyenne de la distribution d'chantillonnage des variances.
m=6

E(V(X)) =

= 10,8

et

n=2

5 2 1
N
n 1

=
10,8 = 6,75
N 1
n
5 1 2

3.3.4. Solution de lexercice 3.2.4.


Dsignons par X le poids des ovins. X suit une loi normale de moyenne 38 kg et dcart type 5
kg
La taille de lchantillon est n = 25
60

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

a) Moyenne et cart type thoriques de la distribution d'chantillonnage des variances.


Il sagit dune population dont on connat la moyenne, la variance et la loi de probabilit.
- Moyenne de la distribution d'chantillonnage des variances.
m = 38

E(V(X)) =

= 25 et

n = 25

n 1
25 1
=
25 = 24
25
n

- Ecart type de la distribution d'chantillonnage des variances.


V(V(X)) =

2(n 1) 4 2(251)
=
.25 = 48
n
25

Lerreur standard est alors :

48 = 6,9

b) Pour combien d'chantillons peut-on s'attendre trouver un cart type compris entre 4 et 8
kilogrammes ?
Dans le cas dune population normale, la variable alatoire

n.V(X)
possde une distribution

khi deux 24 (n-1) degr de libert.


p(4 < V(X) < 7) = p( 25.16 <

25.V(X) 25.49
<
)
5
5

p(4 < V(X) < 7) = p(16 < < 49)


p(4 < V(X) < 7) = p( < 49) - p( < 16)
En consultant la table de la fonction de rpartition de la loi Khi deux, 24 degrs de libert, on
trouve :
0,995 < p( < 49) < 0,999 aprs interpolation linaire on trouve :
p( < 49) = 0,997

61

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

0,1 < p( < 16) < 0,2 aprs interpolation linaire on trouve :
p( < 16) = 0,1125
p(4 < V(X) < 7) = 0,997 0,1125 = 0,8845
Nombre d'chantillons dont lcart type est compris entre 4 et 7 kilogrammes = 0,8845x80 =
70,76.
On peut sattendre avoir 70 ou 71 chantillons dont lcart type est compris entre 4 et 7
kilogrammes.
3.3.5. Solution de lexercice 3.2.5.
Dans le cas dune population normale, la variable alatoire

n.V(X)
possde une distribution

khi deux 99 (n-1) degr de libert.


a) Ecart type compris entre 0,25 et 0,35 grammes.
p(0,25 < V(X) < 0,35) = p(

100.0,25 100.V(X) 100.0,35


<
<
)
0,3
0,3
0,3

p(0,25 < V(X) < 0,35) = p(69,44 < < 136,11)


p(0,25 < V(X) < 0,35) = p( < 136,11) - p( < 69,44)
Le nombre de degr de libert est trs grand, on peut utiliser lapproximation par la loi normale
de moyenne 99 et dcart type

2.99 =14.

136,1199
(
) = (2,65) = 0,9960
14
69,4499
) = (2,11) = 0,0174
p( < 69,44) = (
14
p( < 136,11) =

p(0,25 < V(X) < 0,35) = 0,9960 0,0174 = 0,9786


b) Ecart type plus grand que 0,3 grammes.
p(V(X) > 0,3) = 1 - p(V(X) < 0,3)

62

Statistiques dcisionnelles

p(V(X) > 0,3) = 1 - p(<

3. Loi de probabilit de la variance dchantillon

100.V(X) 100.0,3
<
)
0 ,3
0 ,3

p(V(X) > 0,3) = 1 - p( < 100)


Le nombre de degr de libert est trs grand, on peut utiliser lapproximation par la loi normale
de moyenne 99 et dcart type
p( < 100) =

2.99 =14.

(10099) = (0,07) = 0,5279


14

p(V(X) > 0,3) = 1 0,5279 = 0,4721


3.3.6. Solution de lexercice 3.2.6.
Dsignons par X la dure de vie dune ampoule. X suit une loi normale de moyenne 1500
heures et dcart type 150 heures. Lclairage va durer pendant le total des dures de vie des
trois ampoules.
Dsignons par Y la dure de vie totale.
Y=X+X+X
E(Y) = E(X) + E(X) + E(X) = 4500 h
V(Y) = V(X) + V(X) + V(X) = 150+150+150 = 67500
Lcart type de Y est donc

67500 = 260 h.

Lclairage Y suit une loi normale de moyenne 4500 heures et dcart type 260 heures.
a) Probabilit que lcart type de lclairage ne dpasse pas 260 heures.
p(V(Y) < 260) = p(

3.V(X) 3.260
<
)
260
260

p(V(Y) < 260) = p( < 3) = 0,7769

63

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

b) Probabilit que lcart type de lclairage ne dpasse pas 200 heures.


p(V(Y) < 200) = p(

3.V(X) 3.200
<
)
260
260

p(V(Y) < 200) = p( < 1,78) = 0,5893


3.3.7. Solution de lexercice 3.2.7.
a) Moyenne et cart type thoriques de la distribution d'chantillonnage des variances.
Il sagit dune population normale de moyenne gale 22,40 kg et dcart type gal 0,048 kg.
m = 22,40 kg

= 0,048 kg

et

n = 36

- Moyenne de la distribution d'chantillonnage des variances


E(V(X)) =

n 1
36 1
=
0,048 = 0,022
36
n

- Ecart type de la distribution d'chantillonnage des variances

V(V(X)) =

2.(n 1)

2.(36 1)

0,048
= 0,0005
36

b) Nombre d'chantillons qui ont leur cart type compris entre 45 grammes et 50 grammes.
Dans le cas dune population normale, la variable alatoire

n.V(X)
possde une distribution

khi deux 35 (n-1) degr de libert.


p(0,045 <V(X)< 0,050) = p(

36.0,045 36.V(X) 36.0,05


<
<
)
0,048
0,048
0,048

p(0,045 <V(X)< 0,050) = p(31,64 < < 39,06)


p(0,045 <V(X)< 0,050) = p( < 39,06) - p( < 31,64)

64

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

Le nombre de degr de libert est grand, de ce fait, et par application du thorme central
limite, on peut affirmer que la loi Khi deux tend vers une loi normale de paramtres k et

2k . Toutefois, la convergence vers la loi normale est relativement lente, l'approximation est
gnralement satisfaisante lorsque k est suprieur 100. Pour un nombre de degr de libert
compris entre 30 et 100, on prfre faire usage de la racine carre. On peut en effet utiliser la
transformation :
Z=

2 2k 1

Pour p( < 39,06) => Z =

2.39,06 2.351 = 0,53

p( < 39,06) p(Z < 0,53) = (0,53) = 0,7019


Pour p( < 31,64) => Z =

2.31,64 2.351 = 0,35

p( < 31,64) p(Z < 0,35) = (0,35) = 0,6368


p(0,045 <V(X)< 0,050) = 0,7019 0,6368 = 0,0651
Le nombre d'chantillons qui ont leur cart type compris entre 45 grammes et 50 grammes est :
300. 0,3398 = 102 chantillons.
3.3.8. Solution de lexercice 3.2.8.
a) Moyenne et cart type thoriques de la distribution d'chantillonnage des variances.
Il sagit dune population normale de moyenne gale 300 kg et dcart type gal 50 kg.
= 50 kg

m = 300 kg

et

n = 25

- Moyenne de la distribution d'chantillonnage des variances.

E(V(X)) =

n 1
25 1
=
50 = 2400
n
25

- Ecart type de la distribution d'chantillonnage des variances.

V(V(X)) =

2.(n 1)

50
= 2.(25 1)
= 693
n
25
65

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

b) Probabilit pour que 25 colis reus au hasard et chargs sur un monte-charge aient un cart
type qui dpasse 40 kg.
Dans le cas dune population normale, la variable alatoire

n.V(X)
possde une distribution

khi deux 24 (n-1) degr de libert.


p(V(X) > 40) = 1 - p(V(X) < 40)
p(V(X) > 40) = 1 - p(

25.V(X) 25.40
<
)
50
50

p(V(X) > 40) = 1 - p( < 16)


En consultant la table de la fonction de rpartition de la loi Khi deux, 24 degrs de libert on
trouve :
0,1 < p( < 16) < 0,5 aprs interpolation linaire on trouve :
p( < 16) = 0,1178
p(V(X) > 40) = 1 0,1178 = 0,8822
3.3.9. Solution de lexercice 3.2.9.
Il sagit de la diffrence de rsistance de rupture entre les deux chantillons indpendants.
La diffrence de rsistance de rupture entre les deux marques suit une loi normale de moyenne
(m2-m1) et dcart type

1 2 .

E(X2 X1) = m2 - m1 = 4500 4000 = 500 kg


V(X2 X1) =

1 2 = 300 + 200 = 130000

Lcart type est donc

130000 = 361 kg

La diffrence de rsistance de rupture entre les deux marques suit une loi normale de moyenne
500 kg et dcart type 361 kg.

66

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

a) Probabilit pour que la diffrence de rsistance de rupture entre les deux marques ait un
cart type de moins de 350 kg
p(V(X2 X1) < 350) = p(

100.V(X 2 X 1 ) 100.350
<
)
361
361

p(V(X2 X1) < 350) = p( < 94)


Le nombre de degr de libert est trs grand, on peut utiliser lapproximation par la loi normale
de moyenne 99 et dcart type
p( < 94) =

2.99 =14.

(9499) = (0,36) = 0,3594


14

p(V(X2 X1) < 350) = 0,3594


b) Probabilit pour que la diffrence de rsistance de rupture entre les deux marques ait un
cart type de moins de 300 kg.
p(V(X2 X1) < 300) = p(

100.V(X 2 X1) 100.300


<
)
361
361

p(V(X2 X1) < 300) = p( < 69,06)


Le nombre de degr de libert est trs grand, on peut utiliser lapproximation par la loi normale
de moyenne 99 et dcart type
p( < 69,06) = (

2.99 =14.

69,06 99
) = (2,14) = 0,0162
14

p(V(X2 X1) < 300) = 0,0162


3.3.10. Solution de lexercice 3.2.10.
Dterminons la loi de probabilit de la moyenne.
Il sagit dune population dont on connat la moyenne et la variance.

67

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

a) Moyenne et cart type thoriques de la distribution d'chantillonnage des variances pour des
chantillons de taille 20.
Dsignons par X la dure de vie de moyenne 1800 heures avec un cart type de 200 heures.
= 200 h

m = 1800 h

et

n = 20

- Moyenne de la distribution d'chantillonnage des variances

E(V(X)) =

n 1
= 20 1 x 200 2 = 38000
n
20

- Ecart type de la distribution d'chantillonnage des variances

V(V(X)) = 2.(n1) = 2.(201) 200 = 12329


n
20
b) Moyenne et cart type thoriques de la distribution d'chantillonnage des variances pour des
chantillons de taille 50.
= 200 h

m = 1800 h

et

n = 50

- Moyenne de la distribution d'chantillonnage des variances

E(V(X)) =

n 1
50 1
=
200 = 40000
50
n

- Ecart type de la distribution d'chantillonnage des variances

V(V(X)) = 2.(n 1) = 2.(501) 200 = 7920


n
50
On remarque quen augmentant la taille de lchantillon, lerreur standard de la variance
baisse.
c) Probabilit qu'un chantillon alatoire de 20 units de ce bien ait un cart type de vie
suprieur 220.
p(V(X) > 220) = 1 - p(V(X) < 220)
p(V(X) > 220) = 1 - p(

20.V(X) 20.220
<
)
200
200
68

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

p(V(X) > 220) = 1 - p( < 24,2)


En consultant la table de la fonction de rpartition de la loi Khi deux, 19 degrs de libert on
trouve :
0,5 < p( < 24,2) < 0,9 aprs interpolation linaire on trouve :
p( < 24,2) = 0,7645
p(V(X) > 220) = 1 0,7645 = 0,2355
d) Probabilit qu'un chantillon alatoire de 50 units de ce bien ait un cart type de vie
suprieur 220.
p(V(X) > 220) = 1 - p(V(X) < 220)
p(V(X) > 220) = 1 - p(

50.V(X) 50.220
<
)
200
200

p(V(X) > 220) = 1 - p( < 60,5)


Le nombre de degr de libert est grand, de ce fait, et par application du thorme central
limite, on peut affirmer que la loi Khi deux tend vers une loi normale de paramtres k et

2k . Toutefois, la convergence vers la loi normale est relativement lente, l'approximation est
gnralement satisfaisante lorsque k est suprieur 100. Pour un nombre de degr de libert
compris entre 30 et 100, on prfre faire usage de la racine carre. On peut en effet utiliser la
transformation :
Z=

2 2k 1

Z=

2.60,5 2.491 = 1,15

p( < 60,5) p(Z < 1,15) = (1,15) = 0,8749


p(V(X) > 220) = 1 0,8749 = 0,1251

69

Statistiques dcisionnelles

3. Loi de probabilit de la variance dchantillon

3.3.11. Solution de lexercice 3.2.11.


m = 6 m = 0,10 et

n = 40

- Moyenne de la distribution dchantillonnage des variances

E(V(X)) =

n 1
= 401 . 0,102 = 0,00975
n
40

- Ecart type de la distribution dchantillonnage des variances

2
0,12
V (V(X)) 2 (n 1) x
2 x 39 x
0,0022
n
40
b) Pour des chantillons de taille 60 on a :
- Moyenne de la distribution dchantillonnage des variances

E(V(X)) =

n 1
= 60 1 x 0,102 0,00983
n
60

- Ecart type de la distribution dchantillonnage des variances

V (V(X)) 2 (n 1) x

2
0,12
2 x 59 x
0,0018
n
60

c) On peut lasticits demandes, en effet pour une variation de 50 % de la taille des


chantillons on a :
- Une lasticit des moyennes de distribution dchantillonnage des variances gale :

0,00983 0,00975
0,82 %
0,00975
- Une lasticit des cart-types de distribution dchantillonnage des variances gale :

0,0018 0,0022
18,18 %
0,0022
70

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

CHAPITRE 4
LOI DE PROBABILITE DE LA PROPORTION DECHANTILLON

4.1. POSITION DU PROBLEME.


De mme que pour la moyenne et pour la variance, si lon considre une population infinie et
que lon y prlve un chantillon alatoire et simple deffectif n, on dsigne par Xn le nombre
dindividus possdant, dans chaque chantillon, le caractre tudi.

f n X n est la frquence ou proportion des individus possdant, dans lchantillon, le


n
caractre tudi.
On dsigne par p la proportion des individus possdant, dans la population, le caractre tudi.
Les chantillons successifs possdent les frquences :

fn Xn
n

f n' X n'
n

fn" Xn"
n

Ces frquences peuvent tre considres comme des valeurs observes dune mme variable
alatoire :

fn Xn
n
La variable alatoire Fn possde une distribution de probabilit, dite distribution
dchantillonnage de la proportion. On peut donc calculer lesprance et la variance de cette
distribution, en supposant que lchantillon est alatoire et simple.

71

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

4.2. LOI DE PROBABILITE SELON LECHANTILLON.


4.2.1. Echantillon non exhaustif.
E(Fn) = E( X n ) =

V(Fn) = V(

Fn

1 E( X n ) = 1 n p = p
n
n

Xn
pq
1
1
n ) = n V( X n ) = n n p q = n

pq
n

est appel erreur standard de la frquence dun chantillon alatoire et simple.

En ce qui concerne la forme de cette distribution, on peut affirmer que la distribution de la


proportion suit une loi normale de moyenne p et dcart type Fn

pq

condition que la
n
taille de lchantillon soit suprieure ou gale 30 (n 30) et le produit n p 5.
4.2.2. Echantillon exhaustif.
Dans le cas dune population finie deffectif N, au sein de laquelle est prlev, sans remise, un
chantillon alatoire et simple deffectif n, lesprance mathmatique et la variance de la
frquence sont :
E(Fn) = E( X n ) =

V(Fn) = V( X n ) =

Lerreur standard est alors : Fn

1 E( X n ) = 1 n p = p
n
n

1 V( X n ) = 1 N n n p q = N n pq
n
n N 1
N 1 n
pq
Nn

N 1
n

En ce qui concerne la forme de cette distribution, on peut affirmer que la distribution de la


proportion suit une loi normale de moyenne p et dcart type Fn

pq
Nn

N 1
n

condition que la taille de lchantillon soit suprieure ou gale 30 (n 30) et le produit n p


5.
72

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

4.3. ENONCES DES EXERCICES DAPPLICATION.


4.3.1. Lors dlections, les rsultats ont montr quun des candidats a obtenu 46 % des voix.
Dterminer la probabilit pour que le vote donne une majorit de voix en faveur de ce candidat
pour un chantillon de :
a) 200 personnes choisies au hasard parmi le corps lectoral.
b) 1000 personnes choisies au hasard parmi le corps lectoral .
4.3.2. Trouver la probabilit pour que parmi les 200 prochains enfants natre :
a) Il y ait moins de 40 % de garons.
b) Il y ait entre 43 % et 57 % de filles.
c) Il y ait plus de 54 % de garons.
On supposera que la naissance d'un garon et la naissance d'une fille sont quiprobables.
4.3.3. Etant donn 1000 chantillons de 200 enfants chacun, pour combien d'chantillons a-t-on
une chance de trouver :
a) Moins de 40 % de garons.
b) Entre 40 % et 60 % de filles.
c) 53 % ou plus de filles ?
4.3.4. Les rsultats d'une lection montrent qu'un des candidats a obtenu 65 % des voix.
Trouver la probabilit pour que deux chantillons alatoires, chacun correspondant 200
votants, indiquent plus de 10 % de diffrence dans les proportions de gens qui ont vot pour ce
candidat.
4.3.5. On sintresse au taux de russite au sein dune cole.
a) On considre un chantillon de 35 tudiants, quelle est la probabilit davoir plus de 70 %
dadmis ?
b) On considre deux chantillons indpendants de 100 tudiants chacun, quelle est la
probabilit davoir plus de 15 % de diffrence dans les taux de russite ?
4.3.6. On considre une lection municipale dans laquelle deux candidats ont obtenu
respectivement 34 % et 14 % des suffrages. Le nombre de votants est 12000.
On prend un chantillon de 100 personnes, quelle est la probabilit pour que le candidat 1 ait
plus de 25 % des suffrages et le candidat 2 ait plus de 20 % ?
4.3.7. Un 1er test a donn un taux de pices dfectueuses gal 5 %. On ralise un test de
qualit sur un chantillon de 1000 pices mcaniques.
a) Quelle est la probabilit pour que ce dernier test donne une frquence de pices dfectueuses
infrieure ou gale 1 %, 2 %, 3 %, 4 % et 5 % ?
b) Quelles sont ces probabilits avec un chantillon de 100 pices seulement au lieu de 1000.
Interprter ces rsultats.
73

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

c) Quelle est la taille de lchantillon pour que le taux de pices dfectueuses soit infrieur ou
gale 4 % avec une probabilit de 98 % ? Interprter ces rsultats.
4.3.8. Une tude sur la notorit dune marque a port sur un chantillon alatoire de 400
personnes.
a) Quelle est la probabilit davoir un taux de notorit qui dpasse 55 % ?
b) Calculer cette probabilit si on pense que la notorit est de 60 %.
4.3.9. Un fournisseur affirme que le risque de vendre une pice dfectueuse est de 5 %. Pour
vrifier laffirmation du fournisseur, un contrle a port sur un chantillon alatoire de 300
pices. Laffirmation du fournisseur est-elle plausible ?
4.3.10. 80 % des clients sont satisfaits, cest ce que pense le directeur dune socit de service.
a) Quelle est la probabilit que sur un chantillon alatoire de 200 clients, moins de 70 %
soient satisfaits ?
b) Un deuxime chantillon alatoire de 300 clients est choisi indpendamment du premier
chantillon. Quelle est la probabilit davoir plus de 2 % de diffrence entre les taux de
satisfaction obtenus auprs des deux chantillons ?
4.4. SOLUTIONS DES EXERCICES DAPPLICATION.
4.4.1. Solution de lexercice 4.3.1.
Soit F la variable alatoire qui dsigne la frquence des lecteurs qui voteront pour ce
candidat.
La distribution dchantillonnage de F suit une loi normale de moyenne p et dcart type

pq
n

condition que la taille de lchantillon soit suprieure ou gale 30 (n30) et le produit n


p5.
E(F) = p V(F) =

pq
n

pq
n

a) 200 personnes choisies au hasard parmi le corps lectoral.

E(F) = 0,46
V(F) =

0,46.0,54
= 0,0012
200

Fn 0,0012 = 0,035
74

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

n = 200 > 30 et le produit n p = 200 . 0,46 = 92 > 5. La distribution dchantillonnage de F suit


donc une loi normale de moyenne 0,46 et dcart type 0,035.
Le vote donnera une majorit de voix en faveur de ce candidat si la frquence des
lecteurs qui voteront pour ce candidat est suprieure ou gale 50 %.
p(F 0,5) = 1 p(F < 0,5) = p(Z <

0,50,46
)
0,035

p(F 0,5) = 1 (1,14) = 1 0,8729 = 0,1271 = 12,71 %


b) 1000 personnes choisies au hasard parmi le corps lectoral.
E(F) = 0,46
V(F) =

0,46.0,54
= 0,0002484
1000

Fn 0,0002484 = 0,016

n = 1000 > 30 et le produit n p = 1000.0,46 = 460 > 5. La distribution dchantillonnage de F


suit donc une loi normale de moyenne 0,46 et dcart type 0,016.
Le vote donnera une majorit de voix en faveur de ce candidat si la frquence des
lecteurs qui voteront pour ce candidat est suprieure ou gale 50 %.
p(F 0,5) = 1 p(F < 0,5) = p(Z <

0,50,46
)
0,016

p(F 0,5) = 1 (2,5) = 1 0,9938 = 0,0062 = 0,62 %


4.4.2. Solution de lexercice 4.3.2.
Soit F la variable alatoire qui dsigne la frquence des garons parmi les 200 prochains
enfants natre.
E(F) = p = 0,5
V(F) =

pq 0,5.0,5
=
= 0,0013 F
n
200

0,0013 = 0,0354

n = 200 > 30 et le produit n p = 200.0,5 = 100 > 5. La distribution dchantillonnage de F suit


donc une loi normale de moyenne 0,5 et dcart type 0,0354.
75

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

a) Probabilit pour que parmi les 200 prochains enfants natre il y ait moins de 40 % de
garons.
p(F < 0,4) = p(Z <

0,40,5
) = (-2,82) = 1 0,9976 = 0,0024
0,0354

b) Probabilit pour que parmi les 200 prochains enfants natre il y ait entre 43 % et 57 % de
filles.
p(0,43 < F < 0,57) = p(Z <

0,57 0,5
0,430,5
) - p(Z <
)
0,0354
0,0354

p(0,43 < F < 0,57) = (1,98) - (-1,98)


p(0,43 < F < 0,57) = 0,9761 0,0239 = 0,9522
c) Probabilit pour que parmi les 200 prochains enfants natre il y ait plus de 54 % de
garons.
p(F > 0,54) = 1 - p(Z <

0,540,5
)
0,0354

p(F > 0,4) = 1 - (1,13) = 1 0,8708 = 0,1292


4.4.3. Solution de lexercice 4.3.3.
Soit F la variable alatoire qui dsigne la frquence des garons parmi les 200 enfants de
lchantillon.
E(F) = p = 0,5
V(F) =

pq 0,5.0,5
=
= 0,0013
n
200

F 0,0013 = 0,0354

n = 200 > 30 et le produit n p = 200.0,5 = 100 > 5. La distribution dchantillonnage de F suit


donc une loi normale de moyenne 0,5 et dcart type 0,0354.
a) Nombre dchantillon de moins de 40 % de garons.
76

Statistiques dcisionnelles

p(F < 0,4) = p(Z <

4. Loi de probabilit de la proportion dchantillon

0,40,5
)
0,0354

p(F < 0,4) = (-2,82) = 1 0,9976 = 0,0024


Nombre dchantillon de moins de 40 % de garons est :
1000 . 0,0024 = 2,4.
On peut sattendre 2 ou 3 chantillons qui auront moins de 40 % de garons.
b) Nombre dchantillon qui auront entre 40% et 60% de garons.
p(0,40 < F < 0,60) = p(Z <

0,600,5
0,400,5
) - p(Z <
)
0,0354
0,0354

p(0,40 < F < 0,60) = (2,82) - (-2,82)


p(0,40 < F < 0,60) = 0,9976 0,0024 = 0,9952
Nombre dchantillon qui auront entre 40% et 60% de garons est :
1000 . 0,9952 = 995,2.
On peut sattendre 995 chantillons qui auront entre 40 % et 60 % de garons.
c) Nombre dchantillon de 53 % ou plus de filles.
53 % ou plus de filles est quivalente 47 % de garons ou moins.

p(F < 0,47) = p(Z <

0,47 0,5
)
0,0354

p(F < 0,47) = (-0,85) = 1 0,8023 = 0,1977


Nombre dchantillon qui auront 53 % ou plus de filles est :
1000 . 0,1977 = 197,7
On peut sattendre 198 chantillons qui auront 53 % ou plus de filles.

77

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

4.4.4. Solution de lexercice 4.3.4.


Soit F1 la variable alatoire qui dsigne la frquence des gens du premier chantillon qui
ont vot pour ce candidat.
E(F1) = p = 0,65
V(F1) =

pq 0,65.0,35
=
= 0,0011
n
200

F1 0,0011 = 0,0337

n = 200 > 30 et le produit n p = 200.0,65 = 130 > 5. La distribution dchantillonnage de F 1 suit


donc une loi normale de moyenne 0,65 et dcart type 0,0337.
Soit F2 la variable alatoire qui dsigne la frquence des gens du deuxime chantillon qui
ont vot pour ce candidat.
E(F2) = p = 0,65
V(F2) =

pq 0,65.0,35
=
= 0,0011
n
200

F2 0,0011 = 0,0337

n = 200 > 30 et le produit n p = 200.0,65 = 130 > 5. La distribution dchantillonnage de F2 suit


donc une loi normale de moyenne 0,65 et dcart type 0,0337.
Dsignons par F la diffrence entre les frquences des gens qui ont vot pour ce candidat dans
chaque chantillon.
E(F) = E(F1 F2) = E(F1) E(F2) = 0,65-0,65 = 0
V(F) = V(F1 F2) = V(F1) V(F2) = 0,0011+0,0011 = 0,0022

F 0,0022 = 0,0469
La distribution dchantillonnage de F suit donc une loi normale de moyenne 0 et dcart type
0,0469.
p(

F1 F2 > 0,1) = p( F > 0,1) = 1 - p( F 0,1)

p(

F1 F2 > 0,1) = 1 p(-0,1 F 0,1)


78

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

0,10
0,10
) - p(Z
)]
0,0469
0,0469

p(

F1 F2 > 0,1) = 1 [p(Z

p(

F1 F2 > 0,1) = 1 [(2,13) - (-2,13)]

p(

F1 F2 > 0,1) = 1 (0,9834 0,0166) = 0,0332

4.4.5. Solution de lexercice 4.3.5.


a) Probabilit davoir plus de 70 % dadmis dans un chantillon de 35 tudiants.
Soit F la variable alatoire qui dsigne la frquence des tudiants admis parmi les 35
tudiants de lchantillon.
Puisquon na pas dinformation sur le taux de russite dans cette cole, on le considre gal
50 %.
E(F) = p = 0,5
V(F) =

pq 0,5.0,5
=
= 0,0071 F 0,0071 = 0,0845
n
35

n = 35 > 30 et le produit n p = 35.0,5 = 17,5 > 5. La distribution dchantillonnage de F suit


donc une loi normale de moyenne 0,5 et dcart type 0,0845.
p(F > 0,7) = 1 - p(Z <

0,7 0,5
)
0,0845

p(F > 0,7) = 1 - (2,37) = 1 0,9911 = 0,0089


b) Probabilit davoir plus de 15 % de diffrence dans les taux de russite de deux chantillons
indpendants de 100 tudiants chacun.
Soit F1 la variable alatoire qui dsigne la frquence des tudiants admis parmi les 100
tudiants du premier chantillon.
E(F1) = p = 0,5
V(F1) =

pq 0,5.0,5
=
= 0,0025 F1 0,0025 = 0,05
n
100

79

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

n = 100 > 30 et le produit n p = 100.0,5 = 50 > 5. La distribution dchantillonnage de F 1 suit


donc une loi normale de moyenne 0,5 et dcart type 0,05.
Soit F2 la variable alatoire qui dsigne la frquence des tudiants admis parmi les 100
tudiants du deuxime chantillon.
E(F2) = p = 0,5
V(F2) =

pq 0,5.0,5
=
= 0,0025 F2 0,0025 = 0,05
n
100

n = 100 > 30 et le produit n p = 100.0,5 = 50 > 5. La distribution dchantillonnage de F 2 suit


donc une loi normale de moyenne 0,5 et dcart type 0,05.
Dsignons par F la diffrence dans les taux de russite des deux chantillons indpendants de
100 tudiants chacun.
E(F) = E(F1 F2) = E(F1) E(F2) = 0,5-0,5 = 0
V(F) = V(F1 F2) = V(F1) V(F2) = 0,0025+0,0025 = 0,005

F 0,005

= 0,0707

La distribution dchantillonnage de F suit donc une loi normale de moyenne 0 et dcart type
0,0707.
p(

F1 F2 > 0,15) = p( F > 0,15) = 1 - p( F 0,15)

p(

F1 F2 > 0,15) = 1 p(-0,15 F 0,15)

p(

F1 F2 > 0,15) = 1 [p(Z

p(

F1 F2 > 0,15) = 1 [(2,12) - (-2,12)]

p(

F1 F2 > 0,15) = 1 (0,9830 0,0170) = 0,0340

0,150
0,150
) - p(Z
)]
0,0707
0,0707

4.4.6. Solution de lexercice 4.3.6.


- Probabilit pour que le candidat 1 ait plus de 25 % des suffrages.
Soit F1 la variable alatoire qui dsigne la frquence des votants qui voteront pour le
candidat 1.
80

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

E(F1) = p = 0,34
V(F1) =

N n pq = 12000100 0,34.0,66 = 0,0022


N 1 n
120001
100

F1 0,0022 = 0,0472
n = 100 > 30 et le produit n p = 100.0,34 = 34 > 5. La distribution dchantillonnage de F 1 suit
donc une loi normale de moyenne 0,34 et dcart type 0,0472.
p(F1 > 0,25) = 1 - (

0,250,34
)
0,0472

p(F1 > 0,25) = 1 - (-1,91) = 0,9719


- Probabilit pour que le candidat 2 ait plus de 20 % des suffrages.
Soit F2 la variable alatoire qui dsigne la frquence des votants qui voteront pour le
candidat 2.
E(F2) = p = 0,14
V(F2) =

N n pq = 12000100 0,14.0,86 = 0,0012


N 1 n
120001
100

F2 0,0012

= 0,0346

n = 100 > 30 et le produit n p = 100.0,14 = 14 > 5. La distribution dchantillonnage de F 1 suit


donc une loi normale de moyenne 0,14 et dcart type 0,0346.
p(F2 > 0,20) = 1 - (

0,200,14
)
0,0346

p(F2 > 0,20) = 1 - (1,73) = 0,0418


4.4.7. Solution de lexercice 4.3.7.
a) Probabilit pour que le dernier test donne une frquence de pices dfectueuses infrieure ou
gale 1 %, 2 %, 3 %, 4 % et 5 % dans un chantillon de 1000 pices.
Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans
lchantillon.

81

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

E(F) = p = 0,05
V(F) =

pq 0,05.0,95
=
= 0,0000475
n
1000

F 0,0000475 = 0,00689
n = 1000 > 30 et le produit n p = 1000.0,05 = 50 > 5. La distribution dchantillonnage de F
suit donc une loi normale de moyenne 0,05 et dcart type 0,00689.
p(F 0,01) = p(Z <
p(F 0,02) = p(Z <
p(F 0,03) = p(Z <
p(F 0,04) = p(Z <
p(F 0,05) = p(Z <

0,010,05
) = (-5,8) = 0
0,00689
0,020,05
) = (-4,35) = 0
0,00689
0,030,05
) = (-2,90) = 0,0019
0,00689
0,040,05
) = (-1,45) = 0,0735
0,00689
0,050,05
) = (0) = 0,5
0,00689

b) Probabilit pour que le dernier test donne une frquence de pices dfectueuses infrieure ou
gale 1 %, 2 %, 3 %, 4 % et 5 % dans un chantillon de 100 pices.
Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans
lchantillon.
E(F) = p = 0,05
V(F) =

pq 0,05.0,95
=
= 0,000475
n
100

F 0,000475 = 0,02179
n = 100 > 30 et le produit n p = 100.0,05 = 5. La distribution dchantillonnage de F suit donc
une loi normale de moyenne 0,05 et dcart type 0,02179.
p(F 0,01) = p(Z <

0,010,05
) = (-1,84) = 0,0329
0,02179

82

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

0,020,05
) = (-1,38) = 0,0838
0,02179
0,030,05
p(F 0,03) = p(Z <
) = (-0,92) = 0,1788
0,02179
0,040,05
p(F 0,04) = p(Z <
) = (-0,46) = 0,3228
0,02179
0,050,05
p(F 0,05) = p(Z <
) = (0) = 0,5
0,02179
p(F 0,02) = p(Z <

On constate que pour un chantillon de taille plus petite, les probabilits sont plus grandes.
Plus la taille de lchantillon est grande plus le risque davoir des pices dfectueuses est
grand.
c) Taille de lchantillon pour que le taux de pices dfectueuses soit infrieur ou gal 4 %
avec une probabilit de 98 %.
Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans
lchantillon de taille n.
E(F) = p = 0,05
V(F) =

pq 0,05.0,95 0,0475
=
=
n
n
n

0,0475 0,2179

n
n

p(F 0,04) = 0,98

p(Z <

0,040,05
) = 0,98
0,2179
n

0,040,05
) = 0,98
0,2179
n

83

Statistiques dcisionnelles

0,040,05
= Z0,98 = 2,05
0,2179
n

4. Loi de probabilit de la proportion dchantillon

=>

n = 1996 pices

Un chantillon de 1996 pices peut garantir 98 % de chances davoir moins de 4 % de pices


dfectueuses.
4.4.8. Solution de lexercice 4.3.8.
a) Probabilit davoir un taux de notorit qui dpasse 55 %
Soit F la variable alatoire qui dsigne la frquence des personnes de lchantillon qui
connaissent la marque.
Puisquon na pas dinformation sur le taux de notorit dans la population, on le considre
gal 50 %.
E(F) = p = 0,5
V(F) =

pq 0,5.0,5
=
= 0,000625
n
400

F 0,000625 0,025

n = 400 > 30 et le produit n p = 400.0,5 = 200 > 5. La distribution dchantillonnage de F suit


donc une loi normale de moyenne 0,5 et dcart type 0,025.
p(F > 0,55) = 1 - p(Z <

0,550,5
)
0,025

p(F > 0,55) = 1 - (2) = 0,0228


b) Probabilit davoir un taux de notorit qui dpasse 60 % si on pense que la notorit est de
60 %.
E(F) = p = 0,6

pq 0,6.0,4
=
= 0,0006 F
n
400
0,550,6
p(F > 0,55) = 1 - p(Z <
)
0,02449
V(F) =

0,0006 0,02449

p(F > 0,55) = 1 - (-2,04) = 0,9793

84

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

4.4.9. Solution de lexercice 4.3.9.


Soit F la variable alatoire qui dsigne la frquence des pices dfectueuses dans
lchantillon.
E(F) = p = 0,05
V(F) =

pq 0,05.0,95
=
= 0,00016
n
300

F 0,00016 0,01258
n = 300 > 30 et le produit n p = 300.0,05 = 15 > 5. La distribution dchantillonnage de F suit
donc une loi normale de moyenne 0,05 et dcart type 0,01258.
Laffirmation du fournisseur est plausible si la probabilit davoir plus de 5 % de pices
dfectueuses est faible.
p(F 0,06) = 1 - p(Z <

0,060,05
)
0,01258

p(F 0,06) = 1 - (0,79) = 0,2148


Le contrle de 300 pices donne 21,48 % de chances davoir 6 % ou plus de pices
dfectueuses. Laffirmation du fournisseur est probable 78,52 %.
4.4.10. Solution de lexercice 4.3.10.
a) Probabilit que sur un chantillon alatoire de 200 clients, moins de 70 % soient satisfaits.
Soit F la variable alatoire qui dsigne la frquence des clients de lchantillon qui sont
satisfaits.
E(F) = p = 0,8
V(F) =

pq 0,8.0,2
=
= 0,0008
n
200

F 0,0008 0,02828
85

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

n = 200 > 30 et le produit n p = 200.0,8 = 160 > 5. La distribution dchantillonnage de F suit


donc une loi normale de moyenne 0,8 et dcart type 0,02828.
p(F < 0,7) = p(Z <

0 ,7 0 ,8
)
0,02828

p(F < 0,7) = (-3,54) = 0,0002


b) Probabilit davoir plus de 2 % de diffrence entre les taux de satisfaction obtenus auprs
des deux chantillons.
Soit F la variable alatoire qui dsigne la frquence des clients du deuxime chantillon
qui sont satisfaits.
E(F) = p = 0,8
V(F) =

pq 0,8.0,2
=
= 0,00053
n
300

F ' 0,00053 0,02309


n = 300 > 30 et le produit n p = 300.0,8 = 240 > 5. La distribution dchantillonnage de F suit
donc une loi normale de moyenne 0,8 et dcart type 0,02309.
Dsignons par F la diffrence dans les taux de satisfaction des deux chantillons indpendants.
E(F) = E(F F) = E(F) E(F) = 0,8-0,8 = 0
V(F) = V(F F) = V(F) + V(F) = 0,0008+0,00053 = 0,00133

F 0,00133 0,03647
La distribution dchantillonnage de F suit donc une loi normale de moyenne 0 et dcart type
0,03647.
p(

F F' > 0,02) = p( F > 0,02) = 1 - p( F 0,02)

p(

F F' > 0,02) = 1 p(-0,02 F 0,02)

86

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

0,020
0,020
) - p(Z
)]
0,03647
0,03647

p(

F F' > 0,02) = 1 [p(Z

p(

F F' > 0,02) = 1 [(0,55) - (-0,55)]

p(

F F' > 0,02) = 1 (0,7088 0,2912) = 0,5824

87

Statistiques dcisionnelles

4. Loi de probabilit de la proportion dchantillon

88

Statistiques dcisionnelles

Partie 3. Principe de lestimation

PARTIE 3
PRINCIPE DE LESTIMATION

Les premiers problmes dinfrence statistique auxquels sapplique la thorie des distributions
dchantillonnage sont les problmes destimations. Le but poursuivi est destimer, partir
dun chantillon, la ou les valeurs numriques dun ou de plusieurs paramtres de la population
considre et de dterminer la prcision de cette ou de ces estimations.
DEFINITION DUN ESTIMATEUR.
Soient une population quelconque, dont la distribution de probabilit L(X) est fonction dun
paramtre : L(X) = f(X, ) et un chantillon alatoire et simple deffectif n extrait de cette
population.
On appelle estimateur du paramtre , toute fonction alatoire des valeurs observes, X1, X2,
X3,, Xn, susceptibles de servir estimer
Tn = f (X1, X2, , Xn)
On appelle estimation les valeurs numriques t1, t2, de cette variable alatoire Tn.
QUALITES DUN ESTIMATEUR.

Absence de biais
La premire qualit dun bon estimateur est labsence derreur systmatique ou de biais. Cette
qualit implique que la vraie valeur doit tre retrouve en moyenne :
E(Tn) =
Tout estimateur qui satisfait cette condition est dit sans biais ou non biais.

89

Statistiques dcisionnelles

Partie 3. Principe de lestimation

Variance minimale
Une deuxime qualit dun bon estimateur est de possder une prcision suffisante. Cette
prcision peut tre mesure par le moment dordre deux par rapport .
E[(Tn - )]
Pour les estimateurs non biaiss, ce moment se confond avec la variance :
E[(Tn - )] = V(Tn)
On peut dmonter qu tout paramtre correspond une valeur minimum de E[(Tn - )].
La fonction qui correspond ce minimum, dfinit lestimateur de variance minimum.

90

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

CHAPITRE 5
ESTIMATION DE LA MOYENNE DUNE POPULATION

5.1. ESTIMATION DUNE MOYENNE.


5.1.1. Estimation ponctuelle.
La meilleure estimation de la moyenne m dune population, qui puisse tre dduite dun
chantillon alatoire et simple, est la moyenne de lchantillon.
_

m=X
La dispersion des diffrentes estimations possibles autour de cette moyenne gnrale, est
mesure par lerreur standard de la moyenne :

Signalons ds prsent, comme nous le verrons, dans le chapitre suivant, que lestimation
ponctuelle et sans biais de la variance dune population mre, partir des rsultats obtenus
dun chantillon simple et alatoire est :

n
v( x ) =
n -1

(x x)
i

i 1

n 1

5.1.2. Estimation par intervalle de confiance.


5.1.2.1. Cas dune population normale.
Si on sintresse la moyenne inconnue m dune population normale dcart type connu ,
lestimation, par intervalle de confiance, consiste dterminer, de part et dautre de

lestimateur
contenir m.

X , les bornes X1 et X 2 dun intervalle qui a un niveau de confiance (1-) de


91

Statistiques dcisionnelles.

Les limites

5. Estimation de la moyenne dune population

X1 et X 2 sont telles que :

p ( X1 m

X2 ) = 1 -

Si on dsigne par

p (m < X1 ) = p (m > X 2 ) = /2

ou

Z1 la valeur de la variable normale centre et rduite lue dans la table,

2
les limites de confiances sont :

X1 = X - Z

12

et

X2 = X + Z

1
2

On notera lintervalle de confiance :

X Z

1
2

ou


;xZ
x Z1

1
n
n
2
2

Cest un intervalle symtrique par rapport la moyenne.


Dans le cas dune population normale dont on ne connat pas lcart type, on utilise
lestimation ponctuelle et sans biais de lcart type, savoir :

n
V( x )
n 1

5.1.2.2. Cas dune population de distribution inconnue.


Pour une population de distribution de probabilit inconnue (cart type inconnu), on utilise la
quasi-variance comme estimation de la variance de la population.
Lestimation ponctuelle et sans biais de lcart type est :

n
V( x )
n 1

Lintervalle de confiance de la moyenne sera dfini selon les cas.

92

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

5.1.2.2.1. Cas dun chantillon deffectif infrieur 30 (n < 30)


Dans ce cas, la moyenne dun chantillon peut toujours tre considre comme une variable T
de Student (n-1) degr de libert.
La valeur

Z
1-

sera remplace par la valeur

T
1-

(n-1) degrs de libert.

Lintervalle de confiance est alors :


^

X T

12

ou


;xT
x T1

1
n
n
2
2

5.1.2.2.2. Cas dun chantillon deffectif suprieur ou gal 30 (n 30).


Dans ce cas, la moyenne dun chantillon peut toujours tre considre comme une variable
approximativement normale. Lintervalle de confiance est alors :
^

X Z
1-

ou


;xZ
x Z1

1
n
n
2
2

5.2. ESTIMATION DE LA SOMME DE MOYENNES.


La population objet dtude peut tre subdivise en plusieurs strates dans lesquelles on choisit
des chantillons indpendants.
Dsignons par :
N = Taille de la population
Ni = Taille de la strate i
n = Taille de lchantillon global
ni = Taille de lchantillon prlev dans la strate i
5.2.1. Estimation ponctuelle.
La moyenne de chaque strate est estime par la moyenne de lchantillon de la strate.

i xi
m

93

Statistiques dcisionnelles.

avec une erreur standard x


i

5. Estimation de la moyenne dune population

i
ni

Ni ni
Ni 1

i est lcart type de la strate i


La moyenne globale de la population est estime par :

x
m

La variance de

x est :

Lerreur standard est :

V (x)

1
N

Ni xi
Ni

2 Ni n i
1
( N i2 i
)
2
N
ni Ni 1
( N i2

i2 N i n i
)
ni Ni 1

5.2.2. Estimation par intervalle de confiance.


Lestimation par intervalle de confiance de la moyenne globale dune population stratifie
lorsque n 30, est donne par :

X Z1 / 2 x
O

Z1 / 2 est tel que p (

xm

Z1 / 2 ) 1 lu dans la table de la loi de probabilit

normale centre rduite.


5.3. ENONCES DES EXERCICES DAPPLICATION.
5.3.1. Le tableau suivant donne la distribution du nombre de pannes observes dans le
fonctionnement dune machine au cours de 100 journes de travail.
a) Dduisez-en une estimation du nombre moyen de pannes par jour, en supposant que la
distribution thorique du nombre de pannes est une loi de poisson.
b) Donnez lerreur standard du rsultat obtenu.

94

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

Nombres de pannes par jour Nombres de jours


0
53
1
32
2
11
3
3
4
1
Total
100
5.3.2. Lors dun concours radiophonique, on note X le nombre de rponses reues chaque jour.
On suppose que X suit une loi normale de paramtres m et . Durant les 10 premiers jours, on
a obtenu :
x1 = 200 ; x2 = 240 ; x3 = 190 ; x4 = 150 ; x5 = 220 ; x6 = 180 ; x7 = 170 ; x8 = 230 ; x9 =
210 et x10 = 210.
Dterminer une estimation ponctuelle de m.
5.3.3. Un chantillon de 15 tudiants d'une facult a obtenu les notes suivantes :
13 ; 06 ; 12 ; 10 ; 10 ; 16 ; 02 ; 04 ; 11 ; 12 ; 12 ; 05 ; 07 ; 08 ; 13
a) Estimer la note moyenne pour l'ensemble des tudiants de la facult.
b) Donner des estimations par intervalle de confiance pour la moyenne avec un risque derreur
de 5 %.
5.3.4. Dans une entreprise produisant un article dtermin, on veut estimer la dure de vie de
cet article en heures. cette fin on a observ un chantillon de 16 units dont les rsultats sont
(en 1000 heures) :
1,10
1,30

1,05
1,35

1,25
1,15

1,08
1,32

1,35
1,05

1,15
1,25

1,30
1,10

1,25
1,15

a) Estimer la dure de vie moyenne d'un article.


b) Donner une estimation par intervalle de confiance pour la moyenne. ( =5%).
c) Donner une estimation par intervalle de confiance pour la moyenne. ( =10%).
d) Discuter la sensibilit de lintervalle de confiance par rapport une variation du risque
derreur.
5.3.5. Dans une station service, on suppose que le montant des chques essence suit une loi
normale de paramtres m et . On considre un chantillon de taille n = 50 et on obtient une
moyenne de 130 Dh et un cart-type de 28 Dh.
Donner une estimation de m par un intervalle de confiance au niveau de confiance 95%.

95

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

5.3.6. On donne la rpartition des masses de 35 ressorts provenant dune mme fabrication :
masses (g)
[82 ; 84[
[84 ; 86[
[86 ; 88[
[88 ; 90[
[90 ; 92[
[92 ; 94[
[94 ; 96[
[96 ; 98[

Nombre de Ressorts
4
6
6
6
8
2
2
1

X donnant le poids dun ressort provenant de cette fabrication,


a) Donner une estimation ponctuelle de la moyenne des poids des ressorts fabriqus
b) Donner pour cette moyenne un intervalle de confiance au niveau de confiance 96%.
5.3.7. On veut estimer lesprance mathmatique m dune variable alatoire gaussienne X dont
on connat lcart type = 2,3. Quelle est la taille minimum de lchantillon de X qui est
prendre si lon veut obtenir pour m un intervalle de confiance de seuil 0,95 et dont la longueur
ne dpasse pas 0,1 ?
5.3.8. Un confiseur vend des boites de bonbons dun certain modle. On note X la masse dune
boite pleine. Les peses de 8 boites ont conduit aux masses (en kg) :
1,22 ; 1,23 ; 1,21 ; 1,19 ; 1,23 ; 1,24 ; 1,18 ; 1,21.
a) Donner pour m un intervalle de confiance au risque de 10 %.
b) En supposant que la variance de X soit connue et gale la variance observe, donner pour
m un intervalle de confiance au seuil de confiance 95% et comparer avec le a).
c) On suppose maintenant que lon a trouv la mme moyenne et la mme variance
quobserves mais avec 5 observations au lieu de 8. Reprendre les questions a) et b).
5.3.9. Aprs avoir pes 12 pamplemousses dune mme provenance, on donne pour lesprance
mathmatique m du poids X dun pamplemousse, lintervalle de confiance au niveau de
confiance 95% : 390 g m 520 g. En dduire la moyenne observe et lcart type observ.
5.3.10. Un chantillon alatoire de 50 notes (sur 100) dans une population de 200 a donn une
moyenne de 75 et un cart type de 10.
a) Quelles sont les limites de confiance 94 % pour estimer la moyenne des 200 notes ?
b) Avec quel degr de confiance peut-on dire que la moyenne des 200 notes est de 75 plus ou
moins 1 ?
5.3.11. Un chantillon de 150 lampes de marque A a donn une dure de vie moyenne de 1400
heures et un cart type de 120 heures. Un chantillon de 200 lampes de marque B a donn une
96

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

dure de vie moyenne de 1200 heures et un cart type de 80 heures. Dterminer les limites de
confiance 95 % de la diffrence des dures de vie moyennes des marques A et B.
5.3.12. Une compagnie fabrique des roulements billes ayant un poids moyen de 0,638 Kg et
un cart type de 0,012 Kg.
Calculer les limites de confiance des poids de lots comprenant 100 roulements chacun.
a) Avec un risque derreur de 1 %.
b) Avec un risque derreur de 10 %.
c) Discuter la sensibilit de la largeur de lintervalle de confiance par rapport au risque
derreur.
5.3.13. Dans une population de 579 individus, divise en quatre strates comprenant
respectivement 53 ; 190 ; 231 ; et 105 individus, on a prlev un chantillon de 58 individus,
dont 10 dans la premire strate, 14 dans la deuxime, 21 dans la troisime et 13 dans la
quatrime. En fonction des rsultats suivants, estimer la moyenne de la population globale et
lerreur standard de cette moyenne, en considrant lchantillon comme :
a) Alatoire et simple ;
b) Stratifi.
Strates Sommes Sommes des carrs
1
54
1004
2
127
3081
3
388
13270
4
553
39667
5.3.14. En vue destimer la note moyenne des lves dune cole, on a choisi de faon alatoire
et simple six classes, et dans chacune de ces classes on a choisi alatoirement 4 lves. En
fonction des rsultats obtenus et repris ci-dessous :
a) Estimer la note moyenne des lves de lcole ;
b) Dterminer lintervalle de confiance 95 % de cette estimation.
Classes
Elves
1
2
3
4

11,69
12,32
12,32
11,90

11,79
11,97
12,07
12,06

11,84
11,59
11,25
11,80

12,30
11,91
12,05
12,23

11,83
11,77
12,15
11,66

11,95
11,87
11,65
11,87

97

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

5.4. SOLUTIONS DES EXERCICES DAPPLICATION.


5.4.1. Solution de lexercice 5.3.1.
a) Lestimation ponctuelle de la moyenne de la population mre est la moyenne de
lchantillon considr, savoir, aprs calculs :
xi

ni xi

x i2

n i x i2

0
53
0
1
32
32
2
11
22
3
3
9
4
1
4
Somme
100
67
Somme / n
0,67
V(x)

0
1
4
9
16
30
-

0
32
44
27
16
119
1,19
0,7411
0,86

ni

m = 0,67
Avoir 0,67 panne par jour peut sembler bizarre du fait que le nombre de pannes doit tre un
entier, mais le rsultat que nous avons obtenu veut dire quen moyenne il y a un peu plus dune
panne, tous les deux jours (exactement 2x0,67= 1,34).
b) Lcart type de la population est inconnu, on utilise comme estimation ponctuelle est
sans biais de lcart type :

n
100
V(X)
x 0,7411 0,87
n 1
100 1

Lerreur standard est mesure par

0,87
100

8,7 %

5.4.2. Solution de lexercice 5.3.2.


Lestimation ponctuelle de la moyenne de la population mre est la moyenne de lchantillon
considr, savoir, aprs calculs :

98

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

m = 200 rponses par jour.


Lerreur standard de lestimation est :

Lcart type de la population est estim par :

(x i x) 2

27,89
27,89 soit x

8,82
n 1
n
10

Somme
Somme / n

xi

x i2

200
240
190
150
220
180
170
230
210
210
2 000
200

40 000
57 600
36 100
22 500
48 400
32 400
28 900
52 900
44 100
44 100
407 000
40 700
700

V(x)

n
x V( x )
n 1

99

27,89

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

5.4.3. Solution de lexercice 5.3.3.


a) Lestimation ponctuelle de la moyenne de la population mre est la moyenne de
lchantillon considr, savoir, aprs calculs :
^

m = 9,4
x

3,92
15

1,01

Somme
Somme / n

xi

x i2

13
6
12
10
10
16
2
4
11
12
12
5
7
8
13
141
9,40

169
36
144
100
100
256
4
16
121
144
144
25
49
64
169
1541
102,73
14,37
3,79

V(x)
(x)

n
x V( x )
n 1

3,92

b) Comme la loi de probabilit est inconnue et que nous avons un chantillon de taille n < 30,
la moyenne de lchantillon peut tre considre comme une variable alatoire T de Student
(n-1) degrs de libert, soit 14.
T 0,05 14 degrs de libert lu sur la table de Student est : 2,145
1-

100

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

Les limites de lintervalle de confiance sont :


^

X T
1 -

0 , 05
2

= 9,4

2,17

Lintervalle de confiance est alors : [7,23 ; 26,03]


5.4.4. Solution de lexercice 5.3.4.
a) Lestimation ponctuelle de la moyenne de la population mre est la moyenne de
lchantillon considr, savoir, aprs calculs :
xi
x i2

Somme
Somme / n
V(x)
(x)

1,1
1,05
1,25
1,08
1,35
1,15
1,3
1,25
1,3
1,35
1,15
1,32
1,05
1,25
1,1
1,15
19,20
1,2

n
x V( x )
n 1

m = 1,2 soit une dure de vie de 1200 heures.


Lerreur standard est :

0,11
16

0,03
101

1,21
1,1025
1,5625
1,1664
1,8225
1,3225
1,69
1,5625
1,69
1,8225
1,3225
1,7424
1,1025
1,5625
1,21
1,3225
23,21
1,45
0,01
0,10
0,11

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

b) Comme la loi de probabilit est inconnue et que nous avons un chantillon de taille n < 30,
la moyenne de lchantillon peut tre considre comme une variable alatoire T de Student
15 degrs de libert, (n 1).

T
1-

0,05
2

15 degrs de libert lu sur la table de Student est : 2,131

Les limites de lintervalle de confiance sont :


^

X T
1 -

0 , 05
2

= 1,2

0,06

Lintervalle de confiance de la dure de vie moyenne de larticle est alors : [1,14 ; 1,26] soit
[1140 h ; 1260 h]
c) Lintervalle de confiance 10% seulement de risque est :

T
1-

0,10

15 degrs de libert lu sur la table de Student est : 1,753

Les limites de lintervalle de confiance sont :


^

X T
1 -

0 , 05
2

= 1,2

0,05

Lintervalle de confiance de la dure de vie moyenne de larticle est alors : [1,15 ; 1,25] soit
[1150 h ; 1250 h]
d) On voit bien quen doublant le risque derreur, lintervalle de confiance ne varie pas
tellement (une variation de 16,7 %) puisque sa largeur varie de 0,12 0,10.
5.4.5. Solution de lexercice 5.3.5.
Dans le cas dune population normale les limites de lintervalle de confiance 95% sont :

X Z

0 , 05
12

102

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

La lecture de la table normale centre rduite donne Z


1-

0 , 05
2

1,96

De mme, lestimation ponctuelle et sans biais de lcart type est donne par :

n
. V( x ) 28,28
n 1

X Z
1

0 , 05
2

= 130 7,84

Lintervalle est alors : [130-7,84 ; 130+7,84] = [122,16 ; 137,84]


5.4.6. Solution de lexercice 5.3.6.
a) Lestimation ponctuelle de la moyenne de la population mre est la moyenne de
lchantillon considr, savoir, aprs calculs :
^

m = 88,5 g
x

0,063
xi

ni

ni xi

83
4
85
6
87
6
89
6
91
8
93
2
95
2
97
1
35
Somme
Somme / n
V(x)
(x)

332
51
522
534
728
186
190
97
3099
88,5

n
x V( x )
n 1
103

ni

x i2

27556
43350
45414
47526
66248
17298
18050
9409
274851
7852,90
13,6
3,68
3,74

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

b) Lestimation par intervalle de confiance de la moyenne :


Comme nous ne connaissons pas la loi de probabilit de la variable alatoire : poids du ressort
et comme lchantillon a une taille de 36 > 30, cette loi de probabilit peut tre approche par
une normale.
La lecture de la table normale centre rduite donne Z

0 , 04
2

2,05

Les limites de lintervalle de confiance sont :


^

X Z
1 -

0 , 04
2

= 88,5 1,30

Lintervalle de confiance est alors : [87,2 ; 89,8].


5.4.7. Solution de lexercice 5.3.7.
Nous utiliserons les limites de lintervalle de confiance 95% avec les donnes suivantes :

2,3
0 , 05
1
2

= 0,05 =>

0 , 05
1
2

= 0,05

n
= 1,960
2,3

Ce qui donne pour n = 8129


5.4.8. Solution de lexercice 5.3.8.
a) Lestimation ponctuelle et sans biais de la moyenne des botes fabriques par le confiseur est
la moyenne de lchantillon considr, savoir aprs calcul :

Somme
Somme / n

xi

x i2

1,22
1,23
1,21
1,99
1,23
1,24
1,18
1,21
9,71
1,214

1,4884
1,5129
1,4641
1,4161
1,5129
1,5376
1,3924
1,4641
11,7885
1,4736

104

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

V(x)

0,0004

n
x V( x )
n 1

0,021

= 1,214 kg par boite avec x 0,007


m
n

Comme la loi de distribution des poids des botes nest pas connue, elle peut tre approche par
une loi de Student 7 degrs de libert (n 1).
La lecture de la table

0 ,10
2

1,895

Lintervalle de confiance 10 % est :


1,214 0,014

ou

[1,2 ; 1,228]

b) Si la variance de la population est exactement celle de lchantillon, alors lintervalle de


par ( x ) :
confiance est, en remplaant lestimateur

1,214 0,013

ou

1,201 ; 1,227

c1) Si la taille de lchantillon varie, lestimateur sans biais de la moyenne varie aussi :

n
. V( x ) 0,022
n 1

La lecture de la table de Student avec 4 degrs de libert donne :

0,1
2

2,132 .

Lintervalle de confiance devient :

1,214 0,021

ou

1,193 ; 1,235

c2) Dans le cas o la variance de la population mre est exactement celle de lchantillon,
lintervalle de confiance devient :

1,214 0,018

ou

1,196 ; 1,232
105

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

5.4.9. Solution de lexercice 5.3.9.


En supposant, comme dhabitude que lintervalle de confiance est symtrique par rapport la
moyenne on peut donner la moyenne observe :

E (x)

390 520
455 g
2

La demi largeur de lintervalle de confiance est gale, en prenant pour loi de probabilit de la
distribution des poids de pamplemousse, la loi de Student 11 degrs de libert (n 1).

455 390 65 T

Avec

0 , 05
2

0 , 05
2

2,201 lu sur la table de Student, ce qui donne pour :

102,30
et pour

n 1
97,94
n

(x)

5.4.10 Solution de lexercice 5.3.10.


Comme il sagit de plus de 30 deffectifs, nous pouvons considrer que la loi de distribution
des notes est une loi normale.
a) On lit sur la table normale centre rduite :
Lestimation sans biais de

n
V( x ) x
n 1

est :

Nn
8,77
N 1

Lintervalle de confiance 94 % est :

75 2,33

ou

72,67 ; 77,33
106

0 , 06
2

1,88

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

b) Pour avoir une moyenne comprise entre 74 et 76, on doit avoir :

8,77
50

1 Z

0,81

Correspond pour la table normale centre rduite

0,791 0,42 .
2

Le degr de confiance est donc de 58 %.


5.4.11. Solution de lexercice 5.3.11.
Il sagit dchantillons de tailles > 30, les lois de probabilits de distribution des dures de vie
peuvent tre approches par des lois normales.
Il en est de mme de la loi de distribution de la diffrence des dures de vie.
Lestimateur sans biais de la moyenne des diffrences de dures de vie est :

m
1 m
2 1400 h 1200 h 200 h
m
1

n1
150
x 1
x 120 120,4
n1 1
150 1

n2
x 2
n2 1

Lcart

type

de

200
x 80 80,2
200 1
la

diffrence

des

dures

de

vie

moyenne

est

estim

par :

120,4
80,2

11,35
n1 n 2
150
200
2
1

2
2

Lintervalle de confiance 95 % de la diffrence des dures de vie moyennes des deux


marques A et B est :
200 1,96 x 11,35

ou

[177,75 ; 222,25]

5.4.12. Solution de lexercice 5.3.12.


Comme il sagit de lots comprenant 100 roulements, on peut valablement approcher la loi de
probabilit des poids des roulements par une loi normale.

107

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

a) Lintervalle de confiance 99 % est, aprs lecture sur la table normale centre rduite :

2,58

0,638 0,0031

ou

0,635 ; 0,641

Lintervalle de confiance du poids du lot est : [63,5 kg ; 64,1 kg]


b) Lintervalle de confiance 90 % est, aprs lecture sur la table normale centre rduite :

1,64

Lcart type de la population est connu :

0,012

Lintervalle de confiance du poids moyen est :

0,638 0,002

ou

0,636 ; 0,64

Lintervalle de confiance du poids du lot est : [63,6 kg ; 64 kg]


c) Pour une variation du risque derreur de :

0,99 0,90
9%
0,99
Nous obtenons une variation de lintervalle de confiance de :
0,002 0,0031
35 %
0,0031
On voit bien quune faible variation du risque derreur induit une forte variation de lintervalle
de confiance.
5.4.13. Solution de lexercice 5.3.13.
a) Echantillon alatoire simple
La meilleure estimation de la moyenne m dune population, qui puisse tre dduite dun
chantillon alatoire et simple, est la moyenne de lchantillon.
108

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

58

xi

X =
m

i 1

54 127 388 553


= 19,34
58

La dispersion des diffrentes estimations possibles autour de cette moyenne gnrale, est
mesure par lerreur standard de la moyenne :
^

=
X

Nn
N 1

Lcart type de la population peut tre estim par :


^

n.V(X)
n -1
58

V(X)
V(X)

xi
i 1

- x

1004 3081 13270 39667


- 19,34 = 609,10
58

58.609,10
=24,90
58 - 1

= 24,90
X

58

579 58
= 3,10
579 1

La moyenne de la population globale peut tre estime 19,34 avec une erreur standard de
3,10.
b) Echantillon stratifi
On estime la moyenne de chaque strate par la moyenne calcule de lchantillon de la strate.
ni

i Xi =
m

xi
i 1

ni
109

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

Lerreur standard de la moyenne :


^

Ni n i
N i 1

Xi = i

ni

Lcart type de la strate peut tre estim par :


^

n i.V(X)
n i -1
ni

xi

V(X)

i 1

- xi

ni

Le tableau suivant regroupe les rsultats des calculs pour chaque strate.

Strate

Ni

ni

V(X)

xi

Xi

1
2
3
4
Total

53
190
231
105
579

10
14
21
13
58

5,4
9,07
18,48
42,54

71,24
137,78
290,54
1241,79

8,9
12,18
17,47
36,68

2,56
3,14
3,64
9,57

La moyenne de la population globale peut tre estime par :

Ni x i
m
Ni
^

53.5,4190.9,07 231.18,48105.42,54
579

m = 18,56
Lerreur standard de lestimation est :

Xi

V(x)

avec V( x ) =

V( x ) =

1 N i V(x i )

1 (53.2,56 + 190.3,14 + 231.3,64 + 105.9,57)


579

V( x ) = 6,24
110

Statistiques dcisionnelles.

Xi

5. Estimation de la moyenne dune population

6,24 = 2,5

La moyenne de la population globale peut tre estime 18,56 avec une erreur standard de 2,5.
On peut constater que lchantillonnage stratifi est plus prcis que lchantillonnage alatoire
et simple.
5.4.14. Solution de lexercice 5.3.14.
a) Estimation de la note moyenne de la classe.
On estime la moyenne de chaque classe par la moyenne calcule de lchantillon de la classe.
ni

xi

i Xi =
m

i 1

ni

Lerreur standard de la moyenne :


^

Xi = i

ni

Lcart type de la classe peut tre estim par :


^

n i.V(X)
n i -1
ni

V(X)

xi
i 1

ni

- xi

111

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

Le tableau suivant regroupe les rsultats des calculs pour chaque classe.

Classe

V(X)

xi

Xi

1
2
3
4
5
6

12,06
11,97
11,62
12,12
11,85
11,84

0,07
0,01
0,05
0,02
0,03
0,01

0,32
0,13
0,27
0,18
0,21
0,13

0,16
0,06
0,13
0,09
0,11
0,06

En supposant des classes de mme effectifs, la note moyenne de lcole peut tre estime par :

xi
m
^

12,0611,97 11,6212,1211,8511,84
6

m = 11,91
Lerreur standard de lestimation est :

Xi

V(x)

avec V( x ) =

V( x ) =

1 V(x i )

1 (0,16 + 0,06 + 0,13 + 0,09 + 0,11 + 0,06)


36

V( x ) = 0,0019

Xi

0,0019 = 0,044

La note moyenne de lcole peut tre estime 11,91 avec une erreur standard de 0,044.
b) Intervalle de confiance de la note moyenne de lcole.

112

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

La loi de la population est inconnue, la taille de lchantillon est infrieure 30. Lintervalle de
confiance est :
^

X T1
2
n

Au seuil de 5 %, la valeur de T0,975 avec 23 degrs de libert lue dans la table de Student est :
T0,975 = 2,07
Lintervalle de confiance est :
11,91

2,07 . 0,044 = [11,82 ; 12].

113

Statistiques dcisionnelles.

5. Estimation de la moyenne dune population

114

Statistiques dcisionnelles

6. Estimation de la variance dune population

CHAPITRE 6
ESTIMATION DE LA VARIANCE DUNE POPULATION

6.1. ESTIMATION DUNE VARIANCE.


6.1.1. Estimation ponctuelle.
Contrairement la moyenne, la meilleure estimation de la variance dune population, qui
puisse tre dduite dun chantillon alatoire et simple, nest pas la variance de lchantillon
v(x). En effet, pour lensemble des chantillons qui peuvent tre rencontrs, on ne retrouve pas,
en moyenne, la vraie valeur de la population, on obtient ainsi, en moyenne, une valeur
infrieure la variance de la population.
Le biais est :

E(V(X)) - =

Ce biais peut tre corrig en multipliant la variance de lchantillon par le facteur

n . On
n1

obtient alors lestimation :

n
v( x ) =
n 1

(x

x )

i 1

n 1

dont lesprance mathmatique est bien .


^

E( ) = E(

n n 1
n
n
v( x ) ) =
=
E(v(x)) =
n 1
n 1
n 1 n

^
n v(x) est appele quasi-variance, cest un estimateur sans biais de la variance de
n 1

la population. La quasi-variance est dsigne par


115

n 1

Statistiques dcisionnelles

6. Estimation de la variance dune population

Lerreur standard de cette estimation est, dans le cas dune population normale :
^

v( ) 2 (n 1)

2
n

6.1.2. Estimation par intervalle de confiance.


Si on sintresse la variance dune population normale, lestimation par intervalle de
confiance consiste dterminer les bornes 1 et 2 dun intervalle qui a un niveau de
confiance (1-) de contenir .
Les limites 1 et 2 sont telles que :
p(1 2) = 1 -

(x i x)
i 1

Comme, pour une population normale, la variable alatoire

distribution khi deux (n-1) degrs de libert, on peut alors crire :

p(

i 1

(x i x)

(x i x)
i 1

(x i x)
i 1

)=1-

Les limites de confiances sont alors :

1 =

i 1

(x x)
i

et

Les valeurs de

(x x)

2 =

i 1

et 1 sont (n-1) degr de libert, lus sur la table du 2 .


2

116

possde une

Statistiques dcisionnelles

6. Estimation de la variance dune population

6.2. ESTIMATION DE LA SOMME DE VARIANCES.


La population objet dtude peut tre subdivise en plusieurs strates dans lesquelles on choisit
des chantillons indpendants.
Dsignons par :
N = Taille de la population
Ni = Taille de la strate i
n = Taille de lchantillon global
ni = Taille de lchantillon prleve dans la strate i
La variance de chaque strate est estime par la quasi-variance :

i2

xi xi
ni 1

La variance globale de la population est estime par :

N i i2 N i x i x

N
N
2

6.3. ENONCES DES EXERCICES DAPPLICATION.


6.3.1. On reprend les donnes de lexercice 5.3.1.
a) Dduire une estimation de lcart type du nombre de pannes par jour.
b) Donner lerreur standard du rsultat obtenu.
6.3.2. On reprend les donnes de lexercice 5.3.2.
Dterminer une estimation ponctuelle de .
6.3.3. On reprend les donnes de lexercice 5.3.3.
a) Estimer lcart type des notes de l'ensemble des tudiants de la facult.
b) Donner une estimation par intervalle de confiance pour lcart type. ( = 5 %).
c) Donner une estimation par intervalle de confiance pour lcart type 1 % .
d) Donner la sensibilit de la largeur de lintervalle de confiance par rapport une variation du
risque derreur .
6.3.4. On reprend les donnes de lexercice 5.3.4.
a) Estimer lcart type de la dure de vie d'un article.
b) Donner une estimation par intervalle de confiance pour lcart type avec = 2 pour mille.
117

Statistiques dcisionnelles

6. Estimation de la variance dune population

6.3.5. On reprend les donnes de lexercice 5.3.5.


Donner une estimation de par un intervalle de confiance au niveau de confiance 90 %.
6.3.6. On reprend les donnes de lexercice 5.3.6.
X donnant le poids dun ressort provenant de cette fabrication,
a) Donner une estimation ponctuelle de V(X).
b) Donner pour V(X) un intervalle de confiance au niveau de confiance 95%.
6.3.7. On reprend les donnes de lexercice 5.3.8.
a) Donner pour V(X) un intervalle de confiance au risque de 5%.
b) On suppose maintenant que lon a trouv la mme variance observe mais avec 5
observations au lieu de 8. Reprendre la question a).
c) Discuter la sensibilit de lintervalle de confiance par rapport une variation de la taille de
lchantillon.
6.3.8. On reprend les donnes de lexercice 5.3.10.
Quelles sont les limites de confiance 95 % pour estimer lcart type des 200 notes ?
6.3.9. Une compagnie fabrique des roulements billes ayant un poids moyen de 0,638 kg et un
cart type de 0,012 kg. Calculer les limites de confiance de lcart type des poids de lots
comprenant 100 roulements chacun.
a) Avec un risque derreur de 1 %.
b) Avec un risque derreur de 5 %.
c) Discuter la sensibilit de lintervalle de confiance en fonction de la variation du risque
derreur.
6.3.10. En fonction des donnes et rsultats de lexercice 5.3.13., estimer la variance de la
population globale en considrant lchantillon comme :
a) Alatoire et simple ;
b) Stratifi.
6.3.11. On reprend les donnes de lexercice 5.3.14.
Estimer lcart type des notes des lves de lcole ;
6.4. SOLUTIONS DES EXERCICES DAPPLICATION.
6.4.1. Solution de lexercice 6.3.1.
Nous reprenons les rsultats des tableaux des calculs de la solution de lexercice 5.3.1., page
127.

118

Statistiques dcisionnelles

6. Estimation de la variance dune population

a) Lestimation ponctuelle de lcart type est, aprs calcul :

n
x V( x ) 0,87
n 1

b) Lerreur standard est, aprs calcul :

V( 2 ) 2 n 1

2
0,87 2
2 100 1
0,1065
n
100

V() 0,1065 0,33


6.4.2. Solution de lexercice 6.3.2.
On reprend le tableau des rsultats de calculs de la solution de lexercice 5.3.2., page 128.
Lestimation ponctuelle, sans biais, de lcart type est, aprs calcul :

n
x V( x ) 27,89
n 1

Lerreur standard est :

V( )

2 x 10 1

27,89 2
18,16
10

6.4.3. Solution de lexercice 6.3.3.


On reprend le tableau des rsultats de calculs de la solution de lexercice 5.3.3. page 129.
a) Lestimation ponctuelle, sans biais, de lcart type des votes est, aprs calcul :

n
x V( x ) 3,92
n 1

b) Lestimation par intervalle de confiance de 5 % est comme suit :


La lecture de la table du

2 14 degrs de libert donne 2

119

0 , 05
2

26,119 .

Statistiques dcisionnelles

Soit 12

6. Estimation de la variance dune population

(x i x) 2
8,25
2 0 , 05
1

et

1 2,87

et

2 6,19

20 , 05 5,629
2

Soit 22

(x i x) 2
38,29
0 , 05
2

Lintervalle de confiance 5 % de risque est [2,87 ; 6,19].


c) Lestimation par intervalle de confiance 1 % de risque derreur est comme suit :
De mme la lecture de table du

2 14 degrs de libert donne 12 0, 01 31,319


2

Soit 12

(x i x) 2
6,88
2 0 , 01
1

et

1 2,62

20 , 01 4,075
2

Soit 12

(x i x) 2
52,90
20 , 01

et

2 7,27

Lintervalle de confiance est [2,62 ; 7,27] 1 % de risque derreur.


d) On voit quune variation de 5 % 1 % (soit 80 %) induit une variation de la largeur de
lintervalle de confiance de 3,32 (= 6,19 2,87) 4,65 (= 7,27 2,62) soit + 40 %.
6.4.4. Solution de lexercice 6.3.4.
On reprend le tableau des rsultats de calcul de la solution de lexercice 5.3.4. page 131.

120

Statistiques dcisionnelles

6. Estimation de la variance dune population

a) Lestimation ponctuelle, sans biais, de la dure de vie est, aprs calcul :

n
x V( x ) 0,11 soit 110 h.
n 1

b) Lestimation par intervalle de confiance 2 pour 1000 est comme suit :


La lecture de la table du

0 , 002
2

2 15 degrs de libert donne :

37,698

Soit 12

(x i x ) 2
2

0,0046

et

1 0,068

0,002
2

20 , 002 3,483
2

Soit 22

(x i x ) 2
0,0499
20,002

et

2 0,223

Lintervalle de confiance 2 % de risque est [0,068 ; 0,223].


6.4.5. Solution de lexercice 6.3.5.
Lestimation ponctuelle sans biais de lcart type est donne par :

n
V( x ) 28,28
n 1

Le nombre de degrs de libert 49 est grand, on peut utiliser lapproximation de


transformation :

2
2

0 ,1
2

2 x k 1

1,64

2 x 49 1
2

65,997

121

2 par la

Statistiques dcisionnelles

20 ,1
2

12

1,64

xi x
2 0 ,1
1

22

xi x
20 ,1

2 x 49 1

6. Estimation de la variance dune population

33,693

28 2 x 50
593,97 et 1 24,37
65,997

28 2 x 50
1163,446 et 2 34,11
33,693

Lintervalle de confiance 10 % de risque est [24,37 ; 34,11].


6.4.6. Solution de lexercice 6.3.6.
On reprend le tableau des rsultats de calcul de la solution de lexercice 5.3.6. page 133.
a) Lestimation ponctuelle de V(x) est :

n
x V(x) 14
n 1

b) Lintervalle de confiance en risque de 5 % est comme suit :


Les valeurs de

1,96

2 x 34 1

1,96

2 x 34 1

0 , 05
2

2
0 , 05
2

2k 1
2

2
1

2 34 degrs de libert peuvent tre approximes par la transformation :

Soit 12

51,46

19,38

( x i x ) 2 14 x 34

9,25
2 0 , 05
51,46
1

Soit 22

et

1 3,04

et

2 4,96

( x i x ) 2 14 x 34

24,56
20 , 05
19,38
2

Lintervalle de confiance de lcart type [3,04 ; 4,96] 5 % de risque derreur.

122

Statistiques dcisionnelles

6. Estimation de la variance dune population

6.4.7. Solution de lexercice 6.3.7.


On reprend le tableau des rsultats de calcul de la solution de lexercice 5.3.8. page 135.
a) Lintervalle de confiance en risque de 5 % est donn comme suit :
La lecture de la table du

0 , 05
2

2 7 degrs de libert donne :

16,013

Soit 12

(x i x) 2
0,0002
2 0 , 05
1

et

1 0,014

et

2 0,044

20 , 05 1,690
2

Soit 22

(x i x) 2
0,0019
20 , 05
2

Lintervalle de confiance 5 % du risque est [0,014 ; 0,044] 5 % de risque derreur.


b) Si lon na fait que 5 observations au lieu de 8, les rsultats deviennent, aprs lecture de la
table de

0 , 05
2

2 4 degrs de libert :

11,143

Soit 12

(x i x) 2
0,0003
2 0 , 05
1

et

1 0,017

et

2 0,081

20 , 05 0,484
2

Soit 22

(x i x) 2
0,0066
20 , 05
2

Lintervalle de confiance est [0,017 ; 0,081] 5 % de risque derreur.


123

Statistiques dcisionnelles

6. Estimation de la variance dune population

c) La sensibilit de lintervalle de confiance est :


Pour une variation de lchantillon de 8 5 (soit 37,5 %) la largeur de lintervalle varie de
0,030 (= 0,044 0,014) 0,064 (= 0,081 0,017) soit + 113 %.
6.4.8. Solution de lexercice 6.3.8.
On reprend les rsultats des calculs de la solution de lexercice 5.3.10. page 138.

8,77
La valeur

2 199 degrs de libert peut tre approxime par la loi normale de moyenne 199
2 x 199 19,95 .

et dcart type

0 , 05
2

199
Z

19,95

0 , 05
2

0 , 05
2

1,96 x 19,95 199 238,10

20 , 05 199
Z 0 , 05

19,95

20 , 05 1,96 x 19,95 199 159,90


2

12

xi x
2 0 , 05
1

8,77 2 x 199
64,28
238,10

et

1 8,02

8,77 2 x 199
95,72
159,90

et

2 9,78

xi x

20 , 05
2
2

Lintervalle de confiance est [8,02 ; 9,78] 5 % de risque derreur.

124

Statistiques dcisionnelles

6. Estimation de la variance dune population

6.4.9. Solution de lexercice 6.3.9.

0,012 kg

2 99 degrs de libert peuvent tre approximes par la loi normale de

Les valeurs de

2 x 99 14 .

moyenne 99 et dcart type


a) Risque derreur de 1 % :

0 , 01
2

99
Z

14

0 , 01
2

0 , 01
2

2,58 x 14 99 135,12

Z 20 , 01 99
Z 0 , 01 20 , 01 2,58 x 14 99 62,88

14

12

xi x
2 0 , 01
1

22

0,012 2 x 100
0,0001 et
135,12

1 0,0103

0,012 2 x 100
0,0002 et
62,88

2 0,0151

xi x
20 , 01

Lintervalle de confiance est [0,0103 ; 0,0151] 1 % de risque derreur.


b) Risque derreur de 5 % :

0 , 05
2

99
Z

14

0 , 05
2

0 , 05
2

1,96 x 14 99 126,44

20 , 05 99
Z 0 , 05 20 , 05 1,96 x 14 99 71,56

14

xi x

2 0 , 05
2
1

0,012 2 x 100
0,00011 et
126,44

125

1 0,0107

Statistiques dcisionnelles

22

xi x
20 , 05

6. Estimation de la variance dune population

0,012 2 x 100
0,0002 et
71,56

2 0,0142

Lintervalle de confiance est [0,0107 ; 0,0142] 5 % de risque derreur.


c) La sensibilit de lintervalle de confiance est :
Pour une variation du risque derreur de 1 % 5 % (soit une augmentation de 400 %) la largeur
de lintervalle de confiance varie de 0,0048 (= 0,0151 0,0103) 0,0035 (= 0,0142 0,0107)
soit 27 %.
6.4.10. Solution de lexercice 6.3.10.
a) Echantillon alatoire simple :
La variance de la population peut tre estime par :
^
n.V(X)

n -1
58

x
i

V(X)

x=

-x

58

x
i 1

V(X)

i 1

54 127 388 553


= 19,34
58

1004 3081 13270 39667


- 19,34 = 609,10
58

58.609,10
=619,79
58 - 1

b) Echantillon stratifi :
La variance de la strate peut tre estime par :

12

n i .V(X)
ni -1

126

Statistiques dcisionnelles

6. Estimation de la variance dune population

ni

x
i

V(X)

xi =

i 1

ni

- xi

ni

i 1

ni

Le tableau suivant regroupe les rsultats des calculs pour chaque strate.

Strate

Ni

ni

xi

V(X)

1
2
3
4
Total

53
190
231
105
579

10
14
21
13
58

5,4
9,07
18,48
42,54

71,24
137,78
290,54
1241,79

79,2
148,4
305,1
1614,3

La moyenne de la population globale peut tre estime par :

N xi
53.5, 4 190.9,07 231.18, 48 105.42,54
i
x
=
= 18,56
Ni
579

La variance de la population globale peut tre estime par :


^

^
N i i N i ( x i x )

N
N
^
53.79,2 190.148,4 231.305,1 105.1614,3
+

579

53.(5, 4 18,56) 190.(9,07 18,56) 231.(18, 48 18,56) 105.( 42,54 18,56)


579

^
= 620,11

127

Statistiques dcisionnelles

6. Estimation de la variance dune population

6.4.11. Solution de lexercice 6.3.11.


La variance de la classe peut tre estime par :
^

n i .V(X)
ni -1
ni

x
i

V(X)

i 1

- xi

ni

ni

xi =

i 1

ni

Le tableau suivant regroupe les rsultats des calculs pour chaque classe.

Classe

xi

V(X)

1
2
3
4
5
6

12,06
11,97
11,62
12,12
11,85
11,84

0,07
0,01
0,05
0,02
0,03
0,01

0,1024
0,0169
0,0729
0,0324
0,0441
0,0169

En supposant des classes de mme effectifs, la note moyenne de lcole peut tre estime par :

x
x

12,06 11,97 11,62 12,12 11,85 11,84


6

x = 11,91
La variance de la population globale peut tre estime par :
^

N (x x)

= 0,07
^

Lcart type de la population globale peut tre estime par : = 0,27.


128

Statistiques dcisionnelles

7. Estimation de la proportion dune population

CHAPITRE 7
ESTIMATION DE LA PROPORTION DUNE POPULATION

7.1. ESTIMATION PONCTUELLE.


La meilleure estimation de la proportion p dune population, qui puisse tre dduite dun
chantillon alatoire et simple, est la frquence de lchantillon fn.

p f n
La dispersion des diffrentes estimations possibles autour de cette proportion gnrale, est
mesure par lerreur standard de la proportion :

f
n

f n 1 f n
n

7.2. ESTIMATION PAR INTERVALLE DE CONFIANCE.


Si on sintresse la proportion p, lestimation par intervalle de confiance consiste
dterminer de part et dautre de lestimateur fn les bornes p1 et p2 dun intervalle qui a un
niveau de confiance (1-) de contenir p.
Les limites p1 et p2 sont telles que :
p(p1 p p2) = 1 -

ou

p(p < p1) = p(p > p2) = /2

Comme, la distribution de la proportion suit une loi normale de moyenne p et dcart type

Fn

pq

condition que la taille de lchantillon soit suprieure ou gale 30 (n 30) et le

produit np 5, on peut crire si on dsigne par

Z1 la valeur de la variable normale rduite

2
lue dans la table que les limites de lintervalle de confiance sont :
129

Statistiques dcisionnelles

p1= fn - Z

7. Estimation de la proportion dune population

p(1 p)
n

et

p2 = fn + Z

p(1 p)
n

On notera lintervalle de confiance :


fn Z

ou

p(1 p)
n

f n Z 1
2

p (1 p)
; fn Z
1
n
2

p (1 p)

On obtient ainsi un intervalle symtrique par rapport fn.


7.3. ENONCES DES EXERCICES DAPPLICATION.
7.3.1. Dans une population dtudiants en sociologie, on a prlev, indpendamment, deux
chantillons de taille n1 = 120 et n2 = 150. On constate que 48 tudiants de lchantillon 1 et
66 tudiants de lchantillon 2 ont une formation secondaire scientifique. Soit p la proportion
dtudiants de la population ayant une formation scientifique ; calculer trois estimations
ponctuelles de p.
7.3.2. Un promoteur dsire tudier le nombre de garage qu'il est souhaitable de construire avec
un ensemble de logements, afin que les occupants puissent y ranger leur voiture. Pour cela il
fait effectuer une enqute par sondage auprs d'un chantillon de mnages susceptibles
d'habiter ces appartements.
a) On interroge un chantillon de 3238 mnages. On trouve parmi eux 1943 possesseurs d'une
voiture. Estimez, partir de cet chantillon, la proportion des mnages ayant une voiture.
Degr de confiance 99 %.
b) partir de la proportion estime, combien de mnages faudrait-il interroger pour construire,
avec un risque d'erreur de 5 %, un intervalle de confiance d'amplitude 0,04 ?
7.3.3. On tudie le pourcentage d'utilisation d'une machine. 400 observations ont t effectues
qui ont donn le rsultat suivant :
Machine marche : 320 observations.
Machine arrte : 80 observations.
a) Entre quelles limites peut-on fixer le taux d'utilisation de la machine avec un degr de
confiance de 94 % ?
b) Combien doit-on faire d'observations pour obtenir le mme pourcentage d'utilisation tout en
ayant, avec un risque d'erreur de 6 %, lintervalle de confiance [78,4 % ; 81,6 %] ?

130

Statistiques dcisionnelles

7. Estimation de la proportion dune population

7.3.4. Sur un chantillon de 400 adultes et de 600 adolescents ayant regard un certain
programme de tlvision, 100 adultes et 300 adolescents lont apprci. Calculer les limites de
confiance 99 % de la diffrence des frquences des adultes et des adolescents qui ont regard
et apprci le programme.
7.3.5. On considre 2 chantillons tirs dune mme population et lon dsire calculer le taux
de participation un vote.
Le 1er chantillon de taille 100 a donn 45 personnes ayant vot.
Le 2e chantillon de taille 200 a donn 96 personnes ayant vot.
a) Donner les 2 estimations ponctuelles des taux de participation au vote.
b) Donner pour chaque chantillon un intervalle de confiance de taux de participation au vote
avec un risque derreur de 1 %.
c) Donner la sensibilit de lintervalle de confiance en fonction de la taille de lchantillon.
7.3.6. Sur 100 clients dun caf, 85 demandent un caf au petit djeuner.
a) Donner une estimation ponctuelle de la proportion de clients qui prennent un caf.
b) Donner lintervalle de confiance 1 % de risque derreur de cette proportion.
c) Donner lintervalle de confiance 5 % de risque derreur de cette proportion.
d) Discuter la sensibilit de lintervalle de confiance en fonction du risque derreur.
7.4. SOLUTIONS DES EXERCICES DAPPLICATION.
7.4.1. Solution de lexercice 7.3.1.
On se propose de dterminer 3 estimations ponctuelles de p.
a) Estimation partir du 1er chantillon :

p1

48
0,40
120

Lerreur standard est :

p
1

0,40 x 0,60
0,045
120

b) Estimation partir du 2e chantillon :

p2

66
0,44
150

131

Statistiques dcisionnelles

Lerreur standard est p


2

7. Estimation de la proportion dune population

0,44 x 0,56
0,040
150

c) Estimation partir de la sommation des 2 chantillons :

P3

48 66
114

0,42
120 150 270

0,42 x 0,58
0,030
270
On trouve bien 3 rsultats qui ne sont pas trop diffrents.
Lerreur standard est : p
3

7.4.2. Solution de lexercice 7.3.2.


a) Lestimation ponctuelle de la proportion des personnes ayant une voiture, daprs les
donnes du 1er chantillon est :

1943
0,60
3238

Lestimation par intervalle de confiance au risque de 1 % de la proportion des personnes qui


ont une voiture est comme suit :
On utilisera la loi normale puisque lchantillon a une taille de 3238 > 30 et que np = 1943 > 5.

0 , 01
2

Soit Z

2,575

0 , 01
2

p (1 p)
0,022
n

Lintervalle de confiance est [0,578 ; 0,622] 1 % de risque derreur.


b) On suppose que la taille de lchantillon quon va trouver est suprieure 30 et que np > 5
pour que nous puissions utiliser la lecture de la table normale centre rduite.

0 , 05
2

1,960

132

Statistiques dcisionnelles

7. Estimation de la proportion dune population

Pour avoir un intervalle de confiance 5 % de risque derreur damplitude 0,04, on doit avoir :

p (1 p) 0,04

0,02
n
2

0 , 05
2

n Z2

0 , 05
2

p (1 p)
2305
0,02 2

On trouve bien n > 30 et np = 1383 > 5.


7.4.3. Solution de lexercice 7.3.3.
a) Lestimation ponctuelle de taux dutilisation de la machine est :

320
0,80
400

On utilisera la loi normale puisque lchantillon a une taille de 400 et que np = 320 > 5.

0 , 06
2

0 , 06
2

1,88

p (1 p)
0,038
n

Lintervalle de confiance 6 % de risque est [0,762 ; 0,838].


b) Le nouvel intervalle de confiance 6 % du risque derreur a une amplitude de 81,6 % - 78,4
% = 3,2 % = 0,032.
Donc :

0 , 06
2

n Z2

p (1 p) 0,032

0,016
n
2

0 , 06
2

p (1 p)
2209
0,016 2

On voit bien que n = 2209 est suprieur 30 et que np = 1767 > 5 ce qui justifie notre
utilisation de la loi normale.
133

Statistiques dcisionnelles

7. Estimation de la proportion dune population

7.4.4. Solution de lexercice 7.3.4.


La frquence des adultes qui ont regard et apprci le programme est :

p1

100
0,25
400

Lerreur standard de cette estimation est :

0,25 x 0,75
0,0217
400

p
1

La frquence des adolescents qui ont regard et apprci le programme est :

p2

300
0,5
600

Lerreur standard de cette estimation est :

p
2

0,5 x 0,5
0,0204
600

La diffrence des frquences des adultes et des adolescents qui ont regard et apprci le
programme :

p 2 p 1 0,5 0,25 0,25


Lerreur standard est :

0,0217 2 0,0204 2 0,0298


Au seuil de 99 % Z

0 , 01
2

2,575

Lintervalle de confiance est :

0,25 2,575 x 0,0298 0,25 0,08 0,17 ; 0,33

134

Statistiques dcisionnelles

7. Estimation de la proportion dune population

7.4.5. Solution de lexercice 7.3.5.


a) Les estimations ponctuelles du taux de participation sont :
p1 = 0,45
p2 = 0,48
b) Les intervalles de confiance 1 % de risque derreur sont, aprs lecture sur la table normale
centre rduite puisque pour les 2 chantillons n > 30 et np > 5.

2,575

0 , 01
2

0 , 01
2

p 1 (1 p 1 )
0,128
n1

0 , 01
2

p 2 (1 p 2 )
0,091
n2

Lintervalle de confiance du 1er chantillon est : [0,322 ; 0,578].


Lintervalle de confiance du 2e chantillon est : [0,389 ; 0,571].
c) Il est difficile de parler de sensibilit de lintervalle de confiance puisque les proportions
diffrent dun chantillon un autre.
Pour ce faire, nous allons supposer quen ayant augment la taille de lchantillon de 100 200
la proportion p est reste inchange, ce qui modifie quelque peu lintervalle relatif au 2 e
chantillon puisquil devient :

0 , 01
2

p 1 (1 p 1 )
0,091
n2

On voit quaux erreurs dapproximation prs, on retrouve le mme rsultat quavec p 2.


Donc la sensibilit de lintervalle de confiance en fonction de la taille de lchantillon est
comme suit :
On fait passer la taille de lchantillon de 100 200 (soit + 100 %) lamplitude de lintervalle
de confiance varie de 0,256 (2 x 0,128) 0,182 (2 x 0,091) soit 28,8 %.

135

Statistiques dcisionnelles

7. Estimation de la proportion dune population

7.4.6. Solution de lexercice 7.3.6.


a) p

85
0,85
100

b) Lintervalle de confiance 1 % de risque derreur est, puisque n > 30 et np > 5.

0 , 01
2

2,575

et

0 , 01
2

p (1 p)
0,092
n

Lintervalle de confiance est : [0,758 ; 0,942] 1 % de risque derreur.


c) Lintervalle de confiance 5 % de risque derreur est, puisque n > 30 et np > 5.

0 , 05
2

1,960

et

0 , 05
2

p (1 p)
0,070
n

Lintervalle de confiance est : [0,78 ; 0,92] de risque derreur.


d) Ainsi en faisant varier le risque derreur de 1 % 5 %, soit + 400 %, lamplitude de
lintervalle de confiance varie de 0,184 (2 x 0,092) 0,140 (2 x 0,070) soit 23,9 %.

136

Statistiques dcisionnelles

Partie 4. Tests statistiques

PARTIE 4
TESTS STATISTIQUES

PROBLEMATIQUE DES TESTS STATISTIQUES.


Un test statistique est une mthode permettant de prendre une dcision partir dinformations
fournies par un chantillon.
Les tests statistiques ou les tests dhypothses ont pour but de vrifier, partir de donnes
observes dans un ou plusieurs chantillons, la validit de certaines hypothses relatives une
ou plusieurs populations.
On peut distinguer diffrents types de tests, en fonction des hypothses quon peut faire.
- Les tests de comparaison une norme ou tests de conformit sont destins comparer
entre eux une population thorique et un chantillon observ. Ils servent vrifier si un
chantillon donn peut tre considr comme extrait dune population possdant telle
caractristique particulire (moyenne, variance, ). Le test se fait en vrifiant si la diffrence
entre la valeur observe et la valeur thorique du paramtre considr peut tre attribue au
hasard ou non.
- Les tests dhomognit ou dgalit ont pour but de comparer entre elles un certain
nombre de populations, laide dun mme nombre dchantillons.
- Les tests dajustement sont destins vrifier si un chantillon observ peut tre extrait
dune population donne.
- Les tests dindpendance ont pour but de contrler, partir dun chantillon,
lindpendance de deux ou plusieurs critres de classification, gnralement qualitatifs.

137

Statistiques dcisionnelles

Partie 4. Tests statistiques

PRINCIPE GENERAL DUN TEST STATISTIQUE.


Pour commencer, on met une certaine hypothse tester, appele hypothse nulle,
gnralement dsigne par H0. Celle-ci suppose toujours lgalit des caractristiques
compares.
Lhypothse qui diffre de H0 est dite hypothse alternative, gnralement dsigne par H1.
On mesure ensuite lcart observ entre les caractristiques compares, et on calcule la
probabilit dobserver, si lhypothse nulle est vraie, un cart aussi important.
Si cette probabilit est relativement leve, on considre lhypothse nulle comme plausible et
on laccepte. Par contre si la probabilit calcule est faible, lcart observ apparat comme peu
compatible avec lhypothse nulle et on rejette celle-ci.
Lensemble des valeurs observes pour lesquelles lhypothse H0 est admissible forme la
rgion dacceptation. Les autres valeurs constituent la rgion de rejet. Les valeurs limites sont
appeles valeurs critiques.
La dcision dpend donc de lchantillon. Ainsi quelle que soit la dcision prise, le hasard de
lchantillonnage peut fausser les conclusions. Quatre situations doivent donc tre envisages :
- Lacceptation de l'hypothse nulle alors qu'elle est vraie ;
- Le rejet de l'hypothse nulle alors qu'elle est vraie ;
- L'acceptation de l'hypothse nulle alors qu'elle est fausse ;
- Le rejet de l'hypothse nulle alors qu'elle est fausse.
Dans le premier et le dernier cas, la conclusion obtenue est correcte, mais il n'en est
malheureusement pas de mme dans les deux cas intermdiaires.
- L'erreur qui consiste rejeter une hypothse vraie est appele erreur de premire espce et
dsigne par RH0/H0.
- Accepter une hypothse fausse est une erreur de seconde espce, elle est dsigne par
AH0/H1.
Les probabilits daboutir de telles conclusions errones sont les risques de premire et de
deuxime espce, dsigns respectivement par et .
= p (RH0/H0)

= p (AH0/H1)

Le risque de premire espce est appel aussi seuil de signification du test, fix trs souvent
5 %. La probabilit complmentaire de dsigne le niveau de confiance du test.

138

Statistiques dcisionnelles

Partie 4. Tests statistiques

1- = p(AH0/H0)
La probabilit complmentaire de dsigne la puissance du test.
1- = p (RH/H1)
On peut prsenter une table de dcision comme suit :

H0
Hypothse
vraie

H1

Dcisions prises
Accepter H0
Accepter H1
1-

Niveau de confiance
erreur de premire espce

1-
erreur de deuxime
Puissance du test
espce

La dtermination des valeurs limites de la rgion dacceptation de lhypothse nulle dpend de


lhypothse alternative H1, ainsi on distingue le test bilatral et le test unilatral.
a) Test bilatral
Un test est dit bilatral si la condition de rejet est indpendante du signe de lcart observ
entre les caractristiques compares. Les hypothses formules du test bilatral sont :
H 0 : = t0

et

H1 : t0

et t0 sont les caractristiques compares.


La rgle de dcision peut tre reprsente ainsi :
< t0
= t0
> t0
Rgion de rejet de H0 Rgion dacceptation de H0 Rgion de rejet de H0
A1
A2
A1 et A2 sont les valeurs critiques qui dlimitent la rgion dacceptation.
La rgion dacceptation est donc lintervalle [A1 ; A2].
p (A1 t0 A2) = 1 -
p (t0 < A1) = p(t0 > A2) = /2
b) Test unilatral

139

Statistiques dcisionnelles

Partie 4. Tests statistiques

Un test est dit unilatral si lhypothse alternative dsigne quune caractristique est
strictement suprieure ou infrieure lautre. On parle respectivement de test unilatral droite
ou gauche.
- Test unilatral droite
Les hypothses formules du test unilatral droite sont :
H 0 : = t0

H 1 : > t0

et

La rgle de dcision peut tre reprsente ainsi :


t0
Rgion dacceptation de H0

> t0
Rgion de rejet de H0
A

A dsigne la valeur critique qui dlimite la rgion dacceptation.


La rgion dacceptation est donc lintervalle - ; A].
p (t0 A) = 1 -

p(t0 > A) =

- Test unilatral gauche


Les hypothses formules du test unilatral gauche sont :
H 0 : = t0

et

H 1 : < t0

La rgle de dcision peut tre reprsente ainsi :


< t0
Rgion de rejet de H0

t0
Rgion dacceptation de H0
A

A dsigne la valeur critique qui dlimite la rgion dacceptation.


La rgion dacceptation est donc lintervalle [A ; + [.
p(t0 < A) =

p(t0 A) = 1 -

140

Statistiques dcisionnelles

Partie 4. Tests statistiques

RECAPITULATIF.
Pour rcapituler, la dmarche dun test statistique se compose des tapes suivantes :
1. Formuler les hypothses H0 et H1 ;
2. Fixer le seuil de signification ;
3. Prciser la loi de probabilit de lcart observ, appel aussi variable de dcision ;
4. Calculer la valeur numrique de la variable de dcision ;
5. Dterminer les valeurs critiques qui dlimitent la rgion dacceptation ;
6. Prendre la dcision et conclure.

141

Statistiques dcisionnelles

Partie 4. Tests statistiques

142

Statistiques dcisionnelles

8. Tests sur les moyennes

CHAPITRE 8
TESTS SUR LES MOYENNES

8.1. TEST SUR UN ECHANTILLON.


8.1.1. Formulation de lhypothse nulle.
On attribue la valeur m0 pour la moyenne dune population dont la vraie moyenne m est
inconnue, et on veut juger la validit de cette hypothse.
Ce test a pour but de vrifier si la moyenne m dune population est ou nest pas gale une
valeur donne m0, appele norme.
Lhypothse nulle est donc :

H0

m = m0

8.1.2. Variable de dcision.


On extrait de la population un chantillon alatoire et simple pour lequel la moyenne observe

x est, en gnral, diffrente de m0, il sagit dexpliquer cette diffrence.


La variable de dcision du test correspond lestimation de m qui est la moyenne de
lchantillon :

VD = x
Pour une population normale dcart type connu, la variable de dcision est elle-mme

normale de moyenne m0 et dcart type


.
n

143

Statistiques dcisionnelles

8. Tests sur les moyennes

La variable de dcision centre rduite est donc :


x - m0
VDR

n
VDR est alors une variable normale rduite N(0 ; 1).
Si la distribution de la population parent est inconnue, la quasi-variance sera utilise comme
estimation de la variance de la population. Pour un effectif suffisamment lev, la variable de
dcision peut toujours tre considre comme une variable approximativement normale. Cest
gnralement le cas lorsque leffectif est suprieur 30. Dans le cas contraire (n < 30), la
variable de dcision rduite VDR peut toujours tre considre comme une variable de Student
(n-1) degr de libert.
8.1.3. Rgion dacceptation.
La rgion dacceptation dpend de lhypothse alternative H 1.
a) Test bilatral :
H0 : m = m0

H1 : m m0

et

Les valeurs critiques qui dlimitent la rgion dacceptation sont, pour une distribution normale
rduite ou asymptotiquement normale rduite, Z1 et Z2 telles que :
p(Z1 VDR Z2) = 1 -
p(VDR < Z1) = /2

Z1 =

Z
2

p(VDR > Z2) = /2

p(VDR Z2) = 1-/2

La rgion dacceptation est donc lintervalle [ Z ; Z


2

Z2 = Z

].

On accepte lhypothse nulle si la variable de dcision rduite appartient la rgion


dacceptation. Sinon, cest lhypothse alternative H1 qui est accepte.
Remarque : Puisque la rgion dacceptation est symtrique, on rejette lhypothse nulle si :

VDR Z

144

Statistiques dcisionnelles

8. Tests sur les moyennes

b) Test unilatral droite :


H0 : m = m0

et

H1 : m > m0

La valeur critique qui dlimite la rgion dacceptation est, pour une distribution normale
rduite ou asymptotiquement normale rduite, Z telle que :
p(VDR Z) = 1 -

Z=

Z1

La rgion dacceptation est donc lintervalle ]- ;

Z1 ].

c) Test unilatral gauche :


H0 : m = m0

et

H1 : m < m0

La valeur critique qui dlimite la rgion dacceptation est, pour une distribution normale
rduite ou asymptotiquement normale rduite, Z telle que :
p(VDR < Z) =

Z=

La rgion dacceptation est donc lintervalle [ Z ; +[.


Remarque : Pour une distribution de probabilit inconnue, et lorsque leffectif de
lchantillon est infrieur 30, la variable de dcision rduite VDR peut toujours tre
considre comme une variable de Student (n-1) degr de libert. Les valeurs de Z sont
remplaces par les valeurs de T de la loi de Student avec (n-1) degr de libert.
8.2. TEST SUR DEUX ECHANTILLONS.
8.2.1. Test de comparaison des moyennes de deux chantillons indpendants.
Ce test a pour but de comparer les moyennes de deux populations laide de deux chantillons.
Soient deux chantillons alatoires et non exhaustifs prlevs respectivement dans une
population 1 de moyenne inconnue m1 et dans une population 2 de moyenne inconnue m2.

145

Statistiques dcisionnelles

8. Tests sur les moyennes

8.2.1.1. Formulation de lhypothse nulle.


Ce test a pour but de vrifier si la moyenne m1 dune population est ou nest pas gale la
moyenne m2 dune autre population.
Lhypothse nulle est donc :

H0

m1 = m2

8.2.1.2. Variable de dcision.


La variable de dcision du test correspond la diffrence entre les moyennes observes des
deux chantillons :

VD = x 1 - x 2
Une distinction est faite entre le cas de deux populations de variances ingales et le cas de deux
populations de variances gales.
a) Cas de deux populations de variances ingales :

Pour des populations normales (variances connues), les variables

x 1 - x 2 sont des variables

normales de moyennes respectivement m1 et m2 et dcarts type respectivement

1
n1

et

n2

La variable de dcision est elle-mme normale de moyenne (m1-m2) et dcart type


1 2
.

n1
n2
Sous lhypothse nulle, (m1-m2)=0. La variable de dcision centre rduite :

VDR =

(x 1 x 2 )
1 2

n1
n2

VDR est donc une variable normale rduite N(0 ; 1).


Remarque : Si les distributions des populations parents sont inconnues, pour des effectifs
suffisamment levs, la variable de dcision peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs
30. Dans le cas contraire, la variable de dcision rduite VDR peut toujours tre considre
comme une variable de Student (n1 + n2 - 2) degr de libert.

146

Statistiques dcisionnelles

8. Tests sur les moyennes

b) Cas de deux populations de variances gales :


Dans le cas o les populations sont de variances gales, une estimation de la variance
commune aux deux populations est donne par :
^

(x

x 1 )

(x

x 2 )

n1 n 2 2

La variable de dcision rduite devient :

VDR =

(x 1 x 2 )
^

n1 n 2

VDR =

(x 1 x 2 )
1
1
)
n1 n 2

(x 1 x 2 )

(x

x 1 )

(x

x 2 ) 1
1
( )
n1 n 2 2
n1 n 2
i

Remarque : Si les distributions des populations parents sont inconnues, pour des effectifs
suffisamment levs, la variable de dcision peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque les effectifs sont suprieurs
30. Dans le cas contraire, la variable de dcision rduite VDR peut toujours tre considre
comme une variable de Student (n1 + n2 - 2) degr de libert.
8.2.1.3. Rgion dacceptation.
La rgion dacceptation dpend de lhypothse alternative H 1.
a) Test bilatral :
H0 : m1 = m2

et

H1 : m1 m2

Les valeurs critiques qui dlimitent la rgion dacceptation sont, pour des distributions
normales rduites ou asymptotiquement normales rduites, Z1 et Z2 telles que :
p(Z1 VDR Z2) = 1 -
p(VDR < Z1) = /2

Z1 =

Z
2

147

Statistiques dcisionnelles

8. Tests sur les moyennes

p(VDR > Z2) = /2 p(VDR Z2) = 1-/2

Z2 = Z

La rgion dacceptation est donc lintervalle [ Z ; Z


2

].

On accepte lhypothse nulle si la variable de dcision rduite appartient la rgion


lacceptation. Sinon, cest lhypothse alternative H1 qui est accepte.
Remarque : Puisque la rgion dacceptation est symtrique, on rejette lhypothse nulle
si :
VDR > Z
1

b) Test unilatral droite :


H0 : m1 = m2

et

H1 : m1 > m2

La valeur critique qui dlimite la rgion dacceptation est, pour des distributions normales
rduites ou asymptotiquement normales rduites, Z telle que :
p(VDR Z) = 1 -

Z=

Z1

La rgion dacceptation est donc lintervalle ]- ;

Z1 ].

c) Test unilatral gauche :


H0 : m1 = m2

et

H1 : m1 < m2

La valeur critique qui dlimite la rgion dacceptation est, pour des distributions normales
rduites ou asymptotiquement normales rduites, Z telle que :
p(VDR < Z) =

Z=

La rgion dacceptation est donc lintervalle [ Z ; +[.


Remarque : Pour des distributions de probabilits inconnues, et lorsque les effectifs des
chantillons sont infrieurs 30, la variable de dcision rduite VDR peut toujours tre
considre comme une variable de Student. Les valeurs de Z sont remplaces par les
valeurs de T de la loi de Student avec (n1 + n2 - 2) degr de libert.

148

Statistiques dcisionnelles

8. Tests sur les moyennes

8.2.2. Test de comparaison des moyennes de deux chantillons apparies.


Ce test a pour but de comparer les moyennes de deux populations laide de deux chantillons
associs par paires. Cest le cas o on soumet les mmes individus, choisis dans une population
donne, deux types dobservations.
8.2.2.1. Formulation de lhypothse nulle.
Ce test a pour but de vrifier si la moyenne m1 dune population sous une forme donne est ou
nest pas gale la moyenne m2 de la mme population sous une autre forme.
Lhypothse nulle est donc :

H0

m1 = m2

8.2.2.2. Variable de dcision.


Soient deux sries de n observations chacune, x1, x2, , xn, et y1, y2, , yn . On travaille avec
la srie des diffrences :
di = xi yi
La variable de dcision du test correspond la moyenne des diffrences :

VD = d
Pour une population normale, la variable de dcision est elle-mme normale et la variable de
dcision centre rduite est donc :

VDR =

d
^

n
VDR est alors une variable normale rduite N(0 ; 1).
Remarque : Si la distribution de la population parent est inconnue, pour un effectif
suffisamment lev, la variable de dcision peut toujours tre considre comme une variable
approximativement normale. Cest gnralement le cas lorsque leffectif est suprieur 30.
Dans le cas contraire (n < 30), la variable de dcision rduite VDR peut toujours tre
considre comme une variable de Student (n-1) degr de libert.
8.2.2.3. Rgion dacceptation.
La rgion dacceptation est identique celle du test prcdent. Elle dpend toujours de
lhypothse alternative H1.
a) Test bilatral :
149

Statistiques dcisionnelles

8. Tests sur les moyennes

H0 : m1 = m2

H1 : m1 m2

et

La rgion dacceptation est lintervalle [ Z ; Z


2

].

On accepte lhypothse nulle si la variable de dcision rduite appartient la rgion


dacceptation. Sinon, cest lhypothse alternative qui est accepte.
Remarque : Puisque la rgion dacceptation est symtrique, on rejette lhypothse nulle
si :

VDR > Z

b) Test unilatral droite :


H0 : m1 = m2
La rgion dacceptation est lintervalle ]- ;

et

H1 : m1 > m2

Z1 ].

c) Test unilatral gauche :


H0 : m1 = m2

et

H1 : m1 < m2

La rgion dacceptation est lintervalle [ Z ; +[.


Remarque : Pour des distributions de probabilits inconnues, et lorsque les effectifs des
chantillons sont infrieurs 30, la variable de dcision rduite VDR peut toujours tre
considre comme une variable de Student (n-1) degr de libert. Les valeurs de Z sont
remplaces par les valeurs de T de la loi de Student avec (n-1) degr de libert.
8.3. TEST SUR PLUSIEURS ECHANTILLONS : ANALYSE DE LA VARIANCE (ANOVA).
Cest une mthode statistique pour tester l'galit de plusieurs moyennes. La mthode repose
sur les postulats suivants : les chantillons alatoires proviennent de populations distribues
normalement et ayant la mme variance.

150

Statistiques dcisionnelles

8. Tests sur les moyennes

Formulation de lhypothse nulle :


L'analyse de variance, sert effectuer le test de l'galit de plusieurs moyennes. On crit
comme suit les hypothses :
Ho: m1 = m2 = ... = mJ
H1: au moins une des moyennes est diffrente des autres.
En effet, l'analyse de variance est une technique d'analyse statistique qui permet de tester
globalement l'galit des moyennes de J populations normales dans lesquelles on suppose que
les variances sont gales (12 22 2j 2 ) mme si elles demeurent inconnues.
L'analyse de variance constitue une extension J populations normalement distribues, J 2,
du test de comparaison des moyennes de deux chantillons indpendants.
Modles d'analyse de variance :
Les modles varient selon le nombre de facteurs contrls. On aura ainsi le modle un
facteur, le modle 2 facteurs sans interaction et le modle 2 facteurs avec interaction.
8.3.1. ANOVA un facteur.
On essaie de dcouvrir si un seul facteur peut expliquer ou non les variations constates dans
les observations Yij. Au dpart, on dispose d'chantillons prlevs alatoirement dans des
populations normales dans lesquelles les variances sont supposes gales

(12 22 32 2j ) .
Le tableau suivant illustre la notation indice: par exemple, Y21 reprsente la deuxime
observation prleve de la premire population. Dans chaque chantillon, on a aussi calcul le
total des observations, la moyenne et la variance.
Matrice des donnes
Observation
1

POPULATION
P1: N(m1,1) P2 : N(m2,2) Pj : N(mj,j)
Y11
Y12
Y1j

Y21

Y22

yn1

yn2

ynj

151

Y2j

Statistiques dcisionnelles

8. Tests sur les moyennes

T1

Total

T2

Tj

Yj
S j

Moyenne

Y1

Y2

Variance

S1

S 2

N n 1 n 2 ... n J

Grand total = T

Moyenne gnrale = Y
8.3.1.1. Equation fondamentale de l'analyse de la variance.
L'analyse de la variance dveloppe par Fisher repose sur la comparaison de deux estimateurs
de la variance commune aux J populations normales.
L'quation fondamentale de l'analyse de la variance dcompose la variabilit totale (STC) entre
les observations en une part due aux diffrences entre les modalits du facteur (SCF) et une
part de variabilit rsiduelle (SCE).

STC = SCF + SCE


Les trois sommes de carrs prsentes plus haut sont calcules par les formules suivantes :
nj

STC Yij2
ji i 1

Tj2

j i

nj

SCF

T2
N

T2
N

SCE = STC - SCF


8.3.1.2. Tableau d'analyse de variance un seul facteur.
Il est d'usage de prsenter les rsultats d'une analyse de variance un seul facteur dans un
tableau comme celui-ci :
Analyse de variance un facteur
Source de
variation
Facteur

Somme des
carrs

Degrs de
libert

Moyenne des
carrs

SCF

J-1

MCF

F observ

MCF
MCE

152

Statistiques dcisionnelles

8. Tests sur les moyennes

Erreur
Totale

SCE
SCT

N-J
N-1

MCE

MCF
obit une loi de Fisher avec (J-1) et (N-J) degrs de
MCE
libert. On devra rejeter l'hypothse nulle de l'galit des moyennes Ho : 1 = 2 = ... = J
MCF
au seuil si et seulement si la valeur de
est plus grande que la valeur critique de la
MCE
table de Fisher au seuil et avec (J-1) et (N-J) degrs de libert.
Quand Ho est vraie, le rapport

8.3.2. ANOVA deux facteurs sans rptition.


Le but est de dcouvrir si deux facteurs A et B peuvent expliquer ou non les variations
constates dans les observations alatoires Yij.
Au dpart, l'analyste dispose d'chantillons prlevs alatoirement de populations normales
dans lesquelles les variances sont prsumes gales. Le tableau ci-dessous illustre la notation
indice. Ainsi, Y32 reprsente la valeur de l'observation prleve quand le premier facteur est
son troisime niveau (ou modalit) et que le second facteur est son deuxime niveau; par
ailleurs,

T2 et Y 2 dsignent le total et la moyenne des observations quand le premier

facteur est maintenu son deuxime niveau (l'indice sur lequel la sommation a t effectue est
remplac par un ).
Toutes les combinaisons possibles des modalits des facteurs donnent lieu IJ traitements.
A remarquer qu'il n'y a qu'une seule observation pour chaque traitement, c'est--dire une seule
valeur numrique dans chacune des cellules du tableau.
Matrice des donnes
Facteur B
Facteur A
1
2
3
...... etc...
I
Total
Moyenne

Total

Moyenne

Y11

Y12

Y1J

Y21

Y22

Y2J

T1
T2

Y1
Y2

Y32

YI1

YI2

YIJ

TI

YI

TJ
Y J

T1
Y1

T2
Y2

Tableau d'analyse de variance deux facteurs sans rptition :


153

Statistiques dcisionnelles

8. Tests sur les moyennes

Les rsultats d'une analyse de variance deux facteurs sans rptition se prsentent dans un
tableau comme celui-ci :
Analyse de variance deux facteurs sans rptition
Source de
variation
Facteur A
Facteur B
Erreur
Total

Somme des
carrs
SCFA
SCFB
SCE
STC

Degrs de
libert
I-1
J-1
(I-1)(J-1)
IJ-1

Moyenne des
carrs
MCFA
MCFB
MCE

F observ
MCFA / MCE
MCFB / MCE

Les diverses sommes des carrs et moyennes des carrs sont calcules l'aide des formules
suivantes :
I
J
T2
STC
Yij2
IJ
i 1 j1

Ti2 T 2

J
IJ
i 1
J
T2j T 2
SCFB

I
IJ
j1
I

SCFA

SCE STC SCFA SCFB


En se basant sur les rsultats prsents au tableau, on dduit que les tests sur le facteur A et sur
le facteur B s'effectuent exactement comme dans le cas de lanalyse de variance un facteur,
MCFA
MCFB
savoir au moyen des statistiques
et
.
MCE
MCE
8.3.3. ANOVA deux facteurs avec rptition.
Bien des recherches ont pour but d'tudier l'impact de plusieurs facteurs sur le rsultat d'une
exprience. Dans ce qui suit on tentera de dcouvrir si deux facteurs A et B peuvent expliquer
ou non les variations constates dans les observations Yijk.
On dispose de IJ chantillons de taille K (K>1) prlevs alatoirement de populations normales
dans lesquelles les variances sont prsumes gales. Le tableau suivant illustre la notation
indice: par exemple, Y324 renvoie la quatrime observation prleve quand le facteur A
est son troisime niveau (ou modalit) et que le facteur B est son deuxime niveau. Ainsi,
T2 reprsente le total des observations quand le premier facteur est maintenu son deuxime
niveau, alors que Y 3 dsigne la moyenne des observations quand le second facteur est
maintenu sa troisime modalit.
154

Statistiques dcisionnelles

8. Tests sur les moyennes

Toutes les combinaisons possibles des modalits des facteurs donnent lieu IJ traitements.
A remarquer enfin qu'il y a ici le mme nombre d'observations dans chacune des IJ cellules,
soit K, et cette valeur est suprieure l'unit.
Matrice des donnes
Facteur B
Facteur A

2
...

I
Total
Moyenne

Y111
Y112
...
Y11K
Y211
Y212
...
Y21K
...
YI11
YI12
...
YI1K

Y121
Y122
...
Y12K
Y221
Y222
...
Y22K
...
YI21
YI22
...
YI2K

...

T1
Y1

T2
Y2

...

...

Y1J1
Y1J2
...
Y1JK
Y2J1
Y2J2
...
Y2JK
...
YIJ1
YIJ2
...
YIJK

TJ
Y J

Total

Moyenne

T1

Y1

T2

Y2

...

...

TI

YI

Tableau d'analyse de variance deux facteurs avec rptitions :


Les rsultats d'une analyse de la variance deux facteurs avec rptitions sont habituellement
prsents dans un tableau comme celui-ci :
Analyse de variance deux facteurs avec rptitions
Source de
variation
Facteur A
Facteur B
Interaction
Erreur
Total

Somme des
carrs
SCFA
SCFB
SCI
SCE
STC

Degrs de
libert
I-1
J-1
(I-1)(J-1)
IJ(K-1)
IJK-1

155

Moyenne des
carrs
MCFA
MCFB
MCI
MCE

F observ
MCFA / MCE
MCFB / MCE
MCI / MCE

Statistiques dcisionnelles

8. Tests sur les moyennes

Les diverses sommes des carrs et moyennes des carrs sont calcules l'aide des formules
suivantes :

STC

i 1

j1

k 1

i 1

T2j

IK

T2
IJK

j1

SCI

i 1

j1

Tij2

i 1

T2
IJK

Ti2
T2

JK IJK

SCFA

SCFB

Yijk2

Ti2

JK

T2j

IK

j1

T2
IJK

SCE STC SCFA SCFB SCI


En se basant sur les rsultats prsents au tableau, on dduit que les tests sur la prsence
dinteraction, sur le facteur A et sur le facteur B s'effectuent exactement comme dans le cas de
lanalyse de variance un facteur, savoir au moyen des statistiques :
MCI
MCFA
MCFB
;
et
MCE
MCE
MCE
L'analyse de variance doit vrifier en premier lieu si l'interaction entre les deux facteurs est
importante; si la rponse est ngative, on pourra considrer ensuite les deux autres tests
disponibles dans le tableau de l'analyse de la variance.
La prsence dinteraction entre les deux facteurs signifie que les rsultats sous les niveaux d'un
facteur se comportent diffremment selon les diffrents niveaux de l'autre facteur.
8.4. ENONCES DES EXERCICES DAPPLICATION.
8.4.1. Le diamtre des billes fabriques par une machine est en moyenne de 6 mm. Pour
contrler si la machine est bien rgle, on a prlev un chantillon de 50 billes et on a mesur
leur diamtre. On a trouv :

x 2462

350

a) La machine est-elle bien rgle au seuil de signification de 95 % ?


b) La machine est-elle bien rgle au seuil de signification de 99 % ?
156

Statistiques dcisionnelles

8. Tests sur les moyennes

8.4.2. Pour savoir sil existe une diffrence dassiduit entre les filles et les garons, on a choisi
de manire alatoire et simple un premier chantillon de 10 filles et de faon indpendante, un
deuxime chantillon de 10 garons. En fonction des rsultats ci-dessous relatifs aux notes
dassiduits (note sur 100), et en supposant que les variances des deux populations sont gales,
peut-on conclure, au seuil de 5 %, lexistence dune diffrence significative entre les deux
sexes ?
Assiduit des filles
Assiduit des garons

72
66

67
59

52
54

54
57

46
63

58
55

59
61

54
55

58
66

63
75

8.4.3. Un chef de produit souhaite tester leffet dune formation sur les techniques de ventes sur
les ventes dun produit. Un chantillon alatoire de 10 commerciaux ayant reu la formation
est constitu. Les ventes ralises par les dix commerciaux avant et aprs formation sont
indiques dans le tableau ci-dessous.
a) Peut-on parler dun effet positif de la formation au seuil de 5% ?
b) Peut-on parler dun effet positif de la formation au seuil de 1 % ?
N commercial Aprs formation Avant formation
1
4580
3970
2
5190
4880
3
3940
4090
4
6320
5870
5
7680
6930
6
3480
4000
7
5720
5080
8
7040
6950
9
5270
4960
10
5840
5130
8.4.4. Un investisseur tranger songe implanter une nouvelle usine au Maroc. Il hsite entre
trois villes : Settat, Casablanca et Eljadida. Selon son point de vue, le critre le plus important
prendre en considration pour dterminer l'emplacement de cette nouvelle usine est l'assiduit
au travail des ouvriers. Linvestisseur a visit au hasard dans chacune des villes considres
cinq grandes usines de fabrication et il a obtenu des administrateurs le taux d'absentisme par
3500 journes de travail. Les rsultats sont reproduits dans le tableau ci-dessous.
Donnes numriques
Ville
Echantillon
Settat
141; 127 ; 111; 124 ; 144
Casablanca
157; 131; 105; 132 ; 163
Eljadida
183; 161; 145 ; 157 ; 189
Aux seuils de 5 %, puis de 1 % peut-on conclure que le taux d'absentisme au travail est le
mme en moyenne dans ces 3 villes?
157

Statistiques dcisionnelles

8. Tests sur les moyennes

8.4.5. On a mis au point quatre techniques diffrentes, T1, T2, T3, et T4 pour la promotion
dun produit. On a alors dcid de toutes les essayer et d'utiliser les oprateurs qualifis pour
comparer les dites techniques. On s'attend ce qu'il y ait des diffrences importantes entre
oprateurs et peut-tre aussi entre techniques. 5 oprateurs ont t assigns aux 4 techniques.
Voici les nombres dunits vendues enregistres lors de ces tests.
Donnes numriques
Oprateurs \ Techniques
O1
O2
O3
O4
O5

T1
42
39
38
43
44

T2
45
41
39
45
45

T3
55
52
48
54
56

T4
50
46
42
48
49

Y a-t-il des diffrences significatives au niveau 5% entre les cinq oprateurs d'une part et entre
les quatre techniques d'autre part quant au nombre moyen dunits vendues ?
8.4.6. On a demand 24 ouvriers de prdire le nombre dheures ncessaires pour
lassemblage dune machine. Les ouvriers ont t classifis selon leur type dexprience et leur
nombre dannes dexprience. Quand le projet fut termin, tous sans exception avaient sousestim le temps effectivement requis pour accomplir cette tche. Dans le tableau qui suit, on a
ces erreurs de prvision (en heures).
Donnes numriques

TYPE DEXPERIENCE
Dans une grande entreprise

NOMBRE DANNEES DEXPERIENCE


Moins de Entre 2 et Plus de
Total
2 ans
5 ans
5 ans
25
12
10
167
22
10
9
18
14
11
20
8
8

Dans une petite entreprise

30
38
45
44

20
28
29
28

14
15
26
24

341

Total

242

149

117

508

Que ce soit sous l'angle Type d'exprience ou Nombre d'annes d'exprience, existe-t-il
globalement des diffrences significatives entre les groupes (seuil 5%)?

158

Statistiques dcisionnelles

8. Tests sur les moyennes

8.4.7. Un fabricant de tubes essais pour laboratoire fonde sa publicit sur le fait que la dure
de vie de ses tubes correspond 1500 heures de chauffage laide d'un bec Bunzen. Un
laboratoire de contrle de publicit constate que sur 100 tubes essais, la dure moyenne de
vie est de 1485 heures de chauffage avec un cart-type de 110 heures. Aux risques 5%, puis de
10 %, la dure de vie des tubes essais est-elle diffrente de 1500 heures de chauffage ?
8.4.8. Les moteurs des appareils lectromnagers d'une marque M ont une dure de vie
moyenne de 3000 heures avec un cart-type de 150 heures. la suite d'une modification dans
la fabrication des moteurs, le fabriquant affirme que les nouveaux moteurs ont une dure de vie
suprieure celle des anciens. On a test un chantillon de 50 nouveaux moteurs et on a trouv
une dure de vie moyenne de 3250 heures avec un cart-type gal 150 heures. Les nouveaux
moteurs apportent-ils une amlioration dans la dure de vie des appareils lectromnagers au
risque de 1% ?
8.4.9. Dans une grande ville d'un pays donn, une enqute a t ralise sur les dpenses
mensuelles pour les loisirs. On a observ les rsultats suivants :
Sur 280 familles habitant le centre-ville, les dpenses mensuelles pour les loisirs sont en
moyenne de 640 dh avec un cart-type de 120 dh.
Sur 300 familles habitant la banlieue, les dpenses mensuelles pour les loisirs sont en
moyenne de 610 dh avec un cart-type de 100 dh. En supposant que les variances des deux
populations sont ingales, peut-on dire, aux risques de 5 % puis de 1 pour 1000 que la part du
budget familial consacr aux loisirs est diffrente suivant que la famille habite le centre-ville
ou la banlieue ?
8.4.10. On prlve dans la production d'une machine, un chantillon de 100 tiges mtalliques.
La moyenne des longueurs des tiges de cet chantillon est 100,04 cm avec un cart-type de
0,16 cm. La machine est rgle en principe pour obtenir des tiges de 100 cm.
1) Au risque de 5 %, peut-on dire que la machine est bien rgle ?
2) Reprendre la question prcdente avec un risque de 1 %.
8.4.11. Un spcialiste en marketing a fait modifier la mthode traditionnellement utilise pour
effectuer la promotion d'un certain produit. A titre exprimental, il a observ dans 10 points de
vente le nombre dunits vendues en une semaine en utilisant la mthode existante. La semaine
daprs, les mmes points de vente ont utilis la nouvelle mthode de promotion, on a observ
le nombre dunits vendues en cette semaine. Les donnes recueillies sont comme suit :
Ancienne mthode: 48, 46, 47, 43, 46, 45, 49, 46, 47, 44.
Nouvelle mthode: 56, 49, 53, 51, 48, 52, 55, 53, 49, 50.
La nouvelle mthode de promotion a-t-elle un effet positif sur les ventes ( = 5%)?

159

Statistiques dcisionnelles

8. Tests sur les moyennes

8.4.12. Dans le but de contrler le poids net des sachets d'un produit alimentaire, on a prlev
deux chantillons respectivement de 10 et 12 sachets, on a obtenu les rsultats suivant (en
grammes) :
1
2

190
210

200
204

202
203

195
189

194
194

208
195

205
206

196
205

198
200

206
201

198

197

En supposant que les variances des deux populations sont gales, ces deux rsultats sont-ils
significativement diffrents en ce qui concerne le poids moyen au seuil de 5 %.
8.4.13. 24 ttes dovin ont reu 6 alimentations diffrentes pour constituer 4 rptitions et on a
enregistr les gains moyens quotidiens en poids suivants :
Alim. 1
590
760
700
640

Alim. 2
460
430
540
470

Alim. 3
600
460
610
510

Alim. 4
640
660
720
580

Alim. 5
690
600
550
480

Alim. 6
690
650
680
740

Aux seuils de 5 %, puis de 1 pour 1000, existe-t-il une diffrence significative quant leffet
des diffrentes alimentations sur le gain moyen quotidien en poids des ovins ?
8.4.14. L'exprience suivante avait pour but d'analyser l'impact des 2 facteurs Sexe et ge sur
la consommation d'un certain produit de luxe. Dans chacun des 6 groupes, le produit a t
offert 100 personnes choisies au hasard. La consommation, en nombre dunits achetes, est
donne dans le tableau qui suit :
Sexe
Fminin
Masculin
Total

Moins de 20 ans
27
32
59

Catgorie d'ge
Entre 20 et 45 ans
39
45
84

Plus de 45 ans
54
62
116

On suppose que les nombres dunits achetes obissent des lois normales, que les variances
sont gales dans ces six populations.
Quant au nombre dunits achetes en moyenne, peut-on affirmer au niveau 5% qu'il y a une
diffrence significative entre hommes et femmes d'une part, et entre les trois groupes d'ge,
d'autre part?

160

Statistiques dcisionnelles

8. Tests sur les moyennes

8.4.15. Une machine fabrique des pices identiques. La moyenne des poids de 50 pices
prleves dans la production est 68,2 grammes avec un cart-type de 2,5 grammes. On effectue
un rglage sur la machine. On prlve un nouvel chantillon de 50 pices. On trouve un poids
moyen de 67, 5 grammes avec un cart-type de 2, 8 grammes. En supposant que les variances
des deux populations sont gales, peut-on affirmer, au risque 5 % que le rglage a modifi le
poids des pices ?
8.4.16. Les ventes quotidiennes d'ordinateurs ralises par une socit informatique durant les
3 premiers mois de 2003, du lundi au jeudi sont comme suit :

Lundi

Mardi

Mercredi

Jeudi

Janvier 2003 Fvrier 2003 Mars 2003


13
9
7
9
5
15
8
8
14
7
12
10
8
11
17
6
4
14
6
9
12
7
5
13
6
10
6
10
2
14
7
8
12
4
3
13
1
6
10
10
10
8
7
12
4
5
9
9

En supposant les conditions de lanalyse de la variance satisfaites, peut-on dire quil y a une
diffrence significative un seuil de 5% entre les moyennes des ventes ralises chaque mois
et entre les moyennes des ventes ralises chaque jour ?
8.5. SOLUTIONS DES EXERCICES DAPPLICATION.
8.5.1. Solution de lexercice 8.4.1.
Pour rpondre cette question, on doit vrifier si le diamtre moyen des 50 billes observes,
est conforme la norme de 6 mm. Il sagit donc de faire un test de conformit de la moyenne.
Hypothse nulle :
Il sagit dun test bilatral H0

m=6

H1 : m 6

161

Statistiques dcisionnelles

8. Tests sur les moyennes

Variable de dcision :
La variable de dcision du test correspond lestimation de m qui est la moyenne de
lchantillon :
x i 350

7
VD =
50
50

La variable de dcision peut tre considre comme une variable approximativement normale.
La variance de la population peut tre estime par la quasi-variance.

(x

^

x )

n
50 2462
(
7) = 0,24
=
n 1
49 50

n 1
^

0,24 = 0,49

VDR =

x m0
^

76
= 14,43
0.49
50

n
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ;
2

].

a) Au seuil de signification de 95 % ( = 0,05), les valeurs critiques qui dlimitent la rgion


dacceptation sont :
Z = Z0,025 = -1,96
2

= Z0,975 = 1,96

La rgion dacceptation est donc lintervalle [-1,96 ; 1,96].


On rejette lhypothse nulle car la variable de dcision rduite nappartient pas la rgion
dacceptation. La machine nest donc pas bien rgle au seuil de signification de 95 %
b) Au seuil de signification de 99 % ( = 0,01), la rgion dacceptation est :
[Z0,005 ; Z0,995] = [- 2,58 ; 2,58]
On regrette lhypothse nulle. La machine nest donc pas bien rgle au seuil de signification
de 99 %.
162

Statistiques dcisionnelles

8. Tests sur les moyennes

8.5.2. Solution de lexercice 8.4.2.


Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si lassiduit moyenne m1 des filles est ou nest pas gale
lassiduit moyenne m2 des garons.
Il sagit dun test bilatral :
H0 : m1 = m2

H1 : m1 m2

et

Variable de dcision :
Les deux chantillons sont indpendants, les populations sont de variances gales, la variable
de dcision centre rduite est donc:

VDR =

(x 1 x 2 )

(x

x 1 )

(x

x 2 ) 1
1
( )
n1 n 2 2
n1 n 2
i

Reprenons les donnes et calculons les caractristiques pour chaque chantillon.


Assiduit des filles
Assiduit des garons

72
66

67
59

52
54

54
57

46
63

58
55

x 2 = 61,1

x 1 = 58,3

54
55

(x

59
61

(x

x 1 ) = 514,1

VDR =

58,3 61,1
514,1 390,9 1
1
( )
10 10 2 10 10

Rgion dacceptation :

VDR = 0,88

163

x 2 ) = 390,9

= - 0,88

58
66

63
75

Statistiques dcisionnelles

8. Tests sur les moyennes

Comme lchantillon ne comporte que les personnes (< 30), on peut valablement dire que la loi
de probabilit suivie par la VDR est une loi de STUDENT de 18 (n1 + n2 2) degrs de libert.
Pour = 0,05, la valeur de

avec 18 degrs de libert est :


t0,975 = 2,101

VDR < t

, on accepte donc lhypothse nulle. Cest--dire, il ny a pas de diffrence

significative entre lassiduit des deux sexes.


8.5.3. Solution de lexercice 8.4.3.
Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si, en moyenne, les ventes enregistres aprs formation m1 sont ou
ne sont pas gales aux ventes enregistres avant formation m2.
Il sagit dun test unilatral droite :
H0 : m1 = m2

et

H1 : m1 > m2

Variable de dcision :
Les deux chantillons sont associs par paires, la variable de dcision centre rduite est donc:

VDR =

d
^

d
n
Reprenons les donnes et calculons les diffrences di
N commercial Aprs formation Avant formation Diffrence (di)
1
4580
3970
610
2
5190
4880
310
3
3940
4090
-150
4
6320
5870
450
5
7680
6930
750
6
3480
4000
-520
7
5720
5080
640
164

Statistiques dcisionnelles

8. Tests sur les moyennes

8
9
10

7040
5270
5840

6950
4960
5130

90
310
710

VDR =

d
^

320
= 2,462
410,96
10

n
Rgion dacceptation :

VDR = 2,462
Comme lchantillon ne comporte que les personnes (< 30), on peut valablement dire que la loi
de probabilit suivie par la VDR est une loi de STUDENT de 9 (n-1) degrs de libert.
a) Pour = 0,05, la valeur de t1- avec 9 degrs de libert est :
t0,95 = 1,833
VDR > t1-, on rejette donc lhypothse nulle. Cest dire, on peut conclure que la formation
a eu un effet positif sur les ventes.
b) Pour = 0,01, la valeur de T1 - avec 9 degrs de libert est :
t0,99 = 2,82
VDR t 1 , on accepte donc lhypothse nulle, cest--dire, on peut conclure que la
formation na pas eu un effet positif sur les ventes.
8.5.4. Solution de lexercice 8.4.4.
Pour rpondre cette question, il faut comparer le taux dabsentisme moyen dans les trois
villes. Il sagit de tester l'galit de plusieurs moyennes, cest une analyse de variance un
facteur (ANOVA1).
Formulation de lhypothse nulle :
Il sagit de tester globalement lhypothse de l'galit des moyennes des 3 populations
supposes normales dans lesquelles on suppose que les variances sont gales 12 22 32 .
Ho: m1 = m2 = m3
H1: au moins une des moyennes est diffrente des autres.
Tableau d'analyse de variance :
Reprenons les donnes et calculons les trois sommes des carrs:

165

Statistiques dcisionnelles

8. Tests sur les moyennes

Ville
Settat
Casablanca
Eljadida
J=3

STC

nj

2
ij

ji i 1

SCF

Tj2

n
j i

Echantillon
141; 127 ; 111; 124 ; 144
157; 131; 105; 132 ; 163
183; 161; 145 ; 157 ; 189
N = 15

Total
T1 = 647
T2 = 688
T3 = 835
T = 2170

T
2170
141 127 ... 189
8149,33
N
15

T
647 688 835
2170

3908,93
N
5
5
5
15

SCE = 8149,33 - 3908,93 = 4240,40


Ce qui permet la construction du tableau de l'analyse de variance.
Tableau danalyse de variance un facteur
Source de
variation
Ville
Erreur
Total

Somme des carrs


3908,93
4240,40
8149,33

Degrs de
libert
2
12
14

Moyenne des carrs F obs


1954,467
353,367

5,53

A un seuil = 5%, on ne peut pas conclure que l'assiduit des travailleurs leur travail soit
la mme en moyenne dans ces 3 villes puisque la valeur observe 5,53 de F est suprieure la
valeur critique F 0,95 2 et 12 dl = 3,89 obtenue de la distribution de Fisher 2 et 12
degrs de libert.
A un seuil de 1 % ( = 0,01), on peut conclure que lassiduit des travailleurs leur travail est
la mme en moyenne dans ces 3 villes puisque la valeur observe 5,53 de F est infrieure la
valeur critique F0,99 2 et 12 dl = 6,93.
8.5.5. Solution de lexercice 8.4.5.
Pour rpondre cette question, il faut comparer les nombres dunits vendues en moyenne par
les 5 oprateurs assigns aux 4 techniques, soit 20 combinaisons. Il sagit de tester l'galit de
plusieurs moyennes, cest une analyse de variance deux facteurs (ANOVA2) sans interaction.
Formulation de lhypothse nulle :
Il sagit de tester globalement l'galit des moyennes des 20 populations supposes normales
dans lesquelles on suppose que les variances sont gales.
Ho: m1 = m2 = m3 = m20
166

Statistiques dcisionnelles

8. Tests sur les moyennes

H1: au moins une des moyennes est diffrente des autres.


Tableau d'analyse de variance :
Reprenons les donnes et calculons les quatre sommes des carrs :
Oprateurs \ Techniques
O1
O2
O3
O4
O5
Total

STC

i 1

j1

2
ij

SCFA

i 1

SCFB

T2
45
41
39
45
45
215

T3
55
52
48
54
56
265

T4
50
46
42
48
49
235

Total
192
178
167
190
194
921

T
921
42 45 ... 49
548,95
IJ
20

Ti2
T
192 ... 194
921

131,20
J
IJ
4
20

T2j

j1

T1
42
39
38
43
44
206

T
206 ... 235
921

410,15
IJ
5
20

SCE = 548,95 - 131,20 - 410,15 = 7,60


Ce qui permet la construction du tableau de l'analyse de variance ci-dessous.
Analyse de variance deux facteurs sans rptition
Source de
variation
Oprateurs
Techniques
Erreur
Total

Somme des
carrs
131,2
410,15
7,6
548,95

D.L.
4
3
12
19

Moyenne des
carrs
32,8
136,72
0,63

F
51,79
215,87

En examinant les valeurs F observes 51,79 et 215,87 qui sont toutes deux suprieures aux
valeurs thoriques F 0,95 4 et 12 dl = 3,26 et F 0,95 3 et 12 dl = 3,49 on peut rejeter les
deux hypothses nulles et conclure qu'il y a d'une part, des diffrences significatives entre les
cinq oprateurs quant au nombre dunits vendues et d'autre part, des diffrences significatives
entre les quatre techniques de vente.

167

Statistiques dcisionnelles

8. Tests sur les moyennes

8.5.6. Solution de lexercice 8.4.6.


Pour rpondre cette question, il faut comparer les erreurs de prvision (en heures) moyennes
pour les 6 groupes douvriers. Il sagit de tester l'galit de plusieurs moyennes, cest une
analyse de variance deux facteurs (ANOVA2) avec interaction.
Formulation de lhypothse nulle :
Il sagit de tester globalement l'galit des moyennes des 6 populations supposes normales
dans lesquelles on suppose que les variances sont gales.
Ho: m1 = m2 = m3 = m6
H1: au moins une des moyennes est diffrente des autres.
Tableau d'analyse de variance :
Reprenons les donnes et calculons les cinq sommes des carrs :
NOMBRE DANNEES DEXPERIENCE
TYPE DEXPERIENCE
Moins de Entre 2 et Plus de
Total
2 ans
5 ans
5 ans
Dans une grande entreprise
25
12
10
167
22
10
9
18
14
11
20
8
8
Dans une petite entreprise
30
20
14
341
38
28
15
45
29
26
44
28
24
Total
242
149
117
508

I J K
T
508
STC Y 2
25 22 ... 24
2737,33
24
i1 j1 k 1 ijk IJK
SCFA

i 1

Ti2
T
167 341
508

1261,50
JK
IJK
12
24

2
J T j
T
242 149 117 508
SCF

1054,08
B
8
8
8
24
j1 IK IJK
XI

1 j 1

Tj
K

T2

JK

T2j

IK
j 1

T2
IJK
168

Statistiques dcisionnelles

8. Tests sur les moyennes

85 2 79 2 167 2 3412 242 2 149 2 117 2

4
12
8
2
508

61,75
24

SCI

SCE 2737,33 1261,50 1054,08 61,75 360


Analyse de variance deux facteurs avec rptitions
Source de variation
Type d'exprience
Nombre d'annes
d'exprience
Interaction
Erreur
Total

Somme des
carrs
1261,5
1054,08
61,75
360
2737,33

D.L.
1
2
2
18
23

Moyenne des
carrs
1261,5
527,04
30,875
20

F
63,075
26,35
1,54

En examinant en tout premier lieu le test sur linteraction, on peut vrifier que la valeur FI =
1,54 est infrieure la valeur critique de la table, soit F 0,95 2 et 18 dl = 3,55. On doit
conclure qu'il n'y a pas d'interaction significative entre les deux facteurs Type d'exprience et
Nombre d'annes d'exprience.
Cette constatation justifie la poursuite de l'analyse de la variance. Comme les valeurs FA=
63,075 et FB =26,35 sont suprieures respectivement aux valeurs critiques de la table F 0,95 1
et 18 dl = 4,41 et F 0,95 2 et 18 dl = 3,55, on doit conclure qu'aussi bien sous l'angle Type
d'exprience que Nombre d'annes d'exprience, il existe globalement des diffrences
significatives entre les groupes.
8.5.7. Solution de lexercice 8.4.7.
Pour rpondre cette question, on doit vrifier si la dure de vie moyenne des 100 tubes
essais observs, est conforme la norme de 1500 heures de chauffage. Il sagit donc de faire un
test de conformit de la moyenne.
Hypothse nulle :
Il sagit dun test unilatral gauche :
H0

m = 1500

H1 : m < 1 500

169

Statistiques dcisionnelles

8. Tests sur les moyennes

Variable de dcision :
La variable de dcision du test correspond lestimation de m qui est la moyenne de
lchantillon :
VD = 1485
La variable de dcision peut tre considre comme une variable approximativement normale.
La variance de la population peut tre estime par la quasi-variance.

(x

^

x )

n 1

n 100
=
. 110 = 12222,22
n 1 99

12222,22 = 110,55

VDR =

x m 0
^

1485 1500
= - 1,36
110,55

100

n
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.

Au seuil de signification de 95 % ( = 0,05), la valeur critique qui dlimite la rgion


dacceptation est :
Z0,05 = -1,64
La rgion dacceptation est donc lintervalle [-1,64 ; +[.
On accepte lhypothse nulle car la variable de dcision rduite appartient la rgion
dacceptation. Au risque 5%, la dure de vie des tubes essais nest pas diffrente de 1500
heures de chauffage.
Au seuil de 10 %, la rgion dacceptation est :
[Z0,1 ; + ] = [- 1,28 ; + ]
On rejette lhypothse nulle car VDR nappartient pas la rgion dacceptation. Au risque de
10 %, la dure de vie des tubes essai est infrieure 1500 heures de chauffage.
170

Statistiques dcisionnelles

8. Tests sur les moyennes

8.5.8. Solution de lexercice 8.4.8.


Pour rpondre cette question, on doit vrifier si la dure de vie moyenne des 50 nouveaux
moteurs est conforme la norme de 3000 heures. Il sagit donc de faire un test de conformit
de la moyenne.
Hypothse nulle :
Il sagit dun test unilatral droite :
H0

m = 3000

H1 : m > 3000

Variable de dcision :
La variable de dcision du test correspond lestimation de m qui est la moyenne de
lchantillon :
VD = 3250
La variable de dcision peut tre considre comme une variable approximativement normale.
La variance de la population peut tre estime par la quasi-variance.

(x

^

x )

n 1

n 50
=
. 150 = 22959,18
n 1 49

22959,18 = 151,52

VDR =

x m0
^

3250 3000
= 11,67
151,52
50

n
Rgion dacceptation :
La rgion dacceptation est lintervalle ]- ;

Z1 ].

Au seuil de signification de 99 % ( = 0,01), la valeur critique qui dlimite la rgion


dacceptation est :
Z0,99 = 2,33
171

Statistiques dcisionnelles

8. Tests sur les moyennes

La rgion dacceptation est donc lintervalle ]- ; 2,33].


On rejette lhypothse nulle car la variable de dcision rduite nappartient pas la rgion
dacceptation. Au risque 1%, les nouveaux moteurs apportent une amlioration dans la dure
de vie des appareils lectromnagers.
8.5.9. Solution de lexercice 8.4.9.
Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si la part du budget familial consacr aux loisirs est diffrente
suivant que la famille habite le centre-ville ou la banlieue.
Il sagit dun test bilatral :
H0 : m1 = m2

et

H1 : m1 m2

Variable de dcision :
Les deux chantillons sont indpendants, les populations sont de variances ingales, la variable
de dcision centre rduite est donc:

VDR =

(x 1 x 2 )
1 2

n1
n2

avec

x 1 = 640

x 2 = 610

Les variances des deux populations sont estimes par les quasi-variances.

n1 280
=
. 120 = 14451,61
n 1 279
^
n2 300
2 =
=
. 100 = 10033,44
n 1 299
640 610
VDR =
= 3,25
14451,61 10033,44

280
300
^

1 =

172

Statistiques dcisionnelles

8. Tests sur les moyennes

Rgion dacceptation :

VDR = 3,25
Pour = 0,05, la valeur de

est :
Z0,975 = 1,96

VDR > Z

, on rejette donc lhypothse nulle. Cest--dire, au risque de 5 %, la part du

budget familial consacre aux loisirs est diffrente suivant que la famille habite le centre-ville
ou la banlieue.
Pour = 0,001, la valeur de

est :
Z0,9995 = 3,29

VDR Z

, on accepte donc lhypothse nulle, c'est--dire, au risque de 1 %, la part du

budget familial consacr aux loisirs est le mme pour les 2 milieux.
8.5.10. Solution de lexercice 8.4.10.
Pour rpondre cette question, on doit vrifier si la longueur moyenne des 100 tiges
mtalliques est conforme la norme de 100 cm. Il sagit donc de faire un test de conformit de
la moyenne.
Hypothse nulle :
Il sagit dun test bilatral :
H0

m = 100 H1 : m 100

Variable de dcision :
La variable de dcision du test correspond lestimation de m qui est la moyenne de
lchantillon :
VD = 100,04
La variable de dcision peut tre considre comme une variable approximativement normale.
La variance de la population peut tre estime par la quasi-variance.

173

Statistiques dcisionnelles

8. Tests sur les moyennes

(x

^

x )

n 1

n 100
=
. 0,16 = 0,026
n 1 99

0,026 = 0,1608

VDR =

x m0
^

100,04 100
= 2,49
0,1608
100

n
Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ;
2

].

1) Au seuil de signification de 95 % ( = 0,05), les valeurs critiques qui dlimitent la rgion


dacceptation sont :

Z = Z0,025 = -1,96 et Z
2

= Z0,975 = 1,96

La rgion dacceptation est donc lintervalle [-1,96 ; 1,96].


On rejette lhypothse nulle car la variable de dcision rduite nappartient pas la rgion
dacceptation. La machine nest donc pas bien rgle au seuil de signification de 95 %.
2) Au seuil de signification de 99 % ( = 0,01), les valeurs critiques qui dlimitent la rgion
dacceptation sont :

Z = Z0,005 = -2,58 et Z
2

= Z0,995 = 2,58

La rgion dacceptation est donc lintervalle [-2,58 ; 2,58].


On accepte lhypothse nulle car la variable de dcision rduite appartient la rgion
dacceptation. La machine est donc bien rgle au seuil de signification de 99 %.

174

Statistiques dcisionnelles

8. Tests sur les moyennes

8.5.11. Solution de lexercice 8.4.11.


Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si, en moyenne, les ventes enregistres avec la nouvelle mthode
de promotion m1 sont ou ne sont pas suprieures aux ventes enregistres avec lancienne
mthode de promotion m2.
Il sagit dun test unilatral droite :
H0 : m1 = m2

et

H1 : m1 > m2

Variable de dcision :
Les deux chantillons sont associs par paires, la variable de dcision centre rduite est donc:

VDR =

d
^

d
n

Reprenons les donnes et calculons les diffrences di.


Point de vente Nouvelle mthode Ancienne mthode Diffrence (di)
1
56
48
8
2
49
46
3
3
53
47
6
4
51
43
8
5
48
46
2
6
52
45
7
7
55
49
6
8
53
46
7
9
49
47
2
10
50
44
6

VDR =

d
^

5,5
= 7,49
2,3214
10

n
175

Statistiques dcisionnelles

8. Tests sur les moyennes

Rgion dacceptation :

VDR = 7,49
Pour = 0,05, la valeur de t1- avec 9 degrs de libert est :
t0,95 = 1,833

VDR > t1-, on rejette donc lhypothse nulle. Cest--dire, on peut conclure que la nouvelle
mthode de promotion a un effet positif sur les ventes.
8.5.12. Solution de lexercice 8.4.12.
Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si le poids moyen net des sachets m1 du premier chantillon est ou
nest pas gale au poids moyen net des sachets m2 du deuxime chantillon.
Il sagit dun test bilatral :
H0 : m1 = m2

et

H1 : m1 m2

Variable de dcision :
Les deux chantillons sont indpendants, les populations sont de variances gales, la variable
de dcision centre rduite est donc:

VDR =

(x 1 x 2 )

(x

x 1 )

(x

x 2 ) 1
1
( )
n1 n 2 2
n1 n 2
i

Reprenons les donnes et calculons les caractristiques pour chaque chantillon.


1
2

190
210

200
204

202
203

195
189

194
194

208
195

205
206

206
201

x 2 = 200,1667

198
200

x 1 = 199,4

(x

196
205

(x

x 1 ) = 306,4
176

x 2 ) = 381,6667

198

197

Statistiques dcisionnelles

8. Tests sur les moyennes

VDR =

199,4 200,1667
306,4 381,6667 1
1
( )
10 12 2
10 12

= - 0,31

Rgion dacceptation :

VDR = 0,31
Pour = 0,05, la valeur de

avec 20 degrs de libert est :


t0,975 = 2,09

VDR < t

, on accepte donc lhypothse nulle. Cest--dire, ces deux rsultats ne sont pas

significativement diffrents en ce qui concerne le poids moyen au seuil de 5 %


8.5.13. Solution de lexercice 8.4.13.
Pour rpondre cette question, il faut comparer les gains moyens quotidiens en poids des 6
alimentations. Il sagit de tester l'galit de plusieurs moyennes, cest une analyse de variance
un facteur (ANOVA1).
Formulation de lhypothse nulle :
Il sagit de tester globalement l'galit des moyennes des 6 populations supposes normales
dans lesquelles on suppose que les variances sont gales.
Ho: m1 = m2 = m3 = m4 = m5 = m6
H1: au moins une des moyennes est diffrente des autres.
Tableau d'analyse de variance :
Reprenons les donnes et calculons les trois sommes des carrs :
Alim. 1
Alim. 2
Alim. 3
Alim. 4
Alim. 5
590
460
600
640
690
760
430
460
660
600
700
540
610
720
550
640
470
510
580
480
Total
2690
1900
2180
2600
2320

STC

2
ij

j i

SCF

nj

Y
J

i 1

T j2

n
j i

Alim. 6
690
650
680
740
2760

T
14450
590 760 ... 740
215595,83
N
24

T
2690 1900
2760
14450

...

139520,83
N
4
4
4
24
177

14450

Statistiques dcisionnelles

8. Tests sur les moyennes

SCE = 215595,83 - 139520,83 = 76075


Ce qui permet la construction du tableau de l'analyse de variance.
Tableau danalyse de variance un facteur
Source de
variation
Alimentation
Erreur
Totale

Somme des
carrs
139520,83
76075
215595,83

Degrs de
libert
5
18
23

Moyenne des
carrs
27904,17
4226,39

F obs
6,6

A un seuil = 5%, on ne peut pas conclure que le gains quotidiens en poids soit le mme en
moyenne pour les 6 alimentations puisque la valeur observe 6,6 de F est suprieure la
valeur critique F 0,95 5 et 18 dl = 2,77 obtenue de la distribution de Fisher 5 et 18
degrs de libert.
Au seuil = 0,001, on peut conclure que les gains quotidiens en poids est le mme en
moyenne pour les 6 alimentations puisque la valeur observe 6,6 de F est infrieure la valeur
critique F0,999 5 et 18 dl = 6,8.
8.5.14. Solution de lexercice 8.4.14.
Pour rpondre cette question, il faut comparer la consommation moyenne du produit de luxe
dans chacun des 6 groupes. Il sagit de tester l'galit de plusieurs moyennes, cest une analyse
de variance deux facteurs (ANOVA2) sans interaction.
Formulation de lhypothse nulle :
Il sagit de tester globalement l'galit des moyennes des 6 populations supposes normales
dans lesquelles on suppose que les variances sont gales.
Ho: m1 = m2 = m3 = m4 = m5 = m6
H1: au moins une des moyennes est diffrente des autres.
Tableau d'analyse de variance :
Reprenons les donnes et calculons les quatre sommes des carrs:

Sexe
Fminin
Masculin
Total

Moins de
20 ans
27
32
59

Catgorie d'ge
Entre 20 et
45 ans
39
45
84
178

Plus de 45 ans
54
62
116

Total
120
139
259

Statistiques dcisionnelles

STC

8. Tests sur les moyennes

i 1

j1

2
ij

SCFA

i 1

SCFB

Ti2
T
120 139
259

60,17
J
IJ
3
6

T2j

j1

T
259
27 39 ... 62
878,83
IJ
6

T
59 84 116
259

816,33
IJ
2
6

SCE = 878,83 - 60,17 - 816,33 = 2,33


Ce qui permet la construction du tableau de l'analyse de variance ci-dessous.
Analyse de variance deux facteurs sans rptition
Source de
variation
Sexe
Age
Erreur
Total

Somme des
carrs
60,17
816,33
2,33
878,83

D.L.
1
2
2
5

Moyenne des
carrs
60,17
408,17
1,17

F
51,43
348,86

En examinant les valeurs F observes 51,43 et 348,86 qui sont toutes deux suprieures aux
valeurs thoriques F 0,95 1 et 2 dl = 18,51 et F 0,95 2 et 2 dl = 19 on peut rejeter les deux
hypothses nulles et conclure qu'il y a d'une part, des diffrences significatives entre les deux
sexes quant la consommation du produit de luxe et d'autre part, des diffrences significatives
entre les trois catgories dge.
8.5.15. Solution de lexercice 8.4.15.

Pour rpondre cette question, on doit raliser un test de comparaison de deux moyennes.
Hypothse nulle :
Ce test a pour but de vrifier si le poids moyen des pices m1 avant le rglage est ou nest pas
infrieur au poids moyen des pices m2 aprs le rglage.
Il sagit dun test bilatral :
H0 : m1 = m2

et
179

H1 : m1 m2

Statistiques dcisionnelles

8. Tests sur les moyennes

Variable de dcision :
Les deux chantillons sont indpendants, les populations sont de variances gales, la variable
de dcision centre rduite est donc :

(x1 x 2 )

VDR =

(x i x 1 ) (x i x 2 ) ( 1 1 )
n1 n 2 2
n1 n 2

x1 = 68,2

x 2 = 67,5

(x x ) = 2,5 . 50 = 312,5
(x x ) = 2,8 . 50 = 392
1

VDR =

68,2 67,5

312,5 392 1
1
( )
50 50 2 50 50

= 1,3

Rgion dacceptation :

VDR = 1,3
Pour = 0,05, la valeur de

VDR < Z

est : Z0,975 = 1,96

, on accepte donc lhypothse nulle. Cest--dire, on peut affirmer, au risque 5

% que le rglage na pas modifi le poids des pices.


8.5.16. Solution de lexercice 8.4.16.
Pour rpondre cette question, il faut comparer Les ventes quotidiennes moyennes
d'ordinateurs des 12 combinaisons jour/mois. Il sagit de tester l'galit de plusieurs moyennes,
cest une analyse de variance deux facteurs (ANOVA2) avec interaction.
Formulation de lhypothse nulle :
Il sagit de tester globalement l'galit des moyennes des 12 populations supposes normales
dans lesquelles on suppose que les variances sont gales.
Ho: m1 = m2 = m3 = m12
180

Statistiques dcisionnelles

8. Tests sur les moyennes

H1: au moins une des moyennes est diffrente des autres.


Tableau d'analyse de variance :
Reprenons les donnes et calculons les cinq sommes des carrs :

Lundi

Janvier 2003
13
9
8
7

Fvrier 2003
9
5
8
12

Mars 2003
7
15
14
10

37
8
6
6
7

34
11
4
9
5

46
17
14
12
13

112

27
6
10
7
4

29
10
2
8
3

56
6
14
12
13

95

27
1
10
7
5
23
114

23
6
10
12
9
37
123

45
10
8
4
9
31
178

Mardi

Mercredi

Jeudi

Total

Total
117

91

415

I J K
T
415
STC Y 2
13 9 ... 9
604,98
48
i1 j1 k 1 ijk IJK
SCFA

Ti2

JK
i 1

T
117 112 95 91
415

40,23
IJK
12
48

2
J T j
T
114 123 178 415
SCF

150,04
B
16
16
16
48
j1 IK IJK

181

Statistiques dcisionnelles

SCI

i j

j1

Tij2

i 1

Ti2

JK

8. Tests sur les moyennes

T2j

IK
j1

T2
IJK

37 2 312 117 2 112 2 95 2 912

4
12
114 2 123 2 178 2 415 2

93,6
8
48
SCE = 604,98 40,23 150,04 93,96 = 320,75
SCI

Tableau danalyse de variance deux facteurs avec rptitions


Source de
Somme des
Moyenne des
D.L.
F
variation
carrs
carrs
Jours
40,23
3
13,41
1,51
Mois
150,04
2
75,02
8,42
Interaction
93,96
6
15,66
1,76
Erreur
320,75
36
8,91
Total
604,98
47
En examinant en tout premier lieu le test sur linteraction, on peut vrifier que la valeur FI =
1,76 est infrieure la valeur critique de la table, soit F 0,95 6 et 36 dl = 2,36. On doit
conclure qu'il n'y a pas d'interaction significative entre les deux facteurs jours et mois.
Cette constatation justifie la poursuite de l'analyse de la variance. Comme la valeur FA= 1,51
est infrieure la valeur critique de la table F 0,95 3 et 36 dl = 2,87, on doit conclure quil
nexiste pas de diffrences significatives entre les jours. Par contre, comme la valeur F B = 8,42
est suprieure la valeur critique de la table F 0,95 2 et 36 dl = 3,26, on doit conclure quil
existe
des
diffrences
significatives
entre
les
trois
mois.

182

Statistiques dcisionnelles

9. Tests sur les variances

CHAPITRE 9
TESTS SUR LES VARIANCES

9.1. TEST SUR UN ECHANTILLON.


9.1.1. Formulation de lhypothse nulle.
Ce test a pour but de vrifier si la variance dune population est ou nest pas gale une
valeur donne

02 , appele norme.

Lhypothse nulle est donc :

H0

2 02

9.1.2. Variable de dcision.


On extrait un chantillon alatoire non exhaustif de taille n. La variable de dcision du test
correspond :

x
n

VD

11

02

La variable de dcision possde une distribution khi deux (n-1) degrs de libert.
9.1.3. Rgion dacceptation.
La rgion dacceptation dpend de lhypothse alternative H 1.
a) Test bilatral :
H0 : =

02

et

183

H1 :

02

Statistiques dcisionnelles

9. Tests sur les variances

Les valeurs critiques qui dlimitent la rgion dacceptation sont 1 et 2 telles que :

p (12 VD 22 ) 1

p (VD 12 ) / 2 12 2a
2

p (VD 22 ) / 2 p (VD 22 ) 1 / 2 22 2

a
2

La rgion dacceptation est donc lintervalle 2a ; 2 a .


1
2
2
On accepte lhypothse nulle si la variable de dcision appartient la rgion dacceptation.
Sinon, cest lhypothse alternative qui est accepte.
b) Test unilatral droite :

H 0 : 2 02

et

H 1 : 2 02

La valeur critique qui dlimite la rgion dacceptation est 2 telle que :

p (VD 2 ) 1 2 12

La rgion dacceptation est donc lintervalle 0 ; 12

c) Test unilatral gauche :

H 0 : 2 02

et

H 1 : 2 02

La valeur critique qui dlimite la rgion dacceptation est telle que :

p (VD 2 ) 2 2
La rgion dacceptation est donc lintervalle 2 ; .
9.2. TEST SUR DEUX ECHANTILLONS.
Ce test a pour but de comparer les variances de deux populations laide de deux chantillons
indpendants.
184

Statistiques dcisionnelles

9. Tests sur les variances

9.2.1. Formulation de lhypothse nulle.


Ce test a pour but de vrifier si la variance 12 dune population est ou nest pas gale la
variance

22 dune autre population.

Lhypothse nulle est donc : H 0

12 22

9.2.2. Variable de dcision.


Soient deux chantillons alatoires et non exhaustifs prlevs dans les deux populations. La
variable de dcision du test correspond au rapport des deux variances observes des deux
chantillons :
2
VD 12
2
La variable de dcision suit une loi de Fisher avec (n1-1) et (n2-1) degr de libert.
Les tables de la loi de Fisher ne donnent que des valeurs suprieures lunit. Cest la raison
pour laquelle la variable de dcision correspond au rapport de variances qui est suprieur
lunit, do lchantillon 1 est celui qui a la plus grande variance.
9.2.3. Rgion dacceptation.
Le test dgalit de deux variances est en gnral un test bilatral. Il prcde gnralement le
test de comparaison des moyennes de deux chantillons indpendants.

H0

12 22

et

H1

12 22

Les valeurs critiques qui dlimitent la rgion dacceptation sont F1 et F2 telles que :
p(F1 VD F2) = 1 -
p(VD < F1) = /2

F1 =

F
2

p(VD > F2) = /2 p(VD F2) = 1-/2

185

F2 =

Statistiques dcisionnelles

9. Tests sur les variances

La rgion dacceptation est donc lintervalle F ; F .


1
2
2
Les tables de la loi de Fisher ne donnent que des valeurs suprieures lunit, de telle sorte que
seule est possible la comparaison avec F , et on rejette lhypothse nulle si la variable de
1

dcision est suprieure ou gale F

9.3. ENONCES DES EXERCICES DAPPLICATION.


9.3.1. On souhaite vrifier, au seuil de signification de 95 %, si le peuplement, dans lequel on a
mesur la hauteur dun chantillon de 12 arbres, appartient un type de fort dont lcart type
est de 1,4 m. Les rsultats en mtre sont :
5,1 ; 5,2 ; 5,2 ; 5,4 ; 5,9 ; 6,3 ; 6,3 ; 6,8 ; 6,9 ; 6,9 ; 7,0 ; 7,0
Ce peuplement appartient-il ce type de fort ?
a) Au seuil de signification de 95 %.
b) Au seuil de signification de 99 %.
9.3.2. Le diamtre des billes fabriques par une machine est en moyenne de 6 mm. La machine
est considre comme bien rgle si lcart type du diamtre des billes fabriques ne dpasse
pas 0,45 mm. Pour contrler si la machine est bien rgle, on a prlev un chantillon de 50
billes et on a mesur leur diamtre. On a trouv :

x 2462

350

La machine est-elle bien rgle au seuil de signification de 95 % ?


9.3.3. Pour savoir si les filles sont plus assidues que les garons ou non, on a choisi de manire
alatoire et simple un premier chantillon de 10 filles et de faon indpendante, un deuxime
chantillon de 10 garons. En fonction des rsultats ci-dessous relatifs aux notes dassiduits
(note sur 100), peut-on supposer, au seuil de 5 %, que les variances des deux populations sont
gales ?
Assiduit des filles
Assiduit des garons

72
66

67
59

52
54

54
57

186

46
63

58
55

59
61

54
55

58
66

63
75

Statistiques dcisionnelles

9. Tests sur les variances

9.3.4. Un fabricant de tubes essais pour laboratoire fonde sa publicit sur le fait que la dure
de vie de ses tubes correspond 1500 heures de chauffage laide d'un bec Bunzen avec un
cart type de 100 heures. Un laboratoire de contrle de publicit constate que sur 100 tubes
essais, la dure moyenne de vie est de 1485 heures de chauffage avec un cart-type de 110
heures. Au risque 5%, lcart type de la dure de vie des tubes essais est-il diffrent de 100
heures de chauffage ?
9.3.5. Les moteurs des appareils lectromnagers d'une marque M ont une dure de vie
moyenne de 3000 heures avec un cart-type de 150 heures. A la suite d'une modification dans
la fabrication des moteurs, le fabricant affirme que les nouveaux moteurs ont une dure de vie
suprieure celle des anciens avec un cart type plus rduit. On a test un chantillon de 50
nouveaux moteurs et on a trouv une dure de vie moyenne de 3250 heures avec un cart-type
gal 145 heures. Les nouveaux moteurs apportent-ils une amlioration dans la dispersion de
la dure de vie des appareils lectromnagers au risque de 5% ?
9.3.6. Dans une grande ville d'un pays donn, une enqute a t ralise sur les dpenses
mensuelles pour les loisirs. On a observ les rsultats suivants :
Sur 280 familles habitant le centre-ville, les dpenses mensuelles pour les loisirs sont en
moyenne de 640 dh avec un cart-type de 120 dh.
Sur 300 familles habitant la banlieue, les dpenses mensuelles pour les loisirs sont en
moyenne de 610 dh avec un cart-type de 100 dh.
Peut-on dire au risque de 5 % que la variance de la part du budget familial consacr aux loisirs
est diffrente suivant que la famille habite le centre-ville ou la banlieue ?
9.3.7. On prlve dans la production d'une machine, un chantillon de 100 tiges mtalliques. La
moyenne des longueurs des tiges de cet chantillon est 100,04 cm avec un cart-type de 0,16
cm. La machine est rgle en principe pour obtenir un cart type des longueurs des tiges de
0,12 cm.
1) Au risque de 5 %, peut-on dire que la machine est bien rgle ?
2) Reprendre la question prcdente avec un risque de 1 %.
9.3.8. Dans le but de contrler le poids net des sachets d'un produit alimentaire, on a prlev
deux chantillons respectivement de 10 et 12 sachets, on a obtenu les rsultats suivant (en
grammes) :
1
2

190
210

200
204

202
203

195
189

194
194

208
195

205
206

196
205

198
200

206
201

198

197

Ces deux rsultats sont-ils significativement diffrents en ce qui concerne les carts types des
poids %.

187

Statistiques dcisionnelles

9. Tests sur les variances

9.3.9. Une machine fabrique des pices identiques. La moyenne des poids de 50 pices
prleves dans la production est 68,2 grammes avec un cart-type de 2,5 grammes. On effectue
un rglage sur la machine. On prlve un nouvel chantillon de 50 pices. On trouve un poids
moyen de 67, 5 grammes avec un cart-type de 2, 8 grammes. Peur-on affirmer, au risque 5 %
que le rglage a modifi lcart-type du poids des pices ?
9.3.10. Un tour oprateur veut mettre un nouveau produit son catalogue. La rentabilit de ce
produit suppose, en moyenne, 50 rservations hebdomadaires au minimum par agence avec un
cart type maximum de 2 rservations. A titre de test, il dcide de linclure au catalogue dun
chantillon alatoire de 10 de ses agences. On a not le nombre de rservations observes
durant une semaine dans les 10 agences :
51 ; 48 ; 58 ; 55 ; 52 ; 49 ; 50 ; 54 ; 53 ; 52
Peut-on conclure, au seuil de 5 %, puis de 1 % que lcart type est effectivement infrieur 2
rservations ?
9.4. SOLUTIONS DES EXERCICES DAPPLICATION.
9.4.1. Solution de lexercice 9.3.1.
Pour rpondre cette question, on doit raliser un test de conformit de la variance.
Hypothse nulle :
Il sagit dun test bilatral.
H0

= 1,4 = 1,96 H1 : 1,96

Variable de dcision :
La variable de dcision du test correspond :
n

VD

(i )

i 1

02

6,6
3,37
1,96

La variable de dcision possde une distribution khi deux 11 degrs de libert.


Rgion dacceptation :
a) Les valeurs critiques qui dlimitent la rgion dacceptation sont : et
2

Au seuil de signification de 95 % ( = 0,05)

02, 025 3,82 et


188

02, 975 21,9

Statistiques dcisionnelles

9. Tests sur les variances

La rgion dacceptation est donc lintervalle [3,82 ; 21,9].


On rejette lhypothse nulle car la variable de dcision nappartient pas la rgion
dacceptation.
b) Au seuil de signification de 99 % ( = 0,01)

02, 005 2,6

02,995 26,8

et

La rgion dacceptation est donc [2,6 ; 26,8].


On accepte lhypothse nulle car la variable de dcision appartient la rgion dacceptation.
9.4.2. Solution de lexercice 9.3.2.
Pour rpondre cette question, on doit raliser un test de conformit de la variance.
Hypothse nulle :
Ce test a pour but de vrifier si la variance de la population des billes fabriques ne dpasse
pas la norme.
Il sagit dun test bilatral :

H0

2 0,45 2

et

2 0,45 2

H1

Variable de dcision :
n

VD

i 1 (x i x ) 2

02

50 (

2462
350 2
(
) )
50
50
59,26
0,45 2

Rgion dacceptation :
Il sagit dun test unilatral droite.
Pour

0,05 , la valeur critique qui dlimite la rgion dacceptation est 12 49 degrs de

libert.
Le nombre de degrs de libert est grand (k > 30), on peut trouver lapproximation de la valeur
de 2 par la loi normale.
2
0,95

49 dl

(Z 0,95 2k 1) 2
2

189

(1,64 2 x 49 1) 2
2

66

Statistiques dcisionnelles

9. Tests sur les variances

La rgion dacceptation est donc lintervalle 0 ; 66 .


On accepte lhypothse nulle car la variable de dcision appartient la rgion dacceptation.
Au seuil de signification de 95 %, la machine est bien rgle.
9.4.3. Solution de lexercice 9.3.3.
Pour rpondre cette question, on doit raliser un test de comparaison de deux variances.
Hypothse nulle :
Ce test a pour but de vrifier si la variance 1 de la population des filles est ou nest pas gale
la variance 2 de la population des garons.
Il sagit dun test bilatral :

H0

12 22

et

H1

12 22

Variable de dcision :

VD
Rgion dacceptation :
Pour = 0,05 la valeur de F

12 57,12

1,31
22 43,43

avec 9 et 9 degrs de libert est : F0,975 = 4,03

La variable de dcision est infrieure F

, on accepte donc lhypothse dgalit des

variances des deux populations.


9.4.4. Solution de lexercice 9.3.4.
Pour rpondre cette question, on doit raliser un test de conformit de la variance.
Hypothse nulle :
Il sagit dun test bilatral.

H0

12 22

et

190

H1

12 22

Statistiques dcisionnelles

9. Tests sur les variances

Variable de dcision :
La variable de dcision du test correspond :

100

(x
VD =

x )

i 1

2
0

110.100
= 121
10000

La variable de dcision possde une distribution khi deux 99 degrs de libert.


Rgion dacceptation :
Les valeurs critiques qui dlimitent la rgion dacceptation sont : 2 et 2
2

Au seuil de signification de 95 % ( = 0,05), Les valeurs critiques qui dlimitent la rgion


dacceptation sont :

02, 025 et 02,975 .

Le nombre de degrs de libert tant trs grand, on peut utiliser lapproximation par la loi
normale de moyenne 99 et dcart type

2 99 14,07 .

En passant la loi normale centre rduite on obtient :


02, 025 99 dl 99
= Z0,025
14,07
do :
0,025 99 dl = Z0,025 x 14,07 + 99
0,025 99 dl = -1,96 x 14,07 + 99 = 71,42
de mme :
0,975 99 dl = Z0,975 x 14,07 + 99
0,975 99 dl = 1,96 x 14,07 + 99 = 126,58
0,025 = 71,42

et

0,975 = 126,58

La rgion dacceptation est donc lintervalle [71,42 ; 126,58].


On accepte lhypothse nulle car la variable de dcision appartient la rgion dacceptation.
Cest--dire, au risque 5%, lcart type de la dure de vie des tubes essais est de 100 heures
de chauffage.
191

Statistiques dcisionnelles

9. Tests sur les variances

9.4.5. Solution de lexercice 9.3.5.


Pour rpondre cette question, on doit raliser un test de conformit de la variance.
Hypothse nulle :
Il sagit dun test bilatral.
= 150 = 22500

H0

H1 : < 22500

Variable de dcision :
La variable de dcision du test correspond :

50

(x
VD =

x )

i 1

145.50
= 46,7
22500

La variable de dcision possde une distribution khi deux 49 degrs de libert.


Rgion dacceptation :
Il sagit dun test unilatral gauche.
La valeur critique qui dlimite la rgion dacceptation est

Au seuil de signification de 95 % ( = 0,05), la valeur critique qui dlimite la rgion


dacceptation est

02, 05

Le nombre de degrs de libert tant trs grand, on peut utiliser lapproximation par la loi
normale de moyenne 49 et dcart type

2 49 9,9 .

Pour amliorer lapproximation, on peut utiliser la transformation suivante :

( Z 2k 1)
2

do :

02, 05

( Z 0 , 05 2 x 49 1) 2
2

( 1,64 2 x 49 1) 2
2

33,7

La rgion dacceptation est donc lintervalle [33,7 ; + ].


192

Statistiques dcisionnelles

9. Tests sur les variances

On accepte lhypothse nulle car la variable de dcision appartient la rgion dacceptation.


Cest--dire, au risque 5%, les nouveaux moteurs napportent aucune amlioration dans la
dispersion de la dure de vie des appareils lectromnagers.
9.4.6. Solution de lexercice 9.3.6.
Pour rpondre cette question, on doit raliser un test de comparaison de deux variances.
Hypothse nulle :
Ce test a pour but de vrifier si la variance 12 des dpenses mensuelles pour les loisirs en
centre ville est ou nest pas gale la variance 22 des dpenses mensuelles pour les loisirs en
banlieue.
Il sagit dun test bilatral :

H0

12 22

et

H1

12 22

Variable de dcision :

VD

12
22

Les variances des deux populations sont estimes par les quasi-variances.
^

n1 280
=
. 120 = 14451,61
n 1 279

n2 300
=
. 100 = 10033,44
n 1 299

1 =

2 =

VD =

14451,61
= 1,44
10033,44

Rgion dacceptation :
En consultant la table de Fisher pour = 0,05, la valeur de F

libert ne peut tre ni infrieure 1,19 ni suprieure 1,32.


1,19 < F0,975 < 1,32

193

avec 279 et 299 degrs de

Statistiques dcisionnelles

9. Tests sur les variances

La variable de dcision est suprieure F

, on rejette donc lhypothse dgalit des

variances des deux populations. Cest--dire, au risque de 5 % la variance de la part du budget


familial consacr aux loisirs est diffrente suivant que la famille habite le centre-ville ou la
banlieue.
9.4.7. Solution de lexercice 9.3.7.
Pour rpondre cette question, on doit raliser un test de conformit de la variance.
Hypothse nulle :
Il sagit dun test bilatral.
H0

= 0,12 = 0,0144

H1 : 0,0144

Variable de dcision :
La variable de dcision du test correspond :

100

(x

x )

0,16.100
=
= 177,78
0
0,0144
La variable de dcision possde une distribution khi deux 99 degrs de libert.
VD =

i 1

Rgion dacceptation :
Les valeurs critiques qui dlimitent la rgion dacceptation sont :

et 1 .
2

1) Au seuil de signification de 95 % ( = 0,05), Les valeurs critiques qui dlimitent la rgion


dacceptation sont : 0,025 et 0,975 .
Le nombre de degrs de libert tant trs grand, on peut utiliser lapproximation par la loi
normale de moyenne 99 et dcart type

2 99 14,07 .

En passant la loi normale centre rduite on obtient :


02, 025 99 dl 99
= Z0,025
14,07
do :
0,025 99 dl = Z0,025 x 14,07 + 99
0,025 99 dl = -1,96 x 14,07 + 99 = 71,42
194

Statistiques dcisionnelles

9. Tests sur les variances

de mme :
0,975 99 dl = Z0,975 x 14,07 + 99
0,975 99 dl = 1,96 x 14,07 + 99 = 126,58
0,025 = 71,42

et

0,975 = 126,58

La rgion dacceptation est donc lintervalle [71,42 ; 126,58].


On rejette lhypothse nulle car la variable de dcision nappartient pas la rgion
dacceptation. Cest--dire, au risque 5 %, la machine nest pas bien rgle.
2) Au seuil de signification de 99 % ( = 0,01), les valeurs critiques qui dlimitent la rgion
dacceptation sont : 0,005 et 0,995 .
Le nombre de degrs de libert tant trs grand, on peut utiliser lapproximation par la loi
normale de moyenne 99 et dcart type

2 99 14,07 .

En passant la loi normale centre rduite on obtient :


0,005 99 dl = Z0,005 x 14,07 + 99
0,005 99 dl = -2,58 x 14,07 + 99 = 62,70
de mme :
0,995 99 dl = Z0,995 x 14,07 + 99
0,995 99 dl = 2,58 x 14,07 + 99 = 135,30
La rgion dacceptation est donc lintervalle [62,70 ; 135,30].
On rejette lhypothse nulle car la variable de dcision nappartient pas la rgion
dacceptation. Cest--dire, au risque 1%, la machine nest pas bien rgle.

195

Statistiques dcisionnelles

9. Tests sur les variances

9.4.8. Solution de lexercice 9.3.8.


Pour rpondre cette question, on doit raliser un test de comparaison de deux variances.
Hypothse nulle :
Ce test a pour but de vrifier si la variance 1 de la population du premier chantillon est ou
nest pas gale la variance 2 de la population du deuxime chantillon.
Il sagit dun test bilatral :
1 = 2et

H0

H1

1 2

Variable de dcision :
^

VD =

Rgion dacceptation :
Pour = 0,05 la valeur de F

1
^

34,70
= 1,02
34,04

avec 11 et 9 degrs de libert est : F0,975 = 3,91

La variable de dcision est infrieure F

, on accepte donc lhypothse dgalit des

variances des deux populations.


9.4.9. Solution de lexercice 9.3.9.
Pour rpondre cette question, on doit raliser un test de comparaison de deux variances.
Hypothse nulle :
Ce test a pour but de vrifier si la variance 1 des poids des pices avant le rglage est ou nest
pas gale la variance 2 des poids des pices aprs le rglage.
Il sagit dun test bilatral :
H0

1 = 2et

H1

Variable de dcision :
^

VD =

1
^

196

1 2

Statistiques dcisionnelles

9. Tests sur les variances

Les variances des deux populations sont estimes par les quasi-variances.
^

1 =

n1 50
=
. 2,5 = 6,38
n 1 49

2 =

n2 50
=
. 2,8 = 8
n 1 49

VD =

8
= 1,25
6,38

Rgion dacceptation :
En consultant la table de Fisher pour = 0,05, la valeur de

avec 49 et 49 degrs de

libert ne peut tre ni infrieure 1,75 ni suprieure 2,07.


1,75 < F0,975 < 2,07
La variable de dcision est infrieure

, on accepte donc lhypothse dgalit des

variances des deux populations. Cest--dire, au risque de 5 % le rglage na pas modifi


lcart type du poids des pices.
9.4.10. Solution de lexercice 9.3.10.
Pour rpondre cette question, on doit raliser un test de conformit de la variance.
Hypothse nulle :
Il sagit dun test unilatral gauche.
H0 : = 2

H1 : < 4

et

Variable de dcision :
La variable de dcision du test correspond :

10

(x x)
i

VD =

i 1

79,6
= 19,9
4

La variable de dcision possde une distribution khi deux 9 degrs de libert.


197

Statistiques dcisionnelles

9. Tests sur les variances

Rgion dacceptation :
La rgion dacceptation est lintervalle [ ; +[.
Au seuil de signification de 95 % ( = 0,05)
0,05 = 3,325
La rgion dacceptation est donc lintervalle [3,325 ; +[.
On accepte lhypothse nulle car la variable de dcision appartient la rgion dacceptation.
Cest--dire au seuil 5 %, lcart type est effectivement infrieur 2 rservations.
Au seuil de signification de 99 % ( = 0,01)

02, 01 2,09
La rgion dacceptation est lintervalle [2,09 ; + ] on accepte lhypothse nulle.

198

Statistiques dcisionnelles

10. Tests sur les proportions

CHAPITRE 10
TESTS SUR LES PROPORTIONS

10.1. TEST SUR UN ECHANTILLON.


10.1.1. Formulation de lhypothse nulle.
On attribue la valeur p0 pour proportion dans une population dont la vraie proportion p est
inconnue, et on veut juger la validit de cette hypothse.
Ce test a pour but de vrifier si la proportion p dune population est ou nest pas gale une
valeur donne p0, appele norme.
Lhypothse nulle est donc : H0

p = p0

10.1.2. Variable de dcision.


On extrait de la population un chantillon alatoire et simple dans lequel la proportion observe
fn est en gnral diffrente de p0, il sagit dexpliquer cette diffrence.
La variable de dcision du test correspond lestimation de p qui est la frquence de
lchantillon :
VD = fn
Comme, la distribution de la proportion suit une loi normale de moyenne p et dcart type
p(1 p)
condition que la taille de lchantillon soit suprieure ou gale 30 (n 30) et le
n
produit n np 5, la variable de dcision rduite :
fn p0
VDR =
p 0 (1 p 0 )
n
est donc une variable normale rduite N(0 ; 1).
199

Statistiques dcisionnelles

10. Tests sur les proportions

10.1.3. Rgion dacceptation.


La rgion dacceptation dpend de lhypothse alternative H 1.
a) Test bilatral :
H0 : p = p 0

H1 : p p 0

et

Les valeurs critiques qui dlimitent la rgion dacceptation sont les valeurs dune variable
normale rduite Z1 et Z2 telles que :
p(Z1 VDR Z2) = 1 -
p(VDR < Z1) = /2

Z1 =

Z
2

p(VDR > Z2) = /2 p(VDR Z2) = 1-/2 Z2 =

Z1
2

La rgion dacceptation est donc lintervalle [ Z ;


2

Z1 ].
2

On accepte lhypothse nulle si la variable de dcision rduite appartient la rgion


dacceptation. Sinon, cest lhypothse alternative qui est accepte.
Remarque : Puisque la rgion dacceptation est symtrique, on rejette lhypothse nulle si :

VDR > Z1
2

b) Test unilatral droite :


H0 : p = p 0

et

H1 : p > p 0

La valeur critique qui dlimite la rgion dacceptation est la valeur dune variable normale
rduite Z telle que :
p(VDR Z) = 1 -

La rgion dacceptation est donc lintervalle ]- ;

200

Z1 ].

Z=

Z1

Statistiques dcisionnelles

10. Tests sur les proportions

c) Test unilatral gauche :


H0 : p = p 0

et

H1 : p < p 0

La valeur critique qui dlimite la rgion dacceptation est la valeur dune variable normale
rduite Z telle que :
p(VDR < Z) =
Z = Z
La rgion dacceptation est donc lintervalle [ Z ; +[.
10.2. TEST SUR DEUX ECHANTILLONS.
Ce test a pour but de comparer les proportions de deux populations laide de deux
chantillons indpendants.
10.2.1. Formulation de lhypothse nulle.
Ce test a pour but de vrifier si la proportion p1 dune population est ou nest pas gale la
proportion p2 dune autre population.
Lhypothse nulle est donc : H0

p1 = p2

10.2.2. Variable de dcision.


Il sagit de comparer deux proportions observes. Soient deux chantillons alatoires de taille
respectivement n1 et n2 extraits de deux populations. Les frquences observes fn1 et fn2 sont
gnralement diffrentes, il sagit dexpliquer cette diffrence.
X
X
f n1 1
f n2 2
et
n1
n2
La variable de dcision du test correspond la diffrence entre les frquences observes des
deux chantillons :
VD = fn1 fn2
Comme les distributions des deux proportions suivent des lois normales de moyennes
p 1 (1 - p 1 )
p 2 (1 - p 2 )
respectivement p1 et p2 et dcarts types respectifs
et
condition que
n2
n1
la taille de lchantillon soit suprieure ou gale 30 (n 30) et le produit np 5, la variable
de dcision est elle-mme normale de moyenne (p1-p2) et dcart type
p 1 (1 p 1 )
p (1 p 2 )
.
2
n1
n2
201

Statistiques dcisionnelles

10. Tests sur les proportions

Sous lhypothse nulle p1 = p2 , il y a la mme proportion inconnue p dans les deux


populations. Cette proportion peut tre estime par la frquence observe fn1+n2 dans
lchantillon unique qui est la runion des deux chantillons.

f n1 n 2

X 1 X 2 n 1 fn 1 n 2 fn 2

n1 n 2
n1 n 2

Sous lhypothse nulle, la variable de dcision suit une loi normale de moyenne (p 1-p2) = 0 et
dcart type :

p (1 p) p (1 p)
=

n1
n2

f n1 n 2 (1 f n1 n 2 ) (

1
1
)
n1 n 2

La variable de dcision centre rduite :

f n1 f n 2

VDR

f n1 n 2 (1 f n1 n 2 )(

1
1
)
n1 n 2

est donc une variable normale rduite N(0 ; 1).


10.2.3. Rgion dacceptation.
La rgion dacceptation est identique celle du test de conformit dune proportion, elle
dpend de lhypothse alternative H1.
a) Test bilatral :
H0 : p 1 = p 2

H1 : p 1 p 2

et

La rgion dacceptation est lintervalle [ Z ;


2

Z1 ].
2

On accepte lhypothse nulle si la variable de dcision rduite appartient la rgion


dacceptation. Sinon, cest lhypothse alternative qui est accepte.
Remarque : Puisque la rgion dacceptation est symtrique, on rejette lhypothse nulle
si :

202

Statistiques dcisionnelles

10. Tests sur les proportions

VDR > Z1
2

203

Statistiques dcisionnelles

10. Tests sur les proportions

b) Test unilatral droite :


H0 : p 1 = p 2

et

La rgion dacceptation est donc lintervalle ]- ;

H1 : p 1 > p 2

Z1 ].

c) Test unilatral gauche :


H0 : p 1 = p 2

et

H1 : p 1 < p 2

La rgion dacceptation est donc lintervalle [ Z ; +[.


10.3. TEST SUR PLUSIEURS ECHANTILLONS.
Ce test a pour but de comparer les proportions dun certain nombre de populations laide du
mme nombre dchantillons indpendants.
10.3.1. Formulation de lhypothse nulle.
Ce test a pour but de vrifier si les proportions p1, p2, ... pk de k populations sont gales. On
crit comme suit les hypothses :
Ho: p1 = p2 = ... = pk
H1: au moins une des proportions est diffrente des autres.
10.3.2. Variable de dcision.
Soient k chantillons alatoires de taille respectivement n1, n2 , , nk extraits de k populations.
Il sagit de comparer les effectifs observs nij dans les k chantillons et les effectifs attendus ou
thoriques sous lhypothse nulle.
Effectifs observs

Avoir le caractre tudi


Ne pas avoir le caractre
tudi
Total

Echantillon
1
n11
n12
n1.

204

Echantillon
Echantillon

2
k
n21
nk1

n22
nk2

n2.

nk.

Statistiques dcisionnelles

10. Tests sur les proportions

Sous lhypothse nulle p1 = p2 = ... = pk, il y a la mme proportion inconnue p dans les k
populations. Cette proportion peut tre estime par la frquence observe f dans lchantillon
unique qui est la runion des k chantillons.

n 11 n 21 n k1
n1 n 2 n k

sous lhypothse nulle, les effectifs thoriques sont :


Effectifs thoriques

Avoir le caractre tudi


Ne pas avoir le caractre tudi
Total

Echantillon 1 Echantillon 2
f n1.
f n2.
(1 f) n1.
(1 f) n2.
n1.
n2.

Echantillon k
f nk.

(1 f) nk.

nk.

On est amen confronter les effectifs observs et les effectifs thoriques. On calcule la
variable de dcision VD :
VD = (effectif observ-effectif thorique)2 / effectif thorique
On peut dmontrer que la variable de dcision est une variable alatoire Khi deux avec (k-1)
degr de libert.
10.3.3. Rgion dacceptation.
La variable de dcision est nulle lorsque les effectifs observs sont tous gaux aux effectifs
attendus, cest--dire, lorsquil y a concordance absolue entre la distribution observe et la
distribution thorique. La valeur de la variable de dcision est dautant plus grande que les
carts entre les effectifs observs et attendus sont plus grands. La valeur critique qui dlimite la
rgion dacceptation est telle que :
p(VD < ) = 1 -

= 1-

Le test tant toujours unilatral, la rgion dacceptation est donc lintervalle [0 ; 1-[.
On rejettera donc lhypothse nulle lorsque la valeur de la variable de dcision est suprieure
ou gale 1- avec (k-1) degrs de libert.

205

Statistiques dcisionnelles

10. Tests sur les proportions

10.4. ENONCES DES EXERCICES DAPPLICATION.


10.4.1. Au cours des lections, un candidat est lu avec 52 % des voix. Plusieurs mois aprs
l'lection, un institut de sondage interroge 1600 lecteurs, dont 800 dclarent qu'ils voteraient
en cas d'lection, pour le mme candidat. Ce rsultat est-il ou non significatif d'une
dsaffection des lecteurs pour l'lu ?
a) Au seuil de signification de 95 %.
b) Au seuil de signification de 90 %.
10.4.2. Une enqute sur lemploi a concern 220 personnes dont 115 dans le milieu rural et
105 dans le milieu urbain. Sur les 115 ruraux enquts, 74 se sont rvls actifs, alors que pour
les enquts urbains, 81 sont actifs. Peut-on admettre, au seuil de 5 %, quil ny a pas de
diffrence significative entre les taux dactivits dans les deux milieux ?
10.4.3. Lors dune campagne lectorale, un parti politique a effectu un sondage pour valuer
les intentions de vote en faveur de ce parti. Quatre chantillons indpendants ont t choisis
dans quatre villes diffrentes. On a obtenu les rsultats suivants :

Voteront pour le parti


Ne voteront pas pour le parti
Total

Rabat Tanger Oujda Agadir


94
58
60
43
240
230
252
197
334
288
312
240

Au seuil de signification de 5 % puis de 1 %, la proportion de la population des lecteurs qui


ont lintention de voter pour ce parti est-elle identique dans les quatre villes ?
10.4.4. Dans une population, soit p1, la proportion d'hommes possdant le baccalaurat et p2
la proportion de femmes possdant le baccalaurat. Le tableau suivant correspond la
rpartition de 200 individus choisis au hasard dans cette population.

Possdent le bac
ne possdent pas le bac

hommes femmes
32
26
64
78

Peut-on affirmer au risque 0,05, que p1 et p2 sont significativement diffrents ?


10.4.5. Dans un pays M, le gouvernement a annonc que le taux de chmage est de 15,6 %.
Contestant ce chiffre, les dputs de l'opposition ont fait appel un institut de sondage. Celui ci
a ralis une tude couvrant 4900 personnes en ge d'activit et a trouv que le taux de
chmage est de 16,4 %. Avec un niveau de confiance de 0,95 ; estimez-vous que l'opposition a
raison de contester le chiffre annonc par le gouvernement ?

206

Statistiques dcisionnelles

10. Tests sur les proportions

10.4.6. Dans une population, on interroge un chantillon alatoire de 400 personnes dont 160
sont ges de 18 40 ans et 240 sont ges de plus de 40 ans. On a trouv que le pourcentage
des personnes propritaires de leur logement dans les deux groupes sont respectivement 35% et
45%. Ces deux rsultats sont-ils significativement diffrents au seuil de signification de
5 % puis de 1 % ?
10.4.7. Le tableau suivant donne le nombre dtudiants qui ont t brillants et mdiocres devant
trois examinateurs :

Brillants
Mdiocres
Total

Examinateur 1
50
5
55

Examinateur 2
47
14
61

Examinateur 3
56
8
64

Total
153
27
180

Au seuil de 5 % puis de 10 %, testez lhypothse selon laquelle le nombre dtudiants


mdiocres est le mme pour chaque examinateur.
10.4.8. Quelques jours avant une consultation lectorale mettant deux candidats A et B en
prsence, deux instituts de sondage interrogent les lecteurs. Pour l'institut X, qui a interrog
1600 personnes, le candidat A ne recueillerait que 47 % des suffrages. Pour l'institut Y, qui a
interrog 2500 personnes, A recueillerait 50 % des suffrages.
Ces deux rsultats sont-ils significativement diffrents avec un degr de confiance de 95 % ?
10.4.9. L'exprience suivante a t ralise par Weldon : il a lanc un d 315 672 fois, il a tir
106 602 fois l'une des faces 5 ou 6 Peut-on accepter l'hypothse selon laquelle le d est
quilibr, au risque de 5% ?
10.4.10. Un fabricant affirme qu'au moins 95 % de lquipement qu'il fournit un dpositaire
est conforme au cahier des charges. Lexamen d'un chantillon de 200 pices fournies montre
que 18 pices sont dfectueuses. Que penser de l'affirmation du fabricant au seuil de confiance
de 5 % puis de 10 % ?
10.4.11. Pour une lection, on effectue un sondage pour valuer les intentions de vote en faveur
du parti M. Dans la ville de Casablanca, sur 450 personnes interroges, 52% ont l'intention de
voter pour M. Dans la ville de Rabat, sur 300 personnes interroges, 49 % ont l'intention de
voter pour M. Au risque de 5%, y a-t-il une diffrence d'intention de vote dans ces deux villes?
10.4.12. Un chercheur a dcouvert un procd efficace 90 % pour prolonger la dure de vie
des ballons eau chaude. On teste son procd sur 200 ballons. On constate qu'il est efficace
pour 160 dentre eux. Laffirmation du chercheur est-elle lgitime au seuil de signification de
0,05 ?

207

Statistiques dcisionnelles

10. Tests sur les proportions

10.4.13. Un laboratoire annonce que l'un de ses mdicaments est efficace 95 %. Sur un
chantillon de 400 personnes le traitement s'est rvl efficace sur 368 d'entre elles. Quel
risque faut-il accepter si l'on considre que l'affirmation du laboratoire est lgitime ?
10.4.14. Une entreprise commerciale succursales multiples procde un sondage dans ses
magasins de Rabat et Casablanca. A Rabat, sur 1000 clients interrogs, 350 dclarent souhaiter
que le magasin reste ouvert jusqu 21 heures tandis qu Casablanca, sur 900 clients, 280 ont
mis ce mme vu. Lentreprise peut-elle, au seuil de signification de 5 % puis de 10 %,
considrer que sa clientle de Rabat ragit comme celle de Casablanca ?
10.5. SOLUTIONS DES EXERCICES DAPPLICATION.
10.5.1. Solution de lexercice 10.4.1.
Pour rpondre cette question, on doit vrifier si le nouveau pourcentage obtenu par le
sondage, nest pas infrieur la norme de 52 %. Il sagit donc de faire un test de conformit de
la proportion.
Hypothse nulle :
Il sagit dun test unilatral gauche.
H0

p = 0,52 H1 : p < 0,52

Variable de dcision :
La variable de dcision du test correspond la frquence fn de lchantillon :
VD = fn =

800
= 0,50
1600

La distribution de la proportion suit une loi normale de moyenne p et dcart type

pq
n

taille de lchantillon est suprieure 30 et le produit n p > 5).


La variable de dcision rduite est :
VDR =

fn p0
p 0 (1 p 0 )
n

0,50 0,52

0,52(1 0,52)
1600

208

= - 1,60

(la

Statistiques dcisionnelles

10. Tests sur les proportions

Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.
a) Au seuil de signification de 95 % ( = 0,05) :

Z = Z0,05 = -1,65

La rgion dacceptation est donc lintervalle [-1,65 ; +[.


On accepte lhypothse nulle car la variable de dcision rduite appartient la rgion
dacceptation. Ce rsultat n'est donc pas significatif d'une dsaffection des lecteurs pour ce
candidat.
b) Au seuil de signification de 90 % ( = 0,1)

Z Z 0 ,1 1,28
La rgion dacceptation est [- 1,28 ; + ]. On rejette lhypothse nulle. Ce rsultat est donc
significatif dune dsaffection des lecteurs pour ce candidat.
10.5.2. Solution de lexercice 10.4.2.
Pour rpondre cette question, on doit raliser un test de comparaison de deux proportions.
Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des personnes actives dans le milieu rural est
ou nest pas gale la proportion p2 des personnes actives dans le milieu urbain.
Il sagit dun test bilatral : H0 : p1 = p2

H1 : p 1 p 2

et

Variable de dcision :
Daprs les donnes :

f n1

74
= 0,64
115
f n 2 n 2

f n2
155
= 0,70
220

209

81
= 0,77
105

Statistiques dcisionnelles

10. Tests sur les proportions

La variable de dcision centre rduite est :

f n1 f n 2

VDR =

f n1 n 2(1 f n1 n 2)(

1
1
)
n1 n 2

0,64 0,77

VDR =

= -2,10

1
1
0,70(1 0,70)(

)
115 105
Rgion dacceptation :
Pour = 0,05 la valeur de

Z1 est : Z0,975 = 1,96


2

VDR > Z1 , on rejette donc lhypothse nulle. Cest--dire, il y a une diffrence


2

significative entre les taux dactivits dans les deux milieux.


10.5.3. Solution de lexercice 10.4.3.
Pour rpondre cette question, on doit raliser un test de comparaison de plusieurs proportions.
Formulation de lhypothse nulle :
Ho : p 1 = p 2 = p 3 = p 4
H1: au moins une des proportions est diffrente des autres.
Variable de dcision :
Sous lhypothse nulle : p1 = p2 = p3 = p4, il y a la mme proportion inconnue p dans les 4
villes. Cette proportion peut tre estime par la frquence observe f dans lchantillon unique
qui est la runion des 4 chantillons.
94 58 60 43
f
0,22
334 288 312 240
Sous lhypothse nulle, les effectifs thoriques sont :
Effectifs thoriques

Voteront pour le parti


Ne voteront pas pour le parti
Total

Rabat
73,48
260,52
334
210

Tanger
63,36
224,64
288

Oujda
68,64
243,36
312

Agadir
52,8
187,2
240

Statistiques dcisionnelles

10. Tests sur les proportions

On calcule la variable de dcision VD :


VD =

(94 73,48) (240 260,52) (58 63,36)

73,48
260,52
63,36

(230 224,64) (60 68,64) (252 243,36)

224,64
68,64
243,36
+

(43 52,8) (197 187,2)

= 11,65
52,8
187,2

La variable de dcision est une variable alatoire Khi deux avec 3 degrs de libert.
Rgion dacceptation :
La rgion dacceptation est donc lintervalle 0 ; 12 .

- Au seuil de signification de 5 %, la valeur 0,95 3 degrs de libert est gale 7,81.


La valeur de la variable de dcision est suprieure la valeur 0,95 3 degrs de libert, on
rejettera donc lhypothse nulle, cest--dire au seuil de signification de 5 %, la proportion de
la population des lecteurs qui ont lintention de voter pour ce parti nest pas identique dans les
quatre villes.
- Au seuil de signification de 1 %, la valeur

02,999 3 degrs est gale 16,27.

La valeur de la variable de dcision est infrieure la valeur

02,999 3 degrs de libert, on

acceptera donc lhypothse nulle, cest--dire au seuil de 1 %, lintention de vote pour ce parti
est identique dans les quatre villes.
10.5.4. Solution de lexercice 10.4.4.
Pour rpondre cette question, on doit raliser un test de comparaison de deux proportions.
Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des hommes possdant le bac est ou nest pas
gale la proportion p2 des femmes possdant le bac.
Il sagit dun test bilatral : H0 : p1 = p2
et
H1 : p 1 p 2

211

Statistiques dcisionnelles

10. Tests sur les proportions

Variable de dcision :
Daprs les donnes :
Possdent le bac
Ne possdent pas le bac
Total
32
f n1
= 0,33
96

f n 2 n 2

Hommes Femmes Total


32
26
58
64
78
142
96
104
200
26
f n2
= 0,25
104

58
= 0,29
200

La variable de dcision centre rduite est :

f n1 f n 2

VDR =

f n1 n 2(1 f n1 n 2)(

1
1
)
n1 n 2

0,33 0,25

VDR =

= 1,25

1
1
0,29(1 0,29)(
)
96 104
Rgion dacceptation :
Pour = 0,05 la valeur de

Z1 est : Z0,975 = 1,96


2

VDR < Z1 , on accepte donc lhypothse nulle. Cest--dire, il ny a pas de diffrence


2

significative entre la proportion des hommes possdant le bac et celle des femmes possdant le
bac.
10.5.5. Solution de lexercice 10.4.5.
Pour rpondre cette question, on doit vrifier si le nouveau pourcentage obtenu par le
sondage, nest pas suprieur la norme de 15,6 % annonce par le gouvernement. Il sagit
donc de faire un test de conformit de la proportion.
Hypothse nulle :
Il sagit dun test unilatral droite
H0

p = 0,156

H1 : p>< 0,156

212

Statistiques dcisionnelles

10. Tests sur les proportions

Variable de dcision :
La variable de dcision du test correspond la frquence fn de lchantillon :
VD = fn = 0,164
La distribution de la proportion suit une loi normale de moyenne p et dcart type

pq

(la

n
taille de lchantillon est suprieure 30 et le produit n p > 5).
La variable de dcision rduite est :
VDR =

fn p0
p 0 (1 p 0 )
n

0,164 0,156

Rgion dacceptation :
La rgion dacceptation est lintervalle ]- ;

0,156(1 0,156)
4900

= 1,54

Z1 ].
Z1 = Z0,95 = 1,65

Au seuil de signification de 95 % ( = 0,05) :

La rgion dacceptation est donc lintervalle ]- ; 1,65].


On accepte lhypothse nulle car la variable de dcision rduite appartient la rgion
dacceptation. Cest--dire au seuil 5 % l'opposition a tort de contester le chiffre annonc par le
gouvernement.
10.5.6. Solution de lexercice 10.4.6.
Pour rpondre cette question, on doit raliser un test de comparaison de deux proportions.
Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des personnes propritaires de leur logement
dans la tranche dge 18 40 ans est ou nest pas gale la proportion p 2 des personnes
propritaires de leur logement dans la tranche dge de plus de 40 ans.
Il sagit dun test bilatral : H0 : p1 = p2

et

H1 : p 1 p 2

Variable de dcision :
Daprs les donnes :

f n1 = 0,35
f n 2 n 2

f n2 = 0,45
160.0,35 240.0,45

= 0,41
160 240
213

Statistiques dcisionnelles

10. Tests sur les proportions

La variable de dcision centre rduite est :

f n1 f n 2

VDR =

f n1 n 2(1 f n1 n 2)(

1
1
)
n1 n 2

0,35 0,45

VDR =

= -1,99

1
1
0,41(1 0,41)(

)
160 240
Rgion dacceptation :
- Pour = 0,05 la valeur de

Z1 est : Z0,975 = 1,96


2

VDR > Z1 , on rejette donc lhypothse nulle. Cest--dire, au seuil 5 % il y a une


2

diffrence significative entre les proportions de personnes propritaires de leur logement dans
les deux tranches dge.
- Pour = 0,01 la valeur de

VDR Z

est Z0,995 = 2,58

, on accepte donc lhypothse nulle. Cest--dire au seuil de 1 % il ny a pas

de diffrence significative entre les proportions de personnes propritaires de leur logement


dans les deux tranches dge.
10.5.7. Solution de lexercice 10.4.7.
Pour rpondre cette question, on doit raliser un test de comparaison de plusieurs proportions.
Formulation de lhypothse nulle :
Ho: p1 = p2 = p3
H1: au moins une des proportions est diffrente des autres.
Variable de dcision :
Sous lhypothse nulle : p1 = p2 = p3, il y a la mme proportion inconnue p pour les 3
examinateurs. Cette proportion peut tre estime par la frquence observe f dans lchantillon
unique qui est la runion des 3 chantillons.

27
0,15
180

214

Statistiques dcisionnelles

10. Tests sur les proportions

Sous lhypothse nulle, les effectifs thoriques sont :


Effectifs thoriques
Examinateur 1
46,75
8,25
55

Brillants
Mdiocres
Total

Examinateur 2
51,85
9,15
61

Examinateur 3
54,40
9,60
64

On calcule la variable de dcision VD :


VD =

(50 46,75) (47 51,85) (56 54,40)

46,75
51,85
54,40
(5 8,25) (14 9,15) (8 9,60)

8,25
9,15
9,60
VD = 4,84

La variable de dcision est une variable alatoire Khi deux avec 2 degrs de libert.
Rgion dacceptation :
La rgion dacceptation est donc lintervalle [0 ; 1-[.
- Au seuil de signification de 5 %, la valeur 0,95 2 degrs de libert est gale 5,99.
La valeur de la variable de dcision est infrieure la valeur 0,95 2 degrs de libert, on
acceptera donc lhypothse nulle, cest--dire au seuil de signification de 5 %, le nombre
dtudiants mdiocres est le mme pour chaque examinateur.
- Au seuil de signification de 10 %, la valeur

02,90 2 degrs de libert est gale 4,61.

La valeur de la variable de dcision est suprieure la valeur

02,90 2 degrs de libert, on

rejettera donc lhypothse nulle, cest--dire au seuil de 10 %, le nombre dtudiants mdiocres


est le mme pour chaque examinateurs.
10.5.8. Solution de lexercice 10.4.8.
Pour rpondre cette question, on doit raliser un test de comparaison de deux proportions.

215

Statistiques dcisionnelles

10. Tests sur les proportions

Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des personnes qui voteraient pour le candidat
A, estime par linstitut X, est ou nest pas gale la proportion p 2 des personnes qui voteraient
pour le candidat A, estime par linstitut Y.
Il sagit dun test bilatral : H0 : p1 = p2
et
H1 : p 1 p 2
Variable de dcision :
Daprs les donnes :

f n1 = 0,47

f n2 = 0,50
1600.0,47 2500.0,50

= 0,49
1600 2500

f n 2 n 2

La variable de dcision centre rduite est :

f n1 f n 2

VDR =

f n1 n 2(1 f n1 n 2)(

1
1
)
n1 n 2

0,47 0,50

VDR =

= -1,11

1
1
0,49(1 0,49)(

)
1600 2500
Rgion dacceptation :
Pour = 0,05 la valeur de

Z1 est : Z0,975 = 1,96


2

VDR < Z1 , on accepte donc lhypothse nulle. Cest--dire, au seuil 5 % il ny a pas de


2

diffrence significative entre les rsultats obtenus par les deux instituts.
10.5.9. Solution de lexercice 10.4.9.
Pour rpondre cette question, on doit vrifier si le pourcentage obtenu par lexprience, est ou
nest pas gal au pourcentage thorique, cest--dire la probabilit davoir les faces 5 ou 6 lors
du jet dun d quilibr.
Probabilit davoir les faces 5 ou 6 lors du jet dun d quilibr est de 2 sur 6, soit 0,333.
Hypothse nulle :
Il sagit dun test bilatral :
H0

H1 : p 0,333

p = 0,333
216

Statistiques dcisionnelles

10. Tests sur les proportions

Variable de dcision :
La variable de dcision du test correspond la frquence fn de lexprience :
VD = fn =

106602
= 0,338
315672

La distribution de la proportion suit une loi normale de moyenne p et dcart type

pq

(la

n
taille de lchantillon est suprieure 30 et le produit n p > 5).
La variable de dcision rduite est :

fn p0

VDR =

Rgion dacceptation :
Pour = 0,05 la valeur de

p 0 (1 p 0 )
n

0,338 0,333

0,333(1 0,333)
315672

= 5,96

Z1 est : Z0,975 = 1,96


2

VDR > Z1 , on rejette donc lhypothse nulle. Cest--dire, au seuil 5 % le d nest pas
2

quilibr.
10.5.10. Solution de lexercice 10.4.10.
Pour rpondre cette question, on doit vrifier si le nouveau pourcentage obtenu par le
sondage, nest pas infrieur la norme de 95 %. Il sagit donc de faire un test de conformit de
la proportion.
Hypothse nulle :
Il sagit dun test unilatral gauche :
H0

p = 0,95 H1 : p < 0,95

Variable de dcision :
La variable de dcision du test correspond la frquence fn de lchantillon :
VD = fn =

182 = 0,91
200

La distribution de la proportion suit une loi normale de moyenne p et dcart type

pq
n

taille de lchantillon est suprieure 30 et le produit n p > 5).

217

(la

Statistiques dcisionnelles

10. Tests sur les proportions

La variable de dcision rduite est :


fn p0
VDR =
=
p 0 (1 p 0 )
n

0,91 0,95
0,95(1 0,95)
200

= - 2,60

Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.
- Au seuil de signification de 95 % ( = 0,05) :

Z = Z0,05 = -1,65

La rgion dacceptation est donc lintervalle [-1,65 ; +[.


On rejette lhypothse nulle car la variable de dcision rduite nappartient pas la rgion
dacceptation. Au seuil 5 %, laffirmation du fabricant nest pas correcte.
- A seuil de signification de 99,9 % ( = 0,001) :

Z Z0, 001 3,09


La rgion dacceptation est donc lintervalle [- 3,09 ; + [. On accepte lhypothse nulle. Au
seuil de 1 %, laffirmation du fabricant est correcte.
10.5.11. Solution de lexercice 10.4.11.
Pour rpondre cette question, on doit raliser un test de comparaison de deux proportions.
Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des personnes qui voteraient pour le parti M
dans la ville de Casablanca est ou nest pas gale la proportion p2 des personnes qui
voteraient pour le parti M dans la ville de Rabat.
Il sagit dun test bilatral : H0 : p1 = p2

et

H1 : p 1 p 2

Variable de dcision :
Daprs les donnes :

f n1 = 0,52
f n 2 n 2

f n2 = 0,49

450.0,52 300.0,49
= 0,51
450 300

218

Statistiques dcisionnelles

10. Tests sur les proportions

La variable de dcision centre rduite est :

f n1 f n 2

VDR =

f n1 n 2(1 f n1 n 2)(

1
1
)
n1 n 2

0,52 0,49

VDR =

= 0,54

1
1
0,51(1 0,51)(

)
450 300
Rgion dacceptation :
Pour = 0,05 la valeur de

Z1 est : Z0,975 = 1,96


2

VDR < Z1 , on accepte donc lhypothse nulle. Cest--dire, au seuil 5 % il ny a pas de


2

diffrence significative entre les intentions de vote pour le parti M dans les deux villes
Casablanca et Rabat.
10.5.12. Solution de lexercice 10.4.12.
Pour rpondre cette question, on doit vrifier si le pourcentage obtenu par le test, nest pas
infrieur la norme de 90 %. Il sagit donc de faire un test de conformit de la proportion.
Hypothse nulle :
Il sagit dun test unilatral gauche
H0

p = 0,90 H1 : p < 0,90

Variable de dcision :
La variable de dcision du test correspond la frquence fn du test :
VD = fn =

160 = 0,80
200

La distribution de la proportion suit une loi normale de moyenne p et dcart type

pq
n

taille de lchantillon est suprieure 30 et le produit n p > 5).

219

(la

Statistiques dcisionnelles

10. Tests sur les proportions

La variable de dcision rduite est :


VDR =

fn p0
p 0 (1 p 0 )
n

0,80 0,90

0,90(1 0,90)
200

= - 4,71

Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.

Z = Z0,05 = -1,65

Au seuil de signification de 95 % ( = 0,05) :

La rgion dacceptation est donc lintervalle [-1,65 ; +[.


On rejette lhypothse nulle car la variable de dcision rduite nappartient pas la rgion
dacceptation. Laffirmation du chercheur nest pas lgitime au seuil de signification de 0,05.
10.5.13. Solution de lexercice 10.4.13.
Pour rpondre cette question, on doit accepter que le pourcentage obtenu par le test, nest pas
infrieur la norme de 95 %. Il sagit donc de faire un test de conformit de la proportion.
Hypothse nulle :
Il sagit dun test unilatral gauche
H0

p = 0,95 H1 : p < 0,95

Variable de dcision :
La variable de dcision du test correspond la frquence fn du test :
VD = fn =

368
= 0,92
400

La distribution de la proportion suit une loi normale de moyenne p et dcart type

pq
n

taille de lchantillon est suprieure 30 et le produit n p > 5).


La variable de dcision rduite est :
VDR =

fn p0
p 0 (1 p 0 )
n

220

0,92 0,95
0,95(1 0,95)
400

= - 2,75

(la

Statistiques dcisionnelles

10. Tests sur les proportions

Rgion dacceptation :
La rgion dacceptation est lintervalle [ Z ; +[.
Le seuil de signification est inconnu. Pour accepter lhypothse nulle, la variable de dcision
rduite doit appartenir la rgion dacceptation. Z doit donc tre infrieure ou gale 2,75.

Z = -2,75

= 0,003

=>

10.5.14. Solution de lexercice 10.4.14.


Pour rpondre cette question, on doit raliser un test de comparaison de deux proportions.
Hypothse nulle :
Ce test a pour but de vrifier si la proportion p1 des personnes de Rabat qui souhaiteraient que
le magasin reste ouvert jusqu 21 heures est ou nest pas gale la proportion p2 des
personnes de Casablanca qui souhaiteraient que le magasin reste ouvert jusqu 21 heures.
Il sagit dun test bilatral : H0 : p1 = p2

H1 : p 1 p 2

et

Variable de dcision :
Daprs les donnes :

f n1 = 350 = 0,35
1000

f n2 = 280 = 0,31
900

f n2 n2 350 280 = 0,33


1000900
La variable de dcision centre rduite est :
VDR =

f n1 f n 2
f n1 n 2(1 f n1 n 2)(

VDR =

1
1
)
n1 n 2

0,35 0,31
1
1
0,33(1 0,33)(

)
1000 900

221

= 1,85

Statistiques dcisionnelles

Rgion dacceptation :
Pour = 0,05 la valeur de Z

10. Tests sur les proportions

est : Z0,975 = 1,96

VDR < Z1 , on accepte donc lhypothse nulle. Cest--dire lentreprise peut, au seuil de
2

signification de 5%, considrer que sa clientle de Rabat ragit comme celle de Casablanca.
Pour = 0,1 la valeur

VDR Z

est :

Z0,95 1,64

, on rejette donc lhypothse nulle. Cest--dire lentreprise ne peut pas, au seuil

de signification de 10 %, considrer que sa clientle de Rabat ragit comme celle de


Casablanca.

222

Statistiques dcisionnelles.

11. Tests non paramtriques

CHAPITRE 11
TESTS NON PARAMETRIQUES

11.1. TEST DE VALIDITE DE LOI DE PROBABILITE DUNE DISTRIBUTION.


Les tests dajustement sont destins comparer une distribution observe et une distribution
thorique donne. Dune faon gnrale, on considre dune part, une population infinie dont
les individus sont classs en k catgories, en fonction dun critre qualitatif ou quantitatif, et
dautre part, un chantillon alatoire et simple deffectif n, dont les individus sont classs de la
mme manire. Le but du test est de vrifier si la population possde une distribution de
probabilit donne :
k

p1, p2, p3, , pk tel que :

p
i 1

Formulation de lhypothse nulle :


Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi.
Lhypothse nulle est alors :
H0 : ni = npi avec

i 1

i 1

n i = npi = n

Variable de dcision :
On distingue deux cas dapplication de ces tests, selon que la distribution thorique est ou nest
pas compltement dfinie. Dans le premier cas, la variable de dcision peut tre calcule
immdiatement. Dans le second cas, la distribution de probabilit de la population nest dfinie
quen fonction dun ou de plusieurs paramtres, ceux-ci doivent pralablement tre estims
partir des donnes de lchantillon.

223

Statistiques dcisionnelles.

11. Tests non paramtriques

11.1.1. CAS DUNE DISTRIBUTION COMPLETEMENT DEFINIE.


Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi.
Les effectifs attendus doivent tre tous suprieurs ou gaux 5. Quand cette condition nest pas
remplie, on peut regrouper des classes voisines, de manire augmenter les effectifs attendus.
On calcule la variable de dcision VD :

VD

i 1

(n i np i ) 2
np i

On peut dmontrer que la variable de dcision est une variable alatoire Khi deux avec (k-1)
degr de libert. k correspond au nombre de classes aprs regroupement.
La variable de dcision peut tre calcule plus facilement par :

VD

n i2

np
i 1

n
i

11.1.2. CAS DUNE DISTRIBUTION INCOMPLETEMENT DEFINIE.


Lorsque la distribution thorique nest pas compltement dfinie, le ou les paramtres qui
caractrisent cette distribution doivent tout dabord tre estims. On peut calculer ensuite les
^

probabilits estimes

pi , les effectifs attendus correspondants n pi , et la valeur de dcision :


VD

n i2

np
i 1

n
i

Pour dterminer le nombre de degrs de libert, on doit dduire de (k 1) le nombre de


paramtres estims.
Rgion dacceptation :
La variable de dcision est nulle lorsque les effectifs observs sont tous gaux aux effectifs
attendus, cest dire, lorsquil y a concordance absolue entre la distribution observe et la
distribution thorique. La valeur de la variable de dcision est dautant plus grande que les
carts entre les effectifs observs et attendus sont plus grands. La valeur critique qui dlimite la
rgion dacceptation est telle que :
p(VD < ) = 1 -

224

= 1-

Statistiques dcisionnelles.

11. Tests non paramtriques

Le test tant toujours unilatral, la rgion dacceptation est donc lintervalle 0 ; 12 .


On rejettera donc lhypothse nulle lorsque la valeur de la variable de dcision est suprieure
ou gale 1-.
11.2. TEST DINDEPENDANCE.
Les tests dindpendance ont pour but de contrler lindpendance stochastique de deux ou
plusieurs critres de classification. Ils permettent galement deffectuer des comparaisons de
proportions.
Les tests dindpendance concernent une population subdivise en pq classes, en fonction de
deux critres de classification. La distribution de probabilit correspondante est alors une
distribution deux dimensions, et les donnes relatives tout chantillon sont prsentes sous
la forme dun tableau de contingence.
Pour des chantillons alatoires et simples, si les deux critres de classification sont
indpendants, les probabilits pij de la distribution deux dimensions peuvent tre estimes
par :
p ij f i. x f . j

fi

nj
ni
et f j
sont les frquences relatives marginales.
n
n

ni. et n.j sont les effectifs marginaux, et nij les effectifs conjoints.
Les effectifs attendus correspondants sont donc :

np ij nfi x fj n

ni. n. j ni. x n. j

n n
n

Les effectifs attendus doivent tous tre suprieurs ou gaux 5.


Formulation de lhypothse nulle :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
^

les effectifs observs nij et les effectifs attendus ou thoriques correspondants n pij .
Lhypothse nulle est lindpendance des deux critres de classification.
^

H0 : nij = n pij

225

Statistiques dcisionnelles.

11. Tests non paramtriques

Variable de dcision :
La comparaison des effectifs observs et attendus se fait comme pour les tests dajustement, en
calculant la variable de dcision suivante :

VD =

n ij

i 1

j1

n p ij

-n

On dmontre que la variable de dcision est une variable alatoire Khi deux avec (p-1)(q-1)
degr de libert.
Rgion dacceptation :
La valeur critique qui dlimite la rgion dacceptation est telle que :
p(VD < ) = 1 -

= 1-

Le test tant toujours unilatral, la rgion dacceptation est donc lintervalle [0 ; 1-[.
On rejettera donc lhypothse nulle lorsque la valeur de la variable de dcision est suprieure
ou gale 1-.
11.3. ENONCES DES EXERCICES DAPPLICATION.
11.3.1. Le tableau suivant donne la distribution de frquences des nombres de garons observs
dans 1600 familles de 4 enfants, considres comme choisies au hasard au sein dune trs large
population. En fonction de ces rsultats, peut-on affirmer, au seuil de 5 %, puis de 1 % que le
nombre de garons suit une loi binomiale ?
Nombre de garons Nombre de familles
0
113
1
367
2
576
3
426
4
118
Total
1600
11.3.2. Au concours dentre une cole, lpreuve de culture gnrale est note de 0 50. On
tire au hasard un chantillon de 100 candidats et lon relve que les notes quils ont obtenues se
classent en cinq tranches de la manire suivante :

226

Statistiques dcisionnelles.

11. Tests non paramtriques

Tranches de notes
Note 10
10 < Note 20
20 < Note 30
30 < Note 40
40 < Note 50

Nombre de candidats
10
20
30
20
20

Le jury se demande sil est justifi de considrer que la distribution des notes suit une loi
normale dans la population de tous les candidats.
a) Au seuil de 5 %.
b) Au seuil de 1 %.
11.3.3. Une enqute a t ralise auprs dun chantillon de 500 individus prlev au sein
dune population cible de 4 millions d'individus. Les donnes que l'on possde sur cette
population sont les suivantes :
Hommes 48% soit 1,92 millions dhommes
Femmes 58% soit 2,08 millions de femmes
Sexe
Niveau dinstruction
Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur
Total

Hommes
% Effectifs
35
672000
30
576000
15
288000
13
249600
7
134400
100 1920000

Femmes
Total
% Effectifs
50 1040000 1712000
25
520000 1096000
10
208000
496000
10
208000
457600
5
104000
238400
100 2080000 4000000

Au dpouillement, on a trouv que les individus qui ont form lchantillon ont les
caractristiques suivantes :
Sexe
Niveau dinstruction
Aucun
Primaire
Secondaire
Formation professionnelle
Suprieur
Total

Hommes
Femmes
Total
% Effectifs % Effectifs
32
61
54
112
173
28
54
23
48
102
18
35
12
25
60
14
27
8
17
44
8
15
3
6
21
100
192
100
208
400

Lchantillon prlev est-il reprsentatif de la population tudie ?

227

Statistiques dcisionnelles.

11. Tests non paramtriques

11.3.4. On a enregistr plusieurs fois de suite le nombre de personnes qui se sont prsent un
guichet automatique bancaire, pendant des temps de 5 minutes.
Nombres darrives
Frquences absolues observes

0
1

1
4

2 3 4 5 6
12 18 22 17 11

7
6

8
4

9
3

10
2

Peut-on affirmer au seuil de signification de 5 % que le nombre de personnes qui se prsentent


un guichet automatique bancaire, pendant un intervalle de temps de 5 minutes suit une loi de
Poisson ?
11.3.5. On a mesur la longueur, en mm, de 75 grains de bl. Les rsultats obtenus ont t
rpartis en neuf classes;
longueur en mm Nombre de grains
[5,25 ; 5,75[
1
[5,75 ; 6,25[
6
[6,25 ; 6,75[
6
[6,75 ; 7,25[
9
[7,25 ; 7,75[
15
[7,75 ; 8,25[
17
[8,25 ; 8,75[
10
[8,75 ; 9,25[
8
[9,25 ; 9,75[
3
Peut-on ajuster cette distribution la loi normale de moyenne 7,75 mm, et dcart type 0,94
mm ? (seuil de signification de 5 %)
11.3.6. Le centre de transfusion Rabat a enregistr la rpartition suivante des groupes
sanguins de 525 donneurs bnvoles.
Groupes sanguins
Effectifs observs

O
251

A
219

B
29

AB
26

La rpartition des groupes sanguins dans la population marocaine est la suivante :


Groupes sanguins
Proportions

O
44,5%

A
44%

B
8%

AB
3,5%

Au seuil de signification de 5%, puis de 1 % les 525 donneurs sont-ils reprsentatifs de la


population marocaine en terme de groupes sanguins ?

228

Statistiques dcisionnelles.

11. Tests non paramtriques

11.3.7. Un tour oprateur souhaite segmenter son march. Il se demande sil existe un lien
entre le choix dune destination de vacances et le niveau dinstruction. Les donnes recueillies
ont t structures sous forme de tableau de contingence.
Niveau
dinstruction
Primaire
Secondaire
Suprieur
Total

Destination de vacances
Mer
Montagne
Dsert
300
50
100
250
80
20
50
120
30
600
250
150

Total
450
350
200
1000

11.3.8. Le directeur de ventes dun laboratoire pharmaceutique veut savoir sil existe des
diffrences significatives entre les rgions en terme de niveau daccueil dun nouveau produit.
Les rsultats suivants ont t obtenus auprs dun chantillon alatoire de clients :
Rgions
Nord Est Sud Ouest
22
35
0
5
84
55
8
24
25
17 22
12

Niveau daccueil
Faible
Modr
Elev
Le niveau daccueil dpend-t-il de la rgion ?

11.3.9. Les 150 tudiants dune cole doivent choisir entre trois disciplines pour leur activit
parascolaire. Le choix des tudiants selon le sexe a t comme suit :
Sexe
Fille
Garon
Total

Sport
20
43
63

Discipline
Musique
28
16
44

Thtre
32
11
43

Total
80
70
150

Peut-on affirmer au seuil de 5 % puis de 1 % que le choix des tudiants dpend de leur sexe ?
11.3.10. Le tableau ci-dessous donne la rpartition de 10000 tudiants dune universit selon la
filire dtude et la profession des parents.
Filire
Sciences
Mdecine et
Droit
LettresSciences
PharmacieAutre Total
Profession
conomiques
dentaire
Exploitant agricole 80
35
135
99
65
28
69
511
Salari agricole
6
2
15
6
4
1
5
39
Patron
168
74
312
137
208
53
83 1035
Profession librale 470
191
806
400
876
164
124 3031
229

Statistiques dcisionnelles.

et cadre sup
Cadre moyen
236
Employ
145
Ouvriers
166
Personnel de service 16
Autres
305
Total
1592

11. Tests non paramtriques

99
52
64
6
115
638

493
281
401
27
624
3094

264
133
193
11
247
1490

281
135
127
8
301
2005

56
30
23
2
47
404

123 1552
74
850
157 1131
10
80
132 1771
777 10000

Daprs les donnes ci-dessus, peut-on affirmer au seuil de signification de 5 %, quil y a un


lien entre la filire dtude et la profession des parents ?
11.4. SOLUTIONS DES EXERCICES DAPPLICATION.
11.4.1. Solution de lexercice 11.3.1.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution binomiale.
Hypothse nulle :
k

H0 : ni = npi

n = np

avec

i 1

=n

i 1

Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi. On doit
calculer alors les probabilits pi en utilisant la loi binomiale.
La probabilit davoir un garon est suppose gale 0,5, la loi binomiale qui caractrise le
nombre de garons dans une famille de 4 enfants a pour paramtre 4 et 0,5.
En utilisant la formule de la loi binomiale, on trouve les probabilits suivantes :

p ( x ) C nx p x q n x
Distribution de la variable B(4 , 1/2)
x
0
1
2
3
4
Total

p(x)
0,0625
0,2500
0,3750
0,2500
0,0625
1
230

Statistiques dcisionnelles.

11. Tests non paramtriques

Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
x
0
1
2
3
4
Total

ni
113
367
576
426
118
1600

npi
100
400
600
400
100
1600

Les effectifs thoriques sont tous suprieurs 5, on peut calculer la variable de dcision :

n i2
n
i 1 np i
k

VD
VD

113 2 367 2 576 2 426 2 118 2

1600 10,3
100
400
600
400
100

Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Pour = 0,05, la valeur de 1- avec 4 degrs de libert est : 0,95 = 9,49
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
Cest dire quau seuil de 5%, on ne peut pas affirmer que le nombre de garons suit une loi
binomiale.
Pour = 0,01 la valeur de

12 avec 4 degrs de libert est : 02,99 13,28

La valeur de la variable de dcision est infrieure

12 , on accepte donc lhypothse nulle.

Cest--dire quun seuil de 1 %, on peut affirmer que le nombre de garons suit une binomiale.
11.4.2. Solution de lexercice 11.3.2.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution normale.

231

Statistiques dcisionnelles.

11. Tests non paramtriques

Hypothse nulle :
H0 : ni = npi

i 1

i 1

n i = npi = n

avec

Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi. On doit
calculer alors les probabilits pi en utilisant la loi normale. Pour cela, il faut estimer les
paramtres de la loi normale, savoir, la moyenne et lcart type.
La moyenne m peut tre estime par la moyenne calcule partir de la distribution observe
alors que la variance sera estime par la quasi-variance.
Reprenons les donnes et calculons la moyenne et la quasi-variance.
Tranches de notes
Note 10
10 < Note 20
20 < Note 30
30 < Note 40
40 < Note 50

n x
n
i

Centres xi
5
15
25
35
45

Effectifs ni
10
20
30
20
20

10.5 20.15 30.25 20.35 20.45


= 27
10 20 30 20 20

n (x x)

n 1
^

10.(5 27) 20.(15 27) 30.(25 27) 20.(35 27) 20.(45 27) ^
= 157,58
100 1
^

157,58 = 12,55
La loi normale est de moyenne 27 et dcart type 12,55.
Calculons les probabilits :

10 27
) = (-1,35) = 0,0885
12,55
10 27
20 27
p(10 < X 20) = p(
<Z
)
12,55
12,55
p(10 < X 20) = (-0,56)- (-1,35) = 0,2877-0,0885 = 0,1992
p(X 10) = p(Z

232

Statistiques dcisionnelles.

11. Tests non paramtriques

20 27
30 27
<Z
)
12,55
12,55
p(20 < X 30) = (0,24)- (-0,56) = 0,5948 - 0,2877 = 0,3071
p(20 < X 30) = p(

30 27
40 27
<Z
)
12,55
12,55
p(30 < X 40) = (1,04)- (0,24) = 0,8508 0,5948 = 0,2560
p(30 < X 40) = p(

40 27
50 27
<Z
)
12,55
12,55
p(40 < X 50) = (1,83)- (1,04) = 0,9664 0,8508 = 0,1156
p(40 < X 50) = p(

Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
Tranches de notes
Note 10
10 < Note 20
20 < Note 30
30 < Note 40
40 < Note 50

ni
10
20
30
20
20

pi
0,0885
0,1992
0,3071
0,2560
0,1156

npi
8,85
19,92
30,71
25,6
11,56

Les effectifs thoriques sont tous suprieurs 5, on peut calculer la variable de dcision :
k
n i2
VD
n
i 1 npi

VD

10 2
20 2
30 2
20 2 20 2

100 10,91
8,85 19,92 30,71 25,6 11,56

Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
a) Pour = 0,05, la valeur de 1- avec 2 (5-2-1) degrs de libert est : 0,95 = 5,991
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
Cest--dire quau seuil de 5 %, il nest pas justifi de considrer que la distribution des notes
suit une loi normale dans la population de tous les candidats.
b) Pour = 0,001, la valeur de

12 avec 2 degrs de libert est : 02,999 13,82 .

233

Statistiques dcisionnelles.

11. Tests non paramtriques

La valeur de la variable de dcision est infrieure

12 , on accepte donc lhypothse nulle.

Cest--dire quau seuil de 1 %, il est justifi de considrer que la distribution des notes suit
une loi normale dans la population de tous les candidats.
11.4.3. Solution de lexercice 11.3.3.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution thorique.
Hypothse nulle :
H0 : ni = npi

i 1

i 1

n i = npi = n

avec

Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi.
Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
Sexe

Hommes
Femmes
Effectifs Effectifs Effectifs Effectifs Total
Niveau dinstruction
thoriques observs thoriques observs
Aucun
67,2
61
104
112
173
Primaire
57,6
54
52
48
102
Secondaire
28,8
35
20,8
25
60
Formation professionnelle
24,96
27
20,8
17
44
Suprieur
13,44
15
10,4
6
21
Total
192
192
208
208
400
Les effectifs thoriques sont tous suprieurs 5, on peut calculer la variable de dcision :

VD

i 1

612
54 2

67,2 57,6
112 2 48 2
25 2

104
52
20,8
VD

n i2
n
npi

35 2
27 2
15 2

28,8 24,96 13,44


17 2
62

400 6,8
20,8 10,4

234

Statistiques dcisionnelles.

11. Tests non paramtriques

Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Pour = 0,05, la valeur de 1- avec 9 degrs de libert est : 0,95 = 16,919
La valeur de la variable de dcision est infrieure 1- , on accepte donc lhypothse nulle.
Cest--dire quau seuil de 5%, lchantillon prlev est reprsentatif de la population tudie.
11.4.4. Solution de lexercice 11.3.4.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution de Poisson.
Hypothse nulle :
H0 : ni = npi

i 1

i 1

n i = npi = n

avec

Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi. On doit
calculer alors les probabilits pi en utilisant la loi de Poisson.

On doit estimer le paramtre de la loi de Poisson en calculant la moyenne observe

n i x i 1.0 4.112.2... 2.10


=
= 4,42
100
n i

En utilisant la formule de la loi de Poisson, on trouve les probabilits suivantes :


p(x) = e-4,42 . 4,42x / x !
Distribution de la variable de Poisson
x
0
1
2
3
4
5
6
7

p(x)
0,0120
0,0532
0,1176
0,1732
0,1914
0,1692
0,1246
0,0787
235

n pi
1,20
5,32
11,76
17,32
19,14
16,92
12,46
7,87

x.

Statistiques dcisionnelles.

11. Tests non paramtriques

8
9
10

0,0435
0,0214
0,0094

4,35
2,14
0,94

Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
x
0
1
2
3
4
5
6
7
8
9
10
Total

ni
1
4
12
18
22
17
11
6
4
3
2
100

n pi
1,20
5,32
11,76
17,32
19,14
16,92
12,46
7,87
4,35
2,14
0,94

Les effectifs thoriques infrieurs 5 doivent tre regroups. On obtient les effectifs suivants :
x
0 ou 1
2
3
4
5
6
7
8 ou plus
Total

ni
5
12
18
22
17
11
6
9
100

n pi
6,52
11,76
17,32
19,14
16,92
12,46
7,87
7,43

On peut calculer la variable de dcision :

VD

i 1

n i2
n
npi

5
12 2
18 2
22 2

6,52 11,76 17,32 19,14


2
17
112
62
92

100 2,34
16,92 12,46 7,87 7,43
VD

236

Statistiques dcisionnelles.

Rgion dacceptation :
La rgion dacceptation est lintervalle

11. Tests non paramtriques

0 ; .
2
1

Pour = 0,05, la valeur de 1- avec (8-1-1)=6 degrs de libert est : 0,95 = 12,592
La valeur de la variable de dcision est infrieure 1- , on accepte donc lhypothse nulle.
Cest--dire quon peut affirmer au seuil de signification de 5 % que le nombre de personnes
qui se prsentent un guichet automatique bancaire, pendant un intervalle de temps de 5
minutes suit une loi de Poisson.
11.4.5. Solution de lexercice 11.3.5.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution normale.
Hypothse nulle :
H0 : ni = npi

avec

i 1

i 1

n i = npi = n

Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi. On doit
calculer alors les probabilits pi en utilisant la loi normale.
La loi normale est de moyenne 7,75 et dcart type 0,94.
Calculons les probabilits :

5,25 7,75
5,75 7,75
<Z
)
0,94
0,94
p(5,25 < X 5,75) = (-2,13)-(-2,66)=0,0166-0,0039= 0,0127
p(5,25 < X 5,75) = p(

5,75 7,75
6,25 7,75
<Z
)
0,94
0,94
p(5,75 < X 6,25) = (-1,60)-(-2,13)=0,0548-0,0166= 0,0382
p(5,75 < X 6,25) = p(

6,25 7,75
6,75 7,75
<Z
)
0,94
0,94
p(6,25 < X 6,75) = (-1,06)-(-1,60)=0,1446-0,0548= 0,0898
p(6,25 < X 6,75) = p(

p(6,75 < X 7,25) = p(

6,75 7,75
7,25 7,75
<Z
)
0,94
0,94
237

Statistiques dcisionnelles.

11. Tests non paramtriques

p(6,75 < X 7,25) = (-0,53)-(-1,06)=0,2981-0,1446= 0,1535

7,25 7,75
7,75 7,75
<Z
)
0,94
0,94
p(7,25 < X 7,75) = (0)- (-0,53) = 0,5-0,2981 = 0,2019
p(7,25 < X 7,75) = p(

7,75 7,75
8,25 7,75
<Z
)
0,94
0,94
p(7,75 < X 8,25) = (0,53)- (0) = 0,7019-0,5 = 0,2019
p(7,75 < X 8,25) = p(

8,25 7,75
8,75 7,75
<Z
)
0,94
0,94
p(8,25 < X 8,75) = (1,06)- (0,53)=0,8554-0,7019 = 0,1535
p(8,25 < X 8,75) = p(

8,75 7,75
9,25 7,75
<Z
)
0,94
0,94
p(8,75 < X 9,25) = (1,60)- (1,06)=0,9452-0,8554 = 0,0898
p(8,75 < X 9,25) = p(

9,25 7,75
9,75 7,75
<Z
)
0,94
0,94
p(9,25 < X 9,75) = (2,13)- (1,60)=0,9834-0,9452 = 0,0382
p(9,25 < X 9,75) = p(

Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.
longueur en mm
[5,25 ; 5,75[
[5,75 ; 6,25[
[6,25 ; 6,75[
[6,75 ; 7,25[
[7,25 ; 7,75[
[7,75 ; 8,25[
[8,25 ; 8,75[
[8,75 ; 9,25[
[9,25 ; 9,75[

ni
1
6
6
9
15
17
10
8
3

pi
0,0127
0,0382
0,0898
0,1535
0,2019
0,2019
0,1535
0,0898
0,0382

npi
0,9525
2,8650
6,735
11,5125
15,1425
15,1425
11,5125
6,735
2,865

Les effectifs thoriques infrieurs 5 doivent tre regroups. On obtient les effectifs suivants :
longueur en mm
[5,25 ; 6,75[
[6,75 ; 7,25[
[7,25 ; 7,75[

ni
13
9
15
238

npi
10,5525
11,5125
15,1425

Statistiques dcisionnelles.

11. Tests non paramtriques

[7,75 ; 8,25[
[8,25 ; 8,75[
[8,75 ; 9,75[

17
10
11

15,1425
11,5125
9,6

On peut calculer la variable de dcision :

VD

n i2

npi n
i 1

VD

13 2
92
15 2
17 2

10,5525 11,5125 15,1425 15,1425

10 2
112

75 3,26
11,5125 9,6

Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Pour = 0,05, la valeur de 1- avec 5 degrs de libert est :
0,95 = 11,07
La valeur de la variable de dcision est infrieure 1- , on accepte donc lhypothse nulle.
Cest--dire quau seuil de 5 %, on peut ajuster cette distribution la loi normale de moyenne
7,75 mm, et dcart type 0,94 mm.
11.4.6. Solution de lexercice 11.3.6.
Pour rpondre cette question, on doit raliser un test dajustement dans le but de comparer la
distribution observe la distribution thorique.
Hypothse nulle :
H0 : ni = npi

avec

i 1

i 1

n i = npi = n

Variable de dcision :
Pour comparer la distribution thorique et la distribution observe, on est amen confronter
les effectifs observs ni et les effectifs attendus ou thoriques correspondants npi.
Le tableau suivant regroupe les effectifs observs ni et les effectifs attendus ou thoriques
correspondants npi.

239

Statistiques dcisionnelles.

11. Tests non paramtriques

Groupes sanguins
Effectifs observs
Effectifs thoriques

O
251
233,625

A
219
231

B
29
42

AB
26
18,375

Les effectifs thoriques sont tous suprieurs 5, on peut calculer la variable de dcision :

n i2
n
i 1 npi
k

VD

VD

2512
219 2 29 2
26 2

525 9,10
233,625
231
42 18,375

Rgion dacceptation :
La rgion dacceptation est lintervalle

0 ; .
2
1

- Pour = 0,05, la valeur de 1- avec 3 degrs de libert est :


0,95 = 7,815
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
Cest--dire quau seuil de signification de 5%, les 525 donneurs ne sont pas reprsentatifs de
la population marocaine en terme de groupes sanguins.
- Pour = 0,01, la valeur de

12 avec 3 degrs de libert est : 02,99 11,34 .

La valeur de la variable de dcision est infrieure

12 , on accepte donc lhypothse nulle.

Cest--dire quau seuil de 1 %, les 525 donneurs sont reprsentatifs de la population


marocaine en terme de groupes sanguins.
11.4.7. Solution de lexercice 11.3.7.
Pour rpondre cette question, on doit raliser un test dindpendance.
Hypothse nulle :
Lhypothse nulle est lindpendance des deux critres de classification.
^

H0 : nij = n pij
Variable de dcision :
Les effectifs attendus sont estims par la formule :
^

n pij =

n i.n .j
n

240

Statistiques dcisionnelles.

Niveau
dinstruction
Primaire
Secondaire
Suprieur
Total
p

VD =

11. Tests non paramtriques

Destination de vacances
Mer
Montagne
Dsert
270
112,5
67,5
210
87,5
52,5
120
50
30
600
250
150

n
i 1 j1

ij
^

n pij

-n=

Total
450
350
200
1000

300 50 100 250 ... 30 - 1000


270 112,5 67,5 210
30
VD = 220,91

Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Le nombre de degrs de libert est gal (3-1)(3-1) = 4.
Pour = 0,05, la valeur de 1- avec 4 degrs de libert est : 0,95 = 9,49.
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
On conclut donc que le niveau dinstruction a une influence sur le choix dune destination
touristique.
11.4.8. Solution de lexercice 11.3.8.
Pour rpondre cette question, on doit raliser un test dindpendance.
Hypothse nulle :
Lhypothse nulle est lindpendance des deux critres de classification.
^

H0 : nij = n pij
Variable de dcision :
Les effectifs attendus sont estims par la formule :
^

n pij =

n i.n .j
n

241

Statistiques dcisionnelles.

11. Tests non paramtriques

Niveau daccueil
Faible
Modr
Elev
Total
p

VD =

i 1

j 1

n ij
^

n p ij

-n=

Rgions
Est
Sud
21,47 6,02
59,21 16,60
26,32 7,38
107
30

Nord
26,28
72,49
32,22
131

Ouest Total
8,23
62
22,69 171
10,08
76
41
309

22 35 0 5 ... 12 -309
226,28 21,47 6,02 8,23
10,08
VD = 41,15

Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Le nombre de degrs de libert est gal (3-1)(4-1) = 6.
Pour = 0,05, la valeur de 1- avec 6 degrs de libert est : 0,95 = 12,59
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
On conclut que le niveau daccueil dpend de la rgion.
11.4.9. Solution de lexercice 11.3.9.
Pour rpondre cette question, on doit raliser un test dindpendance.
Hypothse nulle :
Lhypothse nulle est lindpendance des deux critres de classification.
^

H0 : nij = n pij
Variable de dcision :
Les effectifs attendus sont estims par la formule :
^

n pij =
Sexe
Fille
Garon
Total

Sport
33,6
29,4
63

n i.n .j
n

Discipline
Musique
23,47
20,53
44

242

Thtre
29,93
20,07
43

Total
80
70
150

Statistiques dcisionnelles.

11. Tests non paramtriques

VD =

VD =

n ij

i 1

j 1

n p ij

-n

20
28
32
43
16
11
- 150

33,6 23,47 29,93 29,4 20,53 20,07


VD = 10,9

Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Le nombre de degrs de libert est gal (3-1)(2-1) = 2.
- Pour = 0,05, la valeur de 1- avec 2 degrs de libert est : 0,95 = 5,99
La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
On peut affirmer au seuil de 5 % que le choix des tudiants dpend de leur sexe.
- Pour = 0,001, la valeur de

12 avec 2 degrs de libert est 02,999 13,82 .


12 , on accepte donc lhypothse nulle.

La valeur de la variable de dcision est infrieure

On peut affirmer au seuil de 1 % que le choix des tudiants est indpendant du sexe.
11.4.10. Solution de lexercice 11.3.10.
Pour rpondre cette question, on doit raliser un test dindpendance.
Hypothse nulle :
Lhypothse nulle est lindpendance des deux critres de classification.
^

H0 : nij = n pij
Variable de dcision :
Les effectifs attendus sont estims par la formule :
^

n pij =

n i.n .j
n

Filire
Sciences
Mdecine et
Droit
LettresSciences
PharmacieAutre Total
Profession
conomiques
dentaire
Exploitant agricole 81,4
32,6
158,1 76,1
102,5
20,6
39,7 511
Salari agricole
6,2
2,5
12,1
5,8
7,8
1,6
3,0
39
Patron
164,8
66,0
320,2 154,2
207,5
41,8
80,4 1035
243

Statistiques dcisionnelles.

Profession librale
et cadre sup
Cadre moyen
Employ
Ouvriers
Personnel de
service
Autres
Total

11. Tests non paramtriques

482,5

193,4

937,8

451,6

607,7

122,5

235,5 3031

247,1
135,3
180,1

99,0
54,2
72,2

480,2
263,0
349,9

231,2
126,7
168,5

311,2
170,4
226,8

62,7
34,3
45,7

120,6 1552
66,0 850
87,9 1131

12,7

5,1

24,8

11,9

16,0

3,2

281,9
1592

113,0
638

547,9
3094

263,9
1490

355,1
2005

71,5
404

VD =

VD =

n ij

i 1

j 1

n p ij

6,2

80

137,6 1771
777 10000

-n

80
35 135 99
65
132
- 10000

...
81,4 32,6 158,1 76,1 102,5
137,6
VD = 450,3

Rgion dacceptation :
La rgion dacceptation est lintervalle [0 ; 1-[.
Le nombre de degrs de libert est gal (7-1)(9-1) = 48.
Le nombre de degrs de libert tant grand, on peut utiliser lapproximation par la loi normale.
Pour amliorer lapproximation, on peut utiliser la transformation suivante :

( Z 2k 1)
2

do :

0 , 95

( Z 0 , 95 2 48 1)
2

(1,64 2 48 1)
= 64,8
2

Pour = 0,05, la valeur de 1- avec 48 degrs de libert est : 0,95 = 64,8


La valeur de la variable de dcision est suprieure 1- , on rejette donc lhypothse nulle.
On peut affirmer au seuil de 5 %, quil y a un lien entre la filire dtude et la profession des
parents.

244

Statistiques dcisionnelles.

Tables statistiques
Loi Normale
Loi de Khi deux
Loi de Student
Loi de Fischer

245

LOI NORMALE CENTREE REDUITE L(X) = N(0 ; 1)


z
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3

0,00
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,9987

0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,9987

0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,9987

0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,9988

Probabilit P(Z<=z)
0,04
0,05
0,5160
0,5199
0,5557
0,5596
0,5948
0,5987
0,6331
0,6368
0,6700
0,6736
0,7054
0,7088
0,7389
0,7422
0,7704
0,7734
0,7995
0,8023
0,8264
0,8289
0,8508
0,8531
0,8729
0,8749
0,8925
0,8944
0,9099
0,9115
0,9251
0,9265
0,9382
0,9394
0,9495
0,9505
0,9591
0,9599
0,9671
0,9678
0,9738
0,9744
0,9793
0,9798
0,9838
0,9842
0,9875
0,9878
0,9904
0,9906
0,9927
0,9929
0,9945
0,9946
0,9959
0,9960
0,9969
0,9970
0,9977
0,9978
0,9984
0,9984
0,9988
0,9989

0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,9989

0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,9989

0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,9990

0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
0,9990

LOI NORMALE CENTREE REDUITE L(X) = N(0 ; 1)


z
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9

0,00
0,99903
0,99931
0,99952
0,99966
0,99977
0,99984
0,99989
0,99993
0,99995

0,01
0,99906
0,99934
0,99953
0,99968
0,99978
0,99985
0,99990
0,99993
0,99995

0,02
0,99910
0,99936
0,99955
0,99969
0,99978
0,99985
0,99990
0,99993
0,99996

0,03
0,99913
0,99938
0,99957
0,99970
0,99979
0,99986
0,99990
0,99994
0,99996

Probabilit P(Z<=z)
0,04
0,05
0,99916
0,99918
0,99940
0,99942
0,99958
0,99960
0,99971
0,99972
0,99980
0,99981
0,99986
0,99987
0,99991
0,99991
0,99994
0,99994
0,99996
0,99996

0,06
0,99921
0,99944
0,99961
0,99973
0,99981
0,99987
0,99992
0,99994
0,99996

0,07
0,99924
0,99946
0,99962
0,99974
0,99982
0,99988
0,99992
0,99995
0,99996

0,08
0,99926
0,99948
0,99964
0,99975
0,99983
0,99988
0,99992
0,99995
0,99997

0,09
0,99929
0,99950
0,99965
0,99976
0,99983
0,99989
0,99992
0,99995
0,99997

LOI DU KHI 2
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

0,001
0,000
0,002
0,024
0,091
0,210
0,381
0,599
0,857
1,152
1,479
1,834
2,214
2,617
3,041
3,483
3,942
4,416
4,905
5,407
5,921
6,447
6,983
7,529
8,085
8,649
9,222
9,803
10,391
10,986
11,588

0,005
0,000
0,010
0,072
0,207
0,412
0,676
0,989
1,344
1,735
2,156
2,603
3,074
3,565
4,075
4,601
5,142
5,697
6,265
6,844
7,434
8,034
8,643
9,260
9,886
10,520
11,160
11,808
12,461
13,121
13,787

A l'intersection de la ligne k=1 et de la colonne 0,025 on lit 0,025=P(Khi deux(1)<=0,001)


0,01
0,025
0,05
0,1
0,5
0,9
0,95
0,975
0,99
0,000
0,001
0,004
0,016
0,455
2,706
3,841
5,024
6,635
0,020
0,051
0,103
0,211
1,386
4,605
5,991
7,378
9,210
0,115
0,216
0,352
0,584
2,366
6,251
7,815
9,348
11,345
0,297
0,484
0,711
1,064
3,357
7,779
9,488
11,143
13,277
0,554
0,831
1,145
1,610
4,351
9,236
11,070
12,832
15,086
0,872
1,237
1,635
2,204
5,348
10,645
12,592
14,449
16,812
1,239
1,690
2,167
2,833
6,346
12,017
14,067
16,013
18,475
1,647
2,180
2,733
3,490
7,344
13,362
15,507
17,535
20,090
2,088
2,700
3,325
4,168
8,343
14,684
16,919
19,023
21,666
2,558
3,247
3,940
4,865
9,342
15,987
18,307
20,483
23,209
3,053
3,816
4,575
5,578
10,341
17,275
19,675
21,920
24,725
3,571
4,404
5,226
6,304
11,340
18,549
21,026
23,337
26,217
4,107
5,009
5,892
7,041
12,340
19,812
22,362
24,736
27,688
4,660
5,629
6,571
7,790
13,339
21,064
23,685
26,119
29,141
5,229
6,262
7,261
8,547
14,339
22,307
24,996
27,488
30,578
5,812
6,908
7,962
9,312
15,338
23,542
26,296
28,845
32,000
6,408
7,564
8,672
10,085
16,338
24,769
27,587
30,191
33,409
7,015
8,231
9,390
10,865
17,338
25,989
28,869
31,526
34,805
7,633
8,907
10,117
11,651
18,338
27,204
30,144
32,852
36,191
8,260
9,591
10,851
12,443
19,337
28,412
31,410
34,170
37,566
8,897
10,283
11,591
13,240
20,337
29,615
32,671
35,479
38,932
9,542
10,982
12,338
14,041
21,337
30,813
33,924
36,781
40,289
10,196
11,689
13,091
14,848
22,337
32,007
35,172
38,076
41,638
10,856
12,401
13,848
15,659
23,337
33,196
36,415
39,364
42,980
11,524
13,120
14,611
16,473
24,337
34,382
37,652
40,646
44,314
12,198
13,844
15,379
17,292
25,336
35,563
38,885
41,923
45,642
12,878
14,573
16,151
18,114
26,336
36,741
40,113
43,195
46,963
13,565
15,308
16,928
18,939
27,336
37,916
41,337
44,461
48,278
14,256
16,047
17,708
19,768
28,336
39,087
42,557
45,722
49,588
14,953
16,791
18,493
20,599
29,336
40,256
43,773
46,979
50,892

0,995
7,879
10,597
12,838
14,860
16,750
18,548
20,278
21,955
23,589
25,188
26,757
28,300
29,819
31,319
32,801
34,267
35,718
37,156
38,582
39,997
41,401
42,796
44,181
45,558
46,928
48,290
49,645
50,994
52,335
53,672

0,999
10,827
13,815
16,266
18,466
20,515
22,457
24,321
26,124
27,877
29,588
31,264
32,909
34,527
36,124
37,698
39,252
40,791
42,312
43,819
45,314
46,796
48,268
49,728
51,179
52,619
54,051
55,475
56,892
58,301
59,702

LOI DE STUDENT
k
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

Probabilit P(T<=z)=p
0,6
0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260
0,260
0,259
0,259
0,258
0,258
0,258
0,257
0,257
0,257
0,257
0,257
0,256
0,256

0,7
0,727
0,617
0,584
0,569
0,559
0,553
0,549
0,546
0,543
0,542
0,540
0,539
0,538
0,537
0,536
0,535
0,534
0,534
0,533
0,533
0,532
0,532
0,532

0,8
1,376
1,061
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
0,859
0,858
0,858

0,9
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319

0,95
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714

0,975
12,71
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069

0,99
31,82
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500

0,995
63,66
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807

Statistiques dcisionnelles.
0,256
24
0,256
25
0,256
26

0,531
0,531
0,531

0,857
0,856
0,856

1,318
1,316
1,315

250

1,711
1,708
1,706

2,064
2,060
2,056

2,492
2,485
2,479

2,797
2,787
2,779

LOI DE STUDENT
k
27
28
29
30
40
60
80
100
200
500

Probabilit P(T<=z)=p
0,6
0,256
0,256
0,256
0,256
0,255
0,254
0,254
0,254
0,254
0,253
0,253

0,7
0,531
0,530
0,530
0,530
0,529
0,527
0,527
0,526
0,525
0,525
0,524

0,8
0,855
0,855
0,854
0,854
0,851
0,848
0,846
0,845
0,843
0,842
0,842

0,9
1,314
1,313
1,311
1,310
1,303
1,296
1,292
1,290
1,286
1,283
1,282

0,95
1,703
1,701
1,699
1,697
1,684
1,671
1,664
1,660
1,653
1,648
1,645

0,975
2,052
2,048
2,045
2,042
2,021
2,000
1,990
1,984
1,972
1,965
1,960

0,99
2,473
2,467
2,462
2,457
2,423
2,390
2,374
2,365
2,345
2,334
2,326

0,995
2,771
2,763
2,756
2,750
2,704
2,660
2,639
2,626
2,601
2,586
2,576

LOI DE FISHER
Probabilit P(F<=z) = 0,95

K2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500

K1
1
161
18,5
10,1
7,71
6,61
5,99
5,59
5,32
5,12
4,96
4,84
4,75
4,67
4,60
4,54
4,49
4,45
4,41
4,38
4,35
4,30
4,26
4,23
4,20
4,17
4,03
3,94
3,89
3,86
3,84

2
200
19,0
9,55
6,94
5,79
5,14
4,74
4,46
4,26
4,10
3,98
3,89
3,81
3,74
3,68
3,63
3,59
3,55
3,52
3,49
3,44
3,40
3,37
3,34
3,32
3,18
3,09
3,04
3,01
3,00

3
216
19,2
9,28
6,59
5,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,05
3,01
2,98
2,95
2,92
2,79
2,70
2,65
2,62
2,60

4
225
19,2
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
3,36
3,26
3,18
3,11
3,06
3,01
2,96
2,93
2,90
2,87
2,82
2,78
2,74
2,71
2,69
2,56
2,46
2,42
2,39
2,37

5
230
19,3
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,03
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,66
2,62
2,59
2,56
2,53
2,40
2,31
2,26
2,23
2,21

6
234
19,3
8,94
6,16
4,95
4,28
3,87
3,58
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,55
2,51
2,47
2,45
2,42
2,29
2,19
2,14
2,12
2,10

7
237
19,4
8,89
6,09
4,88
4,21
3,79
3,50
3,29
3,14
3,01
2,91
2,83
2,76
2,71
2,66
2,61
2,58
2,54
2,51
2,46
2,42
2,39
2,36
2,33
2,20
2,10
2,06
2,03
2,01

8
239
19,4
8,85
6,04
4,82
4,15
3,73
3,44
3,23
3,07
2,95
2,85
2,77
2,70
2,64
2,59
2,55
2,51
2,48
2,45
2,40
2,36
2,32
2,29
2,27
2,13
2,03
1,98
1,96
1,94

9
241
19,4
8,81
6,00
4,77
4,10
3,68
3,39
3,18
3,02
2,90
2,80
2,71
2,65
2,59
2,54
2,49
2,46
2,42
2,39
2,34
2,30
2,27
2,24
2,21
2,07
1,97
1,93
1,90
1,88

10
242
19,4
8,79
5,96
4,74
4,06
3,64
3,35
3,14
2,98
2,85
2,75
2,67
2,60
2,54
2,49
2,45
2,41
2,38
2,35
2,30
2,25
2,22
2,19
2,16
2,03
1,93
1,88
1,85
1,83

15
246
19,4
8,70
5,86
4,62
3,94
3,51
3,22
3,01
2,85
2,72
2,62
2,53
2,46
2,40
2,35
2,31
2,27
2,23
2,20
2,15
2,11
2,07
2,04
2,01
1,87
1,77
1,72
1,69
1,67

20
248
19,4
8,66
5,80
4,56
3,87
3,44
3,15
2,94
2,77
2,65
2,54
2,46
2,39
2,33
2,28
2,23
2,19
2,16
2,12
2,07
2,03
1,99
1,96
1,93
1,78
1,68
1,62
1,59
1,57

30
250
19,5
8,62
5,75
4,50
3,81
3,38
3,08
2,86
2,70
2,57
2,47
2,38
2,31
2,25
2,19
2,15
2,11
2,07
2,04
1,98
1,94
1,90
1,87
1,84
1,69
1,57
1,52
1,48
1,46

50
252
19,5
8,58
5,70
4,44
3,75
3,32
3,02
2,80
2,64
2,51
2,40
2,31
2,24
2,18
2,12
2,08
2,04
2,00
1,97
1,91
1,86
1,82
1,79
1,76
1,60
1,48
1,41
1,38
1,35

100
253
19,5
8,55
5,66
4,41
3,71
3,27
2,97
2,76
2,59
2,46
2,35
2,26
2,19
2,12
2,07
2,02
1,98
1,94
1,91
1,85
1,80
1,76
1,73
1,70
1,52
1,39
1,32
1,28
1,24

200
254
19,5
8,54
5,65
4,39
3,69
3,25
2,95
2,73
2,56
2,43
2,32
2,23
2,16
2,10
2,04
1,99
1,95
1,91
1,88
1,82
1,77
1,73
1,69
1,66
1,48
1,34
1,26
1,21
1,17

500
254
19,5
8,53
5,64
4,37
3,68
3,24
2,94
2,72
2,55
2,42
2,31
2,22
2,14
2,08
2,02
1,97
1,93
1,89
1,86
1,80
1,75
1,71
1,67
1,64
1,46
1,31
1,22
1,16
1,11

254
19,5
8,53
5,63
4,37
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,78
1,73
1,69
1,65
1,62
1,44
1,28
1,19
1,11
1,00

LOI DE FISHER

K2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500

Probabilit P(F<=z) = 0,975


K1
1
648
38,5
17,4
12,2
10,0
8,81
8,07
7,57
7,21
6,94
6,72
6,55
6,41
6,30
6,20
6,12
6,04
5,98
5,92
5,87
5,79
5,72
5,66
5,61
5,57
5,34
5,18
5,10
5,05
5,02

2
800
39,0
16,0
10,6
8,43
7,26
6,54
6,06
5,71
5,46
5,26
5,10
4,97
4,86
4,76
4,69
4,62
4,56
4,51
4,46
4,38
4,32
4,27
4,22
4,18
3,98
3,83
3,76
3,72
3,69

3
864
39,2
15,4
9,98
7,76
6,60
5,89
5,42
5,08
4,83
4,63
4,47
4,35
4,24
4,15
4,08
4,01
3,95
3,90
3,86
3,78
3,72
3,67
3,63
3,59
3,39
3,25
3,18
3,14
3,12

4
900
39,2
15,1
9,60
7,39
6,23
5,52
5,05
4,72
4,47
4,28
4,12
4,00
3,89
3,80
3,73
3,66
3,61
3,56
3,51
3,44
3,38
3,33
3,29
3,25
3,06
2,92
2,85
2,81
2,79

5
922
39,3
14,9
9,36
7,15
5,99
5,29
4,82
4,48
4,24
4,04
3,89
3,77
3,66
3,58
3,50
3,44
3,38
3,33
3,29
3,22
3,15
3,10
3,06
3,03
2,83
2,70
2,63
2,59
2,57

6
937
39,3
14,7
9,20
6,98
5,82
5,12
4,65
4,32
4,07
3,88
3,73
3,60
3,50
3,41
3,34
3,28
3,22
3,17
3,13
3,05
2,99
2,94
2,90
2,87
2,67
2,54
2,47
2,43
2,41

7
948
39,4
14,6
9,07
6,85
5,70
4,99
4,53
4,20
3,95
3,76
3,61
3,48
3,38
3,29
3,22
3,16
3,10
3,05
3,01
2,93
2,87
2,82
2,78
2,75
2,55
2,42
2,35
2,31
2,29

8
957
39,4
14,5
8,98
6,76
5,60
4,90
4,43
4,10
3,85
3,66
3,51
3,39
3,29
3,20
3,12
3,06
3,01
2,96
2,91
2,84
2,78
2,73
2,69
2,65
2,46
2,32
2,26
2,22
2,19

9
963
39,4
14,5
8,90
6,68
5,52
4,82
4,36
4,03
3,78
3,59
3,44
3,31
3,21
3,12
3,05
2,98
2,93
2,88
2,84
2,76
2,70
2,65
2,61
2,57
2,38
2,24
2,18
2,14
2,11

10
969
39,4
14,4
8,84
6,62
5,46
4,76
4,30
3,96
3,72
3,53
3,37
3,25
3,15
3,06
2,99
2,92
2,87
2,82
2,77
2,70
2,64
2,59
2,55
2,51
2,32
2,18
2,11
2,07
2,05

15
985
39,4
14,3
8,66
6,43
5,27
4,57
4,10
3,77
3,52
3,33
3,18
3,05
2,95
2,86
2,79
2,72
2,67
2,62
2,57
2,50
2,44
2,39
2,34
2,31
2,11
1,97
1,90
1,86
1,83

20
993
39,4
14,2
8,56
6,33
5,17
4,47
4,00
3,67
3,42
3,23
3,07
2,95
2,84
2,76
2,68
2,62
2,56
2,51
2,46
2,39
2,33
2,28
2,23
2,20
1,99
1,85
1,78
1,74
1,71

30
1001
39,5
14,1
8,46
6,23
5,07
4,36
3,89
3,56
3,31
3,12
2,96
2,84
2,73
2,64
2,57
2,50
2,44
2,39
2,35
2,27
2,21
2,16
2,11
2,07
1,87
1,71
1,64
1,60
1,57

50
1008
39,5
14,0
8,38
6,14
4,98
4,28
3,81
3,47
3,22
3,03
2,87
2,74
2,64
2,55
2,47
2,41
2,35
2,30
2,25
2,17
2,11
2,05
2,01
1,97
1,75
1,59
1,51
1,46
1,43

100
1013
39,5
14,0
8,32
6,08
4,92
4,21
3,74
3,40
3,15
2,96
2,80
2,67
2,56
2,47
2,40
2,33
2,27
2,22
2,17
2,09
2,02
1,97
1,92
1,88
1,66
1,48
1,39
1,34
1,30

200
1016
39,5
13,9
8,29
6,05
4,88
4,18
3,70
3,37
3,12
2,92
2,76
2,63
2,53
2,44
2,36
2,29
2,23
2,18
2,13
2,05
1,98
1,92
1,88
1,84
1,60
1,42
1,32
1,25
1,21

500
1017
39,5
13,9
8,27
6,03
4,86
4,16
3,68
3,35
3,09
2,90
2,74
2,61
2,50
2,41
2,33
2,26
2,20
2,15
2,10
2,02
1,95
1,90
1,85
1,81
1,57
1,38
1,27
1,19
1,13

1018
39,5
13,9
8,26
6,02
4,85
4,14
3,67
3,33
3,08
2,88
2,72
2,60
2,49
2,40
2,32
2,25
2,19
2,13
2,09
2,00
1,94
1,88
1,83
1,79
1,55
1,35
1,23
1,14
1,00

LOI DE FISHER

K
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500

Probabilit P(F<=z) = 0,99


K1
1
2
3
4
4050
5000
5400
5630
98,5
99,0
99,2
99,2
34,1
30,8
29,5
28,7
21,2
18,0
16,7
16,0
16,3
13,3
12,1
11,4
13,7
10,9
9,78
9,15
12,2
9,55
8,45
7,85
11,3
8,65
7,59
7,01
10,6
8,02
6,99
6,42
10,0
7,56
6,55
5,99
9,65
7,21
6,22
5,67
9,33
6,93
5,95
5,41
9,07
6,70
5,74
5,21
8,86
6,51
5,56
5,04
8,68
6,36
5,42
4,89
8,53
6,23
5,29
4,77
8,40
6,11
5,18
4,67
8,29
6,01
5,09
4,58
8,18
5,93
5,01
4,50
8,10
5,85
4,94
4,43
7,95
5,72
4,82
4,31
7,82
5,61
4,72
4,22
7,72
5,53
4,64
4,14
7,64
5,45
4,57
4,07
7,56
5,39
4,51
4,02
7,17
5,06
4,20
3,72
6,90
4,82
3,98
3,51
6,76
4,71
3,88
3,41
6,69
4,65
3,82
3,36
6,63
4,61
3,78
3,32

5
5760
99,3
28,2
15,5
11,0
8,75
7,46
6,63
6,06
5,64
5,32
5,06
4,86
4,70
4,56
4,44
4,34
4,25
4,17
4,10
3,99
3,90
3,82
3,75
3,70
3,41
3,21
3,11
3,05
3,02

6
5860
99,3
27,9
15,2
10,7
8,47
7,19
6,37
5,80
5,39
5,07
4,82
4,62
4,46
4,32
4,20
4,10
4,01
3,94
3,87
3,76
3,67
3,59
3,53
3,47
3,19
2,99
2,89
2,84
2,80

7
5930
99,4
27,7
15,0
10,5
8,26
6,99
6,18
5,61
5,20
4,89
4,64
4,44
4,28
4,14
4,03
3,93
3,84
3,77
3,70
3,59
3,50
3,42
3,36
3,30
3,02
2,82
2,73
2,68
2,64

8
5980
99,4
27,5
14,8
10,3
8,10
6,84
6,03
5,47
5,06
4,74
4,50
4,30
4,14
4,00
3,89
3,79
3,71
3,63
3,56
3,45
3,36
3,29
3,23
3,17
2,89
2,69
2,60
2,55
2,51

9
6020
99,4
27,3
14,7
10,2
7,98
6,72
5,91
5,35
4,94
4,63
4,39
4,19
4,03
3,89
3,78
3,68
3,60
3,52
3,46
3,35
3,26
3,18
3,12
3,07
2,79
2,59
2,50
2,44
2,41

10
6060
99,4
27,2
14,5
10,1
7,87
6,62
5,81
5,26
4,85
4,54
4,30
4,10
3,94
3,80
3,69
3,59
3,51
3,43
3,37
3,26
3,17
3,09
3,03
2,98
2,70
2,50
2,41
2,36
2,32

15
6160
99,4
26,9
14,2
9,72
7,56
6,31
5,52
4,96
4,56
4,25
4,01
3,82
3,66
3,52
3,41
3,31
3,23
3,15
3,09
2,98
2,89
2,82
2,75
2,70
2,42
2,22
2,13
2,07
2,04

20
6210
99,4
26,7
14,0
9,55
7,40
6,16
5,36
4,81
4,41
4,10
3,86
3,66
3,51
3,37
3,26
3,16
3,08
3,00
2,94
2,83
2,74
2,66
2,60
2,55
2,27
2,07
1,97
1,92
1,88

30
6260
99,5
26,5
13,8
9,38
7,23
5,99
5,20
4,65
4,25
3,94
3,70
3,51
3,35
3,21
3,10
3,00
2,92
2,84
2,78
2,67
2,58
2,50
2,44
2,39
2,10
2,1,89
1,79
1,74
1,70

50
6300
99,5
26,4
13,7
9,24
7,09
5,86
5,07
4,52
4,12
3,81
3,57
3,38
3,22
3,08
2,97
2,87
2,78
2,71
2,64
2,53
2,44
2,36
2,30
2,25
1,95
1,73
1,63
1,56
1,52

100
6330
99,5
26,2
13,6
9,13
6,99
5,75
4,96
4,42
4,01
3,71
3,47
3,27
3,11
2,98
2,86
2,76
2,68
2,60
2,54
2,42
2,33
2,25
2,19
2,13
1,82
1,60
1,48
1,41
1,36

200
6350
99,5
26,2
13,5
9,08
6,93
5,70
4,91
4,36
3,96
3,66
3,41
3,22
3,06
2,92
2,81
2,71
2,62
2,55
2,48
2,36
2,27
2,19
2,13
2,07
1,76
1,52
1,39
1,31
1,25

500
6360
99,5
26,1
13,5
9,04
6,90
5,67
4,88
4,33
3,93
3,62
3,38
3,19
3,03
2,89
2,78
2,68
2,59
2,51
2,44
2,33
2,24
2,16
2,09
2,03
1,71
1,47
1,33
1,23
1,15

6370
99,5
26,1
13,5
9,02
6,88
5,65
4,86
4,31
3,91
3,60
3,36
3,17
3,00
2,87
2,75
2,65
2,57
2,49
2,42
2,31
2,21
2,13
2,06
2,01
1,68
1,43
1,28
1,16
1,00

LOI DE FISHER
Probabilit P(F<=z) = 0,995

K
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500

K1
1

10

15

20

30

16200
198
55,6
31,3
22,8
18,6
16,2
14,7
13,6
12,8
12,2
11,8
11,4
11,1
10,8
10,6
10,4
10,2
10,1
9,94
9,73
9,55
9,41
9,28
9,18
8,63
8,24
8,06
7,95
7,88

20000
199
49,8
26,3
18,3
14,5
12,4
11,0
10,1
9,43
8,91
8,51
8,19
7,92
7,70
7,51
7,35
7,21
7,09
6,99
6,81
6,66
6,54
6,44
6,35
5,90
5,59
5,44
5,36
5,30

21600
199
47,5
24,3
16,5
12,9
10,9
9,60
8,72
8,08
7,60
7,23
6,93
6,68
6,48
6,30
6,16
6,03
5,92
5,82
5,65
5,52
5,41
5,32
5,24
4,83
4,54
4,41
4,33
4,28

22500
199
46,2
23,2
15,6
12,0
10,0
8,81
7,96
7,34
6,88
6,52
6,23
6,00
5,80
5,64
5,50
5,37
5,27
5,17
5,02
4,89
4,79
4,70
4,62
4,23
3,96
3,84
3,76
3,72

23100
199
45,4
22,5
14,9
11,5
9,52
8,30
7,47
6,87
6,42
6,07
5,79
5,56
5,37
5,21
5,07
4,96
4,85
4,76
4,61
4,49
4,38
4,30
4,23
3,85
3,59
3,47
3,40
3,35

23400
199
44,8
22,0
14,5
11,1
9,16
7,95
7,13
6,54
6,10
5,76
5,48
5,26
5,07
4,91
4,78
4,66
4,56
4,47
4,32
4,20
4,10
4,02
3,95
3,58
3,33
3,21
3,14
3,09

23700
199
44,4
21,6
14,2
10,8
8,89
7,69
6,88
6,30
5,86
5,52
5,25
5,03
4,85
4,69
4,56
4,44
4,34
4,26
4,11
3,99
3,89
3,81
3,74
3,38
3,13
3,01
2,94
2,90

23900
199
44,1
21,4
14,0
10,6
8,68
7,50
6,69
6,12
5,68
5,35
5,08
4,86
4,67
4,52
4,39
4,28
4,18
4,09
3,94
3,83
3,73
3,65
3,58
3,22
2,97
2,85
2,79
2,74

24100
199
43,9
21,1
13,8
10,4
8,51
7,34
6,54
5,97
5,54
5,20
4,94
4,72
4,54
4,38
4,25
4,14
4,04
3,96
3,81
3,69
3,60
3,52
3,45
3,09
2,85
2,73
2,66
2,62

24200
199
43,7
21,0
13,6
10,2
8,38
7,21
6,42
5,85
5,42
5,09
4,82
4,60
4,42
4,27
4,14
4,03
3,93
3,85
3,70
3,59
3,49
3,41
3,34
2,99
2,74
2,63
2,56
2,52

24600
199
43,1
20,4
13,1
9,81
7,97
6,81
6,03
5,47
5,05
4,72
4,46
4,25
4,07
3,92
3,79
3,68
3,59
3,50
3,36
3,25
3,15
3,07
3,01
2,65
2,41
2,30
2,23
2,19

24800
199
42,8
20,2
12,9
9,59
7,75
6,61
5,83
5,27
4,86
4,53
4,27
4,06
3,88
3,73
3,61
3,50
3,40
3,32
3,18
3,06
2,97
2,89
2,82
2,47
2,23
2,11
2,04
2,00

25000
199
42,5
19,9
12,7
9,36
7,53
6,40
5,62
5,07
4,65
4,33
4,07
3,86
3,69
3,54
3,41
3,30
3,21
3,12
2,98
2,87
2,77
2,69
2,63
2,27
2,02
1,91
1,84
1,79

50

100

200

500

25200
199
42,2
19,7
12,5
9,17
7,35
6,22
5,45
4,90
4,49
4,17
3,91
3,70
3,52
3,37
3,25
3,14
3,04
2,96
2,82
2,70
2,61
2,53
2,46
2,10
1,84
1,71
1,64
1,59

25300
199
42,0
19,5
12,3
9,03
7,22
6,09
5,32
4,77
4,36
4,04
3,78
3,57
3,39
3,25
3,12
3,01
2,91
2,83
2,69
2,57
2,47
2,39
2,32
1,95
1,68
1,54
1,46
1,40

25400
199
41,9
19,4
12,2
8,95
7,15
6,02
5,26
4,71
4,29
3,97
3,71
3,50
3,33
3,18
3,05
2,94
2,85
2,76
2,62
2,50
2,40
2,32
2,25
1,87
1,59
1,44
1,35
1,28

25400
200
41,9
19,4
12,2
8,91
7,10
5,98
5,21
4,67
4,25
3,93
3,67
3,46
3,29
3,14
3,01
2,90
2,80
2,72
2,57
2,46
2,36
2,28
2,21
1,82
1,53
1,37
1,26
1,17

25500
200
41,8
19,3
12,1
8,88
7,08
5,95
5,19
4,64
4,23
3,90
3,65
3,44
3,26
3,11
2,98
2,87
2,78
2,69
2,55
2,43
2,33
2,25
2,18
1,79
1,49
1,31
1,18
1,00

LOI DE FISHER
Probabilit P(F<=z) = 0,999

K
2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500

K1
1
998
168
74,1
47,0
35,5
29,2
25,4
22,9
21,0
19,7
18,6
17,8
17,1
16,6
16,1
15,7
15,4
15,1
14,8
14,4
14,0
13,7
13,5
13,3
12,2
11,5
11,2
11,0
10,8

2
999
148
61,2
36,6
27,0
21,7
18,5
16,4
14,9
13,8
13,0
12,3
11,8
11,3
11,0
10,7
10,4
10,2
9,95
9,61
9,34
9,12
8,93
8,77
7,95
7,41
7,15
7,01
6,91

3
999
141
56,2
33,2
23,7
18,8
15,8
13,9
12,6
11,6
10,8
10,2
9,73
9,34
9,00
8,73
8,49
8,28
8,10
7,80
7,55
7,36
7,19
7,05
6,34
5,85
5,64
5,51
5,42

4
999
137
53,4
31,1
21,9
17,2
14,4
12,6
11,3
10,4
9,63
9,07
8,62
8,25
7,94
7,68
7,46
7,26
7,10
6,81
6,59
6,41
6,25
6,12
5,46
5,01
4,81
4,69
4,62

5
999
135
51,7
29,8
20,8
16,2
13,5
11,7
10,5
9,58
8,89
8,35
7,92
7,57
7,27
7,02
6,81
6,61
6,46
6,19
5,98
5,80
5,66
5,53
4,90
4,48
4,29
4,18
4,10

6
999
133
50,5
28,8
20,0
15,5
12,9
11,1
9,92
9,05
8,38
7,86
7,43
7,09
6,81
6,56
6,35
6,18
6,02
5,76
5,55
5,38
5,24
5,12
4,51
4,11
3,92
3,82
3,74

7
999
132
49,7
28,2
19,5
15,0
12,4
10,7
9,52
8,66
8,00
7,49
7,08
6,74
6,46
6,22
6,02
5,84
5,69
5,44
5,23
5,07
4,93
4,82
4,22
3,83
3,65
3,54
3,47

8
999
131
49,0
27,6
19,0
14,6
12,0
10,4
9,20
8,35
7,71
7,21
6,80
6,47
6,19
5,96
5,76
5,59
5,44
5,19
4,99
4,83
4,69
4,58
4,00
3,61
3,43
3,33
3,27

9
999
130
48,5
27,2
18,7
14,3
11,8
10,1
8,96
8,12
7,48
6,98
6,58
6,26
5,98
5,75
5,56
5,39
5,24
4,99
4,80
4,64
4,50
4,39
3,82
3,44
3,26
3,16
3,10

10
999
129
48,0
26,9
18,4
14,1
11,5
9,89
8,75
7,92
7,29
6,80
6,40
6,08
5,81
5,58
5,39
5,22
5,08
4,83
4,64
4,48
4,35
4,24
3,67
3,30
3,12
3,02
2,96

15
999
127
46,8
25,9
17,6
13,3
10,8
9,24
8,13
7,32
6,71
6,23
5,85
5,53
5,27
5,05
4,87
4,70
4,56
4,32
4,14
3,99
3,86
3,75
3,20
2,84
2,67
2,58
2,51

20
999
126
46,1
25,4
17,1
12,9
10,5
8,90
7,80
7,01
6,40
5,93
5,56
5,25
4,99
4,78
4,59
4,43
4,29
4,06
3,87
3,72
3,60
3,49
2,95
2,59
2,42
2,33
2,27

30
999
125
45,4
24,9
16,7
12,5
10,1
8,55
7,47
6,68
6,09
5,62
5,25
4,95
4,70
4,48
4,30
4,14
4,01
3,77
3,59
3,45
3,32
3,22
2,68
2,32
2,15
2,05
1,99

50
999
125
44,9
24,4
16,3
12,2
9,80
8,26
7,19
6,41
5,83
5,37
5,00
4,70
4,45
4,24
4,06
3,90
3,77
3,53
3,35
3,20
3,08
2,98
2,44
2,07
1,90
1,80
1,73

100
999
124
44,5
24,1
16,0
11,9
9,57
8,04
6,98
6,21
5,63
5,17
4,80
4,51
4,26
4,05
3,87
3,71
3,58
3,34
3,16
3,01
2,89
2,79
2,24
1,87
1,68
1,57
1,49

200
999
124
44,3
23,9
15,9
11,8
9,46
7,93
6,87
6,10
5,52
5,07
4,70
4,41
4,16
3,95
3,77
3,61
3,48
3,25
3,07
2,92
2,79
2,69
2,14
1,75
1,55
1,43
1,34

500
999
124
44,1
23,8
15,8
11,7
9,39
7,86
6,81
6,04
5,46
5,01
4,64
4,35
4,10
3,89
3,71
3,55
3,42
3,19
3,01
2,86
2,73
2,63
2,07
1,68
1,46
1,32
1,21

999
124
44,0
23,8
15,8
11,7
9,34
7,81
6,76
6,00
5,42
4,97
4,60
4,31
4,06
3,85
3,67
3,51
3,38
3,15
2,97
2,82
2,70
2,59
2,03
1,62
1,39
1,23
1,00

LOI DE FISHER

K
2
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
50
100
200
500

P(F<=z) = 0,9995
K1
1

10

15

20

30

2000
266
106
63,6
46,1
37,0
31,6
28,0
25,5
23,6
22,2
21,1
20,2
19,5
18,9
18,4
17,9
17,5
17,2
16,6
16,2
15,8
15,5
15,2
13,9
13,0
12,5
12,3
12,1

2000
237
87,4
49,8
34,8
27,2
22,8
19,9
17,9
16,4
15,3
14,4
13,7
13,2
12,7
12,3
11,9
11,6
11,4
11,0
10,6
10,3
10,1
9,90
8,88
8,21
7,90
7,72
7,60

2000
225
80,1
44,4
30,4
23,5
19,4
16,8
15,0
13,6
12,7
11,9
11,3
10,8
10,3
9,99
9,69
9,42
9,20
8,82
8,52
8,27
8,07
7,90
7,01
6,43
6,16
6,01
5,91

2000
218
76,1
41,5
28,1
21,4
17,6
15,1
13,4
12,2
11,2
10,5
9,95
9,48
9,08
8,75
8,47
8,23
8,02
7,67
7,39
7,16
6,98
6,82
6,01
5,47
5,23
5,09
5,00

2000
214
73,6
39,7
26,6
20,2
16,4
14,1
12,4
11,2
10,4
9,66
9,11
8,66
8,29
7,98
7,71
7,48
7,28
6,94
6,68
6,46
6,28
6,14
5,37
4,87
4,64
4,51
4,42

2000
211
71,9
38,5
25,6
19,3
15,7
13,3
11,8
10,6
9,74
9,07
8,53
8,10
7,74
7,44
7,18
6,95
6,76
6,44
6,18
5,98
5,80
5,66
4,93
4,44
4,23
4,10
4,02

2000
209
70,6
37,6
24,9
18,7
15,1
12,8
11,3
10,1
9,28
8,63
8,11
7,68
7,33
7,04
6,78
6,57
6,38
6,07
5,82
5,62
5,45
5,31
4,60
4,13
3,92
3,80
3,72

2000
208
69,7
36,9
24,3
18,2
14,6
12,4
10,9
9,76
8,94
8,29
7,78
7,36
7,02
6,73
6,48
6,27
6,08
5,78
5,54
5,34
5,18
5,04
4,34
3,89
3,68
3,56
3,48

2000
207
68,9
36,4
23,9
17,8
14,3
12,1
10,6
9,48
8,66
8,03
7,52
7,11
6,77
6,49
6,24
6,03
5,85
5,55
5,31
5,12
4,96
4,82
4,14
3,70
3,49
3,36
3,30

2000
206
68,3
35,9
23,5
17,5
14,0
11,8
10,3
9,24
8,43
7,81
7,31
6,91
6,57
6,29
6,05
5,84
5,66
5,36
5,13
4,94
4,78
4,65
3,98
3,54
3,34
3,21
3,14

2000
203
66,5
34,6
22,4
16,5
13,1
11,0
9,56
8,52
7,74
7,13
6,65
6,27
5,94
5,67
5,44
5,25
5,07
4,79
4,55
4,37
4,22
4,10
3,45
3,03
2,83
2,72
2,65

2000
201
65,5
33,9
21,9
16,0
12,7
10,6
9,16
8,14
7,37
6,78
6,31
5,93
5,61
5,34
5,12
4,92
4,75
4,47
4,25
4,07
3,92
3,80
3,16
2,75
2,56
2,45
2,37

2000
199
64,6
33,1
21,4
15,5
12,2
10,2
8,75
7,75
7,00
6,42
5,95
5,58
5,27
5,01
4,78
4,59
4,42
4,15
3,93
3,75
3,61
3,48
2,86
2,44
2,25
2,14
2,07

50

100

200

500

2000
198
63,8
32,5
20,9
15,1
11,8
9,80
8,42
7,43
6,68
6,11
5,66
5,29
4,98
4,72
4,50
4,31
4,15
3,88
3,66
3,48
3,34
3,22
2,59
2,18
1,98
1,87
1,79

2000
197
63,2
32,1
20,5
14,7
11,6
9,53
8,16
7,18
6,45
5,88
5,43
5,06
4,76
4,50
4,28
4,09
3,93
3,66
3,44
3,27
3,13
3,00
2,37
1,95
1,74
1,61
1,53

2000
197
62,9
31,8
20,3
14,6
11,4
9,40
8,04
7,06
6,33
5,76
5,31
4,94
4,64
4,39
4,17
3,98
3,82
3,55
3,33
3,16
3,01
2,89
2,25
1,82
1,60
1,46
1,36

2000
196
62,7
31,7
20,2
14,5
11,4
9,32
7,96
6,98
6,25
5,69
5,24
4,87
4,57
4,32
4,10
3,91
3,75
3,48
3,27
3,09
2,95
2,82
2,17
1,74
1,50
1,34
1,22

2000
196
62,6
31,6
20,1
14,4
11,3
9,26
7,90
6,93
6,20
5,64
5,19
4,83
4,52
4,27
4,06
3,87
3,70
3,44
3,22
3,04
2,90
2,78
2,13
1,67
1,42
1,24
1,00

Statistiques dcisionnelles.

BIBLIOGRAPHIE

Titres
Aide mmoire de probabilits et
statistiques
Cours de probabilits et de statistiques
Cours de probabilits et de statistiques
Formulaire de probabilits et de
statistiques
Introduction aux probabilits et la
statistique
Probabilits et statistiques
Probabilits et statistiques cours,
exercices et problmes rsolus
Probabilits et statistiques
Probabilits et statistiques
Probabilits et statistiques
Probabilits et statistiques rsum de
cours exercices et problmes corrigs
Statistique et calcul des probabilits
Statistiques et probabilits
Statistiques et probabilits

Auteurs

Editeurs - annes

J. MARCELL

ELLIPSES 92

C. LEBOEUF
J. L. ROQUE / J. GUEGAND
J. RENAULT

ELLIPSES 87
ELLIPSES 87
DUNOD 92

E. AMIOT

GAETAN MORIN 90

A. LEVINE
J. ISIAS

ELLIPSES 89
ELLIPSES 99

L. GACOGNE / G. FRUGIER
AUDET, BOUCHER
(AUMARTIN, SKEEWE)
J. FOURASTIE /
J. F. LASLIER
G. CHAUVAT / J.F. REAU

EYROLLES 90
GAETAN MORIN 93

W. MASSIERI
J. P. LECOUTRE
M. ELLATIFI

SIREY 96
DUNOD 2000
AFRIQUE ORIENT 84

259

DUNOD 87
ARMAND COLIN 99

Statistiques dcisionnelles.

260