Vous êtes sur la page 1sur 62

STATISTIQUE DESCRIPTIVE

1 Introduction
La statistique dsigne lensemble des mthodes mathmatiques relatives
la collecte, la prsentation, lanalyse et lutilisation de donnes
numriques. Ces oprations permettent de tirer des conclusions et de
prendre des dcisions dans les situations dincertitude quon rencontre
dans le domaine conomique, dans celui des aaires ou dans dautres
sciences sociales.....
On distingue la statistique descriptive et la statistique inductive. La
premire rsume, rcapitule, analyse un ensemble de donnes . La seconde
conclut sur le tout aprs examen dune partie. Le tout est alors appel
population et une partie est appele un chantillon .
2 Terminologie :
- La population est lensemble de tous les individus concerns par une
tude statistique
Exemple 1:
Si lon veut tudier la qualit des allumettes fabriques par une usine, la
population sera lensemble de toutes les allumettes fabriques par cette
usine.
- On appelle chantillon toute partie de la population.
- On appelle individu chaque lment de la population.
- La taille reprsente le nombre dindividus dun chantillon ou dune
population. Elle est note : dans le cas dun chantillon et ` dans le
cas dune population.
- Le caractre est laspect particulier que lon dsire tudier.
Exemple 2:
Concernant un groupe de personnes, on peut sintresser au caractre
ge, ou au caractre sexe ou encore leur taille .
1
- On appelle modalits les direntes possibilits que peut prsenter un
caractre.
Exemple 3:
- Le sexe est un caractre deux modalits : fminin ou masculin
- Le caractre nombre denfants par famille peut tre gal 0. 1. 2. ...
- On dira dun caractre quil est qualitatif si ses modalits ne sexpriment
pas par un nombre.
Exemple 4 :
La religion , la marque dune lessive et la couleur des yeux sont des
caractres qualitatifs.
- On dit dun caractre quil est quantitatif si ses modalits sont numriques.
Exemple 5 :
Lge , le poids , le salaire , . . . sont des caractres quantitatifs.
- On appelle srie statistique lensemble des direntes donnes associes
aux individus dun chantillon ou dune population.
Exemple 6:
- La srie suivante reprsente les notes (sur 20 ) obtenues par 10 tudiants
en statistique :
10 15 9 7 6 5 8 13 11 19
- La srie suivante reprsente le sexe de 10 tudiants de premire anne
de l
/
ISIAM :
1 1 ` ` 1 1 1 ` ` 1
2
3 Traitement des donnes
- Dune faon gnrale , on distingue 3 tapes dans le traitement dune
srie statistique :
A) La synthse des rsultats laide dun tableau;
B) La reprsentation graphique du phnomne tudi;
C) Le calcul des mesures caractristiques.
Expliquons maintenant comment il faut procder dans chaque tape.
A) Tableaux statistiques
1) Cas dun caractre qualitatif
- La taille de lchantillon est :
- Les direntes modalits sont r
1
. r
2
. .... r
/
.
- Chaque modalit constitue une classe .
- Le nombre dindividus qui appartiennent la classe r
i
sappelle leectif
(ou la frquence absolue ) de cette classe . Il est not ,
i
. On a toujours
,
1
+ ,
2
+ ... + ,
/
= :
- La frquence relative de la classe r
i
est
,
i
:
.
- Souvent on prfre exprimer la frquence relative en pourcentage ; pour
cela, il sut de multiplier
,
i
:
par 100 .
Exemple : La srie statistique suivante reprsente ltat-civil dun
3
groupe de 20 personnes .
`C`\ ``1\ 1`C\ \ \ \ CCC``
o `. 1. C et \ reprsentent respectivement mari(e), divorc(e), cli-
bataire et veuf(ve).
Repartition d/un groupe de 20 personnes selon leur etat civil
Etat-civil eectifs frq.relatives
,
i
:
pourcentages
,
i
:
100
` 7 0. 35 35
C 5 0. 25 25
\ 6 0. 30 30
1 2 0. 10 10
Total 20 1 100
2) Cas dun caractre quantitatif discret :
- Un caractre quantitatif est discret si lensemble des valeurs quil peut
prendre est ni.
Exemple 1:
- Le nombre denfants par famille et le nombre de tlviseurs fabriqus par
une usine par jour sont des caractres quantitatifs discrets , par contre le
caractre poids nest pas discret .
Pour llaboration du tableau , il faut voir si le caractre prsente beau-
coup de valeurs dierentes ou non . Dans le deuxime cas on procde
comme dans le cas dun caractre qualitatif et dans le premier cas on
regroupe les donnes comme dans le cas dun caractre continu qui sera
trait ultrieurement .
Exemple 2: La srie suivante donne le nombre denfants charge dans
16 familles .
0 1 0 0 2 1 3 0 1 2 0 1 2 2 2 4
4
Repartition de 16 familles selon le nombre d/enfants a charge
nb.denf e ,
i
freq.rel.
,
i
:
pourcent
,
i
:
100 e. cumul 1
i
freq.rel. cum
1
i
:
0 5 0. 3125 31. 25 5 0. 3125
1 4 0. 25 25 9 0. 5625
2 5 0. 3125 31. 25 14 0. 8750
3 1 0. 0625 6. 25 15 0. 9375
4 1 0. 0625 6. 25 16 1
Total 16 1 100 //////////////////////////// /////////////////////////////
- La colonne des eectifs cumuls 1
i
sobtient en additionnant leectif
dune classe leectif de chacune des classes qui la pcde , ainsi on a :
1
1
= ,
1
, 1
2
= ,
1
+ ,
2
, . . . ,
1
i
= ,
1
+ ,
2
+ ... + ,
i
1
i
correspond au nombre de donnes de la srie dont la valeur est in-
frieure la classe r
i
. 2) Cas dun caractre quantitatif continu :
Un caractre quantitatif est continu sil peut prendre thoriquement nimporte
quelle valeur dans un intervalle donn .
Exemple 1 :La taille des individus et leur poids sont des caractres
quantitatifs continus .
Dans ce cas (ou dans le cas dun caractre discret avec beaucoup de
valeurs dierentes) la construction du tableau passe par les tapes suiv-
antes :
Etape 1 : Dterminer ltendu de la srie
Note c, ltendu de la srie est la dirence entre la plus grande valeur
et la plus petite valeur observe.
Etape 2 : Dterminer le nombre de classes
Not /, le nombre de classe doit se situer entre 5 et 15 , et sil na pas
5
t impos on peut le dterminer partir de la formule de Sturges :
/ = la valeur entire la plus rapproche de 1 + 3. 322 log
10
(:) o n est
le nombre de donnes de la srie.
Exemple 2 :
- Pour : = 12 on a 1 + 3. 322log
10
(12) = 4. 585... donc / = 5
classes
- Pour : = 15 on a 1+3. 322log
10
(15) = 4. 906... donc / = 5 classes
- Pour : = 25 on a 1 + 3. 322log
10
(25) = 5. 643... donc / = 6
classes
- Pour : = 1000 on a 1 + 3. 322log
10
(1000) = 10. 966... donc / = 11
classes.
Etape 3 : Dterminer lamplitude des classes
Note c, lamplitude des classes ne doit pas contenir plus de chires aprs
la virgule que les donnes de la srie . Ainsi aprs avoir calcul le quotient
c
/
, il faut tronquer le rsultat pour liminer les dcimales non utiles et
additionner 1 au dernier chire.
Exemple 3: Si
c
/
= 0. 9361 alors pour des donnes 2 chires aprs la
virgule c = 0. 94 mais pour des donnes entires c = 1.
Etape 4 : Construire les intervalles
En procdant avec la mme unit de mesure que les donnes de la srie ,
on xe tout dabord la limite infrieure du premier intervalle . La valeur
choisie peut tre soit la plus petite mesure de la srie , soit une valeur
qui lui est assez voisine mais infrieure . En additionnant lamplitude
cette valeur , on obtient la limite suprieure de la classe .
Pour les classes suivantes , la limite infrieure coincide avec la limite
suprieure de la classe prcdente . Laddition la limite infrieure de
lamplitude permet encore dtablir la limite suprieure .
Par convention ,pour que toute donne appartienne une seule classe,
6
les intervalles seront ferms gauche et ouverts droite .
Exemple (voir plus loin )
Etape 5 : Etablir la frquence des classes
Pour complter le tableau, il reste dterminer
- le centre des classes :
i
=
limite infrieure + limite suprieure
2
(Les
centres des classes serviront dans le calcul des mesures caractristiques )
- Les eectifs ,
i
.
- Les eectifs cumuls 1
i
.
- Les frquences relatives
,
i
:
.
- Les frquences relatives en pourcentages
,
i
:
100.
Exemple 4 : La srie suivante reprsente le poids rel , en grammes ,
dun chantillon de 23 boites de conture de marques direntes :
271 516 414 242 510 190 490 450 390 430
360 360 450 460 453 509 489 412 410 453
460 405 373
Construire le tableau de frquences de cette srie.
Solution :
- Ltendue c = 516 190 = 326
- Le nombre de classes / : on a 1+3. 322log
10
(23) = 5. 523... donc / = 6
classes .
- Lamplitude des classes : on a
c
/
=
326
6
= 54. 33... donc c = 55
7
- Le premier intervalle : [190. 245[
Poids 1(en g ) centres :
i
eectifs ,
i
e.cumuls 1
i
freq.rel.
,
i
:
(%)
,
i
:
100
190 _ 1 < 245 217. 5 2 2 0. 0869 8. 69
245 _ 1 < 300 272. 5 1 3 0. 0434 4. 34
300 _ 1 < 355 327. 5 0 3 0 0
355 _ 1 < 410 382. 5 5 8 0. 2173 21. 73
410 _ 1 < 465 437. 5 10 18 0. 4347 43. 47
465 _ 1 < 520 492. 5 5 23 0. 2173 21. 73
Exemple 2 : Le salaire horaire (en DH ) de 20 employs dun magasin
est donn par la srie suivante : 6. 80 6. 30 8. 25 6. 45 6. 30 6. 80 8. 30
5. 55 6. 00 5. 60 6. 75 8. 35 5. 75 6. 80 7. 30 6. 85 5. 70 5. 55
7. 25 7. 25
Construire la distribution de frquences de cette srie .
Solution :
- Ltendue : c = 8. 35 5. 55 = 2. 8
- Le nombre de classes / : on a 1 +3. 322 log
10
(20) = 5. 322... donc / = 5
classes
- Lamplitude des classes c : on a
c
/
=
2. 8
5
= 0. 56 donc c = 0. 57
- Le premier intervalle : [5. 55 ; 6. 12 [ .
8
Salaire o (en DH) centres :
i
e ,
i
e.cum 1
i
freq.rel.
,
i
:
%
5. 55 _ o < 6. 12 5. 835 6 6 0. 30 30
6. 12 _ o < 6. 69 6. 405 3 9 0. 15 15
6. 69 _ o < 7. 26 6. 975 7 16 0. 35 35
7. 26 _ o < 7. 83 7. 545 1 17 0. 05 5
7. 83 _ o < 8. 4 8. 115 3 20 0. 15 15
B) Reprsentation graphique
Il existe plusieurs faons de reprsenter graphiquement les rsultats dune
srie statistique. Nous verrons ici les formules les plus utilises.
1) Diagramme bandes rectangulaires.
Ce diagramme est adapt la reprsentation dun caractre qualitatif
ou quantitatif discret. Il est constitu par la juxtaposition de bandes
verticales ou la superposition de bandes horizontales; la hauteur ou la
longueur dune bande, sera proportionnelle la frquence de la modalit.
Exemple 1.
2) Histogramme.
Il convient bien la reprsentation dun caractre quantitatif continu,
lhistogramme est constitu par la juxtaposition de bandes rectangulaires
verticales, mais adjacentes. De plus chaque rectangle doit prsenter une
largeur quivalente lamplitude de la classe quil reprsente et la hauteur
proportionnelle la frquence.
Exemple 2.
C) Le calcul des mesures caractristiques.
9
Il est souvent ncessaire de rsumer de faon trs concise lensemble des
informations quon possde sur une srie statistique .Pour cela , on a
recours quelques mesures donnant une ide sur lordre de grandeur des
donnes ou sur ltalement de la srie .
On distingue deux types de mesures : les mesures de tendance centrale
et les mesures de dispersion .
1) les mesures de tendances centrales :
Les mesures de tendance centrales les plus importantes sont : la moyenne
arithmtique , la mdiane et le mode .
a) La moyenne arithmtique :
Pour calculer la moyenne arithmtique (on dira dans la suite moyenne
tout court ) dun ensemble de donnes, il sut de faire la somme de
celles-ci et de diviser par le nombre de donnes .
Notation
Dans le cas dune population la moyenne sera note j
j =
`
P
i=1
r
i
`
et dans le cas dun chantillon elle sera note

r :

r =
:
P
i=1
r
i
:
Exemple 1
Les notes ( sur 20 ) obtenues par 10 tudiants en statistique sont :
2 2 8 9 10 12 8 13 12 13
10
On a donc

r =
2 + 2 + 8 + 9 + 10 + 12 + 8 + 13 + 12 + 13
10
=
89
10
= 8. 9
- Si les donnes sont traites dans un tableau de frquences :
caractre r
i
eectifs ,
i
freq.rel.
,
i
:
r
1
,
1
,
1
:
r
2
,
2
,
2
:
. . .
. . .
. . .
r
/
,
/
,
k
:
dans ce cas la formule de la moyenne devient :

r =
/
P
i=1
r
i
,
i
:
Exemple 2
La distribution des notes des 10 tudiants de lexemple prcdent est :
11
Notes r
i
eectifs ,
i
freq.rel.
,
i
:
2 2 0. 2
8 2 0. 2
9 1 0. 1
10 1 0. 1
12 2 0. 2
13 2 0. 2
Total 10 1

r =
2 2 + 2 8 + 1 9 + 1 10 + 2 12 + 2 13
10
=
89
10
= 8. 9
- Si maintenant les donnes sont groupes dans des intervalles de centres
:
i
alors une aproximation de la moyenne est donne par

r =
/
P
i=1
,
i
:
i
:
o / est le nombre de classes et n la taille de lchantillon .
Exemple 3
Le tableau suivant reprsente le chire daaires (en DH) ralis par 36
restaurants au cours dune journe.
Chire da. C (en DH) centres :
i
eectifs ,
i
,
i
:
i
2000 _ C < 2500 2250 11 24750
2500 _ C < 3000 2750 9 24750
3000 _ C < 3500 3250 10 32500
3500 _ C < 4000 3750 6 22500
Total ,,,,,,,,,,,,,,, 36 104500
12
On a donc

r =
104500
36
= 2902. 777... = 2902. 78
Le chire daaires moyen de ces restaurants est donc approximativement
2902. 78 DH
b) La mdiane
- La mdiane est la valeur du caractre qui partage la srie en deux
parties gales : 50% de donnes lui sont infrieures ou gales et 50% lui
sont suprieures ou gales .
Notation : la mdiane sera note `
c
- Calcul de la mdiane: On distingue deux cas :
1
c:
cc: : les donnes ne sont pas groupes dans des intervalles.
Alors dans ce cas on applique la rgle suivante :
- Si : est impair , la mdiane est la valeur de la srie dont le rang est
: + 1
2
dans le classement par ordre croissant .
- Si : est pair , la mdiane est la moyenne des valeurs de rang
:
2
et
:
2
+ 1 dans le classement par ordre croissant .
Exemple 1: Soit la srie 3 1 4 5 1 2 6 8 6.
Le classement par ordre croissant est 1 1 2 3 45 6 6 8
On a : = 9 donc `
c
= la cinquime valeur = 4
Exemple 2 :
Soit la srie 3 1 4 7 5 1 2 6 8 6
13
Le classement par ordre croissant est 1 1 2 3 4 5 6 6 7 8
On a : = 10 ; la 5
c:c
valeur est 4 et la 6
c:c
valeur est 5 donc la mdiane
est `
c
=
4 + 5
2
= 4. 5
Exercice 1 :Calculer la mdiane de la srie suivante :
r
i
0 2 5 7 9 Total
,
i
5 7 9 4 5 30
Solution
On a : = 30 donc la mdiane est la moyenne entre la 15
c:c
et la 16
c:c
valeur dans le classement par ordre croissant .
Ici la 15
c:c
valeur est 5 et la 16
c:c
valeur est 5 aussi, donc la mdiane
est `
c
=
5 + 5
2
= 5
2
c:c
cc: : Si les donnes sont groupes dans des intervalles :
Dans ce cas , on ne se proccupe pas du fait quil y a un nombre pair ou
impair de donnes dans la srie .
On dtermine dabord la classe qui contient la mdiane : cest la premire
classe dont leectif cumul est suprieur ou gal
:
2
.
Si [1
i
, 1
i
+ c[ est la classe qui contient la mdiane , et si 1
i
est son
eectif cumul et 1
i1
leectif cumul de la classe qui la prcde alors
on a :
`
e
1
i
(1
i
+c) 1
i
=
:
2
1
i1
1
i
1
i1
14
donc
`
c
= 1
i
+
0
@
:
2
1
i1
1
i
1
i1
1
A
c
Exemple 3:
Reprenons lexemple du chire daaires des 36 restaurants .
Chire da. C en DH eectifs ,
i
eectifs cumuls 1
i
2000 _ C < 2500 11 11
2500 _ C < 3000 9 20
3000 _ C < 3500 10 30
3500 _ C < 4000 6 36
On a : = 36 donc
:
2
= 18. la classe qui contient la mdiane est la
deuxime donc
`
c
2500
3000 2500
=
18 11
20 11
donc
`
c
2500
500
=
7
9
et par suite `
c
=
2500 + 500
7
9
= 2888. 88...
`
c
= 2888. 89 DH
c) Le mode .
Le mode dune srie de donnes est la valeur du caractre la plus frquente
. Le symbole utilis pour le noter est `
o
, quil sagisse dun chantillon
ou dune population .
Lorsque les donnes sont groupes dans des intervalles, on utilise le centre
de la classe ayant la plus grande frquence comme approximation du
mode ou on parle tout simplement de la classe modale, cest--dire la
classe ayant la plus grande frquence
15
Exemple 1.
Le mode de la srie 2 3 4 2 2 est la valeur 2
La srie 2 2 3 4 3 2 3 a deux modes : 2 et 3
La srie 1 2 3 4 5 na pas de mode
2) Les mesures de dispersion
-La variance
Pour un chantillon de taille : , la variance, note :
2
, est dnie par
:
2
=
:
P
i=1
(r
i

r)
2
:
o r
i
reprsente la ime donnes et
_
r la moyenne .
Exemple 1
Calculer la variance de la srie suivante : 8 8 10 12 12 .
On a
_
r =
8 + 8 + 10 + 12 + 12
5
=
50
5
= 10 do :
2
=
(8 10)
2
+ (8 10)
2
+ (10 10)
2
+ (12 10)
2
+ (12 10)
2
5
=
4 + 4 + 0 + 4 + 4
5
= 3. 2
Exemple 2
Calculer la variance de la srie 6 7 10 13 14.
On a
_
r =
6 + 7 + 10 + 13 + 14
5
=
50
5
= 10
do :
2
=
(6 10)
2
+ (7 10)
2
+ (10 10)
2
+ (13 10)
2
+ (14 10)
2
5
=
50
10
= 10
16
Remarque:
les sries 8 8 10 12 12 et 6 7 10 13 14 ont la mme
moyenne 10, mais les carts des donnes par rapport la moyenne sont
plus grands dans la deuxime srie que dans la premire. Ceci se traduit
par une variance plus grande dans la deuxime srie.
- En gnral le calcul de la variance laide de sa formule est fastidieux,
cest pour cela quil est parfois intressant dappliquer la formule quiv-
alente suivante :
frame
:
2
= r
2
(r)
2
Cette formule se retient facilement en disant que la variance est la moyenne
des carrs moins le carr de la moyenne.
Exemple 3
Pour la srie 8 8 10 12 12 on a r
2
=
8
2
+ 8
2
+ 10
2
+ 12
2
+ 12
2
5
=
516
5
= 103. 2
et (r)
2
= 10
2
= 100 do :
2
= 103. 2 100 = 3. 2
- Dans le cas o les donnes sont donnes dans un tableau de frquences
caractre r
i
eectifs ,
i
frquences relatives
,
i
:
r
1
,
1
,
1
:
r
2
,
2
,
2
:
. . .
. . .
. . .
r
/
,
/
,
k
:
17
alors
:
2
=
,
1
r
2
1
+ ,
2
r
2
2
+ ... + ,
/
r
2
/
:
(
,
1
r
1
+,
2
r
2
...+,
k
r
k
:
)
2
On peut crire encore
:
2
=
,
1
:
r
2
1
+
,
2
:
r
2
2
+ ... +
,
/
:
r
2
/
(r)
2
Exercice 1
Calculer la variance de la distribution suivante:
caractre r
i
eectifs ,
i
frquences
,
i
:
2 2 0. 2
8 2 0. 2
9 1 0. 1
10 1 0. 1
12 2 0. 2
13 2 0. 2
Total 10 1
Solution
Pour le calcul de la variance , on organise le tableau comme suit :
18
r
i
,
i
,
i
r
i
,
i
r
2
i
2 2 4 8
8 2 16 128
9 1 9 81
10 1 10 100
12 2 24 288
13 2 26 338
Total 10 89 943
On a r =
89
10
= 8. 9 et :
2
=
943
10
(8. 9)
2
= 94. 3 79. 21 =
15. 09
- Lorsque les donnes sont groupes dans des intervalles , on se contente
dobtenir une approximation de la variance en remplaant dans la formule
les r
i
par les centres :
i
:
2
=
,
1
:
2
1
+ ,
2
:
2
2
+ ... + ,
/
:
2
/
:
(
,
1
:
1
+ ,
2
:
2
... + ,
/
:
/
:
)
2
Exercice 2
Calculer la variance de la distribution suivante:
19
REGRESSION ET CORRELATION
1 Introduction
Dans ce chapitre, on va tudier les relations, lorsquelles existent, entre
deux variables statistiques. Par exemple la relation entre publicit et
vente, ou entre le revenu et les dpenses.
2 : Rgression linaire simple
Nuage statistique : Considrons deux caractres numriques r et . Si
partir dune tude mene sur un chantillon de taille n on obtient les
valeurs r
i
et
i
, la reprsentation graphique dans le plan de lensemble
des points de coordonnes (r
i
.
i
) pour i = 1. 2. ..... : sappelle nuage
statistique.
A partir de ce nuage, il faut chercher exprimer la relation entre les deux
variables laide dune quation mathmatique . On pourrait le faire de
plus dune faon, mais on va se limiter ici la plus simple, cest--dire
lquation linaire de la forme
= cr + /
- On appelle rgression linaire, lajustement dune droite au nuage sta-
tistique (r
i
.
i
)
- Le problme consiste donc trouver une droite dquation = cr + /
qui traduit , avec le plus de dlit, le lien entre r et . Pour cela nous
allons utiliser une technique appele : la mthode des moindres carrs,
qui consiste minimiser la somme des carrs des distances 1
i
verticales
entre la droite et chacun des points (r
i
.
i
).
Tout calcul fait (pour voir ces calculs consulter votre livre) on trouve :
20
c =
n
P
i=1
r
i

i
:r.
n
P
i=1
r
2
i
:(r)
2
et
/ = cr.
o r et sont respectivement les moyennes arithemtiques de r et de .
Exemple : Une entreprise veut mener une tude pour connatre la re-
lation entre les dpenses hebdomadaires en publicit et le volume des
ventes quelle ralise. On a recueilli au cours des dix dernires semaines
les donnes suivantes :
X=Cot pub en10
3
DH 4 2 2.5 2 3 5 1 5.5 3.5 4.5
Y=Ventes en 10
3
DH 49.5 41 43 39 46 53 38 54 48.5 51.5
1) Trouver lquation de la droite de rgression des moindres carrs
2) Estimer le volume des ventes si la semaine prochaine on compte
dpenser 3500 DH en publicit .
3 : Sries chronologiques.
Lorsque la variable indpendante r reprsente le temps et la variable
reprsente un facteur quelconque on dit quon a aaire une srie
chronologique . Dans ce cas la droite de rgression sappelle la droite de
tendance ou le trend
Mthode dajustement : Lorsque les direntes valeurs de r (le temps)
se suivent par le mme intervalle , on associe chaque valeur de r un
code comme suit :
- Si : est impair , les codes seront ,3. 2. 1. 0. 1. 2. 3, . O le code 0
est associ la valeur de r de rang
: + 1
2
- Si : est pair , les codes seront ,5. 3. 1. 1. 3. 5. o le code 1 est
associ la valeur de r de rang
:
2
+ 1
21
Exemple 1
Donner les codes pour reprsenter la variable indpendante temps si on
a
1) 1975. 1976. 1977. 1978. 1979. 1980
2) lundi mardi mercredi jeudi vendredi samedi dimanche
3) janvier , fvrier , ., dcembre.
Exercice 1
Une nouvelle ptisserie vient douvrir ses portes . La srie statistique
suivante donne le nombre de milliers de pains vendus au cours des dix
premires semaines :
Semaine x 1re 2re 3re 4re 5re 6re 7re 8re 9re 10re
Nb de pains(10
3
) y 1,71 1.74 1.73 1.75 1.78 1.77 1.81 1.80 1.84 1.83
1) Trouver lquation de tendance.
2) Dterminer le nombre de pains qui va etre vendus la semaine prochaine.
4 : Coecient de corrlation .
Ce coecient va nous permettre daborder le problme du degr de dpen-
dance entre les deux variables r et .
Considrons la srie statistique deux caractres :
r r
1
r
2
. . . . . . . r
:

1

2
. . . . . . .
:
Dnissons la covariance de r et par : Co(r. ) = r r.
Le coecient de corrlation r est donn par la formule suivante
: =
Co(r. )
:(r).:()
22
O :(r) et :() sont les cart-types des variables x et y .
Interprtation de r
1) On a toujours : 1 6 : 6 1
2) Si : 0 alors il y a corrlation positive entre r et , c--d si r
augmente alors augmente .
3) Si : < 0 alors il y a corrlation ngative entre r et , c--d si r
augmente alors diminue .
4) Si : = 0 alors il ny a aucune corrlation entre r et , les variables r
et sont indpendantes.
5) Si : est voisin de 1 ou de 1, il y a une trs forte dpendance entre r
et .
6) Si : = +1 ou 1, la droite de rgression sajuste parfaitement aux
donnes recueillies .
Exercice 1 : Intra 2000
La srie suivante reprsente le prix dune boite de sardines, fabrique par
une usine marocaine, au cours des dix dernires annes.
Annes 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Prix y en DH 2.00 2.20 2.25 2.35 2.50 2.70 2.70 2.80 3.00 3.00
1) Trouver lquation de la droite de rgression.
2) Si la tendance continue estimer le prix dune boite pour lan 2001 et
pour lan 2002.
3) Calculer le coecient de corrlation linaire :.
4) Que peut-on dire des estimations de la question 2
5) En quelle anne le prix dune boite atteindra les 4 DH
23
Solution
On a : = 10 donc le code 1 sera attribu la sixime anne 1996
Anne Code r
i
Prix
i
en Dh r
2
i

2
i
r
i
.
i
1991 -9 2.00 81 4.00 -18.00
1992 -7 2.20 49 4.84 -15.40
1993 -5 2.25 25 5.06 -11.25
1994 -3 2.35 9 5.52 -7.05
1995 -1 2.50 1 6.25 -2.50
1996 1 2.70 1 7.29 2.70
1997 3 2.70 9 7.29 8.10
1998 5 2.80 25 7.84 14.00
1999 7 3.00 49 9.00 21.00
2000 9 3.00 81 9.00 27.00
Total 0 25,50 330 66.095 18.60
1) Lquation de la droite de rgression :
On a : et
Donc lquation de la droite est = 2.55 + 0.056 r
2) - Lan 2001 a pour code r = 11, donc lestimation du prix est =
2.55 + 0.056 11 = 3.166 DH.
- Lan 2002 a pour code r = 13, donc lestimation du prix est =
2.55 + 0.056 13 = 3.278 DH.
3) Coecient de corrlation :
On a Co(r. ) = r r. = r car donc r = 0
Co(r. ) =
18.6
10
= 1.86 , :
2
(r) = r
2
(r)
2
= 33 et :
2
() =

2
()
2
= 0.107
24
Le coecient de corrlation : =
Co(r. )
:(r).:()
=
1.86
5.74 0.33
0. 98
4) Puisque le coecient de corrlation : est proche de 1 alors il y a une
forte dpendance linaire entre r et , donc si la tendance continue , les
estimations de la question 2 seront bonnes .
5) Si le prix est de 4 DH , alors le code de lanne est donn par c--d
Or lan 2008 a pour code 25 et lan 2009 a pour code 27, donc le prix
atteindra les 4 DH vers la n de 2008.
Exercice 2 :( intra 2000)
Dans une entreprise on veut tudier la relation entre le revenu mensuel
et les dpenses mensuelles pour le transport. Pour cela , on a choisi un
chantillon de dix employs.
Les rsultats de lenqute sont dans le tableau suivant :
X = Rev mes en Dh 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5
Y= Dp en trans en Dh 500 500 475 450 570 525 725 300 625 800
1) Calculer lquation de la droite de rgression .
2) Estimer les dpenses en transport pour quelquun qui a un revenu
mensuel de 2500 DH.
3) Calculer le coecient de corrlation .
4) Que peut-on dire de lestimation de la question 2 .
Solution : Total
25
r
i

i
r
2
i

2
i
r
i

i
3 500 9 25000 1500
3.5 500 12.5 25000 1750
4 475 16 225625 1900
4.5 450 20.25 202500 2025
5 570 25 324900 2850
5.5 525 30.25 275625 2887.5
6 725 36 275625 4350
6.5 300 42.25 90000 1950
7 625 49 390625 4375
7.5 800 56.25 640000 6000
52.5 5470 266.25 3174900 29587.5
Lquation de la droite est donc = 325.56 + 42.18 r
2) Si r = 2. 5 alors = 325. 56 + 42. 18 2. 5 = 431. 01 DH
3) Le coecient de corrlation : : =
co (r. )
: (r) : ()
. O co(r. ) = r
r. , :
2
(r) = r
2
(r)
2
et :
2
() =
2
()
2
.
donc il y a une faible corrlation linaire entre r et .
26
LES PROBABILITES
Introduction.
Aprs avoir appris traiter les rsultats dune enqute sur un chan-
tillon ( la premire partie) nous allons maintenant passer la question
importante, savoir, comment gnraliser les rsultats obtenus sur un
chantillon toute la population (statistique inductive). Pour cela nous
avons besoin de quelques notions en calcul des probabilits. Le prsent
chapitre sera donc juste un outil pour pouvoir aborder la statistique in-
ductive.
1 : Notions fondamentales.
Une exprience alatoire est un processus caracteris par:
- i) on ne peut prdire son rsultat,
- ii) on peut dcrire priori lensemble de tous ses rsultat possibles.
Exemple 1
- Un investissement est une exprience alatoire dont les rsultats possi-
bles sont, soit R=rentable, soit N=non rentable.
- Lancer un d est une exprience alatoire dont les rsultats sont 1,2,3,4,5
ou 6.
Lespace chantionnal o associ une exprience alatoire est lensemble
de tous les rsultats possibles de cette exprience.
Exemple 2
- Dans le cas dun investissement o =
n
N,R
o
- Dans le cas du d, on a o = 1. 2. 3. 4. 5. 6
Un vnement est un sous-ensemble de lespace o
27
On dira quun vnement sest ralis lorsque le rsultat de exprience
alatoire est un lment de .
Exemple 3
- Dans le cas du d, considrons lvnement =obtenir une face paire.
On a = 2. 4. 6, et lvnement sera ralis si le rsultat est 2 ou 4 ou 6.
Lvnement o est appel lvnement sr ( ou certain )
Lvnement O est appel lvnement impossible.
Lorsquun vnement est compos dun seul lment, il est dit simple
ou lmentaire.
Si et 1 sont deux vnements alors,
- '1 est lvnement qui se ralise si au moins un de ces deux vnements
se ralise
- 1 est lvnement qui se ralise les deux vnements se realisent.
-

(lire non ) est lvnement qui se ralise si lvnement ne se ralise
pas.
2 : Probabilit dun evenement.
On dit quon a dni une probabilit j sur un espace chantionnal o
lorsqu chaque vnement on peut associ un nombre j() tel que :
i) 0 _ j() _ 1
ii) j(o) = 1
iii) j( ' 1) = j() +j(1) pour tous les vnements ct 1 tels que 1 = O.
2.1 Consquences immdiates.
a) Pour tout vnement on a j() = 1 j(
_
)
b) On a toujours j(O) = 0
c) On a toujours j('1) = j()+j(1)j(1) quels que soient les vnements
28
et 1.
2.2 Cas particulier dquiprobabilit.
Lors dune exprience alatoire, il arrive souvent (pour des raisons physiques)
que les vnements lmentaires aient la mme chance de se raliser. Dans
ce cas on dit quil y a quiprobabilit des vnements lmentaires.
Si lespace chantionnal est o = :
1
. :
2
. .... :
n
et si est un vnement quel-
conque, j() est dni, dans le cas dquiprobabilit, par
j() =
cc:d()
cc:d(o)
=
nombre de cas favorables la ralisation de
nombre de cas possibles
On vrie facilement que
i) 0 _ j() _ 1
ii) j(o) = 1
iii) j( ' 1) = j() +j(1) si 1 = O
Donc on a bien une probabilit sur o et j(:
i
) =
1
cc:d o
=
1
:
.
Exemple 1.
On lance un d quilibr.
1) Calculer la probabilit davoir un rsultat pair.
2) Calculer la probabilit davoir un rsultat impair.
Solution :
On a o = 1. 2. 3. 4. 5. 6 . Puisque le d est quilibr, alors on peut supposer
quil ya quiprobabilit des vnements lmentaires.
Appelons lvnement avoir un rsultat pair et 1 lvnement avoir
un rsultat impair. On a = 2. 4. 6 et 1 = 1. 3. 5
29
j() =
cc:d
cc:d o
=
3
6
=
1
2
et j(1) =
cc:d 1
cc:d o
=
3
6
=
1
2
.
Exercice 1
On lance une pice de monnaie quilibre 3 fois dale, et on observe
chaque fois le ct quelle prsente lorsquelle tombe.
1) Calculer la probabilit dobtenir au moins une fois le ct face.
2) Calculer la probabilit dobtenir exactement deux fois le ct face.
Solution :
Lespace chantonnal est o = 111. 111. 111. 111. 111. 111. 111. 111
Comme la pice est quilibre, on peut supposer quil y a quiprobabilit
des vnements lmentaires.
1) Appelons lvnement obtenir au moins une fois le ct face
On a = 111. 111. 111. 111. 111. 111. 111 et j() =
cc:d
cc:d o
=
7
8
.
Remarque 1
Pour calculer j() il est parfois plus simple dutiliser la propriet j() =
1 j(
_
). En eet; dans le cas prsent on a
_
= 111 donc j() = 1
1
8
=
7
8
2) Appelons 1 lvnement avoir exactement 2 fois le ct face
On a 1 = 111. 111. 111 donc j(1) =
3
8
.
3:Analyse combinatoire:
Le cardinal de certains vnements complexes est souvent dicile cal-
culer. Les tchniques danalyse combinatoire, que nous allons voir main-
tenant, vont nous faciliter cette tche dans beaucoup de cas.
3.1 Principe de multiplication
Si une premire opration peut tre execute de :
1
faons, et si pour
chacun des cas prcdent, une deuxime opration peut tre execute de
30
:
2
faons,...., et si pour chacun des cas prcdent une /-ime opration
peut tre execute de :
k
faons, alors il y aura :
1
.:
2
....:
k
faons dexecuter
toutes ces oprations.
Exemple 1.
Vous interroger trois personnes au hasard. Calculer la probabilit que
toutes les trois soient nes un dimanche.
Solution
Notons le rsultat de lexperience par (r. . .) o r est le jour de naissance
de la premire personne, celui de la deuxime personne et . celui de la
troisime personne.
Il y a 7 rponses possibles pour la premire personne, et pour chaque
rponse de la premire personne il y a 7 rponses possibles pour la deux-
ime personne, et quelle que soit la rponse des deux premires personnes,
il y a 7 rponses possibles pour la troisime personne. Au total , daprs
le principe de multiplication, il y a 7 7 7 = 343 rponses possibles .
cc:d o = 343
Si on appelle lvnement les 3 personnes sont nes un dimanche alors
= (d. d. d), donc j() =
1
343
3.2 Les arragements
Considrons un ensemble ni 1 : lments, et un entier j _ :. On ap-
pelle arrangement de j lments pris parmi :, toute suite ordonne de j
lments dierents forme partir des : lments de 1.
Exemple 2.
Soit 1 = c. /. c. d . Les dierents arrangements de 2 lments pris parmi les
4 lments sont :
c/ cc cd /c /c /d cc c/ cd dc d/ dc. Il y en a 12.
Thorme 1 :
Le nombre darrangements de j lments pris parmi : , not
p
n
, est donn
par :
31

p
n
=
:!
(: j)!
o :! = 1 2 ... : et par convention on pose 0! = 1
Exemple 3.

2
4
est le nombre darrangements de 2 lments pris parmi 4.

2
4
=
4!
(4 2)!
=
4!
2!
= 34 = 12 cest ce quon atrouv dans lexemple prcdent.
Exercice 2.
Au tierc, supposons quil ya 12 partants et quil ne peut y avoir dex
aequo.
1) Calculer la probabilit de gagner dans lordre si lon a pari une seule
fois sur 3 numros
2) Calculer la probabilit de gagner dans lordre ou dans le dsordre si
lon a pari une seule fois sur 3 numros.
Solution
Le rsultat de la course est un arrangement de 3 numros pris parmi 12.
Donc cc:d(o) =
3
12
=
12!
9!
= 12 11 10 = 1320
Supposons quil y a quiprobabilit des vnements lmentaires.
1) Posons lvnement gagner dans lordre , on a cc:d() = 1 ( il y a un
seul arrangement gagnant) , donc j() =
1
1320
= 0. 00075
2) Si c/c est le rsultat dans lordre alors cc/. /cc. /cc. cc/ et c/c sont gagnant
dans le dsordre . Au total il y a 6 arrangements gagnant dans lordre ou
dans le dsordre. La probabilit cherche est donc gale
6
1320
= 0. 0045.
3.3 Les prmutations
- On appelle prmutation de : lments de 1 , tout arrangement de :
32
lments pris parmi les : lments de 1.
- Le nombre de prmutations de : lments est donc
n
n
=
:!
(: :)!
=
:!
0!
= :!
3.4 Les combinaisons.
- Considrons un ensemble ni 1 n lments, et un entier j _ :. On
appelle combinaison de j lments pris parmi:, tout ss-ensemble de j
lments dierents form partir des : lments de 1.
Exemple 4.
Soit 1 = c. /. c. d
Les dierentes combinaisons de 2 lments pris parmi les 4 lments de 1
sont :
c. / , c. c , c. d , /. c , /. d , c. d
Rappelons que dans un ensemble lordre dans lequel on crit les lments
na aucune importance.
Thorme 2 :
Le nombre de combinaisons de p lments pris parmi n , not C
p
n
. est
donn par
C
p
n
=
:!
j!(: j)!
Exemple 5.
Au jeu Loto, le parieur doit faire une slection de 6 numros parmi les
nombres de 1 49.
De combien de faons peut-il faire une mise?
Solution :
Une slection est une combinaison de 6 lments pris parmi les 49 ( car
lordre na aucune importance) . Il y a donc C
6
49
=
49!
6!(49 6)!
= 13983816 faons
33
de faire une mise.
La probabilit de gagner avec une mise est
1
13983816
= 0. 000000071
4: Probabilit conditionnelle
Soit un vnement dans le cadre dune exprience alatoire, et 1 un
vnement non impossible ( i.e j(1) ,= 0 ) ; alors la probabilit de lvnement
sachant que lvnement 1 est dj raliser , note j(,1) , est donne
par
j(,1) =
j( 1)
j(1)
j(,1) sappelle la probabilit de par rapport 1.
Exemple 1
1) Quelle est la probabilit quune famille de 2 enfants nait que des lles
sachant que lane est une lle.
2) Quelle est la probabilit quune famille de 2 enfants nait que des lles
sachant quelle a au moins une lle.
Solution:
Lespace echantionnal de cette exprience est o = 11. 1G. G1. GG
Appelons lvnement la famille na que des lles
1 lvnement laine est une lle
C lvnement la famille a au moins une lle
On a = 11 , 1 = 11. 1G . C = 11. 1G. G1
1) On doit calculer j(,1). Pour cela on a 1 = 11 donc j( 1) =
1
4
et
j(1) =
2
4
, do j(,1) =
j(,1)
j(1)
=
1
4
2
4
=
1
2
2) On doit calculer ici j(,C). pour cela on a C = 11 donc j( C) =
1
4
34
et j(C) =
3
4
do j(,C) =
j( C)
j(C)
=
1
4
3
4
=
1
3
.
Exercice 1
Le tableau suivant prsente le comportement dun chantillon de con-
sommateurs par rapport une compagne publicitaire en faveur dune
lessive.
les consommateurs qui ont achet nont pas achet total
ont vu la pub 15 30 45
nont pas vu la pub 15 60 75
total 30 90 120
Si lon considre au hasard une personne de cette chantillon :
1) Quelle est la probabilit quelle ait achet la lessive ?
2) Quelle est la probabilit quelle ait achet la lessive si elle a vu la
publicit?
3) Est-ce que la publicit a eu des eets positifs sur les consommateurs?
Solution
- Lchantillon contient 120 personnes au total; parmi elles 30 ( au total )
ont achet la lessive.
1) Si on choisit une personne au hasard ( sans aucune information sup-
plmentaire) la probabilit quelle ait achet la lessive est
30
120
=
1
4
2) Si on choisit une personne au hasard et si on sait quelle a vu la
publicit (il y en a 45 au total qui ont vu la pub parmi lesquelles 15 ont
achet ) alors la probabilit quelle ait achet est
15
45
=
1
3
3) Puisque
1
3

1
4
donc la probabilit quune personne achte la lessive
aprs avoir vu la pub est suprieur la probabilit quune personne prise
au hasard achte la lessive; donc la publicit a eu des eets positifs sur
les consommateurs.
5 Les variables alatoires (v.a)
35
Soit o lespace chantionnal associ une exprience alatoire. Une vari-
able alatoire est une fonction de o dans 1 .
Gnralement une v.a sera dsign par A. 1. 2 ou 1.
Exemple 1
On lance une pice de monnaie trois fois, alors on a vu que
o = 111. 111. 111. 111. 111. 111. 111. 111
On peut considrer la v.a X qui compte le nombre de faces, on alors
A(111) = 3 . A(111) = 2 . A(111) = 2. ....A(111) = 1 . A(111) = 0
Les valeurs possibles de A sont 0. 1. 2 et 3
5.1 Nouvelle notation pour les vnements
Soit A une v.a . lcriture (A = c) dsignera lvnement : o : A(:) = c
Exemple 2
Dans le cadre de lexemple prcdent on a :
(A = 3) = 111 . (A = 2) = 111. 111. 111 . (A = 1) = 111. 111. 111 et
(A = 0) = 111 .
- On peut donc parler de j(A = c). par exemple on a j(A = 3) =
1
8
; j(A = 2) =
3
8
; j(A = 1) =
3
8
et j(A = 0) =
1
8
- De mme on note par (A _ c); (c _ A _ /) ou (c _ A) les vnements
suivants:
(A _ c) = : o : A(:) _ c
(c _ A _ /) = : o : c _ A(:) _ /
(A _ c) = : o : A(:) _ c .
Exemple 3
Toujours dans le cadre de lexemple prcdent on a
36
(A _ 1) = 111. 111. 111. 111 et j(A _ 1) =
4
8
=
1
2
.
5.2 Remarque :
c) Comme pour les variables statistiques quantitatives, il y a deux types
de v.a : discrtes et continues.
/) Une v.a est discrte si lensemble des valeurs quelle peut prendre est ni
ou dnombrable, par contre si lensemble des ses valeurs est un intervalle,
elle sera dite continue.
37
LES LOIS D/USAGE COURANT
Dans ce chapitre, nous allons tudier trois exemples importants de vari-
ables alatoires obissant aux lois suivantes: binomiale, de Poisson et la
loi normale.
1 Variable alatoire discrte
Soit A une v.a discrte pouvant prendre les valeurs r
1
. r
2
. .... r
n
. Posons
j(A = r
i
) = j
i
pour i = 1. 2. .... : .
On appelle loi de la variable A (ou distribution de probabilit de A) le
tableau suivant:
A r
1
r
2
.... r
n
j(A = r
i
) j
1
j
2
.... j
n
Remarquons que cela est identique une distribution de frquences pour
une variable statistique o les probabilits j
i
remplacent les frquences
relatives
,
i
:
.
De mme que pour une variable statistique, on peut calculer la moyenne,
la variance et lcart-type dune v.a.
- La moyenne, appele aussi lesprance mathmatique et note 1(A).dune
v.a A est dnie par
1(A) =
n
P
i=1
j
i
r
i
o les r
i
sont les valeurs de A et j
i
= j(A = r
i
) pour i = 1. 2. .... : .
- La variance de A , note \ c:(A), est dnie par :
\ c:(A) = 1(A
2
) (1(A))
2
- Lcart-type de A , not o(A). est dni comme la racine carre de la
variance:
o(A) =
p
\ c:(A)
38
2 La loi binomiale.
Considrons une exprience qui na que deux rsultats possibles dont
lun est appel 1 (russite) et lautre est appel 1 (chec), avec j(1) = j et
j(1) = 1 j = .
Ce genre dexprience sappelle exprience de Bernoulli.
Rptons cette exprience : fois et considrons la variable alatoire A qui
compte le nombre de russites au cours des n essais. Alors les valeurs
possibles pour A sont 0. 1. 2. .... :. et on dmontre que la loi de probabilit
de A est donne par :
j(A = /) = C
k
n
j
k

nk
pour / = 0. 1. 2. .... :.
j(A = /) reprsente la probabilit davoir / russites aprs : essais . Cette
v.a est dite suivre la loi binomiale de paramtres : et j, et pour dire cela
en abrg on note A 1(:. j)
On montre que si A 1(:. j) alors
1(A) = :j
,
\ c:(A) = :j
et
o(A) =
_
:j
Exemple 1.
Calculer la probabilit dobtenir 6 bonnes rponses dans un test de 10
questions o il y a 4 choix de rponses pour chacune delles, si lon choisit
les rponses tout fait au hasard.
Solution
Lexperience rpondre une question au hasard na que deux rsul-
tats:ou bien la rponse est juste 1 (russite) avec la probabilit
1
4
. ou bien
la rponse est fausse 1 (chec) avec la probabilit
3
4
.
Cette experience se rpte 10 fois dans le test.
Considrons maintenant la v.a A qui compte le nombre de bonnes rponses.
Il est clair que
A 1(: = 10. j =
1
4
).
39
La probabilit davoir 6 bonnes rponses est donc donne par j(A = 6).
On a alors j(A = 6) = C
6
10
(
1
4
)
6
(
3
4
)
106
= 0. 0162
Exercice 1
Dans le cadre de lexemple prcdent , calculer :
1) la probabilit de navoir aucune bonne rponse,
2) la probabilit davoir au moins cinq bonnes rponses.
Solution
1) la probabilit de navoir aucune bonne rponse est donne par j(A = 0).
On a j(A = 0) = C
0
10
(
1
4
)
0
(
3
4
)
10
= 0. 0563.
2) la probabilit davoir au moins 5 bonnes rponses est donne par j(A _
5).
Or j(A _ 5) = j(A = 5) +j(A = 6) +j(A = 7) +j(A = 8) +j(A = 9) +j(A = 10)
Pour acclrer ces calculs, on dispose dune table ( la n du livre) don-
nant les valeurs numriques de j(A = /) pour certaines valeurs de : et
j.
Aprs lecture de la table , on trouve
j(A _ 5) = 0. 0584 + 0. 0162 + 0. 0031 + 0. 0004 + 0. 000 + 0. 000 = 0. 0781
3 La loi de Poisson
Considrons un vnement 1 dont on sait (par exprience) quil se ralise
en moyenne ` fois dans un intervalle de temps t (ou dans une rgion 1)
donn. Alors la v.a A qui compte le nombre de ralisation de lvnement
1 dans lintervalle de temps t (ou dans la rgion 1) a pour loi de prob-
abilit :
j(A = /) = c

.
`
k
/! pour / = 0. 1. 2. ...
j(A = /) est la probabilit que lvnement 1 se ralise /-fois dans lintervalle
40
de temps t (ou dans la rgion 1)
Une telle v.a est dite suivre la loi de Poisson de paramtre `. et pour
exprimer cela on crit A 1
o
(`).
On montre que si A 1
o
(`) alors 1(A) = \ c:(A) = ` et o(A) =
_
`
Exemple 2
Dans une grande usine, on sait, par exprience, quil se produit en moyenne
1. 8 accident de travail par semaine.
1) Calculer la probabilit quil se produise, dans cette usine, trois acci-
dents en une semaine.
2) Calculer la probabilit quil se produise, dans cette usine, au plus deux
accidents en une semaine.
Solution
Lvnement R ici est un accident de travail. On sait quil se ralise en
moyenne 1. 8 fois par semaine. Donc t = une semaine, et ` = 1. 8
La v.a A qui compte le nombre daccidents par semaine suit alors une loi
de Poisson de paramtre 1. 8: A 1
o
(1. 8)
1) La probabilit davoir trois accidents par semaine est donne donc par
j(A = 3) = c
1;8
(1. 8)
3
3!
= 0. 1607
2) La probabilit de voir se produire au plus 2 accidents par semaine est
donne par j(A _ 2) = j(A = 0) +j(A = 1) +j(A = 2)
= c
1;8
(1. 8)
0
0!
+c
1;8
(1. 8)
1
1!
+c
1;8
(1. 8)
2
2!
Pour calculer rapidement des expressions de ce genre, une table est
fournie en annexe la n du livre.
On lit sur la table j(A = 0) = 0. 1653; j(A = 1) = 0. 2975 et j(A = 2) = 0. 2678
do j(A _ 2) = 0. 1653 + 0. 2975 + 0. 2678 = 0. 7306
Exemple 3
41
Le nombre moyen de dfauts mineurs par mtre carr de tissu produit
par une usine de textile est 0. 3. Si les dfauts sont distribus au hasard
dans la production, quelle est la probabilit quun mtre carr de tissu
contienne plus dun dfaut.
Solution
Lvnement 1 ici est un dfaut mineur. On sait quil se ralise en
moyenne 0. 3 fois par mtre carr. Donc la rgion 1=un mtre carr, et
` = 0. 3
La v.a A qui compte le nombre de dfauts mineurs par mtre carr, suit
donc une loi de Poisson de paramtre 0. 3: A 1
o
(0. 3)
la probabilit quun mtre carr de tissu contienne plus dun dfaut est
donne par j(A 1) = j(A = 2) +j(A = 3) +......
Pour faciliter ce calcul , il vaut mieux passer par lvnement contraire
comme suit:
j(A 1) = 1 j(A _ 1)
= 1 [j(A = 0) +j(A = 1)]
= 1 (0. 7408 + 0. 2222)
= 0. 037
3.1 Remarque importante
Soit A 1
o
(`) . Il arrive souvent quon cherche la probabilit de voir se
raliser lvnement 1 en question pendant :t (ou dans la rgion :1).
Alors dans ce cas la v.a 1 qui compte le nombre de ralisation de 1
pendant :t ( ou :1) suit la loi 1
o
(:`).
Exemple 4.
Dans le cadre de lexemple prcdent, quelle est la probabilit quune
pice de tissu de 10 mtres carrs ne contienne aucun dfaut.
Solution
On sait quen moyenne, il y a 0. 3 dfauts par mtre carr, donc il y a en
moyenne 10 0. 3 = 3 dfauts par 10 :
2
.
42
La v.a 1 qui compte le nombre de dfauts par 10 :
2
suit donc la loi de
Poisson de paramtre 3: 1 1
o
(3)
la probabilit quune pice de tissu de 10 mtres carrs ne contienne aucun
dfaut est donne par j(1 = 0) = c
3
(3)
0
0!
= 0. 0498
Exercices
Exercice 1 (nal 2000)
Par exprience, on sait quune personne sur huit parmi celles qui entrent
dans un supermarch nachte aucun article.
Parmi les 12 prochaines personnes qui vont entrer au supermarch, cal-
culer:
1) la probabilit quil sen trouve au moins une personne qui nachte
rien ;
2) la probabilit que les 12 achtent chacun au moins un article.
Exercice 2
Lexprience montre que
1
6
des cosommateurs contacts par un vendeur
daspirateurs achtent un des produits oerts.Calculer la probabilit que
parmi les 15 prochaines personnes contactes, il sen trouve 5 qui accptent
dacheter le produit.
Exercice 3
Des relevs rcents montrent quil entre en moyenne 1. 6 clients par minute
dans une agence banquaire.
1) Quelle est la probabilit quil nentre, dans cette agence, aucun client
pendant un intervalle dune minute
2) Quelle est la probabilit quil entre, dans cette agence, au moins un
client pendant un intervalle de deux minutes
3) Quelle est la probabilit quil entre, dans cette agence, au plus 5 clients
pendant un intervalle de 5 minutes.
43
Solutions
Exercice 1
Une personne qui entre au supermarch est une exprience qui na que
deux rsultats : ou bien la personne nachte aucun article 1 (russite)
avec j(1) =
1
8
. ou bien la personne achte au moins un article 1 (chec)
avec j(1) =
7
8
.
Pour les 12 prochaines personnes qui entrent au supermarch, cette ex-
prience se rpte 12 fois .
Considrons la v.a A qui compte le nombre de personnes qui nachtent
aucun article. Alors A 1(: = 12. j =
1
8
)
1) la probabilit que parmi les 12 au moins une personne nachte rien est
donne par j(A _ 1) = 1 j(A < 1) = 1 j(A = 0) = 1 C
0
12
(
1
8
)
0
(
7
8
)
12
= 0. 798 58
2) Considrons la v.a Y qui compte le nombre de personnes qui achtent
au moins un article. Il est clair que cette v.a suit une loi binomiale de
paramtres : = 12, et j =
7
8
.
La probabilit que les 12 achtent chacun au moins un article est donne
par j(1 = 12).
j(1 = 12) = C
12
12
(
7
8
)
12
(
1
8
)
0
= (
7
8
)
12
= 0. 201 4
Exercice 2
Contacter un client est une exprience deux rsultats : ou bien le client
achte (Russite) , avec j(1) =
1
6
, ou bien il nachte pas (Echec) , avec
j(1) =
5
6
.
Lorsque le vendeur cotacte 15 clients, il rpte lexprience 15 fois. Donc la
v.a A qui compte le nombre de clients qui achtent , suit la loi binomiale
1(: = 15; j =
1
6
).
La probabilit que parmi les 15 clietns contacts, il sen trouve 5 qui
achtent, est donne par j(A = 5) = C
5
15
(
1
6
)
5
(
5
6
)
10
= 0. 0623 (nexiste pas dans
44
la table)
Exercice 3
1) Lvnement 1 un client entre dans lagence se produit en moyenne
1. 6 fois par minute. Donc la v.a A qui compte le nombre de clients qui
entrent, par minute, dans lagence suit une loi de Poisson de paramtre
1. 6.
La probabilit quil nentre aucun client dans lagence pendant un inter-
valle dune minute est donne par j(A = 0) = c
1;6
(1. 6)
0
0!
= 0. 2019
2) De mme si on considre la v.a 1 qui compte le nombre de clients
qui entrent dans lagence pendant un intervalle de deux minutes, alors
1 1
o
(3. 2) car 2 1. 6 = 3. 2
la probabilit quil entre, dans cette agence, au moins un client pendant
un intervalle de deux minutes est donne par :
j(1 _ 1) = 1 j(1 < 1)
= 1 j(1 = 0)
= 1 0. 0408
= 0. 9592
3) Soit 2 la v.a qui compte le nombre de clients qui entrent dans lagence
pendant un intervalle de 5 minutes. On a 2 1
o
(8) car 5 1. 6 = 8.
la probabilit quil entre, dans cette agence, au plus 5 clients pendant un
intervalle de 5 minutes est donne par :
j(2 _ 5) = j(2 = 0) +j(2 = 1) +.... +j(2 = 5) (la lecture de la table donne)
= 0. 0003 + 0. 0027 + 0. 0107 + 0. 0286 + 0. 0573 + 0. 0916
= 0. 1912.
4 Variable alatoire continue
Pour une v.a alatoire A continue, sa loi de probabilit est donne par
une fonction , appele densit de probabilit de A. Elle est reprsente
par une courbe continue et la probabilit j(c _ A _ /) est donne par la
45
surface comprise entre la courbe de , , laxe Cr et les droites verticales
r = c et r = /
La surface totale entre la courbe de , et laxe des x est videmment
gale 1
On dnit lesprance mathmatique, la variance et lcart type dune
variable continue comme suit:
1(A) =
R
r,(r)dr
\ c:(r) =
R
r
2
,(r)dr (1(r))
2
= 1(A
2
) (1(A))
2
o(A) =
p
\ c:(A)
Dans la suite on va avoir besoin de la dnition suivante:
Une variable alatoire est dite cente si 1(A) = 0 et elle est dite rduite si
\ c:(A) = 1.
Si on a la fois 1(A) = 0 et \ c:(A) = 1 , elle sera dite centre rduite.
On montre que si A est une v.a telle que 1(A) = j et o(A) = o alors la
variable 2 =
A j
o
est une variable centre rduite cest-dire que 1(2) = 0
et o(2) = 1
4.1 La loi normale cente rduite
Une variable 2 est dite normale cente rduite si sa densit de probabilit
est donne par :
,(r) =
1
_
2:
c

r
2
2
Pour dire quune variable alatoire 2 suit une loi est normale centre
rduite, on crit 2 `(0. 1)
4.2 Propriets
La courbe de , est symtrique par rapport laxe des
La surface comprise entre la courbe et laxe des r est comme on la dj
dit est gale 1, donc laxe des divise cette surface en deux parties
46
gales chacune 0. 5
Pour calculer une probabilit, lorsque 2 `(0; 1) , on se sert dune table
construite pour cela. Cette table donne seulement j(2 _ .
0
) pour .
0
0 .
cest--dire elle donne la surface hachure.
Pour comprendre comment lire la table voici un exemple
Exemple 1.
Soit 2 `(0. 1). Calculer j(2 _ 1. 65).
On utilise la table comme suit: on crit 1. 65 = 1. 6+0. 05. Puis au croisement
de la ligne 1. 6 et la colonne 0. 05 on lit la probabilit j(2 _ 1. 65) = 0. 9505.
Pour calculer toutes les probabilits, mme celles qui ne sont pas donnes
par la table, par exemple j(2 _ 1. 65) ou j(2 _ 1. 36) , on utilise les propriets
de , . Voici comment :
4.2 Calcul de j(2 _ .
0
) avec .
0
ngatif.
Bien sr cette probabilit nest pas donne par la table, mais en utilisant
les propriets de la densit, on peut la calculer en se ramenant ce que
donne la table cest--dire j(2 _ r) o r est positif.
La surface o
1
est gale la surface o
2
cause de la symtrie de la courbe
par rapport laxe des .
On a donc
j(2 _ .
0
) =surface totalej(2 _ .
0
) (avec .
0
_ 0)
= 1 j(2 _ .
0
).
La table nous donne j(2 _ .
0
) car .
0
_ 0.
47
ECHANTILLONNAGE ET ESTIMATION
Dans ce chapitre on va aborder le problme fondamental de la statis-
tique, savoir dvelopper des procds permettant de gnraliser toute
une population des rsultats observs sur un chantillon, tout en tant
capable de mesurer les chances que ces gnralisations savrent exactes.
1: Echantillon alatoire
Dans la pratique, il est souvent impensable de faire porter notre tude
statistique sur lensemble de tou les individus de la population. On
procde alors par chantillonnage, cest--dire que lon restreint notre
tude une partie de la population.
Pour que les conclusions de notre tude soient valables, les chantil-
lons doivent tre reprsentatifs. Une des faons dobtenir un chantillon
reprsentatif est de procder un chantillonnage alatoire, ce qui re-
vient considrer que les individus de la population ont la mme chance
dappartenir un mme chantillon. Enn, pour obtenir un chantillon
alatoire , on attribue un numro chaque individu de la population; on
inscrit ces numros sur des petits morceaux de papier que lon place dans
une urne, puis on procde un tirage dans lurne.
Quand on a extrait un individu dune urne, avant de procder un nou-
veau tirage, on peut soit ly remettre (tirage avec remise), soit ne pas ly
remettre(tirage sans remise). Dans le deuxime cas, un individu ne peut
sortir quune seule fois.
Quand chaque individu dune population peut tre tir plus dune fois,
lchantillonnage est dit non exhaustif, dans le cas contraire il est dit
exhaustif.
2 Distribution dchantillonnage des moyennes
Supposons quun certain caractre numrique dans une population a
pour moyenne j et dcart-type o.
Considrons tous les chantillons de taille n, qui peuvent tre extrait au
hasard (avec ou sans remise).
Dsignons par r
1
. r
2
. ... les moyennes du caractre dans lchantillon 1,2,...etc.
48
Considrons la variable alatoire A dont les valeurs possibles sont r
1
. r
2
. ...
La variable alatoire A sappelle distribution dchantillonnage des moyennes.
On montre les deux thormes suivants :
Thorme 1: Les caractristiques de A
a) Si le tirage est exhaustif dans une population de taille N, on a :
1( A) = j et o( A) =
o
_
:
r
` :
` 1
b) Sinon on a :
1( A) = j et o( A) =
o
_
:
Thorme 2: La loi de A
Dans une population distribue normalement (c--d le caractre suit la
loi normale dans la population) ou dans une population quelconque mais
avec : _ 30 on a : A `(j; o
2
(A))
Remarque.
Le facteur
r
` :
` 1
qui sappelle facteur dexhaustivit peut tre pris gal
1 si : _ 0. 05`. Autrement dit
r
` :
` 1
= 1 si la taille de lchantillon est
infrieur 5% de la population.
Exemple 1
Supposons que le poids dune population de 60 tudiants dune universit
est normalement distibu avec une moyenne j = 64 kg et une variance
o
2
= 20 kg
2
.
Un chantillon de 20 tudiants a t tir.
1) Trouver les caractristiques et la loi de probabilit de la distribution
dchantillonnage des moyennes A si le tirage a t eectu avec remise.
2) Mme question pour un tirage sans remise.
49
3) Trouver la probabilit quun chantillon de taille 20 tir avec remise
ait une moyenne suprieure ou gale 66 kg.
4) Trouver deux valeurs 1
1
et 1
2
situes distance gale de part et dautres
de j = 64 telles que la probabilit que la moyenne dun chantillon non
exhaustif de 20 tudiants tombe entr ces deux valeurs soit 0. 95.
Solution.
1) On est dans le cas non exhaustif, donc les caractristiques de A sont (
voir thorme 1)
1( A) = j = 64 kg et o( A) =
o
_
:
=
_
20
_
20
= 1
Puisque la population est distribue normalement alors A `(j ; o
2
(A))
(voir thorme 2)
Donc ici A `(64 ; 1)
2) Si le tirage est exhaustif alors le thorme 1 nous dit que 1( A) = 64
kg et
o( A) =
_
20
_
20
r
60 20
60 1
ce qui donne o( A) = 0. 8234
Le thorme 2 nous dit que
A `(64 ; o
2
(A) = 0. 6779)
3) Puisque le tirage est avec remise alors on est dans le cadre de la
question 1) donc A `(64; 1). La probabilit demande est 1(A _ 66). Pour
la calculer faisons le changement de variable habituel
2 =
A j
o(A)
=
A 64
1
donc A = 2 + 64
On sait que dans ce cas 2 `(0; 1)
1(A _ 66) = 1(2 + 64 _ 66)
50
= 1(2 _ 2)
= 1 1(2 _ 2)
= 1 0. 9772
= 0. 0228.
4) La question signie quil faut chercher 1
1
et 1
2
telles que 1(1
1
_ A _
1
2
) = 0. 95 avec A `(64; 1) puisque le tirage est avec remise.
Pour cela posons encore 2 =
A j
o(A)
=
A 64
1
donc A = 2 + 64 On a 0. 95 =
1(1
1
_ A _ 1
2
) = 1(1
1
_ 2 + 64 _ 1
2
) = 1(1
1
64 _ 2 _ 1
2
64)
Puisque 1
1
et 1
2
doivent tre symtriques par rapport la moyenne j = 64
de A alors pour la variable alatoire 2 ceci revient chercher t 0 tel que
1(t _ 2 _ t) = 0. 95.
Dans ce cas on a :
1(t _ 2 _ t) = 1(2 _ t) 1(2 _ t) = 1(2 _ t) [1 1(2 _ t)] = 0. 95
donc, 1(2 _ t) =
1+0;95
2
= 0. 975
La table de la loi normale nous donne t = 1. 96 et par suite
On peut crire donc 1(62. 04 _ A _ 65. 96) = 0. 95
Autrement dit lintervalle [62. 04 ; 65. 95] possde 95% de chance de contenir
la moyenne dun chantillon non exhaustif de taille 20.
Exercice 1
La dure de vie moyenne des ampoules lectriques produites par une usine
est de 800 heures avec un cart-type o=40 heures. De cette population on
tire un chantillon de taille 25 pris sans remise(exhaustif). Trouver, en
supposant que la dure de vie des ampoules est distribue normalement:
1) 1(A _ 785)
2) 1(790 _ A _ 810)
3) 1
1
et 1
2
symtriques par rapport j = 800 telles que 1(1
1
_ A _ 1
2
) = 0. 90.
51
Exercice 2
Les rsultats de 200 tudiants un test de mathmatiques prsentent une
moyenne de 75 sur 100 et un cart-type de 10 . De cette population , on
prlve , sans remise, un chantillon de taille 50. Trouver:
1) La probabilit que le rsultat moyen de cet chantillon se situe entre
74 et 76.
2) Les limites 1
1
et 1
2
dun intervalle symtrique par rapport la moyenne
qui possde 99% des chances de contenir la moyenne de cet chantillon.
Solutions
Exercice 1
On a j = 800 / ct o = 40 /
Le tirage est exhaustif, donc on doit tenir compte du facteur dexhaustivit
puisque : = 25 < 30 . Mais on peut considrer que la population est trs
grande, donc : < 0. 05` (ce qui est logique puisque 25 ampoules reprsente
certainement moins de 5% de la production de lusine) et par suite le
facteur dexhaustivit peut tre pris gal 1. Do
1(A ) = 800 / et o(A) =
o
_
:
=
40
_
25
= 8
La population est suppose normale donc A `(800 ; 64)
Posons 2 =
A j
o(A)
=
A 800
8
donc A = 82 + 800 avec 2 `(0 ; 1)
1) 1(A _ 785) = 1(82+800 _ 785) = 1(2 _ 1. 88) = 11(2 _ 1. 88) = 10. 9699 = 0. 0301.
2) 1(790 _ A _ 810) = 1(790 _ 82 + 800 _ 810)
= 1(1. 25 _ 2 _ 1. 25)
= 1(2 _ 1. 25) 1(2 _ 1. 25)
= 1(2 _ 1. 25) [1 1(2 _ 1. 25)]
= 21(2 _ 1. 25) 1
= 2(0. 8944) 1
52
= 0. 7888
Cette probabilit signie quil y a 78. 88% de chances que la moyenne dun
chantillon exhaustif de taille 25 soit dans lintervalle [790 ; 785]
3) De la mme faon que dans lexemple du cours, on a :
1(1
1
_ A _ 1
2
) = 1(1
1
_ 82 + 800 _ 1
2
) = 1(
1
1
800
8
_ 2 _
1
2
800
8
) = 0. 90
Cherchons t 0 tel que 1(t _ 2 _ t) = 0. 90
Ceci est quivalent 1(2 _ t) =
1 + 0. 90
2
= 0. 95. la valeur de t la plus proche
dans la table est t = 1. 65
1
1
800
8
= 1. 65 et
1
2
800
8
= 1. 65 Donc 1
1
= 786. 8 et 1
2
= 813. 2
Ceci signie quil y a 90% de chances que la moyenne dun chantillon de
taille 25 soit dans lintervalle [786. 8 ; 813. 2] .
Exercice 2
On a j = 75 . o = 10 . : = 50 ct ` = 200
Le tirage est exhaustif donc 1(A) = 75 ct o(A) =
o
_
:
r
` :
` 1
=
10
_
50
r
200 50
200 1

1. 23
Puisque : = 50 30 alors A `(75 ; (1. 23)
2
)
Posons comme toujours 2 =
A 75
1. 23
donc A = 1. 232 + 75 ct 2 `(0 ; 1)
1) 1(74 _ A _ 76) = 1(74 _ 1. 232 + 75 _ 76)
= 1(
74 75
1. 23
_ 2 _
76 75
1. 23
)
= 1(0. 81 _ 2 _ 0. 81)
= 1(2 _ 0. 81) 1(2 _ 0. 81)
= 1(2 _ 0. 81) [1 1(2 _ 0. 81)]
= 21(2 _ 0. 81) 1
53
= 2(0. 7910) 1
= 0. 5820
2) 1(1
1
_ A _ 1
2
) = 0. 99
1(1
1
_ 1. 232 + 75 _ 1
2
= 0. 99 == 1(
1
1
75
1. 23
_ 2 _
1
2
75
1. 23
) = 0. 99
On cherche t 0 tel que 1(t _ 2 _ t) = 0. 99 et comme avant ceci revient
rsoudre lquation
1(2 _ t) =
1 + 0. 99
2
= 0. 995 . La table de la loi normale nous donne t = 2. 58 (la
valeur la plus proche)
Donc
1
1
75
1. 23
= 2. 58 et
1
2
75
1. 23
= 2. 58 == 1
1
= 1. 23(2. 58) + 75 = 71. 831
2
= 1. 23(2. 58) + 75 = 78. 17
Lintervalle [1
1
; 1
2
] a 99% de chances de contenir la moyenne dun chan-
tillon exhaustif de taille 50.
3 Estimation par intervalle de conance de la moyenne j
Lors dune tude statistique, en gnral la moyenne j de la population est
inconnue. Le problme qui nous intersse ici est de trouver un intervalle
[1
1
; 1
2
] tel que la probabilit que j appartienne cet intervalle soit xe
davance.
Dnition 1
On appelle intervalle de conance, un intervalle de la forme [1
1
; 1
2
]
symtrique par rapport j ayant une certaine probabilit de contenir la
moyenne j.
Dnition 2
On appelle niveau de conance, not 1 c , la probabilit qu lintervalle
de conance de contenir la moyenne j. Le nombre c sappelle le risque
derreur.
Mthode de calcul de L
1
et L
2
Si : _ 30 , ou si la population est distribue normalement avec o connu,
on sait que dans ce cas que A `(j; o
2
(A)).
54
Posons 2 =
A j
o(A)
, on sait qualors 2 `(0; 1)
1
ere
tape: on cherche dabord t 0 tel que 1(t _ 2 _ t) = 1 c . Voici
comment:
On a 1(2 _ t) 1(2 _ t) = 1 c
1(2 _ t) [1 1(2 _ t)] = 1 c donc 1(2 _ t) = 1
c
2
et t sera donn par
la table de la loi normale.
2
eme
tape: Une fois que t est connu, on peut crire que 1(t _
A j
o(A)
_ t) =
1 c donc
1(A to(A) _ j _ A +to(A)) = 1 c
Pour un chantillon, la variable alatoire A prend la valeur r, donc
1
1
= r to(A) 1
2
= r +to(A)
Si o est inconnu, alors on peut prendre une valeur estim ponctuelle
pour o. cest--dire lcart-type trouv dans lchantillon.
Remarque
Pour le calcul de lintervalle de conance [1
1
; 1
2
] on prendra les valeurs de
t suivantes:
t = 2. 58 si c = 1%
t = 1. 96 si c = 5%
t = 1. 65 si c = 10%
Exemple
Une machine est rgle pour verser un certain mlange dans une boite
avec un cart-type de 3. 2 grammes. Parmi lensemble de la production, on
prlve au hasard, avec remise, 30 boites pour chacune delles on a not le
poids. Sachant que le poids moyen obtenu partir de lchantillon est 165
grammes, construire un intervalle de conance 95% pour le poids moyen
des boites remplies par cette machine.
Solution :
55
On a et 1
1
= r to(A) et 1
2
= r + to(A) avec r = 165q et puisque le
tirage est non exhaustif alors o(A) =
o
_
:
=
3. 2
_
30
= 0. 584..
Comme 1 c = 0. 95 alors c = 0. 05 = 5% donc t = 1. 96
Donc 1
1
= 165 (1. 96)(0. 584) = 163. 86
1
2
= 165 + (1. 96)(0. 584) = 166. 14
On a donc 1(j [163. 86 ; 166. 14]) = 0. 95
Autrement dit, on a 95% de chances que la moyenne appartienne lintervalle
[163. 86 ; 166. 14] .
Exercice 1
Etan donn que la moyenne j et lcart-type o de la dure de vie dun
tube cran de tlvision fabriqu par une compagnie sont inconnus, on
a prelev au hasard dans la production un chantillon de taille 36 pour
lequel on a obtenu une moyenne de 6 ans et un cart-type de 0. 8 an .
Construire un intervalle de conance 95% pour j puis un intervalle de
conance 99%.
Exercice 2
Dans le but de se faire une ide sur lecacit dun nouveau mdicament
devant prolonger la dure du sommeil des gens, on a administr une
dose de ce mdicament 40 individus choisis au hasar. On a obtenu un
temps supplmentaire moyen de sommeil de 1. 6 heures avec un cart-type
de 0. 4 heure pour ces individus. Construire un intervalle de conance
99% pour j , le temps moyen de prolongation de sommeil caus par le
mdicament.
Solution :
Exercice 1
On a : = 36 ; r = 6 ct lcart-type de lchantillon : = 0. 8. On a aussi
1
1
= r to(A) et 1
2
= r +to(A) o o(A) =
:
_
:
=
0. 8
_
36
= 0. 133..
Ici on a pas tenu compte du facteur dexhaustivit car on peut considrer
que la population est trs grande, et par suite la taille de lchantillon
reprsente moins de 5% de la taille de la population.
56
- Si c = 5% alors t = 1. 96 donc
1
1
= 6 (1. 96)(0. 133) = 5. 74
et
1
2
= 6 + (1. 96)(0. 133) = 6. 26
Do 1(j [5. 74 ; 6. 26]) = 0. 95
- Si c = 1% alors t = 2. 58 donc
1
1
= 6 (2. 58)(0. 133) = 5. 66
1
2
= 6 + (2. 58)(0. 133) = 6. 34
Do 1(j [5. 66 ; 6. 34]) = 0. 99
Exercice 2
On a : = 40 ; r = 1. 6 et : = 0. 4 donc o(A) =
:
_
:
0. 4
_
40
= 0. 06
Pour c = 1% on a t = 2. 58 donc
1
1
= r to(A) = 1. 6 (2. 58)(0. 06) = 1. 45
1
2
= r +to(A) = 1. 6 + (2. 58)(0. 06) = 1. 75
Donc 1(j [1. 45 ; 1. 75]) = 0. 99
4 Distribution dchantillonnage des proportions
Considrons une population dans laquelle chaque individu possde ou
ne possde pas un caractre. Supposons que la proportion de ceux qui
possdent le caractre est j ( donc la proportion de ceux qui ne possdent
pas le caractre est 1 j)
Considrons tous les chantillons de taille : qui peuvent tre extrait de
la population . Pour chaque chantillon i dterminons la proportion ,
i
de
ceux qui possedent le caractre.
La variable alatoire 1 dont les valeurs sont ,
1
. ,
2
. ... est appele distrib-
ution dchantillonnage des proportions.
57
On a les thormes suivants:
Thorme 1
Si le tirage est sans remise (exhaustif) dans une population de taille `
alors
1(1) = j ct o(1) =
r
j(1 j)
:
r
` :
` 1
Sinon on a
1(1) = j ct o(1) =
r
j(1 j)
:
Thorme 2
Si : _ 30 alors 1 `(j ; o
2
(1))
Remarque
Si : < 0. 05` le facteur dexhaustivit
r
` :
` 1
peut tre pris gal 1.
Exercice 1
Une certaine machine usine des pices. Dune faon gnrale, elle produit
3% de pices mauvaises. Un client reoit une caisse de 500 pices, en
provenance directe de la machine.
1) Quelle est la probabiulit quil trouve moins de 1% de pice mauvaises
linterieur de la caisse.
2) Quelle est la probabiulit quil trouve plus de 5% de pice mauvaises
linterieur de la caisse
Exercice 2
Calculer la probabilit pour que sur les 200 prochains accidents de voiture
sur les routes, il existe:
1) moins de30% dhommes,
2) plus de 80% dhommes
58
3) entre 40% et 60% dhommes sachant que, gnralement, sur cinq person-
nes accidentes il y a une femme.
Solution :
Exercice 1
Dune faon gnrale, la proportion de pices mauvaises est j = 3% =
0. 03. On peut considrer que lchantillon provient dune population trs
grande (donc : _ 0. 05`) . La distibution dchantillonnage des proportions
1 a donc les caractristiques suivantes:
1(1) = j = 0. 03 . o(1) =
r
j(1 j)
:
=
r
0. 03(1 0. 03)
500
0. 0076
1 `(0. 03 ; (0. 0076)
2
)
1) On doit calculer 1(1 < 0. 01). Pour cela posons 2 =
1 0. 03
0. 0076
On a 1(1 < 0. 01) = 1(0. 00762 + 0. 03 < 0. 01) = 1(2 < 2. 63) = 1 1(2 < 2. 63) = 0. 0043.
2) La probabilit que le client trouve plus de 5% de pices mauvaises est
donne par 1(1 0. 05).
On a 1(1 0. 05) = 1(0. 00762 + 0. 03 0. 05) = 1(2 2. 63) = 1 1(2 < 2. 63) = 0. 0043.
Exercice 2
Dsignons par j la proportion dhommes accidents. On a j =
4
5
= 0. 8.
On peut considrer que lchantillon de taille : = 200 provient dune pop-
ulation trs grande (donc : < 0. 05`), ce qui permet de prendre le facteur
dexhaustivit gal 1. La distribution dchantillonnage des proportions
a donc les caractristiques suivantes:
1(1) = 0. 8 ; o(1) =
r
j(1 j)
:
=
r
0. 8(1 0. 8)
200
0. 028
Et comme : = 200 30 alors 1 `(0. 8 ; (0. 028)
2
)
1) La probabilit demande est donne par 1(1 < 0. 3).
Posons 2 =
1 0. 8
0. 028
donc 1 = 0. 0282 + 0. 8 et 2 `(0. 1)
59
1(1 < 0. 3) = 1(0. 0282 + 0. 8 < 0. 3) = 1(2 <
0. 3 0. 8
0. 028
) = 1(2 < 17. 85) 0
2) De mme calculons 1(1 0. 8).
1(1 0. 8) = 1(0. 0282 + 0. 8 0. 8) = 1(2 0) = 0. 5
3) Il faut calculer 1(0. 4 < 1 < 0. 6).
1(0. 4 < 1 < 0. 6) = 1(0. 4 < 0. 0282 + 0. 8 < 0. 6)
= 1(14 < 2 < 7) 0
5 Estimation par intervalle de conance de la proportion
Comme pour la moyenne, nous allons chercher deux valeurs 1
1
et 1
2
telles que la probabilit que j apparetienne [1
1
; 1
2
] soit gale 1 c o c
est le risque derreur x davance.
Si : _ 30 nous savons que la distribution dchantillonnage 1 suit la loi
normale `(j ; o(1) ).
Posons 2 =
1 j
o(1)
, on sait que 2 `(0; 1)
Cherchons t 0 tel que 1(t _ 2 _ t) = 1 c
On a vu (voir 3 ) que ceci est equivalent 1(2 _ t) = 1
c
2
et t est donn
par la table de la loi normale.
On a donc 1(t _
1 j
o(1)
_ t) = 1c donc 1(1 to(1) _ j _ 1 +to(1)) = 1c
Pour un chantillon la variable alatoire prend la valeur , , donc
1
1
= , to(1)
1
2
= , +to(1)
Il reste pour calculer 1
1
et 1
2
estimer o(1) :
On prend o(1) =
r
,(1 ,)
:
r
` :
` 1
si lon doit tenir compte du facteur
dexhaustivit, ou on prend o(1) =
r
,(1 ,)
:
sinon .
60
Rappelons que , est la valeur de la proportion trouve dans lchantillon.
Exercice 1
90% des 150 personnes interroges sont des consommateurs dune marque
de lessive.
Construire un intervalle de conance 95% pour la proportion de lensemble
des consommateurs de cette lessive
Exercice 2
Dans un certain lac, un chantillon de 350 poissons pris laide dun
let comprend 70 truites. Construire un intervalle de conance pour la
proportion des truites dans ce lac.
1) avec un niveau de conance de 90%
2) avec un risque de 1%
Solution :
Exercice 1
Dans lchantillon de taille 150 on a trouv que la proportion est , = 0. 9.
On peut supposer que la population est trs grande (donc : < 0. 05`), donc
le facteur dexhaustivit peut tre pris gal 1, et par suite o(1) =
r
,(1 ,)
:
=
r
0. 9(1 0. 9)
150
= 0. 024
Ici 1 c = 0. 95 donc c = 0. 05 = 5% et par suite t = 1. 96
Donc 1
1
= 0. 9 (1. 96)(0. 024) = 0. 85
1
2
= 0. 9 + (1. 96)(0. 024) = 0. 95
Do 1(j [0. 85 ; 0. 95]) = 0. 95
Avec un niveau de conance de 95%, la proportion des consommateurs se
situe entre 85% et 95%.
Exercice 2
61
Dans lchantillon de taille : = 350 , la proportion des truites est , =
70
350
=
0. 2.
On peut supposer que la taille de la population (les poissons du lac) est
trs grande donc o(1) =
r
,(1 ,)
:
=
r
0. 2(1 0. 2)
350
= 0. 0213... 0. 021
1) Si c = 10% ( c--d 1 c = 0. 90) alors t = 1. 65 donc
1
1
= 0. 2 (1. 65)(0. 021) = 0. 165 0. 17
1
2
= 0. 2 + (1. 65)(0. 021) = 0. 234 0. 23
Avec un risque derreur de 10% , la proportion des truites dans le lac se
situe entre 17% et 23%.
2) Si c = 1% alors t = 2. 58 donc 1
1
= 0. 2 (2. 58)(0. 021) = 0. 1458 0. 15 et
1
2
= 0. 2 + (2. 58)(0. 021) = 0. 254 0. 25
Avec un niveau de conance de 99%, la proportion des truites dans le lac
se situe entre 15% et 25%.
62