Vous êtes sur la page 1sur 208

1

Beaujolais BOFOYA KOMBA, Ph.D.


Professeur d’Universités

Statistique
pour économiste

Cours et exercices résolus


2ème Edition revue et corrigée

Kinshasa/RDC-Mai 2010
2
3

Avertissement

vertissement

Le code de la propriété intellectuelle du 1er juillet 1992 interdit la photocopie


à usage collectif des œuvres scientifiques sans autorisation des ayants droit. Or,
cette pratique s’est généralisée dans les établissements d’enseignement
supérieur, provoquant une baisse brutale des achats de livres, au point que la
possibilité même pour les auteurs de créer des œuvres nouvelles est de le faire
éditer correctement est aujourd’hui menacée.

Nous rappelons donc que toute reproduction, partielle ou totale, du


présent ouvrage est interdite sans autorisation de l’auteur.
4
5

Préface

réface

Ce cours s’adresse essentiellement aux futurs économistes, et plus


particulièrement aux économètres, c’est-à-dire aux étudiants en Sciences
Economiques qui veulent pouvoir utiliser les instruments mathématiques et
statistiques dans leurs études économiques. Le lecteur n’a guère besoin d’avoir au
départ que des connaissances mathématiques très limitées. Néanmoins, une
certaine maîtrise des principes de base de l’Economie Politique est indispensable.
Il n’y a sans doute aucun moyen de prouver à priori que les méthodes
statistiques et économétriques sont fructueuses, mais cela est vrai pour toutes
les méthodes scientifiques. Tout ce qui est demandé au lecteur ou à l’étudiant,
est de garder son esprit ouvert à la possibilité d’utiliser ces méthodes. Seul un
usage sérieux des méthodes statistiques dans le domaine de l’économie peut nous
donner une justification pragmatique de l’économétrie.
Le but de ce cours est d’initier l’économiste à l’analyse statistique en
suivant une approche pédagogique adaptée à la réceptivité de l’étudiant en
Sciences Economiques. De nombreux exemples et exercices illustrent les
développements théoriques aux travers de différentes sections. Les solutions aux
exercices étant indiquées à la fin de chaque section, l’étudiant pourrait ainsi
parvenir à une bonne assimilation des concepts et techniques à retenir et un
contrôle individuel des connaissances.
Il est à peine besoin de souligner ici qu’un ouvrage de ce genre ne pourrait
guère être le fait d’une seule personne. Nous sommes redevables à bien d’autres
personnes à commencer par de nombreux devanciers dont les ouvrages repris
parmi les références bibliographiques nous ont servi.
Au moment où nous livrons cet ouvrage au publique, nous avons le plaisir
d’adresser nos remerciements aux étudiants de 2ème graduat en Sciences
Economiques de l’Université de Kinshasa qui avaient suivi durant l’année
académique 1989-1990 nos leçons de Statistique II. Leurs interrogations,
commentaires et suggestions ont été pour beaucoup dans l’amélioration de la
qualité de nos leçons qui, pour l’essentiel, constituent l’ossature du présent
ouvrage.
Nous voudrions ainsi exprimer notre gratitude au Professeur KINTAMBU
MAFUKU, en tant que notre Promoteur de Thèse. Cet ouvrage constitue un
modeste témoignage de l’encadrement dont nous y avons bénéficié.

Prof. Dr Beaujolais BOFOYA KOMBA


6
7

Chapitre Premier
Chapitre I. Introduction aux calculs des probabilités
ntroduction aux calculs des probabilités

1.1. Le concept de probabilité

Le concept de probabilité s’est dégagé { partir d’exemples simples


empruntés généralement aux jeux de hasard.
La statistique antérieure aux calculs des probabilités traitait
principalement des ensembles d’objets, de l’organisation et de la présentation
des données en tableaux et graphiques.
Avec l’apparition, du calcul des probabilités, il a été vite réalisé que la
statistique pouvait être utilisée à tirer des conséquences valides et prendre des
décisions raisonnables telles que dans le cas de la théorie de l’échantillonnage
et dans celui de la prévision sur la base de l’analyse des données.
Dans tout jeu du hasard, l’élément essentiel est le caractère aléatoire. Il y
a toujours une incertitude en ce qui concerne la réalisation ou non d’un
événement particulier. Il est donc commode d’affecter un nombre compris
entre 0 et 1 à la chance ou à la probabilité avec laquelle nous espérons voir cet
événement se réaliser.
Si nous sommes sûrs ou certains que cet événement sera réalisé, nous
dirons que sa probabilité est de 100% ou 1.
Exemple : La probabilité d’obtenir un nombre inférieur { 7 dans un jeu
consistant { lancer une fois le dé en l’air est égal { 1.
Par contre, si nous sommes sûrs que cet événement ne peut pas se réaliser,
nous dirons que sa probabilité est de 0% ou 0.
Exemple : La probabilité d’avoir le chiffre 7 dans un jeu consistant { lancer une
fois le dé en l’air est égal { 0.
Exercice 1 : Trouver la probabilité d’obtenir une face au cours du jet unique
d’une pièce de monnaie bien équilibrée.
Solution
Le jet constitue une épreuve, c’est-à-dire une expérience dont le résultat
est « incertain ». Il y a deux éventualités (ou résultats) possibles : pile ou face.
Les différents résultats possibles d’une épreuve constituent les évènements
élémentaires. Ils sont généralement représentés par des lettres majuscules (A,
B, C,…) ou des lettres majuscules indicées (E1, E2, E3,…). L’ensemble de tous ces
ensembles est appelé ensemble fondamental. Il sera noté par la lettre S.
8
Si la pièce est symétrique et réellement lancée au hasard, chacune de ces
deux éventualités a la chance de se réaliser. Ces deux événements sont donc
« probables ».
Considérons E1 l’événement "obtenir face" et E2, l’évènement "obtenir
pile». Parmi les deux résultats possibles de l’ensemble fondamental
{ } , il n’y a qu’un seul (l’obtention de face) qui est favorable.

La probabilité d’avoir face sera donc :

Exercice 2 : On tire une carte dans un jeu de 52 cartes. Quelle est la probabilité
de tirer un roi ?
Solution

Soit A=l’événement ‘’tirer un roi’’. P


D’une manière générale, s’il existe en tout n éventualités s’excluant
mutuellement et toutes également probables résultat d’une épreuve (jet d’une
pièce, tirage d’une carte…) et si parmi celles-ci il y en a k favorables à un
événement A déterminé (ex. le tirage d’un cœur), la probabilité de cet
événement est égale à k/n.
Nombre de cas favorables à A
P( A )  k / n 
Nombre de cas possibles

La non réalisation de l’événement A (ou son échec) est dénommé événement


contraire, noté ̅ et sa probabilité est ̅ .
Il est à noter pour la suite que la probabilité est conçue comme la
fréquence théorique d’un événement. Selon cette conception, la probabilité
d’un événement est la proportion du nombre de fois que les événements du
même type se réaliseront lorsque l’expérience est repérée un très grand de fois.
Ceci n’est que la conséquence de la loi de grand nombre.
En effet, lorsqu’on désire connaître les chances de réalisation de l’événement
particulier associé à une expérience aléatoire, on peut s’y prendre en
répétant l’expérience un certain nombre de fois.
Le nombre de réalisations de A permet de calculer la fréquence relative :

( )

La conception de la probabilité comme ‘’fréquence relative’’ d’un


événement apparaît ainsi clairement. Par exemple, dans une expérience qui
consiste { lancer une pièce de monnaie. Si on répète l’expérience 1.000.000 de
fois (c’est-à-dire ), la fréquence d’apparition du côté ‘’face’’ se stabilisera
autour de 0.5 c’est ainsi que dans l’exercice 1, la probabilité d’obtenir ‘’face’’
nous est donnée par .
9
Exercice 3 : On jette en l’air un dé bien équilibré. Quelle est la probabilité
d’obtenir :
a) un nombre pair
b) un nombre impair
c) un nombre premier

Solution

Soient S l’ensemble fondamental et A1, A2, A3 les différents événements


(un événement est un sous ensemble de l’ensemble fondamental associé { une
expérience aléatoire).
On a : S = 1,2,3,4,5,6
A1 = 2,4,6 = ensemble de nombres pairs
A2 = 1,3,5 = ensemble de nombres impairs
A3 = 1,2,3,5 = ensemble de nombres premiers
a) P(A1) = 3/6 = 1/2
b) P(A2) = 3/6 = ½
c) P(A3) = 4/6 = 2/3

Exercice 4 : Dans une urne, il y a 10 boules blanches, 20 noires et 30 rouges


disposées au hasard. On tire une boule. Quelle est la probabilité
pour que la boule tirée soit :
a) blanche
b) noire
c) rouge

Solution

Soient : A1= l’événement ‘’tirer une boule blanche’’


A2= l’événement ‘’tirer une boule noire’’
A3= l’événement ‘’tirer une boule rouge’’

a) P (A1) = 10/60 = 1/6


b) P (A2) = 20/60 = 1/3
c) P (A3) = 30/60 = 1/2.

Exercice 5 : On tirer une carte au hasard dans un paquet de 52 cartes à jouer.


Evaluer la probabilité de tirer :
a) un cœur
b) un trois de trèfle
c) un joker
d) une carte rouge ou noire
10
Solution

Soient : E1=l’événement ‘’tirer un cœur’’


E2=l’événement ‘’tirer un trois de trèfle’’
E3=l’événement ‘’tirer un joker’’
E4=l’événement ‘’tirer une carte rouge ou noire’’

a) P (E1) = 13/52
b) P (E2) = 1/52
c) P (E3) = 0/52 = 0
d) P (E4) = 1.

Remarque

1. Un événement certain a donc une probabilité égale à 1 : tandis qu’un


événement impossible a une probabilité nulle. Entre les deux extrêmes,
il y a toute la gamme des événements qui sont simplement possibles.
Une probabilité est donc toujours comprise entre 0 et 1.
0 ≤ P ≤ 1.
2. La somme des probabilités de tous les événements possibles
mutuellement incomparables est égale { 1. Reprenons l’exemple de
l’urne.

P(A1) + P(A2) + P(A3) = 1/6 + 1/3 + 1/2 = 1

1.2. Quelques propriétés fondamentales

1°/Si S est l’ensemble fondamental, alors Ai  S, on a O ≤ P (Ai) ≤ 1

2°/P(S) = 1

3°/Si X1 et X2 sont deux événements qui s’excluent mutuellement, alors


P(X1  X2) = P(X1)+P(X2)

4°/ Si X1, X2 et X3 sont trois événements quelconques, alors :


P( X1  X 2 )  P( X1 )  P( X 2 )  P( X1  X 2 )
P( X 1  X 2  X 3 )  P( X 1 )  P( X 2 )  P( X 3 )  P( X 1  X 2 ) P( X1  X 3 )  P(X 2  X 3 ) P( X1  X 2  X 3 )

5°/Si Xi  Xj, alors P(Xi) ≤ P(Xj)

6°/Si ̅ est le complément de A, alors P( ̅) = 1 – P(A). On dit que X’ est la non


réalisation de X.

1.3. Règle de multiplication et probabilité conditionnelle

La règle de multiplication des probabilités est intimement liée à la notion


de probabilité conditionnelle.
11
1.3.1. Probabilité conditionnelle

Si A et B sont deux événements, la probabilité de réalisation de A étant


donné que B s’est déj{ réalisé est notée P(A/B), où / signifie sachant que, étant
donné que, si et seulement si … bref, la contrainte ou la condition.

P( A  B)
Formule : P( A / B) 
P( B)

Exercice 1 : On jette une paire de dé bien équilibrée. Calculer la probabilité pour


qu’au moins l’un des dés ait donné le nombre 2 sachant que la
somme de l’événement est 6.

Solution

Soit S = l’ensemble fondamental.

S=(1,1) ;(1,2)…(2,1) ;(2,2)…(3,1) ;(3,2)…(4,1);(4,2)…(5,1);(5,2)…(6,1) ;(6,2)…(6,


6)  36 couples.

Les différents événements sont :

A = l’événement « le couple contient au moins un 2 »


B = l’événement « la somme des dés est 6 ».

A =  (1,2) ; (2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) ; (3,2) ; (4,2) ; (5,2) ; (6,2)   11
couples.

B = (1,5) ; (2,4) ; (3,3) ; (4,2) ; (5,1)  5 couples.

A  B = (2,4) ; (4,2)  2 couples.


La probabilité cherchée est P (A/B)

P(A) = 11/36
P(B) = 5/36
P (AB) = 2/36

P( A  B) 2 / 36
P( A / B)    2 / 5  0,4
P(B) 5 / 36

Exercice 2 : Dans l’expérience aléatoire consistant { lancer successivement deux


dés, trouver la probabilité que :
a) l’un des dés ait donné le nombre 5 sachant que la somme des dés est 7
b) la somme des dés soit 7 sachant que l’un des dés donne le nombre 5
c) la somme des dés soit paire sachant que le premier dé indique le
nombre pair
d) la somme des dés est 10 sachant que le premier dé indique 3.
12
Solution

Soit S = l’ensemble fondamental.


S=(1,1) ;(1,2)….(2,1) ;(2,2) ;….(3,1) ; (3,2)…(4,1) ; (4,2) ;…(5,1) ; (5,2) …(6,1) ;
(6,2) ;…(6,6)  36 couples.

Les différents événements sont :

A1 = l’événement « la somme des dés est 7 »


A2 = l’événement « l’un des dés donne le nombre 5 »
A3 = l’événement « la somme des dés est pair »
A4 = l’événement « le premier dé indique le nombre pair »
A5 = l’événement « la somme des dés est 10 »
A6 = l’événement « le premier dé indique le nombre 3 ».

A1 = (1,6) ; (2,5) ; (3,4) ; (4,3) ; (5,2) ; (6,1)  6 couples


A2 = (1,5) ; (2,5) ; (3,5) ; (4,5) ; (5,5) ; (6,5) ; (5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,6)  11
couples
A3 = (1,1) ; (2,2) ; (3,3) ; (4,4) ; (5,5) ; (6,6) ; (1,3) ; (1,5) ; (2,4) ; (2,6) ; (3,1)) ; (3,5) ;
(4,2) ; (4,6) ; (5,1) ; (5,3) ; (6,2) ; (6,4)   18 couples
A4 = (2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) ; (4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ;
(4,6) ; (6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6)  18 couples
A5 = (4,6) ; (5,5) ; (6,4)  3 couples
A6 = (3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6)  6 couples.

Il s’agit du problème des probabilités conditionnelles.

On sait que :

P( A  B)
P( A / B) 
P(B)
A1  A2 = (2,5) ; (5,2)  2 couples
A3  A4 = (2,2) ; (2,4) ; (2,6) ; (4,2) ; (4,4) ; (4,6) ; (6,2) ; (6,4) ; (6,6)  9
couples
A5  A6 =    0 couple

P( A 2  A1) 2 / 36
a) P( A 2 / A1)    1/ 3  0,33
P( A1) 5 / 36
P( A1  A 2 ) 2 / 36
b) P( A1 / A 2 )    2 / 11  0,18
P( A 2 ) 11/ 36
P( A3  A 4 ) 9 / 36
c) P( A3 / A 4 )    1/ 2  0,5
P( A 4 ) 18 / 36
P( A5  A 6 ) 0 / 36
d) P( A5 / A6 )   0
P( A 6 ) 6 / 36
13
Remarque

Nous constatons, à partir de cet exercice que :


P(A2/A1)  P (A1/A2)
0,33  0,18
Dès lors, P(A/B)  P(B/A)

1.3.2. Loi de multiplication de probabilité

Nous savons que

P( A  B)
P( A / B)  et
P(B)
P( A  B)
P(B / A) 
P( A)
Ainsi, P(AB) = P(A). P(B/A) = P(B). P(A/B). C’est la loi de multiplication des
probabilités.

Généralisation
n n2 n 1
P( Ai )  P( A1 ).P( A2 / A1 ).P( A3 / A1  A2 ).P( A4 / A1  A2  A3 )...P( An1 /  Ai).P( An /  Ai)
i 1 i 1 i 1

Exemple : Pour 3 événements, on écrit :


P(A1A2A3) = P(A1).P(A2/A1).P(A3/AA2).

Exercice 3 : Quelle est la probabilité qu’il y ait deux garçons dans une famille de
3 enfants, si on sait qu’il y a au moins une fille?

Solution

S’il n’y aucune restriction, l’ensemble fondamental est :

S = (GGG) ; (GGF) ; (GFG) ; (FGG) ; (GFF) ; (FGF) ; (FFG) ; (FFF)  8 couples.

Soient A1 et A2 les événements suivants :


A1 = l’événement « il y a deux garçons dans la famille »
A2 = l’événement « il y a au moins une fille dans la famille ».
A1 = (GGF) ; (GFG) ; (FGG)  3 couples
A2 = (GGF); (GFG); (FGG); (GFF); (FFG); (FGF); (FFF)  7 couples
A1  A2 = (GGF); (GFG); (FGG)  3 couples

P(A1) = 3/8 = 3 P(G).P(F).P(G) = 3 (0.5) (0.5) (0.5) = 0.375


P(A2) = 7/8 = 7 (.05) (0.5) (0.5) = 0.875
P (A1  A2) = 3/8
14
La probabilité cherchée est :

P( A1  A 2 ) 3 / 8
P( A1 / A 2 )    3/ 7
P( A 2 ) 7/8

Exercice 4 : En 2ème Graduat Economie B, en 1ère session, 15% d’étudiants


échouent en comptabilité; 60% échouent en statistique et 5%
échouent en comptabilité et statistique. On choisit un étudiant au
hasard.
a) Si l’étudiant a échoué en comptabilité, quelle est la probabilité qu’il ait
échouée aussi en statistique.
b) S’il a échoué en statistique, quelle est la probabilité qu’il ait échouée
aussi en comptabilité.
c) Quelle est la probabilité qu’il ait échoué en comptabilité ou en
statistique.

Solution

Soit A1 = l’événement « l’étudiant échoue en comptabilité »


A2 = l’événement « l’étudiant échoue en statistique »
A1A2 = l’événement « l’étudiant échoue en statistique et en comptabilité »

P(A1) = 15% = 0.15


P(A2) = 60% = 0.60
P (A1A2) = 5% = 0.05

P( A 2  A1) 0,05
a) P(A2/A1) =   1/ 3
P( A1) 0,15
P( A1  A 2 ) 0,05
b) PA1/A2) =   1/ 12
P( A 2 ) 0,06
c) P(A1A2) = P(A1)+P(A2)-P(A1A2)
= 0,15 + 0,60 – 0,05
= 0,7

Exercice 5

Pour connaître les intentions de vote de la population, on a interrogé 100


personnes et on leur a demandé pour lequel des parties A, B, C, elles
voteraient. On regroupe les résultats dans le tableau suivant :

Parti A B C
Sexe
Homme 13 21 19
Femme 20 8 19

Si on choisit une personne au hasard dans ce groupe, trouver la probabilité :


a) qu’elle vote pour le parti A
b) qu’elle vote le parti B étant donné que c’est une femme
15
c) qu’elle vote pour le parti B ou C sachant que c’est un homme
d) qu’elle soit une femme, si on sait qu’elle vote pour le parti C.

Solution

A1 = l’événement « la personne voterait pour le parti A »


A2 = l’événement « la personne voterait pour le parti B »
A3 = l’événement « la personne voterait pour le parti C »
A4 = l’événement « la personne est un homme »
A5 = l’événement « la personne est une femme »

P(A1) = 33/100 = 0,33


P(A2) = 29/100 = 0,29
P(A3) = 38/100 = 0,38
P(A4) = 53/100 = 0,53
P(A5) = 47/100 = 0,47

a) P(A1) = 0,33
P( A1  A5 ) 20 / 100
b) P(A1/A5) =   20 / 47
P( A5 ) 47 / 100
P( A 2  A3 )  A 4 )
c) P(A2A3)/A4 =
P( A 4 )
P( A 2  A 4 )  P( A3  A 4 )

P( A 4 )
P( A 2  A 4 ) P( A3  A 4 )
 
P( A 4 ) P( A 4 )
= 0,21/0,53+0,19/0,53 = 40/53
P( A5  A3 ) 0,19
d) P(A5/A3) =   0,5
P( A3 ) 0,38

Exercice 6

D’une boîte contenant 3 craies blanches et 2 craies rouges, on tire


successivement deux craies au hasard. Calculer la probabilité de tirer deux
craies rouges si :
a) le tirage est non exhaustif
b) le tirage est exhaustif

Solution

Soient E1 : l’événement « craie rouge au 1er tirage »


E2 : l’événement « craie rouge au second tirage »

Nous recherchons alors :


P(E1E2) = P(E1).P(E2/E1)
16
a) Comme au premier tirage il y a 2 craies rouges, P(E1) = 2/5. La craie étant
replacée dans la boîte avant le 2ème tirage, on aura :

P(E2/E1) = 2/5

Ainsi P(E1E2) = P(E1).P(E2/E1)


= 2/5.2/5
= P(E1).P(E2)
= 4/25 = 0.16

b) P(E1)=2/5
P(E2/E1) = ¼ puisqu’étant donné que l’événement E1 s’est déj{ réalisé, il ne
reste que 4 craies dans la boîte parmi lesquelles une rouge.

Ainsi P(E1E2) = P(E1).P(E2/E1)


= 2/5.1/4=2/20=0.1
Remarque

- Si le tirage de la population est exhaustif, c’est-à-dire sans remise, alors


P(E1E2) = P(Ei).P(Ej/Ei) (ij)
- Si le tirage de la population est non exhaustif, c’est-à-dire avec remise,
alors P(E1E2) = P(Ei).P(Ej).

1.4. Théorème de probabilité totale et théorème de Bayes

1.4.1. Théorème de probabilité totale

Lorsque, dans le cadre d’une certaine expérience aléatoire, on cherche {


évaluer la probabilité d’un certain événement E, il peut arriver qu’il soit très
difficile d’évaluer directement P(E) alors qu’il est assez facile d’évaluer la
probabilité de E conditionné par certains autres événements Ei ; i = 1,2, …, n.
Dans ce cas l{, il est possible d’utiliser les probabilités P(Ei) et les probabilités
P(E/Ei) pour calculer P(E).

Ce théorème s’énonce de la manière suivante :


« Si un événement E est la résultante des événements mutuellement exclusifs
E1 ; E2 ; … ; En : alors

P(E) = P(E1).P(E/E1) + P(E2).P(E/E2) + … + P(En) P(E/En).

1.4.2. Théorème de BAYES

La formule de Bayes se présente dans le même contexte que celui


prévalent pour la formule de probabilité totale. Cependant, au lieu de
s’intéresser { la probabilité inconditionnelle d’un certain événement E, on va
maintenant s’intéresser { la probabilité conditionnelle d’un certain événement
17
Ek étant donné E. Pour calculer P(Ek/E), on va utiliser les probabilités
inconditionnelles de certains événements Ei ; i = 1, 2, …, n (Ei étant un
événement particulier parmi les événements) et les probabilités conditionnelles
P(E/Ei) qui seront facilement disponibles.
Plus précisément, on aura :

P(E k )P(E / E k )
P(E k / E)  n
P(E i )P(E / E i )
i 1

Ce théorème permet d’évaluer les probabilités de différents événements


E1 ; E2 ; … ; En qui peuvent causer la réalisation de E.

Exercice 1

Dans un collège de la région parisienne, 4% des garçons et 1% des filles


mesurent plus de 1,60m.
On sait que 60% des élèves sont des filles.
Si l’on prend un élève au hasard et si celui-ci mesure plus de 1,60m ; quelle est la
probabilité que cet élève soit une fille.

Solution

Soient A : l’événement « l’élève mesure plus de 1,60m »


F : l’événement « l’élève est une fille »
G : l’événement « l’élève est un garçon »
P(F) = 0,60
P(G) = 1 – P(F) = 1 – 0,60 = 0,40

P(A/F) = 0,01
P(A/G) = 0,04

La probabilité cherché est P(F/A)

P(F  A)
P(F/A) =
P( A)
P(FA) = P(F).P(A/F)
= 0,60 (0,01)
= 0,006

P(A) = P(F). P(A/F) + P(F). P(A/G)


= 0,60 (0,01) + 0,40 (0,04)
= 0,022

0,006 6
P(F/A) =   0,27
0,022 22
18
En appliquant le théorème de Bayes, on a :
P(F) P( A / F)
P(F/A) =
P(F) P( A / F)  P(G)P( A / G)
0,6 (0,01)
=
0,6(0,01)  0,4(0,04)
6
=
22
Exercice 2

Une ville est formée à 54% des femmes. On sait que 32% des femmes pratiquent
le « Basket-ball » alors que 41% des hommes le pratiquent.
On choisit une personne au hasard dans cette ville. Quelle est la probabilité
qu’elle pratique le « Basket-ball » ?

Solution

Soient A : l’événement « la personne pratique le Basket-ball »


A1 : l’événement « la personne est une femme »
A2 : l’événement « la personne est un homme »

P(A1) = 0,54
P(A2) = 0,46
P(A/A1) = 0,32
P(A/A2) = 0,41

La probabilité cherchée est :


P(A) = P(A1).P(A/A1)+P(A2).P(A/A2)
= 0,54 (0,32) + 0,46 (0,41)
= 0,3614

Exercice 3

12 appareils sont en exploitation. Trois d’entre-eux sont fabriqués par l’usine


n°1 ; quatre par l’usine n°2 et cinq par l’usine n°3.
Les appareils provenant de l’usine n°1 (resp. n°2, n°3) passe l’essaie avec une
probabilité P1 = 0,9 (resp. P2 = 0,8 et P3 = 0,75).
Calculer la probabilité pour qu’un appareil choisit au hasard passe l’essaie.

Solution

Soient A : l’événement « l’appareil passe l’essaie »


A1 : l’événement « l’appareil est fabriqué par l’usine n°1 »
A2 : l’événement « l’appareil est fabriqué par l’usine n°2 »
A3 : l’événement « l’appareil est fabriqué par l’usine n°3 »

P(A1) = 0,25
P(A2) = 0,33
19
P(A3) = 0,416

P(A/A1) = 0,9
P(A/A2) = 0,8
P(A/A3) = 0,75
La probabilité cherchée est P(A).
D’après le théorème de probabilité totale :
P(A) = P(A1).P(A/A1)+P(A2).P(A/A2)+P(A3).P(A/A3)
3 4 5
= (0.9)  (0.8)  (0.75)
12 12 12
= 0.225+0.267+0.313
= 0.805

Exercice 4 :

Un sac contient 4 billes rouges, 2 billes bleues et 3 billes vertes. On tire


successivement et sans remise deux billes. Trouver la probabilité des
événements suivants :
a) les deux billes tirées sont rouges
b) la première bille est bleue et la seconde est verte
c) une des billes est rouge et l’autre est bleue.

Solution

Soient R1 : l’événement « la première bille tirée est rouge »


R2 : l’événement « la seconde bille tirée est rouge »
B1 : l’événement « la première bille tirée est bleue »
B2 : l’événement « la seconde bille tirée est bleue »
V1 : l’événement « la première bille tirée est verte »
V2 : l’événement « la seconde bille tirée est verte ».
4 3 1
a) P(R1R2) = P(R1).P(R2/R1) = . 
9 8 6
2 3 1
b) P(B1V2) = P(B1).P(V2/B1) =  
9 8 12
c) P[(R1B2)  (B1R2)] =P(R1 B2)+P(B1R2)
=P(R1).P(B2/R1)+P(B1).P(R2/B1)
= 4/9.2/8+2/9.4/8
= 2/9
Exercice 5

Répondre aux questions précédentes en supposant que le tirage était non


exhaustif.
4 3 4
a) P(R1R2) = P(R1).P(R2/R1) = . 
9 9 27
20
2 3 2
b) P(B1V2) = P(B1).P(V2/B1) =  
9 9 7
c) P[(R1B2)  (B1R2)] =
N.B.
- Un tirage est exhaustif lorsqu’il se fait sans remise
- Un tirage est non exhaustif lorsqu’il se fait avec remise.

1.5. L’indépendance stochastique

Un événement B est indépendant d’un autre événement A si la


probabilité pour que B se réalise n’est pas influencé par la réalisation ou non de
A. Pour mesurer cette indépendance stochastique, on vérifie l’identité :
P(AB) = P(A). P(B)

Dans ce cas, on dira que A et B sont stockastiquement indépendant.


Si tous les événements sont indépendants dans leur ensemble, on dira que ces
événements sont mutuellement indépendants.

Soient 3 événements E1, E2 et E3.

- Ces 3 événements sont stockastiquement indépendants deux à deux


ssi :
P(E1E2) = P(E1).P(E2)
P(E1E3) = P(E1).P(E3)
P(E2E3) = P(E2).P(E3)

- Ces 3 événements sont stockastiquement indépendants dans leur


ensemble ssi :
1°/ ils sont stockastiquement indépendants deux à deux ;
2°/ P(E1E2E3) = P(E1).P(E2).P(E3)

Dans ce cas, on dira que ces 3 événements sont mutuellement


indépendants.

1
Exercice 1 : Soit S = a1, a2, a3, a4avec P (a1) = 1 = 1, 2, 3,4
4
Soient les événements E1, E2, E3 S
E1 = a1, a2 ; E2 = a1, a3 ; E3 = a1, a4

Ces 3 événements sont-ils mutuellement indépendants ?

Solution

E1E2 = a1P E1E2 = 1/4


E1E3 = a1P E1E3 = 1/4
E2E3 = a1P E2  E3 = 1/4
E1E2 E3 = a1  E1 E2 E3.= 1/4
21

1- Vérifions d’abord si ces événements sont stockastiquement indépendants


deux à deux

PE1E2 = P E1.P E2.


1/4 = 1/2. 1/2
 PE1E2 = P E1.P E2 = 1/4
PE1E3 = P E1.P E3 = 1/4
PE2E3 = P E2.P E3 = 1/4

Cette première condition est vérifiée.

2- Vérifions maintenant si la 2ème condition est vérifiée.

PE1E2  E3 = 1/4 et


PE1. P E2.P E3 = 1/2. 1/2. 1/2 = 1/8
PE1E2 E3  P E1.P E2 P E3

En conclusion, ces événements ne sont pas mutuellement indépendants. Par


contre ils sont stockastiquement indépendants deux à deux.

Exercice 2 : Dans une boîte, il y a une craie rouge, une craie jaune, un dé rouge
et une bague jaune. On pige un objet au hasard dans cette boîte
Si E1 est l’événement « choisir un objet rouge »
E2 l’événement « choisir un objet jaune » et
E3 l’événement « choisir une craie »
Peut-on dire que ces 3 événements sont indépendants ?

Solution

PE1 = 2/4 = 0.5


PE2 = 2/4 = 0.5
PE3= 2/4 = 0.5

1° vérifions s’ils sont stockastiquement indépendants

PE1  E2 = 0  PE1. PE2 = 1/4


PE1  E3 = 14 = PE1.PE3 = 1/4
PE2  E3 = 14 = PE2.PE3 = ¼

2° PE1E2  E3 = 0  PE1. PE2 = 1/8

Conclusion :

- Les événements E1 et E3 sont indépendants, de même que E2 et E3. Par


contre E1 et E2 ne sont pas indépendants ;
- PE1E2  E3  PE1. PE2. PE3, nous pouvons conclure que ces 3
événements ne sont pas mutuellement indépendants.
22
Exercice 3 : Une urne contient 4 jetons rouges et 3 jetons blues. On tire
successivement et sans remise deux jetons. Si A est l’événement « le
premier jeton tiré est rouge » et B l’événement « le second jeton tiré
est bleu », peut-on conclure que A et B sont indépendants ?
Solution
PA1 = 4/7,
PB1 = 3/7
PA B = PA).P(B/A = 4/7.3/6 = 12/42
PA. PB = 4/7.3/7 = 12/49
PA  B.  PA. PB
12/42  12/49
D’où les événements A et B ne sont pas indépendants
Exercice 4 : Dans un concours de recrutement à la Banque Centrale, 46 hommes
sur 230 hommes ont été sélectionnés, pendant que 8 femmes sur
40 femmes ont été sélectionnées. Est-ce que la sélection est-elle
indépendante du sexe.
Solution

Soient H : l’événement ‘’la personne est un homme’’


F : l’événement ‘’la personne est une femme’’
S : l’événement ‘’la personne est sélectionnée’’
̅= l’événement ‘’la personne n’est pas sélectionnée’’.

On a :
S ̅
H 46 184 230
F 8 32 40
54 216 270

 ̅

Vérifions maintenant les identités :

•

•

Les identités étant vérifiées, nous disons donc que la sélection est
indépendante du sexe.
23

1.6. Analyse combinatoire


Il y a 3 types de dispositions qui présentent un intérêt particulier en
analyse combinatoire et en probabilité. Ce sont :
- Les arrangements ;
- Les permutations ;
- Les combinaisons

1.6.1. Arrangement

Soit un ensemble E de cardinal # E= n.


On appelle arrangement de n élément pris k à kn avec la contrainte que
(k≤n), tous les groupes de k éléments choisis parmi les n éléments données et
placés dans un ordre déterminé. Le nombre de ces arrangements s’écrit :
n!
A=
(n  k )!

N.B. : Dans un arrangement ab  ba

Exercice 1 : Soit 4 éléments a, b, c, d.

a) Constituer le groupe de ces lettres prises 1 à 1 ;


b) Constituer le groupe de ces lettres prises 2 à 2

Solution

4! 4! 4 .3!
a) A 13 = = = =4
(4  1)! 3! 3!
Ce groupe c’est : a, b, c, d.

2 4!
b) A 4 = = 12
(4  2)!

Exercice 2 : Une association doit élire son comité directeur. Celui-ci doit
comprendre 1 président, 1 vice-président, 1 secrétaire et 1 trésorier.
S’il y a 10 candidats, de combien de manières ces 4 postes peuvent
être occupés ?

Solution

Il s’agit de l’arrangement
4 10! 10.9.8.7.6!
A 10 = = = 5040
(10  4)! 6!
1.6.2. Permutation

C’est un cas particulier de l’arrangement où nous prenons tous les n


objets de l’ensemble E. En bref, la permutation est un arrangement ou n = k
24
n n!
Pn =An = =n!
(n  n)!
N.B. : Par convention. 0 ! = 1

Exercice 3 : Combien de mots de 5 lettres peut-on former avec les lettres du


mot FINAL ?
Solution

Il s’agit d’une permutation de 5 éléments.


5
P 5 = A 5 = 5 ! = 120

Ces mots sont : FINAL  NAFIL  NIFAL LIFAN, LAFIN, ALFIN,…

Exercice 4 : De combien de manières différentes peut-on placer 6 livres sur une


étagère ?
Solution

Il s’agit de la permutation
P 6 = 6 ! = 720 manières différentes

Cas particuliers de la permutation


Il s’agit de la permutation avec répétition. Si parmi les n éléments, quelques-uns
sont semblables, la formule devient :
n!
Pn =
n1! n 2 .....n n !

Ou les ni représentent le nombre de fois que les éléments i se répètent.

Exercice 5 : Combien de lettre de 6 mots peut-on former avec le mot BOLAFA ?

Solution

6! 6.5.4.3.2!
P6 = = = 360
2! 2!

Exercice 2

De combien de manières les lettres du mot MAKELELE peuvent être arrangées ?


25
Solution

8!
P8 = = 3360
3!2!

1.6.3. Combinaison

On appelle combinaison de k objet pris parmi n objet distincts (k ≤ n) tout


groupe qu’on peut former en prenant k de ces objets sans tenir compte de
l’ordre. Deux groupes sont alors considérés comme distincts lorsqu’ils diffèrent
d’au moins par un élément et non par l’ordre des éléments. Le nombre de
combinaisons est donné par :
k n!
Cn =
k! (n  k )!

Exercice 5 : Dans un examen, si on doit répondre à 8 questions sur 12, combien y


a-t-il de choix possibles ?

Solution

Il s’agit de la combinaison

8 12!
C 12 = = 495
4!8!

Exercice 7 : De combien de manières différentes peut-on former un comité de 3


personnes :
a) { partir d’un groupe de 10 candidats ?
b) comprenant un président, un vice-président et un secrétaire à partir
d’un groupe de 10 candidats ?

Solution

a) Il s’agit de la combinaison, car l’ordre n’est pas de rigueur


3 10!
C 10 = = 120
7!3!
b) L’ordre étant très important, il s’agit ici de l’arrangement
3 10
A 10 = = 720
7!

Exercices supplémentaires

Exercice 1
Combien de mots de 7 lettres peut-on former avec toutes les lettres du
mot « ENTENTE » ?
Rép. 210 mots
26
Exercice 2

Un ensemble de signaux est formé par 6 pavillons alignés. Combien de signaux


différents peut-on former { l’aide de 4 pavillons rouges et de 2 pavillons verts ?
Rép. 15 signaux.

Exercice 3

Un autobus dessert 12 stations. Il transporte au départ 9 voyageurs. Aucun


voyageur n’est monté en cours de route. De combien de façon distincts ces
voyageurs ont pu descendre de l’autobus s’il est descendu tout au plus un par
arrêt ?

Rép. 79.833.600 façons différentes


Exercice 4

De combien de manières peut-on constituer une délégation de 5 personnes


choisies dans un groupe de 9 personnes ?
Rép. 126 manières

Exercice 5

En rapport avec l’exercice précédent, de combien de manière peut-on le faire si


l’une de ces 9 personnes est d’office membre de la délégation ?
Rép. 70 manières
Exercice 6

Si 10 personnes veulent jouer au tennis et qu’un seul terrain est disponible.


Combien de groupes de 4 joueurs peut-on former ?
Rép.210 groupes

Exercice 7

Dans une firme, on doit procéder au remplacement d’un directeur, d’un sous-
directeur, d’un chef de service et d’un chef de bureau. Combien de possibilités
y a-t-il de procéder aux nominations.
a) Si l’on a 4 candidats de mêmes compétences ;
b) Si l’on a 5 candidats de mêmes compétences
Rép.

a) P 4 = 4 ! = 24 possibilités
4 5!
b) A 5 = = 120 possibilités
(5  4)!
27
1.6.4. Le binôme de newton

Le binôme de newton est très appliqué en statistique. Ce binôme est


basé sur l’expansion entre deux termes selon l’une ou l’autre puissance. On
utilise ce binôme quand il s’agit de calculer les probabilités dans le cas deux
alternatives qui s’excluent mutuellement et dont les probabilités restent
constantes.

Exemple :
- Bon et mauvais
- Ordinaire et non ordinaire
- Fille et garçon
Formule général du binôme de newton
1
(a + b) = a + b
2
(a + b) = a2 + 2ab +b2
(a + b) 3 = a3 + 3a2b + 3ab2 + b4
(a + b) 4 = a4 + 4a3b + 6a2b2 + 4ab3 + b4
n
(a + b) n =  C nk a nk b k
k 0

Ca, c’est la formule générale du binôme de Newton.


Exercice 1 : Un ensemble d’ampoules électriques comprend 5% d’ampoules
défectueuses. Quelle est la probabilité de tirer dans ce tas :
a) 2 bonnes ampoules et une ampoule défectueuse ;
b) 3 ampoules défectueuses.

Solution

Posons a = probabilité de tirer une bonne ampoule


b = probabilité de tirer une ampoule défectueuse.
a= 0.95
b= 0.05

Puisqu’on nous demande de tirer 3 ampoules, nous sommes en face de


l’expansion (a + b) 3

(a + b) 3 = b 3 + 3a 2 b + 3ab 2 + b 3

Où :
a3 représente la probabilité de tirer 3 bonnes ampoules ;
3a2b représente la probabilité de tirer 2 bonnes ampoules et une ampoule
défectueuse ;
3ab2 représente la probabilité de tirer 1 bonne ampoule et 2 ampoules
défectueuses ;
b3 représente la probabilité de tirer 3 ampoules défectueuses.
28
a) La probabilité de tirer 2 bonnes ampoules et une ampoule défectueuse
est :

3a2b = 3(0.095)2(0.05) = 0.1354

b) La probabilité d’avoir 3 ampoules défectueuses est :

a3 = (0.05)2 = 0.000125
Exercice 2 : On sait que 80% des avions de la compagnie SABENA arrivent à
l’heure. Un voyageur emprunte 4 avions de cette compagnie.
Quelle est la probabilité pour qu’il arrive 3 fois { l’heure.
Solution
Soit a = probabilité d’arriver { l’heure = 0.8
b= probabilité de ne pas arriver { l’heure = 0.2
Ici, nous avons affaire à une expansion de puissance 4
0 1 2 3 4
(a + b)4 = C 4 a4b0 + C 4 a3b + C 4 a2b2 + C 4 ab3 + C 4 a0b4
La probabilité cherchée est:
1
C 4 a3b = 4a3b = 4(0.8)3 (0.2) = 0.4096
D’où la probabilité que notre voyageur arrive 3 fois { l’heure est de 41%
NB : Si on demandait la probabilité d’arriver 2 fois en retard, on aurait :
2
C 4 a2b2 = 6(0.8)2(0.2)2

Remarque

Le binôme de newton ne s’applique qu’en cas de tirage avec remise et


correspond donc à la pré-application de la loi binomiale.

1.6.5. Le triangle de Pascal

Il existe une grande relation entre le triangle de pascal et le binôme de


newton. Chaque terme est la somme du terme immédiatement supérieur et de
celui qui se trouve à gauche de celui-ci.
29

k 0 1 2 3 4 5 6 7
n
0 1
1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1

Ce triangle de pascal est important en ce sens qu’il nous donne les coefficients
du binôme.

1.6.6. Le diagramme arborescent

Deux modes de représentation sont souvent utilisés dans l’analyse de


choix incertains : le diagramme arborescent ou diagramme d’éventualités et la
matrice d’éventualités.

Le diagramme est aussi appelé « diagramme en arbre ». L’importance de


ce diagramme est surtout de faciliter le raisonnement dans le calcul des
probabilités. C’est un outil pour construire l’espace de probabilité d’une
expérience.

Le point de départ de ce diagramme est les probabilités des événements


mutuellement exclusifs.

Sur ce diagramme, les branches représentent les probabilités


conditionnelles ; c'est-à-dire la probabilité que le résultat particulier de la
branche se réalise étant donné que les résultats représentés par les branches
précédentes se sont tous réalisés.

Tout chemin traversant l’arbre de l’origine { un point terminal


correspond à un événement élémentaire possible. Sa probabilité est le produit
des probabilités attachées aux branches qui forment le chemin.

La somme des probabilités de toutes les branches partant d’un point


particulier doit être l’unité, puisque les branches représentent tous les résultats
possibles mutuellement exclusifs.

Si le diagramme arborescent apparaît plus opérationnel en ce qui


concerne la structuration du problème, la matrice d’éventualité offre une
présentation souvent commode en ce qui concerne la résolution.
30
Exemple :
Au restaurent universitaire, les étudiants ont à choisir entre :

- Pain ou fufu
- Poisson ou viande
- Lait ou boisson sucrée
De combien de façon peuvent-ils choisir leur repas
Solution

On peut recourir au diagramme arborescent pour répondre à cette


question.

Lait Pn, Ps, Pt

Poisson
Boisson sucrée Pn, Ps, Bs
Pain
Lait Pn, Vd, Lt
Viande

Boisson sucrée Fu, Ps, Lt

Lait Fu, Ps, Lt


Poisson

Fufu Boisson sucrée Fu, Ps, Bs


Lait Fu, Vd, Lt
Viande

Boisson sucrée Fu, Vd, Bs

D’où, il y a 8 façons différentes de choisir leur repas.

Exercice 1

L’ambassadeur du Congo en Belgique doit aller accueillir une personnalité


congolaise venant de Kinshasa. 50% de trafic Kinshasa-Bruxelles est assuré par
Congo Air-line, 40% par SABENA et 10% par Air-Afrique. Sachant que la
probabilité que l’avion arrive en retard est 0.9 pour Congo Air-line, 0.05 pour
Sabena et 0.1 pour Air-Afrique, l’ambassadeur vous demande d’évaluer :
a) la probabilité pour que la personne arrive en retard
b) la probabilité pour que le retard soit dû à Congo Air-line.
Solution
Il existe 3 causes :
- Congo Air-line (CAL)
- Sabena (SAB)
- Air-Afrique (AA).
31
- Soient A = l’événement « l’avion arrive en retard »
- A1 = l’événement « le trafic est assuré par CAL »
- A2 = l’événement « le trafic est assuré par SAB »
- A3 = l’événement « le trafic est assuré par AA ».

La somme de trafic est de 100%.

R 0.5(0.9)  X
0.9
A1
0.5 0.1 𝑅 0.5(0.1)
0.05 R 0.4 (0.05)  Y
0.4 A2
P
0.95 𝑅 0.4 (0.95)
0.1 0.1 R 0.1 (0.1)  Z
A2

0.9 𝑅 0.1 (0.9)

X : Probabilité d’arriver en retard pour CAL : P(x)=P(A1 A)=P(A1).P(A/A1)


Y : Probabilité d’arriver en retard pour SABENA : P(y)=P(A2 A)=P(A2).P(A/A2)
Z : Probabilité d’arriver en retard pour Air-Afrique : P(z)=P(A3 A)=P(A3).P(A/A3)

a) Probabilité d’arriver en retard est X+Y+Z ; soit :

0.45 + 0.02 + 0.01 = 0.48

b) Probabilité pour que le retard soit dû à CAL est :

0,45
P( A1 / A)   45 / 48
0,48

Une autre façon de procéder, c’est de revenir { la matrice d’éventualités :


A 𝐴̅ A 𝐴̅
A1 P(A A1) P(A1 𝐴̅) P(A1) A1 0.45 0.05 0.50
A2 P(A A2) P(A2 𝐴̅) P(A2) A2 0.02 0.38 0.40

A3 P(A A3) P(A3 𝐴̅) P(A3) A3 0.01 0.09 0.10
P(A) P(𝐴̅) 1 0.48 0.52 1.00

On a :

P(A1) = 0.5 et P(A/A1) = 0.45/0.50 = 0.9


P(A2) = 0.4 et P(A/A2) = 0.02/0.40 = 0.05
P(A3) = 0.1 et P(A/A3) = 0.01/0.10 = 0.10
32
a) P(A) = P(A A1)+ P(A A2)+ P(A A3)
= 0.45 + 0.0.2 + 0.01
= 0.48

P( A1).P( A / A1) 0.45


b) P(A1/A) = 3
  45 / 48
0.48
P(A1).P(A / Ai )
i 1

Exercice 2 :

Dans une usine, trois machines M1, M2, M3 fabriquent des stylos. La machine
M1 en fabrique 1000 dans une journée alors que M2 en fabrique 2000 et M3 en
fabrique 3000 quotidiennement. On sait que pour M1, 3% de stylos fabriqués
sont défectueux ; pour M2, 2% sont défectueux et pour M3, 1%. A la fin d’une
journée, on choisit un stylo au hasard et on constate qu’il est défectueux.
Quelle est la probabilité qu’il provienne de la machine M2 ?

Solution

Soient D = l’événement « le stylo est défectueux »


A1 = l’événement « le stylo provient de la machine M1 »
A2 = l’événement « le stylo provient de la machine M3 »
A3 = l’événement « le stylo provient de la machine M3 »

La probabilité cherchée est P(A2/D)

1000
P( A1)   1/ 6
6000
2000
P( A 2 )   1/ 3
6000
3000
P( A 3 )   1/ 2
6000

P(D/A1) = 0.03
P(D/A2) = 0.02
P(D/A3) = 0.01

En utilisant la matrice d’éventualités, on a :

A 𝐴̅ A 𝐴̅
A1 30 970 1000 A1 30/6000 970/6000 1/6
A2 40 1960 2000 A2 40/6000 1960/6000 2/6

A3 30 2970 3000 A3 30/6000 2970/6000 3/6
100 5900 6000 100/6000 5900/6000 1.0

P(A2/B)=40/100=0.40
33
Selon le théorème de Bayes, on a :

P( A 2 ).P(D / A 2 )
P( A 2 / D) 
P( A1).P(D / A1)  P( A 2 ).P(D / A 2 )  P( A3 ).P(D / A3 )
1/ 3(0.02)

1/ 3(0.03)  1/ 3(0.02)  1/ 2(0.01)
= 2/5
= 0.4

Exercice 3 : un test permet de détecter la grippe aviaire sur les poulets.


Cependant, ce test n’est pas parfait car si le poulet n’est infecté, le
test est positif avec une probabilité de 0.02 et lorsque le poulet est
infecté, le test est négatif avec une probabilité de 0.01. On sait que
10/% des poulets sont infectés.

a) Si le test n’est positif sur un poulet, quelle est la probabilité que le


poulet ne soit pas infecté ?
b) Si l’on tire au hasard un poulet, quelle est la probabilité que le test ne
soit pas positif ?

Solution

Soient A=l’événement ‘’le test est positif sur un poulet’’


I= l’événement ‘’le poulet est infecté’’.

On a :
0.99 A P(I A)=0.10(0.99)

I
0.10 P(I 𝐴̅)=0.10(0.01)
0.01 𝐴̅

0.02 A P(𝐼 ̅ 𝐴̅)=0.10(0.01)


0.90 𝐼̅

0.98 𝐴̅ P(𝐼 ̅ 𝐴̅)=0.90(0.98)

A ̅
I 0.099 0.001 0.10
̅ 0.018 0.882 0.90
0.117 0.883 1.00

a) /̅ ̅
b) ̅
34

1.7. Exercices de récapitulation


Exercice 1

Un sac contient 10 boules blanches et 20 boules noires. On extrait au hasard 2


boules du sac. Quelles sont les probabilités :
a) pour qu’elles soient toutes les deux blanches
b) pour qu’elles soient toutes les deux noires
c) pour que l’une soit blanche et l’autre noire

Exercice 2

Un appareil peut être monté avec des pièces de haute qualité ou exclusivement
avec des pièces ordinaires. Dans le 1er cas, sa fiabilité (c’est-à-dire la probabilité
de fonctionnement sans panne durant le temps T) est de 0.95 et dans le second
cas 0.7. Environ 40% des appareils sont fabriqués avec des pièces de haute
qualité. Un appareil choisi au hasard a été testé pendant le temps T et s’est
avéré être bon. Calculer la probabilité pour qu’il soit monté avec des pièces de
haute qualité.

Exercice 3

On amène { l’hôpital en moyenne 50% des malades avec la maladie K, 30% avec
la maladie L et 20% avec la maladie M. La probabilité de guérison pour la
maladie K (resp. L et M) est de 0.7 (resp. 0.8 et 0.9), un malade a été guéri.
Trouver la probabilité pour que le malade guéri ait souffert de la maladie K.

Exercice 4

On considère un stock d’ampoules électriques produites par 2 usines. La


productivité de l’usine n°1 (c’est-à-dire probabilité pour que l’ampoule soit
fabriquée par l’usine n°1) est 2 fois supérieure { celle de l’usine n°2.
Il y a deux types d’ampoules : type A et type B. L’usine n°1 produit en moyenne
60% d’ampoules du type B. L’usine n°2 produit en moyenne 84% d’ampoules du
type B. On prend au hasard une ampoule. L’ampoule prise est de type B. Quelle
est la probabilité qu’elle soit produite par l’usine n°1.

Exercice 5

Il y a 3 lots de détails contenant 30, 50 et 100 détails respectivement.


Le lot 1 contient 20 détails standardisés
Le lot 2 contient 10 détails standardisés
Le lot 3 contient 10 détails standardisés

On choisit au hasard un lot et, ensuite, on a prélevé au hasard 1 détail. Le


détail a été standardisé. De ce même lot, une deuxième fois on a pris au hasard
le détail. Ce détail a été une fois encore standardisé. Déterminer la probabilité
pour qu’on ait pris les détails du lot 3.
35
Exercice 6

Un tireur tire sur une cible. Sachant que la probabilité de tirer au but est p = 0.4
et qu’il tire 3 coups. Calculer la probabilité qu’il a d’atteindre :
- 0 fois la cible
- 1 fois la cible
- 2 fois la cible
- 3 fois la cible.

Exercice 7

Dans les mêmes conditions que l’exercice précédent, calculer la probabilité


qu’a le tireur d’atteindre au moins 0 fois (resp. 1 fois, 2 fois, 3 fois) la cible.

Exercice 8

Dans les mêmes hypothèses que l’exercice précédent ; le tireur gagne 5 points
chaque fois qu’il tire au but. Le nombre de points gagnés par le tireur est donc
une v.a. discrète X prenant les valeurs 0, 5, 10 et 15.
a) Tracer l’histogramme de cette v.a.
b) Etablir le tableau de répartition des points gagnés.

1.8. Solutions

Ex. 1 :
a) 45/435
b) 190/435
c) 200/435

Ex 2 : En appliquant le théorème de Bayes ou en faisant recours au diagramme


arborescent, on trouve aisément la probabilité cherchée qui est 0.475.

Ex 3 : On raisonne de la même manière qu’{ l’exercice précédent. La probabilité


cherchée est 35/77.

Ex 4 : Cette probabilité est 120/204.


36
Ex 5 : La probabilité cherchée est :
19/29 𝑆 P(L1 S1 S2)
20/30 S
10/29 𝑆̅
L1
30/180 10/30 𝑆̅ 𝑆
9/49 𝑆̅ P(L2 S1 S2)
S
50/180 10/50 40/49 𝑆
L2
𝑆
40/50 𝑆̅
𝑆̅
100/180 𝑆 P(L3 S1 S2)
L3 10/100 S 9/99
90/99 𝑆̅
90/100 𝑆̅ 𝑆
𝑆̅

La probabilité cherchée est (cfr. théorème de Bayes) :

∑ ( )

( ) ( ) ( )

Ex 6 :
a) 0.216
b) 0.432
c) 0.288
d) 0.064

Ex 7 :
a) 1
b) 0.784
c) 0.352
d) 0.064

Ex 8 : Voir chapitre 2.
37

Chapitre 2. Notion de variables aléatoires


Chapitre Deuxième

otion de variables aléatoires

2.1. Introduction

Si { chacun des événements de l’ensemble des événements S, on fait


correspondre un nombre, on définit une variable aléatoire désigné par X. Si à
chacun des valeurs possibles de la V.a, on associe la probabilité de l’événement
correspondant, on obtient la « loi de probabilité » (ou la distribution de
probabilité) de la v.a. X.

La distribution de probabilité d’une variable aléatoire décrit comment


sont distribuées les probabilités en fonction des valeurs de la variable aléatoire.
Pour une variable aléatoire discrète x, la distribution de probabilité est définie
par une fonction de probabilité notée f(xi). Celle-ci donne la probabilité que la
v.a x prenne une valeur spécifique, pour l’ensemble des valeurs possibles.

Exemple

On lance successivement deux fois une pièce de monnaie bien équilibré.


On définit la v.a.X par le nombre de faces obtenues en ces deux jets.
On a S = (PP), (PF), (FP), (FF)
La v.a. X = nombre de faces obtenues
X = 0,1,2
P(X=0) = 1/4 = 0.25
P(X=1), 2/4 = 0.50
P(X=2)=1/4=0.25

On obtient ainsi la loi de probabilité suivante :

Evénement élémentaire V.a.X Probabilité


(ou résultat possible) S (valeur de X) P(X=xi) = f(xi)
PP 0 0.25
PF
FP 1 0.50
FF 2 0.25
1

N.B. Il est parfois commode d’étendre la notion de variable aléatoire { des


entités non numérique. Par exemple, la couleur C dans un arc-en-ciel est
une variable qui peut prendre les ‘’valeurs’’ rouge, vert, bleu, indigo et
violet. Il est en général possible de remplacer de telles valeurs par des
quantités numériques, par exemple 1 pour rouge, 2 pour vert,…
38
Exemple 2

Une urne contient des boules blanches en proportion p et des boules rouges en
proportion q = 1-p. On tire une boule au hasard et on définit la v.a.X de la façon
suivante :
- si la boule tirée est blanche X = 1
- si la boule tirée est rouge X = 0.

On aura alors :

S = B, R X = 1,0
P(X=1) = p
P(X=0) = q = 1-p

On obtient ainsi la loi de probabilité suivante :

Evénement élémentaire V.a.X P(X=xi)


S
B 1 P
R 0 q = 1-p
Total 1

2.2. Variable aléatoire discrète

2.2.1. V.a discrète et fonction de probabilité

On dit qu’une variable aléatoire X est discrète lorsque ses différentes valeurs
possibles sont en nombre fini ou infini dénombrable.

Exemples :
- Soit M = l’ensemble des jours de la semaine
M = L, Ma, Me, J, V, S, D  ensemble fini
- P = x/x = médecin congolais  ensemble fini
- Soit Y = l’ensemble de nombres entiers positifs pairs
Y = 2,4,6, …  ensemble infini dénombrable
- A=x  R/0 ≤ x ≤ 1  ensemble infini non dénombrable.
- B=x/x=poids d’un bébé nouveau né  ensemble infini non
dénombrable.

Loi de probabilité

La loi de probabilité associe à chacune des valeurs possibles de la v.a discrète X


la probabilité de l’événement correspondant.
La représentation graphique est le diagramme en bâton ou l’histogramme.
39
Exercice 1

On lance successivement 3 fois une pièce de monnaie bien équilibrée.


Construire le tableau de distribution de probabilité de la v.a X représentant le
nombre de faces obtenues.

Solution

S = (PPP), (PPF), (PFP), (FPP), (PFF), (FPF), (FFP), (FFF)


X = 0, 1, 2, 3

Evén. Elém. V.a X Fonction de Fonction de


S (valeur de X) probabilité répartition
f(xi) = P (X=xi) F(xi) = P(X≤xi)
PPP 0 0.125 0.125
PPF
PFP 1 0.375 0.500
FPPP
FPF 2 0.375 0.875
FFP
PFF
FFF 3 0.125 1.000
Total 1

Graphiquement
f(x)

Diagramme en bâton
3/8
x

1/8

0 1 2 3 X=x

Fonction de répartition

La fonction de probabilité ou distribution de probabilité indique pour chaque


réalisation xi, la probabilité que la v.a prenne cette valeur xi. Dans certaines
circonstances, il serait intéressant de connaître la probabilité de deux ou
plusieurs réalisations. Puisque des réalisations différentes correspondent à des
événements incompatibles, il suffit alors de cumuler les probabilités pour
obtenir le résultat désiré. Ceci conduit à définir une distribution de probabilités
cumulées que l’on appelle « fonction de répartition ».
40
Si X est une v.a discrète ayant une fonction de probabilité f(xi), on définit alors
une fonction de répartition que l’on note F(xi) par :
F(xi) = P(X ≤ xi) = f(x1) + f(x2) + … + f(xi)
= P(X = x1) + P(X = x2) + … + P (X = xi)

La représentation graphique de cette fonction est la courbe en escalier. Elle


présente des marches (ou sauts) aux points d’abscisses correspondant aux
valeurs possibles de la variable.
P.S. D’après un théorème fondamental P (a  X ≤ b) = F(b) – F(a)

Exercice 2

Pour l’exercice ci-haut, trouver la fonction de répartition.

Solution

P(X≤0) = P(X=0) = f(x0)


= 0.125

P(X≤1) = P (X=0) + P(X=1)


= f(x0) + f(x1)
= 1/8 + 3/8 = 0.500

P(X≤2) = P(X=0) + P(X=1) + P(X=2)


= f(x0) + f(x1) + f(x2)
= 1/8 + 3/8 + 3/8
= 0.875

P(X≤3) = P(X=0) + P(X=1) + P(X=2) + P(X=3)


= f(x0) + f(x1) + f(x2) + f(x3)
= 1/8 + 3/8 + 3/8 + 1/8
= 1.00

N.B. : La fonction de répartition demandée est déjà présentée dans le tableau


précédent.

Représentation graphique
F(xi)

1/8

0 X = xi
1 2 3
41
2.2.2. Espérance mathématique – Variance – Moment – Coefficient
d’asymétrie et coefficient d’aplatissement

2.2.2.1. Espérance mathématique (E(X))

L’espérance mathématique E(X) de la variable discrète X est la moyenne


arithmétique des valeurs possibles pondérées par les probabilités. C’est une
mesure de tendance centrale et son expression mathématique est :

E(X) = xi fxi) où f(xi) = P (X = xi) = pi


 E(X) = xipi = 

Les notations E(x) et  sont souvent utilisées pour désigner l’espérance


mathématique.

Exercice 3

Pour l’exercice précédant, calculer l’espérance mathématique de X = nombre


de faces obtenues.

Solution

E(X) = xipi = 0 (1/8) + 1 (3/8) + 2 (3/8) + 3 (1/8)


= 1.5

Exercice 4

Supposons qu’{ chaque face xi obtenue, on gagne xi2 points. On définit alors
une V.a Y prenant les valeurs 0, 1, 4, 9.
Calculer l’espérance mathématique de Y = nombre de points gagnés.

Solutions

E(Y) = yipi = 0 (1/8) + 1 (3/8) + 4 (3/8) + 9 (1/8)


=3

Propriétés de l’espérance mathématique

Soient a et b des constantes ; et X et Y des variables aléatoires…

1. E(aX+b) = a E(X) + b
2.E (X+Y) = E(X) + E(Y)
3.E(X*Y)=E(X)*E(Y)  X et Y étant deux variables aléatoires indépendantes
4. E[g(x)]=g(xi)pi

2.2.2.2. Variance de la v.a discrète

Alors que l’espérance mathématique fournit la valeur moyenne de la


variable aléatoire, on a souvent besoin d’une mesure de dispersion ou de
42
variabilité des valeurs d’une variable aléatoire. Les mesures couramment
utilisées sont la variance et l’écart-type.
La variance Var (X) de la V.a X est l’espérance mathématique des carrés des
écarts { l’espérance mathématique.

Var (X) = E X-E(X)² = E(X-u)²


Var (x) =  (Xi-u)² Pi =

Exercice 5

Pour l’exercice précédent (EX. 1), calculer la variance de X.

Solution

Var (X) = (0-1.5)² (1/8) + (1-1.5)² (3/8) + (2 – 1.5)² (3/8) + (3 – 1.5)² (1/8)
= 0.75

Propriétés de la variance

1. Var (k) = 0 où k = constante


2. Var (kX) = k² Var (X)
3. Var (X  Y) = Var (X) + Var (Y)
4. Var ( )

N.B. : Pour calculer la variance de X, on utilise aussi la formule :

Var (X) = E(X²) - E(X)²


qui est la transformation de la formule précédente en vue de simplifier les
calculs.

Exercice 6

Pour l’exercice précédent, trouver la variance en appliquant la formule ci-


dessous.

Solution

Var (X) = E(X2) - E(X)² = (xi)²pi-(1.5)²


= 0 (1/8) + 1 (3/8) + 4 (3/8) + 9 (3/8) - (1.5)²
= 0.75

2.2.2.3. Moment de la V.a discrète

On appelle moment d’ordre k de la V.a X, l’espérance mathématique de


Xk.
Mk = k’ = E(Xk) = (xi)k pi
43
On appelle moment d’ordre k par rapport { la moyenne de la V.a X, l’espérance
mathématique de (X - )k.

k = E (X-)k =  (xi-)kpi
N.B.

1°) Le moment d’ordre 2 par rapport { la moyenne nous donne la variance 2 =


E (X-u)² = Var (X).

L’écart-type ( ) correspond à la racine carrée de la variance.

N.B. Si la dispersion absolue est l’écart-type et si la valeur centrale est la


moyenne, alors la dispersion relative est appelée ‘’coefficient de
variation’’ ; il est noté v et donné par la formule :

Cette mesure est indépendante des unités utilisées et elle est utile pour
la comparaison des distributions dont les unités diffèrent.

On peut aussi évaluer la covariance comme suite :


Cov(X,Y)=E(X-x)(Y-y)=∑ ∑
Avec Pij=fonction de probabilité jointe (cfr.2.4)

2°) Le moment d’ordre 3 par rapport { la moyenne sont souvent utilisés { la


recherche du coefficient d’asymétrie.

 32  32
1    coefficient de PEARSON
 32 ( 2 ) 3
3
1  1   coefficient de FISHER
3
Si
1 = 0, la distribution est symétrique (cas de la distribution normale et de t de
Student)
1  0, la distribution est penchée vers la droite (allongée à gauche)
1  0, la distribution est penchée vers la gauche (allongée à droite)

Exercice

Pour l’exercice précédent, calculer le moment d’ordre 3.

Xi Pi Xi- (Xi-)3 (Xi-)3 pi


0 0.125 -1.5 -3.375 -0.4219
1 0.375 -0.5 -0.125 -0.0469
2 0.375 0.5 0.125 0.0469
3 0.125 1.5 3.375 0.4219
1.00   0.00
44

√ =0

D’où la distribution est symétrique.

3°) Les moments d’ordre 4 sont utilisés { la recherche du coefficient


d’aplatissement.

u4 u4
2    coefficient de PEARSON
u 22 4
 2   2  3  coefficient de FISHER

Si
2 = 0, la distribution est symétrique (cas de la distribution normale)
2  0, la distribution est platokurtique (cas de la distirbution t de Student)
2  0, la distribution est leptokurtique

2.2.2.4. Le mode et la médiane d’une V.a discrète

- Le mode d’une V.a discrète X que l’on note M0 est la réalisation de X {


laquelle correspond la plus grande probabilité.
- La médiane d’une V.a discrète X que l’on note Md est la première
réalisation de X pour laquelle la fonction de répartition dépasse ½.

Si la fonction de répartition vaut exactement ½ pour une certaine réalisation, la


médiane est alors le point milieu entre cette réalisation et la suivante.

2.2.3. Exercices

Exercice 1.

Soit X 1a V.a définie par le nombre de garçons dans une famille de 3 enfants.
a) Construire le tableau de distribution des probabilités
b) Trouver la fonction de répartition et représenter
graphiquement cette fonction
c) Calculer E(X) et Var (X)

Exercice 2. On jette deux dés. On définie la V.a X comme la somme des points
obtenus par les deux dés.

a) Construire le tableau de distribution des probabilités


b) Etablir la fonction F(x) de distribution des probabilités cumulées et
représenter graphiquement la fonction de répartition
45

c) Calculer E(X), Var (X), Mo et Md


d) Trouver P (4  X ≤ 8) et P (X  9).

Exercice 3. A partir de la variable aléatoire X de l’exercice précédent,

a) Effectuer la transformation Y = X - - et établir le tableau de


distribution des probabilités de Y
b) Exprimer la fonction de probabilité de Y sous forme algébrique
c) Tracer le polygone de probabilité de Y et la courbe de probabilité
cumulées de Y
d) Trouver le mode, la médiane et l’espérance mathématique de Y.

Exercice 4. Un vendeur de parapluies peut gagner 300FF par jour quand il pleut.
Il peut perdre 60 FF par jour quand il fait chaud. Quelle somme
peut-il espérer gagner par jour si la probabilité pour qu’il pleuve
est 0.3 ?

Exercice 5. On considère la loi de probabilité de la V.a X définie dans le tableau


suivant :

xi 7843 7845 7847 7849 7851


Pi 0.1 0.2 0.3 0.3 0.1

a) Déterminer la loi de probabilité de la V.a :


X  7847
Y
2
b) Calculer E(Y) et Var (Y)
c) En déduire E(X) et Var (X)

Exercice 6. Un vendeur d’automobile estime que le nombre d’automobiles


vendues chaque semaine suit la distribution suivante :
Nombre d’auto
0 1 2 3 4 5 6 7 8 9 10
vendues/sem. (X)
Probabilité 0.05 0.07 0.08 0.09 0.16 0.20 0.15 0.10 0.05 0.04 0.01

Supposons que son salaire hebdomadaire soit de 50FF plus une commission de
100FF par automobile vendue. Quel salaire hebdomadaire peut-il espérer ?

Exercice 7

Dans les mêmes hypothèses que l’exercice précédent, supposons que le profit
découlant de la vente des automobiles soit une variable aléatoire W donnée par
W = 10X²-40.
Trouver le profit hebdomadaire espéré.
46
Exercice 8

Le vendeur d’automobile de l’exercice n°6 vend aussi des camions. Selon son
estimé, le nombre de camions vendues chaque semaine est une V.a. V dont la
fonction de probabilité est donné par le tableau suivant :

Nombre de camions vendus par sem. 0 1 2 3 4


Probabilité 0.30 0.55 0.08 0.05 0.02

Quel est le nombre de véhicules, automobiles et camions, qu’il peut espérer


vendre dans une semaine quelconque.

Exercice 9

On effectue une expérience dans laquelle l’événement A peut être réalisé avec
la probabilité p ou ne pas être réaliser. Soit X la V.a représentant le nombre de
réalisation de l’événement A. Trouver son espérance mathématique, sa
variance et son écart type.

Exercice 10

Un sac contient 6 crayons et 3 gommes à effacer. On tire successivement et


avec remise 3 objets de ce sac. Si X représente le nombre de gommes à effacer,
trouver :
a) la fonction de probabilité de X
b) la fonction F(x) de répartition de X
c) P (0  X  2)
d) P (X  1)

Exercice 11

Un jeu consiste { tirer une carte d’un jeu ordinaire de 52 cartes. Si on tire un AS,
on a 10 points, un roi 5 points, une dame 3 points, un valet 2 points, une carte
avec un numéro pair un point et une carte avec un numéro impair aucun point.
a) Trouver la fonction de probabilité de la Va X représentant le nombre de
points obtenus
b) Trouver P(X3)

Exercice 12

Trois coups sont tirés sur une cible. La probabilité d’atteindre la cible avec un
coup est égale à 0.4.
Pour chaque coup réussi, le tireur gagne 5 points.
a) établir le tableau de distribution de nombre des points gagnés
b) trouver E(X), Var(X), le coefficient d’asymétrie et le coefficient de
kurtose.
47
Exercice 13

Démontrer que :

X u
a) la variable centrée réduits Z  a une moyenne égale à 0 et un

écart-type égale à 1.
b) Var (XY) = Var (Y)
c) Var (k) = 0
d) Var (kX) = k² Var (X)
e) E (X+Y) = E(X) + E(Y)

Solutions

Ex.1.

a)

V.a.X P(X=Xi) = pi = f(xi) xipi (Xi-u)² (X-u)²pi F(X) = P(Xxi)


0 1/8 0 9/4 9/32 1/8
1 3/8 3/8 1/4 3/32 4/8
2 3/8 6/8 1/4 3/32 7/8
3 1/8 3/8 9/4 9/32 1
Total 1 3/2 3/4

b)
0 pour  xi  0
1/8 pour 0  xi  1
F(Xi) = 4/8 pour 1  xi  2
7/8 pour 2  xi  3
1 pour xi  3

F(xi)

4/8

1/8

0 X = xi
1 2 3
Ex.2.
a) et b)
V.aX P(X=Xi) F(xi)=P(Xxi) xipi (xi-)² (xi-u)²Pi
48
2 1/36 1/36 2/36 25 25/36
3 2/36 3/36 6/36 16 32/36
4 3/36 6/36 12/36 9 27/36
5 4/36 10/36 20/36 4 16/36
6 5/36 15/36 30/36 1 5/36
7 6/36 21/36 42/36 0 0
8 5/36 26/36 40/36 1 5/36
9 4/36 30/36 36/36 4 16/36
10 3/36 33/36 30/36 9 27/36
11 2/36 35/36 22/36 16 32/36
12 1/36 1 12/36 25 25/36
TOTAL 1 7 5.83
F(X
i)

27/3
6

18/3
6

9/
36

0 1 X = xi
2 3 4 5 6 7 8 9 1 1 1
0 1 2
c) E(X) = 7 Var (X) = 5.83 Mo = 7 Md = 7
d) P (4  X  8) = P (X=5) + P(X=6)+P(X=7)+P(X=8)
= F(8)-F(4)
= 5/9
P(X9) = 1 – P(X8)
= 1 – F (8)
= 1 - 26/36
= 5/18
Ex.3.

V.aX 2 3 4 5 6 7 8 9 10 11 12
V.A Y ½ 1 3/2 2 5/2 3 7/2 4 9/2 5 11/2
P(Yi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
F(Y) 1/36 3/36 6/36 10/36 15/36 21/36 26/36 30/36 33/36 35/36 1
49
c)
f(yi)

6/36

Polygone de probabilité de Y

Y=
0 3 7/ 4 9/ 5 11/2 yi
1/ 1 3/ 2 5/
2 2 2 2 2

Pour la courbe de probabilité cumulé de Y, c’est la même chose que dans


l’exercice n°2 (voir fonction de répartition). Seulement { la place des xi, on met
les yi

2Yi / 36 pour 1/ 2  Yi  3
12  2Yi

c) f (yi)   pour 3 Yi  11/ 2
 36
0 aileurs

d) Mo = 3
Md = 3

E(Y) = yipi = 216/36 = 3

Ex.4.
V.a.X P(X=xj)
300 0.3
-60 0.7
Total 1

La somme que le vendeur peut espérer gagner correspond { l’espérance


mathématique de la V.a.X.

E(X) = xipi = 300 (0.3) – 60 (0.7)


= 48
Il peut donc espérer gagner 48FF.

Ex.5.

a) A partir de la formule Y  X  7847 , on peut trouver les Yi. Ainsi :


2
y1 = -2 ; y2 = -1 ; … ; y5 = 2

On aura donc :
50
xi yi pi yipi (yi-)2 (yi-)2pi
7843 -2 0.1 -0.2 4.41 0.441
7845 -1 0.2 -0.2 1.21 0.242
7847 0 0.3 0 0.01 0.003
7849 1 0.3 0.3 0.81 0.243
7851 2 0.1 0.2 3.61 0.361
Total X 1 0.1 X 1.29

b) E(Y) = yipi=0.1
Var(Y) = (yi-)²pi = 1.29

c) Y  X  7847  X  7847  2Y
2
E(X) = 7847 + 2 E(Y) = 7847 + 2 (0.1) = 7847,2
Var(X) = 2² Var (Y) = 4 (1.29) = 5.16

Ex. 6.

Soit X la V.a « nombre d’automobile vendus par semaine » et Y de la V.a « salaire


hebdomadaire ».

On a Y = 50 + 100 X

Le salaire hebdomadaire qu’il peut espérer correspond { l’espérance


mathématique de Y. Ainsi :
E(Y) = 50 + 100 E(X)

Calculons E(X) pour en déduire E(Y)

E(X) = xipi = 0 (0.05) + 1 (0.07) + 2 (0.08) + … + 10 (0.01)


= 4.6
E(Y) = 50 + 100 (4.6)
= 510
Notre vendeur peut donc espérer un salaire hebdomadaire de 510FF.
Ex.7. Pour trouver le profit découlant de la vente des automobiles, on calcule
l’espérance mathématique de la v.a. W.

W = 10X² - 40
E(W) = 10 E(X²) – 40
E( X 2 )   X i2Pi  0(0.05)  1(0.07)  ...  100(0.01)  26.5
 E(W) = 10 (26.5) – 40 = 225.

Le profit hebdomadaire espérer est 225FF.

Ex.8. Le nombre de véhicule vendus est la v.a. T = X + V, c’est-à-dire le nombre


d’automobiles plus le nombre de camions.
Pour trouver le nombre de véhicule, on calcule donc :
51
E(T) = E(X) + E(V)
E(X) = 4.6
E(V) = vipi = 0(0.3) + 1(0.55) + ... + 4 (0.02) = 0.94

Ainsi, E(T) = 4.6 + 0.94 = 5.54

Il peut donc espérer vendre 5 à 6 véhicules par semaine.

Ex.9.

V.a.X P(X=xi)
0 q=1–p
1 p
Total 1

a) E(X) = xipi = 1 (p) + 0 (1-p) = 9


b) Var (X) = (Xi-)² pi = (1-p)² (p) + (0-p)² (q) = q² p + p²q = pq (q+p)=pq
c)    2  pq

Ex. 10. a) et b)
V.aX P(X=xi) F(x)
0 8/27 8/27
1 12/27 20/27
2 6/27 26/27
3 1/27 1
1
Remarque
Si le tirage d’un échantillon est avec remise dans une population, on utilise la loi
binomiale.
P( X  x)  C nx p x qnx

Si le tirage d’un échantillon est sans remise dans une population, on utilise la loi
hypergéométrique.
x nx
C Np C Nq
P( X  x) 
C Nn

Ainsi, pour notre exercice, on peut appliquer la loi binomiale.

P( X  0)  C 30p 0 q3  (1 / 3) 0 ( 2 / 3) 3  8 / 27
P( X  1)  C13p1q2  (1 / 3)1 ( 2 / 3) 2  12 / 27
. . . . . .
P( X  3)  C 33p3q0  (1 / 3) 0 ( 2 / 3) 3  1 / 27
52
Dans le même ordre d’idées, si on appliquait la loi hypergéométrique, on
aurait :
Np = 3 Nq = 6 N = 9 et n=3

C 30 C 36
Ainsi, P( X  0)   120 / 504
C 39

P (X=1) = 270/504 P(X=2) = 108/504 et P(X=3)=6/504

Les explications nécessaires { l’application de cette loi se trouvent au chapitre


3.

Ex.11.

a) Soit X = v.a représentant le nombre de points obtenus.


On aura :

xi 0 1 2 3 5 10 Total
f(xi) 16/52 20/52 4/52 4/52 4/52 4/52 1
b) P (X3) = P(X=3) + P(X=5) + P (X=10)
= 4/52 + 4/52 + 4/52
= 3/13

Ex.12.

a) Soit X = v.a représentant le nombre de points gagnés.

x1 = 0 x2 = 5 x3 = 10 x4 = 15

P( X  0)  C30 (0.4) 0 (0.6)3  0.216


P( X  5)  C13 (0.4)1 (0.6) 2  0.432
P( X  10)  C32 (0.4) 2 (0.6)1  0.288
P( X  15)  C33 (0.4)3 (0.6) 0  0.064
On aura le tableau de probabilité ci-après :

xi 0 5 10 15
pi 0.216 0.432 0.288 0.064

b) E(X) = xipi = 0 (0.216) + 5 (0.432) + … + 15 (0.064) = 6


Var (X) = (xi-)² pi = (0-6)² (0.216) + (5-6)² (0.432) + ... + (15-6)² (0.064)
= 18

3 (0  6)3 (0.216)  ...  (15  6)3 (0.064)


1  
3 (4.24)3
 1.5
53

 4 (0  6) 4 (0.216)  ...  (15  6) 4 (0.064)


2   3
 22 (18) 2
  0.6

Ex.13.

a) Z  X  

X  X 
E(Z) = E (  )  E( )  E( )
   
1 
= E( X ) 
 
= 
 
=0

X  X 
Var(Z) = Var (  )  Var ( )  Var ( )
   
1
= Var ( X )
2
2
= 1
2

b)

Var (X  Y) = E (XY)² - E(XY)²


= E (X²  2 XY + Y²) - E(X)  E(Y)²
= E (X²)  2 E(X) E(Y) + E(Y²) - E(X)²  2 E(X) E(Y) + E(Y)²
= E(X²)  2 E(X) E(Y) + E(Y²) - E(X)² + 2 E(X) E(Y) - E(Y)²
E( X 2 )  E( X )2 E( Y)²  E( Y)²
= 
Var ( X ) Var ( Y)
 Var (X  Y) = Var (X) + Var (Y)

c) Var (k) = E(k²) - E(k)²


= k² - k²
=0

d) Var (kX) = E(kX)² - E(kX)²


= E (k²X²) - k E(X)²
= k² E(X²) – k² E(X)²
= k² E(X²) - E(X)²
= k² Var (X)

e) Soit Pij la probabilité que X prenne la valeur xi et Y la valeur yi

Pij = P (X = xi ; Y=yj)
54

E( X  Y)   (xi  y j )Pij
i j

  xiPij   yiPij
i j i j

  xi  Pij   y j  Pij
i j j j

  xi  Pio   y j  Poj
i j j j

E (X + Y) = E(X) + E(Y)

N.B. Pio = loi de probabilité marginale de X


Poj = loi de probabilité marginale de Y

2.3. Variable aléatoire continue

2.3.1. V.a continue et fonction de densité

On dit qu’une variable aléatoire X est continue lorsque son ensemble de


définition est un intervalle.

Si X est une v.a continue, la probabilité pour que X prenne une valeur
particulière quelconque est généralement nulle. Il n’est donc pas possible de
définir une fonction de probabilité comme pour une v.a discrète.

Pour pouvoir définir une distribution de probabilité dans le cas d’une v.a
continue, on remarque que la probabilité pour que X soit comprise entre deux
valeurs différentes est une notion qui a un sens.

Exemple

Si l’on choisissait au hasard un individu parmi un groupe nombreux


d’adultes mâles, la probabilité pour que sa taille X soit exactement 1.75m (c’est-
à-dire 1.7500m) sera nulle. Il y a cependant une probabilité supérieure à 0 que X
soit comprise entre 1.7500 m et 1.7550 m, par exemple.

Ces remarques nous conduisent { postuler l’existence d’une fonction f(x) telle
que :
a) f(x)  0

b) 

f ( x) dx  1

Cette seconde proposition est un énoncé mathématique du fait qu’une v.a


réelle a une valeur certainement comprise entre - et +.

Ainsi, la probabilité pour que X soit comprise entre a et b sera définie par :
55

  ∫

Fonction de densité de probabilité

Une fonction f(x) que satisfait aux propositions précédentes est appelée
« fonction de probabilité ou distribution de probabilité », mais plus souvent on
l’appelle « fonction de densité de probabilité » pour une v.a continue.

Graphiquement, on la représente par la courbe de fréquence relative.


Cette fonction de probabilité donne la probabilité pour chacun des intervalles
et cette probabilité est la surface sous la courbe.

Calcul de cette probabilité

Pour X, une v.a continue :


b
P (a  X  b) =  f (x) dx  F(b)  F(a)
a
b
P (a  X  a) =  f (x)dx  F(a)  F(a)  0
a

N.B. Pour une v.a continue, la probabilité que X soit égale à une valeur donnée
quelconque est nulle. Dans ces conditions, on peut remplacer les signes 
par .
Ainsi,
b
P (a  X  b) = P (a  X  b) = P (a  X  b) = P (a  X  b) =  f (x)dx  F(b)  F(a)
a

Exercice 1

a) Evaluer la constante c pour que la fonction

 
{

Soit une fonction de densité


b) Calculer P (1  X  2)

Solution

a) Pour que f(x) satisfasse à la propriété 1, il faut que c  0. Et, pour qu’elle
satisfasse à la propriété 2, il faut que :
 3
 f(x)dx  0 f(x)dx  1
3
3  cx 3 
0 cx dx   3   9c  1
2
Ainsi,
0
 c = 1/9
56
La fonction de densité est donc :
1/ 9x 2 pour 0  x  3
f ( x)  
0 ailleurs

2 2
b) P (1  X  2) = 1 f(x)dx  1 1/ 9x dx  7 / 27
2

Exercice 2

Dans l’intervalle 2, 4, f(x) = k x². Trouver k sachant que la fonction f(x) est une
fonction de densité.

Solution
 4
 f(x)dx  2kx²dx  1
56
 k 1
3
 k = 3/56

La fonction de densité est donc :


3 / 56x² pour 2  x  4
f (x)  
0 autrement

Fonction de répartition

Comme pour le cas discret, on s’intéressera aux variables du type (X  x).


D’après un théorème fondamental de calcul intégral, on montre que :


f (t )dt  F ( x)  F ( )
F(-) = 0

 P (X  x) = F(x) =  f(t)dt, où t est une var iable muette.
b
Ainsi, P (a  X  b) = a
f ( x)dx  F (b)  F (a)

Exemple 1.

Pour l’exercice 1, on évalue la fonction de répartition comme suit :

a) Dans l’intervalle ] ]
f(t) = 0
 F(x) = P(Xx)=∫

b) Dans l’intervalle ] ]
f(t)=
 F(x)=P(Xx)= ∫ ∫ * +
57

F(x)=

c) Dans l’intervalle [ [
f(t)=0
F(x)= P(Xx)= ∫ ∫ ∫
F(x)=1

La fonction de répartition ainsi cherchée est :

Exemple 2.

Soit une v.a continue dont la fonction de répartition est la suivante :

0 pour x  0
F(x) = 
 x pour 0  x 1
1 pour x  1

Graphiquement
F(x)

0 1 x
Connaissant la fonction de répartition, on peut dériver la fonction de densité
d F ( x)
par la formule f (x) 
dx

On aura donc, pour le cas échéant :


0 pour x  0
 1 pour 0  x  1
f ( x)  1 pour0  x  1  f ( x)  
0 pour x  1 0 autrement

{  ,
58
Graphiquement
f(x)

x
0 1

On peut calculer P(X  x) suivant la fonction de densité ou suivant la fonction


de répartition.
1°/ En utilisant la fonction de densité :

P (X 0.4) = ∫

2°/ En utilisation la fonction de répartition :

P (X 0.4) = F (0.4) = 0.4

Exemple 3

En rapport avec l’exemple précédent calculer :

P (0.6  x  0.9)
- En utilisant la fonction de densité on à :
0.9
P (0.6  x  0.9) = 0.6 1dx  0.3
- En utilisant la fonction de répartition, on a :

P (0.6  x  0.9) = F (0.9) – F (0.6) = 0.3


2.3.2. Espérance mathématique et variance

2.3.2.1. Espérance mathématique


E (X) =  =  xf(x)dx

E g (x) =  g(x) f (x)dx


2.3.2.2. Variance

Var(x) =  (x  ) 2 f (x)dx

= E(x2) - E (x)2 =∫

On peut aussi évaluer la covariance de deux v.a continue X et Y par la


formule :
59

∫ ∫ ( )

Avec f(x,y), fonction de densité jointe (cfr.2.5)

2.3.2.3. Le mode et la médiane de la v.a continue

- Le mode Mo d’une v.a continue est la valeur de X pour laquelle la


fonction de densité atteint son maximum ;
- La médiane Md d’une v.a continue est la valeur de X qui divise l’aire
sous la courbe de y= f(x) en deux parties égales.

Mathématiquement :
Md 
Md est telle que  f (x)dx  1/ 2 ou 
Md
f (x)dx  1/ 2

2.3.2.4. Moment de la v.a continue

Les calculs des moments et des coefficients d’asymétrie et d’aplatissement se


font de la même manière que pour le cas discret. Seulement on remplacera la
sommation (  ) par l’intégrale (  ) .


k  E ( x  k    


(x  )k f (x)dx

Les coefficients d’asymétrie sont :

u32 u32
1    coefficien t de PEARSON
u32 ( 2 ) 3

1 = 1  33  coefficien t de FISHER

Et les coefficients d’aplatissement.

4 4
1    coefficien t de PEARSON
 22 4

  S
60
2.3.3. Exercices

Ex. 1 : soit X une v.a continue dont la distribution f est constante sur un
intervalle


a  x b
k pour
I= a  x b et vaut 0 ailleurs : f(x) = o ailleur

(On dit qu’une telle distribution est uniformément distribuée sur I)

a) Calculer k ;
b) Calculer la moyenne  de X et la variance ;
c) Déterminer la fonction de répartition F(x)

Ex. 2 : Considérons qu’une v.a continue est distribuée suivant le modèle


probabiliste suivant :

k (30  x) , pour 0  x  30
F(x)= 
0 , autrement
On demande :
a) de déterminer la valeur de k pour que le modèle spécifié soit
véritablement une densité de probabilité ;
b) de représenter graphiquement le modèle probabiliste ;
c) de déterminer F(x) et tracer le graphique ;
d) d’évaluer : P (X15), P (10 X 20), P (X12)
e) d’évaluer le mode et la médiane de la v.a X.

Ex.3 : soit le modèle probabiliste suivant :

f (x) = {

a) tracer le modèle postulé ;


b) déterminer la fonction de répartition et tracer cette fonction ;
c) évaluation E(X), Md, Mo de ce modèle probabiliste. Quelle conclusion
peut-on tirer ?

Ex.4 : L’expression de densité de probabilité est :


 
,

Après avoir trouvé , calculer E(X), Var(X) et le coefficient d’asymétrie.

Ex.4 : La densité de probabilité d’une v.a est :


61

1°/ Evaluer (a) la constante c, (b) P (1 X  2), (c)P (X 3) et (d) P (X  1)
2°/ Trouver la fonction de distribution de la v.a X

Ex. 6. La fonction de répartition de la v.a est donnée par :

a) trouver le coefficient a ;
b) trouver la densité de probabilité f(x) ;
c) trouver la probabilité pour que la variable X se trouve dans l’intervalle
(0.25 et 0.5)
Ex. 7 : La v.a X suite une loi de probabilité :

a) trouver a ;
b) tracer le graphique de la densité de probabilitéf(x)
c) trouver le mode Mo et la médiane Md ;
d) trouver la fonction f(x) de répartition et tracer son graphique ;
e) trouver la probabilité pour que la v.a X se trouve dans l’intervalle
0  x  /4.
Ex. 8 : Une v.a continue X de densité de probabilité c(4x-x2) est définie sur
l’intervalle allant de 0 { 4 ;
a) calculer la constante c de façon que c (4x- x2) soit effectivement une
fonction de densité ;
b) représenter graphiquement la loi de probabilité correspondante ;
c) quelle est la fonction de répartition de la v.a en question ;
d) déterminer la somme de probabilité correspondant aux valeurs de X
compris entre 1et 3 ;
e) calculer l’espérance mathématique et la variance.

Ex.9. la fonction de répartition d’une v.a X est :

{
a) établir l’expression de la densité de probabilité ;
b) évaluer la probabilité que X  2 et -3  X  4

Ex. 10 : soit X la v.a dont la densité de probabilité est :

{
62
Evaluer :

a) la constante c ;
b) P (1/2  X  3/2) ;
c) P (X  1) ;
d) La fonction de répartition.

Ex. 11 : on considère la fonction F définie par :

F(x) = 0, si x  0
F(x) = 1, si x /2
F(x) = sin x, si 0  x  /2
a) montrer que F est une fonction de répartition ;
b) calculer E(X) et var (X).

Ex.12 : Une variable aléatoire continue X est distribuée sur un segment fermé
1, e avec une densité f(x)= k/x.
a) Déterminer la constante k et la fonction de répartition ;
b) Calculer la moyenne et la variance ;
c) Evaluer P(xe)

Ex.13 : la densité de probabilité d’une v.a X est :

1°/ évaluer :

a) la constante c ;
b) P (X  2) ;
c) P (0.5  X  1.5)

Solutions
Ex.1 :
b b
a)  f (x)dx  1  kdx  1, avec k, une cons tan te
a a

k x
b
 1  k (b  a)  1  k 
1
a
ba
b
 b b x  x2  b2  a2 a  b
b) E(x) =  xf(x)dx   kxdx  
a a ba
dx    
 2(b  a  a 2(b  a)

2
2
b x2  ab  (b  a) 2
var( x)   dx    
a ba  2  12
63

c)

Ex. 2 :
a) k = 1/450 ;
b) p.m

c) {

d) P(x  15) = 0.25


P(10  X  20)= 0.33
P(X  12) = 0.64
e) Mo = 0 ; Md = 8.8

Calcul de la médiane

∫ ( ) [ ]


8.8
Md
51.2 (à rejeter)

Ex. 3 :
f(x)
a)

0 2 4

b)

{
64
c) E(X) = 2 ; Mo = 2 et Md = 2

∫ ∫ ∫ ∫

* + * +

Calcul de la médiane

est telle que ∫

∫ 
Ou encore :

∫ * +

6 (à rejeter)
Md
2
La distribution étant parfaitement symétrique, on voit que l’espérance
mathématique, le mode et la médiane coïncident.

Ex. 4 :
1
a)  axdx  1  a / 2  1  a  2
0

1
b) E(x) = O
( x)( 2 x)dx  2 / 3
1
O ( x  2 / 3) (2 x)dx  1 / 18
2
d) Var (X) =
Ou encore
1
Var (X) = E(X2) - E(X)2 = O ( x )(2 x)dx  4 / 9  1 / 18
2

e) Le cœfficient d’assymétrie (Y1) est :


1
O (x  2 / 3)
3
( 2x)dx 2
Y1 = 3
 2
( 1 / 18 ) 5
65
Ex.5 :

  c  c c
1°/ a) O ce 3x dx  1   e 3x   1   e   e 0  1  c  3
 3 0 3 3

b) P (i  X  2) = F (2)-F(1)
6
= e  e 3
1 1
= 3
(1  3 )
e e
 1
c) P(X 3) = 3 f ( x)dx  F (3) 
e9
0 1
d) P(X  1) =  f ( x)dx  
O
f ( x)dx

=
O

1
0dx   3e 3x dx   e 3x
O
 
1
0  e 3  e 0  1  e 3
= F(1)- F(0)

2°/ la fonction de distribution cherchée est :

Ex.6 :

a) connaissant la fonction de répartition, on trouve la fonction de densité


par

,
1
  2axdx  1  a  1
0

b) La densité de probabilité cherchée est :

c) P (0.25  X  0.5) = F(0.5)- F(0.25)=0.1875

{
66

D’où P (0.25  X  0.5) =


= 0.1875

Ex.7 :
 /2
a)  / 2 a cos xdx  1  a sin  / 2  a sin(  / 2)  1
 a1  (1)  1
 a  1/ 2

b) Graphique

f(x)

-/2 0 /2
c) – Le mode correspond à la valeur de x pour la quelle f(x) atteint le
maximum. Sur le graphique, on trouve que pour x =0, la fonction
atteint le maximum. D’où Mo = 2

P.S. On peut aussi trouver le mode en faisant l’optimisation de la fonction f (x).


dans ce cas on aura :

Condition du 1er ordre :

df ( x)
 0  ( 1 2 cos x)'  0  (1 / 2 sin x)  0  x  0
dx
Condition du 2eme ordre pour le maximum :

( )

Au point d’abscisse . D’où au point x = 0, la fonction


atteint le maximum ; et donc Mo = 0
x
d) F(x) = 
f (t ) dt
67
x
1°/ pour x  -/2 F(x) =  0 dt  0
 / 2 x 1
2°/ pour - /2  x  /2 F(x) =  0 dt   cos t dt
 / 2 2
x
 1  1
=  sin t   1 / 2 sin x 
 2   / 2 2
 / 2 /2 x
3°/ pour x  /2, F(x) =  0 dt  
 / 2
1 / 2 cos t dt  
/2
0 dt
 /2
=  1 sin t  1
2   / 2
Graphique F(x)
1

𝜋 𝜋 X

d) P (0  X  /4) = F (/4) – F (0)


= 1/2 sin /4 – 1/2 sin 0
2
=
4
Ex. 8:
4
a) 0 c(4x  x 2 )dx  1  c  3 / 32

b) Graphiquement :
f(x) = -3/32x2+12/32x pour 0  x  4

f(x) = 0 pour x  0 et x  4
Coordonnés du sommet (M)

 12 / 32
= 2
 6 / 32
YM = - /4a, avec  = (12/32)2 -4(-3/32) (0) = 144/1024

144 / 1024
 YM    3/8
4(3 / 32 )
68

f(x)

3/8

0 2 4 X

c) la fonction de répartition est :

Graphiquement F(x)

0
2 4 x

N.B : Le point d’inflexion correspond { la valeur de x qui annule la dérivée


second (sur le graphique, c’est le point 2).
3
d) P (1 X 3) =  3 / 32( 4 x  x ) dx
2

1
= F(3)- F(1)
= 25/32

1 x3 / 32(4x  x )dx  2


3 2
e) E(X) =

Var (X) = Var (x)  E(x2 )  E(x)2   x2  (4x  x2 )dx  4


4 3
0  32 
4 12 3 3 4
=  ( x  x )dx  4
0 32 32
= 4.8

Ex.9 :
df ( x)
a) f(x) =
dx
69

b) P(x  2) = 1 – F(2)
= e 4
c) P(-3  X  4)= F(4) – F(-3)
= 1- e 8
Ex. 10 :

a)
b) P(1/2  X  3/2) = F(3/2) – F(1/2)
= 1/2
c) P(X 1) = 1 - F(1) = 3/4
d) La fonction de distribution est :

Ex. 11 :
a) Pour montrer que F(x) est une fonction de répartition, on vérifie les
propriétés suivantes :
1°/ F(x) est non négative dans 0 ; /2
F(x) = sin x
Ainsi, dans 0 ;  /2, F(x) est non négative et non décroissante.
2°/ F(a) = 0  F (0)= sin 0 = 0
3°/ F (b) = 1  F (/2) = 1
D’où F(x) est une fonction de répartition. On peut l’exprimer comme suit :

{
b) E(X) =
Var (X) =
Ex.12 :
a) k=1

b) ∫ ( ) ∫

Var (x) =-e 2 / 2  2e  3 / 2


70
Ex. 13 :
a) c = 6/29
b) P (x  2) = F(2) – F(1) = 0.483
c) P (0.5  X  1.5) = 0.164
d) P (X  4)  1

2.4. Distribution de probabilités jointes : v.a discrète

Dans les expériences associés aux variables aléatoires jointes (ou


bivariées), l’intérêt porte simultanément sur deux caractéristiques
numériques.
Soient X et Y deux variables aléatoires définies sur l’ensemble des
événements S. Si à chacune des valeurs possibles du coupe (x, y) on associe la
probabilité de l’évènement correspondant, on obtient la loi conjointe des v.a X
et Y, ou la loi de la v.a à deux dimensions (x, y).

Exemple 1.

Soient des jets « indépendants » de deux dés à six faces. Considérons les v.a X
et Y définies comme suit :
X : l’évènement "le résultat obtenu sur le premier dé"
Y : l’évènement "la somme des points des deux dés".

L’ensemble des résultats possibles formé de tous les couples (x,y) permet de
ressortir la loi de probabilité à deux dimensions.

V.a Y 2 3 4 5 6 7 8 9 10 11 12 F(x)
v.a X
1 1/36 1/36 1/36 1/36 1/36 1/36 0 0 0 0 0 1/6
2 0 1/36 1/36 1/36 1/36 1/36 1/36 0 0 0 0 1/6
3 0 0 1/36 1/36 1/36 1/36 1/36 1/36 0 0 0 1/6
4 0 0 0 1/36 1/36 1/36 1/36 1/36 1/36 0 0 1/6
5 0 0 0 0 1/36 1/36 1/36 1/36 1/36 1/36 0 1/6
6 0 0 0 0 0 1/36 1/36 1/36 1/36 1/36 1/36 1//6
f(y) 1/36 1/18 /12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36 1.0

Comme dans le cas des v.a à une dimension, ici aussi on s’intéresse {
différentes catégories d’événement et aux probabilités de leurs réalisations.

2.4.1. Fonction de distribution de probabilités jointes

Dans le cas bivarié, il s’agit de définir la fonction de distribution de


probabilités jointes, c’est-à-dire qui donne la probabilité de réalisation
simultanée de deux variables aléatoires.

Désignons par Pij, la probabilité que X et Y prennent respectivement les


valeurs déterminées xi et yi, c’est-à-dire :
71

Pij =P(X=xi, Y=yj), avec  Pij  1 (la somme des probabilités attachées aux
i j

valeurs possibles du coupe (x,y) est égale à 1).

Désignons par Pi., la totalisation des probabilités Pij suivants l’indice j (somme
de probabilité de la ligne j), alors :
Pi.=  Pij  P ( x  xi )
j

Les Pi. constituent la la loi de probabilité marginale de x.


De même, en totalisant les probabilités Pij suivant l’indice i (somme de
probabilités de la colonne j), on a :
P. j   Pij  P(Y  y j )
j

Les P.j constituent la loi de probabilité marginale de y.

Le tableau ci-après permet de ressortir les probabilités attachées aux


différentes catégories d’événements. Il s’agit du tableau de distribution de
probabilités jointes.

v.a Y y1 y2 yj Yn Loi de probabilité


v.a X marginale de X
x1 P11 P12 .…
.… P1j . ...…. P1n P1.

x2 P21 P22 .…
… P2j ….…. P2m P2 .

xi Pi1 Pi2 .....


… Pij .……. Pin P1.

xm Pm1 Pm2 .…
… Pmj ……. Pmn Pm .

Total des P.1 P.2 P.j P.m  Pij  1


colonnes (Ci) i j

On remarque que  Pi .   P. j   Pij 1 .


i j i j

Comme pour le cas univarié, la fonction de distribution de probabilité pour la


réalisation simultanée de deux variables aléatoires discrètes X et y est définie
comme :
F(xi, yi)=P(x=xi, Y=yi)=Pij.
Cette notation est utilisée pour indiquer qu’il s’agit bien d’une fonctio de
probabilité bivariée.
Rappelons que pour le cas univarié, la fonction f(xi)=P(x=xi) = Pi est utilisée.
72
2.4.2. Fonction de répartition

La fonction de répartition univariée est donnée par :


i
F(xi)=P(x≤xi)=P(x=x1)+P(x=x2)+…+P(x=xi)=  f (x
k 1
k )

Dans le cas bivarié, cette fonction est obtenue par :


i j
F(xi, yj)=P(x≤xi, y≤yi)=   f (a, b)   f ( x k , y h )
a  xi b yi k 1 h 1

Pour l’exemple 1, ci-dessus, on calcule aisément cette fonction de répartition :


F(3, 4) = P(x≤3, y≤4)=  f (a, b) .
a 3 b  4

= [P11+P12+P13+P14 ]+[P21+P22+P23+P24 ]+[P31+P32+P33+P34 ]


=* + * + * + ⁄

F(6,12) = P(X≤6, Y≤12)=   f ( a, b)


a  6 b 12
= [P11+P12+P13+…+P1.12 ]+[P21+P22+P23+…+P2.12 ]+…+…+[P61+P62+P63...+P6.12]
=* + * + * + ⁄
= 1.

Si l’on s’intéresse { la probabilité qu’une des variables aléatoires prenne une valeur
donnée, peu importe la valeur prise par l’autre variable, on obtient les fonctions de
répartition marginale définies comme suit :

 f (a, y )
a xi j
j

( ) ( )   f ( x , b)
i b y j
i

Pour notre exercice, on calcule aisément ces fonctions de répartition


marginale :

Exemple 2

Dans l’exemple des jets indépendants de deux dés, on définit :


{

{
73

En dénombrant les cas favorables et les cas possibles, on obtient le tableau des
probabilités jointe que voici :

w 0 1 P(Z=zi)
z
0 1/6 1/6 1/3
1 1/3 1/3 2/3
P(W=wi) ½ ½ 1.0

On peut dès lors calculer :

a) f(z1, w2) = P(Z=z1, W=w2)=P(Z=0, w=1)=1/6


b) f(1,0) = P(z=1, w=0) = 1/3
c) F(0, 1) = P(z ≤ 0, w ≤ 1) =  f ( a, b)
a  0 b 1
= f(0, 0) + f(0, 1) = 1/3
d) Fw(0)=P(w≤0)=1/2
e) Fz (1) = P(z≤1) = 1
f) Fz (0) = 1/3

2.4.3. Loi de multiplication et probabilité conditionnelle

Supposons que la probabilité que X prenne la valeur xi ne soit pas nulle ;


c’est-à-dire Pi.≠0. Alors la probabilité conditionnelle Y=yi sachant que x=xi est
égale à :
Pj/i=P(Y=yi/x=xi)=Pij/Pi.

Les Pj/I correspondant aux différentes valeurs possibles yi de Y étant


donné xi constituent la loi conditionnelle de Y liée par X=xi.

De même, si P.j≠0, la probabilité conditionnelle de x=xi sachant que Y=yi


est égale à :
Pj/i=P(x=xi/Y=yi)=

Les Pi/j correspondant aux différentes valeurs possibles xi de X étant


donné yj constituent la loi conditionnelle de X liée par Y=yi.

Nous avons déjà rencontré, à propos de la probabilité de réalisation de


deux événements la notion de probabilité conditionnelle. En particulier, la
relation existant, en raison de leurs définitions, entre probabilité marginale et
probabilité conditionnelle est :
Pij=Pi.•Pj/i=P.j•Pi/j
Ceci correspond à la formule de probabilité composée appelée loi de
multiplication.
Pour l’exemple 1, on calcule aisément cette probabilité.

a) P(Y=8/x = 3) =


74

b) P(x = 3/Y=6) = ⁄

c) P(Y=8, x = 3) = P(x=3, Y=8) = P3.•P8/3==

Exercice

Soit dans un univers probabiliste deux événements A et B tel que P(A) ,


( ⁄ ) et P(A/B)
Soient X et Y deux variables aléatoires indicatrices de A et B respectivement,
c’est-à-dire :
X=1 Si A se produit, X = 0 si A ne se produit pas
Y=1 si B se produit, Y=0 si B ne se produit pas
a) Elaborer le tableau de distribution de probabilité jointe
b) X et Y sont-elles indépendantes ?
Solution
a) Tableau de la loi conjointe
Y 1 0 f(x)
X (B) (
1 (A) 1/8 1/8 1/4
0( ̅ 3/8 3/8 3/4
f(y) 1/2 1/2 1.0

P(B/A)=P(Y=1/x=1) =
(ce qui permet de remplir la première case).

P(A/B)=P(x=1 /Y=1) =
⁄ ⁄
=1/2 (ce qui permet de remplir la première case

correspondante à P(Y=1).
b) Il s’agit de vérifier si :
P(x=xi, Y=yi) = P(x=xi)•P(Y=yi)
a.
b.
D’où les variables X et Y sont indépendantes.

2.5. Distribution de probabilité bivariée : v.a continue

Si X peut prendre des valeurs continues x réparties sur un segment]-∞, +∞[


et si Y peut prendre des valeurs continues y répartie sur le segment ]-∞, +∞[, on dit
qu’il s’agit d’un couple de variables aléatoires continues.
75
2.5.1. Fonction de densité jointe

Comme dans le cas univarié, une fonction f(x, y) qui est telle que son
intégration dans la totalité du domaine de variation des deux variables (X et Y)
donne l’unité est une fonction de probabilités jointes ou fonction de densité de
probabilité jointe, c’est-à-dire :
∫ ∫ ∫ ∫

Cette densité de probabilité donne la probabilité pour chacun des


intervalles et cette probabilité est la surface sous la courbe.
Ainsi P(x<X<x+dx, y<Y<y+dy) = ∫ ∫
Où f(x, y) représente la fonction de densité de probabilité jointe (c’est-à-dire à
deux dimensions).

La figure ci-après donne une interprétation graphique du rôle de la densité de


probabilité, interprétation très utile pour les calculs effectifs.
𝑥 𝑑𝑥 𝑦 𝑑𝑦
∫ ∫ 𝑓 𝑥 𝑦 𝑑𝑦 𝑑𝑥
𝑥 𝑦
y+dy
y

x x+dx

2.5.2. Fonction de répartition

Dans le cas bivarié, on définit la fonction de répartition comme suit :


∫ ∫

Connaissant la fonction de répartition, on peut dériver la fonction de densité


de probabilité jointes par :

Exemple

Soit la fonction de répartition de deux variables aléatoires X et Y donnée par :

{
76
Dériver la fonction de densité jointe associée à cette fonction de répartition et
calculer : P(1≤X≤2, 1≤Y≤3).

Solution

On note tout de suite que :


F(-∞, -∞) = 0 et
F(+∞, +∞) = 1

D’où la fonction ci-dessus est une fonction de répartition.


La fonction de densité jointe correspondante s’obtient par différentiation.
Ainsi, dans l’intervalle X>0 et Y>0, on aura :

{ [ ]} [ ]

Ailleurs, F(x,y) = 0,

D’où, {

La fonction de densité permet de calculer :


P(1≤X≤2, 1≤Y≤3)=∫ ∫

∫ [ ]

(y entre parenthèse signifie que y est la variable d’intégration).

P(1≤X≤2, 1≤Y≤3) =∫ [ ]
=[ ] [ ]
=
=
= 0.074

PS : En utilisant la fonction de répartition, on aura :


P(1≤X≤2, 1≤Y≤3) = [[ ] ] [ ]
=[ ] [ ]
=[ 𝑒 𝑒 𝑒 𝑒 ] [ 𝑒 𝑒 𝑒 𝑒 ]
0.865 0.950 0.632 0.950 0.865 0.632 0.632 0.632
0.822 0.600 0.547 0.399
= (0.822 - 0.600 - 0.547 + 0.399)
= 0.074
77
Graphiquement

3 0.074

1 2

2.6. Distributions marginales

On est souvent intéressé par la probabilité qu’une des variables


aléatoires prenne une valeur donnée, quelque soit la valeur prise par l’autre
variable. Ceci définit la distribution marginale, qui est obtenue à partir de la
fonction de probabilité jointe, comme vue précédemment, c’est-à-dire :
yn
f x ( xi )   f ( xi , yi ) qui est identique à Pi .   Pij
y  y1 j
xm
f y ( yi )   f ( xi , yi ) qui est identique à P. j   Pij
x  x1 i

Pour le cas des variables aléatoires continues, on définit : les densités


marginales de x et y :
f x ( x)   f ( x, y)dy intégration de la fonction dans le domaine de variation de y,
y

c’est-à-dire ∫

f y ( y)   f ( x, y)dx intégration de la fonction dans le domaine de variation de x,


x

c’est-à-dire ∫
Exemple

Soit f(x, y) = ,

Trouver fx(x) et fy(y).


On a :

f x ( x)   0
1
 23 ( x  2 y )dy  2
3
( xy  y 2 
1
0( y )
 23 ( x  1) pour 0  x  3

 0, ailleurs
 2 ( x  1), 0  x  3
f x ( x)   3
0, autrement
78

3 2
f x ( x)   3
 ( x  2 y )dx  
2 x2
3 2
 2 xy 
3
0( x )

2 9
(  6 y ) pour 0  y  1
3 2
0
 0, ailleurs

(3  4 y ), 0  y  1
f y ( y)  
 0, ailleurs
79

Chapitre 3. Les lois de distribution statistique


Chapitre Troisième

es lois de distribution statistique

3.1. Introduction

La plupart de phénomènes statistiques peuvent être décrit par un petit


nombre de modèle probabilistes ou lois de probabilité.

Naturellement, lorsque cette représentation est possible, elle fournit une


description beaucoup plus riche du phénomène que le simple calcul des
caractéristiques de tendance centrale et de dispersion. Elle permet notamment
de calculer la probabilité de certains événements et, par conséquent, de
préciser dans certaine mesure la représentation que l’on peut se faire de
l’avenir.
Parmi les lois de distribution statistique, on distingue :
- les modèles discrets et
- les modèles continus.

3.2. Les modèles discrets


3.2.1. La loi binomiale

La loi binomiale est une distribution de probabilité discrète qui a de


nombreuses applications. Cette loi intervient chaque fois que l’on considère
deux alternatives dont les probabilités restent constantes au cours d’une suite
d’épreuves :
- garçon ou fille ;
- mort ou survie ;
- bon ou mauvais.

Son importance provient, en particulier, de ce qu’elle s’applique au tirage


d’un échantillon aléatoire et { l’interprétation des résultats obtenus par cette
méthode.

3.2.1.1. V.a binomiale

On appelle V.a binomiale de paramètre n et p, la v.a « X = nombre de


succès ». On note X B (n,p) pour indiquer que la v.a X suit une loi binomiale
de paramètre n et p.

3.2.1.2. Fonction de probabilité

La probabilité que la variable binomiale X prenne la valeur x est :


x x n x
P (X = xi) = C n p q
80
Où n = taille de l’échantillon
p = probabilité de succès
q = 1-p
x = succès échantillon

3.2.1.3. Moyenne et Variance

Si X B (n,p), alors
E(X) = np, et
Var (X) = npq

Exercice 1

Une urne contient 4 boules blanches et 6 boules noires. L’expérience


aléatoire consiste à tirer successivement et avec remise 5 boules de cette urne.
Si X représente le nombre de boules blanches tirées, trouver la fonction de
probabilité de X.

Solution

X = nombre de succès = nombre de boules blanches tirées


n=5
p = 4/10 = 0.4 et q = 0.6
X B (5 ; 0.4).
0
p(X=0) = f(0) = C 5 (0.4)0 (0.6)5 = 0.0778
1
p(X=1) = f(1) = C 5 (0.4)1 (0.6)4 = 0.2592
2
p(X=2) = f(2) = C 5 (0.4)2 (0.6)3 = 0.3456
p(X=3) = f(3) = 0.2304
p(X=4) = f(4) = 0.0768
p(X=5) = f(5) = 0.0102

La fonction de probabilité se résume dans le tableau suivant :

xi f(xi)
0 0.0778
1 0.2592
2 0.3456
3 0.2304
4 0.0768
5 0.0102
1.0000

N.B. On peut aisément trouver les probabilités ci-dessus en utilisant la table de


la loi binomiale.
(Voir annexe).
81
Exercice 2

Dans une classe de 30 élèves, 6 d’entre-eux portent des lunettes. Si on


choisit au hasard et avec remise un échantillon de 5 élèves dans cette classe,
qu’elle est la probabilité qu’aucun d’entre eux ne porte des lunettes.

Solution

X = V.a « nombre d’élèves qui portent des lunettes »


p = 6/30 = 0.2 et q = 0.8
n=5
X B (5 ; 0.2)
0
p(X=0) = f(0) = C 5 (0.2)0 (0.8)5 = 0.3277

Exercice 3

Un étudiant doit subir un examen objectif comportant 25 questions. Pour


chacune de question, une seule réponse est bonne parmi les 4 réponses
suggérées. Si cet étudiant, n’ayant aucunement étudié, répond aux questions
d’une manière tout { fait aléatoire :
a) combien de bonnes réponses peut-il espérer ?
b) quelle est la probabilité qu’il ait au moins 15 bonnes réponses ?

Solution

a) X = V.a « choisir une bonne réponse »


p = ¼ = 0.25 et q = 0.75
n = 25
X B (25 ; 0.25)
E(X) = np = 25 (0.25) = 6.25
D’où, il peut espérer 6 bonnes réponses.

b) p(X15) = p(X=15) + p(X=16) + … + p(X=25)


= 0.0002 + 0.0000 + …. + 0.0000
= 0.0002
D’où, la probabilité de réussir dans ces circonstances est très faible (0.0002).

3.2.2. La loi hypergéométrique

La loi hypergéométrique est étroitement liée à la loi binomiale. La loi


binomiale correspond au tirage d’un échantillon avec remise dans une
population comportant deux catégories d’individus. La loi hypergéométrique
correspond, au contraire, au tirage d’un échantillon sans remise (ce qui est
équivalent { l’extraction en un seul tirage).
En réalité, c’est de cette dernière façon que l’on procède habituellement { la
désignation d’un échantillon. En effet, la méthode du tirage exhaustif donne
des estimations plus précises. Par contre, la loi hypergéométrique a des
82
propriétés moins simples et elle est d’une utilisation moins commode que la loi
binomiale. Toutefois, dès que l’effectif N de la population est grand par rapport
{ l’effectif n de l’échantillon, la loi hypergéométrique devient très proche de la
loi binomiale et peut, en pratique, lui être assimilée.

3.2.2.1. Fonction de probabilité

La notation habituelle dans les applications de la loi hypergéométrique


est la suivante : Np correspond au nombre d’éléments, dans la population de
taille N, qui sont considérés comme de succès et Nq=N-Np, correspond au
nombre d’éléments dans la population qui sont considérés comme des échecs.
La fonction de probabilité hypergéométrique est utilisée pour calculer la
probabilité que, dans un échantillon de n éléments sélectionnés aléatoirement
sans remise, nous obtenons x éléments considérés comme des succès et (n-x)
éléments considérés comme des échecs. Pour que cela se réalises, il faut
obtenir x succès parmi les Np de la population et (n-x) échecs parmi les Nq de la
population.

Si nous avons une urne contenant N boules de deux couleurs (blanches


et noires) dont Np sont blanches et Nq sont noires ; et si X consiste à extraire
des boules blanches en n extraction sans remplacement, alors nous dirons que
X suit une distribution hypergéométrique.
La probabilité que la variable hypergéométrique X prenne la valeur x est :
x n x
C Np C Nq
P ( X  x) 
C Nn

3.2.2.2. Moyenne et Variance

E(X) = np
N n
Var (X) = npq
N 1
où p = probabilité initiale (probabilité de succès)

Exercice 1

On tire simultanément 5 cartes d’un jeu ordinaire de 52 cartes. Quelle est la


probabilité que 4 de ces cartes soient des cartes de pique ?

Solution

X = V.a représentant le nombre de cartes de pique tirées


N = 52
Np = nombre de cartes de pique = 13
Nq = nombre des autres cartes = 39
p = probabilité de succès = 13/52 = 0.25
q = 1-p = 0.75
n=5
83
4 1
C13 C 39
p ( X  4)  5
 0.0107
C 52

Exercice 2

Trouver la fonction de probabilité de la V.a X de l’exercice précédant.

Solution
Cette V.a X qui obéit à cette loi hypergéométrique peut prendre les réalisations
0, 1, 2, 3, 4 et 5. On doit donc calculer les probabilités que X prenne chacune de
ces valeurs.

C130 C395
f(0) = P (X = 0) =  0.2215
C525
C131 C394
f(1) = P (X = 1) =  0.4114
C525
f(2) = P (X = 2) = 0.2743
f(3) = P (X = 3) = 0.0816
f(4) = P (X = 4) = 0.0107
f(5) = P (X = 5) = 0.0005

La fonction de probabilité se résume dans le tableau suivant :

xi f(xi)
0 0.2215
1 0.4114
2 0.2743
3 0.0816
4 0.0107
5 0.0005
1.0000

Exercice 3

Dans un jeu ordinaire de 52 cartes, on tire au hasard deux cartes. Quelle


est la probabilité d’obtenir exactement une carte de trèfle si :
a) le tirage se fait avec remise
b) le tirage se fait sans remise.

Solution

On a N = 52
n=2
p = 13/52 = 0.25
Np = 13
Nq = 39
84

a) P(X = 1) = C 2 (0.25 ) (0.75 )  0.3750


1 1 1

C131 C39
1
b) P(X = 1) =  0.3824
C522

3.2.2.3. Tendance de la loi hypergéométrique vers la loi binomiale

Quand l’effectif N de la population devient très grand, n et p demeurant


fixe, la loi hypergéométrique tend vers la loi binomiale. C’est le résultat qui, en
pratique, va permettre d’appliquer la loi binomiale, d’utilisation beaucoup plus
commode que la loi hypergéométrique, aux sondages et aux procédures
d’estimation sur échantillon.

En effet, la plupart des échantillons sont, en réalité, prélevés par tirage


exhaustif, de façon { ce qu’un même individu ne puisse être désigné deux ou
plusieurs fois : en toute rigueur, c’est donc la loi hypergéométrique qui
s’applique.
En fait, en raison de la taille généralement élevée N de la population, la
probabilité de tirer une boule blanche reste très proche de p au cours des
tirages successifs, bien qu’il n’y ait pas remise de la boule dans l’urne.
Considérons, par exemple, une urne contenant 100.000 boules, dont 40.000
blanches, dans laquelle on tire sans remise un échantillon de 1000 boules : on a

N = 100.000 p = 0.4 n = 1000

- Au premier tirage, la probabilité de tirer une boule blanche est !


40.000
P(B1 )   0, 4
100.000

- Au deuxième tirage, la probabilité devient :


Si l’on a tiré une boule rouge au tirage précédent :
40000
P( B2 / R1 )   0.400004  0.4
99999
Si l’on a tiré une boule blanche au tirage précédant :
39999
P( B2 / B1 )   0.399994  0.4
99999

Au dernier tirage, dans l’hypothèse la plus défavorable où l’on aurait tiré


une boule blanche au cours de chacun des 999 premiers tirages, la probabilité
d’obtenir une boule blanche est :
39001
P( B1000 / B1 B2 ...B999 )   0.394  0.4
99001

Si les 999 premier tirage avaient données des boules rouges, on aurait :
40000
P( B1000 / R1 R2 ...R999 )   0.404036  0.4
99001
On remarque donc qu’{ chacun des tirages, la probabilité de tirer une
boule blanche reste très proche de la proportion primitive p de boules blanches
85
dans l’urne : en pratique, on est dans les conditions d’application de la loi
binomiale.
Ainsi, lorsque la taille de la population est grande et que la taille de l’échantillon
est petite par rapport à celle de la population (on considère n petit si n  N/20),
la différence entre un tirage avec remise et un tirage sans remise devient très
faible. Dans ces conditions, il y a lieu d’utiliser la loi binomiale.

3.2.3. La loi de poisson

La loi de Poisson convient à la description des événements dont les


chances de réalisation sont faibles. Par exemple, le nombre d’appels
téléphoniques reçu dans un intervalle de temps ou le nombre de réparations
nécessaires sur 10km d’autoroute. Comme dans le cas de la distribution
binomiale, il est nécessaire, pour que la loi s’applique, que la probabilité de
réalisation de l’événement reste constante.

3.2.3.1. Fonction de probabilité

La V.a de Poisson X est une v.a discrète qui prend les valeurs entières :
x = 0, 1, 2, …
avec des probabilités :

e   x
P(X = x) = où   np
x!

3.2.3.2. Moyenne et Variance

Si X Po (), alors
E(X) = , et
Var (X) = 

3.2.3.3. Approximation de la loi Binomiale par la loi de Poisson

Si n est grand et qu’en même temps p est petit, la loi binomiale tendra vers la
loi de poisson de paramètre  = np. En effet, si n est grand et p très petit, on
aura :

N.B. Habituellement, on accepte de substituer la loi de poisson à la loi


binomiale lorsqu’on a { la fois :
- 1er cas : n  50 et p  10%
- 2ème cas : n  30 ; np  5 et nq  5
86
3.2.3.4. Table de la loi de Poisson

Cette table donne les valeurs de  et x. Elle est à double entrée. Voir
Annexe.

Exercices

Ex. 1. Dans une grande ville, on compte en moyenne 5 décès par accident
d’auto chaque mois. Sachant que le nombre d’accidents par mois est une
v.a de Poisson de paramètre  = 5, calculer la probabilité pour que dans
un mois, il y ait zéro accident (resp. 1 accident, au moins 6 accidents).

Ex. 2. Une dactylo fait en moyenne deux erreurs de dactylographie par page.
Sachant que le nombre d’erreurs par page est une v.a de Poisson,
calculer la probabilité qu’elle tape une page sans erreur.

Ex. 3. Une centrale téléphonique reçoit des appels en raison de k appels par
heure en moyenne. En supposant que le nombre d’appels pendant un
intervalle de temps donné est une v.a de Poisson, calculer la probabilité
pour que pendant deux minutes la centrale reçoive exactement 3 appels
(resp. au moins 1 appel, au moins 3 appels).

Ex. 4. A la sortie d’une chaîne de fabrication de boulons, on tire chaque jour au


hasard un lot de 1000 boulons et ce, pendant 100 jours.
Dans chaque lot, on compte le nombre de boulons mal calibrés. Au bout
de 100 jours, on a obtenu :
0 boulon défectueux dans 5 lots
1 boulon défectueux dans 16 lots
2 boulons défectueux dans 23 lots
3 boulons défectueux dans 21 lots
4 boulons défectueux dans 17 lots
5 boulons défectueux dans 9 lots
6 boulons défectueux dans 6 lots
7 boulons défectueux dans 3 lots
Total 100
a) Calculer la moyenne et la variance de nombre de boulons défectueux
par tôt.
b) A quelle distribution théorique peut-on ajuster la distribution ci-dessus.
c) Chercher la probabilité pour qu’un boulon tiré au hasard { la sortie de la
chaîne soit défectueux.

Ex.5. 10% d’outils produits par un certain procédé de fabrication ont été
défectueux. Trouver la probabilité pour que 2 outils exactement soient
défectueux sur un échantillon de 10 choisit au hasard, en utilisant :
a) la loi binomiale
b) l’approximation de la loi binomiale par la loi de Poisson.
87
Ex.6. Si la probabilité pour qu’un individu ait une mauvaise réaction { l’injection
d’un sérum est de 0.001, quelle est la probabilité pour que sur 2000
individus :
a) 3 aient une réaction dangereuse
b) Plus de deux aient une réaction dangereuse.

Ex.7. Une agence organise des voyages par bus. Le prix est fixé à 2000F par
passager. Le bus peut transporter 50 personnes et l’Agence doit payer
25000F au propriétaire du bus. L’expert de la compagnie fait observer
que le nombre de personnes qui annulent une réservation suit une
distribution de Poisson de moyenne L’Agence se demande alors
si elle doit accepter plus de réservations que de places disponibles. En
effet, si les annulations sont inférieures au nombre de réservations
supplémentaires, l’Agence paie 500F { titre de dommages { la personne
qu’elle ne peut transporter.
Calculer le nombre de réservations supplémentaires que peut accepter
l’Agence.

Solutions
e  x
Ex.1. Pour une v.a de Poisson P(X=x) =
x!

e 5 5 0
a) P(X = 0) =  0.0067
0!
e 5 51
b) P(X = 1) =  0.0337
1!
c) P(X  6) = 1 – P(X  6)
= 1 – (P1 + P2 + P3 + P4 + P5)
= 1 – 0.616
= 0.384

Ex.2.  = 2 et x=0
e 2 2 .0
P( X  0)   0.1353
0!

Ex.3.  = k/30

e  k / 30 (k / 30 ) 3 e  k / 30 (k / 30 ) 3
a) P(X = 3) = 
3! 6
b) P(X  1) = 1 – P (X  1) = 1 – P (X = 0)
= 1 - e-k/30
c) P(X  3) = 1 – P(X3)
= 1 – (P0 + P1 + P2)
88

e  k / 30 (k / 30 ) 2
= 1 - (e  k / 30  (k / 30 ) e  k / 30  )
2
= 1 - e-k/30 (1 + k/30 + k/1800)

Ex.3.

xi Pi xipi x12 p i
0 0.05 0 0
1 0.16 0.16 0.16
2 0.23 0.46 0.92
3 0.21 0.63 1.89
4 0.17 0.68 2.72
5 0.09 0.45 2.25
6 0.06 0.36 2.16
7 0.03 0.21 1.47
1.00 2.95 11.57

a) E(X) = xipi = 2.95


Var (X) = E(X²) - E(X)² = 11.57 – 8.7 = 2.87
b) n étant supérieur à 50 et p inférieur à 0.1, cette distribution peut être
ajustée par une distribution de Poisson.
E(X) = Var (X) = 3 = 
c) E(X) =  = np n = 1000 et N = 100000
 3 = 1000p  p = 3/1000 = 0.003

Ex.5.
x x n x
a) P(X=xi) = C n p q
p = 0.1 et q = 0.9
P(X=2) = C10 (0.1) (0.9)  0.1937
2 2 8

e  x
b) P(X = x) =
x!
 = nbp = 10 (0.1) = 1
e 112
P(X = 2) =  0.1839
2!
Ex.6.

p = 0.001 et n = 2000
n  50 et p  0.1, on peut approximer la loi binomiale par la loi de Poisson.
 = np = 2000 (0.001) = 2
89

e 2 2 3
a) P(X = 3) =  0.1804
3!
b) P(X  2) = 1 - P(X  2) = 1 - (P0 + P1 + P2)
= 1 – 0.6767
= 0.3233

Ex.7. Un statisticien qui appliquerait les méthodes classiques se limiterait à


calculer les probabilités d’avoir 0,1,2 ou 3 annulations et soumettrait les
résultats aux instances qui doivent décider en fonction de toute une série
de facteurs (image de la compagnie, coût d’opportunité,…). Les
méthodes bayesiennes proposent une solution basée sur le principe de
perte implicite. Lorsqu’on considère jusqu’à 10 annulations, on a la
matrice de pay off suivante.
90

RESERVATIONS SUPPLEMENTAIRES

Avec λ=2.5 0 1 2 3 4 5 6 7 8 9 10
0.082084999 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
0.205212497 2000 0 500 1000 1500 2000 2500 3000 3500 4000 4500
0.256515621 4000 2000 0 500 1000 1500 2000 2500 3000 3500 4000
0.213763017 6000 4000 2000 0 500 1000 1500 2000 2500 3000 3500
0.133601886 8000 6000 4000 2000 0 500 1000 1500 2000 2500 3000
0.066800943 10000 8000 6000 4000 2000 0 500 1000 1500 2000 2500
0.027833726 12000 10000 8000 6000 4000 2000 0 500 1000 1500 2000
0.009940617 14000 12000 10000 8000 6000 4000 2000 0 500 1000 1500
0.003106443 16000 14000 12000 10000 8000 6000 4000 2000 0 500 1000
0.000862901 18000 16000 14000 12000 10000 8000 6000 4000 2000 0 500
0.000215725 20000 18000 16000 14000 12000 10000 8000 6000 4000 2000 0
1
91
Le nombre de réservation supplémentaires que peut accepter la compagnie
correspond à la perte implicite la plus minimale. Les calcules de ces pertes
implicites (PI) espérées se fait comme suit :

[ ]

[ ]

[ ]

[ ]

[ ]

[ ]

[ ]

.
.
.
[ ]

Il se dégage une perte minimale de 1176F. D’où l’agence ne peut accepter


que 4 réservations supplémentaires.

3.3. Les modèles continus

3.3.1. La loi normale

La loi normale ou loi de Laplace-Gauss est une loi de probabilité la plus


importante en Statistique. Et cela, parce qu’on la rencontre le plus souvent en
Statistique. Il s’agit d’une distribution continue qui est { la fois symétrique et
mesokurtique.

Cette distribution est utilisée dans nombreuses applications pratiques,


surtout dans l’inférence statistique où elle fournit une description des résultats
possibles obtenus grâce à un échantillon.
92
3.3.1.1. Définition

La v.a normale X est une variable continue pouvant prendre n’importe


quelle valeur entre - et + avec la densité de probabilité :
1  x 
2

f ( x)  exp  1 / 2  
 2     

Symboliquement, on note X N(, ²) pour indiquer que la v.a X suit une
loi normale de paramètres  et ², qui déterminent la position et la forme de la
distribution. Plus l’écart-type est grand, plus la courbe sera large, aplatie,
traduisant ainsi une plus grande dispersion.

Propriétés

1°/ f(x) 0 lorsque x  et atteint son maximum lorsque x =  et deux


points d’inflexion pour . Il s’inscrit que la courbe est d’autant plus que
la variable possède une large variance comme illustré sur le graphique 3.1 ci-
dessous.

2°/ f(x) est symétrique par rapport à , càd


 
 f ( x)dx   f ( x)dx  0.5
3°/ La moyenne et la variance sont les deux seules paramètres de la distribution
normale.
4°/Si X N(, ²), toute transformation de X suivra aussi la loi normale, comme
illustré dans le graphique 3.2 ci-dessous.

Graphique 3.1 : Trois distributions normales ayant la même moyenne, avec des
écart-types différents.

𝛿
93
Graphique 3.2 : Trois distributions de moyennes différentes ayant la même
transformation normale centrée réduite.

3.3.1.2. V.a normale réduite

Si on a X N(, ²), on peut obtenir la courbe normale centrée réduite


par la transformation :
X 
Z

Ainsi, si X est une v.a obéissant à une loi normale, alors Z, la variable aléatoire
centrée réduite obéit également à la loi normale.
On aura donc :
Z N(0,1) lorsque X N(, ²)
Grâce à ces transformations linéaires on peut construire une seule table,
celle de la variable centrée réduite Z. Dans cette table on trouve la valeur de
l’aire sous une courbe normale centrée réduite Z entre la moyenne 0 et une
valeur zi : c.à.d. P (0  Z  zi)1
Les différentes valeurs de zi sont données à une décimale à la première colonne
alors que la ligne du haut représente la seconde décimale correspondante.
Par exemple, pour trouver P (0  Z  1.34) on cherche la valeur 1.3 dans la
première colonne, puis on se déplace horizontalement, jusqu’{ l’emplacement
du chiffre 4 de la ligne du haut pour repérer la probabilité cherchée :
P (0  Z  1.34) = 0.4099

N.B. Il sera toujours utile d’esquisser un graphique dans ces calculs de


probabilité. La partie hachurée correspond à la probabilité cherchée.
P (0  Z 1.34) P (z1  Z  z2) = P (a  Z  b)

0 1,34 a b

a- b- 0 Z
 

1
Dans d’autres tables, on trouve la valeur de l’aire entre - et zi ; càd P (Z zi).
94
Exercice 1
Si Z N (0,1), trouver :
a) P (0.80  Z  2.35)
b) P (-2.11  Z  0)
c) P (-0.35  Z  3.42)

Solution

a) Pour trouver la probabilité que Z se trouve entre deux valeurs positives,


il faut faire la différence entre deux nombres de la table.

En effet, la table donne l’aire entre 0 et 2.35 et l’aire entre 0 et 0.80.


La différence sera l’aire entre 0.80 et 2.35 et dont la probabilité.
Cherchée est :
P (0.80  Z  2.35) = P (0  Z  2.35) - P (0  Z  0.80)
= 0.4906 – 0.2881
= 0.2025

Z
0 0,8 2,35

b) On peut utiliser la même table pour des valeurs de Z négatives en se


servant du fait que la courbe est symétrique par rapport à la verticale Z
= 0.
P(-2.11  Z  0) = P (0  Z  2.11)
= 0.4826

-2,11 0 2,11
Z

c) Si les valeurs zi sont de part et d’autres de 0, il faut alors additionner


deux valeurs de la table.

P(-0.35  Z  3.45) = P (-0.35  Z  0) + P (0  Z  3.42)


= 0.1368 + 0.4997
= 0.6365

-0,35 0 -3,42
Z
95
Exercice 2

Si X N (20, 100), trouver :


a) P (X  25)
b) P (15  X  18)
c) P (X  17)

Solution

Pour utiliser la table, il faut transformer la v.a X en une v.a centrée réduite Z
défini par
X  20
Z
10

X  20 25  20
a) P(X  25) = P (  )
10 10
= P (Z  0.5)
= 0.5 – P (0  Z  0.5)
= 0.5 – 0.1915
20 25 X
= 0.3085
Z
0 0.5

N.B. On sait que l’aire totale sur la courbe est 1 ; donc la moitié de cette aire est
0.5

P (15  X  18) = P (-0.5  Z  -0.2)


= P (0.2  Z  0.5)
= P (0  Z  0.5) – P (0  Z  0.2)
= 0.1915- 0.0793
= 0.1122 - - 0 0.2 0.5
0.5 0.2

c) P(X  17) = P (Z  -0.3)


= 0.5 + P (0  Z  0.3)
= 0.5 + 0.1179
= 0.6179
-0.3 0 Z

Exercice 3

La taille moyenne de 500 élèves du Mont AMBA est de 151 Cm et la variance 225
Cm. Sachant que la taille est une variable aléatoire continue qui obéit à une loi
normale, trouver :
a) La probabilité qu’un élève choisit au hasard ait une taille comprise entre
120 cm et 155 cm ;
96
b) La probabilité qu’il ait une taille de 185 cm ou plus
c) Le nombre d’élèves ayant une taille supérieure { 185 cm.

Solution

Si on désigne par X la v.a représentant la taille des élèves du Mont Amba, alors
X N (151, 225).

a) P(120  X  125) = P (-2.07  Z  0.27)


= 0.5872

-0.27 0 0.27

b) P(X185) = P(Z2.27)
= 0.5 - P(0  Z  2.27)
= 0.5 - 0.4884
= 0.0116

0 2.27

c) Lorsque on a 500 élèves, on peut considérer que l’on tire 500 élèves dans
une population très grande. Si Y représente le nombre d’élèves ayant une
taille supérieure à 185 Cm, alors Y est une v.a qui obéit à une loi
hypergéométrique où N est très grand, n = 500 et p = 0,0116. Toutefois,
comme la population est très grande (on dit souvent infinie), on peut
considérer que Y suit une loi binominale : Y B (500, 0.0116). Alors le
nombre d’élèves qui mesurent plus de 185 Cm est égal { :
E(Y) = np = 500 (0.0116) = 6 élèves.

Exercice 4

Yves s’inscrit { une compétition de lancer de javelot où sont inscrits


plusieurs autres participants. Il sait que les performances des participants
obéissent { une loi n normale de moyenne 64 m et d’écart-type 6 m. Quelle
distance doit-il réaliser pour se classer dans les meilleurs 10% ?
97
Solution

Ici, le problème est à sens inverse par rapport aux précédents. En effet, si
X est une v.a représentant la distance de lancer des javelots, on cherche ici une
valeur de X, appelons-la xi telle que :
P(X  xi) = 0.10
x  64
P(X  xi) = P( Z  i )  0.10
6
= P (Z  zi) = 0.10
 0.5 - P(0  Z  zi) = 0.10
 P (0  Z  zi) = 0.40

En utilisant la table II en sens inverse, on obtient zi = 1.28. Ainsi :


xi  64
zi 
6
x i  64
1.28 
6
 xi = 71.68 0.10

X
64 xi

zi Z
0

Ainsi, un lancer supérieur ou égal à 71.68 m permettra à Yves de se classer dans


les meilleurs 10%.

Exercice 5

Etant donné que la v.a X a la distribution de probabilité dont le champs de


variation est -  X  + avec f ( x)  1
18
 
exp  ( x 2  10x  25) / 18

a) Montrer que cette distribution est une distribution normale


b) Quelle est la valeur maximum de f(x).

Solution

a) L’expression de la distribution normale est la suivante :


2
1   x   
f ( x)  exp . 1 / 2  avec -  X  +
 2    

En prenant en considération les données du problème, on a :


x² - 10x + 25 peut s’écrire (x-5)²
18 peut s’écrire 2 * 3² ; d’où
18 peut s’écrire 2 * 3²  3 2
98
Ainsi donc, l’expression ci-dessus peut s’écrire :
1   x 5 
2
f ( x)  exp . 1 / 2  
3 2   3  
où 5 représente la moyenne, et
3 représente l’écart-type.

b) Le graphe d’une distribution normale atteint son maximum au point où x = 


Ainsi, en substituant x = 5 dans l’expression, on a :

exp. (5  5)² / 18


1
f ( x) 
3 2
1
 e0
3 2
1

3 2

1
D’où la valeur maximum de f(x) est
3 2
Exercice 6

Si X N(, ²), trouver :


a) P (-  X   + )
b) P (-2  X   + 2)
c) P (-3  X   + 3)
d) P (-1.96 X+1.96)

Solution

a) P (-  X   + ) = P (-1  Z  1) = 0.6826


b) P (-2  X   + 2) = P (-2  Z  2) = 0.9544
c) P (-3  X   + 3) = P (-3  Z  3) = 0.9974
d) P (-1.96 X+1.96)=0.95

Exercice 7

On a ajourné deux étudiants qui ont respectivement eu { l’examen de


mathématique les notes centrées réduites 0.8 et -0.4. Si leurs notes vraies
étaient respectivement 88 et 64, trouver la moyenne et l’écart-type des notes à
l’examen.

Solution

X 
Z

99

88  
- Pour le premier étudiant, on a 0.8 =  88    0.8

64  
- Pour le second étudiant, on a - 0.4 =  64    0.4

On aura donc :
  0.8  80 1 0.8      88 
       
  0.4  64 1  0.4      64 

D’où  = 72 et  = 20

Exercice 8

Dans un test d’aptitudes en Mathématiques, LAURA a obtenu un résultat


brut de 88.3. Pour ce test, la moyenne est 75 avec un écart-type de 8. Chaque
année, les résultats sont ramenés à une moyenne de 500 avec un écart-type de
100 (pour pouvoir comparer les résultats d’une année { l’autre). Quel résultat
donnera-t-on à LAURA ? On suppose que les résultats du test suivent la loi
normale.

Solution

La note centrée réduite de LAURA dans une distribution de moyenne 75


88.3  75
et d’écart-type 8 est  1.66 . Dans une distribution où  = 500 et  =
8
100, la note centrée réduite sera Z  X  500  1.66  X  666
100

D’où, on donnera { LAURA une note de 666. Avec cette note, LAURA est
classée parmi les 5% des meilleurs.

3.3.1.3. Approximation de la loi binomiale par la loi normale

Si n est grand et qu’en même temps p est grand (c’est-à-dire que p n’est
pas trop voisin de 0, ni de 1), la loi binomial tendra vers la loi normale de
paramètre  = np et ² = npq.

Ce résultat est très intéressant en pratique, car il permet de remplacer la


loi binomiale par la loi normale dès que n est de l’ordre de quelques dizaines
d’unités.

Habituellement, on accepte l’approximation de la loi binomiale par la loi


normale lorsqu’on a { la fois :
n  30, np  5 et nq  5.
100
Correction de continuité

Etant donné que la loi binomiale concerne les valeurs discrètes et que la
loi normale concerne les valeurs continues, il y a une correction { faire que l’on
appelle « correction de continuité ».

Illustrons par un exemple la manière de procéder pour approximer une


probabilité dans une loi binomiale avec une loi normale.

Soit X B (30 ; 0.4) et soit à calculer P (10  X  15)


On sait que np = 12 et npq = 7.2. Bien sur pour n = 30, on peut encore utiliser la
table de la loi binomiale :
P (10  X  15) = P(X = 10) + P (X = 11) + … + P (X = 15)
= 0.1152 + 0.1396 + … + 0.0783
= 0.7266

Si on veut approximer par une loi normale, il faut tenir compte du fait que
X B (30 ; 0.4) est une v.a discrète alors que Y N (12 ; 7.2) est une v.a
continue. Si on cherche P(Y=10), on trouve 0.
Il en est de même pour toute probabilité qu’une v.a continue prenne une valeur
particulière. Puisqu’une v.a continue remplace une v.a discrète, chaque valeur
de la v.a discrète sera remplacée par un intervalle de longueur 1 situé
également de part et d’autres de cette valeur. Ainsi x = 10 sera remplacé par 9.5
 Z  10.5. C’est ce qu’on appelle « la correction continuité ».

D’où P(10  X  15)  P (9.5  Z  15.5)


9.5  12 15 .5  12
= P( Z  )
7.2 7.2
= P (-0.93  Z  1.30)
= 0.7270

On peut constater que l’approximation est bonne.

P.S. D’une manière générale, lorsqu’on utilise la correction de continuité, 0.5


peut soit être ajouté, soit être soustrait en rapport avec la forme de
l’inégalité et se présente comme suit :
1- soustraire 0.5 de X lorsqu’on cherche P(X  xi)
2 - soustraire 0.5 de X lorsqu’on cherche P(X  xi)
3 - ajouter 0.5 { X lorsqu’on cherche P(X  xi)
4 - ajouter 0.5 { X lorsqu’on cherche P(X  xi)

Notons que cette correction de continuité peut avoir un effet négligeable


lorsqu’un grand nombre de valeur de la v.a X est inclus dans la distribution de la
probabilité.
101
Exercice 1

Soit X B (100 ; 0.4). Calculer P(X  45)

Solution

On a n = 100, p = 0.4, np = 40 et npq = 24

La probabilité cherchée ne peut se trouver grâce à la table de la loi binomiale


puisque celle-ci est limitée à n = 30. On pourrait retrouver cette probabilité
grâce aux formules binomiales. Mais, il s’agit l{ d’un travail long et fastidieux.
La meilleure solution consiste donc à approximer cette valeur par une loi
normale.

Soit Y N(40 ; 24)


P(X  45)  P(Y  45.5)
= P(Z  1.12)
= 0.8686
y
40 45.5
Z
0 0.12
Exercice 2

Un appareil automatique fabrique des billes avec un pourcentage des pièces


défectueuses que son vendeur affirme avoir été mesuré sur un très grand
nombre d’appareils identiques et s’élève en moyenne { 10%.
Avant de se décider { l’acheter et afin d’estimer les pertes qu’il pourra avoir {
endosser. Le client éventuel pose les questions suivantes dans l’hypothèse
d’une mise en fabrication de 400 billes ; quelles sont les probabilités que les
pièces défectueuses soient :
a) au maximum 30
b) de 30 à 50
c) de 35 à 45
d) de 55 ou plus.

Solution

On a n = 400, p = 0.1, np = 40 et npq = 36

a) P(X  30)  P (Y  30.5)


= P (Z  -1.58)
= 0.0571

b) P(30  X  50)  P(29.5  Z  50.5)


= P(-1.75  Z  1.75)
= 2 (0.4599)
= 0.9198
102

c) P(35  X  45)  P(34.5  Y  45.5)


= P(-0.92  Z  0.92)
= 2 (0.3212)
= 0.6424
d) P(X  55)  P(Y  54.5)
= P(Z  2.42)
= 0.5 – 0.4922
= 0.0078

Exercice 3
On envoie 400 questionnaires par la poste pour effectuer un sondage. On sait
que la probabilité qu’une personne retourne le questionnaire complété est
0.10. Quelle est la probabilité qu’au moins 60 questionnaires soient retournés
complétés ?
Solution
On a n = 400, p = 0.1, np = 40 et npq = 36

P(X  60)  P(Y  59.5)


= P(Z  -0.68)
= 0.5 + 0.2518
= 0.7518
Exercice 4
Les notes données aux réponses d’un examen de statistique II sont 0, 1, 2,
…, 10 selon qu’on a répondu { 0, 1, 2, …, 10 questions. La note moyenne est de
6.7 et l’écart-type de 1.2. En supposant que les notes soient distribuées suivant
une loi normale, déterminer :
a) le pourcentage d’étudiants ayant obtenus 6
b) la note minimale de 10% les meilleurs de la classe
c) la note maximale de 10% les plus mauvais de la classe.
Solution

 = 6.7 et  = 1.2

a) P(X = 6)  P (5.5  Y  6.5)


= P (-1  Z  -0.17)
= 0.2738
Il y a donc 27.38% d’étudiants ayant obtenu la note 6.

b) P(X  xi) = 0.10


 P(Z  zi) = 0.10 0.10
0.5 - P(0  Z  zi) = 0.10
 P(0  Z  zi) = 0.40
μ xi X
 zi = 1.28
0 Zi Z
103
x i  6.7
Or z i 
1.2
x  6 .7 0.10
1.28  i  xi  8.236  8
1 .2

c) P(X  xi) = 0.10 xi μ xi


 P(Z  zi) = 0.10 Zi 0 Zi
 zi = -1.28
x  6.7
Or z i  1
1.2
xi  6.7
 1.28   xi  5.164
1.2
D’où la note maximale est 5.

Exercice 4

La maladie de Popo atteint 55% des ouvriers agricoles d’une région donnée.
a) Dans une entreprise agricole employant 5 ouvriers, quelles sont les
probabilités respectives pour que :
- aucun ouvrier ne soit atteint par la maladie de Popo
- au maximum 4 ouvriers soient attendus par cette maladie
- au moins un ouvrier soit atteint par cette maladie
b) Dans une entreprise agricole employant 40 ouvriers, quelle est la probabilité
pour que moins de la moitié des ouvriers soit atteints par la maladie de Popo.
C) Les ouvriers de la région considérée sont pour 1/3 des femmes et 2/3 des
hommes :
- sachant que 48% de ces femmes sont atteintes par la maladie de Popo,
quelle est la proportion des ouvriers agricoles hommes atteints par
Popo ?
- lorsque le médecin est appelé dans une entreprise agricole pour
examiner un ouvrier atteint de la maladie de Popo, quelle est la
probabilité pour qu’il ait { examiner une femme.

Solution

a) Comme n  30 et N quasi- infini, on applique la loi binomiale ; X B (5 ; 0.55).


on trouve donc :
a.1/ 0.0185
a.2/ 0.9497
a.3/0.9815

b) n  30, np  55 et nq  5, on approxime la loi binomiale par la loi normale :


X B (5 ; 0.55)  Y N(22 ; 9.9)
La probabilité cherchée est donc 0.2148
104
c) Soit A l’événement "la personne est atteinte de la maladie de Popo". Alors :
- P(A/H)=0.5850
- P(F/A)=0.2909

3.3.1.4. Approximation de la loi de Hypergéométrique par la loi normale

Si N est petit en qu’en même temps n et p sont grands, la loi


hypergéométrique tendra vers la loi normale de paramètre =np et
N n
²=npq ( )
N 1
Habituellement, on accepte l’approximation de la loi hypergéométrique par la
loi normale lorsque on a à la fois :
N
n  30, n  , np  5 et nq  5
20
Exercice

On prélève sans remise un échantillon de 36 candidats parmi 120


candidats (dont 72 catholiques) à un poste de directeur de la compagnie
Beaujolais. Quelle est la probabilité qu’au moins 20 de ces candidats soient
catholiques ?

Solution

Soit X = v.a représentant les candidats catholiques prélevés.


En principe, on est dans le cas d’application de la loi hypergéométrique, avec :
N = 120, Np = 72, Nq = 48, n = 36, p = 0.6 et q = 0.4

N
Etant donnée que n  30, n  , np  5 et nq  5 ; on doit donc faire
20
l’approximation de la loi hypergéométrique par la loi normale de paramètre  =
21.6 et ² = 6.0988.

Ainsi :
P(X  20)  P(Y  19.5)
= P(Z  -0.85)
= 0.8023

3.3.1.5. Approximation de la loi Poisson par la loi normale

Lorsque la moyenne  de la distribution de Poisson est relativement


élevé, la loi de Poisson tendra vers la loi normale de paramètres  =  et ² = .
Habituellement, on accepte l’approximation de la loi de Poisson par la loi
normale lorsque   10.
105
Exercice

Le nombre d’appels téléphoniques reçu par une centrale téléphonique


est de 10 appels par heure. En supposant que le nombre d’appels pendant un
intervalle de temps donné est une v.a de Poisson. Trouver la probabilité pour
que la centrale reçoive plus de 15 appels pendant une heure :
a) en utilisant la loi de Poisson
b) en utilisant l’approximation de la loi de Poisson par la loi normale.

Solution

a)  = 10
P(X  15) = P(X = 16) + P(X = 17) + P(X = 18) + …
= 0.0217 + 0.0128 + 0.0071 + …
= 0.0488

b)  =  = 10 et ² =  = 10
P(X  15)  P(Y  15.5)
= P (Z  1.74)
= 0.0409

3.3.2. La loi de Khi-deux (x²)

La loi de khi-deux est importante, non pas comme les lois précédemment
étudiées, mais en raison du rôle qu’elle joue dans les tests statistiques ;
notamment dans le test de l’ajustement d’une loi théorique { une distribution
observée et dans les tests d’hypothèses sur l’indépendance de deux variables
aléatoires.
Cette variable aléatoire varie entre 0 et .

Soit Z1, Z2, … Zk k variables aléatoires normales centrées réduites et


indépendantes. On appelle variable aléatoire Khi-deux (²) de paramètre k, la
v.a définie comme la somme des carrés de k variables aléatoires normales
centrées réduites indépendantes, càd :
 2  Z i2  Z 22  ...  Z k2
k
  Z 12
i 1
k
 x  i 
  i  où k = nombre de degrés de liberté.
i 1  1 

Propriétés

1. 0  ²  
2. E(²) = k
3. Var (²) = 2k
4. 1 = (1-2t)-k/2
106

5. La distribution du ² dépend du nombre de degrés de liberté k. Alors,


pour des valeurs différentes de k, nous obtenons des distributions
différentes. A mesure que k augmente (k  30), la loi de ² tend
lentement vers la loi normale.

Table de Khi-carré

P (  k  x)  p et P (  k  x)  
2 2
P α
𝑥
x 2
k ,  2
k, p 𝑥

Ici, p est donnée ; x est l’inconnu et ² est donné dans la table. P est le niveau
de confiance. Dans d’autres tables, c’est plutôt α=1-p, seuil de signification qui
est donné. Dans ce cas, c’est la valeur de correspondant à P(  =α qui
est donné directement.

Exemple

Pour 10;0.95  18.3 Cela signifie que P (  10  18 .3) = 0.95


2 2

Exercice 1

Soit une v.a distribuée suivant un ² avec 10 degrés de liberté. Evaluer P(² 
12.5)

Solution

Etant donné que la somme de toutes les probabilités est égale à 1, si P(²  x) =
p, alors P(²  x) = 1-p.
Nous aurons donc :  k2; p  10
2
; p  12.50

Ainsi, pour k = 10, nous aurons :


P( 10 ; p  12.5)  0.75 et P (  10;  12 .5)  0.25
2 2

et P( 10
2
;  12.5)  1  P( 10; p  12.5)  0.25
2

La distribution du ² possède la propriété d’additivité. Cette notion est utile en


analyse de la variance et de régression.

Ainsi, si  1 et  2 sont des v.a indépendantes suivant la loi du Khi-deux avec k1


2 2

et k2 degrés de liberté, alors la somme    1   2 sera aussi distribuée


2 2 2

suivant la loi de Khi-deux avec k1 et k2 degrés de liberté.


107
Exercice 2

Soient deux variables aléatoires indépendantes,  1 avec 6 degrés de liberté et


2

 22 avec 8 degrés de liberté. Evaluer la probabilité que 12   22 soit supérieure


à 21.10.

Solution

Par la propriété d’additivité, nous savons que    1   2 est distribuée


2 2 2

suivant la loi du Khi-deux avec 6 + 9 = 14 degrés de liberté.


Nous voulons évaluer P (²  21.10) et  142 ,  21.10 . Dans la table, pour k = 14,
on obtient p = 0.10. Donc : P(²  21.10) = 0.10

P.S. En inférence statistique, nous aurons plutôt à déterminer le ²


correspondant { un k et un α donnés.

Exercice 3

Trouver la valeur de la médiane pour une distribution en ² correspondant à :


a) 9 degrés de liberté
b) 28 degré de liberté
c) 40 degré de liberté

Solution

La médiane correspond au 50ième centile. D’après la table de ² dans la colonne


intitulée  02,50 , on trouve la médiane.
a) 8.34
b) 27.3
c) 39.3

3.3.3. La distribution t de student

Soient Z N(0,1) et deux variables aléatoires indépendantes. On


appelle variable aléatoire de student de paramètre k, une v.a définie comme le
rapport d’une v.a normale réduire { la racine carrée d’une v.a Khi-deux de
paramètre k divisé par son paramètre k ; les variables en cause étant
indépendantes.
Z

 k2
k
Cette loi fut découverte par l’étudiant W.S. Gosset au moment où il était à
l’emploi dans une brasserie irlandaise. La brasserie s’opposant { la publication
de cette recherche par Gosset, il décida donc de publier sous le nom de plume
108
« Student » ; d’où le nom de « loi de student ». La loi de student ne dépend que
d’un seul paramètre, { savoir le nombre de degrés de liberté.

Pour des valeurs différentes de k, nous obtenons des distributions différentes.


La courbe est symétrique par rapport { l’origine et la forme de la courbe varie
avec le nombre de degrés de liberté. A mesure que k augmente, la loi de
student tend vers la loi normale. Le cas limite où k  est effectivement une
loi normale.

Table de t de student

La table que nous avons utilisé pour évaluer les probabilités lorsque la v.a suit la
loi de student nous donne la probabilité que t soit supérieur à une valeur
spécifiée tk,α ; soit :
P(tk  x) = α où x = tk,α est la valeur tk,α donnée dans la table. D’autres ables
donnent P(tk≤x)=p

0 ti t

La table de la distribution t de student est symétrique par rapport { l’origine,


mais elle est plus aplatie que celle de la distribution normale. Cette distribution
est donc platokurtique.

Exemple

Pour t20 ; 0.99 = 2.53, cela signifie que P(t20  2.53) = 0.99
Donc t20 ;0.01 = 2.53 signifie que P(t20≥2.53)=0.01

Souvent, les tables ne donnent pas toutes les possibilités et sont parfois
muettes. Pour ce fait, on applique le principe de symétrie :
tk,p = -tk,α

Exemple

T15,0.95= -t15,0.95
= -1.75

Exercice 1

Soit une v.a continue distribuée suivant la loi de student avec 12 degrés de
liberté. Déterminer, { l’aide de la table, P(t  2.68).

Solution

On cherche donc la valeur de p telle que t12,α = 2.68. On trouve α = 0.01.


Donc, P(t≥2.68) = 0.01
109
Exercice 2

Pour la distribution de student avec 15 degrés de liberté, quelle est la valeur de


t1 telle que :
a) l’aire { droite de t1 soit égale à 0.01
b) l’aire { gauche de t1 soit égale à 0.95
c) l’aire { droite de t1 soit égale à 0.10
d) l’aire composée de l’aire { droite de t1 et de l’aire { gauche de -t1 soit
égale à 0.01
e) l’aire comprise entre -t1 et t1 soit égale à 0.95.

Solution

a) P (t  t1) = 0.01

 t1 = 2.60

b) P(t  t1) = 0.95


 t1 = 1.75

c) P(t  t1) = 0.10

 t1 = 1.34

d) P(t  t1) = 0.005

t1 = 2.95

e) P(-t1  t  t1) = 0.95


 P(t  t1) = 0.025

 t1 = 2.13

3.3.4. Distribution F de Fisher

Une distribution très importante en analyse de variance et en analyse de


régression est la distribution F de Fisher.

Soient  1 et  2 deux variables aléatoires indépendantes suivant toutes


2 2

deux une loi du Khi-deux avec respectivement k1 et k2 degrés de liberté ; alors la


quantité :
12
k1
F
 22
k2
est aussi une v.a qui suit la distribution de Fisher avec k1 et k2 degrés de liberté.
Cette loi de probabilité dépend donc des deux paramètres k1 et k2 ;
respectivement degré de liberté du numérateur et du dénominateur.
110
De plus :
k2
E(F ) 
k2  2
avec k2  2

k 22 (2k 2  2k1  4)
Var ( F ) 
k12 (k 2  2) 2 (k 2  4)

Table de Fisher

La probabilité que la quantité F soit inférieure { une valeur donnée s’écrit :


P(F  Fα ;k1;k2) = α où α représente le seuil de signification.

Nous lirons cette probabilité { l’aide de la table de Fisher.

P α

0 Fi F

Exercice 1

Soit une v.a distribuée selon la loi de Fisher avec k1 = 20 et k2 = 5 degrés de


liberté. Evaluer P(F  4.56).

Solution

P(F  4.56) = 1 – P(F  4.56)

On doit trouver dans la table la valeur de α telle que Fα ;20 ;5 = 4.56. On trouve
cette valeur dans la table où α = 0.05.

D’où P(F  4.56) = 0.05

Exercice 2

Déterminer la valeur de F correspondant { α = 0.05 si k1 :=30 et k2 = 8.

Solution

P(F  F0.05 ; 30.8) = 0.05


 F0.05 ; 30 ;8 = 3.08

Probabilité complémentaire de F de Fisher


111
Certaines tables de statistiques présentent la table des probabilités de Fisher
pour des valeurs de α et d’autres, pour 1-α. Ainsi, si la table qu’on utilise donne
les probabilités de F pour 1-α, { l’aide d’une simple transformation, on peut
calculer les probabilités pour p. Nous aurons donc :
1 1
F1 p;k 2;k1  et F ;k1;k 2 
F p;k1;k 2 F1 ;k 2;k1

Exercice 3

Déterminer le F correspondant aux valeurs suivantes :


α = 0.05, k1 = 10 et k2 = 6.

Solution

Puisque nous avons directement cette table, nous allons utiliser la formule ci-
dessus en utilisant la table de F.
Ainsi F0.05 ; 10 ;6 = 4.06

Exercice 4

Déterminer le F correspondant aux valeurs suivantes :


p = 0.95, k1 = 6 et k2 = 10.

Solution

Puisque nous n’avons pas directement cette table, nous allons utiliser la
transformation ci-dessus en utilisant la table de F
1 1
Ainsi F0.95;6;10    0.246
F0.05;10;6 4.06

3.3.5. Distribution du Quotient de deux variances

Nous allons maintenant utiliser la distribution de Fisher pour obtenir la


distribution du quotient de deux variances. Considérons la situation suivante ;
de deux populations normales de variances et respectivement. Nous
prélevons deux échantillons aléatoires indépendants de taille n 1 et n2
respectivement :

Nous savons que la quantité :


(n1  1) S12 suit la loi du ² avec (n -1) degrés de liberté ;
1
12
(n2  1) S 22
et suit la loi de ² avec (n2-1) degrés de liberté.
 22
112
Par conséquent, le rapport :
(n1  1) S12
 12 S12
(n1  1)  12
F 
(n 2  1) S 22 S 22
 22  22
(n 2  1)
est distribué suivant la loi de Fisher avec (n1-1) et (n2-1) degrés de liberté.

Sous l’hypothèse que  1   2 (les deux populations ont même variance) ; le


2 2

rapport devient :

 12
F 
 22

Nous utilisons ce rapport pour éprouver l’hypothèse de l’égalité de deux


variances lors des tests statistiques.

3.3.6. Distribution uniforme

Une distribution uniforme est une distribution telle que f(x) est constante
dans un intervalle [a,b] et 0 partout ailleurs. En d’autres termes, lorsque la
probabilité est proportionnelle { la longueur de l’intervalle, la variable aléatoire
est definie de façon uniforme avec comme densité de probabilité :
{

Avec k, une constante dont la valeur est .

Lors que x est uniformément distribué dans l’intervalle a≤x≤b, alors :


et .

Exercice : la longueur des cheveux des élèves du Mont Amba est


uniformément distribuée entre 4cm et 24 cm. Trouver la probabilité que MILCA,
une élève choisie au hasard, ait les cheveux d’une longueur de 19cm { un
centimètre près. Quelle est la probabilité que celle-ci soit comprise entre 20 et
24 cm.

Solution

Soit x= v.a "longueur des cheveux des élèves du Mont Amba".


Puis que la variable aléatoire X peut prendre n’importe quelle valeur dans
l’intervalle [4,24], X est une variable aléatoire continue et non discrète.
Comme la probabilité que la longueur de cheveux appartienne à un intervalle
compris entre 4cm et 24cm est la même que la probabilité que la longueur de
cheveux appartienne à un autre intervalle compris entre 4 et 24 cm, on dit que
la variable aléatoire X suit une distribution uniforme. La fonction de densité de
probabilité correspond à :
113

{
avec

La probabilité qu’on cherche correspond {


a) P(18,5<X<19,5)=∫

=>* +

b) P(20≤x≤24)=∫

=>* +

3.3.7. Distribution exponentielle

La loi exponentielle peut être utilisée pour décrire des variables aléatoires
telles que le temps entre les arrivées à une station service, le temps nécessaire
pour charger un camion, la distance entre les défauts majeurs sur une route,
etc. La fonction de densité exponentielle s’écrit :
pour
avec = moyenne.
Comme exemple de la loi exponentielle, supposons que le temps de
chargement d’un camion sur les docks suive une telle distribution. Si le temps
moyen de chargement d’un camion est de 15 minutes ( =15), la fonction de
densité appropriée s’écrit :

La figure 3.3 représente cette fonction de densité.

Calcul des probabilités d’une loi exponentielle

Dans les exemples sur les files d’attente, la distribution exponentielle est
souvent utilisée pour le temps de service.

Comme pour toute loi continue, l’aire sous la courbe dans un intervalle
donné fourni la probabilité que la variable aléatoire prenne une valeur
appartenant { cet intervalle. Dans l’exemple des docks, la probabilité qu’un
camion soit chargé en au plus 6 minutes (X≤6) est définie par l’aire sous la
courbe, représentée par la figure 3.3 comprise entre X=0 et X=6. De même, la
probabilité qu’un camion soit chargé en au plus 18 minutes (X≤18) et définie par
l’aire sous la courbe compris entre X=0 et X=18. Notez aussi que la probabilité
que le temps de chargement du camion soit compris entre 6 et 18 minutes
(6≤X≤18) est définie par l’aire sous la courbe comprise entre X = 6 et X = 18.
114
Figure 3.3 Loi exponentielle pour l’exemple des docks de Schips.

f(x)

0,07 

0,05 

0,03 

0,01 

0 5 15 25 35 45 X
Temps de chargement

Pour calculer les probabilités exponentielles comme celles décrites ci-dessus,


on utilise la formule suivante. Elle fournit la probabilité cumulée d’obtenir une
valeur inférieure ou égale à une valeur donnée de la variable aléatoire
exponentielle, notée x0.
P(X≤x0)=

Pour l’exemple des docks, x=temps de chargement et λ=15, ce qui implique :


P(X≤x0)=

Par conséquent, la probabilité que le temps de chargement d’un camion


prenne, au plus, 6 minutes est égale à :
P(X≤6)= =0,3297

La figure 3.4. représente l’aire ou la probabilité d’un chargement effectué en 6


minutes maximum.

La probabilité de charger un camion en au plus 18 minutes est égale à :


P(X≤18)= =0,6988

Ainsi, la probabilité que le temps de chargement d’un camion soit compris


entre 6 et 18 minutes est également à 0,3691 (0,6988-0.3297=0.3691). Les
probabilités pour d’autres intervalles peuvent être calculées de la même façon.

Dans l’exemple précédent, le temps moyen de chargement d’un camion est de


15 minutes. Une propriété de la loi exponentielle implique que la moyenne et
l’écart type de la distribution sont égaux. Ainsi, l’écart type du temps de
chargement d’un camion est σ=15 minutes. La variance est égale σ2=(15)2=225.
115
Figure 3.4. Probabilité que le temps soit inférieur ou égal 6 minutes

f(x)

0,07

0,06  P(x≤6)=0,3297

0,05 
0,04 
0,03 
0,02 
0,01 
X
0 5 10 15 20 25 30 35 40 45

Temps de chargement
116
117

Chapitre 4. Echantillonnage
Chapitre Quatrième

chantillonage

4.1. Théorie de l’échantillon ou théorie du sondage


La théorie de l’échantillonnage ou théorie de sondage est l’étude des
relations existant entre une population et des échantillons prélevés ou tirés de
cette population. Elle est utile pour l’estimation des quantités inconnues de la
population (comme la moyenne, la variance,…) appelées "paramètres de la
population" ou brièvement "paramètres", à partir des quantités
correspondantes connues de l’échantillon (moyenne, variance,…) appelées
souvent "statistiques de l’échantillon" ou brièvement une "statistique".

Elle est également utile dans la prise de décision qu’implique l’utilisation


des tests d’hypothèses. De ce fait, l’apport majeur de la statistique inférentielle
réside dans la probabilité de faire des estimations et des tests d’hypothèses sur
les caractéristiques d’une population ; à partir des données collectées
uniquement auprès d’une petite partie du groupe concerné, appelé
"échantillon".

4.2. Inférence et échantillonnage


Lorsqu’on veut prendre une décision ou entreprendre une action en
rapport avec une population donnée, il faut connaître le mieux possible cette
population. Idéalement, on devrait effectuer un recensement, càd recueillir les
informations faisant l’objet d’études auprès de tous les individus de la
population et à partir de ces informations, faire une étude statistique.
Cependant, d’un point de vue pratique, il est rarement possible d’effectuer un
recensement pour l’une ou plusieurs de raisons suivantes :
- la population peut être trop grande. Par exemple, si la population
concernée est l’ensemble des citoyens de Kinshasa ;
- le recensement entraîne des coûts trop élevés ;
- le recensement est trop long à effectuer ;
- le recensement s’avère destructif. Par exemple, si on veut vérifier la
durée de vie d’ampoules électriques, il est bien sûr impensable de
vérifier toutes les ampoules.
- la population peut être inaccessible, par exemple, si la population est
l’ensemble de cobra congolais.
118
Les statisticiens ont développé des méthodes qui permettent d’obtenir
des informations concernant cette population sans avoir à faire le
recensement.
L’ensemble de ces méthodes constitue une partie importante des
statistiques qu’on appelle «inférence statistique ». Celle-ci consiste à étudier
une partie de la population et { tirer des conclusions qu’on essaie de
généraliser à la population entière. On peut résumer la procédure de l’inférence
statistique en trois étapes :
- choisir un échantillon représentatif de la population ;
- étudier les variables statistiques dans l’échantillon prélevé ;
- tirer des conclusions sur le comportement de ces variables statistiques
dans la population.

Les méthodes employées en inférence statistique se regroupent en deux


catégories :
- les estimations ;
- les tests d’hypothèses.

Supposons qu’on désire connaître la proportion des consommateurs


préférant une marque de bière. Il serait fastidieux et même impossible
d’interroger tous les consommateurs de bière. Une solution est de recenser
quelques personnes et de considérer que la proportion dans cet "échantillon"
serait une bonne estimation de la proportion dans la population des
consommateurs de bière.
On a l{ un cas typique de l’inférence statistique (induction statistique). Dans
l’exemple, on infère les caractéristiques de consommations de tous les
amateurs de bières dans une communauté donnée au départ des
caractéristiques de consommation de quelques centaines d’entre eux.

La démarche de l’inférence recèle cependant une incertitude. En effet, les


caractéristiques de l’échantillon peuvent être différentes de celle de la
population. On peut tout au plus espérer que les caractéristiques estimées
seront proches des caractéristiques réelles si l’échantillonnage est
adéquatement effectué (c’est-à-dire l’échantillon est représentatif).
Autrement dit, dans notre exemple, on estimera la proportion de la population
(inconnue) { partir de la proportion de l’échantillon calculé comme suit :
̅ ± une petite erreur.
Où et ̅ sont respectivement les proportions réelles de la population et
estimée (de l’échantillon).

On doit cependant s’interroger sur la nature de cette erreur et sur la


validité de l’affirmation contenue dans l’expression ci-dessus.
On verra ultérieurement que la nature de l’erreur peut-être spécifiée, si
l’échantillon est aléatoire et de grande taille.

Outre l’estimation, l’induction statistique permet également de tester des


hypothèses. Par exemple, si un spécialiste de marketing soutient que plus de
119
2/3 des consommateurs au Congo préfèrent la marque de bière PRIMUS, c’est-
à-dire π>0,66. On rejetterait cette hypothèse sur la base de l’intervalle estimé
avec l’équation ci-dessus.
L’estimation d’intervalle de confiance et le test d’hypothèses sont deux
des thèmes importants du cours de statistique inférentielle.

4.3. Distribution d’échantillonnage


Considérons une population de taille N sur laquelle on étudie une variable
statistique quantitative X. Pour décrire une population, on a définie certaines
caractéristiques intrinsèques telles que la moyenne, la variance, une
proportion, etc. Ces valeurs numériques décrivant une population s’appellent
« des paramètres » de la population. On les note généralement par des lettres
grecques : , ², , …

Le problème fondamental de l’étude des statistiques consiste { trouver


les valeurs de ces paramètres. Comme il est généralement impossible
d’observer tous les individus d’une population pour calculer un paramètre, on
choisit dans cette population un échantillon de taille n.

Pour décrire un échantillon, on utilise les mêmes caractéristiques, telles la


moyenne, la variance, une proportion,… Une valeur numérique décrivant une
caractéristique d’un échantillon s’appelle "une statistique". Même si une
statistique, par exemple la moyenne d’un échantillon, se calcule de la même
manière que dans le cas d’une population, on utilise un symbole différent pour
la noter et ce, pour bien montrer qu’elle ne s’adresse pas au même ensemble.
Voici un tableau indiquant les notations des principaux paramètres et des
statistiques correspondantes.
Paramètre Statistique
(population) (échantillon)
Nombre d’éléments N n
Moyenne μ ̅
Ecart-type δ S
Variance δ2 S2
Proportion (fréquence relative ) π

Exercice 1.

Supposons une population formée de cinq individus A, B, C, D et E ; et


supposons qu’on s’intéresse { la variable statistique S représentant le nombre
de voitures que possède des individus.
Individu Nombre de voiture (X)
A 2
B 1
C 0
D 3
E 4
120
a) Ecrire tous les échantillons de talle deux qui peuvent être extraits par
tirage sans répétition de la population.
b) Ecrire tous les échantillons de taille deux qui peuvent être extraits par
tirage avec remise de la population.
c) Calculer la moyenne et l’écart-type de la population.
d) Calculer la moyenne et l’écart-type de l’échantillon

Solution

a) Quand il s’agit de l’échantillonnage sans remise, le nombre


d’échantillon s’obtient par la formule :
Nombre d’échantillons = où n=taille de l’échantillon.

Ainsi, pour notre exercice ; le nombre d’échantillon est de =10 échantillons.


Ces échantillons sont :

Echantillon x Echantillon x
2-1 1.5 1-3 2
2-0 1 1-4 2.5
2-3 2.5 0-3 1.5
2-4 3 0-4 2
1-0 0.5 3-4 3.5

b) Quand il s’agit du tirage avec remise, on a :


Le nombre d’échantillons, on a Nn, 52=25 échantillons.

Echantillon x Echantillon x Echantillon x Echantillon x


2-2 2 1-0 0.5 0-3 1.5 3-4 3.5
2-1 1.5 1-3 2 0-4 2 4-2 3
2-0 1 1-4 2.5 3-2 2.5 4-1 2.5
2-3 2.5 0-2 1 3-1 2 4-0 2
2-4 3 0-1 0.5 3-0 1.5 4-3 3.5
1-2 1.5 0-0 0 3-3 3 4-4 4
1-1 1


c)
∑ ∑
( )



d) 1°. ̅

̅

2°. ̅

̅
121

4.4. Distribution d’échantillonnage des moyennes

Soit une population de taille N sur laquelle on étudie une variable


statistique X de moyenne μ et de variance δ2 ; et soit X la variable aléatoire
représentant la distribution d’échantillonnage des moyennes d’un échantillon
de taille n. alors :
et si le tirage est non exhaustif.
et ( ) si le tirage est exhaustif.

NB : Si n≥30, la distribution d’échantillonnage des moyennes est


approximativement une distribution normale.
Si XN(μ, δ2), alors N( )
Pour notre exemple :
=2 et cas du tirage non exhaustif.
=2 et = 0.75 cas du tirage exhaustif.

Exemple 2.

Dans une classe de maternelle où il y a 25 enfants, on sait que le quotient


intellectuel moyen est de 110 avec une variance de 7. Si est la v.a
représentant le quotient intellectuel dans un échantillon de 10 enfants, trouver
E( et Var( ), si et seulement si :
a) Le tirage est exhaustif
b) Le tirage est non exhaustif.

Solution

a) = 110.
( )

b) = 110.

Remarque

Si XN( , δ2), alors

̅ ( ) si le tirage est non exhaustif, et

̅ ( ( )) si le tirage est exhaustif.

Exercice 3

La taille des 72 élèves d’une école de Kisangani est une v.a obéissant { une loi
normale des moyenne 160 cm et d’écart-type 10cm. Si on prélève sans remise
122
un échantillon de 10 élèves de l’école, quelle est la probabilité que la taille
moyenne dans cet échantillon soit supérieure à 170cm.

Solution

On note par x la variable aléatoire représentant la taille des élèves de


cette école de Kisangani. On a XN(160 ;100).
On a δ=10, δ2=100, N=72, μ=160 et n=10.
Soit la v.a représentant la taille des élèves dans un échantillon de taille n=10
alors comme le tirage est exhaustif, on a :
̅ ( ( ))
donc ̅ =160 et ̅ =2.9551

on cherche donc P( = p(Z>3.38)


=0.5-p(0<Z<3.38)
=0.5-0.4996
=0.0004

Exercice 4

Un manufacturier d’appareils électriques fabrique des grille-pains dont la durée


de vie moyenne est de 150 mois avec un écart-type de 12 mois. Trouver la
probabilité qu’un échantillon de 100 grille-pains ait une durée de vie moyenne
de plus de 144 mois.

Solution

Soit X une v.a représentant la durée de vie de grille-pain. On est dans une
situation où on peut considérer que la population a une taille quasi-infinie ;
donc le prélèvement de l’échantillon se fait avec remise.

On a μ=150 et δ=12 et n=100

̅ et ̅ √
N(150 ;1.44)

On cherche P( >144) =P(Z>-5)


=0.5+P(0<Z≤5)
=1

NB : Il est donc pratiquement certain que la durée de vie moyenne des grille-
pains dans un échantillon de taille 100 sera supérieur à 144 mois. Il ne faut
pas confondre avec la probabilité que la durée de vie d’un grille-pain soit
supérieur à 144 mois ; soit p(X>144). Dans ce contexte, on ne peut évaluer
cette dernière probabilité puis que la distribution de probabilité de X
n’est pas connue.
123
Exercice 5

Le PDG de l’imprimerie GALIMAGE fait une étude sur le revenu annuel de ses
200 employés. Il sait que le revenu annuel moyen est de 24000 Francs avec un
écart-type de 4200 Francs.
S’il prélève un échantillon de 50 employés, quelle est la probabilité que le
salaire moyen dans cet échantillon soit entre 23500 et 24 500 Francs.

Solution

soit X = salaire annuel des employés de l’imprimerie GALIMAGE. On a N=200


μ=24000, δ=4200 et n =50.

̅ √

On cherche p(23500< <24500) = P(-0.97<Z<0.97)


= 2(0.3340)
= 0.6680

Le PDG a donc environ 2/3 de chances que la moyenne de l’échantillon s’éloigne


de moins de 500F de la moyenne.

4.4. Distribution d’échantillonnage des fréquences ou des


proportions

Soit une population de taille N dans laquelle on retrouve une proportion


π d’individus ayant une certaine caractéristique. Si est la v.a représentant la
proportion des individus dans un échantillon de taille n ayant la caractéristique
étudiée, alors :

et si le tirage est non exhaustif


et ( ) si le tirage est exhaustif

NB :
- Si n≥ 30, nπ≥5 et n(1-π)≥5, la distribution de l’échantillonnage des
proportions devient proche de la distribution normale.
- Si n<30, on remplace dans la formule n par n-1.
- Lorsque on approxime une v.a discrète par une v.a normale, la
correction de la continuité, dans ce cas, devient p±0.5/n.
- Si XN(μ,δ2), alors ( ̅ ̅ ).
124
Exercice 1

Lors de dernières élections estudiantines, 42% des électeurs du comité EST ont
voté pour le Parti OUEST. Si on prélève avec remise un échantillon de 100
électeurs du comité EST, quelle est la probabilité que, dans cet échantillon, on
trouve plus de 40 et moins de 44% d’électeurs ayant voté pour le Parti OUEST.

Solution

Soit π la proportion des électeurs du comité EST ayant voté pour le Parti
OUEST : π=0.42.
On a n=100, nπ=42 et n(1-π)=58.

La distribution de l’échantillonnage est proche de la distribution normale. Si


représente la proportion des électeurs du comité EST ayant voté pour le parti
OUEST dans un échantillon de taille n=100, alors
̅

̅ et ̅ √

On cherche P(0.40< <0.44).


Comme obéit { une loi binomiale et qu’on l’approxime par une loi normale, il
faut tenir compte de la correction de continuité qui est P±0.5/100=P±0.005.

Ainsi P(0.40<P<0.44) ≈ P( ) ≤Z≤( )


= P(-0.30<Z<0.30)
= 2(0.1179)
= 0.2358

Exemple 2

Parmi 120 candidats à un poste de directeur de la compagnie BEAUJOLAIS, 72


sont catholiques. Si on prélève sans remise un échantillon de 36 candidats,
quelle est la probabilité que dans cet échantillon au mois 20 candidats soient
catholiques ?

Solution

Soit π la proportion des candidats catholiques.


π =0.60
on a n=36, nπ=21.6 et n=(1-π)=14.4
Soit une v.a représentant la proportion de candidats catholiques dans un
échantillon de taille n=36 alors :
125

̅ et ̅ √ √
On cherche : P( ≥ ) =P( ≥0.5556)
= P(Z )
= P(Z )
= P(Z>-0.85)
= 0.8023

Exercice 3

Chacune des personnes d’un groupe de 500 individus lance 120 fois une pièce
de monnaie parfaitement équilibrée. Combien de personne signaleront que :
a) Le nombre de faces qu’elles obtiennent se trouve compris entre 40 et
60% ?
b) 5/8 ou plus de leurs jets correspondent à des faces.

Solution

a) On cherche d’abord la probabilité pour que le nombre de face en 120


jets soit compris entre 48 (40% de 120) et 72 (60% de 120).
̅ √ √

On cherche P(48<X<72) ≈ P(47.5<Y<72.5)


= P(-2.28<Z<2.28)
= 2(0.4887)
= 0.9774

D’où le nombre de personnes qui signalerons que le nombre de face qu’elles


obtiennent se trouve entre 40 et 60% est de 0.9774-500)=489 personnes.

Autres méthodes

On cherche P(0.4≤P≤0.6) =( )
= P(-2.28<Z<2.28)
= 0.9774

b) et
P(P≥5/8)=P(P≥0.6250)=P(Z)>
=P(-2.28<Z<2.28)
=0.004
126
D’où, le nombre de personnes qui signaleront que 5/8 au plus de leurs jets
correspondent à des faces est :
0.004(500)=2 personnes.

Exercice 4

Dans un sac, il y a cinq boules A, B, C, D et E. Les boules B et D sont rouges. On


choisit au hasard et avec remise deux boules dans ce sac. Si on note par la v.a
représentant la proportion de boules rouges dans de tels échantillons, trouver :
a) Le nombre d’échantillons possibles
b) La distribution d’échantillonnage de
c) E(
d) Var (
e) Calculer la proportion π

Solution

a) Le nombre d’échantillons possibles est de 52=25 .


b) La distribution d’échantillonnage de est de :

f(
0.00 0.36
0.50 0.48
1.00 0.16
1.00

c) E( )=0.40
d) Var( )=0.12
e) Π=2/5=0.40

Exercice 5

Une population E est composée des éléments E={ }

a) Calculer la proportion π des chiffres impairs.


b) 1°. Ecrire tous les éléments de taille deux qui peuvent être extraits
par tirage non exhaustif de la population E ;
2°. Calculer pour chacun des échantillons précédents la proportion des
chiffres impairs ;
3°. Calculer la moyenne μF de la distribution d’échantillonnage F de
proportion f.
4°. Calculer l’écart-type δF de la distribution d’échantillonnage F de
proportion f.
c) 1°. Ecrire tous les échantillons de taille deux qui peuvent être extraits
par tirage exhaustif de la population E.
2°. Calculer pour chacun des échantillons précédents la proportion f des
chiffres impairs.
127
3°. Calculer la moyenne μF de la distribution d’échantiçllon F de
proportion
4°. Calculer l’écart-type δF de la distribution d’échantillonnage F de
proportion f.
Solution
a) π=1/4=0.25
b) 1°.

E 1 2 4 6
E
1 (1,1) (1,2) (1,4) (1,6)
2 (2,1) (2,2) (2,4) (2,6)
4 (4,1) (4,2) (4,4) (4,6)
6 (6,1) (6,2) (6,4) (6,6)

2°.
Echantillon ̅ Echantillon ̅ Echantillon ̅ Echantillon ̅
1-1 1 2-1 0.5 4-1 0.5 6-1 0.5
1-2 0.5 2-2 0 4-2 0 6-2 0
1-4 0.5 2-4 0 4-4 0 6-4 0
1-6 0.5 2-6 0 4-6 0 6-6 0

3°.

4°.
δF=0.306

c) 1°.

E 1 2 4 6
E
1 - (1,2) (1,4) (1,6
2 - - (2,4) (2,6)
4 - - - (4,6)
6 - - - -
2°.
Echantillon f Echantillon f
1–2 0.5 2–4 0
1–4 0.5 2–6 0
1–6 0.5 4–6 0
3°. F = 0.25
4°. ²F = 0.063
F = 0.251
128

4.6. Distribution d’échantillonnage d’une somme ou d’une


différence

Supposons que l’on ait deux populations. Pour chaque échantillon de


taille n1 tiré de la première population, calculons une statistique T1. Ceci fournit
une distribution d’échantillonnage de la statistique T1 dont la moyenne et
l’écart-type sont respectivement TI et TI. De la même façon, pour chaque
échantillon de taille n2 tiré de la seconde population, on calcule une statistique
T2. Ceci fournit une distribution d’échantillonnage pour la statistique T2 dont la
moyenne et l’écart-type sont respectivement T2 et T2. A partir de toutes les
combinaisons possibles de ces échantillons de deux populations, on peut
obtenir une distribution des différences T1-T2, qui est appelée la « distribution
d’échantillonnage de la différence de ces statistiques ».

La moyenne et l’écart-type de cette distribution, désigné respectivement


par T1-T2 et T1-S2 sont donnés par :
T1  T2  T1  T2

et T1  T2  2T1  2T 2 (1)

Si T1 et T2 sont les moyennes X 1 et X 2 des distributions d’échantillonnage de


moyenne, alors la distribution d’échantillonnage des différences des moyennes
pour des populations infinies de moyennes et d’écart-types respectifs 1, 1 et
2, 2 est donné par :
 X 1  X 2   X 1   X 2  1   2 (2)

12  22
et  X 1  X 2   X2 1   X2 2   si le tirage est non-exhaustif (ou avec remise)
n1 n2

 12  N1  n1   22  N 2  n2 
 X 1  X 2   X2 1   X2 2      si le tirage est exhaustif.
n1  N1  n  n2  N 2  1 

On obtient des résultats analogues pour des distributions d’échantillonnage de


différences de fréquences, à partir de deux populations binomiales dont les
paramètres sont respectivement 1, (1-1) et 2 (1-). Dans ce cas T1 et T2
correspondent aux distributions d’échantillon des proportions 1 et 2 et les
équations (1) deviennent :
 P1 P2   P1   P2   1   2 (3)

et  P1  P 2   P21   P22   1 (1   1 )   2 (1   2 ) si le tirage est non exhaustif


n1 n2

 1 (1   1 )  N1  n1   2 (1   2 )  N 2  n2 
 P1  P2   P21   P22       si le tirage est
n1  N1  1  n2  N2 1 
exhaustif.
129
Lorsqu’on considère la distribution d’échantillonnage des sommes de
statistiques, les équations (1) deviennent :
 S1  S 2   S1   S 2 (4)

et  S1  S 2   S21   S22

Ainsi, pour les équations (2), on aura :

X 1X 2
  X 1   X 2  1   2

et  X 1  X 2   X2 1   X2 2

Et, pour les équations (3), on aura :


 P1  P 2   P1   P 2   1   2

Et  P1  P 2   P21   P22

Si n1 et n2 sont grands ( 30), les distributions d’échantillonnage des sommes


(ou des différences) des moyennes ou des fréquences sont presque des lois
normales.
Si X1 et X2 suivent la loi normale ; alors X 1 et X 2 sont aussi des lois normales. Il
en est de même pour et .

Exercice 1

La mesure de deux distances donne respectivement 27.3 Cm et 15.6 Cm, avec


des écarts-types respectifs 0.16 Cm et 0.08 Cm.
Déterminer la moyenne et l’écart-type de :
a) la somme
b) la différence

Solution

Si l’on désigne les distances par D1 et D2, alors :

a) D1+D2 = D1 + D2 = 42.9 cm


²D1+D2 = ²D1 + ²D2 = 0.0324 Cm²
 D1+D2 = 0.18 Cm

b) D1-D2 = D1-D2 = 11.7 Cm


²D1-D2 = 0.18 Cm

Exercice 2

Les ampoules d’un fabriquant A ont une durée de vie moyenne de 1400 heures
avec un écart-type de 200 heures, et celle d’un fabriquant B ont une durée de
130
vie moyenne de 1200 heures avec un écart-type de 200 heures. Si l’on teste des
échantillons de 125 ampoules pour chaque marque, quelle est la probabilité que
la marque d’ampoule A ait une durée de vie moyenne qui soit d’au moins :
a) 160 heures supérieures { celle de la marque d’ampoules B
b) 250 heures supérieures à celle de la marque d’ampoules B

Solution

Soit respectivement X A et X B les v.a représentant les durées de vie moyenne


des échantillons A et B.
On a alors :

X AX B
 200 h

X AX B
 20 h
-2 0 Z
a) On cherche
160  200
P( X A  X B )  160)  P(Z  )
20
= P(Z  -2)
= 0.5 + P(0  Z  2)
= 0.9772

b) On cherche
250  200
P( X A  X B )  250)  P( Z  )
20
= P(Z  2.5)
= 0.5 – P(0  Z  2.5)
= 0.0062

0 2,5 Z

Exercice 3

A et B jouent tous deux à pile au face en jetant chacun 50 fois une pièce de
monnaie bien équilibrée. A gagne au jeu s’il réussit { avoir 5 faces ou davantage
de plus que B, sinon c’est B qui gagne. Déterminer les chances pour que A
gagne lors d’un jeu particulier.

Solution

Soit et les v.a représentant les proportions de faces des joueurs A et B


dans un échantillon de taille n1 = 50 et n2 = 50.

On a π1=0.5, π2=0.5,
131

 P  P   P   P  0.5  0.5  0
1 2 1 2

 P  P  0.10
1 2

  5  
On cherche P( ( P A  P B )  )  P( ( P A  P B )  0.1)
50
0.5
 P (Y  0.1  )
n
0.09  0
 P(Z  )
0.10
= P(Z  0.9)
= 0.1841 0 0,9 Z

4.7. La distribution de la variance empirique S²

Comme dans le cas de la moyenne X , la variance S² d’un échantillon est


aussi une variable aléatoire. Cette variance S² va varier d’échantillon en
échantillon.

Quelle est la distribution de probabilité correspondant à cette


statistique ?
La variance d’un échantillon est donnée par :
n
 ( xi  x)²
i 1
S 
2
n 1

Si on pose S c   ( xi  x) , alors (n-1)S² = Sc


2

Nous avons mentionné que, pour un échantillon de taille n tiré d’une


population normale de moyenne  et de variance ², la quantité
n

 (x
i 1
i  x )²

n 1
suit la loi du ² avec n degrés de liberté. A toute somme de carrés de variables
aléatoires est associé un nombre de degrés de liberté. Ainsi,
n
 ( xi   )²
i 1
a n degrés de liberté puisqu’elle consiste en n déviations indépendantes.
n
Par contre  (x
i 1
i  x)²
132
a seulement (n-1) degrés de liberté ; les données devant être utilisées d’abord
pour évaluer x , qui sert d’estimation { , il ne reste plus que n-1 déviations
indépendantes. En effet, à partir de x et des n-1 déviations indépendantes nous
pouvons reconstituer la nième déviation.
Ainsi, nous perdons un degré de liberté.
Pour s’assurer que (xi- x ) soit centrée réduite, comme l’exige un ², nous
devons la diviser par , alors

 (x
2
n  x1  x   x) 2
    2
i

i 1    2
n
Par contre  (x
i 1
i  x)²  (n  1) S ², donc

(n  1) S 2
2 
2
et cette quantité est distribuée suivant la loi du khi-deux avec (n-1) degrés de
liberté. On peut illustrer cela par une application de cette distribution.

Exercice

Soit S², la variance d’un échantillon aléatoire de taille n = 16, tiré d’une
population normale de variance ² = 20. Evaluer la probabilité suivante :
P(9.68  S²  33.33).

Solution

Pour évaluer cette probabilité, il faut d’abord transformer ces variances en ² à


(n  1) S 2
l’aide de  
2

2
(16  1)(9.68)
Ainsi, à S² = 9.68 correspond 12   7.26
20
(16.1)(33.33)
à S² = 33.33 correspond  22   25
20
Donc, P (9.68  S²  33.33)  P(7.26  ²  25)

La distribution de ² qui nous intéresse possède 15 degré de liberté.


De la table de Khi-deux, on a :
P(²  7.26) = 0.95
P(²  25) = 0.05
Donc, P(7.26  ²  25) = P(²  7.26) - P(²  25) = 0.95 - 0.05 = 0.90

Ainsi, P(9.68  S²  33.33) = 0.90


133

4.8. Détermination de la taille de l’échantillon

Si nous disons que la longueur d’une latte est comprise entre 4.5 Cm et
5.5 Cm pendant que sa vraie longueur est de 5 Cm, nous avons commis une
erreur de 0.5 cm. L’erreur peut être positive ou négative.
En général, nous pouvons écrire :    X  Z x  X
 
Sachant que  X  , on peut écrire :    x  Z c
n n
Puisque Zc peut prendre 2 valeurs, l’une négative, l’autre positive, nous
écrirons :

   X  Zc
n
En considérant l’erreur maximum que nous pouvons commettre (E), le second

terme de notre équation peut s’écrire E  Z c
n
En élevant cette dernière expression au carré et en résolvant pour n, nous
obtenons :
2
Z c2 2 Z  
n  c 
E2  E 
Si les données sont sous forme des proportions, la taille de l’échantillon
s’obtient par la formule :
Z c2 (1   )
n
E2

P.S. Il est toujours aisé de chercher la taille de l’échantillon en procédant par le


même raisonnement que ci-dessus.

Exercice 1

Les lampes à incandescences fabriquées par un manufacturier ont une durée de


vie moyenne de 1000 h avec un écart-type de 100h.
On considère que la durée de vie en heures est distribuée normalement.
Si on tire un échantillon de taille n = 25 de cette population, quelle est la
probabilité que la durée de vie moyenne dans cet échantillon soit :
a) entre 950 h et 1020 h
b) moins de 960 h
c) plus de 1000 h
d) entre 940 et 980 h

Solution

Les paramètres sont :  = 1000  = 100 n = 25


E ( X )    1000
134
 100
X    20
n 25

a) P(980  X  1020)  P(1  Z  1)  0.6826


b) P( X  960)  P( Z   2)  0.5  0.4772  0.0228
c) P( X 1000 )  P( Z  0)  0.5000
d) P(940  X  980)  P(3  Z  1)  0.4987  0.3413  0.1574

Exercice 2

Supposons que notre fabriquant ci-haut n’est pas satisfait de la précision de


son estimation de la moyenne avec la taille d’échantillon n = 25. Quelle est la
taille de l’échantillon qu’il devrait tirer de la population pour assurer avec une
probabilité de 0.95 que la moyenne de la durée de l’échantillon ne diffère pas
de la moyenne de la population par plus de 25 heures ?

Solution

Nous voulons évaluer la taille de l’échantillon nécessaire pour respecter


l’équation suivante :

P(  25  X    25)  0.95

̅ ̅
 ( )  ( )
̅ ̅

 100
Puisque  X   et  X   , on aura 0,95
n n

X  25 25 0,475 0,475


Z Z1  Z2 
 100 100
n n
Z2 Z1

Cherchons le Z correspondant pour une probabilité de 0.475.


De la table de la loi normale, on trouve Z = 1.96. Utilisant Z 1 ou Z2, nous
obtenons :
25
1.96 
100
n
1.96 n
  7.84  n
25 100
 n  7.84²  62
Ayant déjà 25 observations, un échantillon additionnel de (62 - 25) = 37 serait
suffisant pour obtenir la précision cherchée avec la probabilité spécifiée.
135
Nous remarquons que, pour augmenter la précision du résultat obtenu avec un
échantillon, il faut augmenter la taille de l’échantillon. Ceci est aussi
évidemment accompagné d’un coût additionnel.
En pratique, il s’agit de balancer le coût de l’échantillonnage avec la précision
désirée.

P.S. En utilisant la formule développée ci-haut, on trouve :


2
 1.96 * 100 
n   62
 25 

Exercice 3

Soit X est la variable aléatoire représentant la moyenne d’un échantillon


aléatoire de taille n tiré d’une population normale de moyenne  et de variance
² = 100. Déterminer n tel que :
a) P(  10  X    10)  0.954 ( Rép. n  4)
b) P(   5  X    5)  0.954 ( Rép. n  16)
c) P(  2  X    2)  0.954 ( Rép. n  100)
136
137

Chapitre 5 Estimation
Chapitre Cinquième

stimation

5.1. Estimateur

Une des principes utilisations de la méthode de l’échantillonnage


consiste { faire de l’estimation. On appelle théorie de l’estimation l’ensemble
des méthodes utilisées pour évaluer un paramètre d’une population { l’aide
d’une statistique calculée dans un échantillon extrait de cette population. Par
exemple, si on veut estimer le revenu moyen  des médecins congolais sans
avoir { faire un recensement qui s’avérerait sans doute pénible, long et
coûteux, la méthode statistique consiste à prélever un échantillon représentatif
de taille n, à calculer le revenu moyen ̅ dans cet échantillon et à utiliser cette
statistique ̅ soit une valeur proche de μ pour remplacer μ. Bien sûr, on
s’attend { ce que ̅ soit une valeur plus proche de μ. Pour s’assurer, il faut
étudier la distribution d’échantillonnage de la variable aléatoire . On dit que ̅
est une estimé de  et que est un estimateur de μ.

D’autres possibilités sont offertes pour faire une telle estimation : ainsi,
on pourrait utiliser la médiane de l’échantillon pour estimer le revenu des
ménages congolais. Il faudrait donc déterminer quelle estimation s’avère la
meilleure.

Posons le problème d’une manière plus générale en considérant un


paramètre inconnu  dans une population quelconque. Le symbole  peut
donc représenter , , 2,  ou tout autre paramètre. Pour estimer la valeur
de, on prélève dans la population un échantillon de taille n. Toute statistique
calculée dans l’échantillon et pouvant être utilisée pour approximer  s’appelle
un estimé de . Par exemple, ̅ est un estimé de , ̅ est un estimé de . La
variable aléatoire dont les réalisations sont les différents estimés retrouvés
dans les différents échantillons s’appelle un estimateur de et se note par ̂

(lire « théta chapeau »). Par exemple, X est un estimateur de  et P un
estimateur de .

En théorie de l’estimation. On utilise un estimateur si celui-ci rencontre certains


critères de qualité, { savoir qu’il soit sans bais, convergent et efficace.

- Un estimateur ̂ d’un paramètre inconnu  est sans biais si son


espérance est égale à , soit E ( ̂) = , c'est-à-dire si la moyenne de toutes les
estimations possibles est égale à la valeur réelle du paramètre inconnu.
138

La v.a X est un estimateur sans biais de , car E( X ) = . De même, P est un
estimateur sans biais de  car E( ) = . La variance calculée dans un échantillon,
( xi  x) 2
que l’on note s2 est s2 =
n
 est lit « sommation »

En utilisant la moyenne échantillonnale ̅ à la place de .

Cette statistique s 2 est une réalisation de la variable aléatoire S 2 ; avec


( xi  x)2
s2 
n
Cet estimateur S 2 est un estimateur biaisé de  2 En effet, E( S 2 ) = n  1  2
n
Ainsi, pour estimer sans biais la variance  2
. On utilise l’estimateur ( n ) S 2
n 1
∑ ̅ ∑ ̅
( ) ( )
∑ ̅
La valeur de cet estimation calculée dans un échantillon constitue un
estimé sans biais de la variance  2 . On note cet estimé par ̂ .

 (x i  x) 2
n
 
2
( )S2
n 1 n 1

- Un estimateur ̂ d’un paramètre inconnu  est convergent si la probabilité


qu’il diffère de  décroît { mesure que la taille de l’échantillon augmente.
Pour un estimateur sans biais ̂, si Var ( ̂ 0 lorsque n  , alors ̂ est
convergent. Ainsi, X est une estimateur convergent de  car Var( X ) =  ;
2

n

et si n  , alors Var( X ) 0. de même P est un estimateur convergent
  (I   ) 
de  car Var( P ) = 0 lorsque n 
et Var ( P )
n
- Un estimateur sans biais ̂ d’un paramètre inconnu  est efficace si la
variance de ̂ est inférieur à la variance de tout autre estimateur sans biais de
. Choisir un estimateur efficace c’est donc choisir le meilleur estimateur,
c'est-à-dire celui qui fournir des estimés les plus près possible de la valeur
réelle du paramètre.
Par exemple, la variable aléatoire X représentant les moyennes
échantillonnales est un estimateur efficace de  comparativement à la v.a
représentant les médianes échantillonnales.

Il existe des méthodes permettant de déterminer le meilleur estimateur


d’un paramètre, par exemple la méthode de maximum de vraisemblance ou la
méthode des moments. Ces méthodes seront étudiées en Econométrie.
139

5.2. Estimation ponctuelle et estimation par intervalle

La méthode de l’estimation se divise en deux parties : l’estimation


ponctuelle et l’estimation par intervalle.
Une estimation d’un paramètre de population, exprimé par une valeur, est
appelée une "estimation ponctuelle". Une estimation donnée en deux
nombres, entre lesquels peut se situer le paramètre de la population, est
appelée une "estimation par intervalle".

L’estimation ponctuelle permet d’évaluer un paramètre de la population


{ l’aide d’une seule statistique mesurée sur un échantillon tandis que
l’estimation par intervalle détermine un intervalle de confiance qui, avec une
certaine probabilité, contient la valeur vraie du paramètre.

L’estimation ponctuelle est simple { effectuer et commode puisqu’elle


fournit une valeur qui peut jouer le rôle du paramètre inconnu. Elle présente
cependant un inconvénient, celui de ne pas donner d’indication sur l’erreur
possible entre l’estimé et le paramètre.
L’estimation par intervalle indique la précision d’une estimation et est
préférable { l’estimation ponctuelle.

5.3. Intervalle de confiance des paramètres d’une population

Soit  et  la moyenne et l’écart-type de la distribution de la statistique


T T
S. Si la distribution de T est approximativement normale (ce qui est vraie si la
taille de l’échantillon n est supérieure à 30), on peut s’attendre { ce que la
statistique T varie dans les intervalles (T -T, T +T) ; (T- 2T , T +2T) ;(T -3T,
T +3T) (respectivement à 68.26% ; 95.45% et 99.74%)

De même, on peut avoir l’assurance de trouver s compris dans ces


intervalles. C’est pourquoi, on appelle ces intervalles « intervalles de confiance »
à 68.27% ; 95.45% et 99.74% de s. Les extrémités de ces intervalles sont souvent
appelées « limites de confiance » à 68.27% ; 95.45% et 99.73% respectivement.
Ainsi, T – 1.96 T et T+ 1.96T sont les limites (inférieure et supérieure) de
confiance à 95%.
Les pourcentages indiqués précédemment sont souvent appelle « seuils de
confiance » (ou niveaux de confiance). On les note par 1- . Si  = 5%, cela veut
dire qu’il y a 95% de chance que la vraie valeur de T se trouve dans l’intervalle
déterminé de cette façon. Le risque  mesure la probabilité de se tromper en
affirmant que T appartient { l’intervalle de confiance. On appelle  le seuil de
signification (ou niveaux de probabilité). Dans la pratique, un seuil de
signification de 0.05, 0.01 et 0.10 est habituel, bien que d’autres valeurs soient
aussi utilisées.
Les nombres 1.96 ; 2.58 ; etc. vus plus haut dans l’expression des limites
de confiance sont les « coefficients de confiance »
140

(On dit également valeurs critiques) et on les note Z a / 2 .


Dans le tableau ci-dessous, on retrouve les valeurs Zα/2 et Zα correspondent à
des seuils de confiances différents. Pour les seuils de confiance non
mentionnés dans le tableau, les valeurs de Z a / 2 correspondantes se déduisent
des tables de la loi normale.
Seuil de 99.74% 99% 98% 96% 95.45% 95% 90% 80% 68.26% 50%
confiance
Z a/2 3.00 2.58 2.33 2.05 2.00 1.96 1.645 1.28 1.00 0.6745

Za 2.78 2.33 2.05 1.75 1.60 1.645 1.28 0.84 0.475 0

5.4. Intervalle de confiance de la moyenne 

Selon la connaissance ou non de la variance  2 , selon la connaissance de


la distribution de X ou la taille de l’échantillon, on distingue 4 cas d’intervalles
de confiance pour.
1er cas :  2 connue et X N (pour tout n)
2ème cas : ² connue et n  30
3ème cas : ² inconnue et X N (avec n  30)
4ème cas : ² inconnue et n  30
On résume dans un tableau synthèse les 4 cas d’estimation par intervalle de la
moyenne  d’une population.

Cas Loi utilisée Intervalle de confiance


Echantillonnag Echantillonnage sans
e avec remise remise
² connue X u ² 2 N n
N (0;1) u  Z / 2
X N (pour 2
X
n u X  Z / 2 ( )
tout n)
n N 1
n
² connue et Approximation
n  30 X u
N (0;1)
2
n
² inconnue X u S² S² N  n
t k ,p u X  t / 2 u X  t / 2 ( )
et X N S² n 1 n 1 N 1
(avec n  30) n 1
² inconnue Approximation S² S² N  n
uX  Z / 2 u X  Z / 2
et n  30 X u n ( )
N(0;1) n N 1
S2
n
N.B :

1°/ tk,p signifie « suit la loi t de student avec k degré de liberté » ; k = n-1
141

2°/ ̂ ; S² étant la variance de l’échantillon et ̂ la variance non


biaisée de l’échantillon.
3°/ En général, si n  30, on peut supposer que S2 et ̂ sont pratiquement égaux
(voir 4ème cas).
4°/ Dans la plupart de cas, le tirage de la population se fait sans remise. Mais
lorsque la taille N de la population est grande et que la taille n de
l’échantillon est petite par rapport { N (on considère n petit si n  N/20) le
N n
facteur de correction ( ) devient voisin de 1. Dans ce cas, il n’y a pas de
N 1
différence entre le calcul de la variance dans le cas du tirage non exhaustif et
exhaustif. Dans ces circonstances, on peut négliger ce facteur de correction.
5°/ Lorsque n est inférieur { 30 et que la population n’est pas normalement
distribuée, on fait recours au théorème de TCHEBYCHEFF (voir section 5.7).

Exercices

Exercice 1.

A partir de la définition d’un estimateur sans biais, montrer que la moyenne


̅ d’un échantillon possède cette propriété.

Exercice 2

La durée de fonctionnement des montres SEIKO obéit à une loi normale


d’écart-type 0.75 ans. On prélève avec remise un échantillon de 36 montres et
on trouve une durée de fonctionnement moyenne de 4.5 ans. Construire un
intervalle de confiance de 95% pour estimer la durée de fonctionnement
moyenne des montres SEIKO.

Exercice 3

Un marchand de tapis a un stock de 200 carpettes. Pour estimer la grandeur


moyenne de ses carpettes, le gérant prélève sans remise un échantillon de 49
carpettes et il calcule une grandeur moyenne de 4.35m². En admettant que
l’écart-type de la population est 0.70m². Construire un intervalle de confiance
au niveau de confiance de 98% pour estimer la grandeur moyenne des
carpettes.

Exercice 4

On a tiré un échantillon exhaustif de 10000 ménages dans une région A


comportant au total environ 700000 ménages. Sur cet échantillon, on a
observé, pour un mois déterminé, une consommation moyenne des ménages
de 950$, avec un écart-type égale { 700$. Calculer l’intervalle de confiance se
rapportant { l’estimation de la consommation moyenne des ménages dans la
région. Le seuil de probabilité est 0.95.
142
Exercice 5

Un échantillon aléatoire de 50 notes de mathématiques sur un total de 200 a


donné une moyenne de 75 et un écart-type de 10.
a) Quelles sont les limites de confiance à 95% pour estimer la moyenne de 200
notes ?
b) Avec quel degré de confiance peut-on dire que la moyenne de 200 notes est
75±1 ?
Exercice 6
Le revenu annuel des 160 huissiers de Kinshasa est une v.a obéissant à une loi
normale. Pour estimer le revenu annuel des huissiers de Kinshasa, on a prélévé
sans remise un échantillon de 10 huissiers et on trouve, dans cet échantillon un
revenu annuel moyen de 42000F avec un écart-type échantillonnel S=4000F.
Construire un intervalle de confiance au niveau de confiance de 90% pour
estimer le revenu moyen des huissiers de Kinshasa.
Exercice 7
Dans une scierie, une machine est réglée pour couper des planches de bois.
Pour estimer la longueur moyenne de ces planches, on prélève un échantillon
de 120 planches et on trouve une longueur moyenne de 1.9 m avec un écart-
type échantillonnel S=0.16m. Construire un intervalle de confiance au niveau de
confiance de 95% pour estimer la longueur moyenne des planches coupées par
cette machine.
Solutions
Ex.1. On doit donc montrer que E( )=μ
Puisque

X 
 Xi ; alors
n

( ) (∑ ) ∑

Or E(Xi) = u
Alors = ∑
est donc un estimateur sans biais de μ.

Ex. 2. Δ² est connue et XN(u, δ²)


δ=0.75 n = 36 1-α=0.95

L’intervalle de confiance cherchée a la forme

√ √

On a donc [4.255 ; 4.745].


143
D’où μ [4.255 ; 4.745] au seuil de probabilité de 95%.

Ex.3 on a N=200 ; n = 49 =4.365 ; δ=0.70


δ² est connue et n ≥ 30

L’intervalle de confiance cherché a la forme

On a donc : [4.15 ; 4.55]

D’où μ [4.15; 4.55] au seuil de probabilité de 98%.

Ex.4. n=10000 ; N=70000 ;

δ² est inconnue et n≥30. L’intervalle de confiance cherché a la forme

Comme n ≥ 30 ; alors δ² ou ˆ x2 = S2

950±1.96√

On a donc [936.28 ; 963.72]


à un niveau de confiance de 95%.

Ex.5.
a) n = 50 N = 200 =75 10 1-α=0.95
δ² est inconnue et n≥30

L’intervalle de confiance cherché a la forme

√ n≥30 ̅

75±1.96√ ( )
On a donc [72.6 ; 77.4]

D’ μ [72.6 ; 77.4]

b) Les limites de confiances peuvent s’écrire :


144

75±Zα √ ( )

On a 23Zα = 1
Zα = 0.81
α = 0.209
α
1- α %

Ex.6. N=100 n=10 1-α tα = 1.82

X N(n<30)

L’ e de confiance a la forme :

[39630.06 ; 44369.94]

D’ μ [336630.06 ; 44369.94] à un niveau de confiance de 90%.

Ex.7. n = 120 1-α tα = 1.96

L’ :

Comme N est infinie, on considère que N est trop grand et


δ² = (0.16)²
On a donc 1.98±1.96(0.0146)
[1.951 ; 2.009]

D’ μ [ ] au seuil de confiance de 95%.

5.5. Intervalle de confiance d’une proportion π


La méthode utilisée pour construire l’intervalle de confiance d’une
proportion est semblable { celle utilisée dans le cas d’une moyenne. Mieux
encore, ici il n’y a pas lieu de distinguer plusieurs cas. D’une manière générale,
on remarque que dans le cas de l’estimation des proportions, il faut avoir de
très grands échantillons pour obtenir une bonne précision. Ainsi, nous n’aurons
145
qu’un seul cas où n≥30, nπ≥5 et n(1-π) ≥ 5. L’intervalle de confiance pour π est
donc :

[ √ √ ] avec

Si le tirage est avec remise ; et

[ √ ( ) √ ( )]

Si le tirage est sans remise

Exercices
Exercice 1

Le Président du FORUM ECONOMIQUE veut connaître la proportion des


membres qui lisent au moins trois livres par mois. Parmi les 600 membres du
club, il prélève sans remise un échantillon de 60 membres et il constate que 22
d’entre eux lisent au moins trois livres par mois.
Construire un intervalle de confiance au niveau de confiance de 90% pour
estimer la proportion des membres du club qui lisent au mois trois livres par
mois.

Exercice 2

Un échantillon de 100 votants choisis au hasard parmi tous les votants d’une
circonscription donnée a montrée que 55% d’entre eux étaient favorables { un
certain candidat. Déterminer les limites de confiance (a) à 95% ; (b) à 99,73% de
la proportion de tous les votants favorables à ce candidat.

Solution

Ex.1 N=600 n=60 p = 0.367 ̅ 1-α=0.90 Zα = 1.645


On a : π et n(1-π

L’intervalle de confiance a la forme :

√ ( )

√ ( )

[0.270 ; 0.464]
D’ π [ ] au seuil de confiance de 90%.
Exercice 2
146
a) n=100 =0.55 1-α=0.95 Zα = 1.96

L’intervalle de confiance a la forme :

√ ( )

N étant infinie ( )=1

On a donc :

[0.45 ; 0.65]

D’ π [ ] au seuil de confiance de 95%.

b) 1-α=0.9973 Zα = 3

On a donc

[0.40 ; 0.70]

D’ π [ ] au seuil de confiance de 99.73%.

5.6. Intervalle de confiance des différences et des sommes


L’élaboration d’un intervalle de confiance pour une différence des
moyennes (resp. de proportions) se fait de la même façon que pour une
moyenne (resp. une proportion).

Ainsi :
- L’intervalle de confiance de la différence de deux moyennes de
population normales indépendantes de variances connues où n1≥30,
n2≥30 est donnée par :

( ) √ Si le tirage est avec remise.

Si δ² est inconnue, avec n≥30, on remplace δ² par ̂ (ou par S²).


- Si les échantillons proviennent de populations normales indépendantes
de variances inconnues, mais supposées égales et n1  30, n2  30 ; on
aura :
147

̂ ̂ avec
( ) √ √

Où le est le nombre de degré de liberté.

Si en plus n1 = n2 , alors :

avec
( ) √
le degré de liberté
est

Si les variances inconnues sont supposées inégales (n1 = n2 30), le degré de
liberté est obtenu de la manière suivante :

̂ ̂

̂ ̂
⁄ ⁄

- L’intervalle de confiance de la différence de deux fréquences


théoriques est :
avec
( ) √ √

N.B. : Si le tirage est sans remise, on doit multiplier la variance par le facteur de
correction.
( )

Exercices

Exercice 1

Un échantillon de 150 lampes de qualité A a donné une durée de vie moyenne


de 140 heures et un écart-type de 120 heures. Un échantillon de 200 lampes de
qualité B a donné une durée de vie moyenne de 120 heures et un écart-type de
80 heures. Déterminer les limites de confiance.
a) à 95%
b) à 99%
de la différence des durées de vie moyenne des variétés A et B.

Exercice 2
148
Sur un échantillon de 400 adultes et 600 adolescents ayant regardé un certain
programme de télévision, 100 adultes et 300 adolescents l’ont apprécié.
Calculer les limites de confiance.
a) à 95%
b) à 99%
de la différence des fréquences des adultes et des adolescents qui ont
apprécié le programme.

Solutions

Ex.1. n1 = 150
n2 = 200
a) 1 - α = 0.5 Zα =1.96
L’intervalle cherché a la forme :

( ) √

Donc ( ) [ ] au seuil de confiance de 95%.

b) 1 - α = 0.99 Zα =2.58

On aura [170.8 ; 229.2]

D’ [ ] au de confiance de 99%

Ex.2. n1 = 400 ̅
n2 = 600 .

L’intervalle de confiance a la forme :

( ) √ √

a) 1 - α = 0.95 Zα =1.95

On a donc 0.25±0.08

D’ π1 – μ2 [ ] au de confiance de 99%

5.7. Inégalité de TCHEBYCHEFF et intervalle de confiance de la


moyenne

Lorsque la taille de l’échantillon est trop petite (n < 30) et que la


population n’est pas normalement distribuée, la construction de l’intervalle de
149
confiance ne pourra faire recours ni à la loi normale, ni la loi t de student. Dans
ce cas, le recours au théorème développé par le mathématicien russe
BIENAYME TCHEBYCHEFF devient indispensable. D’après ce théorème, la
probabilité pour que X s’écarte de la moyenne a une valeur inférieure ou égale
à k ne peut pas être inférieure à 1-1/k² ; où k ≥1.
En appliquant ce théorème dans la distribution d’échantillonnage des
moyennes, on a :

Lorsqu’on fait recours { l’inégalité de Tchebycheff pour construire un intervalle


de confiance, la procédure à suivre est :
- Poser 1-1/k² égale au seuil de confiance désiré
- Tirer la valeur de k
- Construire l’intervalle de confiance comme suit :
* √ √ + si δ² est connue

* √ √ + si δ² est inconnue

Exercice

Le salaire mensuel moyen de 10 employés de l’OFIDA est de 180000F avec un


écart-type échantillonnal de 14000F. Construire l’intervalle de confiance { 95%
pour estimer le salaire mensuel moyen des employés de l’OFIDA.

Solution

N=10 1-1/k²=0.095 k=4.47

n<30 et inconnue

180000±4.47√

D’ μ [ ] au seuil de confiance de 95%.


150

5.8. La distribution de Khi-deux et l’intervalle de confiance de la


variance et de l’écart-type

La distribution de Khi-deux n’est pas symétrique. De ce fait, l’intervalle de


confiance pour la variance ou l’écart-type fait appel à deux valeurs différentes
de 2. Il ne s’agira donc plus d’intervalle de confiance en terme de "plus-
ou-moins" comme dans le cas d’une distribution normale ou de t de
student. Connaissant la valeur de S2, l’intervalle de confiance sera de la
forme :

√ √ pour l’écart-type
 

 L
 L
pour la variance

Où dL = nombre de degré de liberté (n-1)


Ic1 = 1-α/2
Ic1 =α/2
α = seuil de signification.

Exercice 1

Le revenu moyen de 30 employés de l’UNIKIN est de 180FB avec un écart-type


échantillonnal de 14FB.
a) Construire l’intervalle de confiance { 95% pour estimer la variance de la
population en supposant que celle-ci est normalement distribuée.
b) Construire l’intervalle de confiance pour estimer l’écart-type.

Solution

n=30 = 180 S=14 1-α=0.95 dL=29 ic1=0.975 ic2=0.0275

a) L’intervalle de confiance a la forme

 

124.3220≤σ≤354.1433

b) L’intervalle de confiance de l’écart-type est :

√ √
11.15≤σ≤18.82
151
Exercice 2

Supposons que sur 16 essaies, la consommation en carburant d’une voiture


expérimentale montre un écart-type égal à 2.2 litres pour 100 km.
Construire un intervalle de confiance de l’écart-type pour avoir une indication
de la variabilité de la consommation de carburant de la voiture, au seuil de
signification α=0.01.

Solution

n=16 S=2.2 α=0.01 dL = 15 ic1=0.995 ic2=0.005


 
 

Conclusion : Avec un degré de confiance de 99%, la variabilité réelle de la


consommation est comprise entre 1.49 et 3.97 litres pour 100 km.
152
153

Chapitre 6. Tests d’hypothèses


Chapitre Sixième

ests d’hypothèse

6.1. La méthode d’un test d’hypothèses

La méthode scientifique utilisée par l’être humain pour établir une


connaissance quelconque peut se résumer en trois étapes :
1°/ Observation d’un fait ou d’un phénomène
2°/ Formulation d’une explication de ce fait ou de ce phénomène sous la forme
d’une hypothèse ou loi
3°/ Vérification de l’hypothèse au moyen d’une expérience quelconque ou d’un
test.

Supposons par exemple que l’on observe qu’un jeune homme qui joue
aux dés gagne presqu’{ tous les coups en pariant que la somme de deux dés
lancés sera 10. Le grand nombre de victoires qu’il remporte étonne et cela
amène { formuler l’hypothèse que les dés sont truqués. Pour confirmer ou
infirmer cette hypothèse, on confisque les deux dés et on vérifie l’hypothèse en
effectuant l’expérience consistant { lancer les deux dés une centaine de fois.
Puisque la probabilité d’obtenir une somme égale { 10 avec deux dés honnêtes
est 3/36, l’espérance mathématique du nombre 10 obtenu en 100 lancers est
8,33. Si on obtient 8 ou 10 ou 12 fois la somme 10, l’hypothèse affirmant que les
dés sont truqués devrait être rejetée. Si par contre on obtient 78 fois la somme
10, alors il serait certes justifié d’accuser le jeune homme d’utiliser des dés
truqués. Ce qu’on fait lorsque, par une expérience quelconque, on arrive à
confirmer ou { infirmer une hypothèse s’appelle un « test d’hypothèse ».

Cette forme de vérification constitue la deuxième grande catégorie de


problèmes abordés en inférence statistique.

On appelle hypothèse statistique un énoncé, une affirmation concernant


une ou plusieurs populations. Cette hypothèse sera dite « paramétrique » s’il
s’agit d’un énoncé quantitatif concernant un paramètre de la ou des
populations. Autrement, elle est dite « non paramétrique ».

Dans l’ensemble déj{ cité, l’hypothèse statistique qu’on cherchait {


vérifier était non paramétrique. Elle était de la forme « les dés sont truqués ».
On aurait pu, par exemple, formuler une hypothèse statistique sous forme
paramétrique en disant : « la proportion de succès du jeune homme est
supérieure à 1/2 ».
154

6.2. Formulation des hypothèses à confronter

Dans tout test d’hypothèse, on établit deux hypothèses mutuellement


exclusives qui sont en quelque sorte, confrontées. Une et une seule d’entre
elles sera acceptée.

D’une part, il y a l’hypothèse nulle que l’on note H0. C’est l’hypothèse qui
sera rejetée uniquement s’il y a suffisamment d’évidence contre elle. C’est
l’hypothèse qui n’amène pas de changement, qui n’amène pas d’action {
entreprendre. C’est l’hypothèse du statu quo. C’est l’hypothèse prudente.
D’autre part, il y l’hypothèse alternative ou contre-hypothèse que l’on note H1.
C’est l’hypothèse qui sera accepté si H0 est rejetée. C’est l’hypothèse qui amène
un changement, qui implique généralement une action à entreprendre.

Soit θ un paramètre quelconque et soit H0 une hypothèse nulle ainsi


formulée : H0 : « θ=θ0 » où θ est une valeur fixe du paramètre. L’hypothèse
alternative peut prendre l’une ou l’autre des formes suivantes :
a) H1 : θ≠θ0 (alors le test est dit bilatéral).
b) H1 : θθ0 (alors le test est dit unilatéral à gauche).
c) H1 : θθ0 (alors le test est dit unilatéral à droite).

6.3. Risques d’erreur

Etant donné que notre décision est basée sur une information partielle,
un échantillon, il est facile de concevoir qu’elle comporte un risque d’erreur.
Ceci nous amène { définir deux types d’erreurs possibles lorsque nous portons
un jugement sur l’hypothèse H0.
Ces erreurs sont :
- Erreur de première espèce (α)
- Erreur de deuxième espèce (β)

6.3.1. Erreur de première espèce (α)

L’erreur de première espèce est commise lorsque nous rejetons H0 alors


qu’en réalité cette hypothèse est vraie. Cette erreur est quantifiable en
probabilité et nous l’identifions par α.

Cette probabilité est aussi le seuil de signification utilisé lors de


l’élaboration d’un test statistique. Ce seuil de signification est ordinairement
spécifié avant même que l’évidence statistique soit obtenue. Puisque l’analyste
peut spécifier au préalable le risque α, il peut possiblement le rendre aussi petit
qu’il veut et minimiser ainsi le risque de rejeter H0 lorsqu’elle est vraie. Par
contre, cette attitude comporte un autre risque d’erreur qu’il doit envisager,
soit l’erreur de deuxième espèce.
155
6.3.2. Erreur de deuxième espèce (ß)

En éprouvant une hypothèse nulle, il existe aussi le risque d’accepter une


hypothèse H0 qui est fausse ; c’est l’erreur de deuxième espèce que nous
identifions par β. Les risques β est la probabilité d’accepter l’hypothèse nulle
lorsqu’en réalité elle est fausse. Pour évaluer ce risque, il faut donner, dans
l’hypothèse H1, une ou plusieurs valeurs au paramètre que l’on suppose vraies.

Ainsi, les résultats d’une décision peuvent se présenter de la façon suivante :

Situations
H0 vraie H1 vraie
Décisions Accepter H0 Bonne décision Erreur de deuxième
espèce β
Rejeter H0 Erreur de première Bonne décision
espèce α

6.3.3. Réduction de α et β

En diminuant le risque d’erreur de première espèce, on augmente


simultanément le risque d’erreur de deuxième espèce. Par analogie avec la
justice, supposons que H0 soit l’hypothèse : « l’accusé est innocent ». L’erreur de
première espèce sera alors de "condamner un innocent".

L’alternative { H0 donc H1 est l’hypothèse : « l’accusé est coupable ».


L’erreur de type Il sera de « libérer le coupable ».

La solution serait donc de diminuer simultanément α et β, en améliorant


la détection des crimes, autrement dit en augmentant l’information. En
Economie, augmenter l’information consistera { augmenter la taille de
l’échantillon. Lorsque n augmente, on voit que diminue. C’est-à-dire que la
dispersion de la distribution diminue ; ce qui diminue simultanément α et β.

6.4. Les étapes d’un test d’hypothèse

On peut décomposer la procédure à suivre à 7 étapes :


ère
1 étape : identifier la variable concernée
2ème étape : Formuler les hypothèses à confronter
3ème étape : Etablir le niveau de signification
4ème étape : Déterminer la distribution de l’estimateur
5ème étape : Etablir la règle de décision
6ème étape : Effectuer les calculs requis
7ème étapes : prendre la décision
156

6.5. Tests d’hypothèse sur la moyenne

Lorsqu’un test porte sur la moyenne de la population, c’es-à-dire


l’hypothèse nulle a la forme μ = μ0 (μ0 étant une valeur fixe du paramètre), il
faut distinguer quatre cas dans la quatrième étape où on doit déterminer la
distribution de l’estimateur . On peut résumer les diverses situations
rencontrées dans les tests d’hypothèse sur une moyenne dans le tableau
synthèse suivant où n représente la taille de l’échantillon, α le niveau de
signification et H0 : μ= μ0 est l’hypothèse nuelle.

Cas Distributeur de Zone de rejet


l’estimateur X H1 :   0 H1 :   0 H1 :   0
² connue et X u ̅ ̅  ̅
N(0,1)
X N(n) ou
2
̅ 
n
² connue et Approximation ̅ ̅  ̅
n  30 X u ou
N(0,1)

2 ̅

n
² inconnue X u ̅ ̅  ̅
 Tn 1
et X 2
S
N(n30) ou
n 1
̅ 
² inconnue Approximation ̅ ̅  ̅
et n  30 X u ou
N (0,1)
 ̅ 
n

Si la population n’est pas normalement distribuée, avec n  30. On fait


recours { l’inégalité de Tchebycheff.

Exercices

Exercice .1.

La compagnie de pneus MICHELIN prétend que ses pneus ont une durée
de vie moyenne de 42.000 Km. En prélevant un échantillon de 30 pneus, on
trouve une durée de vie moyenne de 39.480 Km. En supposant que la durée de
vie de ces pneus obéit { une loi normale d’écart-type 4500 Km, peut-on dire
que l’affirmation de la compagnie est exagérée au niveau de signification  =
0.05 ?

Exercice 2.

Un producteur de poulets s’engage { fournir { un supermarché des


poulets d’une masse moyenne de 2 kg, avec un écart-type de 0.2 Kg. Pour
vérifier la masse moyenne de ces poulets, on prélève un échantillon de 100
157
poulets et on y trouve une masse moyenne de 2.3 Kg. En utilisant un niveau de
signification  = 0.10 ; peut-on affirmer que la masse moyenne des poulets est
de 2 Kg ?

Exercice 3.

Un fabricant d’article de sports vient de mettre sur le marché un nouveau


casque protecteur pour le football et il prétend que ce casque peut, en
moyenne, supporter une pression moyenne de 1800Kg/Cm². Pour s’assurer que
ce casque supporte au moins une pression moyenne de 1800Kg/Cm², une
association de consommateurs prélève un échantillon de 10 casques et trouve
qu’ils supportent en moyenne une pression de 1780 Kg/Cm² avec un écart-type
échantillonal de 20 Kg/Cm². En supposant que la pression supportée par ces
casques obéit { une loi normale, l’association peut-elle accepter, au niveau de
signification  = 0.05, l’affirmation de fabricant ?

Exercice 4.

Avant la zaïrianisation, une famille de 4 personnes dépensait en moyenne


105 Z par semaine pour se nourrir. Un mois après cette mesure, en prélevant un
échantillon de 225 familles, on a vérifié qu’elles dépensaient en moyenne 110 Z
par semaine pour se nourrir, avec un écart-type échantillonnal de 8 Z. Peut-on
affirmer, à un niveau de signification  = 0.05, que la dépense hebdomadaire
moyenne pour se nourrir a augmenté ?

Exercice 5.

Une entreprise de montage des congélateurs estime que le poids de


nouveaux congélateurs est normalement distribué avec une moyenne  =
260Kg et une variance 2 = 43Kg. Après la restructuration des unités de
production, l’entreprise voudrait tester au niveau de signification de 5% si le
poids moyen des congélateurs fabriqués est en dessous de 260Kg. Pour ce
faire, elle prend un échantillon aléatoire de 36 congélateurs et trouve que le
poids moyen pour l’échantillon est 240Kg. Vérifier ce test et trouver la
probabilité d’accepter H0 pour une contre hypothèse 1 = 240Kg. Illustrer cette
probabilité par un graphique.

Solutions

Ex.1.

(1) Soit X : durée de vie d’un pneu MICHELIN


 : Durée de vie moyenne des pneus MICHELIN
On a  = 42000 n = 30  X  39480  = 4500

(2) H0 :  = 42000
H1 :   42000
158

(3)  = 0.05

X u
(4) X N (  ,  ²), alors N (0,1)

n

(5)
0.05

42000 X
0 Z
-Z
(-1.645)

39480  42000
(6) Z ( X )   3.07
821.58
(7) Rejeter H0, car -3.07  -1.645. On peut donc conclure que l’affirmation de la
compagnie est exagérée.

Ex. 2.

(1) Soit X : Masse de poulet de ce producteur


 : Masse moyenne des poulets de ce producteur

On a  = 2  = 0.2 n = 100  X  2 .3

(2) H0 :  = 2
H1 :   2

(3)  = 0.10

X u X 2
(4) Z  
2 0.02
n
0.05
0.05
(5)

2 X
0 Z
-Z -Z
(-1.645) (-1.645)
2.3  2
(6) Z ( X )   15
0.02

(7) Rejeter H0, car 15  1.645. On peut donc affirmer que la masse moyenne des
poulets n’est pas 2 Kg.
159
Ex.3.

(1) X : Pression supportée par un casque de ce fabricant


 : Pression moyenne supportée par les casques de ce fabricant.
On a  = 1800 n = 10  X  1780  X  20
(2) H0 :  : 1800
H1 :   1800
(3)  : 0.05
X  1800
(4) Tn 1 
6.6667
(5)
0.05

-t T9
(-1.83)

1780  1800
(6) T9( X )   3.00
6.6667
(7) Rejeter H0, car -3.00  -1.83. D’où le fabricant a exagéré dans son
affirmation.

Ex.4.

(1) X = Dépense hebdomadaire d’une famille de 4 enfants pour se nourrir


 = Dépense hebdomadaire moyenne d’une famille de 4 enfants pour se
nourrir
On a  = 105 n = 225  X  110 X  8
(2) H0 :  = 105
H1 :   105

(3)  = 0.05 0.05

(4) Z  X  105
0.5333
Z
0 Z
(5) (1.645)

(6) Z ( X )  9.38

(7) Rejeter H0, car 9.43  1.645. On conclut donc que la dépense hebdomadaire
moyenne pour se nourrir a augmenté.
160
Ex. 5
(a)
(1) X : poids d’un nouveau congélateur
 : poids moyen de nouveaux congélateurs
On a  = 260 n = 36  X  240  = 43

(2) H0 :  = 260
H1 :   260
(3)  = 0.05

(4) Z  X  260
7.17 0.05
(5)

260 X
Z
-Z 0
(-1.645)

(6) Z ( X )  240  260  2.8


7.17
(7) Rejeter H0 car -2.8  -1.645
(b)
On recherche  = P (accepter H0/H0 fausse)

432
aZ
36
= 260 + (-1.645) (7.17)
= 248.20

= P (Z  1.14)
= 0.1271 0.05
= 0.13 Région de rejet Région d’acceptation
(erreur )
Illustration
248.2 260

Bon rejet de 0.13 Mauvaise acceptation de


l’hypo. nulle l’hypo. nulle
(erreur )
240 248.2
161

6.6. Test d’hypothèses sur une proportion

Pour les tests d’hypothèses portant sur une proportion, c’est-à-dire


lorsque l’hypothèse nulle a la forme  = 0, on considère seulement le cas où n
 30, n  5 et n(1-)  5. On peut résumer les éléments essentiels d’un test
d’hypothèse sur une proportion dans le tableau suivant où n représente la taille
de l’échantillon,  le niveau de signification et H0 :  = 0 l’hypothèse nulle.

Cas Distributeur de Zone de rejet


l’estimation X H1 :   0 H1 :   0 H1 :   0
n  30 P  Z ( P )  Z Z ( P )   Z / 2
n  5 N (0,1)
p(1  p) ou
n(1-)  5
n Z ( P)  Z / 2

NB : ̂ , proportion de succès dans l’échantillon.

Exercices

Exercice 1.

Le ministère des transports affirme que 15% des véhicules circulant sur nos
routes ne rencontrent pas les normes de sécurité du code de la route. La police
procède alors { l’inspection de 600 véhicules parmi lesquels elle en trouve 94
ne rencontrant pas les normes de sécurité du code de la route. En utilisant un
niveau de signification  = 0.05, peut-on accepter l’affirmation du ministère des
transports ? A quel intervalle de confiance appartient π

Exercice 2.

Le Gouverneur de la ville de Kinshasa Yoanis prétend que le revenu mensuel


moyen des diamantaires de Kinshasa est de 24000 Fc avec un écart-type de
4000 Fc. Pour vérifier cette affirmation, on prélève un échantillon de 100
diamantaires et on observe que le revenu mensuel est 23600 Fc.
a) Comment ce test peut-il être vérifié au niveau de signification de 5%
b) Trouver la probabilité d’accepter H0 pour une contre- hypothèse 1 =
23000.

Solutions

Ex.1.
a) 555
(1)  : la proportion des véhicules circulant sur nos routes et ne rencontrent pas
les normes de sécurité du code de la route.
On a :  = 0.15 n = 600  P  0.1567
162

(2) H0 :  = 0.15
H1 :   0.15
(3)  = 0.05

P  0.15 P  0.15
(4) Z  
0.1567(0.8433) 0.0148
600
(5)

0.025 0.025

Z
-Z/2 0 Z/2
(-1.96) (1.96)
(6) Z( P)  0.46

(7) Accepter H0 car -1.96  0.46  1.96. Donc l’affirmation du ministère des
transports peut être acceptée.
b) L’intervalle de confiance de π est 0.1567±1.96√ . Ainsi,
π [0.1277 ;0.1857].
x.2.

(a)

(1) x : revenu mensuel d’un huissier de Kinshasa


 : revenu mensuel moyen des huissiers de Kinshasa

On a : u = 24000  = 4000 n = 100 u X  23600

(2) H0 :  = 24000
H1 :   24000

(3)  = 0.05

X  24000
(4) Z 
400
(5)

0.025 0.025

Z
-Z/2 0 Z/2
(-1.96) (1.96)
(6) Z( X )  1
163

(7) Accepter H0 car -1.96  -1  1.96. D’où l’affirmation du Gouverneur Yoanis est
validée.

(b)

On note par  une erreur de 2ème espèce.

 = P (accepter H0/H0 fausse)


= P (a  X  b/ = 1)
a=2400-1.96(400)=23216
b=2400+1.96(400)=24784

 (23000) = P (a  X  b/1 = 23000)


23216  23000 24784  23000
P( Z )
400 400
= P (0.54  Z  4.46)
= 0.2946

D’où  = 0.2946, c’est la probabilité d’accepter que la moyenne est 24000 alors
qu’elle est en réalité 23000.

6.7. Tests d’hypothèses sur la différence de deux moyennes (et de


deux proportions)
Il arrive fréquemment que l’on ait { comparer deux populations
différentes relativement à une certaine caractéristique. Par exemple, on peut
vouloir comparer le revenu des fonctionnaires de Kinshasa avec celui des
fonctionnaires de Brazzaville. On peut alors utiliser la méthode de tests
d’hypothèses pour effectuer une telle comparaison. Ici, le raisonnement reste
le même que celui de tests d’hypothèses des moyennes (et des proportions).
Ainsi, la quatrième étape pour le test d’hypothèse de différence des deux
moyennes est la suivante :

- Zc= si les variances sont connues.


- Zc= si les variances sont inconnues, avec n1 et n2 supérieurs à 30.


Tc= si les variances sont inconnues avec n1et n2


̂ ̂
√ √

inférieurs à 30 et X1 et X2 suivent la loi normale.


164

- Tc= si les variances sont inconnues avec n1 = n2, inférieurs à


30 et X1 et X2 suivent la loi normale

Pour ce qui est de la proportion, il n’y a qu’un seul cas (n1 et n2≥30) :

- Zc= ̅ ̅ ̅ ̅

Exercices
Exercice 1.
La société LENGSRAM affirme que la durée de vie moyenne de ses ampoules
est de 400 heures supérieures { celle de la compagnie DEF. On sait que l’écart-
type de la durée de vie des ampoules LENGSRAM est de 140 heures et que celui
des ampoules DEF est de 180 heures. On prélève un échantillon de 50 ampoules
LENGESRAM et on y trouve une durée de vie moyenne de 1750 heures. De
même, on prélève un échantillon de 40 ampoules DEF et on y trouve une durée
de vie moyenne de 1320 heures. Au niveau de signification  = 0.05, peut-on
accepter l’affirmation de la société LENGSRAM ?
Exercice 2.
Un politicien affirme que, dans la fonction publique, le salaire moyen des
femmes est identique à celui des hommes. Agnès veut confondre ce politicien
car elle pense que le salaire moyen des femmes dans la fonction publique est
inférieur à celui des hommes. Elle prélève donc un échantillon de 35 femmes
travaillant dans la fonction publique et elle trouve un salaire mensuel moyen de
23000 FB avec un écart-type échantillonnal de 4200 FB. Elle prélève également
un échantillon de 45 hommes, travaillant dans la fonction publique et elle y
trouve un salaire mensuel moyen de 25800 FB avec un écart-type échantillonal
de 3900 FB. Au niveau de signification  = 0.05. Agnès peut-il confondre ce
politicien ?
Exercice 3.
Un psychologue affirme que la proportion des mariages qui se terminent par un
divorce en moins de cinq ans est de 10% supérieur en milieu urbain qu’en milieu
rural. Un échantillon de 50 mariages de personnes vivant en milieu urbain
révèle que 28 se terminent par un divorce en moins de cinq ans. Un échantillon
de 75 mariages de personnes vivant en milieu rural révèle que 35 se terminent
par un divorce en moins de cinq ans. Au niveau de signification  = 0.05, peut-
on accepter l’affirmation de ce psychologue ?
165
Solutions
Exercice 1.
(1) Soit X1 : durée de vie des ampoules LENGSRAM
1 : durée de vie moyenne des ampoules LENGSRAM
X2 : durée de vie des ampoules DEF
2 : durée de vie moyenne des ampoules DEF

On a
1 = 140 2 = 180 n1 = 50  X  1750
n2 = 40   1320
1

X2

(2) H0 : 1- 2 = 400


H1 : 1 - 2  400
(3)  = 0.05
( X 1  X 2 )  400
(4) Z 
34.6699
(5)

0.025 0.025

Z
-Z/2 0 Z/2
(-1.96) (1.96)

(6) Z ( X 1  X 2 )  0.87

(7) Accepter H0 car – 1.96  0.87  1.96

Exercice 2.

(1)
X1 : salaire mensuel d’une femme travaillant dans la fonction publique
1 : salaire mensuel moyen des femmes travaillant dans la fonction publique
X2 : salaire mensuel d’un homme travaillant dans la fonction publique
2 : salaire mensuel moyen des hommes travaillant dans la fonction publique
on a : n1 = 35 = 23000 S1 = 4200
n2 = 45 = 25800 S2 = 3900

(2) H0 : μ1-μ2=0
H1 : μ1-μ2<0

(3) α = 0.05
166
̅
(4)

(5)

(-1.645)
0
Z
(6) Z ( X 1  X 2 )  3.05

(7) Résister H0, car -3.05<-1.645. D’où Agnès peut confondre ce politicien, car le
salaire des termes est inférieur à celui des hommes.

Exercice 3.

(1) π1=proportion des mariages de personnes vivant lieu urbain, qui


aboutissent à un divorces en moins des cinq ans.
π2= proportion des mariages des personnes vivant n milieu rural, qui
aboutissent à un divorce en moins de cinq ans.
On a : n1 =50 ̅ = 0.56
n2 =75 ̅ = 0.467

(2) H0 : π1- π2 =0.10


H1 : π1- π2 ≠0.10

(3) α = 0.05

(4)

(5)

0.025 0.025

Z
-Z/2 0 Z/2
(-1.96) (1.96)

(6) =-0.08

(7) Accepter H0, car -1.96<-0.08<1.96


167

6.8. La distribution F de Fisher et le test d’hypothèses sur la


différence de deux variances

Dans la section 3.3.5, nous avons dit que l’hypothèse que  1   2 (les
2 2

̂
deux populations ont même variance), le rapport ̂ peut être utilisé pour
éprouver l’hypothèse de l’égalité de deux variances lors des tests
d’hypothèses. Ordinairement, on place la plus grande variance au numérateur.
L’hypothèse nulle sera H 0 :  1   2 . Lorsque la valeur de F calculée se situe
2 2

dans l’intervalle de confiance déterminé par l’usage des F de la table, on ne


peut pas rejeter H0.
Les différentes valeurs critiques de F sont :
- Limite supérieure de F : F/2 ; k1 ; k2
1
- Limite inférieure de F :
F / 2 , k 2 , k1

Avec k1≥k2, k1 et k2 étant des degrés de liberté.


Exercice

Une entreprise désire comparer les grandeurs des variances de la population


entre le rapport coûts réels et coûts estimés pour deux types différents de
projets de construction. Les données échantillonnales sur 10 types de projets
nouveaux n°1 et sur 8 projets de type n°2 sont :

Type n°1 Type n°2


n1 = 10 n1 = 8
 X 1  4000  X  4300
2

̂ =200 ̂ =250

En supposant que les deux ensembles des données représentent des


échantillons aléatoires indépendants des populations normales, vérifier si les
variances de la population des rapports coût réel/coût estimé pour les deux
types de projets sont égales au seuil de signification de 10%.

Solution

  0.10   / 2  0.05
k1  9 et k2  7
H 0 :  12   22
H1 :  12   22
Au seuil de signification de 10%, les valeurs critiques de F sont :
- limite supérieure de F est F0.05 ; 9,7 = 3.68
1 1
- limite inférieure de F est   0.304
F0.05;7;9 3.29
168

L’intervalle de confiance est 0.304 ; 3.68

40000
̂
Le F calculé est ̂
 0.64
62500
(en mettant la plus grande variance au numérateur, on trouve Fe = 1.56)

La valeur de Fc n’étant ni inférieure { 0.304, ni supérieure { 3.68 ; on constate


que celle-ci est dans la zone d’acceptabilité de l’hypothèse nulle. D’où
l’assertion selon laquelle les variances de ces deux populations sont égales ne
peut pas être rejetée au seuil de signification de 10%.

6.9. Distribution de Fisher et analyse de la variance

L’analyse de la variance (ANOVA) est une méthode qui consiste à


comparer plus de deux moyennes. Cette analyse de la variance est basée sur le
test F de Fisher. Toutefois, l’utilisation de la distribution F de Fisher exige que
les populations d’où sont tirées les échantillons soient normalement
distribuées quelque soit la taille de l’échantillon.

Lorsqu’on fait le test d’hypothèse sur la différence de plusieurs


moyennes, l’hypothèse nulle est :
H0 : 1 = 2 = 3 … = k ; et
H1 : 1  2  3 ; …  k

Avec les données disponibles, on va calculer une distribution F, qu’on note Fc


qui sera comparée avec la distribution  de la table ; où  est le seuil
de signification, k-1 = Dx et nT-k = Dy ; k étant le nombre total d’échantillons et nT
le nombre total des résultats de tous les échantillons.
 
Le Fc est obtenu en calculant le rapport entre «  entre » et «  intérieure »,
2 2

c’est-à-dire :

Si FC>  on rejette H0.



L’expression «  entre » est la variance des moyennes des échantillons par
2

rapport à la moyenne X T de tous les résultats, ainsi :


n1 ( x1  x T ) 2  n2 ( x 2  x T )  ...  nk ( x k  x T ) 2
 2 entre 
k 1
(n1  1) S12  (n2  1) S 22  ...  (nk  1) S k2
(n1  1)  (n2  1)  ...( nk  1)
Le calcul de Fc peut se faire aisément en suivant le schéma suivant :
1. Ecrire en colonne les résultats de chaque échantillon ;
2. Additionner les résultats du premier échantillon, faire de même pour
chaque échantillon ;
169
3. Additionner en ligne les sommes ainsi obtenues, appeler cette somme
B;
4. Elever au carré la somme de chaque échantillon, la diviser par la taille
de l’échantillon, répéter la même opération pour tous les échantillons.
Faire la somme de tous ces résultats et appeler cette somme A ;
5. Elever au carré chaque élément du premier échantillon et faire la
somme. Répéter cette opération pour tous les échantillons. Faire la
somme de tous ces résultats, appeler cette somme C ;
A  B 2 / nT
6. Ainsi, ̂ entre =
k 1
CA
Et ̂ intérieure =
nT  k
D’où

Disposition pratique des calculs

X’ X’’ X’’’
X11 X21 X31
X12 X22 X32
: : :
: : :
X1k X2k X3k Total
(Xi) X1 X2 X3 X1+X2+X3=B
(Xi)² X 12 X 22 X 32

Taille éch. n1 n2 n3 n1+n2+n3 = nT


( X )² X 2
X 2
X 2
X 12 X 22 X 32
1 2 3
  A
n n1 n2 n3 n1 n2 n3
(Xi)² (X1i)² (X2i)² (X3i)² (X1i)² + (X2i)² +(X3i)²=c

Sachant que k est égal au nombre d’échantillon et nT est égal au nombre total
de résultats de tous les échantillons :

̂ entre =
̂ intérieure =
Par conséquent :
̂
̂
Exercice 1 :

Un économiste voudrait vérifier au niveau de signification α=0,01 l’hypothèse


que les plombiers, les maçons et les électriciens gagnent un salaire moyen
identique dans la Ville de Kinshasa. L’économiste dispose des données salaires
(en dollars) ci-après :
170

X1= plombiers X2= Maçons X3 = Electriciens


22 23 22
23 20 23
25 24 26
23 25 20
26 21

Solution

En procédant comme expliqué ci-dessous, on aura :

X1 X2 X3
22 23 22
23 20 23 k=nombre de données =3
25 24 26 X1 X2 X3
23 25 20
26 21 Total
∑X 119 92 112 323=B
(∑X)2 14161 8464 12544
n 5 4 5 14=nT
(∑X)2 /n 2832,2 2116 2508,8 7457=A
∑ (X)2 2843 2130 2530 7503=C

̂ entre =
̂ intérieur =
=0,59
(2,11)=7,21

Puis que FC<F0.01 (2,11)


0,59<7,21 accepte H0

L’hypothèse H0 est acceptée, c’est-à-dire qu’au niveau de signification de


α=0.01, les trois catégories d’ouvriers ont un salaire moyen identique.

Les calculs peuvent être simplifiés, si les chiffres sont élevés, en soustrayant à
chaque valeur de tous les échantillons un nombre arbitraire et procéder au
calcul comme précédemment.
171
En prenant le même exemple, soustrayons 25 à chaque valeur de tous les
échantillons et effectuons les calculs comme précédemment :

X1 X2 X3
-3 -2 -3
-2 -5 -2
0 -1 1
-2 0 -5
1 -4 Total
∑X -6 -8 -13 -27=B
(∑X)2 36 64 169
n 5 4 5 14=nT
(∑X)2 /n 7,2 16 33,8 57=A
∑ (X)2 18 30 55 103=C

̂ entre =
̂ intérieur =
=0,59

On arrive au même résultat que précédemment.

Exercice 2.

Cinq (5) différents traitements de fertilisant ont été appliqués à un nombre de


plates-bandes de maïs. Le traitement (1) était appliqué à 4 plates-bandes ; les
traitements (2) et (3) étaient appliqués à 6 plates-bandes ; le traitement (4) à 7
plates-bandes et le traitement (5) à 3 plates-bandes.

Les productions par hectare se trouvent dans le tableau ci-après :

(1) (2) (3) (4) (5)


78.9 63.5 79.1 87 75.9
72. 74.1 90.3 81.2 77.2
81.1 75.5 85.6 75.3 81.5
85.7 80.8 81.4 79.4
71.3 74.5 80.7
79.4 95.5 82.8
89.6

Tester l’hypothèse que la récolte moyenne est la moyenne pour chaque


traitement du fertilisant au niveau de signification α=0.05.
172
Solution

(1) (2) (3) (4) (5)


78.9 63.5 79.1 87 75.9
72. 74.1 90.3 81.2 77.2
81.1 75.5 85.6 75.3 81.5
85.7 80.8 81.4 79.4
71.3 74.5 80.7
79.4 95.5 82.8
89.6
∑X 318.6 444.6 506.4 576 234.6 2080.2=B
(∑X)2 101506.0 197669.2 256441.0 331776 55037.2
n 4 6 6 7 3 26=nT
(∑X)2 /n 25376.5 32944.9 42740.2 47396.6 18345.7 A=166804
∑ (X)2 25461.32 33140 43034.72 47533.38 1862.9 C=167532

Calculs de F

- A-B2/nT=166803.8-166432=371.8
- C-A=167532.32-166803.8=728.52
- K-1=5-1=4
- nT-k=26-5=21

on aura

̂ entre =
̂ intérieur =

Par conséquent,

=2.68

F0.05(4 ;21)=2.84
Fc<FT, on accepte H0.

Test de SCHEFFE

Avec le test F, nous acceptions ou rejetons l’hypothèse nulle telle que :

H0 : μ1 = μ2 = μ3… μk ; et
H1 : μ1 ≠ μ2 ≠ μ3… μk.

On rejette H0 après avoir fait un test F. Toutefois, il serait intéressant de


connaître les paires des moyennes qui sont significativement différentes. A cet
effet, on utilise le test de Scheffé qui est valide pour toutes les paires
d’échantillons et qui diffère considérablement d’un test t répété.
173

Les étapes dans l’application du test Scheffé sont les suivantes :

1. Calculer S=√ ̂

2. Si a) Les échantillons sont de même taille, n vérifier si | | est


inférieur ou supérieur à √ .
b) Les échantillons sont de tailles différentes, vérifier si | | est
inférieur ou supérieur à √ .
ce test est fait pour chaque paire de moyenne ,
3. Si | |> √ ou √ selon le cas, alors H0 : μi = μj est
rejeté ;
4. Si | | √ ou √ selon le cas, alors H0 : μi = μj est
acceptée.
Exercice 3

En faisant l’analyse de variance sur les données :

X1 X2 X3 X4
0 2 4 6
1 3 5 7
1 3 5 7
2 4 6 8
2 4 6 8

On trouve que :
H0 : μ1 = μ2= μ3 = μ4 est rejetée au seuil de signification de 0.05, sachant que
A=452.8 et C=464.

̂ intérieur =

F0.05(3 ; 16)=3,24

√ ⁄ √ √ =2,13

En appliquant le test de Scheffé, on trouve que seuls : μ1 ≠ μ3 ; μ1 ≠ μ4 et μ2≠ μ3 .


174

6.10. Ajustement analytique et Tableau de contingence.

Le test de Khi-deux trouve sa justification non seulement dans la


dépendance ou non de deux variables qualitatives, mais aussi dans l’ajustement
d’une loi théorique { distribution observée.

Examinons un problème qui justifie l’utilisation de 2.


Une étude faite en 1960 montre que parmi tous les hommes de 30 ans,
25 % avaient fait l’Université, 40 % n’ont fait que le secondaire et 35 % se sont
limités en primaire.

Au niveau de signification  = 0.01, avons-nous aujourd’hui la même


distribution ?
Une étude similaire portant sur 100 hommes âgés de 30 ans, choisis au
hasard, donne les résultats suivants aujourd’hui : 26 ont fait l’Université, 51
n’ont fait que le secondaire et 23 se sont limités en primaire.

Pour répondre à une telle question, où deux ensembles de données


sont comparés, on recourt à la distribution de Khi-deux. Les étapes à suivre
demeurent les mêmes comme dans le cas des autres tests d’hypothèses.
Seulement, dans la deuxième et quatrième étape, on procède Comme suit :
2ème étape : Formulation des hypothèses.
H0 : Pas de différence dans l’instruction (distributions identiques)
H1 : Il y a différence dans l’instruction (distributions différentes)
4ème étape : La statistique du test est c2 =  (O – E)2/ E . Cette statistique suit
la loi de Khi-deux à (n – 1) degrés de liberté. Si c2  T2, on accepte H0. La
distribution observée est celle dont nous disposons des données, tandis que la
distribution théorique est celle issue des estimations si et seulement si
l’instruction était identique.

Le calcul de la statistique du test se fait donc comme suit :

O E (O – E) (O – E)2 (O – E)2/E

26 25 1 1 0.04
51 40 11 121 3.03
23 35 -12 144 4.11

100 100 c2 = 7.18

La règle de décision est :

9.21
175

Comme 7.18  9.21, on accepte H0. D’où il n’y a pas de différence


significative dans l’instruction des hommes de 30 ans d’aujourd’hui et ceux de
1960.

Exemple 2.

Trois cent chiffres sont tirés aléatoirement d’une table de nombres au


hasard et les fréquences de ces chiffres se présentent comme suit :

Chiffre 0 1 2 3 4 5 6 7 8 9
Fréquences 28 29 33 31 26 35 32 30 31 25

Peut-on conclure que les chiffres sont distribués dans un nombre égal
dans la table.

Solution
Si les chiffres étaient distribués en nombre égal, la fréquence de
chaque chiffre serait de 30 (300/10). C’est ça la fréquence théorique.

Les calculs requis sont présentés dans le tableau ci-après.

O E (O – E) (O – E)2 (O – E)2/E

28 30 -2 4 0.133
29 30 -1 1 0.033
33 30 3 9 0.300
31 30 1 1 0.033
26 30 -4 16 0.533
35 30 5 25 0.833
32 30 2 4 0.133
30 30 0 0 0.00
31 30 1 1 0.033
25 30 -5 25 0.833

300 300 c2 = 2.804

Comme T2 = 16.92, on accepte l’hypothèse nulle ; parce que 2.804 


16.92.

Test de 2 et Efficacité d’un ajustement

Jusqu’{ présent, nous avons appliqué la théorie de probabilité en formulant les


hypothèses de base sur lesquelles sont fondées les théories et les modèles.
Dans plusieurs problèmes, nous avons supposées que les observations
proviennent d’une population normale, ou d’une population binomiale, ou
d’une population suivant la loi de Poisson, … Pour s’en assurer, le test de Khi-
deux permet de vérifier la qualité de l’ajustement. Pour ce test, nous
176
comparons les fréquences observées avec les fréquences théoriques ou
estimées sous l’hypothèse d’une distribution de probabilité spécifique.

La procédure pour vérifier l’efficacité de l’ajustement est sensiblement la


même comme celle de l’exemple ci-haut.
2ème étape : Formulation des hypothèses.
H0 : La distribution d’où l’échantillon est tiré n’est pas différente de la
distribution théorique (distributions identiques)
H1 : Il y a différence (distributions différentes)
4ème étape : La statistique du test est c2 =  (O – E)2/ E . Cette statistique suit
la loi de Khi-deux à (n – 1) degrés de liberté. Si c2  T2, on accepte H0.
En ce qui concerne l’ajustement par la distribution de Poisson, le degré de
liberté est(n–2).

N.B. Dans le cadre de l’ajustement d’une loi théorique { une loi de probabilité
quelconque, la fréquence théorique et observée d’une classe quelconque
doivent être d’au moins 5. Ainsi, si quelques classes ont des fréquences
inférieures à 5, on regroupe ces classes avec les précédentes ou les suivantes ;
afin d’en avoir au-moins 5. Dans ce cas, le degré de liberté sera calculé en
considérant le nombre de classe (n) obtenu après regroupement.

Exercice 1

On veut tester si les données suivantes proviennent d’une population


binomiale de paramètre p = 0.20.

xi 0 1 2 3 4 5 6 Total
Fréquences 29 37 17 7 3 2 1 96

Solution

Si ces chiffres provenaient d’une population binomiale, la fonction de


probabilité de X serait comme suit :

xi 0 1 2 3 4 5 6 Total
P(X=xi) 0.2621 0.3932 0.2458 0.0819 0.0154 0.0015 0.0001 1

A partir de cette distribution de probabilité, on évalue la fréquence théorique


(n.pi) pour chaque classe. Les calculs des fréquences théoriques sont présentés
dans le tableau suivant.
xi 0 1 2 3 4 5 6 Total
Fréquences 25.16 37.75 23.60 7.86 1.48 0.14 0.01 96

Comme la fréquence d’une classe doit être au-moins 5, on remarque


donc que les 4 dernières classes doivent être regroupées. Les calculs requis
donnent ce qui suit :
177
xi O E (O – E)2/E

0 29 25.16 0.586
1 37 37.75 0.015
2 17 23.60 1.846
3 ou plus 13 9.49 1.298

96 96 c2 = 3.745

Comme T2 = 7.81, on accepte l’hypothèse nulle ; parce que 3.745  7.81.
D’où l’ajustement de ces données par une loi binomiale de paramètre p = 0.2
semble satisfaisant.

Exercice 2

Une enquête nutritionnelle auprès de 160 familles ayant 4 enfants


montre que 6 familles n’ont pas de fille, 34 ont une fille, 56 en ont deux, 46 en
ont 3, et 18 en ont 4. Se basant sur cette enquête, peut-on affirmer que la
probabilité de naissance d’un garçon ou d’une fille est la même ( = 0.10).

Solution

(1) Les données du problème peuvent être présentées sous forme d’un
tableau.

xi Fréquences
observés
0 6
1 34
2 56
3 46
4 18
Total 160

Si la probabilité de naissance d’un garçon et d’une fille était identique, on serait


dans le cas de la loi binomiale de paramètre p = 0.5. La fonction de probabilité
de X serait donc :

xi 0 1 2 3 4 Total
P(X=xi) 0.0625 0.2500 0.3750 0.2500 0.0625 1

A partir de cette distribution de probabilité, on évalue aisément la fréquence


théorique pour chaque classe. Les calculs requis donnent :
178

xi O E (O – E)2/E

0 6 10 1.60
1 34 40 0.90
2 56 60 0.27
3 46 40 0.90
4 18 10 6.40

160 96 c2 = 10.07

Comme T2 = 7.78, on rejette l’hypothèse nulle ; parce que 10.07  7.78.
D’où on ne peut affirmer que la probabilité de naissance d’un garçon et celle
d’une fille sont identiques.

Exercice 3

Soit les données suivantes sur le nombre d’accidents de travail en une journée
pour une période de 100 jours.

Nombre d’accidents 0 1 2 3 4 5 6 Total


Fréquences (Nbre jrs) 13 27 27 19 9 4 1 100

Tester si ces données suivent une distribution de poisson.

Solution

La loi de poisson n’a besoin que d’un seul paramètre, { savoir . Le calcul de ce
paramètre donne  = ( xi ni)/n = 200/100 = 2. Ceci permet d’avoir la distribution
de probabilité suivante :

xi 0 1 2 3 4 5 6 et Total
plus
P(X=xi) 0.1353 0.2707 0.2707 0.1804 0.0902 0.0361 0.0166 1

A partir de cette distribution de probabilité, on évalue la fréquence théorique


(n.pi) pour chaque classe. Les calculs des fréquences théoriques sont présentés
dans le tableau suivant.

xi 0 1 2 3 4 5 6 et plus Total
Fréquences 13.53 27.07 27.07 18.04 9.02 3.61 1.66 100

Comme la fréquence d’une classe doit être au-moins 5, on remarque


donc que les 2 dernières classes doivent être regroupées. Les calculs requis
donnent ce qui suit :
179

xi O E (O – E)2/E

0 13 13.53 0.02076
1 27 27.07 0.00018
2 27 27.07 0.00018
3 19 18.04 0.05108
4 9 9.02 0.00004
5 ou plus 5 5.27 0.01290

100 100 c2 = 0.0851

Comme T2 = 9.49, on accepte l’hypothèse nulle ; parce que 0.0851 


9.49. D’où l’ajustement de ces données par une loi de poisson est satisfaisant.

Distribution de 2 et Tableau de contingence

Une autre application intéressante du 2 est le test d’indépendance entre deux


variables qualitatives. Il s’agit de répondre prudemment au problème
d’indépendance soulevé { la section 1.5 ; en prenant un certain niveau de
confiance dans les affirmations. On peut, par exemple, s’intéresser { la relation
entre la réussie à un examen et le sexe des candidats, ou encore à la relation
entre le fait de porter des lunettes et la scolarité… Un test de 2 aide à
répondre à ce genre de problème en présentant les informations par un
« tableau de contingence »

Dans ce tableau de contingence, chaque variable est dénombrée suivant un


certain nombre de modalité. Le tableau de contingence nxm se présente
comme suit :

A A1 A2 …..…..Aj...... ... Am Total des


B lignes (Li)
B1 f11 f12 .…
… f1j ...
…. f1m L1

B2 f21 f22 .…
… f2j …
…. f2m L2

Bi fi1 fi2 .....


… fij …
…. fim Li

Bn fn1 fn2 .…
… fnj …. fnm Ln

Total des C1 C2 Cj Cm Grand


colonnes (Ci) total (n)

Le test d’indépendance ou d’association se fera, comme dans le cas précédent


en comparant les fréquences observés et les fréquences théoriques. Les
hypothèses à confronter sont les suivantes :
H0 : il y a indépendance (pas de relation)
H1 : il y a dépendance (il y a relation entre A et B)
180

Pour obtenir les fréquences théoriques de chaque case, on multiplie les


fréquences marginales de la ligne et de la colonne, puis on divise par le grand
total.

A A1 A2 Aj Am Total des
B lignes (Li)
B1 L1

B2
L2

…… …… Li
Bi ….
……
Ln
Bn
Total des C1 C2 Cj Cm Grand
colonnes total (n)
(Ci)

La statistique du test est :


 ∑
Cette statistique sera comparée au khi-deux de la table  à (m-1)(n-1) degrés
de liberté.
Si  < , on accepte H0.

Exercice 1
Le tableau ci-après montre les données obtenues pendant une épidémie de
choléra. Dans ce tableau il y a des personnes qui étaient vaccinées ; parmi
celles-ci il y a celles qui sont atteintes de choléra, d’autres non atteintes. Il y a
également des personnes non vaccinées du tout ; ici aussi, certaines personnes
ont été atteintes et d’autres non. Est-ce que la vaccination est efficace contre le
choléra ?
Personnes Personnes non Total
atteintes atteintes
Personnes vaccinées V 31 469 500
Personnes non vaccinées NV 185 1.315 1.500
Total 216 1.784 2.000
Les chiffres en encadré donnent les fréquences observées (0) ; pour trouver la
fréquence théorique de chaque cas, on multiplie les fréquences marginales de
la ligne et de la colonne, puis on divise par le grand total.
181
Personnes atteintes Personnes non atteintes Total
V 500

NV 1.500

Total 216 1.784 2.000

Les hypothèses à confronter sont :


Ho : il n’y a pas de relation entre le vaccin et la maladie
H1 : il y a relation

Ainsi, on a la disposition pratique suivante pour les colonnes :


0 E 0-E (0-E)²/E
31 54 -23 9,80
185 162 23 3,26
469 446 23 1,18
1315 1338 23 0,39
2000 2000  =14,63

Degrés de la liberté = nombre de lignes moins un multiplié par le nombre de


colonnes moins un ; ainsi s’il y a m lignes et n colonnes :
DL=(m-1)(n-1).

Dans le cas qui nous concerne ; c’est un tableau de contingence 2x2 ; donc DL
=(2-1) (2-1)=1.
Au niveau de signification de 0,05, c’es-à-dire α=0.05 ; ( )=3,84.

En partant de l’hypothèse que le vaccin n’est pas efficace { la prévention


contre le choléra (H0 :V=NV), l’hypothèse rivale est que le vaccin est efficace à la
prévention contre le choléra (H1 : V≠NV). Dans notre exemple, puisque
 > , nous acceptons l’hypothèse rivale selon laquelle la vaccination est
efficace à la prévention contre le choléra. En d’autre terme, on rejette Ho.

Lorsqu’on applique les résultats d’une distribution continue { des distributions


discrètes on procède à des corrections de continuité qui, dans ce cas du test
du sont formulées comme suit :

Cette correction est appelé correction de YATES. La correction de YATES est


également d’application lorsque DL=1.
Exercice 2
Le tableau ci-après donne la relation entre le nombre d’accidents en une année
et l’âge des conducteurs dans un échantillon de 500 conducteurs âgés de 18 {
50 ans.
182
1-25 26-40 41-50 Total
0 accident 75 120 105 300
1 accident 50 60 40 150
2 accidents 25 20 5 50
Total 150 200 150 500

Vérifier au niveau de signification  = 0.01 l’hypothèse que le nombre


d’accidents est indépendant de l’âge du conducteur.

Solution
Les calculs requis donnent :
O E O-E (O – E)2 (O – E)2/E

75 90 -15 225 2.5


120 120 0 0 0
105 90 15 225 2.5
50 45 5 25 0.6
60 60 0 0 0
40 45 -5 25 0.6
25 15 10 100 6.7
20 20 0 0 0
5 15 -10 100 6.7

500 500  = 19.6

Comme T2 = 13.28, on rejette l’hypothèse nulle ; parce que 19.6  13.28. D’où il
y a relation entre le nombre d’accidents et l’âge du conducteur.

Exercice 3

Y-a-t-il relation entre le fait de fait de porter des lunettes et la scolarité ?

Un échantillon de 50 finissant du Primaire montre que 15 portent des lunettes.


28 sur 100 finissant du secondaire portent des lunettes et 70 sur 200
universitaires portent des lunettes.
Faire le test en prenant  = 0.05.

Solution

Les données du problème sont présentées sous forme de tableau de


contingence ci-après :

Primaire Secondaire Université Total


Lunettes 15 28 70 113
Sans 35 72 130 237
lunettes
Total 50 100 200 350
183
Les fréquences théoriques sont présentées dans le tableau suivant :

Primaire Secondaire Université Total


Lunettes 16.1 32.3 64.6 113
Sans lunettes 33.9 67.7 135.4 237
Total 50 100 200 350

Les calculs requis donnent :

O E O-E (O – E)2 (O – E)2/E

15 16.1 -1.1 1.21 0.08


28 32.3 -4.3 18.5 0.57
70 64.6 5.4 29.2 0.45
35 33.9 1.1 1.21 0.04
72 67.7 4.3 18.5 0.27
130 135.4 -5.4 29.2 0.22

350 350 c2 = 1.63

Comme T2 = 5.99, on accepte l’hypothèse nulle ; parce que 1.63  5.99. D’où il
n’y a pas de relation entre le fait de porter des lunettes et la scolarité.

Exercice 4

Est-ce que les variables du tableau suivant sont indépendantes ?

B1 B2 Total
A1 40 105 145
A2 60 95 155
Total 100 200 300

Solution

Comme le degré de liberté est 1, on doit appliquer aux calculs la correction de


YATES.

Les calculs requis donnent :

O E O–E O – E–0.5 (O – E–0.5)2/E

40 48.3 8.3 7.8 1.26


105 96.7 8.3 7.8 0.63
60 51.7 8.3 7.8 1.18
95 107.3 8.3 7.8 0.57

300 300 c2 = 3.64


184

Comme T2 = 3.84, on accepte l’hypothèse nulle ; parce que 3.64  3.84.
N.B. La correction de Yates est utilisée seulement quand le degré de liberté (dl)
est égal à 1 et peut être utilisée pour les tests impliquant des ajustements des
distributions.

Coefficient de contingence

Si le tableau de contingence indique une association possible entre deux


variables qualitative, on peut mesurer alors le degré d’association { l’aide du
coefficient de contingence. Il s’agit de voir si la dépendance ou association est
forte ou faible. Ce coefficient varie toujours entre 0 et 1. Si le coefficient tend
vers 1, la dépendance est forte. Sinon, elle est faible. Le coefficient de
contingence s’obtient par la formule :

√   où n est le nombre total d’observations dans le tableau.

Pour des tableaux carrés (r x r), on connaît les valeurs maximales :


Dimensions du tableau de contingence
(2 x 2) (3 x 3) (4 x 4) (5 x 5) (6 x 6) (r x r)

Valeur maximale de c (cmaximum)


0.707 0.816 0.866 0.894 0.913 (r-1)/r

Habituellement, on apporte une correction au coefficient de contingence dont


la dimension du tableau est inférieure ou égale à (4 x 4).

Ccorrigé = c/cmaximum

Pour l’exercice 2 ci-dessus, on peut calculer le coefficient de contingence :


√ √

Bien qu’il y ait dépendance, il y a lieu de retenir que le degré d’association est
faible.

Ccorrigé =0.19/0.816=0.23

6.11. Test sur deux moyennes avec variances inconnues et


supposées inégales

Dans chacun des tests sur deux moyennes, les hypothèses de base sont
restrictives, entre autres, celle de l’égalité des variances inconnues. Si l’on peut
respecter cette hypothèse alors le rapport critique tel que défini au test de
l’égalité de deux variances supposées égales ne peut s’appliquer.

Toutefois, B.L. Welch (1947) a développé un rapport critique, que nous notons
t’ qui permet d’obtenir une solution approximative. Cette statistique.
185

̂ ̂

Suit approximativement une loi de student avec k degré de liberté ; avec

̂ ̂

̂ ̂
⁄ ⁄

k n’est pas nécessairement un entier ; on prend alors la valeur entière la plus


rapprochée.
L’hypothèse nulle { vérifier est H0 : μ1 = μ2

P.S. La solution de Welch exige toutefois que les deux échantillons aient la même
taille.

Exercice

On utilise deux procédés pour la fabrication d’un câble. Afin de déterminer si


les deux procédés de mêmes qualité, on veut comparer la force moyenne de
rupture des câbles de chacun des procédés. Des tests en laboratoire donnent
les résultats suivants :

Procédé I Procédé II
126.4 125.7
122.6 129.0
124.9 130.4
123.8 126.3
121.5 122.2
127.2 127.2
125.6 124.2
123.2 123.6
126.2 129.0

On considère que l’échantillonnage s’est effectué { partir de deux populations


normales de variances inconnues mais nécessairement égales.

Solution

1. Les hypothèses sont :


H0 : μ1 = μ2
H1 : μ1 ≠ μ2
186
2. 2. Les hypothèses de base supposent un échantillonnage aléatoire de
deux populations normales indépendances de variances inconnues et
inégales n1<30 ; n2<30.

3. α = 0.05

4.
̂ ̂

5. L’évaluation de k nous amène d’abord { trouver les moyennes et les


variances :


̂

̂

⁄ ⁄
( )

On obtient donc les valeurs critiques du t’ :


-t0.025 ;8=-2.306 et t0.025 ;8=2.306

6.

7. Accepter H0 car -2.306<-1.6022.306

Donc les deux procédés semblent produire des câbles dont la force de rupture
est égale.

6.12. Test sur une variance

Nous avons mentionné, lors des tests sur une moyenne que différents
échantillons d’une même population peuvent présenter des moyennes
différentes de celle de la population-mère. Il est de même pour la variance d’un
échantillon vis-à-vis de la variance de la population. On tentera donc ici de
vérifier une hypothèse sur la variabilité de la population { l’aide d’une mesure
échantillonnelle.
187
L’hypothèse nulle que l’on observe est : H0 :
Où est une valeur hypothétique comme μ0.

Le seul outil dont on peut disposer pour vérifier cette hypothèse est de
calculer la variabilité d’un échantillon aléaloire de taille n, tiré d’une population
normale, et de tenter avec un certain risque d’erreur de généraliser le résultat {
la population. Donc, la statistique S2 servira { éprouver l’hypothèse nulle.
Nous avons discuté à la section 3.36 de la distribution empirique de S 2.
Nous devons donc faire appel à la loi de 2. Les différents test sont résumés au
tableau suivant.

Hypothèse H1 Cas Distribution Zone de rejet de


H0
H1 : XN (de  
moyenne et de 
ou
variance
inconnues)
 
H1 : >> >>  
H1 : >> >>  

Exercice

La ville de Montréal veut acheter une certaine quantité de lampes


fluorescentes pour l’éclairage de son Métro. La ville est non seulement
intéressée à une longue durée de vie des lampes mais aussi à une dispersion
relativement faible. On décida que l’écart-type de cette caractéristique ne
devrait pas excéder 100 heures. Le laboratoire de la ville de Montréal a vérifié
20 lampes d’un fournisseur local et a obtenu une variance S2=12500 heures2.
Est-ce que les lampes du fournisseur sembler excéder la variation permise ?
Utiliser α=0.05

Solution

1. Hypothèse de base : échantillon aléatoire de taille n=20, tiré d’une


population normale (on suppose la durée de vie normalement
distribuée) de variance inconnue.
2. H0 : δ2=10000 (δ=100)
H1 : δ2>10000 (δ>100)
3. Α=0.05
4. Le test portera sur la statistique S2. Le rapport critique est :

5. Région critique
La valeur critique de  est  = 30.14
188
6. n = 20 S2 = 12500 ; alors :

7.  = 23.75<30.14 ; nous pouvons accepter H0. Il semble donc, d’après


l’évidence statistique, que le fournisseur respecte les exigences de la
Ville de Montréal sur la variabilité de la durée de vie des lampes
fluorescentes.

Exercice 2 (de la récapitulation)

On veut vérifier l’ajustement qu’un même mécanicien a effectué sur des


machines. Un échantillonnage de 10 pièces prélevé sur deux machines donne
les résultats suivants :
Machine 1 Machine 2
165 167 172 167
169 168 170 173
174 172 167 165
172 170 169 163
165 171 171 174

a) Peut-on conclure que les deux machines sont ajustées à la même valeur
centrale ?
Par expérience, on sait que la variance de la machine 1 est 4 et celle de
la machine 2 est de 6.
b) Appliquer le test de l’égalité de deux variances.
c) Supposons que les variances de ces deux populations sont inconnues.
Comment pouvez-vous, { partir des résultats dans b) tester l’hypothèse
de l’égalité de deux moyennes.
On retient l’hypothèse que les populations sont normales.

Solution

a) Il s’agit d’une hypothèse sur l’égalité de deux moyennes


1. L’hypothèse de base pose un échantillon aléatoire de deux
populations normales indépendantes de variances connues.
et
et
2. H0 :μ1 = μ2
H1 : μ1 ≠ μ2
3. α=0.05
4. le rapport critique est :

√ √
5. Région critique :
-Zα/2 = -1.96 et Zα/2 = 1.96
189

6.

7. -1.96<Zc<1.96 ; nous pouvons accepter H0.

b) Il s’agit d’un test d’hypothèse sur l’égalité de deux variances.


1. L’hypothèse de base pose un échantillon aléatoire indépendances
de deux populations normales de variances inconnues. On a :
Machine 1. Machine 2.
n1 = 10 n2 = 10
̂ = 10.5 ̂ = 10.5
= 165.5 = 169.1

2. H0 : =
H1 : ≠

3. α=0.05
4. la statistique sur laquelle porte le test est le quotient de deux
variances empiriques. Ordinairement, on place la plus grande
variance au numérateur.
Le rapport critique est alors :
̂
̂
qui est distribué suivant la loi de Fisher avec (n2-1) et (n1-1)
degrés de liberté.

5. Raison critique
Le test étant bilatéral, on aura : F0,975 ;9 ;9=0.248 et F0.025 ;9 ;9=4.03

6.

7. 0.248<Zc<4.03 ; nous pouvons accepter H0.

c) Comme l’évidence statistique nous a conduit { accepter l’hypothèse de


l’égalité de deux variances, nous allons donc appliquer le test sur
l’égalité des moyennes (de variances inconnues, mais supposés égales).
1. L’hypothèse de base pose un échantillon aléatoire de deux
populations normales indépendantes de variances inconnues mais
supposés égales ; n1<30 et n2<30
2. H0 :μ1 = μ2
H1 : μ1 ≠ μ2
3. α=0.05
4. comme n1≠n2, le rapport critique est :

qui est la réduction de t=


√ ̂ ̂
√ √

5. région critique : -tα/2=-2.101 et tα/2 = 2.101


190

6.

7. -2.101<tc<2.101 ; nous pouvons accepter H0.

6.13. Test d’hypothèses sur l’égalité de plusieurs proportions

La distribution de Khi-deux est aussi importante pour tester l’hypothèse sur


l’égalité de plusieurs proportions. Comme dans tout test d’hypothèses, les
étapes à suivre demeurent les mêmes comme dans les cas précédents. D’une
part, on a les fréquences observées, et d’autre part, les fréquences théoriques
qui serviront de calcul à la statistique du test à la quatrième étape. Plus,
particulièrement, nous formulons les hypothèses de la manière suivante :

H0 : 1 = 2 = … = k
H1 : au moins deux j sont différents

La statistique du test est c2 =  (O – E)2/ E . Cette statistique suit la loi de Khi-
deux à (n – 1) degrés de liberté. Si c2  T2, on rejette H0.

Il est { noter que, dans le calcule des valeurs théoriques, on part de l’hypothèse
que si toutes les proportions étaient identiques, alors :
p1 = p2 = … = p1 = p = (n1 + n2 + … + nk)/ (N1 + N2 + … + Nk), avec ni = nombre de
succès du groupe i, et Ni = taille de l’échantillon du groupe i.

Ceci permettra donc de construire une table à double entrée correspondant


aux fréquences théoriques et ; de ce fait, de calculer les fréquences théoriques
du problème.

Exercice 1

Dans l’usine U1, 75 ouvriers sur 150 sont favorables à la grève, tandis que dans
l’usine U2, 103 sur 200 sont favorables à la grève. Si { l’Usine U3, 112 sur 225 sont
favorables à la grève, peut-on dire que la proportion des ouvriers favorables à
la grève est la même dans ces usines ?

Solution

(1)Les données du problème peuvent être présentées sous forme d’un tableau
à double entrée :

U1 U2 U3 Total
Pour la grève 75 103 112 290
Contre la 75 97 113 285
grève
Total 150 200 225 575
191

(2) Formulation des hypothèses :


H0 : 1 = 2 = 3
H1 : au moins deux j sont différents

(3) Seul de signification :  = 0.05


(4) Statistique du test : c2 =  (O – E)2/ E avec dl = (3 – 1) = 2

(5) Construction de la règle de décision

5.99

(6) Les calculs requis

En supposant que la proportion des ouvriers favorables à la grève est


identique, on aura : p = (75 + 103 +113)/ (150 + 200 + 225) = 290/575 = 0.504. Ce
qui nous permet de calculer les fréquences théoriques (Ni.p).

U1 U2 U3 Total
Pour la grève 75.6 100.8 113.4 290
Contre la 74.4 99.2 111.6 285
grève
Total 150 200 225 575

On peut donc procéder au calcul de c2. Si cette valeur est plus grand que 5.99,
cela veut dire que l’écart entre les fréquences théoriques et observées est trop
grand pour être dû au hasard. Dans le cas contraire, on peut conclure à
l’égalité.

O E (O – E) (O – E)2 (O – E)2/E
75 75.6 -0.6 0.36 0.0048
103 100.8 2.2 4.84 0.0480
112 113.4 -1.4 1.96 0.0173
75 74.4 0.6 0.36 0.0048
97 99.2 -2.2 4.84 0.0488
113 11.6 1.4 1.96 0.0176

575 575 c2 = 0.1413


(7) Prise de décision.

On accepte H0 parce que 0.1413  5.99. On peut donc conclure que dans les
trois usines, la proportion de travailleurs en faveur de la grève est la même et
peut être évaluée à 50.4 %.
192
Exercice 2

Une entreprise vient de mettre au point une nouvelle couleur pour un appareil
portable et aimerait savoir si cette couleur semble plaire { un groupe d’âges en
particulier ou si elle semble attrayante quel que soit l’âge. Les résultats de cette
étude permettraient { l’entreprise d’orienter sa publicité.

Un sondage auprès de différents groupes d’âges de consommateurs donne les


résultats suivants :
 25 25-35 36-45 46 et plus
Plaît 104 122 68 41
Ne plaît pas 21 28 32 34
Total 125 100 100 75

Peut-on conclure que la proportion de consommateurs auxquelles la nouvelle


couleur plaît est la même quelque soit le groupe d’âge ?
Solution
(1) Le tableau à double entrée est le suivant :

 25 25-35 36-45 46 et Total


plus
Plaît 104 122 68 41 335
Ne plaît 21 28 32 34 115
pas
125 150 100 75 450

(2) Formulation des hypothèses :


H0 : 1 = 2 = 3= 4
H1 : au moins deux j sont différents

(3) Seul de signification :  = 0.05

(4) Statistique du test : c2 =  (O – E)2/ E avec dl = (4 – 1) = 3

(5) Construction de la règle de décision

7.81

(6) Les calculs requis

En supposant que la proportion des ouvriers favorables à la grève est


identique, on aura : p = (104 + 122 + 68 + 41)/ (125 + 150 + 100 + 75) = 335/450 =
0.74. Ce qui nous permet de calculer les fréquences théoriques.
193
 25 25-35 36-45 46 et Total
plus
Plaît 92.5 111 74 55.5 335
Ne plaît 32.5 39 26 19.5 115
pas
125 150 100 75 450

On peut donc procéder au calcul de c2.

O E (O – E) (O – E)2 (O – E)2/E
104 92.5 11.5 132.25 1.423
122 111 11 121.00 1.090
68 74 -6 36.00 0.486
41 55.5 -14.5 210.25 3.788
21 32.5 -11.5 132.25 4.069
28 39 -11 121.00 3.103
32 26 6 36.00 1.385
34 19.5 14.5 210.25 10.782

450 450 c2 = 26.126

(7) Prise de décision.

Rejet H0 parce que 26.13  7.81. On peut donc conclure que la proportion de
consommateurs auxquels la couleur plaît n’est pas la même selon les différents
groupes d’âges. D’après l’évaluation de 2, le groupe d’âge 46 et plus semble
celui qui diffère le plus des autres groupes.
194
195

Chapitre 7. Ajustement linéaireChapitre


et corrélation
Septième

justement linéaire et corrélation

7.1. Ajustement
Ajuster, c’est substituer une courbe continue, régulière, simple, aussi
fidèle que possible, { un nuage de points représentatif d’une série statistique.
Si le phénomène étudié est susceptible d’un ajustement linéaire, l’équation de
la droite d’ajustement de la forme :
Y=a+bX où Y : variable dépendante ; et
X : variable indépendante.

La méthode de recherche de la droite d’ajustement la plus couramment utilisée


est celle des moindres cadrés.

∑ ∑ ∑ ∑
̂ (1)
∑ ∑

∑ ∑ ∑ ∑
̂
∑ ∑ (2)

Les coefficients ci-dessus peuvent aussi s’écrire :


∑ où xt=Xt- et yt=Yt-
̂

a= -b

Pour simplifier les calculs dans les nombreux cas, ces coefficients peuvent être
aussi exprimés de façon suivante :


Où SXY désigne la covariance entre X et Y


désigne la variance de X
196
PS : Dans l’obtention de a et b, nous supposé que Y=f(x). mais nous pouvions
aussi supposé que X=f(y). Dans ce cas, nous aurons :
X’=a+bY
L’application de la méthode des MCO donne :
∑ ∑
∑ ∑

7.2. Corrélation
Il est en général possible d’étudier plusieurs variables sur une même
unité statistique.
Exemple :
Unité statistique Variable 1=X Variable 2=Y
Enfants d’une école Taille Poids
Année Revenue Consommation
Cadre d’une entreprise Age Salaire

On dit qu’il existe une présomption de corrélation entre X et Y si ces variables


sont en dépendance plus au moins marquée.

On calcule alors le coefficient de corrélation :


∑ ∑ ∑
√[ ∑ ∑ ][ ∑ ∑ ]

Pour simplifier les calculs, on utilise souvent la formule :


√[∑ ∑ ][∑ ∑ ]

r sera du signe de ∑
La corrélation est forte sur r voisin de +1 ou -1.
Si le coefficient de corrélation, r, négatif et voisin de -1, cela signifie que les
deux phénomènes peuvent être liés, mais qu’ils évoluent en sens inverse
(exemple prix et quantités vendus pour un produit).
Si r est positif et voisin de +1, cela signifie que les deux phénomènes évoluent
dans le même sens (exemple : revenu et consommation d’une année donnée).
On considère que la corrélation est significative si :
2

Conseils généraux

Attention : il ne faut pas tirer de conclusion trop rapide d’un calcul de


coefficient de corrélation ; il existe d’une corrélation ne prouve pas l’existence

2
P. BORENTIN & C. RAULET : "Techniques quantitatives de gestion G2", Tome 2, Bordas,
Paris, 185, p.86.
197
d’une relation de cause { effet entre les deux phénomènes étudiés. Par
exemple, pour une période donnée, on pourrait montrer l’existence d’une
corrélation entre les ventes de boisson gazeuses et les ventes de chapeaux de
soleil. Il n’y a aucun lien de cause { effet entre les deux phénomènes, mais ces
deux types de ventes sont fortement liés à la température extérieure.

7.3. La relation entre r, le coefficient de corrélation et ̂ , le


coefficient de régression
∑ ∑
̂
∑ √∑ ∑ (1)3

̂ et ̂

La relation ̂ ̂ peut donc s’écrire ̂ ( )


Le coefficient de corrélation a donc toujours le même signe que le coefficient
de régression.
En outre, si ̂ est le coefficient de régression inverse, c’est-à-dire le coefficient
de régression de X sur Y, on a :

̂

Ainsi, le produit

∑ (r² étant le coefficient de détermination)


̂̂
∑ ∑
7.4. Exercices
Exercice 1
On a étudié le revenu annuel moyen Ri et la consommation moyenne Ci des
habitants de Isangi pendant 6 ans. Les informations se trouvent rassemblées
dans le tableau suivant :
Ri Ci
i
(en milliers de Fc) (en milliers de Fc)
1 72 67
2 75 72
3 75 70
4 76 73
5 78 75
6 80 75

3
Il suffit pour cela de multiplier seulement le numérateur et le dénominateur par 1/N
198
a) Tracer sur le diagramme rectangulaire Or, Oc le nuage représentant les
points (Ri, Ci) et la droite obtenue en appliquant la méthode des
moindres carrés.
b) Présenter le calcul des coefficients de la droite d’ajustement
c) Calculer le coefficient de corrélation des 2 séries Ri et Ci.

Solution
I Ri (en 000Fc) Ci (en 000FC) RiCi R²
1 72 67 4824 5184 4489
2 75 72 5400 5625 5148
3 75 70 5250 5625 4900
4 76 73 5548 5776 5329
5 78 75 5850 6084 5625
6 80 75 6000 6400 5625
456 432 32872 34694 31152

a)
76
74
72
C

70
68
66
70 72 74 76 78 80 82
R

b) R = 456/6 = 76
C=432/6=72
B=40/38=1.0520
A=72-1.0520(76)=-8
L’équation de la droite d’ajustement est donc :
Ci=-8+1.0520 Ri

c) Soit r le coefficient de corrélation :


∑ ̅
√[∑ ][∑ ̅ ]

√[ ][ ] √

Il existe donc une relation assez forte entre revenu et consommation.


N.B. : Le numérateur et le premier terme du dénominateur avaient déjà été
calculés pour déterminer le coefficient b.
199

Exercice 2

Trouvez, en utilisant les données ci-dessous, les estimations ̂ et ̂ qui vont


nous permettre d’obtenir la droite empirique et calculer le coefficient de
corrélation r.
X = 0.3 ; 0.6 ; 0.9 ; 1.2 ; 1.8 ; 2.1 ; 2.4
Y = 10 ; 15 ; 30 ; 35 ; 25 ; 30 ; 50 ; 45
Où X représente les fertilisants ; et
Y représente la production d’un champs de maïs

Solution

X Y X² XY Y²
0.3 10 0.09 3 100
0.6 15 0.36 9 225
0.9 30 0.81 27 900
1.2 35 1.44 42 1125
1.5 25 2.25 31.5 625
1.8 30 3.24 54 900
2.1 50 4.41 105 2500
2.4 45 5.76 108 2025
10.8 240 18.36 385.5 8500

a)
̂

La droite de moindre carré sera :


Y=a+bX
Y=8.03+16.27X

b) Le coefficient de corrélation est :


∑ ∑ ∑
√[ ∑ ∑ ][ ∑ ∑ ]

Exercice 3

D’une distribution de 2 variables, on dispose des données suivantes :


R²=0.81 Sx=1.2 Sy=2.1 =5 = 10
Calculer les droites de régression
200
Solution

r=0.9
̂

On trouve donc :

Y = 2.1250 + 1.5750X
X = 0.1439 + 0.5143Y

PS : En multipliant b par b’ on retrouve le coefficient de détermination


(bb’=081)

Exercice 4

Soit la distribution ci-après :

Yi Xi
3 1
2 2
3 3
6 4
4 5

1. Ajuster une droite à ces données en utilisant la méthode des moindres


carrées d’après l’équation : Y = a+bX.
2. Calculer SXY ; SX et SY
3. Calculer R² et r

Solution

1. a=1.8 et n=0.6
Y = 1.8 + 0.6X
2. Sx = 1.41 ; Sy = 1.35 et SXY = 1.10
3. r = 0.5745 et R² = 0.33
201

Annexes
nnexes
202
203

Table des matières


able des matières

AVERTISSEMENT ......................................................................................... 3
PREFACE ..................................................................................................... 5
................................................................................................................... 7
CHAPITRE I. INTRODUCTION AUX CALCULS DES PROBABILITES ..................... 7
1.1. LE CONCEPT DE PROBABILITE ............................................................................ 7
1.2. QUELQUES PROPRIETES FONDAMENTALES ......................................................... 10
1.3. REGLE DE MULTIPLICATION ET PROBABILITE CONDITIONNELLE ................................ 10
1.3.1. Probabilité conditionnelle ............................................................... 11
1.3.2. Loi de multiplication de probabilité ................................................ 13
1.4. THEOREME DE PROBABILITE TOTALE ET THEOREME DE BAYES ................................. 16
1.4.1. Théorème de probabilité totale ...................................................... 16
1.5. L’INDEPENDANCE STOCHASTIQUE .................................................................... 20
1.6. ANALYSE COMBINATOIRE ............................................................................... 23
1.6.1. Arrangement ................................................................................... 23
1.6.2. Permutation .................................................................................... 23
1.6.3. Combinaison ................................................................................... 25
1.6.4. Le binôme de newton ...................................................................... 27
1.6.5. Le triangle de Pascal ....................................................................... 28
1.6.6. Le diagramme arborescent ............................................................. 29
1.7. EXERCICES DE RECAPITULATION ....................................................................... 34
1.8. SOLUTIONS ................................................................................................. 35
CHAPITRE 2. NOTION DE VARIABLES ALEATOIRES ...................................... 37
2.1. INTRODUCTION ........................................................................................... 37
2.2. VARIABLE ALEATOIRE DISCRETE ....................................................................... 38
2.2.1. V.a discrète et fonction de probabilité ............................................ 38
2.2.2. Espérance mathématique – Variance – Moment – Coefficient
d’asymétrie et coefficient d’aplatissement ............................................... 41
2.2.2.1. Espérance mathématique (E(X)) .............................................. 41
2.2.2.2. Variance de la v.a discrète ....................................................... 41
2.2.2.4. Le mode et la médiane d’une V.a discrète .............................. 44
2.3. VARIABLE ALEATOIRE CONTINUE ...................................................................... 54
2.3.1. V.a continue et fonction de densité ................................................ 54
Fonction de densité de probabilité............................................................ 55
2.3.2. Espérance mathématique et variance ............................................ 58
2.3.2.1. Espérance mathématique........................................................ 58
2.3.2.2. Variance ................................................................................... 58
204
2.3.2.3. Le mode et la médiane de la v.a continue ............................... 59
2.3.2.4. Moment de la v.a continue ..................................................... 59
2.3.3. Exercices .......................................................................................... 60
2.4. DISTRIBUTION DE PROBABILITES JOINTES : V.A DISCRETE ....................................... 70
2.4.1. Fonction de distribution de probabilités jointes ............................. 70
2.4.2. Fonction de répartition ................................................................... 72
2.4.3. Loi de multiplication et probabilité conditionnelle ......................... 73
2.5. DISTRIBUTION DE PROBABILITE BIVARIEE : V.A CONTINUE ...................................... 74
2.5.1. Fonction de densité jointe ............................................................... 75
2.5.2. Fonction de répartition ................................................................... 75
2.6. DISTRIBUTIONS MARGINALES .......................................................................... 77
CHAPITRE 3. LES LOIS DE DISTRIBUTION STATISTIQUE ................................ 79
3.1. INTRODUCTION ........................................................................................... 79
3.2. LES MODELES DISCRETS ................................................................................. 79
3.2.1. La loi binomiale ............................................................................... 79
3.2.1.1. V.a binomiale ............................................................................... 79
3.2.1.2. Fonction de probabilité ........................................................... 79
3.2.1.3. Moyenne et Variance .............................................................. 80
3.2.2. La loi hypergéométrique ................................................................. 81
3.2.2.1. Fonction de probabilité ........................................................... 82
3.2.2.2. Moyenne et Variance .............................................................. 82
3.2.2.3. Tendance de la loi hypergéométrique vers la loi binomiale ... 84
3.2.3. La loi de poisson .............................................................................. 85
3.2.3.1. Fonction de probabilité ........................................................... 85
3.2.3.2. Moyenne et Variance .............................................................. 85
3.2.3.3. Approximation de la loi Binomiale par la loi de Poisson ......... 85
3.2.3.4. Table de la loi de Poisson ........................................................ 86
3.3. LES MODELES CONTINUS ................................................................................ 91
3.3.1. La loi normale ................................................................................. 91
3.3.1.1. Définition ................................................................................. 92
3.3.1.2. V.a normale réduite ................................................................. 93
3.3.1.3. Approximation de la loi binomiale par la loi normale ............. 99
3.3.1.4. Approximation de la loi de Hypergéométrique par la loi
normale............................................................................................... 104
3.3.1.5. Approximation de la loi Poisson par la loi normale ............... 104
3.3.2. La loi de Khi-deux (x²) .................................................................... 105
Table de Khi-carré ............................................................................... 106
3.3.3. La distribution t de student ........................................................... 107
Table de t de student .......................................................................... 108
3.3.4. Distribution F de Fisher ................................................................. 109
Table de Fisher.................................................................................... 110
3.3.5. Distribution du Quotient de deux variances ................................. 111
3.3.6. Distribution uniforme .................................................................... 112
205
3.3.7. Distribution exponentielle ............................................................. 113
Calcul des probabilités d’une loi exponentielle .................................. 113
CHAPITRE 4. ECHANTILLONNAGE ............................................................. 117
4.1. THEORIE DE L’ECHANTILLON OU THEORIE DU SONDAGE ...................................... 117
4.2. INFERENCE ET ECHANTILLONNAGE.................................................................. 117
4.3. DISTRIBUTION D’ECHANTILLONNAGE .............................................................. 119
4.4. DISTRIBUTION D’ECHANTILLONNAGE DES MOYENNES ......................................... 121
4.4. DISTRIBUTION D’ECHANTILLONNAGE DES FREQUENCES OU DES PROPORTIONS ......... 123
4.6. DISTRIBUTION D’ECHANTILLONNAGE D’UNE SOMME OU D’UNE DIFFERENCE ............ 128
4.7. LA DISTRIBUTION DE LA VARIANCE EMPIRIQUE S² .............................................. 131
4.8. DETERMINATION DE LA TAILLE DE L’ECHANTILLON ............................................. 133
CHAPITRE 5 ESTIMATION......................................................................... 137
5.1. ESTIMATEUR ............................................................................................. 137
5.2. ESTIMATION PONCTUELLE ET ESTIMATION PAR INTERVALLE.................................. 139
5.3. INTERVALLE DE CONFIANCE DES PARAMETRES D’UNE POPULATION ........................ 139
5.4. INTERVALLE DE CONFIANCE DE LA MOYENNE  ................................................. 140
5.5. INTERVALLE DE CONFIANCE D’UNE PROPORTION Π ............................................. 144
Exercices .................................................................................................. 145
5.6. INTERVALLE DE CONFIANCE DES DIFFERENCES ET DES SOMMES ............................. 146
5.7. INEGALITE DE TCHEBYCHEFF ET INTERVALLE DE CONFIANCE DE LA MOYENNE ....... 148
5.8. LA DISTRIBUTION DE KHI-DEUX ET L’INTERVALLE DE CONFIANCE DE LA VARIANCE ET DE
L’ECART-TYPE................................................................................................... 150

CHAPITRE 6. TESTS D’HYPOTHESES .......................................................... 153


6.1. LA METHODE D’UN TEST D’HYPOTHESES .......................................................... 153
6.2. FORMULATION DES HYPOTHESES A CONFRONTER .............................................. 154
6.3. RISQUES D’ERREUR..................................................................................... 154
6.3.1. Erreur de première espèce (α)....................................................... 154
6.3.2. Erreur de deuxième espèce (ß)...................................................... 155
6.3.3. Réduction de α et β ....................................................................... 155
6.4. LES ETAPES D’UN TEST D’HYPOTHESE .............................................................. 155
6.5. TESTS D’HYPOTHESE SUR LA MOYENNE ........................................................... 156
6.6. TEST D’HYPOTHESES SUR UNE PROPORTION ..................................................... 161
6.7. TESTS D’HYPOTHESES SUR LA DIFFERENCE DE DEUX MOYENNES (ET DE DEUX
PROPORTIONS) ................................................................................................. 163
6.8. LA DISTRIBUTION F DE FISHER ET LE TEST D’HYPOTHESES SUR LA DIFFERENCE DE DEUX
VARIANCES ...................................................................................................... 167
6.9. DISTRIBUTION DE FISHER ET ANALYSE DE LA VARIANCE ....................................... 168
Test de SCHEFFE ...................................................................................... 172
6.10. AJUSTEMENT ANALYTIQUE ET TABLEAU DE CONTINGENCE. ................................ 174
Test de 2 et Efficacité d’un ajustement ................................................ 175
Distribution de 2 et Tableau de contingence ........................................ 179
206
6.11. TEST SUR DEUX MOYENNES AVEC VARIANCES INCONNUES ET SUPPOSEES INEGALES . 184
6.12. TEST SUR UNE VARIANCE ........................................................................... 186
6.13. TEST D’HYPOTHESES SUR L’EGALITE DE PLUSIEURS PROPORTIONS ........................ 190
CHAPITRE 7. AJUSTEMENT LINEAIRE ET CORRELATION ............................. 195
7.1. AJUSTEMENT ............................................................................................ 195
7.2. CORRELATION ........................................................................................... 196
Conseils généraux ................................................................................... 196
7.3. LA RELATION ENTRE R, LE COEFFICIENT DE CORRELATION ET , LE COEFFICIENT DE
REGRESSION .................................................................................................... 197
7.4. EXERCICES ................................................................................................ 197
ANNEXES ................................................................................................ 201
TABLE DES MATIERES .............................................................................. 203
207
208

Achevé d’imprimer à Kinshasa en Mai 2010 par :


GALIMAGE n°d’impression 050/0109
+243 89 815 99 05 – 99 119 66 80 – jrzhazo@yahoo.fr
© Tous droits strictement réservés à BOFOYA KOMBA, bofoya@yahoo.fr