Vous êtes sur la page 1sur 553

pour ingénieurs

3eédition

WILLIAM W. HINES
School of Industrial and Systems Engineering
Georgia Institute of Technology
DOUGLAS C. MONTGOMERY
Department of Industrial Engineering
Arizona State University
DAVID M. GOLDSMAN
School of Industrial and Systems Engineering
Georgia Institute of Technology
CONNIE M. BORROR
Department of Industrial Engineering
Arizona State University

Adaptation française
Emmanuelle Reny-Noiin
Département de mathématiques et de statistique
Université Laval

Révision scientifique
Luc Adjengue
Département de mathématiques
et de génie industriel
École Polytechnique de Montréal

CHENELIÈRE
EDUCATION
* » fl

e manuel est une adaptation de Probability and Statistics in Engineering, Fourth Edition
C de Hines, Montgomery, Goldsman et Borror. Il s’adresse aux étudiants inscrits à un
programme de baccalauréat en génie ou en sciences qui doivent suivre un premier cours de
probabilités et de statistique. La première partie de cet ouvrage est une solide introduction à
l’étude des probabilités, suffisante pour étudier les principales méthodes statistiques qui cons­
tituent la deuxième partie.
première partie est composée
variables
aléatoire, et le chapitre 3 porte sur les distributions conjointes. Les chapitres 4 et 5 traitent
respectivement des lois de probabilité discrètes et des lois de probabilité continues, et le cha­
pitre 6 étudie la loi normale.
La seconde partie comporte les sept chapitres subséquents. L’étude de la statistique débute
au chapitre 7 avec la statistique descriptive. Les distributions échantillonnais sont analysées au
chapitre 8, l’estimation de paramètres au chapitre 9, les tests d’hypothèses au chapitre 10, puis
l’analyse de la variance et les plans d’expériences au chapitre 11. Enfin, la régression linéaire
simple et la régression linéaire multiple sont respectivement les sujets des chapitres 12 et 13.
Chaque chapitre se termine par un résumé des formules importantes ainsi qu’une série
d’exercices remaniés, dont les réponses se trouvent en fin de volume.
Nous tenons à souligner d’une façon toute particulière le travail de Luc Adjengue (École
Polytechnique de Montréal), qui a réalisé la révision scientifique de cet ouvrage. Nous sou­
haitons également remercier les consultants Sofiane Ayad (École de technologie supérieure),
Mounira Groiez (École de technologie supérieure) et Nadir Hakem (Université du Québec en
Abitibi-Témiscamingue) pour leurs remarques avisées.
Les auteurs de l’édition originale, William W. Hines, Douglas C. Montgomery, David
M. Goldsman et Connie M. Borror, tiennent à remercier les personnes suivantes pour leur aide :
Christos Alexopoulos (Georgia Institute of Technology), Michael Caramanis (Université de
Boston), David R. Clark (Université de Kettering), J.N. Hool (Université d’Auburn), John S.
Ramberg (Université d’Arizona) et Edward J. Williams (Université du Michigan - Dearborn).
Leurs commentaires ont été d’une aide précieuse. Bien sûr, les auteurs remercient leurs familles
pour la patience et le soutien inconditionnels dont elles ont fait preuve tout au long de ce projet.

Un pictogramme renvoie à du matériel en ligne. Rendez-vous au www.cheneliere.ca/hines-montgomery.


Vous y trouverez des jeux de données pour résoudre certains exercices, des démonstrations supplémen­
taires ainsi qu’un complément au chapitre 11.
Chapitre 1 Une introduction aux probabilités...................... 1
1.1 Un retour sur les ensem bles........................................................... 2
1.1.1 Les sous-ensem bles............................................................. 3
1.1.2 Les opérations sur les ensem bles........................................ 4
1.2 Les expériences aléatoires et les espaces échantillonnaux.......... 6
1.3 Les événements............................................................................... 9
1.4 Les probabilités et leur déterm ination............................................ 10
1.4.1 L'estimation d'une probabilité fondéesur la pratique............ 11
1.5 Les espaces échantillonnaux finis et leur dénombrement............. 16
1.5.1 Les diagrammes en arbre...................................................... 16
1.5.2 Le principe de multiplication.................... 17
1.5.3 Les permutations................................................................... 18
1.5.4 Les combinaisons................................................................... 19
1.5.5 Les permutations d'objets semblables................................. 23
1.6 Les probabilités conditionnelles...................................................... 23
1.7 Les partitions, les probabilités totales et le théorème de Bayes . . 30
R ésum é........................................................................................... 33
Exercices......................................................................................... 34

Chapitre 2 Les variables aléatoires à une dimension . . 4-2.


2.1 Les fonctions de répartition............................................................ 44
2.2 Les variables aléatoires discrètes.................................................... 47
2.3 Les variables aléatoires continues.................................................. 50
2.4 Quelques caractéristiques des distributions................................. 53
2 .4.1 L'espérance m athém atique.................................................. 53
2 .4.2 La variance et l'é ca rt-typ e.................................................... 55
2 .4.3 Les moments d'une distribution .......................................... 57
2.5 Les fonctions d'une variable aléatoire............................................ 58
2 .5.1 Les événements équivalents................................................ 58
2 .5.2 Les fonctions discrètes d'une variable aléatoire................... 60
2 .5.3 Les fonctions continues d'une variable aléatoire continue. . 63
2 .5.4 L'espérance mathématique d'une fonction de X ................. 65
R ésum é............................................................ 70
Exercices......................................................................................... 71

Chapitre 3 Les distributions de probabilité conjointes............... 78


3.1 Les vecteurs aléatoires de dimension .......................................... 78
3.2 La distribution conjointe de deux variables aléatoires................... 79
3.3 Les distributions marginales............................................................. 84
3.4 Les distributions conditionnelles.................................................... 89
3.5 L'indépendance de variables aléatoires.......................................... 95
TABLE DES MATIÈRES

3.6 La covariance et la corrélation....................................................... 97


3.7 Les combinaisons linéaires............................................................... 100
Résum é...........................................................................................103
Exercices.........................................................................................104

Chapitre 4 Quelques lois de probabilité discrètes..................... 110


4.1 Les épreuves et la loi de Bernoulli................................................. 110
4.2 La loi binomiale............................................................................... 112
4.3 La loi géométrique......................................................................... 115
4.4 La loi de Pascal........................................................................... 119
4.5 La loi hypergéométrique................................................ . 120
4.6 La loi de Poisson............................................................................. 123
4.7 Quelques approximations............................................................... 126
Résum é........................................................................................ 127
Exercices.........................................................................................129

Chapitre 5 Quelques lois de probabilité continues . . . . 134


5.1 La loi uniforme continue................................................................... 134
5.2 La loi exponentielle........................................................................... 137
5.3 La loi gam m a................................................................................... 142
5.4 La loi de Weibull............................................................................... 145
Résum é.......................................................................................... 148
Exercices.........................................................................................149

Chapitre 6 La loi normale.................................................................... 154


6.1 La loi normale...................................................................................154
6 .1.1 Les propriétés de la loi normale............................................. 155
6.2 La propriété d'additivité de la loi normale.........................................163
6.3 Le théorème central lim ite...............................................................165
6.4 La loi lognormale.............................................................................173
6.5 La loi normale à deux variables....................................................... 176
Résum é...........................................................................................181
Exercices.........................................................................................183

Chapitre 7 La statistique en bref et la description


des données......................................................................190
7.1 Les concepts de base en statistique............................................... 190
7.2 La présentation graphique des données......................................... 192
7.2.1 Le graphique de points et le nuage de p o in ts .................... 193
7.2.2 Le tableau de fréquences et ('histogramme...........................195
7.2.3 Le diagramme en boîte........................................................... 200
7.2.4 Le diagramme en bâtons........................................................202
7.2.5 Le diagramme quantile-quantile............................................. 203
7.2.6 Le diagramme chronologique..................................................204
/
TABLE DES MATIÈRES

7.3 La description numérique des données............................................ 205


7.3.1 Les mesures de p o s itio n ......................................................... 205
7.3.2 Les mesures de dispersion.......................................................209
7.3.3 Les coefficients d'asymétrie et d'aplatissem ent.................... 213
7.3.4 Une mesure d'association: le coefficient de corrélation . . . 215
7.3.5 Les données groupées............................................................. 216
R ésum é.............................................................................................. 218
Exercices............................................................................................ 220

Chapitre S Les échantillons aléatoires et les


distributions échantillonnâtes.............................226
8.1 Les échantillons aléatoires................................................................. 226
8.2 Les statistiques et les distributions échantillonnales....................... 227
8.3 La loi du khi-carré............................................................................... 230
8.4 La loi f de S tu d e n t............................................................................. 233
8.5 La loi F de F ish e r............................................................................... 236
R ésum é............................................................................................. 238
Exercices........................................................................................... 239

Chapitre 9 L'estimation de param ètres..................................242


9.1 L'estimation ponctuelle.......................................................................242
9.1.1 Les propriétés des estim ateurs..............................................243
9.1.2 La méthode du maximum de vraisemblance.....................247
9.1.3 La méthode des mom ents...................................................... 251
9.2 L'estimation par intervalle de confiance à partir d'un
seul échantillon...................................................................................252
9.2.1 La moyenne d'une loi normale de variance connue............ 254
9.2.2 La moyenne d'une loi normale de variance in co n n u e........ 257
9.2.3 La variance d'une loi normale.................................................. 259
9.2.4 La proportion dans une population..........................................260
9.3 L'estimation par intervalle de confiance à partir
de deux échantillons.......................................................................... 263
9.3.1 La différence entre les moyennes de deux lois
normales de variance co n n u e ................................................263
9.3.2 La différence entre les moyennes de deux lois
normales de variances inconnues mais é g a le s..................... 265
9.3.3 La différence entre les moyennes de deux lois
normales de variances inconnues maisinégales.................... 267
9.3.4 La différence entre les moyennes de deux lois
normales dans le cas d'observations appariées.....................267
9.3.5 Le rapport des variances de deux lois norm ales.................269
9.3.6 La différence entre deux proportions......................................271
9.4 Les intervalles de prévision et les intervalles de to lé ra n ce .......... 272
9.4.1 Les intervalles de prévision....................................................272
9.4.2 Les intervalles de tolérance.................................................... 274
Résum é............................................................................................ 275
Exercices.......................................................................................... 276

»
TABLE DES MATIÈRES V

Chapitre 10 Les tests d'hypothèses...........................................2S2


10.1 Les concepts de base................................................................. 282
10.2 Les tests d'hypothèses à partir d'un seul échantillon................ 288
10.2.1 Les tests sur la moyenne d'une distribution
normale de variance connue........................................... 288
10.2.2 Les tests sur la moyenne d'une distribution
normale de variance inconnue....................................... 297
10.2.3 Les tests sur la variance d'une distribution
normale...........................................................................300
10.2.4 Les tests sur une proportion...........................................304
10.3 Les tests d'hypothèses à partir de deux échantillons................ 307
10.3.1 Les tests sur les moyennes de deux distributions
normales de variances connues.....................................307
10.3.2 Les tests sur les moyennes de deux distributions
normales de variances inconnues mais égales...............311
10.3.3 Les tests sur les moyennes de deux distributions
normales de variances inconnues mais inégales........ 314
10.3.4 Les tests rappariés......................................................... 316
10.3.5 Les tests sur l'égalité de deux variances.......................319
10.3.6 Les tests sur deux proportions.......................................322
10.4 Le test d'ajustement du khi-carré...............................................324
10.5 Les tests de tableaux de contingence.......................................329
10.5.1 Le test d'indépendance de deux variables
aléatoires catégoriques...................................................329
10.5.2 Le test d'homogénéité de r populations........................ 332
Résumé...................................................................................... 332
Exercices.................................................................................... 334

Chapitre 11 L'analyse de la variance et les


plans d'expériences................................................... 3AA
11.1 Le plan d'expériences à un seul facteur.................................... 344
11.1.1 Le modèle...................................................................... 346
11.1.2 L'estimation des paramètres du modèle........................ 349
11.1.3 La décomposition de la variabilité.................................. 349
11.1.4 La construction de la statistique du test global
de comparaison des moyennes.....................................351
11.1.5 Le plan d'expériences déséquilibré................................ 354
11.1.6 L'analyse des résidus et la validation du modèle.......... 355
11.1.7 Les comparaisons de moyennes deux à d e u x .............. 357
11.2 Le plan d'expériences en blocs aléatoires co m p le ts................ 361
11.3 Les plans factoriels à deux facteurs...........................................368
11.4 Le plan factoriel 2k .....................................................................377
11.4.1 Le plan 22 ..................................................................... 377
11.4.2 Le plan 2k avec trois facteurs ou plus.............................383
Résumé.......................................................................................384
Exercices.....................................................................................387
VIII TABLE DES MATIÈRES

Chapitre 12 La régression linéaire simple


et la corrélation................................................................396
12.1 La régression linéaire simple..........................................................396
12.2 Les tests d'hypothèses dans une régression linéaire simple . . 400
12.2.1 Les tests sur la pente de la droite de régression, /?,... 400
12.2.2 Le test sur l'ordonnée à l'origine de la droite
de régression, (50 ................................................................ 405
12.3 L'estimation par intervalle pour une régression linéaire simple . . 406
12.3.1 L'intervalle de confiance pour la pente /? ,..................... 406
12.3.2 L'intervalle de confiance pour l'ordonnée à l'origine /30 . . 407
12.3.3 L'intervalle de confiance pour la valeur moyenne
au point xQ.......................................................................... 407
12.4 La prévision de nouvelles observations...................................... 409
12.5 La validation et la qualité de l'ajustement du modèle
de régression................................................................................. 410
12.5.1 L'analyse des ré s id u s ........................................................ 411
12.5.2 Le coefficient de déterm ination.......................................414
12.6 Les transformations pour une droite............................................. 414
12.7 La corrélation................................................................................. 415
Résumé...........................................................................................420
Exercices......................................................................................... 421

Chapitre 13 La régression multiple...............................................4-28


13.1 Les modèles de régression multiple.............................................428
13.2 L'estimation des paramètres......................................................... 429
13.2.1 Les propriétés statistiques de p ...................................... 435
13.3 Les intervalles de confiance dans une régression
linéaire multiple.............................................................................. 437
13.4 La prévision de nouvelles observations......................................439
13.5 Les tests d'hypothèses dans une régressionlinéaire multiple . . 440
13.5.1 Le test de signification de la régression......................... 440
13.5.2 Les tests sur les coefficients de régression...................442
13.6 La qualité de l'ajustement et la validation dum odèle.................. 446
13.6.1 Deux coefficients de déterminationm u ltip le .................. 446
13.6.2 L'analyse des ré s id u s .......................................................449
13.7 La régression polynom iale........................................................... 451
13.8 Les variables indicatrices............................................................. 453
Résumé.......................................................................................... 456
Exercices........................................................................................ 457

Réponses aux exercices......................................................................... 464

Annexe.................................................................................................................... 509

Bibliographie 539

Index......................................................................................................................... 541
'* o génie et eo sciences appliquées, il faut s< * 4
î fiï|?

P
*> des systèmes comportant des mesures qui &Ct * - v v &V *

/
r~r divers facteurs d’influence. On dira une a '* ai
K /
« f O f» * g *

simplement de variables dans îe texte, ont un comportement ; f


m
f

£ 1 1 V tfl i l 11
S . - \ , V
. v

/
< I

V - * . • -

souhaitera modéliser à laide des probabilités. Les exemples de cc \


|| iti
î I i n
££-
-

probabilistes abondent: la durée de vie d'un système mécanique ou électronique,


la répartition des défaillances du matériel, la manifestation de phénomènes natu­
rels comme les taches solaires ou les tornades, Sa quantité de particules qu’émet
une source radioactive, la durée des déplacements liés à des activités de livraison,
le nombre d’accidents survenus pendant une journée sur le tronçon d’ene auto­
route ou le temps d ’attente aux guichets d'une banque.

Le terme « probabilité » est devenu d’usage courant pour indiquer dans quelle mesure on croit à
la possibilité qu’un événement donné se réalise. Les exemples ne manquent pas, tels que «il y a
une probabilité d’averses de 20 % » ou « la probabilité qu’un ordinateur de marque X fonctionne
pendant 10 000 heures sans incident est de 0,75 ». Le présent chapitre décrit les fondements, les
concepts de base et les méthodes à l’appui de tels énoncés précis et non équivoques.
L’étude systématique des probabilités s’est amorcée en France, au xvne et au xvme siècle,
par suite de l’étude des jeux de hasard. Comme cette discipline avait alors peu de fondements
mathématiques explicites, les gens l’envisageaient avec un certain scepticisme. Les choses ont
toutefois commencé à évoluer au xixe siècle, avec la conception d’un modèle probabiliste (une
description) du comportement des molécules dans un liquide. Ce phénomène porte aujourd’hui le
nom de «mouvement brownien», en l’honneur du botaniste anglais Robert Brown qui, en 1827,
a été le premier à l’observer. L’intérêt porté aux probabilités a aussi augmenté avec l’apparition
du téléphone au tournant du xxe siècle. En effet, la nécessité de créer une structure pour relier
physiquement les appareils téléphoniques entre eux ainsi que la grande variabilité de l’intervalle
entre les appels et de leur durée ont exigé l’élaboration de modèles probabilistes pour décrire le
comportement de ce système. Ce n’est que dans les années 1930 qu’on a conféré aux probabilités
une structure mathématique rigoureuse.
Dans ce chapitre, nous verrons une définition des probabilités, les propriétés qui en
découlent ainsi que des résultats et des méthodes utiles pour la résolution de problèmes. Les
chapitres 1 à 6 visent avant tout à vous faire comprendre et apprécier les probabilités, tout
en appliquant ces dernières à un éventail de situations réelles liées au génie et aux sciences en
général. Mentionnons que les probabilités sont liées à un vaste et riche champ mathématique,
lequel dépasse la portée du présent ouvrage.
CHAPITRE 1

Souhaitons que la lecture des chapitres 1 à 6 enrichira votre compréhension du monde qui
nous entoure et vous fournira une base solide pour l’utilisation des méthodes statistiques présen­
tées dans les chapitres subséquents. Ces méthodes statistiques touchent l’analyse et l’interprétation
de données, l’inférence à partir d’échantillons prélevés d’une population, ainsi que la conception
et l’analyse d’expériences et de données expérimentales. Leur bonne compréhension augmente
considérablement les capacités professionnelles de toute personne évoluant dans l’un des nom­
breux secteurs d’activité actuels où des données sont disponibles pour guider la prise de décision.

1.1 Un retour sur les ensem bles


Nous allons recourir à quelques éléments de la théorie des ensembles pour présenter les concepts de
base du calcul des probabilités. Un ensemble est une collection ou un groupe d’objets. On le désigne
habituellement par une lettre majuscule, telle que A ou B. On appelle « éléments de A » les objets qui
forment l’ensemble A. En règle générale, on écrit «x e A » si x appartient à l’ensemble A, et « x <£ A »
si tel n’est pas le cas. Pour définir un ensemble, on peut soit énumérer ses éléments ou en indiquer
une propriété caractéristique. Illustrons ces notions à l’aide de quelques exemples. Les accolades
dénotent ici un ensemble, et les deux points à l’intérieur d’une accolade doivent se lire « tels que ».

Exemple 1.1
L’ensemble formé des nombres entiers 5, 6, 7 et 8 est fini et compte quatre éléments. On peut le noter
A = {5, 6, 7, 8 }.
Les énoncés « 5 g A » et « 9 g A » sont ici tous deux vrais.

Exemple 1.2
On peut définir l’ensemble des voyelles de l’alphabet français en écrivant V = {a , e, i, o, u, y}. Une
autre façon de procéder consiste à indiquer une caractéristique propre à cet ensemble, en utilisant un
symbole, d’où
V ={* : * est une voyelle de l’alphabet français}.

Exemple 1.3
Soit A l’ensemble de tous les nombres réels compris entre 0 et 1 inclusivement. On pourrait définir cet
ensemble par une caractéristique propre et écrire
A = {x: x e R, 0 < x < 1},
où R représente l’ensemble de tous les nombres réels.

Exemple 1.4
L’ensemble B = (-3, +3} est identique à l’ensemble
R, x 2 —9},
où R représente encore une fois l’ensemble des nombres réels.
Une introduction aux probabilités

Exemple 1.5
Soit les points (x, y) qui appartiennent à une droite donnée A dans le plan réel. Les points (x , y) tels que
ax + by = csont des éléments de A. On a ainsi

A = {(x, y) '•x e

où R représente l’ensemble des nombres réels.

L'ensemble vide et l'ensemble universel


L’ensemble de tous les objets considérés porte le nom d’«ensemble universel » ou «ensemble
référentiel». On le désigne en général par U. L’ensemble vide est un autre ensemble particulier,
le plus souvent noté 0 . Illustrons ces deux concepts. Soit l’ensemble

On a ici l’ensemble des nombres réels R comme ensemble universel. L’ensemble A est mani­
festement vide, puisqu’il n’existe aucun nombre réel tel que 1. Soulignons que l’ensemble
{ 0 } * 0.

Le cardinal
Le nombre d’éléments d’un ensemble (son cardinal) a souvent de l’importance. Dans le
cas d’un ensemble A, on le note n(A). S’il s’agit d’un nombre fini, on est en présence d’un
ensemble fini. Un ensemble infini tel qu’on peut établir une correspondance biunivoque
entre ses éléments et les nombres naturels porte le nom d’« ensemble infini dénombrable ».
On appelle « ensemble non dénombrable » un ensemble constitué d’un nombre infini d’élé­
ments impossibles à compter. Ainsi, si a< b, alors A = {x e R, a <x < b] définit un ensemble
non dénombrable.

1 . 1.1 Les sous-ensembles


Soit deux ensembles, A et B. L’ensemble A est un sous-ensemble de l’ensemble ou est
inclus dans l’ensemble B (A c )Bis chacun de ses éléments appartient auss
Les ensembles Aet B sont dits «égaux» (A = B) si et seulement si A c
démontrer qu’il en résulte ce qui suit :
1. L’ensemble vide est inclus dans tout ensemble A.
2. Dans un ensemble U donné, tout autre ensemble A satisfait à la relation A a U.
3. Tout ensemble A est inclus dans lui-même (une relation réflexive), A c A .
4. Si A c B et B a C, alors A ci C (une relation transitive).
Fait intéressant, il découle de l’égalité d’ensembles que l’ordre dans lequel on énumère
leurs éléments n’a pas d’importance. Soit A = {a, b, c } et B = {c, a, b). Selon notre définition,
ces ensembles sont manifestement égaux. Il arrive aussi que des ensembles définis par des pro­
priétés caractéristiques différentes soient égaux. Prenons le cas de A = {x : e R, où x est un
nombre pair premier} et B ={x: x + 3 = 5}. Puisque le nombre entier 2 est le seul
premier, A = B.
CHAPITRE 1

1.1.2 Les opérations sur les ensem bles


Voyons maintenant quelques opérations sur les ensembles. Si A et B sont des sous-ensem bles
quelconques de l’ensemble universel U, les énoncés suivants s’appliquent :
1. Le com plém entaire de l’ensemble A (dans U) est l’ensemble de tous les éléments de U
qui n’appartiennent pas à A. On le note A. Autrement dit,
A = {x : x 6
2. L’intersection des ensembles A et B est l’ensemble des éléments qui appartiennent à la
fois à A et à B. On la note A n .BEn d’autres termes,
A o B —{x i x g A et x g B }.
Soulignons que A n B forme un ensemble qu’on pourrait désigner par une lettre quel­
conque telle C.
3. L’union des ensembles A et B est l’ensemble des éléments qui appartiennent à A ou
à B, sinon aux deux à la fois. On la note A u B :
A u B = {x: jc g A oujcg B (ou les deux)}.
Les opérations décrites ci-dessus sont illustrées dans les exemples qui suivent.

Exemple 1.6
Soit U l’ensemble des lettres de l’alphabet, d’où U ={* : * es
que A = {* : * est une voyelle} et B = {* : * est l’une des lettres ou c}. À pa
cédemment fournies, il s’ensuit que

A = l’ensemble des consonnes


B = {d, e,f, g,..., x, y, z}
A u B = {a,by c, e, i, o, u, y}
A n B = {a}.

Exemple 1.7
Supposons l’ensemble universel U = {1, 2, 3, 4, 5, 6, 7} et les trois sous-ensembles A = {1, 2, 3},
B = {2, 4, 6 } et C = {1, 3, 5, 7}. Il ressort directement des définitions citées précédemment que
A =-- {4, 5, 6, 7} B == {1,3, 5, 7} = C C == {2, 4, 6 } = B
A u B =={h 2, 3 ,4 ,6 } A u C == {1, 2, 3, 5,7} B u C == U
A n B == {2 } A n C == {1,3} B n C ==0 .

On peut représenter certaines opérations sur les ensembles par un diagramme de Venn.
Pour ce faire, on trace un rectangle figurant l’ensemble universel U. On dessine ensuite dans
ce rectangle un cercle qui délimite la région correspondant à un sous-ensemble A de U. La por­
tion du rectangle située à l’extérieur du cercle représente alors le complémentaire A, comme le
montre la figure 1.1.
■y r
* y .

*1 V / ' » * »

T n irj IT ftjK W V iir ,

Une introduction aux probabilités ■ »


H L1
^ '
. j v

nM f Un ensemble dans un diagramme de Venn

La figure 1.2 montre l’intersection et l’union à l’aide d’un diagramme de Venn.

a) A n B b)A uB

a) L'intersection entre A et B est ombrée; b) l'union de A et 6 est ombrée.

On peut facilement étendre les opérations d’intersection et d’union à tout nombre fini d’en­
sembles. Supposons qu’on a trois ensembles : A, B et Dans ce cas, A u S u C a comme pro­
priété que Au (BuC) = (A u )u C, ce qui ne fait aucun doute puisque les d
B
de l’équation sont identiques. On constate aussi que A n B n C = ( A n B ) n C = A n ( 5 n C ) .
Le tableau 1.1 présente quelques lois auxquelles obéissent les ensembles en ce qui a trait aux
opérations définies précédemment.
y/jk *YV*-m—
V P k/V
jH ^TïfaYJm1nY /AV«f«^25»iHV«TylLWT»V
| te TmJ1♦w ■
- m -

Lois Opérations |
Les lois d’identité Au 0 =A A r \ U =A
AuU=U An 0 =0
Les lois de De Morgan Aufi=Anfi Anfi=Aufi
Les lois associatives A u (B u C) = (A u fi) u C
A n (B n C ) = (A n B )n C
Les lois distributives A u (fi n C) = (A u fi) n (A u C)
A n (fi u C) = (A n fi) u (A n C) |

On peut illustrer certains de ces énoncés par un diagramme de Venn. Une démonstration
formelle s’avère en général plus longue.
Lorsqu’il y a plus de trois ensembles, on généralise en recourant à des indices. Supposons
ainsi que nest un nombre entier positif et que fi,, fi2, ..., Bn sont des ensembles donnés. En
pareil cas, fi, n B2 n ... n Bn correspond à l’ensemble des éléments qui appartiennent à tous
CHAPITRE 1

ces ensembles à la fois, et B xkj B 2 kj ... u B n, à l’ensemble des éléments qui ap


moins un de ces ensembles.

1.2 Les expériences aléatoires


et les espaces échantillonnaux
La théorie des probabilités découle de situations concrètes où l’on réalise une expérience pour
en observer le résultat, ce dernier étant impossible à prédire avec certitude.
On peut décrire l’ensemble des résultats possibles même si l’on ne peut prédire avec certi­
tude l’un ou l’autre de ces résultats. En second lieu, d’un point de vue conceptuel, on pourrait
répéter une telle expérience dans des conditions identiques et obtenir ainsi une suite de résultats
déterminés par le hasard ; mais lorsque le nombre de répétitions augmente, on commence à ob­
server certaines régularités en ce qui a trait à la fréquence des divers résultats.

Expérience aléatoire et espace échantillonnai


Une expérience aléatoire est une expérience dont le résultat dépend du hasard. Elle peut mener à des
résultats différents même si elle est conduite dans les mêmes conditions chaque fois. L’ensemble
des résultats possibles à l’issue d’une expérience aléatoire s’appelle «espace échantillonnai».
On utilisera ici les lettres % et pour représenter respectivement une expérience et son espace
échantillonnai. :

Classons maintenant les espaces échantillonnaux (et de ce fait les expériences aléatoires) en
reprenant la terminologie utilisée pour l’étude des ensembles et des opérations sur les ensembles.

Espaces échantillonnaux discret et continu


V • -i " ■ ^ . / * . f .

Un espace échantillonnai discret consiste en un ensemble fini ou en un ensemble infini dénombrable


. ' . . .... .• . '

de résultats. Par opposition, un espace échantillonnai continu consiste en un ensemble non dénom­
brable de résultats. - ■ :'

Ces derniers peuvent être des nombres réels compris dans un intervalle, ou des couples
de nombres réels à l’intérieur du produit d’intervalles, là où l’on déterm ine la valeur de deux
variables dans une expérience.
Voici quelques exemples présentant des expériences aléatoires et leur espace échantillonnai.

Exemple 1.8
%x: On lance une pièce de monnaie et on note sur quel côté elle tombe.
Sf, : {F, P).
On a ici un ensemble fini, car n(Sf,) = 2.

Exemple 1.9
On lance à trois reprises une pièce de monnaie et on note chaque fois sur quel côté elle tombe.
{PPP,FFFi FFF, FFF, FFF, FFF, FFF, FFF}.
Une introduction aux probabilités

f i . > *-.7 % v

Exemple 1.10
: On lance à trois reprises une pièce de monnaie et on note le nombre de fois où elle tombe sur le
côté pile.
Sf3; (0, 1,2,3).

Exemple 1.11
%a: On lance deux dés réguliers et on note le chiffre sur la face du dessus de chacun.
£f„ : ((1, 1), (1, 2), (1, 3), (1,4), (1, 5), (1, 6),
(2, 1), (2, 2), (2, 3),(2,4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3,4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4,4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5,4), (5, 5), (5,6),
(6, 1), (6, 2), (6, 3),(6,4), (6, 5), (6, 6)).
On a ici n(Sf4) = 36. On aurait pu choisir de représenter l’espace échantillonnai sans tenir compte
de l’ordre des résultats; on aurait alors n(ff4) ~ 21. Dans une telle représentation, les éléments de ff4
n’auraient pas tous les mêmes chances de survenir.

Exemple 1.12
%5: On assemble une portière de véhicule automobile en réalisant de nombreuses soudures. On ins­
pecte ensuite ces soudures et on note le nombre total de soudures qui sont défectueuses.
: {0, 1, 2 , . . K
},où K =le nombre total de soudures de la portière.

Exemple 1.13
%6: On fabrique un tube cathodique, puis on lui fait subir un essai de durée. On note le temps écoulé
(en heures) au moment où le tube connaît une défaillance.
SP6: {f: te R, t 0>).
On a ici un ensemble non dénombrable, car les résultats possibles sont des valeurs comprises dans un
intervalle de la droite réelle.

Exemple 1.14
%-j : Un gestionnaire compte le nombre d’appels reçus au service à la clientèle en une heure.
Sf7: {0,1,2,...}.
On a ici un ensemble infini dénombrable, car les valeurs possibles sont constituées de l’ensemble des
nombres entiers.
CHAPITRE 1

Exemple 1.15
%%’. On inspecte visuellement deux des principaux joints de brasure d ’un circuit im prim é; on les
vérifie à l’aide d’une sonde. Ensuite, chacun des joints est coté A (acceptable) ou D (défectueux,
ce qui entraîne une reprise ou une mise au rebut).
%: {AA, AD, DA, DD}.

Exemple 1.16
%g : Soit une usine de produits chimiques où l’on fabrique chaque jo u r entre 400 et 600 tonnes
métriques d’acide chlorhydrique. On choisit une journée au hasard et on note la quantité produite.
£f9: (x: jc e R, 400 < x < 600}.
On a ici un espace infini et non dénombrable.

Exemple 1.17
^ 10: Soit une usine d’extrusion où l’on fabrique des pièces métalliques profilées longues de 6 m.
Comme on enlève les bavures des barres à chaque extrémité, elles doivent initialement avoir
plus de 6 m. Après avoir fabriqué et fini une barre profilée, on mesure la longueur totale des
matières de rebut.
Sfl0: {x: ex R, x >
0 }.
On a ici un espace infini et non dénombrable.

Exemple 1.18
: À l’occasion du lancement d’un satellite, on mesure les trois composantes de sa vitesse à par­
tir du sol (c’est-à-dire dans les trois directions de l’espace), en fonction du temps écoulé. Une
minute après le lancement, on enregistre ces données pour les transm ettre à un appareil de
commande.
5fn : {(vx, v , v.) : vx, vy, v. sont des nombres réels}.
On a ici un espace à trois dimensions, théoriquement infini dans toutes les directions.

Exemple 1.19
%n : Reprenons l’exemple précédent, en mesurant cette fois continuellement les trois composantes de
la vitesse du satellite pendant cinq minutes.
On a ici un espace complexe, car il faut tenir compte de toutes les valeurs possibles des fonctions
vx(/), vv(t) et v_(r) lorsque 0 < t<
5.

Tous ces exemples présentent les caractéristiques requises d’une expérience aléatoire.
La description de l’espace échantillonnai est relativement simple, sauf pour l’exemple 1.19, et
même si on ne l’envisage pas ici, on pourrait idéalement répéter ces expériences. Reprenons
l’exemple 1.8 pour mieux voir le phénomène des manifestations aléatoires. Si l’on répète %,
à l’infini, on obtiendra de toute évidence une suite de «piles» et de «faces». Une régularité
Une introduction aux probabilités

dans les fréquences finira par apparaître. Comme la pièce utilisée est équilibrée, elle devrait
tomber sur le côté pile environ une fois sur deux. En faisant en sorte qu’un modèle soit idéal,
on se limite à convenir d’un ensemble théorique possible de résultats. Dans le cas de on a
éliminé la possibilité que la pièce tombe autrement qu’à plat.

Envisageons l’espace échantillonnai comme l’ensemble universel 17, c’est-à-dire l’ensemble


des résultats possibles d’une expérience aléatoire, ce qui fait de l’événement A, par exemple, un
sous-ensemble de Il faut noter que 0 et sont tous deux des sous-ensembles de c/1

É vénem ent
Un événement est un sous-ensemble de l’espace échantillonnai d'une experienc . On le
désigne par une lettre majuscule.

Les événements énumérés ci-dessous se rattachent aux expériences ..., ^ 10 décrites


à la section 1.2. Ce ne sont que des exemples parmi tous les événements qu’on pourrait définir
dans chaque cas.

Dans l’expérience %x, soit A : La pièce tombe sur le côté pile.


A = {P}.
Dans l’expérience soit B : La pièce tombe chaque fois sur le même côté.
B = {PPP, FFF}.
Dans l’expérience %3, soit C : La pièce tombe deux fois sur le côté pile.
C={2}.
Dans l’expérience %A, soit D : La somme des chiffres sur les faces du dessus
est sept.
D = {(1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)}.
Dans l’expérience %5, soit E : Il n’y a pas plus de cinq soudures défectueuses.
£ = { 0 , 1,2, 3, 4,5}.
Dans l’expérience %6, soit F : Il s’écoule plus de 1000 heures avant la défaillance.
F = { t: t> 1000}.
Dans l’expérience soit G : Le nombre d’appels est compris entre 3 et 6
inclusivement.
G = { 3, 4, 5, 6}.
Dans l’expérience soit : Aucun des joints n’est défectueux.
H = {A A ).
Dans l’expérience %9, soit J : La quantité d’acide produite est supérieure à 550 tonnes
métriques.
J = {x: x g R, 550 < x< 600}.
Dans l’expérience %lQt soit K : La longueur totale des matières de rebut ne dépasse
pas 1 m.
K — {x: jce R, 0 < x < 1}.

Comme un événement est un ensemble, les opérations, les lois et les propriétés étudiées
à la section 1.1 s’y appliquent.
CHAPITRE 1

Événements mutuellement exclusifs


Deux événements A,et A2s ont mutuellement exclusifs si O A2 = 0 . Les
et «disjoints» sont des synonymes de «mutuellement exclusifs».

Pour que trois événements A v A 2 et A 3 soient mutuellement exclusifs, il faut que A , n A 2


= 0 , Aj n A3 = 0 , A2 n A3 = 0 et que A x n A 2n A 3 = 0 . La figure 1.3 illustre ce cas. De façon
générale, lorsque l’intersection de chacune des combinaisons de deux ou plusieurs événe­
ments pris parm i k événements considérés est vide, on qualifie ces k événements de « m utuel­
lement exclusifs ».

1.4 Les probabilités et leur détermination


Une approche axiomatique permet de définir toute probabilité comme une fonction dont le
domaine est constitué d’ensembles, et l’image, de nombres réels compris entre 0 et 1. Si l’évé­
nement A est un élément du domaine de cette fonction, on peut utiliser la notation fonctionnelle
P (A) pour désigner l’élément correspondant de l’image, soit la probabilité que A se réalise.

Probabilité
Soit une expérience % et son espace échantillonnai Une probabilité /*(•) définie sur Sf est une
fonction qui, à tout événement A dans £f, associe un nombre réel P(A) appelé «probabilité de l’événe­
ment A » (ou probabilité de A), vérifiant les propriétés (axiomes) suivantes :
1. 0 < P(A) < 1 pour tout événement A de ïf.
2. P(<f) = 1.
3. Pour tout nombre fini k d’événements mutuellement exclusifs définis dans
!
; v , : L ; y
/
/

P(A, u A2 u ••• u Ak) =PiA J + P(A2) +■■■+ P(Ak).


W
Br
Ay. .. représentent une suite dénombrable d’événements mutuellement exclusifs
y
V
Si Ar A 2,
définis dans alors

* I

Ces propriétés n’indiquent pas comment déterminer les probabilités, mais elles im posent
des restrictions à cet égard.
i
Une introduction aux probabilités

Concrètement, on établit une probabilité en s’appuyant sur :


1. des estimations fondées sur la pratique ou sur des observations antérieures ;
2. une analyse des conditions expérimentales ;
3. une hypothèse.

1.4.1 L'estimation d'une probabilité fondée


sur la pratique
Une approche pratique basée sur les fréquence# reîetive#
Afin d’illustrer la détermination de probabilités fondées sur la pratique, on peut penser à la
répétition d’une expérience et à la fréquence relative de l’événement d’intérêt.
La notion de fréquence relative possède un attrait intuitif. Elle fait intervenir la répétition
conceptuelle d’une expérience et l’observation du nombre de répétitions ainsi que du nombre
de fois où l’événement souhaité se produit. Soit plus précisément une expérience % répétée
m fois et deux événements notés A et B. Représentons par mA et mB le nombre de fois où et
se produisent lors des m répétitions.

F ré q u e n c e r e la tiv e
La v a l e u r = mAlm se définit comme la fréquence relative de l’événement A. Elle présente les pro­
priétés suivantes :
1. 0 < / A< l .
2. f A= 0 si et seulement si l’événement A ne se produit jamais, et si et seulement si
l’événement A se produit à chaque répétition.
3. Si les événements A et B sont mutuellement exclusifs, alors/, uB -f A+fB.

Lorsque la valeur de m devient élevée, la valeur de f A tend à se stabiliser. Autrement


dit, plus on répète l’expérience, moins la fréquence relative de l’événement A varie (d’une
répétition à l’autre). La notion de fréquence relative et la tendance de cette fréquence à se
stabiliser sont à l’origine d’une méthode servant à attribuer une probabilité à un événement.
En effet, dans le cas d’une expérience % d’espace échantillonnai Sf, si la fréquence relative^
d’un événement A tend vers un nombre quelconque pA à mesure que le nombre de répétitions
augmente, on peut faire du nombre pA la probabilité de A. En d’autres termes, lorsque m —» <»,

P(A) = = p A- (1.1)
m
En pratique, on doit évidemment se satisfaire d’un nombre de répétitions plus limité. Prenons
l’exemple d’une expérience simple %, où l’on lance une pièce pour noter à chaque répétition si elle
tombe du côté pile (P) ou face (F). Puisque l’espace échantillonnai est S = {F, F}, on peut s’inté­
resser à l’événement A = {F}, défini avant d’effectuer les observations. Imaginons qu’au bout de
m = 100 répétitions de %, on observe que mA= 43, d’où une fréquence relative apparemment faible
de f A = 0,43. Supposons qu’on répète plutôt l’expérience m = 10 000 fois et que mA —4 924; on a
alors une fréquence relative de fA = 0,4924. Comme on dispose cette fois de 10 000 observations
au lieu de 100, on devrait avoir davantage confiance dans la deuxième fréquence relative obtenue,
soit 0,4924, comme valeur de F(A). Jusqu’à présent, la stabilité de/Alorsque la valeur de m est éle­
vée ne relève que d’une notion intuitive, ce qui sera examiné de façon plus précise ultérieurement.
CHAPITRE 1

La détermination d'une probabilité


Si l’espace échantillonnai contient une quantité dénombrable de résultats (ev e2, ...) dont les
probabilités respectives sont p v p v ..., alors la probabilité d’un événement A est la somme
des probabilités des résultats qui le composent. Plus précisément, on doit avoir p. > 0, pour
i = l , 2 , . . et p x + p 2 +••* = 1, donc
P (A )= X p,.
{i:ejeA}
Par exemple, si A = {e p ey e6}, alors P (A) = p 1 + p 3 + p 6. Nous étudierons plus loin, particuliè­
rement au chapitre 4, différents modèles permettant d’établir les valeurs de p v p 2, ...
* . ' . ■ 1_ - •* * — V

Résultats équiprobables
Si l’espace échantillonnai est fini et renferme nrésultats aya
alors on dit que ces résultats sont équiprobables. La probabilité associée à chacun est
1 ‘ \
P, = /? ,= • • • = P = —. !
1 2 n n

Si l’espace échantillonnai renferme n résultats tous équiprobables, alors

P(A) = (1.2)
n
et l’événement A englobe n(A) résultats possibles. Des méthodes de dénombrement utiles pour
déterminer la valeur de n et de n(A) seront étudiées à la section 1.5.

Exemple 1.20
Supposons que la pièce de monnaie de l’exemple 1.9 est biaisée et qu’elle a deux fois plus de chances
de tomber du côté «face» que du côté «pile», de sorte que les résultats de l’espace échantillonnai
Sf = {PPP, PPF, PF P, PFF\FPP, FPF, FFP, FFF) ont respectivement une probabilité de p x=
p 3 = ^ j , p 4 = Yj, p 5 = ^ , p 6 = Y j,p7 = ^j et p s = où e{ = PPP, e2 = PPF, et ainsi de suite. Soit A l’événe­
ment « la pièce de monnaie tombe chaque fois sur le même côté ». On a alors P (A) = + 27 = 3^■

Exemple 1.21
Reprenons l’exemple 1.14 et supposons qu’un modèle probabiliste a permis d’établir que

0,1,2,

où p ( représente la probabilité que le gestionnaire enregistre i appels en une heure. Soit A l’événement

P(A) = p X5 + p x6 0,116.
15! 16!
Une introduction aux probabilités

Exemple 1.22
Reprenons l’exemple 1.9, dans lequel on lance à trois reprises une pièce de monnaie. Comme on sup­
pose ici que la pièce est équilibrée, les huit résultats possibles sont équiprobables. Soit A l’événement
«la pièce tombe chaque fois sur le même côté». Selon l’équation 1.2,
n(A) 2
P(A
n 8
puisqu’il y a huit résultats possibles au total dont deux sont favorables à l’événement A .

Exemple 1.23
On tient pour acquis que les dés à l’exemple 1.11 sont équilibrés. Soit A l’événement «la somme des
chiffres sur les faces du dessus est sept». Selon l’équation 1.2, il y a 36 résultats possibles, tous équi­
probables, dont 6 sont favorables à l’événement A, d’où P(A) = 3^= z-

Voici quelques théorèmes importants en ce qui concerne les probabilités.

Si 0 . représente l’ensemble vide, alors P (0 ) - 0.

Démonstration
On sait que ^ = ^ u 0 e t que Sf et 0 sont mutuellement exclusifs. Il résulte ainsi de la propriété
n° 3 (voir à la page 10) que P(Sf) = P(Sf) + P (0 ), d’où P ( 0 ) = 0.

P(A) = 1 - P (A)

Démonstration
On sait que Sf= Au Aet que A et A sont mutuellement exclusifs. Il résulte ainsi
que P (O*) = P(A) + P (A), et comme P (^ ) = 1 selon la propriété n° 2, il s’ensuit que P (A) = 1 —P (A). ^

P(A U B) = P(A) + P(B) - P (A n B)

Démonstration
Le diagramme de Venn à la figure 1.4 ( voirà la page suivante) aide à s
théorème 1.3. On peut voir qu’il faut soustraire P (A B) de l’expression P(A) + P (B) afin d’éviter
de compter deux fois la probabilité associée à la région hachurée.
Sachant que A u B = A u (B n A), où A et (B n A) sont mutuellement exclusifs, et que
B = (A n B) u (B o ^ 4 . ou o et (5 o A) sont mutuel 16mont exclusifs^ il s ensuit c^ue
P(A kj B) = P (A) + P (B n A) et que P (B) = P(A n B ) + P(B n A). En effectuant la soustraction, on
obtient P(A u B) -P(B) = P(A) - P(A n B), d’où P(A u P(A) + P(B) - P(A n B).
14 CHAPITRE 1

Figure 1.4
non disjoints

P(A u B kjC) = P (A) + P(B) + P(C) - P(A n P (A n C) - P(B

Démonstration
On peut écrire A u f i u C = ( A u S ) u C e t recourir au théorème 1.3 étant donné que A (J B
représente un événement.

THEOREME 1.5 ■ * i .- -> :w

P(A, u A 2 u - u A ^ ) = J / ’fA,.) P(y4/ O >4 ■) + P(Aj O Ay O /4;. ) + •••


1= 1 1< / < y < * 1< / < j < r < k

+ ( - l ) Ar~1P(A I n A , n oA,)

THEOREME 1.6
Si A 5, alors P(A) < P(B).

Démonstration
Si A B, alors B= A U (A n fi) et P(Æ) = P(A) + P(A o ) puisque P (A n f i ) > 0
- ■ « — -•

Exemple 1.24
Soit A et B des événements mutuellement exclusifs (A n B = 0 ) , tels que représentés à la figure 1.5. S ’il
est établi que P(A) = 0,20 et que P(B) = 0,30, on peut ici évaluer plusieurs probabilités :
1. P (À) = 1 - P(A) = 0,80
2. P (B) = 1 - P(B) = 0,70
3. P(A k j B) = P(A) + P{B) = 0,20 + 0,30 = 0,50
4. P (AnB) = 0
5. P(A n B) = P(A kj B), selon la loi de De Morgan, d’où
= 1 - P ( A kj B)
= 1 - [P{A) + P(B)\ = 0,5. ►
Une introduction aux probabilités

Exemple 1.25
, (r « mA ‘• • ♦

Supposons que les événements A et fi ne sont pas mutuellement exclusifs. Si l’on sait que = 0,20,
que P (B) = 0,301et que P (A n B ) = 0,10, on obtient ce qui suit:
OO
73

1.
O
O

P(Â) = 1 -
II
s
SA

2. P{B) = 1 - • P(B) = 0,70


3. P(A u B):= P{A) + P(B) -- P(A r \ B ) = 0,2 + 0,3 - =0,1
0,4 =
4. B):= 0,1
A,
S
C

5. P(A n B):= P(A u B) = 1 - [P(A) + P(B) - P(A n fi)] == 0,6


La figure 1.6 illustre les probabilités associées à chacune des régions.

Les événements A et B associés à l'exemple 1.25

Exemple 1.26
Imaginons une ville où 75 % des gens lisent le journal (J), 20 % aiment l’art impressionniste (/) et 40 %
sont mélomanes (A /). Du nombre, 15 % lisent le journal et aiment l’art impressionniste, 30 % lisent
le journal et sont mélomanes, 10 % aiment l’art impressionniste et sont mélomanes, et 5 % lisent le
journal, aiment l’art impressionniste et sont mélomanes.
On peut réunir tous ces renseignements à l’intérieur d’un simple diagramme de Venn (voir la figure 1.7,
à la page su)ivante, en y inscrivant d’abord la dernière donnée fournie, soit P(J n n Af) = 0,05, pour
ensuite procéder à partir du centre. ^
CHAPITRE 1

s/
f

/o ,3 5 0 )
V / '\ a o 5 / \ J
X A ^ N ^ /o ,0 5 \ y
'f

V 0,05 J
i
1

j
M
i

** * / y * 'l . 't * • . » ', * • r**-

Un diagramme de Venn associé à l'exemple 1.26


- ~ 3 t* ’T **

% F . . I V . w I . i. F F k A . V l
• . ‘1 | ^ F f * . F " i j JB .w — » . .

! » , . v a v i k • > . . ' 4 < — 4 ____j w

1. Déterminons la probabilité qu’un habitant de cette ville, choisi au hasard, présente au moins
une des trois caractéristiques à l’étude. Selon le théorème 1.4,

P ( i u / u M ) = P (J) + P(I) + P(M) - P{J n i ) - P (J n M ) - P(I


= 0,75 + 0,20 + 0,40 - 0,15 - 0,30 - 0,10 + 0,05 = 0,85.

On peut aussi additionner les valeurs du diagramme de Venn pour arriver à cette réponse.
2. Déterminons la probabilité qu’un habitant de cette ville ne présente qu’une seule des trois
caractéristiques. Le diagramme de Venn révèle que cette probabilité correspond à

P(J n T n M ) + P (J n i n M ) + P (J n i n M ) = 0,35 + 0 + 0,05 = 0,40.

1.5 Les espaces échantillonnaux finis


et leur dénombrement
Cette section porte uniquement sur les résultats équiprobables. Pour être en mesure d’établir
une probabilité selon P (A) = n(A)/n, il faut pouvoir déterminer la valeur de n, soit le nombre
de résultats possibles, et celle de n(A), soit le nombre de résultats favorables à l’événement A.
Lorsque l’expérience est très simple, comme le lancer de dés ou d’une pièce de monnaie, il est
aisé d’établir le nombre de résultats possibles ou favorables. Par contre, si on s’intéresse à la proba­
bilité d’obtenir au moins deux as lorsqu’on pige cinq cartes à jouer, le nombre de résultats possibles
est beaucoup plus difficile à cerner. Il en va de même si on choisit au hasard des pièces d’une chaîne
de production et qu’on souhaite quantifier la probabilité d’en obtenir au moins une défectueuse.
Il faudra dans ces situations faire appel à différentes techniques de dénombrement pour
évaluer n et n(A). Nous discuterons ici de diagrammes en arbre, du principe de multiplication,
de permutations d’objets semblables et de combinaisons.

1.5.1 Les diagrammes en arbre


Dans le cas d’une expérience simple, un diagramme en arbre peut s’avérer utile pour le dénom ­
brement de l’espace échantillonnai. Reprenons l’exemple 1.9, dans lequel on lance à trois
reprises une pièce de monnaie équilibrée. On pourrait définir l’ensemble des résultats possibles
de cette expérience en suivant chacun des trajets du diagramme en arbre à la figure 1.8. Notez
qu’il y a deux résultats possibles à chaque essai, qu’on effectue trois essais et que l’ordre
des résultats aux trois essais est pris en compte (autrement dit, PPFyPFP et FPP sont considérés
Une introduction aux probabilités

comme trois résultats distincts de l’expérience). On a donc un total de 23 = 8 résultats {PPP,


PPF, PFP, P FF, FPP, F P F, FFP, FFF}.

Premier Deuxième Troisième Résultat de


essai essai essai l’expérience
PPP

PPF
PFP

PFF

FPP

FPF
FFP

FFF I
i
»
»

Le diagramme en arbre d'une expérience dans laquelle on lance à trois reprises


une pièce équilibrée

1.S.2 Le principe de multiplication


Si les ensembles A x, A 2, ..., A k comptent respectivement n x, n2, ..., nk éléments, il existe
«j ♦ n2......n k façons de choisir un élément de A,, puis un élément de A 2, e t ainsi de suite
jusqu’à un élément de A k.

Principe de multiplication
Supposons une expérience % composée de kétapes, et que :
• il y a », façons de réaliser l’étape l ;
• il y a n, façons de réaliser l’étape 2 (pour chaque issue de l’étape l) ;
• etc. ;
• il y a ?ik façons de réaliser l’étape k (pour toutes les issues des étapes précédentes).
Alors, l’espace échantillonnai de % contiendra n, x x ••• x n k résultats possibles.
Si à chaque étape de l’expérience les n issues sont équiprobables, alors les n x n2 x ••• x n, résultats de
l’expérience globale le seront aussi.

Dans le cas particulier où n l = n 2 = ••• = nk = n, il y a nk choix possibles. Cette situation a


été observée à la figure 1.8.

Exemple 1.27
Imaginez qu’on lance une pièce et un dé équilibrés. Les deux résultats possibles de l’étape 1, soit
{P, F}, sont équiprobables, tout comme les six résultats possibles de l’étape 2, soit {1, 2, 3, 4, 5, 6}.
Puisque n, = 2 et n2 = 6, l’expérience dans son ensemble présente 12 résultats possibles, tous équi­
probables. Cette expérience étant simple, on peut aisément procéder à un dénombrement complet à
l’aide d’un diagramme en arbre (voir la figure 1.9, à la page suivante). ►
CHAPITRE 1

/
Étape 1 Étape 2
1
2
3
P 4
5
6
Sf = {(P, 1), ,2), (P, 3), (P, 4), (P, 5), (P, 6),
(P
1 (P, 1), (P, 2), (P, 3), (P, 4), (P, 5), (P, 6)}
2
3
F
4
5
6
*

Le diagramme en arbre associé à l'expérience en deux étapes de l'exemple 1.27

Exemple 1.28
Soit un processus de production où l’inspection en cours de fabrication est très limitée. Une fois les
produits finis, on les achemine à une aire d’examen où quatre personnes en vérifient chacune une
caractéristique différente. La première de ces personnes attribue aux unités produites l’une ou l’autre
de quatre cotes ; la deuxième, l’une ou l’autre de trois cotes ; et les deux autres, l’une ou l’autre de deux
cotes chacune. Chaque personne inscrit sur l’étiquette d’identification du produit la cote attribuée selon
la caractéristique examinée.
Il y a un total de 4 • 3 • 2 • 2 = 48 inscriptions possibles pour une unité donnée.

1.5.3 Les perm utations

P e rm u ta tio n
Une permutation consiste en un arrangement ordonné d’objets distincts. Deux perm utations diffèrent
l’une de l’autre si leur contenu n’est pas le même ou si leurs éléments sont ordonnés différem m ent.
• . ■ • , ^ . I . • ■ ...

■* - '
.
X ■■ . * *’ . •• * ï
.
* . * * " .
.
■;
*.
*
1 • < •
; . . ;
* .

Considérons l’exemple de quatre jetons se distinguant chacun par une lettre différente, a, b,
c ou d.Voici toutes les permutations de ces jetons pris un à la fois :
a
b
c
d.

Voici toutes les permutations de ces jetons pris deux à la fois :

ab bc
ba cb
ac bd
ca db
ad cd
da de.
Une introduction aux probabilités

Puisqu’il y a quatre lettres possibles à la première position, puis trois lettres restantes pour la
deuxième position, le principe de multiplication nous aurait permis de vérifier que le nombre de
permutations possibles est 4 x 3 = 12. Notons que les permutations et ba diffèrent l’une
de l’autre parce que leurs éléments ne sont pas dans le même ordre, tandis que les permutations
ac et ab diffèrent l’une de l’autre parce que leur contenu n’est pas le même.
Prenons le cas de n objets distincts à partir desquels on veut obtenir des per
r objets (r< n ). Le choix du premier objet a n résultats possibles, le choix du deuxième, (n — 1) ré­
sultats possibles, et ainsi de suite jusqu’au choix du r-ième, qui a [n —(r —1)] résultats possibles.
L’application du principe de multiplication nous permet d’établir la formule générale suivante.

Permutations de r objets choisis parmi n objets


Le nombre de permutations possibles de r objets distincts choisis parmi n objets distinct

P" n( n—l)(n —2)(n —3) (n —r+ 1)


ni
(n —r)\
Soulignons que Pni et1. que 0!

Exemple 1.29
Une équipe de baseball des ligues majeures compte en général 25 joueurs. La formation à l’attaque se
compose de 9 de ces joueurs dans un ordre donné. Il y a donc P *5 = 7,41 • 1011 formations possibles.

1.5.4* Les combinaisons

Combinaison
Une combinaison consiste en un arrangement d’objets distincts et ne diffère d’une autre que si son
contenu n’est pas le même. L'ordre n’a ici aucune importance.

Voici toutes les combinaisons possibles de deux jetons pris parmi quatre jetons qui portent
chacun une lettre différente, a, b, c ou d:
ab
ac
ad
bc
bd
cd.
Puisqu’il y a 2 ! = 2 façons de permuter deux objets, la liste des combinaisons est deux fois plus
courte que la liste des permutations de deux objets choisis parmi quatre.
Voyons comment déterminer le nombre de combinaisons possibles de n objets distincts pris
r à la fois. On sait que le nombre de permutations P? indique le nombre de façons différentes
de choisir r objets parmi n et d’ordonner ensuite ces r objets. On sait aussi qu’il y a r ! façons
d’ordonner r objets distincts. On peut en déduire le nombre de combinaisons.
CHAPITRE 1

Combinaisons de r objets choisis parmi objets


Le nombre de combinaisons de r objets distincts choisis parmi n objets distincts est défini par
\
n p rn n f:
C" (1.3)
vr y r\ r\(n — r)!

Pour nos besoins actuels, on a défini le terme (”) dans les cas où n et r sont des nombres
entiers tels que 0 < r < n. Ce terme peut toutefois être défini de façon générale pour un nombre
réel n et tout nombre entier non négatif r. On peut aussi écrire
\
n n(n —1)(n —2) (n —r + 1)
r J r\

Le terme (”) porte le nom de « coefficient binomial » en raison de son utilisation dans le théo­
rème du binôme :
n \
n n r
(a + b )n a rb —

(1.4)
r=0 r J

Exemple 1.30
Une équipe de l’Association nationale de basketball (NBA) compte habituellement 12 joueurs. La
formation partante se compose de 5 de ces joueurs dont l’ordre n’a pas d’im portance. Il y a, par
conséquent,
12 A 12 !
792 formations partantes possibles.
5 J 5 !7 !

Voici deux identités utiles pour la résolution de problèmes

n
r n
\
(1.5)
r n —r

et
\ \ N
n n —1 n —1
+ ( 1.6)
r J r —1 J r
J
On peut expliquer le résultat de l’équation 1.5 en posant
( n n\ n\
\
n
r J r\{n —r)\ (n —r)!r! n -r

on en remarquant que le nombre de façons de « choisir » r objets parm i n est équivalent au


nombre de façons d’«exclure» n — r objets parmi n. Le résultat de l’équation 1.6 se justifie
mathématiquement en développant le membre de droite et en regroupant les termes sem blables.
Une introduction aux probabilités

Le nombre de sous-ensembles possibles


Un ensemble fini de néléments comprend 2n sous-ensembles. On peut le vérifie
principe de multiplication en considérant que chaque élément peut être présent ou absent d’un
sous-ensemble donné (2 possibilités). On a donc un total d e 2 x 2 x ... x 2 = 2" sous-ensembles
possibles. On peut aussi le vérifier à partir du théorème du binôme ( l ’é quation ) en
utilisant a —b= 1, comme suit :

Le membre de droite de cette relation indique le nombre total de sous-ensembies. puisque (")
représente le nombre de sous-ensembles vides, (”), le nombre de sous-ensembles formés de
un élément, et ainsi de suite jusqu’à qui représente le nombre de sous-ensembles formés
de n éléments. On appelle parfois «ensemble-puissance» l’ensemble contenant tous les sous-
ensembles possibles d’un ensemble d’éléments.

L'échantillonnage dans une population composée


de deux groupes
Généralisons la situation d’échantillonnage précédente en supposant une population de N élé­
ments dont Dappartiennent à une classe donnée. On tire de cette population un échantillo
aléatoire de taille n, sans remise. Soit A l’événement « l’échantillon renferme exactement r élé­
ments appartenant à la classe donnée ». On a alors
N- D

r e (max (0, n + D —N ) , ..., min {n, D)}.

Les problèmes de ce type sont appelés « problèmes d’échantillonnage hypergéométrique ».

Exemple 1.31
On sait que 5 % des 100 unités d’un lot de production sont défectueuses. On en tire un échantillon
aléatoire de 10 unités, sans remise. Quelle est la probabilité que cet échantillon ne renferme aucune
unité défectueuse ?
On compte le nombre d’échantillons possibles et le nombre d’échantillons favorables à l’événement A
«il n’y a aucune unité défectueuse». Le nombre d’échantillons possibles égale (^ q0) = -^ 5 7 et Ie
nombre de cas favorables à A , © • © . On a ainsi

\ \
5 95 5! 95!
0 A 10 J 0 !5 !10185!
P{A) 0,58375.
100 ^ 100!
10 J 10!90!
CHAPITRE 1

Exemple 1.32
Les méthodes de dénombrement peuvent servir à calculer la probabilité de diverses mains au
poker. Avant d’aller plus loin, mentionnons deux termes utiles : la « valeur » d’une carte tirée d’un
jeu ordinaire de 52 cartes peut être deux, trois,..., dame, roi ou as; et sa «couleur», trèfle, carreau,
cœur ou pique. Au poker, on tire cinq cartes du jeu au hasard. Le nombre de mains possibles est de
(552) = 2 598 960.
1. Calculons d’abord la probabilité d’obtenir une main renfermant exactement deux paires telles
que Av, Aa , 3v, 3 a, 10a . Voici la démarche réalisée.
a) On détermine deux valeurs différentes associées aux paires (as et 3, par exemple).
Il y a ( 23) façons de le faire.
b) On sélectionne deux couleurs différentes (V, A , par exemple) pour la première paire. Il y
a (2) façons de le faire.
c) On sélectionne encore deux couleurs différentes (V, ♦, par exemple) pour la deuxième
paire. Il y a (2) façons de le faire.
d) On choisit une autre carte pour compléter la main. Il y a 44 possibilités, car on veut
exclure les cartes ayant la même valeur que les deux paires.
Par conséquent, le nombre de façons d’obtenir deux paires est de

n(2 paires) = 123 552,

123 552
P(2 paires) = 0,0475.
2 598 960

2. Calculons maintenant la probabilité d’obtenir une main pleine, soit une paire et un brelan
(trois cartes de la même valeur), par exemple Av, AA, 3v, 3#, 3a .
a) On choisit deux valeurs différentes et ordonnées : une pour la paire et une pour le brelan
(as et 3, par exemple). Il y a P213 = 13*12 façons de le faire. Il faut que les valeurs soient
ordonnées parce que trois as et deux 3 diffèrent de deux as et trois 3.
b) On sélectionne deux couleurs différentes (V, A, par exemple) pour la paire. Il y a (2) façons
de le faire.
c) On choisit trois couleurs différentes (V, ♦, A, par exemple) pour le brelan. Il y a (3) façons
de le faire.
Par conséquent, le nombre de façons d’obtenir une main pleine est de

«(main pleine) = 13*12 3744,

3744
P(main pleine) 0,00144.
2 598 960 ►
Une introduction aux probabilités

3. Pour terminer, calculons la probabilité d’obtenir cinq cartes de la même couleur (une quinte
ou un flush, en anglais).
a) On choisit une couleur. Il y a (*) = 4 façons de le faire.
b) On choisit cinq cartes de cette couleur. Il y a ('53) = 1287 façons de le faire.
Par conséquent, on a

5148
P(quinte) 0,001 98.
2 598 960

1.S.S Les permutations d'objets s e m b la b le s


Soit k classes distinctes dont chacune est formée d’objets indiscernables les uns des autres à l’in­
térieur de cette classe. On arrive alors au résultat ci-après, où nx représente le nombre d’objets
dans la première classe, n2,le nombre d’objets dans la deuxième classe, et ainsi de
nk, le nombre d’objets dans la &-ième classe, et où n{+ n2+ ••• + nk = n.

Permutations d'objets semblables


Le nombre de façons de permuter objets répartis en k :s contenant respectivement n objets
indiscernables à n. objets indiscernables est:

Exemple 1.33
Prenons le mot « Tennessee ». On découvre que les permutations possibles des lettres de ce mot sont
au nombre de

9!
3780.
1!4!2!2!

Les problèmes de ce type sont appelés « problèmes d’échantillonnage multinomial ».

Les méthodes de dénombrement présentées ici servent avant tout à déterminer les proba­
bilités lorsqu’il existe un nombre fini de résultats possibles tous équiprobables. Il importe de
%

retenir qu’il s’agit là d’un exemple particulier des types plus généraux de problèmes associés
aux probabilités.

1.6 Les probabilités conditionnelles


Nous avons vu à la section 1.3 qu’un événement est un sous-ensemble de l’espace échantillon­
nai ££ Toutes les probabilités étudiées à la section 1.4 étaient liées à l’espace échantillonnai dans
son ensemble. On a utilisé la notation P(A) pour désigner ce type de probabilités, mais on aurait
aussi pu écrire P(A|£0, ce qui se lit «la probabilité de A sachant que le résultat est dans l’espace
CHAPITRE 1

échantillonnai Sf ». Il faut parfois réévaluer les probabilités d’un événement pour ten ir com pte
d’une information supplémentaire sur le résultat. On voudra déterm iner la probabilité que A
survienne sachant que B s’est réalisé. Quelques exemples devraient aider à clarifier les choses.

Exemple 1.34
Soit un groupe de 100 individus dont 40 sont diplômés universitaires, 20 sont travailleurs autonom es et
10 appartiennent à ces deux catégories. Si B représente l’ensemble des diplômés ayant au m oins un b ac­
calauréat et A, l’ensemble des travailleurs autonomes, alors A n 5 représente l’ensem ble des bacheliers
qui sont travailleurs autonomes. On veut choisir un individu au hasard à l’intérieur de ce groupe. Si
l’on tient compte de tout l’espace échantillonnai, on aura ici ) = 0,2, P (B) = 0,4 et P (A o 0,1.
Supposons maintenant qu’on s’intéresse à l’événement A| ,soit «ch
B
compte, sachant qu’il est bachelier». L ’espace échantillonnai est manifestement réduit puisqu’on pigera
dans l’ensemble des diplômés universitaires (voir la figure 1.10). La probabilité P(A\B) correspond à

10 _ n(A o B) _ n(A n B)/n P(A o B)


= P{A\B) =
40 ~~ n(B) ~ n(B)/n P(B)

a) L'espace échantillonnai initial; b) l'espace échantillonnai réduit

Exemple 1.35
Prenons maintenant l’exemple d’un échantillon formé de 2 unités tirées au hasard d ’un lot de 10. O n
sait que 7 des unités de ce lot n’ont pas de défaut et que les 3 autres en ont. Soit A l’événem ent « la p re ­
mière unité choisie n’a pas de défaut» et B
, l’événement «la deuxième u
Si l’on procède sans remise, c’est-à-dire sans remettre la première unité dans le lot avant d ’en tire r
la deuxième, alors
1
P(A)
10

et

6
P(B\A)
9

remise, c’est-à-dire si l’on remet la première


seconde, la probabilité conditionnelle P(Æ|A) = P (B) — et les événements A
dants». On présentera plus loin une définition formelle de toute probabilité conditionnelle P{A\B)
on examinera en détail la notion d ’indéDendance.
Une introduction aux probabilités
]

Exemple 1.36
Reprenons l’exemple 1.11, dans lequel on lance deux dés réguliers. Les 36 résultats possibles sont
illustrés à la figure 1.11. Soit deux événements:
A = {(dl, d 2) : d l 4},
B = { ( d l, d 2) : d 2> d l},
où d, représente le chiffre sur la face du dessus du premier dé et le chiffre sur la face du dessus
du second dé. On a alors P(A) = ^ , P(B) = P(A n = P{B\A) = | et P(A\B) = ^
ces probabilités en examinant directement l’espace échantillonnai et en dénombrant les résultats pos­
sibles. Soulignons que

et P(fiM) = — - r '-5- .
P(B) P(A)

ÉÉMto
i c i

w l ^ y

-
».

L'ensemble des résultats possibles lors du lancer de deux dés

Exemple 1.37
Au cours de la Seconde Guerre mondiale, on a fait appel à la recherche opérationnelle en Angleterre
pour l’une des premières fois. On voulait alors établir des circuits de recherche pour les sorties aériennes
visant à repérer les U-boats. Pendant un certain temps, on avait surtout patrouillé à proximité des côtes,
croyant que c’était là qu’on repérait le plus souvent des U-boats. Après avoir examiné 1000 rapports de
patrouille, le groupe de recherche a obtenu les résultats suivants (les données sont fictives).

Près des côtes Au large Total


U-boat repéré 80 20 100
Aucun U-boat repéré 820 80 900
Nombre total de sorties 900 100 1000

Soit S, l’événement «repérer un U-boat»,


S2 l’événement «ne repérer aucun U-boat»,
B,F événement « effectuer une sortie près des côtes »,
B21’événement « effectuer une sortie au large ».
On constate d’emblée que
80 20
P(S,\B.) = -----= 0,0889 et P(Sl\B2) = —~ = 0,20.
11 1 900 ' 100
Si les données étaient réelles, il faudrait conclure que les sorties au large augmentent les chances de
repérer des U-boats.
*

.•* r

V. f

CHAPITRE 1

Probabilité conditionnelle
La probabilité conditionnelle de l’événement A étant donné la réalisation de l’événement fi se définit
comme suit:

P (A |fi)= P ( /4 n g ) si 0. (1.9)
P(fi)

Cette définition découle de la notion intuitive présentée dans les paragraphes précédents.
La probabilité conditionnelle P(-1-) a les propriétés requises d’une probabilité. A utrem ent dit,
1. 0 < P(A|fi) < 1
2. P(Sf|fi) = 1

P (A; | fi) Si A; = 0 pour f *

P ( J j A, 15 J = £ / > (A, | B)
pour A1}A2, A3, ..., une suite dénombrable d’événements disjoints
En pratique, on peut résoudre les problèmes soit en posant l’équation 1.9 et en calculant
P{A r> fi) et P (B) par rapport à l’espace échantillonnai initial (comme le montre l’exemple 1.36),
soit en envisageant la probabilité de A par rapport à l’espace échantillonnai réduit fi (com m e le
montre l’exemple 1.37).
En transformant l’équation 1.9, on arrive à ce que plusieurs appellent la «règle de m u lti­
plication », selon laquelle

P ( A n f i ) = P ( f i) - P ( A |f i) si P(B)> 0

P(A n fi) = P (A) • P (fi|A ) si P (A) > 0. ( 1. 10)

Le second de ces énoncés découle manifestement de l ’équation 1.9 et fait de A l ’événem ent
conditionnel.
Il convient de mentionner que si A et fi sont mutuellement exclusifs, comme à la figure 1.12a),
alors A n fi = 0 , de sorte que P(A|fi) = 0 et P(B\A) = 0. À l’inverse, si fi c: A, com m e à la
figure 1.12b), alors P(A|fi) = 1.

a) P(A| fi) = 0 b) P(A | fi) = 1


Figure 1.12 a) A et fi sont mutuellement exclusifs; b) fi est inclus dans A.
Une introduction aux probabilités

Dans le premier cas, A et B ne peuvent survenir simultanément. Il faut donc conclure de la


réalisation de B que A ne se produira pas. Dans le second cas, si B se réalise, A doit nécessaire­
ment se produire. Il existe par contre nombre de cas où deux événements n’ont aucun lien entre
eux et où la réalisation de l’un n’influe en rien sur l’autre et ne nous apprend rien à son sujet.

Exemple 1.38
Prenons l’exemple d’une expérience dans laquelle on lance deux fois une pièce de monnaie équili­
brée. Soit A l’événement «on obtient le côté face au premier essai» et B l’événement «on obtient le
côté face au second essai». La pièce étant équilibrée, P(A) = et cette pièce équilibrée n’ayant au­
cune mémoire, P(fi|A) = La réalisation de A n’influe donc en rien sur celle de B, et la probabilité
que ces deux événements surviennent, c’est-à-dire P(A n B), correspond à

P(A nfi) = P(A)-P(fi|A) = 1 . 1 - 1


2 2
" 4

Dans cet exemple, P(B\A) = P (B), qui est la probabilité de l’événement B quand on ignore si l’événe­
ment A s’est produit ou non.

De façon non formelle, on qualifie deux événements d’«indépendants» lorsque la proba­


bilité de réalisation de l’un ne varie pas selon que l’autre se réalise ou non, ce qui nous amène
à la définition qui suit.

Événements indépendants
Les événements A et B sont indépendants l’un de l'autre si et seulement si
P(A nB ) = P(A) • P(B). (1.11)
Il s’ensuit directement, selon l’équation 1.10, que dans le cas de deux événements indépendants A et B,
P(A\B) = P(A) et P(fi|A) = P(fi). ( 1. 12)

Le théorème ci-dessous se révèle parfois utile. Uniquement la démonstration de sa première


partie est effectuée ici.

Si A et B sont des événements indépendants, alors


1. A et B sont des événements indépendants ;
2. A et B sont des événements indépendants ;
3. A et fi sont des événements indépendants.

Démonstration
(de la première partie)
P (A fi) = P {A) • P(fi| A)
= P(A) • [1 - P(fi| A)]
= • [1 - P(fi)]
= P(A)• P(fi)
CHAPITRE 1

En pratique, il existe de nombreuses situations où il n ’est pas nécessairement facile de déter­


m iner si deux événements sont indépendants l’un de l’autre. Il y a toutefois bien d ’autres cas
où un examen concret de l’expérience peut justifier qu’on admette cette indépendance, q u ’elle
soit réelle ou qu’elle soit une approximation. Prenons l’exemple d ’une expérience de sondage.
Exemple 1.39
Imaginons un échantillon aléatoire formé de deux unités tirées d’un lot de 100. On sait que 98 % de ces
100 unités n’ont pas de défaut. Quelle est la probabilité qu’aucune des deux unités ne soit défectueuse ?
Soit
A, l’événement «la première unité observée n’a pas de défaut» ;
B, l’événement «la deuxième unité observée n’a pas de défaut».
1. Supposons que l’on prélève l’échantillon en observant la première unité pour ensuite la
remettre dans le lot avant de tirer la deuxième unité.
Pour déterminer la probabilité que les deux unités n’aient aucun défaut, on utilisera l’indé­
pendance de A et B :
98 98
P(A n B ) = P( A) •P(B) = 0,9604.
100*100
2. Si l’on procède sans remise, c’est-à-dire sans remettre la première unité dans le lot avant de
tirer la deuxième unité, A et B ne sont plus indépendants :
98 97
P(A n B )= A
(P • = 0,9602.
100*99
On voit que les deux résultats sont très proches l’un de l’autre. Il est pratique courante d’ad­
mettre que des événements sont presque indépendants lorsque le taux de sondage (taille de
l’échantillon / taille de la population) est petit, par exemple inférieur à 0,1.

Exemple 1.40
L’ingénierie de la fiabilité est en plein essor depuis le début des années 1960. Elle vise entre autres à
évaluer la fiabilité d’un système d’après celle de ses sous-systèmes. La fiabilité se définit ici comme la
probabilité d’un fonctionnement sans défaillance pendant une période donnée. Soit le système simple
présenté à la figure 1.13.
Ce système en série ne fonctionne que lorsque ses deux sous-systèmes fonctionnent. Si le bon fonction­
nement de chaque sous-système est indépendant de celui de l’autre, alors
la fiabilité du système = RS= R{ ♦R2,
où et R2représentent respectivement la fiabilité des sous-systèmes 1 et 2. Si, par exemple, R l = 0,90
et R2= 0,80, alors Rs = 0,72.
/
Système

Un système simple monté en série


Une introduction aux probabilités

L’exemple 1.40 met en évidence la nécessité d’étendre la notion d’indépendance à plus de


deux événements. Un système pourrait en effet se composer de 3 sous-systèmes ou même de 20.
Quelles seraient les conditions requises pour qu’on puisse estimer la fiabilité d ’un tel système
en calculant le produit de la fiabilité de ses sous-systèmes ?

Événements mutuellement indépendants


Les k événements A,, A2, . Ak sont mutuellement indépendants si et seulement si la probabilité de
l’intersection de 2, de 3 , . . de k de ces ensembles pris au hasard correspond au produit de leurs pro­
babilités respectives.
Plus précisément, pour r = 2, 3 , ..., k, il faut que
P( A , , n ^ n - n A . ) = P( A,. )•P(Ah) •* P(A; )

=n«A )
j=1

Soit trois événements, A, B et C. Ces événements ne sont indépendants que si


P(A n B)= P(A) • P(P),
P ( A n Q = P(A) • P(C),
P ( B n Q = P(B) • P(C)
et
P ( A n B n Q = P(A )• P(P) • P(C).
Dans le cas d’un système en série dont on peut raisonnablement considérer les sous-
systèmes comme étant mutuellement indépendants, la fiabilité du système correspond au pro­
duit de la fiabilité de ses sous-systèmes :

* , = * i* 2 ........* r (1-13)
L’exemple qui suit fait voir des événements indépendants par paire mais non mutuellement
indépendants.

Exemple 1.41
Voici l’espace échantillonnai d’une expérience donnée dont les résultats sont équiprobables :
SP= {(0, 0, 0), (0, 1, 1), (1, 0, 1), (1, 1, 0)}.

A0 = « le premier chiffre est 0 », B0= « le deuxième chiffre est 0 », C0= « le troisième chiffre est 0 »,
A [ = «le premier chiffre est 1 », Bx= « le deuxième chiffre est 1», Cx= « le troisième chiffre est 1 ».
On a alors

P( A0) = P( A, ) = P(B0) = P(BX = P(C0) = P(Cj ) = 1/2,


)

et il ressort clairement que


P(Afn P y) ==1/4 ==P(A,)*P(Py), i = 0,l, j ==0,1,
P i^ n C j)-- =1/4 ==P(A,).P(C.), 1= 0,1, j ==0,1,
P(Bi n C j ) ==1/4 ==P(P,).P(C,), 1= 0,1, r - =0,1. ►
30 CHAPITRE 1

On remarque toutefois que


P( A0 n B0n C0) = 1/4 * P( A0 ) • P (P 0) • P (C 0),
P(A0 n B0 n C,) = 0 * P(A0) • P (P 0) • P(C,),
et il y a d’autres triplets dans le même cas. Les six événements sont donc indépendants deux à deux,
mais pas mutuellement indépendants.

1.7 Les partitions, les probabilités


totales et le théorème de Bayes
Les deux théorèmes présentés dans cette section sont particulièrement utiles en pratique. Ils
reposent tous deux sur la notion de partition. Une partition de l’espace échantillonnai peut se
définir comme suit.

Partition
Si BXt B2, ..., Bk sont des sous-ensembles disjoints de ïf (c’est-à-dire des événements mutuellement
exclusifs) et si P, u f i 2u ... u ^ = ^, alors ces ensembles forment une partition de

Cette définition signifie que lorsqu’on procède à l’expérience correspondant à alors un


seul des événements .Bde la partition se réalise. Une partition doit être exhaustiv
que tous les éléments de &doivent appartenir à un des B. ( la figure 1.1

I
Î

i
t

î
f
i

l
\

i
i

/ S . C r \ . “t u ~ l i • , ‘ , , % •

Exemple 1.42
Soit un mot binaire composé de trois bits : bt, b2et b3, où bt = 0 ou 1 pour i = 1, 2 et 3. Durant une expé­
rience qui consiste à transmettre ce mot, on constate qu’il y a 8 variations possibles. Si les événements
considérés sont
B, = {(0, 0, 0)) ;
B2={(0,0, 1),(0, 1,0), (1,0,0)};
((0,1, 1), (1,0, 1), (1, 1,0)};
«4 = Kl, 1, DI;
alors B]t B2, B2et BAforment une partition de Sf.
Une introduction aux probabilités

En général, si k événements Bt (où i= 1, 2 , k) forment un


événement arbitraire par rapport à îf, alors on peut écrire
A = (A n Bx) u (A n B2) u ••• u (A n Bk),
de sorte que
P(A)= P(A n B x) + P ( A n f i2) + ...+ n Bk\
puisque les événements ( An Bt) sont mutuellement exclusifs par paire (voir la fi
k =4). Peu importe que A n Bt = 0 pour certaines ou pour l’ensemble des valeurs de i étant
donné que P (0 ) = 0.

{
t
4
;

;
f
;

1
l

La partition de l'événement A en trois événements mutuellement exclusifs

À partir de l’équation 1.10, on peut énoncer le théorème ci-dessous.

Si B x, B2, ..., Bk forment une partition de ïf et si A dénote un événement quelconque dans if, alors la
probabilité de A se traduit par
P(A) = P ( A n £ ,) + P ( A n £ 2) + -- + P04r>j5*)
= P(B}) • P(A\B}) + P{B2) • P(A\B2)+•••+ P(B, ) • P(A\Bk )
k
YPiB,)P(A\B,X
i=1

Le théorème 1.8 s’avère très utile, car il est souvent impossible en pratique de calculer
directement la probabilité de A. En pareil cas, cependant, si l’on sait que B{s’est réalisé, on peut
évaluer P(A\Bj) et ainsi déterminer P (A) une fois que l’on connaît les valeurs de P(Bt).
Le théorème de Bayes est une autre proposition importante résultant du théorème des
probabilités totales.

Si B {, B2,..., Bkforment une partition de l’espace échantillonnai Sf et si dénote un événem


dans .r/, alors pour / 12
X ^ X - / • • • • 5 l
k
\ 4

P(An Br) P
P(B\A) (1.14)
P(A) r \

1= 1

Il s’agit d’une probabilité conditionnelle dont le numérateur est développé selon la règle de multi­
plication, et le dénominateur, selon le théorème des probabilités totales.
CHAPITRE 1

Exemple 1.43
Un fabricant de matériel de télémétrie achète des microprocesseurs de trois fournisseurs. Ces derniers
respectent supposément les mêmes normes de produit. Néanmoins, pendant des années, le fabricant a
vérifié chaque lot reçu, ce qui lui a permis de réunir les données ci-dessous.

Fournisseur P art fournie P art défectueuse


1 0,15 0,02
2 0,80 0,01
3 0,05 0,03

Le fabricant a cessé toute vérification en raison des coûts. Toutefois, on peut raisonnablement supposer
que les parts défectueuses et les parts fournies demeurent inchangées. Le directeur de la production
choisit un microprocesseur au hasard.
1. Quelle est la probabilité que le microprocesseur soit défectueux ? Notons cet événement D, et
notons B. l’événement « le microprocesseur vient du fournisseur ». On peut utiliser un schéma
en arbre pour illustrer la situation (voir la figure 1.16).

La partition des microprocesseurs selon le fournisseur et le taux de défectuosité

Du théorème des probabilités totales, il s’ensuit que :


P(D) = P(D n B,) + P(D r» B2) + P(D n B3)
= P(BX)P(D\BX) + P{B2)P{D\B2) + P(B3)P(D\B3)
= 0,15(0,02) + 0,80(0,01) + 0,05(0,03)
= 0,0125.
Cette valeur nous donne le taux de microprocesseurs défectueux reçus par ce fabricant, soit
1,25%.
2. Le directeur envoie le microprocesseur choisi au hasard au laboratoire d’essais, qui révèle que
l’unité est effectivement défectueuse. Quelle est la probabilité qu’elle provienne du troisième
fournisseur ? ►
Une introduction aux probabilités

On cherche donc à calculer P(B3\D). Le théorème de Bayes nous permet d’écrire :


P(B,)P(D\B,)
P(D)
0,05(0,03)
0,0125

Ainsi, 12 % des unités défectueuses reçues proviennent du troisième fournisseur.


On pourrait schématiser cette mise en situation à l’aide d’un diagramme de Venn où les micro­
processeurs sont partitionnés selon le fournisseur (voir la figure 1.17).

P(BX) = 0,15 P(B2) = 0,80 P(By) = 0,05

La partition des microprocesseurs défectueux selon le fournisseur

Résumé
Propriétés d’une probabilité
• 0 < P(A) < 1
• P ( 0 ) = 0 et P(S0 = 1
• Si A,, A2, A y ... sont mutuellement exclusifs, alors P(A, u A2 u A u •••) = X ^(A ).
• P (A) = 1 - >(Â) ' '
• Si A œB , alors A
(P<) P (B).
• P (A u B) =P (A) + P (B) - P (A n B)
• P (A u f i u C ) = P(A) + P (B) + P(C) - P (A n B ) - P (B n C) - P (A n C) + P (A n B n C)
• Si les n résultats de sont équiprobables, alors P (A) = n(A)/n.

Techniques de dénombrement
• Permutations :
Il existe n\ arrangements ordonnés de n éléments distincts.
n\
Il existe P" façons de choisir r objets parmi n objets distincts en tenant compte
(.n —r)!
de l’ordre de pige.
CHAPITRE 1

ni
Il existe façons de permuter n objets séparés en k groupes formés respective­
n\ ! n2! ••• nk \
ment de rc., n2, ..., n k. objets indiscernables.

Com binaisons :
\
n\
Il existe C rn façons de choisir rob jets parm i n objets
V I y r l ( n - r ) ï
tenir compte de l’ordre de pige.

Probabilités conditionnelles
P{A o B )
P (A |£)
P(B)
P(A n B ) = P{A)P(B\A) = P(B)P(A\B)
. . • . _* .
. . ■ . . .. * . - • « ^ . « ' * ^ . • y* * • . \ \ . ^ t

• ‘ . » . • ' **. ’ «

A et B sont indépendants si et seulement si P (A n B) =


# * » » . . _ ■ , ^

’ * »
• 1 •

,
, '

* ■
.

» ' •
. » ^

*
»* •

.
* V »

*
,


» , ^ • • • , *»

* _. *
V

* * * * *
)
B

» • >. - . • ' . ■ r \ v

Si Bj, B2, ..., Bk forment


n une partition de SP, alors :
k
P(A) Y , P(B: )P{A | Bh) (théorème des totales) ;
«•=1
P Ç A n Br) ÊÊm
P(Br\A) k (théorème de Bayes)
P(A)
WÊÊ
i=i

1.1 Des téléviseurs font l’objet d’une dernière qu’un téléviseur appartienne à chacune
vérification après leur montage. Ils peuvent des régions du diagramme.
avoir trois types de défauts : d’image, b) Quelle proportion des téléviseurs ne
de son ou de matériel. Une analyse des comporte aucun défaut ?
données a permis d’obtenir les résultats c) Les téléviseurs qui ont des défauts
ci-dessous. d’image ou de son (ou les deux)
sont remis en fabrication. Quelle
Téléviseurs ayant uniquement : proportion des appareils appartient
- des défauts d’image 2% à cette catégorie ?
- des défauts de son 5%
—des défauts de matériel 7% 1.2 Hachurez sur la figure ci-dessous la région
—des défauts d’image et de son 3% correspondant à chacun des événements
—des défauts d’image et de matériel % suivants.
- des défauts de son et de matériel 3%
Téléviseurs ayant des défauts de
chaque type 1%

aJ Tracez le diagramme de Venn associé à


cette situation en précisant la probabilité
»
Une introduction aux probabilités

a) A u C e) C u D mesurant le temps écoulé entre le moment


b) Â n B f) C n D où un numéro s’affiche sur un écran et
c) A u D g)(A nB )u(C nD ) celui où le sujet appuie sur un bouton à
d) A n B h) ( A u B ) n ( C u D) l’endroit indiqué par ce numéro. Deux
sujets se prêtent à l’expérience, et on
1.3 Supposons un ensemble universel mesure pour chacun le temps écoulé en
formé des entiers positifs de 1 à 10, c’est- secondes (/,, t2). Présentez les événements
à-dire U= {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. Soit
ci-dessous sous forme de sous-ensembles
A = {2, 3, 4}, B= {3, 4, 5} et C = {5, 6, 7}.
et représentez-les dans un diagramme de t2
a) Tracez le diagramme de Venn de ces en fonction de
ensembles et définissez par énumération a) Le temps moyen des deux sujets est
les ensembles ci-dessous. inférieur à 0,15 seconde.
i) A n B b) Les deux sujets répondent en
ii) A u B 0,15 seconde ou moins.
iü) Â n B c) L’écart entre les temps des deux sujets
est inférieur à 0,06 seconde.
iv) A n (B n C)
d) Le premier sujet répond plus rapidement
v) A n ( B u C) que le second.
b) Supposons que les entiers 1 à 5 1.6 Au cours d’une période de 24 heures, un
ont une probabilité individuelle ordinateur sera allumé à une heure X, puis
d’être pigés valant 4 % et que chaque éteint à une heure YX.On veut m
entier de 6 à 10 a 16 % de chances et Y en heures sur une droite chronologique
d’être pigé. Déterminez la probabilité où le début de la période de 24 heures se
associée à chacun des événements situe à l’origine.
définis en a).
a) Décrivez l’espace échantillonnai.
1.4 Un circuit flexible est choisi au hasard b) Représentez les événements ci-dessous
parmi les 1 000 circuits d’un lot de pro­ dans le plan XK:
duction. Il peut avoir trois types de dé­ i) La durée d’utilisation est de une
fauts, notés A, B etC. Les circuits ont heure ou moins.
des défauts de type A dans 2 % des cas, ii) On allume l’ordinateur avant f,, et on
de type B dans 1 % des cas et de type C
l’éteint après t2, où 0 < r, < t2< 24.
dans 1,5 % des cas. Ils comportent à la
fois des défauts de type A et de type B 1.7 Une station météorologique enregistre bon
dans 0,5 % des cas, de type A et de an, mal an entre 200 et 600 mm de précipi­
type C dans 0,6 % des cas, de type B tations. Soit les événements suivants :
et de type C dans 0,4 % des cas et
A = Il tombe moins de 500 mm de pluie ;
de chaque type dans 0,2 % des cas.
B= Il tombe au moins 400 mm de pluie ;
a) Tracez le diagramme de Venn C = Il tombe entre 350 et 550 mm de pluie,
associé à cette situation en précisant inclusivement.
la probabilité qu’un circuit appartienne
à chacune des régions du diagramme. Représentez les événements suivants sous
b) Quelle est la probabilité que le circuit forme d’intervalles de valeurs pour la quan­
choisi présente au moins un de ces trois tité de pluie.
types de défauts ? a) A d )A n fin C
c) Quelle est la probabilité que le circuit b) A n C e) (A C)
choisi présente des défauts de type A c } In C f) (A u fi) u C
seulement ?
1.8 Soit un ensemble formé de trois éléments :
1.5 Dans un laboratoire d’étude, on détermine *
= {a, byc}. Combien existe-t-il de sous-
le temps de réaction de sujets humains en ensembles de Sf ?
CHAPITRE 1
S - ' « v - T \
> ' ■ * « ?

1.9 Décrivez 1’espace échantillonnai de c) Quelle est la probabilité d’obtenir une


chacune des expériences ci-dessous. plaque contenant trois fois la même lettre
a) Soit un lot de 120 couvercles de piles ou le même chiffre ?
destinées à des stimulateurs cardiaques. 1.13 Le directeur d’une petite usine veut
Un certain nombre de ces couvercles déterminer combien d’équipes différentes
présentent un défaut. On choisit trois il peut former pour le premier quart de
couvercles au hasard (sans remise) travail. Il dispose de 15 opérateurs à la
et on les examine avec soin. production, de 8 préposés à l’entretien
b) Soit une palette portant 10 pièces et de 4 contremaîtres. Combien d’équipes
coulées dont 1 pièce est défectueuse. différentes peut-il former comprenant
On choisit 4 de ces pièces au hasard 6 opérateurs à la production, 2 préposés
(sans remise) et on les vérifie. à l’entretien et 1 contremaître?
c) On vérifie une à une les diodes d’un lot 1.14 Soit un lot dont on sait que 20 des
pour établir si elles sont défectueuses 100 unités sont défectueuses. On en tire
ou non. La vérification continue jusqu’à 4 unités au hasard, sans remise.
ce qu’on ait trouvé deux diodes défec­ a) Quelle est la probabilité que cet échan­
tueuses ou qu’on ait examiné quatre tillon ne renferme pas plus de 2 unités
diodes. défectueuses ?
1.10 La directrice de la production d’une b) Le lendemain, on répète l’expérience
entreprise souhaite vérifier un produit fini sur un autre lot identique. Quelle est
présenté en lots de 50 unités. Elle décide la probabilité que les deux échan­
de prélever sans remise un échantillon tillons ne contiennent aucune unité
aléatoire de 10 unités dans chaque lot et défectueuse ?
de faire reprendre le lot si elle y trouve 1.15 Vous pigez 2 cartes d’un jeu standard
au moins 1 unité défectueuse. formé de 52 cartes.
a) Si un lot contient 10 % d’unités défec­ a) Quelle est la probabilité d’obtenir au
tueuses, quelle est la probabilité qu’il moins une figure (valet, dame ou roi) ?
soit retourné à la production ? b) Quelle est la probabilité d’obtenir une
b) Si la proportion d’unités défectueuses paire d’as?
est p, exprimez la probabilité de piger c) Quelle est la probabilité d’obtenir
au plus une unité défectueuse. une paire ?
1.11 Un transporteur routier doit acheminer des 1.16 Dans un jeu de loterie, on tire 6 boules
marchandises de la ville W à la ville Z. sans remise d’une urne de tirage au sort
Aucune route ne relie directement ces deux contenant 49 boules numérotées de 1
endroits, mais il y a six routes reliant à 49. L’ordre dans lequel les numéros
à X et cinq reliant X à Z. Combien y a-t-il sont pigés n’est pas important dans cette
d’itinéraires possibles ? loterie.
Il y a dix millions de véhicules immatricu­ a) Calculez la probabilité d’obtenir la
lés dans une province donnée. On songe combinaison gagnante en achetant
à y utiliser des plaques d’immatricula­ un billet.
tion portant trois lettres suivies de trois b) Calculez la probabilité d’obtenir
chiffres. exactement quatre des six numéros
a) Ce projet est-il réalisable ? de la combinaison gagnante.
b) Si on choisit une de ces-plaques au c) Calculez la probabilité d’obtenir la com­
hasard, quelle est la probabilité d’obtenir binaison gagnante lors de deux tirages
un numéro sans répétition de /ettre ou de consécutifs si on achète un billet pour
chiffre ? chacun.

à
/
Une introduction aux probabilités

d) Paul a assez d’argent pour acheter deux a) Si l’on procède par tâtonnements, quel
billets. Il croit qu’il a plus de chances de nombre maximal d’essais peut-on
gagner au moins une fois s’il achète deux devoir effectuer pour trouver les deux
billets différents pour le tirage de ce soir substances en question ?
plutôt que s’il achète un billet pour ce soir b) Supposons qu’un catalyseur connu a
et un billet pour demain. A-t-il raison ? provoqué la réaction accidentelle initiale.
L’ordre dans lequel la chimiste a mélangé
1.17 Voici comment on inspecte des marchan­
les ingrédients devient alors important.
dises à leur arrivée. Livrées en lots de
Dans cette situation, quel nombre maxi­
300 unités, on tire du lot 10 unités au
mal d’essais faut-il effectuer?
hasard. Si cet échantillon ne compte pas
plus de 1 unité défectueuse, on accepte le 1.21 Une urne contient une boule rouge, deux
lot. Dans le cas contraire, on retourne boules bleues et trois boules noires. On
le lot au fournisseur. tire successivement trois boules, au hasard
a) On reçoit un lot contenant 1% de produits et sans remise. On définit les événements
défectueux (mais on l’ignore). Sans éva­ suivants :
luer sa valeur numérique, déterminez la
probabilité que le protocole de contrôle A = La première boule, tirée est rouge ;
de la qualité nous fasse rejeter ce lot. fi = La deuxième boule tirée est bleue ;
C = Les trois boules tirées sont noires.
b) Soit p' la proportion d’unités défectueuses
d’un lot reçu. Déterminez la probabilité Dites si les énoncés suivants sont vrais ou
d’acceptation du lot en fonction de p'. faux.
1.18 Dans une usine de matières plastiques, a) A et fi sont indépendants.
12 produits chimiques différents se b) A et C sont indépendants.
déversent dans une cuve de mélange par c) A et fi sont mutuellement exclusifs.
des tuyaux munis chacun d’une soupape d) A et C sont mutuellement exclusifs.
à 5 positions qui en règle le débit. Un jour, e) fi(A) = fi(fi)
en faisant l’essai de divers mélanges, on f) fi(A) < fi(fi)
obtient une solution qui dégage un gaz g) P(A n fi) < fi(A u fi)
toxique. On a omis de noter la position des
h) fi(C) est la probabilité qu’aucune boule
soupapes à ce moment-là. Quelle est la pro­
babilité d’obtenir encore cette solution si on tirée ne soit noire.
procède à un autre essai au hasard ? i) P ( A n B n C ) = 0
j) P(A u fi u C) = P (A) + P(fi) + P(C)
1.19 On a le choix entre huit personnes toutes k) P(A n fi) = P(A)P(fi)
aussi qualifiées pour combler deux postes.
Les deux personnes embauchées doivent 1.22 Lesquelles des réponses de l’exercice 1.21
partager des affinités parce qu’elles seraient différentes si les tirages avaient été
devront travailler en étroite collaboration. avec remise ?
On fait donc passer aux candidats un test
1.23 Une entreprise prévoit construire
de personnalité et on compare les résultats
5 entrepôts à des endroits différents. Or,
de chaque couple possible. Combien de
10 endroits sont à l’étude.
comparaisons peut-on effectuer ?
a) Combien y a-t-il de choix possibles au
1.20 Après avoir mélangé accidentellement total pour l’ensemble des 5 entrepôts?
2 substances de laboratoire, une chimiste b) On veut placer deux entrepôts sur la
a obtenu un produit désirable. Malheureu­ rive nord du fleuve, et seulement quatre
sement, son assistant n’a pas noté le nom des endroits considérés s’y trouvent.
de ces substances. Or, 40 substances sont Combien y a-t-il de configurations pos­
présentes dans le laboratoire. sibles avec cette contrainte ?
CHAPITRE 1

1.24 Des machines à laver peuvent avoir cinq 1.27 Un nouveau modèle de drone équipé
types de défauts majeurs et cinq types de de caméras doit être testé avant sa mise
défauts mineurs. en marché. Les résultats des tests sur
a) Combien y a-t-il de combinaisons 50 drones sont présentés dans le tableau
possibles de un défaut majeur et ci-dessous.
de un défaut mineur ? I
Problèmes mécaniques j
b) Combien y a-t-il de combinaisons
Oui Non
possibles de deux défauts majeurs
et de deux défauts mineurs ? Problèmes Oui 5 10
électroniques Non 5 30
1.25 Une entreprise de transport soumet ses
camionneurs à des tests antidopage. Supposons que les proportions dans ce
Chaque mois, 1 des 20 employés est sélec­ tableau sont parfaitement représentatives de
tionné au hasard et doit fournir un échan­ l’éventuelle production si rien n’est changé.
tillon sanguin. Jacques et Alain travaillent Quelle serait alors la probabilité :
tous les deux comme camionneurs pour
a) qu’un drone ait un problème mécanique ?
cette entreprise. Calculez la probabilité
des événements suivants : b) qu’un drone n’ait ni problème méca­
nique ni problème électronique ?
a) Jacques n’est pas testé cette année.
c) qu’un drone ait un problème mécanique
b) Ni Jacques ni Alain ne sont testés cette
alors qu’on sait qu’il a un problème
année.
électronique ?
c) Jacques et Alain sont tous les deux
d) que trois drones achetés par un consomma­
testés au moins une fois cette année.
teur aient chacun au moins un problème ?
1.26 Soit le montage électronique représenté 1.28 Soit le montage représenté à la figure 1.19.
à la figure 1.18. Le schéma indique la Chaque composant à Rs) fonctionne
probabilité de bon fonctionnement de ses indépendamment des autres, avec une pro­
divers composants. Pour que le montage babilité de 0,9. Le montage ne connaît une
fonctionne, il faut que le courant puisse défaillance que si le trajet de A à B est inter­
le traverser par un chemin fonctionnel. rompu. Calculez la fiabilité du montage,
Ainsi, l’ensemble III et au moins un c’est-à-dire la probabilité qu’il fonctionne.
élément de l’ensemble I et au moins
un élément de l’ensemble II doivent 1.29 Le test diagnostique pour détecter le virus
fonctionner. Le fonctionnement de XYZ n’est pas parfait. En effet, 1 % des
chaque composant d’un ensemble et personnes saines recevront à tort un résultat
de chaque ensemble est indépendant de «positif». De plus, 2 % des personnes
celui des autres. Quelle est la probabilité infectées recevront à tort un résultat
que le montage fonctionne ? « négatif ». On sait que 0,05 % de la

Exercice 1.26
Une introduction aux probabilités

population est porteuse du virus à un 1.32 On tire successivement deux boules d’une
certain moment. Trouvez la probabilité urne qui contient m
boules num
qu’une personne dont le test est positif soit de 1 à m. Si la première boule tirée porte
réellement infectée par le virus. le numéro 1, on la garde ; dans le cas
contraire, on la remet dans l’urne. Quelle
1.30 Supposons que parmi tous les véhicules qui
est la probabilité que la deuxième boule
démarrent mal :
tirée porte le numéro 2 ?
• la probabilité que la cause soit le démar­
reur est de P (A) = 0,5 ; 1.33 On choisit au hasard deux chiffres
• la probabilité que la cause soit la batterie différents compris entre un et neuf
est de P(B) = 0,4 ; inclusivement.
• la probabilité que la cause soit l’une des a) Déterminez la probabilité qu’il s’agisse
bougies est de P(C) = 0,1. des chiffres un et neuf.
De plus, on sait que : b) Déterminez la probabilité que le trois
• sur le nombre total de voitures qui soit pigé.
démarrent mal à cause du démarreur, c) Déterminez la probabilité qu’il s’agisse
10 % sont de marque X ; de deux nombres impairs sachant que
• sur le nombre total de voitures qui leur somme est paire.
démarrent mal à cause de la batterie, 1.34 Soit une université où 20 % des étudiants
20 % sont de marque X ; et 1 % des étudiantes mesurent plus de
• sur le nombre total de voitures qui 1,80 m. Sa population étudiante compte
démarrent mal à cause de l’une des 40 % de femmes. Si un membre de cette
bougies, 5 % sont de marque population, choisi au hasard, mesure plus
On confie une voiture de marque à un de 1,80 m, quelle est la probabilité qu’il
mécanicien. Devrait-il d’abord se pencher s’agisse d’une femme ?
sur le démarreur, la batterie ou les bougies ?
1.35 Soit un atelier équipé de quatre taraudeuses
1.31 Un dispositif de freinage devant automatiques. Un examen des rapports
empêcher une automobile de déraper d’inspection a permis d’obtenir les données
se compose de trois sous-systèmes en ci-dessous.
série qui fonctionnent chacun de façon
indépendante : un système électronique, Pourcentage Pourcentage
un système hydraulique et un mécanisme d’unités d ’unités
d’activation. Lors d’une manœuvre Machine produites défectueuses
de freinage, la fiabilité de ces trois
éléments est respectivement de 0,995, 1 15 4
de 0,993 et de 0,994. Évaluez la fiabilité 2 30 3
du dispositif. 3 20 5
4 35 2

Exercice 1.28
40 CHAPITRE 1

Les machines 2 et 4 sont plus récentes et ii) quelle proportion des commandes
assurent une plus grande part de la produc­ n’ayant que des produit usagés
tion que les machines 1 et 3. Supposez ici contient des frais de livraison rapide ?
que la répartition actuelle des stocks reflète
1.38 II y a np
ersonnes dans une pièce. S
les pourcentages d’unités produites selon le
qu’il y a 365 jours dans une année et que
tableau.
l’anniversaire de chaque personne peut
a) Quelle est la probabilité qu’une vis aussi bien tomber sur un jour que sur un
tirée au hasard à partir des stocks soit autre.
défectueuse ?
a) Soit B l’événement «deux ou plusieurs
b) Si une vis choisie se révèle défectueuse, personnes ont le même mois et le même
quelle est la probabilité qu’elle provienne jour de naissance». Déterminez )
de la machine 3 ? pour n =25.
1.36 On choisit un point au hasard à l’intérieur b) Déterminez P )B
(de façon généra
d’un cercle. Quelle est la probabilité qu’il tout n.
se situe plus près du centre que de la cir­
1.39 On sait que 6 % des impressions photos
conférence ?
d’un laboratoire doivent être reprises pour
1.37 Un site de vente en ligne propose des pro­ cause de surexposition ou de sursaturation ;
duits neufs et usagés. On sait que 80 % des que 4 % de toutes les photos sont surexpo­
commandes contiennent au moins un pro­ sées ; et que 3 % des photos ont les deux
duit neuf et que, pour 30 % des commandes, problèmes à la fois.
le client accepte de payer un supplément a) Quelle proportion de toutes les photos
pour une livraison plus rapide. a une trop grande saturation ?
a) Quelle proportion des commandes b) Sachant qu’une photo est surexposée,
contient au moins un produit neuf ou quelle est la probabilité qu’elle soit
des frais pour livraison rapide ? aussi sursaturée ?
b) Quelle est l’hypothèse nécessaire pour
1.40 Soit le schéma reproduit à la figure 1.20.
répondre à la question précédente ?
Une randonneuse part du point A en choi­
c) Si 35 % des commandes ayant au moins sissant au hasard parmi les sentiers AB, AC,
un produit neuf comprennent aussi des AD et AE. A chaque intersection subsé­
frais de livraison rapide, quente, elle choisit un nouveau sentier
i) que devient la proportion calculée au hasard. Quelle est la probabilité qu’elle
en a)? atteigne le point X ?
Une introduction aux probabilités

1.41 Trois imprimeurs effectuent des travaux le reconnaisse est de 0,9. Si sa cause est autre,
pour le compte d’une université. Il n’y a la probabilité qu’on l’attribue à tort à une
aucune pénalité exigée en cas de retard, défaillance de structure est de 0,2. Sachant
et les nombreux travaux précédemment que 25 % de tous les accidents aériens
confiés à ces imprimeurs ont permis résultent d’une défaillance de structure,
d’établir les données ci-dessous. déterminez la probabilité qu’il s’agisse bien
de la cause d’un accident ayant été attribué
à une telle défaillance.
Part des
travaux 1.43 On sait que 20 % des produits alimentaires
Part des effectués d’un grossiste sont sans gluten, et que 90 %
travaux avec plus de ses produits sont sans arachides. Si on
confiés à d ’un mois considère que l’utilisation de noix et que celle
Imprimeur i l’imprimeur i de retard de produits contenant du gluten ne sont pas
0,2 0,2 liées, quelle proportion des produits de ce gros­
1
0,3 siste contient au moins un des deux allergènes ?
2 0,5
3 0,5 0,3 1.44 Les aéroports effectuent des contrôles de
sécurité aléatoires sur les bagages des voya­
geurs. Supposons que 10 % des voyageurs
On aurait dû recevoir un certain dépliant il y
voient leurs bagages fouillés par hasard avant
a plus d’un mois. Quelle est la probabilité
que ce contrat ait été confié à l’imprimeur 3 ? d’accéder aux terminaux de départ. Quelle
est la probabilité que, lors de ses 15 voyages
1.42 Tout accident aérien fait l’objet d’une d’affaires annuels, un représentant commer­
enquête approfondie. S’il résulte d’une cial soit intercepté exactement une fois pour
défaillance de structure, la probabilité qu’on une fouille de bagages aléatoire ?
f ♦' I

» è * + V<

V 4 » * + >♦

l ♦ »« ■f i é ? « « » » fc C 4 4 -f» > ï

~ ^
a os ce ch ap itre, nous allon s p résen ter la notion de v a ria b le a lé a to ir e ,
d éfin ir les d istrib u tion s de p rob ab ilité et les fon ctio n s de r é p a r titio n ;
J Ê L * J le tou t sera illu stré à l’aide d ’exem p les. N ous ex a m in ero n s e n s u ite
certa in s p aram ètres u tiles à la com préhension des v a ria b les a lé a to ir e s- N o u s
term in ero n s en p résen tan t les fon ction s d ’une v ariab le a léa to ire.

Lorsqu’on décrit l’espace échantillonnai d’une expérience aléatoire, il n’est pas nécessaire que
tout résultat possible soit un nombre. Divers exemples le démontrent, notam m ent le lancer d’une
pièce de monnaie équilibrée à trois reprises, où {PPP, PPF, PFP, P F F, F P P, F P F, ,
FFF} ; et la vérification de deux produits pouvant être « Acceptables » ou « D éfectueux », soit
ï f = {AA, AD, DA, DD}.
Dans la plupart des situations expérimentales, on s’intéresse plutôt à des résultats numériques.
Si on reprend le cas du lancer d’une pièce de monnaie, on pourrait attribuer un nom bre réel x à
chaque élément e de l’espace échantillonnai SF, par exemple = le nombre de résultats « pile »
obtenus. Dans ce cas, X est une fonction qui porte le nom de « variable aléatoire ». L’espace échan­
tillonnai Sf forme le domaine de X et son image se compose de nombres réels.
— * . . m • —, . # , . • — . • * — ' ■ . m'

Variable aléatoire
- _ . " ^ . ’* . * * « 1 * , % . ' \ * r . . " . f* * * . ' 1 i - , - i , - , • fc ■ " 4

' • . ' " • • • * - * . • < " - * • - 4 • ■ -


* - , # ■ * y — , . , / N . ■* • • . • " * , ” - — 1 ■ m * “ ■

Soit % une expérience dont l’espace échantillonnai est SPet X, une fonction qui attribue un nombre réel
— * , . , — . a ^ 1 " \ j , ' —a . a * . a

à chaque résultat e e SP. On appelle X une « variable aléatoire». On utilise une lettre majuscule pour
• • ' • . - a - * . ". > * „ , > ( ^ ' • • , ' . y • s ;.4 ' ■ * . . , . y V y y ' ,

identifier la variable elle-même, disons X. Après la conduite de l’expérience, on notera la valeur d’une
■— —_ a * . a * # y " y * ’ * a P I . ' . - . - ■ ( a-’ # ■ a a ■* * * ' ' f , . . • a * «

observation par une lettre minuscule, x.

Rappelons que pour toute fonction, chaque élément du domaine est associé à une et une seule
valeur de l’image. Ainsi, dans le cas d’une variable aléatoire, à chaque résultat e Sf correspond
exactement une valeur x=X(e). Soulignons que différentes valeurs de e peuvent se traduire par une
même valeur de x, comme dans l’exemple précédent, où = 1, X(JFPF) = 1 et ) = 1.

Exemple 2.1
À partir de l’expérience mentionnée précédemment, si X représente le nombre de fois où la pièce tombe
sur le côté pile, alors X(PPP) = 3, X(PPF) = 2, X(PFP) = 2, X(PFF) = 1, X(FPP) = 2, X(FPF) = 1,
X(FFP) = 1 et X(FFF) = 0. L’image de X est alors Rx = {0, 1, 2, 3} (voir la figure 2.1a).
On aurait pu définir une autre variable aléatoire en se basant sur la même expérience. Par exemple,
1 si la pièce tombe trois fois sur le même côté
Y
0 sinon. ►
Les variables aléatoires à une dimension
f

L’image de Y est Ry= {0,1} (voir lafigure 2.lb).


/
• * • *- r *- . « • . *

Sf R $f R

:
_ J

a) X = le nombre de résultats «p ile » lors du lancer d'une pièce à trois reprises;


b) Y = 1 si la pièce tombe trois fois du même côté, Y = 0 sinon.

L’image de X, Rx, se compose de toutes les valeurs possibles de X, et constit


espace échantillonnai au même titre que Sf. On s’intéresse ici aux événements associés à
Rx• La variable aléatoire X permet de déterminer leur probabilité à partir de la probabilité
définie sur £f, selon le principe des événements équivalents. Comme illustration de ce prin­
cipe, considérons une pièce de monnaie lancée à trois reprises. Si l’on suppose que la pièce
est équilibrée, il y a huit résultats possibles (PPP, ’ PFP, PFF, FPP, FFP et FFF),
chacun ayant une probabilité de Soit A, l’événement «la pièce tombe exactement deux
fois sur le côté pile» et X, le nombre de fois où l’on obtient le côté pile ( la figure 2.là).
L’événement [X = 2} se rattache à Rx et non à Sf. Cependant, les événements [X = 2} et
A = {PPF, PFP, FPP) sont équivalents et on pose P(X = 2) = P (A) = | . Chaque fois que l’évé­
nement A se réalise, l’événement {X = 2} se produit, et inversement. Il faut noter que ces deux
événements sont associés à des espaces différents. Rappelons que tous les éléments de l’image
de X sont des nombres réels même si les résultats formant l’espace échantillonnai ne le sont pas
nécessairement.
Les exemples ci-après montrent la relation entre l’espace échantillonnai et l’image d’une
variable aléatoire. Puisqu’on s’intéresse à des résultats numériques, c’est l’image qui retiendra
l’attention plutôt que l’espace échantillonnai.

Exemple 2.2
Soit l’expérience consistant à lancer deux dés équilibrés. (L’espace échantillonnai est constitué des
36 couples de résultats possibles). Si la variable aléatoire Y se définit comme la somme des chiffres sur
les faces du dessus, alors Ry = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}, et ses éléments ont dans l’ordre une
probabilité de Le tableau 2.1 (voir à la page suivante) montre
les événements équivalents. Rappelons qu’il y a 36 résultats possibles, tous équiprobables puisque les
dés sont équilibrés. ►
44 CHAPITRE 2

Exemple 2.3
Pour vérifier la durée de vie de 100 stimulateurs cardiaques, un technicien les dépose dans une solution
saline maintenue à la température du corps. L’ordinateur enregistre la date et l’heure de la défaillance
des stimulateurs. On a alors SP = {(d, h) : d = la date, h = l’heure}.
Soit X une variable aléatoire représentant la durée de fonctionnement avant une défaillance. La variable
aléatoire X correspond au nombre total d ’unités de temps, à compter de la date et de l’heure du début de
l'expérience (d0, hQ). On a alors R x — {x : x > 0}. On s’intéresse ici à X et à sa distribution de probabilité,
un concept qui sera présenté dans les prochaines sections.

2.1 Les fonctions de répartition


Par convention, la minuscule de la lettre associée à une variable aléatoire sert à in d iq u e r une
valeur particulière de cette variable. De ce fait, {X = x }. { x < x} et { X < x} rep résen ten t des
événements appartenant à l’image de la variable aléatoire X, où x est un nom bre réel.
m

F o n c tio n de ré p a rtitio n
On peut traduire la probabilité de l’événement {X < x} par une fonction de x:
F(x) = P(X < x). (2.1)
La fonction F porte le nom de « fonction de répartition » ou « fonction cumulative de d istrib u tio n » de
la variable aléatoire X.

La définition de F(x) est toujours la même, à savoir P ( X < x), mais sa form e exacte d ép en d
de la nature des valeurs possibles de X.
Les variables aléatoires à une dimension

Exemple 2.4
Dans le cas du lancer d’une pièce à trois reprises, la variable aléatoire X = nombre de résultats « pile »
1 3 3
pouvait prendre quatre valeurs, 0, 1, 2 et 3, ayant respectivement une probabilité de | 8 8 et ~ On ’

peut écrire F ainsi :

0 si x < 0
1/8 si 0 < x < 1
FO<) 4/8 si 1 < x < 2
7/8 si 2 < x < 3
1 si jc> 3.

Le tout est représenté graphiquement à la figure 2.2.

La fonction de répartition du nombre de fois où une pièce lancée à trois


reprises tombe sur le côté pile

Quelle est la probabilité d’obtenir au maximum un « pile » lors de trois lancers ?


4 1
P(X < 1) = F(l)
8 2
Quelle est la probabilité d’obtenir au moins un « pile » lors de trois lancers ?
P(X> l ) = l - P ( X < 0)
= 1 - F(0)
1
1
8
7
8

Exemple 2.5
Reprenons l’exemple 1.13 concernant un tube cathodique soumis à un essai de durée. Soit Sf= {r : t > 0}.
Si X représente le temps écoulé (en heures) au moment de la défaillance, l’événement {X < x} appar­
tient à l’image de X. Voici un modèle mathématique qui attribue une probabilité à [X < x) :
r
si x < 0,
F(x)
si x > 0,


46 CHAPITRE 2

où X (lambda) est un nombre positif appelé «taux de défaillance», c’est-à-dire le nombre de défai!
lances par heure. Dans la pratique, l’utilisation de ce modèle exponentiel repose sur certaines hypo
thèses sur lesquelles nous reviendrons ultérieurement.
La fonction de répartition de la durée de fonctionnement du tube est représentée graphiquement à la
figure 2.3, où on suppose un taux de = 0,001.

La fonction de répartition de la durée de fonctionnement avant la défaillance


d'un tube cathodique
Quelle est la probabilité que la défaillance survienne en 500 heures ou moins ?
P{X < 500) = F(500)
- 0 ,001-500
1—e
0,3935

Toute fonction de répartition a les propriétés énumérées ci-dessous, qui découlent directe­
ment de la définition énoncée.

Propriétés d'une fonction de répartition


1. 0 < F(x) < 1, — < x < °°.
2. lim F(x) =1, |
JT—

lim F(x) = 0.
. r — > — o o . . . .

3. La fonction est non décroissante. Autrement dit, si x, < alors F(x,) < F(x2)■
» , . ( ,
* »* , '*

4. La fonction est continue à droite. Autrement dit, pour toute valeur de x et S> 0,
lim [F(x + <5)-F(x)] = 0.
<5->0

Réexaminons les deux derniers exemples. À l’exemple 2.4, on remarque que les valeurs de
x qui font augmenter la valeur de F{x) sont des nombres entiers. Lorsque x n’est pas un entier,
F{x) a la même valeur qu’au point le plus près sur la gauche, où x correspond à un entier. On
voit que F{x) fait un saut aux points d’abscisse 0, 1, 2 et 3 et passe de 0 à 1 par une succession
de tels bonds. L’exemple 2.5 présente une situation différente, où F{x) s’élève progressivement
de 0 à 1 et s’avère partout continue, mais sans être dérivable en x = 0.
Selon la forme de sa fonction de répartition F{x) ou encore selon la nature de son image
Rx, une variable aléatoire X peut être qualifiée de discrète {voir l ’exemple 2.4) ou de continue
{voir l ’exemple 2.5).
Les variables aléatoires à une dimension

2.2 Les variables aléatoires discrètes


Diverses situations expérimentales peuvent se traduire par des variables aléatoires discrètes.
En génie et en sciences appliquées, ce type de variable est souvent associé à un dénombrement.
Si X représente une variable aléatoire discrète, alors F(x) comporte au plus un nombre infini
dénombrable de sauts, et Rx = {*i, x2, ..., xk, ...}.

Exemple 2.6
Supposons qu’une année compte 250 jours de travail et qu’on inscrit tout jour d’absence au dossier de
chaque membre du personnel. On réalise une expérience où il faut choisir au hasard le dossier d’un
membre du personnel pour connaître ses jours d’absence. La variable aléatoire X représente ici U-
nombre de jours d’absence, de sorte que Rx = {0, 1, 2, ..., 250}. Il s’agit d’une variable aléatoire
discrète ayant un nombre fini de valeurs possibles.

- \ ' 1 ' • %

Exemple 2.7
Un compteur Geiger-Müller est relié à un tube à gaz afin de mesurer le nombre de radiations ambiantes
à l’intérieur d’un intervalle de temps [0, /]. La variable aléatoire est la mesure obtenue sur le compteur.
Si l’on note cette variable X, alors Rx = {0, l, 2, ..., k, ...}. Comme cette image est formée, à tout
le moins du point de vue conceptuel, d’une infinité dénombrable d’éléments (une relation bijective
pouvant être établie entre les résultats possibles et les nombres naturels), on est en présence d’une
variable aléatoire discrète.

Fonction de masse de X
Lorsque X représente une variable aléatoire discrète, on associe un nombre = P(X = à chaque
résultat ;c, de Rxpour i= l, 2 , . , où chaque nombre p{xi) satisfait aux condit
I. p (xi) > 0, pour toute valeur de /.
O O

/=!
La fonction p(x) constitue la fonction de masse (de probabilité) de la variable aléatoire, et l’ensemble
des couples [(*,-, p(xi)), i= l, 2 , ...] forme la distribution de probabilité de X. On représente gr
ment une fonction de masse par un diagramme en bâtons.

On remarque d’emblée que


p (xf) = F(x^ - F(xi_ ,) (2.2)
et que

F(x, ) = P ( X < x ,) = £ p(x). (2.3)


x Xj

En reprenant l’équation 2.3, on peut aussi noter le résultat utile ci-dessous, obtenu lorsque b>a:
P{a <X<b)~P(X<b)~P(X<à)=) - F(à). (2.4)
On présente en général la fonction sous une forme tabulaire, graphique ou mathématique,
comme le montrent les exemples ci-après.
48 CHAPITRE 2

Exemple 2.8

/
P(x) + c

X 3/8 - !
%
«

pix) f

0 1/8 2/8
î 3/8
2 3/8 1/8 *

•*

3 1/8
0 1 2 3 x
- I
I
t
> i J j i

- . y
La fonction de masse du nombre de «p ile » lors du lancer d'une pièce
à trois reprises

On peut calculer des probabilités associées à des événements à l’aide de la fonction de masse
Quelle est la probabilité d’obtenir au maximum un « pile » lors de trois lancers ?
P(X< \) = P(X = 0) + P(X = 1)
p(0)+ p(l)
1 3 4 J.
~+ —

8 8 8 2
Quelle est la probabilité d’obtenir plus de deux « pile » lors de trois lancers ?
P(X > 2) = P(X = 3)
4

Pi 3)
1
8

Exemple 2.9
Soit une variable aléatoire X dont la distribution de probabilité est définie par la relation
( n '
n-x
Px(1 ~ P) si x = 0,1,...,
pix) x J (2.5)
0 smon,
où n est un entier positif et p est un paramètre avec 0 < 1. Cette relation porte le nom de « loi
binomiale » et fera l’objet d’une étude plus poussée au chapitre 4. On pourrait représenter ce modèle
par un tableau ou un diagramme pour des valeurs données de n et de , en évaluant p ( ) lorsque = 0,
1, 2, ..., n. Notons que l’exemple 2.8 représente la fonction de masse binomiale pour des paramètres
valant n= 3 et p = 1/2.
Les variables aléatoires à une dimension 49

Exemple 2.10
Soit N objets dont Dsont défectueux. On en prélève au hasard et sans remise un échantillon de t
Si X représente le nombre d’objets défectueux dans cet échantillon, alors
\
D N -D
x J n-x
si x € {max (0, n - N + D),..., min (n, D)\
p(x) N X ( 2.6)
n J
0 smon.
Cette distribution de probabilité porte le nom de «loi hypergéométrique». Prenons un cas particulier
oùN = 100 objets, D = 5 objets défectueux et n = 4 objets tirés. On a alors
\
5 95
* y 4 - x / six = 0,1,2,3,4
P (x ) f 100 ^
4 J
0 smon.
Quelle est la probabilité de tirer exactement un objet défecteux lors d’un tel échantillonnage ?

La distribution de probabilité d'une loi hypergéométrique pour = 100, £) = 5


et n - 4
CHAPITRE 2

On vient de voir quelques distributions de probabilité discrètes et divers m oyens de pré­


senter les couples [(*„ p(jc,)), i = 1, 2, ...]. Plus loin, on étudiera un certain nom bre de lois de
probabilité en partant chaque fois d’un ensemble de postulats fondés sur l’étude de phénom ènes
du monde réel.

2.3 Les variables aléatoires c o n tin u e s


Lorsqu’une variable aléatoire X est continue, sa fonction de répartition est alors continue
et admet une dérivée/(x) = (d/dx)F(x) pour toutes les valeurs de x (à l’exception peut-être d’un
certain nombre dénombrable), cette dérivée étant continue par morceaux. D ans ces conditions,
l’image Rx de X est formée d’un ou de plusieurs intervalles.
< - , . • * * ' » ' • 1 . ; " J r ‘ ' . • • ■ *

Fonction de d e n s ité d e X
La fonction de densité (de probabilité) de la variable continue X, est définie par :

f(x) = 4- n x ) , (2.7)
; dx
et il s’ensuit que

F(x)= P du (2.8)

On rem arque une correspondance étroite entre ce dernier résultat et l’éq u atio n 2.3 (ie
symbole de l’intégration ayant remplacé celui de la sommation).

P ro p rié té s d 'u n e fo n c tio n de d e n s ité

1. f(x)0 pour tout x e Rx-


2. f f ( x ) dx = 1.
RX

3. La fonction f(x) est continue par morceaux.


4. Si jc n’appartient pas à l’image de X, alors f(x) = 0

Énoncer la définition d’une fonction de densité exige une fonction /d é fin ie sur l’im age de
X telle que

où e représente un résultat de l’espace échantillonnai. Il importe de reconnaître que f ( x ) ne


représente pas une probabilité en soi, et qu’il faut l’intégrer entre deux points p o u r en tirer une
probabilité. La figure 2.6 illustre ces notions.
Ainsi, l’aire totale sous la courbe de la fonction de densité vaut 1. A la figure 2.7, par
exemple, les intervalles ( a,b) et (b, c) sont de même longueur, m ais la
à (a , b) est plus grande.
Un fait intéressant à noter: contrairement à ce qu’on observe dans le cas d ’une variable
aléatoire discrète, et puisqu’ici la fonction F{x) est continue, pour £ > 0, on a

P (X = x) = lim [F(x + ô ) ~ F ( x )] = 0. (2 .10)


<5—
>0 «
Les variables aléatoires à une dimension

/
.

t
i

i
:

?
l

i
t

P(a <X< b)

La probabilité que X soit compris entre a et b

Deux intervalles de même longueur associés à des probabilités différentes

L’équation 2.10 peut sembler contre-intuitive. Si X peut prendre toutes les valeurs dans un
intervalle quelconque, alors P(X = x0) = 0 ne veut pas dire que notre modèle est mal adapté.
Lorsqu’on considère une mesure continue réelle comme la vitesse du vent et que l’on s’inté­
resse à l’événement V= 21,3 km/h, il s’agit d’une valeur arrondie de la vitesse liée à la
de notre instrument. La probabilité que V = 21,3, nulle en théorie pour la valeur exacte, est
équivalente en pratique à la probabilité que V appartienne à un petit intervalle autour de 21,3,
par exemple [21,25 ; 21,35], qui n’est pas nulle selon notre modèle.
Ainsi, puisque chaque point est de probabilité nulle pour une variable continue, il n’est pas
nécessaire de distinguer les inégalités < et < dans la définition des événements.

Remarque
Il en résulte directement que P(a <X<b) = P(a < X < b) = P(a <X<b) = P(a < X < b), où X est une
variable continue* ces valeurs étant toutes données par F(b) - F(a).

Exemple 2.11
La durée de fonctionnement avant défaillance du tube cathodique de l’exemple 1.13 présente la fonc­
tion de densité suivante :
Xe~Xt sir> 0
sinon,

où À > 0 est une constante appelée « taux de défaillance ». On qualifie d’« exponentielle » cette fonc­
tion de densité, et des expériences ont démontré que cette fonction peut servir à décrire la durée de ►
CHAPITRE 2

ônctionnement avant défaillance (un phénomène du monde réel) de certains types de composants.
Supposons qu’on veut ici déterminer P ( T > 100 heures), ce qui correspond à /^(ÎOO < T < oo). On a alors

P(T 100) Xe A/
dt
100
100 A
e

On pourrait de nouveau utiliser la notion de probabilité conditionnelle et déterminer P (T 100 99),


soit la probabilité que le tube fonctionne au moins 100 heures, sachant qu’il fonctionne déjà depuis plus
de 99 heures. On arrive ainsi à
P( T 100 et T 99)
P(T 100 \T 99)
P( T 99)
Xt
Xe dt e 100 A
100 A
99A
e
Xe Xt
dt e
99

E x e m p le 2.12
Soit une variable aléatoire X dont la fonction de densité triangulaire est définie ci-dessous et représentée
graphiquement à la figure 2.8.

X si 0 < x < 1

—x si 1 < x < 2

0 sinon •

/ « +

x
0 1 2

U n e fo n ctio n de d e n sité tria n g u la ire

Voici quelques calculs réalisés à partir de cette densité. Vous pouvez hachurer les surfaces correspon
dantes sur le graphique de la figure 2.8 pour estimer les probabilités avant de les calculer.
Les variables aléatoires à une dimension

On utilise en général un modèle mathématique pour décrire une fonction de densité. Une
représentation graphique ou géométrique peut également s’avérer utile. La probabilité que la
variable X se situe entre deux valeurs données correspond à l’aire sous la courbe comprise entre
ces deux valeurs.

2.4 Quelques caractéristiques


des distributions
Une distribution discrète est entièrement déterminée par sa fonction de répartition F(x), ou
encore par les couples [(xh p ( x i ;) i = 1, 2, ..., n, ...]. Une distribution
déterminée par [(x, f(x)) ; x e Rx] • Or» il est souvent pratique de recourir à certains paramètres
descriptifs de la variable aléatoire. L’espérance et la variance sont les deux paramètres les plus
couramment utilisés.

2.4.1 L'espérance mathématique


Le premier de ces paramètres est l’espérance mathématique ou encore la moyenne de la variable
aléatoire, et il est représenté par la lettre grecque p (mu) ou par E(X)

Espérance de X

si X est une variable discrète


E( X) = p = {
si X est une variable continue.

Cette mesure fournit une indication de la tendance centrale de la variable aléatoire. La


valeur de p est celle que l’on obtiendrait si on réalisait notre expérience aléatoire un très grand
nombre de fois (une infinité), et que l’on faisait la moyenne de toutes nos observations. C’est
donc la moyenne théorique des valeurs de X pondérées par leur masse ou leur densité.
On peut représenter une fonction de masse du point de vue mécanique, comme des poids
p(xï) appliqués en certains points xi sur une poutre (voir la figure 2.9a), à la page suivante). La
somme de ces poids doit être égale à 1 pour que l’analogie soit correcte. Une fonction de densité
peut être représentée de façon similaire par une masse unitaire répartie au-dessus d’une poutre
(voir la figure 2.9b), à la page suivante).
CHAPITRE 2

Dans les deux cas (discret et continu), l’espérance de X est le centre de gravité ou le c e n tr
de masse, c’est-à-dire le « point d’équilibre » de la masse représentée par le graphique de p (x) o u d
/(x). Un diagramme symétrique donnera lieu à une espérance située au milieu de l’im age de X.

b)
Une analogie entre l'espérance et le centre de masse: a) dans le cas d iscre t;
v..
b) dans le cas continu

Exemple 2.13
Revenons à l’expérience de l’exemple 2.8, où X représente le nombre de fois qu’une pièce lancée à trois
reprises tombe sur le côté pile. On obtient ici
1 3
E(X) = fi = ' £ x lp(xl) = 0 -1 î ) + l { f ) + 2 - ( f 1+ 3
(= 1 8 2
comme l’indique la figure 2.10. Dans ce cas précis, on aurait aisément pu déterminer la valeur de fl
en examinant le diagramme, étant donné sa symétrie. Il faut noter que, dans cet exemple, la moyenne
n’est pas une valeur possible de .XlI s’agit du nombre moyen de «pile» qu’o
une pièce à trois reprises un très grand nombre de fois.
X t
I
*
t

p(x)
3/8 z
i
t

|S
t

2/8 ±
r

*
i
•4

1/8 ft
k
t

i
I

0
i.

i
£ r

0 1 2 3 x i

p = 3/2 i

i
i

Le calcul de la moyenne théorique


Les variables aléatoires à une dimension

Exemple 2.14
Soit la fonction de densité triangulaire définie à l’exemple 2.12 :
X si 0 < x < 1
2-x si 1<x < 2
0 sinon.
La moyenne correspond ici à
x •x dx + X‘0 dx
= 1.
Encore une fois, la moyenne aurait pu être déterminée à partir du diagramme grâce à sa symétrie.

2.4.2 La variance et l'écart-type


Une autre mesure décrit l’étalement ou la dispersion de la probabilité associée aux éléments de
Rx• Il s’agit de la variance, notée a 2 (sigma carré) et définie comme suit.

Variance de X

si X est une variable discrète


V(X) = ct2 = £[(AT-/0 ] = l
si X est une variable continue.

La variance est une mesure de dispersion des valeurs par rapport à la moyenne. Plus la
variance est grande, plus les valeurs de X qu’on obtiendrait lors de plusieurs réalisations de
l’expérience seraient éloignées les unes des autres. La variance est définie comme la moyenne
des écarts entre les x et leur espérance fl élevés au carré, c’est-à-dire V(X) = £[(X —fX)2].
Si on reprend l’analogie des masses sur une poutre, la variance correspond au moment
d’inertie du diagramme par rapport à fl. Plus les valeurs sont dispersées (cr2 grand), plus il serait
difficile de faire pivoter le diagramme autour d’un axe placé en //.
Soit les deux distributions discrètes présentées graphiquement à la figure 2.11 {voir à la
page suivante). Chacune a une moyenne de 1. La variance de la variable aléatoire discrète en a)
est de

<To2 = ( 0 - l ) 2( y + ( l - D 2g ) + (2 - l ) 2( I ) = I ,

et celle de la variable aléatoire discrète en b) est de

<742 = ( - l - l ) 2i + (0 —l)2L ( l - l ) 2i + (2 —1)2| + (3 —l)2i = 2,

ce qui est quatre fois supérieur à la variance de la variable en a).


CHAPITRE 2

/
p(x) p(x)
1/2

1/4 1/5

0 1 2 x 1 0 12 3 x
a)fi 1 etcr 2 = 0,5 b) 1 etcr 2 = 2

Deux distributions de probabilité de même espérance mais de variance


différente

Si la variable aléatoire est exprimée en mètres, on utilisera cette même unité pour la moyenne,
mais on exprimera la variance en mètres carrés. Il en va ainsi quelle que soit l’unité utilisée.

Écart-type de X
« „ / . / . i a » - * — •’ «

L'écart-type est défini comme la racine carrée de la variance et on le note a, où


2
G a (2.13)

L’unité utilisée pour l’écart-type est la même que pour la variable aléatoire. Un faible écart-
type dénote une faible dispersion, et un grand écart-type, une plus grande dispersion.
Par manipulation algébrique, on peut réécrire l’équation 2.12 sous la forme
2 2
G V(X) EÇX2) ~ P%
ou

^ , x f p(xi ) si X est une variable discrète


2 *
E { X A) (2.14)
x f ( x ) dx si X est une variable continue

Exemple 2.15
À partir de l’exemple 2.8 sur le lancer d’une pièce, l’exemple 2.13 a permis d’établir que = 3
j , d’où
2
2 3Ÿ 13V f . 3Y 3 3Y 1 3
(7 y
£ i(xi - f i )p(xi)
2 0- I - +| 1
- + 12 — + 3
i 2 / 8 v 2) 8 l 2 8 2 8 4
Utilisons maintenant l’autre forme de l’équation, soit
2
2 1 12 3 2 3 2 1 3 3
a 2 =E{X2) - f l 2 0 + 1 -- + 2 -- + 3 •-
8 8 8 8 2 4

ce qui simplifie le calcul. En prenant la racine carrée de a 2, on obtient l’écart-type de X


a 0 , 866 .
Les variables aléatoires à une dimension

Exemple 2.16
Si on revient à l’exemple 2.11 sur la distribution exponentielle, en posant A = 2 , on a la fonction de
densité/(x), illustrée à la figure 2.12 et définie par
-2x
2e six > 0
f(x)
0 smon.

En recourant à l’intégration par parties, on obtient

x /(x ) dx x 2e —
2jc
dx
2
et
2 1 1 1
<72 x 2 •2e 2x dx
ri x - \ ) f ( x ) d x = i
2 2 4 4

1
On obtient donc un écart-type valant a
2
/

La fonction de densité exponentielle de paramètre Â= 2

2.4.3 Les moments d'une distribution


La moyenne et la variance ne sont pas les seuls paramètres qui servent à décrire une distribu­
tion. En effet, les moments d’une distribution permettent de la décrire, d’en mesurer les pro­
priétés et même de la déterminer dans certains cas. Le £-ième moment par rapport à l’origine
se note ji'k, où

) si X est une variable discrète

f x kf dx si X est une variable continue.


v.
CHAPITRE 2

Appelés « moments centrés », les moments par rapport à la moyenne se notent u k, où

w V -o si X est une variable discrète


l
(2.16 i
(x —fi)kf ( x ) dx si X est une variable continue

Soulignons que la moyenne fl est égale à fi\ et la variance cr2, à fi^.

.5 fonctions une variable


En génie et en gestion, il est fréquent de s’intéresser au comportement d ’une quelconque fonction
(notée ici H) d’une variable aléatoire X. Par exemple, on peut étudier l’aire de la section d ’un fi
de cuivre même si on ne dispose que de son diamètre. La relation Y — n X 1/^, où X représente
le diamètre de la section du fil, traduit cette valeur. Si on sait que X est une variable aléatoire,
il en va de même pour Y, et l’on devrait pouvoir déterminer la distribution de probabilité de
Y = H(X) si l’on connaît celle de X. Nous examinerons ici, dans un prem ier tem ps, les problèm es
de ce type. Il sera ensuite question de l’espérance mathématique, un concept auquel nous ferons
très souvent appel dans les chapitres subséquents.

2.5.1 Les événements équivalents


Avant d’examiner différentes méthodes pour déterminer la distribution de probabilité d ’une
fonction d’une variable aléatoire, précisons les concepts en cause.
Soit une expérience % et son espace échantillonnai Sfi Une variable aléatoire X définie dans
SP attribue une valeur aux différents résultats e de l’espace échantillonnai, d ’où X(e) = x, les
valeurs x appartenant à l’image Rxde
de manière telle que les valeurs y = x(H)formant l’image R Y de
pareil cas, Y représente une variable aléatoire puisque chaque résultat e d éterm in e une
valeur y de la variable aléatoire Y, autrement dit y = H[X(e)]. La figure 2.13 illustre ce co n cep t
Soit Cun événement associé à RY et B, un événement associé à Ces deux événe
sont équivalents s’ils se réalisent ensemble, autrement dit si B = {jc g R x : H( x ) e C}. Supposons
de plus un événement A associé à Sf. Si les événements A et B sont équivalents, alors les événe­
ments A et C le sont également.
Les variables aléatoires à une dimension

P robabilité d'un é v é n e m e n t associé à H( x )


Soit X une variable aléatoire (définie dans Sf) ayant une image Rx, et H, une fonction réelle telle que
Y = H(X) est une variable aléatoire d’image R Y.Pour tout événement C c R

Py(C) —Px([x G Rx• H(x) g C}). (2.17)

Ces probabilités se rattachent à des probabilités dans l’espace échantillonnai. On pourrait


ainsi écrire

PY{C) = P({e € Sf : H[X(e)\ e C}).

Afin d’alléger la présentation, nous écrirons simplement P au lieu d’utiliser PYou Px.

L’équation 2.17 indique la méthode à utiliser pour résoudre les problèmes. On doit en effet
trouver l’événement B de Rx équivalant à l’événement C de RY, puis en déterminer la probabilité.

Exemple 2.17
Prenons l’exemple de l’aire Y de la section d’un fil. Supposons que le diamètre de ce fil soit la variable
aléatoire X, dont la fonction de densité est illustrée à la figure 2.14 et définie ainsi :

200 si 1,000 <x< 1,005


m
0 sinon.

/ 1
f(x)

200

100

X
1,000 1,005

La fonction de densité du diamètre du fil


■■A P
On exprime alors l’aire de la section du fil sous la forme Y — (7t/4)X2. Si l’on veut déterminer
la probabilité P (Y < (l,01 ) 7r/4 ), il faut d’abord trouver l’événement équivalent en remplaçant Y par sa
fonction de X :
P (Y <
(1 ,01 ) 7t/4) = P((;r/4)X2 < (l,01)/r/4) = P(\X\ < VTÔT).
L’événement [x g Rx: |jc| < yj1,01} appartient à Rx, et comme/(x) = 0 pour toute valeur de x < 1,000,
on obtient
P(|Xl<VÏÏÔI)
1 l = />
a000<X <V ÏÏÔ I) = \ 2 0
Jlj000 0 d x
0,9975.
60 C H A P IT R E 2

Exemple 2.18
com pteur Geiger-Müller permet de mesurer le nombre de particules ïs reçues sur un
temps t. Dans un certain environnement m asse de X, soit
nombre minute

e~44 x si x = 0, 1, 2,
PU) x\
0 smon.

Supposons que l’on s’intéresse à une fonction de X,

Y=2X + 2,

et que l’on souhaite calculer la probabilité < 5).


En procédant com m e à l’exemple 2.17, on obtient
3
P(Y <5) = P(2X + 2<5) = P\ X
2
e (4)° . ~4 (4 )1
P(0) + 1) +
0! 1!
-4
5e 0 ,0 9 2 .
3
L’événement {x e Rx : x < j } appartient à l’image de X, et on dispose d’une fonction de m asse p(pc)
associée à cette image. Il n’est donc pas toujours nécessaire de connaître la fonction de m asse o u d
densité de Y pour calculer des probabilités.

Afin de déterminer de manière générale la distribution de la variable aléatoire Y —H(X), on


distingue deux cas principaux :
*

1. La variable Y est discrète, ce qui peut arriver lorsque X est une variable discrète on
continue. On cherche alors à trouver une fonction de masse p Y(y ).
2. La variable Y est continue, ce qui arrive lorsque la variable X est également continue
Dans ce cas on cherche à trouver une fonction de densité f Y( y ) .
Ces deux cas sont présentés dans les deux sections qui suivent.

2.5.2 Les fonctions discrètes d'une variable aléatoire


S o it A’ e t K d e u x v a r ia b le s a lé a to ir e s d is c r è te s e t B , = (x v x, 2, x , , . . . } l ’e n s e m b l e d e s v a l e u i
d e X te lle s q u e H ( x , ) = y, p o u r u n e n s e m b le q u e lc o n q u e d ’i n d i c e s j .
L a f o n c tio n d e m a s s e d e Y, n o té e Pr(}'i), s e t r a d u i t p a r

P r ( y l) = P (Y = y i) = X P x ( T ,) ’ ( 2 .1
e Bi

P a r e x e m p le , à l a f ig u r e 2 .1 5 , l a p r o b a b i l i t é d e y . c o r r e s p o n d à

P r C y d ~ P x ( x i ) + P x ( JCi2) + P x ( x i3) + P x ( x i ) .
Les variables aléatoires à une dimension

I t

iII
.

>

*
.

i
*

i
;

Des probabilités associées à

Dans le cas particulier où la fonction H est telle qu’il y a exactement une valeur x associée
à chaque valeur y, on a p Y(yd = Px(*,•)» où y, = //(x ,) . Illustrons ces concepts par des exemples.

Exemple 2.19
Revenons à l’expérience où X représente le nombre de fois qu’une pièce lancée à trois reprises tombe
sur le côté pile. On se souviendra que X peut ici prendre quatre valeurs, 0, 1, 2 et 3, leurs probabili­
tés respectives étant les suivantes : | et Si F= 2X - 1, alors Y peut prendre les valeurs —1, 1, 3
et 5, et on a

P y (—1 ) —Px ( 0 ) —g 5
3
PY(1) = Px (1) = g ’

P Y0 ) = P x (2 ) = - ,

PK(5) = Px(3) = i-

Dans le cas présent, la fonction H est telle qu’il y a exactement une valeur x associée à chaque valeur y.

Exemple 2.20
Soit la variable X de l’exemple précédent. Si Y = \X - 2\, de sorte que Y peut prendre les valeurs 0, 1 et 2
(voir la figure 2.16, à la page suivante), on a alors

P y ( 0 ) = xP2( ) ~ ë’

p . (1) = M » + P* (3) = J •
1
P y (2 )= p x (0) 8" ►
CHAPITRE 2

Un exemple de fonction : H[x) =

Lorsque la variable X est continue tandis que la variable Y est discrète, la fonction de masse
p Y(yd est alors donnée par

P y (y,- ) = Jf x (*) dx> (2.19)

où B représente l’événement de Rx équivalant à l’événement de R y.

Exemple 2.21
Soit la variable X dont la fonction de densité est définie ci-dessous et illustrée à la figure 2.17.
—Xx
Xe si x > 0
/rW
0 sinon.

X
i
■a

1
4

i
F La fonction de densité de la variable X

Supposons que l’on définit la variable Y comme suit :


0 pour X < MX
Y =\
1 pour X > l/X,
alors l/X
l/ A
—Xx
e - Xx
l-e -i 0,632
P y ( 0) Xe dx 0
et
p y (1) = 1—pY(0) ~ 0,368.
Les variables aléatoires à une dimension

2.5.3 Les fonctions continues d'une variable


aléatoire continue
Soit X une variable aléatoire continue de fonction de densité/* (*). Si la fonction H est elle aussi
continue, alors Y = HQC) représente une variable aléatoire continue dont on peut déterminer la
fonction de densité f Y(y) en procédant comme suit :
1. On établit la fonction de répartition de Y, c’est-à-dire FY{y) = Py(Y < y), en trouvant
l’événement B de Rx qui est équivalent à l’événement {Y < >>} de R y.
2. On dérive FY()y par rapport à y afin d’obtenir la fonction de densité f Y(y).
3. On détermine l’image de la nouvelle variable aléatoire.

Exemple 2.22
Supposons qu’une variable aléatoire a la fonction de densité
x/S si 0 < x < 4
/*(*) 0 sinon.

On veut connaître la fonction de densité fy(y) de la variable aléatoire Y = H(X) = 2X + 8. On suit les
étapes énumérées ci-dessous.

1. FY(y) = P ( y < y ) = P(2X + %<


P(X < (v-8)/2)
(y -
8 ) / 2 *
2 ( y — 8)/2
1
(jc/ 8) dx = (y l6y + 64)
16 0 64
y î
2. f Y{y) = FXy)
32 4
3. Si * = 0, y = 8 et si x = 4 , y =16, de sorte que

y 1
si 8 < y < 16
fy(y) 32 4
0 sinon.
La figure 2.18 illustre la différence entre la densité de X et celle de Y.

fx(*) I fr(y) 4

1/2 1/4

1/4 1/8

0 0
0 8 16 y
a) b)

a) La densité de X ; b) la densité de Y = 2 X + 8
64 CHAPITRE 2

Exemple 2.23
Reprenons la variable aléatoire X définie à l’exemple 2.22 et supposons que Y = ) (X 2)2. En
procédant comme à l’exemple 2 .2 2 , on obtient ce qui suit.

1. Fy(y) P(Y < y)= P((X - 2)2 < y)= P ( S


P(2 —J ÿ <X< 2 + Jÿ)
2+>Iÿx x 2
—dx = —
2->/ÿ 8 16
2 - s i ï

1
[(4 + 4Jÿ + y) - (4 - 4yjÿ + y)]
16
1
2 V?
1
2. f Y(y) = Fy
4 V?
3. Six 2 , y 0, et si x = 0 ou 4, on a y = 4. Cependant, la fonction / y n’est pas définie pour
y = 0, de sorte que

1
si 0 < y < 4
/y (y) 4Vÿ
0 smon.
2
La figure 2.19 illustre la différence entre la densité de X et celle de 2)
/
/y(y) I
0,5
fx(x) I
0,4

1/2 0,3
0,2
1/4
0,1
i
«
4

r
0 1 2 3 4 y
a) b) !
t
1
I

t
t

a) La densité de X; b) la densité de Y = ( X - 2)

On note que l’événement de équivalant à l’événement {7 < y} de R Y était {X < 8 )/ 2 }


à l’exemple 2.22 et {2 —y/ÿ < X < 2 + ^Jÿ} à l’exemple 2.23. Toutefois, à l’exemple 2.22, H c o n s­
titue une fonction strictement croissante de x, ce qui n’est pas le cas à l’exemple 2.23.
Le théorème suivant permet de trouver directement la fonction de densité de la v a ria b le
Y = H(X) dans le cas où la fonction H est strictement croissante, ou strictement d écro issan te.
Les variables aléatoires à une dimension

Soit X une variable aléatoire continue dont la fonction de densité vérifi > 0 pour <
Si y = H(x) définit une fonction continue strictement croissante ou strictement décroissante de x
alors la variable aléatoire Y = H{X) a pour fonction de densité
dx
Sy(y) = fx (*) dy ( 2 . 20 )

où x = H (y), sa valeur exprimée en fonction de y. Si la fonction H est croissante, alors fy{ v ) 0 L 1

H {a) <y < H{b). Si elle est décroissante, alors/y (y) > 0 si H(b) H (a).

Démonstration

Exemple 2.24
À l’exemple 2 .2 2 , on avait
jc/8 si 0 < x < 4
fx(x) 0 smon.
et ff(x) = 2x+ 8, qui est une fonction strictement croissante. L’équation 2.20 donne ainsi
dx y- 8 1
fy (y) = f x (x) dy 16 *2

puisque x = (y - 8)/2. Comme H{0) = 8 et H(4) = 16, on obtient


y 1 si 8 < y < 16
fy(y) 32 4
0 sinon.

2.5.4 L'espérance mathématique d'une fonction de X


Soit une variable aléatoire X. Si Y = H(X) est une fonction de X et donc une variable aléatoire,
alors l’espérance mathématique de H{X) se définit comme suit.

Espérance d'une fonction de X

si la variable X est discrète.


E\H(X)] = {
si la variable X est continue.

Lorsque la variable X est continue, on se limite ici aux fonctions H telles que Y = H(X)
constitue une variable aléatoire continue. Les équations 2.21 et 2.22 indiquent qu’on peut
déterminer la moyenne de la variable Y = H(X) en utilisant uniquement la distribution de la
variable X.
CHAPITRE 2

La moyenne et la variance relèvent d’une application particulière de ces deux équations. En


effet, lorsque H(X) = ,Xon observe que

E[H(X)]=E(X) = .uj( 2.23)

L’espérance de la variable aléatoire X correspond ainsi simplement à la moyenne ju.


De même, si H(X) = (X - ju)2, alors

E[H(X)] = E [ ( X - ju)2] = V(X) = a 2. (2.24)

On peut donc définir la variance de la variable aléatoire X comme l’espérance m athém atique
d’une fonction.

Variance d'une fonction de X


La variance d'une fonction de X peut s’exprimer comme suit:
VI H( X) } =
= E[(ff(X))2] - [E(H(X))]2. (2.25)

L’opérateur d'espérance peut également servir à exprimer les moments par rapport à l’o ri­
gine et les moments centrés dont il a été question précédemment. On a alors

A = £(X‘) (2.26)
et

A = E [(X -£(X ))*].

E s p é ra n c e e t v a ria n c e d e a X + b
Il convient d’examiner ici une fonction linéaire H(X) = aX + où et sont des constantes. Si
la variable X est discrète, on a

E(aX + b) ='^(aXj + £>)/?(.*,)


/
a^ x iP(x i) + b ^ Jp(xi)
l l
aE(X) + b (2.27)

et le résultat est le même si la variable X est continue. En effet,

E(aX + b) (ax + b)f(x) dx

a x f ( x ) dx + f ( x ) dx
OO

aE(X) + b. ( 2 . 28 )
Les variables aléatoires à une dimension

En recourant à l’équation 2.25, on obtient


V(aX + b)= E[(aXE(aX + b))2]
= E[(aX + b - aE{X) - b)2]
= a2E [ ( X - E ( X ))2]
= a2V(X). (2.29)
Ces résultats indiquent qu’une translation d’une ampleur b influe sur l’espérance mathématique,
mais non sur la variance.

Espérance et variance d'une constante


Dans le cas où H(X) = b (une constante), on peut aisément vérifier que
E(b) = b (2.30)

V(b) = 0. (2.31)
Exemple 2.25
Soit une variable aléatoire X telle que E(X) = 3 et V(X) = 5. Si H(X) - 2 X - 1 , alors
E[H(X)] = 7) = 2E(X) - 7 = -1

V[H(X)] = X
2(V
- 7) = 4V(X) = 20.

Les exemples qui suivent font voir d’autres calculs liés à l’espérance et à la variance.

Exemple 2.26
Une entrepreneuse s’apprête à soumissionner un travail. Le nombre de jours requis pour exécuter ce
travail est une variable aléatoire notée X. Le bénéfice B que réalisera l’entrepreneuse varie en fonction
de X. En d’autres termes, B =H(X). La distribution de probabilité (jc, p(x)) de X se présente comme suit.
x p(x)
3 1/8
4 5/8
5 2/8

La notion d’espérance mathématique permet de calculer la moyenne et la variance de X, soit


CHAPITRE 2

Supposons que la fonction H(X) dans ce cas se présente comme suit.


X H(x)
3 10 000 $
4 2 500
5 -7 000
Alors, l’espérance mathématique de H(X) égale
2
E[H(X)] = £ H(xf) •p(xt ) = 10 000 •[ i ] + 2500 / 5 7000- 1062,50$,
v8 ) v8 8
ce qui représente le bénéfice moyen que réaliserait l’entrepreneuse si elle exécutait ce travail un très
grand nombre de fois (en fait, un nombre infini de fois), la fonction H demeurant toujours inchangée et
la variable aléatoire X obéissant à la loi de probabilité p{x). On peut ici aisément calculer la variance
de 15 = HQC) :
2
V[H(X)] = E U H ( X ) f } - i E ( H ( X m (10 0Ô0)24 + (2500)2 5 • ' —— 2 2 8 + ( - 7 0 0 ° )
(1062,5)
8
27,53*106 $2.
L’écart-type du bénéfice s’exprime en $ (et non en $2 comme la variance) et vaut
y/V[H(X)] « y/27,53-106 « 5246,65 $.

Exemple 2.27
Voici un problème simple et bien connu de gestion des stocks, celui du vendeur de journaux. Ce ven­
deur paie ses journaux 15 0 l’unité et les revend 25 0 l’unité, mais il ne peut pas retourner ses invendus.
Le tableau suivant fait voir la distribution de la demande quotidienne de ses journaux, la demande de
toute journée étant indépendante de celle de la veille.

Nombre de ventes x 23 24 25 26 27 28 29 30
Probabilité p(x) 0,01 0,04 0,10 0,10 0,25 0,25 0,15 0,10

Soit s le nombre d’exemplaires qu’il achète et X, la demande quotidienne. Si le vendeur achète trop
de journaux (X < s), il subit une perte en raison de son stock excédentaire (15 0 par item en trop). S’il
en achète trop peu (X > s), il se prive d’une part de bénéfice puisqu’il ne comble pas la demande (10 0
par item manquant). Donc, on peut s’attendre à ce que le vendeur souhaite avoir un stock de journaux
qui atténue sa perte moyenne. Soit L(X, s) la perte qu’entraîne un stock donné s. La perte que subit le
vendeur se traduit alors simplement par

0,10(X - s) si X > s
0,15 (s - X) si X < s,

de sorte que la perte moyenne pour un stock donné s correspond à


s 3 0

E[L(X,s)]= ^ 0,15(s- x ) •p(x) + 0 ,1 0 (x -s)./?(*).


x=23 x= s+ l

Évaluons E [L{X, 5)] pour différentes valeurs de s.


Les variables aléatoires à une dimension

Soit s = 26,
E[L(X, 26)] = 0,15[(26 - 23)(0,01) + (26 - 24)(0,04) + (26 - 25)(0,10)
+ (26 - 26)(0,10)] + 0,10[(27 - 26)(0,25) + (28 - 26)(0,25)
+ (29 - 26)(0,15) + (30 - 26)(0,10)]
= 0,1915$.
Soit s= 27,
E[L(X, 27)] = 0,15[(27 - 23)(0,01) + (27 - 24)(0,04) + (27 - 25)(0,10)
+ (27 - 26)(0,10) + (27 - 27)(0,25)] + 0,10[(28 - 27)(0,25)
+ (29 - 27)(0,15) + (30 - 27)(0,10)]
= 0,1540 $.
Soit s = 28,
E[L(X, 28)] = 0,15[(28 - 23)(0,01) + (28 - 24)(0,04) + (28 - 25)(0,10)
+ (28 - 26)(0,10) + (28 - 27)(0,25) + (28 - 28)(0,25)]
+ 0,10 [(29 - 28)(0,15) + (30 - 28)(0,10)]
= 0,1790$.
Les autres valeurs de s donneront lieu à des pertes moyennes plus élevées que 0,1540 $.
Le vendeur devrait donc se procurer 27 exemplaires s’il veut réduire le plus possible sa perte moyenne.
Notons ici qu’il ne s’agit pas d’une perte nette (au sens d’un déficit), car on y inclut les bénéfices poten­
tiels non réalisés.

Exemple 2.28
Soit le système illustré dans le schéma ci-dessous.

Au moins un des deux éléments du système doit fonctionner. Or, l’un d’eux joue un rôle de dispositif de
secours (il demeure inutilisé jusqu’à ce que l’autre connaisse une défaillance), la commutation s’effec­
tue sans faille, et le système ne fait l’objet d’aucun entretien. On peut démontrer que dans certaines
conditions, où la durée de fonctionnement avant défaillance de chaque élément du système obéit à une
loi exponentielle, la durée de fonctionnement avant défaillance du système a la fonction de densité
six > 0
sinon, -
où X > 0 et représente le taux de défaillance des modèles exponentiels des éléments. Le présent système
a une durée moyenne de fonctionnement avant défaillance de

S’il n’y avait qu’une composante dans le système dont la durée de vie suivait une loi exponentielle
(/(x) = Ae~Xx pour x > 0), alors l’espérance de X serait E(x) = 1 Ici, la durée de vie prévue du système
est deux fois plus longue parce que les composantes fonctionnent l’une après l’autre.
70 CHAPITRE 2

Notons que V(X) = £[(X - u )2] E(X2) - 2

Distribution de probabilité d’une fonction Y = H ( X )


• X et Y discrètes

Py(yi ) Px(x i X OÙ B l {xt : H( Xi ) y,\


X Bi
X continue et Y discrète

Py W = J[Bf x ( x ) dxO
’Ù H(x) = y (}

X et Y continues
Fyiy) P {Y <y) = P(H(X) < y) = P(X < H ~ \y ))
cl
fy(y) Fy(y)
dy
Les variables aléatoires à une dimension

2.1 Au jeu de poker, on peut obtenir de 0 à ex si —oo < <0


4 as parmi les 5 cartes d’une main. Soit c) H( x
X la variable aléatoire représentant le 1 si x >0
.
nombre d’as.
a) Quelle est la probabilité de chaque 0 si x 0
valeur possible de ? d) J M = . 0,1* si 0< jc<10
b) Illustrez par un diagramme approprié 1 si x > 10.
la distribution de la variable X.
2.2 Le nombre de véhicules retournés à une x si 0 < x < 1
e) K(x) =
agence de location peut être de 0,1, 2, 3,4 0 sinon.
ou 5 en une journée, avec une probabilité 2.6 Déterminez la fonction de densité cor­
respective de j, | et Sachant respondant à la ou aux fonctions de
que l’espérance de X vaut -y, déterminez la l’exercice 2.5 qui sont des fonctions
variance du nombre de véhicules retournés. de répartition.
2.3 Une variable aléatoire X a la fonction de 2.7 Laquelle ou lesquelles des fonctions
densité définie par f(x) = ce~x, pour 0 < définies ci-dessous correspondent à une
a) Déterminez la valeur appropriée de distribution de probabilité discrète ?
b) Calculez la moyenne de X. r

c) Calculez la variance de X. 1/3 si x = 0


a) p(x) = < 2/3 si jc= 1
2.4 Supposons que la fonction de répartition
de la durée de fonctionnement T (en heures) 0 sinon.
d’un tube cathodique se traduit par 1 - e~cl,
où c est un paramètre qui varie selon le si x e 0,1,
fabricant et t>
0. 2, 3,4,5
a) Déterminez la fonction de densité de T. sinon.
b) Supposons que c = 0,002. Sachant
que le tube a déjà été utilisé durant
300 heures, calculez la probabilité six= 1,2,...,n
c) p(x) = <
qu’il fonctionne encore au moins
200 heures supplémentaires. sinon.
c) Toujours en supposant que c = 0,002, r

trouvez le nombre d’heures tel que si x = 1,2,3,4,5


90 % des tubes auront cessé de fonction­ d) p(x) = «
ner avant t selon ce modèle. En d’autres sinon.
termes, trouvez le 90e centile théorique
de cette distribution. 2.8 La demande quotidienne d’un produit peut
être de -1, 0, +1 ou +2, avec des proba­
2.5 Soit les cinq fonctions définies ci-après. bilités respectives de j, | et Une
Indiquez laquelle ou lesquelles sont des demande de -1 signifie qu’une unité du
fonctions de répartition. produit a été retournée.
a) Déterminez la demande quotidienne
si 0 < x < °°
moyenne.
sinon.
b) Sachant que E^X2) = calculez l’écart-
type de la demande quotidienne.
si 0 < x < °o c) Tracez le graphique de la fonction
si x < 0. de masse de la demande quotidienne.
CHAPITRE 2

d) Tracez le graphique de la fonction 2.12 Considérons la fonction de densité définie


de répartition de la demande ci-dessous.
quotidienne. r
kx si 0 < x < a
Le gérant d’un magasin de confection pour
hommes se demande si son stock actuel de f(x) = < k(2a —x) si a < x < 2a
30 complets (de toutes tailles) est suffisant. s .
0 sinon.
Le nombre de commandes de complets
qu’il recevra d’ici la fin de la saison est a) Déterminez la valeur de k qui fait en
une variable aléatoire X dont la fonction sorte que /s o it une fonction de densité.
de masse est définie par b) Déterminez l’espérance de X.
c) Définissez la fonction de répartition
si x = 0, 1, 2... deX.

sinon. 2.13 Un panier contient 4 boules rouges


et 6 boules noires. On procède à
Déterminez comment calculer la probabi­ 3 tirages sans remise, et on considère
lité qu’il lui reste des complets à la fin de la variable aléatoire X qui représente
la saison (sans effectuer le calcul). le nombre de boules rouges parmi les
boules tirées.
2.10 Une variable aléatoire X a une fonction
a) Déterminez la fonction de masse de X.
de répartition de la forme suivante :
b) En théorie, combien de boules rouges
\ y *i+i tire-t-on en moyenne lors de trois tirages
1 si x > 0 sans remise dans ce panier?
F(x) 2)
0 sinon, 2.14 On vous propose de jouer à un jeu de hasard
qui consiste à lancer 2 dés à 6 faces. Si vous
où [x]est la partie entière de x. obtenez un double 6, vous gagnez 10 $. Si la
a) Tracez une représentation graphique somme des 2 dés vaut 7, alors vous gagnez
de cette fonction de répartition. 1 $. Pour tout autre résultat, vous perdez 1 $.
b) Déterminez la fonction de masse de X. Soit la variable aléatoire X représentant votre
c) Calculez P (0 < X < 8). gain.
d) Calculez ( 3< X < 5).
P a) Déterminez la fonction de masse
e) Calculez P(X > 1). deX.
b) En théorie, si vous jouez un grand
2.11 Soit la fonction de densité définie ci-dessous. nombre de fois à ce jeu, quel est le gain
moyen réalisé par partie ?
kx si 0 < x < 2
c) Supposons maintenant que, lorsque
/(* ) = k( 4 —x) si 2 < x < 4 vous obtenez une somme égale à 7
0 sinon. au premier tour, une alternative vous
est proposée: soit arrêter et gagner 1 $,
a) Déterminez la valeur de k qui fait en soit rejouer (une seule fois) et gagner
sorte que/soit une fonction de densité. (ou perdre) le double du montant
b) Tracez le graphique de la fonction de associé au résultat de votre deuxième
densité. lancer. On note p la p
c) Calculez la probabilité conditionnelle vous décidiez de rejouer. Déterminez la
que X soit inférieur à 1, sachant que X fonction de masse de votre gain Y dans
est inférieur à 2. ce cas.
d) Déterminez la moyenne et la variance d) Calculez l’espérance de Y.
de X. e) Pour quelles valeurs de p le jeu décrit
e) Définissez la fonction de répartition en c) est-il en moyenne plus avantageux
de X. que le premier jeu ?
Les variables aléatoires à une dimension

2.15 Considérez les huit figures illustrées 2.18 Déterminez si les énoncés suivants sont
ci-dessous. vrais ou faux.
a) Dans certains cas, une fonction de densité
peut prendre des valeurs supérieures à 1.
b) Pour calculer P(2 7) à partir de
la fonction de répartition, il suffit
de calculer F(2) - F (J).
c) On peut obtenir la fonction de densité
d’une variable aléatoire continue en
dérivant sa fonction de répartition sur
chaque intervalle de Rx.
0 5 1 0 1 5 2 0 2 5* ^
d) L’espérance d’une variable aléatoire X
- 1 0 1

3) t est toujours sa valeur la plus probable.


e) Si la fonction de densité de X est
constante lorsque 2 < 3, alors F(x)
sera constante sur ce même intervalle.
f) Si l’espérance de X est supérieure à celle
de Y, alors la variance de X sera aussi
supérieure à celle de Y.
g) Si, pour une certaine fonction de répar­
tition F(x), on a F(3) > F(2), alors la
6 x
valeur 3 est plus probable que la valeur 2.
- 4 - 2 0 2 4

a) Lesquelles représentent des fonctions de h) Pour calculer P(X > 2\X < 3), il suffit de
densité ?
F( 2)
b) Lesquelles représentent des fonctions calculer 1-
de répartition ? F( 3)'
Deux promoteurs immobiliers, A et B,
2.16 La variable aléatoire continue T a la fonc­ souhaitent vendre certains de leurs terrains.
tion de densité fit)= 2pour-1 0. L’analyse des ventes passées permet d’établir
a) Déterminez la valeur appropriée de k. la distribution de probabilité du prix de vente
b) Tracez le graphique de la densité de T. par terrain (en dollars) pour chaque promoteur.
c) Calculez la moyenne de T.
d) Sachant que E(T2) = 3/5, calculez la Prix 50 000 51 000 51 500 53 500
variance de T. A 0,2 0,4 0,3 0,1
e) Déterminez la fonction de répartition de T. B 0,3 0,2 0,3 0,2
2.17 Une variable aléatoire discrète X a pour Sachant que A et B agissent indépendam­
fonction de masse p(x), où ment l’un de l’autre, calculez :
, , [ *(1/2)* six =1,2, 3 a) le prix de vente moyen que chacun réus­
p(x )= sit à obtenir ;
0 sinon.
%
b) le prix que A peut s’attendre à obtenir
a) Déterminez la valeur de k. pour un terrain si B a obtenu 51 500 $
b) Tracez le graphique de la fonction de
pour son dernier terrain ;
masse de X. c) la probabilité que A et B obtiennent
c) En examinant le diagramme tracé en b), tous deux le même prix lors de leur
pouvez-vous dire si l’espérance de X sera prochaine vente.
inférieure à 2, supérieure à 2 ou égale à 2 ? 2.20 Sans faire de calcul, choisissez dans le tableau
d) Sans faire de calcul, pouvez-vous dire ci-après les valeurs les plus représentatives de
si l’écart-type de X sera inférieur à 2 ou l’espérance et de l’écart-type de chacune des
supérieur à 2 ? densités représentées par un diagramme.
CHAPITRE 2

Espérance 0 10 20 100 150 200 iiî) La pièce mesure 115 mm.


iv) La pièce mesure entre 120 et 125 mm.
Écart-type 5 10 20 55 150 230
v) La longueur de la pièce excède
140 mm.
a) c)
b) Quel est l’intervalle de longueurs accep­
tables de ce client ?
c) Estimez la probabilité qu’une pièce soit
trop courte et celle qu’une pièce soit trop
longue.
d) Quelle est la longueur des plus petites
pièces produites ?
2.23 Considérez les quatre fonctions de
répartition illustrées ci-dessous.

2.21 Soit une variable aléatoire continue X et sa


fonction de densité définie ainsi :

si 0 < x < 3
sinon.
a ) Définissez la fonction de répartition de X.
b) En examinant le diagramme de la fonc­
tion de densité, pouvez-vous dire si la
moyenne de X sera supérieure à 1,5 ? Associez les densités suivantes à la bonne
c) Déterminez c’est-à-dire EQP)- fonction de répartition.
d) Trouvez une valeur m telle que
P(X >m) = P(X < m). C’est ce qu’on
appelle la « médiane » de X.
2 .2 2 Voici le graphique de la fonction de répar­
tition de la longueur des pièces usinées
(en mm) qui sortent de l’intervalle de
valeurs acceptables d’un client industriel.

2.24 La fonction de densité f(x) d’une variable


aléatoire X est illustrée ci-dessous.
a) Estimez, à partir du graphique ci-dessus,
la probabilité des événements suivants
se rapportant à une pièce rejetée.
») La longueur de la pièce est infé­
rieure à 105 mm.
ii) La longueur de la pièce est supé­
rieure à 110 mm. a) Établissez la valeur de la constante a.
Les variables aléatoires à une dimension

b) Déterminez l’expression algébrique de Une étude du rendement antérieur du robot


la fonction f(x). a permis d’obtenir les résultats suivants :
c) Définissez la fonction de répartition F(x) si x = 0
de la variable X.
d) Evaluez les probabilités suivantes : si x = 1
P(X > 1), P(1 < X < 2,5), P(X < 2 1X > 1). si jc= 2.
2.25 Considérons une variable aléatoire X dont la
fonction de répartition est définie par Sachant que la perte attribuable aux
emplacements libres se traduit par
0 si Y = 20X2, déterminez :

<N
V
-1
0,25 H
si -2 < < -1
jc a) Py(,}’)s>
■oit la fonction de masse de
0,55 si - 1 < < 0
jc
la perte ;
b) E(Y),la perte moyenne théorique ;
0,80 si
IA
o

A
c) V(K), la variance de la perte.
1 si JC > 1.
2.28 La teneur en magnésium d’un alliage est une
a) Donnez Rx, l’ensemble des valeurs variable aléatoire de fonction de densité
possibles de X.
b) Déterminez la fonction de masse p(x) de X. si 0 < < 6
jc

c) Évaluez la probabilité P(—1 < <4).


sinon.
2.26 Une entreprise électronique fabrique des
composants selon un procédé novateur. Cet alliage permet de réaliser un profit de
La durée de vie de ces composants cor­ P = 1 0 + 2X.
respond au temps de fonctionnement (en
a) Sans déterminer la fonction de densité
années) jusqu’à ce que la première panne
de P, évaluez l’espérance du profit.
se produise. Elle peut être modélisée par
une variable aléatoire X (en années) dont b) Sachant que la variance de la teneur en
la fonction de répartition est magnésium vaut 2, quelle est la variance
du profit ?
si jc < 0 2.29 Un fabricant garantit pendant un an le rem­
placement de l’écran plasma de ses télé­
si 0 < x < 3 viseurs en cas de défaillance. Il envisage la
durée de fonctionnement avant défaillance
si 3 < x < 4 (en années) comme une variable aléatoire T
dont la fonction de densité est
si x > 4.
1 . tIA
e si t > 0
a) Selon ce modèle, quelle est la durée f r (0 = 4
de vie maximale des composants de 0 sinon.
ce type ?
b) Évaluez les probabilités P(X < 3) et a) Quel pourcentage de ses téléviseurs
P(X > \). devra-t-il réparer ?
c ) Calculez l’espérance et la variance de X. b) Calculez le bénéfice moyen (par appa­
reil) du fabricant si chaque appareil
2 .2 7 Un robot insère 10 pièces à usiner entre
vendu lui rapporte 200 $ et si chaque
les mors d’un mandrin. Toute pièce mal
écran remplacé lui coûte 200 $.
insérée se détache du mandrin. Lorsqu’on se
retrouve avec un emplacement libre, moins 2.30 Une entreprise compte soumissionner un
de 10 pièces sont usinées au cours du cycle. travail. Le nombre de jours requis pour
Soit X le nombre d’emplacements libres. effectuer ce travail est une variable X
CHAPITRE 2

ayant la fonction de masse suivante : 2.33 Au moment de créer un générateur de


0,1 si ==10
jc
chiffres aléatoires, on doit s’assurer que
chaque chiffre D obéit à la loi uniforme
0,3 si = =il
jc
discrète, c’est-à-dire
Px (*) = i 0,4 si x == 12
0,1 si == 13
jc
si d = 0,1, 2, 3, ..., 9
0,1 si == 14.
jc
PD(d)
sinon.
L’entreprise réalisera un bénéfice de
Y = 2000(13-X ). a) Sans faire le calcul au long, déterminez E(D).
a) Quelle est la probabilité que l’entreprise b) Sachant que Y = \D—4|, déte
enregistre un bénéfice positif ? p r(y) et E(Y).
b) Déterminez E{X) et E(Y).
2.34 Le prix de l’essence varie selon la concen­
c) Sachant que EÇX2) = 140,4 (jours)2,tration d’un certain additif. Si la variable
déterminez V(X) et V(Y). aléatoire A représente cette concentration
2.31 Soit X le nombre de véhicules vendus par en pourcentage, alors 0 % < %. Lors­
un concessionnaire automobile dans une que la concentration est inférieure à 1,4%,
journée. Supposons que la fonction de l’essence a un faible indice d’octane et
masse de X soit donnée par se vend 92 0 le litre. Lorsqu’elle est égale
ou supérieure à 1,4%, l’essence a un indice
1/24 si = 0
jc
d’octane élevé et se vend 98 0 le litre.
1/2 si = 1
jc
Calculez le revenu moyen par litre,
1/3 si x = 2 sachant quefA(a) = 1/2 pour 0 < 2
Px (x) 1/12 si = 3
jc et q\iefA{a) = 0 ailleurs.
1/24 si = 4
jc
2.35 Soit une variable aléatoire X et sa fonction
0 sinon. de densité
Ce concessionnaire réalisera un bénéfice
Y = 3600X - 600. si jc > 0
a) Quel est le bénéfice le plus probable sinon.
pour une journée donnée ?
b) On sait que E(X) = 19/12 et que a) Déterminez la fonction de densité
V(X) = 107/144. À partir de ces données, de Y= 2X2.
déduisez la valeur moyenne du bénéfice b) Déterminez la fonction de densité
quotidien et sa variance, sans passer par de V = XU2.
la fonction de masse de c) Déterminez la fonction de densité
■c) Sur une période d’un an, environ de U =ln X.
combien de journées auront donné lieu
à une perte d’argent ? Considérez que le 2.36 On considère la demande d’antigel pour une
concessionnaire est ouvert tous les j ours saison comme une variable aléatoire X de
sauf à l’occasion de cinq congés fériés. fonction de densité uniforme
d) Sur une période d’un an, quel est le
si 106< jc< 2* 106
bénéfice moyen auquel ce concession­
naire peut s’attendre ? sinon,
2.32 Soit une variable aléatoire continue X et où X est exprimée en litres. On sait que
sa fonction de densité chaque litre vendu à l’automne rapporte 50 0
au fabricant, et que celui-ci doit conserver
six > 0 tout stock excédentaire jusqu’à l’année
sinon. suivante, ce qui lui coûte 25 0 le litre.
a) Définissez la fonction de perte L(X, s)
Déterminez la fonction de densité de Z = X2. en vous inspirant de l’exemple 2.27.
Les variables aléatoires à une dimension

b) On veut déterminer le niveau optimal 2.42 Un procédé est utilisé pour produire en
des stocks pour un automne donné. série un type de pièce dont le diamètre est
Quelle fonction faudra-t-il minimiser ? une caractéristique importante. Une telle
c) Déterminez le niveau optimal des stocks pièce est jugée conforme si son diamètre
pour un automne donné. se situe dans l’intervalle 75 ± 0,8 mm.
Un examen de la production obtenue avec
2.37 L’acidité d’un certain produit, mesurée
ce procédé montre que le diamètre des
selon une échelle arbitraire, se traduit par pièces est de la forme
A = (3 + 0,05G)2, D= 75 + X,
où G représente la quantité d’un ingrédient
donné dont l’espérance est de 8/3 et la où X (en millimètres) est une variable
variance, de 8/9. Évaluez l’acidité moyenne aléatoire représentant l’erreur par rapport
de ce produit. à la valeur souhaitée, et dont la fonction de
répartition est
2.38 Soit une variable X de fonction de densité
si 1 < x < 2 si x < —1
sinon. si —1<x < 0
a) Déterminez la fonction de densité de
Y= 4 - X 2. si 0 < x < 1
b) Déterminez la fonction de densité
si x > 1.
de W=ex.
2.39 La concentration d’un certain réactif à
l’intérieur d’un processus chimique est une a) Calculez l’espérance et l’écart-type du
variable aléatoire de fonction de densité diamètre D.
b) Calculez le pourcentage de pièces non
si 0 < r < 1 conformes de la production obtenue avec
sinon. ce procédé.
c) Supposons que la production d’une pièce
Le produit final obtenu permet de réaliser de ce type coûte 100 $. Chaque pièce
un profit de P = 1 + 3R (en $). Calculez la produite est testée, et seules les pièces
valeur moyenne du profit, sans déterminer conformes sont vendues à raison de
sa densité. 160 $ l’unité. De plus, toute pièce dont le
2.40 Soit une barre circulaire de diamètre X. On sait diamètre dépasse 75,8 mm est réusinée
que E(X) = 2 cm et que V(X) = 25 x 10~3cm2. (pour devenir conforme) à un coût sup­
Un outil de tranchage découpe cette barre plémentaire de 40 $. Toutefois, la pièce
en rondelles d’une épaisseur de 1 cm, cette est mise au rebut (jetée) si son diamètre
valeur étant constante. Déterminez le
*
est inférieur à 74,2 mm. Quelle est la
volume moyen de chaque rondelle. moyenne et l’écart-type du profit réalisé
2.41 Une variable aléatoire X a comme fonction pour une pièce de ce type ?
de masse 2.43 Déterminez si chacun des énoncés suivants
1/2 six = 0 est vrai ou faux.
1/4 si jc= 1 a) Peu importe la distribution de X, on a
EiX2) = fi2.
1/8 six = 2
b) Si £(X) = 10, alors £(4X - 1) = 39.
1/8 six = 3 C) Si £(X) = 10, alors £(X*) = 10 000.
0 sinon. d) Si £(X) = 10, alors £(ln(X)) = ln(10).
a) Déterminez la moyenne et la variance de X. e) Si V(Y) = 10, alors V(Y- 1) = 9.
b) Sachant que Y = ( X - 2)2, déterminez f) Si V(X) = 10, alors V(T4) = 10 000.
la fonction de répartition de Y. g) Si V(Y) = 10, alors V(-3Y) = 90.
est fré q u e n t d ’avoir à tra ite r deux ou plusieurs variai}
ers m êm e tem ps. A titre d'exem ple, on p o u rra it prélever des tô les d ’a c ie r
.e t s’in té re sse r à deux variables a lé ato ires: la résistan ce au c is a ille m e n t
des so u d u res et leu r d iam ètre. On p o u rra it aussi vouloir c a r a c té r is e r la
d istrib u tio n de la taille et du poids des individus d 'u n e p o p u la tio n a in s i
que les liens qui u n issen t ces deux variables. Le p résen t c h a p itre e x p liq u e
com m ent é ta b lir la d istrib u tio n de probabilité conjointe de d eu x ou p lu ­
sieu rs v ariab les aléato ires. Nous verrons com m ent é ta b lir la d is tr ib u tio n
d 'u n e v ariab le sans te n ir com pte des au tres (la d istrib u tio n m a rg in a le )
ou en fixant les valeurs des au tres variables (la d istrib u tio n c o n d itio n n e lle ).
Nous d iscu tero n s d 'in d ép en d an ce de variables aléato ires, de c o v a ria n c e
et de co rrélatio n . Les fonctions de deux ou plusieurs v a ria b le s aléato ires-
y sero n t égalem ent explorées, en p a rtic u lie r le cas de c o m b in a iso n s lin é a ir e s
de variables.

3.1 Les vecteurs aléatoires de dimension le


La définition d’une variable aléatoire à une dimension présentée au chapitre 2 se généralise de
façon naturelle au cas d’un vecteur aléatoire de dimension k.

Vecteur aléatoire
Soit SPl’espace échantillonnai d’une expérience et X,, X2, ...,Xkdes fonctions qui attribuent chacune un
nombre réel XJe), X2(e), Xk(e) à chaque résultat e. On appelle [X,, X2, X J un vecteur aléatoire
de dimension k.

L’image du vecteur aléatoire [Xv X 2,..., X J correspond à l’ensemble de toutes ses valeurs
possibles. On peut la représenter par xX x...xX *°ù
R X] xX2 X’” XXk {[xv x 2, . x J : x x g Rx , x 2 g
2 l
L’exemple qui suit présente l’image de plusieurs variables aléatoires issues d ’u n e même
expenence.
Les distributions de probabilité conjointes

Exemple 3.1
On tire deux chiffres au hasard dans l’ensemble {4, 5, 6}. On définit trois variables réunies dans le
vecteur aléatoire [X,, X2, X3] (voir la figure 3.1).

Un vecteur aléatoire de dimension 3

Si on considère le résultat e= {4, 6}, chaque variable aléatoire est une fonction qui l
nombre réel :
jc , = X, (e) = 10, jc 2 = X2(e) = 2, jc 3 = X3(e) = 4.
L’image du vecteur aléatoire [X„ X2, X3] est Rx xX xX {(9,1,4), (10,2,4), (11, 1, 5)}. Les combinaisons
1 2 3 «
de (je,, 2, 3) ayant une probabilité nulle, comme (9, 2, 5), ne sont pas retenues dans l’image par souci
jc jc

de simplicité.

3.2 La distribution conjointe deux


variables
Nous nous intéressons ici surtout aux vecteurs aléatoires de dimension 2. Lorsqu’un vecteur
[X,, X2] comporte un nombre fini ou un nombre infini dénombrable de valeurs possibles, on
le qualifie de « vecteur aléatoire discret de dimension 2 ». Il a alors comme valeurs possibles
[xh, x2j\pour= 1 ,2 ,... et j = 1 ,2 ,... Lorsque les valeurs possibles de [X,, X2] correspondent à
un ensemble non dénombrable d’éléments, il s’agit d’un « vecteur aléatoire continu de dimen­
sion 2 ». Soit a < x, <b et c < x,< d . On a alors R X l x X 2 {[jtp x2] : a <x, < b, < x2 d<).
Il arrive aussi qu’une composante soit discrète et l’autre, continue. Cependant, on se limi­
tera ici aux vecteurs dont les composantes sont toutes deux soit discrètes, soit continues.
CHAPITRE 3

Exemple 3.2
On décide de mesurer le diamètre de soudures par points et leur résistance au cisaillement. Soit X, le
diamètre en pouces etX2la résistance en livres. S’il est établi que 0 < 0,25 pouce et que 0 < x 2< 2000
livres, alors l’image de [Xt, X2] correspond à l’ensemble {[*,, :0 < x, < 0,25, 0 < 2 0 0 0 } , comme
le montre la figure 3.2.

/ *

x2 (livres) | t
.

2000

I
1
»

i
«

0 0,25 x, (pouces)
I
Figure 3.2 L'image de [Xv X2], où X, représente le diamètre des soudures et X 2, leur
S résistance au cisaillement

Exemple 3.3
De petites pompes font l’objet d’un contrôle de la qualité où quatre attributs sont vérifiés. Chacun de
ces attributs obtient la mention «sans défaut», «avec défaut mineur» (qui n’influe pas sur le fonction­
nement) ou «avec défaut majeur» (qui influe sur le fonctionnement). On prévoit choisir une pompe
au hasard et en compter les défauts. Si X, = le nombre de défauts mineurs et X2 = le nombre de
défauts majeurs, alors xx= 0, 1, 2, 3, 4 et x2= 0, 1,..., 4 —x, puisqu’on ne vérifie que quatre attributs.
L’image de [X„ X2] correspond ainsi à {[0, 0], [0, 1], [0, 2], [0, 3], [0, 4], [1, 0], [1, 1], [1, 2], [1, 3],
[2, 0], [2, 1], [2, 2], [3, 0], [3, 1], [4, 0]}. La figure 3.3 présente les résultats possibles.

/ :
<

Figure 3.3 L'image de \Xx, X2L où X, représente le nombre de défauts m ineurs et X 2, le


nombre de défauts majeurs, chaque point gras correspondant à un élé m ent
de l'image
Les distributions de probabilité conjointes

Distribution conjointe de deux variables aléatoires


Les distributions de probabilité bivariées se présentent comme suit.
1. Le vecteur est discret: on associe à chaque résultat [jc ,, x2] de /?v v un nombre

/?(*,, x2) = P(X, = x, et X2 = x2),


0 < p{xv x2) < 1 pour tout [jc,,

Les valeurs ([jc,, x 2], p(xf, x2)) forment la fonction de masse conjointe de [Xt, X2].
ur est continu : si [X,, X2]est un vecteur aléatoire continu d'image R x xY, sa distribution
de probabilité est alors décrite par une fonction de densité conjointe/ayant les propriétés
suivantes :
/ ( jc,, x2) > 0 pour tout [x ,, x2]
et

/ ( jc, , jc2) c, dx2 = 1.


X \ x * 2

La densité conjointe est une surface, et les probabilités sont évaluées en calculant le volume sous
cette surface, au-dessus d’une région déterminée. Les probabilités s’expriment sous la forme

P(a] < X ] < b ] et a2 < X 2 < b^)= [ ' [ ' / ( jc, , x2) = d x ] d
J «2 * a \

(voir la figure 3.4).


*

Une fonction de densité conjointe, où P(a1£ X, £ b, et a2£ X2 ^ b2) correspond


au volume ombré
CHAPITRE 3

Mentionnons une fois encore que/Qc,, x2) ne représente pas une probabilité en soi. O n adopte
ici la convention voulant que f ( x l, x2) = 0 pour tout [*,, x2] <£ Rx xX , ce qui p erm et d ’én o n cer la
seconde propriété sous la forme

/(jtj, x 2)d x 2 1.

Lorsqu’un vecteur [X{, X2] est discret, on en présente la distribution de probabilité sous la form e
d’un tableau, d’un diagramme ou d’un énoncé mathématique. Lorsqu’il est continu, on traduit sa
distribution par une relation mathématique, et il est souvent utile de la représenter graphiquem ent.

Exemple 3.4
figure 3.5 présente, sous la forme d’un tableau, d’un diagramme en mosaïque et d’un diagram m e
distribution de probabilité hypothétique des variables aléatoires définies à l’exemple

/ 4

0 1 2 3 4
c

*;
4

x2 i
*
t

. . f »— *.^ ^ * 0 1

i
1
«
.
i

J lj =“■ nombre de défauts mineurs


. i • t. . - .'. /-. .•.•. .’ •■.•' . i1
»

1 .' ■
—V < *

1
• ' * - • * • » . *" ' ' N • i U

à
i

x2X y 0 1 1 1 2 1 3 1 4 1
i

*
f

2
0 1/30 1/30 2/30 3/30 1/30 | /
4
majeurs
X2= nombre de

1 1/30 1/30 j 3/30 | 4/30 3 i

y v v v * y * r . * / v 5 . v . \ * v
4
4

i
CX % *v , * V5v ^

2 1/30 j 2/30 3/30


défauts

/ i V v / f ;
n y c • < A V v . / V 6 A - / / ,

:
.
v - /

i -
V. N # t

.
Î K
/ .

• >
;

iI t

4
i : / (. y ^ y n 4 v < / / *

1/30
S

3 3/30 ;'mü
t.
*
*YI, ’.y>.*
•$ J
*

4 3/30 1 I § g * "<■£& '£ & V 1

/ • ; r / v / r / / ; ' < . 7 3

■;
."

xi U

a) b) *•

*
C
.

i
»
ta»

p(*l,X2) -4

K
*1

&

I
f
C.

f
.
:-
«

i«.
î
f

t
5

\i *

li
&

i
i

ï
c) ■;
4

I
?

. r r j

distribution de probabilité conjointe sous la forme: a) d'un tableau in d iq u a n t


aieurs p(x x2); b) d'un diagramme en mosaïque; c) d'un diagram m e à bâtons ►

Les distributions de probabilité conjointes 83

Dans le diagramme en mosaïque, la surface de chaque rectangle est proportionnelle à la probabilité


conjointe qui lui est associée, la surface totale du carré étant 1. Par exemple, la surface du rectangle
(0,0) vaut 1/30 de la surface totale.
On pourrait calculer la probabilité qu’une pompe n’ait aucun défaut majeur et moins de trois défauts
mineurs. On aurait alors

P(X,< 3 etX2= 0) = P(0 < X, < 2 etX2= 0)


= p(0, 0) +p( 1, 0) + /?(2, 0)
= J_ -L+ —
~ 30 30 30
4
= — «0,133.
30

Exemple 3.5
Le diamètre des soudures, noté X,, et leur résistance au cisaillement, notée X2, pourraient obéir à une
distribution uniforme se traduisant par
1
si 0 < x, < 0,25; 0 < x2< 2000
f ( x l, x 2) = < 500
0 sinon.
La figure 3.6 illustre l’image de ce vecteur.

Une distribution conjointe de densité uniforme

Dans le cas d’une variable continue à une dimension, la probabilité correspondait à l’aire sous
la courbe. Dans le cas d’une variable continue de dimension 2, c’est le volume sous la surface qui la
représente.
Supposons qu’on veut déterminer la probabilité P(0,1 < X, < 0,2 et 100 < X2 < 200). Il faut intégrer
/(x,, x2) sur la région 0,1 < x, < 0,2, 100 < x2<200, d’où
f 200 f 0,2 1 1
---- dx,dx7 = — .
* io o J 0.1 500 50
CHAPITRE 3

3.3 distributions marginales


Après avoir vu en quoi consiste une distribution de probabilité bivariée, aussi appelée « fonction
de masse conjointe » ou « densité conjointe », il est normal de s’interroger sur la distribution de la
variable X l ou X 2 prise séparément. Celle-ci porte le nom de « distribution m arginale ».

Distribution marginale discrète


. . ,. . • * " ... . - . . '. ■ * •
. m , • • . ( ■ • • . • * ,

Dans le cas d'un vecteur discret, la distribution marginale de X, se traduit par

Pxx(X\)-^ip(X\*x2) pour tout x x (3.2)


*2
et celle de X2, par

Px2(*2> P°ur tout X2 (3.3)


*1

Exemple 3.6
Soit la distribution conjointe discrète de l’exemple 3.3, représentée à la figure 3.5. La figure 3.7 présente les
distributions marginales correspondantes 1 )) forment
masse univariée, celle de la variable Xxprise séparément. Les couples [x2, p (x2)] forment eux au;
iction de masse univariée, celle de la variable X2prise séparément (donc sans tenir compte de X
/
WS nombre de défauts mineurs
• • *

.
*

.
■ • , .

* h * y * ■ -*
\

.
' ■ , •

.
.

.
' . • • -

.
.

, ' , ' •
* - f

. ’• ' . * * . * ' * ' . - » w *' " * * .

0 1 2 3 4 P x2(*2)
*
• . « * •

0 1/30 1/30 2/30 3/30 1/30 8/30 1 I


<a
>
MÉ L*
73
CD 3
O 1 1/30 1/30 3/30 4/30 9/30 |
V ** i
sO
<

£
c/î 2 1/30 2/30 3/30 6/30 1
h c2 3 1/30 3/30 4/30 1
4 3/30 3/30 1 t
»

Pxfr) 7/30 7/30 8/30 7/30 1/30 /?(*:) = il


X 1
a)
PxXX,) a PxSX2) t
9/30
8/30 8/30
7/30 7/30 7/30 6/30
4/30 3/30

0 1 2 3 0 1 2 3 4 x?
b) c)
. J

~ 7 . •m’ v . 1 W jiâ. _ ) S
v 5 ‘ • * » -* v * •* - . -r « i

r ti( i/iV # Les distributions marginales associées au vecteur discret [X,, X 2J : a) ces
4
S . . ^ J JT ■ ( • •
V m« , J* T ~ r > » -
V * ' * ' *. 'ç - ’S » V T\

distributions présentées sous la forme d'un tableau; b) la fonction de m asse


marginale px (x,); c) la fonction de masse marginale p x (x2)
Les distributions de probabilité conjointes

Distribution marginale continue


Si le vecteur aléatoire [X,, XJ est continu, la distribution marginale de X, se traduit par
C O

fx. U. ) f ( x , , x 2)dx2 (3.4)


— O O

et celle de X2, par


00

f x , (*2) f ( x . , x 2)dxx. (3 5)
— O O

La fonction/ est la fonction de densité de la variable X, prise séparément, tandis que la fonction
1
est celle de la variable X? prise séparément.

Exemple 3.7
À l’exemple 3.5, la densité conjointe de [X,, X2] était
1
si 0 < x, < 0,25; 0 < x2< 2000
f{x i,* 2) = < 500
0 smon.

Ainsi, la distribution marginale de X, et celle de X2se traduisent par


2000 1
dx2 = 4 si 0 <x, < 0,25
fx 1 ( * 1 ) 0 500
0 smon

et
0 . 2 5 1
1
dx. si 0 < x2 < 2000
fx2(X2) 500 2000
0 smon.

Elles sont représentées graphiquement à la figure 3.8.


CHAPITRE 3

Les distributions marginales ne sont pas toujours si faciles à représenter. C ’est le cas, entre
autres, lorsque l’image de [X,, X2] n’est pas rectangulaire.

Exemple 3.8
Supposons que la fonction de densité conjointe de [X,, X2] est

si 0 < Xj < x 2 < 1


sinon.

La figure 3.9 illustre cette densité conjointe sur l’image de [X, X ], qui ici est un triangle.

S I

Figure 3.9 Le graphique de la fonction de densité f(xlr x 2) de l'exem ple 3.8

La densité marginale de X, se traduit alors par

= 6xt (1 - xl) pour 0 < < 1.

pour 0 < x<1.

La densité marginale de X, est représentée à la figure 3.10a), et celle de X , à la figure 3.10b).


Les distributions de probabilité conjointes

a) La densité marginale de X,; b) la densité marginale de X,

L'espérance et la variance
On détermine l’espérance mathématique et la variance de X l et de X2à partir de leur distribution
marginale, en procédant comme dans le cas d’une variable à une dimension. Ainsi, en présence
d’un vecteur discret [X,, X2], on a

E ( X l) = jn1 = (3-6)
*1 x \ x2

—^ * 1 PxxC*i) Mi

= XX >*2 ) “ Mi2 »

*1 x2

de même que
E ( X 2) = = X X2 Px2
C*2) =
x2 * i x2

Exemple 3.9
Soit la distribution marginale de Xxet celle de X2selon l’exemple 3.6 et la figure 3.7 sur les défauts
mineurs et majeurs de pompes choisies au hasard. Si l’on effectue les calculs à partir de la fonc­
tion de masse marginale de X,, représentée à la figure 3.7b), on obtient

E(Xl) = fr
CHAPITRE 3

et
2
2 n2 7 12 7 o2 8 2 7 2 1 "8“ 103
V(X,) = C71 0 ----+ 1 •— + 2 + 3 ----+ 4 •
30 30 30 30 30 _5_ 75

On pourrait également déterminer la moyenne et la variance de X2 à partir de sa fonction de masse


marginale.

Remarque
* ,» 1 ^ ^ — „ » . • . . . • .. ..

Comme le révèlent les équations 3.6 à 3.9, on peut déterminer la moyenne et la variance respectives de
X, et de X, à partir soit de leur fonction de masse marginale, soit de leur fonction de m asse conjointe.
Ç . . . - ' ’ . • . * • ■ , . s ‘

Dans la pratique, il est en général plus facile de recourir à leur fonction de m asse m arg in ale si on la
connaît déjà.

En présence d’un vecteur continu [Xp X2], on utilise les définitions univariées basées sur
les intégrales suivantes :

En examinant les équations 3.10 à 3.13, on remarque ici encore qu’il est possible d ’effectuer
les calculs à partir soit de la fonction de densité marginale des variables, soit de leu r fonction
de densité conjointe.

Exemple 3.10
À l’exemple 3.5, le diamètre des soudures et leur résistance au cisaillement, c’est-à-dire X, et X.2»
avaient une densité conjointe de

1
si 0 < Xj <0,25; 0 < x 2 < 2000
f ( x ltx 2) = < 500
0 smon

Les distributions de probabilité conjointes 89

si 0 < x x< 0,25


sinon

1
si 0 < x2 < 2000
2000
0 sinon.

En calculant la moyenne et la variance de X, à partir de sa fonction de densité marginale trouvée à


l’exemple 3.7, on obtient donc

3.4 Les distributions conditionnelles


Lorsqu’on étudie deux variables aléatoires conjointement distribuées, il peut être intéres­
sant d’établir la distribution de l’une de ces variables étant donné une certaine valeur de
l’autre, par exemple la distribution de X v sachant que X2 = 3. On pourrait s’interroger sur
la distribution du poids chez les personnes d’une taille donnée. C’est ce qu’on appelle la
« distribution conditionnelle de X xétant donné que X2 = x2». En s’ins
d’une probabilité conditionnelle ( voir le chapitre 1), on peut établir,
rent de 0, que

P(Xx x x et X 2 x 2)
P(X, xAX 2 x 2)
P(X 2 X 2)

En utilisant la notation pour les fonctions de masse conjointes et marginales, on établit la


définition suivante.

Fonctions de masse conditionnelles


La fonction de masse conditionnelle de , sachant que X = , est

pUhXj) pour tout x 2, où p y (a) > 0, (3.14)


Px2\cM i )
PX,(tf)
et la fonction de masse conditionnelle de X , sachant que X = b, est

p(xx,b)
Pxa,M\) pour tout jc, , où (b) > 0 (3.15)
Px,

Soulignons qu’il existe autant de distributions conditionnelles de X, que de valeurs a pour lesquelles
px (a) > 0, et autant de distributions conditionnelles de X, que de valeurs b pour lesquelles px (b) > 0.
CHAPITRE 3

Exemple 3.11
Revenons au dénombrement des défauts majeurs et mineurs des petites pompes de l’exemple 3.3 et à la
figure 3.7. Il existe cinq distributions conditionnelles de X2, une pour chaque valeur de X {. Le tableau 3.1
montre par exemple les calculs pour la fonction de masse conditionnelle de X2, sachant que X = 0.
■ ■ H W

T de masse cond § V

X 0» 1
lV -' '. v .-^ ....
>. # 2 3 4

0
X
0
p(0, *2) p (0 ,1) p (0 ,2) P(0, 3) P ( 0 ,4)
a
*
Px2|o(*2)
Px, (°) Px, (0) Px, (°) Px, (°) Px, (°) Px, (0)
_ 1/3 0 1 _ 1/30 _ 1 _ i/30 _ 1 _ 1/30 _ 1 _ 3 /3 0 _ 3
_ 7/30 ” 7 ~~ 7/30 _ 7 ~~ 7/30 _ 7 ~ 7 /3 0 ~ 7 _ 7 /3 0 ~~ 7

On pourrait de la même façon établir respectivement une distribution conditionnelle X2 pour X 1,


2, 3 et 4. On pourrait d’une manière analogue déterminer la fonction de masse conditionnelle de X,,
sachant que X = 3, par exemple. Le tableau 3.2 détaille les valeurs de probabilités obtenues.

Tableau 3.2 La fonction de masse conditionnelle de Xv sachant * • « • . : . l a i *

JC1 . . /
0 . . ^ , . a
. 1
P(*i >3) (p0,3) _ 1 P(l, 3) _ 3
Px,|3C*i)
Px, (3) Px2(3) 4 PX20 ) 4

Voyons maintenant comment obtenir les distributions conditionnelles dans le cas continu.
» , . , _ * ■ » / . , . • - .■

D e n s ité s co n d itio n n e lle s


•, , • . •s ‘ 1 . ■» . 1.^ , . ” ••.• » • « 1
• «' • * ‘. I ^ ’
■ » - ^ / I. • . / ■

Lorsqu'un vecteur aléatoire [X,, X,] est continu, la densité conditionnelle de X que X a, est

» X2,o ù / y, (a)> 0, (3.16)


/x2|<J )
/x, («)
. 1 ■ * ' ^ „■ * , «

et la densité conditionnelle de X,, sachant que X2 byest

fi.x \ >b) , où f x (b) > 0.


fx,\b(x \} (3.17)
fx, (*)

Exemple 3.12

Supposons que la densité conjointe de [X,, X2] correspond à la fonction / définie ci-dessous et repré­
sentée à la figure 3.11.
2
x x+. XlX2 si Ocxj < l;0 < x 2 <2
/(* i>*2 ) 3
0 smon ►
Les distributions de probabilité conjointes

Les densités marginales / (x,) et/ (x2) se traduisent ici par


2
2 . *|*2 dx „2x,2H—x
2 si 0 < jc, < 1
•U * î + 3 2 i
/*, (*11) 1 3
0 sinon

et

si 0 < x2 ^ 2
sinon.

La fonction de densité conjointe de l'exemple 3.12

Ces densités marginales sont représentées à la figure 3.12.

Les densités marginales déterminées à l'exemple 3.12

Les équations 3.16 et 3.17 permettent de déterminer les densités conditionnelles


x,x
1^2
x\ + 1 3jCj + jc2
3 si 0 < x, < 1; 0 < x2 <2
fx2\xi (*2) „ 2 2 2 3xj +1
2xf + - x 1
1 3
sinon
CHAPITRE 3

x,x
^^3^! +
si 0 < x, < 1; 0 < <2
*ll*2 1+ ( Xj

sinon.

conditionnelles f x
l e u x (x2) etf x
conditionnelles f x
illustre trois.

*2l*l
x2\m ,0 < X n < 2

1 , 0 < x0< 2
I^

i
' . * . ' v » « • - V T . *

J ç f * - n '

S P î .
1 X S £ j f * V " . *

-
<

x * ,
: v *

Les densités conditionnelles f^|1/2et fx n de l'exemple 3.12

*il*2

l
+ xi
r

i ^

, s \ . r -
i ✓

I J lM IW JÆ Les densités conditionnelles f ^ 0. f^{, et 2de l'exemple 3.12

Notons que les densités conditionnelles ne sont pas de simples « tranches » de la densité conjointe où
on aurait fixé la valeur d’une des variables, par exemple f(x , 0), où X2=
Pour que la surface sous chaque courbe soit égale à 1, il a fallu diviser la portion de loi conjointe par la loi
marginale, par exemplef x (Q). C’est pourquoi l’échelle de l’axe vertical varie entre les figures 3.11 à 3.14.
Les distributions de probabilité conjointes

L'espérance et la variance conditionnelles


Nous allons maintenant traiter de problèmes comme la détermination du poids moyen d’une
personne d’après sa taille. De façon plus générale, nous verrons comment déterminer l’espé­
rance mathématique de X, selon ce qu’on sait de X2. Puisque les distributions conditionnelles
ont les mêmes propriétés que les distributions univariées, on peut calculer l’espérance et la
variance d’une variable en fixant la valeur de l’autre.

Espérance conditionnelle, cas discret


Si [XJ XJ représente un vecteur aléatoire discret, l’espérance conditionnelle de Xt, sachant que X. -
est '

• . « • ■* . . • ^ >

et l’espérance conditionnelle de X., sachant que X. = a, est


E(X2 |a) = X *2P ,*(*2)-
*2

Soulignons qu’il existe une espérance conditionnelle E(Xx\xJ pour chaque valeur de x2.
Cette espérance varie en fonction de la valeur de x2, qui est elle-même déterminée par une
fonction de masse. De la même façon, il existe autant d’espérances conditionnelles E(X2\xJ que
de valeurs de x v chacune dépendant de la valeur de x x déterminée par une fonction de masse.
On peut calculer des variances conditionnelles à partir des fonctions de masse conditionnelles.

Exemple 3.13
Soit la distribution de probabilité du vecteur aléatoire discret [X,, X2], où X, représente le nombre de
grosses turbines qu’un fabricant a inscrit à son carnet de commandes en juillet et X2, le nombre qu’il
y a inscrit en août. La figure 3.15 indique la fonction de masse conjointe de ces deux variables et leurs
fonctions de masse marginales.

X, = nombre de
commandes en juillet
0 1 2 Px2(x2)
X2= nombre de

0 0,05 0,05 0,10 0,2


commandes
en août

1 0,10 0,25 0,05 0,4


2 0,10 0,15 0,05 0,3
3 0,05 0,05 0,00 0,1
PxM i) 0,3 0,5 0,2
Ll_
La fonction de masse conjointe et les fonctions de masse marginales de [X,, X2],
les valeurs indiquées à l'intérieur du tableau étant celles de p(x„ x2) ►
CHAPITRE 3
l

Voici les fonctions de masse conditionnelles px,0, px^ et px^2:

1/6 si x 2 =- 0 1/10 si x 2 ==0 2/4 si x 2 = 0


2/6 si x 2 =; 1 5/10 si x 2 =- 1 1/4 si *2
* ==1
Px210(^ 2 ) = ’ 2/6 si x 2 =; 2 Px2|i (*2) ~ " 3/10 si x 2 ==2 Px212(^ 2 ) = < 1/4 si x 2 = 2
1/6 si *2 ==3 1/10 si x 2 ==3 0 si x 2 = 3
0 sinon 0 sinon 0 k »
sinon.

Le calcul de l’espérance conditionnelle se fait comme suit :

Ê(XjO) = X ^ |0(x2) = 0 . f i ) + l . f | ) + 2 / | ] + 3 . g ) = | = l,5.

Des calculs similaires nous permettent d’établir que E(X211) = 1,4 et E(X2| 2) = 0,75.

Espérance conditionnelle, cas continu


/ . _• ~ " * . - « • V . . .

,■
".*t *■
1 • -

^• . •
, i. * . ^
«* * » ■, . ^
, . .

Si [X, X ] représente un vecteur aléatoire continu, on a alors les espérances conditionnelles


*’ .
t 4

_
^

■ *
7

.
a

*. .*
*

. *
- s - ' T ' - . A .

“ ■•
. . . '

'
* • .* *


- , , ♦

W. a •
. . . .



.
■’ : ' V • • ■ ■ •

• . -- • .

£(X, |* 2) = J A , ./„,„,(*,)<**, (3.20)


et
E(X2 \ Xt)= j ^ x 2. f X2\X](x 2)(xd3.21)

Le nombre de valeurs que cette espérance peut prendre est infini dans chaque cas. Il existe
en effet une espérance conditionnelle E(X{\x2) pour chaque valeur de x dans l’équation 3.20 et
une espérance conditionnelle E(X2\x^) pour chaque valeur de x { dans l’équation 3.21.

Exemple 3.14
À l’exemple 3.12, on a examiné la densité conjointe
X, x0 2
X* —■—- si 0 < x x < l ; 0 < x 2 <2,
f ( x ,,x 2) = < 3
0 sinon.

S’y rattachaient les densités conditionnelles


3xl +
si 0 < Jt, < 1 ;0 < * 2 <2,
fx2\xi^Xl) 2(3x, +1)
0 sinon

Les distributions de probabilité conjointes

et
*,(3;^ )
si 0 < jc, < 1; 0 < jc2 <2,
• W * i> l + (x,/2)
0 smon.

Sachant cela, on peut déterminer E(X2| x,) à l’aide de l’équation 3.21, ce qui donne
2 1 3x , + x 2
E(X, I ) X 9 •—• --------------- aX
o 2 2 3x,+l 2
9jc, +4
9x, +3
Soulignons qu’il s’agit là d’une fonction de x,. Les deux densités conditionnelles représentées à la
1 17
figure 3.13, où x l 2 et x{= 1, se caractérisent respectivement par une espérance de E(X21 2) 15 et de
£(X2|l) = f .

3.5 L'indépendance de variables aléatoires


L’indépendance de variables aléatoires est un concept statistique très utile et important. Au
chapitre 1, il a été question d’événements indépendants. Voyons maintenant en quoi consistent
les variables aléatoires indépendantes. Lorsque la valeur prise par une variable X] n’influe
pas sur celle prise par une variable X2 et inversement, on qualifie ces deux variables aléatoires
d’« indépendantes ».

Variables aléatoires indépendantes


1. Soit un vecteur aléatoire discret [X,, X2], Les variables X, et X2 sont dites «indépendantes» si et
seulement si
p(xv x2) =pXi(xl) • pXi(x2) (3.22)
pour tout x, etx,.
2. Soit un vecteur aléatoire continu [X,, X2]. Les variables X, et X2 sont dites « indépendantes » si et
seulement si

pour tout x, et x2.

Deux variables ne sont indépendantes que si l’on peut décomposer leur fonction de masse
ou de densité conjointe en un produit de leurs fonctions de masse ou de densité marginales
respectives. Cet énoncé s’apparente au fait que des événements ne sont indépendants que si la
probabilité de leur intersection correspond au produit de leurs probabilités respectives.
En faisant appel à cette définition et aux propriétés des distributions conditionnelles, on
peut étendre la notion d’indépendance pour en tirer un théorème.
C H A PITR E 3

1. Soit un vecteur aléatoire discret [X,, X2]. On a alors


= Px2(xi) et Pxl\X2(xl) = P xf r )
pour tout x, et x2 si et seulement si les variables X, et X2 sont indépendantes.
2. Soit un vecteur aléatoire continu [X,, X2]. On a alors

pour tout jc, et x2 si et seulement si les variables X, et X2 sont indépendantes.

Démonstration
Cette démonstration sera limitée à un vecteur continu. On constate que
fx2lx, (*2) =fx2O2) Pour tout x l et x2
si et seulement si

pour tout jc, et x 2,

ce qui est le cas si et seulement si


f(x„ x2) = /X](x,)/X2(x2) pour tout x, et x2,
ce qui est le cas si et seulement si les variables X, et X2 sont indépendantes.

Exemple 3.15
Une société de transport reçoit un appel chaque fois qu’un de ses autobus tombe en panne et doit
être remorqué par une dépanneuse lourde. Soit X,, le nombre d’appels reçus le lundi, et X2, le nombre
d’appels reçus le mardi de la même semaine. La figure 3.16 présente la distribution conjointe de
ces deux variables et leurs distributions marginales. Un bref examen révèle qu’il s’agit de variables
indépendantes, chaque probabilité conjointe étant égale au produit des probabilités marginales
correspondantes.
X
x 1= nombre d ’appels le lundi
0 1 2 3 4 1Px2(.xi)

* .
0 0,02 0,04 0,06 0,04 0,04 1 0,2
ls le mai
nombre

1 0,02 0,04 0,06 0,04 0,04 0,2


2 0,01 0,02 0,03 0,02 0,02 0,1 .
Il v
K« Q- 3 0,04 0,08 0,12 0,08 0,08 0,4
T3 4 0,01 0,02 0,03 0,02 0,02 0,1
PX{(X )1 0,1 0,2 0,3 0,2 0,2 | 1

Les probabilités conjointes du nombre d'appels

Si, pour une seule cellule (jc,, x2) du tableau, la relation ,, jc2) (jc ) p )x( n’était pas respectée,
alors les variables X, et X2ne seraient pas indépendantes.
Les distributions de probabilité conjointes

3.6 La covariance et la corrélation


Nous avons vu que E{Xx) = p x et V(Xx) = cr2 représentent respectivement la moyenne et la
variance de Xp qu’on peut déterminer à partir de sa distribution marginale. De la même façon,
p 2 et <J22 représentent la moyenne et la variance de X2. Examinons maintenant deux mesures
servant à décrire le degré de liaison linéaire entre X, et X2: leur covariance et leur coefficient
de corrélation.

Covariance et corrélation
Soit le vecteur aléatoire [X,, X2]. La covariance de X, et X2, notée crl2, se traduit par
Cov(X,, X2) = <7|: = £[(X, - p,)(X2- /p)]
et leur coefficient de corrélation, noté p, par

_ Cov(X,,X2) _ crl2
p~ o r <Ji

La valeur de p est comprise dans l’intervalle [-1, +1], autrement dit -1 < p < +1.

On exprime la covariance dans l’unité de mesure de X, multipliée par cette de X2. Quant
au coefficient de corrélation, il s’agit d’une grandeur sans unité qui quantifie la liaison linéaire
entre deux variables aléatoires. En effectuant les multiplications dans l’équation 3.24 pour
ensuite affecter chaque terme de l’opérateur extérieur d’espérance, on voit que la covariance se
traduit aussi par

Cov(Xp X2) = £(X, • X2) - £(Xj) • (X2). (3.26)

fih
i A U f B f e c S i E

2 %
3 I •
: n f M l m F x R
' W *

Si les variables X, et X; sont indépendantes, alors p = 0.

Démonstration
Supposons ici encore un vecteur continu. Puisque les variables X, et X2sont indépendantes,

£( x ,- x 2) J * 1 * 2 * / ( * i »* 2 ) dx2

x J x x( * l ) - * 2/ x 2( ^ 2 ) d x \ d x 2

[ L xj Xi dxi ] { L x> w 2

Conséquemment, Cov(X„ X2) = 0 selon l’équation 3.26 et p = 0 selon l’équation 3.25. Le raisonnement
serait semblable dans le cas d’un vecteur [X,, X,] discret.

La réciproque de ce théorème n’est pas nécessairement vraie. En effet, il arrive que 0


sans qu’on ait des variables indépendantes. Lorsque 0, on qualifie les variables aléatoires
en cause de « non corrélées ».
CHAPITRE 3

Lorsque p « 1, il existe une forte corrélation positive entre les variables, ce qui peut é
le cas, par exemple, pour le poids et la taille des enfants, ou pour la valeur des actions de de
entreprises du même secteur d’activité. Lorsque p ~ -1, il existe à l’inverse une forte corrélati
négative, par exemple entre les précipitations sous forme de neige et la température. S’il exi:
une relation linéaire entre X2et X,, de sorte que X2 = a + bXx, alors p2= 1. Lorsque b > 0, p = -\
et lorsque b < 0, p = -1.

Exemple 3.16

Soit le vecteur aléatoire continu [X„ X2] de l’exemple 3.8 et sa fonction de densité conjointe

6xx si 0 < x l < x 2


f ( x x, x 2)
0 smon.

Les densités marginales de X, et de X2 se traduisent par

6xx(1 - x x) si 0 < x x < 1 2


3x 2 si 0 < x-,2 < 1
f x xC*i ) f x 2 (X 22 )
0 smon 0 smon.

Les variables X, et X2 sont-elles indépendantes ? On pourrait effectuer le produit des lois marginales
pour répondre à cette question. On peut aussi calculer la covariance entre X, et X2. Si elle est nulle, on
ne pourra pas répondre à la question de façon définitive, mais si elle est non nulle, on saura qu’il existe
un lien linéaire entre X, et X2.
On aura besoin des valeurs suivantes :

£ (* ,) = —x x) j = 1/2, E(X2) = 3/4,


= J> 2
E (X 2) == j ‘fo?a - x x) dx j = 3/10, E = 3/5,
= /o 3x*
V(Xx) ==E(Xf)~ [£ (* ,)]2 = 1/20, V(X2) == £(A-|) ~ [ E ( X 2)]2 3/80

On note également que

e (x xx 2) = Jr-oo Jr— x xx 2 f ( x x, x 2) d x x dx2


oo

= /„' Jo 26*'x >dx j dx2 = 2/5,

ce qui veut dire que


X2) = E(X,X2) - E(Xx)E(X2) = 1/40
U
o>

r*

et que

Cov(X,, X,2 )
P 0,577
JV(X, ) • V(X2)

On doit conclure que X, et X2 sont linéairement dépendantes. Puisque p est positif, lorsque X, prend de
grandes valeurs, X2prend aussi de grandes valeurs, et les deux variables prennent de petites valeurs en
même temps. Or, le lien n’est pas tellement fort, car p n’est pas assez proche de 1.
Les distributions de probabilité conjointes

• %

Exemple 3.17
Un vecteur aléatoire continu [X,, X2] présente la fonction de densité/définie ci-dessous.
1 si —x2 <Xj <x2; 0 < x 2 < 1
f ( x {, x 22) = <
0 smon.
Sa densité est représentée graphiquement à la figure 3.17.

f(x

X1 X

\ X1
\
\
x1 X

La densité conjointe

On a ici les densités marginales


l + jq si —1< x x < 0 2x 2 si 0 < x2 < 1
fxy C*1) 1—x, si 0 < x, <1 fx2(x2) 0 sinon.
0 sinon,
Puisque/(xp x2) ^ f X[(xi) •^ (x2), les deux variables ne sont pas indépendantes. Pourtant, le calcul de
la covariance donne
Cov(Xp X2)
2 d: -«
. x2 *1 dx{ dx2 - 0 = 0,

ce qui veut dire que p = 0. Ainsi, sans être indépendantes, les deux variables sont non corrélées. Le
lien qui les unit n’est donc pas linéaire.

Voici quelques propriétés de la covariance et de la corrélation


Cov(X1,X 1) = V(X1) p(X „X ,) = 1
ab
p{Xj, X 2) si a * 0 et b * 0
Cov(aX, ,bX2) = abCov(Xl, X 2) p(aXlybX2) \ab\
0 si a = 0 ou b
Cov(Xx+ a , X 2 + b) = Cow(Xl, X 2) p ( X l + a , X 2 + b) = p ( X l, X 2)

b
si b -t- 0
Cov( X Xya + bX,) = bV(Xx) p ( X lya + bX,)
0 si 6 = 0
CHAPITRE 3

Lorsque p ~ 1, il existe une forte corrélation positive entre les variables, ce qu


le cas, par exemple, pour le poids et la taille des enfants, ou pour la valeur des actions de deux
entreprises du même secteur d’activité. Lorsque p1,
négative, par exemple entre les précipitations sous forme de neige et la tem pérature. S ’il existe
une relation linéaire entre X2 et X„ de sorte que X2+
et lorsque b< 0 , p = -1.

Exemple 3.16
Soit le vecteur aléatoire continu [X,, X2] de l’exemple 3.8 et sa fonction de densité conjointe

6xx si 0 < x x <x2 < 1


f ( x ,,x 2)
0 sinon.

Les densités marginales de X, et de X2se traduisent par

2
6x,(l —x ])
î si 0 < jc, < 1 3x 2 si 0 < x 2 < 1
fx\ C*i ) fx2(x2) = i
0 smon 0 sinon.

Les variables X, et X2 sont-elles indépendantes ? On pourrait effectuer le produit des lois marginales
pour répondre à cette question. On peut aussi calculer la covariance entre X, et X2. Si elle est nulle, on
ne pourra pas répondre à la question de façon définitive, mais si elle est non nulle, on saura qu’il existe
un lien linéaire entre X, et X2.
On aura besoin des valeurs suivantes :
i 1
£(X,) 6x,(l —x l) d x l 1/2 , E(X2) 3*2 2 3/4,
0 0
1 1
E( Xf) 6x,(l —x 3/10, E(X l) 3x 2 dx2 = 3/5,
o o
2
m ,) = £ ( x f ) - [ £ ( x ,) ] 1/20 , V (X 2) = E { X \ ) - \ E ( X 2) f = 3 /8 0

On note également que

£(X,X2) x xx 2 f ( x x, x 2) d x x dx 2

f \ X26x xx 2 dx,î dx 2 2/5,


J0 J0

ce qui veut dire que


Cov(X.,X2) = £(X1X2) E(Xx)E{X2) = 1/40
et que

Cov(X,, X2)
0,577.
JV(X,)’v(X2)

On doit conclure que X, et X2sont linéairement dépendantes. Puisque p est positif, lorsque X, prend de
grandes valeurs, X2prend aussi de grandes valeurs, et les deux variables prennent de petites valeurs en
même temps. Or, le lien n’est pas tellement fort, car p n’est pas assez proche de 1.
Les distributions de probabilité conjointes

1 si -x2
0 sinon.

.•
j

!
:

f
// —

!i

Voici quelques propriétés de la covariance et de la corrélation


C o v ( X I, X, ) = VCX, ) P ( * j , JT, ) 1
ab
p ( X t , X 2) si a ^ O et b ^ O
Cov (a X }, b X 2) = abCo v (Z ,, ) p ( a X , , bX2) \ab\
0 si a = 0 ou b O
Cov(Xj + a , X 2 +b)= , X 2) p ( X 1 + a , X 2 + b) = p(A",, X 2)
b^
si b 0
Cov(X, ,a + bXt)= ) p ( X , , a + bXj ) \b \

0 si b 0
CHAPITRE 3

3.7 Les combinaisons linéaires


L’étude des distributions conjointes de vecteurs aléatoires à plus de deux dimensions tels que
[Xp X2, X j dépasse les limites du présent ouvrage. Notre attention portera cependant sur
une fonction particulière de X v X2, ..., Xn, soit
Y = a 0 + a,X, + ••• + <2„X„, (3.27)
les valeurs a étant des constantes réelles pour i = 0, 1, 2, ..., n. C ’est ce qu’on appelle une
«combinaison linéaire» des variables X,, X2, ..., Xn. Si on connaît l’espérance et la variance de
chacune des variables X , il sera aisé de déterminer celles de Y, même sans passer par le calcul
de la distribution de Y.

Exemple 3.18
La figure 3.18 illustre quatre résistances montées en série. La résistance électrique de chacun de ces
composants est une variable aléatoire. Si on la note Y, la résistance électrique de l’ensemble correspond
à Y = X.I + X,z + X,J + X,.4 On a ici une combinaison linéaire où an
0
= 0 et a,1
= an
2
= • • • = a n
=1.

V A — W v — W v — VW
xi X X3 X

Des résistances en série

Exemple 3.19
Soit deux pièces à assembler comme le montre la figure 3.19. On peut représenter l’espace résiduel par
Y = X i X2 ou par Y = (1)X, + (-1)X2. Un espace négatif signifie évidemment qu’il est impossible
d’emboîter ces deux pièces. On a ici une combinaison linéaire où 0, = 1 et 1.

X2

. . . « » - - . ■

Un assemblage simple d'une pièce de diamètre X2dans une autre de diamètre X,

Exemple 3.20
On tire au hasard 10 unités parmi les extrants d’un processus visant à fabriquer de petits arbres pour les
moteurs de ventilateurs électriques. On veut mesurer le diamètre de ces arbres et calculer la moyenne
de l’échantillon, soit
X = — (X! + X2 + ••• + XI0).

La valeur X = ^-X1+ -j^X2+ ••• + X)0constitue une combinaison linéaire où 0 et =


~ °io ~ HT
Les distributions de probabilité conjointes
«

Voyons maintenant comment déterminer la moyenne et la variance d’une combinaison


linéaire. Soit par exemple la somme de deux variables aléatoires

Y = X l +X2. (3.28)

On obtient la moyenne de Y en posant


E(Y) = £(X,) + E(X2). (3.29)

Le calcul de la variance s’avère toutefois moins évident. En effet,


V{Y) = E [ Y - E ( Y ) ] 2= E ( Y 2)- [E{Y)]2
= £ [(X, + X2)2] - [£(X, + X2)]2
= £ [X 2 + 2X,X2 + X22] - [£(X,) + £(X2)]2
= £(X?) + 2£(X,X2) + £(X2) - [£(X,)]2 - 2£(X,) ■£(X2) - [£(X2)]2
= {£(X?) - [£(X,)]2} + (£(X2) - [£(X2)]2} + 2[£(X,X2) - £(X,) • £(X2)]
= V(X,) + V(X2) + 2Cov(X„ X2),
ce qui s’écrit de façon succinte
+ o \ + 2g n . (3.30)

Ces résultats s’appliquent à toute combinaison linéaire

Y + ai^l + a2%2 H----- f anX„


sous les formes générales

£(K) = a0 + 2 > ,.£ (X f)


1=1

et

VOO = 2 > ? v ( x ,>+ ' L ' L a,aJ Cov(X„ Xj).


i=i i=i j=i
i*j

Exemple 3.21
Soit les deux pièces à assembler de l’exemple 3.19. Supposons que les diamètres [X,, XJ, en cm, ont
une densité conjointe qui permet d’établir les quantités suivantes :
£(X,) = 5,1 V(X,) = 0,0025 p = -0,2.
£(X2) = 4,9 V(X2) = 0,0016
Peut-on déterminer l’espace résiduel moyen entre les deux pièces ? Et l’écart-type de l’espace ?
EiX) = £(X, - X2) = £(X,) - £(X2) = 5,1 - 4,9 = 0,2 cm
V(Y) = V(X, - X2) = V(X.) + V(X2) + 2(-l) Cov (X„ X2)
= 0,0025 + 0,0016 - 2p JV{Xx) ^/V(X2)
= 0,0025 + 0,0016 - 2(-0,2) (0,05)(0,04)
= 0,0049 cm2 ►
102 CHAPITRE 3

L’écart-type de l’espace résiduel est donc

JV(ÿ) = VÔÔÔ49 = 0,07 cm.

La combinaison linéaire de variables


aléatoires indépendantes
On peut exprimer la variance de Y beaucoup plus simplement en présence de variables indé­
pendantes, puisque tout terme représentant la covariance est alors nul. On a ainsi, en pareil cas,
n

V ( n = 5 > , 2-V(X,). (3.34)


1=1

Exemple 3.22
L’exemple 3.18 traitait de quatre résistances montées en série de telle façon que l’ensemble a une résis­
tance électrique de Y = X, + X2+ X3+ X4, où X, représente la résistance électrique du premier compo­
sant, et ainsi de suite. On peut aisément calculer la moyenne et la variance de Y en fonction de celles
des divers composants. Si les résistances utilisées ont été choisies au hasard, on peut raisonnablement
supposer que les variables X,, X2, X3 et X4 sont indépendantes, de sorte que
A»y= Ai + A2 +A3 +A4

2 2 2 2 2
Gy =<7f +(72 +G3 +G4.

On ne sait encore rien de la distribution de Y. Toutefois, les variables X,, X2, X3et X4étant indépendantes,
il suffit de connaître la moyenne et la variance de chacune pour pouvoir déterminer celles de Y

Exemple 3.23
On peut s’attendre à ce que les variables X,, X2,..., X10de l’exemple 3
du processus d’échantillonnage aléatoire. Comme le montre la figure 3.20, ces variables sont en outre
identiquement distribuées, car elles proviennent de la même production. On s’intéresse à la combinai­
son linéaire constituant la moyenne de l’échantillon

1 1
X X,1 + ...+ Xio-
10 10

Des distributions identiques pour les dix diamètres



Les distributions de probabilité conjointes 103

Il en résulte ici que

et que

•V(X2) + ••• +

Il est normal que plusieurs valeurs de X prises sur différents échantillons de taille 10 aient la même
espérance qu’un diamètre pris isolément, mais que la variabilité des X 10) soit plus faible que celle
des unités individuelles (g 2).

Distribution p ( x l, x 2) = P(Xl = x l et X 2 x 2) f(xl, x2)


conjointe
Distribution P x (AT,) = P(Xt = *!> = f ( x l, x 2) d x 2
marginale de X { 1

Distribution ppci, b) f ( x ., b)
conditionnelle de Xt, | Pxx\bC*i) = X.\X
Px, V>)
sachant que X 2 = b
Espérance
E(Xi\b) = ' ^ x lPx EiXx| b) (jCj ) dx
conditionnelle de X x,
sachant que X 2- b
Distribution ^ p ( x i,x2) f ( x x, x 2) d x x
Px->(X2)
marginale de X.

Distribution p(a,x 2) f ( a , x 2)
conditionnelle de X J Px2\a(* 2 )
Px, («)
sachant que X x H

Espérance
conditionnelle de X 2, l L x iPx x J x 2\a(x i) d x 2
sachant que X.
104 CHAPITRE 3

Indépendance de deux variables aléatoires


• Xj et X2 sont indépendantes si et seulement si
p (jtp x 2) = p x, (x i )P x2(x 2 ^ pour tout (a:p jc2) (cas discret),
f ( x l, x 2) = f X] ( x {) f x (2x2) pour tout , x 2) (cas continu).

• Si X xet X2 sont indépendantes, alors leur covariance et leur corrélation sont nulles.

Covariance et corrélation
• Covariance: C ov(X pX 2) = EIXXj - p , ) (X2 - p 2)] = E(X 1X 2) - E ( X 1)E (X 2)
^ „ . C ov(X pX 2)
• Corrélation : p = . 1 =
V v ( x ,) v ( x 2)
• Propriétés :
-o o < C 0 V(XpX2)<oo
Cov(Xj, X, ) = V(Xj )

si a ^ 0 et b ■*- 0
Cov(aXl , b X 2)= ov(X ,, X2)
si a = 0 ou b —0

Cov(X, p(X,
+ a , X 2 +b)= C o \ ( X 1, X2) + a , X 2 + b) =p (X p X 2)

si b 0^
Cov(Xj, a + b X x) - p ( X)x,a + b X x) = <
si Z? = 0

Espérance et variance d’une combinaison linéaire de variables aléatoires


• E(a0 +a1X l + a 2X 2) = a0 + a xE ( X x) + a 2 E ( X
• V(a0 +a1X l + a2X 2) = ax V ( X x) + a2 V ( X 2) + 2axa2C o v ( X x, X 2),
où aQ, a { et a2 sont des constantes réelles.

3.1 Un fabricant de réfrigérateurs soumet ses Défauts de finition


produits finis à une dernière inspection. Il
s’intéresse à deux types de défauts : les éra­ > < 0 1 2 3 4 5
flures du fini porcelaine et les défectuosités 0 11/50 4/50 2/50 1/50 1/50 1/50
mécaniques

mécaniques. En inspectant plusieurs réfri­ 1 8/50 3/50 2/50 1/50 1/50


Défauts

gérateurs, on a obtenu les probabilités du 2 4/50 3/50 2/50 1/50


tableau ci-contre, où X représente le nombre
3 3/50 1/50
de défauts de finition et Y, le nombre de
défauts mécaniques d’un réfrigérateur. 4 1/50
Les distributions de probabilité conjointes 105

a) Quelle est la probabilité d'observer un c) Combien d’unités vend-on, en moyenne,


défaut mécanique et un défaut de finition lorsqu’un client passe une commande?
simultanément sur un réfrigérateur? d) Quelle est la proportion des commandes
b) Quelle est la probabilité d’observer au qui incluent un plan d’entretien pour
plus un défaut mécanique et au moins chaque unité vendue?
trois défauts de finition simultanément e) Vrai ou faux? Une commande choisie
sur un réfrigérateur? au hasard a autant de chances d’inclure
c) Quel le est la probabilité d’observer plus un seul plan d'entretien que de n’en
de 3 défauts sur un réfrigérateur? inclure aucun.
d) Déterminez la distribution marginale f) Vrai ou faux ? Un client ayant payé pour
de X et celle de Y. deux plans d’entretien a plus de chances
e) Déterminez la fonction de masse du d’avoir acheté deux unités que trois
nombre de défauts mécaniques lorsque unités.
le fini n’a aucune imperfection, g) Peut-on dire que le nombre d'unités
f ) Déterminez la fonction de masse du vendues est une variable indépen­
nombre d’imperfections du fini lorsqu’il dante du nombre de plans d’entretien
n’y a aucune défectuosité mécanique. vendus ?
g ) Le nombre de défauts de finition est-il 3.3 Dans une petite entreprise, le nombre de
indépendant du nombre de défauts courriels (X) et le nombre d'appels télépho­
mécaniques dans cette production ? niques )Y
(eçus
r en 15 minutes par le gérant
h) Sachant que E(X) = 0,9, V(X) = l,57, sont des variables aléatoires indépendantes
E{Y) = 1,02 et V(Y) = 1,10, calculez le dont les distributions marginales sont
coefficient de corrélation de ces deux respectivement
variables.
3.2 Un gestionnaire de stocks a réuni un grand 1/8 si JC == 0 r

1/4 si v == 0
nombre de commandes de son entreprise, 1/2 si JC == î
puis a mis en relief la distribution con­ Px M ~ ' 1/4 et pY(y) = < 1/2 si y-= 1
si JC == 2

jointe du nombre d’unités vendues par 1/4 si y- = 2 .


commande et du nombre de plans d’entre­ 1/8 si JC == 3
tien vendus pour ces mêmes unités. Cette
distribution est présentée dans le tableau a) Quelle est la distribution conjointe du
ci-dessous. nombre d'appels et du nombre de cour­
riels reçus par le gérant en 15 minutes ?
Nombre d’unités b) Vrai ou faux? La probabilité de ne
vendues recevoir aucun courriel ni appel en
1 2 3 15 minutes est de 1/8 + 1/4 = 3/8.
J .. <
G c) Quelle est la probabilité que le gérant ait
a> 0 0,20 0,10 0,05 reçu 2 courriels en 15 minutes, sachant
a) +3
■o S P C/D
qu’il a répondu à un appel téléphonique
u s 1 0,30 0,05 0
C durant cette période ?
S "O o>> 2 0 0.15 0,05
O C/3
Z G 3.4 Une salle d’attente contient 50 patients
JS
TEL 3 0 0 0,10 de groupe sanguin O, 30 patients du
groupe A, 10 patients du groupe B et
a) Déterminez la distribution condition­ 10 patients du groupe AB. Vous sélec­
nelle du nombre de contrats d’entretien tionnez au hasard deux patients dans cette
vendus lorsque deux unités figurent sur salle. Déterminez la distribution conjointe
la commande. de X =nombre de patients du groupe A
b) Déterminez la distribution marginale dans votre échantillon et de Y nombre
du nombre d’unités vendues. de patients du groupe B.
106 CHAPITRE 3

3.5 Le tableau suivant donne une partie de e) Calculez la probabilité que le joueur
la fonction de masse p(x> y) d’un vecteur gagne (c’est-à-dire que le gain du joueur
[X, Y]. soit supérieur à sa mise).
f ) Calculez la moyenne du gain net de ce
joueur.
3.7 Soit le vecteur aléatoire discret [Xp X2],
où Xi et X2représentent respectivement
le nombre de tubes d’aspirine vendus à
la pharmacie du coin en août et en sep­
tembre. Le tableau suivant présente la
distribution conjointe de ces deux variables.
On connaît aussi l’information ci-dessous.
51 52 53 55
5 4

y -1 0 1
0,06 0,05 0,05 1 0,01 0,01
l 5 1

P(r = y |X = 2) 1/8 3/8 1/2


l
1
5 2
* 1
0,07 0,05 0,01 0,01 0,01
a) Trouvez P(X = 2). 0,05 0,10 0,10 0,05 0,05
1 53
b) Remplissez le tableau de la fonction
0,05 1 0,02 0,01 1 0,01 1 0,03
p(x, y) en incluant les distributions l 5 4 l
marginales. 55 1 0,05 1 0,06 1 0,05 1 0,01 1 0,03
c) Calculez P(X= 0 1T= 0).
d) Les deux variables et sont-elles a) Quelle est la probabilité de vendre
indépendantes ? Justifiez votre réponse. 52 tubes d’aspirine en août ?
©) Calculez la covariance entre X et Y, et b) Déterminez la fonction de masse du
interprétez le résultat. nombre de tubes d’aspirine vendus en
f) On considère la variable T = 10+X - 2Y. août.
Calculez la variance de T. Notez que c) Combien de tubes peut-on s’attendre
V(X) = 11/16 et que = 1/2. à vendre en moyenne au mois d’août ?
3.6 Une boîte contient six jetons ayant des d) Combien de tubes peut-on s’attendre à
valeurs réparties de la façon suivante : vendre en moyenne en septembre si on
un jeton a la valeur 0, trois jetons ont la a vendu 52 tubes en août ?
valeur 1, et deux jetons ont la valeur 2. 3.8 Soit X une variable aléatoire discrète à trois
On extrait au hasard, successivement et modalités (x{, x2, x3), et Y une variable aléa­
sans remise, deux jetons de la boîte. Soit toire discrète à 3 modalités (yt, y2, y3). Les
X la valeur du premier jeton et Y, celle du énoncés suivants sont-ils vrais ou faux ?
deuxième jeton.
a) Déterminez (sous forme de tableau) la a) Si X et Y sont indépendantes, alors la
fonction de masse conjointe p(x, y) du probabilité des neuf combinaisons (x., y )
vecteur [X, Y]. est la même.
»

b) Ajoutez au tableau de p(x, y) les b) Si les trois modalités de X sont équi­


distributions marginales de X et de Y. probables et que les trois modalités de
c) Calculez P(X= 11T = 0). Y sont équiprobables, alors et sont
indépendantes.
d) Les deux variables Xte sont-elles
indépendantes ? Justifiez votre c) Si la loi marginale de X est la même que
réponse. la loi marginale de Y, alors X et Y sont
Supposons qu’un joueur mise 2 $ et indépendantes.
tire au hasard deux jetons de la boîte. d) Si X et Y sont indépendantes, alors la
IJ reçoit alors un montant égal à la somme loi marginale de X est la même que la loi
des valeurs des deux jetons obtenus. marginale de Y
Les distributions de probabilité conjointes 107

©) Si Xet Ysont indépendantes, alors la Calculez les quantités demandées.


loi marginale de X est la même que la loi a) Cov(X, Y)
conditionnelle de | Y.
b) E(X + Y)
3.9 Soit c) V(X+Y)
2. 2
~(xx+x2) d) E(3X - 2Z)
4xxx 2e si x, > 0; x2 > 0
f ( x x, x 2) = < e) V(3X-2Z)
0 sinon.
f) Corrélation entre 3X et -2Z
a) Déterminez la densité marginale de X,. g) Cov(2X + 3Y, Z - Y )
b) Déterminez la densité conditionnelle 3.13 La disposition des taches d’huile sur les
de X, sachant X2. plaques de métal de 2 dm par 1 dm coupées
c) X, et X2 sont-elles des variables aléa­ par une nouvelle machine peut être modé­
toires indépendantes ? lisée par la loi conjointe suivante, où et
3.10 Supposez qu’on mesure la tension super- sont les coordonnées du centre d’une tache à
partir du coin inférieur gauche de la plaque :
«

ficielle et l’acidité d’un produit chimique.


On chiffre ces deux variables en établissant
une échelle de tension superficielle où s i 0<x<2; 0 < y < l
0 < Xj < 2 et une échelle d’acidité
où 2 < X2< 4. Voici la fonction de densité sinon.
de [X,, X2] :
k{6 —x x—x 2) si 0 < < 2; 2 < <4 La figure ci-dessous illustre la densité
/(* i>x2) = < conjointe des coordonnées du centre de
0 sinon. la tache.
a ) Déterminez la valeur appropriée de k.
b) Calculez la probabilité que X, < 1 et que
X2< 3.
c) Calculez la probabilité que X, + X2< 4.
d) Déterminez la densité marginale de X,.
e) Déterminez la probabilité que X, < 1,5.
«

fD
) éterminez la distribution condition­
nelle de X2 sachant X,.
3.11 Soit X, le résultat obtenu à un test d’aptitude
en mathématiques, et X2le résultat obtenu x
à un test d’habiletés physiques. Le vecteur a) Quelle est la probabilité qu’une tache
[Xt, X2] a la fonction de densité soit située dans la moitié inférieure de
r la plaque, c’est-à-dire pour 1/2 ?
si 0 < Xj < 1; 0 < x2 < 1
f ( x l, x 2) = < b) Quelle est la distribution de la hauteur
sinon. du centre de la tache (y) sachant que
x=l?
Déterminez le résultat moyen au second c) Les deux coordonnées du centre d’une
test à partir du résultat au premier test. tache sont-elles indépendantes ?
3.12 Supposons que X, y et Z sont trois varia­
bles aléatoires ayant les caractéristiques 3.14 La demande d’un certain produit est une
suivantes : variable aléatoire dont la moyenne s’éta­
blit à 20 unités par jour et la variance, à 9.
E(X) = 6 V(X) = 25 pXY= 0 , 9 On appelle « délai d’approvisionnement »
E(Y) = - 1 V(Y) = 1 6 pxz = - 0 , 6 l’intervalle entre le moment où l’on passe
E(Z) = 0 V(Z 36 P j , z = 0 , l . une commande et celui où on la reçoit.
108 CHAPITRE 3

a) Déterminez l’espérance et la variance a) Dans quelles circonstances y aura-t-il une


de la demande durant un délai transaction pour une maison à vendre
d’approvisionnement de quatre jours choisie au hasard dans ce quartier ?
si l’on suppose que les demandes b) Traduisez par une expression la probabi­
quotidiennes sont indépendamment lité qu’il y ait une transaction.
distribuées.
3.19 Le vecteur [X, F] est uniformément distribué
b) Déterminez l’espérance et la variance à l’intérieur du demi-cercle représenté ci-
de la demande durant un délai dessous. De ce fait, /(x, y) = 71n si [x, y]
d’approvisionnement de deux jours se situe à l’intérieur du demi-cercle.
si l’on suppose que la corrélation entre
les demandes de deux journées
successives est de -0,6.
3.15 Soit Xxet X2deux variables aléatoires telles
que X2= a + bXx. Démontrez que p = -1 si
b<
0, tandis que p = +1 si 0.
3.16 Les variables X, et X2 sont distribuées selon
la fonction
a) Déterminez la densité marginale de X
f 2 si 0 < x, < x 2 < 1
f ( x l , x 2) = <. et celle de Y.
0 smon. b) Déterminez leurs densités conditionnelles.
c) Déterminez leurs espérances condi­
Déterminez leur covariance.
tionnelles.
3.17 a) Si le prix de vente d’un article est fixé
3.20 Supposons que la position (X, Y) des éclats
à 100 $ de plus que son coût de revient,
de verre sur un pare-brise de camion causés
que vaut la corrélation entre le prix de
vente et le coût de revient ? par les impacts de roches est distribuée
selon la loi conjointe suivante (illustrée
b) Sachant que le coût de revient a un écart-
ci-après) :
type de 5 $, que vaut la covariance entre
le prix de vente et le coût de revient, selon
la situation décrite en a) ? si0<x<2;0<y<l
f(x, y)
c) Si dans un certain commerce le profit
effectué sur la vente d’un article est sinon.
toujours équivalent à 30 % du coût
de revient, que vaut la corrélation entre
le profit et le coût de revient ?
d) En supposant que le coût de revient
a un écart-type de 10 $, que vaut la
covariance entre le profit et le coût
de revient, selon la situation décrite
en c)?
3.18 Dans un certain quartier, les gens qui
mettent leur maison en vente sont prêts à
accepter un prix minimum X variant entre x
200 et 240 milliers de dollars. Les ache­
teurs ayant montré de l’intérêt pour ces a) Quelle est la distribution marginale de
maisons sont prêts à payer un montant Y la hauteur de l’éclat (F) ?
compris entre 180 et 220 milliers de dol­ b) Quelle est la distribution de la hauteur
lars. La fonction/(x, y) définit la distribu­ de l’éclat lorsqu’il est au centre du pare-
tion conjointe de ( .X,Y). brise en largeur (x = 1) ?
1 * * 1• ~ .
Les distributions de probabilité conjointes 109

c) Les positions horizontales et verticales père et celle de son fils aîné est 0,75.
d’un éclat sont-elles indépendantes selon On peut en déduire que la taille des fils
cette distribution ? aînés est en moyenne 75 % de la taille
de leur père dans cette population.
3.21 Sachant que
d) Dans une certaine population, on sait
si0<A:<l;0<>’<l que la corrélation entre la taille d’une
f(x,y) = i mère et celle de sa fille aînée est 0,65.
sinon,
On peut en déduire que les filles aînées
déterminez sont en moyenne plus petites que leur
a) E[X\y]- mère dans cette population.
b) £(X |F = 1/2); 3.24 Soit les densités conjointes définies ci-
0 E [ X ]; dessous, o ù /(jc, y) vaut 0 hors des inter­
d) E[Y] ; valles spécifiés. Indiquez pour chacune si
e) si X et Y sont indépendantes. les variables X et F sont indépendantes
ou non.
3.22 Soit X une variable aléatoire continue dont
a) /( jc, y) = 4jc ye~(x‘+r) si 0, > 0
les valeurs possibles sont dans l’intervalle
(x, jc0), et Y une variable aléatoire conti- b) /( jc, y) = 3;c2y"3 si 0<jc<y < 1
c) /( jc, y) = 1/8 si 0 < x < 2 ;
nue dont les valeurs possibles sont dans
(y , y ). Les énoncés suivants sont-ils vrais 0<y <4
ou faux ? 3.25 Chez un certain distributeur alimentaire, la
a) Si X et F sont indépendantes, alors variable aléatoire X représente le moment
la loi conjointe de (X, Y) est de la de la journée (un nombre entre 0 et 1) où
forme/(x, y) = 1 pour une certaine une commande d’un client pour un produit
constante k. est reçue. La variable F représente le
b) Si la loi marginale de X est la même que moment de la journée où une livraison de
la loi marginale de Y, alors X et sont ce type de produit arrive dans les entrepôts.
indépendantes. Leur fonction de densité conjointe est
c) Si X et Y sont indépendantes, alors
la loi marginale de X est la même que la s i 0 < ; c < l ; 0 < y < l
f(x, y)
loi marginale de Y. sinon.
d) Si X et F sont indépendantes, alors la loi
marginale de X est la même que la loi a) Quelle est la probabilité qu’une com­
conditionnelle de X| (pour les valeurs mande et une livraison soient reçues
de y où f Y(y) est non nulle). dans la première moitié de la journée ?
b) Quelle est la probabilité qu’une com­
3.23 Déterminez si les énoncés suivants sont mande soit reçue après la livraison de
vrais ou faux. ce type de produit ?
a) Si les variables X et F sont indépen­ c) Supposez que les marchandises sont
dantes, alors leur corrélation est nulle. très périssables et qu’elles doivent être
b) Si Cov(V, T)= 0, alors on peut conclure vendues au plus tard un quart de journée
que V est indépendante de T. après leur arrivée à l’entrepôt. Quelle est
c) Dans une certaine population, on sait la probabilité que ces fournitures ne se
que la corrélation entre la taille d’un gaspillent pas ?

«
T sera ici question de plusieurs lois de probabilité discrètes d o n t nous établirons
la forme analytique à p a rtir d ’hypothèses élém entaires p o rta n t s u r des phéno-
• mènes du monde réel. Nous verrons quelques applications de chacune de ces
lois, lesquelles sont fréquem m ent utilisées en génie, en recherche opérationnelle
et en gestion. Trois d'entre elles, soit la loi binomiale, la lot géom étrique et la loi
de Pascal, également définie comme une loi binomiale négative, découlent d ’un
processus aléatoire formé d ’une suite d'épreuves de Bernoulli. Une telle épreuve
est une expérience aléatoire simple dont l’issue peut être un «succès» ou un
«échec», comme le lancer d ’une pièce de monnaie. La loi hypergéom étrique
et la loi de Poisson feront aussi l’objet d ’une étude dans ce chapitre.

En présence d’une seule variable aléatoire, nous omettrons ici encore (lorsque cela ne crée
aucune ambiguïté) l’indice désignant la variable dans la notation de sa fonction de masse ou de
répartition, en écrivant p(x) au lieu de p x(x) et F(x) au lieu de Fx(x). Il en ir
chapitres subséquents.

4.1 Les épreuves et la loi de Bernoulli


De nombreux problèmes font intervenir une expérience composée de n épreuves ou essais
consécutifs. Dans le cas qui nous intéresse, chacune de ces épreuves ne peut déboucher que
sur un succès S ou un échec E, et la probabilité du succès, notée p, est constante d ’une épreuve
à l’autre. Ces dernières sont considérées indépendantes. De telles épreuves sont alors appelées
des « épreuves de Bernoulli ».
Pour faciliter les choses, considérons le cas d’une seule épreuve de B ernoulli. Soit X une
variable aléatoire telle que X = 1 lorsque le résultat obtenu de l’épreuve est S et X = 0 lorsque ce
résultat est E ( voir la figure 4.1).
«■■UUMlMrtC
Quelques lois de probabilité discrètes 111

Fonction de masse de la loi de Bernoulli


La variable aléatoire X représentant le nombre de succès lors d'une épreuve de Bernoulli peut prendre
les valeurs 0 ou 1. On dit alors que X est distribuée selon une loi de Bernoulli de paramètre p, où p est
la probabilité de succès. La fonction de masse de X est donnée par
1 P si jc = 0
p{x) < P si jc = 1 0 f

0 smon.

La fonction de masse de la loi de Bernoulli est représentée à la figure 4.2

/ *
:

p(x) t p(x) t
0 ,8 - 0, 8 -

0,6 0, 6 -

0,4 0,4-

0,2 0,2

0,0 0,0
0 1 x 0 1 JC

a) b)

La fonction de masse de la loi de Bernoulli: a) avec paramètre p = 0,2;


b) avec paramètre p = 0,6

L'espérance et la variance d'une loi de Bernoulli


La loi de Bernoulli a une moyenne théorique de

E(X) 0 • (1 - p ) + 1 • p P
et une variance de
V(X) 2 .
[0 (1 - p ) + l2 2
P( 1- P)• (4.2)

On voit sur la figure 4.2a) que l'espérance de X (le «point d’équilibre» de la fonc­
tion de masse) est p = 0,2, et que la dispersion peut se mesurer avec l’écart-type de , soit
V/?(1- p) yjo,l6 = 0,4. La distribution de la figure 4.2b) a une espérance de 0,6 et un écart-
type d’environ 0,49.

Exemple 4.1
Soit un procédé de fabrication où une machine automatique produit des lots de petites pièces en acier.
À l’inspection, chaque pièce d’un lot de 1000 est jugée parfaite ou défectueuse. On peut envisager la
fabrication d’une pièce donnée comme une épreuve individuelle se soldant par un succès (soit ici une
pièce défectueuse) ou par un échec (une pièce parfaite). La probabilité p qu’une pièce soit défectueuse
constitue ici la proportion moyenne de défectuosité du procédé de fabrication. ►
112 CHAPITRE 4

S’il y a lieu de croire que la probabilité que la machine produise une pièce défectueuse est la même
d’un lot à l’autre et qu’elle ne varie pas quels que soient les résultats associés aux lots précédents,
on peut raisonnablement supposer que chaque lot de production est une suite de 1000 épreuves de
Bernoulli indépendantes.

À l’exemple précédent, l’hypothèse voulant qu’on ait affaire à une suite d’épreuves de
Bernoulli indépendantes dénote une idéalisation mathématique de la situation réelle. En
effet, elle ne tient pas compte des effets de l’usure du matériel, du réglage de la machine et
des difficultés liées à l’emploi d’instruments. On a ici représenté la réalité par un modèle qui
néglige certains éléments, mais qui s’avère néanmoins suffisamment fidèle pour générer des
résultats utiles.
Notons qu’une variable de Bernoulli est définie à partir d’une seule épreuve de Bernoulli.
Lorsqu’on considère une suite de plusieurs épreuves de Bernoulli, on a donc également plu­
sieurs variables de Bernoulli. Ces variables permettent de modéliser d’autres phénomènes liés
aux épreuves, tels que le nombre total de succès en n essais, ou le nombre d’essais nécessaires
à l’atteinte d’un premier ou d’un r-ième succès. Ces variables font l’objet des trois sections
suivantes.

4.2 La loi binomiale


Considérons un exemple où l’on exécute trois épreuves de Bernoulli consécutives.

Exemple 4.2
Soit une expérience constituée de l’évaluation de trois pièces d’acier choisies au hasard dans la pro­
duction. On veut étudier le nombre de pièces défectueuses dans cet échantillon. Il s’agit donc de trois
épreuves de Bernoulli indépendantes ayant chacune une probabilité de succès p, où un succès est une
pièce défectueuse ( v o ir la figure 4.3).
Quelques lois de probabilité discrètes 113

La variable aléatoire X correspond au nombre de pièces défectueuses obtenues en trois épreuves et se


traduit par X = Xl +X2+ X3, où Xj est le nombre de succès lors de la y-ième épreuve. Elle présente ainsi
la distribution ci-dessous.
X P(x)
0 />{EEE) = (1 -p ) ■ (1 -p) • (1 --P) = (1 - P Ÿ
î P{EES}+P{ESE}+P{SEE} = 3p(l -■P)2
2 P{ESS} +P{SES} +P{SSE} == 3p2(l --P)
3 P{SSS}=p3

L’exemple précédent se généralise lorsque l’on s’intéresse au nombre de succès qu’on peut
obtenir lorsqu’un nombre fixé d’épreuves de Bernoulli indépendantes sont effectuées.

Fonction de masse de la loi binomiale


La variable aléatoire X représentant le nombre de succès obtenus en réalisant n épreuves de Bernoulli
indépendantes, ayant chacune une probabilité de succès p, est dite «de loi binomiale de paramètres n
etp ». Sa fonction de masse p{x) est définie par
f n'' n—x
Px{\-P) si x = 0,1,2,...,
p(x) <W (4.3)
0 sinon.
En abrégé, on écrit X ~ Binomiale(n, p).

La forme de la fonction de masse ainsi que les valeurs possibles de X dépendent de la valeur
de chacun des paramètres n et p, comme le montre la figure 4.4 (voir à la page suivante).
L’exemple 4.2 présentait une loi binomiale de paramètre = 3. Les paramètres n et p de la
loi binomiale sont tels que n est un nombre entier positif et 0 < < 1. En termes simples, voici
comment on arrive à cette loi. Soit
p(x) = P(X = x) = P(x succès en n épreuves).
Étant donné l’indépendance des épreuves, la probabilité du résultat particulier de où
les x premières épreuves se traduisent par un succès S et les - dernières, par un échec E
correspond à
x n—x ^
-A.
n-x
P SSS...SSEE...EE PX(\~P)
J
n n\
Il y a résultats possibles qui comptent exactement x succès et (n - x) échecs
\x x !(n -x )!
Par conséquent,

n n-x
Px(1 si x = 0,1,2,..., n
p(x) ■i x J
0 sinon,
ce qui constitue la fonction de masse d’une variable binomiale
114 CHAPITRE 4

0, 4-

0, 3-

----- 1------ ,------- }------ 1 _


l 2 3 4
a) Binomiale(rt = 5, p = 0,2) c) BinomialeOz = 5, 0,6)
a
*
1

i
1

•:

I— I— I— I— I— I— i--- r + —f X
4
a
*•

1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9
b) Binomiale(rt = 9, p = 0,2) d) Binomiale(n 9 ,P 0 , 6 ) 1
t
I

La fonction de masse de la loi binomiale avec différentes valeurs de paramètres n et p

L a m o y e n n e e t la v a r i a n c e d e la lo i b i n o m i a l e
Une façon simple de déterminer la moyenne et la variance consiste à considérer X comme la
somme de n variables aléatoires indépendantes de Bernoulli ayant chacune une moyenne p et
une variance p( 1 - p), de sorte que X=

7 - S ^ * 1 *
i, *t

V(X) = p (l - p) + p(l - p) + ••• + p ( l - p) = np( 1 - p).


s

On peut également obtenir les résultats E(X)= np et


tions 2.11 et 2.12 du chapitre 2.
On remarque à la figure 4.4a) que l’espérance de la distribution binom iale (n — 5, p = 0,2)
est 1, et que son écart-type est de V5(0,2)(0,8) « 0 ,8 9 . À la figure 4.4b), ces valeurs sont
EQO = 1,8 et sjV(X) » 1,2.
Quelques lois de probabilité discrètes 115

Exemple 4.3
L’installation de fabrication représentée schématiquement à la figure 4.5 produit chaque jour des mil­
liers d’unités.

Transporteur
Atelier ■
*

1
I

1
| Echantillonnage «=100
horaire
. . . » » • . * . . ■ . . . . .

fi'
fa

2} \
i « J L ,

y . T v V
f fi f
y 'V
9 M v"
Un échantillonnage pour la vérification d'attributs

Le pourcentage moyen d’unités défectueuses se situe à 1 % et ne varie pas au fil du temps. Une fois
l’heure, on prélève au hasard 100 unités du transporteur de manutention. Une inspectrice en exa­
mine et en mesure plusieurs caractéristiques et qualifie chaque unité de parfaite ou de défectueuse.
Si l’on envisage ce processus d’échantillonnage comme = 100 épreuves de Bernoulli où = 0,01,
le nombre total X d’unités défectueuses de l’échantillon obéit à la loi binomiale
nocn 100-x
(0,01)* (0,99) si x = 0,1,2,..., 100
P(x) X J
0 smon.
L’inspectrice doit faire cesser la production lorsqu’un échantillon renferme plus de 2 unités défectueuses
Or, PiX > 2) = 1 - P(X < 2), et on peut calculer
P(X < 2) = P(X = 0) + P{X = 1) + P(X = 2)
10(A 100 - jc
(0,01)* (0,99)
x J
100 99 2
(0,99) +100(0,01)'(0,99r+4950(0,01)z(0,99) 98

0,921.

Il y a donc une probabilité d’environ 1 0,921 0,079 que l’inspectrice fasse cesser la production.
Le nombre moyen d’unités défectueuses trouvées dans les échantillons de taille 100 correspond à
E(X) = np= 100(0,01) = 1, avec un écart-type de y/V{X) = - p) = >/0,99 « 0,995.

En résumé, il faut avoir la certitude qu’on peut raisonnablement considérer le phénomène


à l’étude comme une suite d’épreuves de Bernoulli si l’on veut recourir à la loi binomiale pour
décrire X , soit le nombre de succès obtenus en réalisant n épreuves.

4.3 La loi géométrique


La loi géométrique est elle aussi liée à une suite d’épreuves de Bernoulli. Toutefois, contraire­
ment à la loi binomiale, le nombre de succès est fixé à 1 et c’est le nombre d’épreuves qui peut
varier.
116 CHAPITRE 4

Fonction de masse de la loi géométrique


La variable aléatoire X, représentant le nombre d’épreuves nécessaires pour obtenir un premier succès
dans une suite d’épreuves de Bernoulli indépendantes dont la probabilité du succès estp > 0, est dite «de
loi géométrique de paramètre p». La figure 4.6 montre l’espace échantillonnai et l’image de X. L’image
* * ^ * ' . ' • .. , ^

de X est Rx = {l, 2, 3, ...}, et sa fonction de masse est donnée par


si x —1, 2 ,...
sinon.
En abrégé, on écrit X Géométrique(/?),

On peut facilement établir qu’il s’agit d’une fonction de m asse puisque

P(x) 0 pour tout x.


La fonction de masse d’une variable est décroissante. En d ’autres term es, p ( x ) p(x
pour x = 2, 3, ..., comme le montre la figure 4.7.
/

La fonction de masse de la loi géométrique pour deux valeurs de paramétre p


Quelques lois de probabilité discrètes 117

La moyenne ia variance de géométrique


aisément déterminer la moyenne et la variance de la loi géométrique comme
d
E(X) X *P(1 p .( - l ) I(l-P )
JC=l dp %

Pour la distribution représentée à la figure 4.7a), la valeur moyenne de X est E{X) = 1/0,2 = 5,
0,8
avec une dispersion mesurable par l’écart-type \jv(X) 2
4,47. La distribution de la
0,2
figure 4.7b) a une espérance de 5/3 et un écart-type d’environ 1,05.

Exemple 4.4
On compte refaire une certaine expérience jusqu’à l’obtention d’un succès. Chaque tentative est indépen­
dante des autres et coûte 25 000 $, mais il faut dépenser 5000 $ de plus pour la préparer si la tentative pré­
cédente a échoué. L’expérimentateur souhaite déterminer le coût moyen d’un tel projet. Si X représente le
nombre de tentatives à effectuer pour obtenir un succès, la fonction de coût se traduit par
C(X) = 25 000X + 5000(X - 1)
= 30 000X - 5000.
Par conséquent,
£[C(X)] = 30 000 •£(X) - £(5000)
1
30 000 5000
P\
Si la probabilité de succès de toute tentative est de 0,25, alors
£[C(X)] = 3QQQ0-5000
0,25
= 115 000$.
Ce coût pourra sembler acceptable ou non à l’expérimentateur. Notons que la valeur la plus probable de
X est 1, donc le coût le plus probable est 25 000 $. Il faut aussi reconnaître qu’il est possible de répéter
l’épreuve à l’infini sans jamais obtenir de succès.
118 CHAPITRE 4

Imaginons que l’expérimentateur dispose de 500 000 $. Il souhaitera peut-être déterminer la probabi­
lité que le coût total de l’expérience dépasse ce montant, c’est-à-dire
P(C(X) > 500 000) = P(30 000X - 5000 > 500 000)
505 000
P X>
30 000 J
P(X> 16,833)
l - P ( X < 16)
16
1—£0,25(0,75)*-'
x=\

0 , 01 .

L’expérimentateur ne sera peut-être pas prêt à courir le risque (la probabilité étant de 0,01) de dépenser
tout l’argent disponible sans obtenir de succès.

L a p r o p r i é t é d 'a b s e n c e d e m é m o i r e
La loi géométrique a une propriété intéressante et utile : elle est sans m ém oire. En effet, pour
tout s > 0,
P(X >k + s\X>s) = P(X>k). (4.5)

Autrement dit, même si nous avons obtenu s échecs lors de nos s prem iers essais, la proba­
bilité de devoir réaliser au moins k essais supplémentaires pour obtenir un succès est la même
qu’au début de l’expérience.
Cette absence de mémoire distingue la loi géométrique de toutes les autres lois de proba­
bilité discrètes.

Exemple 4.5
Soit X le nombre de tentatives nécessaires pour obtenir un six en lançant un dé équilibré. On a déjà
effectué 5 tentatives sans obtenir le résultat voulu. La probabilité qu’il faille plus de 2 autres tentatives
pour y arriver (donc plus de 7 tentatives au total) correspond à la probabilité que le nombre d’essais
nécessaires soit supérieur à 2 dès le début de l’expérience.

P(X> 7\X>5) P(X > 7) P(X > 2) 1 P(X < 2)


P(X > 5) 2
1 - P(X < 7) i - Y a - p v 'p
x=l
l-P (X< 5)
-î 1 5 1
1 1 — I
— • —

1 6 6 6
6 25

T 36
1
V6 /
25
36
Quelques lois de probabilité discrètes 119

4.4 La loi de
La loi de Pascal, ou loi binomiale négative, se fonde elle aussi sur des épreuves de Bernoulli et
constitue en fait un prolongement logique de la loi géométrique.

masse

On considère une suite d’épreuves de Bernoulli indépendantes, dont la probabilité de succès est o.
La variable aléatoire X, qui désigne le nombre d’épreuves necessaires pour obtenir 1
e r-ieme succe
étant un nombre entier, est dite « de loi de Pascal de paramètres r et p ». La fonction de masse de X
jc - n x -r
p ' ^ - p) six = r , r + l ,r + 2...
P(x) r - 1J
IH.O
0 sinon.
En abrégé, on écrit X ~ Pascal(f , p).

Le terme p r(1 - p)x r découle de la probabilité associée à exactement


un résultat de $P formé
de (x r) échecs et de r succès. Pour obtenir ce résultat, il faut observer r
1 succès
rieur des x 1 épreuves qui précèdent la dernière, laquelle doit nécessairement déboucher à l’inté-
sur
x n
un succès. Comme
r - 1J arrangements satisfont à cette condition, la loi de Pascal se traduit
par l’équation 4.6.
•ki La,fi 1UrC 4 8 ™°ntre reffet des Paramètres r et p sur la fonction de masse. Les valeurs pos­
sibles de X sont affectées ainsi que la forme de la distribution. P

p(x) I P(x)
0,08- 0,4
0,06 0,3
0,04 0,2 I
0,02 0,1
0,00 T 0,0 I
0 5 10 0
a) Pascal(r = 2, = 0,2) c) Pascal(r = 2, = 0,6)
P(x) | P(x)
0,08- 0,4
0,06 0,3
0 ,0 4 n 0,2
0, 02 - 0,1 S
0,00 T 0,0 i
T T 1
0 0 20 i
b) Pascal(r = 4, p = 0,2) d) Pascal(r

La fonction de masse de la loi de Pascal avec différentes valeurs des


paramètres r et p
1 2 0 CHAPITRE 4

Notons que certains auteurs ou logiciels définissent la variable X comme le nombre d’échecs
survenus avant le r-ième succès. Cela les amène à définir la fonction de masse différemment h
existe également des contextes où r n’est pas nécessairement entier, mais nous n’aborderons pas
ces situations.

La moyenne et la variance de la loi de Pascal


On peut considérer X comme la somme de r variables aléatoires indépendantes suivant chacune
une loi géométrique de paramètre p. Si chacune représente le nombre d’essais jusqu’à un succès,
leur somme constitue le nombre d’essais jusqu’à r succès :
x = x 1, + 2 x + — + x .r
A insi, il devient facile de déterminer l’espérance et la variance de X :

(4.7)

(4.8)

2
À titre d’exemple, la distribution de la figure 4.8a) a une espérance de E ( X ) 10,
0,2
2( 0 , 8)
et un écart-type d’environ yJV(X) 2 6,32
0,2

Exemple 4.6
Lorsqu’il a une décision à prendre, le président d’une grande société lance des fléchettes sur une cible
mention le centre de la cible, ce
demeure Le président lance une
fléchette après l’autre jusqu’à ce qu’il ait obtenu 3 succès.
Soit X le numéro du lancer lui apportant un troisième succès. La moyenne de X est de 3/0,6 = 5, ce qui veut
dire qu’il lui faut en moyenne 5 lancers pour atteindre 3 fois le centre de la cible. Le président applique
une règle simple pour prendre toute décision : s’il atteint le centre de la cible 3 fois en effectuant au plus
5 lancers, il tranche favorablement. Dans ces conditions, la probabilité d’une décision favorable est de
P(X < 5) =p(3) +/?(4) +p(5)
2} 3'\ 4 2
(0,6)3(0,4)° + (0,6)3(0,4)‘ (0,6)3(0,4)
2J 2J 2
0,683.

4.5 La loi hypergéométriqué


L’un des exemples examinés au chapitre 1 se rattachait à la loi hypergéométrique. Nous allons
maintenant énoncer cette loi de manière formelle et en explorer davantage l’utilisation. Suppo­
sons une population finie de N éléments. Un nombre quelconque D de ces élém ents (où D < N )
appartient à une classe qui retient l’attention. Cette classe varie évidemment selon la situation à
l’étude. Il peut s’agir des unités défectueuses (par rapport à celles qui ne le sont pas) dans un
Quelques lois de probabilité discrètes 121

lot de production ou de personnes ayant les yeux bleus (par rapport à celles qui n’ont pas les
yeux bleus) dans un groupe de N étudiants.

Fo n ctio n de m a s s e de la loi h yp e rg é o m é triq u e


Dans le contexte décrit précédemment, si on prélève au hasard et sans remise un échantillon de taill e n.
la variable aléatoire X représentant le nombre d’éléments de l’échantillon qui appartiennent à la ciaISsr
en question est dite «de loi hypergéométrique de paramètres N, D et n ». La fonction de rmisse c

D\
x J
si jc g {max(0, n - N+ D),. . min(n, D)}
p(x) ( N\
\n J
V
0 sinon.

En abrégé, on écrit X~ Hypergéométrique (N, D, n).

Le fait que les tirages se fassent sans remise est fondamental


indépendants. Si l’échantillonnage était fait avec remise, la variable
miale. On voit sur la figure 4.9 que la forme de la fonction de masse
paramètres.

p(x)
0,5
0,4
0,3
0,2

0,1
0,0 r f + JC
0 1 2 3 4 5
c) Hypergéométrique(N = 10, = 6, = 5)
P(x). P(x)
0,5- 0,5
0,4 0,4
0,3 0,3
0,2 0,2

0,1 0,1
0,0 t T T x 0,0 t
0 1 2 3 0 1 2 3 4 5 x
4 5
b) Hypergéométrique(AT = 20, D = 3, n = 5) d) Hypergéométrique(iV = 20, D —6, n = 5)
S * "
i - . v * - , \ r ? r
/ 7.
^ * .1
■b » \ ^

La fonction de masse de la loi hypergéométrique avec différentes valeurs


» . * 0 A /

< r - ' I 1 ML,vm


ÏX* «
O » .

des paramètres N, O et n
*
CHAPITRE 4

La moyenne et la variance de la loi hypergéométricgue


La moyenne et la variance de la loi hypergéométrique sont

Exemple 4.7
Un client reçoit un lot de 25 articles d’un fournisseur parmi lesquels 3 sont non conformes. Le client
tire au hasard et sans remise un échantillon de 5 articles du lot et les inspecte. Soit X le nombre d’ar­
ticles non conformes qu’il observe dans l’échantillon.
1. Donnez le nom ainsi que les paramètres de la loi de probabilité de X.

Exemple 4.8

On reçoit périodiquement des lots de 100 axes de pompe qui doivent faire l’objet d’un contrôle de récep­
tion. Voici le plan d’échantillonnage utilisé pour ce contrôle. On prélève du lot, sans remise, un échantil­
lon aléatoire de 10 axes. Si cet échantillon renferme au plus 1 axe défectueux, on accepte le lot. Supposons
qu’un lot reçu a une proportion d’axes défectueux dep'. Quelle est la probabilité qu’on l’accepte? >
Quelques lois de probabilité discrètes

La probabilité qu’on accepte le lot est manifestement fonction de la qualité de ce lot. Par exemple,
si p' = 0,05, alors

F (accepter un lot) 0,923.

Si p' = 0,03, alors la probabilité d’accepter un lot grimpe à 0,974.

4.3 La loi de Poisson


La loi de Poisson est l’une des lois de probabilité discrètes les plus utiles. Cette loi intervient
souvent lorsqu’on s’intéresse au nombre de fois qu’un certain type d’événements se réalise dans
un intervalle de temps. Il peut s’agir, par exemple, du nombre d’automobiles qui arrivent à un
feu de circulation entre 12 h et 13 h, du nombre d’accidents qui surviennent sur une route durant
une fin de sem aine ou encore du nombre de particules émises par une substance radioactive
durant 10 minutes.
La loi de Poisson peut également être utilisée pour modéliser la fréquence d’apparition
dans l’espace. Il peut s’agir, par exemple, du cas d’un nombre de défauts qui apparaissent sur le
fini d’une pièce ou encore du nombre d’erreurs relevées dans la page d’un livre.

Fonction de masse de la loi de Poisson


.' * i i . ,

On dit qu’une variable aléatoire X est distribuée selon une loi de Poisson de paramètre c > 0 si sa
^ *

fonction de masse est donnée par


* —C
c e
si x = 0 ,1 ,2 ,..
p(x) x\ (4.12)
0 smon.

Le param ètre c désigne le nombre moyen de réalisations du type d’événement étudié dans l’intervalle
de temps considéré ou dans l’espace considéré.
En abrégé, on écrit X ~ Poisson(c).
124 CHAPITRE 4

Sur la figure 4.10, on voit que plus c augmente, plus la distribution se déplace vers la droite,
ce qui correspond à l’interprétation de ce paramètre, soit le nombre moyen de réalisation d’un
événement dans l’intervalle de temps considéré. Notons également que lorsque est grand, la
fonction de masse prend une forme de cloche. Nous reviendrons sur ce phénomène au chapitre 6.

/
P(.x) p(x)
0,20 0, 2 0 -

0,15 0,15

0,10 0,10

0,05 0,05

0,00 0,00
x x
0 5 10 15 0 5 10 15
a) Poisson(c = 4) b) Poisson(c = 8)
La fonction de masse de la loi de Poisson avec différentes valeurs
du paramètre c

Il existe deux façons d’expliquer dans quelles conditions on peut s’attendre à ce qu’une
loi de Poisson s’applique dans les faits. La première repose sur la définition d’un processus de
Poisson. Dans la seconde, on considère la loi de Poisson comme un cas lim ite de la loi bino­
miale. Voici un bref aperçu de ces deux approches.

Approche 1: Le processus de Poisson


Considérons un certain type d’événements qui surviennent dans le temps. On dit que le comp­
tage du nombre de réalisations de ce type d’événements est un «processus de Poisson» si
(essentiellement) les deux conditions suivantes sont vérifiées :
1. Le nombre de réalisations de l’événement à l’intérieur d’intervalles qui ne se che­
vauchent pas se traduit par des variables aléatoires indépendantes.
2. Il existe une grandeur positive X telle que le nombre de réalisations de l’événement
dans tout intervalle de temps [t, t + Aî] de longueur At obéit à une loi de Poisson de
paramètre c = XAt, peu importe l’origine t de l’intervalle. En d’autres termes, les réali­
sations surviennent à une fréquence moyenne constante dans le temps.
La figure 4.11 montre un ensemble d’événements arbitraires et orientés dans le temps.

/
EE E E E
T
0 t t + At Temps
Des événements surviennent de façon aléatoire à un taux constant
Quelques lois de probabilité discrètes

Le paramètre X est appelé l’« intensité du processus » ; il représente le nombre moyen de


réalisations de l’événement par unité de temps.

Approche 2: La loi de Poisson comme un cas limite de la loi


binomiale
Cette approche consiste à considérer la loi de Poisson comme la limite d’une loi binomiale
dans le contexte suivant : les épreuves de Bernoulli sont de très petits intervalles de temps qui
contiennent (ou non) une réalisation de l’événement. On a donc n grand et p petit, mais de telle
sorte que np reste constant. Il est alors démontré que, dans ces conditions, la fonction de masse
de la loi binomiale est proche de celle d’une loi de Poisson de paramètre c = np.

La moyenne et la variance de la loi de Poisson


La loi de Poisson possède une propriété particulière : sa moyenne et sa variance sont tou­
jours égales.
Soit X une variable aléatoire distribuée selon une loi de Poisson de paramètre c > 0. Alors,

L'additivité de la loi de Poisson


La loi de Poisson possède la propriété d’additivité, qui est précisée dans le théorème 4.1.

V. y§t
A

1
J T r * < . v . . f

*. V '
B fl I
4 % .
f* •
v

.
c .

*
a

• _ *
x

. ’
l

>
v

v .
1
i

/ <

» ,
;


j . î ' .
L

. .
* f


S *

- ,
- ! # • /#

* \ C

.
c l y *

t " : -
, ^

>
v

>

I * *
'

'
-

» ;v
*

■ > . v

■ i . l V
.
j

a
e *

>
• t

• • v
-


v

. n
»
V

• . » » v
^ »
-
A .V

.
.* * * • % Z j ■ r S * ■ " ’ - i l ï * ‘ r \ , ‘ C » - i a r » * .
» t t

• f ■ . *• * • « — . * * . . " j * , 4

Si X x, X 2, ...>X i sont des variables aléatoires indépendantes distribuées selon une loi de
paramètre c,, où i —1 ,2 ,..., k, et si Y
- X, +
c —c, + c*, + • •

+ ck.

Cette propriété d’additivité de la loi de Poisson s’avère très utile. En termes simples, il en
découle que la somme de variables aléatoires indépendantes distribuées chacune selon une loi de
Poisson obéit elle-même à une loi de Poisson.
CHAPITRE 4

L a table I de l’annexe indique quelques valeurs numériques de la fonction de répartition


F(x) d’une variable de Poisson. La plupart des logiciels statistiques effectuent automatiquement
le calcul des probabilités fondées sur une loi de Poisson.

Exemple 4.9
Un détaillant a établi que la demande d’un certain appareil électroménager durant une semaine obéit
à une loi de Poisson de paramètre c = 15. Il veut déterminer la quantité qu’il doit avoir en stock en
début de semaine pour que la probabilité de remplir toutes les commandes reçues durant la période
soit d’au moins 0,95. Le détaillant souhaite éviter toute rupture de stock et tout réapprovisionnement
en cours de période. Soit X le nombre de commandes reçues. Le détaillant veut connaître la valeur de
k telle que
F(k) = P{X <k)> 0,95,
de sorte que

On peut trouver la solution en consultant une table de la fonction de répartition de la loi de Poisson ou
en utilisant un logiciel. Dans le cas présent, k = 22, donc le détaillant doit avoir 22 appareils en stock
pour répondre à la demande avec une probabilité de 95 %.

4.7 Quelques approximations


Il peut parfois être utile de remplacer une loi par une autre, surtout lorsque cette dernière est
plus facile à utiliser. Nous considérons ici deux approximations utiles.

L'approximation de la loi hypergéométrique par la loi binomiale


Lorsque le taux de sondage ni N associé à une loi hypergéométrique est petit (inférieur à 10 %,
par exemple), une loi binomiale de paramètres n et p - D /N fournit une bonne approximation
de cette loi. De fait, plus le rapport n/N est petit, plus cette approximation s’approche de la
réalité, car, dans une grande population, la probabilité change peu d’un tirage à l’autre (même
sans remise).

Exemple 4.10
Soit un lot de production de 200 unités dont 8 sont défectueuses. On prélève un échantillon aléatoire
de 10 unités, et on s’intéresse à la probabilité qu’il renferme exactement 1 unité défectueuse. Cette
probabilité est de
8V 192^
9
P(X = 1) \ 0,288
(200
10 J ►
Quelques lois de probabilité discrètes 127

Toutefois, le taux de sondage étant petit (niN = 10/200 = 0,05), on pourrait recourir à l’approximation
fournie par la loi binomiale de paramètre p= 8/200 = 0,04, soit

P{X = 1) * (0,04)1(0,96)9= 0,277.

Cette dernière probabilité aurait été exacte si le tirage des 10 unités avait été fait avec remise.

L'approximation de la loi binomiale par la loi de Poisson


Comme on l’a déjà mentionné, la loi de Poisson offre une approximation satisfaisante de ia loi
binomiale lorsque n est grand et que p est petit. On pose alors c = np. En règle générale, p doit
avoir une valeur inférieure à 0,1 pour que cette approximation soit valable. Plus p est petit et plus
n est grand, plus la loi de Poisson fournit une bonne approximation.

Exemple 4.11
Chacun des 4000 rivets de l’aile d’un avion neuf a une probabilité de 0,001 d’être défectueux. Quelle
est la probabilité que l’aile ne compte pas plus de 2 rivets défectueux ?
2 4000 \
P(X < 2) (0,001)* (0,999)4000- * = 0,237 96.
X
x=0 J
Si l’on utilise la loi de Poisson comme approximation,
c = 4000(0,001) = 4
et
2
P(X < 2)~ «rV /x! = 0,238 10
;c=0

Somme de variables aléatoires indépendantes

X.~ Bernoulli (p) Y ~ Binomiale (&, p)

X. ~ Binomiale (n , p) Y ~ Binomiale(n, p), où n = n,1+ ••• + n k

X ~ Géométrique (p) Y ~ Pascal(fc, p)

X ~ Pascal (r , p ) Y ~
Pascal(r, p), où r= r
-—

--------------------------_—
— —-, --t
X.~ Poisson (c ) Y ~ Poisson (c), où c = c,1+ ••• + ctk
0

» «

Principales distributions de variables aléatoires discrètes

o
>
12
H
m
3 3
Quelques lois de probabilité discrètes 129

/ • - ■

b) Quel est le nombre de succès le plus


Pour tous les exercices qui s’y prêtent :
probable ?
1) définissez clairement la variable aléatoire c) Quelle est la probabilité que la cin­
utilisée ; quième mission soit la première
2) déterminez la loi qui s’applique et la valeur à échouer ?
des paramètres de celle-ci ; 4.3 Un producteur de semences a prévu
3) puis calculez la quantité demandée. envoyer un vendeur chez une douzaine de
_____________ ______ clients importants (qui ne se connaissent
pas entre eux).
4.1 Pour chacun des contextes suivants, a) On estime à 0,5 la probabilité qu’un
déterminez la loi de la variable aléatoire client rencontré passe une commande.
ainsi que la valeur des paramètres lorsque Quelle est la probabilité que le produc­
l’information est suffisante. teur reçoive au moins 4 commandes
a) Vous allez travailler en transport en à la suite de ces visites ?
commun. Soit X, le nombre de fois où b) Supposons que le vendeur visite
l’autobus arrive en retard lors de vos des clients jusqu’à ce qu’il obtienne
10 passages hebdomadaires. 3 commandes. Combien de clients en
b) Un enfant accepte de jouer au jeu de ser­ moyenne le vendeur devra-t-il rencon­
pents et échelles avec son ami jusqu’à ce
%
trer ? Quel est l’écart-type du nombre
qu’il perde une partie. Soit Y, le nombre de clients à rencontrer ?
de parties jouées (incluant la défaite).
c) Le nouveau gestionnaire d’un centre 4.4 Supposons qu’une valise a une probabi­
d’appels veut mesurer le nombre d’ap­ lité de 0,6 % d’être égarée lors d’un vol
pels traités en une heure, et on lui a commercial entre deux aéroports nord-
dit qu’on y traitait en moyenne un appel américains, et que cette probabilité ne
toutes les trois minutes. change pas d’une valise à l’autre.
d) Un directeur de production laisse a) Les 120 passagers d’un vol reliant
fonctionner les machines jusqu’à ce qu’il Montréal à Chicago ont enregistré
détecte deux produits hors normes. Il 90 valises. Quelle est la probabilité que
compte le nombre de produits inspectés. toutes les valises arrivent à destination
e) Pierre lance un dé jusqu’à l’obtention sans être égarées ?
d’un 5 ou d’un 6. Il compte chaque fois b) Lors de votre prochain voyage d’af­
le nombre de lancers nécessaires. faires, vous prendrez l’avion 4 fois.
f ) Environ 0,5 % des employés sont absents Quelle est la probabilité que votre valise
pour cause de maladie lors d’une jour­ soit égarée exactement une fois ?
née standard. Un administrateur d’une 4.5 Une chaîne de production de transis­
compagnie de 550 employés s’intéresse tors génère en moyenne 2 % d’unités
au nombre d’employés malades en une
défectueuses. On y prélève aux 2 heures
journée.
un échantillon aléatoire de 50 unités. Si
g) Un joueur de cartes s’intéresse au nombre cet échantillon renferme plus de 2 unités
d’as dans une main de cinq cartes. défectueuses, il faut interrompre la
4.2 On planifie 6 missions spatiales indépen­ production.
dantes. Chacune a une probabilité de suc­ a) Déterminez la probabilité que ce plan
cès estimée à 0,95. d’échantillonnage engendre une inter­
a) Quelle est la probabilité qu’au moins ruption de la production.
5 de ces missions soient couronnées b) Quelle est la probabilité de prélever trois
de succès ? échantillons consécutifs sans défauts ?
130 C H A PITR E 4

4.6 On sait que 1 % des voyants de clignotants


produits par un procédé donné sont défec­
tueux. Supposez que cette valeur demeure
constante et qu’on prélève 100 voyants au
hasard.
a) Quelle est la probabilité qu’il y ait au
plus 2 clignotants défectueux dans
l’échantillon ?
b) Sachant que les 60 premiers voyants
testés renfermaient un seul voyant
défectueux, quelle est la probabilité que
le lot de 100 contienne deux voyants
défectueux au total ?
4.7 On veut transmettre un message électro­
nique composé des chiffres 0 et 1. Les
conditions imparfaites de transmission font
en sorte qu’il y a une probabilité égale à 0,1
qu’un 0 soit changé en un 1 et qu’un 1 soit
changé en un 0 lors de la réception, et ce,
de façon indépendante pour chaque chiffre.
Afin d’améliorer la qualité de la trans­
mission, on propose de transmettre le
bloc 00000 au lieu de 0 et le bloc 11111
au lieu de 1, et de traduire une majorité
de 0 dans un bloc lors de la réception
par 0 et une majorité de 1 par 1.
a) Quelle est la probabilité de recevoir une
majorité de 1 si 00000 est transmis ?
b) Quelle est la probabilité de recevoir une
majorité de 1 si 11111 est transmis?
c) Quelle est la probabilité qu’un message
de trois bits, comme 101, soit trans­
mis sans erreur avec cette nouvelle V

technique ? 4.9 A un jeu avec un adversaire, on a une


probabilité p de gagner, q de perdre et
4.8 Pour chacun des graphiques suivants, déter­ 1— p— qde faire une partie
minez la distribution des paramètres la plus ce dernier cas, on détermine qui sera
plausible en fonction des choix proposés le gagnant par tirage au sort en lançant
ci-dessous. une pièce de monnaie. On joue une suite de
1) Poisson (c = 3) parties indépendantes dans les mêmes
2) Poisson (c = 6) conditions. Déterminez la loi des variables
aléatoires suivantes :
3) Géométrique (p = 0,4)
a) le nombre de parties jusqu’à la première
4) Géométrique (p= 0,3) partie nulle ;
5) Binomiale(« = 10, 0,4) b) le nombre de parties jusqu’à la première
6) Binomiale(« = 9, p = 0,5) partie qu’on gagne par tirage au sort ;
7) Pascal(r = 3,p = 0,7) c) le nombre de parties jusqu’à la première
8) Pascal (r = 2, p = 0,3) partie qu’on gagne.
Quelques lois de probabilité discrètes 131

d) Supposons maintenant que p = 2/3 et qu’elle épuise cette somme sans obtenir
q —1/3. Calculez la probabilité de une seule commande ?
gagner pour la quatrième fois à la e) Quel est l’écart-type du coût de cette
septième partie. opération ?
4.10 Vous appelez un service à la clientèle 4.13 La probabilité qu’une compagnie d’explora­
jusqu’à ce que vous réussissiez à parler tion pétrolière trouve du pétrole en creusant
à un employé. On sait que la probabilité un puits dans une certaine région est de 0.8.
que vous ayez à appeler deux fois est Sachant que les forages s’effectuent de façon
de 0,16. indépendante, déterminez la probabilité que
a) Déterminez la loi du nombre d’appels la compagnie trouve du pétrole en procédant :
à effectuer ainsi que son ou ses para­ a) à 2 forages ou moins ;
mètres, si possible.
b) à 3 forages ou moins ;
b) On vous informe que la probabilité de
c) à 8 forages ou moins, sachant que les
devoir appeler trois fois pour parler à
5 premiers forages n’ont pas permis de
quelqu’un est inférieure à 10%. Quelle
trouver de pétrole.
est la probabilité qu’un employé vous
réponde dès votre premier appel ? 4.14 Chaque jour du printemps, la probabilité
4.11 On compte effectuer en laboratoire 5 expé­
qu’un orage survienne à Atlanta est de
0,05. On suppose que les occurrences sont
riences identiques et indépendantes.
Chacune de ces expériences n’a qu’une pro­ indépendantes et que le printemps débute le
babilité de succès p en raison de l’incidence 21 mars.
importante des conditions ambiantes. a) À quelle date en moyenne se produira le
a) Déterminez, en fonction de p, la proba­
premier orage du printemps à Atlanta ?
bilité que la cinquième expérience soit la b) Quelle est la probabilité que le premier
première à échouer. orage se produise le 25 avril ?
b) Déterminez mathématiquement la valeur c) Quelle est la probabilité d’un premier
de p qui maximise la probabilité que la orage le 25 avril, sachant que nous
cinquième expérience soit la première sommes le 15 avril et qu’il n’a pas
à échouer. encore plu ?
d) Quelle est la probabilité que le 3e orage
4.12 Une entreprise spécialisée en systèmes de
survienne le 1er mai ?
chenilles a décidé de faire une tournée de
clients possibles jusqu’à ce qu’elle décroche e) Quelle est la probabilité que le 3e orage
une commande. Or, la première visite coûte survienne le 1er mai, sachant que
10 000 $, et il faut débourser 4 000 $ pour nous sommes le 15 avril et qu’il a plu
chaque visite supplémentaire. On considère aujourd’hui pour la première fois du
que les clients prennent des décisions indé­ printemps ?
pendamment les uns des autres. 4.15 Chaque heure, un client potentiel se pré­
a) Quel est le coût le plus probable de cette sente chez un concessionnaire automobile.
opération ? Chaque fois, la vendeuse a 1 chance sur 5
b) Quel est le coût moyen d’une vente si . de conclure une transaction. Cette employée
la probabilité de réaliser une vente à la décide de travailler jusqu’à ce qu’elle ait
suite de toute visite est de 0,10? vendu 2 véhicules.
c) Devrait-on effectuer ces visites si le a) Quelle est la probabilité que la vendeuse
bénéfice prévu de chaque vente est ait à travailler exactement 8 heures ?
de 25 000 $ ? b) Si elle utilise la même tactique chaque
d) Si l’entreprise ne consacre que 100 000 $ jour, combien d’heures en moyenne
au démarchage, quelle est la probabilité travaillera-t-elle en une journée ?
CHAPITRE 4

4.16 On procède à des entrevues pour combler moins 7 unités défectueuses. Si elle décide
2 postes vacants. La probabilité que toute que la présence d’une seule unité défectueuse
personne rencontrée possède les qualités dans un échantillon est suffisante pour justi­
voulues et accepte un poste est de 0,8. fier le refus d’un lot, quelle devra être la taille
a) Quelle est la probabilité de devoir de l’échantillon ?
effectuer exactement 4 entrevues pour 4.21 On estime qu’en moyenne 25 véhicules tra­
combler les 2 postes ? versent une intersection donnée en 1 heure.
b) Quelle est la probabilité de devoir effec­ Supposez que le nombre de véhicules obéit
tuer moins de 4 entrevues ? - à une loi de Poisson.
4.17 Soit une expérience dont la probabilité de a) Déterminez la probabilité que 8 à
succès est de 0,80. On compte refaire cette 10 véhicules traversent cette intersection
expérience jusqu’à ce qu’on l’ait réussie durant un intervalle quelconque de
5 fois. 1 heure.
a ) Combien de fois en moyenne doit- b) Déterminez la moyenne et l’écart-type
on s’attendre à devoir effectuer du nombre de véhicules qui traversent
l’expérience ? cette intersection en 24 heures si on
b) Quelle est la variance du nombre considère que le trafic est constant.
d’exécutions ? c) En raison d’une défectuosité du comp­
teur automatique, chaque véhicule a
4.18 Une compagnie minière veut déterminer
une probabilité de 10 % de ne pas être
s’il est pertinent d’exploiter un site en
détecté. Déterminez alors la probabilité
particulier. Il faut 4 forages fructueux
que de 8 à 10 véhicules soient détectés
pour qu’un site soit choisi. Si la proba­
lors d’une heure quelconque.
bilité de découvrir le minerai est de 0,9
dans cette région, et que la compagnie 4.22 Soit un métier où un fil se brise environ
peut se permettre 6 forages d’essais avant toutes les 10 heures en moyenne. La fabri­
d’abandonner l’exploration, quelle est la cation d’un certain type de tissu à l’aide de
probabilité que ce site soit sélectionné pour ce métier exige 25 heures. S’il faut 3 bris
l’exploitation ? de fil ou plus pour rendre le produit fini
4.19 Un lot de 25 téléviseurs doit subir un essai inacceptable, quelle est la probabilité qu’on
d’acceptation. On prélève 5 téléviseurs au obtienne un tissu de qualité satisfaisante ?
hasard, sans remise, et on les vérifie. Si 4.23 Le nombre de globules rouges par cellule
2 téléviseurs ou moins connaissent une de comptage de 4 mm2 sur une lamelle de
défaillance, on accepte le reste du lot. Dans microscope obéit à une loi de Poisson
le cas contraire, on refuse le lot. Supposez de moyenne 28.
ici que le lot renferme 4 téléviseurs a) Déterminez la probabilité qu’on observe
défectueux. exactement 28 globules rouges dans
a) Quelle est la probabilité exacte qu’on 1 cellule de comptage.
accepte le lot ?
b) Considérons 10 cellules de comptage
b) Quelle est la probabilité qu’on accepte indépendantes. Quelle est la probabilité
le lot selon la loi binomiale de qu’au moins 2 d’entre elles contiennent
paramètre p = ^ ? exactement 28 globules rouges ?
c) Si l’on avait un lot de 100 téléviseurs c) Déterminez la probabilité qu’on observe
au lieu de 25, la loi binomiale plus de 4 globules rouges sur une
donnerait-elle encore une approximation surface de 1 mm2.
satisfaisante ?
d) Si une lamelle contient 100 cellules
4.20 Une acheteuse reçoit des appareils de haute de comptage remplies de sang, déter­
précision en lots de 25. Elle veut s’assurer de minez la moyenne et la variance du
refuser 95 % du temps tout lot renfermant au nombre de globules rouges par lamelle.
Quelques lois de probabilité discrètes 133

4.24 Des équipes d’entretien en quête d’une c) Quelle loi de probabilité pourrait être
certaine pièce de rechange se présentent utilisée comme approximation de la loi
chaque jour à un local à outils selon une déterminée en a) ?
loi de Poisson de paramètre = 2. Or, d) Quelle est la valeur de la probabilité
on conserve normalement à cet endroit calculée en b) avec cette approximation ?
3 exemplaires de la pièce en question.
Si ce stock est épuisé, les équipes doivent 4.26 Un libraire reçoit chaque semaine 4 exem­
effectuer un long déplacement jusqu’au plaires d’un magazine. En moyenne.
magasin central. 3 clients se présentent par semaine à la
a) Quelle est la probabilité qu’une ou recherche d’un exemplaire du magazine,
plusieurs équipes aient à se rendre au et ce, selon un processus de Poisson. On
magasin central au cours d’une journée suppose que les exemplaires non vendus au
quelconque ? cours d’une semaine ne peuvent être vendus
b) Quelle est la demande quotidienne la semaine suivante.
moyenne de la pièce de rechange ? a) Quelle est la probabilité que le libraire
c) Quel est le nombre moyen d’équipes vende tous les exemplaires reçus du
d’entretien qu’on approvisionne chaque magazine au cours d’une semaine
jour au local à outils ? donnée ?
d) Quel est le nombre moyen d’équipes b) Quelle est la probabilité qu’au cours d’un
devant se rendre au magasin central ? mois (4 semaines), il y ait au moins une
semaine durant laquelle le libraire ne vend
e) En vous basant sur les valeurs de la
m

pas tous les exemplaires du magazine ?


table I de l’annexe, combien d’exem­
plaires de la pièce doit-on stocker au c) Déterminez la moyenne et la variance
local à outils pour pouvoir satisfaire à la du nombre d’exemplaires du magazine
demande de toutes les équipes d’entre­ vendus en une semaine.
tien 90 % du temps ? d) Déterminez la moyenne du nombre de
clients qui n’obtiennent pas un exem­
4.25 Une importante société d’assurance a plaire du magazine en une semaine.
découvert que 0,2 % de la population subit
des blessures causées dans un certain type 4.27 Tout véhicule a une probabilité de 0,0001
d’accident. Or, elle assure 15 000 personnes d’être impliqué dans un accident à une
contre un tel accident. On considère que ces intersection donnée. Or, 10 000 véhicules
personnes sont indépendantes les unes des traversent chaque jour cette intersection.
autres. a) Quelle est la probabilité qu’aucun
a) Quelle est la loi de probabilité du accident ne s’y produise ?
nombre de personnes à indemniser b) Quelle est la probabilité qu’il y sur­
en une année ? vienne 2 accidents ou plus ?
b) Quelle est la probabilité que la société c) Utilisez l’approximation de Poisson pour
reçoive 20 demandes d’indemnité l’an­ recalculer les probabilités demandées en
née prochaine pour ce type d’accident ? a) et en b).
« 1 < > * HM 1 < 'I ~Ÿ“ t* f Hh ^

+ * + >+ * i f **►
«4 ^ ^ r »i < »

*ous allons maintenant examiner quelques lois de probabilité continues:


la loi uniforme continue, la loi exponentielle, la loi gamma et la loi de
Weibull. Le chapitre 6 portera sur la loi normale et d’autres lois qui
lui sont étroitement liées. La loi normale est la plus importante de toutes les lois
de probabilité continues, d’où notre décision de lui consacrer tout un chapitre.

Comme nous l’avons mentionné au chapitre 2, l’image d’une variable aléatoire continue X est
formée d’un ou de plusieurs intervalles et implique une certaine idéalisation. Par exemple, les
instruments de mesure servant à déterminer la durée de fonctionnement avant défaillance d’un
composant électronique ou le temps nécessaire au traitement d’une commande ne peuvent générer
qu’un nombre fini de résultats possibles. Néanmoins, on suppose une situation idéale où la durée
ou le temps recherché peut prendre n’importe quelle valeur à l’intérieur d’un intervalle donné. Ici
encore, nous remplacerons f x(x) par f(x) et Fx(x) par F(x) pour simplifier la notation, lorsque cela
ne crée aucune ambiguïté.

5.1 La loi uniforme continue


La loi uniforme constitue le modèle le plus simple parmi les lois de probabilité continues. Cette
loi est défi nie dans un intervalle, et sa fonction de densité y est constante.

Fonction de densité de la loi uniforme continue


Une variable aléatoire continue X est dite «de loi uniforme dans l’intervalle [a, f i ] » si sa fonction de
densité est

si a < x < fi

sinon,

où a et fi sont des constantes réelles telles que En abrégé, on écrit X ~ U(a, fi).

La figure 5.1 montre deux représentations graphiques de la fonction de densité de cette loi.
Comme une variable aléatoire uniforme a une fonction de densité constante sur un
intervalle de longueur finie, la valeur de cette fonction doit nécessairem ent correspondre à
l ’inverse de la longueur de l ’intervalle pour vérifier la condition
Quelques lois de probabilité continues

J r f. v » ,r A ▼ ‘ / t ~ * w * A
La fonction de densité d'une variable de loi uniforme continue seion differentes
valeurs de paramètres

Une variable aléatoire uniforme représente l’équivalent continu de résultats équiprobables


en ce sens que pour tout sous-intervalle [a,b],oùa<a<b<J3,l& probabilité P (a < X < b) ne
dépend que de la longueur b - a. En effet,

Le fait de choisir au hasard un point de l’intervalle [a, p\ signifie tout simplement que la valeur
choisie, appelons-la Y, est uniformément distribuée sur [a, p\.

Fonction de répartition de la loi uniforme continue


L’équation 5.2 définit la fonction de répartition F(x) = P(X <x) d’une variable aléatoire uniforme, cette
fonction étant représentée graphiquement à la figure 5.2.
si x < a

.
J
]

La fonction de répartition d'une variable aléatoire de loi uniforme continue, pour


• »

les mêmes intervalles qu'à la fiqura 5.1


136 CHAPITRE 5

La moyenne et la variance de la loi uniforme continue


La moyenne de la loi uniforme se traduit par

soit le point milieu de l’intervalle [a, p] (ce qui est évident en raison de la sym étrie), et sa
variance, par

Exemple 5.1
On choisit au hasard un point de l’intervalle [0, 10]. Supposons qu’on veut déterminer la probabilité
que ce point se situe entre | et La variable aléatoire X a comme fonction de densité = ^ pour
0 < x < 10 et f(x) = 0 ailleurs. De ce fait, la probabilité recherchée correspond à l’aire du r
sous la densité, entre | et représentée par la surface en gris dans la figure 5.3a). On peut aussi cal­
culer cette probabilité avec la fonction de répartition, ce qui donne P(3/2 <X< 7/2) = F(1/2) —F(3/2)
= 7/20 —3/20 = 2/10. Les deux valeurs de l’équation sont mises en évidence dans la figure 5.3b).

a) La fonction de densité d'une loi 1/(0,10); b) la fonction de répartition


d'une loi 1/(0,10)

Exemple 5.2
Voici une méthode utilisée pour arrondir à l’entier le plus près les nombres de la forme N N,N. Lorsqu’un
nombre a une partie décimale inférieure à 0,5, on l’arrondit à l’entier inférieur par simple suppression
de la décimale. Lorsqu’il a une partie décimale supérieure à 0,5, on l’arrondit à l’entier supérieur, ce qui
donne \_NN, N\ + 1, où LJ représente la partie entière. Lorsque sa partie décimale égale exactement 0,5,
on lance une pièce en l’air pour déterminer si l’on arrondira le nombre à l’entier inférieur ou supérieur.
L’erreur d’arrondi, ici notée X,se définit comme la différence entre le nombre
sement. Elle obéit en général à une loi uniforme sur l’intervalle [-0,5, 0,5], autrement dit
1 si-0 ,5 <x <0,5
f(x)
0 smon.
Quelques lois de probabilité continues 137

Exemple 5.3

Une variable U est dite «uniforme sur [0, 1] » dans le cas particulier où = 0 et /?= 1. En recourant
aux équations 5.3 et 5.4, on obtient E(U) = x et V(JJ) = s* 1 m

5 .2 La loi exponentielle
Fonction de densité de la loi exponentielle
Une variable aléatoire continue X est dite «de loi exponentielle de paramètre 1
V
V V
~ *
O
V/ J
1

densité est de la forme


Xe Kx six > 0
f(x) (5.5)
0 sinon,

où le paramètre X est un nombre réel positif. En abrégé, on écrit X ~ Exp(A).

La figure 5.4 montre deux représentations graphiques de la fonction de densité de cette loi.
/

i
i

t
!

i
t

• - j .
aa
- . ~ *
La fonction de densité d'une variable de loi exponentielle, pour deux valeurs
du paramètre X

Afin de démontrer que f(x) constitue bel et bien une fonction de densité, soulignons que
f(x) > 0 pour tout x (car X > 0) et que
-kx - kx
f °°Xe dx e 1.
Jo o

Fonction de répartition de la loi exponentielle


On obtient la fonction de répartition d’une variable exponentielle en intégrant la fonction que définit
l’équation 5.5, d’où

0 six < 0
FU) Ax
(5.6)
Xe~h dî 1 six > 0.
o

La figure 5.5 (voir à la page suivante) montre deux représentations graphiques de cette
fonction.
CHAPITRE 5

La fonction de répartition d'une variable de loi exponentielle, pour les mêmes


valeurs du paramètre A qu'à la figure 5.4

La relation entre la loi exponentielle et la loi de Poisson


Il existe un lien étroit entre la loi exponentielle et la loi de Poisson. La compréhension de cette
relation aide en général à reconnaître les types de situations qu’on peut représenter par une loi
exponentielle.
Au moment d’énoncer la loi de Poisson à partir des postulats de Poisson et de la définition du
processus de Poisson, on a attribué au temps une valeur fixe t et établi la fonction de masse
du nombre de réalisations d’un événement à l’intérieur de l’intervalle [0, /]. Cette variable
aléatoire, notée X , avait pour fonction de masse
si x = 0, 1, 2, . . .
sinon.

La probabilité que l’événement ne se produise pas à l’intérieur de l ’intervalle [0, se


traduit par
p(0) = e~Xî.(5.8)
Comme on avait initialement attribué au temps une valeur fixe t, on peut aussi envisager
p{0) = e~Xt comme la probabilité que le temps d’attente avant la première réalisation de l’évé­
nement soit plus long que t. Si l’on représente ce temps d’attente par la variable aléatoire T,
on peut écrire
p{0) = P(T > t) —e~Xt, t> 0. (5.9)
Permettons maintenant au temps de varier et faisons de la variable aléatoire T le temps
d’attente avant la réalisation de l’événement. On a alors
Xt
l —e si t > 0
F(t) = P (T < t) (5.10)
0 si t < 0

Et puisque/(/) = F'(t), on obtient la fonction de densité


-Xt
Xe si t > 0
m < (5.11)
0 si / < 0,
c e qui correspond à la densité d ’une variable exponentielle ( 5 .5 ).
Quelques lois de probabilité continues 139

Par conséquent, on peut décrire comme suit la relation entre la loi exponentielle et la loi
de Poisson : si le nombre de réalisations d’un événement obéit à une loi de Poisson conformé­
ment à l’équation 5.7, alors le temps d’attente entre deux réalisations successives obéit à une
loi exponentielle, conformément à l’équation 5.11. Soit, par exemple, le nombre de commandes
qu’une entreprise reçoit chaque semaine. Si ce nombre obéit à une loi de Poisson, le temps
d’attente entre la réception de deux commandes obéit à une loi exponentielle. On a ici deux
variables, l’une discrète (le nombre de commandes) et l’autre continue (le temps d’attente),
dont les distributions reposent sur le même phénomène.

La moyenne et la variance de la loi exponentielle


La moyenne de la loi exponentielle est donnée par
-kx -Xx
E(X) [ x dx xe'**\ + e dx MX. (5.12)
Jo 0
Ainsi, lorsque X = 2 événements se produisent en moyenne par intervalle de temps (disons par
heure), il faut en moyenne MX = 1/2 heure pour observer un premier événement.
La variance est définie par
V(X) \ x 2Xe- Xxdx-{MX)2
J0

- x 2e~u °°+ 2 xe~Xx dx 2 MX2. (5.13)


0 Jo (l/A)

La loi exponentielle a un écart-type de MX, une valeur égale à sa moyenne.

Exemple 5.4
Soit un composant électronique dont on peut représenter la durée de vie utile (X) par une fonction de den­
sité exponentielle indiquant un taux de défaillance de 10-5 à l’heure (c’est-à-dire X= 10~5), d’où une durée
moyenne de fonctionnement avant défaillance, E(X), de l/X= 105heures. On veut déterminer la proportion
des composants de ce type qui feront défaut avant d’avoir atteint leur durée de vie moyenne ou prévue, soit
( n P /A
l , l/A -i
A

P X <- [ Xe dx - 1- e
1
1

l x ) Jo o
0,632.
Le résultat sera le même pour toute valeur de X supérieure à zéro. Dans cet exemple, 63,2 % des
composants fonctionneront moins de 105heures avant de connaître une défaillance (voir lafigure 5.6).
/ ' 1

f(x)
îr

X six > 0 I

fix) =
il

sinon
o

0,632
0.368 *
*

0 \ 1 X
EÇC)
X
La moyenne d'une variable de loi exponentielle
140 CHAPITRE 5

Exemple 5.5
On hésite entre deux procédés pour la fabrication d’un composant. Le coût de revient à l’unité sera de
100 dollars si l’on choisit le procédé Aet de £• 100 dollars (où £ >
deux procédés génèrent des composants dont la durée de fonctionnement avant défaillance obéit à une
101 exponentielle, mais le procédé Aprésente un taux de défaillance de 1/200 à
un taux de défaillance de 1/300 à l’heure. Les composants fabriqués selon le procédé A ont ainsi une du­
rée de vie moyenne de 200 heures et ceux qui sont fabriqués selon le procédé B (plus chers), une
durée de vie moyenne de 300 heures.
Or, une clause de garantie oblige le fabricant à verser une indemnité de 50 dollars pour tout composant
qui fonctionne moins de 400 heures avant de connaître une défaillance. Si X représente la durée de
fonctionnement avant défaillance de chaque composant, on peut noter les coûts comme suit :

100 siX >400


CA
150 si X <400

et

k* 100 si X > 400


CB
£•100 + 50 si X < 400.
Pour quelle valeur du facteur multiplicatif k le procédé B devient-il avantageux à long terme ?
Les coûts moyens s’établissent ainsi à
c*400 1 - x / 2 0 0 1 - x /2 0 0
E(Ca) 150 [ e dx + 100 Jf* e dx
Jo 200 400 200
400
-x /2 0 0 -x/200
150 e + 100 e
0 400

100 + 50(l-éT2)
et à
f 400 1
- jc/300 1 - jc/300
E(Cb) = (£*100 + 50) e dx + k 100 Jf* e dx
300 400 300
£•100 + 50(1 - e-4'3).

On peut s’attendre à ce que le fabricant opte pour le procédé B si E(CB) < E(CA). Cela survient lorsque
50 -2 -4/3
£< 1 (e e ) 1,0641. Il faudrait donc que le coût de revient de B soit inférieur à 106,41 $.
100

L'absence de mémoire de la loi exponentielle


La loi exponentielle présente une propriété intéressante qui la distingue des autres lois de pro­
babilité continues, son absence de mémoire. En effet, pour tout jc > 0, et 0,
P( X > x + s)
P(X>x +s \X > x )
P( X > x)
e
-Â x e'**,
e
de sorte que
P ( X > T + 5 | X > JC ) = P ( X > 5 ) . (5.14)
Quelques lois de probabilité continues 141

À titre d’illustration, soit un tube cathodique dont la durée de fonctionnement avant défail­
lance obéit à une loi exponentielle. Si ce tube fonctionne encore après 1000 heures, sa durée
de fonctionnement avant défaillance obéira alors à la même loi exponentielle qu’au moment de
la mise en marche du tube. Autrement dit, la probabilité qu’il cesse de fonctionner durant la
prochaine heure est la même que la probabilité de cesser de fonctionner durant l’heure suivant
sa mise en marche.
Cette propriété d’absence de mémoire (ou de «non-vieillissement») indique que la loi
exponentielle ne tient pas compte de la fatigue ni de l’usure. Par conséquent, cette loi doit être
utilisée avec prudence dans la pratique si on veut modéliser la durée de fonctionnem ent (ou de
vie) d’un composant.

Exemple 5.6
Considérons un détecteur de mouvement activé en moyenne toutes les 6 minutes par un passant. Le
temps écoulé entre deux passants suit donc une loi exponentielle de paramètre A= 1/6, dont la densité
est illustrée à la figure 5.7.
La probabilité que le prochain passant à générer un signal arrive dans plus de 4 minutes correspond à
la surface A de la figure 5.7a), et se calcule ainsi :
—(l/6 )(4 )
P(X > 4) = 1- F(4) = 0,513.

Supposons que personne n’est passé depuis 6 minutes. Quelle est la probabilité qu’aucun passant n’active
le détecteur d’ici les 4 prochaines minutes ? Autrement dit, quelle est la probabilité qu’un intervalle
de 10 minutes s’écoule sans passant, sachant que rien n’a été détecté dans les 6 premières minutes ?
P(X > 10 |X > 6) correspond au rapport des surfaces C/(B + C) de la figure 5.7b), et se calcule ainsi :
-0/6X 10)
P(X > 10) _ g -0 /6 X 4 )
P(X>10 X > 6) -0/6 X 6 )
e 0,513.
P(X > 6) “ e

Le fait que personne ne soit passé dans les 6 premières minutes ne change donc rien à la probabilité
que quelqu’un passe dans les 4 prochaines minutes. Voilà pourquoi on parle d’absence de mémoire
pour la loi exponentielle.

m A
0, 2 -

4 8 12 16 20 x \
t

a) P(X > 4) b) P(X> 10 | X> 6) = Cl{B + C)


La densité de la loi exponentielle de paramètre A = 1/6
142 CHAPITRE 5

5.3 La loi gamma


La fonction gamma
O n définit la loi de probabilité gam ma à partir de la fonction gam m a (représentée par la lettre
grecque T), soit

pour a0.

L ’intégration par parties de cette fonction met en lumière une im portante relation récursive:
T(a) = ( a - 1) T ( a - 1). (5.16)
Lorsque a est un nombre entier positif n, on a
r(n ) = ( n - 1)!, (5.17)

puisque T (l) = J e~x d x = 1. La fonction gamma constitue donc une géné


torielle. Les valeurs de la fonction gamma en certains points particuliers sont connues. Par
exemple, il est démontré que

La fonction de densité de la loi gamma

Fonction de densité de la loi gamma


Une variable aléatoire continue X est dite «de loi gamma de paramètres
* . ■ . . i •• ‘ ® ' — —* • ■■ * « * . ' a. . _ ,® • .* * ' « '
et ..
si sa fonction de
densité est de la forme

sinon,
où r > 0 et X>0. En abrégé, on écrit X Gamma(r, A).

On qualifie généralement le paramètre r de « paramètre de form e » et le param ètre A de


«param ètre de dispersion». La figure 5.8 montre la courbe de quelques fonctions de densité
gam m a ayant des paramètres différents.

La fonction de répartition de la loi gamma

Fonction de répartition de la loi gamma



. . .
>
®® . ' •. ** #» ®
.
®,
— .
. /
»
. * . .
• *
,
. .
••
. »
i
/ s
*

Voici la fonction de répartition d’une variable X ~ Gamma(r, A) :

si jc < 0

si x > 0.

Lorsque r est un nombre entier positif, on peut intégrer cette fonction par parties, ce qui donne
Quelques lois de probabilité continues 143

0 si x < 0
FtX) < /•-1 (5.21)
1 e (Ax)k/k\ si x 0>,
Jt=0

moins la somme des r premiers V Uli


une variabl /%
«

rm Iv
%

suit une loi de Poisson de paramètre Ax.On peut donc évaluer la fonction de rép
f L iL / 9 v

gamma répartition

0, 2 -

b) r = 5,A= 1 d) r = 5, A= 1/2

Quatre fonctions de densité gamma de paramètres différents

La relation entre la loi gamma et la loi exponentielle


Il existe un lien étroit entre la loi exponentielle et la loi gamma. En effet, lorsque r — 1, la loi
gamma se réduit à la loi exponentielle. Toute variable aléatoire X qui représente la somme de
r variables aléatoires indépendantes obéissant chacune à une loi exponentielle de paramètre A
constitue en fait une variable gamma de paramètres r et A. En d’autres termes, si
F = X, + X2H----- 1-X, (5.22)
où X est une variable de loi exponentielle (A) indépendante des autres, alors Y ~ Gammafr. A).
144 CHAPITRE 5

Im aginons un contexte où des événements surviennent à un taux moyen constant, par exemple,
des patients se présentant à l’urgence d’un hôpital au rythm e moyen de 10 patients par heure.
On pourrait définir plusieurs variables aléatoires à partir de ce contexte, par exemple les trois
suivantes :
W= nombre de patients qui arrivent en une heure ~ Poisson(X 10);
X temps écoulé entre l’arrivée de deux patients Exp(A 10);
Y temps écoulé jusqu’à l’arrivée de cinq patients ~ G am m a(r 5, 10)
On utilise parfois le terme « loi d ’Erlang» pour désigner le cas particulier où r est un
nombre entier positif.

La moyenne et la variance de la loi gamma


On peut démontrer que la moyenne de la loi gamma se traduit par

E{X) = (5.23)
et sa variance, par
V(X) = (5.24)
Ces deux équations s’appliquent, que r soit ou non un nombre entier. Si r est un nombre
entier, il suffit d’adopter l’interprétation où X est une somme de r variables exponentielles indé­
pendantes pour découvrir que
E
(X=) E ( X l) + •••+ r • 1/X =
et que
V( X) = V ( X l)+ ■■■+ V ( X r) = r • 1/A2 = r / X 2.

Exemple 5.7
Soit le système redondant présenté à la figure 5.9. Au début, l’élément 1 est en fonction, tandis que les
éléments 2 et 3 sont en attente. Dès que l’élément 1 connaît une défaillance, le commutateur active
l’élément 2. Lorsque ce dernier tombe en panne à son tour, le commutateur active l’élément 3. On
suppose que le commutateur effectue parfaitement son travail, ce qui permet d’envisager la durée de
vie X du système comme la somme de la durée de vie de ses trois éléments, d ’où X = X t + X2 + Xy

j Élément 1 b n

Élément 2


Élément 3

Un système à redondance passive

Si la durée de vie de chaque élément (en jours), soit X., pour = 1, 2, 3, est indépendante de celle des
autres et présente une densité exponentielle (X = 0,01), alors X est une variable gamma de paramètres
r = 3 et X = 0,01 et sa fonction de densité est ►
Quelques lois de probabilité continues 145

0,01 2 _-0,0l*
(0,0lxYe si x > 0
/(*) 2!
0 sinon.
Puisque chaque élément a une durée de vie exponentielle de paramètre X - 0,01, la durée moyenne est
de 100 jours.
La durée de vie du système est la somme des durées de vie des éléments individuels, donc il dure en
moyenne 300 jours. Son écart-type est égal à V3/0,01 = 173,2 jours.
La probabilité que le système fonctionne pendant au moins x jours, notée /?(*), porte le nom de « fonc­
tion de fiabilité ». Dans le présent cas, cette fonction se traduit par
-0,01J /r\ n i ,.\k
R(x) 1- F e (0,01x)/&!
4 =0

e-0,01* [l + (0,01*) + (0,01*)2/2l.


Ainsi, la probabilité que le système fonctionne pendant au moins un an est
-0 ,0 1 (3 6 5 ) [0,01(365)]
Æ(365) = e 1+ 0,01(365) + 0,294.
2

La loi de Weihull
La loi de Weibull constitue une excellente approximation de la loi de probabilité de nombreuses
variables aléatoires. On l’utilise entre autres fréquemment pour modéliser la durée de fonction­
nement avant défaillance d’éléments et de systèmes électriques ou mécaniques.

Fonction de densité de la loi de Weibull


Une variable aléatoire continue X est dite «de loi de Weibull de paramètres (lettres grecques
gamma, bêta et delta minuscules)» si sa fonction de densité est de la forme

si * > y

sinon.

où p > 0, ô > 0 et —oo < y < °o. En abrégé, on écrit X ~ Weibulfi)' (5, ô).

Lorsqu’on attribue aux trois paramètres une valeur appropriée, la loi de Weibull fournit
une très bonne approximation de la loi de probabilité de nombreux phénomènes expérimentaux.
• Le paramètre p est un param ètre de forme. Lorsqu’il est inférieur à 1, il fait réference
à un taux de panne décroissant, idéal pour modéliser les défaillances précoces. Lorsqu’il
est supérieur à 1, la densité correspond à un taux de panne croissant, comme dans les phé­
nomènes de vieillissement ou d’usure. On modélise alors la fin de vie utile d’un produit
• Le paramètre ô est un param ètre de dispersion, ou d’échelle. Plus il est élevé, plus la
variance est grande.
• Le paramètre /constitue un param ètre de position. Les valeurs possibles de * sont
supérieures à /
146 CHAPITRE 5

La figure 5.10 montre la courbe de la fonction de densité d’une variable de Weibull pour
différentes valeurs de paramètres.

b) 7 = 0,/?= 1/2, ô = l d) 7 = 0,/?= 5, =2

■ /
Quatre fonctions de densité de la loi de Weibull avec différentes valeurs de paramètres

(5.26)
? —•

>

La relation entre la loi de Weibull et la loi exponentielle


Lorsque y - 0 et J3= 1, la loi de Weibull se réduit à une loi exponentielle de paramètre À = VS.
On parle alors d’un taux de panne constant. Bien que la loi exponentielle constitue à la fois un
cas particulier de la loi gamma et de la loi de Weibull, ces deux dernières lois ne sont généra­
lement pas interchangeables.
Quelques lois de probabilité continues 147

La moyenne et la variance de la loi de Weïbufl


On peut démontrer que la moyenne de la loi de Weibull se traduit par

et sa variance, par

Exemple 5.8
Un certain sous-ensemble électronique a une durée de fonctionnement avant défaillance (en heures)
qui obéit à une loi de Weibull de paramètres y = 0, 100. Par conséquent, on s’attend
à ce que la proportion des sous-ensembles qui fonctionnent encore au bout de 400 heures soit égale à

1 - F(400) = e~'m m = 0,135.


La durée moyenne de fonctionnement avant défaillance est ici de
E(X) = 0 + 100(2) = 200 heures.

Exemple 5.9
Berrettoni (1964) a énuméré un certain nombre d’applications de la loi de Weibull. Voici quelques
exemples de processus naturels obéissant à une loi de probabilité dont la loi de Weibull fournit une très
bonne approximation. La variable aléatoire est notée X dans chaque cas.
1. La résistance à la corrosion de tôles en alliage de magnésium.
X : la perte de poids (en 10*
21543mg/[cm2][jour]) attribuable à la corrosion lorsqu’on plonge les tôles
dans une solution aqueuse à 20 % de MgBr2avec inhibiteur.
2. Les marchandises retournées, classées selon le nombre de semaines qui séparent l’envoi de ces
marchandises de leur retour.
X: le temps écoulé (en 10-1 semaines) entre le moment où l’on expédie un article et celui où le
client le retourne parce qu’il est défectueux.
3. Le nombre de temps d’arrêt par quart de travail.
X : le nombre de temps d’arrêt par quart de travail (multiplié par 10-1) dans le cas d’une chaîne
de montage continue, complexe et automatisée.
4. L’apparition de fuites dans des piles sèches.
X: l’âge des piles (en années) au moment où celles-ci commencent à fuir.
5. La fiabilité de condensateurs.
X : la durée de vie utile (en heures) de condensateurs au tantale de 3,3 pF et de 50 V à
température ambiante C, sachant que la tension nominale est de 33 V.
T ' A '

• » « i v i* ■ ï . - I * ____

R ésum é £
00
Lois de probabilité continues 0
1
>
T>
n * X r

v v • ’r . ^

'S J

r • # ;: . j s s » / y

DD
> * | ç # ,v

^ rare rares?%»?irâ&r<tvff m
en
Temps Uniforme
d'attente d'un
phénomène
régulier

Temps avant | Exponentielle


le prochain
événement

Temps avant Gamma


le r-ième (r.A) » /»

événement
♦ V

Durée de de Weibull
vie avant (y, <5, 0)
défaillance

Fonction gamma
oo
a-\ -x
r(a) x e dx, et T(n) si n est entier.

Somme de variables exponentielles

Si X,,. . X ~ Exp(A) indépendantes, alors X, + X2+ ••• + X ~ Gamma(r, A).


Quelques lois de probabilité continues 149

/ ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
5.4 Une agente immobilière exige un tarif fixe
Pour tous les exercices qui s’y prêtent :
•>

de 500$ et une commission égale à 4 %


1) définissez clairement la variable aléatoire du montant de la vente de l’immeuble. En
utilisée ; supposant que ce montant est uniformément
distribué entre 200 000 $ et 600 000 $, déter­
2) déterminez la loi qui s’applique et la valeur
minez l’espérance et la variance du total des
des paramètres de celle-ci ;
honoraires de l’agente.
3) puis calculez la quantité demandée.
5.5 Soit X une variable de loi uniforme
symétrique par rapport à 0 et de variance 1.
5.1 On choisit au hasard un point du segment Déterminez la valeur anorooriée
AA A
de a et
de droite [0,4]. de p.
a) Quelle est la probabilité que ce point se
situe entre 0,5 et 1,75 ? 5.6 Une machine sert à la production en
série de rondelles dont l’épaisseur (en
b) Supposons qu’on réalise cette expé­
millimètres) X varie uniformément dans
rience aléatoire un très grand nombre
l’intervalle [5,7]. Supposons que pour une
de fois, en notant le résultat chaque fois. 9 - *

application particulière, une rondelle est


Quelle sera la moyenne approximative
de toutes ces valeurs ? Quel en sera considérée comme étant conforme si son
l’écart-type approximatif? épaisseur (en millimètres) se situe dans
l’intervalle [5,02,6,98].
c) Y a-t-il autant de chances que le nombre
a) Déterminez la moyenne et l’écart-type
choisi soit inférieur à l’espérance que
supérieur à l’espérance ? de l’épaisseur des rondelles de cette
production.
5.2 Le cours d’ouverture d’un certain titre boursier b) Quelle est la probabilité qu’une rondelle
est distribué uniformément entre 35 $ et 45 $. prise au hasard dans la production soit
a) Déterminez la fonction de répartition du conforme ?
cours d’ouverture. c) Supposons que le contrôle de la qualité
b) Quelle est la probabilité, peu importe le consiste à examiner une rondelle de
*
§

jour, que ce cours soit inférieur à 41 $ ? la production chaque demi-heure.


c) Sans faire le calcul, pouvez-vous dire si Déterminez la moyenne et l’écart-type
l’écart-type du cours d’ouverture de ce (en minutes) du temps nécessaire pour
titre est supérieur à 10$ ? observer une première rondelle non
conforme.
5.3 Déterminez si les énoncés suivants sont
vrais ou faux. d) Les rondelles de la production sont
expédiées aux clients dans des boîtes
a) Si X~ 1/(2,10), alors > 4)
de 50. On considère une boîte de
= P(X< 8).
rondelles prise au hasard.
b) Si X ~ U{0,4), alors P(X > 4 |X > 1)
i) Quelle est la probabilité que la boîte
= P(X > 4).
contienne moins de 3 rondelles non
c) Si X ~1/(1, 5), alors > 4 |X > 2) conformes ?
= P(X > 2). %

ii) Déterminez la moyenne et l’écart-


d) Deux variables aléatoires suivant des type du nombre de rondelles non
lois uniformes de paramètres différents conformes de la boîte.
peuvent avoir la même espérance sans
avoir la même variance. 5.7 Soit la variable aléatoire X uniforme sur
e) Deux variables aléatoires suivant des l’intervalle [-1,3].
lois uniformes de paramètres différents a) Quelle est la probabilité que l’équation
peuvent avoir la même variance sans y2+ 4y + X= 0 possède des racines
avoir la même espérance. réelles ?
150 CH APITRE 5

b) Quelle est la probabilité que l’équation 5.10 On considère que la durée de vie (en jours)
y2 + 4Xy + 1 = 0 possède des racines d’un type de pile est une variable X dont la
réelles ? fonction de répartition est donnée par
c) Quelle est la probabilité que l’équation r

y2 + 4Xy+ X = 0 possède des racines si x > 0


F(x) = <
réelles ? sinon,
5.8 Le groupe motopropulseur d’un véhicule où k est une constante positive.
neuf comporte une garantie de 1 an. On
On sait de plus que 40 % des piles de ce type
estime sa durée de vie moyenne à 3 ans. Sa
fonctionnent pendant au moins 23 jours.
durée de fonctionnement avant défaillance
obéit à une loi exponentielle. a) Déterminez la valeur de la constante k.
& *

a) Quel'pourcentage des véhicules connaî­ b) Déterminez la moyenne et la variance


tront une défaillance du groupe moto- de la durée de vie de ce type de pile.
propulseur au cours de leurs 6 premiers c) Dix piles de ce type sont mises en service
mois d’utilisation ? et fonctionnent indépendamment les
b) Le concessionnaire réalise un bénéfice unes des autres. Quelle est la probabilité
de 1000 $ à la vente d’un véhicule neuf. que 20 jours plus tard, au moins 9 piles
Il doit cependant débourser 250 $ pour fonctionnent encore ?
les pièces et la main-d’œuvre si une 5.11 On estime que la durée de fonctionnement
défaillance survient durant la période avant défaillance d’un certain type de tube
de garantie. Si on suppose que, pour cathodique obéit à une loi exponentielle et
chaque véhicule vendu, le concession­ est en moyenne de 3 ans. Une entreprise
naire honore sa garantie une seule offre une assurance contre toute défaillance
fois, quel est son bénéfice moyen par de ces tubes durant leur première année
véhicule ? d’utilisation.
5.9 En vous aidant du graphique de la fonc­ a) À quel pourcentage de ses assurés
tion de densité de la loi exponentielle de l’entreprise devra-t-elle verser une
paramètre X = 1/5 présenté ci-dessous, indemnité ?
et sans faire de calcul, déterminez si les b) Quel est l’écart-type de la durée de
deux probabilités proposées à chaque fonctionnement avant défaillance ?
énoncé sont égales. Sinon, identifiez la 5.12 Soit des écrans à usage commercial dont
plus grande. le fabricant garantit le tube cathodique
pour une période de 1 an (8760 heures).
Ces écrans servent à afficher l’horaire des
vols dans les aérogares, et on ne les éteint
jamais. Leurs tubes durent en moyenne
20 000 heures, et leur durée de fonctionne­
ment avant défaillance obéit à une loi expo­
nentielle. Le fabricant débourse 300 $ pour
assembler, vendre et livrer un écran vendu
«

a) P(X > 5) ou P(X < 5) 400 $. Il lui en coûte 150 $ pour remplacer
tout tube défectueux. Le fabricant n’est
b) P(X> 1/5) ou P(X< 1/5) cependant pas tenu de remplacer plus d’une
c) P(X>5)ouP(X>5\X>2) fois le tube d’un même écran.
d) P(0 < X < 2) ou P(1 <X<3) a) Comment le bénéfice se définit-il en
e) JP ( A ' > 5 | X > 4 ) o u / >( X > 5 | X > 1) fonction de la durée de vie d ’un écran?
f) X
(P >5 |X > 3) ou P(X >1\ b) Quelle est la fonction de masse du
g) P(X >5 \X>4) ou P(X >1) bénéfice ?
Quelques lois de probabilité continues 151

c) En moyenne, à quel bénéfice le fabricant 20 000 heures. Or, un tel transistor, utilisé à
peut-il s’attendre? une fin particulière, fonctionne déjà depuis
20 000 heures. Quelle est la probabilité qu’il
5.13 Existe-t-il une loi exponentielle pour fonctionne moins de 30 000 heures au total ?
laquelle la condition suivante s’applique?
5.17 Un traversier se met en route dès que 10 véhi­
P(X<2) = - P(X>2) cules sont à son bord. On sait que les véhicules
Si oui, déterminez la valeur de A. arrivent au quai de façon indépendante, à
un rythme moyen de 7 à l’heure.
5.14 Le temps de traitement d’un appel dans un
a) Déterminez la loi de probabilité du temps
certain service public suit une loi exponen­
écoulé entre deux traversées consécutives.
tielle de paramètre A. On sait que 90 % des
appels sont traités en moins de 5 minutes. b) Quel est le temps moyen écoulé entre
deux traversées et quel est son écart-type ?
a) Quel est le temps moyen de traitement
d’un appel? c) Vous êtes passager dans la neuvième
voiture qui vient tout juste d'embarquer
b) Quel est le temps médian d’un appel, sur le traversier. Quelle est la probabilité
c’est-à-dire le temps t tel que 50 % des
que le départ se fasse d’ici 15 minutes ?
appels sont traités en moins de minutes ?
c) Sachant que vous discutez avec un agent 5.18 Une boîte renferme 24 friandises. L’inter­
depuis 3 minutes, quelle est la proba­ valle entre les moments où l’on vend l’une
bilité que votre appel dure encore au de ces friandises obéit à une loi exponen­
moins 3 autres minutes ? tielle et est en moyenne de 10 minutes.
a) Combien faut-il de temps en moyenne
5.15 On hésite entre deux procédés de fabrica­
pour vendre le contenu d’une boîte ?
tion. Le procédé I entraîne un coût unitaire
fixe de C $ et le procédé II, un coût unitaire b) Comment calcule-t-on la probabilité que la
de 3C $. Qu’on utilise un procédé ou l’autre, boîte soit vide à 12 h si on l’a ouverte à 8 h ?
la durée de fonctionnement avant défail­ 5.19 Associez chacun des graphiques ci-dessous
lance des articles fabriqués obéit à une loi à une des distributions proposées dans la liste.
exponentielle. Toutefois, on obtient un taux
moyen de 1/25 défaillance à l’heure avec 1) U(0, 50) 5) Gamma(r = 1, A = 3)
le procédé I et de 1/75 avec le procédé II. 2) U{-50, 50) 6) Gamma(r = 1, A = 1/3)
En outre, on doit remplacer tout article qui
connaît une défaillance avant d’avoir fonc­ 3 ) Exp(A=l/7) 7) Gamma(r = 6, A = 2)
tionné 15 heures, et ce, au coût de 5 $. 4)Exp(A=7) 8 )Gamma(r= 6, A - 1/2)
a) Complétez la définition du coût selon les
deux procédés :
C si...
C +5 si...

3C si...
3C + 5 si...
b) Quel est le coût unitaire moyen de
chaque procédé ?
c) Pour quelle valeur de C le procédé I est-
il préférable au procédé II ?
5.16 La durée de fonctionnement avant défail­
lance d’un certain transistor obéit à une
loi exponentielle et est en moyenne de
CHAPITRE 5

5.20 Une compagnie produit des cartes la moyenne est de 40 jours et la variance,
graphiques en silicone. Ces cartes sont de 400jours2. Déterminez la probabilité de
constituées de 100 composants qui fonction­ recevoir ce produit dans un délai de
nent indépendamment les uns des autres, 20 j ours après 1’avoir commandé.
chacun d’eux ayant 1 chance sur 1000
5.23 Déterminez si les énoncés suivants sont vrais
d’être défectueux. Certaines cartes
défectueuses sont tout de même vendues. ou faux.
On suppose que les réparateurs de la a) La loi Gamma(r = 1, 8) est équiva­
compagnie réparent en moyenne une carte lente à la loi Exp(= 1/8
par 2 heures, et ce, selon un processus de b) Si X~Gamma(r = 3,= 10) et
Poisson. On suppose que ce taux est cons­ Y ~ Gamma(r = 5, A = 10), et si X et Y
tant durant les heures d’ouverture. sont indépendantes, alors
a) Quelle est la probabilité qu’une carte X + Y ~ Gamma(r = 8, A = 10).
soit défectueuse ? c) SiW ~ U(.2, 4) et T ~ Exp(/l = 3),
b) Quelle est la probabilité qu’on répare alors W et T ont la même valeu
au moins 4 cartes dans les 6 prochaines moyenne théorique.
heures ? d) Si R ~ Exp(A = 10) et
c) Vous vous présentez à la boutique à 8 h H ~ Gamma(r = 2, = 10), alors une
pour faire réparer votre carte graphique valeur de R choisie au hasard sera tou­
et vous êtes le premier client. Quelle est jours inférieure à une valeur de H choi­
la probabilité que votre carte soit réparée sie au hasard.
en moins de 1 heure ? e) Si X suit une loi exponentielle de
d) Supposons qu’il est maintenant 16 h 30. paramètre A = 4, alors il y a autant
Vous appelez à la boutique et on vous dit de chances qu’une valeur de X choisie au
que votre carte n’est toujours pas prête. hasard soit inférieure à 1/4 que supé­
Quelle est la probabilité que vous ne rieure à 1/4.
puissiez pas récupérer votre carte réparée f) Si on suppose que la durée de vie des
avant 17 h 30 ? ampoules suit une loi exponentielle,
e) Quelle est la distribution du temps alors une ampoule neuve a autant de
nécessaire à la réparation de 5 cartes chances de cesser de fonctionner dans la
graphiques ? prochaine heure qu’une ampoule utilisée
depuis 500 heures.
5.21 La durée de vie utile d’un système électro­
g) Dans un certain département d’urgence,
nique correspond à Y =Xx+ X2+ X3+ X4, les patients arrivent à un rythme moyen
c’est-à-dire à la somme de la durée de vie
de 12 personnes par heure. On pourrait
utile de ses composants. Chaque compo­
modéliser le temps écoulé entre l’arrivée
sant est indépendant des autres. La durée
de deux patients (en heures) par une loi
de fonctionnement avant défaillance d’un
exponentielle de paramètre A = 1/12.
composant obéit à une loi exponentielle, et
le temps moyen entre les pannes est de 5.24 La loi bêta se traduit par la fonction
4 heures. de densité
a) Combien de temps en moyenne le sys­
tème fonctionne-t-il ? /(*) = ! si0^Sl.A>0,r>0
b) Quel est l’écart-type du temps de fonc­ 0 sinon.
tionnement du système ?
c) Que deviendraient l’espérance et l’écart-
a) Montrez que la loi bêta se réduit à la loi
type du temps de fonctionnement si on uniforme lorsque = 1.
utilisait 5 composants au lieu de 4 ?
* ' • • > ' - * ' • . • • ,
b) Montrez que la loi bêta a une fonction de
- . > -

5.22 Le délai de réapprovisionnement pour un densité de forme triangulaire lorsque


produit donné obéit à une loi gamma dont A = 2 et r = 1, et lorsque A —1 et r = 2.
Quelques lois de probabilité continues

c) Montrez que la loi bêta se réduit à une a) Quelle est la probabilité qu’une telle pile
loi parabolique lorsque = 2. fonctionne plus de 700 heures ?
5.25 Soit des tiges en acier dont le diamètre b) Quelle est la probabilité qu’une pile dure
(en cm) obéit à une loi de Weibull de para­ plus de 700 heures avant que les métaux
mètres y = l, fi = 2 e t ô = 0,5. Déterminez coulent, sachant qu’elle est en fonction
la probabilité que le diamètre d’une tige depuis 600 heures ?
choisie au hasard ne dépasse pas 1,5 cm. c) Quelle est la probabilité qu’une pile
fonctionne durant plus de 100 heures
5.26 Soit des transistors dont la durée de avant de commencer à fuir?
fonctionnement avant défaillance (en d) Si la distribution du temps avant une
heures) obéit à une loi de Weibull de para­ fuite était exponentielle de même
mètres y =0, fi= 1/3 et = 400.
moyenne que la loi de Weibull spécifiée
a) Quelle proportion de ces transistors (environ 625 heures), que deviendraient
peut-on s’attendre à voir fonctionner les probabilités calculées en a), b) et c) ?
au moins 600 heures ? À la lumière de ces comparaisons, lequel
b) L’espérance de vie des transistors serait- des deux modèles semble le mieux tenir
elle supérieure ou inférieure à celle de la compte de l’usure des matériaux ?
loi décrite...
5.28 Soit de petits systèmes informatiques
i) si /? = 1 au lieu de /? = 1/3 ?
dont la durée de fonctionnement avant
ii) si ô=600 au lieu de 400 ? défaillance (en heures) obéit à une loi
iii) si y = 100 au lieu de 7 = 0? de Weibull de paramètres = 0, /? = 1/4
5.27 On s’attend à ce que le temps écoulé et ô = 200.
(en heures) avant qu’un certain type de a) Quelle proportion de ces systèmes fonc­
pile sèche se mette à fuir obéisse à une loi tionnera au moins 1000 heures ?
de Weibull de paramètres = 0, = 3 et b) Quelle est la durée moyenne de fonc­
<5= 700. tionnement avant défaillance ?
s. chapitre porte sur la loi norm ale, qui revêt beaucoup cTim * +9

î statistique aussi bien sur le plan théorique que pratique. II


îssi de la loi lognorm ale et de la loi norm ale à deux variable
(loi norm ale bivariée).

C ’est au xvm e siècle qu’on s’est intéressé pour la première fois à la loi normale, après avoir
observé que les erreurs de mesure présentaient une distribution symétrique en forme de cloche.
De Moivre a formulé le premier énoncé mathématique de cette loi en 1733. Il y voyait un cas
limite de la loi binomiale. Laplace avait également pris conscience de cette loi en 1775. On a
attribué à tort sa découverte à Gauss, qui a publié en 1809 le premier texte en faisant mention,
d’où le nom de « loi gaussienne » parfois donné à cette loi. On en est venu à qualifier cette loi de
« normale » à la suite des efforts déployés tout au long des xvm e et xixe siècles pour en faire la
loi de probabilité sous-jacente à toutes les variables aléatoires continues.

6.1 La loi normale


La loi normale constitue à plusieurs égards la pierre angulaire de la statistique. Elle est caracté­
risée par deux paramètres : sa moyenne fl et sa variance
La figure 6.1 montre deux représentations graphiques de la fonction de densité de la loi
normale, définie ci-après.
La loi normale 5

Fonction de densité de la loi normale


On dit qu’une variable aléatoire X obéit à une loi normale de moyenne fi (où -©° < /i < <») et de
variance cr~ > 0 lorsqu'elle présente la fonction de densité
1 (l/2 )(U -/i)/cr]
2
f(x) e < X < 0 0 ( 6 . 1)
oJlït
En abrégé, on écrit X ~ N ( li, G2).

6.1.1 Les propriétés de la loi normale


La loi normale possède plusieurs propriétés importantes, énumérées ci-dessous.

1. J f(x ) dx = \ ( 6 .2 )
requis de toute fonction de densité.
2. f ( x ) > 0 pour tout x
3. lim = 0 et limx .„/(*) = 0.
4. f(ju + x) =f(ju - x), c’est-à-dire une courbe de densité symétrique par rapport à //
5. La courbe de/atteint son maximum au point
6. Les points d’inflexion de la courbe d e/se situent en

Démonstration de la première propriété


Voici une façon de démontrer la première de ces propriétés (l’aire totale sous la courbe vaut 1). On
réécrit l’équation 6.1 en posant
x —fJ.
y G

et en notant l’intégrale /, ce qui donne


1 ~(l/2)y
I e dy.

c°°
Pour démontrer que J —OOf(x) dx = 1, il faudra faire voir que I2= 1 et en déduire que I égale nécessai-
rement 1 puisque la valeur de / ne peut être que positive. Après avoir défini une deuxième variable
aléatoire normale, notée U, on obtient
2 1 —(l/2)y 1 0/2 ) u
I e dy e -
du
yflït 4 ïk
1 moo poo
-(l/2 )(y 2+ « 2)
e dy du.
2n J —oo J —oo

En passant à un système de coordonnées polaires accompagné des changements de variables


y - r sin 6e
t u= r cos 6, on transforme l’intégrale en

2 1
I 2*re-m)rl dd dr
2 ttj o Jo
-(l/2 )r
re dr = 1,

ce qui termine la démonstration.


CHAPITRE 6

Fonction d e ré p a rtitio n de la loi n o rm a le


La fonction de répartition d’une variable aléatoire normale est définie par

F(x) = P ( X < x ) = V — 1 dt\ ( 6 .3 )


J-°°cJv27r ; • \ i
\ , 4 ■ y 4 ‘ * . . . ; ’ . ' J "

On ne peut évaluer cette intégrale qu’en recourant à des méthodes numériques, et on doit alors en
.
déterminer la valeur pour chaque couple
. , ^ ^ i
(fl,
- .
a2).
* ' . • * . . ■ i .► i • * * * *

La moyenne et la variance de la loi normale


On peut aisément déterminer la moyenne et la variance de la loi normale en utilisant les for­
mules de l’espérance de X et de (X - fi)2. On s’attend bien sûr à trouver les valeurs / / e t a 2,
puisque c’est ainsi que nous avons défini ces paramètres. En effet, puisque

en posant z= x( - fl)/a et en utilisant la méthode d’intégrati

Or, comme la première fonction à intégrer n’est autre que la fonction de densité d ’une variable
normale de paramètres fl = 0 et a 2 = 1, la première intégrale a une valeur de 1. L a valeur de la
deuxième intégrale est par ailleurs nulle, puisque

Par conséquent,

E(X) = ju[l] + <J[0]

E( X) = fl. ( 6 .4 )

Il s’agit là d’un résultat logique étant donné la symétrie de la densité.


Pour déterminer la variance, il faut évaluer

V(X) = £ [(X - f i ) 2]

dx.
o ^!2k

Or, en posant z = ( x - fl)/<7, on obtient


La loi normale 157

de sorte que
V(X) = a 2. (6.5)

En résumé, la fonction de densité d’une variable normale, définie par l’équation 6.1,
présente une moyenne de fl et une variance de a 2.

Loi normale centrée réduite


La fonction de densité
_~*r>
<p(z) e 0 0 < z < ( 6 .6 )
42k
est celle d’une variable aléatoire normale de moyenne 0 et de variance 1. notée Z - N(0. 1). On dit de
cette variable quelle obéit à une loi normale centrée réduite. Sa fonction de répartition, notée O, se
traduit par

De nombreuses tables en indiquent les valeurs ainsi que certaines calculatrices. La table II
de l’annexe fournit ainsi la valeur de l’intégrale de l’équation 6.7 selon les valeurs positives de z.
Pour les valeurs négatives, on se sert de la symétrie de la fonction de densité d’une loi N(0, 1)
par rapport à 0. En effet, pour tout nombre réel a, on a toujours

O(-a) = 1 - O(a).

La relation ci-dessus traduit le fait que sous la courbe de densité d’une loiiV(0, 1), l’aire à
gauche de -a est toujours égale à celle à droite de a (voir la figure 6.2).
CH APITRE 6

L'intérêt de la loi normale centrée réduite est qu’elle permet de calculer des probabilités
basées sur des lois normales pour n’importe quelle valeur des paramètres, à partir du change­
ment de variables suivant :

La figure 6.3 illustre le passage d’une normale quelconque à une normale centrée réduite,
parfois appelé « standardisation ».
La section qui suit montre comment tout calcul de probabilité pour une normale quel­
conque se ramène toujours à celui d’une normale centrée réduite.

Le passage d'une variable normale quelconque à une variable normale centrée


réduite: a) densité normale quelconque; b) densité normale centrée; c) densité
normale centrée réduite

La méthode de calcul de probabilités et de quantités


La marche à suivre pour résoudre les problèmes concrets touchant les probabilités associées à
une loi normale s’avère en fait très simple. Prenons par exemple la variable X de loi Af(100, 4).
On veut déterminer la probabilité que sa valeur soit inférieure ou égale à 104, c’est-à-dire
P (X < 104) = F {104). Sachant qu’il existe une variable normale centrée réduite
X -fi
Z
a
La loi normale 159

on peut ici « normaliser » le point d’intérêt, soit x = 104, d’où

104-100
2
La probabilité que la variable normale centrée réduite Z prenne une valeur inférieure ou
égale à 2 est alors égale à la probabilité que la variable normale initiale X prenne une valeur
inférieure ou égale à 104. En termes mathématiques,

F(104) = 0(2).
La table II de l’annexe indique la valeur de la fonction de répartition d’une variable normale
centrée réduite pour différentes valeurs de z. On peut y voir que
0(2) = 0,977 25.
Soulignons que dans la relation z = (x — la variable z indique le nombre d’écarts-types
a qui séparent x de la moyenne fx. Dans le cas ci-dessus, F(104) = 0(2), ce qui veut dire que
104 se situe à deux écarts-types (<J = 2) au-dessus de la moyenne. En règle générale, = // +
Donc ici, 104 =/u+g (2) = 100 + 2(2).
Pour résoudre certains problèmes, il ne suffit pas de consulter une table ; il faut aussi faire
appel à la symétrie de la courbe de (p. On peut esquisser la courbe de densité pour estimer la
valeur recherchée, en plaçant // et les points d’inflexion pour se donner une idée de l’échelle de
l’axe des valeurs de x.

Exemple 6.1
Soit un tissu synthétique dont la résistance à la rupture (en newtons) est une variable aléatoire X de loi
/V(800,144). Un acheteur exige que ce tissu ait une résistance à la rupture d’au moins 772 newtons. On
prélève un échantillon au hasard afin d’en vérifier la résistance.
Pour déterminer P(X > 772), on calcule d’abord
J X - f i 772-800^1
P(X<772) = ^ _ £ < _ _ j

= P(Z<- 2,33)
= <D(-2,33)
= 0,0099.
La probabilité recherchée, soit P(X> 772), est donc de 0,9901. On peut voir à la
page suivante) la probabilité calculée relativement à X et à Z. On a choisi d’utiliser la variable Z parce
qu’il existe des tables indiquant les valeurs de sa fonction de répartition. ►
CHAPITRE 6

Z= | Q° 1)
12

|
______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ __________________________________________ |

P [ X < 772), o ù X ~ A/(800,144), équivalent à < -2,33), où Z ~ A/(0, 1)

Exemple 6.2
Il faut X minutes pour réparer une chargeuse automatique servant à réaliser une opération complexe
de conditionnement des aliments à l’intérieur d’une chaîne de production. Selon des études effectuées,
cette variable obéit de près à une loi /V(120, 16). La figure 6.5 montre sa fonction de densité. Si l’inter­
ruption de la production dure plus de 125 minutes, on est obligé de nettoyer le matériel et de jeter tous
les aliments en cours de transformation, ce qui entraîne une perte de 10 000 $. La probabilité que cela
se produise correspond à
125-120 ^
P(X > 125) Z> P{Z > 1,25)
4 J
1-0(1,25)
1-0,8944
0,1056.

// i
X- 120
i
»

Z W(0, 1) 1
4 *

iI

M l 20, 16)

1
*

S
i
k

' » i r f » . , ' ,

P { X > 125), où X ~ Ni 120,16), équivalent à P{Z> 1,25), où Z - N ( 0 . 1)


T J * * ' y ^ ^ ^ • t e ,

u • t ■ 1 ___ M m s . 1 _
M l
[ 9 1 I 1 9 k * ' 1

\ ■ . * • ' Ç/r A c N

Le coût moyen d’une telle interruption s’établit par conséquent à E(C) = 0,1056(10 000 + CR)
+ 0,8944(C/?), où C représente le coût total et CR, le coût de la réparation. En simplifiant, on obtient ►
La loi normale 161

E(C) = CR + 1056. Imaginons que la direction puisse réduire la durée moyenne de réparation à
115 minutes en augmentant les effectifs du service d’entretien. On aurait alors un coût de réparation
CR > CR]. Toutefois,
125-115^
P(X > 125) = Z> P(Z > 2,5)
4 J
= 1-0(2,5)
= 1-0,9938
= 0,0062,
de sorte que le coût total moyen serait de + 62. Il serait donc logique d’augmenter les effectifs du
service d’entretien si
C*, + 62 < CRt + 1056,

c’est-à-dire si
Q , - C„, < 994 $.
On a ici supposé que la fréquence des pannes demeurait inchangée.

Exemple 6.3
Une entreprise fabrique des raccords dont le filetage a un diamètre sur flancs normalement distribué,
avec une moyenne de 0,4008 centimètre et un écart-type de 0,0004 centimètre. Les normes de concep­
tion de l’entreprise prévoient un diamètre sur flancs de 0,4000 ± 0,0010 centimètre (voir la figure 6.6).
La moyenne de la fabrication diffère donc ici de la valeur nominale. On veut déterminer quelle propor­
tion des raccords respecte les exigences. En utilisant la même méthode que précédemment, on obtient
0,3990-0,4008 < < 0,4010-0,4008
P(0,399<X< 0,401) = />
0,0004 0,0004
P(-4,5 < Z < 0,5)
0(0,5)-<î>(-4,5)
0,6915-0,0000
0,6915.
/

de la norme de la norme

«v
fnn3aaj| La distribution du diamètre sur flancs du filetage : X ~ /V(0,4008; 0,Ô0042)

CHAPITRE 6

Après avoir étudié le résultat de ces calculs, un ingénieur des procédés de fabrication décide de rem­
placer un outil de coupe usé et de régler la machine servant à fabriquer les raccords de manière à faire
correspondre la moyenne réelle à la valeur nominale de 0,4000. On a alors n = 0,4, donc
^0,3990 —0,4 0,4010 —0 ,4 ^
P(0,3990 < X < 0,4010) = P
0,0004 0,0004 J
P(-2,5 < Z < 2,5)
= 0>(2,5)-d>(—2,5)
= 0,9938-0,0062
= 0,9876.
Grâce à ces modifications, 98,76% des raccords produits respectent désormais les exigences. La
figure 6.7 montre la nouvelle distribution du diamètre sur flancs de leur filetage.

> “ ■ - ▼ * m J i n * i / A m

Figure 6.7 La distribution du diamètre sur flancs après les modifications :


X~ iN0,4000; 0,00042)

L’exemple précédent illustre un concept important en ingénierie de la qualité. En effet, il


vaut généralement mieux que la moyenne de la fabrication corresponde à la valeur nominale
lorsqu’il y a un minimum et un maximum admis.

Exemple 6.4
On doit parfois résoudre un autre type de problème exigeant l’utilisation d’une table des valeurs asso­
ciées à la loi normale. Soit X ~ N(50, 4). On veut déterminer la valeur x de cette variable telle que
P(X > x) = 0,025, ce qui se traduit par
x 50^
P(X > x) = P\ Z> 0,025
2 J
ou
Z< 0,975

En consultant la table « à rebours », on obtient


1,96 (0,975)

de sorte que
x = 50+ 2(1,96) = 53,92.
La loi normale

Plusieurs intervalles symétriques retiennent fréquemment l’attention; leurs probabilités


sont énumérées ci-dessous.

P { p - 1,00(7 < * < / / + 1 , 0 0 a) =0,6827,


P(ju- l,645cr < X <ju + 1,645(7) = 0,90,
P ( p - 1,96(7 < X +
uj<
1,96(7) =0,95,
P(ju- 2,58cr < X <// + 2,58(7) =0,99,
P ( //-3,00(7 < X <ju + 3,00(7) = 0,9973.

6.2 La propriété d'additivité


de la loi normale
La loi normale possède la propriété d’additivité. Cette propriété signifie que toute somme de
variables de lois normales est elle-même une variable de loi normale, d’où le théorème 6.1.

—" —* n ■ v - 7 ' - *■ n — — a — f c — — 1— — 1 — — — — é
ttÊi . ■, ' — 1 . * .J k . .

I J 0 * , w L J & J O tX ’ J ' A V * ' . T & 5 ? v i V . ^ v . . , * ,\ * v v . > r s - • % ') » ^ t f ^ / V ' ^ v u iL Î* *■ . .‘ A . ; ? • > . . . . » > * > ^ S L > 7 .^ .« ■ «**> !
i f ■ , T / _ y
*, . V . .1 Æ L
r *• a /.
■ ^ * k. 5
T « j|
| I iB
; • • ■r a i 4 Æ | 00* ■ # 1 ' flH V «
î t L 1
_* 0
,V « ry
0 . ' s V» ' ‘ y ■ f . ^ **
* . -B 0 —~■ 00 _ ■ B B _ ir 1 b v .* 1 1 f " T v i * 7 y i \ j h ■ « . __ ^ .t \ > - . , * ____• - i . ) » ^ w ^

Soit nvariables aléatoires indépendantes, notées X,, X2, ..., Xn,


telles que X t
g ]) pour
i = 1,2, n .Alors la variable aléatoire Y définie par

Y —X, + X, + ••• + Xn ( 6 . 10)

est telle que Y ~ N(jUY, G y ) , où fiY + + et <7Y (J x 4- (7 C 4~ • •

+ Gn

Exemple 6.5
Soit trois éléments reliés de la façon présentée à la figure 6.8. Les distributions respectives des lon­
gueurs X,, X2et X3sont
X, ~ N(12, 0,02)
X2~ N(24, 0,03)
X3~ Af(18, 0,04).
Comme ces éléments sont fabriqués par des machines et des personnes différentes, on peut raisonna­
blement supposer l’indépendance des variables X,, X2et X3. On s’intéresse à la longueur totale, notée Y.

— 1 — ! ■ ■ ■ » * » - n i » !■ ■ ■ ■ ■ ■ » ■ I M I C M K . I W I . . . . . » - .......................................................................... ........... T M . W M M . f ■» 1 . — « « . t . » — » « . — T ■ ■ ■ ■ ■ * * * * * • H l l l I I » ■■ ■ ■ « B i t ' « S » ^ *—

Un assemblage de trois éléments

On veut ici déterminer P(53,8 < Y < 54,2). Or, puisque Y =Xx+ X2+ X3, la variable Y obéit à une loi
normale de moyenne jliy= 12 + 24 + 18 = 54 et de variance

G2= <7? + g \ + o\ = 0,02 + 0,03 + 0,04 = 0,09. ►


CHAPITRE 6

On peut étendre les résultats du théorème 6.1 aux com binaisons linéaires de variables
aléatoires indépendantes de loi normale. En effet, une autre propriété plus générale de la loi
normale est que toute combinaison linéaire de variables indépendantes de loi normale est aussi
une variable de loi normale, d’où le théorème 6.2.
— * - '• • / — ,— T r ' + r r - T V v « — ~ ''r r ~ T r V 'T ' O } * ' ' . / • » *■ .

* M * . . — . . - * .

P B p p p m n p n p

» 1 ^ D I . 4 - J 5 — - L V i é W i g f t J l i M l i l i l H 1 A ï Ê r * V j 1 r ^ L ' % ; ‘
r ^ y f î i d p : i § i o i u

p • r ? « <

Soit « variables aléatoires indépendantes, notées Xv telles que X, ~ NijU^ <j?) pour .. . . w »■. .* * ~** * _* ^

i= 1,2,..., n,et a0, av ..., an, des nombres réels quelconques. Alors la variable aléatoire Y défin
Y Gq+ ûjXf + ••• + a..X
n n ( 6.11)

est telle que


Y~N(u Y’ cri),
ou
+ a2ju2 + •• • + et 2
My a0 + « ,//, a nf i n <7 a\ m a\ + ♦ ♦

+ a2o 2n

Exemple 6.6
Soit un arbre (tige cylindrique) qu’on doit insérer dans un palier (une sorte de tube fixe) (voir lafigure 6.9)
r *

L'insertion d'un arbre dans un palier

Le jeu entre ces éléments correspond à la différence des diamètres, soit Y = X, —X2. Si
X. ~ Af(l,50 ; 0,0016)
et
X2 ~ N( 1,48 ; 0,0009),
alors
[iy —axpix+ o.2^i2
= (1)(1,50) + (—1)(1,48)
= 0,02 ►
La loi normale 165

et
aY2 2_2 , 2—.2
^1 C7j + ^2^2
2
(1)2(0,0016) + (-1)^(0,0009)
0,0025,
de sorte que
CFy = 0,05.
Lorsque Y < 0, un serrage (jeu négatif) rend l’arbre impossible à insérer dans le palier, d’où
0 0,02 -
N
P(serrage) = P(Y< 0) = P Z<
0,05 J
O(-0,4) = 0,3446.
Ainsi, 34,46 % des tentatives d’assemblage échoueront. Si l’équipe de conception juge qu’il est
impossible d’accroître le jeu nominal actuel de fiY= 0,02, le seul moyen de réduire cette proportion
d’échecs consiste à réduire la variance des dimensions. Or, on peut y arriver dans bien des cas en
améliorant le réglage des équipements de production, en formant mieux les opérateurs, etc.

6.3 Le théorème central limite


Ce théorème est l’un des plus importants et des plus célèbres en probabilités et en statistique,
d’où son appellation. Sa plus ancienne version, réalisée par Abraham De Moivre (1733), portait
sur les proportions. Une deuxième version est attribuable à Laplace et Gauss (1812). La version
plus générale du théorème a été établie en 1920 par Lindeberg et Lévy.
Exprimé en mots, ce théorème stipule que la somme de n variables aléatoires indépen­
dantes qui satisfont à certaines conditions générales obéit approximativement à une loi normale
lorsque n est suffisamment grand. La formulation mathématique de cet énoncé constitue le
théorème 6.3.

?
Soit X , X ,..., Xnune suite de n variables aléatoires indépendantes telles que E(Xt) = fjt et V(Xt) = <yj
(avec .~
7<
finie). Soit
Y = X +X, + ••• +X„, %

alors dans certaines conditions générales, lorsque n tend vers l’infini, la variable Y obéit approxima­
tivement à une loi /V(/i, + ju, + ••• + jun, cr2 + cr; + ••• + <72).
Autrement dit, si F est la fonction de répartition de
fl

Y
Zn (=1 ( 6 . 12)
n
ai
/»1
alors

lim — = 1, pour tout • (6.13)


fl —?°o
O(z)
CHAPITRE 6

Les conditions générales mentionnées plus haut se résum ent com m e suit. Pris seul, chaque
terme X i exerce une influence négligeable sur la variance de la somme, et il est peu probable
qu’un seul terme contribue pour beaucoup à la somme. La dém onstration de ce théorème et
l’examen rigoureux des hypothèses requises dépassent les lim ites de cet exposé.
L’importance de la loi normale résulte avant tout du fait que la loi de probabilité de Y s’avère
approximativement normale alors que les termes X t peuvent essentiellem ent obéir à n’importe
quelle loi, qu’elle soit discrète ou continue. Dans bien des cas, on peut envisager la variable à
l’étude comme la somme de nvariables aléatoires indépendantes dont
senter des erreurs de mesure, des considérations matérielles, etc., de sorte que la loi normale
fournit une bonne approximation.
On observe un cas particulier du théorème central lim ite lorsque chaque term e obéit à la
même loi.

Soit X,X , ..., Xn une suite de variables aléatoires i et identiquement distribuées,


telles que E(X) —/ j e t V(X() == C72>0.
.2
Si n est assez grand, la variable Y X, + X, +
* v
+ » è

approximativement à une loi


Soit Xj5 X2, ..., X nune suite de n variables aléatoires indépendantes et identiquement dis
telles que E(X) = juet L(X.) = <r2 > 0. Si n est assez grand, la variable
X i+ X 2 + +xn
X
n
obéit approximativement à une loi N(ju, a /ri).

La taille d'échantillon minimale permettant d'appliquer


le théorème central limite
Une question se pose d’emblée sur le plan pratique : jusqu’à quel point n doit-il être grand pour
qu’on obtienne des résultats vraisemblables en utilisant la loi norm ale com m e approximation
de la loi à laquelle obéit Y? Il s’agit là d’une question difficile, car pour y répondre, il faut tenir
compte des caractéristiques de la distribution des termes X; et de ce qu’on entend par des résul­
tats « vraisemblables ». Voici néanmoins quelques règles em piriques très rudim entaires qu’on
peut appliquer selon que la distribution des termes X t appartient à l’une ou l’autre des catégories
arbitraires décrites ci-dessous.
1. La distribution des X est proche de la loi normale :
Leur fonction de densité se traduit par une courbe en form e de cloche presque symé­
trique. La taille d’échantillon n devrait être au moins égale à 4 {n > 4) en pareil cas.
2. La distribution des X. a peu de valeurs extrêmes :
Les termes X, présentent une distribution sans mode évident et une fonction de densité
relativement symétrique semblable à celle d’une variable uniform e. On adopte souvent
n > 12 comme valeur requise dans un tel cas.
f

La loi normale

3. La distribution des X, n’a rien à voir avec une cloche symétrique :


Les valeurs se concentrent surtout aux extrémités de la distribution. La loi exponen­
tielle et la loi de Bernoulli en seraient deux exemples. Il est ici plus difficile d’établir
une règle, mais on peut s’attendre à ce que n > 100 constitue un choix satisfaisant dans
bon nombre de cas.
La figure 6.10 montre un exemple d’approximation de la loi d’une somme par la loi normale.
Puisque les distributions originales (pour n - 1) ne sont pas en forme de cloche, il faut que n
soit grand pour que la loi normale fournisse une bonne approximation de la vraie distribution.
*

n =5 : Densité de n - 30 : Densité de
n = 1: Densité de Xj x Y+x2+ - + x5 Àj + X-, + *•• + XjQ
0,2 -f

n = 1 : Fonction de masse n —5 : Fonction de masse n = 30 : Fonction de masse


deXl de Xj + X2 + ••• + ^ de Xj + X2 + ••• + Xjq
i

0,4

0,2

0,0
0 1 2 3 4 5 6 0 5 10 15 20 25 30

L'approximation normale (en pointillé) de la distribution d'une somme de


n variables aléatoires dans un cas continu et un cas discret, pour = 1, 5 et 30

Exemple 6.7
On emballe des pièces dans des caisses à claire-voie qui en contiennent chacune 250. Le poids de
chaque pièce est une variable aléatoire indépendante ayant une moyenne de 0,5 kg et un écart-type
de 0,10 kg. On charge 20 caisses sur une palette. Quelle est la probabilité que les pièces chargées sur
cette palette pèsent plus de 2510 kg au total (sans tenir compte du poids des caisses et de la palette) ?
Soit
y=x,+x2
le poids total des pièces, de sorte que
flY= n fi- 5000(0,5) = 2500,
a \ = na2= 5000(0,10)2 = 50.
1 6 8 CHAPITRE 6

Puisque n est grand, même si on ne connaît pas la distribution du poids de chaque pièce, on peut
appliquer le théorème central limite et utiliser l’approximation normale
N(2500, 50).
On aura ainsi
(
2510 —2500^1
P(X > 2510)~ P z >
v V5Ô J
1-0(1,41) = 0,08.

Exemple 6.8
Afin de permettre la planification et l’ordonnancement d’un projet de construction, on a créé un réseau
logique montrant les tâches ou étapes à effectuer. Ce réseau comprend un chemin critique formé de
30 étapes. Le tableau ci-dessous indique la moyenne et la variance du temps nécessaire (en semaines
et en semaines2) à la réalisation de quelques-unes de ces étapes.
Étape Moyenne Variance
1 2,7 1,0
2 3,2 0,8
3 4,6 1,0
4 2,1 0,3
••• ••♦ •••
29 7,1 1,9
30 1,5 0,5

On peut envisager la durée de chaque étape comme une variable indépendante et le délai d’achèvement
du projet comme la somme du temps requis pour réaliser les différentes étapes formant le chemin cri­
tique, c’est-à-dire Y=Xl +X2-\--- + X30, où Y représente le délai d’achèvement du projet et X„ la durée
de la i-ième étape. On ne sait pas à quelle loi obéissent les variables X,, mais on connaît leurs moyennes
et leurs variances. En les additionnant, on obtient
HY= 49 semaines
16 semaines2.
L’entrepreneur désire connaître le délai assurant une probabilité de 0,90 d’avoir terminé le projet à
l’échéance, ce que la figure 6.11 peut aider à déterminer.
On cherche la valeur y 0 telle que
P(Y < y0) = 0,90.
On « standardise » Y pour obtenir la variable centrée réduite Z,

P^Z < ^ ° ~ 491 = 0,90,

et à partir de la table de la fonction de répartition d’une 0, 1), on trouve le quantile

^°-- 49 = 1,282 = <ï>_1(0,90).


4
Finalement,
y0= 49 + 1,282(4)
= 54,128 semaines. ►
La loi normale 169

La distribution approximative du délai d'achèvement: A/(49, 16}

Exemple 6.9
On génère 50 nombres au hasard dans l’intervalle [0, 1]. Est-il exact de penser que la probabilité que
la moyenne de ces 50 nombres excède 0,6 est de 40 % ?
Soit X la moyenne des 50 nombres. Les X, sont des variables indépendantes et identiquement distri­
buées selon une loi uniforme dans l’intervalle [0, 1], c’est-à-dire X, - (7(0, 1), = 1, ..., 50. Puisque
E(X) = fi = 1/2, et que V(X,) = a 2 = 1/12, on a donc

E(X) = p =

Puisque n= 50 est grand, la variable X est approximativement normalement distribuée :

Ainsi,

= 1-0(2,45)
0,007.
Bref, même si la probabilité qu’un seul des nombres excède 0,6 est de 40 %, il en va autrement pour la
probabilité que la moyenne de ces nombres excède 0,6. En effet, la moyenne de 50 nombres a beau­
coup plus de chances de se trouver autour de fx - 0,5 qu’un seul de ces nombres.

L'approximation de la loi binomiale par la loi normale


Au chapitre 4, il a été question de l’approximation de la loi hypergéométrique par la loi bino­
miale et de la loi binomiale par la loi de Poisson. Nous allons parler ici de l’approximation de
la loi binomiale par la loi normale. La loi binomiale étant une loi de probabilité discrète, une
telle approximation peut sembler contraire à l’intuition. Il faut cependant savoir qu’elle fait
intervenir un processus de passage à la limite où le paramètre p de la loi binomiale reste fixe
tandis que n —» appelé le « théorème de De Moivre-Laplace ».
170 CHAPITRE 6

Démonstration

Compte tenu du fait que X représente la somme des résultats d’épreuves indépendantes de
Bernoulli (de sorte que E(X) = np et V{X) = np( 1 —p)), le théorème central lim ite nous permet
d’affirmer que la loi normale fournit une bonne approximation à la loi binomiale.
La quantité (X —np)/^Jnp(\ —p) est donc approximativement distribuée selon une loi 7V(0, 1).
Cette approximation se révèle assez juste lorsque la valeur de p est proche de j , tandis que n > 10.
Elle exige cependant une plus grande valeur de pour toute autre valeur de p. On sait par
expérience que la loi normale offre en général une assez bonne approximation tant que
np >5 pour <
p ^ ou tant que «(1 - p) >5 pour
La figure 6.12 illustre la forme de cloche de la distribution binomiale de plus en plus évi­
dente lorsque n grandit.

L’utilisation d’un procédé de fabrication engendre 20 % d’articles défectueux. Pendant tout quart de
travail, on prélève une fois l’heure un échantillon aléatoire de 100 articles. Soit X le nombre d’articles
défectueux dans un échantillon. On en déduit que X suit une loi binomiale qui peut être approchée par
une loi normale, puisque n est grand.
X ~ Binomiale (n = 100, p = 0,20)
X « #(100(0,2), 100(0,2)(0,8))
X * #(20, 16)
Pour déterminer P(X < 15), on peut recourir à l’approximation fournie par la loi normale, d’où
15-20
P(X < 15) * P\ Z <
VÏ6
P(Z < -1,25) = 0 (-l,2 5 ) = 0,1056
La probabilité exacte, calculée avec la loi binomiale, est

P(X < 15)


1 5 TooN(0,2)*(0,8) 1 0 0 -JC 0,1285.
X
jc=0 V J
La loi normale

Une correction pour !a continuité


La loi binomiale étant discrète alors que la loi normale est continue, il est courant d’effectuer
une correction pour la continuité. Cette correction s’avère d’ailleurs essentielle lors du calcul
de toute probabilité P(X = x), autrement, l’approximation normale donnerait une probabilité
nulle ! La façon usuelle de procéder consiste soit à ajouter ou à soustraire une demi-unité aux
bornes de l’intervalle auquel on s’intéresse. La figure 6.13 illustre une telle approximation, et
l’exemple 6.11 montre quelques calculs avec correction pour la continuité.

Une illustration de l'approximation d'une Binomiale(n = 20, p = 0,5) par une loi
N[fi= 10, (T2= 5)

Exemple 6.11
À l’aide des données de l’exemple 6.10, où n = 100 et p = 0,2, évaluons P(X = 15), P(X < 15), P{X < 18),
P(X > 22) et P( 18 < X < 21) avec l’approximation normale en corrigeant cette fois pour la continuité.
La vraie valeur est donnée dans la colonne de droite.

Valeur exacte avec


Valeur avec l’approximation normale la loi binomiale
15,5 14,5
P(X P(14,5<X <15,5)
U25) 1,375) = 0,046 0,0481

15,5
P(X < 15) 0,130 0,1285

17,5
P(X < 18) = P(X < 17) 0,266 0,2712

21,5
P(X > 22) 0,354 0,3460

P(18 < X < 21) = P(19 < X < 20)


20,5- 18,5

0 , 5 5 0 - 0,354 = 0,196 0,1974


172 CHAPITRE 6

R e m a rq u e
V si ■ 5 ^ T > « t * -« ■ J V , ^ ( / <“ «• . -, y " i. h v j.., ^ ^ . „
tr » _ . ^ ■ >, ■ » _ i ^ \ i t > * » . j »■ v* » „ . ^ ^

La correction pour la continuité est présentée ici dans le cas de l’approximation d’une loi binomiale
par une loi normale. Toutefois, de façon générale, on utilise cette correction lors de toute approxima­
tion d’une loi discrète par une loi continué; • » • ■
• * % . * * • . * » . . y ' • * -
. »

La variable aléatoire p = XIn, où X obéit à une loi binomiale de paramèt


souvent l’attention. L’intérêt qu’on lui porte résulte surtout de son utilité dans les situations de
sondage où Ton établit un échantillon aléatoire de n observations qualifiées chacune de succès
ou d’échec, la variable X représentant le nombre total de succès à l’intérieur de l’échantillon. L a
quantité p correspond donc tout simplement à la proportion de succès de l’échantillon. C ’est
également une moyenne de n variables de Bernoulli indépendantes et identiquement distri­
buées. De plus, on peut aisément démontrer que

E(p)= p (6.14)
et que

V(p) = .
n
En vertu du théorème central limite, la variable

<6,s’

obéit approximativement à une loi N (0 ,1). Ce résultat est utile dans de nombreuses applications
liées, entre autres, au contrôle de la qualité, à la mesure du travail, à l’ingénierie de la fiabilité
et aux sciences économiques.

Exemple 6.12
Au lieu de chronométrer les activités d’un mécanicien d’entretien pendant une semaine afin de déterminer
quelle proportion de son temps est consacrée à des tâches « secondaires mais essentielles », une techni­
cienne décide de recourir à la méthode des observations instantanées. Pour ce faire, elle choisit au hasard
400 moments de la semaine où elle effectue une observation ponctuelle visant à déterminer quel type
d’activité occupe alors le mécanicien. La variable X représente ici le nombre de fois où il s’agit d’une tâche
« secondaire mais essentielle », donc le nombre de « succès », et X/400. Si, en réalité, ce type de tâches
occupe 20 % du temps du mécanicien, la probabilité que p (c’est-à-dire la proportion observée) se situe
entre 0,15 et 0,25 correspond à
0,25-0,2 N 0,15-0,2 N
P (0,15< p< 0,25)«0 O
VVo, 16/400 J J0,16/400 J
0(2,5)-<ï>(-2,5)
0,9876.

Notons qu’il est possible d’utiliser une correction pour la continuité pour les calculs impli­
quant la proportion afin d’augmenter la précision de l’approximation. Il faudrait alors ajouter ou
soustraire 1/2n, et non seulement 1/2 au quantile impliqué dans la probabilité.
La loi normale 173

6.4 La loi lognormale


Toute variable aléatoire dont le logarithme obéit à une loi normale est dite soumise à une « loi
lognormale ». La loi lognormale résulte du groupement de termes aléatoires par un processus
multiplicatif. Elle régit des applications dans de nombreux domaines, notamment en sciences
physiques, en biologie et en sciences sociales. Dans le domaine du génie, on l’utilise pour
décrire la durée de fonctionnement avant défaillance en ingénierie de la fiabilité, de même que
le temps de réparation en technogénie de l’entretien.

Fonction de densité d'une variable lognormale


Considérons une variable aléatoire X dont l’image est Rx {x: 0 v v-riariie
aléatoire Y = ln X obéit à une loi normale de moyenne pYet de variance <77 .
On dit alors que X suit une loi lognormale de paramètres jJYet <7Y. La fonction de densité de X est

six > 0
( 6 . 16)

sinon.

La représentation graphique de cette fonction de densité est généralement une courbe asy­
métrique se prolongeant sur la droite.
ê

La moyenne et la variance de la loi lognormale


La moyenne de la loi lognormale est

E(X) = fix = e^ +(U2)°y (6.17)

et sa variance,

V(X) = e2tiY+°* (e°Y -1 ) = (i\ (e°Y -1). (6.18)

Dans la pratique, on peut aussi avoir besoin de connaître la médiane et le mode de la loi
lognormale. Or, la médiane, c’est-à-dire la valeur Je telle que P(X <x) = 0,5, correspond ici à

Quant au mode, soit la valeur de x pour laquelle la fonction/(x) atteint son maximum, il vaut

%MO e1**~°r.

La figure 6.14 (voir à la page suivante) indiquera position relative de la moyenne, de la


médiane et du mode d’une variable lognormale. Étant donné que la distribution s’étire sur
la droite, le mode est généralement inférieur à la médiane, qui est elle-même inférieure à la
moyenne.
174 CHAPITRE 6

La fonction de densité d'une variable lognormale

Les propriétés de la loi lognormale


Alors que la loi normale se reproduit par addition, la loi lognormale se reproduit p ar m u ltip lic a ­
tion. Quelques-unes des principales propriétés de cette loi sont présentées ci-dessous.
1. SoitX une variable lognormale de paramètres fiyti a 2Y.S ia ,b e td sont des constantes telles
que b = e?, alors W = bXa obéit à une loi lognormale de paramètres (d + afiÇ) et (a<JY)2.
2. Soit Xxet X2des variables lognormales indépendantes dont la première est de p aram ètres
HY*et <J11et la seconde, de paramètres (iY2 et a \*2^. Alors, leur produit W —X x • X 2 o b éit
a

à une loi lognormale de paramètres juY+ juY et a l + a l .


3. Soit X v X2t ..., Xn une suite de n variables lognormales indépendantes de p aram ètres
H y . et a y, pour j - 1 ,2 , . . . , n, respectivement. Si {a.} représente une suite de constantes

tandis que b= ed
est une seule constante, alors le produit

W= b f [
;=i
obéit à une loi lognormale de paramètres
n n

d + Y<ajVr, et •
j =\ 7=14

4. Soit Xv X2, ..., Xn des variables lognormales indépendantes ayant chacune pour
paramètres jliy et a Y, alors leur moyenne géométrique

M J
obéit à une loi lognormale de paramètres jliy et a Y/n.
La loi normale

Exemple 6.13
loi N(10,4). Si Y=\n X
, alors X obéit à une loi lognormale de paramètres
M 10 et <72 = 4, dont la moyenne et la variance correspondent respectivement à
E(X) = el0+0/2)4 = e12 162 754,79
et à
V(X) = el2(10)+4](e4 - 1) = e24(e4 - 1) » 53,598e24.
Le mode et la médiane de cette loi sont
10
mode = 403,43 et médiane = e 22 026,47.
Pour déterminer une probabilité donnée, telle que P(X < 1000), on recourt à la transformation
P(ln X < ln 1000) = P(Y l<n 1000), d’où
ln 1000-10
P(Y < ln 1000) = P Z< 0 (-l, 55) = 0,0606.
2 J

Exemple 6.14
Soit
*1-=lnXr - N (4, 1)
K= =lnX2-- N(3, 0,5)
*>-=lnX3-- N(2, 0,4)
K- =ln X4 --N(l,0,01),
où X„ X2, X3etX4sont des variables aléatoires indépendantes. La variable aléatoire Wdéfinie ci-dessous
revêt une importance primordiale en matière de rendement dans le cas d’un système de télémétrie.
W = eU5[X2'5X°2'2X°3J X4]].
Compte tenu de la propriété n° 3 énoncée plus tôt, la variable Wobéit à une loi lognormale de paramètres
1,5 + (2,5 • 4 + 0,2 • 3 + 0,7 • 2 + 3,1 • 1) = 16,6
et
(2,5)2 • 1 + (0,2)2 • 0,5 + (0,7)2 • 0,4 + (3,1)2 • (0,01) = 6,562.
En d’autres termes, ln W ~ N(16,6,6,562). Si la valeur de W doit être comprise entre 20 000 et 600 000
selon les normes de conception établies, on peut calculer comme suit la probabilité qu’elle remplisse
cette exigence :

P(20 000 <W <600*103) = P[ln(20 000) < ln W £ ln(600 •103)]


3 \
ln 600*10 16,6 ln 20 000 -16,6
O
y/6^526 J yK526 J
<b(-1,290) - *ï»(-2,621) = 0,0985 - 0,0044
0,0941.
176 CHAPITRE 6

6.5 La loi normale à deux variables


Il existe une importante loi de probabilité à deux variables découlant d’une généralisation de la
loi normale. Celle-ci porte le nom de « loi normale à deux variables » ou « loi normale bivariée ».

Fonction de densité conjointe de la loi normale bivariée


Un vecteur aléatoire [Xv X2] est dit «de loi normale bivariée» si sa fonction de densité conjointe est
donnée par

/ ( * , , * 2 ) =

pour —<*>■<x, < et —co < jc2< oo.


En abrégé, on écrit [X, X2] ~ N (ji , p2, of, o\\ p).

O '+%
La fonction de densité associée à cette loi comporte cinq paramètres : p , , jl l ,, ct,“ , c r2 et p,
où p est le coefficient de corrélation de X x et X2 tels que < //j < °°, —<» < /p < ©o, o f > 0.
o f > 0 et -1 < p < 1.
La probabilité conjointe P(ax<X{ <bxC\ a2<X2< b2) est donnée par

(6 .22)

Cette probabilité conjointe correspond au volume sous la surface, à l’intérieur de la région


{(Xj, x2) : al < x l < bv a2 < x2 < b2], comme le montre la partie ombragée de la figure 6.15.
- * < > .

D.B. Owen (1962) a établi une table des probabilités liées à la loi normale à deux variables.

Figure 6.15 La fonction de densité associée à la loi normale bivariée

La valeur de la corrélation
Les variables X{ et X2 d’une loi normale bivariée sont indépendantes lorsque p = 0, car on peut
alors décomposer leur fonction de densité conjointe en un produit de leurs fonctions de densité
marginales respectives. Une corrélation nulle est par conséquent synonyme d’indépendance
pour cette loi.
La loi normale 177

Si la corrélation est non nulle, c’est qu’il existe un lien linéaire entre les deux variables aléa­
toires. Si l’on ajoutait à la figure 6.15 des plans parallèles au plan xxOxv l’intersection de chacun
de ces plans et de la surface représentant la fonction de densité conjointe formerait une ellipse.
Les ellipses ainsi formées sont appelées des « courbes de niveaux ». Plus p s’approche de l ou
de —1, plus les ellipses sont étirées, concentrées autour d’un grand axe représentant la relation
linéaire entre X xet X2. Plus p s’approche de 0, plus les ellipses ressemblent à des cercles (lorsque
X x et X 2 ont les mêmes unités de mesure), ou du moins à des ellipses dont les axes sont parallèles
aux axes Oxxet Oxr La figure 6.16 illustre l’effet de la corrélation sur la densité normale bivariée.
>. w . . . a

Densité conjointe de la loi jV2(50, 45, 36, 64; 0,10) Courbes de niveaux A',(50. 45. 36. 64: (),]())
4 *

/(*!. X2) “ X2

0,003 - 60

0,002 -
50-

0,001 -
40 J

30-

T “ T“
0 40 50 60 i

Densité conjointe de la loi N2(50, 45, 36, 64 ; 0,75) Courbes de niveaux AL(50,45, 36, 64 ; 0,75)
. A
f ( x x, X 2) ‘
A i if U
0,004 *
/
y
»

i :
:

x[
XJ i ■ K v •\

:
? : .
:

*V •/*i'1'V'j
.* .n j
t
>
. 'w
t
*
\
\
• W A V
. . y ' ? , '

0,002-

0,000

0 40 50 60 i
BÿfgaæÉ&sm
1a J l l i i IM La distribution normale bivariée et les courbes de niveaux associées pour des
corrélations de 0,10 et 0,75 (densité conjointe mise en évidence lorsque X, = 44
et lorsque X=, 56)
178 CHAPITRE 6

Ces densités dénotent chacune une loi normale, autrement dit

Xl (6.25)
et
X,2 ~ Nij^,
Ainsi, si [X , X 2] suit une loi normale bivariée, alors X] et X2 suivent des lois normales uni­
variées. Notons cependant que l’inverse n’est pas toujours vrai.

Les densités conditionnelles


Les densités conditionnelles f x](;t2) et / XllJt (*,) revêtent aussi de l’importanc
une loi normale puisque

pour —©O< x l < oo.


Des exemples de densités conditionnelles sont représentées graphiquement à la figure 6.17.
L’espérance y change, mais pas la variance. Dans le cas de la densité Ui, on a une moyenne de

E(X2\xl) = n 2 + P & 2
et une variance de

La fonction de densité f X2ÏXis’avère en outre normale, ce qui veut dire que

Le lieu géométrique des valeurs moyennes de X2étant donné x v lequel est défini par l’équa­
tion 6.28, traduit la droite de régression de X2 sur que nous aurons l’occasion d’aborder au
chapitre 12. Soulignons aussi que la variance de ces distributions conditionnelles est constante
pour tout jc,.
La loi normale 179

a) La densité conditionnelle de X2pour quelques valeurs de x,; b) la densité


conditionnelle de X, pour quelques valeurs de x2

On obtient des résultats semblables dans le cas de f X]^ . En effet,


f x 2- p 2^
E(Xl\x2) = n ï + p c l (6.31)
a2 J
2 (6.32)
V ( X , ,x2) = <T?(1 - p ‘)
et
/X
2 ^2 ,crf(l-p")
2
x 2 ~ N //,+p<T,
CT2 y

Exemple 6.15
La résistance au cisaillement X2 et le diamètre X, de soudures par points ont fait l’objet d’une étude
visant à remplacer un essai destructif par un essai non destructif. Voici les conclusions de cette
étude.
1. Le vecteur [X,, X2] obéit à une loi normale à deux variables.
2. p, = 0,20 cm, p, = 1100 kg, d\ = 0,02 cm2, <r2= 525 kg2 et p = 0,9. ►
1 8 0 CHAPITRE 6

La valeur moyenne de X, sachant que X, = x } est ainsi


\
E(X2 | x,) = p 2 + p o 2
Gl J
A
J

Le coefficient devant xxest positif, donc la résistance croît avec le diamètre des soudures.
La variance de X2 sachant xxest

v(x2\Xi) = G ja - p 2)
= 525(0,19)
= 99,75.

Notons que cette variance est indépendante de la valeur du diamètre.


Il existe une forte corrélation entre le diamètre des soudures et leur résistance au cisaillement
puisque la valeur p = 0,9 est proche de 1. Or, la résistance au cisaillement doit être supérieure à
1080 pour respecter les exigences. Le directeur se demande quelle est la probabilité d’atteindre
ce résultat lorsqu’une soudure a un diamètre de 0,18 cm. L’ingénieur des procédés de fabrication
calcule E(X210,18) = 1097,08 et en déduit que
X2|0,18 ~ W(1097,08 ; 99,75).
Ainsi,
\
1080-1097,08
P(X2 >1080|X, =0,18) = P Z
V99,75 J
1—<I>(—1,71)
0,9564.
Dans ces conditions, le directeur de la production recommande que toute soudure ayant un diamètre
de 0,18 ou plus soit jugée satisfaisante.

Exemple 6.16
Au moment d’établir la politique d’admission d’une grande université, on a observé que la note accor­
dée aux étudiants à l’examen d’admission et leur moyenne cumulative à la fin de leur première année
d’études, notées respectivement X, et X2, obéissent à une loi normale bivariée. Une moyenne cumula­
tive de 4,0 correspond à un « A ». Une étude a permis d’obtenir les données ci-dessous.
p, = 1300
& = 2,3
G*= 6400
g\ = 0,25
p = 0,6 ►
La loi normale 181

foute personne qui termine sa première année d’études avec une moyenne cumulative inférieure à 1,5
doit quitter l’université. On juge toutefois satisfaisante une moyenne de 2,0. » ■»

Supposons qu’un candidat se voit refuser l’admission après avoir obtenu une note de 900 à l’examen.
Mécontents, ses parents affirment qu’il peut réussir à l’université et terminer sa première année avec
une moyenne cumulative supérieure à 2,0. Laissant de côté les éléments non probabilistes, le regis-
traire veut déterminer P(X2> 2,0 |X, = 900) en se basant sur les données. Après avoir établi que

900-1300
E(X21900) = 2,3 + (0,6)(0,5)
80
0,8
et que

F(X2|900) = 0,25(1 - 0,62) = 0,16,

il arrive au résultat
2,0-0,8
P(X2> 2,0\Xl = 900) = 1 - 0
0,4
0,0013.

Les parents ont donc très peu de chances d’avoir raison.

me
Loi normale: X ,<T2)
1
Fonction de densité : e-<m , pour °° < X < 00
-, .
<tV2n ^ V » . • %

Cloche symétrique par rapport à fdeux points d’inflexion en .. » .

X-fi
Si X N {fi., a 2), alors Z> N( 0, 1) (loi normale centrée réduite)
* * ' • -

G
» , \ •

x-fl
Fonction de P(X < x) = O O(z)
G

_ - •

Combinaisons linéaires de variables aléatoires suivant des lois normales <. -

• * . . . . . - * - *

Si X, ,X 9,..., X , sont des variables aléatoires alors


indépendantes; V
«

v’
• -

. . . . .

suivant une loi normale; n n n \


ao + Y , aix i N «o + X Û.JU«’] [ X <T'2
de moyenne E ( X ù —fii ; /=! i=l
;=1 /
2
• de variance V(X.) = g ~; » ■

et si a0, a , ,..., a sont des constantes,


C H A PITR E 6

Théorèm e central lim ite


Si X ,, X 2, • • •, X tl sont des variables aléatoires alors
• in d é p e n d a n te s; n
Z T N(nju, n o )
• id en tiq u em en t distribuées (loi quelconque) ; (=i
de m o y en n e ju et
2
de variance 0 CF <72 "
X N
et si n est assez grand, n )
L e th éo rèm e central lim ite est aussi valide si les variables ne sont pas id e n tiq u e m e n t d istri­
buées, sous c ertain es conditions.
Si les X sont des variables aléatoires discrètes, on utilise une co rrectio n p o u r la co n tin u ité.

Loi lognormale: ln X ~ N ( jliy , <r2)


1
Fonction de densité : / (x) e ( l/2)t(lnA Vy)/0 y\ 5 pour X 0
x o y \]2 jt
/Uy + ( l / 2 ) c r p
E(X) e
? / CT
2
Y
V(X)

Loi normale bivariee: N 2{ n l , f i 2->G\ »° i >p)


• Fonction de densité conjointe :

1 1 \ \ \
x i -P i x i ~Pi x2 /i2 *2~M2
\ 2

/ ( x , , x 2) exp 2P 4~
2 k 0 \ 0 2J \ - p
2
2 0 - p 2) y cr, y \ G 2 J y
pour < jc, , jc2 < 00

L ois m arginales :
2
1 N i / u ^ o f ) et X 2 ~ N ( ju2, o ;)

L ois conditionnelles:
\ \
X2 P 2 0 j2( l
X1 x 2 N P i+ P ^ i P 2)
cr2 y y
A
X1 Pl 2
x 2 x1 TV P 2 + P°2 G220 P*)
<71 y y
r

La loi normale

6.1 Soit Z une variable normale centrée réduite. g) La probabilité de sélectionner une
Calculez les probabilités qui suivent en valeur située à moins d'un écart-type
vous aidant d’une représentation graphique de la moyenne est la même pour toutes
approximative de la densité. les variables aléatoires normales, peu
a) P(0 < Z < 2) importe les paramètres ju et a 2.
b) P ( - l < Z < 1) h) Si X . - i2N, 1) (pour / = 1.100).
c) P(Z< 1,65) alors X, + X, + ••• -f X„ suit approxi­
d) P (Z > -1,96) mativement une loi ;V(200, 100) si les
variables X sont indépendantes.
e) P(|Z| > 1,5)
1) La loi MO. 100) est une bonne approxi­
f) P(—1,9 < Z< 2)
mation de la distribution de la somme de
g) P(Z< 1,37) 100 variables aléatoires indépendantes
h) P(|Z| <2,57) de moyenne 0 et de variance 1.
6.2 Soit X ~ A^(10, 9). Tracez sommairement j) La loi N(5, 25) est une bonne approxima­
la cloche normale en y indiquant la valeur tion de la distribution de la moyenne de
de la moyenne et des points d’inflexion. 100 variables aléatoires indépendantes
a) Évaluez P(X < 7). de moyenne 500 et de variance 2500.
b) Évaluez P(X > 12,4). Soit X ~ (V(80, 100). Calculez les probabi­
c) Évaluez P(4 < X<suivent.
lités qui 10). Tracez sommairement la
cloche normale pour estimer les probabili­
6.3 Pour chaque énoncé de probabilité ci-dessous,
tés avant de les calculer.
déterminez la valeur de c qui le vérifie,
sachant que Z ~ i0, 1).
N a) P(X < 100)
a) O(c) = 0,940 62 b) P(X < 80)
b) P(|Z| < c) = 0,95 c) iP5 7< X < 100)
c) P(|Z| < c) = 0,99 d) PiX > 75)
d) P(Z < c) = 0,05 e) P (|X - 80 < 19,6)
f) P (|X - 70 > 10)
6.4 Déterminez si les affirmations suivantes
sont vraies ou fausses. 6.6 La durée de vie d’un certain type de piles
a) Si X ~ N(5, 1), alors la probabilité que X sèches obéit à une loi normale, avec une
soit supérieur à 6 est égale à la probabi­ moyenne de 600 jours et un écart-type
lité que X soit supérieur à 7. de 60 jours.
b) Si X~ 7N
( , 9), alors 2 - 5, 9). a) Quelle proportion de ces piles peut-on
s’attendre à voir fonctionner plus de
c) Si X ~ Ni6, 4), alors X/2 - N(3, 2).
699 jours ?
d) Si X ~ Ni 12, 16) et que Y -N i5, 4), alors
une valeur de X choisie au hasard est b) On achète une boîte contenant 10 de
ces piles. Quelle est la probabilité qu'au
toujours supérieure à une valeur de Y
moins deux d’entre elles fonctionnent
choisie au hasard.
durant plus de 699 jours ?
e) Si X - N( 12, 16), que Y ~ W(5, 4) et que
X et T sont des variables indépendantes, 6.7 Une grande entreprise fait passer un test
alors X - Y - N i l , 12). aux personnes qui veulent y travailler. Pour
f ) Lorsqu’une variable aléatoire est obtenir un emploi, les candidats doivent
distribuée selon une loi normale, il obtenir une note minimale de 500.
est aussi probable de sélectionner a) Quel pourcentage des candidats satisfait
au hasard une valeur supérieure à la à cette exigence si les notes sont norma­
moyenne qu’une valeur inférieure à la lement distribuées avec une moyenne de
moyenne. 485 et un écart-type de 30 ?
184 CHAPITRE 6

b) Un candidat reçoit une lettre lui annon­ est supérieure, inférieure ou égale à la
çant qu’il est convoqué à une entrevue valeur calculée en a), lorsque le produit
car 95 % des candidats obtiennent en fini est trop alcalin avec un pH moyen
général une note inférieure à la sienne. de 7,25.
Quelle note a-t-il obtenue au test ? c) Sans faire de calcul, déterminez si la
probabilité qu’on modifie les réglages
6.8 On sait par expérience que le temps
est supérieure, inférieure ou égale à la
de développement d’un certain type
probabilité calculée en b), lorsque le
de papier photo est une variable de loi
N(30secondes, 1,21 seconde2). produit fini est trop acide avec un pH
moyen de 6,75.
a) Déterminez la probabilité que le temps
de développement soit d’au moins 6.12 Le prix demandé pour un certain titre
28 secondes. constitue une variable de loi normale
b) Déterminez la probabilité que ce avec une moyenne de 50 $ et un écart-
temps ne dépasse pas 31 secondes. type de 5 $. Le prix offert par les gens
c) Déterminez la probabilité que ce temps désireux d’acquérir ce titre obéit lui aussi
s’écarte de plus de 2 secondes de sa à une loi normale, avec une moyenne de
valeur moyenne. 45 $ et un écart-type de 2,50 $. Quelle
est la probabilité qu’une transaction ait
6.9 Le flux lumineux d’un certain type d’am­ lieu?
poules obéit à une loi normale, avec une
moyenne de 2500 lumens et un écart-type 6.13 Des condensateurs doivent fonctionner de
de 75 lumens. Pour être jugées conformes 1000 à 5000 heures pour être conformes
pour un certain usage, les ampoules doi­ aux exigences. On sait que leur durée de vie
vent émettre un flux d’au moins lumens. est en moyenne de 3000 heures et qu’elle
Si seulement 5 % des ampoules sont obéit à une loi normale. Chaque condensa­
rejetées, quel est ce flux minimal k ? teur rapporte 9 $ au fabricant, mais celui-ci
doit remplacer tout condensateur défectueux
6.10 Soit des segments de piston dont le dia­ à un coût de 3 $. Deux procédés permettent
mètre intérieur est normalement distribué de fabriquer des condensateurs ayant
avec une moyenne de 12 centimètres et un une durée de vie moyenne satisfaisante.
écart-type de 0,02 centimètre. L’écart-type s’établit à 1000 heures avec
a) Quelle proportion de ces segments a un le procédé A et à 500 heures avec le pro­
diamètre supérieur à 12,05 centimètres ? cédé B. Toutefois, le procédé A entraîne
b) Quelle valeur c du diamètre
unintérieur est
coût de production deux fois moins
excédée par 90 % des segments ? élevé que le procédé B.
c) Quelle est la probabilité que le diamètre a) Quelle est la proportion de conden­
intérieur d’un segment donné se situe sateurs non conformes avec chaque
entre 11,95 et 12,05 centimètres? procédé ?
6.11 La direction d’une usine ordonne l’arrêt b) Déterminez la fonction de masse du
de la production et la modification des bénéfice de chaque procédé, où C cor­
réglages chaque fois que le produit fini a respond au coût de production avec le
un pH supérieur à 7,20 ou inférieur à 6,80. procédé A.
Le pH des échantillons obéit à une loi 9-C 9 - C - 3 J£b
normale dont la moyenne fi est inconnue
et dont l’écart-type a égale 0,10. P(XA) p(x b) 1 0
a) Déterminez la probabilité qu’on modifie
les réglages alors que le pH moyen
c) Quelle valeur de C fait pencher la
s’écarte un peu de la valeur recherchée, balance en faveur du procédé A ?
avec p = 7,05. 6.14 On s’intéresse à la probabilité qu’une
b) Sans faire de calcul, déterminez si la variable aléatoire normale prenne
probabilité qu’on modifie les réglages une valeur supérieure à 10. En estimant
La loi normale

cette valeur à l’aide d’une esquisse de la 6.17 Soit des variables aléatoires notées X
densité (sans calculer explicitement la pour i = 1, 2, ..., n, lesquelles sont indépen­
probabilité), associez chaque probabilité dantes et identiquement distribuées avec-
à la bonne distribution. une moyenne fi et une variance cj2. et la
moyenne de l’échantillon
Distribution P(X > 10)
X = i( X , + X 2 + - " + X„) = i ÿ x , .
N( 16, 16) 0,09 n n 7T\
N (10,0,01) 0,31
Démontrez que E(X)= et que
N(6, 9) 0,50
V(X) = <j2/n.
N(0, 400) 0,93
On doit insérer un tronc d'arbre dont le dia­
6.15 a) Estimez les paramètres et <T2 de mètre est une variable de loi M l,20; 0,0016)
chacune des distributions ci-dessous. dans un tube dont le diamètre intérieur
est une variable de loi N(\,25 ; 0,0009).
Déterminez la probabilité d’un serrage,
c’est-à-dire qu’on ne réussisse pas l’insertion
(voir l’exemple 6.6, à la page 164).
6.19 Soit trois éléments indépendants assem­
blés bout à bout. La longueur de chacun
présente une distribution normale avec
une moyenne de 2 cm et un écart-type
de 0,2 cm. Or, les assemblages produits
doivent avoir une longueur totale de 5,7
à 6,3 cm. Quelle proportion d’entre eux
satisfait à cette exigence ?
6.20 a) Déterminez la moyenne et la variance
b) Quelle est la distribution de la variable de la combinaison linéaire
X + Y +Z si on suppose que les trois r=x,+ 2x2+x3+x4,
variables sont indépendantes ? où X, ~ N(4,3), X2~ N(4,4), X3~ N(2,4),
c) Quelle est la distribution de la moyenne X4~ N(3, 2), et où les variables X,, X2,
de 20 mesures indépendantes de la X3, X4sont indépendantes.
variable X ?
b) Quelle est la probabilité que 15 < Y < 20 ?
6.16 L’indice de dureté Rockwell d’un certain c) Que devient cette probabilité si la corré­
alliage est une variable aléatoire normale lation entre X, et X est de 0,5 ?
de moyenne 70 et d’écart-type 4.
6.21 Toute erreur d’arrondi constitue une
a) Quelle est la probabilité qu’un échan­
variable indépendante uniformément dis­
tillon choisi au hasard satisfasse aux
tribuée sur l’intervalle [-0,5, +0,5]. Si l'on
exigences s’il doit avoir un indice de
dureté compris entre 62 et 72 ? additionne 50 nombres indépendants après
les avoir arrondis, quelle est la probabilité
b) Si l’on accepte tout indice de dureté
que l’erreur d’arrondi totale (en valeur
compris dans l’intervalle [70 - c, 70 + c],
absolue) dépasse 5 ?
pour quelle valeur de c obtient-on 95 %
des échantillons avec la dureté voulue ? 6.22 Soit une boîte renfermant 100 petits
c) Selon les valeurs indiquées en a), boulons. Chacun de ces boulons pèse
combien d’échantillons acceptables en moyenne 1 gramme, avec un écart-
peut-on s’attendre à trouver parmi type de 0,01 gramme. On considère les
9 échantillons choisis au hasard, boulons indépendants les uns des autres.
sachant qu’ils ont chacun un indice Déterminez la probabilité que la boîte pèse
de dureté indépendant ? plus de 102 grammes.
186 CHAPITRE 6

6.23 Une machine automatique remplit des a) En un point d’un circuit où la tension est
boîtes de détergent en poudre. Chaque boîte stable, vous utilisez ce voltmètre pour
doit contenir de 11,8 à 12,2 centilitres de prendre deux lectures consécutives,
détergent. Les seules données mesurées ont qu’on supposera indépendantes. Quelle
trait au poids total du contenu d’ensembles est la probabilité que les deux lectures
de 9 boîtes, lequel s’établit à 107,1 centi­ diffèrent de plus de 0,25 volt en valeur
litres en moyenne, avec un écart-type de absolue ?
0,45 centilitre. b) Au même point du circuit, vous prenez
a) En supposant que le poids des boîtes suit 10 lectures consécutives indépendantes.
une loi normale, déterminez le poids Quelle est la probabilité que la
moyen d’une boîte et son écart-type. moyenne des 10 erreurs de mesure,
b) Quelle proportion des boîtes produites soit comprise entre -0,05 et 0,05 ?
ne respecte pas la norme ?
6.27 Soit X,, ..., X40 des variables aléatoires
6.24 Un autobus assure la liaison entre deux indépendantes et identiquement distri­
villes en passant par trois autres localités. La buées telles que X, ~ Exponentielle(0,2).
moyenne et l’écart-type de la durée de chaque Considérons la variable aléatoire Y, qui
déplacement sont présentés ci-dessous. représente la somme de tous les X,, c’est-
à-dire Y = X, + ••• + X40-
Villes Durée moyenne Écart-type a) Quelle est la loi exacte de la variable Y1
(par paire) (en heures) (en heures) b) En utilisant la loi exacte de Y, on
peut vérifier que P(Y> 150) = 0,9537.
1 -2 3 0,4
Calculez une approximation de cette
2 -3 4 0,6
probabilité en utilisant le théorème
3 -4 3 0,3
central limite.
4 -5 5 1,2
c) Considérons maintenant que la va­
riable T est la somme de 100 variables
En considérant que la durée du trajet aléatoires indépendantes suivant une loi
entre deux localités suit une loi normale, Exponentielle(0,2). La probabilité exacte
quelle est la probabilité que l’autobus effec­ P(400 < T < 600) est de 0,955. Calculez
tue le trajet total en moins de 16 heures ? une approximation de cette probabilité
6.25 L’utilisation d’un procédé de fabrication en utilisant la loi normale.
engendre 8 % d’unités défectueuses. On 6.28 Soit X,, ..., X200des variables aléatoires
prélève chaque jour un échantillon aléatoire indépendantes et identiquement distribuées
de 200 unités pour en déterminer le nombre telles que X, ~ Poisson(0,5). Considérons
d’unités défectueuses, noté X.En recourant à la variable aléatoire Y, qui représente la
la loi normale comme approximation de la loi somme de tous les X(, c’est-à-dire
binomiale, effectuez les calculs qui suivent.
1Y = X h— +' ^200*
X
a) P(X < 16) a) Quelle est la loi exacte de la variable Y1
b) P(X= 15) b) En utilisant la loi exacte de Y, on peut
c) P( 12 < X < 20) calculer les probabilités suivantes :
d) P(X = 14) P(Y= 100) = 0,0399 et P(89 <Y< 120)
6.26 Vous possédez un voltmètre ayant une = 0,831. Calculez une approximation
erreur de mesure distribuée selon une loi de ces deux probabilités en utilisant le
normale de moyenne 0 et de variance théorème central limite.
0,1 volt2. En somme, chaque fois qu’on c) Quelle est la probabilité (approximative,
prend une mesure de tension X,, celle-ci sans correction de continuité) que la
correspond à la somme de la vraie valeur S moyenne de ces 200 valeurs soit infé­
et de l’erreur de mesure <?,. rieure à 0,42 ?
La loi normale 187

6.29 Une entreprise produit des bouteilles de jus 6.31 Une compagnie fabrique des fusibles dont
d’orange d’environ 2 litres. Une machine la durée de fonctionnement peut être appro­
remplit à moitié chaque bouteille de chée par une distribution normale ayant une
concentré, et une autre machine la remplit moyenne de 1000 heures et un écart-type
à moitié d’eau. de 200 heures.
• La quantité (en litres) de concentré a) Quelle est la probabilité qu’un fusible
versée par la première machine (notée X) fonctionne pendant plus de 1330 heures ?
suit une loi N(0,9& ; 0,0009). b) La compagnie aimerait offrir une
• La quantité (en litres) d’eau versée par la garantie de remplacement pour tout
seconde machine (notée Y) suit une loi fusible dont la durée de fonctionnement
N(l,02; 0,0016). ne dépasse pas x0heures. Déterminez la
a) Quelle est la probabilité qu’une bouteille plus grande valeur de a;, si la compagnie
contienne plus de 1,98 litre de jus ? compte remplacer au maximum 2,5 %
b) Une fois la production terminée, 90 % de ses fusibles avec cette garantie.
*
des bouteilles contiennent moins de c) Un échantillon de 10 fusibles est pris
k millilitres de jus (un mélange d’eau au hasard et mis en service dans un
et de concentré). Quelle est la valeur procédé où ils fonctionnent indépen­
de k l damment les uns des autres.
c) On choisit aléatoirement 25 bouteilles i) Calculez la probabilité qu’au moins
pour le contrôle de qualité et on mesure 8 des fusibles de l’échantillon ne
le volume de jus de chacune. Quelle fonctionnent plus après 1330 heures ?
est la probabilité que le volume de jus Justifiez votre raisonnement.
moyen de ces bouteilles soit supérieur ii) Quelle est la probabilité que la
à 1,98 litre? v. durée moyenne de fonctionnement
des 10 fusibles de l’échantillon soit
6.30 Un procédé est utilisé pour la production
supérieure à 1100 heures ?
de cylindres dont la longueur (en centi­
mètres) est distribuée selon une loi normale 6.32 Une machine sert à produire des panneaux
(gaussienne) de moyenne 5 avec un écart- de clôture dont la longueur (en mètres) X
type G ajustable. Un cylindre est considéré est distribuée selon une loi uniforme dans
comme étant conforme si sa longueur l’intervalle [2,995, 3,005]. Supposons que
se trouve dans l’intervalle (spécifications) pour une application particulière, un pan­
5 ± 0,02 centimètres. neau est considéré comme étant conforme
a) Supposez que l’écart-type est ajusté à si sa longueur (en mètres) se situe dans
G = 0,01 centimètre. l’intervalle [2,996, 3,004].
i) Calculez la probabilité qu’un cylindre a) Quelle est la proportion de panneaux
ait une longueur conforme. conformes de la production ?
ii) De manière approximative, quelle b) Supposez que le contrôle de la qualité
est la probabilité qu’un lot de de cette production consiste à examiner
180 cylindres contienne moins un panneau de la production toutes les
de 5 cylindres non conformes ? demi-heures. Déterminez la moyenne et
b) Les cylindres produits sont utilisés dans l’éCart-type (en minutes) du temps néces­
des assemblages. Chaque assemblage est saire pour trouver un premier panneau
constitué de 4 cylindres placés bout à non conforme.
bout. Les spécifications pour la longueur c) Un client commande 120 panneaux
totale (en centimètres) de l’assemblage qu’il mettra bout à bout pour construire
sont de 20 ± 0,033 centimètres. une clôture. Soit T la longueur totale
Quelle devrait être la valeur maximale de la clôture que le client obtiendra.
de G pour qu’au moins 95 % des assem­ Calculez approximativement la probabi­
blages soient conformes ? lité P(359,95 < T< 360,05).
CHAPITRE 6

6.33 On dispose de composants de type A et a) Déterminez la moyenne et la variance


de composants de type B. On suppose que de W = e2 X2X\'5x \'2%.
la durée de fonctionnement d’un compo­ b ) Établissez les limites L e t R telles que
sant de type A est distribuée selon une loi P(L < W<R) = 0,90.
exponentielle ayant une moyenne de 10 ans ;
celle d’un composant de type B est distribuée 6 .3 6 Soit X, la durée de vie utile de tubes d’un
selon une loi normale ayant une moyenne de certain type et X2, le diamètre de leur fila­
7 ans avec un écart-type de 1,82 an. ment. Ces deux variables obéissent à une
a) Calculez la fiabilité d’un composant loi normale bivariée de paramètres
de type A pour une période de 4 ans //, = 2000 heures, / a = 0,10 pouce,
(c’est-à-dire la probabilité de fonctionner cj2= 2500 heures2, <72 = 0,01 pouce2
pendant au moins 4 ans). et p =0,87. On souhaite déterminer la
b) On considère un système constitué de durée de vie de chaque tube en mesurant
ncomposants de type A : A,, ..., A„ le diamètre de son filament.
fonctionnant indépendamment les uns a) Quelle est la probabilité qu’un tube
des autres et montés en parallèle (le dont le filament a un diamètre de 0,098
système ne fonctionne que si au moins fonctionne plus de 1950 heures ?
un des ncomposants fonctionne). Quelle
b) Sans faire le calcul explicitement,
doit être la valeur minimale de n pour déterminez si la probabilité calculée
que ce système ait une fiabilité de 0,999 en a) serait supérieure ou inférieure
pour une période de 4 ans ? si le diamètre du filament était de
c) On considère à présent un assemblage 0,11 pouce.
constitué de 4 composants dont 2 sont
de type A (notés A, et A2) et 2 sont de 6.37 Un professeur remarque que les notes
type B (notés B, et B2) montés selon attribuées à deux contrôles obéissent à une
le schéma ci-dessous. On suppose que loi normale bivariée de paramètres //, =75,
les composants fonctionnent indépen­ //j = 83, cr2 = 25, <j 2 = 16 et = 0,8.
damment les uns des autres et que le a) Quelle est la probabilité qu’une étu­
système fonctionne s’il y a au moins diante ayant obtenu 80 au premier
un chemin, constitué de composants contrôle ait un meilleur résultat au
qui fonctionnent, entre les points 1 et 2. second ?
Calculez la fiabilité (probabilité de fonc­ b) En quoi la probabilité calculée en a)
tionner) de cet assemblage pour une différera-t-elle si p = -0,8 ? Répondez
période de 4 ans. sans faire le calcul explicitement.
6.38 Considérons le vecteur aléatoire
[X,, X2] ~ N2(50, 10, 9, 16 ; -0,8).
Déterminez laquelle des deux quanti­
tés proposées est la plus grande (ou si
elles sont égales), sans faire le calcul
6.34 La variable aléatoire = ln Xobéit à une explicitement.
loi N (50, 25). Déterminez la moyenne, la a) P(Xx> 40) ou P(X] > 60)
variance, le mode et la médiane de X. b) P(Xx> 53) ou P(X2> 14)
6.35 Soit des variables aléatoires indépendantes c) P(X2 > 10) ou P(X2 > 10 | X, = 56)
7,, Y2et y3telles que d) P(X2> 6 | X, = 44) ou P(X2 > 6 | X, = 56)
= ln X, -- N(4, 1), e) E(X21X, = 45) ou E(X21X, = 50)
*i =
y2== ln X2 -- N(3, 1), f ) V(X2 ) ou V(X2 1X, = 45)
y3== ln X3 -- N(2, 0,5) g) V(X21X, = 45) ou V(X21X, = 55)
La loi normale

6.39 Considérons le vecteur aléatoire e) Si p<0, alors le lien linéaire entre X


[X,, X2] ~ N2(12,100, 36, 9 ; p). Déter­ et X2est très faible.
minez si les énoncés suivants sont vrais f) Si p diffère de 0, alors K(XJ > V(Xt | vj.
ou faux. g) Si p > 0, alors £(X,) > E(Xf | x2) pour
a) X, ~ N{ 12, 36) tout jc2.
b) La variance de X2dépend de la valeur 6.40 Laquelle des distributions ci-dessous est
de p. représentée par la figure 6.18 ?
c) La variance de X! sachant <jue X, = 90 a) N2(S, 30,4, 100, 0,9)
est la même que la variance de X,
b) N2(2, 14, 0, 60, 0,015)
sachant que X2= 100.
d) La valeur de £(X21jc,) augmente c) /V2(30, 8, 2, 10, -0,8 )
lorsque x{augmente, peu importe d) A^2(8, 30, 4, 100, -0,9)
la valeur de p. e) A^2(8, 30, 2, 10,-1)

f La loi normale à deux variables associée à l'exercice 6.40 (densité conjointe


et courbes de niveaux)
^ ans les six prem iers chapitres, nous avons traité de probabilités. D ans
les contextes que nous avons étudiés, le m odèle probabiliste (la loi de
JÈ, probabilité) ainsi que la valeur des param ètres associés étaient toujours
connus. La question était de savoir ce qui se passe lorsqu’on prend une obser­
vation (ou plusieurs) de la variable d ’intérêt dont le com portem ent aléatoire
est parfaitem ent caractérisé par une fonction de m asse ou de densité. A p artir
de m aintenant, nous allons considérer la situation inverse, où nous ne connaissons
que les valeurs d’un échantillon observé, duquel nous espérons tirer des conclusions
sur la population dont il provient et sa distribution. N ous entrons dans le m onde
de la statistique.

La statistique fait intervenir la collecte, la présentation et l’analyse de données ; elle vise à


illustrer des tendances, à prendre des décisions, à faire des estimations et à vérifier des hypo­
thèses sur les paramètres d’un modèle. Une connaissance approfondie de la statistique et de
ses outils élémentaires revêt une importance particulière en génie, en sciences et en gestion,
car ces spécialités nécessitent couramment de traiter des données.
Dans ce chapitre, nous traiterons de la présentation et de la description des données. Dans
les chapitres suivants, nous ferons appel aux notions de probabilité précédemment étudiées afin
de modéliser la variabilité dans un cadre d’inférence statistique.

7.1 Les concepts de base en statistique


Une variabilité omniprésente
Presque tous les processus du monde réel démontrent une certaine variabilité. Par exemple,
on peut tirer des pièces moulées d’un lot pour en mesurer le diamètre. Si l’on utilise un instru­
ment de mesure suffisamment précis, on obtiendra différents résultats (le diamètre variera).
On arrive aussi à des résultats différents lorsqu’on dénombre les défauts de circuits imprimés,
certains circuits comportant peu de défauts et d’autres, plusieurs. D’autres exemples de gran­
deurs variables sont le revenu annuel d’un individu, la quantité de précipitations en janvier à
Montréal, le rendement quotidien d’un placement boursier, le nombre d’erreurs à l’intérieur de
bons de commande, le temps nécessaire à l’assemblage d’un moteur d’avion et la consommation
mensuelle de gaz propane d’un restaurant du Vieux-Québec. Les données recueillies durant des
expériences présentent aussi presque toujours une certaine variabilité.
Qu’est-ce qui explique cette variabilité ? Dans un contexte industriel, il s’agit en général
d’un phénomène attribuable à un changement dans les conditions de production. Par exemple,
La statistique en bref et la description des données 191

il se peut que les échantillons de matières utilisées diffèrent, tout comme la façon de travail­
ler des gens, les variables liées au procédé (telles que la température, la pression ou le temps
de séjour) et les facteurs ambiants telle l’humidité relative. La variabilité des données résulte
également des instruments de mesure utilisés. Il arrive, entre autres, qu’une balance fournisse
une mesure différente selon l’endroit où se trouve l’objet à peser sur son plateau. Le mode
de sélection des unités à examiner peut aussi engendrer une certaine variabilité, ainsi que la
diversité naturelle entre les individus d’une population.

La population e t l'é c h a n tillo n


La statistique englobe les méthodes servant à décrire et à modéliser «a variabilité. On distingue
souvent la statistique descriptive (qui résume l’information contenue dans un ensemble de don­
nées par des graphiques et des mesures numériques) de la statistique in*brenîielle (qui vise à
estimer un paramètre ou à vérifier une hypothèse concernant une population en se basant sur
un échantillon qui en est extrait). Voici quelques définitions de base.

Variable

La variable est la caractéristique visée par l’étude.


Individu

L’individu est l’unité sur laquelle on mesure une ou plusieurs variables.


Population

La population est l’ensemble des N individus sur lesquels porte l’étude. Il arrive que N soit considéré
comme infini, par exemple si on étudie des bactéries ou une production de vis.
Échantillon

L’échantillon est un sous-ensemble (de taille n) de la population.


Échantillon aléatoire simple

L’échantillon aléatoire simple est un échantillon pigé au hasard dans la population, de telle sorte que
tous les éléments ont la même chance d’être pigés.

On notera Xr X2, ..., Xn un échantillon aléatoire théorique (avant qu’il soit pigé), et je, x 2,
..., x l’échantillon observé. On utilisera des parenthèses sur les indices pour Léchant il km
ordonné (dont les observations sont placées en ordre croissant) :

*(!)’ X(2Ÿ ***»X(n)

minimum maximum.
• •

Les types de variables aléatoires


Il existe plusieurs types de variables, et on les classe souvent comme dans le tableau 7.1 (voir à
la page suivante).
Évidemment, le choix de l’analyse statistique appropriée dépend du type de variables en
cause. Dans cet ouvrage, l’attention est portée principalement sur les variables quantitatives.
Notons que des variables discrètes par définition sont parfois traitées comme des variables
continues lors de l’analyse, lorsque le nombre de valeurs possibles est élevé.
192 CHAPITRE 7

.t- av "vV * 'C ’i •V æ ' w- /î ‘iftî: .■


1 ^V. i ■*- ». 1 l^i 1 f-tfVl *V* .h» j, '•
rag? v T * 1• î l ®Bf f r i ~N 1wJ
i _* jr » < » mv 1 " ,/j a |
M
■ wI *• 1
f
fl
* /1 I■ m^, L J v l * | S
f _ f> * 8
7/ t1
vv C
» ,1> !ij B
\’ — • ” » . ■
L • -, V

j Qualitatives Quantitatives
Elles ne font pas référence à un système Elles font référence à un système numérique.
| numérique.
1 Nominales Ordinales Discrètes J Continues j
Les modalités ne Les modalités peuvent L’ensemble des valeurs Les valeurs possibles se
peuvent pas être être ordonnées. possibles est fini ou trouvent dans un inter­
ordonnées. dénombrable. valle de la droite réelle.
Exemples: Exemples : Exemples : ' Exemples :

couleur
• •niveau de scolarité • nombre d’enfants temps

ville
• • niveau de satisfaction • nombre de produits vitesse

• marque • niveau de douleur • nombre de lancers température


de dés

La statistique descriptive
On appelle « statistique descriptive » la branche de la statistique visant à structurer, à résumer
et à présenter des données. Nombre de méthodes utilisées en statistique descriptive existent
depuis plus de 200 ans et tirent leur origine des activités de sondage et de recensement. Grâce
à l’informatique en général et à l’infographie en particulier, la statistique descriptive s’est beau­
coup développée au cours des dernières années. On peut recourir aux méthodes statistiques
descriptives lorsqu’on étudie soit l’ensemble d’une population finie, soit un échantillon.
Il existe un large éventail de logiciels qu’on peut utiliser en statistique descriptive. Ces logi­
ciels varient quant à leur utilisation première, leur degré de complexité et leur portée. Il peut
s’agir de simples tableurs comme Excel® de Microsoft, de logiciels plus évolués mais néanmoins
conviviaux tel Minitab®, de logiciels libres comme R, ou de progiciels complets comme SAS®.

L'organisation des données


Pour collecter et enregistrer les données, on recourt à l’observation humaine, puis à des tableaux
sous forme de chiffriers. En règle générale, chaque ligne se rapporte à un individu, alors que
les colonnes indiquent les valeurs d’une ou de plusieurs variables. Il est fréquent d’utiliser une
colonne pour permettre l’identification des n individus.
Le tableau 7.2, tiré de Montgomery et Runger (2003), indique la résistance à la traction,
la longueur des fils d’interconnexion et la hauteur de la puce de 25 circuits à semi-conducteurs
provenant d’une même usine. Lorsqu’un classement nominal s’impose, on réserve une colonne
à chaque variable nominale et on y indique le code de chaque unité. On pourrait ainsi représen­
ter les quarts de travail de jour, de soir et de nuit respectivement par les lettres J, S et N.

7.2 La présentation graphique des données


Nous allons maintenant examiner quelques-unes des nombreuses façons de résumer et de
présenter des données sous forme graphique ou tabulaire. Notons que tout bon graphique
devrait contenir certaines annotations, comme un titre, des étiquettes identifiant les axes et une
légende, au besoin. Un bon titre ne devrait pas mentionner explicitement le type de graphique
La statistique en bref et la description des données 193

dont il est question, mais plutôt évoquer ce qu’il cherche à représenter. Or, nous ferons quelques
exceptions à cette règle dans ce chapitre pour des raisons pédagogiques, car nous étudions pour
la première fois chaque type de représentation.

7.2.1 Le graphique de points et le nuage de points


Une variable
Lorsqu’on ne s’intéresse qu’à une seule des variables associées aux unités observées, un
graphique de points permet de présenter ces données univariées sous une forme simple et
attrayante qui en fait voir l’étalement, les valeurs extrêmes, la tendance centrale et toute
lacune. On trace une droite horizontale, et on la gradue en fonction de la plage des valeurs
observées. Chaque observation est ensuite exprimée par un point situé directement au-dessus
de cette droite. Lorsque plusieurs observations ont fourni la même valeur, on les représente
simplement par des points alignés à la verticale de la valeur correspondante de la droite. Un
graphique de points constitue un bon mode de présentation lorsqu’il y a peu d’unités (moins
de 30, par exemple).

M-jI'

194 CHAPITRE 7

Exemple 7.1
La figure 7.1 montre chacune des variables du tableau 7.2 sous la forme d’un graphique de points.

//
~r
10 20 30 40 50 60 70
Résistance à la traction

5 10 15 20
Longueur des fils

100 200 300 400 500 600


Hauteur de la puce

Les graphiques de points de la résistance à la traction, de la longueur des fils


et de la hauteur de la puce

Deux variables
Lorsqu’on souhaite présenter ensemble les valeurs de deux variables, on recourt à l’équivalent bidi­
mensionnel d’un graphique de points, appelé « nuage de points » ou « diagramme de dispersion ».
On délimite un simple plan cartésien où l’une des variables figurera en abscisse et l’autre, en ordon­
née. Il n’est pas nécessaire que les axes commencent à 0, mais il faut s’assurer que tous les points
sont représentés sur le diagramme. On reporte ensuite chaque observation dans ce plan.

Exemple 7.2
La figure 7.2 illustre, sous forme de nuages de points, la résistance à la traction par rapport à la lon­
gueur des fils et par rapport à la hauteur de la puce selon les données du tableau 7.2.


• •

• •


• •


• •
•••
• t
••
• •
• •

0 100 200 300 400 500 600


Longueur des fils Hauteur de la puce
■ a mm ma B ^ •*****"******— — ----- *------------------- T----- t t— ^ ~ . . . . . . . . . . . - -------- ■
--------- ‘ ~| 1 “ * - r ------------u « i* ~ i i n mi r i----- r r i n r * ~i—— _ — — - — r-"— — - . ■ * - • , — r , — |----------- r - , — ----- --------- , ------- n » , n n i iu j l » j p i n 3 <I I , i r r i * ■ — ah- r - (- r i - ‘ ■- ■ i___________

L! Les nuages de points de la résistance à la traction par rapport à la longueur


m,
des fils et par rapport à la hauteur de la puce
La statistique en bref et la description des données 195

Si des couples de données sont identiques et occupent ainsi un même point du plan, on peut
laisser les points se superposer, ou l’indiquer en remplaçant les points par des lettres. La lettre A
représente alors un point où figure une seule observation, la lettre B, un point où figurent deux
observations identiques, et ainsi de suite.
Non seulement un nuage de points fait voir la région où se situent les données et leur
concentration à l’intérieur de celle-ci, mais il révèle des liaisons possibles entre les variables.
Par ailleurs, son utilité ne se limite pas aux petits ensembles de données.

Trois variables
dimension
tion des données associées à trois variables, on peut créer un nuage de points tridimensionnel
comme celui de la figure 7.3 (qui reflète les données du tableau 7. 2 ),

.
4

Le nuage de points tridimensionnel de la résistance à la traction, de la longueur


des fils et de la hauteur de la puce

Une autre possibilité consiste à tracer un diagramme à deux dimensions où l’aire de chaque
point est proportionnelle à la valeur de la troisième variable. À l’instar d’un nuage de points, ces
deux types de diagrammes révèlent eux aussi des liaisons possibles entre les variables en cause.

7.2.2 Le tableau de fréquences et ('histogramme


Le tableau 7.3 (voir à la page suivante) indique la résistance en livres par pouce carré (lb/po2)
de 100 bouteilles en verre de 1 litre. On a obtenu ces données en soumettant chaque bouteille
à un essai d’éclatement. Présentées dans l’ordre où on les a recueillies, comme elles le sont au
tableau 7.3, ces données ne révèlent pas grand-chose au sujet de la résistance à l’éclatement
des bouteilles. En effet, il n’est pas facile de déterminer, à partir de ce tableau, la résistance
moyenne des bouteilles ou la proportion d’entre elles ayant éclaté sous une pression inférieure à
230 lb/po2. Une première étape de l’analyse serait d’ordonner les résultats (voir le tableau 7.4,
à la page suivante).
Une distribution de fréquences (ou tableau de fréquences) est un résumé de données plus utile
qu’une simple énumération comme celle des tableaux 7.3 et 7.4. Pour la créer, il faut d’abord diviser la
plage des données en intervalles, connus sous le nom de « classes ». Dans la mesure du possible, ces
intervalles devraient tous être de même longueur pour favoriser la clarté visuelle de l’information.
CHAPITRE 7

L

Le nombre de classes idéal


Il faut choisir le nombre d’intervalles avec discernement pour bien présenter les données. Une
distribution de fréquences qui compte un trop grand ou un trop petit nombre de classes rend
difficile la lecture des tendances dans les données. Les figures 7.5 et 7.6 {voir à la page 198)
illustrent bien ce problème. Le nombre de classes devrait augmenter en fonction de n et se situer
entre 5 et 15 dans la plupart des cas. Créer un nombre de classes à peu près égal à la racine
carrée du nombre d’observations constitue fréquemment une bonne solution dans la pratique.

Exemple 7.3
Comme on a ici un ensemble de 100 données, on s’attend à ce qu’une distribution de fréquences
satisfaisante compte environ V 100 = 10 classes. Il faut s’assurer d’inclure toutes les observations
dans nos intervalles. Neuf classes englobant chacune 20 lb/po2, allant de 170 à 350, permettent ici
d’établir une bonne distribution de fréquences ( voirle tableau 7
La quatrième colonne du tableau 7.5 indique la fréquence relative de chaque classe, déterminée en
divisant sa fréquence observée par le nombre total d’observations. La dernière colonne du tableau
indique pour sa part la fréquence relative cumulée. Une distribution de fréquences se révèle souvent
plus facile à interpréter qu’une table de données. On découvre ainsi aisément à la lecture du tableau 7.5 ►
La statistique en bref et la description des données 197

que la plupart des bouteilles ont éclaté sous une pression de 230 à 290 lb/po2 et que 13 % d’entre elles
ont éclaté sous une pression inférieure à 230 lb/po2.
■BFl J!f-Y*
S
.

- . < - ^ . k ~ A . — ^ X _ #
,

X y , . ,
.

,
1 .

a - r * ^
.

. L
*

. ,
*FI fT^XjT1giikJT|^W|
}
t

-
1 \

. f w
> 4

i .
!

, ‘k j f n
>

n
j l

a ' '
J ,

« < ■
,

> ,
y T J y

--- \

/
X I

î v . . / . A
~» ,.

, ______ - *
W T

^ 7 : v . A . _____ 1
• y

2 !
t

S
*-

1. j l A
- . * • « H » « '

fT*Pi7TTnTT>TyW*»[AT?Jpi
a

^
i

_
j *

*
'

i .
/ V

* .
v ’i w

/
A

»
V

,
’.

\
j j i .

> . * y , ” - ~ l r " , 3
!

f
' V .

i / i . ^ 1
. 7 *

V ? . A J j l i
y

I . A L
■"

J
* X r * , y

V i . ,
. y

. V
]

v V
rj^|
’v 4 .
__

'* ' . C i . / , ’l V ' * " - J - v > . 3 1


|

I . . . 4 • .* - ■ . , ■ ' m V yft ^ v • a ' , ' . V > . / ' H c u i t M T ^ • * » * . 7 .■ A T * • r ^ . • " . ' / k C " < - * > A h • * " • . ^ ’ > • - ! + - j r ._ * ' , * -, £ ■

Classe F réquence Fréquence Fréquence


J (en lb/po2) 1 Effectif observée^, j relative f j t i relative cumulée
170 < jc < 190 II 2 0,02 0,02
190 < jc <210 llll 4 0,04 0,06
w
210 < jc <230 111 7
0,07 0.13
230 < jc <250 f l III ! 13 !
0,13 ! 0,26
250 < jc < 270 UU U ü U il UU MM U ü II
TTÎTtttt tttt Tttt ttît tttî 11 32 0,32 1 0,58
270 < jc < 290 1 i i i i l l l l | 0.24 0,82
24
290 < jc < 310 l i l 11 0,11 0,93
310 < jc <330 llll 0,04 0,97
4
330 < jc < 350 0,03 1,00
3

1 j 1 1 1

n= 100 1 1,00

L'histogramme dont les classes ont la même longueur


On gagne aussi à présenter la distribution de fréquences sous une forme graphique, qu’on appelle
un « histogramme ». Pour tracer ce type de graphique, on inscrit l’échelle de mesure sur l’axe hori­
zontal et on y situe les limites des classes ; l’échelle des fréquences (observées ou relatives) est pré­
sentée sur l’axe vertical. L’axe horizontal peut être sectionné (voir la figure 7.4, à la page suivante),
mais l’axe des fréquences doit absolument commencer à l’origine afin d’éviter les distorsions qui
donneraient lieu à de mauvaises interprétations. Si toutes les classes sont de même longueur, la
hauteur de chaque rectangle doit être proportionnelle à la fréquence de la classe correspondante.
Un histogramme devrait servir à représenter la distribution de variables continues seule­
ment. L’histogramme offre un aperçu visuel de la forme de la fonction de densité, de même que
des renseignements sur la tendance centrale et la dispersion ou l’étalement des données.
En présentant les données initiales sous la forme d’une distribution de fréquences ou d’un
histogramme, on perd une certaine quantité de renseignements, car on ne dispose plus des
observations individuelles. Cette perte s’avère toutefois peu importante par rapport à la faci­
lité d’interprétation d’une distribution de fréquences ou d’un histogramme. Si les données ne
prennent que quelques valeurs distinctes, un graphique de points est susceptible d’être une
meilleure représentation graphique.

Exemple 7.4
L’importance du choix du nombre de classes dans la distribution de fréquences est bien représen­
tée par les figures 7.4 à 7.6 ( voirà la page suivante). La figure 7.4 présente
libré des 100 mesures de résistance du tableau 7.4. Par contre, l’histogramme à 3 classes ( la
figure 7.5) n’illustre pas suffisamment de détails dans la distribution des données. À l’inverse, l’histo-
gramme à 36 classes ( voirla figure 7.6) peine à faire ressortir les tendances globales qu
dans les données, à cause de l’excès de détails. ►
CHAPITRE 7

/
i

!
Résistance à l’éclatement (lb/po2)
' *
-
c
. -

Hji K ; f

F*
>•
-V

«*>
. " »

*
a
^

. « , V -, . * - J

t > X
V r K
fc

i "
V J

J .

L'histogramme de la résistance à l'éclatement de 100 bouteilles en verre


de 1 litre
B & H W U a M H a B U S S M M B I B H l

i . .

i.
KV • - i

I /
Un histogramme ayant un nombre insuffisant de classes

/ >
«

î
;

■ W

\
M

i
B

r •
Un histogramme ayant un trop grand nombre de classes
La statistique en bref et la description des données 199

L'histogramme dont les classes sont de longueur inégale


Si la longueur des classes varie, il faut que l’aire de chaque rectangle soit proportionnelle à la
fréquence de la classe correspondante, ce qui donne un histogramme de densité. On calcule
la hauteur de chaque rectangle ainsi :
Fréquence relative de la classe
Densité = Hauteur du rectangle
Longueur de la classe

Si l’on observe plusieurs intervalles vides après avoir groupé les données à l’intérieur de
classes de même longueur, on peut les fusionner avec des intervalles conLtus et ainsi créer
de plus larges classes pour rendre l’histogramme de densité plus attrayant. Toutefois, il est plus
facile d’interpréter un histogramme où toutes les classes sont de même loi.tueur.

Exemple 7.5

Longueur
de la classe ' V
Fréquence )

6° 1 3

2° 13
20 32
20 24
20 11
40 7
1 100
200 CHAPITRE 7

En résumé, les histogrammes sont des graphiques d’une grande utilité pour mettre en
évidence la position et la variabilité des données ainsi que la forme de leur distribution. Par
contre, ils ne permettent pas de distinguer les données individuelles, puisque toutes les obser­
vations comprises dans une même classe y sont confondues.

7.2.3 Le diagramme en boîte


Un diagramme en boîte peut être utilisé pour représenter la distribution de variables quanti­
tatives, qu’elles soient discrètes ou continues. Il est constitué d’un rectangle et de segments de
droite placés au-dessus d’un axe numérique couvrant l’étendue des données. On utilise parfois
les termes « diagramme en boîte à moustaches » ou « diagramme de quartiles » pour désigner
ce type de graphique. On peut tracer un tel graphique à la verticale ou à l’horizontale.
Le rectangle indique la position des trois quartiles (c’est-à-dire les trois valeurs Ql, Q2 et
<23 qui séparent l’échantillon ordonné en quatre sous-groupes de fréquence relative 25 tels
que définis plus loin à la sous-section 7.3.1). Le côté gauche du rectangle est placé vis-à-vis du
premier quartile <21 î le côté droit vis-à-vis du troisième quartile Q3. La longueur de la base
du rectangle est appelée « écart interquartile » (EIQ = Q3 —Ql) et représente l’étendue de la moitié
centrale des données.
À l’intérieur de ce rectangle, on trace un segment de droite à l’endroit où se situe le deuxième
quartile <22 (c’est-à-dire la médiane Q2 = x).Deux segments de droite,
taches », s’étendent de chaque côté du rectangle jusqu’aux dernières données situées à moins de
1,5 écart interquartile de la boîte, c’est-à-dire dans l’intervalle [ 0 - 1,5 EIQ ; <23 + 1,5 EIQ].
Les données situées à l’extérieur de cet intervalle sont dites « extrêmes » ou « aberrantes » et sont
indiquées individuellement par un point ou un astérisque.

Exemple 7.6
La figure 7.8 présente sous la forme d’un diagramme en boîte les données relatives à la résistance à
l’éclatement de bouteilles.
• Les trois quartiles prennent les valeurs suivantes (voir l'exemple 7.14) :
0 = 248,
Ql = 265,
Q3 = 280.
Ce sont ces trois valeurs qui positionnent la boîte.
• L’écart interquartile vaut EIQ = Q3 - Ql =280 - 248 = 32.
• La moustache inférieure s’étend jusqu’à la dernière donnée supérieure ou égale à Ql —1,5 x EIQ
= 200 (donc jusqu’à 202).
• La moustache supérieure s’étend jusqu’à la dernière donnée inférieure ou égale à <23 + 1,5 x EIQ
= 328 (donc jusqu’à 328).
Les six observations se situant à l’extérieur de l’intervalle [200, 328] sont considérées comme
extrêmes. ►
La statistique en bref et la description des données 201

On voit sur le diagramme que la distribution des données est relativement symétrique par
rapport à la valeur centrale, les deux moustaches et les deux parties du rectangle étant à peu près
de même longueur, et que les valeurs dites extrêmes sont réparties également de chaque côté du
graphique.

Le diagramme en boîte de la résistance à l'éclatement de bouteilles

La comparaison de plusieurs échantillons


Si un histogramme est préférable pour illustrer la distribution d’un jeu de données, les dia­
grammes en boîte juxtaposés sont un outil très utile pour comparer la distribution de deux ou
plusieurs échantillons.

Exemple 7.7
Les données du tableau 7.7 sont des mesures de viscosité associées à trois mélanges différents
de matières premières qu’on utilise à l’intérieur d’une chaîne de fabrication. La figure 7.9 ( à
la page suivante) nous permet de voir que le mélange 1 semble plus visqueux que le mélange 2,
lui-même plus visqueux que le mélange 3. La viscosité de chacun n’est pas distribuée de façon
symétrique, et la valeur maximale de la viscosité du mélange 3 semble anormalement élevée par
rapport aux autres mesures obtenues. Il pourrait s’agir d’une observation aberrante méritant une
analyse plus poussée.
202 CHAPITRE 7

Les diagrammes en boîte de la viscosité de mélanges selon les données


du tableau 7.7

7.2.4 Le diagramme en bâtons


Lorsque les données observées sont qualitatives ou discrètes, comme dans le cas d’un dénom­
brement, on utilise plutôt un diagramme en bâtons. Contrairement à l’histogramme, les rec­
tangles sont séparés par un espace dans le diagramme en bâtons. La hauteur des rectangles doit
correspondre à la fréquence observée ou à la fréquence relative des valeurs en cause.

Exemple 7.8
La figure 7.10, construite à partir de 77 observations, représente la distribution des types de défauts
d’une pièce métallique faisant partie de l’armature de portières d’automobiles. On voit tout de suite
quelles sont les failles les plus souvent identifiées : la forme déficiente et le mauvais détourage.
/
30
gP 25
ooo
20
•8
8 15
a
<D
§<i°
5
0
& -N. sV «&
,J ? «JP
X) sSy
« O
&

S J

Type de défauts
J
k

Le diagramme en bâtons pour la distribution du type de défauts


des armatures d'une portière
La statistique en bref et la description des données 203

Dans le cas de variables qualitatives (catégoriques), il arrive qu’on place les bâtons en ordre
décroissant d’importance. Cela n’a évidemment pas de sens pour des variables quantitatives
discrètes.

Le diagramme circulaire
On voit souvent une autre représentation graphique pour les données qualitatives : le diagramme
circulaire (ou diagramme en pointes de tarte). Pour chaque secteur circulaire, l’angle au centre
est proportionnel à la fréquence de la modalité. Il faut donc évaluer des surfaces en pointes de
tarte pour comparer l’importance des catégories. À moins d’avoir 2 ou 3 catégories seulement,
le diagramme en bâtons est toujours préférable, car il est plus facile de comparer des longueurs
que des surfaces.

7.2.S Le diagramme quantile-quantiie


Les méthodes graphiques sont aussi utiles au moment de choisir une loi de probabilité pour
modéliser les données. L’histogramme, par exemple, donne une idée de la forme de la fonc­
tion de densité d’une variable aléatoire continue. Le diagramme quantile-quantile, aussi
appelé « graphique de probabilité », est une autre méthode graphique servant à déterminer si
les données se conforment à une loi hypothétique. Pour tracer le graphique de probabilité, on
commence par classer les observations dans l’échantillon de la plus petite à la plus grande.
Autrement dit, l’échantillon x v x2, ..., xn est arrangé sous la forme jc(1), x av ..., , où
x U) < x u + 1}. Les observations ordonnées x U) sont considérées approximativement comme
les quantiles échantillonnaux et sont représentées en fonction des quantiles théoriques
correspondants selon la loi avec laquelle on veut comparer les données. Si la loi hypothétique
décrit convenablement les données, les points représentés décriront approximativement une
droite ; si la forme des points représentés s’écarte de façon significative d’une droite, alors
le modèle hypothétique ne convient pas. Considérer que le nuage de points correspond à une
droite ou non est habituellement subjectif.

Exemple 7.9
Pour illustrer le diagramme quantile-quantile, considérons les données suivantes :
-0,314 1,080 0,863 -0,179 -1,390 -0,563 1,436 1,153 0,504 -0,801.
Supposons qu’on veut vérifier graphiquement l’hypothèse que ces données sont convenablement
modélisées par une loi normale. On arrange les observations par ordre croissant et on calcule les
fréquences relatives cumulées (j - 0,5)/n pour j = 1,..., n. On calcule ensuite les quantiles théoriques
de la loi (0, 1) correspondant à ces fréquences relatives cumulées. Ces quantiles, appelés «cotes Zj»,
N
satisfont à

P(Z <

<ï>(z,).

Par exemple, pour j = 1 et n= 10, on a (J-


Le tableau 7.8 (voir à la page suivante) donne les valeurs des cotes zs associées à chaque observation
ordonnée xU).
204 CHAPITRE 7

il r?i7j y fî [j (Jili !3*€•\ i^Jÿ *l A s.>*,v»v*î0kroHi- vv J11*Y7.;ë'a.p&f»TvZtIaYr\’j 4 jpl ^


AV
ILJ 'M a,ylv^ >.â"«,.A *x.Aa ;;i*';.''1 -, j S**■ t ^
Rang Échantillon Fréquences Quantités 1
ordonné relatives cumulées théoriques
I. % 1
J XU) ( j - 0,5)/n Zj
1 -1,390 0,05 -1,64 |
2 -0,801 0,15 -1,04
-0,563 0,25 -0,67
-0,314 0,35 -0,39
-0,179 0,45 -0,13
6 0,504 0,55 0,13
0,863 0,65 0,39
7
8 1,080 0,75 0,67
9 1,153 0,85 1,04
1,436 0,95 1,64 J
1 10

La figure 7.11 représente le graphique des quantiles échantillonnaux x(j) en fonction des quantiles
théoriques zr Comme les points sont généralement alignés, on conclut qu’une loi normale décrit bien
les données.
/ ——
— -- ■■
, .
» '
■ ■
—-------■

«
- ------ - .... .... ... .......*
.. "------- ' ' "
"' '
» »

1,5 - •
1

• •
O
1

• 1
' J

• 1
0,5-
1
o,o -

• ♦
*i
-0,5- • ij

-1,0-
--- 1


-- 1------- 1------- 1------- 1-------1-------T
-------1--
7
Ws

-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 jy


Zj
%
»

Le diagramme quantile-quantile normal

La plupart des logiciels de traitement de données tracent des graphiques de probabilité pour
diverses lois, ce qui évite des calculs fastidieux. Il existe de légères variations dans le calcul des
quantiles d’un logiciel à l’autre, mais le principe général reste le même.

7.2.6 Le diagramme chronologique


La plupart des gens connaissent sans doute le diagramme chronologique, aussi :
gramme à ligne brisée », puisqu’on en voit chaque jour dans les médias. Par exemple
souvent sous cette forme les données concernant l’évolution des températures dans
La statistique en bref et la description des données

particulier ; les fluctuations journalières, mensuelles ou trimestrielles d’un indice boursier ; les
variations annuelles de l’indice des prix à la consommation établi par Statistique Canada.
Un diagramme chronologique présente généralement le temps en abscisse, son axe vertical
portant une échelle définie en fonction de l’étendue des valeurs observées.

Exemple 7.10
La figure 7.12 illustre la demande horaire d’électricité d’un immeuble à bureaux (en kilowatts). Dans
ce cas, les données horaires obtenues représentent véritablement la moyenne de l’ensemble des don­
nées mesurées à l’intérieur de chaque heure.
D’ordinaire, lorsqu’une série se compose de moyennes associées à des intervalles de temps, le degré
de variation des données est fonction de la longueur de ces intervalles, des intervalles plus courts
entraînant une plus grande variabilité. Si l’on avait par exemple mesuré aux 15 minutes la demande
d’électricité en kilowatts, on aurait dû reporter 96 points dans le graphique, et les données auraient
semblé fluctuer bien davantage.
/ /
..
i

»
I
t

t

»
.
*

l
1

__ lg 5' La demande horaire d'électricité (en kilowatts) d'un immeuble à bureaux


durant la journée de pointe de l'hiver

7.3 La description numérique des données


Tout comme les diagrammes, qui peuvent améliorer la présentation des données, les des­
criptions numériques s’avèrent très utiles. Nous allons examiner dans cette section plu­
sieurs mesures numériques qui servent à décrire les caractéristiques des données.

7.3.1 Les mesures de position


La moyenne
La mesure de tendance centrale ou de position la plus répandue n’est autre que la moyenne
arithmétique. On considère en général que les données proviennent d’un échantillon d’unités.
C’est pourquoi le terme «moyenne de l’échantillon» désignera ici la moyenne arithmétique.
206 CHAPITRE 7

Moyenne échantillonnai
Si l’on note x , x2, . x les observations d'un échantillon de taille /?, alors la moyenne de cet échan-
tillon se traduit par

,Y, + JC2 H------- h X H

Exemple 7.11
Dans le cas des données du tableau 7.3, la moyenne de l’échantillon s’établit à

26408
264,08.
100

D’après la figure 7.4, cette moyenne de 264,08 lb/po2semble constituer une valeur typique de la
résistance à l’éclatement des bouteilles, puisqu’elle se situe près du centre de la distribution, là où se
concentrent les observations. Pareille impression peut toutefois être trompeuse. Examinons l’histo-
gramme de la figure 7.13. La moyenne des données présentées ici constitue toujours une mesure de
tendance centrale, mais cela ne veut pas dire que la plupart des observations se concentrent autour
d’elle. Si l’on suppose que chaque valeur observée a une masse, la moyenne de l’échantillon n’est
rien de plus que le centre de masse des données, ce qui signifie que l’histogramme sera à peu près
en équilibre si on le place sur un pivot situé à l’endroit correspondant à cette moyenne.

/~
A

<
D
O
ao
cr Moyenne
«Uh de l’échantillon

[.'histogramme d'un échantillon provenant d'une distribution bimodale

La moyenne de l’échantillon x indique la valeur moyenne de toutes les observations dans


l’échantillon. On peut aussi envisager de calculer la valeur moyenne de toutes les observations
dans une population finie. Lorsqu’il existe un nombre fini (ici noté AOd’observations possibles dans
une population, la moyenne de cette population se traduit par
N
La statistique en bref et la description des données 207

Comme nous l’avons vu dans les chapitres précédents, la valeur // peut aussi représenter
l’espérance d’une variable aléatoire, c’est-à-dire sa moyenne théorique en supposant un modèle
probabiliste prédéfini. Dans les chapitres traitant de l’inférence statistique, on étudiera diverses
méthodes permettant de tirer des conclusions au sujet de la moyenne d’une population (fi) à
partir de la moyenne d’un échantillon (3c).

La médiane
La médiane, c’est-à-dire le point où l’échantillon ordonné se divise en deux sous-groupes de
même fréquence, constitue une autre mesure de tendance centrale.

Médiane échantillonnais
Soit un échantillon ordonné dont les valeurs sont notées x 1f*1 \a£*rj.plus petite
lus srunc 11cathématiuues.
lthé
A

valeur observée, x yj la deuxième plus petite valeur, et x (n> I A , * B

la médiane se définit alors comme suit :


/

X
((fl+])/2 si nset impair
X
**(///2) **((«/2)+l) (7.3)
si nest pair.
9

extrêmes n’influent guère sur la médiane, ce qui lui confère


L’exemple suivant en est une bonne démonstration

Exemple 7.12
Soit les observations ci-dessous, placées en ordre croissant :
1, 2, 3, 5, 6, 7 et 8.
La moyenne de cet échantillon s’établit à 4,57 et sa médiane, à x((7+1},2) = x{4) = 5. Toutes deux four­
nissent une bonne indication de la tendance centrale des données. Supposons maintenant que la der­
nière observation diffère, de sorte qu’on a
1, 2, 3, 5, 6, 7 et 2519.
La moyenne de l’échantillon passe alors à 363,29. Manifestement, elle ne révèle pas grand-chose au
sujet de la tendance centrale de la plupart des données. La médiane, par contre, est toujours de 5, ce
qui constitue probablement une indication beaucoup plus valable de la tendance centrale de-, la majorité
des données.

On peut donc dire que la moyenne est beaucoup plus sensible aux valeurs extrêmes que
la médiane. Par contre, la moyenne de l’échantillon tient compte de toutes les données, alors
que la médiane n’en considère qu’une ou deux. De plus, la distribution échantiUonnale de la
moyenne de l’échantillon est souvent facile à établir. C’est pourquoi beaucoup de méthodes
d’analyse statistique y font appel.
On peut s’intéresser à la médiane 3cd’un échantillon, mais aussi à la médiane fi d’une popu­
lation. Il s’agit là de la valeur de la variable à l’étude telle qu’une moitié de la population se situe
au-dessous de fi et l’autre moitié, au-dessus.
CHAPITRE 7

Le mode

Mode échantillonnai
La valeur la plus fréquente à l'intérieur d’un échantillon porte le nom de «mode», que nous identifie­
rons par la lettre ni.

Exemple 7.13
Soit les 12 données suivantes :
1, 2, 2, 2, 2, 4, 4, 5, 5, 6, 6, 9.
Le mode est ici 2, car cette valeur se répète quatre fois et aucune autre n’est aussi fréquente.

Un même échantillon peut comprendre plus d’un mode.

La comparaison des trois mesures de tendance centrale


Lorsque les données présentent une distribution symétrique, la moyenne et la médiane coïn­
cident. Ces deux mesures peuvent aussi coïncider avec le mode en pareil cas s’il n’y en a qu’un
seul (c’est-à-dire si la distribution est unimodale). Lorsque les données présentent une distri­
bution asymétrique (étalée vers la droite ou vers la gauche), la moyenne, la médiane et le mode
ne coïncident pas. Le mode s’avère en général inférieur à la médiane, elle-même inférieure à
la moyenne, dans le cas d’une distribution asymétrique s’étirant sur la droite et supérieure à la
médiane, elle-même supérieure à la moyenne, dans le cas d’une distribution asymétrique s’éti­
rant sur la gauche (voir la figure 7.14).

~i— i— i------------------ ----------------------------------- 1--------------------------- -------------------- 1— t— r


flp.ni fi m fi fi
P
m
a) Étalement à gauche b) Symétrie c) Étalement à droite
(ou asymétrie négative) (ou asymétrie positive)

La moyenne, la médiane et le mode d'une distribution selon sa forme

Les quantités
Les quantiles échantillonnaux sont d’autres mesures de position pouvant être vues comme
des nombres qui séparent l’échantillon ordonné en sous-groupes de même fréquence. On leur
donne souvent des noms particuliers, selon le nombre de sous-groupes créés. Par exemple, les
3 « quartiles » séparent l’échantillon en 4 classes de fréquence égale. Les 99 « centiles » séparent
l’échantillon en 100 classes de fréquence égale.
On peut aussi envisager le quantile comme un nombre qui divise l’échantillon ordonné en
deux parties, de façon à ce qu’une proportion yde données
proportion 1 - y lui soit supérieure. Il existe plusieurs façons de calculer les quantiles ; l’une
d’elles est décrite ci-après.
La statistique en bref et la description des données

Quantité d'ordre y

r la proportion d’observations inférieures au quantile cherché dans un échantillon de taille n.


Alors le quantile d’ordre / . y noté q , est l’observation de
(Yf\ +0.5)rang yn
j
+ 0,5, soit
^ o ^ ^Lorsque le ran« n
pas un entier, on peut utiliser la moyenne des deux valeurs les plus proches ou faire une interpolation
linéaire entre ces deux nombres.

Ainsi, un quantile n’est pas nécessairement égal à une valeur observée dans l’écha
Selon cette méthode, les trois quartiles d’un échantillon de taille se calculent comme

0 =” ^0,25 ’” *(0,25n+0,5)’
Q2--" #0,50 “=médiane = x (0 ,5 m + 0 .5 ) ’
Q3--“ #0,75 "~*(0,75n+0,5)'

Exemple 7.14
Reprenons les 100 données du tableau 7.4 indiquant la résistance à l’éclatement de bouteilles. Les
trois quartiles se calculent comme suit :
QX--' * (0 .2 5 x100 + 0.5) — * (2 5 .5 ) "" [* (2 5 ) * (2 6 )-^ 2 ~=[248 + 248]/2 =
= 248,
Q2--“ * (0 ,5 n + 0.5) _ * (5 0 .5 ) ' = [ * ( 5 0 , + * ( 5 .,] / 2 ==[265 + 265J/2 =
= 265,
0 =" *(0,75/1 +0,5) —* (7 5 ,5 ) '” [* (7 5 ) * (7 6 )^ 2 “= [280 + 280]/2 =
= 280.

Le dixième centile consiste en l’observation de rang (0,1)(100) + 0,5 = 10,5 (une valeur à mi-chemin
entre les 10e et 11e observations), ce qui donne (220 + 221)/2 = 220,5.

7.3.2 Les mesures de dispersion


Les mesures de position ne suffisent pas nécessairement pour bien décrire des données com m e
l’illustre l’exemple suivant.

Exemple 7.15
Voici la résistance à l’éclatement des six bouteilles de deux échantillons différents.
Échantillon 1: 230 250 245 258 265 240
Échantillon 2 : 190 228 305 240 265 260
La résistance moyenne est de 248 lb/po2pour chaque échantillon. On remarque cependant que les valeurs
obtenues sont beaucoup plus étalées ou dispersées dans le cas de l’échantillon 2 (voir la figure 7.15).
-----*
/
O O OO O O
• • • • • • *

t
t

i i 1 ! i ■

180 200 220 240 260 280 300 320


.•

Moyenne de chaque échantillon = 248 i

Échantillon 1 = Échantillon 2 *
»

Le graphique de points des données relatives à la résistance è l'éclatement


*• * 1 « " - y , '. * . *"» # • «• y V - ‘ •’ ^ ^ • ' *** 4 ’** • * • ’’ * . * ' J r . / J '•-*.* • * . ‘
CHAPITRE 7

Plusieurs mesures de dispersion couramment utilisées sont définies ci-après.

La variance
L a principale mesure de dispersion est la variance de l’échantillon.

Variance échantillonnais
Soit un échantillon formé de n observations notées x , x , . . . , jc . Sa variance se traduit par

L unité de mesure de la variance de l’échantillon correspond au carré de celle de la variable.


2\2
Si Von exprime X en livres par pouce carré (lb/po2), on aura donc une variance en (lb/poz)z. Il
formule plus efficace (et néanmoins équivalente) permettant de calculer S
n n
2 2
SXX XJi JCi. nx (7.5)
i=1 i=1

On doit prendre soin de conserver un nombre suffisant de décimales afin d’éviter toute erreur
d’arrondi.
Pour découvrir com m ent la variance de l’échantillon reflète la dispersion ou la variabi­
lité des données, reportez-vous à la figure 7.16, qui montre les écarts jc. — de la résistance à
l’éclatem ent des six bouteilles de l’échantillon 2. Plus les données observées varient, plus la
valeur absolue de certains écarts x. —x est grande. Comme la somme des écarts jc. —x est tou­
jours nulle, il faut utiliser une mesure de variabilité qui transforme les écarts négatifs en des
grandeurs non négatives. Or, c’est le cas de la variance de l’échantillon, qui demande d’élever
le s écarts au carré. Une faible valeur de s2 indique ainsi que les données varient relativement
peu, et une valeur élevée, qu’elles varient beaucoup. Notons que la variance est très sensible
aux valeurs extrêmes, et qu’il suffit de quelques valeurs très éloignées du centre pour la faire
grossir très rapidement.

Exemple 7.16

Calculons la variance de la résistance à l’éclatement dans le cas de l’échantillon 2 de la figure 7.15


Ua figure 7.16 présente les écarts jc. —x à l’intérieur de cet échantillon.

/
xi *2 x4 x6 x5 x3
O O O O O O
1— i “ T— ~I— T
180 200 220 280 300 320

La variance de l'échantillon reflète la variabilité à partir des carrés


des écarts x, — x ►
La statistique en bref et la description des données 211

Le tableau 7.9 détaille le calcul des écarts à la moyenne élevés au carré.

~~ ~-----------— — ——- - - — ---------------— " —

Observations X -JC
.*>': !/ 1, (JC - x)2
- . •- .-----— — — — ,

jc, = 190 -58 3364


x2= 228 -20 400
x3= 305 57 3249
x = 240
4
-8 64
JC5= 265 17 289
x = 260 12 144
3c= 248 Somme = 0 Somme = 5 =7510XX

D’après l’équation 7.4,

I502(lb/po2)2.

On peut aussi déterminer la valeur de 5 à l’aide de l’équation 7.5, ce qui donne

1502 (lb/po2)2.

Si l’on décide de calculer la variance de l’échantillon 1, on obtient le résultat s2 = 158 (lb/po2)2. La


variance de l’échantillon 1 est donc bien inférieure à celle de l’échantillon 2, ce qui confirme notre
impression initiale d’une plus faible variabilité à l’intérieur de l’échantillon 1.

Pour une population finie, constituée de N valeurs, on peut représenter la variance par

ce qui correspond simplement à la moyenne des carrés des écarts entre les valeurs de la variable
et la moyenne de la population. Tout comme la moyenne d’un échantillon peut servir à tirer des
conclusions au sujet de la moyenne d’une population, sa variance peut servir à tirer des conclu­
sions au sujet de la variance de la population.

Pourquoi diviser par n - 1 et non par n?


Pour calculer la variance d’un échantillon, on inscrit au dénominateur la taille de cet échantil­
lon moins 1, soit n - 1. Si l’on connaissait la véritable moyenne fl de la population, on pourrait
définir la variance d’un échantillon comme la moyenne des carrés des écarts entre les valeurs
de cet échantillon et fl. On connaît rarement la valeur de ji dans la pratique, ce qui oblige à
utiliser plutôt la somme des carrés des écarts par rapport à la moyenne x de l’échantillon.
Les valeurs observées x tendent cependant à être plus proches de leur moyenne x que de la
moyenne fl de la population, ce qui amène à compenser en inscrivant n —1 au dénominateur
plutôt que n.
CHAPITRE 7

Une autre façon d’envisager les choses veut que la variance de l’échantillon s*2 repose sur
n —1 degrés de liberté. On parle de degrés de liberté parce que la somme des écarts x. —
x2 —x, ..., xn— x est toujours nulle, de sorte qu’il suffit d’indiquer 1 de ces valeurs
obtenir la valeur manquante. De ce fait, seuls n - 1 des n écarts x - x sont indépendants.

L'écart-ty p©
Comme on élève au carré l’unité de mesure des données pour en exprimer la variance, cette
statistique est difficile à interpréter. La variabilité constitue en outre une notion moins facile à
saisir et moins familière que la position ou la tendance centrale. On peut toutefois simplifier les
choses en calculant l’écart-type de l’échantillon.

Écart-type échantillonnai
0. . ^
.* _
. i-» _ . • , *
. . . i . . ,
. *
. . •
%,* . * ' .
■. * .
. . . . . / . -
. . . . * . «.

L’écart-type de l’échantillon est la racine carrée (positive) de la variance échantillonnai

On obtient ainsi une mesure de dispersion exprimée dans les mêmes unités que les valeurs
prises par la variable, qu’on peut interpréter comme une distance « typique » entre les observa­
tions et leur moyenne. On ne peut pas parler de distance moyenne, car on ferait alors référence
à l’écart moyen, calculé à partir des écarts en valeur absolue x ( - x

Exemple 7.17
Soit les bouteilles de l’échantillon 2 dont il est question à l’exemple 7.15 et à la figure 7.15. L’écart-type
de leur résistance à l’éclatement est de
s= V1502 = 38,76 lb/po2.

Les bouteilles de l’échantillon 1 se caractérisent, quant à elles, par un écart-type de


s = VÏ58 = 12,57 lb/po2.

Exemple 7.18
Calculons la variance et l’écart-type de l’échantillon à partir des données du tableau 7.3 ayant trait à la
résistance à l’éclatement de bouteilles. On remarque que
100 100
^ x f = 7075 062 et ]£*,.= 26 408.
i= l i= l

Conséquemment,
S = 7 075 062 - (26 408)2/100 = 101 237,4
2 101237,4 . . . . . ... . 2\?
et s2
= -= 1022,6 (lb/po2)2,
99
de sorte que l’écart-type de l’échantillon est de

s = V1022,6 = 31,98 lb/po2.


La statistique en bref et la description des données 213

L'étendue

Étendue
L’étendue de l’échantillon constitue une autre mesure de dispersion utile, dont la notation provient
de l’anglais range. On la note
R = max (*.)
y r - min (jc
x r) =x,
(n) -x,,.
(!) (7.7)

Cette statistique est très facile à calculer, mais


la plus grande des valeurs observées au sein de l’écham iiîon. Dans certaines
d’information peut être négligeable si l’éch . r-»» dr: oerjte taille (si
4> x

10, par exemple). On UN «(- domaine du contrôle

s échantillons étudiés comptaient fréquemment 4 ou 5 un


importance à la simplicité des calculs. Aujourd’hui, l’utili
oniques de mesure et des systèmes de stockage et d’analy
données a réduit considérablement les avantages associés à cette statistique. La variance (ou
l’écart-type) de l’échantillon fournit une meilleure indication de la variabilité.

Exemple 7.19
Calculons l’étendue des données relatives à la résistance à l’éclatement énumérées à l’exemple 7.15 et
présentées graphiquement à la figure 7.15. Dans le cas du premier échantillon, on obtient
Ri 265 - 230 = 35,
tandis que, dans le cas du second, on obtient
R = 305 - 190 = 115.
Le second échantillon présente ainsi une étendue beaucoup plus grande que le premier. Lorsque l’on
considère seulement les deux valeurs les plus extrêmes, on parvient à la même conclusion qu’en calcu­
lant la variance, c’est-à-dire que le deuxième échantillon se caractérise par une plus grande variabilité.

Le coefficient de variation
Il est parfois souhaitable d’exprimer la variation en fonction de la moyenne.

Coefficient de variation
On appelle « coefficient de variation» de l’échantillon la mesure de la variation relativ i ’ï

s
CV
X

Il s’agit là d’une mesure utile pour comparer la variabilité de deux ou de plusieurs ensembles
de données qui diffèrent considérablement en raison de l’ampleur des valeurs observées. On
pourrait y recourir afin de comparer la variabilité de la consommation quotidienne d’électricité,
en janvier, de maisons unifamiliales situées à Québec et à Vancouver.

7.3.3 Les coefficients d'asymétrie et d'aplatissement


Il existe d’autres paramètres servant à décrire un échantillon ou une population, dont les coef­
ficients d’asymétrie et d’aplatissement, aussi appelés «paramètres de forme». La figure 7.14
214 CHAPITRE 7

présentait graphiquement la notion d’asymétrie. Les coefficients d’asymétrie et d’aplatissement


théoriques sont des caractéristiques de la distribution d’une population ou d’un modèle de popu­
lation. On les définit en fonction des moments juk décrits à la sous-section 2.4.3 du chapitre 2.

Coefficients d'asymétrie et d'aplatissement théoriques


.<• ■.. t ■’ *-*■

Le coefficient d’asymétrie théorique et le coefficient d’aplatissement théorique sont respectivement

où, dans le cas d’une population finie, le k-ième moment centré correspond à

Comme on l’a déjà mentionné, une distribution peut être plus ou m oins sym étrique par
rapport à sa moyenne. Une distribution asymétrique négative (/?3 < 0) s’étire du côté où les
valeurs de la variable vont en diminuant (vers la gauche), et une distribution asym étrique
positive > 0), du côté où elles vont en augmentant (vers la droite). Les variables dont
la densité est symétrique, comme celles qui obéissent à une loi norm ale ou uniform e, ont
un coefficient d’asymétrie nul. La loi exponentielle, étirée vers la droite, engendre par
exemple un coefficient /?3 égal à 2.
Quant au coefficient d’aplatissement (kurtosis en anglais), il s’interprète surtout dans le
cas d’une distribution symétrique. Il indique à quel point une distribution est plate ou poin­
tue par rapport à celle d’une variable normale, une valeur négative dénotant une distribution
relativement plate et une valeur positive, une distribution relativement pointue. Ce coefficient
s’établit ainsi à —1,2 dans le cas d’une variable uniforme, alors qu’il est nul dans le cas d ’une
variable normale.
Si les données à analyser résultent de mesures échantillonnales, on peut estim er les coeffi­
cients y33 et /?4 à l’aide des équations 7.11 et 7.12.

. . *»

Coefficients d'asymétrie et d'aplatissement échantillonnaux


• V • ..*. ~* 4 . . . • • ■ «a
*

».

Le coefficient d’asymétrie échantillonnai et le coefficient d’aplatissement échantillonnai sont respec-


tivement a

ti /
%
.
#.

3
» .
. i v » .

n i=1
P3 ( n - \) ( n - 2 ) S
n > 2, s ^ \ ^ -
< >

(7.11)

n
2
(«)(« +1) i=\ 3(n - 1)
P n > 3. ( 7. 12)
(n - 1)(n - 2)(n - 3) S (n - 2){n - 3) -
La statistique en bref et la description des données 215

V
Exemple 7.20
À titre d’exemple, les données relatives à la résistance à la traction du tableau 7.2 donnent lieu à un
coefficient d’asymétrie de 0,865 et à un coefficient d’aplatissement de 0,161.
asymétrie lég
de coefficient
près de 0 (0,161).

La distribution des 25 mesures de résistance à la traction et la courbe normale


de mêmes moyenne et variance

7.3.4 Une mesure d'association : le coefficient


de corrélation
Le coefficient de corrélation de Pearson indique le degré de dépendance linéaire entre deux
variables numériques selon les données d’un échantillon. On le note ordinairement r. Lorsqu’on
étudie un ensemble de données ayant trait à plusieurs variables, on peut utiliser une notation
en indice pour désigner les variables en cause, par exemple X et Il suffit alors d’écrire r .

C o e ffic ie n t de corrélation échantillonnai

(7.13)

(7.14)
2 1 6 CHAPITRE 7

Comme son équivalent théorique p, la valeur de r est comprise dans l’intervalle [—1, 1].
Cette grandeur sans dimension mesure le degré d’association linéaire entre deux variables. Plus
une association est forte, plus |r 1. Si les données ne traduisent aucune association linéaire,
ce coefficient est nul.

Exemple 7.21
Revenons aux données du tableau 7.2, ainsi qu’aux nuages de points de la figure 7.2 qui montrent la
résistance à la traction de fils d’interconnexion (qu’on appellera la variable R) par rapport à la longueur
des fils (disons la variable L) et par rapport à la hauteur de la puce (disons la variable H).
Les coefficients de corrélation échantillonnaux sont = 0,982 et rRH= 0,493. Puisque rRLest positif et
près de 1, on conclut qu’une grande valeur de Lest associée à une
appelle une « association positive ». La figure 7.2 illustre bien ce phénomène. On observe aussi une
relation linéaire positive entre H et R, mais de façon moins importante.

Même si les coefficients de corrélation diffèrent de 0, il ne faut pas en déduire qu’il existe
une relation de cause à effet entre les variables, car on ne peut prétendre qu’une augmentation
de L ou de H fait augmenter celle de R. On oublie souvent ce point important, ce qui engendre
parfois de graves erreurs d’interprétation, puisqu’il peut très bien y avoir une variable causale
non observée qui influe sur toutes les variables à l’étude.

7.3.5 Les données groupées


Si les données se présentent uniquement sous la forme d’une distribution de fréquences, il faut
modifier les formules utilisées pour le calcul de mesures de tendance centrale et de dispersion
basées sur les données brutes. Si les données de départ sont discrètes et que le tableau de fré­
quences ne sert qu’à résumer le nombre de fois où chaque modalité est observée, on pourra
calculer les valeurs exactes des statistiques. Cependant, si le tableau de fréquences regroupe
les données en intervalles de valeurs, on ne pourra qu’estimer les statistiques descriptives.

Les variables discrètes regroupées par modalité


Supposons que chacune d e s p valeurs distinctes de , notées ici ..., x
observée/., pour j = 1, ..., p. La moyenne et la variance de l’échantillon se traduisent alors
respectivement par

( 7. 16)
n —1 n —1
La statistique en bref et la description des données

Les variables quantitatives regroupées en classes de valeurs


Il arrive également, à la suite de la perte ou de la destruction des données initiales, qu’on
ne dispose plus que de données groupées. En pareil cas, on peut déterminer approxi­
mativement les principaux moments de la variable en recourant à une convention par
laquelle on attribue à chaque observation la valeur du point milieu de la classe où elle se
situe. Ainsi, toutes les observations à l’intérieur d’une classe donnée présentent désor­
mais la même valeur. Après avoir effectué cette transformation facile, on peut déterminer
approximativement la moyenne et la variance de l’échantillon à l’aide des équations 7.17
et 7.18.

Approxim ation de la moyenne et de la variein K k


groupées
en classes

Soit m le point milieu de lay-ième classe et c, le nombre total


de l’échantillon se traduisent alors approximativement par

( 7. 17)

;=1

Exemple 7.22
Voyons comment utiliser les équations 7.17 et 7.18 en calculant la moyenne et la variance de la résis­
tance à l’éclatement selon les données de la distribution de fréquences du tableau 7.5. Le tableau
ci-dessous donne le point milieu de chacune des c = 9 classes, ainsi que le nombre d’observations
contenues dans chaque classe.

Point milieu
de la classe Fréquence
m, = 180 /, = 2
m2= 200 4
m3= 220 / 3= 7
m4= 240 f A= 13
m5= 260 / s = 32
m6= 280 f 6=24
m7= 300 / 7= 11
W8= 320 /,= 4
m9= 340 / 9= 3 ►
218 CHAPITRE 7

De ce fait,
9

j =i 26460 2
x 264,60 lb/po
n 100
et
9
2
^ f j m j2 - l O O x
2
2 7=1 7 091900-100(264,60) 2x2
s
_

914,99 (lb/po )
99 99
Il s’agit là de valeurs très proches de celles que fournissent les données non groupées, c’est-à-dire
x = 264,08 et s2 = 1022,6.

On peut aussi déterminer approximativement la médiane de données groupées en classes.


On peut se référer à l’histogramme correspondant au tableau de fréquences. La médiane cor­
respond alors approximativement à la valeur de x qui sépare la surface au-dessous de l’histo-
gramme en deux parties égales. On peut facilement déterminer la classe dans laquelle se situe
la médiane.

Approximation de la médiane de données groupées en classes


Si la médiane se situe dans la classe [jc x [, que le nombre d’observations inférieures à x n est d e /
,

et que le nombre d’observations inférieures à x est d e / , alors la médiane pourrait s’estimer par
la valeur suivante :

, (0,5/7 - / )
jc = x_. H (x m + \
--------------------------------------------------------------------------------------------------------------------------------------------------

^m ) ' (7.19)
f
/,m+1 J m
v . • ». .
■>
, ** . . . , - •

Représentations graphiques des variables quantitatives


• Graphique de points et nuage de points
• Histogramme (variables continues ou discrètes avec un grand nombre de modalités)
» *

Diagramme en boîte
Diagramme en bâtons (variables discrètes ou qualitatives)
Diagramme quantile-quantile
- <■
.* ■ • • .

, * *

' v ..
. .
••

>*■*. • .

•a '

Diagramme chronologique (ligne brisée, évolution — : N -


»

N
.* * *
__

, è —
. . _
' n '

.c
»

•' . / .
§ ' .
* . • • . . . .

Valeurs observées de la variable X


J * ’ l .
, • ■ • < i.. • >
. « >
' -
*
> * ■ - - *
N
*

:*
- «■*
I

*
% .*
' • > •

• Dans l’ordre de collecte : JC.1^ JC^V^ ^ JC


n %

/•
. r , ,

% - -

: • * v

• En ordre croissant : x(1), x (2), ..., x (/i) •> .. » . r


»

■y
La statistique en bref et la description des données 219

Statistiques pour variables quantitatives « *

jC J / jt- . v u ' jK > h h k - - V "4

r y ~ ■» ^ * c • i l - t » * j a . • > > ? ^ . v . ^ -5 - - . « x l / j u w ?
r V , • , * , ; ; ' ' > v » ; *. + 4 V t*. « . ' ' “ > | « T ^ . . J

ï ^ 1 5 kM K 1
^2 _S î .
^

* * - v ^ . -, \ - K - ^ ^ A K A L h . - r — i l — — — — . ----------------------:---------------------------- ;-----------------------------------

Mesures de position
Moyenne X 1 n
1V
~ L xi i

n 7 ? i

____ . __________________________ - - • ' : ________________ - - ________________________ ____________ _________________________ - ____________________________________________________________________________________ f


. ,

- V . .
s,

/.• . * . ■ ' •,
- - r • •
g
|r.:

Médiane x -Q 2 #0 J5 ~ X ((.n+ 1V2)


------------------------------ - - J
Mode m Valeur la plus fréquente
Quantité d’ordre 7 - A - *

{ y n + QS) :

Premier quartile Q\ ^ 0 ,2 5 “ ^(0,25»i + 0.5)


1
Troisième quartile (23 — t
^0.75 — X ( 0 J 5 n + 0,5)

Mesures de dispersion
Variance 7
‘ .X t x i - D *
. . -
n ~ l 13 _________________ ______________________________ - ..................................................................................|
I •

Ecart-type s
4? '
«

Étendue R X (n) ~ *(1) J


i
Coefficient de variation CV
je '

A 1■'
1Ecart interquartile 1 EIQ (2 3 -0 1
Mesures de forme B

n
Coefficient d’asymétrie 1 A

03
n . i= i

1 ( n - l ) ( n - 2) s3
Coefficient 1 A
/» «
d’aplatissement n(n + 1) f?î 3 ( n - l )2
\

11’

| (n -l)(n -2 )(n -3 ) s4 (n -2 )(n -3 ) \: t

__. \

Mesure d’association
l\>
' ■

Coefficient de r r
r.
n
<

$xy
corrélation
(S „ -5 „)''2 L
1

- -- i
220 CHAPITRE 7

Statistiques pour données groupées

• m. = point milieu du j-ième intervalle ( j - 1, . . e)


• [xm >x nt +.,[
1
= classe de la médiane

K \ j i < C J ** ’ f f '\ ■ * «»' ( » ■ * * ■ » • îf lt R i C * • * . ' • - - V - 1


V %' • . f B ' 0 lm . T j , • | fl

t —' t^ . ' J . fl 4 K I r , f. £ T # f \ ’A/ « * *-ï


v ’

Moyenne 1^
X =- ^ fjX j
H j = l

Variance
S = i ^ u f j i
s2 «
'l 1 7= 1

Médiane X = X((n+ j)/2 ) (° , 5 n - / m) ^


X Xm ^ r r ^ m -fl
Jm+\ Jm j

. * " * , . . . ^ - v

/ %
.
»

*. * . '
•■■■ :: • I*
» .
» .•

.
«
• ' , * , /
b) Déterminez les 65e et 95e centiles de
Les données des exercices avec le symbole J+' l’échantillon, c’est-à-dire les quantiles
sont aussi disponibles en format électronique. $ d’ordre 0,65 et 0,95.
c) Tracez un diagramme en boîte à partir
7.1 Le fabricant d’une pellicule photographique des données associées à la durée de
(î+J de sensibilité élevée en étudie la durée de conservation.
conservation en jours. Voici les données qu’il 7.2 Le tableau ci-dessous indique le pourcen-
a recueillies, placées en ordre croissant. ®T tage de coton que renferme le tissu servant à
la confection de chemises. Les données sont
m 125 129 132 141 présentées en ordre croissant.
116 125 129 133 143
117 126 129 133 145 32,1 33,4 33,8 34,3 34,7 35,0 35,5 36,8
117 126 129 134 147
32,5 33,5 34,0 34,5 34,7 35,1 35,6 36,8
120 126 130 134 148
32,6 33,6 34,1 34,5 34,7 35,1 35,7 36,8
120 127 130 134 149
32,7 33,6 34,1 34,6 34,7 35,1 35,8 37,1
120 127 131 136 150
32,8 33,6 34,1 34,6 34,7 35,2 35,9 37,3
122 128 131 140 162
32,9 33,6 34,2 34,6 34,7 35,3 36,2 37,6
40 40 33,1 33,6 34,2 34,6 34,9 35,4 36,4 37,8
« = 40; î > .= =5252; =694 024 33,1 33,8 34,3 34,6 35,0 35,4 36,6 37,9
1=1 1=1
64 64
a) Calculez la moyenne et la variance n = 64; £ X{ = 2225,1 ; ^ jc?= 77 475,63
de l’échantillon. /=! i=l
La statistique en bref et la description des données

a) Tracez un histogramme à huit sera une cloche étirée plutôt vers la


classes débutant à 32 à partir de droite ou plutôt vers la gauche ?
ces données.
Imaginez qu’on classe en ordre croissant
b) Calculez la moyenne, la médiane et le des données issues d’une distribution très
mode de l’échantillon. Comparez les asymétrique à droite, c’est-à-dire avec
trois valeurs obtenues. quelques valeurs beaucoup plus grandes
c) Calculez l’écart interquartile, l’écart- que la majorité, et qu’on en élimine t %
type et l’étendue de l’échantillon. à chaque extrémité. La moyenne de
Comparez les valeurs obtenues. l’échantillon calculée à partir des
d) Tracez un diagramme en boîte valeurs restantes porte le nom de
à partir des données associées au «moyenne tronquée ».
pourcentage de coton. Comparez a) On calcule la moyenne tronquée à 20 %
ses caractéristiques avec celles de de cet échantillon. La valeur obtenue
l’histogramme. sera-t-elle égaie, supérieure ou infé­
7.3 Le tableau ci-dessous indique le rendement rieure à la moyenne échantillonnale
(7+J de 90 lots successifs de substrats céra­ de toutes les données ?
miques métallisés par évaporation sous vide. b) Vrai ou faux ? Cette moyenne tronquée
Les données sont présentées en ordre se situe en général entre la moyenne
croissant. de l’échantillon et sa médiane x.
7.5 Soit une usine où l’on fabrique à chaque
82,6 85,1 87,3 89,4 91,2 94,3 période de travail plusieurs centaines
82,9 85,1 87,3 89,6 91,4 94,4 de blocs d’alimentation pour micro-
83,0 85,1 87,3 89,6 91,7 94,6 ordinateur. Pendant certaines périodes
83,1 85,4 87,3 89,7 92,1 94,7 de travail, on soumet chacun de ces blocs
83,6 85,4 87,5 90,0 92,4 95,1 à un test de vieillissement d’une durée
83,7 86,1 87,6 90,0 92,4 95,2 de 12 heures. Le nombre d’unités ayant
84,0 86,1 87,6 90,1 93,1 95,3 échoué à ce test à chaque période de travail
84,1 86,1 87,7 90,1 93,1 95,6 est représenté par le diagramme en boîte
84,1 86,4 88,2 90,3 93,2 96,1 ci-dessous.
84,1 86,4 88,2 90,4 93,2 96,3
84,2 86,4 88,3 90,5 93,7 96,4
86,4 88,6 94,1 96,8
f
84,5 90,6
84,6 86,6 88,8 90,6 94,1 97,3
84,9 86,6 89,1 90,6 94,1 97,8 t------- 1--------- 1----- 1--------------------- 1— r
85,0 86,7 89,1 91,1 94,3 98,0 1 4 7 9 1617
Nombre d’échecs
90 90

n = 90; =8052,8; ^Tjcf = 722067,3 a) À la lecture de ce graphique, peut-


;=i t=i on dire qu’il y a plus de données
supérieures à 9 que de données
a) Déterminez la médiane ainsi que les inférieures à 4 ?
premier et troisième quartiles de cet b) Est-il raisonnable de penser que
échantillon. la moyenne de cet échantillon est
b) Déterminez l’écart interquartile. supérieure à sa médiane ?
c) Tracez le diagramme en boîte de ces c) Sachant que l’échantillon contient
données. 150 observations, combien y a-t-il
d) Sans le tracer, pouvez-vous déterminer de données entre 4 et 9 ?
si l’histogramme de ces observations d) Calculez l’étendue de ces données.
CHAPITRE 7

7.6 Voici des données, disposées en ordre d) Pourriez-vous ajouter deux observations
(7+T croissant, concernant la durée de fonction­ de valeurs différentes à l’échantillon
nement avant défaillance (en heures) de initial sans modifier sa moyenne ?
turboréacteurs. 7.7 Voici l’histogramme de l’indice d’octane de
différentes essences ( la figure 7.18).
2 165 197 255
171 a) Combien y a-t-il d’observations dans
53 200 262
65 179 203 ce jeu de données ?
286
93 183 206 291 b) Combien y a-t-il d’indices d’octane
144 187 213 compris entre 86 et 90 ?
150 197 223 c) Quelle est la proportion des valeurs de
155 197 232 cet échantillon qui sont supérieures à 94 ?
d) Dans quel intervalle se situe la médiane
Voici quelques statistiques descriptives de cet échantillon ?
issues de ces données. e) Lequel des diagrammes en boîte ci-
n = 25 Je= 197 dessous représente cet échantillon ?

3c = 180,36 = 4825,4 i) _
• • I-------- | -----------1
a) Supposons que ces durées doivent être
converties en minutes. Que deviennent 80 85 90 95 100
les statistiques ci-dessus ?
b) On s’aperçoit que la valeur minimale H)
de ce jeu de données est erronée. I---------- 1 | 1-------- 1 • •
On la retire de la liste. Sans faire
de longs calculs, déterminez si les
statistiques ci-dessus seront égales, 80 85 90 95 100
supérieures ou inférieures aux valeurs
initiales. iü)
c) Pourriez-vous ajouter une observation • 1--------- 1 | 1-------- 1
à l’échantillon initial sans modifier sa
moyenne ? 80 85 90 95 100

(.'histogramme de l'indice d'octane (exercice 7.7)


La statistique en bref et la description des données

7.8 Les données ci-dessous ont trait aux envois 7.12 L’épaisseur d’une carte de circuit imprimé
(gT retournés au manufacturier et à la raison revêt beaucoup d’importance. Les 8 cartes
expliquant le retour de ces marchandises. d’un échantillon ont respectivement 63, 61,
Présentez ces données sous la forme d’un 65, 62, 61, 64, 60 et 66 millièmes de pouce
diagramme approprié. d’épaisseur.
a) Quelle est l’unité de mesure de chacune
Nombre d’envois des valeurs suivantes : la moyenne,
Raison retournés la variance, l’écart-type, le mode, le
Refus 195 000 premier quartile et l’étendue de cet
Mauvais choix 50 000 échantillon ?
Mauvais envoi 68 000 b) On soustrait 63 de chaque donnée. Quel
Annulation 5 000 sera l’effet sur les six statistiques calcu­
Autre 15 000 lées en a) ?
c) On multiplie chaque donnée par 100.
7.9 Démontrez que : Quel sera l’effet sur les six statistiques
n calculées en a) ?
a) X ( x< ~ * )= 0;
1= 1 7.13 Jean veut évaluer sa performance aux exa­
mens dans un cours par rapport aux notes
b) I ,( x t. - x ) 2 = T ^ - n x 2. des autres étudiants. Voici les résultats qu’il
i=l i=l a obtenus, et les statistiques du groupe.
7.10 Déterminez si les énoncés ci-dessous sont
vrais ou faux. Écart-
a) L’écart-type, l’étendue et l’écart inter- Note Moyenne type du
quartile sont trois mesures de tendance de Jean du groupe groupe
centrale. Examen 1 75 60 20
b) On préfère souvent l’écart-type à la Examen 2 83 73 5
variance, car il n’a pas d’unités.
Examen 3 85 80 10
c) Lorsqu’on tire un échantillon d’une
distribution symétrique, on s’attend à ce
que la moyenne échantillonnai soit très a) Selon ces informations, à quel examen
proche de la médiane. Jean s’est-il le plus démarqué du groupe ?
d) L’écart-type peut prendre des valeurs b) Si la moyenne du groupe était de 70 à
positives, négatives ou être nul. chacun des examens (sans que rien d’autre
e) La moyenne, la médiane et l’écart-type ne change dans le tableau ci-dessus), votre
ont les mêmes unités de mesure. réponse en a) changerait-elle ?
f ) Si la variance d’un échantillon est nulle, c) Si l’écart-type des notes était de 10 à
c’est que toutes les observations sont chacun des examens (sans que rien d’autre
égales. ne change dans le tableau ci-dessus),
votre réponse en a) changerait-elle ?
g) La moyenne est plus sensible aux
valeurs extrêmes que la médiane. 7.14 Un embouteilleur de boissons non alcoo­
lisées étudie la résistance à la pression
7.11 Déterminez le type de variable dont il est
question dans chacun des cas ci-dessous. interne des bouteilles en verre de 1 litre
non consignées. Il teste un échantillon
a) La distance entre deux villes aléatoire de 16 bouteilles. Le graphique de
b) La variété d’un érable probabilité pour la loi normale (graphique
c) L’accélération d’un véhicule sur 100 m quantile-quantile) associé à ces données
d) Le nombre de commandes reçues en une se trouve à la page suivante. Semble-t-il
heure raisonnable de conclure que la résistance
e) Le sexe d’un individu à la pression est normalement distribuée ?
CHAPITRE 7

7.17 a) Calculez approximativement la moyenne,


©T la variance et la médiane de l’échantillon
à partir des données de la distribution de
fréquences ci-dessous.

Classe Fréquence
10 < x < 20 121
20 < x < 30 165
30 < x < 40 184
40 < x < 50 173

b) Est-il possible que le diagramme en boîte


ci-dessous représente bien cet échantillon ?

7.15 Soit la distribution de fréquences


—i----------1------------1------------ 1-------------1-------
©r ci-après. 10 20 30 40 50
a) Tracez une représentation graphique
de ces données. 7.18 a) Calculez approximativement la moyenne,
b) Calculez la médiane, la moyenne ©• la variance et la médiane de l’échantillon
et le mode. à partir des données de la distribution de
c) Calculez le 30e centile, c’est-à-dire le fréquences ci-dessous.
quantile d’ordre 0,3 de cet échantillon.
d) Calculez le coefficient de variation de Classe Fréquence
cet échantillon, sachant que -10 <x < 10 11
129 10 < x < 20 12
£ x ,2=1865 291. 20 < x < 30 16
i=i 30 <x < 60 15

b) Tracez l’histogramme associé à ce


x. 115 116 117 118 119 120 121 122 123 124
/.' 4 6 9 13 15 19 20 18 15 10 tableau de fréquences.
Ji
7.19 La figure 7.19 montre un histogramme de
densité qui représente la distribution du
7.16 Soit la distribution de fréquences nombre d’heures de travail supplémen­
©T ci-après. taire effectuées par un groupe d’employés
a) Vrai ou faux ? Puisque les données d’une certaine compagnie pendant une
vont de -4 à 4, alors la moyenne et la semaine.
médiane sont toutes les deux égales à 0. a) Créez le tableau de fréquences
b) Calculez la variance et l’écart-type de correspondant à cet histogramme,
l’échantillon, sachant que en incluant une colonne pour les classes
1270 de valeurs et une colonne pour la
£ x 2= 5080. fréquence relative de chaque classe.
t=i
b) Sachant que 35 employés ont fait moins
x. - 4 - 3 - 2 - 1 0 1 2 3 4 de 5 heures de travail supplémentaire
f 60 120 180 200 240 190 160 90 30 dans ce groupe, combien d’employés y
a-t-il dans cet échantillon ?
La statistique en bref et la description des données

L'histogramme de densité (exercice 7.19)

7.20 Un article paru dans YInternational Journal Déterminez le coefficient de corrélation


(i+J o f Industrial Ergonomics (vol. 24, n° 5, de Pearson entre ces deux variables, puis
1999, p. 483-491) décrit une étude réalisée interprétez-le.
afin de déterminer la relation entre le délai
d’épuisement et la distance parcourue. Les
exercices en question étaient effectués en
fauteuil roulant sur une piste extérieure
10
de 400 mètres. Voici les données ayant trait y y, = 16 602 10
à 10 personnes. tt 2^ = 40 084 944
10 '=■
X = Délai Y = Distance parcourue 5 > ,y , = 17 484 040
d ’épuisement avant l’épuisement 1=1
(en secondes) (en mètres)
610 1373
310 698
720 1440
990 2228
1820 4550
475 713
890 2003
390 488
745 1118
885 1991
/
«V .
A J & t
B
v v X v a
• & U *♦
K W -
S
X1 * . A •■» g 4 *
. « O - .•
» ..r N -J w P
si % *
Z*

£ Ii ^
j * f. - î i .

e présent chapit re marque le début de outre étude de l’in féren ce statistique.


Rappelons que la statistique est une science qui vise à tire r des conclusions
' au sujet d’une population en se fondant sur Panalyse des d on n ées d ’un
échantillon tiré de cette population. Dans ce chapitre, nous présenterons quelques
distributions de probabilité qui facilitent Panalyse des renseignem ents fou rn is par
les données.

3.1 Les échantillons aléatoires


Soit X une variable aléatoire de densité/(x). Tout ensemble de n observations X v X 2, ..., Xn
de cette variable et se traduisant par les résultats numériques ..., x n porte le nom
d’« échantillon aléatoire » si l’on a obtenu chaque observation au hasard et de façon indépendante
en observant la variable X dans les mêmes conditions à reprises. Les observations X {, X 2, ...,
Xn d’un tel échantillon constituent des variables aléatoires indépendantes ayant la même fonction
de densité f(x.)
À titre d’exemple, supposez qu’on s’intéresse à la résistance à l’éclatement de bouteilles en
verre de 1 litre, laquelle obéit à une loi normale dans la population à l’étude. Ainsi, les obser­
vations X v X2, ..., X100 de cette résistance à l’intérieur d’un échantillon aléatoire de 100 bou­
teilles constituent des variables aléatoires indépendantes obéissant toutes exactement à la même
loi normale. «

La manière de prélever un échantillon influe souvent sur les conclusions qu’on peut formu­
ler au sujet de la population. Une méthode fréquemment utilisée pour prélever un échantillon
est l’échantillonnage aléatoire simple, où n unités sont pigées au hasard avec la même pro­
babilité de sélection. Chaque échantillon a la même probabilité d’être tiré. Il existe plusieurs
autres méthodes permettant de tirer un échantillon aléatoire afin qu’il soit plus représenta­
tif de certaines caractéristiques de la population, soit pour en m inim iser le coût ou l’erreur
d’échantillonnage. On peut penser à l’échantillonnage stratifié (où on divise la population en
groupes homogènes avant de prendre aléatoirement un échantillon dans chacun d’eux) ou à
l’échantillonnage par grappes (où on sélectionne des groupes d’individus appelés «grappes»).
Ces méthodes ne seront pas abordées ici. La plupart des procédés statistiques décrits dans cet
ouvrage supposent que l’échantillon est aléatoire simple.
Si on dispose d’une liste des individus ou des unités de la population, on peut obtenir
un échantillon aléatoire simple à l’aide d’une table de nombres aléatoires. Celle-ci permet de
déterminer objectivement les individus (ou unités) qui seront sélectionnés dans l’échantillon.
Un générateur de nombres aléatoires est un programme informatique qui perm et d’effectuer le
même travail de façon plus automatique.
Les échantillons aléatoires et les distributions échantillonnâtes

m
v
^
4, W
•» ”
f ''
f - ■
’ «r «
. ' • „
.1 m f *J
• ” b
1
' k . • “ / • æ ,

p .
Exemple 8.1
j » ( v ^ 4 ^ v • f »■ <* y . * ” * 7 « fc , #

Soit 25 lots de matière première dont on veut tirer un échantillon aléatoire de 5 lots. On peut ici numé­
roter ces lots de 1 à 25 et utiliser la table IX présentée en annexe. La façon de procéder consiste à lire 3a
table de haut en bas et de gauche à droite, à partir d’une colonne et d’une ligne choisies arbitrairement.
Dans notre exemple, on relève deux chiffres à la fois jusqu’à ce qu’on obtienne cinq nombres accep­
tables (c’est-à-dire compris entre 1 et 25).
Supposez, par exemple, que dans la table IX, on commence à la première colonne et à la sixième liane. En
gardant les deux derniers chiffres de chaque nombre, on aurait : 21,62,01,79,75, * 53,29,65,19,85,68,
11, etc. Les nombres en gras désignent les lots de matière première qui formeru»*» férùanml-m aléatoire.

8.2 Les statistiques et les distt


échantillonnâtes

Statistique
On appelle «statistique» toute fonction des observations d'un échantillon aléatoire qui n'est
dépendante de paramètres inconnus.

Si Xv X2, ...,X n représentent les valeurs prises par la variable aléatoire X à l’intérieur d’un
échantillon aléatoire de taille n,les quantités X et S2, définies au chapitre 7 par l
et 7.4, constituent ainsi des statistiques. Il en va de même pour la médiane, le mode, l’étendue,
le coefficient d’asymétrie et le coefficient d’aplatissement de l’échantillon. (On utilisera ici des
lettres majuscules comme symboles parce qu’on se réfère à des variables aléatoires et non à des
valeurs numériques particulières, comme c’était le cas au chapitre 7. Les valeurs numériques,
quant à elles, seront présentées en lettres minuscules.)
Les statistiques occupent une place importante dans le processus qui consiste à tirer des
conclusions au sujet d’une population à partir de données d’échantillon. En outre, les méthodes
utilisées nécessitent la compréhension du comportement probabiliste de certaines statistiques.
On appelle en général «distribution échantillonnale» la distribution de probabilité d’une sta­
tistique. Plusieurs distributions échantillonnâtes, qui sont définies et présentées brièvement à
l’aide d’exemples dans ce chapitre, joueront un rôle clé dans les chapitres subséquents. Nous
allons d’abord fournir quelques définitions pertinentes et d’autres éléments expliquant l’impor­
tance de ces distributions.

Distribution échantillonnale
La distribution échantillonnale d'une statistique correspond à la fonction de densité ou de masse qui
décrit le comportement probabiliste de cette statistique lorsqu’on procède à des tirages répétés à partir
d’une même population.

La forme d’une distribution échantillonnale varie selon les hypothèses formulées quant à la
distribution des valeurs de la variable d’intérêt. Rappelons que le prélèvement d’un échantillon
aléatoire de taille n associé à une variable notée X fournit les résultats Xv X2, ..., Xn, lesquels consti­
tuent des variables aléatoires mutuellement indépendantes ayant chacune la même distribution.
CHAPITRE 8

La distribution échantillonnais de K
Considérons par exemple la statistique X , la moyenne éch an tillo n n ai, qui consiste en
une combinaison linéaire de n variables indépendantes. Or, on sait que si E{X) = fi et que
V(X) = CT2, alors E(X) = net V(X) = c J 2/A
n.
alors X ~ N(jU, a 2/n), ce qui correspond à la distribution éch an tillo n n ai de X pour n > 1.
Si le modèle qui détermine les valeurs prises par la variable X diffère du modèle normal
(s’il est par exemple exponentiel ou uniforme), il est possible que le théorèm e central limite
puisse s’appliquer et qu’il soit raisonnable d’affirmer que la moyenne suit approximativement
une loi normale lorsque n est suffisamment grand.

Erreur-type
L’erreur-type d’une statistique correspond à l’écart-type associé à sa distribution échantillonnale. Si
certains des paramètres en cause ont une valeur inconnue, on utilise l’estimateur pour déterminer une
erreur-type estimée.

L'erreur-type de la moyenne échantillonnale K


A titre d’exemple, supposons qu’on échantillonne une population norm ale présentant une
moyenne // et une variance G 2. Comme X obéit alors à une loi normale de moyenne // et de
variance G 2In, son erreur-type se traduit par

Si, ne connaissant pas l’écart-type g , on lui substitue l’écart-type s de l’échantillon dans l’équa­
tion précédente, on obtient alors l’erreur-type estimée de X, soit

Exemple 8.2
On recueille des données sur la résistance en traction d’un mortier de ciment de Portland modifié.
Voici les 10 valeurs observées en kilogrammes-force par centimètre carré (kgf/cm2) :
16,85; 16,40; 17,21 ; 16,35; 16,52; 17,04; 16,96; 17,15; 16,59; 16,57
On suppose ici que la loi normale décrit bien la résistance en traction du mortier. La moyenne de
l’échantillon est de
x = 16,76 kgf/cm2.
Si l’on sait (ou si l’on suppose) que la résistance en traction présente un écart-type de = 0,25 kgf/cm2,
alors l’erreur-type de la moyenne de l’échantillon correspond à
a/yfn = 0,25/VÏÔ = 0,079 kgf/cm2.

Si l’on ne peut pas supposer que <r = 0,25 kgf/cm2, on peut utiliser l’écart-type de l’échantillon, soit
s = 0,316 kgf/cm2, pour déterminer l’erreur-type estimée, ce qui donne
s/yfn = 0,316/VÏÔ = 0,100 kgf/cm2.
Les échantillons aléatoires et les distributions échantillonnâtes

s
e
1 8.3
Pour mieux comprendre le concept de distribution échantillonnale de X, considérons une variable X,
par exemple la vitesse des véhicules à un endroit précis sur une route de campagne. Supposons que la loi
de probabilité de X est la loi normale de moyenne p - 9 5 km/h et d
on peut dire que si on mesure la vitesse individuelle d’un très grand nombre de voitures choisies aléa­
toirement à cet endroit, qu’on note chacune d’elles dans la colonne d’une feuille de calcul (par exemple
dans le tableur Excel), alors l’histogramme de ces observations aura approximativement la forme d’une
cloche normale centrée à 95 km/h, avec des points d’inflexion à 85 et à 105 km/h (voir la figure 8.1).
Supposons maintenant qu’au lieu de noter la vitesse d’une seule voiture à la fois dans le tableur,
on inscrit à chaque ligne la vitesse moyenne de quatre voitures choisies au hasard, et qu’on répète
cette opération un très grand nombre de fois. On obtient alors une colonne île chiffres représentant
plusieurs moyennes de quatre observations. L’histogramme de ces valeurs aura aussi une allure de
courbe normale centrée à 95 km/h, mais avec une erreur-type o N 'n = ! O/V’4 = 5 km/h. Les points
d’inflexion seront donc situés à 90 et à 100 km/h {voir la figure 8.2).
Il est normal que la variabilité soit réduite quand on considère des moyennes plutôt que des observa­
tions individuelles. Une moyenne, même basée sur seulement 4 observations, a plus de chances d’être
proche de p qu’une seule observation choisie au hasard. Dans le même ordre d’idées, si on notait des
moyennes basées sur 25 observations plutôt que 4, la variabilité de X serait encore plus faible (l’erreur-
type serait alors égale à cr/Vn = 2 km/h), et les points d’inflexion de la courbe normale seraient situés
à 93 et à 97 km/h (voir la figure 8.3, à la page suivante).

Densité

La distribution de X lorsque 1: 95,100)

La distribution de la moyenne échantillonnale lorsque n - A : 95,25) ►


230 CHAPITRE 8
%

/
/

.•
4


*

»
»
I

La distribution de la moyenne échantillonnai lorsque 25: A/(95, 4)

8.3 La loi du khi-carré


On peut définir bien d’autres distributions échantillonnales utiles à partir de variables aléatoires
normales. L’une d’elles porte le nom de «loi du khi-carré» ou «loi du khi-deux».

m_ jjn . * !
t V , U< * à f # ] S : \ tf * , L . y*-
——
» L * 1 BT A M . f 4% X
• F | / F • \ ^ J « '
\ r J : 1 j j? ... F ^ | * —_ F / y 1. ■, ^ _ y * J ®* f — * *■ '• . . / • ▲ , ' . J A ^ p ■ 1 ^~ pL ■ ' ^ J . * B
■ — * , L 4 V h •5 Vf C ▼ , ^ 1 , ♦ V .F F
B X . 1 .
r M
’ É » '

Soit Z,, Z2, ..., Zk des variables aléatoires indépendantes et normalement distribuées avec une
moyenne /z = 0 et une variance <r2 = 1. La variable aléatoire
2 2
U = Z2+ Z$ + ■■■+ z k
obéit alors à une loi du khi-carré avec k degrés de liberté, notée et sa fonction de densité est
1 (*/2)-l -«/2 si u > 0,
2 */2p' k
/(«) ( 8 . 1)
2
0 sinon.

La moyenne de la loi x ï se traduit par


ECU) = k (8.2)
et sa variance, par
V(U) = 2k (8.3)

La figure 8.4 montre la courbe associée à la fonction de densité de la loi du khi-carré avec
différents degrés de liberté. Soulignons que toute variable khi-carré est non négative et que sa
fonction de densité se traduit par une courbe asymétrique s’étirant sur la droite. Toutefois, plus
la valeur de k augmente, plus cette courbe devient symétrique. De plus, lorsque k —> °o la loi du
khi-carré se confond avec la loi normale de moyenne k et de variance 2k.
L es éch an tillo n s a léa to ire s e t les d istrib u tio n s é c h a n tillo n n a is

La fonction de densité de la loi du khi-carré avec différents degrés de liberté

Lé détermination des quantités de le loi du khi-cerré è l'aide


d'une table
La table III de l’annexe donne la valeur de différents quantités de la loi du khi-carré. On définit
ici Xa- k com m e le quantité d’ordre 1 — a d’une variable U suivant une loi du khi-carré avec
k degrés de liberté, soit la valeur pour laquelle la probabilité que U prenne une valeur supérieure
à ce quantité est a , d’où

P ( V > x l . k) = ( , f ( u ) d u = oc.
J Xct\ k

C ette probabilité correspond à l’aire om brée de la figure 8.5.

0 y2 u
^or,k

Le quantité Z2a; kd'une loi du khi-carré à k degrés de liberté

Exemple 8.4

Par exemple, la densité du khi-carré à 10 degrés de liberté a une espérance de 10 et un écart-type <
>/2xlO = 4,472. En se basant sur la table 111, on peut déduire que

P(U > Xo,05;u>) = P(U *18,311 = 0,05.

En d’autres termes, le 95e centile d’une loi du kbi-carté avec 10 degrés de liberté est x o.os,\o ” ^
CHAPITRE 8

La propriété d'additivité de la loi du khi-carré


Tout comme la loi normale, la loi du khi-carré présente une importante propriété d ’additivité.

Soit t/j, U2, ..., Up,des variables indépendantes suivant une loi du khi-carré ayant respectiv
kv k2, ...,k degrés de liberté. La variable
Y —U| -b U2+" • Up
obéit alors à une loi du khi-carré avec k degrés de liberté, où
k = k\+

Démonstration I

On peut présenter chaque variable U.sous la forme d’une somme des carrés d
centrées réduites, d’où

Par conséquent,

et, toutes les variables aléatoires Zi}étant indépendantes parce que les variables U le sont, la variable
Y correspond tout simplement à la somme des carrés de variables normales centrées réduites indé­
pendantes. Or, selon le théorème 8.1, il s’ensuit que la variable Y obéit à une loi du khi-carré avec
k degrés de liberté.

La distribution échantillonnale d'une fonction de S2


Voici un exemple d’une fonction de la variance échantillonnale obéissant à une loi du khi-
carré. Soit un échantillon aléatoire formé de X v X2, ..., Xn et tiré d’une population normale de
moyenne fj. et de variance a 2. La fonction de la variance de cet échantillon obéit à une loi du
khi-carré, et on peut écrire

On utilisera fréquemment cette variable aléatoire aux chapitres 9 et 10, car le fait qu’elle obéit
à une loi du khi-carré permet d’y recourir pour faire des estimations par intervalle de confiance
et pour effectuer des tests d’hypothèses au sujet de la variance d’une population normale.

Exemple 8.5
Considérons à nouveau la variable X représentant la vitesse des voitures sur une route de campagne
(voir l'exemple 8.3), où X ~ N(95, 100). Supposons qu’on échantillonne aléatoirement quatre voitures. ►
Les échantillons aléatoires et <es hismouttons échenrwonnaies

On calcule la variance échantillonnai de ces quatre observations (notée s2), nuis on inscrit la valeur
(n- l)s2 i
de —= -j^-Qdans une colonne d’un tableur. Ensuite, on répète cette opération un très grand nombre
2

de fois. L’histogramme de toutes les valeurs observées de aura alors l’allure d’une courbe du khi-
deux à 3 degrés de liberté, avec une moyenne de 3 et une variance de 6.
Si on répète la même expérience aléatoire avec 25 observations chaque fois au lieu de 4, Histogramme
des valeurs de — aura l’allure d’une courbe du khi-deux à 24 degrés de iiberté, avec une
moyenne de 24 et une variance de 48.

8.4 La loi t de Student


La loi t, aussi appelée « loi t de Student » ou simplement « loi de S i n < » 5es* une autre clistri—
bution échantillonnai importante.

Soit Z une variable aléatoire suivant une loi /V(0, 1) et une variable aléatoire suivant une loi jfj. Si
ces deux variables sont indépendantes, alors la variable aléatoire

obéit à une loi de Student à k degrés de liberté, notée tk, et sa fonction de densité est

r[(* + p/2] ____ i —oo < t< OO. (8.5)


m a +n/: ) %

Æ r< * /2 )'[(,*/*>+il'**

La loi t présente une moyenne de


E(T) = 0 pour k > 1
et une variance de
k
V(T) pour
k- 2

Démonstration

La figure 8.6 ( voirà la page suivante) montre la fonction de densité de la loi t ave
rents degrés de liberté. La distribution obtenue ressemble à celle d’une variable normale cen­
trée réduite, étant elle aussi symétrique et unimodale avec une ordonnée maximale au point où
t = 0. Elle se caractérise toutefois par des ailes plus épaisses, ce qui veut dire qu’elle comporte
une probabilité plus élevée pour les valeurs plus éloignées de la moyenne. Lorsque le nombre de
degrés de liberté k tend vers l’infini, la loi t se confond avec la loi normale centrée réduite. Pour
se représenter la fonction de densité d’une loi tyil peut être bon de savoir que son ordonnée au
CHAPITRE 8

point t = 0 est environ quatre à cinq fois supérieure à son ordonnée au point correspondant au
5e ou au 95e centile. Le rapport entre ces deux valeurs est en fait de 4,8 si la loi t a 10 degrés
de liberté, de 4,3 si elle en a 20 et de 4,1 si elle en a 30. À titre comparatif, le rapport s’établit
à 3,9 dans le cas d’une loi normale.


/ / ----------------------- ------- - ................................... — ............ .. ................................. .......................... ................................................ ............. .....................................................................................................................................................................................................................................................— --------------------------------------------------------------------------------------------- *-------------- '---------------------------------------- -------------------------------------------------------------- ------ --------------------------------------------------------------------------------------------------------------------------------------------- ■■ --------------------

m k

■ v . 7 ^ J j r
La fonction de densité de la loi t avec différents degrés de liberté

La détermination des quantités de la loi de Student à l'aide


d'une table
La table IV de l’annexe indique différents quantiles de la loi t. On définit ici tœk comme le quan-
tile (ou la valeur) d’une variable suivant la loi t avec k degrés de liberté pour lequel

P (T > ta;k)= f fit)


J *a; k

Ce quantile est représenté graphiquement à la figure 8.7. Comme on a ici une distribution
symétrique par rapport à la moyenne, t_ = —ta. Il s’agit l
table IV ne fournit que des quantiles de la partie positive de la distribution, c’est-à-dire des
valeurs de t ûf.fCpour a < 0,50. y

■ ! I» P M . a W K .0 w «<1 „ , ,1< ............................. « ■ ■ ■ " ■ ' » « » » ■ ■ ■ ■ ■ '« I l ~ '■ i I- i. r . , m - i— ............................ . « « W M » — — — .................. 1 1 » ’* * «■■■■■■»■» ........... ..................... ................................... . . » — .................................... ^ i ......................................................................................................................................................................................................................................................................................................................... .................................................... — . ■ . . . . . w . . 0- . . —..1 • « , ........................................- »l 1 ■! » ■■■— 1

^
Les échantillons aléatoires et les distributions échantillonnais

Selon la table IV,


P(T>t005._w) = P(T> 1,812) = 0,05.

En d’autres termes, le 95e centile d’une loi t avec 10 degrés de liberté, noté toos. I0, est 1,812. Il s’ensuit
que la valeur opposée est le 5e centile et se note t09i. 10= 5:10. Cette valeur correspond à -1,812.

La distribution de la moyenne échantiilonnale lorsque crest


estimé par S
Soit un échantillon aléatoire formé de X,, X2, ..., X„, tiré d ’une population normale de moyenne
fl et de variance a 2.Sachant que X représente la moyenne de 1échantillon et S 2, sa vari
examinons la variable aléatoire

En divisant le numérateur et le dénominateur de l’équation 8.6 par <7, on obtient

Comme ( X - / x)/( o7 n/tc) ~ N(0,1), tandis que


que les variables X et S2 sont indépendantes, il ressort du théorème 8.3 que

n - 1*

Aux chapitres 9 et 10, on utilisera la variable aléatoire définie à l’équation 8.7 pour détermi­
ner des intervalles de confiance et vérifier des hypothèses en ce qui concerne la moyenne d’une
loi normale, lorsque la variance de la population est inconnue.

Exemple 8.7
Reprenons l’exemple de la variable X désignant la vitesse des voitures sur une route de campagne, où
X~ (95, 100). Si on mesure la vitesse moyenne de 25 véhicules (notée J), qu’on inscrit dans une
N
.r-95
colonne de tableur la valeur de ’tjTJn= , et qu’on répète cette opération un
de fois, l’histogramme de ces valeurs aura la forme d’une courbe normale centrée réduite, c'est-à-dire
une loi MO, 1).
Par contre, si on utilise l’écart-type échantillonnai s au lieu de l’écart-type théorique <7, qu’on inscrit
x —u x —95
dans une colonne de tableur la valeur de j^ =
nombre de fois, l’histogramme de ces valeurs aura la forme d’une loi de Student à - 1 = 24 degrés de
liberté, c’est-à-dire une cloche centrée à 0, mais un peu plus évasée que celle de la loi MO, 1).
CHAPITRE 8

8.5 La loi de Fisher


La loi F, appelée parfois «loi de Fisher», est une autre distribution échantillonnale très utile

THÉORÈME 8.4 La définition de la loi de Fisher


Soit W et Y des variables indépendantes suivant des lois du khi-carré < respectivement w et v
.* .-

degrés de liberté. * %

Le rapport
Wht
F
Yh

obéit à une loi F de Fisher avec udegrés de liberté au numérateur et v degrés de


nateur. On note en général cette loi FII V, et sa fonction de densité est

U + V \ I U r u/2
(u/ 2)
r f
- I

2 v
/*(/) -i(// +v)/2 o < /< ( 8 . 8)
(v \ u .
r r - f +1
v2y (2 J _V

* /

La variable F a une moyenne de


v
E{F) pour v >2
v -2
et une variance de
2 v2(u+ v —2)
V(F) pour v > 4.
u(v —2)" (v —4)

Démonstration

^ \ i ' ' / . . . . . . • . - .
' 2 , ' -> ' -■ » J> » * . .1 x * * J . t •

La figure 8.8 montre la courbe associée à la fonction de densité de la loi F pour différents
degrés de liberté. Toute variable suivant une loi F est non négative. Sa fonction de densité se
traduit par une courbe asymétrique s’étirant sur la droite. Cette courbe ressemble beaucoup à
celle de la fonction de densité d’une variable suivant une loi du khi-carré (voir la figure 8.4),
mais son espérance est toujours légèrement supérieure à 1. . —

Notons que si on élève au carré une variable aléatoire X suivant une loi alors la nouvelle
« • * ' ■ * . . * ' * •

variable X2 suivra une loi Ft .. Voici le raisonnement derrière cette affirmation. Si X suit une
loi de Student, on peut la définir comme au théorème 8.3, c’est-à-dire en utilisant une variable
' . • ‘ * " ' • * '

V suivant une loi du khi-carré à k degrés de liberté, et une variable Z suivant une loi N (0, 1) :
«. # *

Z
X tk
* ~ -,

V râ
- J

2
En se rappelant que si Z ~ N(0, 1), alors Z2 ~ x\-> on obtient que
2
2 Z71
X
v • •

k
VTk
Les échantillons aléatoires et les distributions échantillonnâtes

La fonction de densité de la loi F avec différents degrés de liberté:


a) w= 5, v= 5,15,60; b) u = 5,15,60, v - 5

La détermination des quantités de la loi de Fisher à l'aide


d'une table
La table V de l’annexe indique différents quantiles de la loi F. On définit ici Fn comme le O » V

quantile d’ordre 1 —oc de la loi F avec u et v degrés de liberté, soit la valeur pour laquelle la
probabilité que la variable F soit supérieure à ce quantile est

P(F S j* h (f)d f = a .
~ ' a ; u, v

La figure 8.9 présente graphiquement cette notion.


/
h{f)\

Les quantiles d'ordre or et 1 - a d'une loi Fu

La table V ne fournit que des quantiles de la partie supérieure de la distribution (c’est-à-dire


des valeurs de Fa.uv pour a < 0,50). On peut déterminer les quantiles de la partie inférieure,
notés F, _a.u ven posant

Fi - a.*., = T r — ■ (8-9)
* a; v, u

Exemple 8.8
Si u = 5 et v = 10, par exemple, il ressort de la table V que
P(F > F0.0S;5j0) = P(F > 3,33) = 0,05. >
CHAPITRE 8

Dans le cas de F095 5 10, on obtient


1 1
F0 ,9 5 ; 5 ,1 0 0,211
F,0 ,0 5 ; 1 0 ,5 4,74
En d’autres termes, le 95e centile de la loi F5 10 correspond à F005.5 ,0= 3,33, et le 5e centile de la
loi F.5 .1 0 correspond à F0,95 ; 5«,1 0 = 0,211.

La distribution échantillonnais impliquant le rapport


des variances
Soit deux populations normales de variances G et o \ respectivement et deux échantillons
2

aléatoires indépendants, l’un de taille n{ tiré de la population 1 et l’autre de taille n2 tiré de la


population 2. Si S2
et S\ représentent la variance des échantillons, alors le rapport

F«i-i,/i2-i • ( 8.10)

Cet état de choses s’explique par le fait que (nx - \ ) S 2/ g 2 ~ x î ,_i> tandis que
(n2 - Ï)S2I g 2 ~ XÎ2-i> et Par Ie théorème 8.4. La variable aléatoire définie par l’équation 8.10
jouera un rôle clé aux chapitres 9 et 10, dans les problèmes liés à l’estimation par intervalle de
confiance et aux tests d’hypothèses en ce qui concerne la variance de deux populations nor­
males indépendantes.

Normale
centrée réduite N(0, 1) 0 1 ^a N ( 0,1)
G/ yfn
Khi-carré avec
k, 2k,
k degrés de xî x l.t
(k > 0) (k > 0)
liberté
Student avec
0,
k degrés de h k - 2’ ^a\ k n-l
liberté ! (* > d S/yfn
! (k > 2)
Fisher avec u V 1 2 v 2(u + v —2)
et v degrés de v -2 ’ m(v - 2)2(v - 4 ) ’
Si l o i F
K ,v Fa;u,v x «i-l,rt9-
liberté (v > 2) (v > 4)
* ^(Variable > Quantile) = a
** Basé sur des échantillons provenant d’une distribution N(ju, G2)

2
Si X F , alors MX F\\ U* Si X ~ tk, alors X fr, k •
Les échantillons aléatoires et les distributions échantillonnais

rcic
8.1 Soit une population de blocs d’alimentation distribution échantillonnai de la variable
pour micro-ordinateurs dont la tension aléatoire
de sortie obéit à une loi normale avec une
moyenne de 5,00 volts et un écart-type de X ,-X 2 - ( / q - ^ 2)
0,10 volt. On choisit au hasard huit de ces yl(<jf/nx) +(cr;/n2)
blocs d’alimentation.
8.4 Un fabricant de puces semi-conductrices
a) Indiquez à quelle loi X obéit.
en choisit 100 au hasard dans sa production
b ) Quelle est l’erreur-type de X ?
afin de vérifier si eiîes sont défectueuses
c) Imaginez qu’on ne connaît pas ou non. Qn p o s e ici X = 0 lorsque la Même
l’écart-type de la population. Dans puce vérifiée est non défectueuse, et X, = 1
ce cas, comment pourrait-on estimer lorsqu’elle est défectueuse. La proportion
l’erreur-type calculée en b) ? échantillonnai de puces défectueuses est
8.2 Un agent d’approvisionnement achète alors définie par
25 composants du fournisseur 1, et 30 du X j + X 2 +*’ *+ X 100
fournisseur 2. On suppose que les valeurs 100
X, ,, X,2, ..., X, 25 de la résistance électrique
des composants obtenus du fournisseur 1 a) Quelle est la distribution échantillonnai
sont indépendantes et obéissent à une loi approximative de p?
normale avec une moyenne de 100 ohms b) Déterminez l’erreur-type de Indiquez
et un écart-type de 1,5 ohm. De même, on ensuite son erreur-type estimée.
suppose que les valeurs X2 ,, X2 2, ..., X2 30
de la résistance électrique des composants 8.5 Déterminez si les énoncés suivants sont
obtenus du fournisseur 2 sont indépen­ vrais ou faux.
dantes et obéissent à une loi normale avec a) Si X,, X2, ..., XJ0constituent un échan­
une moyenne de 105 ohms et un écart-type tillon aléatoire simple issu d’une dis­
de 2,0 ohms. tribution /'/(100, 36), alors la moyenne
a) Quelle est la distribution échantillonnai échantillonnai de ces 10 valeurs suit
de X ,-X 2? une loi /V(100, 36).
b) Quelle est l’erreur-type de X, - X2? b) Si X,, X2, ..., X)0constituent un échantil­
c) S’il était impossible de supposer que lon aléatoire simple issu d’une distribu­
la résistance électrique obéit à une loi tion N(10, 3), alors la variable 3S2 a une
normale, que pourrait-on affirmer au espérance de 9 et une variance de 18.
sujet de la distribution échantillonnai c) Dans un contexte d’échantillonnage
de X ,-X 2? aléatoire simple, la variabilité d**. ia
d) Quelle est la distribution échantillonnai moyenne échantillonnai diminue
lorsque la taille d’échantillon augmente.
de la statistique 7
n si/4,00 d) Si K~ ts, alors P(Y> 2) = P(Y< -2).
e) Quelle est l’espérance de la statistique eî Si ^ ~ X 2,alors/,(W>4) = P (^ < 4 ).
dont il est question en d) ? f) Lorsqu’on pari d’erreur-type de la
8.3 Soit deux échantillons aléatoires indépen­ moyenne, on fait référence à l’écart-type
dants, l’un de taille n,, tiré d’une population deX.
normale de moyenne fixet de variance cr2, 9 ) Le pH d’une certaine rivière suit une
et l’autre de taille n2, tiré d’une population loi normale de moyenne 6,7 et de va­
normale de moyenne et de variance cr2. riance 1 . On prend des mesures de pH
Sachant que X, et X2 représentent ici les sur 25 échantillons d’eau pris à des
moyennes d’échantillon, déterminez la endroits différents le long de cette
240 CHAPITRE 8

rivière, et on obtient une moyenne de esquisse de la fonction de densité au préa­


6,9 et un écart-type de 0,87. Dans cette lable pour estimer la valeur cherchée.
situation, les nombres 6,7 et 1 sont des <*) ^ 0 , 9 5 ; 8
« statistiques » et les nombres 6,9 et 0,87 2
b) X 6,5 0 ; 12
sont des « paramètres ». 2
c) X 0 ,0 2 5 ; 2 0
8.6 Supposons que la pression systolique de d) La valeur de ktelle que
patients diabétiques est distribuée selon 2
P(U<k) = 0,975, où
une loi normale de moyenne 130 mm Hg 2
10

et d’écart-type 10. On planifie de mesurer e) P ( U < 3,49), où U ~ x 8


2
la pression systolique de n individus diabé­ f) P(U<18,55), où U~% 12

tiques choisis au hasard. Associez les situa­ 8.9 À l’aide de la table IV de l’annexe, déter­
tions proposées dans la colonne de gauche minez chaque valeur ci-dessous. Tracez
avec les bonnes valeurs de et dans la une esquisse de la fonction de densité au
colonne de droite. préalable pour estimer la valeur cherchée
a) n =: 100, D a ==77,8 a) *0,25; 10
P(a <X <b) = 0,90 b ==124,5 b) *0,25;20
b) n ==25, 2) a -=-1,7 0 La valeur de k telle que
P(a <X <b) =0,90 b--= 1,7 P(T<k) = 0,95, où tw
c) n ==100, 3) a -= 128,4 d) La valeur de k telle que
P(a <S2 < 0,90 b == 131,6 P(T <k) = 0,025, où T~ tl0
d) n ==25, 4) a = 126,7 e) P(T> 1,311), où F~ t29
Ÿ-130 b■ = 133,3 f) P(T > -2,660), où T ~ t
a< <b 0,90
5/5 8.10 À l’aide de la table V de l’annexe, déter­
minez chaque valeur ci-dessous. Tracez
8.7 Un employeur cherche à connaître la satis­ une esquisse de la fonction de densité au
faction moyenne de ses 1000 employés à préalable pour estimer la valeur cherchée
l’égard de leur travail. Il considère les scé­ F
a) 1 0,25; 4, 9
narios ci-dessous pour sonder ses employés.
Déterminez s’il s’agit d’un échantillon aléa­ b) F
1 0,05; 15, 10
toire simple ou non. c) 1F0,95 ; 6, 8
a) Envoyer lui-même un message à tous d) 1F0,90; 12,24
les employés demandant à ceux qui le e) La valeur de k telle que
souhaitent de répondre au sondage. P(F> k) = 0,10, où F ~ F10,5
b) Piger au hasard les noms de 50 employés, f) La valeur de k telle que
et les obliger à répondre au sondage le P(F <k) = 0,10, où F ~ F 10,5
plus honnêtement possible. 9) P(F < 8,65), où F - F2 ,8
c) Piger 4 départements au hasard parmi h) P(F > 0,0254), où F ~
les 25 départements, et exiger que
tous les employés de ces départements 8.11 Soit F, _a , le quantile d’ordre a de la
répondent au sondage. loi F v» tel que 0 < a < 1. Démontrez
u,
1
d) Puisque l’entreprise compte 60 % qUe^.-a;„, Fa\V. u
d’hommes, choisir au hasard
30 hommes et 20 femmes parmi les 8.12 On s’intéresse au poids des boîtes de spa­
employés, et exiger qu’ils répondent ghetti d’une certaine compagnie, dont l’éti­
au sondage. quette affiche 500 grammes. On tient pour
acquis que le poids d’une boîte suit une loi
8.8 À l’aide de la table III de l’annexe, déter­ normale avec une moyenne de 510 grammes
minez chaque valeur ci-après. Tracez une et un écart-type de 7 grammes.
Les échantillons aléatoires et les distributions échantillonnais

a) On répète 10 000 fois les trois opéra­ aient une moyenne d’environ
tions suivantes : __________ et un écart-type
• choisir une boîte au hasard dans la d’environ__________
production ; d) On répète 10 000 fois les trois opéra­
• mesurer son poids ; tions suivantes :
• inscrire cette mesure dans un tableur • choisir 25 boîtes au hasard dans la
(tel Excel), dans une colonne intitulée production ;
« Poids ». • mesurer le poids de chacune d’elles,
Ainsi, on s’attend à ce que les évaluer la variance des 25 mesures
10 000 entrées de la colonne «Poids» et calculer la quantité h
aient une moyenne d’environ inscrire cette valeur dans un tableur,
__________ et un écart-type dans la colonne « Valeur u ».
d’environ__________ Ainsi, on s'attend à ce que les
b) On répète 10 000 fois les trois opéra­ 10 000 entrées de la colonne « Valeur u »
tions suivantes : aient une moyenne d’environ
• choisir 25 boîtes au hasard dans __________ et un écart-type
la production ; d’environ__________
• mesurer le poids de chacune 8.13 Soit deux échantillons indépendants prove­
d’elles et calculer la moyenne des nant de populations normales, tels que :
25 mesures ;
X„X2,...,X 10~ W , a 2)
• inscrire cette valeur moyenne dans
un tableur, dans la colonne « Poids r„y2, ...,y20~v(8, a2).
moyen ». a) Quelle est la loi de X, + X, + X3?
Ainsi, on s’attend à ce que les b) Quelle est la loi de X ?
10 000 entrées de la colonne « Poids c) Quelle est la loi de 2X - 3K ?
moyen » aient une moyenne d’environ
__________ et un écart-type d) Quelle est la loi de xr 7 ?
d’environ__________ Quelle 15 V
c) On répète 10 000 fois les trois opéra­ f) Quelles sont l’espérance et la variance
tions suivantes : y- 8
de W Sy/JÏÔ 9'
• choisir 25 boîtes au hasard dans la
production ; g) Quelles sont l’espérance et la variance
• mesurer le poids de chacune d’elles, de T a2
évaluer la moyenne et la variance des h) Quelle est la loi de / 2?
25 mesures et calculer la quantité 8.14 Soit X„l X,,2 ..., X,t16 un échantillon aléatoire
_ 3c-5 1 0 d’une variable X de loi normale V(l0, 4).
~ 5/V25 ’ Calculez les probabilités suivantes:
• inscrire cette valeur dans un tableur, a) P(X, < 11)
dans la colonne «Valeur t». b) P(X< 11)
Ainsi, on s’attend à ce que les c) P(|X - 10| < 2 • S)
10 000 entrées de la colonne « Valeur » d) P(S2 > 2,28)
"inférence statistique se définit comme un raisonnement à l’aide duquel on
tire, à partir de renseignements fournis par les données d’un échantillon, des
/
- conclusions au sujet d’une population. Elle comporte deux grandes parties :
l’estimation de paramètres et les tests d’hypothèses. Nous parlerons ici de î’estima-
tion de paramètres, puis nous explorerons les tests d’hypothèses au chapitre 10.

Voici un exemple de problème lié à l’estimation de paramètres. La résistance à la compression


d’un certain type de béton fait l’objet d’une étude. Comme elle varie naturellement d’une par­
celle à l’autre, on souhaite en estimer la moyenne pour l’ensemble de la population que forment
toutes les mesures de résistance qu’on pourrait prendre sur ce type de béton. On pourrait aussi
vouloir en estimer la variabilité au sein de cette population. Nous allons présenter des méthodes
permettant l’estimation ponctuelle de paramètres tels que la moyenne et la variance d’une popu­
lation, et d’autres servant à leur estimation par intervalle de confiance grâce à l’association
d’une marge d’erreur aux valeurs estimées.

9.1 L'estimation ponctuelle


L’estimation ponctuelle consiste à attribuer à un paramètre inconnu d’une population une valeur
numérique d’une statistique basée sur un échantillon, appelée « estimateur ponctuel » ou simple­
ment «estimateur».

Estimateur ponctuel
Soit Xune variable aléatoire de d e n s i t é f(x)caractérisée par le paramètre
un échantillon aléatoire de taille n des valeurs prises par X. Un estimateur ponctuel de 6 est une statis-
A

tique $ = h(X}, X2, ..., XJ permettant d’évaluer approximativement le paramètre 6.

Soulignons que l’estimateur 6 est une variable aléatoire qui ne dépend pas de 0, car il s’agit
A

d’une fonction des données d’échantillon. Une fois l’échantillon obtenu, 6 prend une valeur
numérique particulière qu’on appelle la « valeur estimée de 6 » ou l’« estimation de 6 ».

Exemple 9.1
Supposons que la variable aléatoire X obéit à une loi normale de moyenne // inconnue. La moyenne
de l’échantillon X constitue alors un estimateur ponctuel du paramètre inconnu ju, soit la moyenne de
la population. En d’autres termes, fl = U
. ne fois l’échantillon obtenu, la valeur
X
une estimation ponctuelle de //. ►
0
L'estimation de paramètres

Soit x, = 2,5, x2= 3,1, jc3= 2,8 et x4= 3,0. L’estimation ponctuelle de p est alors
2,5 + 3,1 + 2,8 + 3,0
2,85.
4
De même, si l’on ne connaît pas la variance a 1 de la population, on peut utiliser la variance S2 de
l’échantillon comme estimateur ponctuel, la valeur numérique s2= 0,07, calculée à partir des données
d’échantillon, devenant alors l’estimation ou la valeur estimée de G2.

Les problèmes d’estimation sont chose courante dans le domaine du génie tout comme dans
l’ensemble de la recherche. En effet, on doit souvent estimer les paramètres suivants :
• la moyenne p d’une population ;
• la variance cr2 (ou l’écart-type a) d’une population ;
• la p r o p o r t i o n p des éléments d’une population qui appartiennent à une catégori
• la différence entre les moyennes de deux populations, soit p x- p 2;
• la différence entre les proportions dans deux populations, soit
Voici, pour chacun de ces paramètres, un estimateur ponctuel acceptable :
• un estimateur de p est p - X, soit la moyenne de l’échantillon ;
• un estimateur de a 2 est â 2= S2, soit la variance de l’échantillon ;
• un estimateur de p est p= X/n, soit la proport
le nombre d’éléments dans un échantillon aléatoire de taille n qui appartiennent à la
catégorie à l’étude ;
• un estimateur de p^ - p^est p x- /q = X, - X2, soit la d
deux échantillons aléatoires indépendants ou appariés ;
• un estimateur de p x- p 2 est p, - p2, soit la différence entre les proportions établies à
partir de deux échantillons aléatoires indépendants.
Un même paramètre peut compter plusieurs estimateurs ponctuels possibles. Dans le cas
de la moyenne d’une variable aléatoire, on pourrait ainsi envisager comme estimateur ponctuel
la moyenne d’un échantillon, sa médiane ou même la moyenne de la plus petite et de la plus
grande valeur observées dans l’échantillon. Afin de déterminer lequel des estimateurs ponc­
tuels d’un paramètre donné convient le mieux, il faut en examiner les propriétés statistiques et
fixer certains critères de comparaison.

9.1.1 Les propriétés des estimateurs


Le biais
Tout estimateur devrait, en un certain sens, avoisiner la vraie valeur du paramètre inconnu. De
A

manière formelle, 0 constitue un estimateur sans biais (ou non biaisé) du paramètre ô lorsque
E(0) = 0. (9.1)
A

En d’autres termes, B se révèle un estimateur sans biais de 6 si les valeurs qu’il prend sont
en moyenne égales à 6, ce qui revient à exiger que la moyenne de la distribution échantillonnale
/ S

de B soit égale à B.

Biais d'un estimateur


A

On définit le biais d’un estimateur 6 du paramètre comme suit:


Biais(ê) = E(Ô) - 0.
244 CHAPITRE 9

Exemple 9.2

Soit X une variable aléatoire de moyenne fi et de variance G2, ainsi que X,,X2, Xn un échantiJJor
aléatoire de taille n des valeurs prises par X. Démontrons que la moyenne X de l'échantillon est un
estimateur sans biais de fi.
Sachant que
n

X *. 1 n
i=l
E( X) X E ( X . >

n «M l

et que E (X) = fi pour tout / = 1, 2, . . n, on obtient

1^
E( X) M
” 1=1

La moyenne X de l’échantillon constitue donc un estimateur sans biais de la moyenne fi de la population.


Cela signifie que si l’on tire un échantillon de taille n dans la population, qu’on calcule la moyenne de
ces n valeurs (c’est-à-dire x) et qu’on répète cette opération un très grand nombre de fois (en fait, une
infinité de fois), la moyenne de toutes ces valeurs x sera égale à la moyenne de la population (c’est-
à-dire fl).
De même, on peut montrer que la variance échantilîonnale S2 est un estimateur sans biais de la
variance théorique g 2:

n
2
y (x, - x )
E (S2) i=l
n —1
n
1 2
eY (x, - x )
Tl — 1 i=l
n
1
e £ (X? + X 2 - 2 X X i )
n —1 i= l

n
1 2
e y xf nX
n —1 i =l

n
1
Y E ( X ? ) - n E ( X 2) .
n —1 i=l

Toutefois, comme E(X?) —fj 2 + G 2, tandis que E ( X 2) = fi 2 + < j 2 / n , o n o b tie n t

E ( S 2) = —M ^ ( p 2 + G 2) - n ( p 2 +cr 2/n)

• *
1
(n jl2 + n G 2 - n fl2 - G 2)
n — î

G 2.

La variance S 2 de l’échantillon constitue donc un e s tim a te u r sans b ia is de la v a r ia n c e G 2 de la


population. k
L’estimation de paramètres

Par contre, on peut montrer que l’écart-type S de l’échantillon s’avère un estimateur biaisé de l’écart-
type a de la population, bien que le biais ou l’erreur systématique en cause soit négligeable lorsque
l’échantillon est de grande taille.

L'erreur quadratique moyenne

Erreur quadratique moyenne d'un estimateur


L’erreur quadratique moyenne (EQM) d’un esti nateui 1 i
m
4~.

% |L
f
I
'

EQM(0 H- fj1
IU /
(9.2)
On peut en réécrire la formule comine suit :
/ — V(0) Ri ni
I l 1ci I (9.3)
A

Autrement dit, l’erreur quadratique moyenne de l’estimateur correspond à la m e île sa


variance et du carré de son biais. Lorsque 6 constitue un estimateur sans biais de B, son erreur
quadratique moyenne est alors égale à sa variance. L’erreur quadratique moyenne fournit un
important critère pour comparer deux estimateurs : on préférera en général l’estimateur ayant
la plus faible EQM.

Efficacité relative
A A

Soit ôxet d2, deux estimateurs du paramètre Payant respectivement une erreur quadratique moyenne
A * A ^ A

EQM(d.) et EQM{6^). L’efficacité relative de 6 , par rapport à 6-, est définie par

t )
EOMidO
A

Si l’efficacité relative est inférieure à 1, on conclura que 6 Xest un estimateur plus efficace
A

de 0 que 6V, en ce sens qu’il présente une plus petite erreur quadratique moyenne.

Exemple 9.3
Supposons qu’on désire estimer la moyenne fl d’une population dont on a tiré un échantillon aléatoire
U,
moyenne X de l’échantillon et une seule observation, ici notée Xn provenant de cet échantillon. Comme
quadratique
variance. On a ainsi )= variance
EQM(X) = V(X,) EQM de X est inférieure à YEQM
observadon
En ce qui concerne l’efficacité relative de X, par rapport à X, on peut écrire que
EQM(X) o 2ln 1
2
EQM(XJ a n
Le fait que (1/n) < 1 pour tout échantillon de taille n>2 favorise X.

On souhaitera donc trouver, parmi les estimateurs sans biais d’un paramètre, celui dont
la variance est la plus faible. Il s’agit là de son estimateur sans biais de variance minimale, La
figure 9.1 (voir à la page suivante) illustre la distribution de probabilité de deux estimateurs
CHAPITRE 9

A A

sans biais dont l’un, noté/V


0 X,présente une plus faible variance que l’autre, no
deux estimateurs, 6 , est le plus susceptible de fournir une valeur estimée proche de la vraie
valeur du paramètre inconnu 0.
Il arrive qu’on préfère un estimateur biaisé à un estimateur sans biais parce qu’il comporte
une plus petite erreur quadratique moyenne. On peut en effet réduire de beaucoup la variance
d’un estimateur en y associant un biais (c’est-à-dire une erreur systématique) relativement petit.
Tant que le carré de ce biais demeure inférieur à la réduction de la variance, on obtient un estima­
teur amélioré en ce qui a trait à l’erreur quadratique moyenne. La figure 9.2 montre la distribution
/V A

de probabilité d’un estimateur biaisé 0 Xet celle d’un estimateur sans biais 02. Sa variance étant
A

moindre, 0 Xest plus susceptible de fournir une valeur estimée proche de la vraie valeur de 0.

e
La distribution de deux estimateurs sans biais, et 02. On voit que 9 1a une
variance inférieure à celle de 02.

L'estimateur biaisé Ôx a une plus faible variance que l'estimateur non biaisé 02-

La convergence
A

On peut aussi définir l’exactitude d’un estimateur 0 du paramètre 0 en s’intéressant à la


convergence.

C onvergence d'un estim ateu r

estimateur
si, pour 0,
lim P(\ên -|< =1 (9.4)
n
L'estimation de paramètres

La convergence est une propriété associée aux grands échantillons puisqu’elle décrit le
comportement limite de l’estimateur 0 lorsque la taille de l’échantillon tend vers l’infini. Il
est en général difficile de démontrer par l’équation 9.4 qu’un estimateur est convergent. Sont
convergents les estimateurs dont l’erreur quadratique moyenne tend vers zéro lorsque la taille
de l’échantillon approche de l’infini. On peut ainsi dire que X est un estimateur convergent de
la moyenne d’une population normale, car lim EQM(X) = lim (a 2ln) - 0.
n — > « r — > o o

Y
9.1.2 La méthode du maximum d vr
La méthode du maximum de vraisemblance compte parmi les m eilleures méthodes d’estima­
tion ponctuelle.

Fonction de vraisemblance
Soit une variable aléatoire X dont la distribution de nro
seul paramètre inconnu. Si l’on note jc,, x2,• »X • « e s

de taille n.cet échantillon aura la fonction de vraisemblanc

Le choix de la lettre L vient de l’anglais likelihood, qui signifie «vraisemblance». Si pétait


connu et les xf inconnus, cette fonction serait la distribution conjointe de l’échantillon X , , ..., Xn.
On pourrait alors calculer la probabilité d’obtenir telle ou telle valeur pour X,, . .., Xn. Or, dans
notre situation, l’échantillon a déjà été observé, et on cherche la valeur de 6 qui maximise la
probabilité d’obtenir cet échantillon précis.

Estimateur de maximum de vraisemblance


La valeur 9 pour laquelle la fonction L{9) atteint son maximum constitue l'estimateur du maximum
de vraisemblance de d. Il suffit en général d’annuler la dérivée de [ou de ln J, et d'isoler 6
pour obtenir cet estimateur.

On devra bien sûr vérifier que la dérivée seconde est négative pour garantir qu’on a bien
trouvé un maximum. On exprime finalement 6 comme une fonction de l’échantillon X,,X X,,
_
___ A Ji
...,
Xn. En général, 6 est une variable aléatoire qui a une distribution échantillonnaîe dont on peut
étudier les caractéristiques.

Exemple 9.4
Soit X une variable de Bernoulli ayant la fonction de masse

six = 0 ou 1,
P{X = x) = <
sinon,
W

où pr eprésente le paramètre à estimer. La fonction de vraisemblance d’un échantillon de taille se


traduira ici par


CHAPITRE 9

On peut voir que si L(p) atteint son maximum pour une valeur p , il en va de même û
ln L(p), puisqu’il s’agit d’une fonction monotone croissante. Par conséquent,

On a ainsi

dlnL (p)
dp

En posant ce dernier terme égal à zéro et en isolant , on obtient du maximum dt


vraisemblance

un résultat intuitivem ent ju g é acceptable, car il s ’agit de la proportion de succès dans 1’échantillon qui
estim era la probabilité de succès théorique p. Il reste à vérifier que la dérivée seconde est négative . Et
c ’est bien le cas ici.
é

Exemple 9.5
Soit une variable X distribuée selon une loi normale de et de variance cr2 co n n u e
La fonction de vraisemblance d ’un échantillon de taille n se traduit ici par
n 1 - ( x , - /J) 2/2 cr 2
l (m ) = T 1 crJZn: e
n
- 0 / 2 ( 7 2) X (X, - M )
i 1= 1
2 n/2
e
(2 tto ) \

On aura donc
n
n 1
ln L(p) ln(27rcr 2) £ i- p )
(X
2 1=1
et
n
dlnL(p) 1 V (x. - p ) .
d/u CJ i=î

E n p o sa n t ce dernier résu ltat égal à zé ro e t en isolant ju, on o b tien t

X
c o m m e estim ateur du m ax im u m de vraisem blance de ju. Encore une fois , le résu ltat nous a p p a ra ît
sensé, puisque la m oyenne é c h a n tillo n n a i sert d 9estim ateur à la
L'estimation de paramètres

On peut vérifier graphiquement que la vraisemblance atteint son maximum au point corres­
pondant à la valeur de l’estimateur du maximum de vraisemblance. Soit un échantillon de taille
n = 10 tiré d’une population normale et formé des éléments
14,15; 21,86; 22,59; 23,70; 25,01 ; 25,19; 25,92; 26,47; 32,07; 32,30.
On sait que la variance de la population est de 4. Il a par ailleurs été démontré à l’exemple 9.5
que X constitue l’estimateur du maximum de vraisemblance de la moyenne d’une population
normale. Or, 3c = 25 selon les données fournies ici. La figure 9.3 présente graphiquement le
logarithme de la fonction de vraisemblance pour diverses valeurs de la moyenne. On y voit que
le maximum de la fonction log-vraisemblance se situe au point où u - 25.

r C lL
f T - , '; j r ' J * *
Le logarithme de la fonction de vraisemblance en fonction de la moyenne

Comme le montre l’exemple 9.6, il n’est pas toujours possible de recourir au calcul différen­
tiel pour déterminer le maximum de la fonction L{6).

Exemple 9.6
Soit une variable aléatoire X uniforme sur l’intervalle [0, à\. La fonction de vraisemblance d’un échan­
tillon aléatoire de taille n se traduit ici par

La courbe représentative de cette fonction ayant partout une pente non nulle, on ne peut recourir à des
méthodes de calcul pour déterminer â, l’estimateur du maximum de vraisemb
tefois que la fonction L{à) augmente à mesure que la valeur de a diminue. Il s’ensuit que cette fonction
atteint son maximum pour la plus petite valeur qu’on peut raisonnablement attribuer à a. Or, comme
la valeur de a ne peut manifestement pas être inférieure à la plus grande valeur observée au sein de
l’échantillon, c’est cette dernière qu’on attribuera à âLe paramè
maximum de vraisemblance â = max(.X, = X(n).

On peut utiliser la méthode du maximum de vraisemblance dans les cas où il faut estimer
plusieurs paramètres inconnus, ici notés 6V 02, ..., 6k. La fonction de vraisemblance est alors
une fonction de ces k paramètres inconnus 6V
A
, ..., 6k. Afin de déterminer les e
du maximum de vraisemblance {#,}, on rend égales à zéro les k dérivées partielles d’ordre 1
[9L(0,, 02, ..., 0k)ld6iy pour i = 1, 2, ..., k], et on résout le système d’équations ainsi obtenu.
CHAPITRE 9

Exemple 9.7
Soit une variable normale X dont on ne connaît ni la moyenne ni la variance cr2. Déterminons
l’estimateur du maximum de vraisemblance de fl et celui de cr2. La fonction de vraisemblance d’un
échantillon aléatoire de taille n se traduit ici par
n
L(^ ) = n - ^ w /2 *
n
-(l/2 cr2) ^ - fl)
i i=1
2 \n/2
e
{2 k g )

et
n
n 2 1 2
ln L(u, g 2) \n { ln G )
2

Il faut donc poser

d\nL(fi,a2) 1 f (X|_ M) = 0i
dfl /=!
3lnL(/x,cr2) n 1 n
2
2
+ 2 > , - ao 0.
ô(cr2) 2cr

En résolvant les équations précédentes, on obtient les estimateurs du maximum de vraisemblance

fi =- J lx, = x
n tr.
et

2
ce dernier étant étroitement lié à la variance sans biais de l’échantillon, S2, puisque â 2 = [(n —l)/n]5

Les estimateurs du maximum de vraisemblance ne sont pas nécessairement sans biais


(comme le démontre celui de G2 à l’exemple 9.7), mais il est souvent facile de les modifier
pour en éliminer le biais. Ce biais approche en outre de zéro si l’on a un échantillon de grande
taille. Les estimateurs du maximum de vraisemblance ont en général de bonnes propriétés
asymptotiques. En effet, lorsque n est grand, ils présentent une distribution asymptotique nor­
male, ne comportent aucun biais et se caractérisent par une variance approchant la variance
minimale. De plus, les estimateurs du maximum de vraisemblance sont convergents. On leur A

reconnaît aussi une propriété d’invariance, laquelle fait en sorte que si 0 représente l’esti­
mateur du maximum de vraisemblance de 6, et si u{6) est une fonction de 0 possédant une
fonction inverse à valeur unique, alors l’estimateur du maximum de vraisemblance de u{0)
A

est u{6).
L'estimation de paramètres

9.1.3 La méthode des moments


Soit X une variable aléatoire continue ayant la fonction de densité f ( x ; 0,, 0„ $ ) ou une
variable aléatoire discrète ayant la fonction de massep (x ; 0,, 0k), cette variable se carac­
térisant par k paramètres inconnus.

Moments échantillormaux
Si X., X ,, X„ forment un échantillon aléatoire de taille
t a i l l e n de y on peut définir
0

1 W r i . %
d e s iV/ oc tlC
p ii rt n n cac
U I h►aL/I ! oC N U il
\
comme suit les k premiers moments de cet échantilh n 4pk a r n A I1Xr fl ^CX 1i ovJIr 1C 1O %
I
l tA
1
l i11
l M/*%
il H ^ ^ ** /
_ _ a .
^ - A A
I 7 __ _

* — — 0 _ — — — -
M

1
m -n 2 , m (9.6)
i ~ I

Moments théoriques

Les moments {ju't} de la population sont en général des fonctions des k paramètres in­
connus {#,.}.

Estimateur par la méthode des moments


En faisant correspondre les moments de l'échantillon à ceux de la population, on obtient équations
simultanées à k inconnues (les paramètres 0,). En d'autres termes,
M, m' t= 12
i J • y • • • y k
f \ «
(9.8)
La solution de l'équation 9.8, notée 0,, 0,, ..., 0 k, fournit les estimateurs de la méthode des moments
de 0P 0:, ..., 0 .

Exemple 9.8
Soit une variable X de loi N(p, a 2), les paramètres fl et a 2étant ici inconnus. Pour trouver à chacun un
estimateur par la méthode des moments, il faut se rappeler que dans le cas de la loi normale,
p[ = EÇi) = /i,
p = E(X2) = a + pi2.
'2 2

1" J «
Les moments de l’échantillon se traduisent ici par m[ = - et = - Y X] En recourant à l’équa­
tion 9.8, on obtient donc n »=i n «=i
CHAPITRE 9

d’où on arrive aux solutions

Dans cet exemple, la méthode des moments donne les mêmes estimateurs de et de cr2 que la méthode
du maximum de vraisemblance.

Exemple 9.9
Soit X une variable uniforme sur l’intervalle [0, à\. On veut trouver un estimateur de a par la méthode
des moments. Or, le premier moment de la population par rapport à zéro est

Quant au premier moment de l’échantillon, il s’agit tout simplement de X. Par conséquent,


â = 2X,
l’estimateur de la méthode des moments pour le paramètre a n’étant autre que le double de la moyenne
de l’échantillon.
Dans cet exemple, l’estimateur obtenu ne génère pas une valeur estimée conforme à ce que l’on connaît
de la situation. Ainsi, dans le cas d’un échantillon formé des observations xx= 60, x2 = 10 et x3 = 5,
â égalerait 50, une valeur inacceptable puisqu’on sait qu’une des valeurs observées vaut 60, ce qui
implique que a > 60.

La méthode des moments fournit souvent d’assez bons estimateurs. En règle générale, les
estimateurs obtenus par la méthode des moments présentent une distribution asymptotique nor­
male et se révèlent convergents. Leur variance peut toutefois être plus grande que celle des esti­
mateurs déterminés par d’autres méthodes comme celle du maximum de vraisemblance. Les
estimateurs fournis par la méthode des moments peuvent aussi, à l’occasion, laisser à désirer,
comme c’est le cas à l’exemple 9.9.

9.2 L'estimation par intervalle de confiance


à partir d'un seul échantillon
Dans bien des situations, une estimation ponctuelle ne fournit pas assez de renseignements
sur le paramètre d’intérêt. Si l’on désire par exemple estimer la résistance moyenne p à la
compression de béton, une valeur ponctuelle ne sera pas nécessairement très éclairante,
car on ignore ses chances d’être proche de la vraie valeur de p. Un intervalle estimé de la
forme L < p < U pourrait s’avérer plus utile. Les bornes L et U d’un tel intervalle (de l’an­
glais lower et upper) sont des variables aléatoires, car il s’agit de fonctions des données
d’échantillon.
L'estimation de paramètres

Intervalle de confiance de niveau 1 - a


Pour estimer par intervalle un paramètre inconnu 0, il faut en général trouver deux staristiques, L et
U, telles que
P (L < 0 < U )= \-a . (9.9)
L’intervalle [L, U] ainsi obtenu est un intervalle de confiance à 100(1 - à) % pour le paramètre
inconnu 6. L’expression 1 -andique
i le degré de confiance ou niveau de confiance
l’intervalle.

L 'in t e r p r é t a t io n d 'u n in te rv a lle d e c o n f ia n c e


Quel sens faut-il donner à un intervalle de confiance? Si l’on tirait de la population un grand
nombre d’échantillons aléatoires et si l’on construisait à partir de chacun un intervalle de
confiance de niveau 1 - or pour 0, alors 100(1 - a)9c de ces intervalles renfermeraient la
vraie valeur de 6.
Cette situation est représentée graphiquement à la figure 9.4, où l’on peut voir plusieurs inter­
valles de confiance à 100(1 intervalle
centre
estimation ponctuelle de u (l’estimateur des 15 intervalles
présentés ne comprend pas la vraie valeur de //. À long terme, seulement des intervalles ne
renfermeront pas la moyenne u si le niveau de confiance s’établit à 95 %.

* w -

Divers intervalles de confiance de niveau 1 - a pour // obtenus à partir


d'échantillons différents
CHAPITRE 9

Dans la pratique, on ne prélève qu’un seul échantillon et on ne construit qu’un seul inter­
valle de confiance. Comme cet intervalle ne renfermera pas nécessairement la vraie valeur de 9,
on ne peut raisonnablement associer une probabilité à cet intervalle particulier. On dira plutôt
qu’il est possible d’affirmer avec 100(1 - a) % de confiance que le paramètre 6 sera compris
dans l’intervalle observé [L, U]. Cet énoncé se prête à une interprétation axée sur la fréquence :
on ignore s’il se vérifie pour l’échantillon à l’étude, mais on sait que la méthode utilisée pour
établir l’intervalle [L, U] fournit un énoncé vrai dans 100(1 - a) % des cas.
La longueur de l’intervalle de confiance observé fournit une mesure importante de la qua­
lité des renseignements tirés de l’échantillon. En effet, la longueur du demi-intervalle, soit 0 —L
ou U - 9, reflète la précision de l’estimateur. Plus un intervalle de confiance est long, plus on
a la certitude qu’il renferme la vraie valeur de 9. Toutefois, plus il est long, moins il fournit de
renseignements sur la vraie valeur de 9. L’idéal consiste à avoir un intervalle relativement court
et un degré de confiance élevé.

9.2.1 La moyenne d'une loi normale de variance connue


Soit X une variable aléatoire normale de moyenne jd inconnue et de variance cr2 connue. Suppo­
sons un échantillon aléatoire de taille n, noté X v ..., On peut construire un intervalle de
confiance à 100(1 - a) % pour jd en se basant sur la distribution échantillonnale de la moyenne X
de l’échantillon. Or, on a vu à la section 8.3 que X est normalement distribuée lorsque X obéit à
une loi normale et à peu près normalement distribuée lorsque les conditions d’application du
théorème central limite sont satisfaites. La moyenne de X correspond à u et sa variance, à a 2In.
2
En bref, si X ~ N{fd, <r2), alors X ~ N(ju, o L!ri) . On peut donc affirmer que la variable aléatoire
x -fd
Z
olyfn
obéit à une loi normale centrée réduite, c’est-à-dire une loi N(0, 1).
La figure 9.5 présente graphiquement cette fonction de densité de Z. En examinant cette
figure, on remarque que
X —jd \
P z al2 <---- - < z al2 1- a
J G/yfn
On peut réécrire cette dernière équation en isolant fd au centre, ce qui donne
»

p (x z al 2o /J n < /x< X + zal2(?/sfn) = 1- a . (9.10)

Intervalle de confiance pour // (données normales, cr2 connue)


• , . I * * * . * , . . . " , . ■ . . ' * B . * »

En comparant les équations 9.10 et 9.9, on découvre qu’un intervalle de confiance à 100(1 - a ) % pour
lorsque les données proviennent d’une loi normale de variance cr2 connue, se traduit par
X ± zal2<T/y/n (9.11)
ou, en d’autres termes,
L =X *‘Ctîï(j/sflî et U = X + ZaïïGlyfn.
La demi-longueur de l’intervalle, soit zanOl4n, s’appelle la «marge d’erreur de l’intervalle >>
L'estimation de paramètres

La fonction de densité de Z, soit la loi 1)

* é* . * . • _' m 1 * j ^ J / J | ' * « • .

Exemple 9.10
Un article paru dans le Journal of Heat Transfer (vol. 96, n° 1, 1974, p. 59-64) décrit une façon
de mesurer la conductivité thermique du fer Armco. Les 10 mesures de cette conductivité (en
BTU/h-pi-°F), énumérées ci-dessous, ont été obtenues à une température de 100 °F avec une puis­
sance fournie de 550 W.
41,48 ; 41,60 ; 41,72 ; 41,81 ; 41,86 ; 41,95 ; 42,04 ; 42,18 ; 42,26 ; 42,34.
On veut établir un intervalle de confiance à 95% pour la conductivité thermique moyenne du fer
Armco dans ces conditions, sachant que la moyenne de l’échantillon est de 41,924 BTU/h-pi-°F
et en supposant que l’écart-type de la population (a) est de 0,10 BTU/h-pi-°F. Si l’on suppose que
la conductivité thermique obéit à une loi normale, on peut utiliser l’équation 9.11 pour définir cet
intervalle.
Dans le cas d’un intervalle à 95%, 1 - «=0,95, de sorte que 0,05. Or, = z005/2 z00-,5 = 1*96
selon la table II de l’annexe. On a ainsi l’intervalle de confiance
x ± z a/2<J/Jn = 41,924 ± 1,96(0,10)/VÏÏ) = 41,924 ±0,062.

Par conséquent, l’intervalle de confiance de niveau 95 % est


41,862 <n< 41,986.
Il s’agit là d’une plage de valeurs raisonnables pour la moyenne à un niveau de confiance de 95 %.

Le niveau de confiance et la précision de l'estimation


Le niveau de confiance adopté à l’exemple précédent, soit 95%, relève d’un choix essentiel­
lement arbitraire. Que se passerait-il si l’on optait pour un niveau de confiance plus élevé, tel
99% ? D’ailleurs, serait-il logique de viser un plus haut degré de confiance? Lorsque a —0,05,
Zai2- z0,025= 1*96. La longueur d’un intervalle de confiance à 95 % correspond ainsi à
2(1,96Gt-Jn) - 3,92<j /V«.
Lorsque a = 0,01, zM = z0>005= 2,58. La longueur d’un intervalle de confiance à 99 % est de
2(2,58a/Vn) = 5,16a/Vn.
L’intervalle de confiance à 99% est donc plus long que celui à 95%. C’est d’ailleurs
pour cette raison qu’on a davantage confiance que cet intervalle contienne la vraie valeur du
CHAPITRE 9

paramètre. En règle générale, pour une même taille d’échantillon n et un même écart-type <7,
plus on choisit un niveau de confiance élevé, plus l’intervalle obtenu est long.
Puisque la longueur de l’intervalle établi indique la précision de l’estimation, cette préci­
sion est inversement proportionnelle au niveau de confiance. Comme on l’a déjà souligné, il est
grandement préférable d’établir un intervalle de confiance assez court pour permettre la prise
de décision tout en assurant un degré de confiance adéquat. Une façon d’y parvenir consiste
à choisir une taille d’échantillon n suffisante pour obtenir un intervalle

selon le niveau de confiance requis.

Le choix de la taille de l'échantillon


L’intervalle de confiance défini par l’équation 9.11 assure une marge d’erreur égale à za/2<J/yfn.
Cela signifie qu’on peut avoir confiance à 100(1 - a)% que si l’on utilise X pour estimer fi,
l’erreur |X - fi\ sera inférieure à zallo l4 n (la marge d’erreur de l’intervall
la figure 9.6.
/ * ■. » . . > « * ■ — ■■ «

Erreur = IX- fJ\


h H

L =X — X U =X + Za<j/\fn
* *

L'erreur associée à l'estimation de fi par X

Lorsqu’il est possible de choisir la taille de l’échantillon, on peut attribuer à n une valeur
permettant d’avoir confiance à 100(1 - a) % que l’erreur commise en estimant // sera inférieure
à une valeur donnée e. Il suffit d’isoler n dans l’équation
za/2cr/Vn < e,
ce qui donne

Si la valeur du membre de droite de l’équation 9.12 n’est pas un nombre entier, il faut arrondir n à
l’entier supérieur. Soulignons que l’intervalle de confiance ainsi obtenu aura une longueur de 2e.

Exemple 9.11
Reprenons ici l’exemple 9.10 et supposons qu’on veut estimer la conductivité thermique moyenne du
fer Armco en ayant confiance à 95 % que l’erreur sera inférieure à 0,05 BTU/h-pi-°F. Sachant que
cr= 0,10 et que z0025= 1,96, on peut déterminer la taille requise de l’échantillon en posant

<0,05,
ce qui donne

Ainsi, la taille n minimale est de 16.


L'estimation de paramètres

La taille de l’échantillon requise dépend de la longueur de l’intervalle, du niveau de


confiance 1 - a et de l’écart-type G. En effet, la valeur requise de n augmente lorsque
• la longueur voulue de l’intervalle diminue (tandis que G et 1 - a demeurent inchangés) ;
• l’écart-type augmente (tandis que la longueur de l’intervalle et 1 - a demeurent in­
changés) ;
• le niveau de confiance augmente (tandis que la longueur de l’intervalle et g demeurent
inchangés).

9.2.2 La moyenne d'une Soi normale de —ice


inconnue
Supposons qu’on veut établir un intervalle de confiance pour la moyenne d’une loi normale de
variance inconnue. On dispose d’un échantillon aléatoire de taille n. noté X,, X2, ..., Xn, lequel
présente une moyenne X et une variance S2. Une façon de procéder consisterait à remplacer g par
l’écart-type S de l’échantillon dans les formules permettant d’établir un intervalle de. confiance
pour // lorsque l’on connaît la variance (c’est-à-dire dans l’équation 9.11). Il s’agit là d’une solu­
tion acceptable si la taille de l’échantillon est relativement grande (si n > 30, par exemple). On
associe en effet souvent aux échantillons de grande taille les intervalles de confiance définis
à la sous-section 9.2.1 parce qu’ils demeurent à peu près valables même lorsqu’on substitue la
variance de l’échantillon à la variance inconnue de la population.
On devra cependant utiliser une méthode différente si l’échantillon est de petite taille, car
il faut alors poser une hypothèse plus forte au sujet de la population sous-jacente pour obtenir
un intervalle de confiance adéquat. L’hypothèse la plus courante veut que la population soit
normale, ce qui engendre des intervalles de confiance fondés sur la loi t de Student. Supposons
ici un échantillon aléatoire X,, X2, ..., Xn tiré d’une population normale de moyenne ju et de
variance g 2 inconnues. On a vu à la section 8.4 que la variable aléatoire
_ X-
T= ^

obéit à une loi t avec n - 1 degrés de liberté. Voyons maintenant comment établir un intervalle
de confiance pour p.
La figure 9.7 {voir à la page suivante) présente graphiquement la fonction de densité de
T = (X - p)/{S/yfn). Si on note ta/2.n_l le quantile d’ordre 1 - a l2 de la loi t avec n - 1 degrés
de liberté, il ressort de cette figure que

tlal2 ;n-1 <


- -----— < t
r “ *a/2;n-l

On peut réécrire cette dernière équation sous la forme

P (X ~ * X + tan,n-is / 'fn)
H

Intervalle de confiance pour p (données normales, <rz inconnue)


En comparant les équations 9.13 et 9.9, on découvre qu’un intervalle de confiance à 100(1 - oc) l
pour u, lorsque les données proviennent d'une loi normale de variance G2 inconnue, est al ors
O/ /
X±t S/v/?.
a l2 : /i- l (9.14)
CHAPITRE 9

La fonction de densité de la variable a l é a t o i r e T, s o i t une lo i de S t u d e n t


à n - 1 degrés de liberté

E xe m p le 9.12

Selon un article paru dans le Journal ofTesting and Evaluation (vol. 10, n° 4, 1982, p. 133-143), des
essais effectués sur des échantillons traités de vêtements de nuit pour enfants ont permis d ’obtenir les
20 mesures ci-dessous du temps de propagation des flammes (en secondes) :
9,67, 9,67, 9,74, 9,75, 9,75, j
9,77, 9,83, 9,85, 9,85, 9,87,1
9,88, 9,89, 9,92, 9,92, 9,93,1 s = 0,0954
9,93, 9,94, 9,95, 9,95, 9,99.)
On veut construire un intervalle de confiance à 95 % pour le temps de propagation moyen.
\

La table IV de l’annexe indique que t0025. 19= 2,093. L’intervalle de confiance se

X ± tai2,n-lS/yfn
9.8475 ± 2,093(0,0954)A/2Ô
9.8475 ± 0,0446.
L’intervalle de confiance à 95 % pour p est, par conséquent, [9,8029 ; 9,8921].
On s’attend, avec un niveau de confiance de 95 %, que le temps de propagation moyen se situe entre
9,8029 et 9,8921 secondes. Si on répétait cette expérience un grand nombre de fois et qu’on établissait
chaque fois l’intervalle de confiance pour p à 95 % en utilisant cette formule, environ 95 % des inter­
valles contiendraient la vraie valeur de p ,e 15 % d’entre eux ne la contiendraient pas. Bien sûr, dans les
faits, on ne réalise l’expérience qu’une seule fois. On ignore donc si notre unique intervalle contient la
vraie moyenne de la population, mais on aura confiance à 95 % que c’est le cas.

Les procédés décrits ici supposent que la population échantillonnée est normale. Cela
s’avère important dans le cas des échantillons de petite taille. Heureusement, l’hypothèse de
normalité se vérifie dans nombre de situations concrètes. Lorsqu’elle ne s’applique pas, on doit
se tourner vers des intervalles de confiance non paramétriques, c’est-à-dire des méthodes qui
n’utilisent pas l’hypothèse de normalité, où l’on substitue souvent aux observations la valeur de
leur rang dans l’échantillon ordonné. (Ces méthodes ne sont pas présentées dans ce manuel.)

Le choix de la taille de l'échantillon


Il est plus difficile ici que dans le cas où l’écart-type cr est connu de déterminer la taille n
que l’échantillon doit avoir afin qu’un intervalle de confiance présente la longueur voulue.
L'estimation de paramètres

Cela s’explique par le fait que la longueur de l’intervalle est fonction de la valeur de S (qu’on
ne connaît pas au moment de recueillir les données) et de celle de n. En effet, la valeur de
n influe sur l’intervalle par le biais de 1/Vn et de taf2. n_l. Il faut donc fixer arbitrairement
(ou par une étude-pilote) la valeur de S et procéder par tâtonnement pour déterminer la taille
requise de l’échantillon.

9.2.3 La variance d'une lot normale


Supposons une variable aléatoire normale X de moyenne (i et de variance a 2 toutes deux
inconnues. Soit un échantillon aléatoire de taille n, noté X uI X ,, ..., X ,' ei sa variance S2. À la
m *

section 8.3, on a déterminé que la distribution échantillonnai de


2
U
1)S
2
cr
est une loi du khi-carré avec n - 1 degrés de liberté
On remarque, en examinant la figure 9.8, que
2
2 < (n z l)S_ 2
P X i- a/2; n~l 2 af2:n-l l-a
<7

On peut réécrire cette dernière équation sous la forme


2 2
1)5 < (72 < 1)S
P 2 2 l-a
y Xal2;n-\ X\-a/2;n-\

Intervalle de confiance pour cr2 (données normales)


% *

En comparant les équations 9.15 et 9.9, on découvre qu’un intervalle de confiance à 100( (I ) V /

pour cr2, lorsque les données proviennent d’une loi normale, est
(n-\)S (n-\)S gU loi
< <7 < -
afl\r\ xi M
U
W i
I
r
— .
»
A

La fonction de densité de ia variable aléatoire U, sort une loi du khi-deux


à n - 1 degrés de liberté
CHAPITRE 9

Exemple 9.13
Un fabricant de boissons gazeuses s’intéresse à l’uniformité du remplissage des canettes par une
machine. On suppose que ce volume obéit approximativement à une loi normale. Un échantillon
aléatoire de 20 canettes a donné lieu à la variance s2 = 0,0225 (once liquide)2. On veut établir un
intervalle de confiance à 95 % pour l’écart-type cr.On trouve d’abord un intervalle de confiance pour
la variance <T2 en remplaçant S2 dans l’équation 9.16 par sa valeur échantillonnale, ce qui donne
(n -l)s2 2 ^ (n -l)j2
—2------------------------
X0 ,0 2 5 ;1 9 X0 ,975; 19
c’est-à-dire
(19)0,0225 ^ 2 ^ (19)0,0225
----------------- < CT < ------------------ donc 0,013 < g 2 < 0,048.
32,85 8,91
On peut convertir cette dernière expression en un intervalle de confiance pour l’écart-type. Il suffit
d’extraire la racine carrée de chaque borne, d’où
0,114 < cr < 0,219 once liquide.

9.2.4 La proportion dans une population


Il est fréquent d’avoir à établir un intervalle de confiance pour une proportion notée Imaginez
par exemple qu’on a tiré un échantillon aléatoire de taille d’une population et que X des élé­
ments de cet échantillon appartiennent à une catégorie d’intérêt. Soulignons que X suit une loi
binomiale de paramètres n et p. On note p = XIn l’estimateur ponctuel de la proportion de la
population appartenant à la catégorie en cause. De plus, comme on l’a montré à la section 6.4,
la distribution échantillonnale de p correspondra approximativement à une loi normale de
moyenne p et de variance p{1 - p)/n si la valeur de p n’est pas trop proche d
celle de n est relativement grande. Il s’ensuit que la variable aléatoire

Z P~P

obéit approximativement à une loi normale centrée réduite.


Afin d’établir un intervalle de confiance pour p, il suffit de réaliser que

On peut réécrire cette dernière équation sous la forme

La quantité y]p(\ -/?)/« n’est autre que l’erreur-type de l’estimateur ponctuel p. Toute limite
de confiance fixée à partir de l’équation 9.17 renfermerait malheureusement le paramètre
L'estimation de paramètres

Il existe cependant une solution acceptable : remplacer p par ia dehniuon oe


l’erreur-type pour en faire une erreur-type estimée. On a alors

In te rv a lle d e co n fian ce approxim atif pour p (n g


En comparant: les équations 9.18 et 9.9, on découvt (approximatif) a
100(1 - pour p, lorsque n est grand, est

( 9 . 19 )

Notons que l’équation 9.19 peut engendrer un intervalle ayant une limite inférieure négative
qu’on ramène alors généralement à zéro. De même, la limite supérieure devrait être ramenée à
1 si elle dépasse cette valeur.

Exemple 9.14
i une surtace trop rugueuse
proportion p d’arbres hors
Pobs x/n 12/75 = 0,16. Afin d’établir
remplaçant p par p obs

A i Pobs(l-Pobs)
P Z 0,025
n
ou
0,16(0,84)
0,16 ±1,96
75
0,16 ± 0,08,
ce qui donne
0,08 < p<0,24.

Le choix de la taille de l'échantillon


Soit |j P rreur associée à l’estimation de p pa On peut affirmer avec environ
100(1 confiance que cette erreur est inférieure p)/n. De
de l’échantillon, on peut décider d’attribuer à n une valeur per­
mettant d’avoir confiance à 100(1 - a) % que cette erreur sera inférieure à une certaine valeur e.
Pour y arriver, il suffit d’isoler n dans l’équation
CHAPITRE 9

ce qui donne

n > f^ J p (l-p ). (9.20)

Pour a (< 0,5) et e(> 0) fixés, cette équation définit une parabole ouverte vers le bas
sommet au point p = 0,5. Afin de déterminer la valeur minimale de il faut d’abord est
Une possibilité consiste à effectuer une estimation subjective basée sur des expériences anté­
rieures, par exemple. On peut aussi tirer un échantillon préliminaire, établir la valeur de p et
recourir ensuite à l’équation 9.20 pour déterminer le nombre d’observations additionnelles dont
on aura besoin afin d’estimer p avec la précision voulue.
Si on n’a aucune idée de la taille de /?, il faut savoir que la taille de l’échantillon dans
l’équation 9.20 atteint toujours son maximum pour p = 0,5 [c’est-à-dire pour p (l —p) = 0,25], et
cette valeur peut servir à fixer une limite supérieure dans le cas de En d’autres termes, on est
confiant à au moins 100(1 - a) % que l’erreur résultant de l’estimation de p par p sera inférieure
à e si la taille de l’échantillon est

(0,25).

Afin de maintenir un niveau de confiance d’au moins 100(1 — a) %, on arrondit toujours la


valeur de n au nombre entier supérieur.

Exemple 9.15
Soit les données de l’exemple 9.14. Quelle devrait être la taille de l’échantillon pour qu’on puisse affir­
mer avec un niveau de confiance de 95 % que l’erreur commise en utilisant p dans le but d’estimer p
sera inférieure à 0,05 ? Si l’on adopte pobs= 0,16 comme valeur estimée in
révèle que la taille de l’échantillon devra être d’au moins

0,16(0,84) = 207.

Si l’on considère que l’échantillon n’a pas encore été tiré et qu’aucune valeur de p n’a été mesurée, on
utilise le pire cas de figure, c’est-à-dire la valeur de p qui donne la plus grande marge d’erreur, soit
p = 0,5. On obtiendrait alors

384,16,

ce qui signifie qu’il faudrait au moins 385 arbres pour que l’erreur d’estimation ne dépasse pas 0,05,
et ce, dans 95 % des cas.

Les procédés décrits dans la présente section reposent sur l’approximation de la loi binomiale
par la loi normale. Si la situation ne se prête pas à une telle approximation, ce qui est le cas en par­
ticulier lorsque n est petit, il faut recourir à d’autres méthodes. L’une d’elles consiste à utiliser une
table de la loi binomiale. Lorsque n est grand tandis que p est petit, on peut aussi établir un inter­
valle de confiance pour p en utilisant la loi de Poisson comme approximation de la loi binomiale.
L'estimation de paramètres

O .3 L'estimation par intervalle de confiance


à partir de deux échantiiion
9.3.1 La différence entre les moyennes de deux Sois
normales de variance connue
a première, X v étant de moyenne fJLî
moyenne ll, inconnue et de variance
2
<Tj connue. On souhaite établir un intervalle de confiance à I00(l - a)% pour différence
rs moyennes, fix- //^ Pour ce faire, on tire deux échantillons indépendants
lations. On note X,,, Xl2, ..., XUl l’échantillon aléatoire formé de n de X
y y
**2\’ 22 y
**2n formé 2 Si X . et X 2 représentent
îs moyennes echantillonnales, on peut tenir le raisonnement

l. On sait que
X,,, ...,X,_ ~ N(fiv a l) et que X2l, ..., X2n, ~ a l).
2. Cela implique que
a 2 ’
N a;2 \
N l et que X2 N
*i ni J n2 J
3 Puisque Xj - X2est une combinaison linéaire de variables aléatoires normales, il s’agit
également d’une variable aléatoire normale, et donc
a 2 a 2 \
x,-x2 N l + 2
nî n2 )
4 Par standardisation, on obtient que la variable aléatoire
X 2) th )
Z

normale centrée réduite. Notons qu’elle obéira approxim ativem ent


une loi normale centrée réduite si X, et X2 ne sont pas normales, mais i et n, sont
grands.
Comme le montre la figure 9.9 ( voirà lapage suivante), il s’ensuit que

N
(X, - X 2)-(ju Mi)
P z al2 < < Za/2 1- a

J
On peut réécrire cette dernière équation en isolant au centre :

2A
P (X î X2)~z al 2 2 l +2 l < p x- p 2 <{ X x- X 2) + z 1- a . (9.21)
nî n2 ai 2
ni n2 y
CHAPITRE 9

La fonction de densité de Z, soit la loi /V(0,1)

>

Exemple 9.16
On soumet à un essai des longerons en aluminium de deux qualités différentes. Ces poutres doivent
faire partie de la voilure d’un avion de ligne. Le tableau 9.1 indique les données ainsi recueillies sur
leur résistance à la traction. Supposez que l’on connaît l’écart-type de cette résistance dans chaque cas,
le procédé de fabrication et de mise à l’essai des longerons ayant déjà fourni des données à ce sujet.
Considérez également que la loi normale est un bon modèle pour cette variable.


Taille de Moyenne de l’échan­ Écart-type
Qualité l’échantillon tillon (en kg/mm2) (en kg/mm2)
1 n, = 10 3c, = 87,6 fa= 1,0
2 «2= 12 x2= 74,5 cr2= 1,5

Si faet fa dénotent la résistance moyenne véritable des longerons de chaque qualité, on peut construire
un intervalle de confiance à 90% pour la différence entre ces paramètres, soit fa —fa, en posant

ÇTl + ^2
AT- 2

X X- X 2) ± Z 0,05
« i n2
1 O2 1 52
(87,6-74,5)±l,645j— + ’
10 12
13,1 ± 0,882 kg/mm2.
On obtient ainsi l’intervalle de confiance à 90 % suivant :
12,218 kg/mm2 < fa - fa < 13,982 kg/mm2.
On s’attend, avec un niveau de confiance de 90%, que la résistance à la traction des longerons de la
2
qualité 1 soit de 12,218 kg/mm2 à 13,982 kg/mmz supérieure à celle des longerons de la qualité 2.
L'estimation de paramètres

Le choix des tailles d'échantillon


Si l’on connaît (du moins approximativement) les écarts-types a x et cr2, et si n x égale n2 (d’où
«, = n2 = n), on peut déterminer la taille que chaque échantillon doit présenter pour que l’esti­
mation de fix - fi^, à l’aide de X, - X2, occasionne une erreur inférieure à e à un niveau de
confiance de 100(1 - a)% .
Il suffit d’isoler ndans l’inégalité suivante :
2 2
<7, +<72
n
ce qui donne

On doit ici encore arrondir n à l’entier supérieur, le cas échéant.

9.3.2 La différence entre les moyennes de deux lois


normales de variances inconnues mais égales
On étudie maintenant deux populations normales qui présentent chacune une moyenne et une
variance inconnues. On souhaite encore établir un intervalle de confiance pour la différence
entre les moyennes fixet jj.2
.Si les deux échantillons ont chacun une taille supér
tion 9.22 pour deux lois normales de variance connue fournit une bonne approximation grâce
au théorème central limite. Cependant, en présence de petits échantillons, on doit supposer que
chaque population sous-jacente obéit à une loi normale de variance inconnue et se fonder sur la
loi t pour établir tout intervalle de confiance.

Les variances inconnues mais égales: q 2 2


<*? a
Soit deux variables aléatoires normales et indépendantes : X,, de moyenne juxet de variance <7?;
et X2, de moyenne et de variance <r2. On ne connaît ni leurs moyennes ni leurs variances.
Toutefois, on peut raisonnablement supposer que la variance de l’une est égale à celle de l’autre,
d’où cy? = <7? = cj 2. On veut établir un intervalle de confiance à 100(1 - a) % pour la différence
moyennes ^ A2
À cette fin. » i associé à X,, et l’autre de
taille n 2 moyenne i 2
Comme Sr et S? fournissent tous deux une valeur estimée de la variance corn
mune <72, on peut définir un estimateur combiné 2 noté
2
2 n î 1)S,2 + ( n 2 i)s 2
SP (9.24)
nx+ n2 2
Afin d’établir un intervalle de confiance pour /x, - il faut savoir que la variable aléatoire
(X î X2) î m2)
T

obéit à une loi t avec nx+ n2- 2 degrés de liberté, ce qui veut dire que
P (-t af2; n\ / j j - 2 “< xT < t
~ *a/2; /ij *f «2 “ 2 1 -a .
CHAPITRE 9

On peut réécrire cette dernière équation sous la forme


N
1 1
P (X , X 2) t a i 2 \ n x+n2- l S p < \ + -M l /i2< (X i X 2 ) ± ^ q-/2; r\\+n2- l ^ p \-a (9.25)
nx «i n2 j

Intervalle de confiance pour fa - fa (échantillons indépendants, données


normales, variances inconnues mais égales)
Un intervalle de confiance à 100(1 - a) % pour la différence de deux moyennes, fa - fa, basé sur
deux échantillons indépendants provenant de lois normales de variances inconnues mais considérées
égales, se traduit par

(Xj X2)± ta/2.ni+ 2Sp (9.26)

Exemple 9.17
Un certain procédé pour la gravure de circuits imprimés nécessite l’utilisation d’un catalyseur. On
veut comparer deux catalyseurs afin de déterminer si l’élimination d’une quantité donnée de photoré­
sine exige ou non la même durée d’immersion dans chaque cas. Pour ce faire, on procède à 12 essais
avec le catalyseur 1, la durée d’immersion pour cet échantillon présentant une moyenne 3c, de 24,6 mi­
nutes et un écart-type 5, de 0,85 minute. De même, on effectue 15 essais avec le catalyseur 2, la durée
d’immersion pour cet échantillon présentant une moyenne 5c2 de 22,1 minutes et un écart-type s2 de
0,98 minute.
On veut établir un intervalle de confiance à 95 % pour la différence f a - fa en supposant que les deux
populations suivent le modèle normal avec un même écart-type (ou une même variance). L’équa­
tion 9.24 permet l’estimation combinée de leur variance commune, ce qui donne
2
2 l)^j2+ (w2 S 2
SP
nx+n2—2
11(0,85)2+14(0,98) 2
12 + 15-2
0,8557.

L’écart-type combiné est ainsi de s = >/0,8557 = 0,925. Puisque ta/2; n] + /i2_2 t0,025 ; 25 2,060, on aura
l’intervalle de confiance

1 1
(x î x2)± t 0 ,0 2 5 ; 25 Sp + —

n, n2

(24,6 - 22,1)±2,060(0,925) J T + ±

2,5 ±0,74 minutes.


En d’autres termes, l’intervalle de confiance à 95% pour la différence entre les durées moyennes
d’immersion est
1,76 minute <f a - fa< 3,24 minutes.
On s’attend donc, avec un niveau de confiance de 95 %, que le catalyseur 1 exige une durée d’immer­
sion plus longue de 1,76 à 3,24 minutes par rapport au catalyseur 2.
L'estimation de paramètres

9.3.3 La différence entre les moyennes de deux lois


normales de variances inconnues mais inégales
Dans bien des situations, on ne peut raisonnablement supposer que a f= g \. On estime donc a J
par Sf et g \ par S2,sans utiliser l’estimateur combiné S^.

Les variances inconnues mais inégales: *o\


En pareil cas, il demeure néanmoins possible d’établir un intervalle de confiance à 100(1 a) %
pour fa —fa, puisque la variable aléatoire

{Xl - X 2) - Q i i /i2)
T 2
S \/n\ Jr^ l / n2
obéit approximativement à une loi t avec v degrés de liberté, où
2
( j,7 n i+ 4 //î2)
v 2 2 2 (9.27)
2
S 1/«O (s2/n2)
+
rtj + 1 n ,+ 1

On peut établir un intervalle de confiance pour fa —fa en utilisant le m êm e p rin cip e


dans le cas précédent.

Intervalle de confiance pour fa - fa (échantillons indépendants, données


normales, variances inconnues mais inégales)
Ainsi, un intervalle de confiance (approximatif) à 100(1 - a) % pour //, —fa, basé sur des échantillons
indépendants provenant de lois normales de variances inconnues mais considérées inégales (<7~ ^ <tt),
se traduit par
I S:
k j i s
(X 1 X 2 ) ± f a/2 (9.28)
n n

9.3.4 La différence entre les moyennes de deux lois


normales dans le cas d'observations
Les intervalles de confiance établis aux sous-sections 9.3.1 à 9.3.3 se rapportent à la différence
de moyenne entre deux populations ayant chacune fourni un échantillon aléatoire indépendant.
En d’autres termes, on avait choisi au hasard n, observations dans la première population, pour
ensuite tirer de la seconde un autre échantillon aléatoire totalement indépendant du premier
formé de n2 observations. Dans un certain nombre de situations expérimentales, toutefois, il
n’existe que n unités expérimentales différentes et on recueille les données par paires, c’est-
à-dire en effectuant deux observations de chaque unité.
La revue Human Factors (vol. 4, n° 10,1962, p. 375-380) a déjà traité d’une étude où 14 sujets
devaient garer deux automobiles dont l’empattement et le rayon de braquage différaient considéra­
blement. Le tableau 9.2 ( voirà la page 269) indique le temps (en secondes) qu
pour garer l’un et l’autre véhicule. Chaque sujet constitue ici une unité expérimentale. On veut
maintenant définir un intervalle de confiance pour la différence des temps moyens requis afi n de
garer les deux véhicules, soit f a - fa.
CHAPITRE 9

Supposons de façon générale que les données recueillies se composent de n paires (Xn, X2I),
(X12, X22), (Xln, X2n). On suppose que les variables X, et X2 obéissent toutes deux à une loi
normale, avec une moyenne de / ixet de
paires différentes sont indépendantes. Toutefois, il est clair que les deux mesures dans une
même paire ne sont pas indépendantes, étant donné qu’elles se rapportent à une même unité
expérimentale.
Plutôt que de calculer une covariance permettant d’estimer la dépendance entre les données
d’une même paire, on basera notre inférence sur la différence entre ces deux observations. Soit
les ndifférences D, = Xn - X21, D2= X12- X22, ..., = - X2n. La moye
différences D,notée fiD,est
fb = E(D) = E(Xx- X2) = E{Xx) - E(X2) = -
puisque l’espérance mathématique de Xj - X2 correspond à la différence entre l’espérance
mathématique de X, et celle de X2, que ces deux variables soient indépendantes ou non. On peut
donc établir un intervalle de confiance pour fa - fa simplement en déterminant un intervalle
de confiance pour fa . Or, comme les différences D. sont indépendantes et normalement distri­
buées, on peut définir un intervalle de confiance pour fa en faisant appel à la loi t de la manière
décrite à la sous-section 9.2.2 par analogie avec l’équation 9.14.

Intervalle de confiance pour/t,—n2 (échantillons appariés, données


normales, variances inconnues)
, f * ' . ' V • * _ * ■ » \ » ■

• * • t ” * * . * . I _ I • -

Un intervalle de confiance à 100(1 - a) % pour faD= - b


venant de lois normales de variances inconnues, est
D ±tan-,n-XSD(/'f 9.29)

où D et SDreprésentent respectivement la moyenne et l’écart-type de l’échantillon formé des n diffé­


rences Dr Cette formule s’applique lorsque af = <J2ou lorsque crf &o \ , car la statistique S2Doffre une
valeur estimée de o \ - V(Xx- X2).

Exemple 9.18
Le tableau 9.2 indique le temps que n = 14 sujets ont mis à garer deux véhicules.
Selon les données relatives aux différences dt observées, d = 1,21 et sd= 12,68. Afin d’établir un inter­
valle de confiance à 90 % pour fiD= jix- fa, on rec

V o s ; 13S d / J n

1.21 ± 1,771(12,68)A/Ï4
1.21 ± 6,00
-4,79<jU<7,21 secondes.
L’intervalle obtenu comprend la valeur zéro. Il faut en conclure qu’à un degré de confiance de 90%,
les données ne démontrent aucunement qu’il existe une différence entre les temps moyens fa et fa.
En d’autres termes, la valeur jiD= fa - fa= 0 ne contre
L'estimation de paramètres

« ■ s 6 A | f * » y' V V > , J L « 1 v * f A j| 1 A ^

Sujet Automobile 1 Automobile 2 Différence


+

l
^
X

Il, .

i M 2i
1 37,0 17,8 19,2
2 25,8 20,2 5,6
3 16,2 16,8 -0,6
4 24,2 41,4 -17,2
5 22,0 21.4 .
A
0,6
6 33,4 38,4 -5,0
7 23,8 16,8 7,0
8 58,2 «r ' * A - * 26,0
9 33,6 27.8 5,8
10 24,4 23.2 • 1,2
11 23,4 29,6 -6,2
12 21,2 20,6 0,6
13 36,2 32,2 4,0
14 29,8 53,8 -24,0

Mentionnons que les échantillons de grande taille (où 30 paires, par exemple) rendent
inutile l’hypothèse de normalité.
En déterminant un intervalle de confiance à partir de données appariées plutôt qu’à p artir
de deux échantillons indépendants, on perd des degrés de liberté. Toutefois, on augmente en
général la précision de l’estimation, la valeur de SDétant inférieure à celle de S en raison de la
covariance positive qui unit les deux variables.

9.3.5 Le rapport des variances de deux lois norm ales


Soit X, et X2 des variables aléatoires normales indépendantes dont on ne connaît ni les
moyennes p x et fj^ ni les variances a \ et <x2. On souhaite établir un intervalle de confiance
à 100(1 - a) % pour le rapport a 2/ g \. On choisit ici le rapport des variances plutôt que
leur différence, car on connaît une statistique dont la loi échantillonnale dépend de cr2/ o \ .
À cette fin, on tire un échantillon aléatoire formé de nx observations de X, et un autre form é de
n2 observations de X2, leurs variances respectives étant notées Sf et S\. Pour établir l’intervalle
de confiance voulu, il faut savoir que la distribution échantillonnale de
_ s\/a l _ q f/g |
S,2/<7|2 s 2/ s 2

correspond à une loi F avec n2 — 1 et n, - 1 degrés de liberté. La figure 9.10 (voir à la page
suivante) présente graphiquement la fonction de densité de cette loi.
270 CHAPITRE 9
L

b p
La fonction de densité de la variable aléatoire F, soit une loi de Fisher
à n2- 1 et à nn- 1 degrés de liberté

Il en ressort que
A
*i- ct/2; «2-1,«i-l < Fa/2;n2-l,ni-l 1- a
y
De ce fait,
\
F l-a/2;«2- l. «i~l < - F
2 1 a/2; n2- l . «i-1 1- a
S2 J

Selon l’équation 8.8, le quantile d’ordre 2 de la loi correspond à

- a l 2; n2 - 1 , nj -1
Fal2; nj —
1,

Intervalle de confiance pour crf/af (données normales)


En comparant les équations 9.30 et 9.9, et en utilisant le résultat de l’équation 9.31, on découvre qu’un
intervalle de confiance à 100(1 - a)% pour o \ / o \, basé sur deux échantillons indépendants de lois
normales, est donné par

5
S2
; f 1-
,_ a/2\ ;tj - 1,H2- 1

Exemple 9.19
Revenons à l’exemple 9.17, où deux catalyseurs faisaient l’objet d’une étude visant à comparer leur
capacité à réduire la durée d’immersion nécessaire lors de la gravure de circuits imprimés. On a pro­
cédé à n, = 12 essais avec le catalyseur 1 et à n2= 15 essais avec le ca
j, = 0,85 minute et que s2 = 0,98 minute. Supposons qu’on veut établir un intervalle de confiance à
90 % pour le rapport des variances a \ / o\. En recourant à l’équation 9.32, on obtient ►
L'estimation de paramètres

2
sl 2 2
< S 1
2
S ÏF {
2 c2r*
G 2
2 4 0 ,0 5 ; 11.14 **2 4 0 ,9 5 ; 11,14

(0,85) 2 2
(0,85) 2

< V
(0,98)22,57 ct,z 2
(0,98)z 0,365
2
2
0,29 < <Jl2 <2,06.
2

Comme cet intervalle de confiance renferme la valeur 1, on ne peut affirmer, à un niveau de confiance
de 90%, que la durée d’immersion présente un écart-type différent selon le catalyseur utilisé.

9.3.6 La différence entre deux XM r ** *

Lorsqu’on s’intéresse à deux proportions, telles que p, et p,, on peut définir un intervalle de
confiance à 100(1 - a) % pour la différence p, - p 2. Si l’or» tire deux échantillons indépendants,
l’un de taille n, > 30 et l’autre de taille n2> 30, de populations différentes, de sorte que X, et X2
sont des variables aléatoires binomiales indépendantes de paramètres («,, p,) et (n,, p 2) respec­
tivement, où X, représente le nombre d’éléments de l’échantillon de la première population q u i
appartiennent à une catégorie donnée, et où X2représente le nombre d’éléments de l'échantillon
de la seconde population qui appartiennent à cette même catégorie, alors p x=X ,/n, et p , = X2/n ,
constituent des estimateurs indépendants de p, et de p2, respectivement. En d ’au tres m o ts, les
proportions échantillonnales estiment les proportions dans les populations.
De plus, si l’on suppose l’approximation de la loi binomiale par la loi normale, la variable
aléatoire
z (Pi ~ C P i ~ P 2)
jP i( l- P i) , P i ^ - P i )
V n\ n2

obéit approximativement à une loi normale centrée réduite. En utilisant p, et p 2 pour estim er
l’erreur-type et en appliquant le théorème central limite, on trouve une formule pour un inter-
valle approximatif pour la vraie différence de proportions.

Intervalle de confiance pour p1- p2 (grands échantillons)


Un intervalle de confiance (approximatif) à 100(1 —a v pour p P 1u rs u u l
£ " v * • o t t L'y

on T «
1

Iill
f l ri
# | v

est donné par


P i(l-P i) . P2(l o^ ) (Q W
(P p,)± ul
\ n n

Exemple 9.20
Soit les données fournies à l’exemple 9.14. Imaginez qu’on modifie le procédé de finition de* a rnr
d’essieu pour ensuite prélever un second échantillon aléatoire de 85 arbres. Ce nouvel éehantillo
renferme 10 arbres hors normes. De ce fait, sachant que n, = 75 et que = 0,16, tandi s que ,
et que pobs2 10/85 0,12, on peut utiliser l’équation 9.33 afin d’établir un intervalle de conliane
CHAPITRE 9

approximatif au niveau de 95 % pour la différence entre les proportions d’arbres hors normes avant et
après la modification du procédé. On obtient ainsi

0,16(0,84) 0,12(0,88)
(0,16-0,12)±1,96 +
75 85
c’est-à-dire
0,04 ±0,11,
ou encore
-0,07 <p, - p2< 0,15.
Le zéro étant compris dans cet intervalle, il semble peu vraisemblable, selon les données d’échantil­
lonnage, que les modifications apportées au procédé de finition aient réduit la proportion d’arbres hors
normes, avec un niveau de confiance de 95 %.

9.4 Les intervalles de prévision


et les intervalles de tolérance
9.4.1 Les intervalles de prévision
Dans les sections précédentes, nous avons présenté divers estimateurs par intervalle s’appliquant
à des paramètres de la population comme la moyenne fl. Dans bien des situations, toutefois,
on peut vouloir prédire une seule observation future de la variable aléatoire d’intérêt au lieu de
prédire ou d’estimer la moyenne des valeurs prises par cette variable. Or, il est possible d’établir
un intervalle de prévision pour toute observation à venir.
Supposons qu’on tire un échantillon aléatoire de taille n, noté X}, X2, ..., Xn, d’une population
normale de moyenne ji et de variance cr2. Soit X la moyenne de cet échantillon. On veut ici prédire,
l’observation future Xn+V Puisque X constitue le prédicteur ponctuel de cette observation, l’erreur
de prévision se traduira par Xn+l~ X . L’espérance mathématique de cette erreur correspond à

E(Xn+l- X ) = E(Xn+l) - E ( X ) = fii-/u = 0

et sa variance, à
Var(Xn+l - X) = Var(Xn+l ) + Var(X)

a 2+

a 2
1+
n
L'estimation de paramètres

Du fait que Xtl+l et X sont des variables aléatoires normales et indépendantes, l’erreur de prévi­
sion obéira elle aussi à une loi normale, et la variable aléatoire

suivra une loi normale centrée réduite. Si l’on ne connaît pas la variance cr2, on peut l’estimer
par la variance S2 de l’échantillon, et alors la variable aléatoire

obéit à une loi t avec n - 1 degrés de liberté. On procède ensuite comme dans le cas d'un inter­
valle de confiance.

Intervalle de prévision pour une observation future (données normales)


Un intervalle de prévision à 100(1 - a) % pour Xn+,, basé sur un échantillon de taille provenant
d’une loi normale, est donné par

Exemple 9.21
On a mesuré, au cours de 10 vols, l’accélération maximale (en multiples de = 9,81 m/s2) d’un avion
de ligne assurant une certaine liaison. Voici les résultats obtenus :
1,15; 1,23; 1,56; 1,69; 1,71; 1,83; 1,83; 1,85; 1,90; 1,
La moyenne de cet échantillon est x = 1,666 et son écart-type, s = 0,273. Il peut être important de
prédire la force d’accélération maximale que l’avion subira au cours de son prochain vol. Or, puisque
t0025.9= 2,262, l’intervalle de prévision à 95 % pour correspond à

1,666 ± / 0025;9

1,666 ±0,648
1,018 <XU <2,314.

Il est normal que cet intervalle soit plus long que l’intervalle de confiance à 95 % pour fi (c’est-
à-dire 1,666 ± 0,195), car une observation individuelle est plus variable que la moyenne de plusieurs
observations.
CHAPITRE 9

9.4.2 Les inter va Hes de tolérance


On a vu dans ce chapitre qu’un intervalle de confiance consiste en un intervalle dans lequel on
s’attend à ce que se situe la vraie valeur d’un paramètre de la population, par exemple fl. Par
opposition, un intervalle de tolérance est un intervalle à l’intérieur duquel on s’attend à trouver
un certain pourcentage des valeurs de la population.
Soit une variable aléatoire normale X de moyenne jli et de variance C72. On peut s’attendre à
ce qu’environ 95 % de toutes les valeurs de X soient comprises dans l’intervalle /1± 1,96a Mais V

que dire si l’on ne connaît pas les paramètres fx et a, de sorte qu’il faut les estimer ? A l’aide
des valeurs estimées x et s associées à un échantillon de taille n, on pourrait construire l’inter­
valle x ± 1,965. Malheureusement, en raison de la variabilité liée à l’estimation de et de a,
il se peut que cet intervalle renferme moins de 95 % des valeurs. Dans le présent exemple, on
aura besoin d’une valeur supérieure à 1,96 pour éviter ce problème si l’on utilise les résultats
d’une estimation ponctuelle des paramètres de la population.
On peut cependant définir un intervalle qui comprendra la proportion voulue des valeurs
de la population et avoir relativement confiance dans le résultat obtenu. On pourrait ainsi vou­
loir être confiant à 90 % que l’intervalle déterminé renfermera au moins 95 % des valeurs de la
population. L’intervalle ainsi obtenu porte le nom d’«intervalle de tolérance». On peut l’établir
pour divers niveaux de confiance.
Sous une forme générale, pour 0 < q < 100, un intervalle de tolérance comprenant au
moins q% des valeurs issues d’une population normale avec un degré de confiance de
1 —a se traduit par x ± ks, où k est une constante déterminée pour différentes combinaisons
de qet de 1 - a. La table VIII, présentée en annexe, indique la valeur de k pour q = 90, 95 et
99 et pour 1 —a = 0,90, 0,95 et 0,99. Les valeurs de cette table sont calculées selon la méthode
d’Odeh et Owens (1980).

Exemple 9.22
Soit les données de l’exemple 9.21 relatives à l’accélération maximale atteinte par un avion de ligne.
On veut définir un intervalle de tolérance dont on peut être confiant à 95 % qu’il comprendra 99 %
de toutes les accélérations maximales possibles. Or, selon la table VIII de l’annexe, si 1 - = 0,95
tandis que q= 99 et que n= 10, alors k = 4,433. Sachant que l’échantillon
et un écart-type s de 0,273, on obtient l’intervalle de tolérance
1,666 ±4,433(0,273)
ou
(0,456 ; 2,876).

On peut donc affirmer, avec un niveau de confiance de 95%, qu’au moins 99% des accélérations
maximales possibles se situent entre 0,456 g et 2,876 g.

Rappelons qu’il existe une différence fondamentale entre les limites de confiance et de tolé­
rance. En effet, les limites de confiance (et les intervalles de confiance par le fait même) servent
à estimer un paramètre d’une population, tandis que les limites (et les intervalles) de tolérance
indiquent les limites à l’intérieur desquelles on peut s’attendre à trouver une certaine proportion
de la population. Lorsque n tend vers l’infini, la longueur d’un intervalle de confiance s’approche de
zéro, tandis que les limites de tolérance s’approchent des centiles correspondants de la population.
Résumé

La moyenne d’une loi normale X ± zallol4n


de variance cr2 connue
La moyenne d’une loi normale
X ± t al2-,n-lS / ^ 1
de variance <r2 inconnue f

La différence entre les moyennes


de deux lois normales de variances (Xl - X2)± Zal2 l— + a *
respectives o\ et o \ connues nl n2
La différence entre les moyennes de l)Sf +(n2- " ^
deux lois normales ayant une même ■^2) —^a/2;n,+n2-2‘^p ^I + »°Ù
variance (<rf = <72) inconnue n\ 2 n, +n2
La différence entre X ,-X 2 (Sj fnx+S2/n2)
deux lois normales a i 2; v , OÙ V
ln\Ÿ , (S2J n 2)
inégales (cr? *■cr?)
~ n ^ r +--------
La différence entre les moyennes D ± ,a/2;»-is n/'/«
de deux lois normales, dans le cas
d’échantillons appariés_____
La variance d’une loi normale (n-l)S2 (n — 1)S2

L’estimation de paramètres
---------
2
S

fT S

-----------2

Xa!2\n -l

Le rapport des variances de deux lois


normales SlFan:nt, U n. a/2;nl-l.n2-l
La proportion dans une population
+7
■ *-1 ^ -

La différence de deux proportions


g >Pxtt-Px) , />20 - P 2)
4/“ + ---------- IS)
ai
CHAPITRE 9

^ ■ » * ' ■ * . * ’ • , * <
échantillons aléatoires, l’un de taille n, et
Les données des exercices avec le symbole (£♦, l’autre de taille n2, ayant respectivement
sont aussi disponibles en format électronique. une moyenne de Z, et de Z2
a) Démontrez que
9.1 On tire un échantillon aléatoire de taille Z = aXx+ (1 - a)X2, 0<a<1
d’une population notée Z, où £(Z) = /zet est un estimateur sans biais de
V(Z) = (T2. Lequel des deux estimateurs de
b) Si l’on suppose que les moyennes Z,
{à définis ci-dessous est alors le meilleur?
et Z2sont indépendantes, quelle valeur
Justifiez votre réponse.
de a minimise la variance de Z ?
2n
1 1 n

9.7 Déterminez l’estimateur du paramètre c de


y z,. ou x 2 -Z * ,
2nfz 1 la loi de Poisson à partir d’un échantillon
aléatoire de taille n,
9.2 SoitZ,, X2, X7un échantillon aléatoire
tiré d’une population de moyenne et de a) avec la méthode du maximum
variance G2. de vraisemblance.
b) avec la méthode des moments.
a) L’un ou l’autre des deux estimateurs de
p définis ci-dessous est-il sans biais ? 9.8 Déterminez l’estimateur du paramètre A
de la loi exponentielle à partir d’un échan­
Xy + X+2 ***+ Z 7
/b tillon aléatoire de taille n,
7
a) avec la méthode du maximum
2 Z ,-Z 6+Z4 de vraisemblance.
2 b) avec la méthode des moments.
b) Lequel de ces estimateurs a la plus 9.9 Déterminez les estimateurs des para­
petite erreur quadratique moyenne ? mètres r et Ade la loi gamma par la
A A

9.3 Soit 0, et 02des estimateurs du paramètre 0 méthode des moments à partir d’un
dont on sait que £(0,) = 0, £(02) = 0/2, échantillon aléatoire de taille n.
V(0,) = 10 et V(02) = 4. Lequel de ces
estimateurs est le meilleur ? Dans quel 9.10 Soit Z une variable aléatoire géométrique de
sens? paramètre p. Trouvez un estimateur de à
/N A
partir d’un échantillon aléatoire de taille n,
9.4 Soit 0,, 02et 03des estimateurs du para­ a) avec la méthode du maximum
mètre 0 dont on sait que £(0,) = £(02) = 0, de vraisemblance.
£(03) * 0, V(0,) = 12, V(02) = 10 et b) avec la méthode des moments.
2
Eue 6. Lequel de ces trois
estimateurs préférez-vous ? Expliquez 9.11 Soit Z une variable de Bernoulli de para­
votre réponse. mètre p. Trouvez un estimateur de p par
la méthode des moments à partir d’un
9.5 On tire d’une population de moyenne et de échantillon aléatoire de taille n.
variance G 2 trois échantillons aléatoires de
taille n, = 10, «2 = 8 et n3= 6, respectivement. 9.12 Soit Z une variable aléatoire binomiale
Sachant que S2, S2 et S2représentent la de paramètres n (connu) et p. Trouvez un
variance de ces échantillons, démontrez que estimateur de p à partir d’un échantillon
aléatoire de taille N,
2 2
2 1 OSf +SS2 + 6s; a) avec la méthode du maximum
S
24 de vraisemblance. .
est un estimateur sans biais de g 2. b) avec la méthode des moments.

9.6 Soit une variable aléatoire Z de moyenne ji 9.13 Soit une variable aléatoire Z présentant
et de variance g 2 . On sélectionne deux la fonction de densité suivante :
«
L’estimation de paramètres

d) Environ 90 % des hommes de cet


(7 + l)jcr si 0 < jc< 1,
échantillon ont une fréquence car­
0 sinon. diaque comprise entre 94 et 112.
Sachant que X,, e)
X2,..., X„ représentent unEnviron 90 % de tous les intervalles
échantillon aléatoire de taille n, détermi­ de confiance calculés avec la même
nez l’estimateur du maximum de vraisem­ formule et basés sur des échantillons
blance de 7 de 9 hommes de cette population se
soumettant à l’épreuve contiendront la
9.14 Pourquoi est-il préférable d’associer une vraie fréquence cardiaque moyenne
marge d’erreur à chaque estimation ponc­ postabsorption.
tuelle d’un paramètre ? f) Il y a une probabilité de 90 % que la
9.15 Le service du génie industriel veut estimer moyenne échantillonnale de la fré­
le temps moyen requis pour assembler une quence cardiaque soit comprise entre
carte de circuit imprimé. On considère que 94 et 112.
le temps requis pour assembler une carte g) Si on avait utilisé un échantillon de
suit une loi normale avec un écart-type de 50 individus, l’intervalle de confiance
0,45 minute. aurait probablement été plus court.
a) Quelle devrait être la taille de l’échan­ h) La marge d’erreur associée à l’esti­
tillon si l’on veut être confiant à 95 % mation ponctuelle de la fréquence
que l’erreur d’estimation sera inférieure cardiaque moyenne est de 9 battements
à 0,25 minute ? par minute selon ces données.
b) Si on avait voulu une marge d’erreur 9.17 On demande à 120 étudiants de choisir au
deux fois plus petite, aurait-il fallu que hasard 30 livres répartis dans différents
l’échantillon soit deux fois plus grand ? rayons et à différentes hauteurs de la biblio­
c) Si on avait utilisé un niveau de thèque, de les ouvrir de façon aléatoire, et
confiance de 90%, aurait-il fallu uti­ de compter les mots se situant sur la page
liser un échantillon plus grand ou de droite. Chacun doit ensuite calculer un
plus petit que celui en a) pour une intervalle de confiance à 95 % basé sur ses
même marge d’erreur ? 30 observations, à partir de la formule sui­
9.16 On a noté la fréquence cardiaque (en
vante (en supposant que la loi normale est
battements par minute) de neuf hommes un modèle adéquat dans cette situation) :
après leur avoir administré une certaine * i± 'a / 2 ; „ - i S/yfn.
substance provoquant un stress cardiaque.
L’intervalle de confiance à 90% obtenu a) Quelle quantité tente-t-on d’estimer par
pour la fréquence cardiaque moyenne cette expérience ?
postabsorption est [94,112], en consi­ b) Les 120 intervalles seront-ils tous cen­
dérant que la loi normale est un modèle trés sur la même valeur ?
adéquat pour cette variable. Déterminez c) Les 120 intervalles auront-ils tous la
si les conclusions suivantes sont correctes. même longueur ?
a) La fréquence cardiaque moyenne des d) Les 120 intervalles sont-ils tous aussi
hommes ayant participé à l’étude est de susceptibles de contenir la vraie valeur
103 battements par minute. du paramètre ?
b) Si on recommençait l’épreuve avec neuf e) Environ combien d’étudiants devraient
autres individus de la même population, avoir la vraie valeur du paramètre dans
il y aurait 90 % de chances que la leur intervalle ?
nouvelle moyenne échantillonnale soit f ) Environ combien d’étudiants suresti­
comprise entre 94 et 112. meront significativement la vraie valeur
c) Environ 90 % des hommes de cette du paramètre, c’est-à-dire que les deux
population ont une fréquence cardiaque bornes de leur intervalle seront .
comprise entre 94 et 112. supérieures à la vraie valeur ?
CHAPITRE 9

9.18 On présente ci-dessous la résistance avec un écart-type crde 0,01 mm. Les
(£ j d’adhésion de 15 matériaux éner­ 15 segments d’un échantillon aléatoire
gétiques (explosifs, combustibles et présentent un diamètre moyen
compositions pyrotechniques) selon x = 74,036 mm.
un article paru dans Annual Reviews a) Établissez, pour le diamètre moyen
Material Research (vol. 31, 2001, des segments produits, un intervalle
p. 291-321). Définissez un intervalle de confiance à 95 %.
de confiance à 95 % pour la résistance b) Si on ne connaissait pas la vraie valeur
d’adhésion moyenne et pour la variance de g et qu’on l’estimait par l’écart-type
de la résistance d’adhésion selon ces échantillonnai s, obtiendrait-on nécessai
données. Considérez que la loi normale rement une plus grande marge d’erreur
est une bonne distribution pour modéli­ que dans l’intervalle calculé en a) ?
ser cette variable. 0

9.22 Soit des ampoules de 75 W dont on sait


323, 312, 300, 284, 283, 261, 207, 183,1 3c = 219,8 que la durée de vie, en heures, obéit
180, 179, 174, 167, 167, 157,120. \ s= 66,41 approximativement à une loi normale,
avec un écart-type crde 25 heures. Les
9.19 Lorsque l’on connaît l’écart-type g , l’inter­ 20 ampoules d’un échantillon aléatoire
valle de confiance pour la moyenne fi ont duré en moyenne 3c = 1014 heures.
d’une loi normale présente la forme a) Établissez, pour la durée de vie
générale moyenne des ampoules, un intervalle
X - Z ai Glyfn < H< X + Zai G/yfn, de confiance à 95 %.
b) Supposons qu’à partir de cet échantil­
où a x+ «2 = a.
lon, on a construit, pour la durée de vie
a) Posez a = 0,05 et déterminez les moyenne des ampoules, un intervalle
limites de cet intervalle pour de confiance d’une longueur totale
ax= «2 = al2= 0,025. correspondant à 8 heures. Quel est le
b) Déterminez les limites de cet intervalle niveau de confiance de cet intervalle ?
lorsque ax= 0,01 et 0,04. c) Pour une expérience future, on veut
c) Lequel des deux intervalles obtenus est s’assurer à 95 % que l’erreur commise
le plus court ? Un intervalle de confiance en estimant la durée de vie moyenne
symétrique offre-t-il des avantages ? des ampoules sera inférieure à
9.20 Lorsque les variables aléatoires Xx, 5 heures. Quelle devra être la taille
X2, ...,X n sont indépendantes et obéissent de l’échantillon utilisé ?
chacune à une loi de Poisson de para­ 9.23 On étudie la résistance à la compression
mètre c tandis que n est relativement d’un certain type de béton. Celle-ci obéit
grand, la moyenne de l’échantillon X approximativement à une loi normale
obéit approximativement à une loi nor­ de variance g 1 = 1000 (lb/po2)2. Douze
male de moyenne c et de variance c/n. spécimens tirés au hasard offrent une
a) Quelle est alors la loi de probabilité résistance moyenne 3c= 3250 lb/po2.
de la variable aléatoire a) Établissez un intervalle de confiance
à 95 % pour la résistance moyenne
yjc/n du béton.
b) Sans faire le calcul, déterminez si un
b) À l’aide de votre réponse en a), défi­ intervalle de confiance à 99 % aurait été
nissez un intervalle de confiance à plus long que l’intervalle obtenu en a).
100(1 - a) % pour c.
*
c) Si l’on veut estimer la résistance
9.21 Un fabricant produit des segments de moyenne du béton avec une erreur
piston pour des moteurs d’automobile. On inférieure à 15 lb/po2 et un niveau de
sait que le diamètre de ces segments obéit confiance de 95 %, quelle devra être
approximativement à une loi normale, la taille de l’échantillon utilisé ?
L'estimation de paramètres

d) On calcule un autre intervalle de un essai deux échantillons aléatoires,


confiance à 95 % pour la résistance l’un de taille n}= 15 et l’autre de taille
moyenne à la compression, à partir n2= 20, on obtient un indice d’octane
d’un nouvel échantillon de 30 obser­ moyen de 3c, = 89,6 pour le premier et
vations. Cet intervalle a-t-il plus de de 3c2= 92,5 pour le second.
chances de contenir la vraie valeur a) Établissez un intervalle de confiance à
de // que celui calculé en a) ? 95 % pour la différence entre les indices
9.24 Un ingénieur civil vérifie la résistance à d’octane moyens, en considérant que
(7+T la compression d’un certain type de béton, ces variables suivent une loi normale.
une variable distribuée selon la loi nor­ b) Les résultats précédents vous
male. Voici les données qu’il a obtenues portent-ils à conclure que les deux
en soumettant 16 spécimens à un essai. indices d’octane moyens diffèrent
significativement ?
2216 2237 2249 2204 '
2225 2301 2281 2263 > 3c = 2257,75 9.27 Soit deux machines servant à remplir des
2318 2255 2275 2295 bouteilles de détergent à vaisselle. On sait
5 = 34,515 que le volume de remplissage présente un
2250 2238 2300 2217 .
écart-type de <7, = 0,15 once liquide dans
a) Établissez, pour la résistance moyenne, le cas de la machine 1 et de = 0,18 once
un intervalle de confiance à 95 %. liquide dans le cas de la machine 2. On
b) Établissez un intervalle de confiance prélève au hasard deux échantillons, l’un
à 95 % pour la résistance moyenne, en formé de n, = 12 bouteilles provenant de la
supposant que machine
G=36. Comparez 1 et l’autre, de n2= 10 bouteilles
cet inter­
valle à celui que vous avez obtenu en a). provenant de la machine 2. Le premier se
c) Établissez, pour une seule mesure de la caractérise par un volume de remplissage
résistance à la compression, un inter­ moyen de 3c, = 30,87 onces liquides et le
valle de prévision à 95 %. second, de 3c2= 30,68 onces liquides. On
d) Établissez un intervalle de tolérance de considère que la loi normale est un bon
telle sorte qu’on puisse avoir confiance modèle pour cette variable.
à 95 % qu’il englobera 99 % de toutes a) Établissez un intervalle de confiance
les mesures de la résistance à la à 90 % pour la différence entre les
compression. volumes de remplissage moyens.
9.25 Soit deux combustibles solides dont on b) Établissez un intervalle de confiance
étudie la vitesse de combustion. On sait à 95 % pour cette même différence,
que la vitesse de combustion de chacun et comparez sa longueur à celle de
suit une loi normale qui présente à peu l’intervalle obtenu en a).
près le même écart-type, soit <7, = cr2 c) Les résultats précédents vous
= 3 cm/s. En soumettant à un essai deux portent-ils à conclure que les
échantillons aléatoires, l’un de taille deux volumes moyens diffèrent
n, = 20 et l’autre de taille = 20, on significativement ?
a obtenu une vitesse de combustion 9.28 Un biologiste souhaite vérifier la différence
moyenne de 3c, = 24 cm/s pour le pre­
de moyennes entre la taille des perchaudes
mier et de 3c2= 18 cm/s pour le second.
adultes dans deux lacs en juin. On sait
Établissez un intervalle de confiance à
grâce à des études antérieures que, dans
99 % pour la différence entre les vitesses
ces deux lacs, la taille des poissons suit
de combustion moyennes.
une loi normale de variance 16 cm2. Le
9.26 On étudie l’indice d’octane de deux biologiste compte prendre 30 mesures au
essences sans plomb. L’indice d’octane total. S’il veut minimiser la marge d’erreur
de l’essence 1 présente une variance de son intervalle de confiance, devrait-il
of de 1,5 et celui de l’essence 2, une prendre 15 poissons dans chaque lac ou
variance of de 1,2. En soumettant à en prendre davantage dans un des lacs ?

*
CHAPITRE 9

9.29 La tension de sortie de deux types de b) Y a-t-il une quelconque indication que
transformateurs fait l’objet d’une étude. l’un des deux types de manettes est
Après avoir choisi au hasard 10 transfor­ supérieur à l’autre ?
mateurs de chaque type, on en mesure
9.31 Le responsable d’un parc automobile veut
la tension de sortie, dont la distribution
(Vf mettre à l’essai deux marques de pneus à
est normale. Les moyennes d’échantil­
carcasse radiale. A cette fin, il fait monter
lon obtenues sont 3c, = 12,13 volts et
un pneu de chaque marque sur les roues
3c2= 12,05 volts. On sait que la ten­
arrière de huit véhicules choisis au hasard.
sion de sortie présente une variance de
Voici le kilométrage que chaque véhicule
o f = 0,7 pour le premier type de trans­
a parcouru avec ces pneus avant leur usure
formateur et de o f - 0,8 pour le second.
complète.
Déterminez un intervalle de confiance à
95 % pour la différence entre les tensions
moyennes. Véhicule Marque 1 Marque 2 Différence
9.30 Les résultats d’une étude sur la conduite 1 36 925 34 318 2607
(7+f de fauteuils roulants motorisés ont été 2 #
45 300 42 280 3020
publiés dans Proceedings the IEEE 3 36 240 35 500 740
24th Annual Northeast Bioengineering 4 32 100 31 950 150
Conférence (1998, p. 130-132). Dans 5 37 210 38 015 -805
cette étude, on s’est intéressé à l’effet sur 6 48 360 47 800 560
la conduite de deux types de manettes 7 38 200 37 810 390
de direction, l’un avec capteur d’effort 8 33 500 33 215 285
(CE) et l’autre avec capteur de position
(CP). On a demandé à 10 sujets de faire Moyenne 38 479,4 37 611,0 868,4
l’essai de ces deux types de manettes. Écart-type 5590,3 5243,9 1290,0
Un élément ayant retenu l’attention est le
nombre de secondes que chacun a mis à Etablissez un intervalle de confiance à
effectuer un trajet prédéterminé. Voici 95 % pour la différence entre les kilo­
des données caractéristiques de ce type métrages moyens, en supposant que la
d’expérience. loi normale est un bon modèle. Quelle
marque préférez-vous ?
Type Type 9.32 Nommez toutes les conditions d’applica­
Sujet CE CP Différence tion de la formule ci-dessous pour l’inter­
valle de confiance pour une différence de
1 25,9 33,4 -7,5 moyennes.
2 30,2 37,4 -7,2
3 33,7 48,0 -14,3 Y 2) i 2n
/
a
t ;, +«2-2
4 27,6 30,5 -2,9
5 33,3 27,8 5,5
6 34,6 27,5 7,1 9.33 Le diamètre des tiges d’acier produites par
7 33,1 36,9 -3,8 deux extrudeuses fait l’objet d’une étude.
8 30,6 31,1 -0,5 On tire deux échantillons aléatoires, l’un de
9 30,5 27,1 3,4 taille n, = 15 et l’autre de taille n2= 18. La
10 25,4 38,0 -12,6 moyenne et la variance du premier échantil­
lon sont respectivement 3t, = 8,73 et sf = 0,30
Moyenne 30,49 33,77 -3,28 et celles du second, 3c2= 8,68 et s%= 0,34.
Écart-type 3,29 6,50 7,30
a) Établissez pour of/(72 un intervalle de
a) Établissez un intervalle de confiance à confiance :
95 % pour la différence entre les temps i) à 90%;

moyens enregistrés, en supposant que ii) à 95 % (et comparez-le à celui que


la loi normale est un bon modèle. vous avez obtenu en i).
L'estimation de paramètres

b) Y a-t-il des raisons de croire que d’un échantillon aléatoire s’avèrent


les variances sont significativement défectueuses.
différentes ? a) Établissez, pour la proportion de calcu­
c) En supposant que o f = o \ et que cette latrices défectueuses, un intervalle de
variable suit une loi normale, établissez confiance à 99%.
un intervalle de confiance à 95 % pour la b ) Si on avait construit un intervalle de
différence entre les diamètres moyens. confiance pour la proportion de calcu­
9.34 On a calculé que l’écart-type de la durée latrices non défectueuses à partir des
de vie des 101 ampoules d’un échantillon mêmes données, aurait-on obtenu une

aléatoire est de 12,6 heures. Etablissez, marge d’erreur plus grande ?


pour la variance de la durée de vie des c) On considère acceptable une propor­
ampoules, un intervalle de confiance à tion de calculatrices défectueuses de
90%, en supposant que la durée de vie 3/1000. Est-on certain de respecter la
£

suit une loi normale. norme dans cette usine ?


9.35 Les firmes de sondage mentionnent sou­ 9.38 On compte effectuer une étude sur le
vent quelques précisions méthodologiques pourcentage de propriétaires immobiliers
liées à des questions de type oui/non dans qui possèdent au moins deux téléviseurs.
un encart annexé aux résultats, prenant a) Quelle devra être la taille de l’échantillon
l’allure suivante : si l’on veut s’assurer à 99 % que l’erreur
d’estimation sera inférieure à 0,01 ?
«L’échantillon de 601 répondants a une
b ) Si on souhaite une marge d’erreur deux
marge d’erreur d’au plus 4%, et ce, 19 fois
fois plus petite, aurait-on besoin d’un
sur 20. » échantillon deux fois plus grand ?
a ) Que signifie l’expression « 19 fois sur 20 »? c) Si on veut un niveau de confiance de
b) Pourquoi une firme choisirait-elle une 95 %, doit-on prendre un échantillon
taille d’échantillon de 601 répondants plus grand ou plus petit que celui en a) ?
comme dans l’exemple ci-dessus ?
9.39 On souhaite déterminer si le taux
9.36 Soit 400 automobilistes choisis au hasard, de syndicalisation varie selon le sexe.
dont 48 n’assurent pas leur véhicule contre En interrogeant 5000 travailleurs d’usine
les dommages. choisis au hasard, on a appris que 785
a) Établissez un intervalle de confiance d’entre eux étaient syndiqués. De même,
à 95 % pour la proportion d’automobi­ en interrogeant 3000 travailleuses d’usine
listes qui n’assurent pas leur véhicule choisies au hasard, on a appris que 327
contre les dommages. d’entre elles étaient syndiquées.
b) Si 100 automobilistes avaient affirmé ne a) Établissez un intervalle de confiance
pas assurer leur véhicule plutôt que 48, à 99 % pour la différence de propor­
déterminez (sans faire le calcul complet) tions chez les hommes et les femmes.
si la marge d’erreur aurait été supérieure b ) L’intervalle calculé en a) vous porte-t-il
ou inférieure à celle calculée en a). à croire que le taux de syndicalisation
c) En supposant que la proportion d’assu­ varie selon le sexe de façon significative ?
rés est complètement inconnue avant le
sondage, quelle devrait être la taille de 9.40 La proportion d’unités défectueuses asso­
l’échantillon pour qu’on puisse affirmer ciée à deux chaînes de production fait l’ob­
avec 95 % de confiance que l’erreur
jet d’une étude. Un échantillon aléatoire
d’estimation de la proportion en cause
de 1000 unités provenant de la chaîne 1
est inférieure à 0,03 ?
renferme 10 unités défectueuses, tandis
qu’un autre de 1200 unités provenant de
9 .3 7 Un fabricant de calculatrices veut la chaîne 2 en compte 25. Etablissez un
estimer la proportion de calculatrices intervalle de confiance à 99 % pour la
défectueuses au sein de sa produc­ différence entre les proportions d’unités
tion. Or, 18 des 8000 calculatrices défectueuses dans les deux chaînes.
^ e nom breux problèmes exigent d’accepter ou de rejeter un énoncé au sujet
d ’un param ètre. L’énoncé est habituellement appelé une « hypothèse »
J et le processus de prise de décision, un «test d’hypothèse». C ’est l’un
des aspects les plus utiles de l’inférence statistique, car on peut exprim er
de nom breux problèm es de décision sous la forme de tests d’hy pothèses. D ans
ce chapitre, nous élaborerons des procédures de tests d’hypothèses dans plusieurs
situations importantes.

10.1 Les concepts de base


La théorie des tests d’hypothèses consiste à énoncer les questions de recherche sous la forme
d’une paire d’hypothèses statistiques (une hypothèse nulle et une hypothèse alternative), de
formuler une règle de décision quant à l’hypothèse à favoriser (tout en minimisant les proba­
bilités d’erreur), puis de confronter les données à cette règle de décision. Nous abordons ici
ces étapes de façon générale et nous discuterons des détails de la procédure dans les sections
subséquentes.

Les hypothèses statistiques: hypothèses nulle et alternative

Hypothèse statistique
Une hypothèse statistique est un énoncé sur la loi de probabilité à laquelle obéit une variable aléatoire.
Les hypothèses statistiques concernent souvent au moins un paramètre de cette loi.

Exemple 10.1
Supposons qu’on s’intéresse à la résistance moyenne à la compression d’un certain type de béton. Plus
précisément, on veut déterminer si la résistance moyenne à la compression (c’est-à-dire ju) diffère de
2500 lb/po2. Ce qui précède s’exprime formellement ainsi :
H0: n = 2500 lb/po2,
H, \n* 2500 lb/po2. (10.1)

L’énoncé H0: fj.= 2500 lb/po2 dans l’équation 10.1 est appelé « hypothèse nulle » en
rence au statu quo, ou à l’absence de conséquences, et l’énoncé Hj : 2500lb/po2, «hypothèse
alternative». L’hypothèse Ht est souvent l’hypothèse de recherche, celle que l’on souhaite cor­
roborer à l’aide de données probantes.
Les tests d'hypothèses 283

Comme l’hypothèse alternative dans l’exemple 10.1 spécifie des valeurs de fl supérieures
ou inférieures à 2500 lb/po2, elle est aussi appelée «hypothèse alternative bilatérale». Dans
certaines situations, on écrira une hypothèse alternative unilatérale, par exemple
Hj : /J.>2500 lb/po2 (unilatérale à droite) (10.2)
ou encore
Hj : // < 2500 lb/po2 (unilatérale à gauche).
Il importe de se souvenir que les hypothèses sont toujours des énoncés sur la population
ou la loi étudiée, et non sur l’échantillon. La valeur du paramètre de la population précisée
dans l’hypothèse nulle (2500 lb/po2 dans l’exemple précédent) est habituellement dérerminée
de l’une des trois façons suivantes. Premièrement, elle peut provenir de la comi .ix- -u-e du
processus, ou même d’une expérimentation antérieure. L’objectif du test d’hypothèse es» alors
de déterminer si la situation a changé. Deuxièmement, cette valeur peut être dé-erminée par
une théorie ou un modèle du processus étudié. Dans ce cas, l’objectif du test d’hypothèse est. de
vérifier la théorie ou le modèle. Troisièmement, la valeur du paramètre de la population peut
résulter de considérations extérieures, telles que les spécifications de conception, ou d’obliga­
tions contractuelles. Dans ce cas, le test d’hypothèse sert habituellement à tester la conformité.
On aimerait décider de la véracité ou de la fausseté d’une hypothèse. Pour en avoir le cœur net,
il faudrait sonder toute la population, ce qui s’avère en général impossible. Par contre, une procé­
dure, appelée «test d’hypothèse», peut être effectuée à partir des renseignements contenus dans un
échantillon aléatoire de la population en question. Si ces renseignements sont compatibles avec l’hy­
pothèse nulle, l’hypothèse n’est pas rejetée; s’ils sont incompatibles, l’hypothèse nulle est rejetée.

T e s t d'hypothèse

Un test d’hypothèse est une procédure qui confronte une hypothèse statistique (portant sur une ou
plusieurs populations) à des observations provenant d’un échantillon (ou de plusieurs échantillons).
L’issue d’un test consiste à rejeter (ou non) l’hypothèse nulle au prolit d’une hypothèse alternative, en
contrôlant les probabilités d’erreur.

Pour tester une hypothèse, on sélectionne un échantillon aléatoire, on calcule une statis­
tique, aussi appelée « statistique du test », à partir des données d’échantillon, puis on utilise les
renseignements contenus dans cette statistique pour prendre une décision.

Région de rejet de H 0

La «région de rejet de H0», ou «région critique» d’un test, est l’ensemble des
du test qui mènent au rejet de l’hypothèse nulle.

Exemple 10.2
Par exemple, pour tester l’hypothèse nulle H0: n = 2500 dans l’équation
de béton choisies aléatoirement sont testées et que la moyenne de l’échantillon est la stat istique du
test. Si la valeur observée de la moyenne échantillonnai, Je, est très grande ou très petite par rapport à
2500 lb/po2, on sera tenté de conclure que la valeur 2500 n’est pas représentative de la réalité. Mais de
combien d’unités x doit-elle s’éloigner de 2500 pour que cette valeur soit rejetée ? Disons pour l’in
qu’on utilise la règle suivante :
« Si x >2550 lb/po2ou si x <2450lb/po2, on considérera que la résistance moyenne à la compressio
type de béton est différente de 2500 lb/po2. Autrement dit, on rejettera l’hypothèse nulle H0: = 2500. » ►
CHAPITRE 10

Le rejet de H0 entraîne que l’hypothèse alternative H, est considérée comme plus plausible.
L’ensemble de toutes les valeurs possibles de X qui sont supérieures à 2550 lb/po2 ou inférieures à
24501b/po2 est appelé la «région critique» ou la «région de rejet» du test. D’autre part, si on obtient
2450lb/po2 < x < 2550lb/po2, alors on ne rejettera pas l’hypothèse nulle H0: fJ. = 2500. Donc, l’inter­
valle [2450 lb/po2, 2550lb/po2] est appelé la «région de non-rejet» du test.

Remarquez que, dans l’exemple 10.2, les bornes de la région critique (souvent appelées
« valeurs critiques » de la statistique du test), soit 2450 lb/po2 et 2550 lb/po2, ont été déterminées
arbitrairement. Dans les sections suivantes, nous montrerons comment établir une statistique du
test appropriée et déterminer la région critique de plusieurs tests d’hypothèses de façon objective.

Les erreurs de première et de deuxième espèces:


risques, seuil et puissance
La décision de rejeter ou non l’hypothèse nulle repose sur une statistique calculée à partir
des données d’un échantillon aléatoire. Elle est donc sujette à erreur. Deux espèces d’erreurs
peuvent être commises lorsqu’on effectue un test d’hypothèse. Si l’on rejette l’hypothèse nulle
lorsque celle-ci est vraie, on commet une erreur de prem ière espèce. Si l’on ne rejette pas
l’hypothèse nulle lorsque celle-ci est fausse, on commet une erreur de deuxièm e espèce. Le
tableau 10.1 décrit ces situations.
j» X f »«r*v -, ’'
f ^ r - v T l i B d 1 1 i • y ^ F «J F ^ « V%. A \ T> C '6»
« ♦ h '+ J < v ? * l « C \ f ». " A » i ( - < (■ v J ;*«* v f fiBf R y , y ~ ->
"/
.
\ , |' 1 K
»* <*»•»0— {yt .*1 ' / 'v 7
M ', v -
, A >
’Y y
/ J ïm T ,
■'*-* -■
* .* v ï
> • r.. - v * .
;'ji; 2 ; '
- :*< & > .*
* ‘’ % , . • * * ' /, 4l'
» -a
if
/- x fr v .p *
'-
y
v ‘i aJT- —
1 » L.
,
►* * ,*—• -■ v, r m W C T P lj-' - J j / è • ■■ .* . „•• •• . J » *r t . T » r W / v r * /v A ^ + (
■•

. ** • * .v . ' • , * - , y■ — , • ’•

•‘ •■
*• 4

• * .
m

.■ ... -». ■ y• «» • ■. • • . . . . « -. , . . i
, •
Réalité (dans la population)
Décision (basée sur l’échantillon)
. . #. _ s- y * "" * . ' rt -F. ‘ *— ■
H0 est vraie Ho est fausse y ' ‘ . • r % / • • «

Ne pas rejeter Hfl . y' * * .* — , •. ' — .


Pas d’erreur Erreur de deuxième espèce
• " * >« • • B

Rejeter H0 Erreur de première espèce Pas d’erreur

Les probabilités de commettre des erreurs de première espèce et de deuxième espèce sont
appelées « risques » et notées respectivement par les symboles a et fi. La probabilité de l’erreur de
première espèce a est souvent appelée « seuil » ou « niveau de signification » du test. On définit
aussi la «puissance du test» par la probabilité de rejeter (à juste titre) une hypothèse nulle fausse.

Erreurs de p re m iè re e t de deuxièm e espèces, seuil e t puissance

Risque de l Te espèce = Seuil = a -'P(erreur die lrfî espèce) = P(rejeter H0|H0 est vraie) (1Ô.3) * ' . » ' • . •l ' y

de 2e espèce = f3=P(erreur de 2° espèce) = P(ne pas rejeter H0|H0 est fausse) (10.4)
Puissance = 1 - f5 = P(rejeter H0 H0 est fausse) (10.5)

Exemple 10.3
Dans l’exemple du test portant sur le béton, décrit précédemment, il y aura une erreur de première
espèce si la moyenne de l’échantillon 3c > 2550 lb/po2 ou si 3c < 2450 lb/po2 quand en fait la résis­
tance moyenne réelle est fl = 2500 lb/po2. Il y aura une erreur de deuxième espèce si on obtient
2450 lb/po2 < 3c < 2550 lb/po2 et que, pourtant, la valeur réelle de fl diffère de 2500 lb/po2.
Les tests d'hypothèses

Comme les résultats d’un test d’hypothèse sont sujets à erreur, on ne peut pas «prouver» ou
«réfuter» hors de tout doute une hypothèse statistique à partir d’un échantillon. Cependant, il
est possible de concevoir des procédures de test qui feront en sorte que les probabilités d’erreurs
a et P prendront des valeurs suffisamment petites.
En règle générale, on considère que l’erreur de première espèce est la plus grave. On fixe
alors arbitrairement le seuil a à une petite valeur comme 0,01, 0,05 ou encore 0,10. Ainsi,
lorsqu’on rejettera H0 à l’issue d’un test d’hypothèse, ce sera avec une grande conviction, et on
dira qu’il s’agit d’une « conclusion forte ». À l’inverse, ne pas rejeter H0constituera une « conclu­
sion faible », car cela signifie seulement que l’écart entre x et 2500 n’est pas assez grand pour
conclure que // diffère de 2500.
C’est en fixant la valeur de a qu’on détermine les bornes de la région critique (et non arbi­
trairement, comme dans l’exemple précédent). Il faut donc faire certaines suppositions sur la
distribution de la statistique du test pour établir le critère de rejet de H0.
Toutes choses étant égales par ailleurs, plus a est petit, plus la probabilité d’erreur de
deuxième espèce (/?) est grande. Or, on verra plus loin que /? varie aussi en fonction du degré
de fausseté de H0 (c’est-à-dire la différence entre la valeur de p spécifiée sous H0 et la véri­
table valeur de ju) et de la taille d’échantillon n. Il sera donc possible de corriger certaines
quantités pour s’assurer que n’est pas trop grand.

Le seuil observé (valeur P ou évalue)


La décision de rejeter ou non H0 à l’issue d’un test est binaire et ne reflète pas la force du rejet
ou du non-rejet. Il est utile d’avoir une mesure permettant de quantifier la compatibilité entre
les données et l’hypothèse nulle. C’est le rôle de la valeur P. On utilise fréquemment des logi­
ciels informatiques pour les tests d’hypothèses statistiques. La plupart de ces programmes
calculent la valeur P, définie comme suit.

Seuil observé, ou valeur P


Le seuil observé, ou valeur P
{-valueneanglais), représente la probabilité que la statistique du test
prenne une valeur au moins aussi extrême (au sens de H ) que la valeur observée de cette statistique
lorsque H0est vraie. On peut aussi définir la valeur P comme le plus petit seuil de signification qui
mène au rejet de H0. Si la valeur P est inférieure ou égale à a. on rejette H0, mais si la valeur P
excède or, on ne peut pas rejeter H0.

Par exemple, si une valeur P de 0,04 est obtenue, l’hypothèse nulle H0 sera rejetée au
seuil a —0,05, mais pas au seuil a —0,01.
On qualifie habituellement la statistique du test (et les données) de «significatives»
lorsque l’hypothèse nulle H0 est rejetée. On peut donc considérer la valeur P comme le plus
petit seuil a pour lequel les données sont significatives. Si une petite valeur P est calculée, le
décideur doit déterminer à quel point les données sont significatives scientifiquement, au-delà
de la signification statistique. Puisque c’est souvent une des seules valeurs rapportées dans les
résultats d’études scientifiques, il est très important de savoir interpréter des valeurs P. Nous
donnerons plusieurs exemples de calcul et d’interprétation du seuil observé dans les sections
qui suivent.
CHAPITRE 10

La signification pratique et la signification statistique


L’objectif d’un test d’hypothèse est de prendre une décision à propos d’une affirmation ou d’une
croyance. La décision de rejeter ou non l’hypothèse nulle en faveur de l’hypothèse alternative
repose sur un échantillon tiré de la population en jeu. Si l’hypothèse nulle est rejetée, on dit
qu’il existe une preuve statistique significative à l’encontre de l’hypothèse nulle et en faveur de
l’hypothèse alternative. Toutefois, les résultats statistiques significatifs (par rejet de l’hypothèse
nulle) ne sont pas nécessairement des résultats significatifs en pratique.
Pour illustrer notre propos, supposons qu’on s’intéresse à la température moyenne durant
une journée du mois de mai dans une province particulière. Supposons que n = 50 emplacements
dans cette province ont une température moyenne de x —16 °C et un écart-type de 0,5 °C. Si l’on
teste l’hypothèse H0: fl = 17 par opposition à H ,: f i ^ 17, on obtient une valeur P d’environ 0 et
on rejette donc l’hypothèse nulle. (Nous verrons plus loin comment faire ces calculs.) Alors, on
conclut que la vraie température moyenne n’est pas de 17 °C, donc qu’il existe une différence
statistique significative entre la valeur hypothétique et la moyenne de l’échantillon obtenue
des données. Mais s’agit-il d’une différence pratique ? Autrement dit, est-ce que la différence
entre 17 °C et 16 °C est vraiment importante ? Du point de vue de la température ressentie lors
d’une activité extérieure, probablement pas. Un climatologue aurait peut-être un avis différent
sur la question, en raison des impacts globaux d’une baisse de 1 °C sur l’environnement. Bref,
la signification statistique n’entraîne pas nécessairement la signification pratique, et c’est au
scientifique de vérifier si ce qu’il observe est significatif pour lui, au-delà de l’information que
la statistique peut lui apporter.
La taille de l’échantillon étudié a une influence directe sur la puissance du test et la signi­
fication pratique. Lorsque la taille de l’échantillon est suffisamment grande, le test d’hypo­
thèse peut détecter même les plus petites différences entre la valeur supposée et la valeur de
l’échantillon. Il faut donc interpréter prudemment les résultats d’un test d’hypothèse dans le cas
de grands échantillons, car plus n est grand, plus les différences observées sont signficatives
statistiquement.

Les hypothèses unilatérales et bilatérales


Il n’est pas toujours facile de choisir le sens de l’hypothèse alternative. Comme le rejet de H0 est
toujours une conclusion forte, alors que le fait de ne pas rejeter H0peut être une conclusion faible
(à moins de savoir que /? est petit), on préfère habituellement formuler des hypothèses telles que
l’énoncé pour lequel on désire une conclusion forte soit dans l’hypothèse alternative H,.
Une hypothèse alternative bilatérale est appropriée lorsqu’on souhaite vérifier si le para­
mètre 0 d’une distribution diffère d’une valeur arbitraire 0Q. Par exemple, s’il est important de
détecter les valeurs de la moyenne réelle fl plus grandes ou plus petites que fl0, on doit utiliser
l’alternative bilatérale :
»

H0•

Par contre, supposons qu’on désire rejeter H0 seulement lorsque la vraie valeur de la moyenne
excède fi0.Ainsi, les hypothèses sont
H0• P Poi
( 10.6)
Les tests d'hypothèses

La région critique est alors située dans l’aile supérieure de la distribution de la statistique ; on
rejette H0 si x est trop grand. On conçoit le test unilatéral à droite en supposant que fl ne peut
être inférieure à ju0 ou, si tel est le cas, qu’il est souhaitable d’accepter l’hypothèse nulle. Nous
écrirons toujours l’hypothèse nulle avec un signe d’égalité même s’il est sous-entendu que, dans
plusieurs situations, cela signifie H0: fJ. n Q.
<
Une troisième possibilité consiste à faire un test unilatéral à gauche en posant les hypothèses

On rejette alors H0 lorsque la moyenne échantillonnai est trop petite. Mais comment choisir le
test idéal ? Cela dépend de l’objectif de l’étude et du point de vue de l’analyste.

Exemple 10.4
Supposons qu’un embouteilleur achète des bouteilles de 284 ml d’une verrerie. Lembouteilleur veut
être sûr que les bouteilles excèdent la spécification sur la pression interne moyenne (ou résistance à
l’éclatement), qui est de 200 lb/po2pour les bouteilles de 284 ml. L’embouteilleur a décidé de formuler
une hypothèse alternative unilatérale à droite, c’est-à-dire
H0: n = 200 lb/po2,
H, : /i > 200 lb/po2. (10.7)
Si l’hypothèse nulle est rejetée, les bouteilles sont jugées satisfaisantes ; tandis que si H0 n’est pas
rejetée, alors les bouteilles ne sont pas conformes aux spécifications et il faut les refuser. Comme le
rejet de H0est une conclusion forte, cette formulation force le verrier à «démontrer» que la résistance
moyenne à l’éclatement des bouteilles excède la spécification.
Une telle formulation convient si le verrier a déjà éprouvé des difficultés à respecter les spécifications
ou si des considérations sur la sécurité du produit nous forcent à maintenir fermement la spécification
de 200 lb/po2.
Considérons maintenant le cas où l’embouteilleur décide de formuler une hypothèse alternative uni­
latérale à gauche :
H0: jj.= 200 lb/po2,
H, : n < 200 lb/po2. ( 10.8)
Dans cette situation, les bouteilles sont insatisfaisantes seulement lorsqu’il y a une preuve forte que
la moyenne est inférieure à 200 lb/po2. Cette formulation laisse supposer que les performances anté­
rieures du verrier sont convenables et que les petits écarts relativement à la spécification sont peu
importants.

Lorsqu’on formule des hypothèses alternatives unilatérales, on doit se souvenir que le rejet
de H0 est toujours une conclusion forte et qu’il faut donc écrire l’énoncé pour lequel il est impor­
tant de formuler une conclusion forte dans l’hypothèse alternative. Cela dépendra souvent de
notre point de vue et de notre expérience dans une telle situation.

La relation entre les tests d'hypothèses bilatéraux


et les intervalles de confiance
Il existe une relation étroite entre le test d’une hypothèse sur un paramètre 6 et l’intervalle de
confiance pour 6. Si [L, U] est un intervalle de confiance de niveau 1 - or pour le paramètre 6,
CHAPITRE 10

alors le test de seuil a de l’hypothèse


Ho: 0 = 6 o’
H,: 6 ± d 0
mènera au rejet de H0 si et seulement si n’appartient pas à l’intervalle [L, U].

Exemple 10.5
Considérons une situation où un intervalle de confiance de niveau 1 0,95 pour la moyenne
d’une population a été calculé à partir d’un échantillon, et où on a obtenu [41, 43]. Comme la valeur
40 n’appartient pas à cet intervalle, alors on sait qu’en conduisant un test d’hypothèse sur le même
échantillon, l’hypothèse
H0: /J. = 40
sera rejetée au seuil de a = 0,05, au profit de son alternative bilatérale.

La démarche générale d'un test d'hypothèse


Lorsqu’on veut faire de l’inférence statistique en utilisant un test d’hypothèse, on doit suivre
une série d’étapes :
1. Déterminer les hypothèses nulle et alternative, et fixer le seuil a du test ;
2. Établir la règle de rejet de H0 à partir de la distribution de la statistique du test
(lorsque H0 est vraie) ;
3. Calculer la valeur observée de la statistique du test à partir de l’échantillon ;
4. Décider si H0 doit être rejetée ou non, en comparant la valeur observée à la valeur cri­
tique, ou encore en comparant la valeur P avec le seuil du test ;

5. Enoncer la conclusion dans les termes de l’étude pour rendre le résultat accessible à un
non-statisticien.
Les hypothèses à confronter, le seuil de signification et la règle de rejet doivent guider la col­
lecte de données, et non l’inverse. En général, ce ne sont pas les observations qui dictent les buts
de l’analyse (même si elles peuvent être inspirantes pour la poursuite de la recherche).

10.2 Les tests d'hypothèses à partir


d'un seul échantillon
Dans cette section, nous abordons les détails de la procédure des tests d’hypothèses dans
diverses situations : les tests sur la moyenne d’une distribution normale avec variance connue
et inconnue, les tests sur la variance d’une distribution normale, et les tests sur une proportion
(pour une grande taille d’échantillon).

10.2.1 Le$ tests sur la moyenne d'une distribution


normale de variance connue

La procédure pour le test bilatéral


Supposons que la variable aléatoire X représente un certain processus ou une certaine popu­
lation d’intérêt. On suppose que X obéit à une loi normale ou que, dans le cas contraire, le
Les tests d'hypothèses

théorème central limite s’applique. De plus, on suppose que la moyenne f iâ t X est inconnue,
mais que sa variance g 2 est connue. On veut tester les hypothèses

H0’ fl —/A)»
H (10.9)
où jUqest une constante spécifiée.
Un échantillon aléatoire simple de taille n est disponible. Notons-le Xt, X v ..., X n. Chaque
observation dans cet échantillon a une moyenne théorique fi inconnue et une variance théorique
G2 connue. Si l’hypothèse nulle H0: f l - fiQest vraie, alors X ~ N{fiQ, G2In). La procédure de
test utilise la statistique

(10.10)

laquelle, sous l’hypothèse nulle, obéit à la loi N (0,1). Donc, si H0: fi - fi0est vraie, la probabilité
est 1 - a qu’une valeur de la statistique Z0 soit entre - et za/2, où est le quantile de la loi
normale centrée réduite tel que P(ZQ> zal2) = cdl. Les figures 10.1 et 10.2 illustrent respective­
ment la distribution de X et de Z0 lorsque H0 est vraie.

La distribution de X lorsque H0: fi = tioest vraie

Zalï 0 Z2

La distribution de lorsque H0: » est vraie


c

290 CHAPITRE 10

Visiblement, un échantillon donnant une valeur de la statistique qui appartient aux extré­
mités de la distribution de Z0 est peu probable si H0: H = ju0 est vraie. Le cas échéant, on aurait
raison de remettre en doute la véracité de H0.

Critère de rejet de H0: fi- fiQ


(test bilaté
* * , 0
, '< t » , * ■ ■*

On se donne comme règle de rejeter H0: jli = au profit de H, ; // &jut) si


0 < —7
cal2 OU SI 7 > 7
405 ^a/2 ( 10. 11)

et de ne pas rejeter H0 si
•7
c a /2
< -
— ^0
< r
— ^ a /2
( 10. 12)

L’équation 10.11 définit la région critique ou de rejet de H0. La probabilité de l’erreur de


première espèce de cette procédure de test est a. On peut déduire de l’équation 10.12 que les
deux valeurs critiques de la figure 10.1 sont les suivantes :

Exemple 10.6
On étudie la vitesse de combustion du carburant d’une fusée. Le cahier des charges exige que la vitesse
moyenne de combustion soit de 40 cm/s. Supposons que l’écart-type de la vitesse de combustion est
d’environ 2 cm/s et que cette variable suit une distribution normale.
1. Hypothèses et seuil
L’expérimentateur décide de spécifier une probabilité d’erreur de première espèce = 0,05 et base le
test sur un échantillon aléatoire de taille n = 25. Il veut tester les hypothèses
H0: fi= 40 cm/s,
H] : jj.*40 cm/s.

2. Règle de rejet de H0
Puisque le test est bilatéral, on rejettera H0 si x est trop grand
On devra comparer la valeur observée (z0) de la statistique du test (Z0) avec les valeurs critiques
L^o 025 =: ±1,96. Si —1,96 < z0 < 1,96, l’hypothèse nulle ne sera pas rejetée.
3. Calcul de la statistique observée
Les 25 unités sont essayées, et la vitesse moyenne de combustion de l’échantillon obtenue est
x = 41,25 cm/s. La valeur de la statistique dans l’équation 10.10 est

3,125.

4. Décision
On remarque que z0appartient à la région critique, car 3,125 > 1,96. Donc, H0 est rejetée.
5. Conclusion
La vitesse moyenne de combustion excède 40 cm/s de façon significative au seuil de 5 %.
Une décision basée directement sur la distribution de la moyenne échantillonnai
Notons que les valeurs critiques auraient pu être calculées à partir de la distribution de X, soit la loi
N f 40, —1 plutôt que sous la forme centrée réduite. La règle de décision serait plutôt formulée ainsi : on
rejette H0 si x > 40 + l,9 6 x | = 40,784 ou si J < 40-1,96x | = 39,216. La décision est évidemment la
même à l’issue du test : on rejette H0, car la moyenne observée (41,25 cm/s) appartient à la région critique.
Les tests d'hypothèses 291

Le calcul du seuil observé (valeur P)


La valeur calculée de la statistique est z0= 3,125 et, comme l’hypothèse alternative est bilatérale, les
valeurs dites « extrêmes » sont les valeurs très éloignées de la valeur attendue de la statistique sous H0
(ici la valeur 0) dans un sens ou dans l’autre. La valeur P est donc la probabilité d’observer une valeur
de Z0 au moins aussi éloignée de 0 que 3,125 :
Valeur P = P(Z0<-3,125) + P(Z0> 3,125)
= 2P(Z0> 3,125)
= 0,0018.
Le seuil observé est représenté par la région ombrée de la figure 10.3. Donc, H0: 40 sera rejetée
pour tout seuil de signification a> 0,0018. Par exemple, H0sera rejetée si a= 0,01 ou si a = 0,05, mais
ne le sera pas si a = 0,001.

W , 1)

-4 -3,125 -1,645 0 1,645 3,125 4

Le seuil observé du test bilatéral sur la vitesse moyenne de combustion

La procédure pour les tests unilatéraux


Supposons maintenant qu’on désire tester l’hypothèse alternative unilatérale à droite, soit

H0: ^ = A)>
H ,://> /i0. (10.13)
En définissant la région critique de ce test, on remarque qu’une valeur négative de la statistique
Z0 ne conduira jamais à conclure que H0: fl - /ll0e
st fausse. On
tique dans l’aile supérieure de la distribution N(0, 1) et rejeter H0 pour les trop grandes valeurs
de z0. Autrement dit, on doit rejeter H0 si
Zq^ Zqt* (10.14)
De même, pour tester l’hypothèse unilatérale à gauche

H0: ^ = A)>
H, : jj. </Uq, (10.15)
on doit calculer la statistique Z0et rejeter H0pour les trop petites valeurs de z0. Autrement dit, la
région critique est dans l’aile inférieure de la distribution N(Q, 1), et on rejette H0 si
Zq Za- (10.16)
CHAPITRE 10

Exemple 10.7
Dans l’exemple 10.6, le test unilatéral à droite aurait mené au rejet de H0, car 3,125 > z005 = 1,645. La
valeur Passociée à ce test aurait été P(ZQ> 3,125) = 0,0009. Par contre, le test unilatéral à gauche
n’aurait pas permis de rejeter l’hypothèse nulle, car la région critique contient toutes les valeurs infé­
rieures à -1,645. La valeur P de ce test aurait été P(Z0 < 3,125) = 0,9991. Il faut cependant garder en
mémoire que les hypothèses et le seuil du test doivent être spécifiés avant la collecte des données.

Le calcul du risque de deuxième espèce du test


Lorsque l’analyste teste les hypothèses des équations 10.9,10.13 et 10.15, il choisit directement la
probabilité de l’erreur de première espèce a. Cependant, la probabilité de l’erreur de deuxième
espèce doit aussi être prise en compte.
Considérons par exemple l’hypothèse unilatérale
H0: // = //(,>
H
Supposons que l’hypothèse nulle est fausse et que la valeur réelle de la moyenne est //,, une valeur
plus grande que jUq. Puisque Hj est vraie, la moyenne échantillonnai X obéit à la loi N( jliv <J2/n).
La figure 10.4 représente la distribution de X sous l’hypothèse nulle H0 et sous l’hypothèse
alternative H,. On rejette H0 si x est supérieure à la valeur critique v, qui vaut }l0 + za a / J n .
Rappelons qu’une erreur de deuxième espèce est commise si H0 n’est pas rejetée alors qu’elle
est fausse. L’examen de cette figure révèle que si H, est vraie, une erreur de deuxième espèce
ne sera commise que si x < v. Autrement dit, la probabilité de l’erreur de deuxième espèce /?
correspond à la région ombrée (en gris foncé) de la figure 10.4. Sur la figure 10.5, on voit cette
même probabilité sous la courbe de la loi de Z0.
/ ~

Sous H0: fi = S ous H,: f i > H q


\

/A) v Mi x
________________________________ ______ _ _____ _______________ _________________ .i
*
t

La distribution de X sous H0et sous H,


1!
Sous FLo: n HQ Sous H
t
.

:
:

1

j

La distribution de sous H0et sous H1


Les tests d'hypothèses

L'utilisation des courbes caractéristiques


On peut évaluer la probabilité de l’erreur de deuxième espèce à l’aide de la loi normale, mais
il est aussi possible d’utiliser les graphiques Vie et VId de l’annexe, appelés « courbes caracté­
ristiques ». Ces courbes représentent P en fonction d’un paramètre d pour différentes valeurs de
taille d’échantillon n. Ces courbes sont tracées pour a = 0,05 et 0,01. Par définition,

d - Ël— pour les tests unilatéraux à droite ; (10.17)


<7
Lin ~ U,
d = ——— pour les tests unilatéraux à gauche. (10.18)
G

Les graphiques Via et VIb de l’annexe sont les courbes caractéristiques correspondant au
test bilatéral. Dans ce cas, le paramètre d est défini par

d = \tlZ£À
(10.19)
G

En règle générale, les courbes caractéristiques comprennent trois paramètres : et La


connaissance de deux de ces paramètres permet de déterminer le troisième. Voici deux appli­
cations typiques de ces courbes :
1. n et d sont donnés et l’on doit trouver p. L’exemple 10.8 illustre cette situation. C’est
le genre de problème que l’analyste doit souvent résoudre quand il se préoccupe de la
précision d’une expérience antérieure ou lorsque des considérations économiques ou
autres limitent la taille de l’échantillon.
2. p et d sont donnés et l’on doit trouver n. L’exemple 10.9 ( à la page 296)
illustre cette situation. C’est le genre de problème que l’analyste doit habituelle­
ment résoudre quand il a l’occasion de choisir la taille de l’échantillon au début de
l’expérience.

Exemple 10.8
Considérons le problème du combustible de fusée de l’exemple 10.6 et tenons pour acquis qu’on réalise
un test unilatéral à droite :
H0: p = 40 cm/s,
H,:/z>40 cm/s.
Supposons que l’analyste veut rejeter H0 avec une forte probabilité si la véritable vitesse moyenne de
combustion est p = 41 cm/s. En d’autres termes, il veut une faible probabilité d’erreur de deuxième
espèce si p = 41 cm/s.
L’utilisation des courbes caractéristiques
Utilisons d’abord les courbes caractéristiques pour trouver p. On note que 40, /i, = 41, = 25,
G= 2 et a= 0,05. Donc,
d =h ~ J k =i
G 2
et, à partir du graphique Vie de l’annexe, pour n = 25, on trouve que P~ 0,20. Autrement dit, si la vraie
vitesse moyenne de combustion est p = 41 cm/s, alors il y a environ 20 % de chances que cet écart ne
soit pas détecté par le test avec n - 25. ►
CHAPITRE 10

Le calcul direct basé sur la loi normale


Pour calculer exactement avec la loi normale, on utilise la définition de la probabilité d’erreur de
deuxième espèce :
P = P(Ne pas rejeter H0|H, est vraie) Définition de p

X -4 0 , ^
P I ----j= < 1,645 H, est vraie Région de non-rejet de H0
2/JÏ5 J
P( X<40,658 | /z = 4l) Isoler X

X -41 40,658-41
1 I ----7= < H = 41 Centrer et réduire avec 41
2/J25 2/V25 J
P{Z< -0,855) Z~N( 0, 1)
= 0,195.

Les facteurs qui influencent le risque de deuxième espèce


du test sur une moyenne
L’examen des courbes caractéristiques et des figures 10.6, 10.7 et 10.8 révèle que, toutes choses
étant égales par ailleurs,
1. diminue lorsque jJ^ s’éloigne de fl0. Autrement dit, pour une taille d’échantillon et
un seuil a donnés, il est plus facile de détecter les grands écarts par rapport à jlIq que
les petits.

/
Sous Sous Sous Sous
H 0'-M= Mo H, : // > H0’-M = Mo H ,: //> //0

N Ao» CT2
n
J

Po Al X

a) //, proche de /£, b) fixloin de fj^

L'effet de la distance entre /*, et sur la valeur de fi : a) lorsque est proche


de /4,; b) lorsque faest loin de fa,
Les tests d’hypothèses

B diminue lorsque n augmente. Autrement dit, pour détecter un écart à la moyen


spécifié, on peut accroître la puissance du test (1 - fi)en augmentant la taille de l'écha
tillon. Ceci est dû au fait que la variance de X diminue lorsque n augmente

L'effet de la taille d'échantillon sur la va le u r de a) lo rsq u e l


l'échantillon (n) est petite; b) lorsque la ta ille de l'é ch a n tillo n (n) e s t g ra n d e

3. f i d im in u e lorsq u e a augm ente. Autrement dit, on peut augm enter la puissance du


test (1 — p)en haussant le seuil du test, mais il faut garder en tête que l ’erreur de p re­
m ière espèce est considérée la plus grave ; a doit donc rester assez petit.

L'effet de la v a le u r de a su r la v a le u r de /?: a) lo rsq u e a e st p â t i t ; b) lo r s q u e a


est gran d
CHAPITRE 10

Le choix de la taille d'échantillon


Puisque la puissance du test est affectée par la taille d’échantillon, il est courant de fixer 1 —fi
et de trouver la valeur de n qui nous permet de l’atteindre. Voici un exemple de ce type de
calcul.

Exemple 10.9
Considérons encore le problème du carburant de fusée de l’exemple 10.6. Supposons que l’analyste
aimerait concevoir le test de manière à ce qu’il détecte si la véritable vitesse moyenne de combustion
est de 41 cm/s (autrement dit, rejeter H0: // = 40) avec une probabilité élevée, soit de 0,90.
L’utilisation des courbes caractéristiques
Comme d =ju^/cr = 1/2, a = 0,05 et J3=0,10, le graphique Vi
de l’échantillon doit être d’environ n =40.
Le calcul direct basé sur la loi normale
On peut aussi déterminer de manière plus exacte la taille de l’échantillon à utiliser pour obtenir une
valeur particulière de fd pour /j 1et adonnés, à partir de la définition de /3:

= P(Ne pas rejeter H01Hj est vraie) Définition de

\
<1,645 H, est vraie Règle de non-rejet sans fixer n
J
Centrer et réduire avec /J = 41

Z~/V(0, 1)

ce qui permet de poser l’égalité

En isolant n, on obtient n —34,22 (qu on arrondit à 35), une valeur proche de celle que donne la courbe
caractéristique.

On peut déduire les formules pour calculer n directement :


~\2
(^a
n pour le test unilatéral,
_ ~ An

n pour le test bilatéral.


Les tests d’hypothèses

Le test sur la moyenne pour grands échantillons


avec variance inconnue
On a élaboré la procédure de test pour l’hypothèse nulle H0: fi -fi^ en supposant que la variance
<72 est connue. Cependant, dans de nombreuses situations pratiques, a 2 n’est pas connue. En
règle générale, si n > 30, on peut substituer la variance de l’échantillon S2 à G2 dans les procé­
dures de test sans commettre une grande erreur. L’étude du cas où a 2 est inconnue et n est petit
nécessite l’usage de la loi t et est traitée dans la sous-section 10.2.2.

10.2.2 Les tests sur la moyenne d'une distribution


normale de variance inconnue
des hypothèses sur la moyenne fi d’une population lo e cr est incon­
nue et que la taille de l’échantillon est petite, on doit faire une supposition à propos de la forme
de la distribution de la variable X pour obtenir une procédure de test. La supposition, raison­
nable dans de nombreux cas, est que cette distribution est normale.
Comme la loi normale est une très bonne approximation de nombreuses populations ren­
contrées dans la pratique, cette supposition mène à une procédure de test généralement appli­
cable souvent appelée «test t», car elle fait appel à la loi de Student. En fait
avec la normalité influera peu sur la validité du test. Si la supposition est déraisonnable, on
peut spécifier une autre loi (exponentielle, Weibull, etc.) et utiliser une méthode générale de
construction de test pour obtenir une procédure valide, ou on peut utiliser un des tests non para­
métriques qui sont valides pour toute distribution. (Cette dernière possibilité n’est pas décrite
dans cet ouvrage.)

La procédure pour le test bilatéral


Supposons que X est une variable aléatoire normalement distribuée de moyenne fl et de
variance cr2 inconnues. Testons l’hypothèse que ji est égale à une constante fi^. On remarque
que cette situation est similaire à celle qui a été traitée à la sous-section 10.2.1 sauf que, main­
tenant, les deux paramètres fl et <72 sont inconnus. Supposons qu’on dispose d’un échantil­
lon de taille n, soit X {, X2, ..., Xn, et soit respectivement X et S2 la moyenne et la variance de
l’échantillon.
Supposons maintenant qu’on désire tester l’hypothèse alternative bilatérale

H0• fl 0’
H {:H*fiQ. (10.20)
La procédure du test t repose sur la statistique

T -* Z £ o
( 10.21)
0 " SAÆ ’
t

qui obéit à la loi t avec n - 1 degrés de liberté si l’hypothèse nulle H0: fl - fi^ est vraie.
CHAPITRE 10

Critère de rejet de H0: // = fiQ


(test bilatéral, loi normale, varian
Pour tester H0: ju = p 0 de l’équation 10.20, on calcule la valeur observée (/ ) de la statistique T0 de
l’équation 10.21, et H0 est rejetée si
t0 > t al2;n- 1’ ( 10.22 )

où /a/2 , est Ie quantile d'ordre 1 - a l 2 de la loi t de Student avec n - 1 degrés de liberté


• *

La procédure pour les tests unilatéraux


Pour l’hypothèse alternative unilatérale à droite, • ^ «■

H0• —A»
H (10.23)
. , - - « , , _ _ * i t . . . . .. - . , •

* . * • » ' , < * ^ 1 ’ ^ É . •' * • 4 -, « ' J ' < * '

on calcule la valeur observée t0 selon l’équation 10.21 et on rejette H0 si


*0 > *a;n-1 (10.24)
■ * \ ' , * * , . . t• • ■ ■ . " , « V | • * , .

Pour l’hypothèse alternative unilatérale à gauche,


H0• P Pqi
—V
h r.//</4>, (10.25)
on rejette H0 si
(10.26)
— » . .

^0 ^ ~t<x;1*

Exemple 10.10

La résistance à la rupture d’une fibre textile est une variable aléatoire normalement distribuée. Le
cahier des charges exige que la résistance moyenne à la rupture soit de 150 lb/po2. Le fabricant désire
• * * ^ *- ^ ’ • “ • • • # *.

détecter tout écart significatif à cette valeur à partir d’un échantillon de 15 fibres.
1. Hypothèses et seuil , %
. ;

Le fabricant désire tester

* . k .
H0: fi= 150 lb/po2,
H, : H* 150 lb/po2.
i f
. , K%
< ; -
« - * » *. • •

- m . 4( . i ■ , * * « * • .* f 4 » * 9 m . • ■ .

Le cahier des charges spécifie une probabilité d’erreur de première espèce a = 0,05.
2. Règle de rejet de H0
On rejettera H0 s i\tQ\ > tQ02S. 14= 2,145, où t 3c—150
S /Jn

observée
rupture. La
noyenne et la variance de l’échantillon, calculées à partir = 152,18 et
s 2 = 16.63. Donc, la valeur observée de la statistiaue du tes / •» .
4

. .•

x-jii0 152,18-150
« V

to 2,07.
s/Jn J l6

4. Décision
Puisque la valeur absolue de t0est inférieure à cette valeur critique, on conclut qu’il n’y a pas de preuve
suffisante pour rejeter l’hypothèse que p —150 lb/po2. ►
Les tests d'hypothèses

On peut calculer la valeur P (voir la figure 10.9) de ce test en se rappelant qu’il s’agit de la probabilité
d’obtenir une valeur au moins aussi extrême que 2,07 si H0 était vraie. On obtient alors, à l’aide d’un
ordinateur,
Valeur P = 2 x P(T0 > 2,07) = 2 x 0,0287 = 0,0574,
une valeur légèrement supérieure au seuil du test, d’où le non-rejet de H0.
5. Conclusion
Les données n’ont pas fourni de preuve suffisante permettant de conclure que la résistance moyenne à
la rupture diffère significativement de 150 lb/po2, au seuil de 5 %.

La valeur P du test bilatéral sur la résistance moyenne à la rupture

Le calcul du risque de deuxième espèce


et le choix de la taille de l'échantillon
La probabilité de l’erreur de deuxième espèce des tests sur la moyenne d’une distribution nor­
male de variance inconnue dépend de la distribution de la statistique de l’équation 10.21 lorsque
l’hypothèse nulle H0: fl - ju0
est fausse. Quand la vraie valeur de la moyenne est
à jI q, la statistique T0 ne suit plus exactement une loi de Student, mais plutôt une loi dite de
Student « décentrée ». Trouver la probabilité de l’erreur de deuxième espèce implique de trouver
la probabilité contenue entre deux points sous la courbe de la loi t décentrée. Par exemple, la
valeur de p pour l’hypothèse alternative bilatérale sera
P = P ( ~ t ( x l 2 ; n - l — ^0 — ?a / 2; n - l ) ’

où Tq représente la variable aléatoire qui suit la loi t décentrée. Ce calcul se fait à l’aide d’un
ordinateur ou des courbes caractéristiques, et nécessite qu’on spécifie une valeur de variabilité.
Les courbes caractéristiques des graphiques Vie, Vif, VIg et Vlh de l’annexe représentent
P en fonction d’un paramètre d pour diverses tailles d’échantillon n. Ces graphiques sont four­
nis pour les hypothèses alternatives bilatérales et unilatérales et pour a - 0,05 ou a= 0,01. Dans
le cas de l’hypothèse alternative bilatérale de l’équation 10.20, c’est-à-dire si on considère que
fl prend la valeur particulière //„ le facteur d’échelle d de l’abscisse des graphiques Vie et V if
est, par définition,

d IMi-Mol ( 10.27)
G
300 CHAPITRE 10

Pour l’hypothèse alternative unilatérale à droite ( l’équation 10.23), c’est-à-dire fi > fig, on
utilise les graphiques VIg et Vlh avec
d = --- - —-, (10.28)
<T
Pour l’hypothèse alternative unilatérale à gauche ( l’équation 10.25), c’est-à-dire < fiQ,

d =— ~^ . (10.29)
G
On remarque que d dépend du paramètre inconnu G1. Il existe plusieurs façons d’éviter
cette difficulté. Dans certains cas, on peut utiliser les résultats d’une expérience antérieure ou
des renseignements dont on dispose pour estimer grossièrement la valeur de G1. Si l’on veut
examiner la courbe caractéristique une fois les données recueillies, on peut utiliser la variance
de l’échantillon s2pour estimer cr2. Si les analystes ne disposent d’aucune expérience an
pour estimer <r2, ils peuvent définir l’écart à la moyenne (//, - fig) qu’ils désirent détecter par
rapport à g . Par exemple, si l’on désire détecter un petit écart à la moyenne, on peut utiliser une
valeur de d= | fix—fig\/G = 1 et si l’on veut détecter seulement des écarts mod
à la moyenne, on peut prendre d=
\fi{ —]Uq\/g qui est importante dans la détermination de la taille de l’échantillon.

Exemple 10.11
Considérons le problème du test de fibre de l’exemple 10.10. Si la résistance à la rupture de cette fibre diffère
de 2,5 lb/po2 par rapport à 150 lb/po2, l’analyste aimerait rejeter l’hypothèse nulle H0: = 150 lb/po2 avec
une probabilité d’au moins 0,90. La taille d’échantillon 15 permet-elle d’assurer que le test ait
cette précision ?
Si l’on utilise l’écart-type de l’échantillon ql 6,63 pour estimer g , alors d = |/i, -/^|/cr= 2,5/4,08 = 0,61. En
se reportant aux courbes caractéristiques du graphique Vie, avec = 0,61 et = 15, on trouve ~ 0,45.
Donc, la probabilité de rejeter H q : jli= 150 lb/po2si la vraie moyenne diffère de ±2,5 lb/po2de cette valeur
est d’environ 1 - P = 1 - 0,45 = 0,55, et on conclut que la taille d’échantillon n = 15 ne convient pas.
Pour trouver la taille d’échantillon nécessaire qui donnera la précision désirée, on consulte les courbes
caractéristiques du graphique Vie avec d = 0,61 et fl = 0,10, et on lit la taille d’échantillon correspon­
dante, soit environ n —35.

10.2.3 Les tests sur la variance d'une distribution


normale
Il faut parfois tester des hypothèses sur la variance ou l’écart-type d’une population. Dans cette
sous-section, la procédure présentée suppose la normalité. Nous présenterons une démarche
valide pour les grands échantillons lorsque cette supposition est déraisonnable.

La procédure pour le test bilatéral


Supposons qu’on désire tester l’hypothèse que la variance g 2 d’une distribution normale est
égale à une valeur spécifiée, soit <x2. Soit X ~ N(fi, G2), où fl et <r2 sont inconnues, et soit
X x, X 2, ...,X n un échantillon aléatoire de n observations de la population. Pour tester
H0: G 2 = G2,
H, : G2 * g \, (10.30)
Les tests d'hypothèses 301

on utilise la statistique

(10.31)

où S2 est la variance de l’échantillon. Si H0: cr2 = a 2 est vraie, alors la statistique UQobéit à la
loi du khi-carré avec n —1 degrés de liberté.

Critère de rejet de H0:a2 = <r§(test bilatéral, loi normale)


On rejette H0: cr2= a l si
«0 > %a/2;n- 1
ou si
M0< X\ I» (10.32b)
où Xa/2 -. n- i et X 2\- a/2 -.n- i sont les quantiles d’ordre 1 - a l 2 et a l 2 de la loi du khi-carré avec
n —1 degrés de liberté.

La procédure pour les tests unilatéraux


On utilise la même statistique pour les hypothèses alternatives unilatérales. Pour l’hypothèse
unilatérale à droite,
H0: a 2 = cr2,
Hj : a 2 > a l (10.33)
on rejette H0 si
U0> X2a;n-V (10.34)
Pour l’hypothèse unilatérale à gauche,
,
Ho : cr2 = a 2,
H, : cr2 < a l (10.35)
on rejette H0 si
U0 < ZÏ-a;n-l- (10.36)

Exemple 10.12
Considérons la machine de l’exemple 9.13, qui est utilisée pour remplir des canettes de boisson gazeu.se.
Si la variance du volume de remplissage excède 0,02 (once liquide)2, alors le pourcentage de canettes
remplies adéquatement risque d’être trop faible.
1. Hypothèses et seuil
L’embouteilleur désire tester les hypothèses suivantes :
H0: <t 2 = 0,02,
H,: (T2>0,02.
Il choisit d’utiliser a - 0,05 et prévoit mesurer le volume de 20 canettes.
2. Règle de rejet de H0
On rejettera H0 si fi0 >Xo,os -,19 = 30, 14.
CHAPITRE 10

3. Calcul de la statistique observée


Un échantillon aléatoire de n= 20 canettes donne une variance de = 0,0225. Don
vée de la statistique du test est

21,38.

4. Décision
Puisque la valeur observée (21,38) est inférieure à la valeur critique (30,14), on ne rejette pas H0.
Puisque le test est unilatéral à droite, la valeur P (voir la figure 10.10) du test se calcule comme suit,
à l’aide d’un ordinateur :
Valeur P= P(U0> 21,38) = 0,316, où U0 ~ *f9.
Une valeur P supérieure au seuil amène au non-rejet de HQ. Puisque 0,316 est une probabilité assez
élevée, ceci indique que l’hypothèse H0 est plausible compte tenu des données.
5. Conclusion
Il n’y a pas de preuve forte que la variance du volume de remplissage excède 0,02 (once liquide)2.

Le seuil observé du test unilatéral sur la variance du volume des bouteilles

Le calcul du risque de deuxième espèce


et le choix de la taille de l'échantillon
On peut calculer p (ou 1 —fi) directement à partir de la loi du khi-carré. On peut aussi utiliser
les courbes caractéristiques des tests sur une variance fournies aux graphiques Vli à V in de
l’annexe pour a —0,05 et a = 0,01. Pour l’hypothèse alternative bilatérale de l’équation 10.30,
les graphiques Vli et Vlj représentent p en fonction d’un paramètre X, où

X = — (10.37)
<7o
pour diverses tailles d’échantillon n, et où <
j x représente la valeur de l’écart-type lorsque l’on
considère que H, est vraie. Les graphiques Vlk et Vil correspondent à l’hypothèse alternative
Les tests d'hypothèses 303

unilatérale H, : G2 g
> 2, tandis que les graphiques VIm et Vin correspondent à l’autre h
thèse alternative unilatérale, H, : <r2 < g \ .
En utilisant ces graphiques, on considère <7, comme la valeur de l’écart-type qu’on désire
détecter, c’est-à-dire celle pour laquelle on souhaite rejeter H0 avec une forte probabilité.

Exemple 10.13
Reprenons le contexte de l’exemple 10.12. Trouvons la probabilité de rejeter H0: = 0,02 si la vraie
variance est aussi grande que 0,03.
Le calcul direct basé sur la loi du khi-carré
On peut calculer la valeur de j3 directement à partir de sa définition :
J3 = P(Ne pas rejeter H0 | H, est vraie)
2
PI (n w—
2 <30,14 G 0,03
a0
2
P((n-1)52 <30,14cr02 1a 1 0,03)
2 2
(n -l)5 ‘ 30.14CTo 2
2 G 1 0,03
a1 G 1

„ 30,14(0,02) , . rf
P U < ------------- , ou U Z 19
0,03
P((/< 20,09)
0,611.
Le calcul approximatif avec les courbes caractéristiques___ ____
On considère ici que H, est vraie. De ce fait, on a <7, = yj0,03 = 0,1732 et <70 = y/0,02 = 0,1414. Le
paramètre A est

Selon le graphique Vlk, avec A = 1,23 et n = 20, on obtient « 0,60.


Autrement dit, il y a seulement 40 % de chances que H0: <r2 = 0,02 soit rejetée si la variance est vrai­
ment aussi grande que 0,03. Pour réduire /?, il faut utiliser un échantillon de taille plus grande. Par
exemple, une taille d’échantillon de 75 permet de réduire J.3à environ 0,20.

La procédure de test pour un échantillon de grande taille


La procédure de test du khi-carré décrite précédemment est plutôt sensible à la supposition de
normalité. Si la population sous-jacente n’est pas normale mais que n est grand (n > 35 ou 40,
par exemple), on peut utiliser le résultat suivant.
Si X,, X2, ..., Xn est un échantillon aléatoire d’une population de variance G2, alors l’écart-
type S de l’échantillon est approximativement normal avec une moyenne de E(S) * G et une
variance de V^S) = G2/2n si n est grand.
304 CHAPITRE 10

Pour tester
H„: oJ= ff02,
H, : a 2 * <7q, (10.38)
la statistique du test est

ai
N
II
(10.39)

0e»
et elle suit approximativement une loi (0, 1) sous H0. On rejette H
N
même statistique pour les hypothèses alternatives unilatérales en ajustant les zones de rejet.

10.2.4 Le$ tests sur une proportion


Dans de nombreux problèmes d’ingénierie et de gestion, il est question d’une variable aléatoire
qui obéit à une loi binomiale. Considérons, par exemple, un procédé de fabrication d’articles qui
sont classés acceptables ou défectueux. Il est habituellement raisonnable de modéliser le nombre
d’articles défectueux avec la loi binomiale, où le paramètre représente la proportion d’articles
défectueux produits. Nous verrons ici comment construire un test d’hypothèse sur le paramètre p.

La procédure pour le test bilatéral


On désire tester
H0: p = p 0,
H p . p ï p 0. (10.40)
Pour ce faire, on procède à un test approximatif basé sur l’approximation de la loi binomiale
par la loi normale. Cette procédure approximative est valide tant que p n’est pas trop proche de
0 ou de 1 et que la taille de l’échantillon est relativement grande.
Soit p la proportion d’observations (dans un échantillon aléatoire de grande taille n) qui
ont la caractéristique recherchée. Si l’hypothèse nulle H0: p = p 0 est vraie, alors p suit approxi­
mativement la loi n {Po' Po(1„ '^ j . Pour tester H0: p = pQpar opposition à l’hypothèse alternative
bilatérale, la procédure consiste à calculer la statistique du test

(10.41)

qui suit approximativement une loi N,0 1) si l’hypothèse nulle est vraie

Critère de rejet de p = p0 (test bilatéral, grand échantillon)


On rejette H0: = p{) si
> ^a/2-

On situe comme d’habitude les régions critiques des hypothèses alternatives unilatérales.
Les tests d'hypothèses 305

Exemple 10.14
Un fabricant de semi-conducteurs produit des dispositifs logiques. Selon le contrat avec un client, le
taux de dispositifs défectueux ne doit pas excéder 0,05. Le client doute que cette norme soit respectée
et prend un échantillon aléatoire de 200 dispositifs pour vérifier son impression.
1. Hypothèses et seuil
Le client veut tester
H0: p = 0,05,
Hi : /? > 0,05.
Il choisit un seuil de 5 %.
2. Règle de rejet de H0
On rejettera H0 si

3. Calcul de la statistique observée


L’échantillon de 200 dispositifs contient 6 unités défectueuses, c’est-à-dire p = 6/200 = 0,03. La valeur
observée de la statistique du test est
0,03-0,05
0,05(1-0,05)
200

4. Décision
Puisque la valeur observée (-1,30) est inférieure à la valeur critique (1,645), on ne peut donc pas rejeter
l’hypothèse nulle selon laquelle p = 0,05.
5. Conclusion
Les données ne permettent pas de conclure que la proportion de défauts excède 0,05 au seuil de 5 %.
Remarquons que, dans ce cas, la proportion échantillonnai était inférieure à = 5 %. Par consé­
quent, il était évident que l’hypothèse alternative unilatérale n’allait pas être corroborée ! (On peut
faire l’exercice qui consiste à montrer que même le test bilatéral n’aurait pas mené au rejet de H0, au
seuil de 0,05.)
Le calcul du seuil observé
Le seuil observé associé à ce test et ces données peut se calculer de manière approximative (avec la loi
normale) ou exacte (avec la loi binomiale). Rappelons que cette probabilité se calcule en considérant
que H0 est vraie.
Valeur P = P(p > 0,03) - P(Z > -1,30) = 0,90
200 200N\ 200
Valeur P exacte (0,05)* (1-0,05) “ X
0,94
jr=6 X J
306 CHAPITRE 10

Le calcul du risque de deuxième espèce


et le choix de la taille de l'échantillon
On peut obtenir des équations analytiques pour le risque des tests de cette section en utilisant
la définition de p. Par exemple, pour une hypothèse unilatérale à droite, on peut définir p l
comme la proportion vraie sous H, et on obtient :

P(Ne pas rejeter H0| Hj est vraie)

P = Pi

(10.43)

Si l’hypothèse alternative est H, : p < p0, alors on a

P o - P i - Z a y]p ( l - P o ) / n
0

1 -0 (10.44)
J Pi (1 “ Pi )!* J

Le risque p de l’hypothèse alternative bilatérale H est approximativement

(10.45)

La résolution de ces équations fournit la taille n de l’échantillon pour laquelle un test de seuil a
a un risque p spécifié. Les équations de la taille de l’échantillon sont

Za i2 V P o ü - P o ) + Z p y / P i Q - P i )
(10.46)
Pl - Po J
Les tests d'hypothèses 307

pour l’hypothèse alternative bilatérale (car on suppose que l’une des deux probabilités de
l’équation 10.45 est négligeable) et

pour les hypothèses alternatives unilatérales.

Exemple 10.15
Soit la situation décrite à 1’ P 0.07. Selon
P
/ A
0,05 -0,07 +1,645^(0,05)(0,95) /200
0 =0
J(0,07)(0,93)/200 J
0(0,30)
0,618.
Cette probabilité d’erreur de deuxième espèce n’est pas aussi petite qu’on aimerait qu’elle soit, mais la
taille d’échantillon n= 200 pourrait peut-être être augmentée davantage. Supposons qu’on dés
le risque f5 ne soit pas plus grand que 0,10 si la véritable valeur du taux de dispositifs défectueux est
aussi grande que p = 0,07. Selon l’équation 10.47, la taille requise de l’échantillon est

1,645^(0,05)(0,95) +1,28^(0,07)(0,93)
n
0,07-0,05 J
1174,
une très grande taille d’échantillon. Remarquons toutefois qu’on essaie de détecter un très petit écart
à la valeur p0= 0,05.

10.3 Les tests d'hypothèses à partir


de deux échantillons
Dans cette section, nous abordons les détails de la procédure des tests d’hypothèses pour la
comparaison de deux populations : les tests sur les moyennes de deux distributions normales
avec variances connues et inconnues, les comparaisons de moyennes avec des données appa­
riées, les tests sur l’égalité de deux variances de distributions normales, et les tests sur deux
proportions (pour de grandes tailles d’échantillons).

10.3.1 Les tests sur Ses moyennes de deux distributions


normales de variances connues
On s’intéresse à X xet à X2, deux populations ayant respectivement pour moyenne //, et (incon­
nues) et pour variance o 2et <r2(connues). On désire tester l’hypothèse que les moyennes juxet
sont égales. Supposons que X! et X2 sont normalement distribuées ou, si elles ne le sont pas, que
les conditions du théorème central limite s’appliquent.
308 CHAPITRE 10

La procédure pour le test bilatéral


Considérons d’abord l’hypothèse alternative bilatérale
H0• fa~ »
(10.48)
Supposons qu’un échantillon aléatoire de taille nxest tiré de la population 1, soit XH, X l2, ..., X irl]
et qu’un échantillon aléatoire de taille n2 est tiré de la population 2, soit X2l, X22, ..., X 2rl2.
On considère que les observations sont indépendantes dans un même échantillon et d’un échan­
tillon à l’autre. La procédure de test repose sur la distribution de la différence des moyennes des
échantillons, X, - X2. On peut donc résumer la situation ainsi.

Populations X2~ N ( f a to \ )

Échantillons x„, Xj2, . . *y ^21» ^22’ —’ ^2/i2

( 1 - f g\ \
Loi des moyennes échantillonnales Xr - N f a t - L X2 ~ N\
y ni J 1 n2 )

Loi de la différence des moyennes - ( cr,2


-x 2~ n +—
échantillonnâtes

Donc, si l’hypothèse nulle H0: fa = fa est vraie, la statistique du test

(10.49)

obéit à la loi N(0, 1).

Critère de rejet de H0: fa = //2(test bilatéral, variances connues)


La procédure pour tester H0: fa= faconsiste à calculer la valeur observée (z
l’équation 10.49 et à rejeter l’hypothèse nulle si
2()l > Z<x/2- (10.50)

La procédure pour les tests unilatéraux


' ‘ • I

Les hypothèses alternatives unilatérales utilisent la même statistique Z0. Pour tester l’hypothèse
alternative unilatérale à droite (H fa), on calcule la valeur observée Zqselon l’équation 10.49
et on rejette H0: fa = fa si
Zq>za.(10.51)
Pour tester l’hypothèse alternative unilatérale à gauche (H, : fa < fa), on calcule la valeur
observée Zqselon l’équation 10.49 et on rejette H0: fa = fa si
Zq Zg- (10.52)
Les tests d'hypothèses 309

Exemple 10.16
La directrice d’une entreprise de mise en boîte de jus d’orange désire comparer la performance de
deux chaînes de mise en boîte de son usine. Comme la chaîne 1 est relativement récente, elle pense
qu’elle produit en moyenne un plus grand nombre de caisses par jour que la chaîne 2, plus ancienne.
On considère que la loi normale est un bon modèle pour cette variable. Dix jours de production
sont sélectionnés au hasard pour chaque chaîne. Selon ces données, J, = 824,9 caisses par jour et
x 2 —818,6 caisses par jour. On sait par expérience d’exploitation de ce type d’équipement que a: = 40
et que a \ = 50.
1. Hypothèses et seuil
On désire tester

H,: A >/^-
On utilisera a = 0,05.
2. Règle de rejet de H0
On rejettera H0 si z0 1,645.
3. Calcul de la statistique observée
La valeur observée de la statistique du test est
824,9-818,6
140 50
V10 + 10

4. Décision
Puisque z0 > z005, on rejette H0.
5. Conclusion
Le nombre moyen de caisses que produit la nouvelle chaîne par jour est significativement supérieur au
nombre moyen de caisses que produit la chaîne plus ancienne, au seuil de 5
À titre informatif, la valeur Passociée à ce test est P(Z0>2,10) = 0,0179. On aurait don
décision si on avait choisi le seuil a = 0,01.

Le calcul du risque de deuxième espèce


et le choix de la taille de l'échantillon
Les courbes caractéristiques des graphiques Via, VIb, Vie et VId de l’annexe permettent
d’évaluer la probabilité de l’erreur de deuxième espèce pour les hypothèses alternatives unila­
térales et bilatérale. Ces courbes permettent aussi de déterminer la taille de l’échantillon. Elles
sont fournies pour a - 0,05 et a = 0,01. Dans le cas de l’hypothèse alternative bilatérale de
l’équation 10.48, le facteur d’échelle des abscisses des courbes caractéristiques des graphi­
ques V ia et VIb est

(10.53)

et il faut choisir des tailles d’échantillons égales, c’est-à-dire n - n ]


310 CHAPITRE 10

VId. Le
facteur d’échelle des abscisses pour l’hypothèse alternative unilatérale à droite, H : //,i >M2

d Ml -1*2 (10.54)

Le facteur d’échelle des abscisses de l’hypothèse alternative unilatérale à gauche, H, : jix< est

d = -£ -■ & -. (10.55)
V<7|+<72
Dans certains problèmes, le coût de la collecte de données diffère fortement d’une popula­
tion à l’autre, ou la variance d’une population est nettement supérieure à celle de l’autre. Dans
ces cas, on utilise souvent des tailles d’échantillons inégales. Si ^ et que leurs valeurs
sont fixées à l’avance, on consulte les courbes caractéristiques avec une valeur équivalente de
n calculée comme suit :

n = —=gV t g j — . (10.56)
<7 x/ n x

Exemple 10.17
Considérons les chaînes de mise en boîte de jus d’orange de l’exemple 10.16. Si la véritable différence
des productions moyennes de mise en boîte est de 10 caisses par jour, trouvons les tailles des échan­
tillons nécessaires pour détecter cette différence avec une probabilité de 0,90. La valeur appropriée
du facteur d’échelle est
d _ P-X-P-2 _ 10

et puisque a = 0,05, on tire du graphique Vie que n = nx= n2= 8.


Le calcul exact de n ou de /?basé sur la loi normale est tout à fait réalisable dans ce cas également, mais
il est beaucoup plus fastidieux que pour le test à un échantillon.

On peut trouver des formules pour la taille de l’échantillon requise afin d’obtenir une valeur
spécifiée de p étant donné //, - et a .Ces formules sont des suppléments utiles aux
téristiques. Pour l’hypothèse alternative bilatérale, la taille d’échantillon nx- n 2- n est
+ Z/3)Vl2+0~22)
(10.57)
)2

Cette approximation est valide lorsque & y-za,2 ~(Mi - + j est petit com para­
tivement à p.
Pour une hypothèse alternative unilatérale, on a , où

(10.58)
Les tests d'hypothèses 311

La détermination des équations 10.57 et 10.58 est semblable au cas présenté à la sec­
tion 10.2, où l’on avait un seul échantillon.

Exemple 10.18
Pour illustrer l’utilisation de ces équations, considérons la situation de l’exemple 10.17. On a une
hypothèse alternative unilatérale avec a = 0,05, /i, — = 10, o\ - 40, = 50 et = 0,10. Donc,
za = z0,05 = 1.645, Zp=z0,io= 1*28 et l’équation 10.58 donne la taille requise de l’échantillon

conformément au résultat de l’exemple 10.17.

10.3.2 Les tests sur les moyennes de deux


distributions normales de variances
inconnues mais égaies
Considérons maintenant des tests d’hypothèses sur l’égalité des moyennes /i, et jj^ de deux
distributions normales de variances et a \ inconnues. On utilisera un test t pour tester ces
hypothèses. Comme on l’a indiqué à la sous-section 10.2.2, on doit supposer la normalité pour
établir la procédure du test, mais des écarts modérés à la normalité ne modifient pas défa­
vorablement la procédure. On doit traiter deux cas différents. Dans le premier, on suppose
que les variances des deux distributions normales sont inconnues mais égales ; c’est-à-dire que
<72 = g \ —G1. Dans le deuxième, qui fera l’objet de la section suivante, on suppose que o \ et o \
sont inconnues, mais pas nécessairement égales.

La procédure pour le test bilatéral


Soit X x et X2 deux variables aléatoires représentant deux populations normales indépendantes
de moyennes //, et fi^ (inconnues) et de variance ex2 (inconnue). On désire tester

Ho:A=/*2>
H (10.59)
Supposons que Xn, X12, ..., Xlni est un échantillon aléatoire de nx observations de X, et que
X2„ X22, ..., X2 est un échantillon aléatoire de n2 observations de X2. Soit X,, X2, S2 et S2
les moyennes et les variances respectives des échantillons. Comme S? et S2 estiment tous
deux la variance commune cr2, on peut les combiner pour obtenir une seule estimation,
soit

. 2 (n, - 1)S,2 + (n2 1)S*


-

(10.60)
p n j+ /i2- 2
CHAPITRE 10

On a déjà abordé cet estimateur combiné à la sous-section 9.3.2. Pour tester H0 : fix= de
l’équation 10.59, on calcule la statistique du test

(10.61)

Si H0: fL\ - fa est vraie, T0 obéit à la loi tn1+nsL_2

Critère de rejet de H0: =//2 (test bilatéral, variances inconnues


mais égales)
Si
( 10.62 )
on rejette H0: /u]= fi2au profit de l'hypothèse alternative bilatérale.

La procédure pour les tests unilatéraux


Les hypothèses alternatives unilatérales se traitent à partir de la même statistique T0. Pour
tester l’hypothèse alternative unilatérale à droite (Hj : fix > fi^), on calcule la valeur observée
t0 de l’équation 10.61 et on rejette H0: fix = si

(10.63)

Pour l’hypothèse alternative unilatérale à gauche (H! : fix < fl2), on calcule la valeur observée
î0 et on rejette H0: fix = fi^ si

(10.64)

Le test t sur deux échantillons présenté dans cette section est souvent appelé « test t combiné »
parce que l’on combine les variances des échantillons pour estimer la variance commune. Il est
aussi appelé « test t pour échantillons indépendants » parce qu’on suppose que les deux popula­
tions normales sont indépendantes.

Deux catalyseurs sont analysés pour savoir comment ils modifient le rendement moyen d’un procédé
chimique. On utilise actuellement le catalyseur 1, mais le catalyseur 2 étant meilleur marché, il sera
adopté s’il ne change pas le rendement moyen du procédé. Le rendement est considéré comme une
variable aléatoire normale.
1. Hypothèses et seuil
On désire tester les hypothèses

en utilisant un seuil de 5 % et 8 observations par catalyseur.


2. Règle de rejet de H0
On rejettera H0 si |f0| > tom5.14= 2,145. ►
Les tests d'hypothèses 313

3. Calcul de la statistique observée


Les données de l’usine pilote donnent n, = 8, x i= 91,73, f = 3,89, = 8,
l’équation 10.60,

2 foi -!)■??+(n2- 1)*2 (7)3,89+ (7)4,02


s 3,96.
n\ +n2~2 8+ 8 - 2

La statistique du test vaut

4. Décision
Donc, on ne peut pas rejeter H0: fa = fa,car |t0| est inférieur à 2,145.
5. Conclusion
Autrement dit, on n’a pas de preuve forte permettant de conclure que le catalyseur 2 donnerait un
rendement moyen différent de celui du catalyseur 1 au seuil de 5 %. La figure 10.11 illustre ce résultat.
À titre indicatif, la valeur P de ce test est calculée comme suit :
Valeur P = 2 x P(T0< -2,03) = 2 x 0,031 = 0,062.

valeur
observée t0

La zone de rejet de H0et la valeur observée f0

Le calcul du risque de deuxième espèce


et le choix de la taille de l'échantillon
Les courbes caractéristiques des graphiques Vie, Vif, VIg et Vlh de l’annexe permettent d’éva­
luer le risque de deuxième espèce lorsque o f = c 2.
314 CHAPITRE 10

Pour l’hypothèse alternative bilatérale de l’équation 10.59, lorsque et nl = n 2= n,


on utilise les graphiques Vie et V if et on prend

d J j L z l i z l . (10.65)
2 (7

On doit utiliser ces courbes en considérant la taille d’échantillon = - 1. Pour l’hypo­


thèse alternative unilatérale à droite, H0: > p 2, on utilise les graphiques VIg et V lh et on
définit

y ( 10.66 )

tandis que pour l’hypothèse alternative unilatérale à gauche, H0 : ju. < p , on utilise

d = B iz J L . (10.67)
2G
On remarque que le paramètre d est une fonction de g, qui est inconnu. Comme pour le test t
avec un seul échantillon ( voirla sous-section 10.2.2), on peut devoir utilis
tion grossière initiale de g o u utiliser une estimation subjective. D’autre part, on peut défi­
nir les différences de moyennes qu’on désire détecter par rapport à G, c’est-à-dire en nombre
d’écarts-types.

Exemple 10.20
Considérons l’expérience des catalyseurs de l’exemple 10.19. Si le catalyseur 2 donne un rendement dif­
férent de 3,0 % du rendement du catalyseur 1, on veut rejeter l’hypothèse nulle avec une probabilité d’au
moins 0,85. Quelle est la taille requise de l’échantillon ? En utilisant sp= 1,99 comme estimation gros­
sière de l’écart-type commun a,onarf = \p{- p^!2c= 3,00/(2)(1,9
de l’annexe et avec d = 0,75 et p - 0,15, on trouve n = 20, environ. Donc, puisque n = 2n - 1,
n + 1 20 + 1
n = ------= ------- 10,5 « 11
2 2
et on utilise les tailles d’échantillon n{ = n2= n = 11.

10.3.3 Les tests sur les moyennes de deux


distributions normales de variances
inconnues mais inégales
Dans certaines situations, on ne peut pas raisonnablement supposer que les variances inconnues
G 2 et G 2 sont égales. Il n’y a alors pas de statistique T exacte pour tester H0: Toutefois,
la statistique

(10.68)
Les tests d'hypothèses 315

est distribuée approximativement selon une loi de Student avec un nombre de degrés de liberté
donné par

(10.69)

2
si l’hypothèse nulle H0: /z, = /^ est vraie. Donc, si g ] * cri, on teste l’égalité des moyennes de
la même façon qu’au premier cas, mais T*0 sert de statistique et n, + 2 est remplacé par
v pour déterminer le nombre de degrés de liberté de la loi t. Ce problème général est souvent
appelé «problème de Behrens-Fisher».

Exemple 10.21
Un fabricant d’écrans cathodiques teste deux conceptions de microcircuits pour déterminer s’ils produi­
sent des courants équivalents. Le bureau d’ingénierie de mise au point a obtenu les données suivantes.
Conception 1 n, = 15 x l = 24,2 s? 10
Conception 2 «2= 10 x2= 23,9 *22 20
1. Hypothèses et seuil
On désire tester
H0:/A=^2>

On choisit d’utiliser un seuil a = 0,10.


2. Règle de rejet de H0
On suppose que les populations sont normales, mais on ne veut pas supposer que les variances incon
2
nues g \ et a \ sont égales. Selon l’équation 10.69, le nombre de degrés de liberté de t\est
V 2 \ 2
IL + S2 10 20
Vn i n2 J 15 + 10
V
2 2
2 2 = 16
(sf/n})2
1 1 +. (sî/n7)
/

2
\

2 (10/15) ( 20/ 10)


2 2

+
n, +1 W9 + 1 16 11

On rejettera donc H0 si \t*0| > t005; 16= 1,746.


3. Calcul de la statistique observée
La valeur observée de la statistique du test est
24,2-23,9
llO 20
V15+ 10
4. Décision
Comme |f*0| < t005.16, on ne peut pas rejeter H0: //, =
5. Conclusion
Les données n’apportent pas de preuves suffisantes que le courant moyen diffère de façon significative
d’une conception à l’autre, au seuil de 10 %.
316 CHAPITRE 10

Le calcul du risque de deuxième espèce


et le choix de la taille de l'échantillon
Malheureusement, lorsque a 2 t- < j \, la distribution de T*0 est inconnue si l’hypothèse nulle est
fausse, et il n’existe pas de courbes caractéristiques dans ce cas.

10.3.4 Les tests t appariés


Un cas particulier de test t sur deux échantillons apparaît lorsque les observatio
populations en jeu sont collectées par paires. Chaque paire d’observations, (XAj, est obtenue
dans des conditions homogènes, mais ces conditions peuvent changer d’une paire à l’autre.
Supposons, par exemple, qu’on désire comparer deux types de billes pour duromètre, un appa­
reil qui enfonce une bille dans une éprouvette de métal. La mesure de la profondeur de la cavité
laissée par la bille permet de déterminer la dureté de l’éprouvette. Si on utilise deux échantillons
î métal pour tester la dureté (un échantil
métal pourraient ne pas être homogènes
dureté
il sera difficile de déterminer si elles sont dues au type de bille ou aux différences de dureté entre les
éprouvettes.
La bonne procédure expérimentale consiste à collecter les données par paires ; autrement
dit, on doit mesurer deux duretés sur chaque éprouvette, une avec chaque bille. La procédure de
test consiste alors à analyser des différences entre les duretés mesurées sur chaque éprouvette.
Si les billes ne sont pas différentes, la moyenne des différences est alors nulle. Cette procédure
de test est appelée « test t apparié ». Elle est équivalente au test t sur un échantillon, une fois
que les différences sont calculées.

La procédure pour le test bilatéral


Soit (Xu, X 2l), (X]2, X22), ..., (X ln, X2n) un ensemble de n observations appariées. On sup­
pose que
X yj ~ cr?) et X2j~ Nifit, 1 ,2 ,...,
Les différences entre chaque paire d’observations sont

Les Dj sont donc normalement distribuées avec une moyenne


juD= E(Dj) = E (X \j-
de sorte qu’on peut tester les hypothèses sur l’égalité de //, et en effectuant un test t sur juD.
Plus précisément, tester
H0: A = fh ,
H] • fJ-\ ^ ’
équivaut à tester
Ho • H-d —0,
H, : fiD*0.
La statistique du test appropriée pour l’équation 10.70 est

(10.71)
Les tests d'hypothèses 317

(10.72)

(10.73)

sont la moyenne et la variance de l’échantillon des différences. Si //, = fir alors T - / ,

Critère de rejet de H0: fa = fa(test bilatéral, échantillons app


On rejette H0: jÀ0 —0 (ce qui implique que fa * fa) si |/0| > tal2.n_

Les hypothèses alternatives unilatérales se traitent à partir de la même statistique TQ.

Exemple 10.22
Un article du Journal ofStrain Analysis (vol. 18, n° 2, 1983, p. 111-117) compare plusieurs méthodes
de prédiction de la résistance au cisaillement de poutres en acier. Le tableau 10.2 contient les don­
nées de deux de ces méthodes, les procédures de Karlsruhe et Lehigh, appliquées à neuf poutres
spécifiques. Déterminons s’il existe une différence (en moyenne) entre ces deux méthodes, au seuil
de 10%.
S* ? « N M

_ 1_ I _ —
~ ^ m\ ..
ictions de la résistance au cisaillement de neuf poutres en acier
,

r
a
? » ? . / ,r - * * . v
^ ^ i • -
v

prédite/charge observée)
Poutre Méthode de Karlsruhe Méthode de Lehigh Différence d
Û86 1,061 0,125
1,151 0,992 0,159
1,322 1,063 0,259
1,339 1,062 0,277
1,200 1,065 0,135
1,402 1,178 0,224
1,365 1,037 0,328
1,537 1,086 0,451
1,559 1,052 0,507

1. Hypothèses et seuil
On désire tester
H0 • f^D
H, :pD*0,
où fJD= HK- i*v On a a= 0,10.
2. Règle de rejet de H0
On rejettera H0si \t0\> t005. 8 = 1,86.
CHAPITRE 10

3. Calcul de la statistique observée _


La moyenne et l’écart-type de l’échantillon des différences d} sont d = 0,2739 et 0,1351, de sorte
que la valeur observée de la statistique du test vaut
_d_= 0,2739
0 sjyfn 0,1351/79 ’
4. Décision
Puisque la valeur observée est supérieure à 1,86, on rejette HQ.
5. Conclusion
On conclut que ces deux méthodes de prédiction de la résistance donnent des résultats significative­
ment différents. Plus précisément, la méthode de Karlsruhe donne, en moyenne, des prédictions plus
grandes que la méthode de Lehigh.

La comparaison entre l'appariement et le non-appariement


Lorsque l’analyste procède à une expérience comparative des moyennes, il peut choisir entre
l’analyse appariée et le test t sur deux échantillons indépendants (test non apparié). Si n mesures
sont effectuées sur chaque population, la statistique TQde deux échantillons indépendants issus
de populations à variance égale est

qui est comparée à ta/2.2n- r La statistique du test apparié est

qui est comparée à ta,2 t. Comme


D X 2’
les numérateurs des deux statistiques sont identiques. Cependant, le dénominateur du test t sur
deux échantillons repose sur l’hypothèse que X { et X2 sont indépendantes, c’est-à-dire que la
variance de la différence vaut
V(Xl - X 2) = V(X{)+ V (X 2) Par indépendance

2(7 2
n
Par contre, dans de nombreuses expériences appariées, il existe une corrélation positive entre
X, et X2. Autrement dit,
V(D) = V(X1- X 2)
= V(Xl ) + V(X2) Cov(X, , )


2<r2(l - p )
_ _ _

n
en supposant que les deux populations Xl etX2ont des variances identiques. De plus, S2Dln estim e
la variance de D. Chaque fois que la corrélation entre les paires est positive, le dénominateur du
test t apparié est inférieur au dénominateur du test t sur deux échantillons indépendants. Donc,
Les tests d'hypothèses 319

le test t sur deux échantillons indépendants diminue grandement la signification des données
s’il est appliqué à tort aux échantillons appariés.
Bien que l’appariement mène souvent à une plus petite valeur de la variance de X, - X2, il
présente un inconvénient. En effet, le test tapparié entraîne une
en comparaison avec le test t sur deux échantillons. On sait qu’en règle générale l’augmentation
du nombre de degrés de liberté augmente la puissance des tests.
Alors, comment peut-on décider de la conduite de l’expérience - doit-on apparier les obser­
vations ou non ? Il est impossible de répondre d’une façon générale. Signalons toutefois que,
selon la discussion ci-dessus,
si les unités expérimentales sont relativement homogènes (petit G) et si la corréla-
mesures
l’appariement est contrebalancé par la perte de degrés de liberté et il faut donc
échantillonner indépendamment ;
si les unités expérimentales sont relativement hétérogènes (grand cr) et s'il existe une
grande corrélation positive entre les deux mesures d’une paire, alors il faut apparier.
On doit appliquer ces règles avec discernement parce que, habituellement, on ne connaît
pas précisément G et p. De plus, si le nombre de degrés de liberté est grand (40 ou 50, par
exemple), alors une perte de n- 1 degrés de liberté par appariement peut
Cependant, si le nombre de degrés de liberté est petit (10 ou 20, par exemple), alors la perte
de la moitié d’entre eux est potentiellement grave si la précision accrue par l’appariement ne la
compense pas.

10.3.5 Les tests sur l'égalité de deux variances


Présentons maintenant les tests de comparaison de deux variances. Le test bilatéral sur l’égalité
de deux variances sert souvent de prélude au choix du test t de comparaison des moyennes,
puisqu’il faut choisir entre des variances égales ou inégales pour identifier la bonne statistique
de test et les bons degrés de liberté.

La procédure pour le test bilatéral


Soit les deux populations indépendantes enjeu X, ~ N{/iv g \) et X2 ~ A(/fj, crj), dont /i,, g 2x,
H2 et <t 2 sont inconnues. Testons l’hypothèse de l’égalité des deux variances, soit H0: G2 = o \.
Supposons qu’on dispose de deux échantillons aléatoires indépendants: l’un de taille n, de
la population 1 et l’autre de taille n2 de la population 2, et soit et Sj les variances de ces
échantillons. Pour tester l’hypothèse alternative bilatérale

(10.74)
on utilise le fait que la statistique

(10.75)

obéit à une loi F de Fisher, avec n, - 1 et n2- 1 degrés de liberté si l’hypothèse nulle H0: G2 - g \
est vraie.
CHAPITRE 10

Critère de rejet de H0: <rf = o\ (test bilatéral)


On rejette H0 si
/o> ^'a/2 ,nl -l , / i 2 - 1 (10.76a)
ou si
a / 2 ; h, (10.76b)
où Fal2. i et F,_ a/2. s o n t les quantiles d'ordre 1 - a /2 et a /2 de la loi F avec /î , - 1
et n2 - 1 degrés de liberté.

La table V de l’annexe ne donne que les quantiles de l’aile supérieure de la loi F, de sorte
que pour trouver Fx_ al2._ h lf on doit utiliser l’égalité
i
al 2; n j - 1, «2-1 (10.77)
F.a /2 ; «2 "“1»«i —1

La procédure pour les tests unilatéraux


On peut utiliser la même statistique pour tester les hypothèses alternatives unilatérales. Comme
la notation X x et X2 est arbitraire, on suppose que la population X l a la plus grande variance.
Donc, les hypothèses du test unilatéral sont
H0: o \ = o \,
H ,: g \> g \. (10.78)
On rejette H0: crf = o \ si

fo>F,a; «, - 1, «2 ~ 1* (10.79)

Exemple 10.23
On enlève du cuivre des cartes de circuits imprimés par décapage chimique, et X, et X représentent
les résultats du décapage pour deux concentrations différentes.
1. Hypothèses et seuil
On désire tester
H0: g \=

H,: cr?* g \.

On utilisera un seuil de 0,05 et 8 observations pour chaque concentration.


2. Règle de rejet de H0
On rejettera l’égalité des variances si
/o >F, 0 , 0 2 5 ; 7 , 7

ou si
(F, -1 (4,99) -î
fo < Fq,9 7 5 ; 7 , 7 0 , 0 2 5 : 7

3. Calcul de la statistique observée


Deux échantillons de tailles nl =n2= S donnent s? = 3,89 et s2 = 4,02, et
Les tests d'hypothèses

4. Décision
Puisque la valeur observée (0,97) tombe entre les deux valeurs critiques, on ne peut pas rejeter
Ho : <T? = cf\.
5. Conclusion
Il n’y a pas de preuve forte que la concentration modifie la variance des résultats au seuil de 5 %.

Le choix de l a taille de l'échantillon


Les graphiques Vio, VIp, Vlq et VIr de l’annexe donnent les courbes caractéristiques du test
pour a = 0,05 et a = 0,01, si on suppose que n, = = n. Les graphiques Vio et VIp serve
pour l’hypothèse alternative bilatérale de l’équation 10.74. Ils représentent /? en fonction du
paramètre

(10.80)

pour diverses valeurs de nx=n 2 = n.Les graphiques Vlq et VIr serven


native unilatérale de l’équation 10.78.

Exemple 10.24
Soit le problème d’analyse des résultats du traitement chimique de l’exemple 10.23. Supposons qu’une
des concentrations a modifié la variance des résultats de manière telle qu’une des variances est quatre
fois plus grande que l’autre. Supposons aussi qu’on désire détecter ce qui précède avec une probabilité
d’au moins 0,80. Quelle taille d’échantillon doit-on utiliser? Si une des variances vaut quatre fois
l’autre, alors

A = — = 2.
cr2
En utilisant le graphique Vio avec /?= 0,20 et X=2, on trouve qu’il fa
d’environ n{ = n2= 20.

La procédure de test pour des échantillons de grande taille


Lorsque les tailles nl et n2 des échantillons sont toutes deux grandes, il n’est pas nécessaire de
supposer la normalité pour procéder au test. Le test repose sur le résultat que les écarts-types
iSj et S2 des échantillons ont des distributions approximativement normales avec des moyennes
<7! et cr2, respectivement, et des variances <7?/2n, et <j\l2n2, respectivement. Pour tester

on utilise la statistique

où Sp est l’estimateur combiné de l’écart-type commun <7. Cette statistique a une distribution
approximativement normale centrée réduite lorsque g \ - a\.
Les régions de rejet ont la même forme que dans les autres tests basés sur la loi normale.
CHAPITRE 10

10.3.6 Les tests sur deux proportions


On peut étendre les tests de la sous-section 10.2.4 au cas où il y a deux paramètres binomiaux
en jeu : p, et p 2, soit la proportion de succès dans la population l et dans la population 2.

La procédure pour le test bilatéral


On désire tester l’égalité des proportions, autrement dit on veut tester
H0:p, = p2,
H ,: p i ^ p 2- (10.83)
Supposons que deux échantillons aléatoires indépendants de tailles n, et (supérieures à 30)
ont été tirés de deux populations et que X, et X2 représentent le nombre d’observations d’inté­
rêt (le nombre de succès) dans les échantillons 1 et 2, respectivement. Supposons de plus que
l’approximation normale de la binomiale s’applique à chaque population, de sorte que les
proportions échantillonnâtes p, = Xxlnxet p 2 = X2/n2 obéissent appro
normales :
A \

N P i(l-P i) et N P 2 Q --P 2 )
P\ P i Pi Pi
nî J n 2 J

Donc, si l’hypothèse nulle H0: p, = p 2 est vraie, en utilisant le fait que p, = p 2= p , la variable
aléatoire p x —p 2 obéit approximativement à une loi normale :
(
"1 il)
Ü?5
^3)
1

0, p ( l - p ) + —
to

l n i n 2 \J

Un estimateur du paramètre commun p (qu’on pourrait appeler la « proportion de succès glo­


bale ») est
/V X x+ X 2
nx +n2

La statistique du test pour H0: p, = p 2, qui suit une loi N(0, 1) lorsque H0 est vraie, est alors
P1 - P 2 (10.84)

Critère de rejet de H0: p, = p2(test bilatéral)


Si
W > Z«/2’ (10.85)
alors l’hypothèse nulle est rejetée au profit de H, : px pr
Les tests d'hypothèses

Exemple 10.25
L’armée américaine envisage d’utiliser deux types différents de calculateurs de tir pour ses batteries
de 105 mm à six coups. Les deux systèmes informatiques sont soumis à un essai de vérification durant
lequel le nombre total de tirs dans la cible est compté. Le système 1 donne 250 tirs réussis sur 300 car­
touches, le système 2 donne 178 tirs réussis sur 260 cartouches. Les deux systèmes informatiques
sont-ils statistiquement différents, au seuil de 5 % ?
1. Hypothèses et seuil
Pour répondre à cette question, on teste
Ho ■Pl =P
Hi:pl * p 2
et on utilise un seuil de 5 %.
2. Règle de rejet de H0
L’hypothèse nulle sera rejetée si la valeur observée de z0, en valeur absolue, excède -,0iP< = 1,96.
3. Calcul de la statistique observée
On remarque que p, = 250/300 = 0,8333, p2= 178/260 = 0,6846 et
„ xx+x2250 + 178 nn£AO
p = —---- - = ----------- = 0,7643.
n, +n2300 + 260

La valeur observée de la statistique du test vaut


Pi - 0,8333-0,6846
zo 4,13.
1 i 1 r i i l
P( 1- P) +— ,10,7643(0,2357)
y +
L». n 2 J
L300 260J

4. Décision
Puisque z0> z0025= 1,96, on rejette H0.
5. Conclusion
Les deux systèmes informatiques diffèrent de façon significative au seuil de 5 %. La proportion de tirs
réussis est statistiquement plus élevée avec le système 1.

Le calcul du risque de deuxième espèce


et le choix de la taille de l'échantillon
Le calcul du risque p du test de comparaison de deux proportions est un peu plus compliqué
que dans le cas d’un seul échantillon. On peut tout de même développer une formule analytique
pour p. En effet, le dénominateur de Z0 est un estimateur de l’erreur-type de p, - p 2 sous
l’hypothèse que p x= p2 —P- Lorsque H0: p x= p 2 est fausse, l’erreur-type de p, - p2 est

( 10.86)
CHAPITRE 10

Si l’hypothèse alternative est bilatérale, le risque p est d’environ

(10.87)

- _ n\P \+ n2p2
n\ + n2
- _ nl( l - p {) + n2( \ - p 7)
n\+ n 2

et (Ti _p2est donné par l’équation 10.86.


Pour une paire spécifiée de valeurs p x et , on peut trouver la taille des échantillons
n\ ~ n2 ~ n requise pour obtenir le test de niveau a dont le risque de deuxième espèce est la
valeur spécifiée p. Pour l’hypothèse alternative bilatérale, la taille d’échantillon commune est
d ’approx imativement
2
^a/2"\/(Pl P2^12
( 10.88 )
i P \ - p 2Ÿ

où qx= 1 - p xet q2 —1 - p 2. Pour les hypothèses alternatives unilatérales, on remplace za/2 dans
l’équation 10.88 par za.

10-4 Le test d'ajustement du khi-carré


Les procédures de tests d’hypothèses discutées dans les sections précédentes conviennent pour les
problèmes dont on connaît la forme de la fonction de densité de la variable aléatoire, et dont
les hypothèses portent sur les paramètres de la distribution. Par contre, il peut arriver qu’on ne
connaisse pas la distribution de probabilité de la variable aléatoire étudiée, disons X , et qu’on
désire tester l’hypothèse que X obéit à une loi de probabilité particulière. On veut, par exemple,
tester l’hypothèse que X obéit à la loi normale. Un graphique quantile-quantile ( le
chapitre 7) peut nous donner une première idée de la réponse à cette question. Dans cette
section, on décrira une procédure formelle de test d’ajustement basée sur la loi du khi-carré.

La procédure du test
La procédure de test requiert un échantillon aléatoire de taille n de la variable aléatoire
X, dont la fonction de densité de probabilité est inconnue. Ces n observations sont d isp o ­
sées dans un tableau de fréquences ayant k classes. Soit O. la fréquence observée dans la
î-ième classe. À l’aide de la distribution hypothétique de probabilité, on calcule la fréquence
espérée dans la i-ième classe, notée E.. (Notons que les fréquences espérées ne sont pas
nécessairement des nombres entiers, et qu’elles n’ont pas à être arrondies puisqu’il s’agit
d’espérances.)
Les tests d'hypothèses

Pour tester les hypothèses


H0: La loi proposée est un bon modèle pour cette variable ;
Hj : La loi proposée n’est pas un bon modèle pour cette variable,
la statistique du test est

Cette statistique peut être considérée comme une « distance » entre le modèle proposé et les
quantités observées. On peut démontrer que UQobéit approximativement à la loi du khi-carré
avec k - p - 1 degrés de liberté, où p représente le nombre de paramètres delad^-nbi.-Ln. hypo­
thétique estimés à partir de l’échantillon. Cette approximation s’améliore Un“siii«t* fj ruante.

Critère de rejet de H0 du test d'ajustement du khi-carré


On rejette l’hypothèse que X obéit à la distribution hypothétique si > %2
: -• - « * *
Ct. k —p —1
■ ^
V -

Il y a un point à remarquer dans l’application de cette procédure de test concernant


l’ordre de grandeur des fréquences espérées. Puisque les termes de la somme sont divisés
par Ep les classes ayant de petites fréquences espérées auront une grande contribution à la
statistique UQ. Si les fréquences espérées sont trop petites, UQne reflétera alors plus l’éloi­
gnement global des fréquences observées par rapport aux fréquences espérées de toutes les
classes, mais principalement celui de la classe ayant la plus petite fréquence espérée. Il n’y
a pas unanimité sur la valeur minimale des fréquences espérées, mais on utilise beaucoup
les valeurs 4 et 5. Une classe ayant une fréquence espérée trop petite peut être combinée
avec une classe adjacente. Les fréquences correspondantes seront alors combinées, et k sera
réduit de 1. Il n’est pas exigé que les différentes classes aient des intervalles égaux.
Voici trois exemples de la procédure de test.

Exemple 10.26
Une distribution complètement spécifiée
Un informaticien a développé un algorithme pour générer des nombres entiers pseudo-aléatoires sur
l’intervalle 0-9. Il code l’algorithme et génère 1000 nombres pseudo-aléatoires. Les données sur la
fréquence d’apparition de chacun des chiffres de 0 à 9 sont indiquées dans le tableau 10.3. Le généra­
teur de nombres aléatoires fonctionne-t-il correctement au seuil de 5 %?
j fl*. ■» i"* ~» ■, % -v-' k*. f J f
, J ? T#**.
> f ^ , >

Lüi flfJ
*v**-V « .v > $ r :
¥ flijB r é _ ^ i y x *
1 # t _. ■ , —f i —— y w ■« i ■s • T .-v .* r < « » ?• . ■ .
r I C n r x * • . « ' : r ■» » • .* •* _ •-> * ' ‘ n W • » « J - ■ . . ' - ■* ' a • J ' - .# J - » • '
r V ■ ▼ X Z ^ | ™ t 1 W ¥ ' V ! ^ * ’ R » 1 Q J | 5
• Z 1/ \ i • . ' _ ^ *, V ■ / ■¥ r s . - -
’ 1 j v * ' - ' -f ‘ ’ >y ' "

_ _____ - ■ — ■ -
Chiffre généré
- -_________________________________________ ______________________________________________________________________________________________________________________________________________
Total 1 \

0 i 2 3 4 5 6 7 8 — -
9 ! n J ----------------- ■ ■

Fréquence observée, 0, 94 93 112 101 104 95 100 99 108 94 1000


Fréquence espérée, Et . . . .
100 100 100 100 100 100 100 100 100 100 1000
CHAPITRE 10

Si ce générateur de nombres aléatoires fonctionne correctement, alors la fréquence d’apparition des


valeurs 0-9 doit suivre la loi uniforme discrète, ce qui implique que chaque entier doit apparaître envi­
ron 100 fois. Autrement dit, les fréquences espérées sont £, = 100, pour i = 0, 1, ..., 9. Comme ces fré­
quences espérées peuvent être déterminées sans aucune estimation de paramètre à partir des données de
l’échantillon, le test d’ajustement du khi-carré résultant aura k - p - l - 10 - 0 - 1 = 9 degrés de liberté.
1. Hypothèses et seuil
Les hypothèses du test sont :
H0: La loi uniforme discrète est un bon modèle pour cette variable ;
H, : La loi uniforme discrète n’est pas un bon modèle pour cette variable.
Le seuil a été fixé à a = 0,05.
2. Règle de rejet de H0
L’hypothèse d’une loi uniforme sera rejetée si u0 > Xo.05;9 ~
3. Calcul de la statistique observée

Comme on rejette H0 pour des grandes valeurs de f/0, c’est-à-dire lorsque la «distance» est grande
entre le modèle et les observations, la valeur du test se calcule comme suit (à l’aide d’un ordinateur) :
(U,72)
P 3 = 0,93, oùU0~ x l
4. Décision
Puisque la valeur P est supérieure à a et que u0<%2
0,05 \ 9
= 16,92, on ne peut pas rejeter l’hypothèse que
les données viennent d’une distribution uniforme discrète.
5. Conclusion
Par conséquent, le générateur de nombres aléatoires semble fonctionner de façon satisfaisante au seuil
de 5 %.

Exemple 10.27
Une distribution discrète
On veut tester l’hypothèse selon laquelle le nombre de défauts sur des cartes de circuit imprimé obéit à
la loi de Poisson. On collecte un échantillon aléatoire de 60 cartes de circuit imprimé et on observe
le nombre de défauts. On obtient les données suivantes.

Nombre de défauts Fréquence observée


0 32
1 15
2 9
3 4
Les tests d'hypothèses

1. Hypothèses et seuil
Les hypothèses appropriées sont
H0: Le nombre de défauts suit une loi de Poisson ;
H, : Le nombre de défauts ne suit pas une loi de Poisson.
Fixons le seuil à 5 %.
2. Règle de rejet de H0
L’hypothèse d’une loi de Poisson sera rejetée comme modèle si
2
0,05 ; A: - p - l

3. Calcul de la statistique observée


La moyenne de la loi de Poisson est inconnue dans cet exemple et doit être estimée à partir des données
de l’échantillon. L’estimateur du nombre moyen de défauts par carte est la moyenne de {échantillon,
c’est-à-dire (32 • 0 + 15 • 1 + 9 • 2 + 4 • 3)/60 = 0,75. La fonction de masse de la loi de Poisson et
l’estimation du paramètre c = 0,75 nous permettent d’estimer les fréquences espérées £ = np . où est
la probabilité théorique et hypothétique associée à la z-ième classe et n, le nombre total d'observations.
Voici les fréquences espérées calculées.

Probabilité (selon une loi


Nombre de défauts de Poisson où 0,75) Fréquence espérée
A

Pi Ê, = npi
0 0,472 28,32
1 0,354 21,24
2 0,133 7,98
>3 0,041 2,46

Comme la fréquence espérée dans la dernière classe est inférieure à 3, on combine les deux dernières
classes.

Nombre de défauts Fréquence observée (0,-) Fréquence espérée (£’.)


0 32 28,32
1 15 21,24
»

>2 13 10,44

La valeur observée de la statistique du test (qui aura k - p - 1 = 3 - 1 - 1 = 1 degré de liberté) devient


2
(32-28,32)2 | (15-21,24) (13-10,44)2
U0 = 2,94.
28,32 21,24 10,44
4. Décision
Comme y 2 - 3,84, on ne peut pas rejeter l’hypothèse nulle.
* 0,05 ; 1
5. Conclusion
La distribution de l’apparition de défauts ne s’éloigne pas significativement d’une loi de Poisson au
seuil de 5 %.
CHAPITRE 10

Exemple 10.28
Une distribution continue
Un ingénieur de fabrication teste un bloc d’alimentation de poste de travail. Il désire déterminer si
la tension de sortie est convenablement décrite par une loi normale, au seuil de 10%. À partir d’un
échantillon aléatoire de n - 100 unités, il obtient les estimateurs de la moyenne x = 12,04 V et de
l’écart-type s = 0,08 V.
Il est courant, quand on établit des intervalles pour la distribution de fréquences utilisée dans le
test d’ajustement du khi-carré, de choisir des limites de classes de sorte que les fréquences espérées
E = np, soient égales pour toutes les classes. Donc, on choisit des limites de classes a0, ax, ak pour
les k classes de manière à ce que toutes les probabilités
f(x) dx , <X<a t) =
1
soient égales. Supposons qu’on désire k= 8 classes. Pour la loi normale centrée réduite, les intervalles qui
divisent l’étendue en huit segments équiprobables sont [0, 0,32), [0,32, 0,675), [0,675, 1,15), [1,15, <=o),
et leurs quatre équivalents négatifs. En notant a0, a{,..., ces born
on définit les nouvelles bornes des intervalles par la transformation + sat, = 0, 1, ..., 8. Par
exemple, la borne de droite du sixième intervalle est
a6 x + sa6= 12,04 + (0,08) (0,675) = 12,094.
i
intervalle, p, = ^ = 0,125, donc les fréquences espérées sont E{= npi = 100(0,125) = 12,5
Le tableau 10.4 donne les fréquences observées et espérées, et la figure 10.12 illustre leur distribution
< T A f ./ *
-v;
f /A
I p i l ü llip ii i
/ 1 * / • I *.—
gu mm
.W T - |ÿ>l A . ^ C M V A J A . A l

| Intervalle Fréquence observée 0, Fréquence espérée Et |


jc < 11,948 10 12,5
11,948 < jc < 11,986 14 12,5
11,986 < jc < 12,014 12 12,5
12,014 < jc < 12,040 13 12,5
12,040 < jc < 12,066 11 12,5
12,066 < jc < 12,094 12 12,5
12,094 < jc < 12,132 14 12,5
12,132 < jc 14 12,5
1 100 100,0 1


Les tests d'hypothèses

1. Hypothèses et seuil
H0: La loi normale est un bon modèle pour la tension de sortie ;
H, : La loi normale n’est pas un bon modèle pour la tension de sortie.
Le seuil a été fixé à a = 0,10. '
2. Règle de rejet de H0
Puisque les deux paramètres de la loi normale ont été estimés, on compare la valeur calculée u0 au
quantile d’une loi du khi-carré aveck - p - 1 = 8 —2 —1 = 5 degrés de liberté.
Le modèle normal sera rejeté si

3. Calcul de la statistique observée

(10-12,5)2 (14-12,5)2 (14-12,5)


-------------------- 1-------------------- h * **H--------------------
12,5 12,5 12,5
1,12
4. Décision
Puisque uQ< Zoio-s= 13,36, on ne rejette pas HQ.
5. Conclusion
Il n’y a aucune raison de croire que la tension de sortie n’est pas normalement distribuée.

10.5 Les tests de tableaux de contingence


Les tests d’hypothèses permettent également de vérifier, avec une certaine probabilité d’erreur,
bien sûr, s’il existe une interaction entre deux variables catégoriques, ou si plusieurs populations
présentent les mêmes proportions dans les diverses catégories d’une variable. Nous discutons
dans cette section du test d’indépendance de deux variables et du test d’homogénéité de plu­
sieurs populations.

10.5.1 Le test d'indépendance de deux


variables aléatoires catégoriques
On peut souvent classer les n éléments d’un échantillon suivant deux critères différents, c’est-
à-dire selon les valeurs de deux variables aléatoires discrètes ou qualitatives. Il est alors intéres­
sant de savoir si les deux variables sont statistiquement indépendantes. On peut, par exemple,
considérer la population des ingénieurs du pays et vouloir déterminer si le salaire de départ est
indépendant de la discipline étudiée. Supposons que la première variable (X,) possède r niveaux
et que la deuxième (X2) en a c. Appelons Oÿla fréquence ob
pour le niveau j de X2. En règle générale, les données apparaîtront comme dans le tableau 10.5
( voir à la page suivante). Un tel tableau est appelé «tableau de contingence» ou «tableau de
fréquences » (r lignes et c colonnes).
330 CHAPITRE 10

On désire tester l’hypothèse que les variables X, et X2 sont indépendantes :


H0: X, et X2 sont indépendantes ;
Hj : X, et X2 sont dépendantes.
Si l’on rejette cette hypothèse nulle, on conclut qu’il existe une certaine interaction entre les
deux critères de classement. Les procédures de test exactes sont difficiles à obtenir, mais on pré­
sente ici une statistique de test approximative qui est valide pour les grandes tailles d’échantillon.
Supposons que p i} est la probabilité qu’un élément choisi au hasard soit dans la (/-ième
cellule, c’est-à-dire que les variables prennent les valeurs X l = et X2 = Dans la mesure où
les deux classements sont indépendants, alors, p . w.v. <j
P{Xx i) P(X2 j), où w. = PCX, 0
est la probabilité qu’un élément choisi au hasard prenne la t-ième valeur de X, et v = P(X2
la probabilité qu’un élément choisi au hasard prenne la y-ième valeur de X2. Les estimateurs du
maximum de vraisemblance de l P(x,■1= i)7 et de v.j = P(X2 j) sont respectivement
M"

A
II

wi z

71y=l
/V C10.90)
v j ~=-n
n± O lr

Donc, si on suppose l’indépendance, l’estimateur du nombre espéré d’éléments dans chaque


classe est

= nW'Vj C10.91)

Ainsi, pour les grandes tailles n(ou plutôt pour des fréquences espérées p
la distribution approximative suivante sous H0:
r c
(10.92)
/=i j-i
Comme dans le cas du test d’ajustement du khi-carré, on peut interpréter la statistique UQ
comme une « distance » entre le modèle d’indépendance hypothétique et les fréquences obser­
vées. Si cette distance est trop grande, il faut rejeter le modèle.

Critère de rejet de l'indépendance de deux variables catégoriques


#

On rejette l'hypothèse d'indépendance si u() > % a


^

( r - l ) ( c - ,)■
y).
Les tests d'hypothèses

Exemple 10.29
Une entreprise doit choisir un régime de pension parmi trois. La direction désire savoir si la préférence
pour un régime est indépendante de la catégorie d’emploi au seuil de 5 %. Le tableau 10.6 donne les
opinions d’un échantillon aléatoire de 500 employés.

X, = Régime de pension
Xy = Catégorie d'emploi 1 ;
2 3 Tntal
1Uul 1
i _■ .. —
- »._.
1 : Cadres 160 140 40 340
2:Employés payés à l’heure 40 60 60 160
Total 200 200 100 500

1. Hypothèses et seuil
H0: Le régime de pension favori et la catégorie d’emploi sont indépendants;
Ht : Le régime de pension favori et la catégorie d’emploi sont liés.
2. Règle de rejet de H0
On rejettera H0 si uQ= . 2= 5,99.
3. Calcul de la statistique observée
On calcule d’abord les estimations des probabilités marginales :
P(Xr-
A

=VV =340/500== 0,68


A

P(Xr-- 2 )a = 160/500 ==0,32


/S

P(X1--= 1) =svi ==200/500 ==0,40


A

P(X2--=2)aSV2 ==200/500 ==0,40


A

P(X2==3) *! V = 100/500 ==0,20.


L’équation 10.91 indique comment estimer les fréquences espérées. Par exemple, l’estimation du nombre
espéré de cadres favorisant le plan 1 sous l’hypothèse d’indépendance est
Ên = nw
, v, = 500(0,68)(0,40) = 136.
Le tableau 10.7 donne les fréquences espérées.

L’équation 10.92 donne la formule pour la statistique du test. Sa valeur observée est donc
CHAPITRE 10

4. Décision
Puisque uQ> %l05,2= 5,99, on rejette l’hypothèse d’indépendance.
5. Conclusion
La préférence pour les plans de pension n’est pas indépendante de la catégorie d’emploi.

10.5.2 Le test d'homogénéité de r populations


Un tableau de contingence à double entrée peut être utilisé pour d’autres applications que pour
tester l’indépendance entre deux variables de classement. On rencontre couramment le cas de
r populations divisées chacune en ccatégories. On prend alors un échant
lation, et les dénombrements sont classés dans les c colonnes de la /-ième ligne. On désire tester
si les proportions dans les c catégories sont les mêmes pour toutes les populations. L’hypothèse
nulle de ce problème stipule que les populations sont homogènes par rapport aux catégories.
Lorsqu’il y a seulement deux catégories, soit succès et échec, défectueux et non défectueux,
etc., alors le test d’homogénéité est un test d’égalité de r paramètres binomiaux. Le calcul des
fréquences espérées, du nombre de degrés de liberté et de la statistique du khi-carré du test
d’homogénéité est identique à celui du test d’indépendance développé à la sous-section 10.5.1.

Résumé
a = P (Rejeter H01H0 est vraie) = P (erreur de première espèce) = Seuil du test
P = P(Ne pas rejeter H0IH, est vraie) = P(erreur de deuxième espèce)
1—p - P(Rejeter H0IHj est vraie) = Puissance du test
Seuilobservé (valeur P) : probabilité que la statistique du test prenne une valeur au moins aussi
extrême que celle observée, si H0 est vraie. (On rejette H0 si la valeur P est inférieure à a.)

- .« r — * - » *»■— * * V V —»

H0:A = Ao> 7 _ * -A o H,:A*Ao kl > Za/2 = lAi Aol/o-


d -

a 2connue 0 " ol4~n H, : A > Ao d = (Ai Ao)/ cj--

H, : A< Ao z0 < - z a rf=(Ao-AiVcr


H0: A = Ao» rp X ~ HO H,: A*Ao kl > ^cc/2: n - 1 4 = lAi Aol/cr
-

a 2inconnue °" S/sfc H| : A > Ao U) ^ ^a \ n - 1 ^ = (Ai Ao)/<7 -

H, : A< Ao ÎQ< - tcc\ n - ! 4 = (Ao~ Ai)/cr

„ * .-* 2 Hi Ai ^ A2
: kl Z<xl2 >
4 = lAi -Aal/V^ + CTj2
cr7 et c \ 1 2 2 J = (A, - H 2)/yJ<JÎ + <7\
H,: a, >Aa ^0 ^or
connues r + 1

Vn \ n 2 H, : Ai < A2 Z{) ^ ~~Za d = (n 2 - n t) / j o î +cr*

H0: Ai = Ai. r X>~*2 H| : Ai ^ A2 kl ^ ^ûf/2;«j +«2-2 d = \Mi


o }= a \= o 2 ° II 1 H,: A. >A2 ^0 ^ ^a: «| +«2~2 d = (//, - Ao)/2cr
inconnues H,: Ai <A2 ^0 ^ ^a\ «j +«2- 2 ^ = (A 2 -A i)/2 c r
Les tests d'hypothèses

H0:m Xt-Xi Hj : //, * fa M > tai 2; v


To
o \* o \ Hj •M\> A) ^ ?a: v
inconnues Hx: f i i <l h t0 < - t «; v

(sf /«, + jfj /n2)*


2
, (»,’ In, )
+ --------
n, +1
Ho•Pd= 0 D Hi• Hd^ 0 ko! > ta!2;n~I (/ ’ i.t/,,1/ <7
,8 v

T,o
où fa —fa —fa , sjyfn Hj • lljy^ 0 tn > t a\n - 1 t/ - ■
i/r,/
» «y (7
<7 ]et c 2 H| : < 0 a:«- ! à — ~£//; / (J
inconnues,
échantillons
appariés

H0: C H, : a 2 * a 2 “0 1 a,/CT0
0 ou

H,: cr2 «0 > * « • .» - 1 cr,/<70


H,: a 2 **0 I Ci/ C()

H0: c 2 F0 = Sf IS\ H, : c? * c? f o > F an-, nl * **n2 * C ,/C 2

U<Fl-a/2;fl| - l.nj- I
H, : c?> c? fo>Fa: n. - I. j u - 1 A= c ,/c .

H o •P = P0* cr/2
n grand ’O
H, : p>P 0 2o>2,
H :p<p0

Ho: P.= H, : p , * p 2 > Za/2


n, et n, grands o
f —-
l n H, : p, >p 2 2o>^a
+—
n2 )
H,:P, <P 2

H0 : La loi H.1: La loi 0 - p-1


- E, f
proposée est o proposée
/* 1
un bon modèle n’est pas un
bon modèle

H0 : X x et r c
H, : X, et X2 o (r-IXc-D
X 2 sont 0 ne sont pas
indépendantes 1*1>*I indépendantes
CHAPITRE 10

/ ■w .
distribution. Les cinq derniers essais de
Les données des exercices avec le symbole Q*J ce traitement ont donné les rendements
sont aussi disponibles en format électronique. suivants (en pourcentage) :
91,60 ; 88,75 ; 90,80 ; 89,85 ; 91,30.
10.1 La résistance moyenne à la rupture a) Y a-t-il une raison de croire que le
d’une fibre utilisée pour fabriquer du rendement moyen soit inférieur à 90 ,
tissu doit être d’au moins 160 lb/po2. au seuil de 5 % ?
Selon l’expérience acquise, l’écart-type de
b) Quelle est la puissance du test si le
la résistance à la rupture est de 3 lb/po2,
rendement réel est de 87 % ?
et la loi normale est un bon modèle
pour cette variable. On soupçonne que la c) Calculez (à partir de la définition de p)
résistance moyenne n’est pas suffisam­ la taille de l’échantillon nécessaire pour
ment élevée, mais il faudrait le démontrer détecter un rendement moyen réel de
avec une conclusion forte pour apporter 87 % avec une probabilité de 0,95.
des changements à la production. On veut 10.3 On sait que le diamètre d’un certain type
effectuer un test d’hypothèse à partir d’un de boulon présente un écart-type de
échantillon aléatoire de quatre morceaux 0,001 cm, et que ce diamètre suit une loi
de tissu en utilisant un seuil de = 0,05. normale. Le responsable du contrôle de la
L’hypothèse nulle peut donc s’écrire qualité croit que le diamètre moyen diffère
H0: ju =160. de la norme en vigueur, soit 0,255 cm. Il
a) Quelle serait la bonne formulation pour effectue un test d’hypothèse au seuil de
l’hypothèse alternative ? 1 % à partir d’un échantillon aléatoire
b) Déterminez la loi de la moyenne de 10 boulons. Il obtient une valeur P
échantillonnai sous H0: = 160. égale à 0,028.
Tracez grossièrement la courbe qui la a) Quelles sont les hypothèses statistiques
représente et identifiez la zone de rejet appropriées pour répondre aux interro­
de H0. gations du responsable ?
c) L’échantillon donne une résistance b) Quelle conclusion le responsable a-t-il
moyenne à la rupture de 158 lb/po2. tiré de son expérience ?
Quelle est votre conclusion ? c) Pouvez-vous déduire la valeur observée
d) Sur le graphique tracé en b), ajoutez la de la statistique du test (z0) ?
courbe représentant la loi de la moyenne d) Sachant que le diamètre moyen obtenu
échantillonnai lorsque la vraie valeur dans cet échantillon est supérieur à la
de juset de 156 lb/po2. Hachurez la zone norme en vigueur, déterminez sa valeur
correspondant à la probabilité d’erreur à la lumière des informations que vous
de deuxième espèce. possédez.
e) À partir de la figure tracée en d), esti­
10.4 Un ingénieur veut tester l’hypothèse que
mez la probabilité de ne pas rejeter H0
le point de fusion moyen d’un alliage est
(à tort) si la fibre a une résistance réelle
de 1000 °C. Son équipe et lui conviennent
à la rupture de 156 lb/po2. Vaut-elle
de rejeter l’hypothèse nulle si le point
environ 1%, 15 %, 50 %, 85 % ou 99 % ?
de fusion moyen obtenu avec 5 mesures
10.2 On étudie le rendement (en pourcentage) échantillonnais est supérieur à 1010 ou
d’un traitement chimique. Selon une inférieur à 990 °C. Dans chacune des
expérience antérieure liée à ce pro­ situations ci-après, déterminez si une
cédé, la variance du rendement est de erreur est commise (et de quelle espèce)
5 %2, et la loi normale modélise bien la ou non.
Les tests d'hypothèses

a) Le vrai point de fusion moyen de l’alliage 8,8 8,8 9,1


est de 1012 degrés, et il obtient une 12,5 12,2 14,7
moyenne échantillonnale de 1005 degrés. 5,4 13,3 2,2
b) Le vrai point de fusion moyen de l’alliage 12,8 6,9
est de 1000 degrés, et il obtient une Dans ces données, on a 9,7 et
moyenne échantillonnale de 1005 degrés. s2= 14,62. Supposez que le nombre
c) Le vrai point de fusion moyen de l’alliage d’heures de travail perdues est
est de 992 degrés, et il obtient une normalement distribué.
moyenne échantillonnale de 988 degrés. a) Y a-t-il une preuve permettant
d) Le vrai point de fusion moyen de l’alliage de conclure que le nombre nunen
est de 1000 degrés, et il obtient une d’heures de travail perdues par jour est
moyenne échantillonnale de 1015 degrés. supérieur à 8 au seuil de 5 ? l aioncez
10.5 La durée de conservation d’un film clairement les hypothèses que vous
photographique intéresse son fabricant. Il testez et la règle de rejet de H ..
observe les durées de conservation pour b) La probabilité d’erreur de deuxième
huit unités choisies au hasard dans la pro­ espèce (/? ) serait-elle supérieure :
duction courante. Il obtient une moyenne i) si la taille d’échantillon était
échantillonnale de 134,34 jours et une de 25 au lieu de 11 ?
variance échantillonnale de 371,07 jours2. ii) si le seuil du test était de a= 1 %
Supposez que la durée de conservation est au lieu de a = 5 %?
distribuée normalement.
üi) si le véritable nombre moyen
a) Y a-t-il une preuve que la durée de vie d’heures perdues était de
moyenne est supérieure à 125 jours au /i, = 10 heures ou de //, = 12 heures ?
seuil de 5 % ?
b) Quelle est la valeur P du test? On soupçonne que le pourcentage de rebut
c) Si on recommençait l’expérience avec produit lors du traitement de la surface
un échantillon de taille = 25 au lieu de d’un métal est inférieur à 7,5 %, et on veut
n= 8, peut-on savoir d’avance comment le démontrer par un test d’hypothèse. On
les probabilités d’erreur de première et suppose que la loi normale est un bon
de deuxième espèces seraient affectées modèle pour cette variable. Plusieurs jours
(s’il y a lieu)? sont choisis au hasard et l’on trouve les
d) Si on recommençait l’expérience avec pourcentages de rebut suivants, où = 7.00
un échantillon de taille = 25 au lieu et s = 1,28.
de n= 8, et qu’on obtenait une moyenne 5,51 % 7,32 %
et une variance échantillonnais simi­ 6,49 % 8,81 %
laires à celles de l’expérience originale, 6,46 % 8,56 %
la valeur P serait-elle supérieure, infé­ 5,37 % 7,46
rieure ou égale à la valeur P obtenue
initialement? a) Quelles sont les hypothèses du test ?
b) Au seuil de 5 %, quelle est la règle de
10.6 Un article du Journal of Construction
©T Engineering and Management (vol. 125, rejet de H0 ?
n° 1, 1999, p. 39) présente quelques c) Le véritable taux de rebut est-il infé­
données sur le nombre d’heures de travail rieur à 7,5 %, au seuil de 5 % ?
perdues par jour, dans le cas d’un projet d) S’il est important de détecter un
de construction, en raison de problèmes rapport (/i, - /i0)/<7 = 1,5 avec une
dus au mauvais temps. Voici le nombre probabilité d’au moins 0,90, utilisez les
d’heures de travail perdues sur 11 jours courbes caractéristiques pour détermi­
ouvrables. ner la taille minimale d’échantillon.
CHAPITRE 10

10.8 Un fabricant de blocs d’alimentation de H0, et la conclusion à laquelle


Q
+Jf s’intéresse à la variabilité de la tension de les données vous mènent.
sortie, une variable réputée suivre une loi b) Calculez un intervalle de confiance
normale. Il a essayé 12 blocs choisis au à 99 % pour la vraie variance.
hasard et a obtenu les résultats suivants, Pourrait-on répondre à la question a)
dont l’écart-type est 0,322. à partir de cet intervalle ?
5,34 5,65 4,76 c) Calculez la puissance du test si l’écart-
5,00 5,55 5,54 type réel est de 0,4 mm.
5,07 5,35 5,44 10.11 Soit 400 automobilistes choisis au hasard,
5,25 5,35 4,61 dont 48 n’assurent pas leur véhicule contre
les dommages.
a) Réalisez un test bilatéral pour l’hypo­
thèse nulle a 2 = 0,5. Utilisez a = 0,05. a) Testez l’hypothèse que plus de 10 %
des automobilistes ne sont pas assurés.
b) Si la vraie valeur de a 2 est 1,0, quelle
Utilisez a= 0,05.
est la probabilité que l’hypothèse de la
question a) soit rejetée ? b) Tracez sommairement la courbe repré­
sentant la distribution approximative de
10.9 Une industrie chimique produit un certain ps
ous l’hypothèse nulle. Déterminez la
médicament dont la masse a un écart- valeur critique, c’est-à-dire la proportion
type de 4 mg. Une nouvelle méthode de échantillonnale au-delà de laquelle vous
production a été proposée, bien qu’elle rejetez H0. Hachurez la zone correspon­
coûte plus cher. La direction n’acceptera dant à a.
de changer la méthode de production que
si l’écart-type de la masse dans le nouveau 10.12 Un fabricant de calculatrices électroniques
procédé est inférieur à 4 mg. Si l’écart- veut contrôler la qualité de ses produits.
type réel est seulement de 3 mg, la société Sur les 3000 calculatrices d’un échan­
aimerait changer sa méthode avec une tillon aléatoire de sa production, 18 sont
probabilité d’au moins 0,90. On suppose défectueuses.
que la masse est normalement distribuée a) Le fabricant peut-il affirmer, avec
et que a —0,05. un seuil de 1 ,que moins de 2,5
%
a) Combien d’observations faudrait-il des calculatrices électroniques sont
recueillir? (Répondez à l’aide des défectueuses ?
courbes caractéristiques de l’annexe.) b) Quelle est la valeur P de son test ?
b) Supposez que les chercheurs ont choisi c) Si le fabricant avait obtenu la même
n= 10 et que l’écart-type échantillon­ proportion à partir d’un échantillon
nai obtenu est de 2,72 mg. Quelle est plus petit (par exemple 3 calculatrices
la valeur P du test effectué ? La société défectueuses sur 500), la valeur P obte­
changera-t-elle de procédé ? nue aurait-elle été changée ?
10.10 Un fabricant d’appareils de mesure de pré­ 10.13 a) Supposons qu’au Canada, le poids moyen
cision affirme que l’écart-type des mesures des enfants de 10 ans est de 32 kg, mais
d’un appareil est de 0,2 mm. Un analyste, que cette information n’est pas connue.
qui ignore cette affirmation, utilise l’ap­ Imaginons que le gouvernement man­
pareil huit fois et obtient un écart-type date 50 équipes de chercheurs indépen­
échantillonnai de 0,5 mm. On suppose que dantes pour tester, au seuil de 10 %, les
la loi normale est un bon modèle pour les hypothèses suivantes :
mesures de cet appareil. H0: // = 32,
a) En prenant a ~ 0,01, l’analyste H, : ju>2.3
a-t-il des données qui contredisent Environ combien d’équipes devraient
l’affirmation du fabricant ? Précisez conclure que le poids moyen des enfants
clairement les hypothèses du test est supérieur à 32 kg (en considérant
que vous réalisez, la règle de rejet que chacune prend un échantillon
Les tests d'hypotheses

aléatoire simple parmi tous les enfants ne versent pas le même volume net, que
de 10 ans du Canada) ? ce volume soit de 16 centilitres ou pas.
b) Supposons qu’une des équipes de Un échantillon aléatoire est prélevé de
recherche a aussi mesuré la taille des la production de chaque machine.
enfants. Ils ont obtenu des moyennes
échantillonnales de 137,9 cm chez les Machine 1 Machine 2
garçons et de 138,1 cm chez les filles. 16,03 16,01 16,02 16,03
Leur seuil observé du test bilaté­ 16,04 15,96 15,97 16.04
ral pour H0: fiQ= a été de 0,042. 16,05 15,98 15.96 16.02
Laquelle des conclusions ci-dessous 16,05 16,02 16.01 16.0!
vous apparaît la meilleure ? 16,02 15,99 15,99 16.00
La différence de taille entre les garçons
Moyenne 16,015 16.005
et les filles de 10 ans...
Écart-type 0,0303 0.0255
i) est significative statistiquement,
mais non significative en pratique.
a) Tracez la distribution de la différence
ii) est significative statistiquement, et
de moyennes échantillonnales sous H0,
significative en pratique.
et identifiez la zone de rejet de H().
ni) est non significative statistiquement,
b) Le service de contrôle de la qualité
mais significative en pratique. a-t-il raison? Utilisez a = 0,05.
iv) est non significative statistiquement, c) Calculez la puissance du test pour une
et non significative en pratique. véritable différence des moyennes de
10.14 Déterminez si les énoncés suivants sont 0,01 centilitre.
vrais ou faux.
10.16 La fabricante d’un nouvel analgésique
a) Dans un test d’hypothèse sur la moyenne
veut démontrer que son produit agit au
d’une loi normale, plus la taille d’échan­
moins deux fois plus vite que l’analgé­
tillon est grande, plus a sera petit.
sique de sa concurrente. Plus précisément,
b) Dans un test unilatéral de comparaison elle veut tester
de moyennes, plus le seuil a est petit,
plus la valeur Pest petite. H0: Afi = 2/z2,
c) À partir d’un échantillon aléatoire de H, : /i, > 2/6,
voitures d’un certain modèle, on a cal­ où //, est le temps moyen d’absorption de
culé un intervalle de confiance à 95 % l’analgésique de la concurrente et /6, le
pour la vitesse maximale (en km/h), temps moyen d’absorption du nouvel anal­
soit [271, 274]. La valeur P du test gésique. En supposant que la loi normale
H0: ju = 273 contre H,: * 273 est est un bon modèle et que les variances
alors supérieure à 0,05. o \ et <72 sont connues, suggérez une
d) Dans un test de comparaison de procédure pour tester cette hypothèse. En
moyennes sur des échantillons appa­ d’autres mots, donnez la formule de la sta­
riés, on peut supposer que la cova­ tistique du test, précisez sa loi et énoncez
riance entre Xt et est nulle sous H0. la règle de rejet de H0.
e) La finalité d’un test d’hypothèse est de
10.17 Un article de Proceedings of the
confirmer laquelle de H0 ou de H, est
Winter Simulation Conférence (1998,
vraie.
p. 1079-1086) traite de la validation des
10.15 Deux machines remplissent des bouteilles modèles de simulation de la circulation
©■ en plastique d’un volume net de 16 centi­ routière. Le but de l’étude est de modifier
litres. On suppose raisonnablement le réseau routier pour optimiser l’efficacité
que les procédés de remplissage sont et la sécurité de la circulation. Quatorze
normaux avec pour écarts-types cr, = 0,015 vitesses (en pieds par seconde) sont mesu­
et cr2 = 0,018. Le service de contrôle de la rées à une intersection donnée. Quatorze
qualité soupçonne que les deux machines observations sont simulées à l’aide du
CHAPITRE 10

modèle proposé. Le tableau ci-dessous de 12 photos couleur est soumis à la


donne quelques statistiques calculées à développeuse actuelle. Le temps moyen
partir de ces données. de développement est de 8,1 min avec un
%


écart-type de 1,4 min. Un échantillon
Sur le terrain Modèle aléatoire de 10 photos est choisi pour
Moyenne 58,62 58,67 tester la nouvelle développeuse. Le temps
Ecart-type 5,49 8,03 moyen de développement est de 7,3 min
avec un écart-type de 0,9 min. (Consi­
En supposant la loi normale avec des dérez que le temps de développement
variances égales, effectuez un test est une variable aléatoire normale dont
d’hypothèse afin de déterminer s’il y a une la variance est la même d’une dévelop­
différence significative entre les données peuse à l’autre.)
sur le terrain et les données simulées par a) Au seuil de 5 %, le temps de dévelop­
le modèle. Utilisez a = 0,05. pement moyen est-il plus court avec la
10.18 Les données suivantes sont les durées de nouvelle développeuse ?
(J+J combustion (en minutes) de deux types b) La direction précise qu’on achètera la
différents de torches. nouvelle développeuse si on peut mon­
trer que le temps moyen est réduit
Type 1 Type 2 d’au moins 2 minutes. Sans refaire
de test, déterminez si l’hypothèse
63 82 64 56
81 68 72 63 Ho: ^ a„c“ /Vouv = 2 sera reietée au
profit de H ,://Anc- / ^ ouv>2.
57 59 83 74
66 75 59 82 10.20 On analyse deux méthodes de prépara-
82 73 65 82 Q+f tion d’essence à partir de pétrole brut.
Moyenne 70,6 70,0 On suppose que les rendements des deux
Ecart-type 9,42 10,02 procédés sont normalement distribués.
L’usine pilote a donné les rendements
On suppose que la loi normale est un bon ci-dessous.
modèle pour ces données.
Procédé Rendements (%)
a) Sachant que le seuil observé (la
valeur P)du test F bilatéral de1com­24,2 26,6 25J 24,8 25,9 26,5
paraison de deux variances est 0,86, 2 21,0 22,1 21,8 20,9 22,4 22,0
testez l’hypothèse que les durées
moyennes de combustion sont inégales a) Y a-t-il une raison de croire que le
au seuil de 5 %. procédé 1 a un plus grand rendement
b) Quelle est la valeur P du test que vous moyen ? Utilisez a= 0,01 et su
avez réalisé en a) ? Toutes choses étant que les deux variances sont égales.
égales par ailleurs, la valeur P serait- b) À l’aide des courbes caractéristiques,
elle plus grande ou plus petite si la trouvez la puissance du test effectué
différence entre les deux moyennes en a) si le rendement moyen du pro­
était plus importante ? Quelle serait cédé 1 est supérieur de 5 % à celui
la valeur P si le test de comparaison du procédé 2.
de moyennes était unilatéral à droite ?
c) À l’aide des courbes caractéristiques,
c) Est-il exact de dire que la valeur P est
calculez la taille requise de l’échan­
la probabilité que l’hypothèse nulle soit
tillon du test effectué en a) pour que
vraie ?
l’hypothèse nulle soit rejetée avec une
10.19 Le service de développement de photos probabilité de 0,90 si le rendement
professionnelles envisage de remplacer moyen du procédé 1 dépasse de 5 %
sa développeuse. Un échantillon aléatoire le rendement moyen du procédé 2.
Les tests d'hypotheses

10.21 Un nouveau filtre est installé dans une même effet sur le rythme cardiaque. Les
cheminée. Avant son installation, un résultats obtenus sont les suivants.
échantillon aléatoire a fourni les don­
nées suivantes à propos du pourcentage Sujet Type A Type B
d’impuretés :
1 162 161
x ] = 14,5, sf = I5l,l7 et = 8. 2 163 187
3 140 199
Après l’installation, un nouvel échantillon 4 191 206
aléatoire a fourni 5 160 16!
x2= 10,2, s= 54,73 et n2=6 9. 158 16! !
7 155 i«

»
î
y
It X
'
*, #
\ »

On suppose que la loi normale est un bon


modèle pour le pourcentage d’impuretés,
a) Effectuez un test d‘ln approprié
mais qu’il n’est pas raisonnable de pré­ ♦

pour déterminer si le rythme cardiaque


tendre que la variance théorique est la
diffère de façon significative d'un
même avec le nouveau filtre.
appareil à l’autre au seuil de
a) Le filtre a-t-il réduit le pourcentage
b ) Quelle est la valeur P du test effectué
d’impuretés de façon significative en a)?
(au seuil de 10 %) ?
b ) Quelle est la valeur du test effectué 10.24 Un concepteur d’avions croit posséder la
en a)? (Î*J preuve théorique que peindre un avion
diminue sa vitesse de pointe de plus
10.22 Deux machines fabriquent des pièces de l mille par heure (à une puissance
métalliques. On s’intéresse au poids (en et à un réglage des volets particuliers).
kilogrammes) de ces pièces, une variable Il prélève six avions consécutifs d’une
distribuée normalement. Voici les données chaîne de montage et les essaie avant et
recueillies. après l’application de la peinture. Voici
les résultats qu’il a obtenus.
Machine 1 Machine 2
Vitesse maximale (mph)
n, == 25 n2- =31
Avion Peint Non peint Différence
X\ =9,84 x 2 ==8,07
s]-=3,46 s\ == 1,25 1 286 289 -3
2 285 286 -I
a) Testez l’hypothèse que les variances 3 279 283 -4
des deux machines sont égales. Utilisez 4 283 288 -5
a - 0,05. 5 281 283
b) En tenant compte du résultat obtenu 6 286 289 -3
en a), testez l’hypothèse que les deux Moyenne 283,3 286.3 -3
machines fabriquent des pièces ayant Variance 8,27 7,87 •

le même poids en moyenne, par opposi­


tion à son alternative bilatérale. Utilisez Ces données soutiennent-elles la théorie
a = 0,05. du concepteur? Utilisez = 0,05.
10.23 Deux types d’appareils de musculation 10.25 Un article de YInternational Journal
(7+J pour personnes handicapées, A et B, sont (gT Fatigue (vol. 20, n° 7. 1998, p. 537-542 )
utilisés pour mesurer l’effet d’un exercice traite de la résistance à la fatigue par
particulier sur le rythme cardiaque (en flexion des dents d’un engrenage sou­
nombre de pulsations par minute). Sept mises à une précontrainte (appliquer puis
sujets ont participé à une étude pour déter­ retirer une surcharge à l’élément de la
miner si les deux types d’appareils ont le machine). Une dent précontrainte et une
340 CHAPITRE 10

dent non précontrainte appartenant au fait l’objet d’une étude. Un échantillon


même engrenage ont été appariées, et la aléatoire de 1000 unités provenant
résistance à la fatigue a été mesurée pour de la chaîne 1 renferme 10 unités
chaque dent. (Le résultat d’intérêt est défectueuses, tandis qu’un autre de
ln [(résistance à la fatigue) x 10-3].) 1200 unités provenant de la chaîne 2
en compte 25.
Dent Dent a) Déterminez s’il est raisonnable de
Paire précontrainte non précontrainte Différence
conclure que la chaîne de fabrication 2
1 3,813 2,706 1,107 produit un pourcentage plus élevé
2 4,025 2,364 1,661 d’unités défectueuses que la chaîne de
3 3,042 2,773 0,269 production 1. Utilisez a= 0,01.
4 3,831 2,558 1,273
5 3,320 2,430 0,890 b) Si on avait utilisé des tailles d’échan­
6 3,080 2,616 0,464 tillons deux fois plus petites, la pro­
7 2,498 2,765 -0,267 babilité d’erreur de première espèce
8 2,417 2,486 -0,069 aurait-elle augmenté ? Et celle de
9 2,462 2,688 -0,226
10 2,236 2,700 -0,464 deuxième espèce ?
11 3,932 2,810 1,122
10.28 Deux types différents de machines de
Moyenne 3,151 2,627 0,524 moulage par injection sont utilisés pour
Écart-type 0,678 0,149 0,726
former des pièces en plastique. Une pièce
est considérée comme défectueuse si elle
a) Déterminez si la précontrainte fait est trop rétrécie ou si elle est décolorée.
augmenter de façon significative la Deux échantillons aléatoires, chacun de
résistance à la fatigue des dents d’un taille 500, sont choisis ; 32 pièces défec­
engrenage. Utilisez a - 0,10. tueuses sont trouvées dans l’échantillon
b) Seriez-vous parvenu à la même conclu­ de la machine 1 et 21 pièces défectueuses
sion si vous aviez considéré que ces dans l’échantillon de la machine 2. Est-il
deux échantillons sont indépendants ? raisonnable de conclure que les deux
10.26 On souhaite déterminer si le taux de syn­ machines fabriquent le même pourcentage
dicalisation varie selon le sexe. En inter­ de pièces défectueuses au seuil de 5 % ?
rogeant 5000 travailleurs d’usine choisis 10.29 Choisissez dans la liste ci-dessous une
au hasard, on a appris que 785 d’entre eux procédure statistique pour répondre
étaient syndiqués. De même, en interro­ aux questions de recherche énoncées.
geant 3000 travailleuses d’usine choisies Identifiez le nombre de degrés de liberté
au hasard, on a appris que 327 d’entre elles associés à la loi t du test choisi.
étaient syndiquées. On veut tester l’hypo­ • Test sur une moyenne de loi normale
thèse que la proportion des travailleurs qui • Test sur deux moyennes de lois nor­
appartiennent à un syndicat diffère chez males, échantillons indépendants
les hommes (pH) et les femmes (pP), au
• Test sur deux moyennes de lois nor­
seuil de 5 %.
males, échantillons appariés
a) Tracez sommairement la courbe de la
a) On veut comparer le salaire des avocats
distribution approximative de pH- p?
du Québec et de l’Ontario, 5 ans après
sous l’hypothèse nulle. Indiquez la
la fin de leurs études. On sélectionne
zone de rejet de H0et hachurez la ré­
gion correspondant à a. au hasard 22 avocats dans chaque
province.
b) Quelle est la valeur observée de la
b) On veut évaluer si un programme d’en­
statistique du test ? Quelle conclusion
pouvez-vous en tirer ? traînement a un impact sur la capacité
pulmonaire des patients asthmatiques.
10.27 La proportion d’unités défectueuses On prend des mesures sur 12 patients
associée à deux chaînes de production avant et après le programme.
Les tests d'hypothèses

c) On soupçonne que la quantité de raisonnable de conclure que ces don­


phosphore dans un cours d’eau est nées viennent d’une distribution nor­
supérieure à la norme de 20 pg/L. On male. Combien de degrés de liberté la
utilise 10 échantillons d’eau puisés à statistique du test comptera-t-elle ?
différents moments. c) Quelle est la règle de rejet de Hn, au
d) On veut savoir si le frère aîné d’une seuil de 5 % ?
famille de deux garçons est plus grand d) Quelle est votre conclusion ?
que son cadet, à l’âge adulte. On
mesure des frères dans 30 familles. 10.31 Un générateur de nombres pseudo­
e) On veut savoir si les étudiants uni­ aléatoires est conçu de manière à ce que
versitaires consacrent le même les entiers de 0 à 9 aient une probabilité
nombre d’heures aux activités égale d’apparaître. Les K) 000 premiers
sportives, en moyenne, que leurs nombres générés présentent les fréquences
collègues féminines. On mène un d’apparition suivantes.
sondage auprès de 100 étudiants et 0 l 2 3 4 5 6 7 8 y
de 100 étudiantes choisis au hasard
967 1008 975 1022 1003 989 1001 981 1043 1011
sur le campus.
a) Quelles sont les fréquences espérées ?
10.30 On a compilé le nombre d’unités
défectueuses trouvées chaque jour b) Sachant que la statistique observée
dans un procédé d’assemblage d’une du test est de 4,724, peut-on affirmer
carte de circuit imprimé. On veut savoir que ce générateur semble fonctionner
s’il est raisonnable de conclure que ces convenablement, au seuil de 5 % ?
données viennent d’une distribution 10.32 Des défauts sur la surface des tranches
normale. sont inévitables durant la fabrication
a) En considérant que la moyenne des circuits intégrés. Les données du
échantillonnale est de 25 unités et tableau 10.9 (voir à la page suivante) ont
que l’écart-type échantillonnai est été recueillies au cours d’un processus
de 9 unités, remplissez la colonne particulier. On veut savoir si une loi de
des fréquences espérées dans le Poisson conviendrait comme modèle de
tableau 10.8. probabilité de ce processus. Notez que
b) On veut réaliser un test d’ajustement le nombre total de défauts relevés est
du khi-carré pour vérifier s’il est de 1991.

-
Nombre d ’unités Nombre Probabilité Fréquence
défectueuses d’observations théorique espérée (o, - &, ) '
A
p a r jo u r o{ Pt É( = npt Ef
0-10 6 0,054 6,27 0.012
11-15 11 0,092 10,76 0,005
16-20 16 0,163 19,06 0,493
21-25 28 0,214 24,99 0,362
26-30 22 0,207 24,25 0,209
31-35 19 •
9 ♦
9 ♦
9

36-40 11 ♦
9 •
9 ♦
9

41-45 4 0,043 4,97 0,191


CHAPITRE 10

■ ïtÿt/vr,, *»

Nombre de Nombre de tranches Fréquence espérée (0 .--Ê ,)2 1


défauts i ayant idéfauts (0t) f il Et
0 4 2,76 0,561
1 13 13,72 0,038 "I
2 34 ?• ?• 1
3 56 56,66 0,008
4 70 70,50 0,004 1
5 70 70,18 0,000
6 58 58,22 0,001
7 42 41,40 0,009
8 25 ?• ?« g1
9 15 14,25 0,040
10 9 7,09 0,514
11 3 3,21 0,014
12 1 2,11 0,582 1
Total 400 1

a) Remplissez la colonne des fréquences a) Quelles sont les hypothèses H0et H, ?


espérées du tableau 10.9. b) Quelle est la règle de rejet de l’hypothèse
b) Certaines classes devraient-elles être nulle, si on utilise un seuil de 1% ?
regroupées pour effectuer un test du c) Si l’hypothèse nulle est vraie, quelle est
khi-carré ? l’espérance (la moyenne théorique) de
c) Quelle est votre conclusion, au la statistique du test UQ?
seuil de 10 % ? Une loi de Poisson d) Sachant que la valeur observée de la
conviendrait-elle comme modèle de statistique du test est de 11,649, que
probabilité de ce processus ? pouvez-vous conclure ?
10.33 Une entreprise exploite quatre machines 10.34 Une étude est effectuée sur les pannes
avec trois équipes d’employés chaque jour. d’un composant électronique. Ce com­
Les rapports de production présentent posant peut subir quatre types de panne
les données suivantes sur le nombre de et possède deux positions de montage
pannes. possibles. Les données relevées sont
présentées ci-dessous.
Machines
A B C D Position de Type de panne
Équipe
montage A B C D Total
1 41 20 12 16
31 11 9 14 1 22 46 18 9 95
2
15 17 16 10 2 4 17 6 12 39
3
Total 26•*
63 24 21 ^ 134
On veut vérifier si les pannes sont indé­
pendantes de l’équipe en place à l’aide On veut savoir si le type de panne est
d’un test du khi-carré. indépendant de la position de montage.
Les tests d'hypothèses

a) Le tableau ci-après donne les fré­ de commercialisation de l’essence. Un


quences espérées et les valeurs échantillon de 441 stations-services a été
étudié. Les résultats (OtJ) figurent dans le
(Oy Êÿ ) pQur cjîaqUe combinaison tableau ci-après, ainsi que les fréquences
EIJ espérées sous l’hypothèse d’indépendance
d’un type de panne et d’une position 2
de montage. Ajoutez les données A

(£ÿ) et le calcul de
manquantes. E‘J
— w

Position de Iÿpe de panne Remplissez le tableau et précisez s'il y


montage A B C D a une preuve que la stratégie du prix de
l’essence et l’état des installations sont
1 18,43 44,66 17,01 14,89 dépendants. Utilisez un seuil île 1Vc.
0,69 0,04 0,06 2,33 Quelle est la valeur P du test ?
2 7,57 9 ? 6,11 T
--------
;
• •

1,68 9

9
• 5,67 État
Politique Désuet Normal Moderne Total
b) Quelle est la valeur de la statistique Agressive 52 58 134
observée du test du khi-carré pour 24
17,0 62,3 54,7
l’indépendance ? 2,87 9• 0,20
c) Quelle est la valeur P du test ? Que J .
pouvez-vous conclure au seuil de 5 %? Neutre 15 73 86 174
22,1 9♦ 71,0
10.35 Un article du Research in Nursing and
2,28 0,77 3,16
Health (vol. 21, n° 4, 1998, p. 285-295)
rapporte une étude sur la relation entre Non 17 80 36 133
l’activité physique et le statut socioécono­ agressive 9♦ 61,8 54,3
mique de 1507 femmes blanches adultes. 9• 5,34 6,16
Les données sont présentées ci-dessous.
Total 56 205 180 441
Statut Activité physique
socioéconomique Inactive Active

Total 10.37 Soit le processus du moulage par
Faible 216 245 461 injection décrit à l’exercice 10.28.
Moyen 226 409 635 a) Présentez ces données sous la forme
Élevé 114 297 411 d’un tableau de contingence (deux
lignes et deux colonnes).
Total 556 951 1507
b) On décide de réaliser un test du khi-
carré à partir de ce tableau. Quelle sera
Testez l’hypothèse que l’activité physique l’hypothèse testée : l’homogénéité ou
est indépendante du statut socioécono­ l’indépendance ? Énoncez la règle de
mique au seuil de 5 %. rejet de Hqau seuil de 5 %, calculez la
10.36 Un article du Journal of Marketing valeur de la statistique observée et tirez
Research (vol. 7, n° 1, 1970, p. 36-42) vos conclusions.
rapporte une étude sur la relation entre c) Cette procédure équivaut-elle
l’état des installations des stations- à la procédure de test utilisée à
services et l’agressivité de leur politique l’exercice 10.28?
es expériences font partie intégrante du processus de découverte
et d'apprentissage. Les conclusions qu’on peut tirer d’une expérience
r aléatoire dépendent en partie de la façon dont elle est menée. P ar

conséquent, la planification de l’expérience a une im portance majeure dans


Sa résolution de problèmes. P ar exemple, supposons qu'un ingénieur civil étudie
l’effet des méthodes de durcissement du béton sur la résistance moyenne de
celui-ci à la compression. Une expérience pourrait consister à fabriquer
plusieurs éprouvettes de béton selon chacune des méthodes de durcissement
proposées, puis à tester la résistance à la compression de chaque éprouvette.
Les données de cette expérience perm ettraient de déterm iner la méthode de
durcissement qui maximise la résistance à la compression.

S’il n’y a que deux méthodes de durcissement enjeu, l’expérience peut être planifiée et analysée
à l’aide des méthodes étudiées au chapitre 10. Autrement dit, l’expérimentateur ne considère
qu’un facteur - les méthodes de durcissement - et il n’y a que deux niveaux de facteur. Si l’expé­
rimentateur cherche la méthode de durcissement qui maximise la résistance à la compression,
alors il utilise un test t pour découvrir si les deux moyennes diffèrent.
Dans de nombreuses expériences à un seul facteur, plus de deux niveaux de facteur
doivent être considérés. Par exemple, l’ingénieur civil peut devoir étudier cinq méthodes de
durcissement différentes. Dans ce chapitre, nous décrivons l’analyse de la variance, une
méthode qui permet de comparer les moyennes de plusieurs niveaux d’un facteur en isolant
les sources de variabilité de la mesure d’intérêt. Une généralisation de cette analyse de la
variance dans le cas de plusieurs facteurs, les plans factoriels d’expériences ainsi que l’ana­
lyse par blocs (dans le cas où les unités expérimentales sont hétérogènes) seront également
présentés.

11.1 Le plan d'expériences à un seul facteur


On considère d’abord le cas où l’expérience vise à comparer les moyennes de la variable d’inté­
rêt obtenues sous plusieurs niveaux d’un même facteur. Cette situation est illustrée à l’aide d’un
exemple.
L'analyse de la variance et les plans d'expériences

Exemple 11.1
Un fabricant de papier pour sacs d’emballage veut améliorer la résistance à la traction de son papier.
Le service technique de fabrication pense que la résistance à la traction est fonction de la concentration
en bois dur de la pâte et que les valeurs de concentration d’intérêt s’étendent de 5 à 20%. L’ingénieur
responsable de l’étude décide d’étudier quatre niveaux de concentration en bois dur: 5 %, 10%, 15 % et
20%. Il décide aussi de fabriquer 6 éprouvettes par niveau de concentration. Les 24 éprouvettes sont
testées dans un ordre aléatoire à l’aide d’un dynamomètre de laboratoire. Le tableau l l.l énumère les
résultats de cette expérience.

t
,y*»t
'
y
é
, \
V fv,
*
y
.J
/

*1
71L

.f
>
% y y
.
çTeÇ•kvJfv-j♦>c L(,*••<. -,*>*j'
'
J '' i
.
f
/y SL"I*n]*T*| *iî

[
Concentration Observations
en bois dur (%) 1 2 3 4 5 6 Toiai Moyenne
,
5 7 8 15 11 9 10 60 10.00

10 12 17 13 18 19 15 94 15.67
15 14 18 19 17 16 102 17,00
18 1
20 19 25 22 23 18 20 : 127 21,17
383 15,96

Il s’agit d’un exemple d’expérience complètement aléatoire à un facteur avec = 4 niveaux. Les niveaux
de facteur sont parfois appelés «traitements». Chaque traitement comporte ici = 6 observations ou
répétitions.

La randomisation des essais


Le caractère aléatoire de cette expérience est extrêmement important. La randomisation des essais,
c’est-à-dire le fait de les effectuer dans un ordre aléatoire, compense à peu près l’effet de toute variable
dérangeante (ou nuisible) qui pourrait modifier la résistance à la traction observée. Par exemple, sup­
posons que le dynamomètre est soumis à un effet de réchauffement; autrement dit, plus l’appareil est
en marche depuis longtemps, plus la résistance à la traction observée est grande. Si les 24 essais sont
effectués selon l’ordre croissant des concentrations en bois dur (c’est-à-dire qu’on teste en premier les
6 éprouvettes à concentration de 5 %, puis les 6 éprouvettes à concentration de 10 %, etc.), alors les diffé­
rences observées dues à la concentration en bois dur pourraient aussi être dues à l’effet de réchauffement.

La description graphique
Il importe d’analyser graphiquement les données d’un plan d’expériences pour se donner une idée
de l’importance des effets observés avant de procéder à l’analyse numérique proprement dite. La
figure 11.1 {voir à la page suivante) présente les diagrammes en boîte de la résistance à la traction pour
les quatre niveaux de concentration en bois dur. Cette figure laisse croire qu’un changement de concen­
tration en bois dur influe sur la résistance à la traction ; plus précisément, une plus grande concentra­
tion en bois dur donne une plus grande résistance à la traction observée. Ces tendances sont peut-être
fortuites, c’est-à-dire peut-être dues au hasard de l’échantillonnage, ou peut-être sont-elles bien réelles
dans les groupes comparés. L’analyse statistique permettra de déterminer si les différences observées
sur le graphe sont statistiquement significatives ou non. En outre, la distribution de la résistance à la
traction d’un niveau de bois dur particulier est à peu près symétrique, et la variabilité de la résistance à
la traction ne change pas de façon draconienne lorsque la concentration en bois dur change. ►
346 CHAPITRE 11

Concentration en bois dur (%)


Les diagrammes en boite des données sur les concentrations en bois dur

L’interprétation graphique des données est toujours utile. Les diagrammes en boîte montrent
la variabilité des observations à l’intérieur d’un traitement (c’est-à-dire d’un niveau de facteur)
et la variabilité entre les traitements. Voyons maintenant comment analyser statistiquement les
données d’une expérience aléatoire à un seul facteur.

11.1.1 Le modèle
Supposons qu’on désire comparer a niveaux différents d’un facteur. La réponse observée pour
chacun des a traitements est une variable aléatoire. Les a niveaux du facteur de l’expérience
peuvent être choisis de deux façons différentes :
1. Le modèle à effets fixes - L’expérimentateur choisit spécifiquement les a traitements.
Dans ce cas, on désire tester des hypothèses sur les effets des traitements (et les
estimer), et les conclusions ne s’appliquent qu’aux niveaux de facteur considérés dans
l’analyse. Les conclusions ne peuvent être étendues aux traitements similaires qui n’ont
pas été considérés.
2. Le modèle à effets aléatoires ou à composantes de variance - Les a traitements
constituent un échantillon aléatoire d’une plus grande population de traitements. Dans
ce cas, on aimerait pouvoir étendre les conclusions (qui reposent sur l’échantillon de
traitements) à tous les traitements de la population, qu’ils soient explicitement considé­
rés dans l’analyse ou non. Ici, les effets des traitements sont des variables aléatoires, et
savoir lesquels en particulier sont étudiés est peu utile. On teste plutôt des hypothèses
sur la variabilité entre les niveaux et on essaie d’estimer cette variabilité. (Ce modèle
n’est pas traité dans ce manuel.)
Cette section porte sur l’analyse de la variance pour le modèle à effets fixes d’un plan à un
facteur. Le tableau 11.2 montre une façon compacte de présenter les données. (Notons qu’un
L'analyse de la variance et les plans d'expériences

chiffrier servant de base à l’analyse par un logiciel ne contiendrait qu’une ligne par observation,
ainsi qu’une colonne identifiant le traitement.) On considère d’abord le cas équilibré, où un même
nombre d’observations n est effectué pour chaque traitement. Le plan d’expériences déséquilibré,
où le nombre d’observations varie d’un traitement à l’autre, sera traité à la sous-section 11.1.5.

Traitement i Observations Y,a 1 Total M A


1 Moyenne
J Xi*
1 y» Y 112 % y*
2 y2i Y
122 K y» n • *


9

9


9

9
• 1
i a

«
• 9 • 9 • A

a y. Y 1 aï Y a n
Ya• V a m

Total Y•• y # #

Dans le tableau 11.2, Y représente la y-ième observation effectuée avec le traitement /


(pour i = 1, ..., a et j = 1..., n), y représente le total des observations dans le Même traite­
ment et Y h,la moyenne des observations dans le Même traitement. De même, Yn désigne la
somme totale de toutes les observations et Y t, la moyenne générale de toutes les observations.
Mathématiquement, on a
Sommes Moyennes
'W î .

par traitement i = l ,2 ...... a , (11.1)


II

r*

globale - y..
Y=•
n

" N’
où N = an est le nombre total d’observations. Un point en indice signifie donc une sommation
sur l’indice qu’il remplace.
Il est à noter que Y représente la variable aléatoire et y , sa réalisation. Cette conven­
tion sera respectée pour la variable Y, mais pas nécessairement pour toutes les autres
quantités aléatoires dans ce chapitre.

Modèle d'analyse de la variance à un facteur


Les observations du tableau 11.2 sont décrites à l’aide du modèle statistique ineaire
12
A f A 4 y * • • * a
V f ,

Y,ij .«+ *,• + 1o n


j - a
f

I

. .. *
où Y. représente la /-ième observation effectuée durant le traitement r. jj est la moyenne globale d<
tous les traitements; T est le paramètre associé au Même traitement, appelé l’«ef et du 1P•V-rlnIiICfA tl lr i#il l l1 1

ment » ; et E..est la composante aléatoire appelée l’«erreur associée à l’observation ) ».


On suppose que les erreurs du modèle sont des variables aléatoires normalement et indépendamment
distribuées avec une moyenne nulle et une variance <7. On suppose que la variance g 2 esti constant V.

pour tous les niveaux du facteur.


\

On exige que les observations soient effectuées dans un ordre aléatoire afin que le milieu
dans lequel les traitements sont appliqués soit aussi uniforme que possible, C’evi c e o u o n
CHAPITRE 11

appelle un « plan d’expériences complètement aléatoire ». Dans ce modèle, les « effets des trai­
tements » (t.) sont habituellement définis comme la différence entre la moyenne du traitement i
et la moyenne globale, de sorte que

Hypothèses testées par l'analyse de la variance à un facteur


On désire vérifier si les a moyennes de traitements sont égales. Dans ce cas, les effets des a traitements
seront tous nuis. Les hypothèses du test peuvent donc s’écrire
H *
n 0‘ T T. ♦ •
T=♦
0,
H : T. * 0, pour au moins un i. (11.4)

Autrement dit, si l’hypothèse nulle est vraie, alors chaque observation est constituée de
la moyenne globale n plus une réalisation de l’erreur aléatoire E . De façon générale, on écrit
souvent la moyenne du i-ième traitement comme suit :
/i; = JJ, + Tit = l , 2 , ...,
Les hypothèses à tester par l’analyse de la variance peuvent donc s’écrire :

Ht : // * juk, pour au moins un couple (J, k).


La figure 11.2 illustre bien la situation sous l’hypothèse nulle et sous l’hypothèse alternative.

Les hypothèses confrontées par le test de l'analyse de la variance à un facteur:


a) l'hypothèse nulle, où toutes les moyennes sont égales; b) un exemple de
l'hypothèse alternative, où au moins deux moyennes diffèrent.
L'analyse de la variance et les plans d'expériences 349

11.1.2 L'estimation des paramètres du modèle


On peut déterminer les estimateurs des paramètres //, r , r2, t dans le modèle d’analyse de
la variance à un facteur
—jU+ Ti. + ij

Un critère d’estimation consiste à trouver les valeurs de fl et de T. qui minimisent la somme des
carrés des erreurs E.
.. Avec cette méthode d’estimation de paramètres, appelée la «
des moindres carrés», la supposition de normalité des erreurs n’est pas nécessaire. La somme des
carrés des erreurs à minimiser est

En dérivant l’équation 11.5 par rapport à ji et à T. et en égalisant à zéro les dérivées obtenues,
on obtient <3+1 équations, appelées « équations normales des moindres carrés ». Ces équations
ne sont pas linéairement indépendantes et, pour les résoudre, il faut ajouter la contrainte
naturelle

En utilisant cette contrainte, on obtient comme solution des équations normales

i “ 1 2»^
} • • ♦ y a §

Cette solution est intuitivement intéressante puisque la moyenne globale est estimée par la
moyenne de toutes les observations et que l’estimateur de tout effet de traitement est pré­
cisément la différence entre la moyenne de traitement et la moyenne globale. Il faut noter
que cette solution n’est pas unique puisqu’elle dépend de la contrainte (voir l ’équation 11.6)
choisie.

Exemple 11.2
Estimons les résistances moyennes à la traction à différents niveaux de concentration en bois dur pour
l’expérience de l’exemple 11.1.
A

>V =s fi$* == 10,00 lb/po2 V =y,. ?.. =-


-5,96 ÿ..= 15,96
"CI

A
11

= 15,67 lb/po2 -0,29


ii
i

y » =~ ^10% V
NJ

=
ÿ3. == fia* = 17,00 lb/po2 V =y 3 . =-
1,04
A A

ÿ4. :~ 1*20% = 21,17 lb/po2


~ V =ÿ4. - ÿ.. = 5,21
On remarque que la somme des effets des quatre traitements est égale à 0.

11.1.3 La décomposition de la variabilité


La procédure de test pour les hypothèses de l’équation 11.4 est appelée l’«analyse de la
variance ». Cette expression résulte de la partition de la variabilité totale des données en deux
composantes : la variabilité entre les traitements et la variabilité à l’intérieur des traitements.
CHAPITRE 11

La somme totale des carrés, notée , est une mesure de la variabilité totale des données,
et s’écrit sous la forme

Décomposition de la variabilité
a n
X X (v
i- 17=1 1= 1 /=1 y = l

SS-T = SStraitements
. +

L’équation 11.9 montre que la variabilité totale des données, exprimée par la somme totale
des carrés S S T, peut être subdivisée en une somme des carrés des différences entre les moyennes
des traitements et la moyenne générale (55traitements, la somme intertraitements) et une somme
des carrés des différences entre les observations dans un traitement et la moyenne dans ce
traitement ( S S E, la somme intratraitements). La somme 5Straitements exprime les différences entre
les traitements, tandis que S S E exprime le fait que les différences entre les observations dans
un traitement et la moyenne du traitement sont dues à une erreur aléatoire ou à une autre cause
que le traitement considéré. (Bien que les sommes de carrés soient des variables aléatoires,
nous utiliserons toujours les lettres majuscules pour représenter à la fois les variables et leurs
réalisations, sans distinction.)
Certaines formules de calcul « efficaces » des sommes de carrés s’obtiennent en développant et
en simplifiant les définitions de 55|Mitememj et S S T de l’équation 11.9. (Elles ne sont utiles que si on fait
les calculs à la main. En général, les données de ce genre sont analysées à l’aide d’un ordinateur.)

Formules des sommes de carrés pour le calcul à la main


w'

a n
Y
I I = X X ij ( 11. 10)
.* h

1 1 N
y?.
» .

« Y12
A #

N.. . * SS traitenwm* x ^ (11.11)
- ✓ /=î n ~N %- -

V é •
, •< m . • » - • , * # V V ,•
par soustraction ou encore en combinant les variances
échantillonnâtes des traitements : a. *■*.
Si •• T

. v -

SS SS. SS traitements
» .\ • _

// > y

K n 1) S f , ( 11.12)
/r=! »V

s
-t.

où n représente te nombre d’observations par traitement. II y a iV = an observations totales dans


l’expérience. ». »
L'analyse de la variance et les plans d'expériences 351

Ainsi, SSTa TV— 1 degrés de liberté. Il y a aniveaux de fac


de liberté. Finalement, dans tout traitement il y a n répétitions fournissant n — 1 degrés de
liberté avec lesquels on estime l’erreur expérimentale. Comme il y a a traitements, on a a(n — 1)
= an — a = N — a degrés de liberté pour l’erreur.

Exemple 11.3
Considérons l’expérience de la concentration en bois dur décrite à l’exemple l l.l. Les sommes de car­
rés se calculent à l’aide des équations 11.10, 11.11 et 11.12 comme suit:

SST 4 6 2 yl
;=i j-1 y‘J ~~N
/v
2
(383)
(7) +(8) + •—h(20) 512,96,
24
4 v2
cçtraitements yl
s,= i" n; N
(60)2+(94)2+(102)2+(127) (383)2
382,79,
6 24
ss SS-p ‘^ ‘^traitemenis
512,96-382,79 = 130,17.

11.1.4^ La construction de la statistique du test global


de comparaison des moyennes
On considère maintenant les propriétés distributionnelles de ces sommes de carrés. Comme on
a supposé que les erreurs E sont indépendantes et suivent une loi /V(0, cr2), il s’ensuit que les
observations Y sont indépendantes et suivent une loi N(ju + T., cr2). Donc, puisque SSTest
somme de carrés de variables aléatoires normales, on a

On peut aussi démontrer que

traitements
~Xa -1 si H 0 est vraie,

et que, en général,

Toutefois, les trois sommes des carrés ne sont pas indépendantes puisque 5S ^ et SSf s’ad­
ditionnent pour donner SST. Le théorème l l.l ( à la page suivante), qui est une forme par­
ticulière du théorème de Cochran, sert à développer une procédure de test.
I

CHAPITRE 11

v&
ml&u&œ'1
m H
m B ^ I j !T^i c-i iti >J lnLn»T»in7HtMHBHHBHBIfr
t v V „ > ' • '• •• : V - , * \ î ' i ' > ^ l 3 r b * ; T . - - v s i ^ r V '- '' - l ' S r ^ ’ î v - ï - f ' ^ y V < X L i r ‘f v V * * : \C .' . - . V > £ ? • ^ ' - V . «.
< y.
«. •'st:.
f .

^ -. .
'■ 4&s^Sase

. . .

Soit Z, pour i = 1, 2, ..., v, des variables indépendantes suivant une loi N(0, i). On pose
V

SI
i=i
Q\ + 42?+ • « •

+ &>

Ô (i=l, 2, ..,., 5). Alors Q.,


ô „ .,42
v V, +
1 V
2, + ••• + V
.9.

En utilisant ce théorème, on remarque que la somme des degrés de liberté de SS traitements et


2
de SSC est N
E ---------- 1 (exactement les degrés de liberté de SST ),
' ---------------------------------------- o ------------------------------ -------------- T/J
ce qui implique que SS traitements
I g
et SS J a 2 sont des variables aléatoires khi-carré indépendantes.

Statistique du test pour H0: r, = r. T O


Sous l'hypothèse nulle, la statistique
SStraitem ent?,/(a-l).,.M S traitements
F,o (11.13)
SS,/(N-a) MS E

suit la loi Fa]. Les grandeurs A/5,(raitements et MSsont des m


squares).

Les espérances mathématiques des moyennes de carrés servent à démontrer que F0 de


l’équation 11.13 est une statistique du test appropriée pour H0: r. = 0 (pour = 1, ..., a) et à
déterminer le critère de rejet de cette hypothèse nulle.
On peut montrer que
2
E(MSe) G
et que
a
2
n Ti
-2 , /=!
E(MS traitements ) (7 +
<2 - 1

Démonstration

On voit aue MSE est toujours un estimateur sans 1 .2


MS traitements estimateur sans biais de g 2. mais
espérance mathématique de MS traitements est supérieure à cr2. Donc, sous l’hypothèse alterna-
l’espérance mathématique du numérateur de la statistique FQdu test (voir l ’é quation 11.13)
ipérieure à l’espérance mathématique de son dénominateur. Par conséquent, on rejette H
valeur observée (f0) de la statistique FQest grande, ce qui implique une région critique
térale à droite.
L'analyse de la variance et les plans d'expériences

Règle de rejet de H0: r, = r2 = ••• = rg= O


On rejette H0 si
fo ^ —I,
où /0 est la valeur observée de la statistique F de l’équation 11.13.

La figure 11.3 illustre la zone de rejet de H0.

La zone de rejet de l'hypothèse d'égalité des moyennes des a traitements

Le tableau 11.3 résume la procédure du test et constitue un tableau d’analyse de la variance.

Tableau 11.3 Le tableau d'analyse de la variance pour le modèle à effets fixes


' V* ^ pi
, •« ' * K < -\ f . ' ^ V^“
d'un plan à un facteur
v a J 1V- '
CCT / * *\i"# K 11— % 0 *
‘A -T .m W *lr * > r mT i" V a yiM f r i k>■ .11 fi 11 * f l i 4. V a - •- ^ * ? ^ ’V ' ’ ‘ ^ . 7" < * • •** :

Source de Somme Nombre de degrés Moyenne


variation des carrés de liberté des carrés I f „

Entre les i r a i tc m c n u i

a- MS
,
traitements
,

mse
1

traitements 4 traitements

Erreur (dans MSEf


55_E N-a
les traitements)
ssT N-
f

Total 1

Exemple 11.4

On considère à nouveau l’expérience de la concentration en bois dur décrite à l’exemple 11.1. On peut
utiliser l’analyse de la variance pour tester l’hypothèse que des concentrations différentes en bois dur
n’influent pas sur la résistance moyenne à la traction du papier. On limite l’erreur de première espèce à 1 .
1. Hypothèses et seuil
HQ: ju{= F2= = ou encore H 0: t1 = t2 = t3 = t4=0.

2. Règle de rejet de H0
On rejettera H0 sif(3> F0Ql;3,20 4,94. ►
CHAPITRE 11

3. Calcul de la statistique observée


Les sommes des carrés ont été calculées précédemment et sont incluses dans le tableau 11.4.

'J \ ■ L 'ti ' rt-.‘


t / J t i J y / j B j >•*

Source de Somme Nombre de degrés Moyenne


variation des carrés de liberté des carrés /.
I Concentration
382,79 3 127,60 19,61
en bois dur
Erreur 130,17 20 6,51
Total 512,96 23

4. Décision
Comme la statistique observée est supérieure à F001.320 = 4,94, on rejette H0.
5. Conclusion
La concentration en bois dur de la pâte influe de façon significative sur la résistance du papier.
Si on voulait calculer la valeur P de ce test, il faudrait évaluer la probabilité d’observer une statistique
F0 au moins aussi extrême que 19,61 si H0 était vraie. En d’autres termes, quelle est la probabilité
qu’une variable aléatoire suivant une loi de Fisher à 3 et 20 degrés de liberté prenne une valeur au
moins aussi grande que 19,61 ? Cette probabilité est presque nulle, ce qui indique que H0 a été rejetée
avec une grande conviction.

11.1.5 Le plan d'expériences déséquilibré


Dans certaines expériences à un seul facteur, le nombre d’observations effectuées dans chaque
traitement peut être différent. Le plan d’expériences est alors dit «déséquilibré». L’analyse
de la variance décrite plus haut est encore valide, mais il faut modifier légèrement les for­
mules des sommes de carrés. Soit n.i le nombre d’observations effectuées dans le traitement
(où i = l, 2, ..., a), et soit N = X?=l ni le nombre total d’observations. Les formules de calcul
des sommes de carrés deviennent

traitements

traitements

= X (", - DS,2.
i=l
Pour résoudre les équations normales afin d’estimer les paramètres ji et T, on utilise la contrainte
XJL, niî i = 0. L’analyse de la variance n’exige aucun autre changement.
L'analyse de la variance et les pians d'expériences

Deux avantages importants militent en faveur du choix d’un plan d’expérience-s équilibré. Le
premier est la relative insensibilité de la statistique du test aux petits écarts à la supposition d’éga­
lité des variances si les tailles des échantillons sont égales. Ce n’est pas le cas pour des tailles
d’échantillons inégales. Le deuxième est la maximisation de la puissance du test si les tailles des
échantillons sont égales.

11.1.6 L'analyse des résidus et la validation du modèle


L’analyse de la variance avec le modèle à un facteur suppose que les observations sont norma­
lement et indépendamment distribuées, avec la même variance à chaque niveau du facteur. On
doit vérifier ces suppositions en examinant les résidus.

Résidu du modèle d'analyse de la variance à un facteur


Un résidu est une estimation de l’erreur aléatoire pour chaque observation, qui se
7

IJ Y e 11

autrement dit la différence entre une observation et la moyenne du traitement correspondant

Exemple 11.5

Le tableau 11.5 indique les résidus (en livres par pouce carré) pour l’expérience de la concentration
en bois dur.

3 ' U'J *.A


*'■ C v*V- **

—V^
N«>f . à J P
*■ < À| * D*^^a
^B1^
^ AiW
BH f 4 V
f
l^^
BBw #■B. T
Vm_T• V
U)V u ■
■u 1JNA U
Af ^
BT Bit SJ i . { 1 I
"•^
B B V
V• T
jHV• r» 1r ^
1 W^r W
'
V ï JV 1 W ÆJ
f 1 Il »y w 1 1 bJ 1 l r l 1 • MB■ 1 ♦ I L >. * . I

Concentration 1
«

-/ I

en bois dur Résidus (lb/po2)


5% -3,00 -2,00 5,00 1,00 - 1 ,00 0,00
10% -3,67 1,33 -2,67 2,33 3,33 -0,67
15% -3,00 1,00 2,00 0,00 -1,00 1,00
20% -2,17 3,83 0,83 1,83 -3,17 -U 7

Il existe des tests d’hypothèses sur les résidus qui permettent de valider les postulats du
modèle en spécifiant un seuil a, mais on se contentera ici de présenter des méthodes graphiques.

La normalité des observations


On vérifie la supposition de normalité en analysant l’histogramme des résidus ou encore te gra­
phique quantile-quantile des résidus. Si l’histogramme se présente sous la forme d’une cloche
relativement symétrique, et si le graphique de probabilité est une droite plutôt qu’un S ou un arc,
alors on peut dire que l’hypothèse de normalité est raisonnable.
CHAPITRE 11

Exemple 11.6

La figure 11.4 montre l’histogramme et le diagramme quantile-quantile normal des résidus de l’expé­
rience de concentration en bois dur. Ces graphiques ne révèlent aucune déviation grave du postulat de
normalité des observations.

. . . « *- ■«• I ■ t . i ^ ■

a) [/histogramme des résidus de l'expérience de concentration


en bois dur; b) le diagramme quantile-quantile normal des résidus
de l'expérience de concentration en bois dur

L'égalité des variances intratraitements


Pour vérifier la supposition des variances égales à chaque niveau du facteur, on représente les
résidus en fonction des niveaux du facteur et on compare l’étendue de ceux-ci d’un traitement à
l’autre. Il est aussi utile de représenter les résidus en fonction des ÿ (parfois appelées « valeurs
ajustées»). La variabilité des résidus ne doit dépendre en aucune façon de la valeur de ÿ . Si ces
points présentent une tendance systématique, il faut effectuer une transformation des données,
c’est-à-dire analyser les données selon une métrique différente. Par exemple, si la variabilité des
résidus augmente avec ÿ , il faut considérer une transformation telle log y ou yfÿ. Dans certains
problèmes, on peut aussi utiliser les transformations 1/y et les puissances de y. On recommence
l’analyse pour les données transformées, puis on vérifie si les postulats sont mieux respectés.
Cette tâche peut paraître longue à première vue, mais avec un ordinateur, ce n’est qu’une question
de secondes.

Exemple 11.7

La figure 11.5 représente les résidus tracés en fonction du numéro du traitement et de la valeur ajustée
ÿ... Bien que les étendues ne soient pas identiques d’un traitement à l’autre, les variations des observa­
tions diffèrent trop peu pour qu’on s’inquiète que ce postulat ne soit pas respecté. ►
L'analyse de la variance et les plans d'expériences

10,0 15,0 20.0 25.0 v

&

a) Le graphique des résidus en fonction du numéro du traitement;


b) le graphique des résidus en fonction des valeurs ajustées

L'indépendance des observations


Un bon plan d’expériences (c’est-à-dire une bonne randomisation des traitements, entre autres)
est garant d’une relative indépendance entre les observations. On peut toujours vérifier si une
dépendance temporelle existe en traçant le graphique des résidus en fonction de l’ordre des
essais dans lequel l’expérience est effectuée. Une tendance systématique dans ce graphique, par
exemple des suites de résidus positifs ou négatifs, peut indiquer que l’ordre des essais est impor­
tant, ou que les variables qui changent dans le temps sont importantes et n’ont pas été incluses
dans le plan d’expériences ou dans le modèle d’analyse.

11.1.7 Les comparaisons de moyennes deux à deux


Le rejet de l’hypothèse nulle dans l’analyse de la variance du modèle à effets fixes implique
qu’il existe des différences entre les moyennes des a traitements, mais la nature exacte de ces
différences n’est pas spécifiée. Dans cette situation, des comparaisons plus poussées entre les
groupes des moyennes de traitements peuvent être utiles.
Considérons l’expérience sur la concentration en bois dur de l’exemple 11.1. Comme on a
rejeté l’hypothèse globale d’égalité des moyennes, on sait que certaines concentrations en bois
dur engendrent des résistances à la traction différentes des autres. Mais quelles concentrations
provoquent ces différences ?
Les analystes veulent parfois tester toutes les paires possibles de moyennes. Les hypo­
thèses milles sont alors HQ: (l. = fj.pour tous les j. Plusieurs procédur
moyennes deux à deux peuvent être utilisées, comme la méthode de Fisher, qui repose sur les
intervalles de confiance sur une différence de moyennes, la correction du seuil de Bonferroni,
le test de Newman-Keuls (Newman, 1939 ; Keuls, 1952), le test d’étendue multiple de Duncan
(Duncan, 1955) et le test de Tbkey (Tukey, 1953). Nous décrivons ici la méthode de Fisher,
celle de Bonferroni et le test de Tbkey. Une discussion traitant de l’inférence sur les combinai­
sons linéaires de moyennes, dont le cas particulier des contrastes, peut être consultée sur (J*J.
CHAPITRE 11

La méthode de Fisher
L’idée de base de la méthode de Fisher consiste à calculer la plus petite différence significative
moyennes (PPDS, ou en anglais LSD, pour least significant différence) consi­
dérer significative toute différence de moyennes échantillonnales supérieure à cette valeur. La
PPDS est en fait la marge d’erreur de l’intervalle de confiance sur une différence de moyennes.
Si l’on suppose que les erreurs sont normalement distribuées, chaque Y suit une loi
g 1!ri). En utilisant MSE comme estimateur de <72, on peut utiliser la loi t pour établir
l’intervalle de confiance sur la différence des moyennes. Ainsi,

(Yi. - Y j.) ± t a/2; N _«V2M S^/n (11.14)

est un intervalle de confiance à 100(1 - a) % pour - c’est-à-dire la différence entre la


moyenne du traitement i et celle du traitement La plus petite différence significative selon
la méthode de Fisher est donc
PPDS t a/2; N _aJ2 M S E/n.
n veut comparer les moyennes de a groupes, cette procedure revient a faire
m a(a l)/2 tests de Student de comparaisons de moyennes (ou encore à construire
a (a l)/2 intervalles de confiance de niveau 1 - a et vérifier s’ils contiennent 0). Or, un désa­
vantage accompagne cette méthode : étant donné la multiplicité des tests, la probabilité globale
de déclarer significative au moins une différence qui ne l’est pas réellement est 1 0 a ) m, soit
une probabilité plus élevée que a. La méthode de Bonferroni apporte une correction du seuil
pour régler ce problème. La méthode de Tukey utilise quant à elle une distribution différente
de celle de Student, ce qui augmente la plus petite différence significative, mais diminue la
puissance des tests.

La méthode de Bonferroni
Cette méthode consiste à diviser le seuil des tests par le nombre de comparaisons à effectuer,
soit m= a(a - l)/ 2. Supposons, de façon générale, qu’on a besoin de intervalles de confiance
et qu’on souhaite obtenir une probabilité de 1 - a que tous ces intervalles contiennent la vraie
valeur de la différence. Selon l’inégalité de Bonferroni,
P(les m énoncés sont tous simultanément justes) 1 a> 1 5>„ (11.15)
1=1
OÙ 1 a. représente le niveau de confiance associé au Même intervalle en cause. Dans la pra­
tique, on définit le niveau de confiance simultané 1 - a, puis on choisit chaque valeur a. de
manière à ce que Z™, a, - a . Pour ce faire, on pose habituellement a. = a / m .
La plus petite différence significative selon cette méthode, notée BON pour Bonferroni, est donc
IM S E
BON = ta/2m\ N-a
n

Exemple 11.8

Reprenons l’exemple des concentrations en bois dur. La plus petite différence significative selon la
méthode de Fisher est
2(6,51)
PPDS = t0,025; 20 2,086(1,473) = 3,07.
6 ►
L'analyse de la variance et les plans d'expériences

Selon Bonferroni, on obtient une valeur un peu plus grande (donc plus conservatrice) :
4(4-1) a • x - H
m = -------- = 6 comparaisons à effectuer
2
2(6,51)
BON = t0,05/12:20 2,927(1,473) = 4,31.
6
Les différences significatives obtenues après avoir évalué les différences de moyennes observées sont
indiquées ci-dessous.
PPDS BON
bv - y J = 110,00 -- 15,67| == 5,67 (signif.) (signif.)
lÿ,. - ÿ j | = 1
10,00 -- 17,00| == 7,00 (signif.) (signif.)
= |10,00 -- 21,17| == 11,17 (signif.) (signif.)
i
&

|y2. ~ y 3*I = 1
15,67 -- 17,00| == 1,33
\ÿ2. ~ ÿ+1= 115,67 -- 21,17| == 5,50 (signif.) (signif.)
\ÿ* ~ ÿ . | = 1
17,00 -- 21,17| ==4,17 (signif.)
On peut tracer le graphique des moyennes des traitements en reliant par un trait horizontal les moyennes
qui ne sont pas différentes ( voir les figures 11.6et 11.7).

Les résultats de la méthode de Fisher

T T T -
10,0 12,0 14,0 16,0 18,0 20,0


'r
y v .

IhileS
*■. t ;

' ^
A * t Les résultats du test de Bonferroni

Le test de Tukey
La procédure de Tükey utilise une loi appelée « distribution de l’étendue studentisée ». La sta­
tistique de l’étendue studentisée est

où Kmax est la plus grande moyenne d’échantillon et min, la plus petite moyenne d’échantillon.
Appelons qa. ale quantile d’ordre 1 — a de la distribution de , où a est le nombre d
360 CHAPITRE 11

traitements et f, le nombre de degrés de liberté de l’erreur. Deux moyennes observées, y et


y (i ^ j), sont différentes de façon significative si

(11.16)

La table VII de l’annexe contient les valeurs de q Of* ci%j pour a = 0,05 et 0,01, ainsi qu’un
choix de valeurs de a et d e / Dans la procédure de Tukey, le seuil de signification de l’ensemble
est exactement a pour des tailles d’échantillons égales et au plus a pour des tailles d’échantil­
lons inégales.

Exemple 11.9

Appliquons le test de Tukey à l’expérience sur les concentrations en bois dur. On se souvient que
a = 4 traitements, n —6 et MSE = 6,51. Les moyennes des traitements sont
5v = 10,00 lb/po2, ÿ2. = 15,67 lb/po2, ÿ„ = 17,00 lb/po2, % = 21,17 lb/po2.
Selon la table VII de l’annexe, si a = 0,05,
rence significative entre deux moyennes est

En d’autres mots, on conclut que deux moyennes sont différentes de façon significative si

Les différences des moyennes des traitements sont indiquées ci-dessous.


l>v - ÿ* = 110,00 -- 15.67| == 5,67 (signif.)
|ÿ,. - ÿy. = 110,00 -- 17,00| == 7,00 (signif.)
|ÿ,. - ÿ4. = 110,00 -- 21.17| == 11,17 (signif.)
|ÿ2. - ÿ3. = 115,67 -- 17,00| == 1,33
\ÿ2. ~ ÿ j 1= 115,67 -- 21.17| == 5,50 (signif.)
|ÿ3. - ÿ j 1= 117,00 -- 21,17| == 4,17 (signif.)
Donc, toutes les paires de moyennes ont une différence significative, sauf la paire y2> —y3>. Dans cet
exemple, on obtient donc les mêmes conclusions avec la méthode de Tukey qu’avec la méthode de Fisher.

On peut aussi établir des intervalles de confiance simultanés sur les différences des paires
de moyennes selon la méthode de Tukey. Il est démontré que

lorsque les tailles des échantillons sont égales. Cette expression représente un intervalle de
confiance simultané à 100(1 — a )%sur toutes les paires de moyennes //. —
L’interprétation des intervalles de confiance est simple. Si la valeur 0 est comprise dans
l’intervalle, la différence entre les deux moyennes n’est pas significative au seuil de significa­
tion a. On note que le seuil a , dans la procédure de comparaison multiple de Tukey, représente
L'analyse de la variance et les plans d'expériences 361

une probabilité d’erreur expérimentale. Par rapport aux intervalles de confiance, a repré­
sente la probabilité qu’au moins un intervalle de confiance sur les différences deux à deux ne
contienne pas la véritable différence (pour des tailles d’échantillons égales).

Dans de nombreux problèmes expérimentaux, il faut planifier l’expérience de manière à contrô­


ler la variabilité provenant de variables nuisibles, c’est-à-dire des facteurs qui ont une influence
sur la variable Y, mais qui ne sont pas d’intérêt premier pour le chercheur.

Le plan d'expériences
A titre d’exemple, on peut revoir la situation de l’exemple 10.22, dans laquelle deux procé­
dures différentes étaient utilisées pour prédire la résistance au cisaillement de poutres en acier.
Puisque chaque poutre avait une résistance potentiellement différente et que cette variabilité
de la résistance n’était pas d’un intérêt direct, on a planifié l’expérience en utilisant les deux
méthodes compare la différence des mesures de résistance moyenne
à 0 en utilisant un test t apparié
Le test t apparié est une procédure qui permet de comparer deux moyennes lorsqu’on ne peut
effectuer tous les essais expérimentaux dans des conditions homogènes. Donc, le test t apparié
diminue le bruit (les variations indues) dans l’expérience en bloquant l’effet d’une variable
confondante (ou nuisible). Le plan d’expériences en blocs aléatoires est un prolongement du test t
apparié qu’on utilise dans les situations où le facteur d’intérêt possède plus de deux niveaux.
À titre d’exemple, supposons qu’on désire comparer l’effet de quatre produits chimiques
différents sur la résistance d’un tissu particulier. On sait que l’effet de ces produits varie beau­
coup d’un morceau de tissu à l’autre. Dans cet exemple, on n’a qu’un facteur : le type de produit
chimique. On peut donc choisir plusieurs morceaux de tissu et comparer l’effet des quatre pro­
duits chimiques dans les conditions relativement homogènes fournies par chaque morceau de
élimine
complets
randomized complété block design) consiste à choisir b blocs et à répéter de façon identique
l’expérience à un facteur dans chaque bloc, comme l’illustre la figure 11.8. Il y a a observations
(une par niveau de facteur) dans chaque bloc, et l’ordre d’exécution de ces observations dans
chaque bloc est assigné au hasard.

Bloc 1 Bloc 2 Bloc b


yu Yn Y\b
y* Y22 Y2b
*3. Yyi « • • Y2b
* • •

Yal Ÿal Yah

La structure des données dans le plan d'expériences en blocs aléatoires complets


CHAPITRE 11

L'analyse statistique
Maintenant, analysons statistiquement un plan d’expériences en blocs aléatoires.

Modèle statistique du plan à blocs aléatoires complets


On représente les observations par le modèle statistique linéaire

(11.17)

où fj. représente la moyenne globale, T. est l’effet du i-ième traitement, f$ est l’effet aléatoire du y-ième
bloc et E.V, le terme d’erreur aléatoire.
,, * h. . ^

Les effets des traitements sont, par définition, des écarts à la moyenne globale, de sorte que
X“=, T, = 0. Le modèle suppose également que /?; ~ N(0, Gp), que cr2) et que les fi. et les
E..sont indépendantes.

Hypothèses à tester avec un plan à blocs aléatoires


On souhaite tester l’égalité des effets des traitements, autrement dit
H. : = - = = 0,
H(: r * 0, pour au moins un i.

Soit
Y et Y , la somme et la moyenne de toutes les observations effectuées avec le traitement i ;
Y et Y,., la somme et la moyenne de toutes les observations dans le bloc y;
y . et y ., la somme et la moyenne de toutes les observations ;
N = ab, le nombre total d’observations. «

La somme totale des carrés se décompose comme suit :

SST
T
= SS,
traitements
, , +
blocs
SS» + SSF
E. (11.19)
La décomposition du nombre de degrés de liberté correspondant à l’équation 11.19 est
ab 1 (a 1) + (b - 1) + (a m i) . ( 11.20 )

Statistique du test global de comparaison des moyennes . .* . ,

• _ ■ V * • • ( à. ' . , . m ■ ■ . ( . •* ■ * ~ f - • . 'f

L’hypothèse nulle correspondant à aucun effet de traitement (HL: T. = 0 pour tout i) est testée par le
rapport F(), c'est-à-dire
SS traitem ents /(a - 1) MS traitem en ts
SSF/(a -\)(b -\) MS
qui suit une loi de Fisher à (a - 1) et (a - l)(b - 1) degrés de liberté lorsque H0 est vraie.
L'analyse de la variance et les plans d'expériences

Le tableau 11.6 résume l’analyse de la variance; il donne aussi les formules des sommes de-
carrés, pour le calcul à la main.

Tableau >a

. * • Nombre .
Source de 5 Somme de degrés Moyenne f. ; • ..
variation des carrés de liberté des carrés F. Valeur P
1UJ| |- -*
jp|'
a yr2 x/2 MStraitements
cetraitements lYIiJ P{F >/0). où
Traitements s s .
- y '•
JLu ^ ~ a- 1
traitem ents
a-l MSE
Y2 V 2
b
Blocs ss.. = y 'j Y~ b- 1 ^ ^ b lo c s

b,ocs % a ab b- 1
55£
Erreur ssF
E
= ssT
T
- SS, , ,
traitements
- SSM
blocs (a - 1 )(* - 1 )
(a- 1)0 - 1)
.
a b r^2
Total SST
T
- y y Y.2 -
JLujLu v _l. ab- 1
1*1 7=1

Exemple 11.10
Une expérience a été menée afin de déterminer l’effet de quatre produits chimiques différents sur la
résistance d’un tissu. Cinq échantillons de tissu ont été choisis, et chaque produit chimique a été testé
dans un ordre aléatoire sur chaque échantillon de tissu. Dans cette expérience, les quatre produits
chimiques représentent les traitements, et les cinq échantillons de tissu sont les blocs aléatoires. Le
tableau 11.7 présente les données en question.

Tableau 11.7 Les données relatives à la résistance du tissu (en livres par pouce carré)
A

- - -
Produit
...
Echantillon de tissu Somme par Moyenne par I
chimique traitement traitement j
1 2 3 4 5 % ÿ !
1 1,3 1,6 0,5 1,2 1,1 5,7 1,14
2 2,2 2,4 0,4 2,0 1,8 8,8 1,76
3 1,8 1,7 0,6 1,5 1,3 6,9 1,38
4 3,9 4,4 2,0 4,1 3,4
£
OO

3,56
#*>

Somme par bloc 9,2 10,1 3,5 8,8 7,6 y.. = 39,2 X. = 1,96
Moyenne par bloc ÿ 2,30 2,53 0,88 2,20 1,90

1. Hypothèses et seuil
H0• Ml ~/^2~ 7^3— ou encore Ho:r, = r = t = t =0.
Fixons a= 0,05. ►
CHAPITRE 11

2. Règle de rejet de H0
On rejettera H0 sif0> ^o.os;3.12— 3,49.
3. Calcul de la statistique observée
Les sommes de carrés de l’analyse de la variance sont calculées comme suit :

SST

2 2 (39,2) 2

(l,3)2 + (l,6 r+ -+ (3 ,4 ) 25,688,


20
4 2 2
tra ite m e n ts
y
b ab
2 2
(5,7)2 +(8, 8)' +(6,9)‘ +(17,8) (39,2) 2

18,044,
5 20

SS b lo cs y T-2, y2
;=1 <2^
2 2
(9,2)2 +(10,1)^ + (3,5)^ +( 8, 8)z +(7,6) (39,2) 2

6,693,
4 20
SS ^ S j ‘^'■^'blocs ‘“^‘■^traitem ents

0,951.

Le tableau 11.8 résume l’analyse de la variance.

4. Décision
Puisque 75,9 dépasse largement la valeur critique de 3,49, on rejette clairement l’hypothèse d’égalité
des moyennes. La petite valeur P nous mène à la même conclusion.
5. Conclusion
La différence entre les produits chimiques (en ce qui concerne leur effet sur la résistance du tissu) est
significative.

Le blocage est-il utile?


Supposons qu’on a effectué un plan d’expériences en blocs aléatoires, mais que le blocage
n’était pas vraiment nécessaire, car les unités expérimentales sont très homogènes. Il y a
L'analyse de la variance et les plans d'expériences

20 observations et 12 degrés de liberté pour l’erreur. Si l’expérience avait été exécutée comme
un plan d’expériences complètement aléatoire à un seul facteur avec b répétitions pour chaque
niveau, on aurait eu 16 degrés de liberté pour l’erreur. Donc, le blocage a coûté 4 degrés de
liberté pour l’erreur. Par conséquent, puisque la perte en degrés de liberté pour l’erreur est petite
(comme c’est le cas habituellement), s’il existe un soupçon raisonnable que les effets des blocs
soient importants, l’expérimentateur doit utiliser un plan d’expériences en blocs aléatoires. Cela
lui permet de partitionner la somme des carrés des erreurs et d’augmenter la valeur observée de
la statistique F, donc d’augmenter la puissance du test.
Si l’expérimentateur se trompe sur l’effet des blocs, l’impact de la légère perte en
degrés de liberté pour l ’erreur est négligeable, sauf si le nombre de degrés de liberté est très
petit. Vous pouvez comparer cette discussion à celle qui est présentée à la fin de la sous-
section 10.3.4.

La comparaison da moyennes deux à deux


Si l’analyse de la variance indique qu’il existe une différence entre les moyennes des trai­
tements, on doit habituellement effectuer quelques tests de suivi pour isoler les différences
spécifiques. Plusieurs méthodes de comparaisons multiples existent. On peut par exemple
utiliser la méthode de Fisher, qui consiste à établir les intervalles de confiance des diffé­
rences de moyennes prises deux à deux. Pour une approche plus conservatrice, on utilisera la
correction de seuil de Bonferroni ou le test de Tükey présentés à la sous-section 11.1.7. Dans
le cas d’une expérience avec des blocs aléatoires complets, il suffit de remplacer n par le
nombre de blocs (b) dans l’équation 11.14. On note également que dans ce plan d’expériences,
le nombre de degrés de liberté à l’erreur e s t/= {a — 1 — 1).

Exemple 11.11

Pour illustrer la procédure de Tukey, on se souvient que les quatre moyennes des produits chimiques
de l’exemple 11.10 sont
ÿ,. = 1,14, ÿ2. = 1,76, ÿ3. = 1,38, ÿ4. = 3,56.
La plus petite différence significative entre deux moyennes est

MS*
^0,05; 4,12 b - 4 , 2 0 . 1 ^ = 0,53
5
On conclut donc que deux moyennes sont différentes de façon significative si
ly, ~ yj.I > 0,53.
Les valeurs absolues des différences des moyennes des traitements sont énumérées ci-dessous.
l>,. -- >J == 11,14 - 1,76| ==0,62 (signif.)
l>,. -■ >3.l== |1,14 - 1,38| ==0,24
l>,.-- >4.l == |1,14 - 3,56| «= 2,42 (signif.)
I>2. ■" >3.l=- H,76 - 1.38| == 0,38
l>2.- - >4.1:= |1,76 - 3,56| =
= 1,80 (signif.)

I>3. ■“ >4.l =
: |1,38 -- 3,56| =
= 2,18 (signif.) ►
CHAPITRE 11

Les résultats indiquent que les produits chimiques 1 et 3 ne diffèrent pas, de même que les pro­
duits 2 et 3. La figure 11.9 présente les résultats sous forme graphique ; les paires reliées par un
trait ne diffèrent pas.

T.. t> y2. y a-


W w ^
I
I
.
i
I

“ T------------ 1------------ 1------------ 1------------ 1------------ !----*"


1,00 1,50 2,00 2,50 3,00 3,50 [

I
A
1

ï

Les résultats des comparaisons multiples entre les moyennes


avec la méthode de Tukey

L’exemple suivant présente les comparaisons multiples avec les méthodes de Fisher et de
Bonferroni.

Exemple 11.12
La plus petite différence significative avec la méthode de Fisher (sans correction pour le seuil global),
est

2MS
PPDS = î0.025; 12 2,179J2(Q^Q8) =0,39.
b

Avec la correction de Bonferroni, avec a = 4 traitements, on obtient m = 6 et

2MSE
BON = t0,05/12; 12 3,153J =0,56.
b
Dans les deux cas, on obtient les mêmes résultats qu’avec le test de Tukey.

L'analyse des résidus et la validation du modèle


Dans tout plan d’expériences, il est toujours important d’examiner les résidus et de vérifier si des
violations des suppositions de base peuvent invalider les résultats.

Résidus du plan à blocs aléatoires


Les résidus d’un plan d’expériences en blocs aléatoires sont les différences entre les valeurs observées
et les valeurs ajustées

où les valeurs ajustées sont


( 11.21)

La valeur ajustée représente l’estimation de la réponse moyenne quand le Même traitement


est exécuté dans le y-ième bloc.
L'analyse de la variance et les plans d'expériences

Exemple 11.13
Le tableau 11.9 indique les résidus de l’expérience de l’exemple 11.10.
7 . ■1 . ' J * J ‘ | a V

— j f j r . f a s 7 — * - l / » » ' V * «B p '

J * .

! » g

Produit Échantillon de tissu


chimique 1 2 3 4 5
1 -0,18 -0,11 0,44 -0,18 0.02
2 0,10 0,07 -0,27 0,00 0.10
I
.

3 0,08 -0,24 0,30 -0,12 0.02


4 0,00 0,27 -0,48 0,30 -0,10

Les figures 11.10 et 11.11 présentent les graphiques importants des résidus de l'expérience. D'après le
graphique quantile-quantile, la loi normale semble un bon modèle pour les résidus. On remarque que
l’échantillon de tissu (bloc) 3 présente une plus grande variabilité en résistance lorsqu’il est traité avec
les quatre produits chimiques que les autres échantillons. De plus, on note que le produit chimique 4,
qui fournit la plus grande résistance moyenne, présente aussi un peu plus de variabilité en résistance.
Des expériences de suivi peuvent être nécessaires pour confirmer ces remarques si elles sont poten­
tiellement importantes.

eu\ ea\
0,5- 0,5-

0 0 ♦
1 2 •3 A Traitement 1 .2 3 A \5 Bloc

-0,5- -0,5-
a) b)
Les résidus (en livres par pouce carré) : a) par traitement; b) par bloc

eij•*
0,5

0 ♦ ■t
2 4 6 y>j

2 1 0 1
0,5-
Z,
a) b)
a) Les résidus (en livres par pouce carré) en fonction des valeurs
prédites Y ; b) le graphique quantile-quantile normal des résidus
CHAPITRE 11

11.3 Les plans factoriels à deux facteurs


Lorsqu’une expérience comporte plusieurs facteurs d’intérêt, on devrait alors utiliser ce qu’on
appelle un «plan factoriel». Il s’agit d’un plan qui fait varier tous les facteurs simultanément.
De manière plus précise, une expérience factorielle implique que, dans chaque série d’essais
ou répétition de l’expérience, toutes les combinaisons possibles des niveaux des facteurs sont
étudiées. Ainsi, si l’on a deux facteurs A et B, avec a niveaux du facteur A et b niveaux du
facteur B,alors chaque répétition comportera toutes les ab combinaisons de traitements.

Effet d'un facteur


L’effet d’un facteur est défini grâce à la variation de la réponse apportée par la variation du niveau du
facteur. On l’appelle l’«effet principal», car il concerne les facteurs individuels de l’étude.

L'étude de l'interaction
Dans certaines expériences, l’effet d’un facteur n’est pas le même à tous les niveaux des autres
facteurs. Il y a alors une interaction entre les facteurs. Par exemple, prenons les données du
tableau 11.10, où les nombres représentent la moyenne échantillonnai pour chaque combinaison
de traitements. Au premier niveau du facteur B, la moyenne en A2 est supérieure à la moyenne
en A r Au deuxième niveau du facteur B, l’effet de A est inversé : c’est en A l que la moyenne est
supérieure. Puisque l’effet de A dépend du niveau du facteur il y a une interaction entre A et B.
\ ■ m . y , X _ 1 A 'S I * y . a A „ ^ \ yn
B M & «►-/ 9 \ v yiu-i <n 1'■ W 7 £ v . 5 * pj V *• j» . 1{ # ^ . X» 4. . m *' V .A md

Facteur B
Facteur A B 2

10 20
30 0
Lorsque l’interaction est importante, les effets principaux correspondants ont peu de signi­
fication. Par exemple, selon les données du tableau 11.10, l’effet principal de A semble nul,
puisque les moyennes en A { et en A2 sont égales. Cela pourrait nous amener à conclure que le
facteur A n’a pas d’effet. Toutefois, lorsqu’on a considéré les effets de A à différents niveaux du
facteur B, on a vu que ce n’est pas le cas. L’effet du facteur A dépend du niveau du facteur B.
Ainsi, la connaissance de l’interaction AB est plus utile que celle des effets principaux. Une
forte interaction peut embrouiller l’interprétation des effets principaux.
Il est possible d’illustrer la notion d’interaction à l’aide de graphiques. La figure 11.12a) pré­
sente un cas sans interaction des facteurs. On remarque que les droites B ] et B2 sont parallèles,
ce qui indique que les facteurs A et B n’interagissent pas. L’effet de B est le même peu im porte
le niveau de A, et vice versa.
La figure 11.12b) présente un cas avec interaction. Sur ce graphique, les droites B l et B ne
sont pas parallèles ; il y a donc une interaction entre les facteurs A et B. De telles représentations
graphiques s’avèrent souvent utiles lorsqu’on présente les résultats d’expériences.
Pour contourner ces difficultés, on pourrait être tenté de varier un facteur à la fois plutôt
que de varier tous les facteurs simultanément. Cette méthode est inefficace ; elle nécessite plus
d’expérimentations que la méthode factorielle, et elle n’offre pas la certitude d’obtenir les résul­
tats appropriés, car elle ignore l’interaction potentielle (Montgomery, 2001).
L'analyse de la variance et les plans d'expériences

/ c a
O
C/3 oC/2
•a
c
-g G 50-
S g 40-
R s
O <L>30-1
c3 ’c3 20
O-H
g ji 10 -

C73
(U
0-
>
O > T

Al ^2
s
Facteur A
b)

Un plan factoriel: a) sans interaction ; b) avec interaction

Le modèle statistique
La forme la plus simple d’expérience factorielle ne met en jeu que deux facteurs, par exemple
A et B. On a a niveaux du facteur A et b niveaux du facteur B. Le tableau 11.11 présente le plan
factoriel à deux facteurs.

Facteur
Facteur A 1 2
1 Y Y
Z 1U’ '*112’ Y
•‘ lin Y121 Y122
’ ’ ’
Y
A1\2n YIM ’ *Y1*2’ Y
* l*n

2 Y Y Y
-*211* *212’ **•’ *21n Y221 Y Y
x222* ** x'22 *
Y2*1 Y2*2’ ’**’ Y
*2*n

a Y y y ya2r ya22 yaln Yo*l’ Y Y


ail* «12* aln *o*2’ *o*«

c
Il y a « répétitions de l’expérience, et chaque répétition comporte toutes les ab combinai-

sons possibles de traitements. L’observation de la fc-ième répétition de la ÿ-ième cellule, s’écrit


y . Lorsqu’on procède à la collecte des données, il importe d’effectuer les abn observations
dans un ordre aléatoire. Ainsi, tout comme le plan d’expériences à un facteur étudié au début de
ce chapitre, le plan factoriel à deux facteurs est un plan entièrement aléatoire.

Modèle statistique du plan à deux facteurs avec interaction


On peut représenter les observations à l’aide du modèle statistique linéaire suivant :
l 12 ü,

Yijk M + T. + A + (r/J) + J 1.2..... b, ( 11.22 )

k 1.2 ... n.
où /u représente la moyenne globale, r. est l’effet du Même niveau du facteur A. (3 est l’effet du
y-ième niveau du facteur B, est l’effet de l’interaction entre A et B. et , est une composante
d’erreur aléatoire indépendante N(0, <r:) indépendamment distribuée.
T' AJ*vi
y\
-
T* ••1 370 CHAPITRE 11

On désire tester les hypothèses milles voulant que le facteur A n’ait aucun effet significa­
tif, que le facteur B n’ait aucun effet significatif et que l’interaction AB ne soit pas significative.

Hypothèses à tester avec le plan à deux facteurs avec interaction


1. Tester la significativité de l’interaction
H0: (t/3) = 0 pour tout = 1, e t j —1, ..., b.
2. En l’absence d’interaction significative, tester les effets principaux des facteurs individuels
0 pour tout l^ ^C\
H(l : fi = 0 pour tout j l ^ •••• •

Comme pour les expériences à un fac


de la variance pour tester ces hypothèses.

La décomposition de la variabilité
Les facteurs A et B sont fixés, c’est-à-dire que les a niveaux du facteur A et les b niveaux du fac­
teur B sont choisis par l’expérimentateur et que les inférences sont limitées à ces niveaux seulement.
Dans ce modèle, on définit généralement les effets T., J3. et (tj0) comme des écarts par rapport à la
moyenne. Ainsi, X?= l T. = 0, XjL l Pj = 0, Xf=, (rp)* = 0 et X *., (t/?).. = 0.
Soit Y./••7, la somme des observations au i-ième niveau du facteur A,’ Y«y.,*’ la somme des
observations au y-ième niveau du facteur B, Y , la somme des observations de la (/-ième
cellule du tableau 11.11 et Y• M7, la somme de toutes les observations. On définit *]*'
comme les moyennes de la ligne, de la colonne, de la cellule et, enfin, la moyenne
On a donc
y == z z > * l == 1,2,

• ♦•y CL^
7=1 *=1 bn

Y-r •
yV ^ J == 1, 2, • ••)
il

an
y
. y i == 1,2, •• •y CLy
#

• (11.23)
II

= z ^ n 7 == 1,2, •••j
*=1
y••• := z z î x <
A ÿ...=. Y~ +

(=17=1 *=1 abn

La somme totale des carrés corrigée peut s’écrire


b n a b
2 2
Y •M') * 2 (F Y j + an^W Y )
1*= 1 i= 1 7=1
a b £2 b n
Y,i •• - Y y . + Y ) 2 + y.,)2. (11.24)
i= 1j = 1 i « 1j = J * a J

Ainsi, la somme totale des carrés est composée d’une somme des carrés due au facteur A
(SS.), d’une somme des carrés due au facteur B (SSB), d’une somme des carrés due à l’interac­
tion entre A et B (SSAB) et d’une somme des carrés due à l’erreur (SSE). On remarque qu’il doit
y avoir au moins deux répétitions pour obtenir une somme des carrés due à l’erreur non nulle.
L'analyse de la variance et les plans d'expériences 371

On peut écrire l’identité de la somme des carrés de l’équation 11.24 de façon symbolique:

SST = SSA + SSB + SSAB + SSE. (11.25)

Il y a abn —1 degrés de liberté en tout. Les effets principaux de A et de B ont respectivement


a —1 et b — 1 degrés de liberté, tandis que l’effet de l’interaction AB comporte (a— \)(b—1) degrés
de liberté. À l’intérieur de chacune des ab cellules du tableau 11.11, il y a n — 1 degrés de liberté
entre les n répétitions, et les différences entre les observations d’une même cellule ne sont dues
qu’à l’erreur aléatoire. Par conséquent, il y a ab(n —1) degrés de liberté pour l’erreur. Le rapport
de chaque somme de carrés du membre droit de l’équation 11.25 à son nombre de degrés de
liberté est une moyenne de carrés.

La construction des statistiques pour tester l'in te r a c tio n


et les effets principaux
Il est démontré qu’étant donné que les facteurs A et B sont fixes, les espérances mathématiques
des moyennes des carrés sont

E( MS a ) = E

J SS
E( MSb) = E — - j
v &- l y

i=l
E( MS AB) = E + y
(a-D(b-l)

E( MSe ) = E

Par conséquent, pour tester HQ:r. = 0 pour tout (aucun effet dû au facteur A),
H0: p = 0 pour tout j (aucun effet dû au facteur B) et HQ: (tjfi) = 0 pour tout i,j (aucun effet
dû à l’interaction), on divise la moyenne des carrés correspondante par l’erreur quadratique
moyenne. Chacun de ces rapports suivra une loi F, où le nombre de degrés de liberté du numé­
rateur correspond au nombre de degrés de liberté de la moyenne des carrés du numérateur,
le nombre de degrés de liberté du dénominateur est a b { n - 1) et la région critique se situe à
l’extrémité supérieure de la fonction de densité. La procédure de test prend la forme d’un tableau
d’analyse de la variance {voir le tableau 11.12, à la page suivante).
En général, les données de ce genre d’étude sont analysées à l’aide d’un logiciel de statis­
tique qui fournit la plupart des résultats, par exemple ceux du tableau 11.12. Il est rare que de
tels calculs soient faits à la main. Voici néanmoins des formules de calcul efficaces des sommes
des carrés de l’équation 11.25. La somme totale des carrés se calcule ainsi:
a b n \72
Y 2
*ijk (11.26)
i=l y=l *=1 abn
CHAPITRE 11

. l Æ * V b • ‘ r > 2 > kV / j - , ç . . & t2 • s ; ; { A V V r ?j 14 .J & s * K i t


fc ' rJ r * . k . fl. \ V * f I f l ' t » fl * *B
& ^ ^ . b ^ i ‘ j b JL . . Jf . J £ JJ , W 1. 1 '
^ b '"'.'flfi'r „ ^ ci ^ ^bb_a . •>> ? . a* ir0 *'
• ■ ^ '1 V . B • . 1 L ' i ^ J* A . £ ' # 1 . t F S « 1 a v c *> \ • j j’ ï p ,* n j .* (B V> • r K * x /, j a% b 3 1e fl* t v À ¥ t • j .J L ^ v a n « v/C ■ , V V r .* .1 f • f
»J ^ l u i V 1 ■ ■ ■ » ; •• a
1 1 ! ; W J y y - b^ M If a 1* ^ fl 1 fl fl LJQ y I I A * y X ly J 1 afl V IB M _Æ A C { fl I j|
«B H v a E T B J V M M \fl jj0 v *’i U J B a« M ^ B ( ▼ —
. ■ - . -^fl* 1 ^ V _ / >' ^ V * •• • > ■ Sm A ^ J* flBb. “A , • b * T r A t — A*
•• ^
• "flv r * . /S ■e* ■-b■ fl ■ > bfl. * • P-
. .^
4 » .-b
.* »a.--.
-~t a * , jBa . b
a .. a a aa v —»
r y fl —■ ■—. dfll
Ab'^w* . b^ a.
' fl ,k J a * -fl 1 i,
X. J—fl fl . f v f l * f l b . V a flM w ■ -' C W * % P l 3 —fl r t . * i . O \ b fl. y * fl fl' A _
■J fl ’ flfc 7 ‘ f l . . *♦ " w" ^ A % fl
7 if. a^a _^b *1 4l f l a .f l ,’ B| 1 fl l Î^ l ' \ . ■ *. flfl ▼
i* fl ST a 4 p 4i B*fl 4 * 1 L y i !
’ 'à..rT<ï,b ^ l1- fl* '!. * . .b‘"b b J*1. B \ b/ (B ^ -% ^ fl^ fl J# * fc U l %

• aC ' ,* * . .■ --

S o u r c e d e 1 S o m m e N o m b r e d e
M o y e n n e d e s

v a r i a t i o n d e s c a r r é s d e g r é s d e l i b e r t é
c a r r é s

«
o
M S .

A
Traitements de ssA a

5
i l
A - 1

m se

I
ssa m sb
Traitements de B / ? - 1

S S .

M S » “ 6 - 1 m se

Interaction (a - )(b
m s a b

s s AB 1 - 1 ) M S = 5 S -

^ (a-\)(b-\) m s5

Erreur SSB a b ( n - 1 )
MS
ab(n
= , a *

E — 1 )

Total SSr abn - 1

Les sommes des carrés dues aux effets principaux sont

(11.27)
bn abn

(11.28)
an abn
On calcule généralement SSABen deux étapes. Premièrement, on calcule la somme des car­
rés entre les totaux des ab cellules, appelée « somme des carrés due aux sous-totaux » :

Cette somme de carrés inclut SSA et SSB. Donc, la deuxième étape consiste à calculer
comme suit :
SSsous-totaux (11.29)
La somme des carrés due à l’erreur s’obtient par soustraction, c’est-à-dire

(11.30a)

SSsous-totaux (11.30b)
L'analyse de la variance et les plans d'expériences

Exemple 11.1

Il existe deux méthodes pour appliquer des apprêts sur les surfaces en aluminium des aéronefs : l’appli­
cation au trempé et au pistolet. Le rôle de l’apprêt consiste à améliorer l’adhérence de la peinture.
Certaines pièces peuvent être apprêtées à l’aide de l’une ou l’autre méthode d’application. Le service
d’ingénierie souhaite également savoir si les trois différents types d’apprêt disponibles diffèrent dans
leurs propriétés d’adhérence.
Une expérience factorielle est entreprise dans le but d’étudier l’effet du type d’apprêt et celui de la
méthode d’application sur l’adhérence de la peinture. On applique à trois échantillons un type d’ap­
prêt différent à l’aide de chacune des deux méthodes. Ensuite, on applique la peinture de finition et
on mesure la force d’adhérence. Les données recueillies durant cette expérience sont présentées au
tableau 11.13. Les nombres encerclés correspondent aux totaux y des différentes cellules.

Méthode d’application
Type d’apprêt Au trempé Au pistolet y,..
1 4,0 4,5 4,3 CEI) 5,4 4,9 5,6 (E3> 28,7
2 5,6 4,9 5,4 ( E l ) 5,8 6,1 6,3 (TQ) 34,1
3 3,8 3,7 4,0 Cü2> 5,5 5,0 5,0 (ES) 27,0
y.j. 40,2 49,6 89,8 = y...
7 ✓

La figure 11.13 présente un graphique de la force d’adhérence moyenne des cellules, , en fonction
des niveaux du type d’apprêt, pour chaque méthode d’application.

Au pistolet

trempé

------- 1-------
2
Type d’apprêt

Le graphique de la force d'adhérence moyenne en fonction du type d'apprèt


et de la méthode d'application

Le parallélisme des deux courbes semble indiquer une absence d’interaction entre les deux facteurs.
De plus, étant donné qu’une réponse plus élevée correspond à une force d’adhérence supérieure, on
a l’impression que l’application au pistolet est la meilleure méthode et que le type d’apprêt n° 2 est le
plus efficace.
CHAPITRE 11

On calcule comme suit les sommes des carrés nécessaires pour effectuer l’analyse de la variance

55
;=1 ;=i *=i
2 (89,8)
(4,0)3+ (4,5)2H— + (5,0) 10,72,
18
a
\ *Ti*» y».»
, , 2 , , 2

55type (11.31)
bn abn
(28,7)2+ (34,l)2+ (27,0) (89,8)
4,58,
6 18
b v2
55méthode y 1 y..»

(40,2)2+ (49,6) (89,8)


4,91,
9 18

55interaction y...
types ‘^ ‘■^méthode

(12,8)2+ (15,9)2-I----H(15,5) (89,8)


4,58-4,91 = 0,24,
3 18
et
SSE —SST 55type 55méthode 55interacüon
= 10,72-4,58 - 4,91 - 0,24 = 0,99.
Le tableau 11.14 présente un résumé de l’analyse de la variance.

- - - . •

Source de Somme Nombre de degrés Moyenne


variation des carrés de liberté des carrés /.
Type d’apprêt 4,581 2 2,291 27,86
Méthode d’application 4,909 1 4,909 59,70
Interaction 0,241 2 0,121 1,47
Erreur 0,987 12 0,082
Total 10,718 17
1. Test sur l’interaction
H0: (tp ).. = 0 pour tout = 1, 2, 3 et j = 1, 2.
Fixons a = 0,05. Étant donné que 1,47 < Ft0,05 ; 2,12 3,89, on peut affirmer qu’il n’y a pas d’interaction
significative entre ces facteurs.
2. Tests sur les facteurs individuels
Puisque l’interaction n’est pas significative, il est pertinent de s’intéresser aux effets principaux des
facteurs « type d’apprêt » et « méthode d’application ».
Effet de A (type d’apprêt) : H0: T, = r. = t3= 0
Puisque 27,86 est supérieur à F.0 ,05; 2,12 3,89, on rejette H0et on conclut que le type d’apprêt a un effet
sur l’adhérence moyenne.
Effet de B (méthode d’application) : H0: fi 0
Puisque 59,70 est supérieur à Foos., 12 4,75, on rejette H0et on conclut que la méthode d’application a
un effet sur l’adhérence moyenne.
L'analyse de la variance et les plans d'expériences

L a c o m p a ra is o n d e m o y e n n e s d e u x à deux
Lorsque les deux facteurs sont fixes et que les effets principaux des facteurs individuels
sont significatifs, il est possible de comparer les moyennes individuelles de l’un des facteurs
à l’aide du test de Tukey ou d’autres méthodes, comme celles de Fisher et de Bonferroni.
Dans les cas où il n’y a pas d’interaction, ces comparaisons peuvent se faire soit sur les
moyennes du facteur A, ÿ,-.., soit sur les moyennes du facteur B, ÿ.Jt. Par contre, lorsqu’il y a
une interaction significative, les comparaisons entre les moyennes d’un facteur (disons A)
peuvent être faussées par l’interaction AB. On peut alors effectuer les tests de comparai­
sons multiples sur les moyennes du facteur A en fixant le facteur B à un niveau donné, et
inversement.

L 'a n a l y s e d e s r é s i d u s e t la v a lid a t io n d u modèle


Comme c’était le cas avec les expériences à un facteur étudiées au début du chapitre» les
résidus d’une expérience factorielle jouent un rôle important dans l’évaluation de la validité
du modèle.

R é s id u s d'un plan à d e u x fa c te u rs

Les résidus d’une expérience factorielle à deux facteurs sont


e...
. ijk Yijk Y.y.
Ainsi, les résidus représentent la différence entre les observations et les moyennes des cellules corres-
pondantes.

Exemple 11.15
Le tableau 11.15 présente les résidus des données de l’exemple 11.14 sur les apprêts pour les surfaces
d’aluminium des aéronefs.
La figure 11.14 (voir à la page suivante) présente les graphiques des résidus en fonction du type
d’apprêt, et en fonction de la méthode d’application. On peut en déduire que le type d’apprêt n° 3 occa­
sionne une variabilité légèrement plus faible de la force d’adhérence que les deux autres types d’apprêt.
Le graphique des résidus en fonction de la valeur ajustée, y.Jk= ÿÿ„ de la figure 11.15a) ( à la page
suivante) ne révèle aucune tendance inhabituelle ou particulière.
A la figure 11.15b) ( voirà la page suivante), on peut voir
résidus. Les extrémités de ce diagramme ne se situent pas exactement le long d’une droite passant par
le centre du diagramme, ce qui indique qu’il y a potentiellement un problème avec la supposition de
normalité, mais l’écart relativement à la normalité ne semble pas très important
#. —
1Cft ~'da. * V L. .*V" » ^ ■ ^
''.'•ai a• T• I**; \ f 'Hr T'As f i _ _ %»~T ». * ,j - _•»
• ‘y - v t ._••* > .. n ^ 'I ■ * K , * v
BS2 S
. M ' y f*
vr ■ ff ht <' t i r r* V •L r ♦ ■ A ■ A 1 ^ V >» ^ w \P* m ^ W
‘V . X * t | ' A « J*1t ♦ VVa * J £ s Q ï Bf*
■ MK k l
< ■ Æ
i 7 • V tr ik v£
fv m. _V »
i
1i f *5 A ■■ a ! *•■*. , 1 *—
V 3k L ▼ U y J . fl S FJL H k • l » 'C ■ * jj ^ ï 1 • " • ^3 . i * f - * K 3 v 3 KB^Qt
\ j t M. d K—'' \ 'b» * 1 f t *—< iïi ,x » Aa, V i* , ->a ( » .. F1^
. /J f AA ’ ■*v_ > v . %J 4 >.•*.' Ml i s .' ’ •—«-CJ ‘ ^ y.
i «m‘ “ _**— .'a ' ■.^ «>. -k_vv
, a. B. "k, ^
WU -JT * * B CW• aC*" "

Méthode d’î
S— * F *
Type d’apprêt Au trempé j Au pistolet j
.
1 -0,27 0,23 0,03 0,10 -0,40 0,30

2 0,30 -0,40 0,10 -0,27 0,03 0,23


£3
O

-0,03 0,17 0,33 -0,17


1
U)
l
o

3 ►
CHAPITRE 11

i
?

i
J
;

Méthode
d’application

Le graphique des résidus en fonction: a) du type d'apprêt; b) de la méthode


d'application
»

a) Le graphique des résidus en fonction des valeurs prédites Y i j k ~ K ,y .;


b) le graphique de probabilité normal des résidus

Le cas d'une seule observation par cellule


Dans certains cas, une expérience factorielle à deux facteurs peut comporter une seule répé­
tition, autrement dit une seule observation par cellule. Il n’est donc pas possible de tester les
hypothèses sans formuler quelques suppositions supplémentaires. En général, on suppose qu’il
n’y a pas d’effet d’interaction et on utilise la moyenne des carrés due à l’interaction comme une
moyenne des carrés due à l’erreur. Pour plus d’information sur le sujet, vous pouvez consulter
Montgomery (2001).

Les plans factoriels à plus de deux facteurs


Les plans factoriels à plus de deux facteurs sont complexes et nécessitent plusieurs essais, en
particulier si certains des facteurs possèdent plus de deux niveaux. Cela nous amène à considé­
rer une classe de plans factoriels où tous les facteurs ont exactement deux niveaux. Ces plans
sont très simples à établir et à analyser.
L'analyse de la variance et les plans d'expériences

11.4 Le plan factoriel 2 k


Dans cette section, nous considérerons un plan factoriel à k facteurs, où chacun des facteurs a
deux niveaux possibles. Étant donné que chaque répétition complète de l’expérience comporte
2k essais ou combinaisons de traitements, on appelle cette approche un «plan factoriel 2k». Ce
type de plan a grandement contribué à simplifier l’analyse statistique et constitue la base de plu­
sieurs autres plans. Notons que dans les plans 2k, l’effet principal d’un facteur est la différence de
moyennes entre les deux niveaux de ce facteur (et non une déviation par rapport à une moyenne
globale, comme dans les plans factoriels généraux présentés aux sections précédentes).

11.4.1 Le plan 22
La forme la plus simple du plan 2k est le plan 22, qui comporte deux facteurs .4 et B qui ont
chacun deux niveaux possibles. On désigne généralement ces niveaux par le niveau «faible » et
le niveau «élevé» du facteur. La figure 11.16 illustre le plan 22. On remarque que ce plan peut
être représenté géométriquement par un carré dont les coins sont définis par les 22 = 4 essais.
On emploie une notation particulière pour désigner les combinaisons de traitements. En effet,
on représente généralement une combinaison à l’aide d’une série de lettres minuscules. Si une
lettre est présente, cela signifie que le facteur correspondant est à son niveau élevé dans cette
combinaison de traitements; son absence indique que le facteur est à son niveau faible. Par
exemple, la combinaison de traitements a indique que le facteur A est au niveau élevé et que le
facteur B est au niveau faible. La combinaison de traitements où les deux facteurs sont au
niveau faible s’écrit (1). On utilise cette notation dans tous les plans 2k. Par exemple, la com­
binaison de traitements dans un plan 24, où Aet C sont au
faible, s’écrit ac.

Élevé b• ■ -- ---— ob
---—•
(+)
J
;

Faible
(-) (1) a
Faible A Élevé
(-) (+)
■V- .V- *>-***- < — -A
•ê^ - ~V‘- *'’•

t v! Le plan factoriel 22

L e s e ffe ts d e s fa c te u rs
Les effets du plan 22 qui nous intéressent sont les effets principaux de A et de B, ainsi que
l’effet de l’interaction AB. Les expressions (1), a, b et ab représentent également les totaux
de toutes les n observations effectuées à ces points du plan. Il est facile d’estimer les effets de
ces facteurs. Pour estimer l’effet principal de A, on prend la moyenne des observations du côté
CHAPITRE 11

droit du carré, où A est au niveau élevé, et on soustrait la moyenne des observations du côté gauche
du carré, où A est au niveau faible :
a + ab 6 + (l)
A (11.32)
2n 2n
1
[a + ab —b —{1)].
2n
De même, pour calculer l’effet principal de B, on prend la moyenne des observations du
haut du carré, où B est au niveau élevé, et on soustrait la moyenne des observations du bas
du carré, où B est au niveau faible :
b + ab a + (1)
B (11.33)
2n 2n
1
[b + ab —a - (1)]
2n
Enfin, on estime l’interaction AB en calculant la différence des moyennes des deux diago­
nales de la figure 11.16, soit
ab + (1) a + b
AB (11.34)
2n 2n
1
[ab + (1) - a - b].
2n
Les quantités entre crochets des équations 11.32,11.33 et 11.34 s’appellent des « contrastes ».
Par exemple, le contraste de A est
Contraste^ = a + ab — b — (1).
Dans ces équations, les coefficients du contraste sont toujours +1 ou -1. On se sert alors d’un
tableau de signes plus et moins, comme le tableau 11.16, afin de déterminer le signe de chaque
combinaison de traitements pour un contraste particulier. Les titres des colonnes du tableau 11.16
désignent les effets principaux de A et de B, l’effet de l’interaction AB et enfin, / représente le
total. Les titres des lignes représentent les combinaisons de traitements. On remarque que les
signes de la colonne AB correspondent aux produits des signes des colonnes A et B. Pour obtenir
un contraste à partir de ce tableau, on multiplie chaque signe de la colonne appropriée par la
combinaison de traitements correspondant à cette ligne, puis on additionne les termes.

A /
” /A i
♦ or

Effet factoriel
Combinaison de traitements / A B AB
(1) j + — —
+
1 61 + + — —

b + —
+ —

1 ab 1 + + + +
L'analyse de la variance et les plans d’expériences

On peut calculer les sommes des carrés pour A, B et AB à l’aide de la forme générale
suivante :
2
(Contraste)
SS 2
(11.35)
n Y (coefficients du contraste)

Par conséquent, les sommes des carrés pour A, B et AB sont


2
[a + a b - b - ( 1)]
SS A
An
[b + a b - a - ( l)]2
SS B
An
[ab + (1) - a - b]2
SS AB
An

Pour terminer l’analyse de la variance, on calcule la somme totale des carrés SST (avec
An —1 degrés de liberté) comme d’habitude, et on calcule la somme des carrés due à l’erreur
SSE [avec A(n—1) degrés de liberté] par une soustraction. On calcule ensuite les moyennes de
carrés en divisant les sommes de carrés par les degrés de liberté appropriés, et les statistiques F
en divisant chaque moyenne de carrés par le MS£.

Exemple 11.16
Un article tiré du AT&T Technical Journal (vol. 65, n° 2, 1986, p. 39-50) décrit l’application de pians
d’expériences à deux niveaux à la fabrication de circuits intégrés. Dans cette industrie, une étape de
base de la fabrication consiste en la croissance d’une couche épitaxiale sur des plaquettes de silicium
polies. Les plaquettes sont disposées sur un suscepteur, puis elles sont insérées dans une cloche. Des
vapeurs chimiques sont introduites par les buses situées en haut de la cloche. Le suscepteur est mis
en rotation, et la cloche est chauffée. Ces conditions sont maintenues jusqu’à l’obtention d’une couche
épitaxiale d’épaisseur appropriée.
Le tableau 11.17 présente les résultats d’un plan factoriel 22 avec n = A répétitions, le facteur A étant
le temps de dépôt et le facteur B,le débit d’arsenic. Les deux niveaux du temps de
« court » et + pour « long », tandis que les deux niveaux du débit d’arsenic sont —pour « 55 ^ » et
+ pour « 59 % ». La réponse est l’épaisseur de la couche épitaxiale (en micromètres ou microns, pm).
380 CHAPITRE 11

On peut estimer les effets à l’aide des équations 11.32,11.33 et 11.34:

1
A [a + a b - b - (1)]
2
1
[59,299 + 59,156 - 55,686 - 56,081] = 0,836,
2(4)
1
B [b + a b - a - ( 1)]
2n
1
[55,686 + 59,156-59,299-56,081] = -0,067,
2(4)
1
AB [ab + (1) —a —b]
2n
1
[59,156 + 56,081 - 59,299 - 55,686] = 0,032.
2(4)

L’effet de l’interaction AB semble faible. De l’estimation des effets, on déduit que l’effet du temps de
dépôt est important et que sa direction est positive (une augmentation du temps de dépôt occasionne
une augmentation de l’épaisseur). En effet, la variation du temps de dépôt du niveau faible au niveau
élevé correspond à une variation de l’épaisseur moyenne de la couche épitaxiale de 0,836 |im. L’effet
du débit d’arsenic ( B)semble faible.
On peut confirmer l’importance statistique de ces effets par une analyse de la variance. Les sommes
des carrés pour A, B et ABse calculent à l’aide de l’équation 11.35 :

(Contraste)
ss = J
«4
[a + a b - b - d)]2 ._ [6,688 f
SSA = 2,7956,
16 16
[b + ab —a —a » 2 _ [-0,538]
SSB = 0,0181,
16 16
[ab + (1) -1 --b]2 [0,256]2
s s AB = 0,0040
16 16
Le tableau 11.18 résume l’analyse de la variance.

>1 —
Source de Somme Nombre de degrés Moyenne
variation n

fi


-

^

__
des carrés
~
9

_^
.
r
^ •
_ * *

^
.^
dea
liberté
. * des carrés.

1A (temps de dépôt) 2,795 l 2,7956 134,50


1 B (débit d’arsenic) j
0,018 l 0,0181 0,87
\ ab . 1 0,004 ____ l 0,0040 0,19
Erreur 0,249 12 0,0208
.

| Total 1 3,067 _________15________


L'analyse de la variance et les plans d'expériences 381

Ces résultats confirment les impressions obtenues lorsqu’on examine la grandeur et la direction des
effets : l’interaction n’est pas significative, le temps de dépôt a un effet significatif sur l’épaisseur de la
couche épitaxiale et, selon la direction de l’estimation de cet effet, on sait que des temps de dépôt plus
longs occasionnent des couches épitaxiales plus épaisses. Le débit d’arsenic, quant à lui, n’a pas d’effet
significatif sur l’épaisseur de la couche épitaxiale.

L'analyse des résidus et la validation du modèle


On peut facilement obtenir les résidus d’un plan 2k à l’aide d’un modèle de régression (dont nous
étudierons les caractéristiques au chapitre 12). Pour l’expérience sur la croissance épitaxiale, le
modèle de régression est
Y+ A *. + £
puisque la seule variable active est le temps de dépôt, représenté ici par X . On attribue respective­
ment aux niveaux bas et élevé du temps de dépôt les valeurs X{= —1 et X = +1. Le modèle ajusté est
ÿ = 14,389 + 1 |* „
A

où l’ordonnée à l’origine J30 correspond à la moyenne générale de toutes les 16 observations


(F)» et la pente (5\ équivaut à la moitié de l’estimation de l’effet du temps de dépôt. La raison
pour laquelle le coefficient de régression est égal à la moitié de l’estimation de l’effet est que les
coefficients de régression mesurent l’effet de la variation de 1 unité de Xj sur la moyenne de Y
et que l’estimation de l’effet est basée sur une variation de 2 unités (de —1 à +1).
On peut se servir de ce modèle pour obtenir les valeurs prévues aux quatre points du plan.
Par exemple, prenons le point correspondant à un temps de dépôt court (.x t 1) et à un faible
débit d’arsenic. La valeur prévue est
0,836 \
y =14,389 + (-1) = 13,971 pm,
2 J
et les résidus sont
ei 14,037 - 13,971 = 0,066, e3 13,972 - 13,971 0 ,001,
e2 14,165 - 13,971 0,194, e 13,907 - 13,971 0,064.

Il est facile de vérifier ce qui suit. Pour un temps de dépôt court î 1) et un débit d’arse-
0,836
nie élevé, y = 14,389 + ( - D 13,971 |im, les résidus sont
2
e5 13,880 - 13,971 0,091, e7 14,032 - 13,971 0,061,
e6 13,860 - 13,971 0 , 111, e8 13,914 - 13,971 0,057.
Pour un temps de dépôt long (x, = +1) et un faible débit d’arsenic,
0,836
y 14,389 + (+D 14,807 Lim, les résidus sont
2
e9 14,821 - 14,807 0,014, eh 14,843 - 14,807 0,036,
e 10 14,757 - 14,807 0,050, e 12 14,878 - 14,807 0,071.
CHAPITRE 11

Pour un temps de dépôt long (Xj = +1) et un débit d’arsenic élevé,


0 836^
(— — J(+l) = 14,807 jim, les résidus sont

el3 = 14,888 - 14,807 = 0,081, el5 = 14,415 - 14,807 = -0,392,


eH = 14,921 - 14,807 = 0,114, el6 = 14,932 - 14,807 = 0,125.
La figure 11.17 présente un graphique de probabilité normal de ces résidus. Ce graphique
montre qu’un résidu £15= —0,392 constitue une valeur aberrante. Si on examine les quatre
observations correspondant à un temps de dépôt long et à un débit d’arsenic élevé, on peut
voir que l’observation _y15= 14,415 est très inférieure aux trois autres observations pour cette
combinaison de traitements. Une explication possible serait que d’autres variables du procédé
pourraient avoir une influence sur la variabilité de l’épaisseur de la couche épitaxiale. Dans ce
cas, si l’on pouvait déterminer les variables en cause, il serait alors possible de les fixer à des
niveaux qui minimiseraient cette variabilité, ce qui pourrait avoir des répercussions impor­
tantes sur les étapes de fabrication subséquentes. La figure 11.18 présente les graphiques des
résidus en fonction du temps de dépôt et en fonction du débit d’arsenic.

Le graphique de probabilité normal des résidus de l'expérience


sur la croissance épitaxiale
/ ..
* • .... ». ■• . . ^ .. . . . M

. . . . . . » .*

Le graphique des résidus en fonction: a) du temps de dépôt; b) du débit d'arsenic


L'analyse de la variance et les plans d'expériences 383

Si l’on ne tient pas compte du résidu exceptionnellement grand (en valeur absolue) associé
à l’observation y , il n’y a pas de raison de conclure que le temps de dépôt ou le débit d’arsenic I

influence la variabilité de l’épaisseur de la couche épitaxiale.


La figure 11.19 présente l’écart-type estimé de l’épaisseur de la couche épitaxiale pour les
quatre combinaisons de traitements du plan 22. Ces écarts-types ont été calculés à l’aide des
données du tableau 11.17. On remarque que l’écart-type des quatre observations correspondant
au niveau élevé des deux facteurs A et Best beaucoup plus grand q
autres points du plan. Cette différence est attribuable en majeure partie à la mesure d ‘épaisseur
exceptionnellement faible associée à y|5. L’écart-type des quatre observations lorsque et B sont
au niveau faible est également un peu plus grand que les écarts-types des deux autres combinai­
sons. On peut en conclure que d’autres variables du procédé, qui ne sont pas prises en compte
dans cette expérience, pourraient influencer la variabilité de l’épaisseur de la couche épitaxiale.
On pourrait donc concevoir et réaliser une autre expérience visant à étudier cette possibilité,
en incluant d’autres variables du procédé (l’article du AT&T Technical Journal traite d’ailleurs
de deux autres facteurs qui n’ont pas été considérés dans cet exemple et qui ont un effet sur la
variabilité du procédé).

X
B/V- - ■■■■

(-) (+)
.

L'écart-type estimé de l'épaisseur de la couche épitaxiale pour les quatre


9 J. ‘ j l * * * • , A ' k .
w* B “ —I W W, J, ' f *
*ï 1 I , jp •
B “ R w 9 J C «
, .if'"
f4> * v
N ..

combinaisons de traitements du plan 22

11.4.2 Le plan 2.k avec trois facteurs ou plus


Les méthodes avec les plans factoriels lorsque k = 2 facteurs ayant chacun deux niveaux peuvent
facilem ent être adaptées à des situations où il y a plus de deux facteurs. Par exemple, prenons
k —3 facteurs à deux niveaux chacun. Le plan qui s’ensuit est un plan factoriel 23 qui comporte
huit combinaisons de traitements. Géométriquement, ce plan peut être représenté par un cube
{voir la figure 11.20, à la page suivante), les sommets du cube correspondant aux huit combi­
naisons possibles.
Ce plan permet d’estimer les trois effets principaux (A, B et C), les interactions entre deux
facteurs {AB, AC et BC) ainsi que l’interaction entre les trois facteurs {ABC). Pour plus d’infor­
m ation sur le sujet, vous pouvez consulter Montgomery (2001).
CHAPITRE 11

Résumé
%
• • »/ *É•* '»
Plan d'expériences complètement aléatoire à un facteur
a échantillons indépendants de taille n (donc N = an observations), variances égales

Modèle
Yu - M+ T, + Ev , où Ev ~ N ( 0 ,o 2) ,(i = 1..... a ,j =

de la variance
H0: T’j T2 T =0 (ou H o *• Mi MJ

’•& • \ *.v' *#<iŸ*i «" .> 111111


ççtraitements y i/ç
P(F >/„).
Traitements 55traitements
. a- 1 fl,fC
traitements
__
*
traitements

a -1 M5£ où F ~ Fa_x N_a


Erreur 55£ N -a
£ N -a |
Total N- 1 1
a 2 2 2
mm. * V A Y•#L a n a n
CO 2 ssT 2 2 p.:
tintements Y..) Y lV j- y ..) yLuyL-i y U:
là i
s

1=1 U
S
~N *=U=1 <=iy=i TV
a n a
55 ey ~ Y y - Y /. = résidu
/-I /=! !*=1
r ce
U k J traitements
L'analyse de la variance et ies pians d'expériences

Plan d’expériences en blocs aléatoires complets


b blocs de a unités expérimentales recevant chacune un des a traitements
(donc ah observations)

Modèle
Yu fl + Ti + (5j + E ij, où p j 2 2
N(0,G p) et E'j ~ N(Q,<j~),(i = 1,...,a yj= 1.....b)

Analyse de la variance
H 0.T, —Tj ••• Ta = 0

Source d e f . Degrés
;C'vr
variation
4>
des carrés de liberté Moyenne des carrés
Rl T-AÆ
i
Ï-*

ÇÇtraitements MS
* ^ traitem ent
P(F >/„)•
Traitements SStraitements
. a —1 MStraitem ents où F Q—1•(&
a- 1 MSH
SSblocs
Blocs SSblocs b- 1 MSblocs
b- 1
SSE *

Erreur SS (a - l)(b - 1) MSE


(a -m -l)
Total SS ab —1

a a xf 2 Y 2 a b « 6 Y
1 2
SS t r a i t e m e n t s Y..) E - SS T Y..)
é b ab
I I I I ^ ab
1= 1 «•=1y=1 (=i y=i
/? y 2
y •2•
blocs = a ± ( Ÿ . i - ÿ . . ) 2 = i — -
ab
y=i y= 1 u

a b
Ty - Y i .- Y .j + Y..= résidu
é r1
n

CC — cv
I l 4 = 0 0 traitements blocs
'=•y=>

Plan d’expérience complètement aléatoire à deux facteurs
a x b échantillons indépendants de taille n (donc abn observations), variances égales

Modèle
Yijk H + T; + Pj + (Tp) .. + Eijk, où Eijk ~ N (0,G 21.a, l,..., k

Analyse de la variance
1) H0: (Tp).u= 0 pour tout (i, j)
2) H0: Ti T.2 Ta 0
1 2 A, = o ♦ «
CHAPITRE 11

Source de j ♦

fl zM
*“ l ’ - Sl 2- #- _ 'v

variation ides carrés F» &


. œ î %-

* îv >

*•' ■" m ( . \ -
U K » •;-« r ;♦!r - -K
: & . ' - V - .

« 7 , / ’lÇZ 4
r ’

V.
r v A

V * - ‘ jC ' . f t c 1
•*-*- >. 'rr
|

SS A MS44
a- 1 MS A fiCM W V i. a b ( n--n1) > h a)
a- 1 MS E

SS B MS B
b- 1 MS B fi0 B P(Fb-u a b ( n--nl ) > /o s )
b —1 MS E

SS A B MS A B
(a - 1Xb - 1) MS A B fiO A B MS E K F ia - ! ) ( / > - ! ) , a b ( n - l ) > fioA B )
(a -l)(fc -l)
SS E
ab(n —1) MS E
ab(n —1)
abn —1
.
2
» f

a a y2 y
y / t.. -* '

SS A b n J jY i Y...) SS E SS 7 SS AS SS A SS s
i=1 /=i rt/>/2 r=l/=l*=l
v ' -- . ‘ •
-« s

b b y z. y ■ *. - * a £> n a b n y #• •
SS B an I ( F . y y - .
SS T 2
an abn )
7= 1 7= 1 i=iy=lfc=l i = l 7 = 1*== 1
« £
SS AS 2
y, y .y .+ i7...) e ijk Ym ~ Y
i=\j=\

Plan d’expérience factoriel 2 2


2 x 2 échantillons indépendants de taille n (donc 4/2 observations), variances égales *
/j
%■ « *
* "
a «»'

Analyse de la variance
1) H0: Pas d’interaction entre A et B
2) H(| : Pas d’effet du facteur A
H„ : Pas d’effet du facteur B
Source de
V: variation Somme des carrés
[a + ab
Facteur A MS A = SS A i ./ o a

[b + a b -a
Facteur B MSB = SS o i

[ab + ( l ) - a
Interaction MS = SS„D If iû A B

Erreur E ~ LJLJ A B ‘- '‘-'A S S b


MS

Total (Yiit- Y . . y
1=1 »'=1A=1
L'analyse de la variance et les plans d'expériences

/ b) Si on rejette H0avec le test F de l’analyse


Les données des exercices avec le symbole (Vj de la variance, on pourra conclure que
sont aussi disponibles en format électronique. ^ i) les variances théoriques des 4 vi­
tesses de coupe sont toutes égales.
11.1 Une étude a été menée pour déterminer l’ef- ii) les variances théoriques des
©r fet de la vitesse de coupe sur la durée de vie 4 vitesses de coupe diffèrent
(en heures) d’un outil particulier. Les résul­ toutes les unes des autres.
tats des quatre niveaux de vitesse de coupe iü) les variances échantilionnales
choisis sont présentés dans le tableau 11.19. des 4 vitesses de coupe diffèrent
a) Étudiez le diagramme de ces observa­ toutes les unes des autres.
tions (voir la figure 11.21). Tentez de iv) les moyennes théoriques des
déterminer intuitivement si le test de 4 vitesses de coupe sont toutes
comparaison des moyennes sera signi­ égales.
ficatif, si les variances sont similaires v) les moyennes théoriques des
d’une vitesse à l’autre et si la loi normale 4 vitesses de coupe diffèrent
est un bon modèle pour ces observations. toutes les unes des autres.

Bht riW’WB. LiLril * — ^ — 1 ^ 1


lAMMMlTyjÆHi lliM ~
F H i ---/L.& ■;/‘'..'vE,»(*nfl-~'T:t. _>
* /•“
1•v_“J
ü _-
t. I-•»- aÜ * .f-, ViJ ' 1.*- j ^>m' —-^*•-' fi( SE—
- 9K
-3H
' Ja
.

• ✓
Vitesse de coupe . . . —. / •
Durée de vie de l’outil (h) Moyenne y Ecart-types
1 41 43 33 39 36 40 38,67 3,61
2 42 36 34 45 40 39 39,33 3,98
3 34 38 34 34 36 33 34,83 1,83
4 36 37 36 38 35 35 36,17 1,17
ÿ
*•• =37,25 <7 = 2,90

Vitesse de coupe

Exercice 11.1 : La distribution de ia durée de vie en fonction de ia vitesse


de coupe
CHAPITRE 11

Vi) les moyennes théoriques d’au vi) Les observations d’un même
moins 2 vitesses de coupe dif­ échantillon sont indépendantes.
fèrent l’une de l’autre. vii) Les observations de la population
vii) les moyennes échantillonnales proviennent d’une loi normale de
des 4 vitesses de coupe diffèrent moyenne /i/.
toutes les unes des autres. d) Peut-on conclure, au seuil de 10%,
c) Créez et remplissez le tableau d’analyse que le débit de C2F6a un effet sur
de la variance. l’uniformité ?
d) Quelle est la valeur P (exacte ou e) La figure 11.22 présente les dia­
approximative) du test de comparaison grammes en boîte juxtaposés des
des quatre moyennes ? observations ainsi que l’histogramme
e) Si le test global de comparaison des des résidus. Les résidus indiquent-ils
moyennes est significatif au seuil de 5 %, des problèmes liés aux suppositions
étudiez les différences entre les niveaux faites par le modèle ?
de la vitesse de coupe pris deux à deux. f) Pourquoi l’histogramme des observa­
tions brutes ne permet-il pas de vérifier
11.2 Dans l’article «Orthogonal design for process
si la loi normale est un bon modèle ?
optimization and its application in plasma V

etching » ( SolidState , vol. 30, Une étude a porté sur la résistance (en
11.3
n° 5,1987, p. 127-132), G.Z. Yin et D.W. Jillie ( V f livres par pouce carré) à la compression
décrivent une expérience permettant de déter­ du béton. Les données recueillies pour les
miner l’effet du débit de C,F.
Z v) sur Funiformité quatre différentes techniques de mélange
de la gravure dans le cas d’une tranche de sili­ étudiées sont présentées dans le tableau 11.21.
cium. Les uniformités résultantes (en pour­ a) Remplissez le tableau d’analyse de la
centage) des six répétitions des trois débits variance suivant.
utilisés dans l’expérience sont présentées dans
le tableau 11.20. Somme Nombre Moyenne
a) Estimez la variance intratraitement Source de des de degrés des
b) Estimez l’effet du débit 125. variation carrés de liberté carrés / .
c) Identifiez toutes les conditions d’appli­ Technique
cation de l’analyse de variance dans la de mélange 489 740 ? ? ? • • •

liste suivante. Erreur 153908 ? ? « •

i) Les tailles d’échantillons doivent Total ? ? • •

être supérieures à 30.


ii) La variance est la même dans b) Au seuil de 1 %, peut-on dire que
toutes les populations comparées. les différences observées entre les
iii) Les variances de toutes les popula­ moyennes sont significatives ?
tions sont considérées connues. c) Voici l’histogramme des résidus et
iv) La moyenne est la même dans le graphique des résidus en fonc­
toutes les populations comparées. tion des valeurs prédites ( la
v) Les observations d’échantillons figure 11.23). Déterminez si le modèle
différents sont indépendantes. est adéquat.

— .* Æ * , » , ™ */ ^ A*i B . * | L^
, , . ï ^ , * —, . j J* 3 • j V* ■ f '• " ^ 7*'
i ^ . .. a " • i x & t- FL, <5 _ < - -rs *J 7 T '* ' S a S p y S - ; i % & ï i
r r . . c r * f / , 4 '■ . / ■ .* 7 v . . / C . f * * r * -v / / • k' •
w L z W »— ' * . M ^

I l i M i l r ~ T ' T I W Ê m m f l t H Ü T
Æ
M
t M V
I
a
w
, a—
m w
M
j
T
t
A 7
|\ri
♦ f m’ MB
W f ’S Q K 3 ' r . £ • g Q H * * X J J t '
X i ' ■*
4 -C V / f , . r . y * * W 4
ü . . P • B k v J i S t * * ; m ; -t
a ? A . >, Â;
.

Observations (%)
**_■“ « « • , — ■ • - **. — .1 o . —
. f •- - ^

Débit de C2fy [ - . 1 ; 1 2 3 4 5 6 Moyenne , Écart-type


f

125 2,7 4,6 2,6 3,0 3,2 3,8 3,32 ! 0,76


160 4,9 4,6 5,0 4,2 3,6 4,2 4,42 0,52
200 4,6 3,4 2,9 3,5 4,1 5,1 - 3,93 | 0,82
L’analyse de la variance et les plans d'expériences

/
5,0 5
4,5 4
vu
W

U
üC J-2
4,0
«2 3U
‘S CT
3,5 'H 2
b
3,0 1 r

2,5 0 1
125 160 200 l,5 - l,0-0,5 0,0 0,5 1.0 I.5
Débit de C2F6 Résidus
a) b)
jdg
TCI . V |
H W
I
i
Exercice 11.2: a) Distribution de l'uniformité par traitement;
•v •. :a a

b) distribution des résidus de l'analyse de variance à un facteur


!■ n jv j . ^ k

Fj- *' tjF r f ' * . •*jf * t V r**!. ” y f •' "T m m H t V *} u. *

|
Technique de mélange Résistance à la compression (lb/po2) 1 Moyenne .j Écart-type
1 3 129 3 000 2 865 2 890 2 971 120,56
2 3 200 3 300 2 975 3 150 3 156 135,98
3 2 800 2 900 2 985 3 050 2 934 108,27
4 2 600 2 700 2 600 2 765 2 666 80,97

/
150 3
100
50 t
\

P O 2 4
y

C/
5 0 e4}
'<L> 3
06 -50 CT
£tt.
100 1
150
i-------1-------1------ 1 r 0
2700 2800 2900 3000 3100 200 100 0 100 200
Valeurs prédites Résidus i
K

l
(
;
»
»

a) b)

»4S3L»LUI l *' C'


k (, W* O* S

Y ï4 j
Exercice 11.3: a) Distribution des résidus en fonction des valeurs prédites;
b) distribution des résidus de l'analyse de variance à un facteur

11.4 Soit une expérience destinée à déterminer si b) Sachant que SST=0,458, déterminez si la
(g r quatre températures de cuisson (en degrés température de cuisson influe sur la mavse
Fahrenheit) spécifiques influent sur la masse volumique des briques au seuil de 5 %.
volumique d’un certain type de brique. Les 11.5 Un ingénieur électronicien s’intéresse
données de l’expérience sont présentées dans à l’effet de cinq types de revêtement
(B
le tableau 11.22 ( voirà la page suivante).
sur la conductivité des tubes à rayons
a) Estimez les paramètres du modèle : cathodiques utilisés dans l’afficheur d’un
/Z, Tj, X T X4, G2 système de télécommunications. Cl obtient
CH A PITRE 11

les données de conductivité énumérées au dans une calculatrice électronique ( le


tableau 11.23. tableau 11.24).
a) Après avoir rempli le tableau d’analyse a)9 Sachant que
*
MS, . ,
traitements
= 130,47,
7
de la variance ci-dessous, pouvez-vous créez le tableau d’analyse de la
conclure que la conductivité diffère variance. Ensuite, testez l’hypothèse
selon le type de revêtement ? Utilisez selon laquelle les trois types de cir­
a - 0,05. cuits ont le même temps de réponse
au seuil de 5 %.
Somme Nombre Moyenne b) Comparez toutes les paires de
Source de des de degrés des moyennes des traitements, avec
variation carrés de liberté carrés a= 0,05.
c) Analysez les résidus de cette expé­
Type de
? rience à partir des deux graphiques
revêtement 9 9 9
de la figure 11.24.
• • •

Erreur 9 •
? 16,22
Total 1303,75 9
♦ 11.7 Supposez que quatre populations normales
ont une variance commune cr2 = 25 et des
b) Testez toutes les différences entre deux moyennes = 50, ju2= 60, ju3= 50 et
moyennes. Utilisez a = 0,05. HA= 60. Supposez aussi que cinq obser­
c) Supposez que le type de revêtement 4 vations sont effectuées au hasard dans
est le type de revêtement actuel. Que chacune de ces populations.
recommanderiez-vous au fabricant ? a) À quelle valeur peut-on s’attendre pour
(On désire minimiser la conductivité.) le MS, ? • E

11.6 Voici les temps de réponse (en milli- b) À quelle valeur peut-on s’attendre pour
(t+T secondes) de trois types de circuits utilisés le MStraitements
. ?

T^pe de revêtement -■

Conductivité **. . ■»
Moyenne Écart-type
1 143 141 150 146 145,00 3,92
2 152 149 137 143 145,25 6,65
3 134 133 132 127 131,50 3,11
4 129 127 132 129 129,25 2,06
5 147 148 144 142 145,25 2,75

Type de circuit *. • • .. m
. Temps de réponse (ms) . ,-•-•.«-•'* Moyenne
.%* •. % Écart-type
1 19 22 20 18 25 20,8 2,77
2 20 21 33 27 40 28,2 8,41
3 16 15 18 26 17 18,4 4,39
ÿ =22,47 <7 = 5,71
L'analyse de la variance et les pians d’expériences

S
C
3
ce
&

a) b)

Exercice 11.6: a) Distribution des résidus; b) distribution des résidus


en fonction des valeurs prédites

c) Si toutes les moyennes théoriques b) Sachant que S Str^.itdocnts


. = 0,102 et que
étaient égales à 50, quelle valeur devrait SST= 0,222, déterminez si le type de
prendre la statistique F de l’analyse de gicleur influe sur le facteur de forme.
la variance (en moyenne) ? Comparez les gicleurs à l’aide de
l’analyse de la variance, avec un seuil
11.8 Dans l’article « The effect of nozzle design
de 10%.
©T on the stability and performance of turbu­
lent water jets» {Fire Safety Journal, vol. 4, c) Quels graphiques traceriez-vous pour
n° 1, 1981, p. 1-13), C. Theobald décrit analyser les résidus de cette expérience ?
une expérience dans laquelle un facteur 11.9 Dans son ouvrage Design and Analysis of
de forme a été déterminé pour différentes ©T Experiments (2001), D.C. Montgomery
conceptions de gicleurs à divers niveaux décrit une expérience pour déterminer
de vitesse d’écoulement (en mètres par l’effet de quatre produits chimiques sur
seconde). Cette expérience porte principa­ . la résistance d’une étoffe particulière. En
lement sur la conception du gicleur, et la raison de la variabilité d’une étoffe à une
vitu^e est un facteur nuisible. Les données autre, les rouleaux d’étoffe sont considérés
obtenues sont présentées au tableau 11.25. comme des blocs. Cinq rouleaux ont été
a) Quel est le modèle approprié pour choisis, et les quatre produits chimiques
analyser ces données ? Quels sont les ont été appliqués dans un ordre aléatoire
postulats de ce modèle ? sur chaque rouleau. Les résistances à la
CHAPITRE 11

les sommes de carrés de certaines c) À l’aide d’un logiciel de traitement de


sources : la vitesse de coupe données, tracez les diagrammes vous
(SSA= 0,031 78), la profondeur de permettant de vérifier les postulats du
coupe (SSB= 0,027 19) et l’interaction modèle factoriel. Commentez les résul­
(SS.„ = 0,000 69). Créez et remplissez
/» D tats obtenus.
la table d’analyse de la variance.
c) En utilisant un seuil critique de 5 % dans 11.14 Identifiez le type d’analyse qui correspond
chaque cas, que pouvez-vous conclure le mieux à chacun des contextes proposés.
sur la présence de l’interaction, l’effet Identifiez dans chaque cas les facteurs et
du facteur vitesse de coupe et l’effet du la variable réponse, ainsi que les degrés
facteur profondeur de coupe ? de liberté à l’erreur.
a) On veut déterminer si la densité de
11.13 Une expérience vise à évaluer l’effet de plantation du maïs et sa variété ont un
@T deux facteurs (le type de verre et le type impact sur son rendement. On étudie
de luminophore) sur la luminosité d’un des plantations de 30 000, 50 000
tube cathodique à image. La réponse et 70 000 plants à l’hectare, et trois
mesurée est le courant nécessaire (en variétés de maïs. On soupçonne que
microampères) à l’obtention d’un certain chaque variété réagira différemment
niveau de luminosité. Les données sont aux différentes densités de plantation.
présentées ci-dessous. On suppose que Chaque combinaison de densité et de
les deux facteurs sont fixes. variété est appliquée à trois parcelles
choisies au hasard. À la fin de la saison,
Type de luminophore on mesure le rendement en grains des
iype de verre 1 2 3 27 parcelles.
280 300 290 b) Une compagnie pharmaceutique veut
1 290 310 285 comparer l’effet de diverses doses
285 295 290 de son nouveau médicament contre
l'hypertension. Dix participants au
230 260 220 profil de santé similaire prendront un
2 235 240 225 total de quatre doses du médicament
240 235 230 à l’étude, soit une dose par semaine,
dans un ordre aléatoire, et noteront
a) Complétez le tableau 11.28 sur l’ana­ leur pression artérielle le matin du
lyse de la variance de cette expérience 7ejour.
factorielle. c) On veut savoir si la lecture du degré
b) Que pouvez-vous conclure sur la pré­ d’éthanol varie selon la méthode
sence de l’interaction, l’effet du facteur utilisée, soit le pycnomètre, l’aréo­
type de verre et l’effet du facteur type mètre et le densimètre électronique.
de luminophore ? On mesure le degré d’éthanol de


m
W r~
K * .
• .

1 1
1 f i
I
- ,

I • V *
i . r l ♦
1
i *
fl B ■
;

a n s r \

rn.
c 2 *
*.
T A \ Æ T' -, rn.
r C , ' V L
X
£KITIHH
t , , >. f "
r /’ i
. * ■i
i.'
.«A
J y
<
.r Æ ‘ ,*».

- .r ,
_ _v

f . 'y /. ‘LKÿ
< , »
-,

y ».«•
,

* “L
*>•_ ,
- v - T V ' . '
.

.
41y -
> ■ A• ê. ,«• -/i,

fV. . , « A v . . 1 ' .»>/


w

v l i ..
‘ . . a. 4\ C

' ^ .■
» vv*.
i, w
■- /
. . _
v

y
,■

v > VJ î i .
* >»»>
& M
- ..A.: . -p*•4 ,.V

f f iir .
' >

, '* ■
L -
« .y T tS f i* /,

v 4m. y y t a ,■» f .4 /■ ir .,
* '2 .. v
:^
F ** 9
j

né - • •
//

-
, . A/ 5 v ' V * / * / ’' V

y
>
-/y

. v
V ^ - ’Cv

i> *•> .
• ;-,
V i Jv ;
t
^ . i- «Wlik-A .
’J
i'

•i* V
y ,T
M


• ' . •. i v p» *c , - r ’- A . »/. • >• « - >* . ., /• m f » V* ‘ / »»^ * *•,
.> r '> ■ ■' 54- r , >*• r}* ï» 9 F v • > $ . • * X v-»> .?■*> 2 -ÎT L v ' - i • y.
___- y____
; _______. * 7 ; .
__________________________________ _ - ■

Source de
—, P % • — •

variation Somme des carrés •


#.
Degrés de liberté
. ■ * . —*
Moyenne des carrés /o Valeur /*
. "* ' . A " A

Verre 14 450,0 1 ? •
? # 0,000
Luminophore 933,3 ? •
? •
? • 0,004
Interaction 133,3 ? •
? •
? • 0,318
Erreur ? •
? ♦
? •

Total 16 150,0 ? •
L'analyse de la variance et les plans d'expériences

8 échantillons d’alcool avec chacun


de ces appareils. (Les 24 échantillons
proviennent du même baril d’alcool
et la méthode de test leur est attribuée
de façon aléatoire.)
11.15 Un article paru dans la revue Quality
©r Engineering (1999, p. 357) présente les
résultats d’une expérience ayant pour but
de déterminer les effets de trois facteurs
sur le gauchissement dans un procédé de
moulage par injection. Les trois facteurs a) Précisez le nombre de degrés <r '' mç,
d’intérêt (ayant deux niveaux chacun) sont associé à l’erreur et celui O U I tîM H SSO t
A (la température de fusion), B (la vitesse à la somme des carrés totale.
d’injection) et C (le procédé d’injection). b) Dressez le tableau d’analyse de ta
Une expérience factorielle 23 a été effec­ variance et analysez les données de
tuée avec quelques répétitions. Le tableau cette expérience en considérant toutes
suivant présente les résultats de deux de ces les interactions. Concluez en utilisant
répétitions. un seuil critique de 5

\ \
jiÊèm

K
Mb l*■r
*'
^ ans rie nombreux problèmes, deux variables ou plus sont liées de façon intrin­
sèque, et il faut explorer la nature de cette relation. L’analyse de régression
, est une méthode statistique de modélisation et d’analyse de la relation entre
deux variables ou plus. Dans un procédé chimique, par exemple, si Fou suppose que le
rendement d’un produit est lié à la température de fonctionnement du procédé, l’an a­
lyse de régression peut permettre de construire un modèle qui exprime le rendement
en fonction de la température. Ce modèle peut servir à prévoir le rendement à une
température donnée. On peut aussi l’utiliser pour optimiser ou contrôler le procédé.

En règle générale, supposons qu’une variable dépendante unique est liée à k variables indé­
pendantes, ou variables explicatives, X {, X2, ..., Xk. La variable dépendante Y est une variable
aléatoire, tandis que les variables explicatives X,, X2, ..., Xk sont mesurées avec une erreur
négligeable. Les variables Xs
ont fréquemment contrôlées par l’expérimentateur
régression sert aussi dans les situations où Y, X , X2, ••■,Xk sont toutes des variables aléatoires,
comme lorsque les données sont des mesures différentes d’une unité expérimentale commune.
La relation entre ces variables est caractérisée par un modèle mathématique appelé « équa­
tion de régression». Plus précisément, on parle de la régression de Y sur X,, X , ..., X k. Ce
modèle de régression est ajusté sur un ensemble de données. Dans certains cas, l’expérimen­
tateur connaît la forme exacte de la fonction qui lie Y et Xr X2, ..., Xk. Mais, dans la plupart
des cas, la vraie relation fonctionnelle est inconnue et l’expérimentateur choisit une fonction
appropriée, souvent un modèle polynomial.
Dans ce chapitre, nous discuterons du cas où une variable explicative unique, X, présente
un intérêt, et du cas où la relation entre y et X est une droite. Le chapitre 13 traite du cas où
plusieurs variables explicatives sont en cause.

12.1 La régression linéaire simple


On désire déterminer la relation entre une seule variable explicative X et une variable dépen­
dante K On considère que la variable explicative X est une variable continue, contrôlable par
l’expérimentateur. On suppose ensuite que la vraie relation entre y et X est une droite et que
l’observation Y à chaque niveau de X est une variable aléatoire. L’espérance mathématique de Y
pour chaque valeur de X est alors le point sur la vraie droite d’équation :
£(y|X ) = £0+ #X , (12.1)
où l’ordonnée à l’origine J30 et la pente sont des constantes inconnues (à estimer à partir d’un
ensemble d’observations).

4
La régression linéaire simple et la corrélation

M o d è le de régression linéaire simple


* / * * • *

On suppose que chaque observation Y (i =1,2, n) est décrite par le modèle


Y ^ p . + P ^ + E, (12.2)
dans lequel on admet les postulats suivants :
• les E. sont des erreurs aléatoires de moyenne nulle et de variance g 2 (ainsi la dispersion autour
de la droite est homogène pour toutes les valeurs de X) ; «

• les E. sont des variables aléatoires indépendantes;


• les E. sont issues d’une loi normale (postulat nécessaire pour effectuer des tests d’hypoth S
sur les paramètres fi0et (3).

Exemple 12.1
Un ingénieur chimiste analyse l’effet de la température de fonctionnement d’un procédé sur le rende­
ment du produit. Il obtient les données suivantes.
Température (en degrés Celsius) (AT) 100 110 120 130 140 150 160 170 180 190
Rendement (en pourcentage) (F) 45 51 54 61 66 70 74 78 85 89
La figure 12.1 présente le diagramme de dispersion de ces 10 points. Ce diagramme montre qu’il existe
une forte relation entre le rendement et la température, et que cette relation est linéaire, du moins sur
l’intervalle de températures étudié. La supposition provisoire du modèle linéaire +
semble donc raisonnable.
/

i
V
i

1
-
i

i

.

:•
i
;

i
;

m m
m r

• v - .. •

■ aijini Le rendement en fonction de la température


-
' B i - 1
■ H H B jf r '

L g y * i f l U
K Q 3 t t ' / .
L
g
6 » ’S V v '

'J tZ r J n « ' V A * / ** «x
« O . sr M S 9 1 S 1'

Supposons qu’on a npaires d’observations, (X,, Ft), ( , F2), ..., (Xn, F )


perm ettent d’estimer les paramètres inconnus pQet de l’équation 12.2 par la méthode des
moindres carrés: on veut estimer PQ et p x de manière à minimiser la somme des carrés
des écarts verticaux entre les observations et la droite de régression. L’équation 12.2 donne

y , =f i , +l ” + »
b.
• • y /2j
CHAPITRE 12

et la somme des carrés des écarts verticaux des observations à la vraie droite de régression est
n n
2
L X e? 0 fi,X.) (12.3)
1= 1 1= 1
A /N

Les estimateurs par la méthode des moindres carrés de et de (respectivement p 0 et (5X)


doivent satisfaire aux égalités
n
dL A

1
2y (y,

O
- f i i -

dfit P0'P\ 1=1 (12.4)


dL n A

1
2Y v , 0

O
a s 1 Po>P\
A A

i=l
- f i i -

La simplification de ces deux équations donne


n n

n P a + fr Y x , I r. X
i=1 II *~
(12.5)
Il
n n ~
j
*w
P o Y x i+ p y X -
II

1= 1 1= 1 / =1
Les équations 12.5 sont appelées les «équations normales des moindres carrés»

E s tim a te u rs des m o in d re s c a rré s de la p e n te e t d e l'o rd o n n é e à l'o r ig in e


La solution des équations normales permet d’obtenir des estimateurs pour la pente et l’ordonnée à
l’origine de la droite de régression :
A, = r - A (12.6)
-o __ °S
P\ ” ç *
xy
(12.7)
^xx
où Y est la moyenne des F, X, la moyenne des et

Sxx= t l(.X,-X)2 = f t X Ï-n X 2, (12.8)


i=1 /=1

s„ = X (X, X)(Y, - 7) = £ X,Y, - nXŸ..


- (12.9)
i=1 1=1
La droite de régression estimée est
A A A

Y=/30+ pX. (12.10)

On appelle Sxx la somme des carrés corrigée de X, et S la som m e des p ro d u its c ro isé s
corrigée de X et de F.Les membres de droite des équations 12.8 et 12.9 sont des form ules de
calcul efficaces pour un calcul à la main.
La convention qui consiste à utiliser des lettres majuscules pour les variables aléatoires et
des lettres minuscules pour les valeurs observées de ces variables ne sera respectée que pour X A A

et Y dans ce chapitre. Nous ne l’appliquerons pas aux sommes de carrés, aux estimateurs f3Qet /?, ni
aux autres quantités aléatoires, par respect pour la tradition établie dans la littérature statistique.
La régression linéaire simple et la corrélation

Exemple 12.2
Quelques calculs sur les données de l’ingénieur chimiste de l’exemple I2.l permettent d’obtenir les
résultats suivants :
n = 10, x= 145, =6
10 10 10
xf =218 500, ^ y f = 47 22 X
/=! 1=1 /=1

Les équations 12.8 et 12.9 donnent les résultats ci-dessous.


10

Sxx =X xf ~1^0j2 = 218 500


1= 1
10

SXY = X^/X -10x ÿ =101 570 - 10(145X67,3) = 398


i = i

Les estimations par la méthode des moindres carrés de la pente et de l’ordonnée à l’origine sont donc

j}\=2*L = — = 0,483
1 S„ 8250
et
Po=ÿ - ^ x = 67,3 - (0,483)145 = -2,739.

Le modèle de régression linéaire simple ajusté est alors


y =-2,739 + 0,483X.
On peut ajouter cette droite au graphique de dispersion (voir lafigure 12.2).

La droite de régression estimée pour le rendement en fonction


de la température
400 CHAPITRE 12

Q u e l q u e s p iè g e s à é v it e r
L’analyse de régression est fréquemment utilisée et souvent de façon abusive. Il est très facile d’éta­
blir des relations statistiques complètement dénuées de sens pratique entre des variables. On pour­
rait, par exemple, tenter de lier la résistance au cisaillement de points de soudure au nombre
de boîtes de papier utilisées par le service de traitement de données. Une droite pourrait même
sembler fournir un bon ajustement des données, mais il serait déraisonnable de tabler sur une
telle relation. Il faut soigneusement choisir les variables avec lesquelles on construit les modèles
de régression et déterminer la forme de la fonction d’approximation. Une forte association obser­
vée entre des variables n’est pas nécessairement le reflet d’une relation causale entre ces variables.
De plus, les relations de régression ne sont valides que pour les valeurs de X situées dans
l’intervalle des données mesurées. La relation linéaire qu’on a supposée provisoirement n’est
peut-être pas valide pour des valeurs de X au-delà de cet intervalle. Autrement dit, à mesure
qu’on s’éloigne de la gamme des valeurs de X pour lesquelles les données ont été recueillies, il
devient plus risqué d’extrapoler à partir du modèle linéaire ajusté.
Finalement, on peut parfois penser que le modèle Y = J3X + E convient. L’omission de l’or­
donnée à l’origine dans ce modèle entraîne, naturellement, que Y = 0 lorsque X = 0. Une telle
supposition forte est souvent injustifiée. Même lorsque deux variables, telles que la taille et le
poids d’individus, semblent convenir pour utiliser ce modèle, on obtient habituellement un meil­
leur ajustement en incluant l’ordonnée à l’origine en raison de l’étendue limitée des données de la
variable indépendante.

12.2 Les tests d'hypothèses dans


une régression linéaire simple
Les tests d’hypothèses statistiques sur les paramètres du modèle et l’établissement de certains
intervalles de confiance constituent une importante partie de la régression linéaire simple.
Les tests d’hypothèses sont abordés dans cette section et, à la section 12.3, les méthodes de
construction d’intervalles de confiance seront présentées. Pour tester des hypothèses sur la
pente et l’ordonnée à l’origine du modèle de régression, on doit supposer que les erreurs sont
indépendantes et suivent une loi (0, <72). On verra plus tard comment
N
tions par l’analyse des résidus.

12.2.1 Le$ tests sur 9a pente de la droite


de régression, ^
Supposons qu’on désire tester l’hypothèse que la pente est égale à 0. Ce test s’appelle le « test
de signification de la régression». C’est l’un des plus importants de l’analyse de régression,
car il vérifie si le taux de variation de Y en fonction de X est significatif.

H yp o th èse s du te s t de signification de la régression

Les hypothèses appropriées sont

H0:A=°>
H, :/?,*(). (I2.ll)
La régression linéaire simple et la corrélation 401

Ne pas pouvoir rejeter H0: fi = 0 équivaut à conclure que la relation linéaire entre X et Y
n’est pas significative selon nos observations. Cela peut impliquer que la variation de X influe
peu sur la valeur de Y et que le meilleur estimateur de Y pour tout x est Ÿ ( la figure 12.3a)
ou encore que la véritable relation entre Xe
t
contre, si H 0: p = 0 est rejetée, cela implique que X influe sur la valeur de Y {voir la figure 12.4).
Mais rejeter H0: p } = 0 peut signifier que le modèle linéaire est adéquat {voir la figure 12.4a) ou
que même s’il y a un effet linéaire de X, on pourrait obtenir de meilleurs résultats par l’ajout de
termes polynomiaux de degrés supérieurs en X {voir la figure 12.4b).

ii

i>
t
.
i

.
t
.
i

t
i

|i
t

!i
i

i

1
I
»

l
l

i
I

L'hypothèse H0: $ 0 n'est pas rejetée.

i
;


î«

I!
A

i .


\
.
t
À
.

1
I

L'hypothèse H = 0 est rejetée.

On peut développer la procédure de test pour H0:/?, = () de deux façons. La première consiste
à décomposer la variabilité totale des Y. en deux sources : la variabilité expliquée par le modèle et
la variabilité résiduelle due à l’erreur aléatoire. On utilisera alors les techniques de l’analyse
de la variance décrites au chapitre 11, en adaptant les calculs des sommes de carrés au modèle de A

régression. La seconde est un test de Student basé directement sur les propriétés de p . Nous y
reviendrons plus loin.
402 CHAPITRE 12

L e t e s t s u r ^ b a s é s u r l'a n a ly s e d e la v a r ia n c e
Notons tout d’abord que les valeurs prédites par le modèle sont définies par

f m +M -
Il s’agit du point sur la droite estimée correspondant à chaque valeur X..
Considérons maintenant la partition suivante de la somme des carrés des écarts entre
les Y. et leur moyenne Y :

Syr = - F )2 = £ ( F , - F )2 + - Ff)2, (12.12)


1=1 1=1 1=1

SST= SSR +SSE, (12.13)


où représente la variabilité totale des Y.. Elle est aussi notée SSTpour cette raison (de l’an­
glais sum o f squarestotal). Les deux composantes de SSTexpriment respectivement la variabi
lité des Y. expliquée par la droite de régression et la variation résiduelle laissée inexpliquée par
la droite de régression. L’équation SS E= X”=1(Yi s’appelle habituelleme
carrés due à l’erreur» et SSR = X"=1(Ff - Y )2, la « somme des carrés due à la régression ». Alors
que SST a n - 1 degrés de liberté, SSR et SSE ont respectivement 1 et n — 2 degrés de
liberté. Quelques manipulations algébriques permettent de vérifier que SSR peut se calcu­
ler comme suit :
(12.14)
On établit une statistique de Fisher en utilisant le même genre d’argument qu’au
chapitre 11. Les étapes du raisonnement sont présentées brièvement ci-dessous. On peut
dém ontrer que
2
E (S S J (n - 2)) = E{MSe) <J
E(SSr!1) 2 , 02
E(MSR) a + PxSXY,
SSE et SSR sont indépendantes.
Donc, si Hn: /?, = 0 est vraie, MSE et MS sont deux estimateurs de la variance
.2
similaires Hj : 0 est
vraie, MSR aura une valeur sensiblement plus élevée que celle de MSE.

T e s t de signification de la régression
*. * . * * *.
• • ' . * . . . y "

La statistique du test est formée du quotient de MSRpar MS :


SS., /1 MS R
F0 (12.15)
SSE/ ( n - 2) MSE
qui suit la distribution ,, sous l'hypothèse nulle. On rejette H0: = 0 si la valeur observée
fn>
70
F , ,.
or; 1, n - 2

La procédure de test est habituellement présentée dans un tableau d’analyse de la variance


(voir le tableau 12.1).
La régression linéaire simple et la corrélation 403

Exemple 12.3
Testons la signification du modèle de régression développé à l’exemple 12.2. Le modèle ajuste est
7 2,739 + 0,483 jc, et l’on a
10

S S T = S YY yf-I0ÿ2
i= 1
2
47 2 2 5 -10(67,3)
1932,10.
La som m e des carrés due à la régression est
SSR = 0 .S xy = (0,483)(3985) = 1924,87,
et la som m e des carrés due à l’erreur est
SS, = SS -
E T R

1932,10 - 1924,87
7,23.

Le tableau 12.2 résum e l’analyse de la variance du test bilatéral pour HQ: 0.

1 ______________________________________________________________
•' •r A ^T
4 \ vVC
l r ^ 1*' B •L
~ B U>’ 1 A . L 4 \ 0
JB ^k V
AmK WWFa'^k
Source de Somme Nombre de degrés Moyenne
variation des carrés de liberté des carrés /. 1
j R égression 1924,87 1 1924,87 2138,74
J E rreu r ou résidu 7,23 8 0,90
j Total 1932,10 9

En rem arquant q u e / = 2138,74 > F 001. 18 = 11,26, on rejette H0 au seuil de 1 % et l’on conclut que
* 0. P uisque la pente estim ée vaut 0,483, on peut même conclure qu’elle est significativement supé­
rieure à 0. D ’ailleurs, le nuage de points était clairement aligné le long d’une droite de pente positive ;
il était facile de prévoir un résultat aussi fort.

Le test sur ^ basé sur les propriétés de l'estimateur ^


On peut aussi développer le test de signification de la régression en se basant sur les propriétés
de l’estim ateur de la pente, p .
404 CHAPITRE 12

On peut montrer que l’espérance et la variance de p sont

Démonstration

Puisqu’on suppose que les E. sont indépendantes et suivent une loi N(0, cr2), il découle direc­
tement que les observations Y. sont indépendantes et suivent la loi N(/30 + J3{X , a 2). On
remarque que /J, est une combinaison linéaire des observations Y. Donc, est une com­
binaison linéaire de variables aléatoires normales indépendantes et, par conséquent, est une
variable aléatoire normale. De plus, la variance des observations autour de la droite, cr2, est
estimée par le MSE. On peut donc dire que

Supposons qu’on désire tester l’hypothèse que la pente est égale à une constante, soit 0

T est bilatéral sur la valeur de la pente

Les hypothèses appropriées sont

H„:A=A.o.
Hi: A * A,.- (12.16)
On rejette H0: fi = fi si

tl0 — Â-A.o > ta/2; n-2 (12.17)


yjMS E/ Sxx

En posant /?, 0 = 0, on obtient le test de signification de la régression, qui donnera bien sûr
le même résultat que celui qu’on a précédemment obtenu à partir de l’analyse de la variance.
Notons que l’élévation au carré des deux membres de l’équation 12.17 donne
*

En règle générale, il est vrai que le carré d’une variable aléatoire suivant une loi tv suit une
loi Fx . Donc, le test utilisant TQéquivaut au test basé sur F0.

Exemple 12.4

Reprenons l’exemple 12.2 sur le rendement en fonction de la température. Supposons qu’on cherche
à savoir si une hausse de 10 degrés Celsius de la température de fonctionnement occasionne un gain
moyen de rendement supérieur à 3 %. ►
La régression linéaire simple et la corrélation

Il s’agit de tester les hypothèses (disons au seuil de 5 %)


H0: A = 0»3,
H, : A > 0,3.
On rejettera H0 si
0,3
to >t0.05; 8 1,86
yjMSE!SXX

La valeur observée de la statistique du test est


0,483-0,3
to 17,5.
V0,90/8250

Puisque 17,5 est largement supérieur à 1,86, on rejette H0. Par conséquent, on conclut que le gain moyen
de rendement correspondant à une hausse de 10 degrés Celsius est significativement supérieur à 3

12.2.2 Le te s t sur l'ordonnée à l'origine de la droite


de régression, ftQ
On utilise une procédure semblable pour tester les hypothèses sur l’ordonnée à l’origine. Il faut
d’abord établir que

E<A) = Poet V(Â>) =

On note aussi que fi0 est une combinaison linéaire des Y. et qu’il suit par conséquent une loi
normale. On peut donc dire que

T e s t b ila té r a l sur la valeur de l'ordonnée à l'origine

Pour tester
(12.19)

on utilise la statistique

( 12.20 )

et l’on rejette l’hypothèse nulle si |r| > t

On peut bien entendu adapter cette règle de décision aux cas unilatéraux.
ïïiis CHAPITRE 12

Supposons qu’on veut tester l’hypothèse suivante : l’ordonnée à l’origine du modèle de régression pour
le rendement en fonction de la température est inférieure à 0. (Le rendement du produit à 0 °C est
ici d’un faible intérêt pratique, mais répondons à la question pour illustrer la théorie.) L’hypothèse
alternative est unilatérale, et on utilisera un seuil de 10 % :

On rejettera H0si t0<—t0l0.n_2, c’est-à-dire si tQ<-1,397. Calculons la valeur observée de la statistique :

2,739-0
t 1,774.

Ainsi, au seuil de 10%, on conclut que l’ordonnée à l’origine est significativement inférieure à 0.

12.3 L'estimation par intervalle pour


une régression linéaire simple
En plus des estimations ponctuelles de la pente et de l’ordonnée à l’origine, on peut obtenir des
estimations par intervalles de confiance de ces paramètres. Plus ces intervalles de confiance
sont courts, plus la droite de régression modélise précisément la relation.

12.3.1 L'intervalle de confiance pour la pente ^

In te rv a lle de confiance pour la pente

Si les E. sont normalement et indépendamment distribuées, alors un intervalle de confiance à


100 ( l - ci) % pour la pente f i est donné par

( 12.21)

irvalle de confiance à 95 % pour la pente de la droite de régression en utilisant les données


l. On se souvient que fix= 0,483, = 8250 et MSE= 0,90. L’équation 12.21 donne

MSe

0,483 ±2,306
0,483 ±0,024 ►

,v
La régression linéaire simple et la corrélation 407

et l’on obtient
0,459 < >3, < 0,507.
C et intervalle exclut la valeur 0, ce qui confirme la conclusion sur le test de signification de la régres­
sion, soit le test bilatéral pour H0: P = 0.

1 2 .3 .2 L'intervalle de confiance pour I


à l'origine fiQ

I n t e r v a l l e d e c o n fia n c e pour l'ordonnée à l'origine

Si les E sont norm alem ent et indépendamment distribuées, un intervalle de con


p o u r l’o rd o n n ée à l'origine /?0 est
A

a/2; n-2

1 2 .3 .3 L 'in tervalle de confiance pour la valeur


m o yen n e au point x0
On peut déterminer un intervalle de confiance pour la réponse moyenne à une valeur spécifiée de X,
soit x Q. C ’est un intervalle de confiance pour E(Y|jc0), qu’on appelle souvent «intervalle de confiance
pour la droite de régression». Comme E(Y|x0) = P+ P{xQ, con

% = A,+ A v
A A A

L a valeur prédite Y est un estimateur sans biais de E (Y |x ), puisque /30 et sont des estima-
teurs sans biais de /3Qet de . La variance de YQest

A A A

et Y0 est norm alem ent distribuée, car et p x sont normalement distribués.

Intervalle de confiance pour la moyenne de Y en X = x0


s

La longueur de l’intervalle de confiance pour E(Y| jc0) est une fonction de xQ.Cette longueur
est minimale pour xQ= xet augmente avec \xQ- 3c|. Cet élargissement est une raiso
le danger d’extrapoler lors d’une analyse de régression : plus xQest situé loin de x, plus notre
estimation de la valeur moyenne de Y correspondant à xQest imprécise. L’exemple 12.7 met ce
phénomène en évidence.
408 CHAPITRE 12

Exemple 12.7
Déterminons un intervalle de confiance à 95% pour la droite de régression avec les données de
l’exemple 12.1. Le modèle ajusté est y0 = -2,739 + 0,483x0, et l’intervalle de confiance à 95 % pour
£ (y |x 0), donné par l’équation 12.23, est

Le tableau 12.3 présente les valeurs ajustées y0et les limites de confiance à 95 % correspondantes pour
10 valeurs x0 allant de 100 à 190 °C.
[ 1 ÿ f _JB | y t 1# v
i^^^iwiTwiwTinnwTr1
f* . J V i u 1 w jy L '
1 [ • J T * T | 3 J g O . ‘w . ç a \ a jp j a i A \
B*
g
I. flp
0^ JB 9 U A A
_ ’jA H v ^ J»

m
h
» >/ v > r
jO m Wr
/ Vkæ ^ ‘. X

X 100 110 120 130 140 150 160 170 180 190
45,56 50,39 55,22 60,05 64,88 69,72 74,55 79,38 84,21 89,04
Marge d’erreur
±1,30 ±1,10 ±0,93 ±0,78 ±0,71 ±0,71 ±0,78 ±0,93 ±1,10 ±1,30
à 95%

Pour illustrer l’utilisation de ce tableau, on trouve par exemple que l’intervalle de confiance à 95 % sur
le véritable rendement moyen du procédé au point xQ= 140 °C est
64,88 ± 0,71,

64,17 < E{Y\140) < 65,49.


La figure 12.5 présente le modèle ajusté et l’intervalle de confiance à 95 % pour la droite de régression.
Plus jcqs’éloigne de 145, plus la marge d’erreur est grande.

0
S

L'intervalle de confiance à 95% pour la valeur moyenne du rendement


du procédé de l'exemple 12.7
La régression linéaire simple et la corrélation 409

12.4 La prévision de nouvelles observations


La prévision de nouvelles ou futures observations Y correspondant à un niveau spécifié de la
variable explicative X est une application importante de l’analyse de régression. Si est la valeur
d’intérêt, alors
Y0 = p 0+ plXo (12.24)
est l’estim ateur ponctuel de la future valeur de la variable dépendante Y .
Cherchons maintenant un intervalle de prévision de cette future observation Y , c’est-
à-dire un intervalle de valeurs dans lequel YQa une probabilité 1 - a de se situer. Ceue nouvelle
observation est indépendante des observations utilisées pour développer le moilr-r <■«-- régres­
sion. L’intervalle de confiance de la droite de régression ne convient pas, puisqu’il concerne
la vraie réponse moyenne au point X = xQ(soit un paramètre de la population), et non une
future observation (à savoir une valeur supplémentaire de la variable aléatoire Y) ( la
sous-section 9.4.1). A

Soit Y0 la future observation au point X = xQ, et soit YQl’estimateur de YQdonné par l’équa­
tion 12.24. La variance associée à l’observation future sera constituée de la somme de deux
variabilités : celle d’une observation autour de la vraie droite (cr2) et celle de l’estimation de la
2
2 1 j, (x0 - X )
droite de régression a ■On peut l’exprimer comme suit
n Sxx J
1 , (x0 - X )
---1------------2
Var (Y0 - = a 2+a
n

On estim era cr2 par le MS£.

On rem arque que la longueur de l’intervalle de prévision est minimale à xQ= x et qu’elle
augmente lorsque \x0- x\ croît, tout comme l’intervalle de confiance sur la droite de rég
En com parant l’équation 12.25 à l’équation 12.23, on observe que l’intervalle de prévision à xQ
est toujours plus grand que l’intervalle de confiance au point xQparce qu’il dépend de l’erreur de
la droite estim ée et de l’erreur associée aux futures observations.

Exemple 12.8
. . . . . . J . • • ' • ■. v ■ . ‘ *- • * .

Pour illustrer l’établissement d’un intervalle de prévision, utilisons les données de l’exemple 12.1 et
trouvons un intervalle de prévision à 95 % pour la prochaine observation du rendement du procédé au
point xQ= 160 °C. La figure 12.6 ( voirà la page suivante) montre l’intervall
Y pour toute valeur xQ. ►
410 CHAPITRE 12

L'intervalle de prévision pour la valeur future de Y

Dans notre exemple, selon l’équation 12.25, l’intervalle de prévision est

, 1 (160-145)2
74,55 ±2,306 0,90
[ 10 8250 J
soit
74,55 ± 2,33
72,22 < Y0 <76,87.
On voit que l’intervalle est plus long que l’intervalle de confiance sur la moyenne dont la marge d’erreur
est de 0,78 pour x0= 160.

12.5 La validation et la qualité de rajustement


du modèle de régression
L’ajustement d’un modèle de régression nécessite plusieurs suppositions. Pour tester les hypo­
thèses et procéder à l’estimation par intervalle de confiance, les erreurs doivent être norm ale­
ment distribuées, de moyenne nulle et de variance constante. De plus, on suppose que l’ordre
du polynôme est correct, c’est-à-dire que si notre modèle est un polynôme du prem ier degré,
on présume que le phénomène se comportera réellement comme une droite, et non com me une
parabole ou un polynôme de degré supérieur.
L’analyste doit toujours douter de ces suppositions et analyser la validité du modèle
provisoire utilisé. Dans cette section, nous discutons des méthodes graphiques à utiliser pour
évaluer la validité d’un modèle.
- -rj

La régression linéaire simple et la corrélation

12.S.1 L'analyse des résidus

Résidus du modèle de régression


A A

Les résidus sont définis par e. = Y. Y.,


-

correspondante sur la droite de régression estimée, soit Yt j3lxr

L’analyse des résidus est utile pour vérifier la supposition que les erreurs sont indépen­
dantes et suivent une loi normale de variance constante, ainsi que pour déterm iner si l'ajout
d’autres termes dans le modèle serait utile.

La vérification du postulat de normalité


Pour vérifier approximativement la normalité, l’expérimentateur peut tracer un histogram m e
des résidus ou un diagramme quantile-quantile (normal). Bien sûr, évaluer si la loi normale est
un bon modèle avec de tels graphiques est un acte subjectif, et les conclusions peuvent varier d’un
expérimentateur à l’autre.
On peut aussi «normaliser» les résidus en calculant d. - e./y/MSE, i = 1, 2, ..., n. Si
les erreurs sont indépendantes et suivent une loi <r2), alors environ 95 % des résidus
norm alisés devraient appartenir à l’intervalle (-2, +2). Un résidu loin de cet intervalle peut
révéler la présence d’une observation aberrante, c’est-à-dire une observation qui est atypique
du reste des données. Diverses règles ont été proposées pour éliminer les observations aber­
rantes. Néanm oins, ces observations fournissent parfois d’importants renseignements sur des
circonstances inhabituelles d’intérêt et ne devraient pas être éliminées. Il faut donc en premier
lieu analyser toute observation aberrante détectée, et l’éliminer s’il le faut. (Pour une discus­
sion plus poussée sur les observations aberrantes, voir Montgomery, Peck et Vining [2001].)

La vérification de l'homogénéité de la variance autour


de la droite
Il est souvent utile de représenter graphiquement les résidus en fonction des pour vérifier
si la variabilité autour de la droite est relativement constante. Habituellement, ces gra­
phiques ressem blent à l’une des quatre configurations présentées à la figure 12.7 ( à la
page suivante). La configuration de la figure 12.7a) représente une situation convenable
(les résidus sont répartis uniformément de chaque côté de la droite horizontale), tandis
que celles des figures 12.7b), c) et d) illustrent des anomalies. Si les résidus apparaissent
com m e à la figure 12.7b), alors la variance des observations augmente avec les valeurs
des y . Les représentations des résidus en fonction des y qui ressemblent à la figure 12.7c)
indiquent aussi une variance inégale.

La vérif ication du choix adéquat de modèle


Un sim ple examen du graphique de dispersion de Y en fonction de X donne une bonne indi­
cation du degré du polynôme à modéliser. Il est aussi possible d’analyser le graphique des
résidus en fonction des valeurs prédites pour parvenir aux mêmes conclusions. Par exemple,
les représentations des résidus qui ressemblent à la figure 12.7d) indiquent que le modèle est
inapproprié, c’est-à-dire que des termes de degrés supérieurs devraient être ajoutés au modèle.
412 CHAPITRE 12

il
;
i

.
4
(

i
i
I
i
i

:
!
4

:i
‘4

!i
i|

lI
i

>
t

[t

i
i

i
i

*
i
>

1I
\
s

*
J
»
*
i
i

l
I
i

i
«.
4

.
i>
*
ç

I
{
i

;
«
j4

Quatre différentes configurations des représentations graphiques des résidus:


a) satisfaisante; b) en entonnoir; c) à deux arcs; d) non linéaire (adaptation
à partir de l'ouvrage de Montgomery, Peck et Vining [2001])

La vérification de l'indépendance des observations


Seule une bonne planification d’expérience permet de s’assurer que les n couples (x., y.) sont
indépendants les uns des autres. Il peut cependant être utile de représenter graphiquement les
résidus chronologiquement (si on le peut) pour vérifier la dépendance temporelle.

Exemple 12.9
Voici les résidus calculés du modèle de régression de l’exemple 12.1.
V =45,00 -- 45,56 = -0,56 *6 := 70,00 -- 69,72 = 0,28
V =51,00 -- 50,39 = 0,61 *7 := 74,00 -- 74,55 = -0,55
=54,00 -- 55,22 = -1,22 = 78,00 -- 79,38 = -1,38
ëe%
V = 61,00 -- 60,05 = 0,95 =85,00 -- 84,21 = 0,79
=
*5 = 66,00 -- 64,88 = 1,12 =
*.0 = 89,00 -- 89,04 = -0,04
Sur le graphique quantile-quantile normal ( voirla figure 72.5), on rema
approximativement le long d’une droite. On conclut donc qu’il n’y a pas d’écart important à la nor­
malité. Les résidus sont aussi représentés en fonction des à la figure 12.9a) et en fonction des à
la figure 12.9b). Ces représentations n’indiquent aucune lacune sérieuse du modèle, c’est-à-dire que la
répartition des résidus autour de 0 est uniforme pour toutes les valeurs de *i
y et de r
La régression linéaire simple et la corrélation 413
414 CHAPITRE 12
L

12.5.2 Le coefficient de détermination

Coefficient de détermination
La grandeur

(12.26)

est appelée «coefficient de détermination» et est souvent utilisée pour juger du bon ajustement d’un
modèle de régression.

Visiblement, 0 < R2 < 1. Ainsi, R2 représente la proportion de variabilité dans les données,
expliquée ou justifiée par le modèle de régression. Pour les données de l’exemple 12.1, on a
R2 = SSR/SST= 1924,87/1932,10 = 0,9963. Autrement dit, le modèle explique 99,63 % de la va­
riabilité des données (ce qui est très élevé). On verra ultérieurement que si X et Y sont des varia­
bles aléatoires conjointement distribuées, R2 est le carré du coefficient de corrélation entre X et Y.
La statistique R2 doit être utilisée avec précaution, car on peut toujours faire augmenter
R2 en ajoutant des termes au modèle. Par exemple, on obtient un ajustement «parfait» sur
n observations avec un polynôme de degré n —1. De plus, R2 augmentera toujours si l’on ajoute
une variable au modèle, mais cela ne signifie pas nécessairement que le nouveau modèle est
supérieur à l’ancien. Cette augmentation doit être significative pour que la nouvelle variable
soit importante. La régression multiple (où plusieurs variables explicatives sont incluses dans le
modèle) sera traitée au chapitre 13.
Il y a plusieurs idées fausses entourant R2. Par exemple, R2 n’est pas toujours lié à la
pente de la droite de régression : une grande valeur de R2 n’entraîne pas nécessairement une
pente abrupte. De plus, R2 n’exprime pas toujours la justesse du modèle puisqu’on peut le gon­
fler artificiellement en ajoutant des termes de polynômes de degrés supérieurs. Même si Y et X
sont liées de façon non linéaire, R2 sera souvent grand. Par exemple, R2 de l’équation de régres­
sion de la figure 12.4b) {voir à la page 401) sera relativement grand, même si l’approximation
linéaire est faible.

12.6 Les transformations pour une droite


Il arrive que le modèle de régression linéaire Y= + p xX
vraie fonction de régression est non linéaire ou parce que les postulats du modèle ne sont pas
tous respectés. Cela se voit parfois sur le diagramme de dispersion ou par l’analyse des résidus.
Dans certaines situations, on peut exprimer une fonction non linéaire sous la forme
d’une droite à l’aide d’une transformation appropriée. Par exemple, considérons la fonction
exponentielle

Cette fonction peut être transformée en une droite par une transformation logarithmique
ln Y = ln
Cette transformation exige que les termes d’erreur transformés ln E soient normalement et
indépendamment distribués avec une moyenne nulle et une variance a 2. On pourra donc étu­
dier le lien entre ln Y et X à l’aide du modèle de régression linéaire.
La régression linéaire simple et la corrélation 415
L

V oici un autre exemple de fonction non linéaire :

Y~ Po + ^+

La transformation inverse Z = 1/X linéarise le modèle en


Y = p 0 + P ïZ + E .

D aniel et W ood (1980) donnent plusieurs autres exemples de modèles non linéaires oui oeuvent
4L
se transform er en une droite.
O n peut aussi utiliser des fonctions monotones pour transformer la variable Y afin >'«• sta­
b iliser la variance ou d’améliorer le respect du postulat de normalité des erreurs. cette
situation, on tentera souvent d’ajuster à nouveau le modèle en changeant Y par ln ou 1/Y, ou
encore par V F ou Y 2.

12.7 La corrélation
Jusqu’à présent, dans notre développement de l’analyse de la régression, on a supposé que X
est une variable m esurée avec une erreur négligeable et que Y est une variable aléatoire. D e
nom breuses applications d’analyse de la régression mettent en jeu des situations où X et Y sont
tou tes le s d eu x des variables aléatoires. Dans ces situations, on suppose souvent que les obser­
vation s (X., Y.), i — 1, 2, . . . , n, sont des variables aléatoires conjointement distribuées obtenues
d ’u n e distribution f ( x , y). Par exemple, supposons qu’on désire développer un modèle de régres­
sio n lia n t la résistance au cisaillem ent de points de soudure au diamètre des points. Dans cet
ex em p le, on ne peut contrôler le diamètre des points. On choisit au hasard n points de soudure
et l’o n o b serv e un diam ètre (x ) et une résistance au cisaillem ent (y.) pour chacun. D onc, X et Y
so n t d e s variab les aléatoires conjointement distribuées.

Le e o e ffic ie n t de corrélation théorique


O n su p p o se habituellem ent que la distribution conjointe de Y et X est une distribution norm ale
à d e u x v a ria b les (voir l'équation 12.6, à la page 176), c’est-à-dire

(12.27)

où f iYet <7^ sont la moyenne et la variance de Y, où jux et o \ sont la moyenne et la variance de


X, et p est le coefficient de corrélation entre Y et X. Souvenons-nous de la définition suivante.

C o e f f i c i e n t d e co rré la tio n th é o riq u e


. 4 > / » > . ^ f . ». , *^ f »

Le coefficient de corrélation théorique est


«

où <7 est la covariance entre Yet X.


416 CHAPITRE 12

La distribution (densité) conditionnelle de Y pour une valeur donnée = est

Autrement dit, la distribution conditionnelle de Y étant donné X correspond à une loi normale
de moyenne
E(Y\X) = P0 + p xX (12.30)
et de variance cr2(l - p2). On remarque que la moyenne de la distribution conditionnelle de
Y étant donné X est un modèle de régression linéaire. De plus, il existe une relation entre
le coefficient de corrélation p et la pente p r Selon l’équation 12.29b), si p = 0, alors Px = 0,
ce qui implique qu’il n’y a pas de régression de Y en X. Dans ce cas, la connaissance de X
n’aide pas à prévoir .YD’autre part, si p = 1, les points (X, Y) forment une droite par
la variance autour de la droite est nulle.

Le coefficient de corrélation échantillonnai


Ce modèle permet d’effectuer des inférences statistiques sur le coefficient de corrélation p.

Estimation du co efficien t de corrélation échantillonnai


• ■ ■ *■ ( • . . , * . .- t

L’estimateur de p est le coefficient de corrélation de l’échantillon

(12.31)

On remarque que

(12.32)

de sorte que la pente p xest simplement le coefficient de corrélation de l’échantillon r


par un facteur d’échelle qui est la racine carrée de la « dispersion » des Y divisée par la « dis-
persion » des X. Donc, p x et r sont étroitement liés, bien qu’ils fournissent des renseignements
quelque peu différents. Le coefficient de corrélation de l’échantillon r exprime l’association
linéaire entre Y et X, tandis que Px exprime la variation prévue de la moyenne de Y pour une
variation unitaire de X.
La régression linéaire simple et la corrélation

L’équation 12.32 donne aussi

2 2
R r f l , 2 S x x

S YY
B S XY
S YY
SS R
S YY

Autrement dit, le coefficient de détermination R2 est simplement le carré du coefficient de corré­


lation échantillonnai entre Y et X.

Les tests d'hypothèses et l'întervaiie de confiance s u r p


*

Il est souvent utile de tester l’hypothèse


H0:/O = 0,
H : p * 0. (12.33)

Test bilatéral pour H0: p - O


La statistique appropriée de. ce test est

qui obéit à une loi r avec n - 2 degrés de liberté si H0: p = 0 est vraie. Par conséquent, on rejette Yhy­
pothèse nulle si \tQ\> toti2-n-2’

Ce test équivaut aux tests de l’hypothèse HQ: /?, = 0 présentés à la section 12.2. Cette équi­
valence découle directement de l’équation 12.32.
La procédure du test de l’hypothèse
H o - P = »

Hj : p ^ p0, (12.35)

où p 0 5* o est un peu plus compliquée. Pour des échantillons modérément grands (par exemple
n > 25), la statistique

Z = arctanh r = (12.36)

est approximativement normalement distribuée avec une moyenne

jiz = arctanh p =

et une variance
g\ = (n -3 )
CHAPITRE 12

Test bilatéral pour H0: p = p0


Pour tester l’hypothèse H0: p = p , on peut calculer la statistique

ZQ= (arctanh r - arctanh p0)(n —3)1/2 (12.37)


et rejeter H0:p = p0 si |d > z

On peut aussi construire un intervalle de confiance à 100(1 - a) % pour p en utilisant la


transformation de l’équation 12.36.

Intervalle de confiance pour le coefficient de corrélation théorique


L’intervalle de confiance à 100(1 - a)%pour p est
\ \
tanh arctanh r ^al 2 < p < tanh arctanh r + ^a/2 (12.38)
•n/ n- 3 V yjn —3 j

où tanh u - (e" - e u)/(eu + e ")•

Exemple 12.10
Montgomery, Peck et Vining (2001) décrivent une application de l’analyse de la régression dans
laquelle une ingénieure au service d’un embouteilleur de boissons non alcoolisées étudie la distribu­
tion de ses produits et le routage d’approvisionnement de ses distributeurs automatiques. Elle pense
que le temps de chargement et d’approvisionnement d’un distributeur automatique est lié au nombre
de caisses du produit livré.
Un échantillon aléatoire de 25 magasins de détail ayant des distributeurs automatiques est choisi, et
le temps de livraison (en minutes) au magasin ainsi que le volume du produit livré (en caisses) sont
observés pour chaque magasin (voir le tableau 12.4 et la figure 12.10). On suppose que le temps de
livraison et le volume des produits livrés sont conjointement et normalement distribués.
La régression linéaire simple et la corrélation 419

/
70 H

G 60-
O
C/3
sC
V—
3
<
50 -
>
< D 40-
T3
<
/C>
X30-
S
eu
H 20-

10

Nombre de caisses
) . V' r^ r
C lV - - '

a n
R U
^ 3
(T h
k'
*
a
^
e
^
f?So La relation entre le temps de livraison et le nombre de caisses,
•Xi

pour les 25 observations du tableau 12.4


Les données du tableau 12.4 donnent
SYY= 6105,945, = 698,560, SXY= 2027,713
Le modèle de régression ajusté est
y = 5,114 + 2,903X.
Selon l’équation 12.31, le coefficient de corrélation échantillonnai entre et est
SX Y 2027,713
r 1/2 1/2 0,982.
[(698,560X6105,945)]

On remarque que R2 2
= (0,982)^ = 0,964 ou que la relation linéaire avec le volume livré explique 96
de la variabilité du temps de livraison. Pour tester l’hypothèse
H0:p = 0,
H,: p*0,
on calcule la statistique du test de l’équation 12.34 comme suit:

r^fn - 2 0,982^23
to 24,80.
1 -r 2 0,964

Puisque tQ025.23= 2,069, on rejette H0et on conclut que le coefficient de corrélation p diffère de 0 au seuil
de 5 %. Finalement, l’équation 12.38 permet d’établir un intervalle de confiance à environ 95 % pour p.
Comme arctanh r= arctanh 0,982 = 2,351, l’équation 12.38 devient

1,96 \ 1,96
tanh 2,351 < p < tanh 2,351 +
V22 J V V22 J

et se réduit à
0,959 < p < 0,992.
420 CHAPITRE 12

Résumé
Modèle linéaire simple
Y, = P0 + PlX, + Ei (i = l,...,n ),
où les Y sont indépendantes et suivent une loi N(/30 + p,X (, (T“).

Test de signification de»la


••, régression
_^
H0 : A = 0 ' #

H :/i * 1)
’ é y i 'v *

, , » . *’ i C%? ^ | 4
- - - *[ •
_■ ■< '. y ? '* '■ ‘ *’ i '■» . ^

V r tt Jj $ W ^ ^JVÿ

SSR 1 MS* = SS*/1 p _ m sr


Régression /o
0 MS£
> ^ a ; l , n - 2

Erreur SS e n —2 MS* = SS£/(n - 2)


Total SST n -1
La régression linéaire simple et la corrélation 421

n n n

S xy
H (. - x ) ( y i - r ) = Y l X ,Y ,- n X Y ssR= X ( r , - 0 2 = P iS xy
n

/=i /=!
n n

K>
- X ) 2 : - n X 2 SSE

II
= ± ( X ,

i

Sxx : =X *? l é
1=1 1=1 1=1
n n
O}

- 2 > , - F ) 2 = I v - ■n Ÿ 2 SST —Syy


11

/=1 /=!

R 2=
.ssR_ f>2SxX = coefficient de détermination Y, -Ÿ , = Y ,- (/30 +
* O
n,
L7 \J
X
/ •
Pl °5Y Y ei =
SST
( i= 1,2, ..., n)

/ x = 2109
Les données des exercices avec le symbole i*
ÿ = 6,964
sont aussi disponibles en format électronique. ^
*
Sxx = 3 604 739
~ s * • » . *

12.1 Montgomery, Peck et Vining (2001) Syy= 326,96


(B présentent des données à propos de
la performance de 28 équipes de la Sxy = -25 328
National Football League. Ils pensent a) Ajustez un modèle de régression linéaire
que le nombre de matchs gagnés, Y, est établissant un lien entre les matchs
lié au nombre de verges d’attaque au gagnés et les verges gagnées pat les
sol gagnées par les adversaires, X. Le adversaires. Donnez l’équation de la
diagramme de dispersion est présenté droite de régression.
ci-dessous. b) Quelle est l’estimation de la variance
des observations autour de la droite
de régression ?
c) Trouvez un intervalle de confiance à 95 9r
pour la pente de la droite de régression. f y • « ' X V * * '% *

d) Testez la signification du modèle de


régression au seuil de 5% à laide
de votre réponse en c).
e) On désire prévoir le nombre de matchs
qu’une équipe gagnera si elle limite
l’attaque des adversaires à 1800 verges.
Nombre de verges gagnées *
Calculez un intervalle de prévision à
» ; ‘• 1 " * ‘ _ * J» - _ .

95 % pour le nombre de matchs gagnés


Voici quelques statistiques calculées si les adversaires gagnent 1800 verges
à partir des données. -.
en attaque au sol.
»■
CHAPITRE 12

12.2 La revue Motor Trend présente fréquem- 12.3 Un article de Technometrics (« Prédiction,
(V f ment des données de performance de (£J linear régression and a minimum sum of
voitures. Le diagramme ci-dessous illustre relative errors », vol. 19, n° 2, 1977,
des données concernant la performance (y) p. 185-190) présente les données sur le
et la cylindrée (X)du moteur de prix de vente (Y) et les taxes annuelles
15 voitures.
( X)de 24 maisons ( diagramme
de dispersion ci-dessous).

100 200 300 400 500


Cylindrée (pouces cubes)
Voici quelques calculs effectués à partir
des données. Taxes annuelles (milliers de dollars)

x = 321,66 SYY= 275,21 L’équation de la droite de régression est


.

y= 18,47 5 ^ = -5477,1 y = 13,32 + 3,32*.


Sxx= 133 668,3 La table d’analyse de la variance associée
à ces données est présentée ci-dessous.
a) Ajustez un modèle de régression éta­
blissant un lien entre la performance Source Somme Degrés Moyenne
et la cylindrée des moteurs. de des de des
b) Testez la signification du modèle de variation carrés liberté carrés /.
régression à l’aide d’une table d’analyse
Régression 636,15 1 636,16 72,56
de la variance. Énoncez clairement
Erreur 192,89 22 8,77
les hypothèses statistiques et calculez
Total 829,05 23
approximativement la valeur P.
c) Quel pourcentage de la variabilité
a) Que pouvez-vous conclure à partir
totale de la performance la cylindrée
de ce tableau au seuil de 1% ?
permet-elle d’expliquer ? *

b) Quel pourcentage de la variabilité


d) Trouvez un intervalle de confiance à
du prix de vente les taxes payées
90 % pour le nombre moyen de milles
permettent-elles d’expliquer ?
par gallon si la cylindrée du moteur est
de 275 pouces cubes. c) Sachant que Sxx = 57,56 et que
x = 6,405, pouvez-vous conclure que
e) On désire prévoir le nombre de
l’ordonnée à l’origine est nulle au seuil
milles par gallon d’une voiture ayant
de 1%?
une cylindrée de 275 pouces cubes.
Trouvez une estimation ponctuelle et 12.4 La résistance du papier utilisé pour
un intervalle de prévision à 90 % pour (J+J fabriquer des boîtes de carton, T, est
cette quantité. Comparez cet intervalle liée au pourcentage de bois dur dans la
à celui qui a été obtenu à la partie d). pâte originale, X. Dans des conditions
Lequel est le plus long ? Pourquoi ? bien définies, une usine pilote fabrique

\
La régression linéaire simple et la corrélation

16 échantillons, chacun à partir d’un lot b) Remplissez la table d’analyse de la


de pâte différent, et mesure la résistance variance ci-dessous et testez si le modèle
à la traction. Les données et le diagramme linéaire est significatif au seuil de 1%.
qui les représente sont fournis ci-dessous.
Source SommeDegrés Moyenne
> 101,4 117,4 117,1 106,2 131,9 146,9 146,8 133,9
de des de des
x HÔ L5 L5 Ï 3 2ÏÏ variation
2f) 2^2 2,4
carrés liberté carrésf Valent-.P
y 111,3 123,0 125,1 145,2 134,3 144,5 143,7 146,9 Régression ? ? ? ? ?
T 2,5 2^5 2^8 2^8 3^0 3jÔ X2 L3~~ Erreur 1895,04 ? ?
Total 3650,81 ?

c) Un nouveau lot de pâre est analysé ; il


contient 2,7 % de bois dur. Établissez
un intervalle de prévision à 99 % pour
la résistance du papier qui sera fabriqué
à partir de ce lot.
d) Un autre lot de pâte est analysé ; il
contient 3,1 % de bois dur. Sans faire
s

aucun calcul, dites si l’intervalle de


prévision à 99 %, relativement à la
résistance du papier qui sera fabriqué
à partir de ce lot, sera plus long ou plus
Pourcentage de bois dur court que l’intervalle calculé en c). La
valeur prédite sera-t-elle plus petite ou
La droite de régression associée à ces plus grande ?
données est e) Les deux graphiques associés aux
y = 93,34 + 15,65X. résidus du modèle sont présentés dans
a) Interprétez précisément la significa­ la figure 12.11. Dites à quoi servent ces
tion des nombres 93,34 et 15,65 dans graphiques et quelles conclusions vous
l’équation ci-dessus. pouvez en tirer.

30 110 115 120 125 130 135 140 145


Résidus Valeurs prédites ' ■ ! j

<
*

Exercice 12.4: a) ('histogramme des résidus; b) le graphique des résidus


en fonction des valeurs prédites
CHAPITRE 12

12.5 On pense que le nombre de livres de b) Réalisez un test bilatéral au seuil de


(7+T vapeur utilisées par mois par une usine de 1% pour vérifier l’hypothèse que la
produits chimiques est lié à la température pente /?, = 10.
extérieure moyenne durant ce mois-là. Le c) Peut-on conclure de ces données
tableau ci-dessous donne la quantité de qu’une faible température est associée
vapeur utilisée et la température moyenne à une faible quantité de vapeur ?
pour chaque mois d’une année particu­ d) Peut-on conclure de ces données qu’une
lière. Certaines statistiques calculées à température moyenne élevée cause une
partir de ces données sont indiquées, et grande quantité de vapeur ?
le diagramme de dispersion est illustré e) Calculez les résidus associés aux deux
ci-après. premières observations.

X = température Y = quantité 12.6 On pense que le pourcentage d’impuretés


(en degrés utilisée Q*J dans l’oxygène gazeux produit par un
Mois Fahrenheit) (livres/1000) procédé de distillation est lié au pourcen­
tage d’hydrocarbures dans le condenseur
Janvier 21 185,79 principal du distillateur. Le tableau 12.5
Février 24 214,47 énumère les données d’exploitation durant
Mars 32 288,03 un mois, et le graphique des observations
Avril 47 424,84 est illustré ci-après.
Mai 50 454,58
Juin 59 539,03 Un modèle de régression a été ajusté
Juillet 68 621,55 sur ces données, dont l’équation est
Août 74 675,06
Septembre 562,03 y = 77,86+ 11,80X.
62
Octobre 50 452,93
Novembre 41 369,95
Décembre 30 273,98

12 12
S x = 5062,24 S - , = 558
i=l i=i
30 470,47 Sn = 280 620,9
T T T I T T

Sxx = 3309 0,9 1,0 1,1 1,2 1,3 1,4 1,5


% Hydrocarbures
a) Sachant que la valeur observée de la
600- statistique F0vaut 11,47, que pouvez-
3
U vous conclure au seuil de 5 % ?
Cu,
es 500 b) Quelle est la valeur prédite associée
<
*oU à la première observation ?
400- c) Sachant que SSEvaut 232,83, calculez
R2 pour ce modèle. Comment
A 300- interprétez-vous cette quantité ?
d) Pouvez-vous estimer l’écart-type des
200 -

observations autour de la droite de


20 30 40 50 60 70 régression ?
Température (°F)
12.7 Un article de Transportation Research
a) Ajustez un modèle de régression (gT Part E (vol. 35, n° 3, 1999, p. 183-189)
linéaire simple aux données. présente une étude sur l’emploi maritime
r®9ression linéaire simple et la corrélation

Pureté (%) 86,91 89,85 90,28 86,34 92,58 87,33 86,29 91,86 95,61 89,86
Hydrocarbures ( %) 1,02 1,11 1,43 1,11 0,95 1,11 0,87 1,43 1,02
—L2L
Pureté (%) 96,73 99,42 98,66 96,07 93,65 87,31 95,00 96,85 85,20 90,56
Hydrocarbures (%) 1,46 1,55 1,55 1,55 __U0_ 1,15 1,01 0,99 0,95 0,98

mondial. Cette étude visait à déterminer e) Aura-t-on une meilleure précision


une relation entre le nombre moyen de en prévoyant y pour une année où
marins et la taille moyenne des bateaux. les bateaux pèsent 6000 tonnes en
Les données recueillies pour les bateaux moyenne, ou en prévoyant la valeur
du Royaume-Uni sur une période de moyenne de y pour toutes les années
16 ans sont illustrées dans le diagramme où les bateaux pèsent 6000 tonnes
de dispersion ci-dessous. en moyenne ?
12.8 Le diagramme ci-dessous illustre les
®T moyennes finales de 20 étudiants, choisis
au hasard, qui suivent un cours de sta­
tistique pour ingénieurs et un cours en
recherche opérationnelle au Georgia Tech.
Supposez que les moyennes finales sont
conjointement et normalement distribuées.

Tonnage brut moyen des bateaux

a) On sait que l’intervalle de confiance


à 95 % pour la pente est [0,001 48 ;
0,001 90]. Si la taille moyenne d’un
bateau augmente de 1000 unités, quel
changement moyen cette augmentation 60 65 70 75 80 85 90 95 100
devrait-elle entraîner sur le niveau des
Note en recherche opérationnelle
effectifs ?
b) On sait que l’intervalle de confiance La droite de régression estimée associée
à 95 % pour l’ordonnée à l’origine est à ces données est y = -0,028 + 0,99 IX.
[2,428 ; 5,501]. Quelle est la valeur
prédite par le modèle pour le niveau On a aussi calculé les quantités ci-dessous,
des effectifs pour les années où je = 80,1 v = 79,4
le tonnage moyen des bateaux est sx =8,88 sy.= 9,14
de 5000 ?
a) Estimez le coefficient de corrélation
c) Sachant que jc= 7016,6 et que
en regardant le graphique.
ÿ = 15,83, aura-t-on une meilleure
précision en prédisant le niveau b) Calculez le coefficient de corrélation
d’effectifs pour un tonnage moyen échantillonnai.
de 6000 ou de 7500 tonnes, avec le c) Testez l’hypothèse (bilatérale) que
modèle de régression linéaire simple? p= 0, au seuil de 5 %
d) Aura-t-on une meilleure précision d) Testez l’hypothèse (bilatérale) que
en prévoyant le niveau d’effectifs p= 0,5, au seuil de 10 %.
moyen avec un niveau de confiance e) Etablissez un intervalle de confiance à
de 95 % ou de 99 % ? 95 % pour le coefficient de corrélation.
CHAPITRE 12

12.9 Le diagramme ci-dessous montre le lien e) En valeur absolue, la corrélation


(Ç+T entre le poids et la pression systolique échantillonnale entre X et Y est
de 26 hommes choisis au hasard dans inférieure à la proportion de varia-
la tranche d’âge 25-30 ans. bilité de Y expliquée par X.
180 12.11 Associez les diagrammes de disper­
< D 170- sion suivants aux bonnes valeurs de
=3
corrélation, de pente et d’ordonnée
ao 160-1
à l’origine.
C
/>3> 150-1
ao 140 r -0,97 0,12 0,92 0,99
OO 130 A

<D
o< 120-
A /V
-1,00 0,04 1,00 9,63

Po U 47,0 104,2 203,3


110
120 140 160 180 200 220 240 260
Poids a) ^ •
80- •
On a calculé les statistiques suivantes •v •
à partir des données.
• J*•
y
40- : •
Sxx =15 312,3 Sxy = 6422,2
• .V
S„ = 4502,2 A *
0- --*-- 1----- 1----- 1----- \-----
0 20 40 60 80 100
Supposez que le poids et la pression systo­ x
lique sont conjointement et normalement
distribués.
a) Estimez le coefficient de corrélation
théorique.
b) Testez l’hypothèse que p = 0 par oppo­
sition à l’hypothèse que p > 0 au seuil
de 5 %.
c) Testez l’hypothèse que p — 0,6 par
opposition à l’hypothèse que p ï 0,6
au seuil de 5 %.
d) Déterminez un intervalle de confiance
à 95 % pour le coefficient de corrélation.
12.10 Déterminez si les énoncés suivants sont
vrais ou faux.
a) Lorsque la pente théorique (/^j de la
vraie droite de régression est nulle, les
valeurs ajustées à partir d’un échantil­ 0 20 40 60 80 100
lon (y, ) sont très proches de x
b) Si tous les points sont sur la droite d) 1200-y
de régression de Y par rapport à X, le
coefficient de corrélation échantillonnai 800-
entre Y et X est égal à 1 ou -1. •#
y
c) La droite de régression estimée passe 400-
toujours par le point (x, •V *
d) Plus la taille d’échantillon augmente, 0- i
plus le coefficient de corrélation échan­ 0 20 40 60 80 100
tillonnai se rapproche de 1. x
La régression linéaire simple et la corrélation

12.12 En examinant un certain diagramme


de dispersion de n points (*, y), on
remarque que lorsque x est au-dessus de
sa moyenne, alors y tend à être supérieur
à sa moyenne. Lorsque x < x, alors y < ÿ
en général.
a) Peut-on conclure que >0 ?
b) Peut-on conclure que p > 0 ?
A

c) Peut-on conclure que /?, > 0 ?

12.13 Pour chacun des diagrammes suivants,


déterminez si le retrait de l’observation
en noir fera augmenter ou diminuer
les estimations du coefficient de cor­
rélation, de la pente et de l’ordonnée à
l’origine.
■ W ^ e nom breux problèmes de régression font Intervenir plusieurs variables
explicatives. De tels m odèles sont appelés «m odèles de régression multiple
- ** * La régression multiple est l’une des méthodes statistiques les plus utilisées.
D ans ce chapitre, nous verrons les méthodes de base d’estimation de param ètres,
d’estim ation par intervalles de confiance et de vérification de la validité du modèle
de régression multiple.

13.1 Les modèles de régression multiple


Supposons que la durée de vie effective d’un outil de coupe dépend de la vitesse de coupe et de
l’angle de l’outil. Cette relation pourrait se décrire par le modèle de régression multiple

Y=fa0 + falX l +fa2X2+ E, (13.1)

où Y représente la durée de vie de l’outil, X, est la vitesse de coupe et X2, l’angle de l’outil. C’est
un modèle de régression linéaire multiple à deux variables explicatives. On utilise le terme
«linéaire» parce que l’équation 13.1 est une fonction linéaire des paramètres inconnus fa0,
et fa2. Ces paramètres sont appelés les «coefficients de régression». Le paramètre fa0 définit
l’ordonnée à l’origine du plan. Les paramètres fax et fa2 sont parfois appelés «coefficients de
régression partiels » parce que faxexprime l’espérance mathématique de
une augmentation de 1 unité de X, lorsque X2 est maintenu constant et que fa2 exprime l’espé­
rance mathématique de la variation de Y pour une augmentation de 1 unité de X2 lorsque X, est
maintenue constante. Le terme E désigne une erreur aléatoire, c’est-à-dire une variation non
expliquée par X, ni par X2.
De façon générale, la variable dépendante Y est liée à k variables indépendantes.

Modèle de régression linéaire multiple


Le modèle
(13.2)
constitue un modèle de régression linéaire multiple à k variables indépendantes. Les paramètres fa-,
. * . * * . . • > .

j = 0, 1, ..., k, sont appelés les «coefficients de régression». Ce modèle décrit un hyperplan dans
l'espace à k dimensions des variables explicatives {X,, X ,,..., XJ.
k
On suppose que les termes d’erreur E. du modèle sont tels que E(JE) = 0, Var(E) = cr2 et que les {Et)
sont des variables aléatoires non corrélées et normalement distribuées.
La régression multiple

L'interprétation des coefficients


Le param ètre Æ représente l’espérance mathématique de la variation de la variable dépendante
Y pour une augmentation de 1 unité de X} lorsque toutes les autres variables indépendantes
X j (i ^ j ) sont maintenues constantes. Les paramètres P j , j = 1, 2, k, sont souvent appelés
«coefficients de régression partiels» parce qu’ils décrivent l’effet partiel d’une variable indé­
pendante lorsque les autres variables indépendantes du modèle sont maintenues constantes. Par
exemple, si les valeurs de Y sont modélisées par l’hyperplan 31 + 8X, - ]1X2 + -f £, on
peut interpréter la valeur de p.2 17 comme suit: si X2augmente de 1 unité, tandis que X et X-.
dem eurent stables, alors Y diminue en moyenne de 17 unités.
Les modèles de régression linéaire multiple servent souvent de fonctions d'approximation.
Autrement dit, la véritable relation fonctionnelle entre Y et X,, X2, .... XLest inconnue, mais le
modèle de régression linéaire est une approximation convenable sur certains intervalles des
variables indépendantes.

Les modèles polynomiaux ou avec interactions


Les méthodes de régression linéaire multiple permettent souvent d’analyser des modèles appa­
rem m ent plus complexes que l’équation 13.2. Soit, par exemple, le modèle polynomial cubique
à une variable indépendante

Y= P 0 + p lX + P2X2 + P,X3 + £. (13.3)

Si on pose X, = X, X2 = X2 et X3= X 3, l’équation 13.3 devient

Y = p0+ #X , + p2X2+ /?3X3+ £,

un modèle de régression linéaire multiple à trois variables explicatives.


Les méthodes de régression linéaire multiple permettent aussi d’analyser les modèles
contenant des effets d’interaction. Soit, par exemple, le modèle

Y = p0+#X , + p2X2+ PnXxX2+ E.

Si on pose X3 = X,X2 et p3= /?12, l’équation 13.5 devient

Y = P0+p xXx+ p2X2+ p,X, + E, (13.6)

un modèle de régression linéaire. En règle générale, tout modèle de régression qui est linéaire
par rapport aux paramètres (les p) est un modèle de régression linéaire, peu importe la forme
de la surface qu’il génère.

13-2 L'estimation des paramètres


Les paramètres p.J sont des constantes inconnues dont la vraie valeur ne peut être évaluée qu’à
partir de la population complète. La collecte d’un échantillon aléatoire permet de trouver une
approximation raisonnable des p.
On estime les coefficients de régression de l’équation 13.2 par la méthode des moindres
carrés. Supposons qu’on dispose de n > kobservations. Appelons Xi} la i
variable X .. Le tableau I3.l (voir à la page suivante) montre la façon de présenter les données.
430 CHAPITRE 13

Observation Y x2 • • »
**
1 Yx *.2 • « •
*u
2 y2 *2. *22 • • •
*2,
• * • • •
• • • • • •
• • • • •

n *„2 ♦ ♦ •

La notation scalaire
E c r i v o n s l e m o d è l e d e l ’é q u a t i o n 1 3 .2 e n f o n c t i o n d e s o b s e r v a t i o n s . O n o b t i e n t

L a so m m e d es c a rré s d es e rre u rs est

T o u t c o m m e a u c h a p itr e p r é c é d e n t, la fo n c tio n L d o i t ê t r e m i n i m i s é e p a r r a p p o r t à /3 0 , / ? . , . . . , J5k .


A A A

L e s e s t i m a t e u r s f i 0 , /3 ,, . . . , (3 k d e s p a r a m è t r e s /? 0, /? ,, . . . , {3k p a r la m é th o d e d e s m o in d re s c a r r é s

d o iv e n t a lo r s s a tis f a ir e le s é q u a tio n s

L a s im p lific a tio n d e l ’é q u a t i o n 1 3 .9 d o n n e ce q u ’o n a p p e lle le s « é q u a tio n s n o rm a le s » d e la

m é th o d e d e s m o in d re s c a rré s :

n n n n

n p 0
+ / 3 , X * . i + Â X
/=1
x i2 +"'+ÂX^ = x ^
/=1
*=1 /=1

P o t , * , , + Â 1 x i + P 2 ' £ x n x r .■ + - - - + Â X * A ; =Z v ,
( 1 3 .1 0 )

/ =1 / =1 1= 1 /=1 1= 1

• • • • •
• • • • •
• • 9 • »

P o X X * + P , ' £ X * X .n, + À X ! + , *- + Â X ^
i= 1 i= \ 1= 1 1= 1 1=1

O n r e m a r q u e q u ’i l y a p = k + 1 é q u a tio n s n o rm a le s , u n e p o u r c h a c u n d e s c o e ffic ie n ts d e r é g r e s ­

s io n in c o n n u s . L a s o lu tio n des é q u a tio n s n o rm a le s se ra l ’e n s e m b l e d e s e s tim a te u rs d es c o e ffi-


y* /N A A

c ie n ts d e ré g re s s io n J30 , ..., f i k p a r la m é th o d e d e s m o in d re s c a rré s .


La régression multiple 431

La notation matricielle
L a notation matricielle facilite la résolution des équations normales. Donnons un développe­
m ent m atriciel des équations normales qui équivaut au développement de l’équation 13.10.

IN/lodèle de régression linéaire multiple en notation matricielle


. ■ . * « aa * ' — .

Le modèle en fonction des observations de l’équation 13.7 s’écrit, sous forme matricielle
Y =XB + E,
ou

1
I-------
1____
1

1-------

1 Xn X{2 X
Æ \k,
1 *21 X ... x
Y y2 22 æ 2k Pl et E =
= » , X = é• ••
♦ ♦
• • . P . ! ,
,» • -•



0
''
Yn 1 x n2;----- ^ nk Pk E„
9§—
— J

En règle générale, Y est le vecteur nx1 des observations de la


de dim ensions n x ( k +1) des valeurs des variables indépendantes, est un vecteur 1) x
coefficients de régression et E est un vecteur n x 1 des erreurs aléatoires.
O n cherche le vecteur des estimateurs par les moindres carrés, J3, qui minimise
n

L = y£ /E f = E 'E = ( Y - X P ) '( Y - X fi).


i=i
On peut exprim er L sous la forme
L = Y ’Y - P ,X ’Y - Y ,XP+ P ’X'Xp
= Y,Y-2P'X,Y + p X ’Xp, (13.11)
puisque P 'X 'Y est une matrice de dimensions 1 x 1, donc un scalaire, et sa transposée
{p ’X 'Y ) ' = Y'XP est le même scalaire. Les estimateurs par la méthode des moindres carrés
doivent donc satisfaire

= - 2 X Y + 2X'XP = 0,

qui se simplifie en
X X p = X'Y. (13.12)

L e système d’équations 13.12 constitue les équations normales de la méthode des moindres
carrés ; il est identique au système d’équations 13.10. Pour résoudre les équations normales, on
m ultiplie les deux membres du système 13.12 par l’inverse de la matrice X'X.

Estimateur du vecteur des coefficients par les moindres carrés


H .. .. . . *"** . . •• , * . ' . . ‘ I #I « . , ' , , ... .
. ' ■^ . * I . . . aa .
- «;' ■ ' *— . . .„ • *■* •. * . ■ - - . I ' ■ . - ■ '- . , ‘ * ■'. '.. . < ' ■ ~

L’estimateur de P par la méthode des moindres carrés est


. .
%| . **
^
* “
P = (X'X)~lX'Y.
. ’ * . . ... •> . ’
_ . . * ^ a .i
f
*.

. ’
■ 'I ' . fc' **
■.
.
(13.13)
- " v « . . ï* v > - * . ’t • • • : ' . •' - /. • * : ' .
* ■'•Y* , . '- » ,. ■ ' i , *.. ‘

O n peut remarquer que X X est une matrice symétrique de dimensions ( k + l) x ( k + 1) dont


les élém ents diagonaux sont les sommes des carrés des éléments des colonnes de X.
CHAPITRE 13

Modèle de régression ajusté


Le modèle de régression ajusté est
Y -X ^ (13.14)
En notation scalaire, le modèle ajusté est
k
- Â> + £ A * r ‘' = 1-2
;'=i

- ■ « . * ' • » . ■»

Résidu du modèle de régression linéaire multiple


La différence entre l’observation Yi et la valeur ajustée Y. est un résidu, soit
ei *Y.i —Y.
Le vecteur de dimensions x 1 des résidus est noté
e = Y -Y . (13.15)

Exemple 13.1
Un article du Journal of Agricultural Engineering and Research (vol. 73, n° 3,1999, p. 275-282) décrit
l’utilisation d’un modèle de régression pour expliquer l’ampleur des dégâts (meurtrissures) sur les
pêches en fonction de la hauteur de leur chute (mesurée en millimètres) et de leur masse volumique
(mesurée en grammes par centimètre cube). Un des buts de l’analyse est de trouver un modèle de pré­
vision de la taille des meurtrissures des pêches qui servira de guide pour la récolte et la postrécolte.
Le tableau 13.2 présente des données typiques de ce genre d’expérience, tandis que la figure 13.1
illustre le lien linéaire entre Y et les variables X et X prises une à la fois.

PfL * ï a ç
La 0 11 * Æ
. 1

nérode Taille des Hauteur de chute Masse volumique des


ervation 1 meurtrissures (mm), Y (mm), I , fruits (g/cm3), X2
1 3,62 303,7 0,90
2 7,27 366,7 1,04
3 2,66 336,8 1,01
4 1,53 304,5 0,95
5 4,91 346,8 0,98
6 10,36 600,0 1,04
7 5,26 369,0 0,96
6,09 418,0 1,00
8
6,57 269,0 1,01
9
4,24 323,0 0,94
10
8,04 562,2 1,01
11
3,46 284,2 0,97
12
8,50 558,6 1,03
13
9,34 415,0 1,01
14
5,55 349,5 1,04
15
16 8,11 462,8 1,02 ►
La régression multiple

Numéro de Taille des Hauteur de chute Masse volumique des


l’observation meurtrissures (mm), Y (mm), Xx fruits (g/cm3), X2
17 7,32 333,1 1,05
18 12,58 502,1 1,10 1
19 0,15 311,4 O,91
20 5,23 351,4 1 0.96 1

La relation entre la taille des meurtrissures et: a) la variable b) la variable X2

On ajustera le modèle de régression linéaire multiple Y = fi0 + fî]Xl + fî2X2 + E sur ces données. La
matrice X et le vecteur Y de ce modèle sont

303.7
366.7
336.8
304.5
346.8
600,0
369.0
418.0
269.0
323.0
562.0
284,2
558.6
415.0
349,5
462.8
333.1
502.1
311.4
351.4
CHAPITRE 13

La matrice X 'X est

F 20 7767,8 19,93
7767,8 3 201646 7791,878
I 19,93 7791,878 19,9077

et le vecteur X 'Y est

Selon l’équation 13.13, les estimateurs par la méthode des moindres carrés sont

Donc, le modèle de régression ajusté est

y = -33,831 + 0,013 14X, + 34,890X2.

On pourrait dire que, selon ce modèle ajusté, une hausse de 10 cm (ou 100 mm) de la hauteur de chute
correspond à une augmentation moyenne de 1,314 mm de la meurtrissure pour une m asse volum ique
fixée. De même, on peut estimer qu’un fruit ayant une masse volumique supérieure de 0,1 g/cm 3 à celle
d’un autre fruit aura une meurtrissure prédite de 3,5 mm plus grande s’ils tombent de la m êm e hauteur.

Notons que la valeur individuelle des coefficients doit être interprétée avec prudence, car elle peut varier
grandement en fonction des autres variables présentes dans le modèle, surtout si les variables explica­
tives sont corrélées entre elles. La section 13.6 aborde ce problème appelé « multicolinéarité ».
La régression multiple

Le tableau 13.3 énumère les valeurs ajustées de Y et les résidus. La valeur 1,56 sur la première ligne,
par exemple, est la valeur prédite (sur le plan de régression) correspondant à une hauteur de chute de
303,7 mm et une masse volumique de 0,90 g/cm3. Elle est obtenue en calculant

£,=-33,831 + 0,01314(303,7) + 34,890(0,90) = 1,56.

h fi lîfWiMi 9 *fl . *CkL pt M ^ jfl


Mb fl* % jfl** * . ^* 9 Z A b* b AP fl V *. JL4 fl
jj * » * * ï *T *j ^ •T f a i I F* t* f• i JK
i >«r ~TT ^ 7 * T ^ v y . Z fe»* K•»>
la

l ■f. i #J A ( • i lJ 11 1■ 1I 1 1 [i, a .m ^ l F
*k v
'jK» ■*1
t

Numéro de * ^ ^ a
A

l’observation, 3>/ :jv e, = v, - v,


i ✓ / ✓ /
!
»,

1 3,62 1,56 2,06


2 7,27 7,27 0,00> •” *

3 2,66 5,83 -3,17


4 1,53 3,31 -1,78
5 4,91 4,92 -0,01
6 10,36 10,34 0,02
5,26 4,51 0,75
7

6,09 6,55 -0,46


8

9 6,57 4,94 1,63


10 4,24 3,21 1,03
1 1
8,04 8,79 -0,75
3,46 3,75 -0,29
1 2

8,50 9,44 -0,94


1 3

9,34 6,86 2,48


1 4

5,55 7,05 -1,50


1 5

8,11 7,84 0,27


16
7,32 7,18 0,14
1 7

12,58 11,14 1,44


1 8

19 0,15 2,01 -1,86


20 1 5,23 4,28 0,95

13.2.1 Les propriétés statistiques de p


A
Voici trois propriétés de l’estimateur par la méthode des moindres carrés J3:
S V

variable aléatoire P est un estimateur sans biais de t8. On a donc E{p)


Démonstration

/\
2. La matrice des covariances de p se calcule comme suit :
Cov(/3) = E { l P - E ( j ) ) } [ j } - E m ' } = <72(* ’* )-'.
La matrice des covariances de p est une matrice symétrique de dimensions
(Jk + 1) x {k+ 1) dont l’élément (j,
A
j) est la variance *

riance entre /3, et pr


436 CHAPITRE 13

3. Il faut habituellement estimer a 2 pour calculer des estimations des erreurs-types associées
aux pj• Pour développer cet estimateur, on considère la somme des carrés des résidus, soit

ssE=jj>',
1=1
= (Y-XP )XY-XB )

(13.16)

Démonstration
___________________________ /

L’équation 13.16 est appelée la « somme des carrés des résidus » ou « somme des carrés
due à l’erreur»; elle a n - (k + 1) degrés de liberté. La moyenne des carrés due à
l’erreur est

(13.17)

Il est démontré que l’espérance mathématique de MSEest g 2 ; donc, un estimateur sans


biais de G2 est

(13.18)

Exemple 13.2
Estimons la variance de l’erreur g 1 du problème de régression multiple de l’exemple 13.1. En se basant
sur le tableau 13.2, on a
20
Y'Y = ^ y f =904,60
/=!

120,79
P'X'Y = [-33,831 0,01314 34,890] 51129,17
122,70
866,39.

Donc, la somme des carrés due à l’erreur est


SSE= Y 'Y -p'X 'Y
904,60 - 866,39
38,21.

L’estimation de <j 2 est

«-(& + 1)
38,21

2,247.
La régression multiple 437

13.3 intervalles confiance dans


une linéaire multiple
Il faut souvent estimer les coefficients de régression en établissant des intervalles de confiance.
Le développement d’une procédure pour obtenir ces intervalles de confiance exige de supposer
normalement et indépendamment distribuées avec une moyenne
2
Les observations Yi sont alors normalement et indépendamment d
moyenne de + X*=1 P jX ^ et une variance <72. Or, l’estimateur par la métl
carrés fi est une combinaison linéaire des observations. Donc, fi est normalemei un
vecteur des moyennes /J et une matrice des covariances G2(X'X)~l. Ainsi, chac IC Cn *f s ■

7 = 0,1,..., k, (13.19)
<7 C j„j

est distribuée selon une loi t de Student avec n —(k+ 1) degrés de liberté, où C* est l’élément (/, j)
de la matrice ( X ï ) " 1 et<72, l’estimateur de la variance de l’erreur, obtenu de l’équation 13.18.

Intervalle de confiance pour un coefficient fi


Un intervalle de confiance à 100(1 — ce) % pour le coefficient de régression fi., compte tenu de la pré­
sence des k—1 autres variables, est

Pj ~^a/2,n-(k +D â~C -, 7 = 0, 1, ..., k. (13.20)

Exemple 13.3
*

Etablissons un intervalle de confiance à 95 % pour le paramètre de l’exemple 13.1. On remarque que


l’estimation ponctuelle de fixest fix= 0,013 14 et que l’élément diagonal de (X'X)
est C n = 0,000 007 7. L’estimation de g 2 obtenue à l’exemple 13.2 est 2,247 et Lo25;i7 = 2,110. Donc,
selon l’équation 13.20, l’intervalle de confiance à 95 % pour fixest

0,013 14 ± (2,110)7(2,247X0,000 007 7)


0,013 14±0,008 78,

ce qui se simplifie en
0,004 36 <fil <, 0,021 92.
À r.

On peut aussi obtenir un intervalle de confiance pour la réponse moyenne en un point par­
ticulier, c’est-à-dire pour des valeurs spécifiées des variables X , . . X,. On définit le vecteur
1
x 01
X0 X 02
»

X 0k • x-v

L
CHAPITRE 13

La réponse moyenne en ce point, E(YQ\x Q), est estimée par

Y0 = x'0p. (13-21)
A

Cet estim ateur est sans biais puisque E(Yn) —E (x’np ) E tY A x à

Var (y0 1
) = o 2x 'J X 'X r'x „ . (13.22)

Intervalle de confiance pour la moyenne de V en un point x


Un intervalle de confiance à 100(1 —
- _ » . ' ’ • ■ *^ ' . *; . —
a )%pour la réponse moyenne au point (x01, jc02, xo
' ■ • *

Y + r
*0 —1a!2; n- (k +1) (13.23)

L’équation 13.23 est un intervalle de confiance défini dans l’hyperplan de régression. C’est
la généralisation de la régression simple de l’équation 12.23.

Exem ple 13.4

Les scientifiques qui effectuent l’expérience sur les pêches meurtries de l’exemple 13.1 désirent établir
un intervalle de confiance à 95 % pour la taille moyenne des meurtrissures d’une pêche qui tombe
d’une hauteur *01 = 325 mm et qui a une masse volumique x02= 0,98 g/cm3. Donc,

1
x0 325
0,98

Selon l’équation 13.21, la réponse moyenne estimée en ce point est

33,831
1 325 0 ,98 1 0, 01314 4,63
34,890

La variance de y 0 est estimée par


24,63666 0,005 321 26,746 79 1
ô 2x ' ( x ' x y ' x o 2,247 [ 1 325 0,005 321 0,000 007 7 -0,008353 325
26,746 79 -0,008 353 30,096 389 0,98

2,247(0,0718) = 0,1613.

Donc, selon l’équation 13.23, l’intervalle de confiance à 95 %pour la taille moyenne des meurtrissures
en ce point est

4.63 ± (2,110)^0,1613
%

4.63 ±0,85,
ce qui se réduit à
3,78 <£(V0|x 0)< 5,48
La régression multiple 439

13.4- La prévision de nouvelles observations


Le modèle de régression peut servir à prévoir de futures observations Y correspondant à des
valeurs particulières des variables indépendantes, soit x0l, x02, x0k. Si x'0 = [l,x 0I, x02, x(J ,
alors

r„= x 'J (13.24)

est une estimation ponctuelle de la future observation Y0 au point (x01, a()2, ..., x,. i. et
*

une marge d’erreur associée à cette prévision à partir de la formule suivante.

Intervalle de prévision pour une valeur future de Y en un point x 0

y0± ta/2;„-,, +i ) V ^ V ^ *o) (13.25)


est un intervalle de prévision à 100(1 - a)% pour une future observation.

Cet intervalle de prévision est une généralisation de l’intervalle de prévision pour une
future observation de la régression linéaire simple de l’équation 12.25.

Exemple 13.5

Supposons que les scientifiques mentionnés dans l’exemple I3.l désirent établir un intervalle de pré­
vision à 95 % sur la taille d’une meurtrissure subie par une pêche tombant d’une hauteur xol = 325 mm
et de masse volumique x 02 = 0,98 g/cm3. On remarque que = [l 325 0,98) et que l’estimation
ponctuelle de la taille de la meurtrissure est 9o = x ofi= 4,63 mm.
À l’exemple 13.4, on a trouvé que (Ar'Ar)-Ijtü = 0,0718. Donc, selon l’équation 13.25,

4.63 ± (2,110) ^2,247(1 +0,0718),


4.63 ± 3,27

et l’intervalle de prévision à 95 % est

1,36 < Y0<


7,90.

La prévision de nouvelles observations et l’estimation de la réponse moyenne en un point


donné (x01, x02, ..., x 0k) exigent de la prudence afin d’éviter une extrapolation au-delà de la
région contenant les observations originales. Un modèle qui s’ajuste bien dans la région des
données originales pourrait mal s’ajuster à l’extérieur de cette région. L’extrapolation par inad­
vertance est fréquente dans la régression multiple puisque la région contenant les données est
difficile à visualiser. En guise d’exemple, considérons la figure 13.2 (voir à la page suivante)
qui représente la région contenant les observations d’un modèle de régression à deux variables.
On remarque que le point (x0,, x02) appartient aux intervalles des deux variables indépendantes
X, et X2, mais qu’il est en dehors de la région des observations originales. Donc, la prévision
de la valeur d’une nouvelle observation ou l’estimation de la réponse moyenne en ce point est
une extrapolation du modèle de régression original.
440 CHAPITRE 13

X,A

I-- ]
' j|
. CS
«
=2 *<U V Région N.
3 *o \ conjointe d e s \
2: *3
B ’5Sb \ données \
g
•G n. originales \
ox
02 li J
±_ I ^ ----
l
l ;
I
-

I
4 * wy
*6l
Intervalle j

original de Xx
t
Un exemple d'extrapolation en régression multiple (à éviter)

13.5 Les tests d'hypothèses dans


une régression linéaire multiple
Dans les problèmes de régression linéaire multiple, des tests d’hypothèses sur les paramètres
du modèle permettent d’évaluer sa validité. Dans cette section, nous décrivons plusieurs procé­
dures de tests d’hypothèses importantes. Nous supposons encore que les erreurs sont normales,
comme à la section précédente.

13.5.1 Le test de signification de la régression


Le test de signification de la régression détermine s’il existe une relation linéaire entre la
variable dépendante Y et un sous-ensemble des variables indépendantes X x, X2, ...,

H y p o th è s e s d u t e s t g lo b a l d e s ig n ific a tio n d e la r é g r e s s io n
= -------A - 0 ,
* •* . (I3.26)
Hj : f5j & 0 pour au moins un j.

Le rejet de H0: p =0 ,y = I, ..., Æimplique qu’au moins une des variables indépendantes X v X2, ..., Xk
contribue de façon significative au modèle.

La procédure du test est une généralisation de la procédure utilisée dans la régression


linéaire simple. La somme des carrés totale SSTse décompose en une somme de carrés due à la
régression et une somme de carrés due à l’erreur, soit
SST= SSR+ SSE,
La régression multiple 441

2
et si Ho est vraie, alors SSR/cr2 ~ x\-> où le nombre de degrés de liberté pour la loi du % est égal
au nombre de variables explicatives du modèle. On peut aussi démontrer que SSEIO2 ~
et que SS, et SSKsont indépendantes.

C r i t è r e d e r e j e t d e H 0: = O
La procédure de test pour H0 consiste à calculer
SSR/k MS R
F,o
SS, /(n-k-1 ) MS,

et à rejeter H() si la valeur observée/,, > F k k_

Cette procédure est habituellement résumée dans un tableau d’analyse de la variance tel le
tableau 13.4.

mBsmmBasmmaaUmÊÉffl
' T r V \ T r * / - Vi K - î «Tl Z * I
^
^
: .1 ® . A J R J ! Xi
l ï ï < i U ■i, 'v«-t
b i d [ > l i T i ü ^ m » ] i i n 1 *J r M i l * r

K S * I fi
■( / ■ A *•
I fi $
■ A/- - . y*

im
a r ;

I ï i 1 * *
1 t l l r 1 M B I & ? j r»{KCM
£* ., * : J ïy ' l
>- f »
*■■■• • . •
•; ‘ :■
'.
-
• •' - •
:. V . T / • / ; / V - '/ :
:
'

;.v
••-■:•
-V :.

Source de Somme Nombre de degrés Moyenne


variation des carrés de liberté des carrés F0
Régression ss* k MS, msr/m s e
Erreur ss£ n-k- 1 MSE
Total SST n- 1

Une formule de calcul de SSR peut être déduite des formules de SST et de SSB. Rappelons
tout d’abord que la somme des carrés totale est

n / \2
ss T 2 lf2>, Y ' Y - -l \ ± Y ^ (13.28)
i=l n ; n{ t l j
Notons également que l’équation 13.16 donne une formule de calcul de la somme des car­
rées due à l’erreur, à savoir
SSE= Y Y - P'X'Y. (13.29)

Puisque

SSR= SST- SSE,

la somme des carrés due à la régression est


V
V "
SS R P'X'Y Y * . (13.30)
n /=! J
442 CHAPITRE 13

* —
* i • 0. -• 4 ~ “ w\ ' • **»

Exemple 13.6
Testons la signification de la régression à l’aide des données sur les pêches meurtries de l’exemple 13.1.
Quelques-unes des grandeurs numériques nécessaires ont été calculées à l’exemple 13.2. On remarque
que
n
2
1
SST = Y'Y Y, y,
n '=1 J
(120,79) 2
904,60
20
175,089,
n \ 2
1
55 P'X'Y *Ly, R
n V'=*
(120,79) 2
866,39
20
136,88,
SS 55 55 «
38,21.

Le tableau 13.5 donne l’analyse de la variance. Pour tester H0: /?, = = 0, on calcule la valeur de la
statistique FQ,c’est-à-dire,

Source de Somme Nombre de Moyenne


variation des carrés degrés de liberté des carrés /o
Régression 136,88 2 68,44 30,46
Erreur 38,21 17 2,247
Total 175,09 19

Comme f 0 > F0X)S.2,n = 3,59, la taille des meurtrissures des pêches est liée à la hauteur de chute, à la
masse volumique des fruits ou aux deux. Toutefois, on remarque que cela n’implique pas forcément
que la relation trouvée est la bonne pour prévoir la taille des meurtrissures en fonction de la hauteur
de chute ou de la masse volumique des fruits. Des tests supplémentaires sur la validité du modèle sont
nécessaires.

13.5.2 Les tests sur les coefficients de régression


On désire souvent tester des hypothèses sur les coefficients de régression afin de déterminer
l’importance de chaque variable indépendante du modèle de régression. L’ajout de variables
supplémentaires au modèle ou la suppression de variables qui y sont déjà, par exemple, pour­
raient accroître l’efficacité du modèle.
La régression multiple

L’ajout d’une variable à un modèle de régression augmente toujours la somme des carrés
due à la régression et dim inue toujours la somme des carrés des résidus. On doit décider si
l’augmentation de la somme des carrés due à la régression suffit pour justifier l’ajout d’une
variable au modèle. De plus, l’ajout d’une variable sans importance au modèle peut augmenter
la moyenne des carrés due à l’erreur et donc diminuer l’utilité du modèle.

Le test de signification pour un coefficient


Les hypothèses du test de signification de tout coefficient de régression, soit /?, sont

• ■. ^
H0: # = O,
Hj : Pj* 0. (13.31)

Si Ion ne rejette pas H 0, alors on peut probablement supprimerX} du modèle.

T e s t p a r t ie l d e s ig n if ic a t io n p o u r un c o e f f ic ie n t
La statistique du test bilatéral pour H ' P - 0 est

T,0
P, (13.32)

où G» est l’élément diagonal de (X'X)~] correspondant à p r On rejette l’hypothèse nulle H„: fy = 0


jj

01 > taJ 2 ; n — k _j. On remarque que ce test est un test partiel (ou marginal) parce que le coefficient de
si |r0|
régression P dépend de toutes les autres variables explicatives X. (i j) du modèle.

Exemple 13.7
Pour illustrer l’utilisation de ce test, on considère les données de l’exemple 13.1. Supposons qu’on veut
tester
0,
H ,:A * 0 .
L’élément de la diagonale principale de (X’X)~l correspondant à P2est C22= 30,096. Donc, la valeur
observée de la statistique T0de l’équation 13.32 est

34,89
4,24
y[(2,247)(30,096)

Comme t0025. 17 = 2,110, on rejette H0: y32 = 0 au seuil de 5% et l’on conclut que la variable X2 (la
masse volumique) contribue de façon significative au modèle. Une démarche équivalente consisterait
à vérifier que la valeur 0 n’appartient pas à l’intervalle de confiance à 95 % pour fi . Ce test mesure la
contribution partielle ou marginale de X2étant donné que X, est dans le modèle.
444 CHAPITRE 13

Le test général de signification pour un sous-ensemble


de coefficients
On peut aussi examiner la contribution à la somme des carrés due à la régression d’un sous-
ensemble de variables explicatives étant donné que les autres variables sont dans le modèle. La
procédure utilisée pour y parvenir est appelée le « test général de signification de la régression »
ou la méthode de la « somme des carrés additionnelle ». Considérons le modèle de régression à
k variables explicatives

Y =XP+E,

où Y est de dimensions n x 1; ,d
X e dimensions + 1) ; de
de dimensions n x 1. Déterminons si le sous-ensemble de variables explicatives X 2, ...
( r< k) contribue de façon significative au modèle de régression. Soit le vecteur des coefficients
de régression divisé comme suit :

où Px est de dimensions r x 1 et P2, de dimensions {k + 1 - r) x 1. On teste les hypothèses

H0:A = 0,
H, : p x0*. (13.33)

On écrit le modèle sous la forme

(13.34)

où X x représente les colonnes de X associées à Px et X2, les colonnes de X associées à p 2.


Pour le modèle complet (comprenant p x et p2), on sait que p = (X’X)~lX'Y. De plus, la
somme des carrés due à la régression de toutes les variables (ordonnée à l’origine comprise) est

SSR(p) = P'X’Y (k + 1 degrés de liberté)

r y - p 'x 'Y
n —k —1

La variable aléatoire SSR(P) est appelée «somme des carrés due à la régression associée
à p ». Pour trouver la contribution des termes de à la régression, on ajuste le modèle en sup­
posant que l’hypothèse nulle H0: Px= 0 est vraie. Selon l’équation 13.34, le modèle ré d u it est

Y = X2P2+ E. (13.35)
A

L’estimateur par la méthode des moindres carrés de P2 est p 2 = (X2X 2)~lX 2Y et

SSR(p2) = P2 % 2 Y(k+1 - r degrés de liberté). (13.36)


La régression multiple 445

La somme des carrés due à la régression associée à /?, étant donné que est déjà dans le
modèle, est

SSR ( f i \ f i ) = SSR - SSR (fi). (13.37)

Cette somme des carrés a r degrés de liberté. On l’appelle parfois la « somme des carrés
additionnelle» due (ou associée) à fi. On remarque que SSR(fi\fi) est l’augmentation de la
somme des carrés due à la régression attribuable à l’inclusion des variables X,, .., dans
le modèle. Notons que SSR(fil\fi2) est indépendante de MSE.

T e s t d e s ig n if ic a t io n p o u r un s o u s -e n s e m b le d e v a ria b le s e x p lic a tiv e s


On peut tester l’hypothèse nulle f i = 0 par la statistique
SSRifix\fiy r
(13.38)
mse

Si f 0 > Fa-.r,n-o
k-v n rejette H0 et on conclut qu’au moins un des paramètres de n’est pas nul et
donc qu’au moins une des variables X,, X2, ..., Xrde X, contribue de f
régression.

Certains auteurs qualifient le test de l’équation 13.38 de «test F partiel». Le test F partiel
est très utile. On peut l’utiliser pour mesurer la contribution de X. en la considérant comme la
dernière variable ajoutée au modèle et en calculant

Il s’agit de l’augmentation de la somme des carrés due à la régression attribuable à l’ajout de X à


un modèle qui contient déjà X,, ..., X _,, X +,, ..., Xk. On remarque que le test F partiel sur une
variable unique X équivaut au test t de l’équation 13.32. Toutefois, le test F partiel est une pro­
cédure plus générale, car il permet de mesurer l’effet d’ensembles de variables. Le test F partiel
joue un rôle majeur dans la construction du modèle, c’est-à-dire dans la recherche du meilleur
ensemble de variables explicatives à utiliser dans le modèle.

Exemple 13.8
Considérons les données sur les pêches meurtries de l’exemple 13.1 et analysons la contribution de la
variable X2 (masse volumique) au modèle. Autrement dit, testons
H0:A = 0,
H, : fi * 0.
Pour tester cette hypothèse avec le test F partiel, il nous faut la somme des carrés additionnelle qui est
attribuable à fi, soit
ss„(/î2|A, A) = ssM .fr, A) - ssR(p0, fr)
= ss,<fi,. AIA) - ssjp.\fr„).
446 CHAPITRE 13

(2 degrés de liberté)

(1 degré de liberté).

Par conséquent, on a
S S R(P 2|A), A) = 136,88-96,21
= 40,67 (1 degré de liberté).

Il s’agit de l’augmentation de la somme des carrés due à la régression attribuable à l’ajout de X2 au


modèle contenant déjà Xj. Pour tester H0: fi2= 0, on calcule la valeur de la statistique du test, soit

On remarque que MSEdu modèle complet, utilisant X, et X2, intervient au dénominateur de la statis­
tique du test. Comme F00s. , 17= 4,45, on rejette H0: = 0 et l’on conclut que la masse volumique (X2)
contribue de façon significative au modèle.
Comme ce test F partiel comprend une variable unique, il est équivalent au test t. Pour illustrer
cette équivalence, on se souvient que le test t sur H0: = 0 a do
On se souvient aussi que le carré d’une vàriable aléatoire suivant une loi t avec v degrés de liberté
est une variable aléatoire suivant une loi F avec 1 et v degrés de liberté, et l’on remarque que
t l = (4,24)2 = 17,98 « / 0.

13.6 La qualité de l'ajustement


et la validation du modèle
Bon nombre de méthodes permettent de mesurer la qualité de l’ajustement et la validité d’un
modèle de régression multiple. Nous en présentons quelques-unes dans cette section. La vali­
dation du modèle est une partie importante de la modélisation de la régression multiple. Snee
(1977) a écrit un bon article sur ce sujet (voir aussi Montgomery, Peck et Vining, 2001).

13.6.1 Deux coefficients de détermination multiple


Le R 2 de base

R2
Le coefficient de détermination multiple est

l *

(13.39)
La régression multiple 447 ]

Le R 2 représente la proportion de la variabilité de Y expliquée par les variables X v X2, ..., Xk.
Com m e dans le cas de la régression linéaire simple, on doit avoir 0 < < 1, car SSR+ SSF= SSr
Le R 2 sera égal à 1 si tous les points sont situés exactement sur l’hyperplan défini par l’équation de
régression. Cependant, une grande valeur de R2n’impliq
de régression est optimal. L’ajout d’une variable au modèle augmentera toujours R 2, que la
variable supplémentaire soit statistiquement significative ou non. Il est donc parfaitement plau­
sible que des modèles à R2 élevé produisent des prévisions moins fiables qu’un autre modèle à
R2 plus bas.

Exem ple 13.9


Le coefficient de détermination multiple du modèle de régression estimé à l’exemple 13.1 est
2 ss_ 136,88
R R
0,782.
SS T
175,09
Autrement dit, l’utilisation de deux variables explicatives, la hauteur de chute (X,) et la masse volu­
mique du fruit ( . X2), explique environ 78,2% de la variabilité de la taille des meurtrissures (y).
Le modèle liant y à la hauteur seule a aussi été ajusté aux données. Pour ce modèle, R2= 0,549. Donc,
l’ajout de la variable X2au modèle a fait augmenter R2 de 0,549 à 0,782.

R 2 a ju s té
Pour mesurer la qualité de l’ajustement d’un modèle, plusieurs praticiens préfèrent utiliser le coeffi­
cient de détermination multiple ajusté défini par
SSE/ ( n - k - 1)
(13.40)
SST/ ( n - 1)

L a grandeur SST/(n — 1) est constante quel que soit le nombre de variables du modèle.
En outre, SSE/(n — k — 1) est la moyenne des carrés due à l’erreur, qui varie avec l’ajo
suppression de termes (nouvelles variables explicatives, termes d’interaction, termes de degré
supérieur) au modèle. Donc, le R J n’augmentera que si l’ajout d’un nouveau terme diminue
de façon considérable la moyenne des carrés due à l’erreur. Autrement dit, le coefficient
défavorisera l’ajout de termes au modèle qui ne sont pas importants dans la modélisation de la
réponse.

Exemple 13.10
Calculons le R2 pour le modèle de l’exemple 13.1. Selon l’exemple 13.6, SSE= 38,21 et SST= 175,09.
Alors,
{ 38,21/(20-3) 2,247
175,09/(20-1) 9,215
0,756.
448 CHAPITRE 13

La sélection d'un modèle


Il existe plusieurs techniques pour choisir un modèle adéquat à partir des variables et des obser­
vations disponibles. L’une d’entre elles consiste à ajuster tous les modèles à une variable expli­
cative, tous les modèles à 2 variables, etc., et à calculer un critère d’ajustement pour chacun.
Si k variables sont disponibles, il faudra donc ajuster 2k - 1 modèles et choisir celui ayant la
meilleure valeur du critère. La plupart des logiciels automatisent cette procédure.
Si le critère retenu est le R2, le meilleur modèle sera automatiquement celui contenant
toutes les variables. Pour plus de parcimonie, on pourrait utiliser le qui pénalise l’ajout de
variables inutiles.

Exemple 13.11
Dans l’exemple 13.1 sur les meurtrissures de pêches, il faut ajuster 3 modèles : celui contenant X(, celui
contenant X , et celui contenant X, et X2. Les critères d’ajustement de ces modèles sont présentés dans
le tableau 13.6.
| A| fl J * v F A W • .f l \ T a * « û ♦ $ 4 T ¥ * XF'J fs- «ÿ y
Si v l JW Si b. wJ 1 t I * Pv

-
►A A

Nombre de variables A A R2
1 0,02* —
0,549 0,525
1 —
49,08 * 0,653 0,634
2 0,01* 34,89 * 0,782 0,756
* Test partiel significatif

Selon les deux critères d’ajustement calculés, le meilleur modèle est celui contenant les deux variables
(hauteur de chute et masse volumique). Le meilleur modèle à une variable serait celui où X2 sert de
variable explicative. On remarque que les estimations des coefficients sont un peu différentes lorsqu’on
ajoute une seconde variable.

L'impact de la multicolinéarité
Dans la plupart des problèmes de régression linéaire multiple, les variables explicatives X.J sont
corrélées les unes avec les autres. Si cette intercorrélation est très grande, on dit qu’il y a multi­
colinéarité. Dans une telle situation, les variances (et covariances) des coefficients de régression
deviennent très grandes, et par conséquent leur estimation est très volatile, donc peu fiable. Il faut
ainsi faire attention à l’interprétation des coefficients individuels de même qu’aux tests ou inter­
valles de confiance sur fi que l’on utilise, et se rappeler qu’il s’agit d’inférence partielle, c’est-
à-dire une analyse qui prend en compte la présence des autres variables dans le modèle. La
multicolinéarité peut aussi avoir un impact sur les méthodes de sélection de variables, d’où l’im­
portance d’avoir des critères globaux, ou même de comparer les résultats de plusieurs méthodes.

Exemple 13.12
Considérons les nuages de points à la figure 13.3, où on cherche à prédire Y à partir des variables
X| et X2 ou de seulement l’une d’entre elles. Les deux premiers graphiques nous portent à croire que
Xj et X2 ont toutes les deux une relation linéaire importante avec C’est d’ailleurs ce que les deux
modèles à une variable confirment: X, et X2 sont significatives lorsque prises séparément comme
prédicteur de Y. Devrait-on s’attendre à ce que le modèle comprenant X] et X2 soit le meilleur pour
expliquer la variabilité de L? ►
La régression multiple 449

Le tableau 13.7 présente les coefficients de détermination des trois sous-modèles pour prédire F: celui
incluant X , celui incluant X,, et celui incluant X] et Xr Le R2 favorise comme toujours le modèle ayant
toutes les variables. Par contre, le R2nous incite à n’inclure que X] dans le mo
que la variable X2, pourtant très liée à F, ne soit pas incluse dans le modèle ayant le meilleur ajustement
selon ce critère ?
Des variables explicatives très corrélées, comme c’est le cas pour X, et X2 ( la figure 13.3c),
expliquent la même portion de variabilité de F. Ainsi, X2 est moins utile individuellement lorsque X
est dans le modèle, et vice versa. On voit dans le tableau 13.7 que , et X2 perdent leur significativité
lorsqu’elles sont considérées simultanément dans le modèle linéaire. L’estimation de (32change même
de signe lorsqu’on inclut X, dans le modèle. Il ne faut pas en déduire que les deux variables sont inu­
tiles: le test F sur le modèle à deux variables peut être significatif même si les tests partiels sur les
coefficients ne le sont pas. Ces derniers mesurent l’impact d’une variable une fois que toutes les aut res
sont prises en compte.

ii
1

i
t

Les relations linéaires entre les variables X v X2 et Y, prises deux à la fois:


a) Y en fonction de X,; b) Y en fonction de X2; c) X2en fonction de X,

• J.—f .* . * ' . 1 u «T' -4* ^ .J ^ *, ' ’ . ./ >■ .. _


’ JP/ r> . ***_,*. / ’j, I* ^ rf*.. . y.' - * . *• z' S ** r m*— J* ‘«y ^ _
* ■ A l J * CK ^ CUL * ha a t a a s • \r — a i f &y « ^ • t r . y v *a T |

Nombre de variables A Â R2 R l

1 2,21* — 0,566 0,551


1 —
-0 ,6 5 * 0,517 0,500
2 3,03 0,26 0,570 0,538

* Test partiel significatif

13.6.2 L'analyse des résidus


/v

Les résidus du modèle de régression multiple estimé, définis par ei = Yi - Y i (pour i — 1, ..., n),
jouent un rôle important dans l’évaluation de la validité du modèle, comme ils le font dans
la régression linéaire simple. Les mêmes graphiques de résidus nous seront utiles en régres­
sion multiple afin de vérifier que les postulats de normalité des erreurs et d’homogénéité de la
variance sont respectés.
Il est aussi intéressant de représenter graphiquement les résidus en fonction de variables
qui sont absentes du modèle actuel, mais qu’on pourrait vouloir y inclure. L’ajout d’une variable
peut améliorer le modèle si une relation existe entre les résidus et cette variable.
450 CHAPITRE 13

Exemple 13.13
Le tableau 13.3 présente les résidus du modèle estimé de l’exemple 13.1. Ces résidus sont représentés
sur le diagramme de probabilité normal de la figure 13.4a). Les points sont assez bien alignés, donc
aucun écart sérieux par rapport à la loi normale n’est évident, même si le plus petit résidu (e3= -3,17)
n’est pas près des autres. A la figure 13.4b), les résidus sont représentés en fonction des valeurs pré­
dites ; à la figure 13.5, ils le sont en fonction de X, et de X2. À la figure 13.5a), il semble que l’hypothèse
de la constance de la variance n’est peut-être pas parfaitement satisfaite. La suppression de l’obser­
vation plus éloignée peut améliorer l’ajustement du modèle, mais rien n’indique une erreur dans la
collecte de données. Donc, le point sera conservé et l’homogénéité de la variance autour de la droite
sera considérée comme un postulat dont on ne s’éloigne pas trop.

hm

3
2 .
»

V5 1
."2
oc 0
ND 1
ûS -1
-2
-3
2 7 12
Quantiles échantillonnaux Valeurs ajustées
a) b)

a) Le diagramme de probabilité normal des résidus; b) le graphique


des résidus en fonction de Y

Le graphique des résidus en fonction : a) des valeurs de X,;


b) des valeurs de X2
La régression multiple 451
I

13.7 La régression polynomiale


Le m odèle linéaire Y = Xfi + E est un modèle général utilisable pour ajuster toute relation
linéaire par rapport aux paramètres fi inconnus, ce qui inclut la classe importante des modèles
de régression polynomiale. Par exemple, le polynôme du second degré à une variable

Y= + (3xX +p x

et le polynôm e du second degré à deux variables

y = A> + A *. + 02*2 + Ai*? + 0 T & + A 2* i*2 + E (13.42)

sont des modèles de régression linéaire.


Les modèles de régression polynomiale sont largement utilisés dans les cas de réponse
curviligne parce qu’on peut leur appliquer les principes généraux de la régression multiple.
L’exem ple 13.14 illustre un des types d’analyses possibles.

Exemple 13.14
Les panneaux des parois latérales intérieures d’un avion sont formés à l’aide d’une presse de 1500 tonnes.
Les frais de fabrication unitaires sont fonction de la taille du lot à produire. Les données ci-dessous
fournissent les frais moyens unitaires (en centaines de dollars) pour ce produit, Y, et la taille du lot
à produire, X. Selon le diagramme de dispersion représenté à la figure 13.6, un polynôme du second
degré pourrait offrir un ajustement satisfaisant.

20 30 40 50 60 70 80 90 1
Taille du lot i
r o
_ i f a
K V 7
I l I fl * i
y, (

Le diagramme de dispersion des données de l'exemple 13.14


Ü l . K l/1 : « K ►
CHAPITRE 13

Ajustons le modèle

Le vecteur Y,la matrice X et le vecteur sont respectivement

1,81 1 20 400
1,70 1 25 625
1,65 1 30 900
1,55 1 35 1225
1,48 1 40 1600
1,40 1 50 2500
, x=
1,30 1 60 3600
1,26 1 65 4225
1,24 1 70 4900
1,21 1 75 5625
1,20 1 80 6400
1,18 1 90 8100

La résolution des équations normales X'X f$= X'Y donne le modèle ajusté

y = 2,1983 - 0,0225X + 0,000 125 IX2.


Le tableau 13.8 présente le test de signification de la régression. Comme = 2171,07 est significatif
au seuil de 1%, on conclut qu’au moins un des paramètres /?, et /?,, n’est pas nul. De plus, les tests
usuels de la validité du modèle ne révèlent aucun comportement inhabituel.

f • Y 4 y • --j •< ï % \ k / y * f ' 1 < 1 E 4 F a | • t aa il J a X a k -y «a 1 ^ A a y .■ ’J a y " I r — / a ? »» J J « AA A AA / A A A D a , W a \ r Æk a J M *, K a . t m V , A a


Z ï Ir j I *.i a 01 ^ J JS 3 L J 4 «j i f / Il TJ
^ 4 1 f # ^ * ■ fl "V " » J 1 V 1 ^ # / v1
| . J ( a A XT . * ^ A (i, ^ yj J . A A, X »- »
r * —’ . j_ ■,'V^w 1' . ' y 1”, nf* a J L '/y î.' y '

Source de Somme Nombre de degrés Moyenne


variation des carrés de liberté des carrés fo
Régression 0,5254 2 0,262 7 2171,07
Erreur 0,0011 9 0,000 121 -

Total 0,5265 11

Généralement, pour ajuster des polynômes, on préfère utiliser le modèle ayant le plus petit
degré tout en étant compatible avec les données. Dans cet exemple, il semblerait logique d’ana­
lyser la pertinence du terme quadratique du modèle. Autrement dit, on devrait tester

H, : Ai * 0-
On utilise le test général de signification de la régression pour tester cette hypothèse. On
doit donc déterminer la somme des carrés additionnelle due à soit

SS*03„l/J„, A) = SS„(P., P M ) - SSM & I


La régression multiple

Selon le tableau 13.8, la somme des carrés SSK(filt P U\P0) = 0,5254. Pour trouver SSR(P\fi0), on
ajuste un modèle de régression linéaire simple sur les données originales. On obtient

y = 1,9004 - 0,0091X.

O n vérifie facilement que la somme des carrés due à la régression de ce modèle est

S S M IA) = 0,4942.

Donc, la somme des carrés additionnelle due à /?,,, étant donné que P et f30 sont dans le
m odèle, est

s s M P v A) = s s P M ) - ssM P o )
= 0,5254 - 0,4942
= 0,0312.
L e tableau 13.9 décrit l’analyse de la variance avec le test de H0: p n = 0 incorporé dans la
procédure. On remarque que le terme quadratique contribue de façon significative au modèle,
puisque la valeur f 0 qui lui correspond, 257,85, est bien au-delà de la valeur critique au seuil
de 1% .

• ^ j v m Sl w J ■ ' -
w H ■ y 1 % ■# • . C . ■ 1 ► J. é Y æ 0 .j w* 0 ■ . Y 0 M A dk Y .
fjr# y, £ ÿ < i v h e &S i- .y A 'f +

Source de
w » * • «
Somme Nombre de Moyenne
variation des carrés degrés de liberté des carrés /.
Régression SS, (fi, A IA) = 0,5254 , 2 , 0,262 7 2171,07
linéaire SS, (Al A) = 0.4942 1 0,494 2 4084.30 |
quadratique (A J A. A) = 0,0312 1 0,031 2 ; 257,85
. 1
Erreur 0,0011 9 0,000 121
Total 0,5265 II

13.S Les variables indicatrices


Les modèles de régression présentés dans les sections précédentes sont élaborés pour des
variables quantitatives, c’est-à-dire des variables mesurées sur une échelle numérique. Par
exemple, les variables telles que la température, la pression, la distance et l’âge sont des variables
quantitatives. Cependant, on doit parfois incorporer des variables qualitatives dans un modèle
de régression. Supposons qu’une des variables d’un modèle de régression est l’opérateur asso­
cié avec chaque observation Yit et qu’il n’y a que deux opérateurs. On peut attribuer différents
niveaux aux deux opérateurs pour tenir compte de la possibilité que chaque opérateur influe
différem m ent sur la réponse.
On tient habituellement compte des différents niveaux d’une variable qualitative à l’aide de
variables indicatrices. Par exemple, pour inclure l’influence de deux opérateurs différents dans
un modèle de régression, on peut définir une variable indicatrice comme suit :

X = 0 si l’observation provient de l’opérateur 1;


X = 1 si l’observation provient de l’opérateur 2.
454 CHAPITRE 13

En règle générale, une variable qualitative à t niveaux est représentée par t - 1 variables
indicatrices, lesquelles prennent les valeurs 0 ou 1. Donc, s’il y avait trois opérateurs, on tien­
drait compte des différents niveaux à l’aide de deux variables indicatrices définies comme suit :

si l’observation provient de l’opérateur 1 ;


si l’observation provient de l’opérateur 2 ;
si l’observation provient de l’opérateur 3.

Les variables indicatrices sont aussi appelées «variables nominales». L’exemple 13.15 pré­
sente quelques-unes des utilisations des variables indicatrices. Pour d’autres applications, voir
Montgomery, Peck et Vining (2001).

Exemple 13.15
Cet exemple est adapté de l’ouvrage de Montgomery, Peck et Vining (2001). Un ingénieur méca­
nicien analyse le fini de surface des pièces métalliques usinées sur un tour et la relation de
celui-ci avec la vitesse de rotation (en tours par minute - tr/min). Les données sont présentées au
tableau 13.10. On remarque que les données ont été obtenues avec deux types différents d’outils à
couper. Comme il est probable que le type d’outil à couper influe sur le fini de surface, on ajuste
le modèle
Y=P0+ {3lXi + p2X2+ E,
où Y est le fini de surface, Xxest la vitesse de rotation du tour et X2, une variable indicatrice dénotant
le type d’outil à couper utilisé, soit

0 pour le type d’outil 302,


1 pour le type d’outil 416.

L’interprétation des paramètres de ce modèle se fait comme suit. Si X2= 0, le modèle devient

Y=/30+PlXl + E,

un modèle linéaire de pente /?, et d’ordonnée à l’origine {30. Mais si X2= 1, alors le modèle devient

un modèle linéaire de pente /?, et d’ordonnée à l’origine fi0+ ft2.


Donc, le modèle Y = /?0+ fîlXl + f$2X2+ E implique que le fini de surface est lié linéairement à la vitesse
de rotation du tour et que la pente /?, ne dépend pas du type d’outil à couper utilisé. Toutefois, le type
d’outil à couper influe sur l’ordonnée à l’origine, et /?2 indique la variation de l’ordonnée à l’origine
associée à une variation du type d’outil de 302 à 416.
La régression multiple

^ ^V ■
-'*f^*~,y**■w
yr»5.'I-T
#'
.
J
ÉP

. f
V *
'
7 *<,y'jr tb.^ X.jHr,j K.Va\T,ib*RLyf ç• SC T a • L
._i« .•« ^j . f. . V
■rn
.S
s*r*'— k yJR êâJ»f»gH
Av'*R■ [^yrr’?* ^Vtt•.>/t 's.-'j
Numéro Fini de Vitesse de rotation TVpe d’outil Variable indicatrice
de l’observation, surface, (tr/min), X U a couper de l’outil, A’,,
1 45,44 1 225 1 302
1 0
42,03 200 302 0
2
50,10 250 302 0
3
4 48,75 245 302 0
5 47,92 235 302 0
6 47,79 237 302 0 i

7 52,26 265 302 0


50,52 259 302 0
8
45,58 302 0
9 221
44,78 302 0
10 218
11 33,50 224 416 1
12 31,23 212 416 1
13 37,52 248 416 1
14 37,13 260 416 1
15 34,70 416 1
243
16 33,92 238 416 1
17 32,13 224 416 1
18 35,47 416 1
251
19 33,49 232 416 1
20 | 32,29 1 216 1 416 1 1

Le modèle ajusté est


y = 14,2762 + 0,141 IX, - 13,2802X
Le tableau 13.11 présente l’analyse de la variance de ce modèle.

'►
•»V
■ '■s»..»*• “/fÆ js^*kav..y».•^yr..-■■/*-./V’V f(,y^•V
,jg./»«?#»yg»—
< .vgj,fy‘Vi»8^£■
ia
B ./.IV
B ■
'•rW
B *^■
-j1.ja^ !
5 ^ ).‘T
-L44'* j
SR8i
vkAj ij
C% —: «
**-^'
• ^ .
C
fN * j f *
•'1a"*>«1/l.*,‘vjT*■ ».w 9
i f
H
y.v.|.*% r* < B '
♦•*
y
Il
**«• %|V4F|
f
l
CyA l
Hf f
, J^r'V-
s
jX
V-J
v
^O*V
-
*
T*%î
»
4\
^J
^*
y
• »^W^
n
i
oîR
v-
*
F Y|
r
Æ
**b
41
BAV

4b6
!
)Y
•L
-7
*.
_
/W
,
ry^ v=.,-■»~ \1 -~=.
»*A
^F
-
,»^^'
S
rm
■%
4f
,
»l Æ
y
,4*f
lJ
KJ
Bf
l Mf
l%v
p
™ î!■'
flt
V
^B^
| S
t.
*
^'
\iy
.
-' -. a' . »w
y.ar.~_y'-»*
’.#y.s*v.*». / /X w v•svV
Source de Somme Nombre de Moyen ne
variation des carrés *s degrés de liberté des carrés /»
| Régression | 1012,0595 2 506,0297 1103,69*
SS„ ( A IA,) l 130,6091 1 130.6091 284,87 *
ss„(A lft, /?,) 881,4504 1 881,4504
-wi,* 1922,52*

Erreur 1 7,7943 17 0,4508
j Total 1 1019,8538 19
* Significatif au seuil de 1% ►
îs r’

CHAPITRE 13

On remarque que l’hypothèse H0: /?, 0 (signification de la régression) est rejetée. Le tableau 13.11
contient aussi la somme des carrés
SS,= SSM , Al ) 0)

= ssM P o) A. A).
ce qui permet de tester l’hypothèse H0: p2= 0. Comme cette hypothèse est aussi rejetée, on conclut que
le type d’outil influe sur le fini de surface.
On pourrait aussi utiliser des variables indicatrices pour déterminer si le type d’outil influe à la fois sur
la pente et l’ordonnée à l’origine.
Une autre façon d’analyser cet ensemble de données consiste à ajuster des modèles de régression dis­
tincts sur les données de chaque type d’outil. Cependant, la méthode utilisant les variables indicatrices
présente plusieurs avantages : 1) on ne doit estimer qu’un seul modèle de régression ; 2) la combinaison
des données des deux types d’outils donne un plus grand nombre de degrés de liberté pour l’erreur;
3) les tests des deux hypothèses sur les paramètres supplémentaires sont simplement des cas particu­
liers du test général de signification de la régression.

Modèle
K 0 + 13, Xn + /32X(2+ •••+ PkXik + £, (/ = 1, ...,
où les E sont indépendantes et suivent une loi /V(0, g2).

Forme matricielle
Y X(3 + E

Variance a 2 â 2 = MSe •

Vecteur P p = { x fx y xx ' y
/s

Coefficient p. pj - 1P s e ■c »
Moyenne £ (F |x 0) Y0 =x'0p Y0 ± . - *-1-Jm s c )

Observation future Y0 f 0= x 'J 1 I f i 2;„- *-, + X'0(X'X)-' x 0)


Test de signification de la régression


H,, : P 1 « «

k 0
H|: ^ 0 pour au moins un

1
La régression multiple

C jj = élém en t ( j , j ) de ( X ' X ) ~ ]

\2
S S H/ ( n - k - l ) = SS r +SSI: = Y ' Y -
S S T/ ( n - 1) J

e) Si les observations sont indépendantes,


L a plupart de ces exercices sont conçus pour
alors les coefficients /?,,..., fik sont indé
être résolus à l’aide d’un logiciel de statistique
pendants entre eux.
de votre choix.
f ) Les estimations de /?0et de /?, seront
Les données des exercices avec le symbole i* les mêmes avec le modèle Y= {30+
sont aussi disponibles en format électronique. qu’avec le modèle Y - fî0+/?,X,+ P2Xr
13.2 Considérez les données sur les pêches
13.1 Déterminez si les énoncés suivants sont ©T meurtries du tableau 13.12 (voir à la page
vrais ou faux. suivante).
a ) Le modèle comprenant toutes les a) Ajustez un modèle de régression à
variables explicatives disponibles a ces données en utilisant toutes les
toujours un R2 supérieur à celui des variables explicatives. Donnez l’équa­
modèles incluant moins de variables tion du plan obtenu.
* . y

explicatives. b) Testez la signification de la régression


b) Le modèle comprenant toutes les pour ce modèle au seuil de 1 .
variables explicatives disponibles a c) Calculez les résidus de ce modèle. À
toujours un MSEsupérieur à celui des l’aide de méthodes graphiques appro­
modèles incluant moins de variables priées, déterminez si les conditions
explicatives. /\ /V A
sur la normalité et l’homogénéité de
c) Les estimations /3,, /32, ..., /3* ont toutes la variance sont respectées.
la même erreur-type. d) Comparez ce modèle au modèle à deux
d) Si certaines variables explicatives sont variables X, et X2de l’exemple 13.1.
très corrélées entre elles, les estimations e) Trouvez un intervalle de confiance
des coefficients ..., J3kpeuvent chan­ à 95 % pour avec chacun des deux
ger beaucoup selon les variables incluses modèles. Comment interprétez-vous
dans le modèle. les deux estimations?
CHAPITRE 13

Taille des Hauteur Masse Position de Epaisseur Énergie poten­


meurtrissures de chute volumique la marque de la pulpe tielle du fruit
Observation
(mm), (mm), (g/cm3), (mm), (mm), (10“3 calories),
à
• .i*, . • ■
. / Y\" M x2 *3 *4 *5
1 3,62 303,7 0,90 26,1 22,3 184,5
2 7,27 366,7 1,04 18,0 21,5 185,2
3 2,66 336,8 1,01 39,0 22,9 128,4
4 1,53 304,5 0,95 48,5 20,4 173,0
5 4,91 346,8 0,98 43,1 18,7 139,6
6 10,36 600,0 1,04 21,0 146,5

Of\
5,26 369,0 0,96 12,7 20,4 155,5
1 7
1 8 6,09 418,0 1,00 46,0 18,1 129,2
6,57 269,0 1,01 2,6 21,5 154,6
1 9
4,24 323,0 0,94 6,9 1 24,4 152,8
1 10
11 8,04 562,2 1,01 27,3 19,5 199,6
12 3,46 284,2 0,97 30,6 20,2 177,5
13 8,50 558,6 1,03 37,7 22,6 210,0
14 9,34 415,0 1,01 26,1 17,1 1 165,1
15 5,55 349,5 1,04 48,0 21,5 195,3
16 8,11 462,8 1,02 32,8 23,7 171,0
17 7,32 333,1 1,05 29,2 21,9 1 163,9
18 12,58 502,1 1,10 4,0 16,9 1 140,8
19 0,15 311,4 0,91 39,2 26,0 154,1
20 5,23 351,4 0,96 36,3 1 23,5 1 194,6

f) Établissez, à partir du modèle complet, complet ? Les coefficients /?,, ..., /?9
un intervalle de confiance à 95 % pour sont-ils tous significatifs ?
la taille moyenne des meurtrissures c) Ajustez un modèle de régression mul­
d’une pêche tombée de 325 mm, de tiple établissant un lien entre le nombre
masse volumique = 0,98 g/cm3, ayant de matchs gagnés et les passes (en
une marque à 30 mm, une pulpe de verges) des équipes (X2), le pourcentage
21 mm et une énergie potentielle de jeux d’attaque ( X7
) et l’attaque
de 190 x 10~3 calories. Comparez votre verges) des adversaires (Xg). Donnez
réponse aux valeurs de l’exemple 13.4. l’équation du modèle estimé.
13.3 Le tableau 13.13 présente les statistiques d) En vous basant sur le modèle en c), calcu­
(B des performances des équipes de la lez un intervalle de confiance à 95 % pour
National Football League en 1976. Ces la hausse moyenne du nombre de victoires
données sont tirées du magazine The lorsque les attaques augmentent de 1% et
Sporting News. que les passes de l’équipe et les attaques
a) Ajustez un modèle de régression mul­ des adversaires restent inchangées.
tiple incluant les neuf variables explica­ e) Retirez la variable Xgdu modèle en c).
tives pour prédire le nombre de matchs Interprétez l’estimation du coefficient
gagnés. associé au pourcentage d’attaque (X7).
b) Y a-t-il au moins une variable signifi­ Comparez avec votre réponse en d).
cative au seuil de 5 % dans le modèle Comment expliquez-vous cette variation ?
La régression multiple 459

MFlîl m KMi
»-J*w m
~LO V
"m
t"
;-
M •{
•' •-VV': : ' r
tA'
V f
■4-
.
Av ' -
,
6\2ci m
a• •\Jjjf
.
Equipe F 1 *3 X X 1 X 1 X^8 , I
Washington 10 1 2113 1985 38,9 64,7 +4 868 1 59,7 1 2205 ! 1917
Minnesota 11 2003 2855 38,8 61,3 +3 615 55,0 2096 1575 |
New England 11 2957 1737 40,1 60,0 +14 914 65,6 1847 2175 j
Oakland 13 2285 2905 41,6 45,3 -4 957 61,4 1903 2476 j
Pittsburgh 1° 2971 1666 39,2 53,8 +15 836 66,1 1457 - Î8n6
Baltimore 11 2309 2927 39,7 74,1 +8 786 61,0 1848 | v'mo
K -Jv«*
.

Los Angeles 10 2528 2341 38,1 65,4 +12 754 66,1 1564 >t / fei>
Dallas 11 2147 2737 37,0 78,3 -1 761 58,0 1821 i909
Atlanta 4 1689 1414 42,1 47,6 -3 714 57,0 2577 2001
Buffalo 2 2566 1838 42,3 54,2 -1 797 58,9 2476 2254
Chicago 7 2363 1480 37,3 48,0 +19 984 67,5 1984 2217
Cincinnati 10 2109 2191 39,5 51,9 +6 700 57,2 1917 1758 I
Cleveland 9 2295 2229 37,4 53,6 -5 1037 ! 58,8 ! 1761 2032 1
Denver 9 1932 2204 35,1 71,4 +3 986 58,6 1709 2025 1
Detroit 6 2213 2140 38,8 58,3 +6 819 59,2 1901 1686 1
| Green Bay 5 1722 1730 36,6 52,6 -19 791 54,4 2288 1835 1
Houston 5 | 1498 2072 35,3 59,3 -5 776 49,6 2072 1914 |
Kansas City 5 1873 2929 41,1 55,3 +10 789 54,3 2861 2496 1
Miami 6 2118 2268 38,2 69,6 +6 582 58,7 2411 2670 1
New Orléans 4 1775 1983 39,3 78,3 +7 901 51,7 2289 2202 1
New York Giants 3 1904 1792 39,7 38,1 -9 734 61,9 2203 1988 1
New York Jets 3 1929 1606 39,7 68,8 -21 627 52,7 2592 2324 1
Philadelphia 4 2080 1492 35,5 68,8 -8 722 57,8 2053 2550 1
St. Louis 10 2301 2835 35,3 74,1 +2 683 ' 59,7 1979 | 2110 1
San Diego 6 2040 2416 38,7 50,0 0 576 54,9 2048 t 2628 1
San Francisco 8 2447 1638 39,9 57,1 -8 848 65,3 1786 1776
Seattle 2 1416 2649 37,4 56,3 -22 684 43,8 2876 2524
1TampaBay 0 1503 1503 39,3 47,0 -9 875 1 53,5 1 2560 1 2241 j

Y : matchs gagnés pour la saison de 14 matchs ;


X, : attaques (en verges) pour la saison ;
X2: passes (en verges) pour la saison ; *

X3: moyenne des volées (en verges par volée) ;


X4: pourcentage des placements (placements effectués/placements essayés) ;
X5: rapport de retournements (retournements acquis/retoumements perdus) ;
X6: pénalités (en verges) pour la saison ;
X7: attaques (en pourcentage : jeux d’attaques/jeux totaux) ;
Xg: attaques (en verges) des adversaires, pour la saison ;
X9: passes (en verges) des adversaires, pour la saison.
13.4 Le tableau 13.14 (voir à la page suivante) a) Quelle est la meilleure variable pour
(7+f donne la consommation d’essence (en prédire la consommation d’essence ?
milles par gallon d’essence) de 25 voitures. Quelle est l’estimation de cr2 obtenue
Ces données sont tirées d’un magazine en ajustant le modèle ne contenant que
M o to r Trend de 1975. cette variable ?
460 CHAPITRE 13

JR
ÎÎJV A - •C'
.JJ*» '
'£ Sv- t *> «■><

•r-* 0 lit i][Will iy<

■■■ . ■ ? ? & 'r l l i S S â r ^ , /’>'>Vv


r* , <r V \ V. - . ' ' v l

__
■ « 'i i i / .

Voiture Y 1 x2 . *3
Apollo 18,90 350 165 260 200,3 69,9 3910
1Nova 20,00 250 105 185 196,7 72,2 3510
Monarch j 18,25 351 !j 143 ! 255 199,9 74,0 3890
Duster 20,07 p 225 95 170 194,1 71,8 3365
Jenson Conv. 11,20 440 215 F 330 184,5 69,0 4215
|Skyhawk | 22,12 1 231 110 | 175 179,3 65,4 3020
Scirocco 34,70 89,7 70 81 8,2 155,7 64.0 1905
Corolla SR-5 30,40 96,9 75 83 9,0 165,2 65.0 2320
Camaro 16,50 350 155 250 8,5 195,4 74,4 3885
Datsun B210 36,50 85,3 80 83 8,5 160,6 62,2 2009
Capri II | 21,50 171 109 1 146 8,2 170.4 66,9 2655
Pacer 19,70 258 110 1 195 8,0 171.5 77.0 3375
Granada 17,80 302 129 220 8,0 3,00 199,9 74.0 3890
Eldorado 14,39 500 190 360 8,5 224,1 79,8 5290
Impérial 14,89 440 215 330 8,2 231,0 79,7 5185
Nova LN 17,80 350 155 250 8,5 196,7 72,2 3910
1Starfire 23,54 231 110 175 8,0 2,56 179,3 65,4 3050
Cordoba 21,47 360 180 290 8,4 214,2 76,3 4250
Trans Am 16,59 400 NA 196,0 73,0 3850
Corolla E-5 31,90 96,9 4,30 165,2 2275
Mark IV 13,27 460 223 366 3,00 228,0 79,8 5430
Celica GT 23.90 1133,6 171.5 63.4
Charger SE 19,73 215,3 76,3 4370
Cougar 13.90 215.5 78.5 4540
Corvette 16,50 185,2 69,0 3660

Y : consommation (en milles par gallon) ; X6: nombre de corps de carburateur ;


X, : cylindrée (en pouces cubes) ; X7: nombre de rapports de transmission ;
X2: puissance (en livres par pied) ; X8: longueur (en pouces) ;
X3: couple (en livres par pied) ; X9: largeur (en pouces) ;
X4: rapport de compression ; X10: poids (en livres) ;
X5: rapport de pont arrière ; X„ : type de transmission
(A - automatique, M - manuelle).

b) On peut vérifier que la corrélation échan- son poids (X10), c’est-à-dire le meilleur
tillonnale entre la cylindrée (X,) et le modèle à 3 variables selon le Rf. Quelle
couple (X3) est de 0,992, la plus élevée de est l’estimation de <72 obtenue ?
toutes les paires de variables. Peut-on pen­ d) À partir du modèle en c), établissez un
ser que le meilleur modèle à deux variables intervalle de prédiction à 95 % pour la
explicatives serait celui incluant Xt et X3? consommation d’une voiture de cette
c) Ajustez un modèle de régression mul­ époque qui aurait un rapport de pont
tiple incluant le rapport de pont arrière de 3,1, une longueur de 192 pouces,
(X5), la longueur du véhicule (Xg) et et qui pèserait 3600 livres.
I

La régression multiple

e) Q uel test statistique pourrait-on b) Peut-on déduire de la matrice des


u tilise r pour comparer la consom­ corrélations le meilleur modèle à deux
m ation m oyenne des deux types de variables ?
tran sm issio n ? c) Testez la signification du modèle de
régression linéaire comprenant toutes
13.5 H ald (1952) rapporte les données sur la
ces variables au seuil de 5 %.
(Ï+T ch ale u r produite (en calories par gramme
d) Vérifiez la signification de chaque
de cim ent) Y pour diverses quantités de
variable indépendante au seuil de 5 %.
q u atre com posants : X v X 2, X4.
Quelles conclusions pouvez-vous tirer
N um éro de lorsque vous comparez votre réponse
observation Y *2 *3 *4 à celle que vous avez obtenue en c) ?
1 78,5 7 26 6 60 e) Testez l’hypothèse /?, = /?, = /?. = 0
2 74,3 1 29 15 52 en utilisant un test F partiel.
3 104,3 11 56 8 20 13.6 On pense que la consommation mensuelle
4 87,6 11 31 8 47 (l+f d’énergie électrique par une usine de pro­
5 95,9 7 52 6 33 duits chimiques (Y) est liée à la température
6 109,2 11 55 9 22
ambiante moyenne (X,), au nombre de jours
7 102,7 3 71 17 6 de travail durant le mois (X2), à la pureté
8 72,5 1 31 22 44
moyenne du produit (X3) et à la quantité
9 93,1 2 54 18 22
(en tonnes) du produit fabriqué (X4). Le
10 115,9 21 47 4 26
tableau 13.15 présente les données pour une
11 83,8 1 40 23 34
année particulière.
12 113,3 11 66 9 12
13 109,4 10 68 8 12 a) Quel est le meilleur modèle pour prédire
la consommation d’énergie, selon le
Voici la m atrice de corrélations de toutes critère du aJ R?2
les paires de variables. b) Quel pourcentage de la variabilité de
la consommation est expliqué par les
Y *2 *3 *4 variables explicatives choisies en a) ?
Y 1 0,731 0,816 -0,535 -0,821 c) Analysez les résidus de ce modèle
et vérifiez le respect des postulats
0,731 1 0,229 -0,824 -0,245 de normalité et d’homogénéité de
*2 10,816 0,229 1 -0,139 -0,973 la variance.
*3 -0,535 -0,824 -0,139 1 0,030 13.7 Un article intitulé « A method for impro-
*4 -0,821 -0,245 -0,973 0,030 1
© ving the accutacy of polynomial regres-
a) Quel serait le meilleur modèle à une sion analysis » publié dans le Journal
variable pour prédire la chaleur produite ? o f Quality Technology (vol. 3, n° 4,
1971, p. 149-155) rapporte les données
CHAPITRE 13

suivantes, où Y représente la résistance régression multiple et obtient les résultats


limite au cisaillement (en livres par pouce suivants.
carré) d’un composé de caoutchouc, et
X est la température de durcissement Estimation des coefficients
(en degrés Fahrenheit - °F). Estimation Erreur-type *0
Y 770 800 840 810 735 640 590 560 A 3,560 6,811 0,52
A 0,436 0,095 4,62
X 280 284 292 295 298 305 308 315
A 0,385 0,116 3,33
a) Tracez le diagramme de dispersion
de la résistance en fonction de la Matrice de corrélation
température. *2 *3
b) Ajustez un polynôme de second degré 1 0,67 0,59
à ces données.
i) Donnez l’équation de régression *2 0,67 1 0,55
obtenue. *3 0,59 0,55 1
ii) Testez la signification du modèle
au seuil de 5 %. Table d’analyse de la variance
iü) Testez l’hypothèse que = 0, au Source de Degrés Somme Moyenne
seuil de 5 %. variation de liberté des carrés des carrés fo
c) Ajustez un polynôme de degré 3 à ces Régression 2 17 574 8787 47,46
données. Erreur 149 27 585 185,1
i) L’ajustement est-il meilleur qu’avec
le polynôme de degré 2 selon le Total 151 45 159
critère du R2
aj?
a) Combien d’étudiants y avait-il dans
H) Le test partiel sur le coefficient son groupe l’année dernière ?
associé à X3 est-il significatif au
seuil de 5 % ? b) Peut-on affirmer qu’au moins un des
deux examens aide à prédire la note
13.8 Considérez les données suivantes pro- du troisième de façon significative
(B venant d’une expérience effectuée pour (au seuil de 5 % ) ?
déterminer l’effet de X, qui représente le c) Lequel des deux premiers examens
temps d’essai (en heures) à une tempéra­ prédit le mieux la note du troisième
ture particulière, sur Y, la variation de la examen ? Quelle proportion de la
viscosité d’une huile. variabilité du troisième examen est
Y -4,42 -1,39 -1,55 -1,89 -2,43 -3,15 -4,05 -5,15 -6,43 -7,89 expliquée par cette évaluation ?
~X 025 0,50 0,75 1,00 1,25 1,50 1,75 2,00 2,25 2,50 d) Lorsqu’on connaît la note d’un des
premiers examens, l’autre évaluation est-
a) Ajustez un polynôme du second degré
elle vraiment utile pour prédire la note
à ces données. Donnez l’équation de
au troisième examen (au seuil de 5 ?
régression obtenue.
e) Samuel, inscrit dans le cours cette
b) Testez la signification du modèle au
année, a obtenu une note de 70 points
seuil de 5 %.
au premier examen, et de 80 points
c) Testez l’hypothèse que /?„ = 0, au seuil au deuxième. Donnez une prédiction
de 5%. pour sa note au troisième examen en
13.9 Un enseignant essaie de prédire la note de vous basant sur ce modèle (sans marge
ses étudiants au troisième examen à partir d’erreur).
des notes obtenues aux deux premiers. Il f ) Léa et Stéphanie ont eu la même
se base sur les résultats de l’année der­ note à l’examen 1, mais Léa a obtenu
nière, auxquels il ajuste un modèle de 10 points de plus que Stéphanie à
La régression multiple 463

l’examen 2. Donnez une prévision sachant que la taille de l’autre parent


de la différence entre leurs notes au est déjà prise en compte ?
troisième examen, selon ce modèle. e) Quelle est la taille prédite d’une fille
13.10 On tente de prédire la taille des filles adulte dont la mère mesure 64 pouces
et le père, 70 pouces ?
adultes à partir de la taille de leur mère
et de celle de leur père (en pouces). On f) Considérons deux filles ayant un père
ajuste un modèle de régression multiple de la même grandeur, mais dont la taille
à un échantillon de 33 familles indépen­ des mères diffère de 5 pouces Quelle
dantes et on obtient les résultats suivants différence de taille ce modèle prévoit-il
(une fille par famille). pour deux filles dans cette situation, en
moyenne? Peut-on associer une marge
Table d’analyse de la variance d’erreur à cette estimation ?
Source de Degrés Somme Moyenne 13.11 Voici la matrice (X'X)~l associée à un
variation de liberté des carrés des carrés fo modèle de régression multiple ajusté à des
Régression ?•
9 • 19,46 9 ♦
données.
Erreur ?• 147,07 9 • 56,784 -0,294 -0,548
Total 9

9

-0,294 0,006 -0,001
Estimation des coefficients -0,548 -0,001 0,009
Coefficient Estimation Erreur-type a) Combien y a-t-il de variables explica­
33,238 16,835 tives dans ce modèle ?
A
b) Sachant que la somme des carrés des
fix(mère) 0,470 0,171 erreurs vaut 35,886 et qu’il y a 20 obser­
P 2 (père) 0,024 0,145 vations dans le jeu de données, donnez
une estimation de la variance autour du
a) La taille des parents permet-elle de plan.
prédire de façon significative la taille c) Sachant que le coefficient associé à
des filles, au seuil de 5 % ? la première variable, /?,, est estimé
b) Quelle proportion de la variabilité à 0,182, établissez un intervalle de
de la taille des filles est expliquée par confiance à 95 % pour ce coefficient,
celle de leurs parents ? en tenant compte de la présence des
c) Que vaut le coefficient de détermina­ autres variables dans le modèle.
tion ajusté ? d) La variable X, est-elle significative au
d) L’apport individuel de la taille de seuil de 5 %, sachant que X2est dans
la mère et du père est-il significatif, le modèle ?
• R -if
j
msgSi
f S B S S r

/ V . r . «•-> V*
^ -

« * •/ *£>52
W fîÇ h K

;V I A V.
■ fS é S c a S Æ jf ‘'K V i T v ^ .-. • ; -■.. ♦. ' ^ î - - * » . r r « ?
> ,• J ? ; , r - ^ j v y** .4 u V
4L

■ v î 2i-r5 T 'i^ > ’ s a *" \ - « > .5 w ’7 ’■


.v S c jf iS f f lE i- '■ i'/<. î 1 *
*sl|' >r ' - . '- -■'• .'0

.•V- 4ji>
'"«^ . j * k >
rV « • ,î t w * ,' l C I • ' '» - tiw * - ■'•T -
. « P ^ - 4fc & S .* > & S . f c * - • f K f c •: '
' /

* €> 9<# 6 I K Eâi»*$2^51


C *2^ ; * 4 *
-

«•*

■a 3 •-
£5;
km< ®.%î. . .vv -,v -R .
;^ 5 r . S v 'rflSfcYî:- '<>R
«£ÿcv:•'";'& .<— >- *■*’•. • ’, >»• • \ » z . » /*■•v' w % » . 'K *j , y '< •» l

a & & 9 S- c .9 5 9
I . „ ./■ r
■ ;. .• ,- V , •
S S r v A .. l l ^ S - r f R î A . ÇC 1» % ■ ,

v -, . - À UKifc/V. ’/ ►- : *, f • V * r --- ' - • - * i_rJ - ~ , X'


^ t
.•: B < & j"l* - fc;
’y r f .v » * ■* ■ • *---- -
i i z m
_ 'M i* .

C h a p itre 1
b) P
(Iu 5 u M) = 1- P
(Iu S u Af) = 0,75
c) P(/ u S)=0,18

AnP

A < jD = A n D (A nB)u(CoD )

A nB =AuB (A uB)n(CuD ) = (A u B )n C
i) AnB={5)
ii) ÂuB={l,3,4,5,6, 7, 8,9,10}
iii)Ânfl=Aufi={2, 3,4,5}
IV) Xn(finC) = {1’ 2’ 3’4’ 6’7>8,9, 10}
v) An (fi u C) = {1, 2, 5, 6,7, 8,9, 10}

0,16 iv) 0,96 v) 0,92


RÉPONSES AUX EXERCICES

1.4 a) A s* " b) P ( A l> B l > 0= 0,032


c) P (A n fln C ) = 0,011

96,8 %
C

1.5 SP= {(r,,f2) : r , > 0 , r 2> 0 }

a) b) c) d)
t\ 4- 0,06 t?
t2< 0,3

t2=t\- 0,06
t t ti ti

A ,i ) s y :h ± h 0,15
2 2
£ = {(f„ r2)€Sf:max(f1,f2)<0,15} = {(f,,r2)eS3:0</, <15 et 0 </2<15}
C = {(?„ t2) e SP: | f, —r2 1< 0,06} = {(tl, t 2) e i f : -0,06 < / , - / , < 0,06}
D = {(?,, t2) e ^ : f 2 > tx)

1.6 a) i f = {(x, )y:0 < b) i) 0 <<24} y- * < i5donc x <y < x + 1. ii) Exemple où t 5 et t2 = 8
V
y y

0 5 10 15 20 24
ri

1.7 if [200, 600]


C [350, 550]
B [400, 600]
A [200, 500[
4- mmde
0 100 200 300 400 500 600 700 pluie

a) Â = [500,600] d) A n B n C = [400,500[
b) A n C = [350,500[ e) (A u C) n B =[400,550]
c) Â o C =]550,600] f) (A u B) lj C =[350,550]
1.8 II existe 23 sous-ensembles de if: 0 , {a}, {c}, b), [a, c}, {b, c], [a, b, c}
1.9 a) i f = {DDD, DDN, DND, NDD, DNN, NDN, NND, N N N }
b) i f = [NNNN, D N N N , NDNN, N N D N , N NND}
466 RÉPONSES AUX EXERCICES

c) S5= {DD,NDD,DND, NNDD, NDND, DNND, DNNN, NDNN, NNDN, NNND,


/ 50/7 f \ 50/7 \ r \
50(1-p) 50(1 - p)
+
v°y vio. V
0 V
10 V 1 \ 9 J
1.10 a) l 0,689 b)
' 50' ^50^
v10y v10,
1.11 6 x 5 = 30 itinéraires
1.12 a) 263x 103=17 576 000 plaques possibles. Le projet est réalisable
26-25*24*10*9*8
b) Z0 - - - - - - = 0,639
17 576 000
. 26 x 103+ 263x 10- 26 x 10
c) --------------------------------------- = 0,011
17 576 000
^15N 8
1.13 560 560 équipes différentes
6w )\ 1J
1.14 a) D
(P 2)
< = 0,976 b) P(D, = 0 n D2 = 0) = 0,1627
40
piger les 2 cartes dans l’ensemble desA v 2 ,
1.15 a) i - p 1 0,412
40 cartes qui ne sont pas des figures , 52^1
V2 y
f48Y4
b) v 0 ; 2
0,00452
52
2
/ 13NV
c) J \2J
1

0,0588

2 J

r43^
0 1
1.16 a)
49 \ 13 983 816
6J
6^ 43 \
2J 13 545
b)
49\ 13 983 816
6J
1
c)
13 983 816J
49"ï
d) Paul a raison. Ce tirage comporte n combinaisons. Deux billets du même tirage lui donnent une
6J
1
probabilité de - de gagner alors que deux tirages lui donnent une probabilité -n n de gagner au moins
n
une fois.
RÉPONSES AUX EXERCICES 467

1/,7 a) 1- [P(D = 0) + P(D = 1)] =

P(D = 0) + P(D = 1) =

= 28 comparaisons

f 40>l = 780 mélanges possibles (donc un maximum de 779 tests !)


2J
b) 40
1560 mélanges ordonnés possibles (donc un maximum de 1559 tests !)
"*•21 a) Faux d) Vrai g) Vrai j) Faux
b) Faux e) Faux h) Faux k) Faux
c) Faux f) Faux i) Vrai
"*•22 a) et k)
O0x (AV6)
1 23 a) 252 choix b) 120 choix
V5y 2
5'
T *24 a)(5)(5) 25 combinaisons b) = 100 combinaisons
11] v2y
19|: > 18 12
^-25 a) 12 —t
0,540 b) 0,282
20 2012
c) J : Jacques est testé au moins une fois, A: Alain est testé au moins une
(J n
P A)= 1- (îuÂ) = 1- [P(7) + P(A) - PÜ n = 1- [0,540 + 0,540 - 0,282] = 0,202
P
r 26 P(I)P(n)P(m) = [1- (0,2)(0,1)(0,1)][1 - (0,2X0,1)1(0,99) = 0,968
1-27 a) P(M) = 10/50 c) P(M|£) = 5/15
b) P(M n £) = 30/50 d) [P(M u £ )]3= 8/125

1.28 P, [ l- ( l- P 3)(l-P 5[l-(l-/î2Xl- P4)))] = 0,9[1 -(1 - 0,9)(1 -0,9 [1-(1 -0,9)1 -0,9)])] = 0,890

P(P|V)P(V) 0,98 x 0,0005


1.29 P(V|P) 0,0467
P(P) 0,98 x 0,0005 + 0,01 x 0,9995
468 RÉPONSES AUX EXERCICES

1.30 P(A|X) = - ^ - = 0,370 P{B\X) = = 0,593 P(C|X) = ^ ^ = 0,037


0,135 0,135 0,135
Le mécanicien devrait d’abord se pencher sur la batterie
x
A
(démarreur)
X

1.31 0,995(0,993X0,994) = 0,982


1 1 m -1 1 m2- m + l
1.32 —------- 1------- ———--------
m m - 1 m m m~(m - 1)
1.33 a) P((l, 9)) = 1/36 b) P((3, x)) = 8/36 c) P((z, i) | Somme paire) P((i, 0)
P((i,i)) +P((p, p))
P(F n G) (0,4)(0,01)
1.34 P(F\G) 0,0323
P(G) (0,4)(0,01) + (0,6X0,2)

1.35 a) P(£>) = 0,15(0,04) + 0,3(0,03) + 0,2(0,05) + 0,35(0,02) = 0,032


(0,2X0,05)
b) P(MAD) 0,312
0,032

1.36 ■
7r---^~ = 0,25
nr
1.37 a) (N uL) = 0,8 + 0,3 - 0,8(0,3) = 0,86
P
b) La présence des frais de livraison rapide est indépendante du type de produits sur la commande
c) i) (N uL) = 0,8 + 0,3 - 0,8(0,35) = 0,82
P
0,3-0,8(0,35)
H) P(L\N)= —-- —•- ■ -= 0,1

P 365
P 365

1.38 a) P(B) =1 25
25
0,569 b) P(B) = 1 ^ 7 pour n <365
365
1.39 a) P(S) = P(S uE) +P(S n £) - P(E) = 0,05 b) P(S\E) = - (-- - - - = 0,75
P{E)
1t i n i i 1/2 41
1.40 P(X) i n V ia ) + 7 a)+T
4U ; 4 4 4 5 60
RÉPONSES AUX EXERCICES 469

1.41 P(I3\R) =------------ (0,5X0,3)------------ = 0 441


(0,2X0,2) + (0,3)(0,5) + (0,5)(0,3) ’
P(C n (0,25)(0,9)
1.42 P(Ç\A) 0,6
P(A) (0,25X0,9) + (0,75)(0,2)

1.43 P( A (J G) = 0,10 + 0,80 - 0,10(0,80) = 0,82


1.44 15 x (0,1) x (0,9)14 =0,343

C h a p itre 2

2.1 a) x. 0 1 2 3 4
f4\
f 48 l
P(X = xi) = ^ j 15 - x J
'52") 0,658 84 0,299 47 0,03993 0,00174 0,00002
,5 J

b) P ( X = x)

0,8-
0,6-
0,4-

0,2 -
0,0 + T T * x
0 1 2 3 4
-|2
13 83
2.2 V(X) = E(X2)
6 36

b) £(X) = /x = xe Xdx =l c) V(X) =a2= J x2e Xdx-fi2=1

si t >0
2.4 a) Pour c 0>, /(/) = ) = -
ailleurs.
b) P (r > 5001r > 300) = éT200c =0,670
c) 1—e c' =0,90 <=> t = 1151,3 heures
2.5 a) Oui c) Oui e) Non, car K(x) =0 pour tout x >1.
b) Non, car x(Gest
) décroissante. d) Oui
470 RÉPONSES AUX EXERCICES

-X si x >0 0,1 si 0 < x< 10


2.6 a) f(x) = F\x) d) j(x) =J'(x)
o sinon. 0 sinon.

e si jc< 0
c) h(x) = H\x)
0 sinon.

2.7 a) Oui b) Oui c) Oui d) Non, car 2 p w > i .


X=1

4 29
2.8 b ) fi = E(X) b) <T= Vv(X)
5 25
c) p(x) d) F(X) A
4/10- 1-
2/10- 8/10-
6/10J
-1 0 1 2 4/10-

-9~ T
-1 0 1 2
29 --2 0
(20)x (= 0,978)
2.9 P(X< 29)
x —0 x\
2.10 a) F(x) 1Y+1
i,o- si x = 0,1, 2,
b) P(x) 2,
0,8 - 0 sinon.
0,6 - c) F(0 < X<8) = F(8)— F(0) = 0,498
0,4 d) P(3< X<5) = F(5)-F(2) = 0,109
02 - e) P(X>1) = 1-F(1) = 0,250

V
A 0.0
m

4 1
.•‘ Çkxdx +^k(4-x)dx = \, donc d) fl = 1 —
4 x2dx+ f
J2 4 (4jc—x2)dx = 2
4
21 41
(N | c o

cr x3dx+ Jf2 — (4 jc xi)dx 2


>
v
>4 4

0 si jc < 0
JC
si 0 < < 2 jc

►j: e) F(jc) 8
JC
1 + JC si 2 < < 4 jc

P(X < 1) _ 1 8
C) P(X< \\X<2) P(X < 2) 4 1 si j: > 4.

[“kxdx+ C"1k(2a-x)dx =1, donc = a12 ’


Jo
f2a
b) E(X) i r f jc2
2cj—
£c+* r2 ° " ------
(2ax X 2)d!x] a
7 Ï Ja
RÉPONSES AUX EXERCICES 471

r
si jc< 0
si 0 < j : < a

C) F(x) = <
si a <x < 2a
si jc> 2a.
V.

2.13 a) jcl 0 1 2 3 b) E(X) =

f4¥ 1
v*, A 3 -J c j 5 15 9 1
P{X = jc,) = •
30 30 30 30
(? )
2.14

a) jc -1 1 10
Px(x) 29/36 6/36 1/36
b) E(X) = -13/36 = -0,361$
c) y -2 -1______ 1__ 2 10 20
py(y) 29/7/216 29/36 (l-/?)/6 p/36 1/36 />/216
d) E(F) = -(31p + 39)/108
e) f'CX) > (E seulement
X ) si p <0; donc, le jeu n’est jamais plus avantageux.

2.15 a) Les fonctions 3), 6) et 7) sont des fonctions de densité.


b) Les fonctions 2) et 5) sont des fonctions de répartition.
3
c) E(T) =J°3/3
4
d) v (r ) = £ (r 2) -[ £ ( D ]
3
80
0 si t <-1
e) Fit) = « r3+ 1 si -1 < r < 0
1 si / > 0.
472 RÉPONSES AUX EXERCICES

8
2.17 a. Cl I + I + i 1 , donc k c) E(X) est inférieure à 2.
7
b) /**) d) y/VÎXj est inférieur à . 2

2.18 a) Vrai. e) Faux, sauf si/(x) = 0 sur cet intervalle.


b) Faux. F(7) - F(2) Autrement, F(x) sera linéaire croissante.
c) Vrai f) Faux
d) Faux. C’est la valeur moyenne de X lors d’une g) Faux
infinité de répétitions de l’expérience aléatoire. h) Vrai

2.19 a) JUA =51200$, /tB=51350$ b) /xAlB= fiA=51200$ c) £ f (A = fc)F(F = À:) = 0,25


k

2.20 a) A= 100, a « 5 (oaxl = Æ = 5,77) c) A= 20, a « 5 (tr^ = V2Ô « 4,47)


b) A = 10, o » 10 = 10) d) A = 150, <r » 55 ( c r ^ = V32ÔÔ « 56,57)

0 si x < 0

x 3 32x 54
2.21 a) F(x) si 0 < x <3 c) F(X3) x — dx .

9 9 5
1 si x >3. p/n 2* , 1 . 3

Jo 9 dx = — , donc m ——= . 7

b) La moyenne de X sera supérieure à 1,5 2 V2

2.22 a) i) F(105) « 0,10 iv) F(125) - F(120) « 0,45


ii) 1-F(110) = 0,75 v) 1-F(140) = 0
iii) (variable continue)
0

b) [mm,1 1 mm]
0 1 2 0

c) 25 % de pièces trop courtes, 75 %de pièces trop longues.


d) Environ 100 mm
2.23 a) Graphe 2 b) Graphe 4 c) Graphe 1 d) Graphe 3
2.24 a) L’aire sous la courbe est égale à 1, donc a =2/3
X
si < x <2
0

3
b) f(x)
2 - - * si 2 < x <3
3
0 sinon.
V.
r
0 si x < 0

x
si < x <
2

0 2

C) F(x) = -
6

x
-f .x- si 2 < x < 3
2

- 2 2

"T
1 si x >3.
RÉPONSES AUX EXERCICES

Lr\ \U)
d) P(X> 1) = 1—F(l) 5 F (2) - FOJ.
P( 1 < X < 2,5) = F(2,5)-F(l) 3

P(X <2|X > 1)


6 4 l-F(l)
2.25 a) R = {-2,-1, 0,1} c) P(-1<X<4) = 0,25 + 0,20 = 0,45
b) XI. -2 - 1 0 1

p(x) 0,25 0,30 0,25 0 , 2 0

2.26 a) 4 ans c) E(X) = 0


J x — dx + X dx
J> )dx + \~°
° 6 2
b) P(X< 3) = F(3) = 0,75
3\
*x 2 X 7 11
f V(X) dx + 2x dx
7" (7/2 "
J 1 0~6 2J 3 1 8

“3 4- 2
) 2

l 2) L2J 4 J 16
2.27 a) X y pY(y) b) F(K) = ]T ^ 0 0 = 14 C) VOO = 2 > P r O O -l
2 4 564
0 0 0 , 6

î 2 0 0,3
2 80 0 , 1

2.28 a) F(P) = 10 + 2F(X) = 18$ b) V(P) = 22V(X) = 8 $ 2

2.29 a) P(T < 1) = \ —e~VA = 0,221


b) T<1 T> 1

b 0 2 0 0

P(B= b) 0 , 2 2 1 0,779
Donc, E(B) = x 0,221 + 200 x 0,779 = 155,80 $. 0

2.30 a) P(Y > 0) = P{X < 13) = 0,8 c) V(X) = 140,4 -(11, = 1,16 jouis
8 ) 2 2

b) F(X) = 11,8 jours V(K) = 2000 V(X) = 4640 000


2 $ 2

E(Y) = 26 000 - 2000 •F(X) = 2400 $


2.31 y -600 3000 6600 1 0 2 0 0 13 800
1 1 1 1 1

pY(y) 24 3 2 1 2 24
a) Y = 3600(1) - 600 = 3000 $ c) En moyenne 360 x 1/24 = 15 journées
b) E(Y) = 3600£(X) - 600 = 5100$ d) 360F(y) = 1836000 $
V(Y) = 36002V(X) = 9 630 000 $ 2

e z siz> 0
2.32 / Z(z) =
0 sinon.

2.33 a) F(D) = 4,5 (par symétrie)


d y pYiy)
4 0 0 , 1

3 ou 5 î 0 , 2

ou 2 6 2 0 , 2

1 ou 7 3 0 , 2

ou 0 4 8 0 , 2

9 5 0 , 1

Donc, E(Y) = 0,2(1 + 2 + 3+ 4) + 0,1(0 + 5) = 2,5.


474 RÉPONSES AUX EXERCICES
I

2.34 R
(E=) 92P(A< 1,4) + 98P(A > 1,4) = 93,8 cents/litre

1
•e~m si y > 0
2.35 a) f y(y) = yfiÿ
0 sinon.

2ve si v > 0
b) / v (v ) = f ;( v) =
0 smon.
c) fu(u) = Fj(u) = pour tout u.

0,50(X - )sis X > s(stock insuffisant)


2.36 a) L(X,s)
0,25(5 - X) si X < s (stock excédentaire).
f s, f 2* 10° , l
b) F[L(X, *)] = J 60,25(j - jc) •10"6 J 0,50(x - j) •10"* [3 •ÎO-6^2-10^ + 9 • 106]
▼------- 8
stock excédentaire stock insuffisant
c) dE[L(X, s)] 5-10
5
ds 3
2.37 F(A) = 9 + 0,3F(G) + 0,0025[V(G) + (F(G))2] = 9,82
i 1
1 si e < w < £
(4-y) si 0 < y < 3 b) / w(hO= F;(w) = < w
2.38 a) f r (y) = Fy'(y) 2 0 sinon.
0 sinon.

2.39 E{P) = 1+ 3E(R) = 2,50 $

£fX
2.40 F(V) = F 1 3,1612
4

0 si y < 0
7 1/8 si 0 < y < 1
b) F, (y)
2.41 a) « H - O I j M ï M Î K J 8 4/8 si 1< y < 4
1 si y > 4.
71
V(X) = F(X )-(F(X)) 2

64

2.42 a) F(F>) = 75 + F(X) = 75 mm

V(X) J*°(jc2+ jc3) ^ + Jo'(x2- ^ 3) <&= 61


o D= sjV(15 + X) = ./- mm

b) F(X < -0,8) + F(X > 0,8) = + x) dx + J^(l - x ) dx = 0,04, soit 4 %.

c) x y Py(y)
74,2 < x<75,860 0,96
* > 75,8 20 0,02
* < 74,2 -100 0,02

E(Y) = 56 $, oY 22,98 $
RÉPONSES AUX EXERCICES

2.43 a) Faux. Sinon toutes les variances seraient nulles ! a) Faux. —1) = V(Y)
b) Vrai f) Faux. V(X ) * [ V(X
4 ) ] 4

c) Faux. E (X 4) * [E (X )f fl) Vrai


d) Faux. E { ln(X)) * ln[£(X)]

Chapitre 3

3.1 a) P (X = 1n X = 1) = p(l, 1) = 3/50


b) P (X > 3 o Y < 1) = pi3,0) + p(4 , 0) + p(5,0) + pi3,1) + p(4,1) = 5/50
c) P(X + F > 3) = 9/50

x 0 1 2 3 4 5
d)
Pv(*) 27/50 11/50 6/50 3/50 2/50 1/50

y 0 3 1 2 4
/v(y) 20/50 15/50 10/50 4/50 1/50
0 1 2 3 4
e)
/VioO ) 11/27 8/27 4/27 3/27 1/27
0 1 2 3 4 5
f)
Pxlo^ 1 1 / 2 0 4/20 2 / 2 0 1 / 2 0 1 / 2 0 1/20
1 1
g) X et F ne sont pas indépendantes puisque, par exemple : pi5,4) = * px (5) •py(4) 0

50 50
0,74-(0,9)(1,02)
h) P 0,135
V(1,57)(1,10)

y 0 1 2 3
3.2 a)
/Vi2(x) 2/6 1/6 3/6 0

X 1 2 3
b)
Pxix) 0,5 0,3 0,2
c) £ ( X ) = 1(0,5)+ 2(0,3)+ 3(0,2) = 1,7
d) p(l,l) + p(2,2) + p(3,3) = 0,30 + 0,15 + 0,10 = 0,55
e) Vrai. pYi0) = pYil) = 0,35
f) Vrai. px12(2) = 0,75 > p (3) = 0,25 x j 2

g) Les deux variables sont dépendantes. Par exemple, p(l,2) = 0 * (1)/V(2)= 0,5 *0,2.

3.3 a) y V 0 1 2 3
0 1/32 4/32 2/32 1/32
1
2/32 8/32 4/32 2/32
2
1/32 4/32 2/32 1/32
«

b) Faux. p(0,0) ==-X —=


1 1 1

8 4 ” 32

c) 4
476 RÉPONSES AUX EXERCICES

3.4
X = Patients du groupe A

0 1 2

1770 1800 435


4e2 oo 0

4950 4950 4950


Q
a9i
O 600 300
S b
OC
1

4950 4950
0

il 9
T3 45
2

4950
0 0

P(X = 2 n y ) 1/16
3.5 a) P(X = 2) 1 1

p(y 1|X = 2) 1/8 2


b) yV 0 1 2 pY(y)
- 1
1/16 1/16 2/16 1/4
0 3/16 3/16 2/16 2/4
1 4/16 0 0 1/4
Px(x) 1/4 1/4 2/4 1

3/16 3
c) P(x = o | y = ) 0

1/2 8
d) X et y ne sont pas indépendantes puisque, par exemple : 0 0
3
, ) = — * py( ) • ( ) = —•— 0 0
1 1

1 6 4 2’
1 5 1
©) Cov(X,Y) — )EY—
(X E)Y=) ———•0 = —>0, donc X et ont tendance à prendre de gra
(X
simultanément et de petites valeurs simultanément.
27
f) V(T ) = V(X) +4V(Y) - 4Cov(X, Y)
16
3.6 a) et b) A* 0 1 2
P K 0 0

0 3/30 2/30 0 1 / 6

3/30 6/30 6/30


1 3/6
22/30 6/30 2/30 2 / 6

Px(x) 3/6 1 / 6 2 / 6 1

P(1,0) 3
c) P(x = i|y = o>
PY(0) 5
d) X et y ne sont pas indépendantes puisque, par exemple : 0 , )=
0 0 ( )pY( )
0 0
1 1
6*6
e) P(G > 0) = P(X + Y >)2= 14/30
f) E(G ) = E (X ) + E(Y) -2 = 1/3$

3.7 a) />(*,= 52) = 0,28 c) £(X, ) = 52,51 tubes

b) *i 51 52 53 54 55 55

d) E(X2 1X, = 52) = ^ x 2p ( U2) = 52,96 tubes 5 2

Px, (*i ) 0,28 0,28 0 , 2 2 0,09 0,13 jt2 =5I

3.8 a) Faux b) Faux c) Faux d) Faux e) Vrai

2jc^ -*\
si x. > 0

3.9 a) U,)
0 smon.
R É P O N S E S A U X E X E R C I C E S

si 0 < x } < 2

sinon.

s i 2 < ,t\ < 4

s i n o n .

3 .1 2 a ) C o v (X , Y ) = p X Y J V ( X ) V ( Y ) = 18
b ) E (X + Y) = E (X ) + )= 5 (Y
E

c ) V (X + Y) = V (X ) + + 2 • C ov(X , V ( Y ) Y ) = 77
d ) E (3 X - 2 Z ) = 3 • E (X ) - 2 • E (Z ) = 18
e ) V (3X - 2 Z ) = 9 V (X ) + 4 V ( Z ) + 2 • (3)(-2)C ov(X , Z) =
^ P3X.-2Z = P xz =
g ) C o v (2 X + 3 Y , Z — Y) = 2 C o v (X , Z ) + 2 ( - l) C o v ( X , + Z) + 3(-l)K (Z) = - 1 12,8
1 2 p1/2 3 17
3 .1 3 a ) P Y
Jn
o J O110
{x y2) dy dx =
2 40

3(1 + y2)
/ a . y) si O < y < 1
b) /yu (y) 4
/*(1) O sinon
O X et y ne sont pas indépendantes, car la loi conditionnelle de Y dépend de valeur de X. On peut aussi
montrer que f x(x) - f Y(y) ^ /(x , y).
3.14- a) E(Y) = E(Xl) + P(X4) = 4 x 20 = 80
V(Y) = V(X,) + V (X.) = 4 x 9 = 36
b) E(y) = 40
V(Y) = 2 x 9 + 2 • p XiX2 ^/VÏXJVÏX^ = 7,2

Cov(Xj, a -l- bX.') fe€ov(X,, X, ) 1 si Z?< 0


3.15 p 1 si 6>0
jVCJCJVXa + fcX,) ^/fc.2V(X,)V(X,) 1*1
3.16 Cov(Xj, X2) = J J 22x,x2 ctxr, <ix X,) dx■][/: 2 4x2 1
[/>.<■ 36
3.17 a) P = C + 100,donc p 1 c) B = 0,30C, donc psc. = 1.
b) Cov(C + ÎOO, C) = V(C) = 25 d) Cov(0,30C, 0 = 0,30^(0 = 30
3.18 a) Si Y 2: X
220 r 220
w n yS>x /0,;y) d;y dix 200L
J

fC
MüX e x e r c ic e s

2
4^? 2 x 2 si —1 < x < 1
3.19 a) ) dy n
o n
0 sinon.

4 2 .A .
2 .y si 0 < 1
dx K
0 sinon.

î
f(x,y) 2 si —yï y2 < x <y j l - y 2
b) x..(*)
f

f Y ( y )
2-y/l
0 smon.

1 2
f ( x , y) 2 si 0 < y <> x
/fl* (y)
AW 0 smon.

X
2
c) E (Y \x ) = j y f rlx(y)dy =
2
E (X | y) = fx f x[y(x)dy = 0

23 2y si 0 < y < 1
3.20 a) f r (y) xy(2 —x) dx
>2 0 sinon.

3
xy(2 - x) si 0 < y < 1
2 2y
b) f ru(y) 3 0 sinon.
;c(2 —x)
4 x=\

3
c) X et Y sont indépendantes, car pour tout couple (x, y), f(x ,y ) = f x (x)fy (y) = -xyÇ2 - x)
x +y 2 + 3y
3.21 a) E (X \y ) x 1 dx pour 0 < < 1
y +- l
2
7
b) E(X IY = 1/2)
12

c) f (X) 2J 12

d) E(K)
y' + 2 J * = i l
1
e) yf et K ne sont pas indépendantes, car f(x ,y ) n est pas égale à _/*•(x)fy (y)
2
tous les couples (x, y).
RÉPONSES AUX EXERCICES

3.22 a) Faux b) Faux c) Faux d) Vrai


3.23 a) Vrai b) Faux c) Faux d) Faux
2 2
3.24 a) f(x ,y ) = (2xe~x )(2 ye~y), donc oui, Xet sont indépendantes.
b) X et Y ne sont pas indépendantes. Puisque x <,yal distribution
varie conditionnelle
en fonction de la valeur de l’autre.
c) Oui, X et Y sont indépendantes, car f(x,y) = f x(x)fY(y) = 1/8.

3.25 a) p ( o < X < - n O < y < - l = f5f5 1 dxdy = -


K 2 2) JoJo 4
b) (P >K) = 0 ; 1
X dy dx = i

c) p lf x < y + -4l J= Jo
f3/4r
Jo +‘‘ l<ixdy+f' f'idxdys
^ J3/4J0 —
^ 32

Chapitre 4-

4.1 a) Binomiale(n = 10, p) e) Géométrique(p = 1/3)


b) Géométrique(p = 1/2) f) Binomiale(n = 550, p= 0,005)
c) Poisson(c = 20) g) Hypergéométrique(/V = 52, 4, = 5)
d) Pascal(r = 2, p)
a) X = nombre de missions réussies sur 6
X ~ Binomiale(n =6, p - 0,95)
6 6^
P(X > 5) c (0,95)s(0,05) + (0,95)6(0,05)° = 0,9672
JJ IO/
b) x=6
c) Y = nombre de missions jusqu’au premier échec
Y ~ Géométrique(p = 0,05)
P(Y = 5) = (0,95)4(0,05) = 0,0407
a) W = nombre de commandes reçues sur 12 visites
W ~ Binomiale(n = 12, p= 0,5)

P(W > 4) = 1- (0,5)12 0,9270

b) Y = nombre de visites nécessaires pour obtenir 3 commandes


Y ~ Pascal(r = 3, p =0,5)

EÇY) = - = 6, VVÔÔ = =S
P V P
4 8 0 RÉPONSES AUX EXERCICES

4.4 a) X = nombre de valises égarées sur 90 valises b) Y = nombre de valises égarées sur 4 essais
X ~ Binomiale(n = 90, p = 0,006) Y~ Binomiale(n = 4, p = 0,006)
4^
P(X = 0) = (1 - 0,006) 90
0,582 P(X = 1) (1-0,006/(0,006) = 0,0236

4.5 a) X = nombre d’unités défectueuses parmi 50 b) X = nombre d’essais sans défaut parmi 3
X ~ Binomiale(n = 50, p = 0,02) Y ~ Binomiale(n = 3, p= (0,98)ÎO= 0,364
50 P(Y = 3) = (0,364/ = 0,048
P(X > 2) = 1 (0,02/(0,98) 50- jc
0,0784
jt=0 x
4.6 a) X = nombre de clignotants défectueux parmi 100
X ~ Binomiale(n = 100, p = 0,01)
>noo,
P(X < 2) XI |(0,01/(0,99)100-* = 0,9206
x=0 X

40^
b) P(X100 2\X„ i )= m . 40 1) (0,99 (0 ) = 0,270
) 3 9 , 0 1

ly
4.7 a) X = nombre de 0 changés en 1 c) Z = nombre d’erreurs sur 3 bits
X ~ Binomiale(n = 5, p = 0,1) Z - Binomiale(n = 3, p = 0,0086)
P(X >3) = 0,0086 P(Z 0=) = 0,9745
b) Y = nombre de 1 changés en 0
Y ~ Binomiale(n = 5, p = 0,1)
P(Y< 2) = 0,9914

4.8 a) 6) Binomiale(n = 9, = 0,5) c) 1) Poisson(c = 3)


b) 3) Géométrique(p = 0,4) d) 7) Pascal(r = 3, = 0,7)

4.9 a) Géométrique(1- p-q) c) Géométrique 1+ P-g


2
b) Géométrique 1 -p -g d) Pascal(r = 4, p= 2/3) P(X = 7) '(2/3 (l/3 = 0,1463
2
6 ) 4 ) 3

4.10 a) X = nombre d’appels jusqu’à une réponse b) P(X = 1) = 0,8


X - Géométrique(p)
/*(X = 2) = (1 -p)p = 0,16, donc p = 0,2 ou p = 0,8.

4.11 a) X = nombre d’essais jusqu’au premier échec p (l-p) = =>


4 0

X ~ Géométrique(1- p)
P(X = 5) = p4(l - p)
4.12 a) X = nombre de visites jusqu’à la première vente c) Non, car 46 0 0 0 $> 25 0 0 0 $.
X ~ Géométrique(p)
d) P(C >100 ) = P(X > 23,5) = 0,0886
C = 10 000 + 4000(X -1 )
0 0 0

Coût le plus probable : 10 000 $ e) VV(C) = 4000J-~r = 37 947,33 $


b) (C=) 10 000 + 4000[£(X) -1] = 46 000 $
E Vo,i2
4.13 X = nombre de forages jusqu’à la découverte de pétrole
X ~ Géométrique(p = 0,8)
a) P(X <£2) = (0,2)° (0,8) + (0,2)‘(0,8) = 0,96
b) P(X <3) = (0,2)°(0,8) + (0,2)‘(0,8) + (0,2/(0,8) = 0,992
c) P(X <; 8 1X > 5) = P(X < 3) = 0,992
RÉPONSES AUX EXERCICES 481

4.14 ») X = nombre de jours jusqu’au premier orage


X —Géométrique (p= 0,05)
E(X) = —= 20 jours (9 avril)
P
b) P(X = 36) = (0,95)3S(0,05) = 0,0083
c) P(X = 361X > 26) = P(X = 10) = (0,95)9(0,05) = 0,0315
d) Y = nombre de jours jusqu’au troisième orage
Y ~ Pascal(r = 3, = 0,05)
M 2 -n 39
P(Y = 42) (0,05)3(0,95) 0,0139
3-1 J
e) Z = nombre de jours jusqu’au deuxième orage
Z ~ Pascal(r = 2, p= 0,05)
16-1
P(Z = 16) (0,05)2(0,95)14= 0,0183
2-1
4.15 X = nombre d’heures jusqu’à la deuxième vente
X —Pascal(r = 2, p= 0,2)
8-1 \ 2
a) P(X = ) 8 (0,2) (0,8 = 0,0734
2 ) 6 b) E{X) 1 0 heures
2-1 J 0,2
4.16 X = nombre d’entrevues pour combler les deux postes
X ~ Pascal(r = , p = 0,8)
2

4 -n 1 2^
a) P(X= 4) (0,8) (0,2 = 0,0768
2 ) 2 b) P(X<4) (0,8)2(0,2)° + (0,8) (0,2) = 0,896
2-1 J 2

4.17 X = nombre d’exécutions jusqu’au cinquième succès


X ~ Pascal(r = 5, p —0,8)
a) P(X) = — = 6,25 b) V(X) = ^ ^ = 1,5625
0,8 (0,8)2
4.18 X = nombre de forages jusqu’au quatrième succès
X ~ Pascal(r = 4, p= 0,9)

P(X< ) = X
6
(0,9) (0,2r
4 “ 4

x=4

4.19 X = nombre de téléviseurs défectueux parmi 5 pigés sans remise


a) X —Hypergéométrique(N = 25, = 4, = 5)
2V\ Ï4V2W 21
+ +
5 y 1 4
\JJ\Z J v2;v 3
P(X < 2) 0,984
( 25\
V5y
b) X ~ Binomiale(n = 5, p = 4/25)
P(X < 2) = 0,968
n 5 5
c) L’approximation serait encore meilleure, car —= ——est plus petit que —.

4.20 X = nombre d’appareils défectueux parmi n tirés sans remise dans N = 25


X ~ Hypergéométrique (/V= 25, D =7, n =?)
f7Y1
8>
P(X >l) = l -^ ^ y J > 0 ,9 5 = > n = 8
RÉPONSES AUX EXERCICES

4.21 a) X = nombre de véhicules qui traversent cette intersection en 1 heure


X ~ Poisson(c = 25)
= 0,000564

b) Y = nombre de véhicules qui traversent cette intersection en 1journée


Y ~ Poisson(c = 24*25 = 600)
E(Y) = 600 véhicules
JV(Y) - a/600 = 24,5 véhicules
c) Z = nombre de véhicules détectés en 1heure
Z ~ Poisson(c = 0,9 •25 = 22,5)
P(8<Z<10) = 0,002 51
4.22 X = nombre de bris de fils en 25 heures
X ~ Poisson(c = 25/10 = 2,5)
2,5° 2,5' 2,52\
P(X< 3) = e -2 ,5
—— +----+ 0,544
0! 1! 2! J
4.23 a) X = nombre de globules sur 4 mm 2
X ~ Poissonfc = 28)
28
-2 8
(28) 0,075
P(X = 28)
28!
b) W = nombre de cellules ayant 28 globules rouges
W - Binomiale(n = 10 ,p=,075)
0
'10^ . in /10 ,
P(W > 2) = 1 ^(0,075)°(0,925)0+| |(0,075)(0,925)
1 0,170
IV
c) y = nombre de globules rouges sur mm 2 1

Y ~ Poisson(c = 28/4 = 7)
- 7 ^--
7°-f---
7 7 7 T
+ + — 0,827
1 2 3

P(Y> 4) = l-g
! ! ! 3! 4!
0 1 2

d) Z = nombre de globules sur 400 mm 2


Z —Poisson(c = 28*100 = 2800)
E(Z) = V(Z) = 2800 globules rouges
4.24 a) X = nombre d’équipes qui se présentent au local chaque jour
X ~ Poisson(c = 2)
-2 2° 2' 22 23N
P(X>3) = l-<? —H---- 1---- 1--- 0,143
0! 1! ! 3! J 2

b) £(X) = 2
c) Y —nombre d’équipes approvisionnées au local en une journée
E(Y) = 0(0,135) +1 (0,271) + 2(0,271) + 3(0,323) = 1,782
d) E(X)-E(Y) = 2-1,782 = 0,218
e) F(3) = 0,857 et F (4) = 0,947, donc il faut au moins n - 4 exemplaires.
4.25 a) X -Binomiale(n = 15 000, p = 0,002) c) X ~ Poisson(c = np = 15 000 •0,002 = 30)
15 000^ g (3Q
0,0134 d) P(X = 20)
' 3 0 ) 2 0

b) P(X = 20) (0,002 (0,998)


)
14980
2 0 0,0134
20 J 20!
4.26 a) X = nombre de clients par semaine
X - Poisson(c = 3)
_3, 3° 3* 3 33A
H---- 1---- h 0,353
2

P(X > 4) = 1- g
0! 1! 2! 3! J
RÉPONSES AUX EXERCICES 483

b) Y = nombre de semaines durant lesquelles certains exemplaires ne sont pas vendus


Y ~ Binomiale(n = 4, p= 1—0,353 = 0,647)
4
P(Y > 1) = 1 (0,647)°(0,353) 0,984
U
c) M —nombre de magazines vendus
E(Af) = 0(0,0498) + 1(0,149) + 2(0,224) + 3(0,224) + 4(0,353) = 2,681
V(M) = E(M2) —[E(M)\ 1,518
d) E(X)-E(M)= 3 - 2,681 = 0,319
4.27 X = nombre de véhicules ayant un accident parmi les 10 000
a) X —Binomiale(n = 10 000, = 0,0001)
P(X = 0) = (0,9999) 1
000
0 0,367 8 6

b) P(X > 2) = 1- P(X < 1) = 0,264 24


c) X~Poisson(c = - 1 = )
0 0 0 0 0 , 0 0 0 1 1

e~'l°
P(X = 0) 0,367 8 8

0!
-i
P(X > 2) = 1—e 0,264 24
0 ! + l!

Chapitre 5
7/4 1 j 5
5.1 a, P \ \ < X < \ — dx = — c) Oui. P(X < 2) = P(X > 2) = 1/2
' / 2 4 16
0 + 4
b) E{X) = _ _ =
16
2 Vnx)
2 12
5.2 X -6/(35,45)
0 si x <35
a) F(x) = - 1 = si 35 < x < 45
3510 10
1 si x >45.
41 1 3
b) P(X < 41) dx
35 10 5
c) L’écart-type est inférieur à 10, car la distance maximale observable entre une observation
et la moyenne 40 est de 5.
5.3 a) Vrai d) Vrai
b) Vrai e) Vrai
C) Faux. P(X > 4 1X > 2) = 1/3, P(X>2) = 3/4
5.4 X = montant de la vente d’un immeuble ; X ~ U (200 000,600 000)
E(H) = 0,04£(X) + 500 = 16500 $
V(H) = 0,042•V(X) = 21333 333 $ 2

5.5 oc yf3,p = j3
5.6 X = épaisseur des rondelles (en mm) ; X - 5,7]
(5 - 7) 0,577 mm
a) E (X ) = ^ = 6,JV
2 12
s 4 8 4 R É P O N S E S A U X EXERCICES

b) P(5,02 < X <6 ,98) = 0,98


c) Y =nombre de rondelles examinées d) W = nombre de rondelles non conformes
jusqu’à la première pièce non conforme parmi 50
Y ~ Géométrique(p = 0,02) W ~ Binomiale(n = 50,p = 0,02)
T = 30X = minutes jusqu’à la première i) P(W< 3) = 0,9216
pièce non conforme
ii) E(W) = 50(0,02) = 1rondelle
E(T) = 30£(7) = 1500 min
yJVÎXj = V50(0,02)(0,98) = 0,99 rondelle
y/V(T) = y/900V(Y) = 1484,9 min
5.7 X —£/[—1,3]
a) P (X < 4) = 1 b) P(X > - ) + P(X < c) P(X >-) + P(X< 0) =
2 4

1000 $ si Y >1
5.8 a) Y = durée de vie du groupe b) B = \
motopropulseur (en années) 1 750 $ si y < l.

Y ~ Exponentielle(l/3) E
(B
) = 1000P(K > 1) + 750P(y < 1) = 929,13 $
P(Y < —) = 1- e(-‘/3x,,2) = 0,1535
2
5.9 a) P(X <)5 c) P (X > 5 |X > 2 ) e )P (X > 5 |X > 4 ) g) Égales
bî P(X > 1/5) d) P(0 < X < 2) f) Égales
5.10 X = durée de vie de la pile (en jours) ; X ~ Exp(A = k)
a) P(X > 23) = e~2U = 0,40 => k = 0,0398 c) W = nombre de piles en fonction après 20 jours
i parmi 10
b) £(X) = -------- = 25 jours
0,0398 w ~ Binomiale(n = 10, = e^'0398'20 = 0,451)
V(X) = ---- -— r = 630 jours2 * 9) = 0,0046
0.03982
5.11 a) E{X) = 1/A = 3
P (X < l) = l - e ' 1/3 = 0,283

-50 si X < 8760


5.12 a) B = c) E(B)= 46,80 $ par écran
100 si X £ 8760.

b -50 100 autre


P (b) 0,355 0,645 0
5.13 Oui. A = 0,2554
5.14 a) {X<5) = 1-
P e~5X = 0,90 => E(X) = 1/A = 2,171 min
b) P(X < 0 = 1“ tf"0,4605' =0,5 1,505 min
C) P(X > 6 1X > 3) = P(X > 3) = tf-*’4605-3 = 0,251

C si X > 15 si X > 15
5.15 a) Coût. = c +5 s i x ^ 15 si X £ 15.

b) ÆXCoûtj ) = C ^,5/23+ (C + 5)(1 - e'15'25) = C + 2,26

E(Coutn) = 3 Ce'15'75+ (3C + 5)(1 - e'15'75) =3C + 0,91


RÉPONSES AUX EXERCICES

c) E(Coûtu) —£(Coût,) = 2C —1,35, donc le procédé I est préférable si 0,68 $.


5.16 X = durée de fonctionnement d’un transistor (heures)
X ~ Exp(A = 1/20000
P(X < 3 0 0 0 0 1 X>
20000) = P(X < 10000) = 0,393

5.17 a) X, = temps écoulé (h) entre la (/ - l)-ième voiture et la i-ième voiture ~ Exp(A=7)
Y = X, + — h X10 - Gamma(r = 10, A = 7)
b) E(Y) = 1,429 heure (1 h 26 min)
yfVÇŸ)= 0,452 heure (27 min)
c) P(X10 < 0,25) = 1- e~m25} = 0,826

5.18 a) X = temps (en minutes) jusqu’à la 24e vente b) P(X <2


40) = 1- 0,527

X - Gamma

240 minutes = 4 heures

5.19 a) 7) Gamma(r = 6, A = 2) b) 4)Exp(A = 7) c) 2)£/(-50,50)


5.20 a) X = nombre de composantes défectueuses ~ Binomiale(n = 100,/? = 1/1000)
P(X > 1) = 0,0952
b) Y = nombre de cartes réparées en 6 h ~ Poisson(c = 3)
P(Y > 4) = 0,3528
c) Z —temps de réparation d’une carte ~ Exp(A = 1/2)
P(Z <1) = 0,3935
d) P(Z > 9,5 1Z > 8,5) = P(Z > 1) = 0,6065
e) K = temps de réparation de 5 cartes ~ Gamma(r = 5, A= 1/2)
5.21 Y = temps jusqu’à la 4e défectuosité
Y ~ Gamma(4,1/4)
a) £(F ) = 16 heures b) JVÇŸ)= 8 heures c) E{Y) = 20 et JV(Y) = 78
5.22 A = 0,1, r = 4
20 0,1 -0
,1*
20(0,1 • 20)
P(X < 20) (0,lx)3^ u dx = 1 e 0,1429
r(4) *=0 ifc!
5.23 a) Faux. Elle est équivalente à une Exp(A = 8). e) Faux. P(X< 1/4) >P(X> 1/4)
b) Vrai f) Vrai
c) Faux. E(W) = 3 et E(T) = 1/3 g) Faux. On peut le modéliser par
d) Faux. Les 2 prennent des valeurs dans [0, °°). une Exp(A = 12).

1 si 0 < x < 1
5.24 a) /(•*) = „ .
0 smon.

si 0 < x < 1 2(1-x) si 0 < x < 1


et /(*) =
sinon 0 sinon.

6x(l —x) s i0 < x < l


c) /(*)
0 sinon.
486 RÉPONSES AUX EXERCICES

fi-s-n2
5.25 P(X < 1,5) = 1—e 1 0 5 j =: 0,632
r60oy/3
5.26 a) P(X > 600) = e ^ =:0,318
b) £(X) = 0 + 400r(4) = 2400 heures
i) £(X) = 0 + 400r(2) := 400 (inférieure)
ii) £(X) = 0 + 600r(4) = 3600 (supérieure)
iii)£(X) = 100 + 400r(4) = 2500 (supérieure)
x-0
700
5.27 £(*) = !-<?
a) P(X> 0,368 700) -i
-i
b) P(X >7001X > 600) -(6 0 0 /7 0 0 )' 0,691

c) P(X > 100) = e-ooono0)3 = 0,997


d) P(X >700) = e -700/625
0,326
-700/625
P(X > 7001X > 600) -600/625
0,852
P(X>100) = <? -100/625 = Q 3 5 2

La loi de Weibull, avec un paramètre /3 > 1, est un meilleur modèle pour les phénomènes d’usure ou de
corrosion, car le taux de défaillance va en augmentant. La probabilité de durer encore 100 heures est plus
faible lorsque la pile a déjà servi durant 600 heures qu’au début de son utilisation.
5.28 a) P(X >000)
1 = 1—(1—e ~ 5 ’ ' 4 ) = 0,224
b) £(X) = 0 + 200r(5) = 4800 heures

C h a p it r e 6
Remarque : Certaines réponses de ce chapitre portent la mention «table II ». Le quantile y a été arrondi à 2 déci­
males pour permettre une recherche de probabilité dans la table II. Un calcul par ordinateur garderait toutes les
décimales et résulterait en une probabilité légèrement différente.
6.1 a) <ï>(2) - 0(0) = 0,477 25 d) 0(1,96) = 0,975 00 g) 0(1,37) = 0,914 65
b) 2 ( 0 1= 0,682
) - 1 6 8 e) 2[1-0(1,5)] = 0,133 62 h) 20(2,57 ) = 0,98984
- 1

c) 0(1,65) = 0,950 53 f) 0(2)-[1-O(l,9)] = 0,948 53

7 -1 0 ^
0,158 12,4 —10 ^
6.2 a) O 6 6 b) 1 -0 0,21186 c) 0,5-0(-2) = 0,477 25
3 y 3 7
6.3 a) c = 1,56 c) P(-c<X<c) = 0,99 2,57
b) O(c) - (1 - O(c)) = 0,95 1,96 d) c 1,645
6.4 a) Faux. P(X > ) est supérieure à P(X >7)
6 f) Vrai
b) Vrai g) Vrai
c) Faux. X/2~7V(3,1) h) Faux. La loi est exacte et non approximative
d) Faux. X et F prennent des valeurs entre et i) Vrai
e) Faux. X - Y ~ N(7,20) j) Faux. La loi 77(500,25) serait une bonne
approximation.
100-80
6.5 a) O 0,977 25 c) 0(2)-O(-0,5) = 0,668 71
10
b) Ol q8Q- | = 0,5 d) l-O(-0,5) = 0,69146
RÉPONSES AUX EXERCICES

e) P(-19,6 < X - 80 < 19,6) = 0(1,96) - <I>(-1,96) = 0,95


f) 1- P(-10 < X - 70 < 10) = 1- 0(0) + 0(-2) = 0,522 75
6 . 6 a) P(X >699) = 1-0(1,65) = 0,04947 (tableII)
b) X = nombre de piles qui fonctionnent plus de 699 jours
X —Binomiale (n = 10, p = 0,049 47)
P(X > 2) = 0,084 56

6.7 a) P(X > 500) = 1- 0(0,5) = 0,308 54 b) P(X O ^ J = 0,95, donc N = 534.

( 1—30 ^
3

6 . 8 a) P(X> 28) = 0(1,82) = 0,9656 (table II) b) P(X <31) = 0 | —pj— 1= 0,8186 (table II)
c) P(| X - 301> 2) = P(X > 30 + 2) + P(X < 30- 2) = 0,0688 (table II)
k - 2500
6.9 P Z< 0,05 k - 2376,6 lumens
75
6.10 a) P(X> 12,05) = 1-0(2,5) = 0,006 21 c) P(11,95 < X < 12,05) = 0(2,5) - 0(-2,5) = 0,987 58
b) O c — 12 0,1, donc c = 11,97
0,02
7,2-7,05^ +o 6,8-7,05 \
6.11 a) P(X > 7,2) + P(X < 6,8) = 1 -0 0,073 02
0,1 J 0,1 J
b) Supérieure, car on sait que P(X > 7,2) > 0,5 dans cette situation.
c) Égale, par symétrie.

0-(-5)^ 0,18673 (table II)


6.12 P(V-X>0) = P Z>
J3Ü25,
6.13 a) 1- P(1000 < X < 5000) vaut 0,0455 avec le procédé A et 0,000 06 avec le procédé B.
0,9545 si ==9--C 0,999 94 si xg ==9--2C
b) p(xA) 0,0455 si ==9--C-3. 0,000 06 si xB==9--2C-3.
c) E(Xa) > E(XB) si C > 0,136

6.14 Af(16,16) : P(X > 10) = 0,93 N(6,9): P(X>10) = 0,09


iV(10, 0,01) :P(X> 10) = 0,50 N(0,400):P(X>10) = 0,31
6.15 a) i) X - N(5, 4) H) Y ~ N( 15,169) iii) Z~N(10,1)
b) X + y + Z~N(30,174)
c) X10~
(5,0,2)
N
6.16 a) P(62 < X < 72) = 0(0,5) - 4>(-2) = 0,668 71

b) P (-c< X-7 0 < c) = 0,95 =>o f = 0,975 =>c = 7,84


c) 9 x 0 , 6 6 8 71 = échantillons acceptables
6

0-0,05 ^
6.18 P(X, X2<0) = O = 0,158 66
25 )
Vrjf.
'/■fV "V* > i
V -* * -H

._ _
RÉPONSES AUX EXERCICES
^

*
488

6,3-6 \
5,7-6 ,\
6.19 P(5,7 <Y <6,3) = 0 0 0,6156 (table II)
JÔ jl y VÔÜ2 y
6.20 a) £(y) = 4 + 2(4) + 2+3 = 17 V(Y) = 3 + 4(4) + 4 + 2 = 25
b) 0(0,6)-0(-O ,4) = 0,38117
c) V(X) = 3 + 4(4) + 4 + 2 + 2(2)(0,5XV3)(2) = 31,928
P( 15 < Y < 20) = 0(0,53) - 0(-O,35) = 0,338 77 (table II)

5 -0
6.21 P(|y|>5) = 2x 1 -0 0,014 28 (table II)
J5Ô/Î2
102-100 \
6.22 Y = X, H---- 1-X W(100xl, 100x0,012) />(y>lO2) = l - 0 0
1 0 0

0,1 y
0,2025
6.23 a) fi = ~ ~ ~ - 1 1>9 CT 0,15
J T 9
b) 1—P(11,8 < X- < 12,2) = 1- [0(2) —0(-O,67)] = 0,2742 (table II)

16 —15 ^
6.24 P(Y < 16) = 0 0,758 (table II)
^05 j
6.25 X ~ Binomiale(n = 200, p= 0,08) ~ N(np = 16, 1- = 14,72)
16.5- 16\ 20,5-16^ 11,5-16
a) 0 0,552 (table II) c) 0 0 = 0,758 (table II)
3.84 y 3,84 y 3,84
15.5- 16 14,5-16 14,5-16 13,5-16 \
b) 0 0 0,100 (table II) d) 0 0 = 0,090 (table II)
3.84 y 3,84 3,84 3,84 y

-0.25-0^ 0,25-0 \
6.26 a) P(|e, e2\>0,25) 0 + 1 0,5755 (table II)
V Jô y y.
0,05-0 -0,05-0 \
b) P(-O,O5<ê<O,O5) = 0 0 0,3829 (table II)
ÆÔÎ Vôôî y
6.27 a) y ~ Gamma(r = 40, A= 0,2)
150-200
b) P(y>15O) = l - 0 0,9430 (table II)
J 1000
c) P(400 < y < 600) - 0(2) - 0(-2) = 0,9545

6.28 a) y ~ Poisson(c = 100)


-v*

b) P{Y = 100) = PI 99,5 ~ 100 < z < 100,5 ~ 100 0,03988


10 10

p(89 < y < 120) » pi 89,5 100 < z < 120,5 100 0,8329
10 10
0,42-0,5 N
c) P(y< 0,42) = 0 0,0548
JO,0025 y
6.29 IV = X + y ~ W(2,00 ; 0,0025)
a) P(IV> 1,98) = 0,6554
b) P(W < *) = 0,9 =>k=
2064 ml
1,98-2
c) P(W> 1,98) = 1 - 0 0,977 25
0,01
RÉPONSES AUX EXERCICES 489

6.30 a) i) P(4,98<X<5,02) = 0(2) —0(—2) = 0,9545


ii) Y ~Binomiale(n = 180, » = 0,0455) *W(8,19; 7,817) P(Y <5) * 0,0934 (table II)
19,967-20 ^ ^ 20,033-20 0,95 a = 0,0084 cm
b) P -- ^ ^
O \[Âa J

6.31 a) P(X> 1330) = 1-0(1,65) = 0,049 47

b) Ol ^ _1000 0,025 xo 608 heures


200
c) i) Y = nombre de fusibles fonctionnant moins de 1330 heures
Y B
~ inomiale(n = 10, = 0,9505) P(Y = ) + P(Y =9) +P(Y = 10) = 0,9885
8

/ ™ r>2
200 \
ii) X ~ N 1000, P(X >1100) = 1- 0(1,58) = 0,0571
10 J
3 004 - 2 996
6.32 a) P(9
2,96 < <3,004) = - • = 0,8
X
3,005-2,995
b) W= nombre de panneaux avant d’obtenir un premier non conforme
W ~ Géométrique(0,2)
E ( T ) =30jE(W) = 150 minutes y/ŸÇ.T)= yl302V(W) = 134,16 minutes
c) T =X, + X 2+■■•+ Xm« N(360 ; 0,001) P(359,95 < <360,05) » 0,8859 (table II)

6.33 a) 0,670 32 b) 7 composants C) 0,8891


25
6.34 E(X) = e62-5, V(X) = e'^Ce25-1), médiane = e50, mode = <?
125 / *25

17,06 + 7,0692/2 20,59 ln(/?)-17,06 ln(L)~ 17,06


6.35 a) E(W) = e b) 0 0 0,90
-v/7,0692 V7,0692
V(H0 = e41'8(e7,0692—1)
[L, P] = [3 244 867,2 027 359 410]

1950-1999,13
6.36 a) P(X, >19501X2= 0,098) = P Z > 0,9767 (table U)
V607,75 y
b) Corrélation positive, donc (X>, 19501
P X=2 0,11) sera pl
de 0,098.
\
80-86,2 0,9951
6.37 a) P(X2 >801x, = 80) = P Z>
JSJ6 J
b) Si p = —0,8, la probabilité d’avoir une note supérieure à 80 au second test diminue (par rapport à la situa­
tion p= , ).
0 8

6.38 i
a) P{Xx>40)
b) Égales
15
c) P { X 2 > 10)

d) P ( X 2 >6
1X, = 44)
10 e) E(X21X, = 45)
f) V(X2)
5 g) Égales

0 -V/ i
45 50 55 1
RÉPONSES AUX EXERCICES

6.39 a) Vrai e) Faux. Le lien est fort lorsque p s’approche


b) Faux. V(X2) = 9. Seulement la variance conditionnelle de 1 ou de -1.
de X21x, dépend de p. f) Vrai
c) Vrai g) Faux. Pour p > 0, £(X,) > £(X, | x2)
d) Faux. £(X21 diminue quand x, augmente seulement si x2 < pu.
lorsque p est négatif.
6.40 d) N, (8,30,4,100, - 0,9)

C h a p itre 7
Remarque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
2 694 024-40* 131,302
7.1 a) x =5252/40 = 131,30, 5 113,75
39
b) <7o.6S~ -*(26,5) 133, <?o,9s —■(3
* 8
.5) 149,5
c)

T
110 120 130 140 150 160
7.2 a)

15 -
U
O
c(U
3 10-
LL,
5-

0 7
32 33 34 35 36 37 38
Pourcentage de coton
b) x 34,767, x = x(325) = 34,65, m = 34,7
c) EIQ —x(48i5) *06.5) 1,65
77 475,63 - 64 •34,767
s 1,828, j = 1,352
63
R = 37,9-32,1 = 5,8
d)

1----- 1----1----- 1----- 1----- 1


32 33 34 35 36 37 38

7.3 a) x = 89,— 8— = 89,25 01 - x(23) 86,1 03 ■*(68) - 93,1


2
b) £70 = 93,1-86,1 = 7
c)


r-
85 90 95
Rendement
RÉPONSES AUX EXERCICES 491

d) Une cloche légèrement étirée vers la droite


7.4 a) Moyenne tronquée inférieure à la moyenne globale
b) Vrai. La moyenne tronquée à 50% est la médiane elle-même.
7.5 a) Non, puisque Ql - 4 et (23 = 9. c) 150-0,5 = 75 données
b) Oui, à cause de l’asymétrie à droite.

T3
1= 16

II
1

7.6 a)• nm = 25 K = 60x197 = 11820


xm
ftl =60x180,36
7 = 10 821,6 si = 602x 4825,4 ==17371440
b) n24 = 24 : supérieure *24 : égale sh : inférieure
c) Oui, en ajoutant une donnée valant 180,36.
d) Oui, en ajoutant deux valeurs situées à une même distance de la moyenne, comme 179,36 et 181,36.
7.7 a) n = 1+ 2 + 8 + 21 + 26 +14 + 5 +1 +1 +1 —80
k) W{86,90] _ 30
c) 8/80 = 0,1
d) x est dans l’intervalle [90, 92].
e) Le diagramme en ii) : c’est le seul ayant des observations supérieures à 100.

Raison du retour

—nx = 0

7.10 a) Faux. Mesures de dispersion e) Vrai


b) Faux. Il a les mêmes unités que la variable, alors f ) Vrai
que la variance est mesurée en unités au carré. g) Vrai
c) Vrai
d) Faux. Non négatif
7.11 a) Quantitative continue c) Quantitative continue e) Qualitative nominale
b) Qualitative nominale d) Quantitative discrète
7.12 a) x, s, m, Ql et R sont en millièmes de pouce (0,001 po) ; s2 est en millionièmes de pouce2 (0,000001 po2).
b) x, m et l de l’échantillon diminueront de 63 ;
Q sz, s et R resteront inchangés.
c) 3c, s, m, Ql et R seront mutipliés par 100; s2 sera multipliée par 10000.
7.13 a) À l’examen 2 (2 écarts-types au-dessus de la moyenne).
b) À l’examen 2 (2,6 écarts-types au-dessus de la moyenne).
c) À l’examen 1 (1,5 écart-type au-dessus de la moyenne).
RÉPONSES AUX EXERCICES

7.14 Les points sont relativement bien alignés sur le graphique. La loi normale pourrait être un bon modèle.

7.15 a)
20
8a 15
< u
ao"
'O 10
tu
5

0
pfV p
T b efc
V- >> V V V \V V N> \> \> *
b) À = *(65) = 120 15 509
x 120,225 m = 121
129
C) <7o.30 •*(39.2) —119
d) s2 5,660 5 = 2,379 CV = 0,0198

7.16 a) Faux, x = 0, x = -0,205 b) ^ 5080-1270-(-0,205)


3,961 yfs2 = 1,99
1269
7.17 a)
. _ 15*121 + 25-165 + 35-184 + 45-173
------------------ — ------------------= 31,36
643
5 2 w (152•121 + 252•165 + 352-184 + 452’173)-643(31,361)2

. 321,5 —286... _
* * 30 +---- —----(40 - 30) = 31,93
7

184
b) Non. Ql > 20, ce qui n’est pas le cas sur le graphique.
. _ 0 -11 +15 *12 + 25 *16 + 45 *15
7.18 a) * = -------------- —--------------- = 23,241
54
(02 -11 + 152 -12 + 252• 16 + 452•15) - 54(23,241)
54-1 262,4
4
x ~ 20 + (30 - 20) = 22,5
16
b)
0,030 -
0,025 -
0,020 -
on
a<D 0,015 -
Q 0,010
0,005 -
0,000
10 20 30 40 50 60

7.19 a) | Nombre d’heures supplémentaires Fréquence relative


0<x <3
3 < jc<5 0,20
5<x<l 0,30
7< x< 8 0,25
8< x< 9

b) 35 employés correspond à 35 % de l’échantillon. Il y a donc 100 employés.


RÉPONSES AUX EXERCICES

4 476 373
7.20 *y 0,985
J{\ 648 452,5)(12 522 303,6)
Il y a une relation positive très forte entre le délai d’épuisement et la distance parcourue

C h a p itre 8
Remarque: Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.

8.1 a) X ~/ c) En utilisant S/-J%.


V(5,00; 0,102/8) = /V(5,00; 0,001 25)
b) s/v(X) = c / = 0,0354
s!/2,25

F.24.29
8.2 a) X . - X 2~ N ( - 5; 0,223) d) ------ F. nj
S] /4,00
c i <7 1,5 2
----+
29
b) + 0,473 e) 1,074
ni n 25 30 2 9 -2
c) X i - X 2« V (-5 ;0,223)
8.3 N,1)
0

8.4 a) Par le TLC, p = N P, Pd-P)


100
(1 ) / 3(1 ~ 3)
b) L’erreur-type de p est J — ' et l’erreur-type estimée de p est
100 100
8.5 a) Faux. X ~ 100,36/10) e) Faux. La médiane est 3,36.
b) Vrai f) Vrai
c) Vrai g) Faux. C’est l’inverse.
d) Vrai
99 s2
8.6 a) ~V
X (130,l),donc3). e) donc 1).
X - 130
b) X ~ W(130,4),donc4). d) ~S/5
----- ^4’ donc2)-

8.7 a) Non (échantillon volontaire, non probabiliste) c) Non (échantillonnage par grappes)
b) Oui d) Non (échantillonnage stratifié)
8.8 a) 2,73 b) 11,34 c) 34,17 d) 20,48 e) 0,10 f) 0,90
8.9 a) 0,700 b) 0,687 c) 1,812 d) -2,228 e) 0,10 f) 0,995
8.10 a) 1,63 c) 0,241 e) 3,30 g) 0,99
b) 2,85 d) 0,490 f) 0,397 h) 0,975, car 39,37 = F0025.82.

1 1
8.11 X ~ FU,v P(X>F]_0'U'V) = P y < p— ---------------------------------------- l-a
\ l-a ,u .v y F.l - a , u . V

8.12 a) 510 et 7

b) 510e t^ = .,4
24
c) 0 et J ------- = 1,044
V2 4 -2
d) 24 et V2-24 = 6,928
4 9 4 RÉPONSES AUX EXERCICES

«2(
8.13 a) W(21,3<t 2) e) o,— +
l 10 20 J
b) N (7, CT2/10) f) W ~ ^19^ E(W) = 0, V ( W ) = 1 9 /1 1

c) N (- 10 ; 0,85<t 2) 9) T ~ z l => E(T) = 9, V (r) = 18


d) W , 1) h) f 9 19

8.14 a) 0,691 C) />(|X--1 0 1< 25) = P ( - 8 < r15<8)«1


.. J1 5 5 2 15 *2,28
a) p ----- > ---------- = 0,90
b) 0,977
4 4 J

Chapitre 9
Remarque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
— o2 — o2 — —
9.1 Les deux estimateurs sont sans biais, mais comme = — , on préfère X. à X,.
2n n
9.2 a) Les deux estimateurs sont sans biais pour b) Puisque V(/i, ) < V{fa), fa est meilleur que fa.

O2 *
9.3 E
Q
M(9!) = 10 ; E Q M ( 9 2) = 4 + —. Si < 2 4 , est préféré à 0,.
4
9.4 E
Q
M{0.) = 12; EQM(92) = \0\ 6. 03 est le meilleur.

2x 10£(5,2) + 8E(S2) + 6E(S2) _ 10<x2+ 8<J2+6<J2 = 2


9.5 E(S‘)
24 24

9.6 a) E(X) = aE(Xl) + (\-a)E(X2) = ap + ( l- a ) p = p b) a
nx+ n2

9.7 **) ^MV ~ % b) MM= X

n 1 1
9.8 a) X MV r* b) MM
X
Y.*,
i=i
A ___ X2
9.9 AMM * ^MM
y -
- X 2
- 2 > ,2- * 2
L ""

9.10 a) Pxy = 1/X W = l/X


PMM~ ^
9.12 a) pm = X/n, où X est la moyenne de l’échantillon de taille N. b) pMM= X/n
r \
n
9.13 1 n
YlnX,
V /«I J
9.14 Parce que l’estimation change avec chaque échantillon. Il faut savoir à quel point on peut avoir confiance que
cette estimation est proche de la vraie valeur du paramètre.
RÉPONSES AUX EXERCICES

915 a) z0
02S *-7= < 0,25 => n > 13
yjn
b) Non. Quatre fois plus grand, car la marge d’erreur est proportionnelle à l/Jn.
c) Plus petit, car z005 = 1,645 et z0025 = 1,96-

9.16 a) Vrai
b) Faux. Le calcul de cette probabilité (ou d’un tel intervalle) nécessite la valeur de H-
c) Faux. C’est un intervalle de confiance, pas de tolérance.
d) Faux. C’est un intervalle de confiance sur la moyenne théorique.
e) Vrai
f) Faux. Cette probabilité est de 100%, c’est même le point milieu !
g) Vrai
h) Vrai
9.17 a) Le nombre moyen de mots dans une page de droite d’un livre de cette bibliothèque.
b) Non. Chacun a une valeur de x qui peut varier.
c) Non. Chacun a une valeur de s qui peut varier.
d) Oui. Le niveau de confiance est de 0,95 chaque fois.
e) Environ 0,95 x 120 = 114 étudiants
f ) Environ 0,025 x 120 = 3 étudiants
66,41
9.18 Moyenne : 2 19,8 ± 025;14 VI5 , soit [183,0; 256,6].

Variance : 14(66,41)2 14(66,41) , soit [2364,10 967]


X 0.025; 14 X0,975;14
«

9.19 a) X ±1,96 c) L’intervalle symétrique est le plus court.

X + 2,33

X —c X _ S
9.20 a) N(0,1) b) X± — ou X ± zan - 7=
In
0,01
9.21 a) 74,036 ±1,96 [74,031; 74,041]
VÏ5
b) Non. Le quantile t est légèrement plus élevé que le quantité z, mais la valeur de s peut être inférieure
à celle de <7.

9.22 a) 1014 —1 , 9 6 • < ^ < 1014 + 1,96- 25 1003,04 <n< 1024,96


V20 V2Ô
b) za i l 0,7155 =>1 - a = 0,526 c) n>91
9.23 a) 3232,11 < u <3267,89
b) Oui. zan augmente quand a diminue, donc quand 1- a augmente.
c) n > 18
d) Non, car le niveau de confiance est le même.
9.24 a) fie [2239,36; 2276,14]c) [2181,93; 2333,57]
b ) f i e [2240,11 ; 2275,39] d) [2126,18;2389,32]
9.25 /i,-^ e (2 4 -1 8 )± 2 ,5 7 5 V Ô 9 ,so it [3,557;8,443].
4 9 6 RÉPONSES AUX EXERCICES

9.26 a) e (89,6-92,5)± 1,96^0,16, soit [-3,68;-2,12].


Puisque 0 n’appartient pas à l’intervalle de confiance à 95 %, la différence des moyennes est significative
statistiquement avec a = 0,05.
9.27 a) }ix—fa e [0,072 ; 0,308]
b) /*, - Aî g [0,050 ; 0,330]
c) 0 n’appartient à aucun des deux intervalles de confiance calculés, donc la différence entre les moyennes
semble significative lorsque a = 0,05 ou 0,10.

9.28 Marge d’erreur = minimale quand n = 15.

9.29 /t, - jtij e [-0,679 ; 0,839]


7,30
9.30 a) fiD e 3,28ir0025 .9 , soit [-8,50; 1,94].
VIÔ
b) Il n’y a pas d’indication qu’un système est meilleur que l’autre, puisque 0 fait partie de l’intervalle
9.31 fiD6 [-210,1; 1946,9]
9.32 • Échantillons indépendants
• Distribution normale de la variable X dans chaque population
• Variances inconnues mais considérées égales

1 <7 0,30 0,30


9.33 a) i) e , soit [0,379; 2,142].
<7 0u»34F
-^M),05;14,17’ 0 34 F
^0,95;14.17
<7
ii) ■— e [0,321 ; 2,559]. L’intervalle est plus long que celui en i), car le niveau de confiance est plus élevé.
<7
b) Puisque les deux intervalles contiennent la valeur 1, on peut conclure que les variances ne diffèrent pas
significativement.
c) - Ma s (8,73-8,68)±fa 0,5674^(1/15) +(1/18), soit [-0,355; 0,455].

9.34 100(12,6) <<J2 < l °?(l ^ 6i 2-, soit [127,68; 203,72].


Xo.os-, 100 Xo.95;100
9.35 a) Le niveau de confiance 1- a = 0,95 = 19/20
b) C’est la taille d’échantillon qui garantit une marge d’erreur <4% pour un intervalle à 95 %, la plus
1
grande marge étant atteinte lorsque p = 1/2:1,96 0,04 n >601
An

9.36 a) 0,12± 1,96J °’-1-■-°-8-8-, donc 0,088 p,152.


< 0
V 400
b) Puisque 100/400 est plus près de 1/2 que 48/400, la marge d’erreur serait plus grande.

c) za/2 \ ~ ” -1»96.1-7- = 0,03, alors n > 1068.


Y n V An

9.37 a) p e [0,000 89; 0,003 61]


b) Non. On aurait obtenu la même marge d’erreur.
c) Non, car certaines valeurs supérieures à 3/1000 sont incluses dans l’intervalle de confiance (avec a = 0,01).
9.38 a) n> 16590
b) Non. Il faudrait un échantillon 4 fois plus grand, car la marge d’erreur est proportionnelle à .
c) Plus petit, car z0.oo5 > *0,025.
RÉPONSES AUX EXERCICES 4 9 7

9.39 a) px—p2e [0,028; 0,068]


b) Puisque 0n’est pas inclus dans l’intervalle de confiance pour /?, - p2, il semble que la différence de pro­
portion soit significative (lorsque a = 0,01).
9.40 p, - p2 e [-0,024; 0,002]

Chapitre 10
Remarque: Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.

10.1 a) H , : < 160


b) N( 160, 9/4)
sous H,

x
157,53 160
c) Puisque x X 157,53 (ou -1,33 X -1,645), on ne rejette pas H0. La résistance moyenne n’est pas significa­
tivement inférieure à 160 au seuil de 5 %.
d)
7/(156, 9/4) N( 160, 9/4)
sous H sous H0

152 156 157,53 160 164


e) P(X > 157,531p = 156) vaut environ 15 %.
10.2 a) H0: ju = 90, Ht : /i < 90, 0,05 X 1,645.
z0= 0,46 -z
On ne rejette pas H0. Il n’y a pas de raison de croire que le rendement moyen est inférieur à 90 %
X -90 \
b) P <-1,645 /x = 87 0(1,355) = 0,912
VsTs
» o, X-87 , _ 3 \
c) P | —/=-=■<-1,645 + 0,95 nmin. 7
Js/n y[5Jn /
10.3 a) H0:p = 0,255,H , 0,255
b) Puisque la valeur P est supérieure au seuil de 1%, on ne rejette pas H0. Le diamètre moyen des boulons
ne diffère pas significativement de 0,255 cm.
c) |z0 | = 2,20
d) 3c = 0,2557
10.4 a) Erreur de deuxième espèce c) Pas d’erreur
b) Pas d’erreur d) Erreur de première espèce
10.5 a) H0: p = 125, H, ; p > 125, t0 = 1,37 X f005;7 = 1,895. On ne rejette donc pas H0.
b) T0 ~ f7, valeur P = P(T0 > 1,37) = 0,10
c) a inchangée (fixée arbitrairement) ; P diminuée.
d) Inférieure
a) H0:/i = 8, H, :// >8. P u i s q u e t 0 = 1 , 4 7 y = 1 , 8 1 , o n n e r e je t t e p a s H 0 .

b) i) Non. P diminuesi n a u g m e n t e . i i i ) S i y = 1 0 . f l d i m i n u e lo r s q u e / / , a i

ii) Oui. p augmente s i a d i m i n u e .

10.7 a) H0:/i-7,5, H , : p < 7 , 5 c ) P u i s q u e t 0 = - 1 , 1 1 , o n n e r e je t t e p a s H g .

b) Onrejette H g si t 0 < - 1 , 8 9 5 . d ) n = 6

10.8 a) Onrejette H g s i u g < 3 , 8 2 o u s i u g > 2 1 , 9 2 . P u i s q u e u 0 = 2 , 2 8 , o n r e je t t e H g .

b) U - X u ■ 1- P = P ( U > 1 0 , 9 6 ) + P ( U < 1 , 9 1 ) = 0 , 4 5

10.9 a) Graphique VIm : A = 3 / 4 e t P = 0 , 1 0 , a l o r s n » 5 5 .

b) Valeur P = P ( U Q < 4 ,1 6 ) = 0 ,1 0 , o ù U 0 ~ x l - O *1 n e r e je tte p a s H 0, la s o c i é t é n e c h a n g e r a p a s d e p r o

1 0 .1 0 a ) H 0 : 0,22, H , : g 2 ï 0 , 2 2. R e j e t d e H 0 s i u 0 > 2 0 , 2 8 o u s i u 0 < 0 , 9 9 . P u i s q u e u 0 = 4 3 ,


G 1=

la variance est significativement supérieure à 0 ,2 2.


b) [0,086; 1,768]. Cet intervalle ne comprend pas la valeur 0,04, donc on conclut la même chose qu'en a).
c) Soit U ~ Xisous Hj, alors l - p = P (U > 5,07) + P ( U <0,247) = 0,6515.
(La table III indique que 1—/3 e [0,50; 0,905].)
10.11 a) H0: p —0,10, H, : p >0,10. On rejette H0 si z0 > 1,645. Puisque z0 —1,33, on ne peut pa
proportion de propriétaires non assurés dépasse 10%.

0 ,1 0 0 ,1 2 4 7

10.12 a) H0 : p —0 ,0 2 5 , H, : p <0,025. O n r e je tte H0 si z0 < —2,33. P u isq u e z0 = —6,67, la p r o p o r tio n d e c a lc u la tr ic e s


défectueuses est significativement inférieure à 2,5 %.
b) Valeur P = P (Z 0 < -6,67) « O
c) Oui, la valeur P serait plus élevée.
10.13 a) Environ 10 % x 50 = 5 équipes b ) i)
10.14 a) Faux, or est fixé arbitrairement.
b) Faux. La valeur P ne dépend pas de oc.
c) Vrai
d) Faux. La covariance est non nulle en général, car les données d 9une même paire sont dépendantes.
e) Faux. On ne confirme jamais quyune hypothèse est vraie ou fausse à partir d 9un échantillon.

s.
r----^ -

RÉPONSES AUX EXERCICES 499


0

b) H0• >Hj • A^2# On H0 si (Zq(^ 1*96# Puisque l^ol **1>35<


i les moyennes ne diffèrent pâs
significativement.
c) 1-/3 = P(Z > 0,610) + P(Z < -3,306) = 0,272

x,i —
10.16 On rejette H si z0 >*«•
a i + 4g
n n.

10.17 H0: ju, = , H, : fj.x * fi2. Puisque |/01= | -0,021X f0025;26 = 2,06, on ne rejette pas H0 au seuil de 5 %.

10.18 a) H0: /z, = , H, : jix * /x2.Puisque |/0| = 0,138 X t002s;i8 = 2,10, on ne rejette pas H0
b) Valeur P = 2 x P(T0 > 0,138) = 0,89. (La table IV indique que la valeur P e [0,80; 1].) La valeur P serait
plus petite si la différence entre les moyennes était plus importante. Si le test était unilatéral à droite, la
valeur P serait P(T0 > 0,138) = 0,45.
c) Non
10.19 a) H0: ^ - MNouv= 0, H, : ^ - /iNouv > 0. Puisque t0 = 1,56 X Vos;20 = 1.725, on ne rejette pas H0 au seuil
de 5 %. La direction ne devrait pas acheter la nouvelle développeuse.
b) H0 ne sera pas rejetée, car xAnc —xNouv n’est même pas de 2 minutes.
10.20 a) H 0:fj.l =/j2,H, : fixj>J^. Puisque t0 = 8,49 > Vomo = 2,76, on rejette H0. L
cédé 1 est significativement supérieur.
b) On utilise sp = 0,799 pour estimer G,d = 3,13, n, =n2 =6, et a = 0,01. Alors, 1— » 1.
c) n = 5

10.21 a) H0: Mi = AV, H, : /i, > /V- Puisque t0 = 0,86 X Vio;i2 = 1,356, on ne rejette pas H0. Le filtre n’a pas réduit le
pourcentage d’impuretés de façon significative.
b) Valeur P = P(T0 > 0,86) = 0,203

10.22 a) H0; o \ = o\, H, : o\ * a\. Puisque / 0 = 2,768 > F0i025;2*.yo ~ 2,14, on rejette H0. Les variances sont consi­
dérées comme étant différentes.
b) H0: /t, = fjiz, H, : /x, * /V- Puisque |/0| = 4,187 > fao25;39 = 2,02, les moyennes sont significativement diffé­
rentes.
10.23 a) H0: }iD= 0, H, : fiD* 0. Données appariées. Puisque 1101= 1,906 X Vo2s;6 = 2,447, on ne rejette pas H0.
b) T0 ~ t6 sous H0, alors valeur P = 2 x P(T0 > 1,906) = 0,105.
10.24 H0: fiD= -1 , H, ; fiD< -1. Puisque t0 = ~ “3,464 < - t 005;5 = -2,015, on rejette H0.

10.25 a) H0: fXD= 0, H, : fiD> 0. Puisque t0 = 2,39 > t0lO;l0 = 1,37, on rejette H0.
b) H0: A*i = AV H, : /t, > /v Variances inégales. Puisque tQ= 2,52 > r010;II = 1,36, on rejette H0.

1 1
10.26 a) On rejette H0 si | pH + JO,139(1-
- pF| > 1,96 0,0157.
0,139)
5000 3000
500 RÉPONSES AUX EXERCICES

b) H0: pH = pv, H o: P ^ Pt=-Puisque |z0| = 6,008 > z0025 = 1,96, on rejette H0.
h

10.27 a) H0: px= p2, H0: px< p2. Puisque z0 =— 2


duit pas un pourcentage de défauts significativement plus élevé.
b) ocest fixée arbitrairement et n’est pas affectée par n.augmente lorsque n dim
égales par ailleurs).
10.28 H0: px= p2, H, : pxp^ 2. Puisque |z0| = 1,55 X z0025 = 1,96, on ne rejette pas H0. Les deux machin
duisent pas des proportions de défauts significativement différentes.
10.29 a) Test sur deux moyennes de lois normales, échantillons indépendants (f42)
----- m ----------— ^ — --------- ----- — ------------ -------------- J ------------------------ ------ — — ------------------- ---------- ---------------------------- ------ 7 ------------------------------------ — -- -------- ---------------------- — ---------------- ------- ------------ ------- -

b) Test sur deux moyennes de lois normales, échantillons appariés (ru)


c) Test sur une moyenne de loi normale ( )
d) Test sur deux moyennes de lois normales, échantillons appariés (f29)
e) Test sur deux moyennes de lois normales, échantillons indépendants (rl98)
10.30

c) On rejette H0 si uQ> 11,07.


d) On ne rejette pas H0, car u0= 1,74. La loi normale pourrait être un bon modèle.
10.31 a) E. = 1000p o u r /= 1, ..., 10
b) On ne rejette pas H0, car uQ= 4,724 y Xoos-9= 16,92. Le générateur semble fonc
10.32 a) „ \ 2

Nombre de Nombre de tranches Fréquences espérées


défauts i ayant i défauts (0.) (Ê) E
34,15 0,001
2 34
1 8 25 j 25,76 0,022
b) Oui. On regroupe les deux premières classes et les deux dernières classes.
c) On ne rejette pas H0, car u0 = 0,92 y ^o.to.9 = 14,68. La loi de Poisson pourrait être un bon modèle.
10.33 a) H : Le nombre de pannes est indépendant de l’équipe ;
H, : Le nombre de pannes n’est pas indépendant de l’équipe.
b) On rejette H„ si u0> ^ 0,.6 = 16,81.
c) 6
d) On ne rejette pas H0.
10.34 a)
Position de Type de panne
montage A B C D
1 18,43 44,66 17,01 14,89
0,69 0,04 0,06 2,33
2 7,57 18,34 6,99 6,11
1,68 0,098 0,14 5,67

b) u0 =10,708
c) Valeur P = 0,013. On rejette H0 au seuil de 5 %.

10.35 On rejette l’indépendance, car uQ= 34,91 > xl.os-i - 5,99.


RÉPONSES AUX EXERCICES 501

10.36 État
Politique Désuet Normal Moderne Total
Agressive 24 52 58 134
17,0 62,3 54,7
i 2,87 1,70 0,20
Neutre 15 73 86 174
22,1 80.9 71,0
2,28 0,77 3,16
Non
17 80 36 133
agressive
16,9 61,8 54,3
0,00 5,34 6,16
Total | 56 205 180 1 441

On rejette l’indépendance, car /i0 = 22,48 > Xo.ou* = 13,28. Valeur P = 0,00016

10.37 a) Pièces non défectueuses Pièces défectueuses


Machine 1 468 32
Machine 2 479 21

b) L’homogénéité de la distribution des pièces selon les deux machines.


On rejette H0 si uQ> xloy i = 3,841. Puisque uQ= 2,4108, on ne rejette pas l’hypothèse d’homogénéité.
c) Oui. La valeur observée uQest le carré de la statistique observée z0de l’exercice 10.28.

Chapitre 11
Rem arque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
11.1 a) Moyennes possiblement différentes (il faut le test F pour valider) ; distributions symétriques, donc loi
normale plausible ; variances potentiellement inégales.
b) vi)
c) Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés
Vitesse de coupe 80,17 3 26,72 3,17
Erreur 168,33 20 8,42
Total 248,50 23
d) Valeur P = 0,047, où F ~ F32Q(table V : [0,025 ; 0,05]).
e) Thkey = 4,69, PPDS = 3,49, BON = 4,90
Les méthodes de Tùkey et Bonferroni ne détectent aucune paire de différences significatives. La méthode
de Fisher PPDS donne les groupes ci-dessous.
yy ya- ÿv.

„2 . „2 , 2
^3
11.2 a) MS 0,51
3
500 RÉPONSES AUX EXERCICES

b) H0: pH= pF, H0: pH* pF. Puisque|z0| = 6,008 > z0025=1,96, on rejette H0.
10.27 a) H0: p, = p2, H0: p, < p2. Puisque z0= -2,023 X z001= — 2,2326, on ne rejette pas H0. La chaîne 2 ne pro­
duit pas un pourcentage de défauts significativement plus élevé.
b) a. est fixée arbitrairement et n’est pas affectée par n. (3augmente lorsque n diminue (toutes choses étant
égales par ailleurs).
10.28 H0: p, = p2, H, : p, ^ p2. Puisque |z0| = 1,55 X z0025 = 1,96, on ne rejette pas H0. Les deux machines ne pro­
duisent pas des proportions de défauts significativement différentes.
10.29 a) Test sur deux moyennes de lois normales, échantillons indépendants (r42)
b) Test sur deux moyennes de lois normales, échantillons appariés (f,,)
c) Test sur une moyenne de loi normale (f9)
d) Test sur deux moyennes de lois normales, échantillons appariés (t29)
e) Test sur deux moyennes de lois normales, échantillons indépendants (tm)
10.30 a) Nombre d’unités Nombre Probabilité 1 Fréquences 1
défectueuses d’observations théorique pmiprpps 1 ' 1 1'
/V p, Ê,
par jour 1| O 1
1
1 Pi ' È
,=
n

31-35 19 0,149 17,42 0,143


36-40 1 n 1 0,079 1 9,26 1 0,327
b) 5 degrés de liberté
c) On rejette H0si u0> 11,07.
d) On ne rejette pas H0, car uQ= 1,74. La loi normale pourrait être un bon modèle.
10.31 a) Et = 1000 pour i = 1, ..., 10
b) On ne rejette pas H0, car uQ= 4,724 y Xoos-9 = 16,92. Le générateur semble fonctionner correctement.
10.32 a) 2
Nombre de Nombre de tranches Fréquences espérées 1[O, - Ê,)
A

défauts i ayant i défauts (O.) (Ê() 1 E,


2 34 1 34.15 ' '1 0,001 1
8 25 1 25,76 ■
0,022
. .. j

b) Oui. On regroupe les deux premières classes et les deux dernières classes.
c) On ne rejette pas H0, car «0 = 0,92 X Xo.m9 = 14,68. La loi de Poisson pourrait être un bon modèle.
10.33 a) H0: Le nombre de pannes est indépendant de l’équipe ;
H, : Le nombre de pannes n’est pas indépendant de l’équipe.
b) On rejette H0si u0> *0201;6= 16,81.
c) 6
d) On ne rejette pas H0.
10.34 a)
Position de Type de panne
montage A B C D
1 18,43 44,66 17,01 14,89
0,69 0,04 0,06 2,33
2 7,57 18,34 6,99 6,11
1,68 0,098 0,14 5,67
b) u0 =10,708
c) Valeur P = 0,013. On rejette H0au seuil de 5%.
10.35 On rejette l’indépendance, car u0 = 34,91 > ~ 5,99.
RÉPONSES AUX EXERCICES 501

10.36 1 État
Politique j Désuet Normal Moderne Total
Agressive 24 52 58 134
17,0 62,3 54,7
2,87 1,70 0,20
Neutre 15 73 86 I 174
22,1 80,9 71,0
2,28 0,77 3,16
Non 17 80 36 133
agressive
16,9 61,8 54,3
0,00 5,34 6,16
Total | 56 205 180 1 441

On rejette l’indépendance, car /d0


= 22,48 > = 13,28. Valeur = 0,00016
10.37 a) Pièces non défectueuses Pièces défectueuses
Machine 1 468 32
Machine 2 479 21
b) L’homogénéité de la distribution des pièces selon les deux machines.
On rejette H0si w0> xlos\ = 3,841. Puisque uQ= 2,4108, on ne rejette pas l’hypothèse d’homogénéité.
c) Oui. La valeur observée w0est le carré de la statistique observée z0de l’exercice 10.28.

Chapitre 11
Remarque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
11.1 a) Moyennes possiblement différentes (il faut le test F pour valider) ; distributions symétriques, donc loi
normale plausible ; variances potentiellement inégales.
b) vi)
Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés fo
Vitesse de coupe 80,17 3 26,72 3,17
Erreur 168,33 20 8,42
Total 248,50 23
d) Valeur P = 0,047, où F ~ F3M(table V: [0,025 ; 0,05]).
e) Tükey = 4,69, PPDS = 3,49, BON = 4,90
Les méthodes de Tukey et Bonferroni ne détectent aucune paire de différences significatives. La méthode
de Fisher PPDS donne les groupes ci-dessous.
yy ya- ÿ\-
I I I I
I I I I I------- 1---------1----- *-
34 35 36 37 38 39 40

2 , 2 . 2
+ $2 + 5,
11.2 a) 0,51
3
RÉPONSES AUX EXERCICES

b) f, = 3,32 - 3,89 = -0,57


c) ii), v), vi) et vii)
Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés /«
Débit 3,65 2 1,82 3,58
Erreur 7,63 15 0,51
Total 11,28 17
Puisque/ 0> F010. 251= 2,70, l’uniformité varie significativement entre certains débits de C2F6.
e) Histogramme en cloche symétrique : normalité plausible. Boîtes de longueurs similaires : variances théo­
riques potentiellement égales.
f) Si les moyennes des traitements sont différentes, les courbes normales sont décalées et ne peuvent être
étudiées à l’aide d’un seul histogramme des observations.
11.3 Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés /o
Technique
de mélange 489 740 3 163 247 12,73
Erreur 153 908 12 12
«>-•. 826
»r-,.*
Total 643 648 15
b) , Puisque f 0= 12,73 > F001.3l2 = 5,95, on rejette l’égalité des moyennes.
c) Histogramme en cloche symétrique : normalité plausible. La technique 4 semble donner lieu à une plus
petite dispersion, mais le nombre d’observations est trop petit pour conclure à l’inégalité des variances.
11.4 a) fi = 21,691, f, = 0,023, î 2 = -0,166, f 3= 0,029,î4 = 0,059, ô 2 = MSE= 0,018
b) Puisque f 0 = 2,62 > F005;3lg = 3,16, les différences observées ne sont pas statistiquement significatives
au seuil de 5 %.
11.5 Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés /o
Type de
revêtement 1060,50 4 265,13 16,35
Erreur 243,25 15 16,22
Total 1303,75 19
Puisque f 0> Foos.41S= 3,06, le type de revêtement a un effet très significatif sur la conductivité,
b) PPDS = 6,07, BON = 9,36, TVikey = 8,80 (mêmes conclusions avec les trois méthodes)

y\- >2-

c) Le revêtement 4 présente la plus petite conductivité observée, mais il ne diffère pas significativement
du revêtement 3 au seuil de 5 %.
11.6 Source de Somme Degrés de Moyenne
variation | des carrés liberté des carrés fo
Type de circuit 260,94 2 130,47 4,01
Erreur 390,79 12 32,57
1Total | 651,73 14
RÉPONSES AUX EXERCICES

Puisque f = 4,01 > F{0,0};2,12 3,89, on rejette H. de justesse au seuil de 5 %.


b) PPDS = 7,87, BON = 10,03, Tbkey = 9,62. La seule différence significative se situe entre les traite­
ments 2 et 3.
c) L’histogramme est unimodal mais un peu asymétrique vers la droite. Les variances sont potentiellement
différentes. On pourrait envisager une transformation de la variable Y
11.7 a) F(MS£) = 25
x ^ 5(25 + 25 + 25 + 25) ^
b) E(MStraitements ) = 25 + —------------------ - = 191,67
3
c) E(F0) = 16/14 = 1,14

11.8 a) Plan d’expériences en blocs aléatoires complets


b) Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés /o
Type de gicleur 0,102 4 0,0255 8,92
Vitesse (blocs) 0,063 5 0,0126
Erreur 0,057 20 0,002 86
Total 0,222 29
Puisque f 0= 8,92 > F010 420= 2,25, l’effet du type de gicleur est significatif au seuil de 10%.
c) Graphique quantile-quantile ou histogramme des résidus pour valider la normalité. Graphique des rési­
dus en fonction des valeurs prédites pour vérifier l’homogénéité des variances.

11.9 a) Puisque f 0 = 2,38 > F001312 = 5,95, les différences entre les produits ne sont pas significatives.
b) i) Plus grande ii) Inchangée iii) Plus petite iv) Plus grande
11.10 a) Faux. On veut comparer les moyennes en isolant les sources de variabilité.
b) Vrai
c) Vrai
dî Faux. On doit interpréter les tests sur les facteurs simples lorsque l’interaction n’est pas significative
e) Faux. MS
11.11 a) ii)etv) b) ii)
11.12 a) dl(vitesse) = 2, dl(profondeur) = 2, dl(interaction) = 4 et dl(erreur) = 18, où dl signifie « degrés de liberté ».
b) Source de Somme Degrés de Moyenne
variation des carrés | liberté des carrés | /o Valeur
Vitesse (A) 0,03178 2 1 0,015 89 15,94 0,000
Profondeur (B) 0,02719 2 0,01359 13,64 1 0,000
Interaction (AB) 0,00069 4 0,00017 0,17 ! 0,950
Erreur 0,017 94 0,000997
18
Total 0,077 59 1 26 1 1
c) Puisque 0,17 < F0,05 ; 4,18 2,93, l’interaction n’est pas significative. Puisque 15,94 et 13,64 sont supérieurs
à F0,05; 2.18 3,55, la vitesse et la profondeur de coupe ont un effet significatif sur l’usure.

11.13 a) Source de Somme Degrés de Moyenne


variation des carrés liberté des carrés Valeur P
Verre 14 450,0 14 450,0 273,67 0,000
Luminophore 933,3 466.7 8,84 0,004
Interaction 133.3 66.7 1.26 0,318
Erreur 633.3 52.8
Total 16150,0
*■. f
504 RÉPONSES AUX EXERCICES

b) Puisque 1,26 < F0M:212 = 3,89 (valeur P > 0,05), l’interaction n’est pas significative.
Puisque 273,67 > F00J;, 12= 4,75, et que 8,84 > F00J;2 |2 = 3,89 (valeurs P < 0,05), le type de verre et de
luminophore a un effet significatif sur la luminosité du tube cathodique.
C) 20

15

10

(A 5
3
T3
• «H

'O
05 0

-5

-10

-1 5
210 230 250 270 290 310 -1 5 -1 0 -5 0 5 10 15 20
Valeurs prédites Résidus
L’hypothèse d’une variance constante est respectée (sauf une exception), et l’hypothèse de la normalité
des erreurs est plausible, malgré une légère asymétrie dénotée par la forme arquée des points du dia­
gramme quantile-quantile.
11.14 a) Plan à deux facteurs avec interaction
Y = rendement de maïs, facteurs = densité et variété, dl(erreur) = 18, où dl signifie «degrés de liberté».
b) Plan à blocs aléatoires complets
Y = pression artérielle, facteur = dose, bloc = patient, dl (erreur) = 27, où dl signifie «degrés de liberté».
c) Plan à un facteur
Y = degré d’éthanol, facteur = appareil, dl(erreur) = 21, où dl signifie «degrés de liberté».
11.15 a) dl(erreur) = 8(n —1) = 8 • 1 = 8 et dl(total) = 8n —1= 8 • 2 —1= 15, où dl signifie «degrés de liberté».
Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés fo , Valeur P
A 0,202 50 1 0,20250 64,80 0,0000
B 0,105 62 1 0,10562 33,80 0,0004
C 0,81000 1 0,81000 259,20 0,0000
AB 1,05063 1 1,05063 336,20 0,0000
AC 0,00000 1 0,00000 0,0000 1,0000
BC 0,330 62 1 0,330 62 105,80 0,0000
ABC 0,01563 1 0,01563 5,00 0,0558
Erreur 0,025 00 8 0,00313
Total 2,54000 15
Puisque F00J., g= 5,32 (ou si on considère les valeurs F), on peut conclure que l’interaction entre A et C
n’est pas significative et que celle entre les trois facteurs non plus. Puisque les interactions doubles AB et
BC sont significatives, il faudrait idéalement fixer le niveau d’un facteur pour étudier l’effet de l’autre.
RÉPONSES AUX EXERCICES

C h a p itre 12
Remarque: Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
12.1 a) y= 21,79-0,007 03*
b) MS 5,73
5,73
c) /3, ± f0i025 26 [-0,0096; -0,0044]
3 604 739
d) Puisque 0 n’est pas dans l’intervalle, la pente diffère de 0 de façon significative
t 1 (1800-2109)
©) 9,14 ± ta025.26J 5,7 3 1H----H--- [4,07; 14,21]
28 3 604 739
12.2 a) y=31,65 —0,041jc
b) Puisque/ = 57,4, on rejette H0: /3, = 0 au seuil de 5 %. Le modèle de régression est donc significatif.
Valeur 0.
224,43
C) R 81,5%
275,21

d) 20,38±f00513 13,91
1 (275-321,66) : 19,37 <E(Y 1275) <21,39
15 133 668,3
, 1 (275-321,66)
e) 20,38 ± r0>05; 13 3,91 1+ — + — : 16,74 < K <24,02
15 133 668,3
12.3 a) Puisque la valeur P = P(F > 72,56) ~ 0 (où F ~ Fx22), la pente de la droite de régression est significative­
ment différente de 0.
636,15
b) R 76,7 %
829,05
c) Intervalle de confiance à 99 % : 6,07 < (30< 20,57. L’ordonnée à l’origine
à zéro au seuil de 1 %.
12.4 a) 93,34 : ordonnée à l’origine de la droite ; la valeur de la résistance du papier dont la pâte ne contien­
drait aucun bois dur. (Attention : Cette interprétation est extrapolée à l’extérieur du domaine des
observations.)
15,65 : pente de la droite ; l’augmentation moyenne de la résistance du papier pour chaque hausse de 1%
de bois dur dans la pâte.
b) Source de Somme Degrés Moyenne
variation des carrés de liberté des carrés /o Valeur P
Régression 1755,77 1
-* *
1755,77 12,97 0,0029
Erreur 1895,04 14 135,36
Total 3650,81 15
Le modèle de régression est significatif.
1 , (2,7 —2,325)
c) 135,59 ±f0005;14 1135,36 1 H---------r : 99,56 < L < 171,62
16 7,17
d) L’intervalle sera plus long, car 3,1 % est plus éloigné de la moyenne x que l’était 2,7. La valeur prédite
sera plus grande, car la pente est positive.
e) L’histogramme sert à vérifier la normalité des observations (ici, une cloche unimodale mais un peu
asymétrique). Les résidus en fonction des valeurs prédites servent à vérifier l’homogénéité de la variance
(ici, une variabilité un peu plus importante au centre).
506 RÉPONSES AUX EXERCICES

12.5 a) y = -6,34 + 9,21*

9,208-10
b) | 0 23,441. On rejette H0: /3, = 10.
3,77
3309
c) Oui
d) Non. Une forte corrélation n’implique pas nécessairement une relation causale.
e) e, = 185,79-187,04 =-1,25; e2 = 214,47 - 214,67 = -0,20
12.6 a) Puisque f 0 > F005;118 = 4,41, on rejette H0: /?, = 0. Le modèle de régression est significatif.
b) y. =77,86 + 11,80*1,02 = 89,90
148,364
c) R 38,9% de variabilité expliquée par le pourcentage d’hydrocarbures
381,194
d) VMS 3,60

12.7 a) f t= 0 ,00169 augmentation attendue de 1,69 marin en moyenne


b) y = 3,9645 + 0,00169-5000 = 12,41 marins
c) Avec un tonnage moyen de 7500 tonnes, puisqu’il est plus proche de x.

d) Niveau de confiance de 95 %, car l’intervalle sera plus court.


e) La précision est meilleure si on prédit le niveau d’effectifs moyen pour toutes les années ayant * = 6000
en moyenne.
12.8 a) Valeur positive assez élevée ; environ 0,8 ou 0,9.
. W 9 L M 8 _ 0,903
9,74
c) | r0 | = 18,921. La corrélation est significativement positive.
d) z0 = 3,88. La corrélation est significativement supérieure à 0,5.
e) [0,767, 0,961]
6422,2
12.9 a) r 0,773 c) z0 = 1,61. On ne rejette pas H0: p = 0,6
y/15 312,3-4502,2
b) t0 = 5,87, la corrélation est significativement positive. d) [0,550, 0,893]
12.10 a) Vrai d) Faux. Quand n augmente, r se rapproche de p.
b) Vrai e) Faux. | r |> /?2
c) Vrai
12.11 a) r = 0,99, A = 1,00, Â>=1,1 c) r = 0,12, Â = 0,04, Âo=47>0
b) r = —0,97, Ai 1,00, Âo =203,3 d) r = 0,92, Â =9,63, L = 104,2
12.12 a) Oui b) Non c) Oui
A A /V A

12.13 a) r augmente, A augmente, Ao diminue. A augmente, A


/N A A A

b) r similaire (» 0), A similaire (= 0), Ao augmente. A diminue, Ao :

C h a p i t r e 13
Remarque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
13.1 a) Vrai b) Faux c) Faux d) Vrai e) Faux f) Faux
13.2 a) y = -20,897 + 0,01 IX. + 27,370X2 - 0,069X3- 0,257X4 + 0,017X,
b) f 0 = 28,15 > F00l;514 = 4,69. Au moins une des variables est significative.
RÉPONSES AUX EXERCICES 507

c) Les postulats de normalité et d’homogénéité de la variance sont bien respectés.


X
D 1,5-
C
C 1,0-
O
3C 0,5-
C3
(J 0,0
'<U
7<3u -0,5-
c -1,0-
=3
a
2 1 o î 2
Quantités théoriques d’une loi normale
d) Le R2(0,9095) et le /?* (0,8772) du modèle complet sont supérieurs à ceux du modèle avec X, et X
(R 0,7805, R* =0,7547).
e) Modèle complet: [13,98; 40,76]. Modèle avec X, et [17,49; 52,29]
f ) Modèle complet : 5,20 ± 0,94. Modèle avec X, et X, : 4,63 ± 0,85
13.3 a) v 7,2919 + 0,0008X, + 0,0036X, + 0,1222X, + 0,0319X. + 0,000 0IX, + 0,0016X* + 0,1544X,
0,0039X8—0,0018X,
b) / 0 = 8,85 > F0.0 5 ;9 .1 8 2,46, le modèle est significatif. Seulement X2est significatif lorsque toutes les
variables sont prises en compte.
c) y == -1,8084+
- 0,0036X2+0,1940X7-0,0048X
d) Intervalle de confiance pour /37: [0,012; 0,376]
e) En retirant X8du modèle : [0,272; 0,588]. L’effet de X7est moins fort quand Xgest déjà dans le modèle,
car ces variables sont corrélées.
13.4 a) X, est la plus corrélée avec Y (r = -0,9). ô 2= MS 8,51
b) Non, car les variables fortement corrélées expliquent la même part d’information de Y.
C) y = 0,298 + 2,817X5+0,248Xg-0,010X10 â 2 MS 7,94
d) [14,81; 26,76]
e) Un test de Student de comparaison de moyennes
13.5 a) Le modèle incluant X b) Non c) /0= 111,5 > os: = 3,84 (significatif)
4 . 8

d) H0: /3, = 0:110 | = 2,083 < t0. S = 2,306 (non significatif : valeur P = 0,0708)
0 2 : 8

H0: A 0 :|r0 0,705 < t0025:8 2.306 (non significatif : valeur P = 0,5009)
H0: A 0 :|/0 0,135 < t0025:8 2.306 (non significatif : valeur P = 0,8959)
H0:A 0 :110 I-0,2031< t0.025:8 2,306 (non significatif : valeur P = 0,8441)
e) f 0 = (1217,82/3)/5,98 = 67,88 > /r005;3g= 4,07 (significatif, donc au moins une des trois variables est
significative si on les ajoute dans le modèle contenant déjà X,).
13.6 a) Le meilleur modèle inclut X, et X2(R2 = 0,6717).
b) R 0,7314, donc environ 73%.
c) Les deux postulats sont respectés.
508 RÉPONSES AUX EXERCICES

13.7 b) i) y - - 26 219+ 189,20*-0.3312X2


ii) f 0 = 17,2 > Foos 2,5 = 5,79 (significatif : valeur P = 0,0057)
ÏHÏ110 2,453 | < tg025; 2,57
(non significatif : valeur P = 0,0577)
C) y -848 900 + 8500,5X - 28,295X2+ 0,031 33X3
i) Degré 2 : R;, = 0,822, degré 3 : /?2 = 0,964
ii) | t0|= 4,548 >025:5 2,57 (significatif : valeur P = 0,0104)
X
13.8 a) y = -4,33 + 4,89X - 2,59X b) / 0 = 39,89 > F005 27 = 4,74 (significatif : valeur P = 0,000 15)
0 l'o 5,291> tQ025;? = 2,37 (significatif : valeur P = 0,0011)
13.9 a) 152 étudiants
b) f 0 = 47,46 > F0o5;2,|49 = 3,057, donc au moins un des deux premiers examens est significatif.
c) L’examen 1, soit le plus corrélé avec l’examen 3. R (0,59) 0,348
d) H0: j3j = 0 :110 \ = 4,62 > t0025:149 1.976 (significatif)
H0:fi 0 :110\ = 3,33 > !0,025:149 1.976 (significatif)
La note de l’autre évaluation est utile pour améliorer la prédiction.
e) x 3,560 + 0,436(70) + 0,385(80) = 64,88
f) 10x /32 =3,85 points. Intervalle de confiance à 95%: [1,56; 6,14]
13.10 a)
Source de Degrés Somme Moyenne
variation de liberté des carrés des carrés /o
Régression 2 38,92 19,46 3,97
Erreur 30 147,07 4,902
.. « - . • « *

Total 32 185,99
/ 0 = 3,97 > F005.i30 = 3,32, la taille d’au moins un des parents explique la taille des filles de façon
significative.
b) 0,209
147,07/30
c) Raj 1 0,157
185,99/32
d) Mère : H0: /3, = 0, t 0 =2,75 > t0025,30 = 2,04. Si la taille du père est dans le mod
celle de la mère.
Père : H0: /J2 = 0, t0= 0,166 < /00 2= 2,04. Si la taille de la mère est dans le modèle, il n’est pas utile
5 . 3 o

d’ajouter celle du père.


e) y =33,238 + 0,470(64) + 0,024(70) = 64,998 pouces
f) Intervalle de confiance pour 5 X)S, : (5 x (0,470)) ± 2,04(5 x 0,171) = 2,35 ±1,74
13.11 a) 2 variables
b) MSe =3
5,886/17 = 2,11
c) 0,182 ± 2,110V2,111 x 0,006 = [-0,055; 0,419]
d) Puisque 0 est dans l’intervalle de confiance pour /?, calculé en c), l’effet de X, n’est pas significatif
(conditionnellement à la présence de X2).
r -v

Table I Les valeurs de la fonction de répartition de la loi de Poisson*

c k
X 0,01 0,05 0,10 0,20 0,30 0,40 0,50 0,60
0 0,990 0,951 0,904 0,818 0,740 0,670 0,606 0,548
1 0 ,9 9 9 0 ,9 9 8 0,963 0,938 0,909 0,878
0.995 0,982
2 0,999 0,999 0,998 0,996 0,992 0.985 0,976
3 0,999 0.999 0.999 0,998 ■ Æ
A OÛA
■ -w ^ W m

4 • «■
0,999 0.999 0.999 0 "

5 0,999 ( ) OQÜ

k
0,70 0,80 0,90 1,00 1,10 1,20 1,30
0 0,496 0,449 0,406 0,367 0,332 0,301 0,272 0,246
1 0 ,8 4 4 0 ,8 0 8 0,772 0,735 0,699 0,662 0.626 0,591
2 ^ 0,965 0,952 0,937 0,919 0,900 0,879 0,857 0,833
3 0 ,9 9 4 0 ,9 9 0 0,986 0,981 0,974 0,966 0,956 0,946
4 0,999 0,998 0,997 0,996 0,994 0,992 0,989 0,985
5 0 ,9 9 9 0 ,9 9 9 0,999 0,999 0.999 0.998 0,997 0.996
6 0,999 0,999 0,999 0,999 0.999 0.999 0,999
7 0,999 0,999 0,999 0.999 0,999
«•

8 . . . . .

0.999 0,999

c— k . -

,—
r

x *»

1,50 1,60 1,70 1,80 1,90 2,00 2,10 2,20


0 0,223 0,201 0,182 0,165 0,149 0.135 0.122 0,110
1 0 ,5 5 7 0 ,5 2 4 0,493 0.462 0.433 0.406 0,379 0.354
2 0,808 0,783 0,757 0,730 0,703 0.676 0,649 0,622
3 0 ,9 3 4 0.921 0,906 0,891 0,874 0,857 0.838 0,819
4 0,981 0,976 0,970 0,963 0,955 0.947 0,937 0,927
5 0 ,9 9 5 0 ,9 9 3 0,992 0.989 0,986 0.983 0,979 0,975
6 0,999 0,998 0,998 0,997 0,996 0,995 0,994 0,992
7 0 ,9 9 9 0 ,9 9 9 0,999 0,999 0.999 0.998 0,998 0.998
8 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
9 0.999 0,999 0,999 0,999 0,999 0,999
10 0.999 0,999

■_ . ■»
r '\ - 1

f v * i r
510 TABLE I
- A . v |

Table I Les valeurs de la fonction de répartition de la loi de Poisson


(s u ite )

h
X 2,30 2,40 2,50 2,60 2,70 2,80 2,90 3,00
0 0,100 0,090 0,082 0,074 0,067 0,060 0,055 0,049
î 0,330 0,308 0,287 0,267
S , w ■1
0,248 0,231 0,214 0 , 199

2 0,596 0,569 0,543 0,518 0,493 * -•


0,469
>■ . < , ,
0,445 0,423
3 0,799 0,778 0,757 0,736 0,714 0,691 0,669 0,647

4 0,916 0,904 0,891 0,877 0,862 0,847 0,831 0,815


5 0,970 0,964 0,957 0,950 0,943 0,934 0,925 0 , 916

6 0,990 0,988 0,985 0,982 0,979 0,975 0,971 0,966


7 0,997 0.996 0,995 0,994 0,993 0,991
H
0,990 0,988

8 0,999 0,999 0,998 0,998 0,998 0,997 0,996 0,996


9 0,999 0,999 0,999 0,999 0.999
, * ■™ * <i ,
0,999 ,
0,999 0 ,9 9 8

10 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999


11 ■*>
0,999 . ■ 0,999
f «

■ « .
0,999
.V ' ■
0,999 0,999 «
0 ,9 9 9

12 0,999 0,999

h
* 3,50 4,00 4,50 5,00 5,50 6,00 6,50 7,00
0 0,030 0,018 0,011 0,006 0,004 0,002 0,001 0,000
1 0,135 0,091 0,061 0,040 0,026 0,017 * i- ,
0,011 0 ,0 0 7

2 0,320 0,238 0,173 0,124 0,088 0,061 0,043 0,029


3 0,536 0,433 * *
0.342
t *
• . ,

0,265 0,201 0,151 0,111 0,081

4 0,725 0,628 0,532 0,440 0,357 0,285 0,223 0,172


, V

5 0,857 0,785 0,702 , . 0.615 - 0,528 . 0,445 0,369 L .-. 0 ,3 0 0

6 0,934 0,889 0,831 0,762 0,686 0,606 0,526 0,449


7 0,973 0,948 ; * *.
0.913
" •■ V- .
. 0,866 2 0,809
■ •
0,743
* * ,* * —
0,672 ■Y',;:..
# # t j *.- , " / ■
% - ». - -


0,598
'

8 0,990 0,978 0,959 0,931 0,894 0,847 0,791 0,729


9 0,996 0,991 0,982 0,968 0,946 0,916 % . 0,877 0 ,8 3 0

10 0,998 0,997 0,993 0,986 0,974 0,957 0,933 0,901


11 0,999 0,999 0,997 0,994 0,989 0,979 0.966 0 ,9 4 6

12 0,999 0,999 0,999 0,997 0,995 0,991 0,983 0,973


13 0,999 0,999 0,999 0,999 0,998 0,996 0,992 0,987

14 0,999 0,999 0,999 0,999 0,998 0,997 0,994


15 0,999 0,999 0,999 0,999 0,998 0 ,9 9 7

16

0,999 0,999 0,999 0,999 0,999


17 0,999 0,999 0,999 0 ,9 9 9

18 •-
0,999 0,999 0,999
19 0,999 0 ,9 9 9

20 0,999

-L W ,

&
Les valeurs de la fonction de répartition de la loi de Poisson 511

Table I Les valeurs de la fonction de répartition de la loi de Poisson*


{ s u ite )

c=h
X 7,50 8,00 8,50 9,00 9,50 10,0 15,0 20,0
0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
a *

î 0,004 0,003 0,001 0,001 0 ,0 0 0 0,000 0 ,0 0 0 0 .0 0 0


2 0,020 0,013 0,009 0,006 0,004 0,002 0,000 0,000
«

3 0,059 0,042 0,030 0,021 0 .014 0,010 0 ,0 0 0 0.000 . * *

4 0,132 0,099 0,074 0,054 0,040 0,029 0,000 0,000


5 0,241 0,191 0,149 0 , 115 0,088 0,067 0,002 0 ,0 0 0 1
6 0,378 0,313 0,256 0,206 0,164 0,130 0,007 0 ,0 0 0
7 0,524 0,452 0,385 0,323 0.268 0,220 0,018 a v a ■

8 0,661 0,592 0,523 0,455 0,391 0,332 0,037 0,002


9 0,776? ‘
0,716 0,652 0,587 0,521 0,457 0,069 0 ,0 0 5
10 0,862 0,815 0,763 0,705 0,645 0,583 0,118 0,010
11 0,920 0,888 0,848 0,803 0,751 0,696 0.184 0,021
12 0,957 0,936 0,909 0,875 0,836 0,791 0,267 0,039
13 0,978 0,965 0,948 0,926 0,898 0,864 0,363 0,066
14 0,989 0,982 0,972 0,958 0,940 0,916 0,465 0,104
15 k *
0,995 0,991 0,986 0,977 0,966 0,951 0,568 0 , 156
16 0,998 0,996 0,993 0,988 0,982 0,972 0,664 0,221
17 0,999 0,998 0,997 0,994 0.991 •
0,985 0,748 0,297
18 0,999 0,999 0,998 0,997 0,995 0,992 0,819 0,381
19 *
0,999 0,999 0,999 0,998 0.998 0,996 0,875 0,470
20 0,999 0,999 0,999 0,999 0,999 0,998 0,917 0,559
< . • - ‘

21 0 ,9 9 9 0,999 0,999 0,999 0,999 0,999 0.946 0,643


22 0,999 0,999 0,999 0,999 0,999 0,967 0,720
23 0,999 0,999 0,999 0.999 0,980 0,787

24 0,999
# _ s
0,999 0,988 0,843
25 0,999 0,993 0,887
-- £

26 0,996 0,922
27 •
0.998 0,947
28 0,999 0,965
29 0,999 0,978
30 0,999 0,986
31 0.999 0,991

32 0,999 0,995
0,999

33 0.997

34 0,998
X
* Les valeurs figurant dans cette table sont celles de F( x) = P(X < x) — T e ' V / i . On suppose que toute valeur manquante au bas
d ’une colonne est égale à 1,0. i*0
Table II Les valeurs de la fonction de répartition de la loi normale centrée réduite*
10

table
Deuxième décimale de z

II
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 t

•*

0,0 0,500 00 0,503 99 0,507 98 0,511 97 0,515 95 0,519 94 0,523 92 0,527 90 0,531 88 0,535 86
t ' * . ■ ,

0,1 0,539 83* la

• V * , .* '
0,543 79 : 111 0,547 76 «
a ■* / a . 1
a ,
i
k .
1
a ,
• » >
, a i t a
• *
a- , a
0,551,72 •
1
a . * *
• la •
0,555 67 a a
0,559 62
a . a a ? |
0,563 56 0,56749 •

a
0,571 42
r

* , * , • .
0,575 34
a • k
• . , ' , ' ê . f

0,2 \ f- .
0,579 26 0,583 17 0,587 06 0,590 95 0,594 83 0,598 71 0,602 57 0,606 42 0,610 26 0,614 09
* , s • »

0,3
, ( ,
0,61791 0,62172 0,625 51 0,629 30 0,633 07 0,63683 0,640 58 0,644 31 0,648 03 0,651 73
0,4 0,655 42 0,659 10 0,662 76 0,666 40 0,670 03 0,673 64 0,677 24 0,680 82 0,684 38 0,687 93
■>, • u , . . -
, a . , a . 1 > * t • , ■ f a , a , * a *

0,5 0,691 46 , * *
0,694 97 0,698 47 • i , 1
0,701 94 0,705 40 0,708 84 0,71226 0,715 66 0,719 04 0,722 40
» a ■ 1 a l
# • a . • p a a» k a a a ' ,

0,6 0,725 75 0,729 07 0,732 37 0,735 65 0,738 91 0,742 15 0,745 37 0,748 57 0,751 75 0,754 90
* •
a a 1 •

0,7 0,758 03 0,761 15 0,764 24 0,76730 0,770 35 0,773 37 0,776 37 0,779 35 0,782 30 0,785 23
Prem ière décimale de z

• 1 i « - | v J # * i , * * ‘ " # *
* a a , • 1 a ,

0,8 0,788 14 0,791 03 0,793 89 0,796 73 0,799 54 0,802 34 0,805 10 0,807 85 0,810 57 0,813 27
t i * .

0,9 0,815 94 0,818 59 0,82121 a , ^ '


0,823 81 0,826 39 0,828 94 0,831 47 0,833 97 0,836 46 0,838 91
• «* • • • a . a * V , . ' a

1,0 0,841 34 0,843 75 0,846 13 0,848 49 0,850 83 0,853 14 0,855 43 0,857 69 0,859 93 0,862 14
,
1,1 • t ■
0,864 33 , , • *
0,866 50 0,868 64 0,87076 0,872 85 0,874 93 0,876 97 0,879 00 0,881 00 0,882 97
' • • • * # , k
/ . | r

1,2 0,884 93 0,886 86 0,888 77 0,890 65 0,892 51 0,894 35 0,896 16 0,897 96 0,899 73 0,901 47
1 " a a

1,3 0,903 20 0,904 90 0,906 58 0,908 24 ; 0,909 88 0,911 49 0,913 08 0,914 65 0,916 21 0,917 73
1,4 0,919 24 0,920 73 0,922 19 0,923 64 0,925 06 0,926 47 0,927 85 0,929 22 0,930 56 0,931 89
a ’ *’ 1 . k - .

1,5 0,933 19
a •
0,93448 0,935 74 0,936 99 a
0,938 22 0,939 43 0,940 62 0,94179 0,942 95 0,944 08
1,6 0,945 20 0,946 30 0,947 38 0,948 45 0,949 50 0,950 53 0,951 54 0,952 54 0,953 52 0,954 48
, , , a >

* ; . . *’ ;

1,7 * • / • .
:
■ ,
0,955 43 0,956 37 0,957 28 0,958 18 0,959 07 0,959 94 0,960 80 0,961 64 0,962 46 0,963 27
/

1,8 0,964 07 0,964 85 0,965 62 0,966 37 0,967 11 0,967 84 0,968 56 0,969 26 0,969 95 0,970 62
| a .
, * * 1 •

1,9 0,97128 0,971 93


* > • *
0,972 57 0,973 20 0,973 81 0,974 41 0,975 00 0,975 58 0,976 15 0,976 70
2,0 0,977 25 0,977 78 0,978 31 0,978 82 0,979 32 0,979 82 0,980 30 0,980 77 0,981 24
a a b • a * . a
0,981 69
2.1 A
0,982 14
' 1 ' • -
f . i
0,982 57
* • , •• •
I
t
l
,
0,983 00 a. a
1
a
a
a
0,983 41 0,983 82 0,984 22 0,984 61 0,985 00 0,985 37 0,985 74
• A ' • 1 ■ \ • ' \ a ■ , V • • a • / a * a a ,
a 1 • | / 1 * ■
■• , ' ' a a , • ’ a , . ‘ / a , , a a

2,2 0,986 10 0,986 45 0,986 79 0,987 13 0,987 45 0,987 78 0,988 09 0,988 40 0,988 70 0,988 99
Table II Lesvaleurs de la fonction de répartition de la loi normale centrée réduite* (suite)

Deuxième décimale de z

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

2,3 0,989 28 0,989 56 0,989 83 0,990 10 0 ,9 9 0 3 6 0,990 61 0,990 8 6 0,99111 0 ,9 9 1 3 4 0,991 58

2,4 0,991 80 0,992 02 ' 0,992 24 0,992 45 0,992 6 6 0,992 8 6 0,993 05 0,993 24 0,993 43 0,993 61
, a , t , ' • , a V

2,5 0,993 79 0,993 96 0,994 13 0,994 30 0,994 46 0,994 61 0 ,9 9 4 7 7 0,994 92 0,995 06 0,995 20

2,6 0,995 34
• * ■ * 'a
0,995 47 0,995 60 0,995 73 0,995 85 0,995 98 0,996 09
,
0,996 21 0,996 32 0,996 43

2,7 , 0,996 53 0,996 64 0,996 74 0,996 83 0,996 93 0,997 02 0,997 11 0,997 20 0,997 28 0,997 36

2,8 0,997 60 0,997 67 0,997 74 0,997 81 0,997 8 8 0,997 95 0,998 01 0,998 07


Prem ière décim ale de z

0,997 44 0,997 52

Les valeurs de la fonction de répartition de la loi normale centrée réduite


, , a i , , .

2,9 0,998 13 0,998 19 0,998 25 0,998 31 0,998 36 0,998 41 0,998 46 •


0,998 51
,
0,998 56 0,998 61

3,0 0,998 65 0,998 69 0,998 74 0,998 78 0,998 82 0,998 8 6 0,998 89 0,998 93 0,998 97 0,999 00

0,999 03 0,999 06 0,999 10 0,999 13 0,999 16 0,999 18 0,999 21 0,999 24 0,999 26 0,999 29
3,1
0,999 31 0,999 34 0,999 36 0,999 38 0,999 40 0,999 42 0,999 44 0,999 46 0,999 48 0,999 50
3,2
0,999 52 0,999 53 0,999 55 0,999 57 0,999 58 0,999 60 0,999 61 0,999 62 0,999 64 0,999 65
3,3
0,999 6 8 0,999 69 0,999 70 0,999 71 0,999 72 0,999 73 0,999 74 0,999 75 0,999 76
3,4 0,999 6 6 « I r

' J ) , ,

0,999 78 0,999 78 0,999 79 0,999 80 0,999 81 0,999 81 0,999 82 0,999 83 0,999 83


3,5 0,999 77
0,999 85 0,999 85 0,999 8 6 0,999 8 6 0,999 87 0,999 87 0,999 88 0,999 88 0,999 89
3,6 0,999 84
0,999 90 0,999 90 0,999 90 0,999 91 0,999 91 0,999 92 0,999 92 0,999 92 0,999 92
3,7 0,999 89
a. . ' *

0,999 93 0,999 93 0,999 94 0,999 94 0,999 94 0,999 94 0,999 95 0,999 95 0,999 95


3,8 0,999 93 #• ,■ »
0,999 95 0,999 96 0,999 96 0,999 96 0,999 96 0,999 96 0,999 96 0,999 97 0,999 97
3,9 0,999 95 , t

1 _„2

* Les valeurs figurant dans cette table sont celles de <ï>(z ) e 2 du,où Z ~ /'/((), 1). La première décim ale de z
yj2n
est indiquée dans la l re colonne , et sa deuxième décimale est indiquée sur la F ligne . Par exemple , <t>(l , 23 ) = 0,890 65 .
514
TABLE III

Table in Us
quantités de la loi du khi-carré*

Probabilité
0,995 0,990 0,975 0,950 0,900 0,500 0,050 0,025 0,010 0,005
0,0 0 + 0,0 0 + 0,0 0 + 0,00+ 0,02 0,45 2,71 3,84 5,02 6,63 7,88
0,01 0,02
3
0,05 0,10 0,21 1,39 4,61 5,99 7,38 9,21 10,60
0 ,0 7 0,11 0,22 0,35
•' .N * ,

4 0,58 2,37 6,25 7,81 9,35 11,34 12,84


0.21 0,30 0,48 0,71 1,06 3,36 7,78 9,49 11,14 13,28 14,86
5 0,41 0,55 0,83 1,15
6 1,61 4.35 9,24 11,07 12,83 1 5 ,0 9 16,75
0.68 0.87
7
1,24 1.64 2,20 •
5.35
• - “
10,65 12,59 14,45 16,81 18,55
0 ,9 9 1,24 1,69
8 2,17 2,83 6.35 12,02 14,07 16,01 18,48 2 0 ,2 8
1,34 1,65 2,18 2,73 3,49 7.34
9 13,36 15.51 17,53 20,09 21.96
1,73 2,09 2,70 3,33 4,17 8.34
10 14,68 16,92 19,02 21,67 2 3 ,5 9
2.16 2.56 »

3,25 3. 4.87 9.34


11 15,99 18,31 20,48 23,21 25,19
2 ,6 0 3,05
* • * • *

3,82 4.57 5,58 10.34


12 17,28 19,68 21,92 24,72 26,76
3,07 3.57 %

4.40 5.23 6.30 11.34


13 18,55 21,03 23,34 26,22 2 8 ,3 0
3,57 4,11 5,01 5,89 7,04 12.34
14 19,81 22,36 24,74 27,69 29,82
4,07 4,66
« »

5,63 6.57 7,79 13.34


15 .••• ' •' * K % .
21,06 23,68 26,12 29,14 31,32
4 ,6 0 5,23 6,27 7,26 8,55 14.34
16 22,31 25,00 27,49 30,58 3 2 ,8 0
5,14 5,81 6.91 7,96 9.31
Degrés de liberté

15.34 23,54 26,30 28,85 32,00 34,27


17 5,70 6,41 7,56 8,67 10,09 16.34 24,77 27,59 30,19 33,41 35,72
18 6,26 7.01 • s

• 0* «
8,23 9,39 10,87 17.34
19
* % • •
25,99 28,87 31,53 34,81 37,16
6 ,8 4 7,63 8.91 10,12 11.65 18.34 27.20 30,14 32,85
20 7,43 8.26
ê *9 •, .
36,19 38,58
9,59 10.85 12,44 19.34 28,41
21 0
31,41 34,17 37,57 4 0 ,0 0
8,03 8,90 10,28 11,59 13,24
oo 8.64
20.34
0 0
29,62 32,67 35,48 38,93 41,40
9.54 10,98 12,34
■ .

14,04 21.34 30,81 33,92 36,78 4 0 ,2 9 4 2 ,8 0


23 ^ & ' » •

10,20
«0 0

9,26 11,69 13,09 14,85 22.34 32,01 35,17


24 38,08 41,64 44,18
9,89 10,86 12,40 13.85 15.66 23.34 33.20 36,42 39,36 42,98 45,56
25 10,52
■»

11,52 13,12 14,61 16,47 24.34 34,28 37,65 40,65 44,31


26 4 6 ,9 3
11,16 12,20 13>84 15,38 17,29 25.34 35,56
27
**
*

>0%
*■ ^ m • * 38,89 41,92 4 5 ,6 4 4 8 ,2 9
11,81 12,88 14,57 16,15
. _ y ■ * . • **..

28
18,11 26.34 36,74 10,11 43,19 4 6 ,9 6 49,65
12,46 13,57 15,31 16,93 18,94
29
27.34 .
37.92 • * 11,34 4 4 ,4 6 48,28 50,99
13,12 14,26 16,05 17,71 19,77 28.34 39,09 2 ,5 6 45,72 49,59 5 2 ,3 4
30 13,79 14,95 16,79 18,49
' . ^ —,

29.34 40,26 •3,77 | 4 6 ,9 8


40
• %
50,89 53,67
20,71 22,16 24,43
' A.

26,51 29,05 39.34 51,81 5,76 59,34 63,69 66,77


50 27.99 29 ,71 32.36 34,76 37,69 49.33 63,17 7,50 71,42 76,15
60 79.49
35,53 37,48 40,48 43,19 46,46 59.33 74,40 79,08 83,30 88,38 91,95
70 43,28 45,44 48,76 51,74 55,33 69.33 85,53 90,53 95,02 100,42 104,22
80 51,17 53,54 57,15 60,39 64.28 79.33 96,58 101,88 106,63 1 1 2 ,3 3
90 59.20 116,32
61,75 65.65 69,13 73.29 89.33 107.57 113,14 118,14 124,12
100 67,33 128,30
118,50 124,34 129,56 135,81 140,17
densité^ Les valeurs figurant dans cette table sont les quantiles Xa-,
tels que P(U>x l;v) = a, où U~ xl-
Les quantiles de la loi de Student

Table IV Les quantiles de la loi de Student*


Degrés de liberté

Source : E . S . Pearson et H .O . Hartley , 1966 , Biometrika Tablesfor Statisticians, 3 e éd ., Cambridge : Cambridge University
Press , vol . 1. Table adaptée avec l’autorisation des administrateurs de Biometrika .
*Les valeurs figurant dans cette table sont les quantiles ta.vtels que
P(T >ta.v) = oc, où T ~ tv.

0
Les quantîles de fa loi de Fisher avec 0,25 *
• ' , • ' 1 ' ' * 1 # • * / ' # . " ' I ' * . * * * ‘ ,! • * . ' . »

_______ : __________________________ ^ . 3.25 ; v,t v,

table
1 Nombre de degrés de liberté du numérateur (Vj)
1 - 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 «>

V
1 5,83 7,50 8,20 8,58 8,82 8,98 9,1 9,19 9,26 9,32 9,41 9,49 9,58 9,63 9,67 9,71 9,76 9,8 9,85
2 2,57 3,00 3,15 3,23 3,28 3,31 3,34 3,35 3,37 3,38 3,39 3,41 3,43 3.43 3,44 3,45 3,46 3,47 3,48
3 2,02 2,28 2,36 2,39 2,41 2,42 2,43 2,44 2,44 2,44 2,45 2,46 2,46 2,46 2,47 2,47 2,47 2,47 2,47
4 1,81 2,00 2,05 2,06 2,07 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08
5 1,69 1,85 1,88 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,88 1,88 1,88 1,88 1,87 1,87 1,87
6 1,62 1,76 1,78 1,79 1,79 1,78 1,78 1,78 1,77 1,77 1,77 1,76 1,76 1,75 1,75 1,75 1,74 1,74 1,74
7 1,57 1,70 1,72 1,72 1,71 1,71 1,70 1,70 1,70 1,69 1,68 1,68 1,67 1,67 1,66 1,66 1,65 1,65 1,65
8 1,54 1.66
T
1,67 1,66 1,66 1,65 1,64 1,64 1,63 1,63 1,62 1,62 1,61 1,60 1,60 1,59 1,59 1,58 1,58
9 1,51 1,62 1,63 1,63 1,62 1,61 1,60 1,60 1,59 1,59 1,58 1,57 1,56 1,56 1,55 1,54 1,54 1,53 1,53
10 1,49 1,60 1,60 1,59 1,59 1,58 1,57 1,56 1,56 1,55 1,54 1,53 1,52 1,52 1,51 1,51 1,50 1,49 1,48
11 1,47 1,58 1,58 1,57 1,56 1,55 1,54 1,53 1,53 1,52 1,51 1,50 1,49 1,49 1,48 1,47 1,47 1,46 1,45
12 1,46 1,56 1,56 1,55 1,54 1,53 1,52 1,51 1,51 1,50 1,49 1,48 1,47 1,46 1,45 1,45 1,44 1,43 1,42
13 1,45 1,55 1,55 1,53 1,52 1,51 1,50 1,49 1,49 1,48 1,47 1,46 1,45 1,44 1,43 1,42 1,42 1,41 1,40
14 1,44 1,53 1,53 1,52 1,51 1,50 1,49 1,48 1,47 1,46 1,45 1,44 1,43 1,42 1,41 1,41 1,40 1,39 1,38
15 1,43 1,52 1,52 1,51 1,49 1,48 1,47 1,46 1,46 1,45 1,44 1,43 1,41 1,41 1,40 1,39 1,38 1,37 1,36
16 1,42 1,51 1,51 1,50 1,47
OO'

1,46 1,45 1,44 1,44 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,35 1.34
* V
)

17 1,42 1,51 1,50 1,49 1,47 1,46 1,45 1,44 1,43 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,35 1,34 1,33
18 1,41 1,50 1,49 1,48 1,46 1,45 1,44 1,43 1,42 1,42 1,40 1,39 1,38 1,37 1,36 1,35 1,34 1,33 1,32
i . *

19 1,41 1,49 1,49 1,47 1,46 1,44 1,43 1,42 1,41 1,41 1,40 1,38 1,37 1,36 1,35 1,34 1,33 1,32 1,30
1,40 1,49 1,48 1,47 1,45 1,44 1,43 1,42 1,41 1,40 1,39 1,37 1,36 1,35 1,34 1,33 1,32 1,31 1,29
T a b le V L e s q u a n t i t é s d e la l o i d e F is h e r a v e c a = 0 , 2 5 * { s u it e )

F0,25 ; v., y.

21 1.40 1.48 1,48 1,46 1.44 1,43 1,42 1,41 1,40 1.39 1,38 1,37 1,35 1,34 1,33 1,32 1,31 1,30 1,28
Nombre de degrés de liberté du dénominateur (v2)

22 1.40 1.48 1.47 1.45 1.44 1.42 1.41 1.40 1.39 1.39 1.37
t'»
1,36 1.34 1.33 1.32 1.31 1.30
0
1,29 1,28
23 1.39 1.47 1.47 1.45 1.43 1.42 1.41 1.40 1.39 1.38 1.37 1.35 1.34 1.33 1.32 1,31 1,30 1,28 1,27
24 1.39 1.47 1.46 y
1.44 1.43 1.41 1.40 1.39 1.38 1.38 1.36 1.35 1.33 1.32
/ i 1.31 1,30 1,29 1,28 1,26
25 1.39 1.47 1.46 1.44 1.42 1.41 1.40 1.39 1.38 1.37 1.36 1.34 1.33 1.32 1.31 1,29 1,28 1,27 1,25
■ i , \ • , *

* *

26 1.38 1.46 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.37 1.35 1.34 1.32 1.31 1.30 1,29 1,28 1,26 , 1,25
27 1.38 1.46 1.45 1.43 1.42 1.40 1.39 1.38 1.37 1.36 1.35 1.33 1.32 1.31 1.30 1,28 1,27 1,26 1,24
28 1.38 1.46 1.45 1.43 1.41 1.40 1.39 1.38 1.37 1.36 1.34 1.33 1.31 1.30 1.29 1,28 1,27 1,25 1,24
29 1.38 1.45 1.45 1.43 1.41 1.40 1.38 1.37 1.36 1.35 1.34 1.32 1.31 1.30 1.29 1.27 1,26 1,25 1,23
30 1.38 1.45 1,44 1,42 1.41 1,39 1.38 1.37 1.36 1.35 1.34 1.32 1.30 1,29 1,28 1.27 1,26 1,24 1,23

Lesquantilesdelaloi deFisheraveca - 0,25


0

40 1,36 1,44 1,42 1,40 1,39 1,37 1,36 1,35 1,34 1,33 1,31 1,30 1,28 1,26 1,25 1,24 1,22 1,21 U9
60 1,35 1,42 1,41 1,38 1,37 1,35 1,33 1,32 1,31 1,30 1,29 1,27 1,25 1,24 1,22 1,21 1,19 1,17 1,15
120 1,34 1,40 1,39 1,37 1,35 1,33 1,31 1,30 1,29 1,28 1,26 1,24 1,22 1,21 1,19 1,18 1,16 1,13 1,10
1,32 1,39 1,37 30 1,35 1,33 1,31 1,29 1,28 1,27 1,25 1,24 1,22 1,19 1,18 1,16 1,14 1,12 1.08 1.00
Source: E.S. Pearson et H.O. Hartley

Densité F. *Les valeurs figurant dans cette table sont les quantiles F025;Vi Vjtels que P (F > F025.vv) = 0,25, où F ~ Fv „

0,25 ; v„ v*

01
M
Nombre de degrés de liberté du dénominateur (v2)
F,0,10; v,, v2

TABLE V
T a b le V L e s q u a n t i t é s d e la lo i d e F i s h e r a v e c a - 0 , 1 0 * ( s u i t e )

Nombre de degrés de liberté du dénominateur (v )

Les quantiles de la loi de Fisher avec a = 0,10


Densité F * Les valeurs figurant dans cette table sont les quantiles F010.v ,, tels que P (F > F010.v v) = 0,10, où

0.10 ; V|, vs

> * •
« ^ , iii
■ <'• • • V • , ..l \'.r • . . , . . «• ‘ ’ ■ . , » . • • •
•. 1 . • ’ ‘ • , 1 • > • • \ ‘ . • ‘ ,» ' .* '■ i

Table V Les quantiles de la loi de Fisher avec oc=0,05*

table V
a

1 161,4 199,5 215,7 224,6 230,2 234 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
• a * “ t , i . » a , > a , * a*
p 1 , * a / * , /

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19.45 19,46 19,47 19,48 •
19,49 19,50
• v •»■

. • i ■ » ,
i ■« • w \ » * ' ^
i . ■ i * • * *■ ■ » . » * , , . 1 f
. . > - V a , / . , 1 ■ ,
a i » ■. * ' / • • V
’ • , *

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
. * i

4 7,71 6,94 6,59 6.39 6,26 6,16 6,09 5,80 5,77 5,75 5,72 5.69 5,66 5,63
, *.

, , ■.

• -
/
• •
• •
>
» j
'
• » • . ,6,04 6,00.
*
t

* ,
B '
*
5,96
P a / , 1 * p
5,91 5.86 a i •
a a ,
N om bre de degrés de liberté du dénominateur ( v2)

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
a
a , /

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 i


4.15 ■
4,10 4,06 4,00 3.94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
• , /
1 k t a, ( .> Pa * a
( v , ,
' » . *• J . . ’ - V * . • • ■ p ,

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
i ■ ■<
»
» . *
. ,# . , #*

8 5,32 4,46 4,07 3,84 3.69 3,58 3,50 3M 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 , 2,97 2,93
. ■ , •
, ,
. 1 . • , * •
■ *
• » »
,
* i a

* * * a * ■

P P » * . . . . . _ • , . a •
» ■» a ■ » * * i

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
* .* i aa
V

10 4.96 4,10 3.71 3,48 3,33 3 22 3,14 3,07 3,02 2,98 2,91 2,85 2 ,7 7 . 2,74 2,70 2,66 2,62 2,58 2,54
■•
i * *
‘ t . r
,

»

*
*

*
>
\ * ■
> •
i *
i *
» ,

' j
i

• 1 > 1 *v • •
■ t
• , » a, a

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
. « , a

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2.47 2,43 2 , 3 8 .. 2,34 2,30
, ,
. ., '
•» * , « * , % .
. • » .
* » *
*
t i
. a j
t- < * .
»
" \ * P • *
/ *

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
, ,, ■ » , • * . * , »

#

, . •
i .
• •
, . . _
, , • ■/ » , ». , . i • j \ ,
. * a a * »
■ •
• * »
a
» a » * p .

a » .

14 4,60 3,74 3,34 3,11 1 2 ,9 6 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2 ,31 2,27 2,22 2,18 2,13
* a
• ■ i
\
. .
• :
► *
• i * * .a »
* a
a

v p
* /

# a a P
• /

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
»• #•.• • « 1 * ».■_•* p

16 4,49 3,63 3,24 3,01 ,•» 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
• .* v■,•,' *> •v, V
*, » .i * .» • * *.* ■ i f

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
i,‘ ■
> » *

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2.06 2 ,0 2 1,97 1,92
, i » *

• , , i . <, . »
' ‘ ' • ■' . » . ►. r. 1 P
»
■ .
’ , ’ a
; c
P
a
i a'
. a * ,
* » m
w
<

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
T a b le V L e s q u a n t i t é s d e la lo i d e F is h e r a v e c = 0 ,0 5 * (s u ite )

F0,05 ; v„I’v 2

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
2 1 4,32 3,47 3,07 2,84 2 , 6 8 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2 , 1 0 2,05 2 , 0 1 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2.07 2,03 1,98 1,94 1,89 1.84 1.78
V
3 -
4
<L> 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2 , 2 0 2,13 2,05 1,96 1,91 1,81 1,76

2 , 0 1 1 , 8 6

«!■(
0

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1.89 1,84 1.79 1,73
S
O
'T
Oc 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 1,96 1,92 1,87 1,82 1,77
3 2 , 0 1
1,71
"N O
D 2,74
D 26 4,23 3,37 2,98 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
t(L>
X) 27 1 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2 , 2 0 2,13 2,06 1,97 1,93 1 , 8 8 1,84 1,79 1,73 1,67
T3 < u 28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19
C/5 2,12 2,04 1,96 1.91 1,87 1.82 1,77 1,71 1,65
u- 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,18
2 , 2 2 2 , 1 0 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
T)
"O< u 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2.01 1,93 1,89 1,84 1.79 1,74 1.68 1,62 CD
C/)
<u JD
X 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,08 1,92 1,84 1,79 1,74 1,69 1,64 1,58 ûU)
E 2 , 1 2 2 , 0 0
1,51
G 60 4.00 3,15 2,76 2,53 2,37
Z 2.25 2,17 2.10 2,04 1,99 1,92 1,84 1,75 1,70 1.65 1,59 1,53 1,47 1,39 CD
(/>
120 3,92 3,07 2,45 2,29 2,17 2,09 1,96 1,91 1,83 1,75 1,61 1,55 1,55 Q .
2 , 6 8
2 , 0 2
1 , 6 6
1,43 1,35 1,25 CD
OC 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 ûT
1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1 . 0 0
6~
O
CD
.
Densitc F Les valeurs figurant dans cette table sont les quantiles FÜUJ„ vtels que P(F> F{0,05; v,, v2) =0,05, où F ~ F. Tl
(/)
*VV
CD
Q)
CD
o O
/ f 1 I I A,

II
O
O
en
T a b le V L e s q u a n t i l e s d e la lo i d e F i s h e r a v e c a = 0 ,0 2 5

F,0,025; v,, v
I*

TABLEV
2
Nombre de degrés de liberté du dénominateur (v2)

6,62
•_« #* 6,52 6,43
5,46 5,37 5,27
4,76 4,67 4,57
4,30 •1
a»«« 1, 4,20 4,10
* *.*f
3,96 3,87 3,77
, • \ •,>,*p
3,72 3,62 3,52
3,53 3,43 3,33
■3,37 3,28 3,18
3,25 3,15 3,05
, *,
3,15 3,05 2,95
3,06 2,96 2,86
2,99 2,89 * 2,79 •4•
2,92 2,82 2,72
2,87 2,77 «2,674
2,82 2,72 2,62 2,33 2,27 2,20
T a b le V L e s q u a n t it é s d e la lo i d e F is h e r a v e c a = 0 , 0 2 5 * (su ite )

F,0,025; v.,,, v 2

v, Nombre de degrés de liberté du numérateur ( v ,)

1 2 3 4 5 6 7 8 9 10 12 15 20 24 ♦
30 40 60 120 00
, .) •
20 5,87 4,46 3,86
/ •
3 , 51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46
1
2,41 2.35 2,29 2.22 2,16 2,09

21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,42 2,37 2,31 2,25 2,18 2,11 2,04

M 22 5,79 4,38 3,78 3,44 3,22 3,05
•. \ '
2,93
■*V
2,84 2,76 2,70 2,60 2,50 2,39 2,33 2,27 2,21 2,14 2,08 2.00
U.
<U 23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,36 2,30 2,24 2,18 2,11 2,04 1,97
G 9 0]
aO 24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64
, t 2,54 2,44 2,33 2,27 2,15 2,08 2,01 1.94

'-o
O c 2,68
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,61 2,51 2,41 2,30 2,24 2,18 2,12 2,05 1,98 1,91

26 5,66 4,27 3,67 3.33 3.10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,28 2 22 2,16 2,09 2,03 1,95 1,88
'S
c
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,25 2,19 2,13 2,07 2,00 1,93 1,85
0
>
*0 28 5,61 4,22 3,63 3,29 3.06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,23 2,17 2,11 2,05 1,98 1,91 1,83
CO t *
'S
W ) 29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,21 2,15 2,09 2,03 1,96 1,89 1,81
a) CD
<o 30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,5 ! 2,41 2,31 2,20 2,14 2,01 </>
X) 2,07 1,94 1,87 1,79 JQ
Xa 40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 2,01 1,94 1,88 1,80 1,72 1,64
Û)
a
O CD
Z 60 5,29 3,93 3,34 3,01 2,79 2.63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1.88 1,82 1.74 1.67 1,58 1,48 en
Ql
CD
120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,76 1,69 1,61 1,53 1,43 1,31 oT
OC 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2.05 1,94 1,83 1,71 1,64 1,57 1,48 1,39 1,27 1,00 O
Q.
CD
*n
Densité K * Les valeurs figurant dans cette table sont les quantités F 0025. tels que P (F > 025;»,.^) = 0 ,025 , où ~ F V|,Vj. (/)'
CD
Û
<>
CD
O
«
0 F ,0,025 ; v,, v2 II
O
O
N)
en
Table V Les quantités de la loi de Fisher 0.01 #

F
r 0,01 ; v,, v2 >
00
1 Nombre de degrés de liberté du numérateur (v,) m
2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 00
4052 4999,5 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
98,50 99.00 99,17 99.25 99,30 99,33 99,36 99,37 99,39. 99.40 99,42 99,43 99,45 99,46 99.47 99,47 99,48 99,49 99,50
34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
21,20 18,00 16.69 15.98 15,52 15,21
»•

i
14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75
» • v * , •
13,65 13,56 13,46
* • \ * t

16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05
Nombre de degrés de liberté dudénominateur (v2)

9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02


6 13,75 10,92
, • %

9,78
v . • / 1 a t

9.15 8,75 8,47 8,26 8,10 7.98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
8 11,26 8.65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86 a ^ • , ,
/ * * . \ 4 a *• / ' ,

9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31
%

10 10,04 7.56 6,55 5,99 5,64 5,39 5.20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91 h K
* , / i

11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,1 4,02 3,94 3,86 3,78 3,69 3,60
12 9,33 6.93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4.01 3,86 3.78 3,70 3,62 3,54 3,45 3,36 •

13
* • k a a 1

9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17 m

14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00 g ,

15 8,68 6,36 5,42 4,89 4,36 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87
16
* /

8,53 6,23 5,29 4,77 4,44 4,20


00

4,03 3,89
j

3,69
V

3,55 3,41 3,26 3,18 3,10 3,02 2.93 2,84 2,75


17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65
18 8,29 6,01 5,09 4,58 4.25 4,01 3,84 3.71 3,60
•■
3,51 3,37 3,23 3.08 3,00 2,92 2,84 2,75 2.66 2,57
8,18
i

19 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2.76 2.67 2.58 7 5Q
i > * , * *

Table V Les quantiles de la loi de Fisher avec #= #


0,01 [suite)

F0,01 ; v„i*V
2
Nombre de degrés de liberté du dénominateur (v2)

Lesquantilesdelaloi deFisheraveca - 0,01


Densité F. * Les valeurs figurant dans cette table sont les quantiles F001.v Vjtels que P(F> Fom.v ) = 0,01 où
* * t* 2 ^ V
Vvvt

0 F0.01;
GRAPHIQUE VI

Graphique VI Courbes caractéristiques pour ies tests d'hypothèses


à unet deux échantillons

a) Courbes caractéristiques du test bilatéral normal avec a = 0,05


- Test sur une moyenne : d est défini à la page 293.
- Test sur une différence de moyennes : d est défini à la page 309.

b) Courbes caractéristiques du test bilatéral normal avec a - 0,01


- Test sur une moyenne : d est défini à la page 293.
- Test sur une différence de moyennes : d est défini à la page 309.
Courbes caractéristiques pour les tests d'hypothèses à un et deux échantillons

Graphique VI Courbes caractéristiques pour lestests d'hypothèses


à un et deux échantillons {suite)

c) Courbes caractéristiques du test unilatéral normal avec a = 0,05


- Test sur une moyenne : d est défini à la page 293.
- Test sur une différence de moyennes : d est défini à la page 310.

d) Courbes caractéristiques du test unilatéral normal avec a = 0,01


- Test sur une moyenne : d est défini à la page 293.
- Test sur une différence de moyennes : d est défini à la page 310.
GRAPHIQUE VI

Graphique VI Courbes caractéristiques pour Sestests d'hypothèses


à unet deux échantillons (suite)

e) Courbes caractéristiques du test t bilatéral avec a - 0,05


- Test sur une moyenne : d est défini à la page 299.
- Test sur une différence de moyennes : d est défini à la page 314.

f) Courbes caractéristiques du test bilatéral avec a = 0,01


- Test sur une moyenne : d est défini à la page 299.
- Test sur une différence de moyennes : d est défini à la page 314.
Courbes caractéristiques pour les tests d'hypothèses à un et deux échantillons

Graphique VI Courbes caractéristiques pour les tests d'hypothèses


deux échantillons
1,00
0 ,9 0

0 ,8 0
c3
C/3 0 ,7 0
CJ
Xc 0 ,6 0
X
a> 0 ,5 0

!/î
cz 0 ,4 0
<D
Z,
K 0 ,3 0

0,20
0,10
0
-0 ,8 -0 ,6 -0 ,4 -0 ,2 0 0 ,2 0 ,4 0 ,6 0 ,8 1 ,0 1,2 1,4 1 ,6 1,8 2 ,0 2 ,2 2 ,4 2 .6 2 .8 3 ,0 3 .2

d
g) Courbes caractéristiques du test t unilatéral avec a = 0,05
- Test sur une moyenne : d est défini à la page 300.
- Test sur une différence de moyennes : d est défini à la page 314
1,00
0 ,9 0

H
cd
0 ,8 0

C/3 0 ,7 0
a>
Xc 0 ,6 0
X
o
H
£
<D
0 ,5 0
i-H

C/3
CZ 0 ,4 0
<D
Z 0 ,3 0
ST
n
0,20
0,10
0
-0 ,8 -0 ,6 -0 ,4 -0 ,2 0 0 ,2 0 ,4 0 ,6 0 ,8 1,0 1,2 1,4 1 ,6 1,8 2 ,0 2 ,2 2 ,4 2 ,6 2 ,8 3 ,0 3 ,2

d
h) Courbes caractéristiques du test î unilatéral avec 0,01
- Test sur une moyenne : d est défini à la page 300.
- Test sur une différence de moyennes : d est défini à la page 314
GRAPHIQUE VI

Graphique VI Courbes caractéristiques pour les tests d'hypothèses


à unet deux échantillons (suite)
1,00
0,90

0,80

0,70

0,60

0,50

0,40

0,30

0,20
0,10
0

i) Courbes caractéristiques du test bilatéral sur une variance avec a = 0,05


- Aest défini à la page 302.

•a
t/3
<L>
JEC
en
S
<0
*ÊT
3
<L>
Z
K
h

j) Courbes caractéristiques du test bilatéral sur une variance avec = 0,01


- A est défini à la page 302.
Courbes caractéristiques pour les tests d’hypothèses à un et deux échantillons 531

Graphique VI Courbes caractéristiques pour lestests d'hypothèses


à un et deux échantillons (suite)

k) Courbes caractéristiques du test unilatéral (à droite) sur une variance avec a = 0,05
- X est défini aux pages 302 et 303.

I) Courbes caractéristiques du test unilatéral (à droite) sur une variance avec a - 0,01
- X est défini aux pages 302 et 303.
à un et deux échangions
thèses
\es tests tf hVP°
cténst'Ques Pour
Courbes cara
tests d'hVpo
. -,«tiQues
r a c te t's J}
P ° ° !
(su ite!
'f
C o u rP e * c *"a é c t t a ^ '" ooS (*
et deo*
G ra p*»,c»u e

%0 4’°°

ariances avec
de deux
bilatéral sur

- “ - r i - « « r“ ■

avances avec
Végalité de deux
bilatéral sur
énsüques du test
Courbes caract 32t.
P) défini à Vapage
_ lest
GRAPHIQUE VI

Graphique V I Courbes caractéristiques pour les tests d'hypothèses


à un et deux échantillons [suite)
1,00

0 ,8 0
(U
2>

X 0 ,6 0
af
Vu.

V
a?
u.
O
ajC
Cu 0 ,4 0
U
Z
ST
II
0,20

0
1 2 3 4
A
q) Courbes caractéristiques du test unilatéral sur l’égalité de deux variances avec # = 0,05
- A est défini à la page 321.

0 1,00 2 ,0 0 4 ,0 0 5 ,0 0 8 ,0 0 1 0 ,0 0 1 2 ,0 0 1 4 ,0 0 1 6 ,0 0
2
r) Courbes caractéristiques du test unilatéral sur l’égalité de deux variances avec a = 0,01
- A est défini à la page 321.
Sources: C.L. Ferris, F.E. Grubbs et C.L. Weaver, Juin 1946, «Operating characteristics for the common statistical
tests of significance », Annals of Mathematical Statistics, pour les courbes en a), e), f), k), m) et q). A.H. Bowker et
G.J. Lieberman, 1972, Engineering Statistics, 2e éd. Englewood Cliffs (N.J.) : Prentice-Hall, pour les courbes
en b), c), d), g), h), i), j), 1), n), o), p) et r).
Table V II Les quantités de la distribution de l'étendue studentisée avec a - 0,01 *
tfo.OI \ p j

/ 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 90,0 135 164 186 202 216 227 *
237 246 253 260 266 272 272 282 286 290 294 298
2 14,0 19,0 22,3 24,7 26,6 28,2 29,5 30.7 31,7 32,6 33,4 31,4 34,8 35,4 36,0 36,5 37,0 37,5 37,9
3 8,26 10,6 12,2 13,3 14,2 15,0 15,6 16,2 16,7 17,1 17,5 17,9 18,2 18,5 18,8 19,1 19,3 19,5 19,8
4 6,51
$
8,12 9,17 9,96 10,6 11,1 11,5 11,9 12,3 12,6 12,8 13,1 13,3 13,5 13,7 13,9 14,1 14,2 14,4
5 5,70 6,97 7,80 8,42 8,91 9,32 9,67 9,97 10,24 10,48 10,70 10,89 11,08 11,24 11,40 11,55 11,68 11,81 11,93
6 5,24 6,33 7,03 7,56 7,97 8,32 8,61 8.87 9,10 9,30 9,49 9,65 9,81 9,95
»
10,08
y 10,21 10,32 10,43 10.54
7 4,95 5,92 6,54 7,01 7,37 7,68 7,94 8,17 8,37 8,55 8,71 8,86 9,00 9,12 9,24 9,35 9,46 9,55 9,65
8 4,74 5,63 6,20 6,63 6,96 7,24 7,47 7,68 7.87 8,03 8,18 8,31 8,44 8,55 8,66 8,76 8,85 8,94 : 9,03
9 4.60 5,43 5,96 6,35 6,66 6,91 7,13 7,32 7,49 7,65 7,78 7,91 8,03 8,13 8,23 8,32 8,41 8,49 8,57
10 4,48 5,27 5,77 6,14 6,43 6,67 6,87 7,05 7,21 7,36 7,48 7,60 7,71 7,81 7,91 7,99 8,07 8,15 S.22
11 4,39 5,14 5,62 5,97 6,25 6,48 6,67 6,84 6,99 7,13 7,25 7,36 7,46 7,56 7,65 7,73 7,81 7,88 7,95
12 4,32 5,04 5,50 5.84 6,10 6,32 6,51 6,67 6,81 6.94 7,06 7.17 7,26 7,36 7,44 7,52 7,59 7,66 .7.73
13 4,26 4,96 5,40 5,73 5,98 6,19 6,37 6,53 6,67 6,79 6,90 7,01 7,10 7,19 7,27 7,34 7,42 7,48 7,55
14 4,21 4,89 5,32 5,63 5,88 6,08 6,26 6.41 6,54 6,66 6,77 6,87 6,96 7,05 7,12 7,20 7,27 7.33 7,39
15 4,17 4,83 5,25 5,56 5,80 5,99 6,16 6,31 6,44 6,55 6,66 6,76 6,84 6,93 7,00 7,07 7,14 7,20 7,26
16 4,13 4,78 5,19 5,49 5,72 5,92 6,08 6,22 6,35 6,46 6,56 6,66 6,74 6,82 6,90 6,97 7,03 7,09 7,15
17 4,10 4.74 5,14 5,43 5,66 5,85 6,01 6,15 6,27 6,38 6,48 6,57 6,66 6,73 6,80 6,87 6,94 7,00 7,05
18 4,07 4,70 5,09 5,38 5,60 5,94 6,08 6,20 6,31 6.41 6,50 6,58 6,65 6,72 6,79 6,85 6.91 6,96
5,79
19 4,05 4,67 5,05 5,33 5,55 5,73 5,89 6,02 6,14 6,25 6,34 6,43 6,51 6,58 6,65 6,72 6,78 6,84 6,89
20 4,02 4,64 6,09 6,19 6,29 6,37 6,45 6 5"> 6,59 6,65 6,71 6,76
5,02 5,29 5,51 5,69 5,84 5,97 6,82
24 3,96 4,54 4,91 5,17 5,37 5,54 5,69 5,81 5,92 6,02 6,11 6,19 6,26 6,33 6,39 6,45 6,51 6,56 6.61
5,85 5 93 6.01 6,08 ATA 6,26 6,31
30 3,89 4,45 4.80 5,05 5,24 5,40 5,54 5,65 5,76 6,36 6,41
4,37 4,70 5,50 5,60 5.69 5,77 5,84 5,90 6,02 6,07 6,12 6,17
40 3,82 4,93 5,11 5,27 5,39 6,21
5.45 5 53 5,60 5,67 V /I
5,89 5 9}
60 3,76 4,28 4,60 4,82 4,99 5,13 5,25 5,36 ; «b * ^ V *
5.98 6,02
120 5,21 5,30 5,38 5,44 5,51 5,56 5,6» 5,66 5,71 5,75
3,70 4,20 4,50 4,71 4,87 5,01 5,12 5,79 5,83
5,23 5,29 5 35
OC 3,64 4,12 4.40 4,60 4,76 4.88 4.99 5,08 5,16 lin II r
5,54 5,57 5,61 5,65
* f - le nombre de degrés de liberté associés à l’erreur
p - le nonibre de moyennes à comparer
T a b le V N Les quantiles de la distribution de I avec #= 0,05 #

4 0.05-, p , f

1 18,1 26,7 32,8 37,2 40,5 43,1 45,4 47,3 49,1 50,6 51,9 53,2 54,3 55,4 56,3 57,2 58,0 58,8 59,6
2 6,09 8,28 9,80 10,89 11,73 12,43 13,03 13,54 13,99 14,39 14,75 15,08 15,38 15,65 15,91 16,14 16,36 16,57 16,77
3 4,50 5,88 6,83 7,51 8,04 8,47 8,85 9,18 9,46 9,72 9,95 10,16 10,35 10,52 10,69 10,84 10,98 11,12 11.24
4 3,93 5,00 5,76 6,31 6,73 7,06 7,35 7,60 7,83 8,03 8,21 8,37 8,52 8,67 8,80 8.92 9.03 9,14 9.24
5
r 1

3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99 7,17 7,32 7,47 7,60 7,72 7,83 7.93 8.03 8,12 8,21
«

6 3,46 4,34 4,90 5,31 5,63 5,89 6,12 6,32 6,49 6.65 6,79 7.59
6,92 7,04 7.14 7.24 7,34 7,43 7,51
7 3,34 4,16 4,68 5,06 5,35 5,59 5,80 5,99 6,15 6,29 6,42 6,54 6,65 6,75 6,84 6,93 7,01 7,08 7,16
* 1 # -- , ■

8 3.26 4.04 4,53 6,05


V .- v 11
4,89 5,17 .
5,40
» r
5,60 5,77 5,92 ■
6,18 6,29 6,39 6,48 6,57 6,65 6,73 6.80 6,87
9 3,20 3,95 4,42 4,76 5,02 5,24 5,43 5,60 5,74 5,87 5,98 6,09 6,19 6,28 6,36 6,44 6,51 6,58 6,65
, , «

10 3,15 3,88 4,33 5,12 5,30


4,66 4,91 . ,« >
5,46 .
5,60 , »■• ■ - ,
5,72 5,83 5,93 6,03 6,12 •; 6,20 6,27 *
6,34 6,41 , 6,47
11
%

3,11
4

3,82 4,26 4,58 4,82 5,03 5,20 5,35 5,49 5,61 5,71 5,81 5,90 5,98 6,06 6,14 6,20 6,27 6,33
. * * 4 . • * . . . . • •

12 3,08 3,77 4,20 5,40 ■ 5.51 : 5,61


4 . 51 4.75 4,95 •» •-.
5,12 ' 5,27 • t , ■
5,71
’• •
5,80 i yy
5,88 . îÿ
5,95 6,02 6,09
4
6,15 6,21
13
.. .

3,06 3,73 4,15 4,46 4,69 4,88 • ■


5,05 , i ■•
5,19 5,32 5,43 5,53 5,63 5,71 5,79 5,86 5,93 6,00 6,06 6,11
14 3,03 3,70 4,11 4,41 5,36 5,46
4,64 4,83 4,99 5,13 5,25 5,56 5,64 5.72 5,79 5.86 * ,
1 4
5,92 .
5,98
•. Y «' -
6,03
15
• -

3,01 3,67 4
4,08 4,37 4,59 4,78 4,94 5,08 5,20 5,31 •
5,40 5,49 5,57 5,65 5,72 5,79 5,85 5,91 5,96
. • * > • . ■

16
t .

3,00
.

3,65 4,05 4,34 4,56 4,74 4,90 5,03 5,15 5,26 < 5,35 5,44 5,52 5,59 5,66 5 ,73 . 5,79 5,84 5,90
••

17 2,98 3,62 4,02 4,31 4,52 4,70 4,86 4,99 5,11 5,21 5,31 5,39 5,47 5,55 5,61 5,68 5,74 5,79 5,84
'• 'V- ' ‘ .• ■. . ■ ■ • »• , ,, • .i.
'. y ' ÿ • - y , . ••

18 2,97 3,61 4,00 4,28 5,07 5,17 5,35


4,49 • 4,67 4,83 4,96 5,27 5,43 5,50 5,5 7 ' 5,63 5,69 5,74 ' 5,79
19 2,96 3,59 3,98 4,26 4,47 4,64 4,79 4,92 5,04 5,14 5,23 5,32 5,39 5,46 5,53 5,59 5,65 5,70 5,75
* , « ; , . 4

20 2,95 3,58 3,96 4,24 4,45


> .ii .
4,62 > *
• *.
4,77 4,90 5,01 5,11 / 1
5,20 5,28

5,36
• ' s ;

5,43 5,50 • « .
5,56 i % ?
5,61 5,66 t
5 ,71
24
.• : v . * . * :

2,92 3,53 3,90 4,37 4,17 4,54 4,68 4,81 4,92 5,01 5,10 5,18 5,25 5,32 5,38 5,44 5,50 5,55 5,59
30 2,89 3,48 3,84 4,30 4,11 4,46 4,60 S 4,72 4,83 4,92 < - 1 ,
5,00 * * .
, »
* '
a
» *
5,08 5,15 #
5,21
. 9 ■ •
5 ,2 7 . 5,33 • , . t
5,38 5,43 5,48
40 2,86 3,44 3,79
• • ‘ S

■ *
4,23
■ V■
4,04 • ,
4,39 4,52 4,63 4,74 4,82 4,90 4,98 5,05 5,11 5,17 5,22 5,27 5,32 5,36
• V .

60 2,83 3,40 3,74 3,98 .


4,16■- -r *• . . . t . • •S .-
4,31 ■ ‘ k
4,44 v. - • * ■ ^f . •.
4,65 4,73 4,81 4,88 4,94 5,00 5,06 5,11 5,15 5,20 5.24
20 2,80 3,36 3,69 3,92 4,10 4,24 4,36 4,47 4,56 4,64 4,71 4,78 4,84 4,90 4,95 5,00 5,04 5,09 5,13
• ••'» • ' , * - ' * i . * • ■ . ' > . • > , . ,

00 2,77 3,32 4,03 4,17


3,63■ «
3,86 4,29 4,39 4,47 4,55 4,62
__________ !
4,68 4,74 4,80 4,84 4,98 4,93 4,97 5,01
f -lenombre de degrés de liberté associés à l’erreur
p= le nombre de moyennes à comparer
Source: J.M. May, 1952, «Extended and corrected ta! -193. Table reproduite avec l’autorisation des admi-
nistrateurs de Biometrika.
Les valeurs du facteur kassociées aux intervalles de tolérance

Table V III Les valeurs du facteur associées aux intervalles


de tolérance

Intervalles de tolérance
table IX

Table IX Nombresaléatoires
10480 15011 01536 69179 14194 62590
02011 81647 91646
22368 46573 25595 27982 53402 93965
85393 30995 89198
24130 48360 22527 15179 24830 49340
97265 76393 64809
42167 93093 06243 16376 39440 53537 71341
61680 07856
37570 39975 81837 06121 91782 60468 81305 49684
16656
77921 06907 11008 53498 18602 70659 90655
4275,1 27756
99562 72905 56420 69994 98872 31016 71194 18738 44013
96301 91977 05463 07972 18876 20922 94595 56869 69014
89579 14342 63661 10281 17453 18103 57740 84378 25331
85475 36857 53342 53988 53060 59533 38867 62300 08158
28918 69578 88231 33276 70997 79936 56865 05859 90106
63553 40961 48235 03427 49626 69445 18663 72695 52180
09429 93969 52636 92737 88974 33488 36320 17617 30015
10365 61129 87529 85689 48237 52267 67689 93394 01511
07119 97336 71048 08178 77233 13916 47564 81056 97735
51085 12765 51821 51259 77452 16308 60756 92144 49442
02368 21382 52404 60268 89368 19885 55322 44819 01188
01011 54092 33362 94904 31273 04146 18594 29852 71585
52162 53916 46369 58586 23216 14513 83149 98736 23495
07056 97628 33787 09998 42698 06691 76988 13602 51851
48663 91245 85828 14346 09172 30168 90229 04734 59193
54164 58492 22421 74103 47070 25306 76468 26384 58151
32639 32363 05597 24200 13363 38005 94342 28728 35806
29334 27001 87637 87308 58731 00256 45834 15398 46557
02488 33062 28834 07351 19731 92420 60952 61280 50001
81525 72295 04839 96423 : 24878 82651 66566 14778 76797
29676 20591 68086 26432 46901 20849 89768 81536 86645
00742 57392 39064 66432 84673 40027 32832 61362 98947
05366 04213 25669 26422 44407 44048 37937 63904 45766
91921 26418 64117 94305 26766 25940 39972 22209 71500
00582 04711 87917 77341 42206 35126 74087 99547 81817
00725 69884 62797 56170 86324 88072 76222 36086 84637
69011 65795 95876 55293 18988 27354 26575 08625 40801
25976 57948 29888 88604 67917 48708 18912 82271 65424
09763 83473 73577 12908 30883 18317 28290 35797 05998
91567 42595 27958 30134 04024 86385 29880 99730 55536
17955 56349 90999 49127 20044 59931 06115 20542 18059
46503 18584 18845 :;‘- 49618 02304 51038 20655 58727 , 28168
92157 89634 94824 78171 84610 82834 09922 25417 44137
14577 62765 35605 81263 39667 47358 56873 56307 61607
98427 07523 33362 64270 01638 92477 66969 98420 04880
34914 63976 88720 82765 34476 17032 87589 40836 32427
70060 28277 39475 46473 23219 53416 94970 25832 69975
53976 54914 06990 67245 68350 82948 11398 42878 80287
76072 29515 40980 07391 58745 25774 22987 80059 39911
90725 52210 83974 29992 65831 38857 50490 83765 55657
64364 67412 33339 31926 14883 24413 59744 92351 97473
Agresti, A., et Coull, B. (1998). Approximate is better Daniel, C., et Wood, F.S. (1980). Fitting Equations
than «exact» for interval estimation of binomial to Data (2e éd.). New York: John Wiley & Sons.
proportions. TheAmerican 52(2).
Davenport, W.B., et Root, W.L. (1958). An
Anderson, V.L., et McLean, R.A. (1974). Design o f Introduction to the Theory of Random Signais
Experiments: A prN
Realistic A ew York: and Noise. New York : McGraw-Hill.
Marcel Dekker. Draper, N.R., et Hunter, W.G. (1969). Transformations :
Banks, J., Carson, J.S., Nelson, B.L., et Nicol, D.M. Some examples revisited. Technometrics, II, 23-40.
(2001). Discrete-Event System Simulation (3e éd.). Draper, N.R., et Smith, H. (1998). Applied Régression
Upper Saddle River (N.J.): Prentice-Hall. Analysis (3e éd.). New York: John Wiley & Sons.
Bartlett, M.S. (1947). The use of transformations. Duncan, A.J. (1986). Quality Control and Industrial
B i o m é t r i e s ,3, 39-52. Statistics (5e éd.). Homewood (111.) : Richard D. Irwin.
Bechhofer, R.E., Santner, T.J., et Goldsman, D. (1995). Duncan, D.B. (1955). Multiple range and multiple
Design and Analysis o f Experiments fo r Statistical F tests. Biométries, II, 1-42.
Sélection, Screening and Multiple Comparisons. Efron, B., et Tibshirani, R. (1993). An Introduction
New York: John Wiley & Sons. to the Bootstrap. New York : Chapman and Hall.
Belsley, D.A., Kuh, E., et Welsch, R.E. (1980). Régression Elsayed, E. (1996). Reliability Engineering. Reading
Diagnostics. New York : John Wiley & Sons. (Mass.) : Addison Wesley Longman.
Berrettoni, J.M. (1964). Practical applications of the English, J.R., et Taylor, G.D. (1993). Process capability
Weibull distribution. Industrial Quality Control, analysis : A robustness study. International
21(2), 71-79. Journal o f Production Research, 31(7).
Bowker, A.H., et Lieberman, G.J. (1972). Engineering Sta- Epstein, B. (1960). Estimation from life test data.
tistics (2eéd.). Englewood Cliffs (N.J.) : Prentice-Hall. IRE Transactions on Reliability, RQC-9.
Box, G.E., et Cox, D.R. (1964). An analysis of Feller, W. (1968). An Introduction to Probability
transformations. Journal o f the Royal Statistical Theory and its Applications (3e éd.). New York:
Society, B26, 211-252. John Wiley & Sons.
Box, G.E., et Müller, M.F. (1958). A note on the Ferris, C.L., Grubbs, F.E., et Weaver, C.L. (1946).
génération of normal random deviates. Annals Operating characteristics for the common
o f Mathematical Statistics, 29, 610-611. statistical tests of significance. Annals o f
Bratley, P., Fox, B.L., et Schrage, L.E. (1987). A Guide Mathematical Statistics, 17(2), 178-197.
to Simulation (2e éd.). New York: Springer-Verlag. Fishman, G.S. (1978). Principles o f Discrète Event
Cheng, R.C. (1977). The génération of gamma Simulation. New York : John Wiley & Sons.
variables with nonintegral shape parameters. Furnival, G.M., et Wilson, Jr., R.W. (1974). Régression
Applied Statistics, 26(1), 71-75. by leaps and bounds. Technometrics, 16, 499-512.
Cléments, J.A. (1989). Process capability calculations Hahn, G., et Shapiro, S. (1967). Statistical Models in
for non-normal distributions. Quality Progress, Engineering. New York : John Wiley & Sons.
22(9), 95-100. Hald, A. (1952). Statistical Theory with Engineering
Cochran, W.G. (1947). Some conséquences when the Applications. New York : John Wiley & Sons.
assumptions for the analysis of variance are not Hawkins, S. (1993). Cumulative sum control charting:
satisfied. Biométries, 3, 22-38. An underutilized SPC tool. Quality Engineering,
Cochran, W.G. (1977). Sampling Techniques (3eéd.). 5, 463-477.
New York : John Wiley & Sons. Hocking, R.R. (1976). The analysis and sélection of
Cochran, W.G., et Cox, G.M. (1957). Experimental variables in linear régression. Biométries, 32, 1-49.
Designs. New York : John Wiley & Sons. Hocking, R.R., Speed, F.M., et Lynn, M.J. (1976).
Cook, R.D. (1977). Détection of influential observations A class of biased estimators in linear régression.
in linear régression. Technometrics, 19, 15-18. Technometrics, 18, 425-437.
Cook, R.D. (1979). Influential observations in linear Hoerl, A.E., et Kennard, R.W. (1970a). Ridge
régression. Journal o f the American Statistical régression : Biased estimation for non-orthogonal
Association, 74, 169-174. problems. Technometrics, 12,55-67.
Crowder, S. (1987). A simple method for studying Hoerl, A.E., et Kennard, R.W. (1970b). Ridge
run-length distributions of exponentially weighted régression : Application to non-orthogonal
moving average charts. Technometrics, 29,401-407. problems. Technometrics, 12,69-82.
BIBLIO G RAPH IE

Kelton, W.D., et Law, A.M. (1983). A new approach for in terms of an independent estimate of standard
dealing with the startup problem in discrète event déviation. Biometrika, 31, 20.
simulation. Naval Research Logistics Quarterly, Odeh, R., et Owens, D. (1980). Tables fo r Normal
30, 641-658. Tolérance Limits, Sampling Plans, and Screening.
Kendall, M.G., et Stuart, A. (1963). The Advanced New York : Marcel Dekker.
Theory of Statistics. New York: Hafner Publishing Owen, D.B. (1962). Handbook o f Statistical Tables.
Company. Reading (Mass.) : Addison-Wesley Publishing
Keuls, M. (1952). The use of the studentized range Company.
in connection with an analysis of variance. Page, E.S. (1954). Continuous inspection schemes.
Euphytics, 1,112. Biometrika, 14, 100-115.
Kotz, S., et Lovelace, C.R. (1998). Process Capability Pearson, E.S., et Hartley, H.O. (1966). Biometrika
Indices in Theory and Practice. London : Arnold. Tables for Statisticians, 1 (3e éd.). Cambridge :
Law, A.M., et Kelton, W.D. (2000). Simulation Modeling Cambridge University Press.
and Analysis (3eéd.). New York: McGraw-Hill. Pearson, E.S., et Hartley, H.O. (1972). Biometrika
Lloyd, D.K., et Lipow, M. (1972). Reliability: Tables for Statisticians, 2. Cambridge : Cambridge
Management, Methods, and Mathematics, University Press.
Englewood Cliffs (N.J.): Prentice-Hall. Roberts, S. (1959). Control chart tests based on
Lucas, J., et Saccucci, M. (1990). Exponentially weighted géométrie moving averages. Technometrics,
moving average control schemes : Properties and 1, 239-250.
enhancements. Technometrics, 32, 1-12. Rodriguez, R.N. (1992). Recent developments in
Luceno, A. (1996). A process capability ratio with process capability analysis. Journal o f Quality
reliable confidence intervals. Communications in Technology, 24.
Statistics: Simulation and Computation, 25(1). Scheffé, H. (1953). A method for judging ail
Marquardt, D.W., et Snee, R.D. (1975). Ridge régression contrasts in the analysis of variance. Biometrika,
in practice. The American Statistician, 29,3-20. 40, 87-104.
May, J.M. (1952). Extended and corrected tables of the Shapiro, S.S. (1980). How to Test Normality and
upper percentage points of the studentized range. Other Distributional Assumptions, 3. The ASQC
Biometrika, 39, 192-193. Basic References in Quality Control : Statistical
Montgomery, D.C. (2001). Design and Analysis of Techniques, ASQC, Milwaukee (WI).
Experiments (5eéd.). New York: John Wiley & Sons. Snee, R.D. (1977). Validation of régression models :
Montgomery, D.C. (2001). Introduction to Statistical Methods and examples. Technometrics, 19(4),
Quality Control (4eéd.). New York: John 415-428.
Wiley & Sons. Somerville, S.E., et Montgomery, D.C. (1996). Process
Montgomery, D.C., Peck, E.A., et Vining, G.G. (2001). capability indices and nonnormal distributions.
Introduction to Linear Régression Analysis Quality Engineering, 9(2).
(3e éd.). New York: John Wiley & Sons. Tucker, H.G. (1962). An Introduction to Probability
Montgomery, D.C., et Runger, G.C. (1993a). Gauge and Mathematical Statistics. New York : Academie
capability and designed experiments : Part I : Basic Press.
methods. Quality Engineering, 6. Tukey, J.W. (1953). The problem of multiple comparisons.
Montgomery, D.C., et Runger, G.C. (1993b). Gauge [Notes non publiées], Princeton University.
capability analysis and designed experiments : Tukey, J.W. (1977). Exploratory Data Analysis.
Part II : Experimental design models and variance Reading (Mass.) : Addison-Wesley.
component estimation. Quality Engineering, 6. United States Department of Defense. (1957). Military
Montgomery, D.C., et Runger, G.C. (2003). Applied Standard Sampling Procedures and Tables fo r
Statistics and Probability for Engineers (3eéd.). Inspection by Variables fo r Percent Defective
New York : John Wiley & Sons. (M1L-STD-414). Washington (D.C.): Government
Mood, A.M., Graybill, F.A., et Boes, D.C. (1974). Printing Office.
Introduction to the Theory of Statistics (3eéd.). Welch, D. (1983). The statistical analysis of simulation
New York : McGraw-Hill. results. The Computer Performance Modeling
Neter, J., Kutner, M., Nachtsheim, C., et Wasserman, Handbook, sous la direction de S. Lavenberg.
W. (1996). Applied Linear Statistical Models Orlando (Fl.) : Academie Press.
(4e éd.). Homewood (111.) : Irwin Press. White, C. (1952). The use of ranks in a test of
Newman, D. (1939). The distribution of the range significance for comparing two treatments.
in samples from a normal population expressed Biométries, 8, 37.
A intervalle de _, 253, 257, 260, Échantillon(s), 191
263, 265, 269,417 aléatoire simple, 191, 226
Absence de mémoire
Convergence, 246, 247 Échantillonnage, 21
de la loi exponentielle, 140 Effet
Correction pour la continuité,
de la loi géométrique, 118 d’un facteur, 368, 377
171, 172
propriété d’_, 118, 141 principal, 368
Corrélation, 97, 99, 176, 177,
Additivité Efficacité relative, 245
415
propriété d’_, 125, 163, 232 Ensemble(s), 2
coefficient de _, 97, 215, 415,
Analyse complémentaire d’un 4
416,418
de la variance, 344, 349, 402 intersection des 4
Courbes
de régression, 396, 400, 409 -puissance, 21
caractéristiques, 293
Appariement, 318 sous-_, 3, 21
de niveaux, 177
non-_, 318 union des , 4
Covariance, 97, 99 S

Epreuves de Bernoulli, 110, 115,


B 119, 125
D Équation de régression, 396
Biais, 243 Erreur
d’un estimateur, 243 Degré de confiance, 253,
de deuxième espèce, 284,
estimateur sans _, 243, 255, 256
292, 299
245,435 Dénombrement
de première espèce, 284, 285,
méthodes de _, 23
292
techniques de _, 16
quadratique moyenne, 245
c Densités
-type, 228
conditionnelles, 178 Espace(s) échantillonnal(aux),
Coefficient
marginales, 177 6, 8, 9, 16, 42, 43
d’aplatissement théorique, 214
Diagramme Espérance, 66, 87, 111
d’asymétrie théorique, 214
chronologique, 204 conditionnelle, 93, 94
de variation, 213
Coefficient de corrélation, 97, circulaire, 203 mathématique, 53, 65
215, 415, 416, 418 de dispersion, 194 Estimateur(s), 242, 403
de Pearson, 215 en arbre, 16 biais d’un _, 243
échantillonnai, 215, 416 en bâtons, 47, 202 combiné, 265
théorique, 415, 418 en boîte, 200, 346 convergence d’un _,
Coefficient de détermination, de Venn, 4, 5 246, 247
414 quantile-quantile, 203 du maximum de
multiple, 446 Distribution, 53 vraisemblance, 247, 250
Coefficient(s) de régression, conditionnelle, 23, 89, 93 du vecteur des coefficients
428, 437, 442, 448 échantillonnai, 227, 228, par les moindres carrés,
partiels, 429 232, 236,238 398,431,435
Combinaison, 19, 20 marginale, 84, 85, 87 erreur quadratique moyenne
de traitements, 377, 378 moments d’une _, 57 d’un _, 245
linéaire, 100, 102, 164 Distribution de probabilité, par la méthode des moments,
Complémentaire d’un 47,58 251
ensemble, 4 bivariée, 81, 84 ponctuels, 243
Conclusion sans biais, 243, 245, 435
faible, 285, 286, 287 Estimation
E
forte, 285, 286 de paramètres, 242, 349, 429
Confiance Écart-type, 55, 212 du coefficient de corrélation
degré de _, 253, 255, 256 échantillonnai, 212 échantillonnai, 416
INDEX

par intervalle de confiance, H gaussienne (voir Loi


252, 263, 406 normale)
Histogramme, 195, 197, 200 Loi binomiale, 112, 154, 169,
ponctuelle, 242, 247
de densité, 199 171,303
précision de l’_, 255, 256
Hypothèse (s) approximation de la _ par la
Étendue
nulle, 282-288, 348, 357 loi normale, 169, 262, 304
de l’échantillon, 213
statistiques, 282, 283 approximation de la _ par la
studentisée, 359
test d’_, 282-286, 288, 304 loi de Poisson, 127
Événement(s), 9
Hypothèse alternative, 282, approximation de la loi
indépendants, 27
286, 288 hypergéométrique par la _,
mutuellement exclusifs, 10 bilatérale, 286, 299, 306
mutuellement indépendants, 126
unilatérale, 289, 298, 301, négative ( voirLoi de Pascal)
29 304, 310, 317
Expérience aléatoire, 6, 8, 9, table de la _, 262
344, 346 Loi de Poisson, 123, 143, 262
I approximation de la loi
binomiale par la _, 127
F Individu, 191 propriété d’additivité de
Inférence statistique, 226, 242, la _, 125
Fonction (s) 282, 288,416 relation entre la loi
d’une variable aléatoire, 58 Intersection des ensembles, 4 exponentielle et la _, 138
de répartition, 44,46, 50, 53, Intervalle (s) Loi de Weibull, 145
135, 137, 146, 156 de prévision, 272, 439 relation entre la _ et la loi
gamma, 142 de tolérance, 274 exponentielle, 146
Fonction de densité Intervalle de confiance, 253, Loi du khi-carré, 230, 301, 302
conjointe de la loi normale 257, 260, 263, 265, 269, propriété d’additivité de
bivariée, 176 417, 437 la _, 232
d’une variable lognormale, estimation par _, 252, 263, Loi exponentielle, 137, 167
173 406 absence de mémoire de la _,
de la loi de Weibull, 145 pour l’ordonnée à 140
de la loi du khi-carré, 230 l’origine, 407 relation entre la _ et la loi
de la loi exponentielle, 137 pour la droite de régression, de Poisson, 138
de la loi F, 236 407 relation entre la loi de
de la loi gamma, 142 pour la pente, 406 Weibull et la _, 146
de la loi normale, 155 pour le coefficient de relation entre la loi gamma
de la loi t, 233 corrélation théorique, 418 et la _, 143
de la loi uniforme continue, Loi gamma, 142
134 relation entre la _ et la loi
Fonction de masse L exponentielle, 143
conditionnelle, 89 Loi (s) Loi géométrique, 116-117, 119
de la loi binomiale, 113 associatives, 5 absence de mémoire de la
de la loi de Pascal, 119 d’Erlang, 144 118
de la loi de Poisson, 123 d’identité, 5 Loi hypergéométrique, 120
de la loi hypergéométrique, de Bernoulli, 110, 167 approximation de la _ par
121 de De Morgan, 5 la loi binomiale, 126
Fréquence relative, 11 de Pascal, 119 Loi lognormale, 173
de probabilité continue, 134 propriétés de la _, 174
de probabilités discrètes, 110 Loi normale, 154, 158, 165, 166,
G
distributives, 5 171, 173, 297
Graphique du khi-deux ( Loi du approximation de la loi
de points, 193, 194, 197 khi-carré) binomiale par la _, 169
de probabilités, 203 F de Fisher, 236, 237, 319 bivariée, 176
INDEX

centrée réduite, 157, 158 méthode des _, 251, 252 Propriété d’absence de
propriété d’additivité de la _, théoriques, 251 mémoire, 118, 141
163 Moyenne, 205, 242 Propriété d’additivité
propriétés de la 155 Multicolinéarité, 448 de la loi de Poisson, 125
variance d’une _, 259 Multiplication de la loi du khi-carré, 232
Loi t de Student, 233, 234, 257, principe de _, 17, 19 de la loi normale, 163
265, 297, 315 Puissance
décentrée, 299 du test, 284, 286
Loi uniforme continue, 134 U ensemble-_, 21
moyenne et variance de la _, Non-appariement, 318
136 Notation
matricielle, 431
a
scalaire, 430 Quantile(s), 208
M
Nuage de points, 193 d’ordre y, 209
Maximum de vraisemblance de la loi du khi-carré. 23î
estimateurs du _, 247, 250 diagramme quantile-_, 203
méthode du 247, 249 P méthode de calcul de
Médiane, 207 Paramètre (s) probabilité et de _, 158
Mesures de dispersion, 209 de dispersion, 142, 145 théoriques, 204
Méthode (s) de forme 142, 145
de Bonferroni, 358 de position, 145
de dénombrement, 23
estimation de _, 242
R
de Fisher, 358 R2, 414
Partition, 30
de Tukey, 358
Permutation (s), 18, 19 ajusté, 447
des moindres carrés, 349,
d’objets semblables, 23 de base, 446
430, 431, 435
Plan, 22, 377 Région critique, 285, 287, 290
des moments, 251, 252
Plan (s) d’expériences, 344, 361 Région de rejet de H0, 283 (voir
du maximum de
complètement aléatoire, 348 aussi Région critique)
vraisemblance, 247, 249
déséquilibré, 354 Règle
Mode, 208
en blocs aléatoires de multiplication, 26
Modèle (s), 346
avec interactions, 429 complets, 361 de rejet, 288
d’analyse de la variance Plan (s) factoriel (s), 368, 376 Régression
à un facteur, 347, 355 2 \ 377, 383 analyse de _, 396, 400, 409
polynomiaux, 429 Population, 191, 283 équation de _, 396
Modèle à effets Postulat de normalité, 411 linéaire simple, 396, 397
aléatoires, 346 Prévision multiple, 428
fixes, 346 intervalles de _, 272, 439 polynomiale, 451
Modèle (s) de régression, 381, Principe de multiplication, test de signification de la _,
439, 446, 453 17, 19 400, 402
ajusté, 432 Probabilité(s), 1, 10 Résidu, 355
ajustement du _, 410 conditionnelle(s), 23, 26 Résidu (s) d’un plan
linéaire multiple, 428, 431 détermination d’une _, 12 2*, 381
linéaire simple, 397, 428 distribution de _, 47, 58 à blocs aléatoires, 366
polynomiale, 451 totales, 31 à deux facteurs, 375
résidus du 411,432, 449 Problème de Behrens-Fisher, Résidus du modèle de
Moments 315 régression, 411,432, 449
d’une distribution, 57 Processus de Poisson, 124, 138 linéaire multiple, 43
échantillonnaux, 251 Proportion multiple estimé, 449
estimateur par la méthode de succès, 39, 172, 322 Résultats équiprobables, 12,16
des _, 251 tests sur une _, 304 Risque, 284
544 INDEX

S général de signification de ordinale, 192


la régression, 444 qualitatives, 192, 203
Seuil partiel de signification pour quantitatives, 192, 217
correction du 358 un coefficient, 443 Variable(s) aléatoire(s), 42, 60,
de signification, 288 pour échantillons 191
du test, 284, 288 indépendants, 312 continue(s), 50, 63, 134, 145
observé, 285 puissance du 284, 286, discrètes, 47
Signification 292, 294 Variance(s), 53, 55, 87, 210,
pratique, 286 seuil du _, 284 242,319
statistique, 286 statistique du _, 283, 284, analyse de la _, 344, 349, 402
Somme des carrés, 443 351, 352, 362 conditionnelle, 93
additionnelle, 445 sur la variance, 300 d’un estimateur, 246
des résidus, 436 sur une proportion, 304 d’une constante, 67
due à l’erreur, 402 unilatéraux, 289, 298, 301, d’une loi de Bernoulli, 111
due à la régression, 402 308, 312, 320 de l’échantillon, 210, 211
due aux sous-totaux, 372 Test de signification de la loi binomiale, 114
Sous-ensemble(s), 3, 21 de la régression, 400,402,440 de la loi de Pascal, 120
Standardisation, 158 pour un coefficient, 443 de la loi de Poisson, 125
Statistique, 190, 227 pour un sous-ensemble de de la loi de Weibull, 147
descriptive, 191, 192 variables explicatives, 445 de la loi exponentielle, 139
du test, 283, 284, 351, 352, Test(s) t, 297 de la loi gamma, 144
362 appariés, 316, 318, 361 de la loi géométrique, 117
inférence _, 226, 242, 282, combiné, 312 de la loi hypergéométrique,
288, 416 Théorème 122
inférentielle, 191 central limite, 165 de la loi lognormale, 173
Succès de Bayes, 30-33 de la loi normale, 156, 259
proportion de _, 39, 172, 322 de Cochran, 352 de la loi uniforme, 136
du binôme, 20, 21 échantillonnale, 210
Tolérance homogénéité de la _, 411
T intervalle de _, 274 inconnue, 257, 265, 267, 297
Tableau intratraitements, 356
d’analyse de la variance, 353, modèle d’analyse
354 U de la _, 347
de contingence, 329, 332 Union des ensembles, 4 pour données groupées
(voir aussi Tableau de en classe, 217
fréquence) rapport des _, 238, 269
de fréquences, 195, 329 V tests sur la _, 300
Techniques de dénombrement, Valeur P, 288 Vecteur
16 Variabilité, 190 aléatoire, 78
Test (s) décomposition de la _, 349, continu, 81
bilatéral, 319, 322, 404, 405 350, 370 discret, 81
d’ajustement du khi-carré, 324 totale, 402 Vraisemblance, 247, 249
d’homogénéité, 332 Variable (s), 191 estimateur de maximum de _,
d’hypothèse, 282-286, 288, indicatrices, 453 247, 250
304 nominale(s), 192,454 fonction de _, 247
de Tukey, 359, 360, 365, 375 (voir aussi Variables méthode du maximum de _,
F partiel, 445 indicatrices) 247

Vous aimerez peut-être aussi