Académique Documents
Professionnel Documents
Culture Documents
3eédition
WILLIAM W. HINES
School of Industrial and Systems Engineering
Georgia Institute of Technology
DOUGLAS C. MONTGOMERY
Department of Industrial Engineering
Arizona State University
DAVID M. GOLDSMAN
School of Industrial and Systems Engineering
Georgia Institute of Technology
CONNIE M. BORROR
Department of Industrial Engineering
Arizona State University
Adaptation française
Emmanuelle Reny-Noiin
Département de mathématiques et de statistique
Université Laval
Révision scientifique
Luc Adjengue
Département de mathématiques
et de génie industriel
École Polytechnique de Montréal
CHENELIÈRE
EDUCATION
* » fl
e manuel est une adaptation de Probability and Statistics in Engineering, Fourth Edition
C de Hines, Montgomery, Goldsman et Borror. Il s’adresse aux étudiants inscrits à un
programme de baccalauréat en génie ou en sciences qui doivent suivre un premier cours de
probabilités et de statistique. La première partie de cet ouvrage est une solide introduction à
l’étude des probabilités, suffisante pour étudier les principales méthodes statistiques qui cons
tituent la deuxième partie.
première partie est composée
variables
aléatoire, et le chapitre 3 porte sur les distributions conjointes. Les chapitres 4 et 5 traitent
respectivement des lois de probabilité discrètes et des lois de probabilité continues, et le cha
pitre 6 étudie la loi normale.
La seconde partie comporte les sept chapitres subséquents. L’étude de la statistique débute
au chapitre 7 avec la statistique descriptive. Les distributions échantillonnais sont analysées au
chapitre 8, l’estimation de paramètres au chapitre 9, les tests d’hypothèses au chapitre 10, puis
l’analyse de la variance et les plans d’expériences au chapitre 11. Enfin, la régression linéaire
simple et la régression linéaire multiple sont respectivement les sujets des chapitres 12 et 13.
Chaque chapitre se termine par un résumé des formules importantes ainsi qu’une série
d’exercices remaniés, dont les réponses se trouvent en fin de volume.
Nous tenons à souligner d’une façon toute particulière le travail de Luc Adjengue (École
Polytechnique de Montréal), qui a réalisé la révision scientifique de cet ouvrage. Nous sou
haitons également remercier les consultants Sofiane Ayad (École de technologie supérieure),
Mounira Groiez (École de technologie supérieure) et Nadir Hakem (Université du Québec en
Abitibi-Témiscamingue) pour leurs remarques avisées.
Les auteurs de l’édition originale, William W. Hines, Douglas C. Montgomery, David
M. Goldsman et Connie M. Borror, tiennent à remercier les personnes suivantes pour leur aide :
Christos Alexopoulos (Georgia Institute of Technology), Michael Caramanis (Université de
Boston), David R. Clark (Université de Kettering), J.N. Hool (Université d’Auburn), John S.
Ramberg (Université d’Arizona) et Edward J. Williams (Université du Michigan - Dearborn).
Leurs commentaires ont été d’une aide précieuse. Bien sûr, les auteurs remercient leurs familles
pour la patience et le soutien inconditionnels dont elles ont fait preuve tout au long de ce projet.
»
TABLE DES MATIÈRES V
Annexe.................................................................................................................... 509
Bibliographie 539
Index......................................................................................................................... 541
'* o génie et eo sciences appliquées, il faut s< * 4
î fiï|?
■
P
*> des systèmes comportant des mesures qui &Ct * - v v &V *
/
r~r divers facteurs d’influence. On dira une a '* ai
K /
« f O f» * g *
£ 1 1 V tfl i l 11
S . - \ , V
. v
/
< I
V - * . • -
Le terme « probabilité » est devenu d’usage courant pour indiquer dans quelle mesure on croit à
la possibilité qu’un événement donné se réalise. Les exemples ne manquent pas, tels que «il y a
une probabilité d’averses de 20 % » ou « la probabilité qu’un ordinateur de marque X fonctionne
pendant 10 000 heures sans incident est de 0,75 ». Le présent chapitre décrit les fondements, les
concepts de base et les méthodes à l’appui de tels énoncés précis et non équivoques.
L’étude systématique des probabilités s’est amorcée en France, au xvne et au xvme siècle,
par suite de l’étude des jeux de hasard. Comme cette discipline avait alors peu de fondements
mathématiques explicites, les gens l’envisageaient avec un certain scepticisme. Les choses ont
toutefois commencé à évoluer au xixe siècle, avec la conception d’un modèle probabiliste (une
description) du comportement des molécules dans un liquide. Ce phénomène porte aujourd’hui le
nom de «mouvement brownien», en l’honneur du botaniste anglais Robert Brown qui, en 1827,
a été le premier à l’observer. L’intérêt porté aux probabilités a aussi augmenté avec l’apparition
du téléphone au tournant du xxe siècle. En effet, la nécessité de créer une structure pour relier
physiquement les appareils téléphoniques entre eux ainsi que la grande variabilité de l’intervalle
entre les appels et de leur durée ont exigé l’élaboration de modèles probabilistes pour décrire le
comportement de ce système. Ce n’est que dans les années 1930 qu’on a conféré aux probabilités
une structure mathématique rigoureuse.
Dans ce chapitre, nous verrons une définition des probabilités, les propriétés qui en
découlent ainsi que des résultats et des méthodes utiles pour la résolution de problèmes. Les
chapitres 1 à 6 visent avant tout à vous faire comprendre et apprécier les probabilités, tout
en appliquant ces dernières à un éventail de situations réelles liées au génie et aux sciences en
général. Mentionnons que les probabilités sont liées à un vaste et riche champ mathématique,
lequel dépasse la portée du présent ouvrage.
CHAPITRE 1
Souhaitons que la lecture des chapitres 1 à 6 enrichira votre compréhension du monde qui
nous entoure et vous fournira une base solide pour l’utilisation des méthodes statistiques présen
tées dans les chapitres subséquents. Ces méthodes statistiques touchent l’analyse et l’interprétation
de données, l’inférence à partir d’échantillons prélevés d’une population, ainsi que la conception
et l’analyse d’expériences et de données expérimentales. Leur bonne compréhension augmente
considérablement les capacités professionnelles de toute personne évoluant dans l’un des nom
breux secteurs d’activité actuels où des données sont disponibles pour guider la prise de décision.
Exemple 1.1
L’ensemble formé des nombres entiers 5, 6, 7 et 8 est fini et compte quatre éléments. On peut le noter
A = {5, 6, 7, 8 }.
Les énoncés « 5 g A » et « 9 g A » sont ici tous deux vrais.
Exemple 1.2
On peut définir l’ensemble des voyelles de l’alphabet français en écrivant V = {a , e, i, o, u, y}. Une
autre façon de procéder consiste à indiquer une caractéristique propre à cet ensemble, en utilisant un
symbole, d’où
V ={* : * est une voyelle de l’alphabet français}.
Exemple 1.3
Soit A l’ensemble de tous les nombres réels compris entre 0 et 1 inclusivement. On pourrait définir cet
ensemble par une caractéristique propre et écrire
A = {x: x e R, 0 < x < 1},
où R représente l’ensemble de tous les nombres réels.
Exemple 1.4
L’ensemble B = (-3, +3} est identique à l’ensemble
R, x 2 —9},
où R représente encore une fois l’ensemble des nombres réels.
Une introduction aux probabilités
Exemple 1.5
Soit les points (x, y) qui appartiennent à une droite donnée A dans le plan réel. Les points (x , y) tels que
ax + by = csont des éléments de A. On a ainsi
A = {(x, y) '•x e
On a ici l’ensemble des nombres réels R comme ensemble universel. L’ensemble A est mani
festement vide, puisqu’il n’existe aucun nombre réel tel que 1. Soulignons que l’ensemble
{ 0 } * 0.
Le cardinal
Le nombre d’éléments d’un ensemble (son cardinal) a souvent de l’importance. Dans le
cas d’un ensemble A, on le note n(A). S’il s’agit d’un nombre fini, on est en présence d’un
ensemble fini. Un ensemble infini tel qu’on peut établir une correspondance biunivoque
entre ses éléments et les nombres naturels porte le nom d’« ensemble infini dénombrable ».
On appelle « ensemble non dénombrable » un ensemble constitué d’un nombre infini d’élé
ments impossibles à compter. Ainsi, si a< b, alors A = {x e R, a <x < b] définit un ensemble
non dénombrable.
Exemple 1.6
Soit U l’ensemble des lettres de l’alphabet, d’où U ={* : * es
que A = {* : * est une voyelle} et B = {* : * est l’une des lettres ou c}. À pa
cédemment fournies, il s’ensuit que
Exemple 1.7
Supposons l’ensemble universel U = {1, 2, 3, 4, 5, 6, 7} et les trois sous-ensembles A = {1, 2, 3},
B = {2, 4, 6 } et C = {1, 3, 5, 7}. Il ressort directement des définitions citées précédemment que
A =-- {4, 5, 6, 7} B == {1,3, 5, 7} = C C == {2, 4, 6 } = B
A u B =={h 2, 3 ,4 ,6 } A u C == {1, 2, 3, 5,7} B u C == U
A n B == {2 } A n C == {1,3} B n C ==0 .
On peut représenter certaines opérations sur les ensembles par un diagramme de Venn.
Pour ce faire, on trace un rectangle figurant l’ensemble universel U. On dessine ensuite dans
ce rectangle un cercle qui délimite la région correspondant à un sous-ensemble A de U. La por
tion du rectangle située à l’extérieur du cercle représente alors le complémentaire A, comme le
montre la figure 1.1.
■y r
* y .
*1 V / ' » * »
a) A n B b)A uB
On peut facilement étendre les opérations d’intersection et d’union à tout nombre fini d’en
sembles. Supposons qu’on a trois ensembles : A, B et Dans ce cas, A u S u C a comme pro
priété que Au (BuC) = (A u )u C, ce qui ne fait aucun doute puisque les d
B
de l’équation sont identiques. On constate aussi que A n B n C = ( A n B ) n C = A n ( 5 n C ) .
Le tableau 1.1 présente quelques lois auxquelles obéissent les ensembles en ce qui a trait aux
opérations définies précédemment.
y/jk *YV*-m—
V P k/V
jH ^TïfaYJm1nY /AV«f«^25»iHV«TylLWT»V
| te TmJ1♦w ■
- m -
Lois Opérations |
Les lois d’identité Au 0 =A A r \ U =A
AuU=U An 0 =0
Les lois de De Morgan Aufi=Anfi Anfi=Aufi
Les lois associatives A u (B u C) = (A u fi) u C
A n (B n C ) = (A n B )n C
Les lois distributives A u (fi n C) = (A u fi) n (A u C)
A n (fi u C) = (A n fi) u (A n C) |
On peut illustrer certains de ces énoncés par un diagramme de Venn. Une démonstration
formelle s’avère en général plus longue.
Lorsqu’il y a plus de trois ensembles, on généralise en recourant à des indices. Supposons
ainsi que nest un nombre entier positif et que fi,, fi2, ..., Bn sont des ensembles donnés. En
pareil cas, fi, n B2 n ... n Bn correspond à l’ensemble des éléments qui appartiennent à tous
CHAPITRE 1
Classons maintenant les espaces échantillonnaux (et de ce fait les expériences aléatoires) en
reprenant la terminologie utilisée pour l’étude des ensembles et des opérations sur les ensembles.
de résultats. Par opposition, un espace échantillonnai continu consiste en un ensemble non dénom
brable de résultats. - ■ :'
Ces derniers peuvent être des nombres réels compris dans un intervalle, ou des couples
de nombres réels à l’intérieur du produit d’intervalles, là où l’on déterm ine la valeur de deux
variables dans une expérience.
Voici quelques exemples présentant des expériences aléatoires et leur espace échantillonnai.
Exemple 1.8
%x: On lance une pièce de monnaie et on note sur quel côté elle tombe.
Sf, : {F, P).
On a ici un ensemble fini, car n(Sf,) = 2.
Exemple 1.9
On lance à trois reprises une pièce de monnaie et on note chaque fois sur quel côté elle tombe.
{PPP,FFFi FFF, FFF, FFF, FFF, FFF, FFF}.
Une introduction aux probabilités
f i . > *-.7 % v
Exemple 1.10
: On lance à trois reprises une pièce de monnaie et on note le nombre de fois où elle tombe sur le
côté pile.
Sf3; (0, 1,2,3).
Exemple 1.11
%a: On lance deux dés réguliers et on note le chiffre sur la face du dessus de chacun.
£f„ : ((1, 1), (1, 2), (1, 3), (1,4), (1, 5), (1, 6),
(2, 1), (2, 2), (2, 3),(2,4), (2, 5), (2, 6),
(3, 1), (3, 2), (3, 3), (3,4), (3, 5), (3, 6),
(4, 1), (4, 2), (4, 3), (4,4), (4, 5), (4, 6),
(5, 1), (5, 2), (5, 3), (5,4), (5, 5), (5,6),
(6, 1), (6, 2), (6, 3),(6,4), (6, 5), (6, 6)).
On a ici n(Sf4) = 36. On aurait pu choisir de représenter l’espace échantillonnai sans tenir compte
de l’ordre des résultats; on aurait alors n(ff4) ~ 21. Dans une telle représentation, les éléments de ff4
n’auraient pas tous les mêmes chances de survenir.
Exemple 1.12
%5: On assemble une portière de véhicule automobile en réalisant de nombreuses soudures. On ins
pecte ensuite ces soudures et on note le nombre total de soudures qui sont défectueuses.
: {0, 1, 2 , . . K
},où K =le nombre total de soudures de la portière.
Exemple 1.13
%6: On fabrique un tube cathodique, puis on lui fait subir un essai de durée. On note le temps écoulé
(en heures) au moment où le tube connaît une défaillance.
SP6: {f: te R, t 0>).
On a ici un ensemble non dénombrable, car les résultats possibles sont des valeurs comprises dans un
intervalle de la droite réelle.
Exemple 1.14
%-j : Un gestionnaire compte le nombre d’appels reçus au service à la clientèle en une heure.
Sf7: {0,1,2,...}.
On a ici un ensemble infini dénombrable, car les valeurs possibles sont constituées de l’ensemble des
nombres entiers.
CHAPITRE 1
Exemple 1.15
%%’. On inspecte visuellement deux des principaux joints de brasure d ’un circuit im prim é; on les
vérifie à l’aide d’une sonde. Ensuite, chacun des joints est coté A (acceptable) ou D (défectueux,
ce qui entraîne une reprise ou une mise au rebut).
%: {AA, AD, DA, DD}.
Exemple 1.16
%g : Soit une usine de produits chimiques où l’on fabrique chaque jo u r entre 400 et 600 tonnes
métriques d’acide chlorhydrique. On choisit une journée au hasard et on note la quantité produite.
£f9: (x: jc e R, 400 < x < 600}.
On a ici un espace infini et non dénombrable.
Exemple 1.17
^ 10: Soit une usine d’extrusion où l’on fabrique des pièces métalliques profilées longues de 6 m.
Comme on enlève les bavures des barres à chaque extrémité, elles doivent initialement avoir
plus de 6 m. Après avoir fabriqué et fini une barre profilée, on mesure la longueur totale des
matières de rebut.
Sfl0: {x: ex R, x >
0 }.
On a ici un espace infini et non dénombrable.
Exemple 1.18
: À l’occasion du lancement d’un satellite, on mesure les trois composantes de sa vitesse à par
tir du sol (c’est-à-dire dans les trois directions de l’espace), en fonction du temps écoulé. Une
minute après le lancement, on enregistre ces données pour les transm ettre à un appareil de
commande.
5fn : {(vx, v , v.) : vx, vy, v. sont des nombres réels}.
On a ici un espace à trois dimensions, théoriquement infini dans toutes les directions.
Exemple 1.19
%n : Reprenons l’exemple précédent, en mesurant cette fois continuellement les trois composantes de
la vitesse du satellite pendant cinq minutes.
On a ici un espace complexe, car il faut tenir compte de toutes les valeurs possibles des fonctions
vx(/), vv(t) et v_(r) lorsque 0 < t<
5.
Tous ces exemples présentent les caractéristiques requises d’une expérience aléatoire.
La description de l’espace échantillonnai est relativement simple, sauf pour l’exemple 1.19, et
même si on ne l’envisage pas ici, on pourrait idéalement répéter ces expériences. Reprenons
l’exemple 1.8 pour mieux voir le phénomène des manifestations aléatoires. Si l’on répète %,
à l’infini, on obtiendra de toute évidence une suite de «piles» et de «faces». Une régularité
Une introduction aux probabilités
dans les fréquences finira par apparaître. Comme la pièce utilisée est équilibrée, elle devrait
tomber sur le côté pile environ une fois sur deux. En faisant en sorte qu’un modèle soit idéal,
on se limite à convenir d’un ensemble théorique possible de résultats. Dans le cas de on a
éliminé la possibilité que la pièce tombe autrement qu’à plat.
É vénem ent
Un événement est un sous-ensemble de l’espace échantillonnai d'une experienc . On le
désigne par une lettre majuscule.
Comme un événement est un ensemble, les opérations, les lois et les propriétés étudiées
à la section 1.1 s’y appliquent.
CHAPITRE 1
Probabilité
Soit une expérience % et son espace échantillonnai Une probabilité /*(•) définie sur Sf est une
fonction qui, à tout événement A dans £f, associe un nombre réel P(A) appelé «probabilité de l’événe
ment A » (ou probabilité de A), vérifiant les propriétés (axiomes) suivantes :
1. 0 < P(A) < 1 pour tout événement A de ïf.
2. P(<f) = 1.
3. Pour tout nombre fini k d’événements mutuellement exclusifs définis dans
!
; v , : L ; y
/
/
* I
Ces propriétés n’indiquent pas comment déterminer les probabilités, mais elles im posent
des restrictions à cet égard.
i
Une introduction aux probabilités
F ré q u e n c e r e la tiv e
La v a l e u r = mAlm se définit comme la fréquence relative de l’événement A. Elle présente les pro
priétés suivantes :
1. 0 < / A< l .
2. f A= 0 si et seulement si l’événement A ne se produit jamais, et si et seulement si
l’événement A se produit à chaque répétition.
3. Si les événements A et B sont mutuellement exclusifs, alors/, uB -f A+fB.
P(A) = = p A- (1.1)
m
En pratique, on doit évidemment se satisfaire d’un nombre de répétitions plus limité. Prenons
l’exemple d’une expérience simple %, où l’on lance une pièce pour noter à chaque répétition si elle
tombe du côté pile (P) ou face (F). Puisque l’espace échantillonnai est S = {F, F}, on peut s’inté
resser à l’événement A = {F}, défini avant d’effectuer les observations. Imaginons qu’au bout de
m = 100 répétitions de %, on observe que mA= 43, d’où une fréquence relative apparemment faible
de f A = 0,43. Supposons qu’on répète plutôt l’expérience m = 10 000 fois et que mA —4 924; on a
alors une fréquence relative de fA = 0,4924. Comme on dispose cette fois de 10 000 observations
au lieu de 100, on devrait avoir davantage confiance dans la deuxième fréquence relative obtenue,
soit 0,4924, comme valeur de F(A). Jusqu’à présent, la stabilité de/Alorsque la valeur de m est éle
vée ne relève que d’une notion intuitive, ce qui sera examiné de façon plus précise ultérieurement.
CHAPITRE 1
Résultats équiprobables
Si l’espace échantillonnai est fini et renferme nrésultats aya
alors on dit que ces résultats sont équiprobables. La probabilité associée à chacun est
1 ‘ \
P, = /? ,= • • • = P = —. !
1 2 n n
P(A) = (1.2)
n
et l’événement A englobe n(A) résultats possibles. Des méthodes de dénombrement utiles pour
déterminer la valeur de n et de n(A) seront étudiées à la section 1.5.
Exemple 1.20
Supposons que la pièce de monnaie de l’exemple 1.9 est biaisée et qu’elle a deux fois plus de chances
de tomber du côté «face» que du côté «pile», de sorte que les résultats de l’espace échantillonnai
Sf = {PPP, PPF, PF P, PFF\FPP, FPF, FFP, FFF) ont respectivement une probabilité de p x=
p 3 = ^ j , p 4 = Yj, p 5 = ^ , p 6 = Y j,p7 = ^j et p s = où e{ = PPP, e2 = PPF, et ainsi de suite. Soit A l’événe
ment « la pièce de monnaie tombe chaque fois sur le même côté ». On a alors P (A) = + 27 = 3^■
Exemple 1.21
Reprenons l’exemple 1.14 et supposons qu’un modèle probabiliste a permis d’établir que
0,1,2,
où p ( représente la probabilité que le gestionnaire enregistre i appels en une heure. Soit A l’événement
P(A) = p X5 + p x6 0,116.
15! 16!
Une introduction aux probabilités
Exemple 1.22
Reprenons l’exemple 1.9, dans lequel on lance à trois reprises une pièce de monnaie. Comme on sup
pose ici que la pièce est équilibrée, les huit résultats possibles sont équiprobables. Soit A l’événement
«la pièce tombe chaque fois sur le même côté». Selon l’équation 1.2,
n(A) 2
P(A
n 8
puisqu’il y a huit résultats possibles au total dont deux sont favorables à l’événement A .
Exemple 1.23
On tient pour acquis que les dés à l’exemple 1.11 sont équilibrés. Soit A l’événement «la somme des
chiffres sur les faces du dessus est sept». Selon l’équation 1.2, il y a 36 résultats possibles, tous équi
probables, dont 6 sont favorables à l’événement A, d’où P(A) = 3^= z-
Démonstration
On sait que ^ = ^ u 0 e t que Sf et 0 sont mutuellement exclusifs. Il résulte ainsi de la propriété
n° 3 (voir à la page 10) que P(Sf) = P(Sf) + P (0 ), d’où P ( 0 ) = 0.
P(A) = 1 - P (A)
Démonstration
On sait que Sf= Au Aet que A et A sont mutuellement exclusifs. Il résulte ainsi
que P (O*) = P(A) + P (A), et comme P (^ ) = 1 selon la propriété n° 2, il s’ensuit que P (A) = 1 —P (A). ^
Démonstration
Le diagramme de Venn à la figure 1.4 ( voirà la page suivante) aide à s
théorème 1.3. On peut voir qu’il faut soustraire P (A B) de l’expression P(A) + P (B) afin d’éviter
de compter deux fois la probabilité associée à la région hachurée.
Sachant que A u B = A u (B n A), où A et (B n A) sont mutuellement exclusifs, et que
B = (A n B) u (B o ^ 4 . ou o et (5 o A) sont mutuel 16mont exclusifs^ il s ensuit c^ue
P(A kj B) = P (A) + P (B n A) et que P (B) = P(A n B ) + P(B n A). En effectuant la soustraction, on
obtient P(A u B) -P(B) = P(A) - P(A n B), d’où P(A u P(A) + P(B) - P(A n B).
14 CHAPITRE 1
Figure 1.4
non disjoints
Démonstration
On peut écrire A u f i u C = ( A u S ) u C e t recourir au théorème 1.3 étant donné que A (J B
représente un événement.
+ ( - l ) Ar~1P(A I n A , n oA,)
THEOREME 1.6
Si A 5, alors P(A) < P(B).
Démonstration
Si A B, alors B= A U (A n fi) et P(Æ) = P(A) + P(A o ) puisque P (A n f i ) > 0
- ■ « — -•
Exemple 1.24
Soit A et B des événements mutuellement exclusifs (A n B = 0 ) , tels que représentés à la figure 1.5. S ’il
est établi que P(A) = 0,20 et que P(B) = 0,30, on peut ici évaluer plusieurs probabilités :
1. P (À) = 1 - P(A) = 0,80
2. P (B) = 1 - P(B) = 0,70
3. P(A k j B) = P(A) + P{B) = 0,20 + 0,30 = 0,50
4. P (AnB) = 0
5. P(A n B) = P(A kj B), selon la loi de De Morgan, d’où
= 1 - P ( A kj B)
= 1 - [P{A) + P(B)\ = 0,5. ►
Une introduction aux probabilités
Exemple 1.25
, (r « mA ‘• • ♦
Supposons que les événements A et fi ne sont pas mutuellement exclusifs. Si l’on sait que = 0,20,
que P (B) = 0,301et que P (A n B ) = 0,10, on obtient ce qui suit:
OO
73
1.
O
O
P(Â) = 1 -
II
s
SA
Exemple 1.26
Imaginons une ville où 75 % des gens lisent le journal (J), 20 % aiment l’art impressionniste (/) et 40 %
sont mélomanes (A /). Du nombre, 15 % lisent le journal et aiment l’art impressionniste, 30 % lisent
le journal et sont mélomanes, 10 % aiment l’art impressionniste et sont mélomanes, et 5 % lisent le
journal, aiment l’art impressionniste et sont mélomanes.
On peut réunir tous ces renseignements à l’intérieur d’un simple diagramme de Venn (voir la figure 1.7,
à la page su)ivante, en y inscrivant d’abord la dernière donnée fournie, soit P(J n n Af) = 0,05, pour
ensuite procéder à partir du centre. ^
CHAPITRE 1
s/
f
/o ,3 5 0 )
V / '\ a o 5 / \ J
X A ^ N ^ /o ,0 5 \ y
'f
V 0,05 J
i
1
j
M
i
% F . . I V . w I . i. F F k A . V l
• . ‘1 | ^ F f * . F " i j JB .w — » . .
1. Déterminons la probabilité qu’un habitant de cette ville, choisi au hasard, présente au moins
une des trois caractéristiques à l’étude. Selon le théorème 1.4,
On peut aussi additionner les valeurs du diagramme de Venn pour arriver à cette réponse.
2. Déterminons la probabilité qu’un habitant de cette ville ne présente qu’une seule des trois
caractéristiques. Le diagramme de Venn révèle que cette probabilité correspond à
PPF
PFP
PFF
FPP
FPF
FFP
FFF I
i
»
»
Principe de multiplication
Supposons une expérience % composée de kétapes, et que :
• il y a », façons de réaliser l’étape l ;
• il y a n, façons de réaliser l’étape 2 (pour chaque issue de l’étape l) ;
• etc. ;
• il y a ?ik façons de réaliser l’étape k (pour toutes les issues des étapes précédentes).
Alors, l’espace échantillonnai de % contiendra n, x x ••• x n k résultats possibles.
Si à chaque étape de l’expérience les n issues sont équiprobables, alors les n x n2 x ••• x n, résultats de
l’expérience globale le seront aussi.
Exemple 1.27
Imaginez qu’on lance une pièce et un dé équilibrés. Les deux résultats possibles de l’étape 1, soit
{P, F}, sont équiprobables, tout comme les six résultats possibles de l’étape 2, soit {1, 2, 3, 4, 5, 6}.
Puisque n, = 2 et n2 = 6, l’expérience dans son ensemble présente 12 résultats possibles, tous équi
probables. Cette expérience étant simple, on peut aisément procéder à un dénombrement complet à
l’aide d’un diagramme en arbre (voir la figure 1.9, à la page suivante). ►
CHAPITRE 1
/
Étape 1 Étape 2
1
2
3
P 4
5
6
Sf = {(P, 1), ,2), (P, 3), (P, 4), (P, 5), (P, 6),
(P
1 (P, 1), (P, 2), (P, 3), (P, 4), (P, 5), (P, 6)}
2
3
F
4
5
6
*
Exemple 1.28
Soit un processus de production où l’inspection en cours de fabrication est très limitée. Une fois les
produits finis, on les achemine à une aire d’examen où quatre personnes en vérifient chacune une
caractéristique différente. La première de ces personnes attribue aux unités produites l’une ou l’autre
de quatre cotes ; la deuxième, l’une ou l’autre de trois cotes ; et les deux autres, l’une ou l’autre de deux
cotes chacune. Chaque personne inscrit sur l’étiquette d’identification du produit la cote attribuée selon
la caractéristique examinée.
Il y a un total de 4 • 3 • 2 • 2 = 48 inscriptions possibles pour une unité donnée.
P e rm u ta tio n
Une permutation consiste en un arrangement ordonné d’objets distincts. Deux perm utations diffèrent
l’une de l’autre si leur contenu n’est pas le même ou si leurs éléments sont ordonnés différem m ent.
• . ■ • , ^ . I . • ■ ...
•
■* - '
.
X ■■ . * *’ . •• * ï
.
* . * * " .
.
■;
*.
*
1 • < •
; . . ;
* .
Considérons l’exemple de quatre jetons se distinguant chacun par une lettre différente, a, b,
c ou d.Voici toutes les permutations de ces jetons pris un à la fois :
a
b
c
d.
ab bc
ba cb
ac bd
ca db
ad cd
da de.
Une introduction aux probabilités
Puisqu’il y a quatre lettres possibles à la première position, puis trois lettres restantes pour la
deuxième position, le principe de multiplication nous aurait permis de vérifier que le nombre de
permutations possibles est 4 x 3 = 12. Notons que les permutations et ba diffèrent l’une
de l’autre parce que leurs éléments ne sont pas dans le même ordre, tandis que les permutations
ac et ab diffèrent l’une de l’autre parce que leur contenu n’est pas le même.
Prenons le cas de n objets distincts à partir desquels on veut obtenir des per
r objets (r< n ). Le choix du premier objet a n résultats possibles, le choix du deuxième, (n — 1) ré
sultats possibles, et ainsi de suite jusqu’au choix du r-ième, qui a [n —(r —1)] résultats possibles.
L’application du principe de multiplication nous permet d’établir la formule générale suivante.
Exemple 1.29
Une équipe de baseball des ligues majeures compte en général 25 joueurs. La formation à l’attaque se
compose de 9 de ces joueurs dans un ordre donné. Il y a donc P *5 = 7,41 • 1011 formations possibles.
Combinaison
Une combinaison consiste en un arrangement d’objets distincts et ne diffère d’une autre que si son
contenu n’est pas le même. L'ordre n’a ici aucune importance.
Voici toutes les combinaisons possibles de deux jetons pris parmi quatre jetons qui portent
chacun une lettre différente, a, b, c ou d:
ab
ac
ad
bc
bd
cd.
Puisqu’il y a 2 ! = 2 façons de permuter deux objets, la liste des combinaisons est deux fois plus
courte que la liste des permutations de deux objets choisis parmi quatre.
Voyons comment déterminer le nombre de combinaisons possibles de n objets distincts pris
r à la fois. On sait que le nombre de permutations P? indique le nombre de façons différentes
de choisir r objets parmi n et d’ordonner ensuite ces r objets. On sait aussi qu’il y a r ! façons
d’ordonner r objets distincts. On peut en déduire le nombre de combinaisons.
CHAPITRE 1
Pour nos besoins actuels, on a défini le terme (”) dans les cas où n et r sont des nombres
entiers tels que 0 < r < n. Ce terme peut toutefois être défini de façon générale pour un nombre
réel n et tout nombre entier non négatif r. On peut aussi écrire
\
n n(n —1)(n —2) (n —r + 1)
r J r\
Le terme (”) porte le nom de « coefficient binomial » en raison de son utilisation dans le théo
rème du binôme :
n \
n n r
(a + b )n a rb —
(1.4)
r=0 r J
Exemple 1.30
Une équipe de l’Association nationale de basketball (NBA) compte habituellement 12 joueurs. La
formation partante se compose de 5 de ces joueurs dont l’ordre n’a pas d’im portance. Il y a, par
conséquent,
12 A 12 !
792 formations partantes possibles.
5 J 5 !7 !
n
r n
\
(1.5)
r n —r
et
\ \ N
n n —1 n —1
+ ( 1.6)
r J r —1 J r
J
On peut expliquer le résultat de l’équation 1.5 en posant
( n n\ n\
\
n
r J r\{n —r)\ (n —r)!r! n -r
Le membre de droite de cette relation indique le nombre total de sous-ensembies. puisque (")
représente le nombre de sous-ensembles vides, (”), le nombre de sous-ensembles formés de
un élément, et ainsi de suite jusqu’à qui représente le nombre de sous-ensembles formés
de n éléments. On appelle parfois «ensemble-puissance» l’ensemble contenant tous les sous-
ensembles possibles d’un ensemble d’éléments.
Exemple 1.31
On sait que 5 % des 100 unités d’un lot de production sont défectueuses. On en tire un échantillon
aléatoire de 10 unités, sans remise. Quelle est la probabilité que cet échantillon ne renferme aucune
unité défectueuse ?
On compte le nombre d’échantillons possibles et le nombre d’échantillons favorables à l’événement A
«il n’y a aucune unité défectueuse». Le nombre d’échantillons possibles égale (^ q0) = -^ 5 7 et Ie
nombre de cas favorables à A , © • © . On a ainsi
\ \
5 95 5! 95!
0 A 10 J 0 !5 !10185!
P{A) 0,58375.
100 ^ 100!
10 J 10!90!
CHAPITRE 1
Exemple 1.32
Les méthodes de dénombrement peuvent servir à calculer la probabilité de diverses mains au
poker. Avant d’aller plus loin, mentionnons deux termes utiles : la « valeur » d’une carte tirée d’un
jeu ordinaire de 52 cartes peut être deux, trois,..., dame, roi ou as; et sa «couleur», trèfle, carreau,
cœur ou pique. Au poker, on tire cinq cartes du jeu au hasard. Le nombre de mains possibles est de
(552) = 2 598 960.
1. Calculons d’abord la probabilité d’obtenir une main renfermant exactement deux paires telles
que Av, Aa , 3v, 3 a, 10a . Voici la démarche réalisée.
a) On détermine deux valeurs différentes associées aux paires (as et 3, par exemple).
Il y a ( 23) façons de le faire.
b) On sélectionne deux couleurs différentes (V, A , par exemple) pour la première paire. Il y
a (2) façons de le faire.
c) On sélectionne encore deux couleurs différentes (V, ♦, par exemple) pour la deuxième
paire. Il y a (2) façons de le faire.
d) On choisit une autre carte pour compléter la main. Il y a 44 possibilités, car on veut
exclure les cartes ayant la même valeur que les deux paires.
Par conséquent, le nombre de façons d’obtenir deux paires est de
123 552
P(2 paires) = 0,0475.
2 598 960
2. Calculons maintenant la probabilité d’obtenir une main pleine, soit une paire et un brelan
(trois cartes de la même valeur), par exemple Av, AA, 3v, 3#, 3a .
a) On choisit deux valeurs différentes et ordonnées : une pour la paire et une pour le brelan
(as et 3, par exemple). Il y a P213 = 13*12 façons de le faire. Il faut que les valeurs soient
ordonnées parce que trois as et deux 3 diffèrent de deux as et trois 3.
b) On sélectionne deux couleurs différentes (V, A, par exemple) pour la paire. Il y a (2) façons
de le faire.
c) On choisit trois couleurs différentes (V, ♦, A, par exemple) pour le brelan. Il y a (3) façons
de le faire.
Par conséquent, le nombre de façons d’obtenir une main pleine est de
3744
P(main pleine) 0,00144.
2 598 960 ►
Une introduction aux probabilités
3. Pour terminer, calculons la probabilité d’obtenir cinq cartes de la même couleur (une quinte
ou un flush, en anglais).
a) On choisit une couleur. Il y a (*) = 4 façons de le faire.
b) On choisit cinq cartes de cette couleur. Il y a ('53) = 1287 façons de le faire.
Par conséquent, on a
5148
P(quinte) 0,001 98.
2 598 960
Exemple 1.33
Prenons le mot « Tennessee ». On découvre que les permutations possibles des lettres de ce mot sont
au nombre de
9!
3780.
1!4!2!2!
Les méthodes de dénombrement présentées ici servent avant tout à déterminer les proba
bilités lorsqu’il existe un nombre fini de résultats possibles tous équiprobables. Il importe de
%
retenir qu’il s’agit là d’un exemple particulier des types plus généraux de problèmes associés
aux probabilités.
échantillonnai Sf ». Il faut parfois réévaluer les probabilités d’un événement pour ten ir com pte
d’une information supplémentaire sur le résultat. On voudra déterm iner la probabilité que A
survienne sachant que B s’est réalisé. Quelques exemples devraient aider à clarifier les choses.
Exemple 1.34
Soit un groupe de 100 individus dont 40 sont diplômés universitaires, 20 sont travailleurs autonom es et
10 appartiennent à ces deux catégories. Si B représente l’ensemble des diplômés ayant au m oins un b ac
calauréat et A, l’ensemble des travailleurs autonomes, alors A n 5 représente l’ensem ble des bacheliers
qui sont travailleurs autonomes. On veut choisir un individu au hasard à l’intérieur de ce groupe. Si
l’on tient compte de tout l’espace échantillonnai, on aura ici ) = 0,2, P (B) = 0,4 et P (A o 0,1.
Supposons maintenant qu’on s’intéresse à l’événement A| ,soit «ch
B
compte, sachant qu’il est bachelier». L ’espace échantillonnai est manifestement réduit puisqu’on pigera
dans l’ensemble des diplômés universitaires (voir la figure 1.10). La probabilité P(A\B) correspond à
Exemple 1.35
Prenons maintenant l’exemple d’un échantillon formé de 2 unités tirées au hasard d ’un lot de 10. O n
sait que 7 des unités de ce lot n’ont pas de défaut et que les 3 autres en ont. Soit A l’événem ent « la p re
mière unité choisie n’a pas de défaut» et B
, l’événement «la deuxième u
Si l’on procède sans remise, c’est-à-dire sans remettre la première unité dans le lot avant d ’en tire r
la deuxième, alors
1
P(A)
10
et
6
P(B\A)
9
Exemple 1.36
Reprenons l’exemple 1.11, dans lequel on lance deux dés réguliers. Les 36 résultats possibles sont
illustrés à la figure 1.11. Soit deux événements:
A = {(dl, d 2) : d l 4},
B = { ( d l, d 2) : d 2> d l},
où d, représente le chiffre sur la face du dessus du premier dé et le chiffre sur la face du dessus
du second dé. On a alors P(A) = ^ , P(B) = P(A n = P{B\A) = | et P(A\B) = ^
ces probabilités en examinant directement l’espace échantillonnai et en dénombrant les résultats pos
sibles. Soulignons que
et P(fiM) = — - r '-5- .
P(B) P(A)
ÉÉMto
i c i
w l ^ y
-
».
Exemple 1.37
Au cours de la Seconde Guerre mondiale, on a fait appel à la recherche opérationnelle en Angleterre
pour l’une des premières fois. On voulait alors établir des circuits de recherche pour les sorties aériennes
visant à repérer les U-boats. Pendant un certain temps, on avait surtout patrouillé à proximité des côtes,
croyant que c’était là qu’on repérait le plus souvent des U-boats. Après avoir examiné 1000 rapports de
patrouille, le groupe de recherche a obtenu les résultats suivants (les données sont fictives).
.•* r
V. f
CHAPITRE 1
Probabilité conditionnelle
La probabilité conditionnelle de l’événement A étant donné la réalisation de l’événement fi se définit
comme suit:
P (A |fi)= P ( /4 n g ) si 0. (1.9)
P(fi)
Cette définition découle de la notion intuitive présentée dans les paragraphes précédents.
La probabilité conditionnelle P(-1-) a les propriétés requises d’une probabilité. A utrem ent dit,
1. 0 < P(A|fi) < 1
2. P(Sf|fi) = 1
P ( J j A, 15 J = £ / > (A, | B)
pour A1}A2, A3, ..., une suite dénombrable d’événements disjoints
En pratique, on peut résoudre les problèmes soit en posant l’équation 1.9 et en calculant
P{A r> fi) et P (B) par rapport à l’espace échantillonnai initial (comme le montre l’exemple 1.36),
soit en envisageant la probabilité de A par rapport à l’espace échantillonnai réduit fi (com m e le
montre l’exemple 1.37).
En transformant l’équation 1.9, on arrive à ce que plusieurs appellent la «règle de m u lti
plication », selon laquelle
P ( A n f i ) = P ( f i) - P ( A |f i) si P(B)> 0
Le second de ces énoncés découle manifestement de l ’équation 1.9 et fait de A l ’événem ent
conditionnel.
Il convient de mentionner que si A et fi sont mutuellement exclusifs, comme à la figure 1.12a),
alors A n fi = 0 , de sorte que P(A|fi) = 0 et P(B\A) = 0. À l’inverse, si fi c: A, com m e à la
figure 1.12b), alors P(A|fi) = 1.
Exemple 1.38
Prenons l’exemple d’une expérience dans laquelle on lance deux fois une pièce de monnaie équili
brée. Soit A l’événement «on obtient le côté face au premier essai» et B l’événement «on obtient le
côté face au second essai». La pièce étant équilibrée, P(A) = et cette pièce équilibrée n’ayant au
cune mémoire, P(fi|A) = La réalisation de A n’influe donc en rien sur celle de B, et la probabilité
que ces deux événements surviennent, c’est-à-dire P(A n B), correspond à
Dans cet exemple, P(B\A) = P (B), qui est la probabilité de l’événement B quand on ignore si l’événe
ment A s’est produit ou non.
Événements indépendants
Les événements A et B sont indépendants l’un de l'autre si et seulement si
P(A nB ) = P(A) • P(B). (1.11)
Il s’ensuit directement, selon l’équation 1.10, que dans le cas de deux événements indépendants A et B,
P(A\B) = P(A) et P(fi|A) = P(fi). ( 1. 12)
Démonstration
(de la première partie)
P (A fi) = P {A) • P(fi| A)
= P(A) • [1 - P(fi| A)]
= • [1 - P(fi)]
= P(A)• P(fi)
CHAPITRE 1
Exemple 1.40
L’ingénierie de la fiabilité est en plein essor depuis le début des années 1960. Elle vise entre autres à
évaluer la fiabilité d’un système d’après celle de ses sous-systèmes. La fiabilité se définit ici comme la
probabilité d’un fonctionnement sans défaillance pendant une période donnée. Soit le système simple
présenté à la figure 1.13.
Ce système en série ne fonctionne que lorsque ses deux sous-systèmes fonctionnent. Si le bon fonction
nement de chaque sous-système est indépendant de celui de l’autre, alors
la fiabilité du système = RS= R{ ♦R2,
où et R2représentent respectivement la fiabilité des sous-systèmes 1 et 2. Si, par exemple, R l = 0,90
et R2= 0,80, alors Rs = 0,72.
/
Système
=n«A )
j=1
* , = * i* 2 ........* r (1-13)
L’exemple qui suit fait voir des événements indépendants par paire mais non mutuellement
indépendants.
Exemple 1.41
Voici l’espace échantillonnai d’une expérience donnée dont les résultats sont équiprobables :
SP= {(0, 0, 0), (0, 1, 1), (1, 0, 1), (1, 1, 0)}.
A0 = « le premier chiffre est 0 », B0= « le deuxième chiffre est 0 », C0= « le troisième chiffre est 0 »,
A [ = «le premier chiffre est 1 », Bx= « le deuxième chiffre est 1», Cx= « le troisième chiffre est 1 ».
On a alors
Partition
Si BXt B2, ..., Bk sont des sous-ensembles disjoints de ïf (c’est-à-dire des événements mutuellement
exclusifs) et si P, u f i 2u ... u ^ = ^, alors ces ensembles forment une partition de
I
Î
i
t
î
f
i
l
\
i
i
/ S . C r \ . “t u ~ l i • , ‘ , , % •
Exemple 1.42
Soit un mot binaire composé de trois bits : bt, b2et b3, où bt = 0 ou 1 pour i = 1, 2 et 3. Durant une expé
rience qui consiste à transmettre ce mot, on constate qu’il y a 8 variations possibles. Si les événements
considérés sont
B, = {(0, 0, 0)) ;
B2={(0,0, 1),(0, 1,0), (1,0,0)};
((0,1, 1), (1,0, 1), (1, 1,0)};
«4 = Kl, 1, DI;
alors B]t B2, B2et BAforment une partition de Sf.
Une introduction aux probabilités
{
t
4
;
;
f
;
1
l
Si B x, B2, ..., Bk forment une partition de ïf et si A dénote un événement quelconque dans if, alors la
probabilité de A se traduit par
P(A) = P ( A n £ ,) + P ( A n £ 2) + -- + P04r>j5*)
= P(B}) • P(A\B}) + P{B2) • P(A\B2)+•••+ P(B, ) • P(A\Bk )
k
YPiB,)P(A\B,X
i=1
Le théorème 1.8 s’avère très utile, car il est souvent impossible en pratique de calculer
directement la probabilité de A. En pareil cas, cependant, si l’on sait que B{s’est réalisé, on peut
évaluer P(A\Bj) et ainsi déterminer P (A) une fois que l’on connaît les valeurs de P(Bt).
Le théorème de Bayes est une autre proposition importante résultant du théorème des
probabilités totales.
P(An Br) P
P(B\A) (1.14)
P(A) r \
1= 1
Il s’agit d’une probabilité conditionnelle dont le numérateur est développé selon la règle de multi
plication, et le dénominateur, selon le théorème des probabilités totales.
CHAPITRE 1
Exemple 1.43
Un fabricant de matériel de télémétrie achète des microprocesseurs de trois fournisseurs. Ces derniers
respectent supposément les mêmes normes de produit. Néanmoins, pendant des années, le fabricant a
vérifié chaque lot reçu, ce qui lui a permis de réunir les données ci-dessous.
Le fabricant a cessé toute vérification en raison des coûts. Toutefois, on peut raisonnablement supposer
que les parts défectueuses et les parts fournies demeurent inchangées. Le directeur de la production
choisit un microprocesseur au hasard.
1. Quelle est la probabilité que le microprocesseur soit défectueux ? Notons cet événement D, et
notons B. l’événement « le microprocesseur vient du fournisseur ». On peut utiliser un schéma
en arbre pour illustrer la situation (voir la figure 1.16).
Résumé
Propriétés d’une probabilité
• 0 < P(A) < 1
• P ( 0 ) = 0 et P(S0 = 1
• Si A,, A2, A y ... sont mutuellement exclusifs, alors P(A, u A2 u A u •••) = X ^(A ).
• P (A) = 1 - >(Â) ' '
• Si A œB , alors A
(P<) P (B).
• P (A u B) =P (A) + P (B) - P (A n B)
• P (A u f i u C ) = P(A) + P (B) + P(C) - P (A n B ) - P (B n C) - P (A n C) + P (A n B n C)
• Si les n résultats de sont équiprobables, alors P (A) = n(A)/n.
Techniques de dénombrement
• Permutations :
Il existe n\ arrangements ordonnés de n éléments distincts.
n\
Il existe P" façons de choisir r objets parmi n objets distincts en tenant compte
(.n —r)!
de l’ordre de pige.
CHAPITRE 1
ni
Il existe façons de permuter n objets séparés en k groupes formés respective
n\ ! n2! ••• nk \
ment de rc., n2, ..., n k. objets indiscernables.
Com binaisons :
\
n\
Il existe C rn façons de choisir rob jets parm i n objets
V I y r l ( n - r ) ï
tenir compte de l’ordre de pige.
Probabilités conditionnelles
P{A o B )
P (A |£)
P(B)
P(A n B ) = P{A)P(B\A) = P(B)P(A\B)
. . • . _* .
. . ■ . . .. * . - • « ^ . « ' * ^ . • y* * • . \ \ . ^ t
• ‘ . » . • ' **. ’ «
’ * »
• 1 •
,
, '
* ■
.
» ' •
. » ^
*
»* •
.
* V »
*
,
•
» , ^ • • • , *»
* _. *
V
* * * * *
)
B
» • >. - . • ' . ■ r \ v
1.1 Des téléviseurs font l’objet d’une dernière qu’un téléviseur appartienne à chacune
vérification après leur montage. Ils peuvent des régions du diagramme.
avoir trois types de défauts : d’image, b) Quelle proportion des téléviseurs ne
de son ou de matériel. Une analyse des comporte aucun défaut ?
données a permis d’obtenir les résultats c) Les téléviseurs qui ont des défauts
ci-dessous. d’image ou de son (ou les deux)
sont remis en fabrication. Quelle
Téléviseurs ayant uniquement : proportion des appareils appartient
- des défauts d’image 2% à cette catégorie ?
- des défauts de son 5%
—des défauts de matériel 7% 1.2 Hachurez sur la figure ci-dessous la région
—des défauts d’image et de son 3% correspondant à chacun des événements
—des défauts d’image et de matériel % suivants.
- des défauts de son et de matériel 3%
Téléviseurs ayant des défauts de
chaque type 1%
à
/
Une introduction aux probabilités
d) Paul a assez d’argent pour acheter deux a) Si l’on procède par tâtonnements, quel
billets. Il croit qu’il a plus de chances de nombre maximal d’essais peut-on
gagner au moins une fois s’il achète deux devoir effectuer pour trouver les deux
billets différents pour le tirage de ce soir substances en question ?
plutôt que s’il achète un billet pour ce soir b) Supposons qu’un catalyseur connu a
et un billet pour demain. A-t-il raison ? provoqué la réaction accidentelle initiale.
L’ordre dans lequel la chimiste a mélangé
1.17 Voici comment on inspecte des marchan
les ingrédients devient alors important.
dises à leur arrivée. Livrées en lots de
Dans cette situation, quel nombre maxi
300 unités, on tire du lot 10 unités au
mal d’essais faut-il effectuer?
hasard. Si cet échantillon ne compte pas
plus de 1 unité défectueuse, on accepte le 1.21 Une urne contient une boule rouge, deux
lot. Dans le cas contraire, on retourne boules bleues et trois boules noires. On
le lot au fournisseur. tire successivement trois boules, au hasard
a) On reçoit un lot contenant 1% de produits et sans remise. On définit les événements
défectueux (mais on l’ignore). Sans éva suivants :
luer sa valeur numérique, déterminez la
probabilité que le protocole de contrôle A = La première boule, tirée est rouge ;
de la qualité nous fasse rejeter ce lot. fi = La deuxième boule tirée est bleue ;
C = Les trois boules tirées sont noires.
b) Soit p' la proportion d’unités défectueuses
d’un lot reçu. Déterminez la probabilité Dites si les énoncés suivants sont vrais ou
d’acceptation du lot en fonction de p'. faux.
1.18 Dans une usine de matières plastiques, a) A et fi sont indépendants.
12 produits chimiques différents se b) A et C sont indépendants.
déversent dans une cuve de mélange par c) A et fi sont mutuellement exclusifs.
des tuyaux munis chacun d’une soupape d) A et C sont mutuellement exclusifs.
à 5 positions qui en règle le débit. Un jour, e) fi(A) = fi(fi)
en faisant l’essai de divers mélanges, on f) fi(A) < fi(fi)
obtient une solution qui dégage un gaz g) P(A n fi) < fi(A u fi)
toxique. On a omis de noter la position des
h) fi(C) est la probabilité qu’aucune boule
soupapes à ce moment-là. Quelle est la pro
babilité d’obtenir encore cette solution si on tirée ne soit noire.
procède à un autre essai au hasard ? i) P ( A n B n C ) = 0
j) P(A u fi u C) = P (A) + P(fi) + P(C)
1.19 On a le choix entre huit personnes toutes k) P(A n fi) = P(A)P(fi)
aussi qualifiées pour combler deux postes.
Les deux personnes embauchées doivent 1.22 Lesquelles des réponses de l’exercice 1.21
partager des affinités parce qu’elles seraient différentes si les tirages avaient été
devront travailler en étroite collaboration. avec remise ?
On fait donc passer aux candidats un test
1.23 Une entreprise prévoit construire
de personnalité et on compare les résultats
5 entrepôts à des endroits différents. Or,
de chaque couple possible. Combien de
10 endroits sont à l’étude.
comparaisons peut-on effectuer ?
a) Combien y a-t-il de choix possibles au
1.20 Après avoir mélangé accidentellement total pour l’ensemble des 5 entrepôts?
2 substances de laboratoire, une chimiste b) On veut placer deux entrepôts sur la
a obtenu un produit désirable. Malheureu rive nord du fleuve, et seulement quatre
sement, son assistant n’a pas noté le nom des endroits considérés s’y trouvent.
de ces substances. Or, 40 substances sont Combien y a-t-il de configurations pos
présentes dans le laboratoire. sibles avec cette contrainte ?
CHAPITRE 1
1.24 Des machines à laver peuvent avoir cinq 1.27 Un nouveau modèle de drone équipé
types de défauts majeurs et cinq types de de caméras doit être testé avant sa mise
défauts mineurs. en marché. Les résultats des tests sur
a) Combien y a-t-il de combinaisons 50 drones sont présentés dans le tableau
possibles de un défaut majeur et ci-dessous.
de un défaut mineur ? I
Problèmes mécaniques j
b) Combien y a-t-il de combinaisons
Oui Non
possibles de deux défauts majeurs
et de deux défauts mineurs ? Problèmes Oui 5 10
électroniques Non 5 30
1.25 Une entreprise de transport soumet ses
camionneurs à des tests antidopage. Supposons que les proportions dans ce
Chaque mois, 1 des 20 employés est sélec tableau sont parfaitement représentatives de
tionné au hasard et doit fournir un échan l’éventuelle production si rien n’est changé.
tillon sanguin. Jacques et Alain travaillent Quelle serait alors la probabilité :
tous les deux comme camionneurs pour
a) qu’un drone ait un problème mécanique ?
cette entreprise. Calculez la probabilité
des événements suivants : b) qu’un drone n’ait ni problème méca
nique ni problème électronique ?
a) Jacques n’est pas testé cette année.
c) qu’un drone ait un problème mécanique
b) Ni Jacques ni Alain ne sont testés cette
alors qu’on sait qu’il a un problème
année.
électronique ?
c) Jacques et Alain sont tous les deux
d) que trois drones achetés par un consomma
testés au moins une fois cette année.
teur aient chacun au moins un problème ?
1.26 Soit le montage électronique représenté 1.28 Soit le montage représenté à la figure 1.19.
à la figure 1.18. Le schéma indique la Chaque composant à Rs) fonctionne
probabilité de bon fonctionnement de ses indépendamment des autres, avec une pro
divers composants. Pour que le montage babilité de 0,9. Le montage ne connaît une
fonctionne, il faut que le courant puisse défaillance que si le trajet de A à B est inter
le traverser par un chemin fonctionnel. rompu. Calculez la fiabilité du montage,
Ainsi, l’ensemble III et au moins un c’est-à-dire la probabilité qu’il fonctionne.
élément de l’ensemble I et au moins
un élément de l’ensemble II doivent 1.29 Le test diagnostique pour détecter le virus
fonctionner. Le fonctionnement de XYZ n’est pas parfait. En effet, 1 % des
chaque composant d’un ensemble et personnes saines recevront à tort un résultat
de chaque ensemble est indépendant de «positif». De plus, 2 % des personnes
celui des autres. Quelle est la probabilité infectées recevront à tort un résultat
que le montage fonctionne ? « négatif ». On sait que 0,05 % de la
Exercice 1.26
Une introduction aux probabilités
population est porteuse du virus à un 1.32 On tire successivement deux boules d’une
certain moment. Trouvez la probabilité urne qui contient m
boules num
qu’une personne dont le test est positif soit de 1 à m. Si la première boule tirée porte
réellement infectée par le virus. le numéro 1, on la garde ; dans le cas
contraire, on la remet dans l’urne. Quelle
1.30 Supposons que parmi tous les véhicules qui
est la probabilité que la deuxième boule
démarrent mal :
tirée porte le numéro 2 ?
• la probabilité que la cause soit le démar
reur est de P (A) = 0,5 ; 1.33 On choisit au hasard deux chiffres
• la probabilité que la cause soit la batterie différents compris entre un et neuf
est de P(B) = 0,4 ; inclusivement.
• la probabilité que la cause soit l’une des a) Déterminez la probabilité qu’il s’agisse
bougies est de P(C) = 0,1. des chiffres un et neuf.
De plus, on sait que : b) Déterminez la probabilité que le trois
• sur le nombre total de voitures qui soit pigé.
démarrent mal à cause du démarreur, c) Déterminez la probabilité qu’il s’agisse
10 % sont de marque X ; de deux nombres impairs sachant que
• sur le nombre total de voitures qui leur somme est paire.
démarrent mal à cause de la batterie, 1.34 Soit une université où 20 % des étudiants
20 % sont de marque X ; et 1 % des étudiantes mesurent plus de
• sur le nombre total de voitures qui 1,80 m. Sa population étudiante compte
démarrent mal à cause de l’une des 40 % de femmes. Si un membre de cette
bougies, 5 % sont de marque population, choisi au hasard, mesure plus
On confie une voiture de marque à un de 1,80 m, quelle est la probabilité qu’il
mécanicien. Devrait-il d’abord se pencher s’agisse d’une femme ?
sur le démarreur, la batterie ou les bougies ?
1.35 Soit un atelier équipé de quatre taraudeuses
1.31 Un dispositif de freinage devant automatiques. Un examen des rapports
empêcher une automobile de déraper d’inspection a permis d’obtenir les données
se compose de trois sous-systèmes en ci-dessous.
série qui fonctionnent chacun de façon
indépendante : un système électronique, Pourcentage Pourcentage
un système hydraulique et un mécanisme d’unités d ’unités
d’activation. Lors d’une manœuvre Machine produites défectueuses
de freinage, la fiabilité de ces trois
éléments est respectivement de 0,995, 1 15 4
de 0,993 et de 0,994. Évaluez la fiabilité 2 30 3
du dispositif. 3 20 5
4 35 2
Exercice 1.28
40 CHAPITRE 1
Les machines 2 et 4 sont plus récentes et ii) quelle proportion des commandes
assurent une plus grande part de la produc n’ayant que des produit usagés
tion que les machines 1 et 3. Supposez ici contient des frais de livraison rapide ?
que la répartition actuelle des stocks reflète
1.38 II y a np
ersonnes dans une pièce. S
les pourcentages d’unités produites selon le
qu’il y a 365 jours dans une année et que
tableau.
l’anniversaire de chaque personne peut
a) Quelle est la probabilité qu’une vis aussi bien tomber sur un jour que sur un
tirée au hasard à partir des stocks soit autre.
défectueuse ?
a) Soit B l’événement «deux ou plusieurs
b) Si une vis choisie se révèle défectueuse, personnes ont le même mois et le même
quelle est la probabilité qu’elle provienne jour de naissance». Déterminez )
de la machine 3 ? pour n =25.
1.36 On choisit un point au hasard à l’intérieur b) Déterminez P )B
(de façon généra
d’un cercle. Quelle est la probabilité qu’il tout n.
se situe plus près du centre que de la cir
1.39 On sait que 6 % des impressions photos
conférence ?
d’un laboratoire doivent être reprises pour
1.37 Un site de vente en ligne propose des pro cause de surexposition ou de sursaturation ;
duits neufs et usagés. On sait que 80 % des que 4 % de toutes les photos sont surexpo
commandes contiennent au moins un pro sées ; et que 3 % des photos ont les deux
duit neuf et que, pour 30 % des commandes, problèmes à la fois.
le client accepte de payer un supplément a) Quelle proportion de toutes les photos
pour une livraison plus rapide. a une trop grande saturation ?
a) Quelle proportion des commandes b) Sachant qu’une photo est surexposée,
contient au moins un produit neuf ou quelle est la probabilité qu’elle soit
des frais pour livraison rapide ? aussi sursaturée ?
b) Quelle est l’hypothèse nécessaire pour
1.40 Soit le schéma reproduit à la figure 1.20.
répondre à la question précédente ?
Une randonneuse part du point A en choi
c) Si 35 % des commandes ayant au moins sissant au hasard parmi les sentiers AB, AC,
un produit neuf comprennent aussi des AD et AE. A chaque intersection subsé
frais de livraison rapide, quente, elle choisit un nouveau sentier
i) que devient la proportion calculée au hasard. Quelle est la probabilité qu’elle
en a)? atteigne le point X ?
Une introduction aux probabilités
1.41 Trois imprimeurs effectuent des travaux le reconnaisse est de 0,9. Si sa cause est autre,
pour le compte d’une université. Il n’y a la probabilité qu’on l’attribue à tort à une
aucune pénalité exigée en cas de retard, défaillance de structure est de 0,2. Sachant
et les nombreux travaux précédemment que 25 % de tous les accidents aériens
confiés à ces imprimeurs ont permis résultent d’une défaillance de structure,
d’établir les données ci-dessous. déterminez la probabilité qu’il s’agisse bien
de la cause d’un accident ayant été attribué
à une telle défaillance.
Part des
travaux 1.43 On sait que 20 % des produits alimentaires
Part des effectués d’un grossiste sont sans gluten, et que 90 %
travaux avec plus de ses produits sont sans arachides. Si on
confiés à d ’un mois considère que l’utilisation de noix et que celle
Imprimeur i l’imprimeur i de retard de produits contenant du gluten ne sont pas
0,2 0,2 liées, quelle proportion des produits de ce gros
1
0,3 siste contient au moins un des deux allergènes ?
2 0,5
3 0,5 0,3 1.44 Les aéroports effectuent des contrôles de
sécurité aléatoires sur les bagages des voya
geurs. Supposons que 10 % des voyageurs
On aurait dû recevoir un certain dépliant il y
voient leurs bagages fouillés par hasard avant
a plus d’un mois. Quelle est la probabilité
que ce contrat ait été confié à l’imprimeur 3 ? d’accéder aux terminaux de départ. Quelle
est la probabilité que, lors de ses 15 voyages
1.42 Tout accident aérien fait l’objet d’une d’affaires annuels, un représentant commer
enquête approfondie. S’il résulte d’une cial soit intercepté exactement une fois pour
défaillance de structure, la probabilité qu’on une fouille de bagages aléatoire ?
f ♦' I
» è * + V<
V 4 » * + >♦
l ♦ »« ■f i é ? « « » » fc C 4 4 -f» > ï
~ ^
a os ce ch ap itre, nous allon s p résen ter la notion de v a ria b le a lé a to ir e ,
d éfin ir les d istrib u tion s de p rob ab ilité et les fon ctio n s de r é p a r titio n ;
J Ê L * J le tou t sera illu stré à l’aide d ’exem p les. N ous ex a m in ero n s e n s u ite
certa in s p aram ètres u tiles à la com préhension des v a ria b les a lé a to ir e s- N o u s
term in ero n s en p résen tan t les fon ction s d ’une v ariab le a léa to ire.
Lorsqu’on décrit l’espace échantillonnai d’une expérience aléatoire, il n’est pas nécessaire que
tout résultat possible soit un nombre. Divers exemples le démontrent, notam m ent le lancer d’une
pièce de monnaie équilibrée à trois reprises, où {PPP, PPF, PFP, P F F, F P P, F P F, ,
FFF} ; et la vérification de deux produits pouvant être « Acceptables » ou « D éfectueux », soit
ï f = {AA, AD, DA, DD}.
Dans la plupart des situations expérimentales, on s’intéresse plutôt à des résultats numériques.
Si on reprend le cas du lancer d’une pièce de monnaie, on pourrait attribuer un nom bre réel x à
chaque élément e de l’espace échantillonnai SF, par exemple = le nombre de résultats « pile »
obtenus. Dans ce cas, X est une fonction qui porte le nom de « variable aléatoire ». L’espace échan
tillonnai Sf forme le domaine de X et son image se compose de nombres réels.
— * . . m • —, . # , . • — . • * — ' ■ . m'
Variable aléatoire
- _ . " ^ . ’* . * * « 1 * , % . ' \ * r . . " . f* * * . ' 1 i - , - i , - , • fc ■ " 4
Soit % une expérience dont l’espace échantillonnai est SPet X, une fonction qui attribue un nombre réel
— * , . , — . a ^ 1 " \ j , ' —a . a * . a
à chaque résultat e e SP. On appelle X une « variable aléatoire». On utilise une lettre majuscule pour
• • ' • . - a - * . ". > * „ , > ( ^ ' • • , ' . y • s ;.4 ' ■ * . . , . y V y y ' ,
identifier la variable elle-même, disons X. Après la conduite de l’expérience, on notera la valeur d’une
■— —_ a * . a * # y " y * ’ * a P I . ' . - . - ■ ( a-’ # ■ a a ■* * * ' ' f , . . • a * «
Rappelons que pour toute fonction, chaque élément du domaine est associé à une et une seule
valeur de l’image. Ainsi, dans le cas d’une variable aléatoire, à chaque résultat e Sf correspond
exactement une valeur x=X(e). Soulignons que différentes valeurs de e peuvent se traduire par une
même valeur de x, comme dans l’exemple précédent, où = 1, X(JFPF) = 1 et ) = 1.
Exemple 2.1
À partir de l’expérience mentionnée précédemment, si X représente le nombre de fois où la pièce tombe
sur le côté pile, alors X(PPP) = 3, X(PPF) = 2, X(PFP) = 2, X(PFF) = 1, X(FPP) = 2, X(FPF) = 1,
X(FFP) = 1 et X(FFF) = 0. L’image de X est alors Rx = {0, 1, 2, 3} (voir la figure 2.1a).
On aurait pu définir une autre variable aléatoire en se basant sur la même expérience. Par exemple,
1 si la pièce tombe trois fois sur le même côté
Y
0 sinon. ►
Les variables aléatoires à une dimension
f
Sf R $f R
:
_ J
Exemple 2.2
Soit l’expérience consistant à lancer deux dés équilibrés. (L’espace échantillonnai est constitué des
36 couples de résultats possibles). Si la variable aléatoire Y se définit comme la somme des chiffres sur
les faces du dessus, alors Ry = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}, et ses éléments ont dans l’ordre une
probabilité de Le tableau 2.1 (voir à la page suivante) montre
les événements équivalents. Rappelons qu’il y a 36 résultats possibles, tous équiprobables puisque les
dés sont équilibrés. ►
44 CHAPITRE 2
Exemple 2.3
Pour vérifier la durée de vie de 100 stimulateurs cardiaques, un technicien les dépose dans une solution
saline maintenue à la température du corps. L’ordinateur enregistre la date et l’heure de la défaillance
des stimulateurs. On a alors SP = {(d, h) : d = la date, h = l’heure}.
Soit X une variable aléatoire représentant la durée de fonctionnement avant une défaillance. La variable
aléatoire X correspond au nombre total d ’unités de temps, à compter de la date et de l’heure du début de
l'expérience (d0, hQ). On a alors R x — {x : x > 0}. On s’intéresse ici à X et à sa distribution de probabilité,
un concept qui sera présenté dans les prochaines sections.
F o n c tio n de ré p a rtitio n
On peut traduire la probabilité de l’événement {X < x} par une fonction de x:
F(x) = P(X < x). (2.1)
La fonction F porte le nom de « fonction de répartition » ou « fonction cumulative de d istrib u tio n » de
la variable aléatoire X.
La définition de F(x) est toujours la même, à savoir P ( X < x), mais sa form e exacte d ép en d
de la nature des valeurs possibles de X.
Les variables aléatoires à une dimension
Exemple 2.4
Dans le cas du lancer d’une pièce à trois reprises, la variable aléatoire X = nombre de résultats « pile »
1 3 3
pouvait prendre quatre valeurs, 0, 1, 2 et 3, ayant respectivement une probabilité de | 8 8 et ~ On ’
0 si x < 0
1/8 si 0 < x < 1
FO<) 4/8 si 1 < x < 2
7/8 si 2 < x < 3
1 si jc> 3.
Exemple 2.5
Reprenons l’exemple 1.13 concernant un tube cathodique soumis à un essai de durée. Soit Sf= {r : t > 0}.
Si X représente le temps écoulé (en heures) au moment de la défaillance, l’événement {X < x} appar
tient à l’image de X. Voici un modèle mathématique qui attribue une probabilité à [X < x) :
r
si x < 0,
F(x)
si x > 0,
✓
46 CHAPITRE 2
où X (lambda) est un nombre positif appelé «taux de défaillance», c’est-à-dire le nombre de défai!
lances par heure. Dans la pratique, l’utilisation de ce modèle exponentiel repose sur certaines hypo
thèses sur lesquelles nous reviendrons ultérieurement.
La fonction de répartition de la durée de fonctionnement du tube est représentée graphiquement à la
figure 2.3, où on suppose un taux de = 0,001.
Toute fonction de répartition a les propriétés énumérées ci-dessous, qui découlent directe
ment de la définition énoncée.
lim F(x) = 0.
. r — > — o o . . . .
3. La fonction est non décroissante. Autrement dit, si x, < alors F(x,) < F(x2)■
» , . ( ,
* »* , '*
4. La fonction est continue à droite. Autrement dit, pour toute valeur de x et S> 0,
lim [F(x + <5)-F(x)] = 0.
<5->0
Réexaminons les deux derniers exemples. À l’exemple 2.4, on remarque que les valeurs de
x qui font augmenter la valeur de F{x) sont des nombres entiers. Lorsque x n’est pas un entier,
F{x) a la même valeur qu’au point le plus près sur la gauche, où x correspond à un entier. On
voit que F{x) fait un saut aux points d’abscisse 0, 1, 2 et 3 et passe de 0 à 1 par une succession
de tels bonds. L’exemple 2.5 présente une situation différente, où F{x) s’élève progressivement
de 0 à 1 et s’avère partout continue, mais sans être dérivable en x = 0.
Selon la forme de sa fonction de répartition F{x) ou encore selon la nature de son image
Rx, une variable aléatoire X peut être qualifiée de discrète {voir l ’exemple 2.4) ou de continue
{voir l ’exemple 2.5).
Les variables aléatoires à une dimension
Exemple 2.6
Supposons qu’une année compte 250 jours de travail et qu’on inscrit tout jour d’absence au dossier de
chaque membre du personnel. On réalise une expérience où il faut choisir au hasard le dossier d’un
membre du personnel pour connaître ses jours d’absence. La variable aléatoire X représente ici U-
nombre de jours d’absence, de sorte que Rx = {0, 1, 2, ..., 250}. Il s’agit d’une variable aléatoire
discrète ayant un nombre fini de valeurs possibles.
- \ ' 1 ' • %
Exemple 2.7
Un compteur Geiger-Müller est relié à un tube à gaz afin de mesurer le nombre de radiations ambiantes
à l’intérieur d’un intervalle de temps [0, /]. La variable aléatoire est la mesure obtenue sur le compteur.
Si l’on note cette variable X, alors Rx = {0, l, 2, ..., k, ...}. Comme cette image est formée, à tout
le moins du point de vue conceptuel, d’une infinité dénombrable d’éléments (une relation bijective
pouvant être établie entre les résultats possibles et les nombres naturels), on est en présence d’une
variable aléatoire discrète.
Fonction de masse de X
Lorsque X représente une variable aléatoire discrète, on associe un nombre = P(X = à chaque
résultat ;c, de Rxpour i= l, 2 , . , où chaque nombre p{xi) satisfait aux condit
I. p (xi) > 0, pour toute valeur de /.
O O
/=!
La fonction p(x) constitue la fonction de masse (de probabilité) de la variable aléatoire, et l’ensemble
des couples [(*,-, p(xi)), i= l, 2 , ...] forme la distribution de probabilité de X. On représente gr
ment une fonction de masse par un diagramme en bâtons.
En reprenant l’équation 2.3, on peut aussi noter le résultat utile ci-dessous, obtenu lorsque b>a:
P{a <X<b)~P(X<b)~P(X<à)=) - F(à). (2.4)
On présente en général la fonction sous une forme tabulaire, graphique ou mathématique,
comme le montrent les exemples ci-après.
48 CHAPITRE 2
Exemple 2.8
/
P(x) + c
X 3/8 - !
%
«
pix) f
0 1/8 2/8
î 3/8
2 3/8 1/8 *
•*
3 1/8
0 1 2 3 x
- I
I
t
> i J j i
- . y
La fonction de masse du nombre de «p ile » lors du lancer d'une pièce
à trois reprises
On peut calculer des probabilités associées à des événements à l’aide de la fonction de masse
Quelle est la probabilité d’obtenir au maximum un « pile » lors de trois lancers ?
P(X< \) = P(X = 0) + P(X = 1)
p(0)+ p(l)
1 3 4 J.
~+ —
8 8 8 2
Quelle est la probabilité d’obtenir plus de deux « pile » lors de trois lancers ?
P(X > 2) = P(X = 3)
4
Pi 3)
1
8
Exemple 2.9
Soit une variable aléatoire X dont la distribution de probabilité est définie par la relation
( n '
n-x
Px(1 ~ P) si x = 0,1,...,
pix) x J (2.5)
0 smon,
où n est un entier positif et p est un paramètre avec 0 < 1. Cette relation porte le nom de « loi
binomiale » et fera l’objet d’une étude plus poussée au chapitre 4. On pourrait représenter ce modèle
par un tableau ou un diagramme pour des valeurs données de n et de , en évaluant p ( ) lorsque = 0,
1, 2, ..., n. Notons que l’exemple 2.8 représente la fonction de masse binomiale pour des paramètres
valant n= 3 et p = 1/2.
Les variables aléatoires à une dimension 49
Exemple 2.10
Soit N objets dont Dsont défectueux. On en prélève au hasard et sans remise un échantillon de t
Si X représente le nombre d’objets défectueux dans cet échantillon, alors
\
D N -D
x J n-x
si x € {max (0, n - N + D),..., min (n, D)\
p(x) N X ( 2.6)
n J
0 smon.
Cette distribution de probabilité porte le nom de «loi hypergéométrique». Prenons un cas particulier
oùN = 100 objets, D = 5 objets défectueux et n = 4 objets tirés. On a alors
\
5 95
* y 4 - x / six = 0,1,2,3,4
P (x ) f 100 ^
4 J
0 smon.
Quelle est la probabilité de tirer exactement un objet défecteux lors d’un tel échantillonnage ?
Fonction de d e n s ité d e X
La fonction de densité (de probabilité) de la variable continue X, est définie par :
f(x) = 4- n x ) , (2.7)
; dx
et il s’ensuit que
F(x)= P du (2.8)
On rem arque une correspondance étroite entre ce dernier résultat et l’éq u atio n 2.3 (ie
symbole de l’intégration ayant remplacé celui de la sommation).
Énoncer la définition d’une fonction de densité exige une fonction /d é fin ie sur l’im age de
X telle que
/
.
t
i
i
:
?
l
i
t
P(a <X< b)
L’équation 2.10 peut sembler contre-intuitive. Si X peut prendre toutes les valeurs dans un
intervalle quelconque, alors P(X = x0) = 0 ne veut pas dire que notre modèle est mal adapté.
Lorsqu’on considère une mesure continue réelle comme la vitesse du vent et que l’on s’inté
resse à l’événement V= 21,3 km/h, il s’agit d’une valeur arrondie de la vitesse liée à la
de notre instrument. La probabilité que V = 21,3, nulle en théorie pour la valeur exacte, est
équivalente en pratique à la probabilité que V appartienne à un petit intervalle autour de 21,3,
par exemple [21,25 ; 21,35], qui n’est pas nulle selon notre modèle.
Ainsi, puisque chaque point est de probabilité nulle pour une variable continue, il n’est pas
nécessaire de distinguer les inégalités < et < dans la définition des événements.
Remarque
Il en résulte directement que P(a <X<b) = P(a < X < b) = P(a <X<b) = P(a < X < b), où X est une
variable continue* ces valeurs étant toutes données par F(b) - F(a).
Exemple 2.11
La durée de fonctionnement avant défaillance du tube cathodique de l’exemple 1.13 présente la fonc
tion de densité suivante :
Xe~Xt sir> 0
sinon,
où À > 0 est une constante appelée « taux de défaillance ». On qualifie d’« exponentielle » cette fonc
tion de densité, et des expériences ont démontré que cette fonction peut servir à décrire la durée de ►
CHAPITRE 2
ônctionnement avant défaillance (un phénomène du monde réel) de certains types de composants.
Supposons qu’on veut ici déterminer P ( T > 100 heures), ce qui correspond à /^(ÎOO < T < oo). On a alors
P(T 100) Xe A/
dt
100
100 A
e
E x e m p le 2.12
Soit une variable aléatoire X dont la fonction de densité triangulaire est définie ci-dessous et représentée
graphiquement à la figure 2.8.
X si 0 < x < 1
—x si 1 < x < 2
0 sinon •
/ « +
x
0 1 2
Voici quelques calculs réalisés à partir de cette densité. Vous pouvez hachurer les surfaces correspon
dantes sur le graphique de la figure 2.8 pour estimer les probabilités avant de les calculer.
Les variables aléatoires à une dimension
On utilise en général un modèle mathématique pour décrire une fonction de densité. Une
représentation graphique ou géométrique peut également s’avérer utile. La probabilité que la
variable X se situe entre deux valeurs données correspond à l’aire sous la courbe comprise entre
ces deux valeurs.
Espérance de X
Dans les deux cas (discret et continu), l’espérance de X est le centre de gravité ou le c e n tr
de masse, c’est-à-dire le « point d’équilibre » de la masse représentée par le graphique de p (x) o u d
/(x). Un diagramme symétrique donnera lieu à une espérance située au milieu de l’im age de X.
b)
Une analogie entre l'espérance et le centre de masse: a) dans le cas d iscre t;
v..
b) dans le cas continu
Exemple 2.13
Revenons à l’expérience de l’exemple 2.8, où X représente le nombre de fois qu’une pièce lancée à trois
reprises tombe sur le côté pile. On obtient ici
1 3
E(X) = fi = ' £ x lp(xl) = 0 -1 î ) + l { f ) + 2 - ( f 1+ 3
(= 1 8 2
comme l’indique la figure 2.10. Dans ce cas précis, on aurait aisément pu déterminer la valeur de fl
en examinant le diagramme, étant donné sa symétrie. Il faut noter que, dans cet exemple, la moyenne
n’est pas une valeur possible de .XlI s’agit du nombre moyen de «pile» qu’o
une pièce à trois reprises un très grand nombre de fois.
X t
I
*
t
p(x)
3/8 z
i
t
|S
t
2/8 ±
r
*
i
•4
1/8 ft
k
t
i
I
0
i.
i
£ r
0 1 2 3 x i
p = 3/2 i
i
i
Exemple 2.14
Soit la fonction de densité triangulaire définie à l’exemple 2.12 :
X si 0 < x < 1
2-x si 1<x < 2
0 sinon.
La moyenne correspond ici à
x •x dx + X‘0 dx
= 1.
Encore une fois, la moyenne aurait pu être déterminée à partir du diagramme grâce à sa symétrie.
Variance de X
La variance est une mesure de dispersion des valeurs par rapport à la moyenne. Plus la
variance est grande, plus les valeurs de X qu’on obtiendrait lors de plusieurs réalisations de
l’expérience seraient éloignées les unes des autres. La variance est définie comme la moyenne
des écarts entre les x et leur espérance fl élevés au carré, c’est-à-dire V(X) = £[(X —fX)2].
Si on reprend l’analogie des masses sur une poutre, la variance correspond au moment
d’inertie du diagramme par rapport à fl. Plus les valeurs sont dispersées (cr2 grand), plus il serait
difficile de faire pivoter le diagramme autour d’un axe placé en //.
Soit les deux distributions discrètes présentées graphiquement à la figure 2.11 {voir à la
page suivante). Chacune a une moyenne de 1. La variance de la variable aléatoire discrète en a)
est de
<To2 = ( 0 - l ) 2( y + ( l - D 2g ) + (2 - l ) 2( I ) = I ,
/
p(x) p(x)
1/2
1/4 1/5
0 1 2 x 1 0 12 3 x
a)fi 1 etcr 2 = 0,5 b) 1 etcr 2 = 2
Si la variable aléatoire est exprimée en mètres, on utilisera cette même unité pour la moyenne,
mais on exprimera la variance en mètres carrés. Il en va ainsi quelle que soit l’unité utilisée.
Écart-type de X
« „ / . / . i a » - * — •’ «
L’unité utilisée pour l’écart-type est la même que pour la variable aléatoire. Un faible écart-
type dénote une faible dispersion, et un grand écart-type, une plus grande dispersion.
Par manipulation algébrique, on peut réécrire l’équation 2.12 sous la forme
2 2
G V(X) EÇX2) ~ P%
ou
Exemple 2.15
À partir de l’exemple 2.8 sur le lancer d’une pièce, l’exemple 2.13 a permis d’établir que = 3
j , d’où
2
2 3Ÿ 13V f . 3Y 3 3Y 1 3
(7 y
£ i(xi - f i )p(xi)
2 0- I - +| 1
- + 12 — + 3
i 2 / 8 v 2) 8 l 2 8 2 8 4
Utilisons maintenant l’autre forme de l’équation, soit
2
2 1 12 3 2 3 2 1 3 3
a 2 =E{X2) - f l 2 0 + 1 -- + 2 -- + 3 •-
8 8 8 8 2 4
Exemple 2.16
Si on revient à l’exemple 2.11 sur la distribution exponentielle, en posant A = 2 , on a la fonction de
densité/(x), illustrée à la figure 2.12 et définie par
-2x
2e six > 0
f(x)
0 smon.
x /(x ) dx x 2e —
2jc
dx
2
et
2 1 1 1
<72 x 2 •2e 2x dx
ri x - \ ) f ( x ) d x = i
2 2 4 4
1
On obtient donc un écart-type valant a
2
/
Afin d’alléger la présentation, nous écrirons simplement P au lieu d’utiliser PYou Px.
L’équation 2.17 indique la méthode à utiliser pour résoudre les problèmes. On doit en effet
trouver l’événement B de Rx équivalant à l’événement C de RY, puis en déterminer la probabilité.
Exemple 2.17
Prenons l’exemple de l’aire Y de la section d’un fil. Supposons que le diamètre de ce fil soit la variable
aléatoire X, dont la fonction de densité est illustrée à la figure 2.14 et définie ainsi :
/ 1
f(x)
200
100
X
1,000 1,005
Exemple 2.18
com pteur Geiger-Müller permet de mesurer le nombre de particules ïs reçues sur un
temps t. Dans un certain environnement m asse de X, soit
nombre minute
e~44 x si x = 0, 1, 2,
PU) x\
0 smon.
Y=2X + 2,
1. La variable Y est discrète, ce qui peut arriver lorsque X est une variable discrète on
continue. On cherche alors à trouver une fonction de masse p Y(y ).
2. La variable Y est continue, ce qui arrive lorsque la variable X est également continue
Dans ce cas on cherche à trouver une fonction de densité f Y( y ) .
Ces deux cas sont présentés dans les deux sections qui suivent.
P r ( y l) = P (Y = y i) = X P x ( T ,) ’ ( 2 .1
e Bi
P a r e x e m p le , à l a f ig u r e 2 .1 5 , l a p r o b a b i l i t é d e y . c o r r e s p o n d à
P r C y d ~ P x ( x i ) + P x ( JCi2) + P x ( x i3) + P x ( x i ) .
Les variables aléatoires à une dimension
I t
iII
.
>
*
.
i
*
i
;
Dans le cas particulier où la fonction H est telle qu’il y a exactement une valeur x associée
à chaque valeur y, on a p Y(yd = Px(*,•)» où y, = //(x ,) . Illustrons ces concepts par des exemples.
Exemple 2.19
Revenons à l’expérience où X représente le nombre de fois qu’une pièce lancée à trois reprises tombe
sur le côté pile. On se souviendra que X peut ici prendre quatre valeurs, 0, 1, 2 et 3, leurs probabili
tés respectives étant les suivantes : | et Si F= 2X - 1, alors Y peut prendre les valeurs —1, 1, 3
et 5, et on a
P y (—1 ) —Px ( 0 ) —g 5
3
PY(1) = Px (1) = g ’
P Y0 ) = P x (2 ) = - ,
PK(5) = Px(3) = i-
Dans le cas présent, la fonction H est telle qu’il y a exactement une valeur x associée à chaque valeur y.
Exemple 2.20
Soit la variable X de l’exemple précédent. Si Y = \X - 2\, de sorte que Y peut prendre les valeurs 0, 1 et 2
(voir la figure 2.16, à la page suivante), on a alors
P y ( 0 ) = xP2( ) ~ ë’
p . (1) = M » + P* (3) = J •
1
P y (2 )= p x (0) 8" ►
CHAPITRE 2
Lorsque la variable X est continue tandis que la variable Y est discrète, la fonction de masse
p Y(yd est alors donnée par
Exemple 2.21
Soit la variable X dont la fonction de densité est définie ci-dessous et illustrée à la figure 2.17.
—Xx
Xe si x > 0
/rW
0 sinon.
X
i
■a
1
4
i
F La fonction de densité de la variable X
Exemple 2.22
Supposons qu’une variable aléatoire a la fonction de densité
x/S si 0 < x < 4
/*(*) 0 sinon.
On veut connaître la fonction de densité fy(y) de la variable aléatoire Y = H(X) = 2X + 8. On suit les
étapes énumérées ci-dessous.
y 1
si 8 < y < 16
fy(y) 32 4
0 sinon.
La figure 2.18 illustre la différence entre la densité de X et celle de Y.
fx(*) I fr(y) 4
1/2 1/4
1/4 1/8
0 0
0 8 16 y
a) b)
a) La densité de X ; b) la densité de Y = 2 X + 8
64 CHAPITRE 2
Exemple 2.23
Reprenons la variable aléatoire X définie à l’exemple 2.22 et supposons que Y = ) (X 2)2. En
procédant comme à l’exemple 2 .2 2 , on obtient ce qui suit.
1
[(4 + 4Jÿ + y) - (4 - 4yjÿ + y)]
16
1
2 V?
1
2. f Y(y) = Fy
4 V?
3. Six 2 , y 0, et si x = 0 ou 4, on a y = 4. Cependant, la fonction / y n’est pas définie pour
y = 0, de sorte que
1
si 0 < y < 4
/y (y) 4Vÿ
0 smon.
2
La figure 2.19 illustre la différence entre la densité de X et celle de 2)
/
/y(y) I
0,5
fx(x) I
0,4
1/2 0,3
0,2
1/4
0,1
i
«
4
r
0 1 2 3 4 y
a) b) !
t
1
I
t
t
a) La densité de X; b) la densité de Y = ( X - 2)
Soit X une variable aléatoire continue dont la fonction de densité vérifi > 0 pour <
Si y = H(x) définit une fonction continue strictement croissante ou strictement décroissante de x
alors la variable aléatoire Y = H{X) a pour fonction de densité
dx
Sy(y) = fx (*) dy ( 2 . 20 )
H {a) <y < H{b). Si elle est décroissante, alors/y (y) > 0 si H(b) H (a).
Démonstration
Exemple 2.24
À l’exemple 2 .2 2 , on avait
jc/8 si 0 < x < 4
fx(x) 0 smon.
et ff(x) = 2x+ 8, qui est une fonction strictement croissante. L’équation 2.20 donne ainsi
dx y- 8 1
fy (y) = f x (x) dy 16 *2
Lorsque la variable X est continue, on se limite ici aux fonctions H telles que Y = H(X)
constitue une variable aléatoire continue. Les équations 2.21 et 2.22 indiquent qu’on peut
déterminer la moyenne de la variable Y = H(X) en utilisant uniquement la distribution de la
variable X.
CHAPITRE 2
On peut donc définir la variance de la variable aléatoire X comme l’espérance m athém atique
d’une fonction.
L’opérateur d'espérance peut également servir à exprimer les moments par rapport à l’o ri
gine et les moments centrés dont il a été question précédemment. On a alors
A = £(X‘) (2.26)
et
E s p é ra n c e e t v a ria n c e d e a X + b
Il convient d’examiner ici une fonction linéaire H(X) = aX + où et sont des constantes. Si
la variable X est discrète, on a
a x f ( x ) dx + f ( x ) dx
OO
aE(X) + b. ( 2 . 28 )
Les variables aléatoires à une dimension
V(b) = 0. (2.31)
Exemple 2.25
Soit une variable aléatoire X telle que E(X) = 3 et V(X) = 5. Si H(X) - 2 X - 1 , alors
E[H(X)] = 7) = 2E(X) - 7 = -1
V[H(X)] = X
2(V
- 7) = 4V(X) = 20.
Les exemples qui suivent font voir d’autres calculs liés à l’espérance et à la variance.
Exemple 2.26
Une entrepreneuse s’apprête à soumissionner un travail. Le nombre de jours requis pour exécuter ce
travail est une variable aléatoire notée X. Le bénéfice B que réalisera l’entrepreneuse varie en fonction
de X. En d’autres termes, B =H(X). La distribution de probabilité (jc, p(x)) de X se présente comme suit.
x p(x)
3 1/8
4 5/8
5 2/8
Exemple 2.27
Voici un problème simple et bien connu de gestion des stocks, celui du vendeur de journaux. Ce ven
deur paie ses journaux 15 0 l’unité et les revend 25 0 l’unité, mais il ne peut pas retourner ses invendus.
Le tableau suivant fait voir la distribution de la demande quotidienne de ses journaux, la demande de
toute journée étant indépendante de celle de la veille.
Nombre de ventes x 23 24 25 26 27 28 29 30
Probabilité p(x) 0,01 0,04 0,10 0,10 0,25 0,25 0,15 0,10
Soit s le nombre d’exemplaires qu’il achète et X, la demande quotidienne. Si le vendeur achète trop
de journaux (X < s), il subit une perte en raison de son stock excédentaire (15 0 par item en trop). S’il
en achète trop peu (X > s), il se prive d’une part de bénéfice puisqu’il ne comble pas la demande (10 0
par item manquant). Donc, on peut s’attendre à ce que le vendeur souhaite avoir un stock de journaux
qui atténue sa perte moyenne. Soit L(X, s) la perte qu’entraîne un stock donné s. La perte que subit le
vendeur se traduit alors simplement par
0,10(X - s) si X > s
0,15 (s - X) si X < s,
Soit s = 26,
E[L(X, 26)] = 0,15[(26 - 23)(0,01) + (26 - 24)(0,04) + (26 - 25)(0,10)
+ (26 - 26)(0,10)] + 0,10[(27 - 26)(0,25) + (28 - 26)(0,25)
+ (29 - 26)(0,15) + (30 - 26)(0,10)]
= 0,1915$.
Soit s= 27,
E[L(X, 27)] = 0,15[(27 - 23)(0,01) + (27 - 24)(0,04) + (27 - 25)(0,10)
+ (27 - 26)(0,10) + (27 - 27)(0,25)] + 0,10[(28 - 27)(0,25)
+ (29 - 27)(0,15) + (30 - 27)(0,10)]
= 0,1540 $.
Soit s = 28,
E[L(X, 28)] = 0,15[(28 - 23)(0,01) + (28 - 24)(0,04) + (28 - 25)(0,10)
+ (28 - 26)(0,10) + (28 - 27)(0,25) + (28 - 28)(0,25)]
+ 0,10 [(29 - 28)(0,15) + (30 - 28)(0,10)]
= 0,1790$.
Les autres valeurs de s donneront lieu à des pertes moyennes plus élevées que 0,1540 $.
Le vendeur devrait donc se procurer 27 exemplaires s’il veut réduire le plus possible sa perte moyenne.
Notons ici qu’il ne s’agit pas d’une perte nette (au sens d’un déficit), car on y inclut les bénéfices poten
tiels non réalisés.
Exemple 2.28
Soit le système illustré dans le schéma ci-dessous.
Au moins un des deux éléments du système doit fonctionner. Or, l’un d’eux joue un rôle de dispositif de
secours (il demeure inutilisé jusqu’à ce que l’autre connaisse une défaillance), la commutation s’effec
tue sans faille, et le système ne fait l’objet d’aucun entretien. On peut démontrer que dans certaines
conditions, où la durée de fonctionnement avant défaillance de chaque élément du système obéit à une
loi exponentielle, la durée de fonctionnement avant défaillance du système a la fonction de densité
six > 0
sinon, -
où X > 0 et représente le taux de défaillance des modèles exponentiels des éléments. Le présent système
a une durée moyenne de fonctionnement avant défaillance de
S’il n’y avait qu’une composante dans le système dont la durée de vie suivait une loi exponentielle
(/(x) = Ae~Xx pour x > 0), alors l’espérance de X serait E(x) = 1 Ici, la durée de vie prévue du système
est deux fois plus longue parce que les composantes fonctionnent l’une après l’autre.
70 CHAPITRE 2
Py W = J[Bf x ( x ) dxO
’Ù H(x) = y (}
X et Y continues
Fyiy) P {Y <y) = P(H(X) < y) = P(X < H ~ \y ))
cl
fy(y) Fy(y)
dy
Les variables aléatoires à une dimension
2.15 Considérez les huit figures illustrées 2.18 Déterminez si les énoncés suivants sont
ci-dessous. vrais ou faux.
a) Dans certains cas, une fonction de densité
peut prendre des valeurs supérieures à 1.
b) Pour calculer P(2 7) à partir de
la fonction de répartition, il suffit
de calculer F(2) - F (J).
c) On peut obtenir la fonction de densité
d’une variable aléatoire continue en
dérivant sa fonction de répartition sur
chaque intervalle de Rx.
0 5 1 0 1 5 2 0 2 5* ^
d) L’espérance d’une variable aléatoire X
- 1 0 1
a) Lesquelles représentent des fonctions de h) Pour calculer P(X > 2\X < 3), il suffit de
densité ?
F( 2)
b) Lesquelles représentent des fonctions calculer 1-
de répartition ? F( 3)'
Deux promoteurs immobiliers, A et B,
2.16 La variable aléatoire continue T a la fonc souhaitent vendre certains de leurs terrains.
tion de densité fit)= 2pour-1 0. L’analyse des ventes passées permet d’établir
a) Déterminez la valeur appropriée de k. la distribution de probabilité du prix de vente
b) Tracez le graphique de la densité de T. par terrain (en dollars) pour chaque promoteur.
c) Calculez la moyenne de T.
d) Sachant que E(T2) = 3/5, calculez la Prix 50 000 51 000 51 500 53 500
variance de T. A 0,2 0,4 0,3 0,1
e) Déterminez la fonction de répartition de T. B 0,3 0,2 0,3 0,2
2.17 Une variable aléatoire discrète X a pour Sachant que A et B agissent indépendam
fonction de masse p(x), où ment l’un de l’autre, calculez :
, , [ *(1/2)* six =1,2, 3 a) le prix de vente moyen que chacun réus
p(x )= sit à obtenir ;
0 sinon.
%
b) le prix que A peut s’attendre à obtenir
a) Déterminez la valeur de k. pour un terrain si B a obtenu 51 500 $
b) Tracez le graphique de la fonction de
pour son dernier terrain ;
masse de X. c) la probabilité que A et B obtiennent
c) En examinant le diagramme tracé en b), tous deux le même prix lors de leur
pouvez-vous dire si l’espérance de X sera prochaine vente.
inférieure à 2, supérieure à 2 ou égale à 2 ? 2.20 Sans faire de calcul, choisissez dans le tableau
d) Sans faire de calcul, pouvez-vous dire ci-après les valeurs les plus représentatives de
si l’écart-type de X sera inférieur à 2 ou l’espérance et de l’écart-type de chacune des
supérieur à 2 ? densités représentées par un diagramme.
CHAPITRE 2
si 0 < x < 3
sinon.
a ) Définissez la fonction de répartition de X.
b) En examinant le diagramme de la fonc
tion de densité, pouvez-vous dire si la
moyenne de X sera supérieure à 1,5 ? Associez les densités suivantes à la bonne
c) Déterminez c’est-à-dire EQP)- fonction de répartition.
d) Trouvez une valeur m telle que
P(X >m) = P(X < m). C’est ce qu’on
appelle la « médiane » de X.
2 .2 2 Voici le graphique de la fonction de répar
tition de la longueur des pièces usinées
(en mm) qui sortent de l’intervalle de
valeurs acceptables d’un client industriel.
<N
V
-1
0,25 H
si -2 < < -1
jc a) Py(,}’)s>
■oit la fonction de masse de
0,55 si - 1 < < 0
jc
la perte ;
b) E(Y),la perte moyenne théorique ;
0,80 si
IA
o
A
c) V(K), la variance de la perte.
1 si JC > 1.
2.28 La teneur en magnésium d’un alliage est une
a) Donnez Rx, l’ensemble des valeurs variable aléatoire de fonction de densité
possibles de X.
b) Déterminez la fonction de masse p(x) de X. si 0 < < 6
jc
b) On veut déterminer le niveau optimal 2.42 Un procédé est utilisé pour produire en
des stocks pour un automne donné. série un type de pièce dont le diamètre est
Quelle fonction faudra-t-il minimiser ? une caractéristique importante. Une telle
c) Déterminez le niveau optimal des stocks pièce est jugée conforme si son diamètre
pour un automne donné. se situe dans l’intervalle 75 ± 0,8 mm.
Un examen de la production obtenue avec
2.37 L’acidité d’un certain produit, mesurée
ce procédé montre que le diamètre des
selon une échelle arbitraire, se traduit par pièces est de la forme
A = (3 + 0,05G)2, D= 75 + X,
où G représente la quantité d’un ingrédient
donné dont l’espérance est de 8/3 et la où X (en millimètres) est une variable
variance, de 8/9. Évaluez l’acidité moyenne aléatoire représentant l’erreur par rapport
de ce produit. à la valeur souhaitée, et dont la fonction de
répartition est
2.38 Soit une variable X de fonction de densité
si 1 < x < 2 si x < —1
sinon. si —1<x < 0
a) Déterminez la fonction de densité de
Y= 4 - X 2. si 0 < x < 1
b) Déterminez la fonction de densité
si x > 1.
de W=ex.
2.39 La concentration d’un certain réactif à
l’intérieur d’un processus chimique est une a) Calculez l’espérance et l’écart-type du
variable aléatoire de fonction de densité diamètre D.
b) Calculez le pourcentage de pièces non
si 0 < r < 1 conformes de la production obtenue avec
sinon. ce procédé.
c) Supposons que la production d’une pièce
Le produit final obtenu permet de réaliser de ce type coûte 100 $. Chaque pièce
un profit de P = 1 + 3R (en $). Calculez la produite est testée, et seules les pièces
valeur moyenne du profit, sans déterminer conformes sont vendues à raison de
sa densité. 160 $ l’unité. De plus, toute pièce dont le
2.40 Soit une barre circulaire de diamètre X. On sait diamètre dépasse 75,8 mm est réusinée
que E(X) = 2 cm et que V(X) = 25 x 10~3cm2. (pour devenir conforme) à un coût sup
Un outil de tranchage découpe cette barre plémentaire de 40 $. Toutefois, la pièce
en rondelles d’une épaisseur de 1 cm, cette est mise au rebut (jetée) si son diamètre
valeur étant constante. Déterminez le
*
est inférieur à 74,2 mm. Quelle est la
volume moyen de chaque rondelle. moyenne et l’écart-type du profit réalisé
2.41 Une variable aléatoire X a comme fonction pour une pièce de ce type ?
de masse 2.43 Déterminez si chacun des énoncés suivants
1/2 six = 0 est vrai ou faux.
1/4 si jc= 1 a) Peu importe la distribution de X, on a
EiX2) = fi2.
1/8 six = 2
b) Si £(X) = 10, alors £(4X - 1) = 39.
1/8 six = 3 C) Si £(X) = 10, alors £(X*) = 10 000.
0 sinon. d) Si £(X) = 10, alors £(ln(X)) = ln(10).
a) Déterminez la moyenne et la variance de X. e) Si V(Y) = 10, alors V(Y- 1) = 9.
b) Sachant que Y = ( X - 2)2, déterminez f) Si V(X) = 10, alors V(T4) = 10 000.
la fonction de répartition de Y. g) Si V(Y) = 10, alors V(-3Y) = 90.
est fré q u e n t d ’avoir à tra ite r deux ou plusieurs variai}
ers m êm e tem ps. A titre d'exem ple, on p o u rra it prélever des tô les d ’a c ie r
.e t s’in té re sse r à deux variables a lé ato ires: la résistan ce au c is a ille m e n t
des so u d u res et leu r d iam ètre. On p o u rra it aussi vouloir c a r a c té r is e r la
d istrib u tio n de la taille et du poids des individus d 'u n e p o p u la tio n a in s i
que les liens qui u n issen t ces deux variables. Le p résen t c h a p itre e x p liq u e
com m ent é ta b lir la d istrib u tio n de probabilité conjointe de d eu x ou p lu
sieu rs v ariab les aléato ires. Nous verrons com m ent é ta b lir la d is tr ib u tio n
d 'u n e v ariab le sans te n ir com pte des au tres (la d istrib u tio n m a rg in a le )
ou en fixant les valeurs des au tres variables (la d istrib u tio n c o n d itio n n e lle ).
Nous d iscu tero n s d 'in d ép en d an ce de variables aléato ires, de c o v a ria n c e
et de co rrélatio n . Les fonctions de deux ou plusieurs v a ria b le s aléato ires-
y sero n t égalem ent explorées, en p a rtic u lie r le cas de c o m b in a iso n s lin é a ir e s
de variables.
Vecteur aléatoire
Soit SPl’espace échantillonnai d’une expérience et X,, X2, ...,Xkdes fonctions qui attribuent chacune un
nombre réel XJe), X2(e), Xk(e) à chaque résultat e. On appelle [X,, X2, X J un vecteur aléatoire
de dimension k.
L’image du vecteur aléatoire [Xv X 2,..., X J correspond à l’ensemble de toutes ses valeurs
possibles. On peut la représenter par xX x...xX *°ù
R X] xX2 X’” XXk {[xv x 2, . x J : x x g Rx , x 2 g
2 l
L’exemple qui suit présente l’image de plusieurs variables aléatoires issues d ’u n e même
expenence.
Les distributions de probabilité conjointes
Exemple 3.1
On tire deux chiffres au hasard dans l’ensemble {4, 5, 6}. On définit trois variables réunies dans le
vecteur aléatoire [X,, X2, X3] (voir la figure 3.1).
Si on considère le résultat e= {4, 6}, chaque variable aléatoire est une fonction qui l
nombre réel :
jc , = X, (e) = 10, jc 2 = X2(e) = 2, jc 3 = X3(e) = 4.
L’image du vecteur aléatoire [X„ X2, X3] est Rx xX xX {(9,1,4), (10,2,4), (11, 1, 5)}. Les combinaisons
1 2 3 «
de (je,, 2, 3) ayant une probabilité nulle, comme (9, 2, 5), ne sont pas retenues dans l’image par souci
jc jc
de simplicité.
Exemple 3.2
On décide de mesurer le diamètre de soudures par points et leur résistance au cisaillement. Soit X, le
diamètre en pouces etX2la résistance en livres. S’il est établi que 0 < 0,25 pouce et que 0 < x 2< 2000
livres, alors l’image de [Xt, X2] correspond à l’ensemble {[*,, :0 < x, < 0,25, 0 < 2 0 0 0 } , comme
le montre la figure 3.2.
/ *
x2 (livres) | t
.
2000
I
1
»
i
«
0 0,25 x, (pouces)
I
Figure 3.2 L'image de [Xv X2], où X, représente le diamètre des soudures et X 2, leur
S résistance au cisaillement
Exemple 3.3
De petites pompes font l’objet d’un contrôle de la qualité où quatre attributs sont vérifiés. Chacun de
ces attributs obtient la mention «sans défaut», «avec défaut mineur» (qui n’influe pas sur le fonction
nement) ou «avec défaut majeur» (qui influe sur le fonctionnement). On prévoit choisir une pompe
au hasard et en compter les défauts. Si X, = le nombre de défauts mineurs et X2 = le nombre de
défauts majeurs, alors xx= 0, 1, 2, 3, 4 et x2= 0, 1,..., 4 —x, puisqu’on ne vérifie que quatre attributs.
L’image de [X„ X2] correspond ainsi à {[0, 0], [0, 1], [0, 2], [0, 3], [0, 4], [1, 0], [1, 1], [1, 2], [1, 3],
[2, 0], [2, 1], [2, 2], [3, 0], [3, 1], [4, 0]}. La figure 3.3 présente les résultats possibles.
/ :
<
où
0 < p{xv x2) < 1 pour tout [jc,,
Les valeurs ([jc,, x 2], p(xf, x2)) forment la fonction de masse conjointe de [Xt, X2].
ur est continu : si [X,, X2]est un vecteur aléatoire continu d'image R x xY, sa distribution
de probabilité est alors décrite par une fonction de densité conjointe/ayant les propriétés
suivantes :
/ ( jc,, x2) > 0 pour tout [x ,, x2]
et
La densité conjointe est une surface, et les probabilités sont évaluées en calculant le volume sous
cette surface, au-dessus d’une région déterminée. Les probabilités s’expriment sous la forme
P(a] < X ] < b ] et a2 < X 2 < b^)= [ ' [ ' / ( jc, , x2) = d x ] d
J «2 * a \
Mentionnons une fois encore que/Qc,, x2) ne représente pas une probabilité en soi. O n adopte
ici la convention voulant que f ( x l, x2) = 0 pour tout [*,, x2] <£ Rx xX , ce qui p erm et d ’én o n cer la
seconde propriété sous la forme
/(jtj, x 2)d x 2 1.
Lorsqu’un vecteur [X{, X2] est discret, on en présente la distribution de probabilité sous la form e
d’un tableau, d’un diagramme ou d’un énoncé mathématique. Lorsqu’il est continu, on traduit sa
distribution par une relation mathématique, et il est souvent utile de la représenter graphiquem ent.
Exemple 3.4
figure 3.5 présente, sous la forme d’un tableau, d’un diagramme en mosaïque et d’un diagram m e
distribution de probabilité hypothétique des variables aléatoires définies à l’exemple
/ 4
0 1 2 3 4
c
*;
4
x2 i
*
t
. . f »— *.^ ^ * 0 1
i
1
«
.
i
1 .' ■
—V < *
1
• ' * - • * • » . *" ' ' N • i U
à
i
x2X y 0 1 1 1 2 1 3 1 4 1
i
*
f
2
0 1/30 1/30 2/30 3/30 1/30 | /
4
majeurs
X2= nombre de
y v v v * y * r . * / v 5 . v . \ * v
4
4
i
CX % *v , * V5v ^
/ i V v / f ;
n y c • < A V v . / V 6 A - / / ,
:
.
v - /
i -
V. N # t
.
Î K
/ .
• >
;
iI t
4
i : / (. y ^ y n 4 v < / / *
1/30
S
3 3/30 ;'mü
t.
*
*YI, ’.y>.*
•$ J
*
/ • ; r / v / r / / ; ' < . 7 3
•
■;
."
xi U
a) b) *•
*
C
.
i
»
ta»
p(*l,X2) -4
*»
K
*1
&
I
f
C.
f
.
:-
«
i«.
î
f
t
5
\i *
li
&
i
i
ï
c) ■;
4
I
?
. r r j
Exemple 3.5
Le diamètre des soudures, noté X,, et leur résistance au cisaillement, notée X2, pourraient obéir à une
distribution uniforme se traduisant par
1
si 0 < x, < 0,25; 0 < x2< 2000
f ( x l, x 2) = < 500
0 sinon.
La figure 3.6 illustre l’image de ce vecteur.
Dans le cas d’une variable continue à une dimension, la probabilité correspondait à l’aire sous
la courbe. Dans le cas d’une variable continue de dimension 2, c’est le volume sous la surface qui la
représente.
Supposons qu’on veut déterminer la probabilité P(0,1 < X, < 0,2 et 100 < X2 < 200). Il faut intégrer
/(x,, x2) sur la région 0,1 < x, < 0,2, 100 < x2<200, d’où
f 200 f 0,2 1 1
---- dx,dx7 = — .
* io o J 0.1 500 50
CHAPITRE 3
Exemple 3.6
Soit la distribution conjointe discrète de l’exemple 3.3, représentée à la figure 3.5. La figure 3.7 présente les
distributions marginales correspondantes 1 )) forment
masse univariée, celle de la variable Xxprise séparément. Les couples [x2, p (x2)] forment eux au;
iction de masse univariée, celle de la variable X2prise séparément (donc sans tenir compte de X
/
WS nombre de défauts mineurs
• • *
.
*
.
■ • , .
* h * y * ■ -*
\
.
' ■ , •
.
.
.
' . • • -
.
.
, ' , ' •
* - f
0 1 2 3 4 P x2(*2)
*
• . « * •
£
c/î 2 1/30 2/30 3/30 6/30 1
h c2 3 1/30 3/30 4/30 1
4 3/30 3/30 1 t
»
0 1 2 3 0 1 2 3 4 x?
b) c)
. J
~ 7 . •m’ v . 1 W jiâ. _ ) S
v 5 ‘ • * » -* v * •* - . -r « i
r ti( i/iV # Les distributions marginales associées au vecteur discret [X,, X 2J : a) ces
4
S . . ^ J JT ■ ( • •
V m« , J* T ~ r > » -
V * ' * ' *. 'ç - ’S » V T\
f x , (*2) f ( x . , x 2)dxx. (3 5)
— O O
La fonction/ est la fonction de densité de la variable X, prise séparément, tandis que la fonction
1
est celle de la variable X? prise séparément.
Exemple 3.7
À l’exemple 3.5, la densité conjointe de [X,, X2] était
1
si 0 < x, < 0,25; 0 < x2< 2000
f{x i,* 2) = < 500
0 smon.
et
0 . 2 5 1
1
dx. si 0 < x2 < 2000
fx2(X2) 500 2000
0 smon.
Les distributions marginales ne sont pas toujours si faciles à représenter. C ’est le cas, entre
autres, lorsque l’image de [X,, X2] n’est pas rectangulaire.
Exemple 3.8
Supposons que la fonction de densité conjointe de [X,, X2] est
La figure 3.9 illustre cette densité conjointe sur l’image de [X, X ], qui ici est un triangle.
S I
L'espérance et la variance
On détermine l’espérance mathématique et la variance de X l et de X2à partir de leur distribution
marginale, en procédant comme dans le cas d’une variable à une dimension. Ainsi, en présence
d’un vecteur discret [X,, X2], on a
E ( X l) = jn1 = (3-6)
*1 x \ x2
—^ * 1 PxxC*i) Mi
= XX >*2 ) “ Mi2 »
*1 x2
de même que
E ( X 2) = = X X2 Px2
C*2) =
x2 * i x2
Exemple 3.9
Soit la distribution marginale de Xxet celle de X2selon l’exemple 3.6 et la figure 3.7 sur les défauts
mineurs et majeurs de pompes choisies au hasard. Si l’on effectue les calculs à partir de la fonc
tion de masse marginale de X,, représentée à la figure 3.7b), on obtient
E(Xl) = fr
CHAPITRE 3
et
2
2 n2 7 12 7 o2 8 2 7 2 1 "8“ 103
V(X,) = C71 0 ----+ 1 •— + 2 + 3 ----+ 4 •
30 30 30 30 30 _5_ 75
Remarque
* ,» 1 ^ ^ — „ » . • . . . • .. ..
Comme le révèlent les équations 3.6 à 3.9, on peut déterminer la moyenne et la variance respectives de
X, et de X, à partir soit de leur fonction de masse marginale, soit de leur fonction de m asse conjointe.
Ç . . . - ' ’ . • . * • ■ , . s ‘
Dans la pratique, il est en général plus facile de recourir à leur fonction de m asse m arg in ale si on la
connaît déjà.
En présence d’un vecteur continu [Xp X2], on utilise les définitions univariées basées sur
les intégrales suivantes :
En examinant les équations 3.10 à 3.13, on remarque ici encore qu’il est possible d ’effectuer
les calculs à partir soit de la fonction de densité marginale des variables, soit de leu r fonction
de densité conjointe.
Exemple 3.10
À l’exemple 3.5, le diamètre des soudures et leur résistance au cisaillement, c’est-à-dire X, et X.2»
avaient une densité conjointe de
1
si 0 < Xj <0,25; 0 < x 2 < 2000
f ( x ltx 2) = < 500
0 smon
►
Les distributions de probabilité conjointes 89
1
si 0 < x2 < 2000
2000
0 sinon.
P(Xx x x et X 2 x 2)
P(X, xAX 2 x 2)
P(X 2 X 2)
p(xx,b)
Pxa,M\) pour tout jc, , où (b) > 0 (3.15)
Px,
Soulignons qu’il existe autant de distributions conditionnelles de X, que de valeurs a pour lesquelles
px (a) > 0, et autant de distributions conditionnelles de X, que de valeurs b pour lesquelles px (b) > 0.
CHAPITRE 3
Exemple 3.11
Revenons au dénombrement des défauts majeurs et mineurs des petites pompes de l’exemple 3.3 et à la
figure 3.7. Il existe cinq distributions conditionnelles de X2, une pour chaque valeur de X {. Le tableau 3.1
montre par exemple les calculs pour la fonction de masse conditionnelle de X2, sachant que X = 0.
■ ■ H W
T de masse cond § V
X 0» 1
lV -' '. v .-^ ....
>. # 2 3 4
0
X
0
p(0, *2) p (0 ,1) p (0 ,2) P(0, 3) P ( 0 ,4)
a
*
Px2|o(*2)
Px, (°) Px, (0) Px, (°) Px, (°) Px, (°) Px, (0)
_ 1/3 0 1 _ 1/30 _ 1 _ i/30 _ 1 _ 1/30 _ 1 _ 3 /3 0 _ 3
_ 7/30 ” 7 ~~ 7/30 _ 7 ~~ 7/30 _ 7 ~ 7 /3 0 ~ 7 _ 7 /3 0 ~~ 7
JC1 . . /
0 . . ^ , . a
. 1
P(*i >3) (p0,3) _ 1 P(l, 3) _ 3
Px,|3C*i)
Px, (3) Px2(3) 4 PX20 ) 4
Voyons maintenant comment obtenir les distributions conditionnelles dans le cas continu.
» , . , _ * ■ » / . , . • - .■
Lorsqu'un vecteur aléatoire [X,, X,] est continu, la densité conditionnelle de X que X a, est
Exemple 3.12
Supposons que la densité conjointe de [X,, X2] correspond à la fonction / définie ci-dessous et repré
sentée à la figure 3.11.
2
x x+. XlX2 si Ocxj < l;0 < x 2 <2
/(* i>*2 ) 3
0 smon ►
Les distributions de probabilité conjointes
et
si 0 < x2 ^ 2
sinon.
x,x
^^3^! +
si 0 < x, < 1; 0 < <2
*ll*2 1+ ( Xj
sinon.
conditionnelles f x
l e u x (x2) etf x
conditionnelles f x
illustre trois.
*2l*l
x2\m ,0 < X n < 2
1 , 0 < x0< 2
I^
i
' . * . ' v » « • - V T . *
J ç f * - n '
S P î .
1 X S £ j f * V " . *
-
<
x * ,
: v *
*il*2
l
+ xi
r
i ^
, s \ . r -
i ✓
Notons que les densités conditionnelles ne sont pas de simples « tranches » de la densité conjointe où
on aurait fixé la valeur d’une des variables, par exemple f(x , 0), où X2=
Pour que la surface sous chaque courbe soit égale à 1, il a fallu diviser la portion de loi conjointe par la loi
marginale, par exemplef x (Q). C’est pourquoi l’échelle de l’axe vertical varie entre les figures 3.11 à 3.14.
Les distributions de probabilité conjointes
• . « • ■* . . • ^ >
Soulignons qu’il existe une espérance conditionnelle E(Xx\xJ pour chaque valeur de x2.
Cette espérance varie en fonction de la valeur de x2, qui est elle-même déterminée par une
fonction de masse. De la même façon, il existe autant d’espérances conditionnelles E(X2\xJ que
de valeurs de x v chacune dépendant de la valeur de x x déterminée par une fonction de masse.
On peut calculer des variances conditionnelles à partir des fonctions de masse conditionnelles.
Exemple 3.13
Soit la distribution de probabilité du vecteur aléatoire discret [X,, X2], où X, représente le nombre de
grosses turbines qu’un fabricant a inscrit à son carnet de commandes en juillet et X2, le nombre qu’il
y a inscrit en août. La figure 3.15 indique la fonction de masse conjointe de ces deux variables et leurs
fonctions de masse marginales.
X, = nombre de
commandes en juillet
0 1 2 Px2(x2)
X2= nombre de
Des calculs similaires nous permettent d’établir que E(X211) = 1,4 et E(X2| 2) = 0,75.
,■
".*t *■
1 • -
^• . •
, i. * . ^
«* * » ■, . ^
, . .
_
^
■ *
7
.
a
*. .*
*
. *
- s - ' T ' - . A .
“ ■•
. . . '
'
* • .* *
■
- , , ♦
W. a •
. . . .
•
’
•
.
■’ : ' V • • ■ ■ •
• . -- • .
Le nombre de valeurs que cette espérance peut prendre est infini dans chaque cas. Il existe
en effet une espérance conditionnelle E(X{\x2) pour chaque valeur de x dans l’équation 3.20 et
une espérance conditionnelle E(X2\x^) pour chaque valeur de x { dans l’équation 3.21.
Exemple 3.14
À l’exemple 3.12, on a examiné la densité conjointe
X, x0 2
X* —■—- si 0 < x x < l ; 0 < x 2 <2,
f ( x ,,x 2) = < 3
0 sinon.
et
*,(3;^ )
si 0 < jc, < 1; 0 < jc2 <2,
• W * i> l + (x,/2)
0 smon.
Sachant cela, on peut déterminer E(X2| x,) à l’aide de l’équation 3.21, ce qui donne
2 1 3x , + x 2
E(X, I ) X 9 •—• --------------- aX
o 2 2 3x,+l 2
9jc, +4
9x, +3
Soulignons qu’il s’agit là d’une fonction de x,. Les deux densités conditionnelles représentées à la
1 17
figure 3.13, où x l 2 et x{= 1, se caractérisent respectivement par une espérance de E(X21 2) 15 et de
£(X2|l) = f .
Deux variables ne sont indépendantes que si l’on peut décomposer leur fonction de masse
ou de densité conjointe en un produit de leurs fonctions de masse ou de densité marginales
respectives. Cet énoncé s’apparente au fait que des événements ne sont indépendants que si la
probabilité de leur intersection correspond au produit de leurs probabilités respectives.
En faisant appel à cette définition et aux propriétés des distributions conditionnelles, on
peut étendre la notion d’indépendance pour en tirer un théorème.
C H A PITR E 3
Démonstration
Cette démonstration sera limitée à un vecteur continu. On constate que
fx2lx, (*2) =fx2O2) Pour tout x l et x2
si et seulement si
Exemple 3.15
Une société de transport reçoit un appel chaque fois qu’un de ses autobus tombe en panne et doit
être remorqué par une dépanneuse lourde. Soit X,, le nombre d’appels reçus le lundi, et X2, le nombre
d’appels reçus le mardi de la même semaine. La figure 3.16 présente la distribution conjointe de
ces deux variables et leurs distributions marginales. Un bref examen révèle qu’il s’agit de variables
indépendantes, chaque probabilité conjointe étant égale au produit des probabilités marginales
correspondantes.
X
x 1= nombre d ’appels le lundi
0 1 2 3 4 1Px2(.xi)
* .
0 0,02 0,04 0,06 0,04 0,04 1 0,2
ls le mai
nombre
Si, pour une seule cellule (jc,, x2) du tableau, la relation ,, jc2) (jc ) p )x( n’était pas respectée,
alors les variables X, et X2ne seraient pas indépendantes.
Les distributions de probabilité conjointes
Covariance et corrélation
Soit le vecteur aléatoire [X,, X2]. La covariance de X, et X2, notée crl2, se traduit par
Cov(X,, X2) = <7|: = £[(X, - p,)(X2- /p)]
et leur coefficient de corrélation, noté p, par
_ Cov(X,,X2) _ crl2
p~ o r <Ji
La valeur de p est comprise dans l’intervalle [-1, +1], autrement dit -1 < p < +1.
On exprime la covariance dans l’unité de mesure de X, multipliée par cette de X2. Quant
au coefficient de corrélation, il s’agit d’une grandeur sans unité qui quantifie la liaison linéaire
entre deux variables aléatoires. En effectuant les multiplications dans l’équation 3.24 pour
ensuite affecter chaque terme de l’opérateur extérieur d’espérance, on voit que la covariance se
traduit aussi par
fih
i A U f B f e c S i E
2 %
3 I •
: n f M l m F x R
' W *
Démonstration
Supposons ici encore un vecteur continu. Puisque les variables X, et X2sont indépendantes,
£( x ,- x 2) J * 1 * 2 * / ( * i »* 2 ) dx2
x J x x( * l ) - * 2/ x 2( ^ 2 ) d x \ d x 2
[ L xj Xi dxi ] { L x> w 2
Conséquemment, Cov(X„ X2) = 0 selon l’équation 3.26 et p = 0 selon l’équation 3.25. Le raisonnement
serait semblable dans le cas d’un vecteur [X,, X,] discret.
Lorsque p « 1, il existe une forte corrélation positive entre les variables, ce qui peut é
le cas, par exemple, pour le poids et la taille des enfants, ou pour la valeur des actions de de
entreprises du même secteur d’activité. Lorsque p ~ -1, il existe à l’inverse une forte corrélati
négative, par exemple entre les précipitations sous forme de neige et la température. S’il exi:
une relation linéaire entre X2et X,, de sorte que X2 = a + bXx, alors p2= 1. Lorsque b > 0, p = -\
et lorsque b < 0, p = -1.
Exemple 3.16
Soit le vecteur aléatoire continu [X„ X2] de l’exemple 3.8 et sa fonction de densité conjointe
Les variables X, et X2 sont-elles indépendantes ? On pourrait effectuer le produit des lois marginales
pour répondre à cette question. On peut aussi calculer la covariance entre X, et X2. Si elle est nulle, on
ne pourra pas répondre à la question de façon définitive, mais si elle est non nulle, on saura qu’il existe
un lien linéaire entre X, et X2.
On aura besoin des valeurs suivantes :
r*
et que
Cov(X,, X,2 )
P 0,577
JV(X, ) • V(X2)
On doit conclure que X, et X2 sont linéairement dépendantes. Puisque p est positif, lorsque X, prend de
grandes valeurs, X2prend aussi de grandes valeurs, et les deux variables prennent de petites valeurs en
même temps. Or, le lien n’est pas tellement fort, car p n’est pas assez proche de 1.
Les distributions de probabilité conjointes
• %
Exemple 3.17
Un vecteur aléatoire continu [X,, X2] présente la fonction de densité/définie ci-dessous.
1 si —x2 <Xj <x2; 0 < x 2 < 1
f ( x {, x 22) = <
0 smon.
Sa densité est représentée graphiquement à la figure 3.17.
f(x
X1 X
\ X1
\
\
x1 X
La densité conjointe
ce qui veut dire que p = 0. Ainsi, sans être indépendantes, les deux variables sont non corrélées. Le
lien qui les unit n’est donc pas linéaire.
b
si b -t- 0
Cov( X Xya + bX,) = bV(Xx) p ( X lya + bX,)
0 si 6 = 0
CHAPITRE 3
Exemple 3.16
Soit le vecteur aléatoire continu [X,, X2] de l’exemple 3.8 et sa fonction de densité conjointe
2
6x,(l —x ])
î si 0 < jc, < 1 3x 2 si 0 < x 2 < 1
fx\ C*i ) fx2(x2) = i
0 smon 0 sinon.
Les variables X, et X2 sont-elles indépendantes ? On pourrait effectuer le produit des lois marginales
pour répondre à cette question. On peut aussi calculer la covariance entre X, et X2. Si elle est nulle, on
ne pourra pas répondre à la question de façon définitive, mais si elle est non nulle, on saura qu’il existe
un lien linéaire entre X, et X2.
On aura besoin des valeurs suivantes :
i 1
£(X,) 6x,(l —x l) d x l 1/2 , E(X2) 3*2 2 3/4,
0 0
1 1
E( Xf) 6x,(l —x 3/10, E(X l) 3x 2 dx2 = 3/5,
o o
2
m ,) = £ ( x f ) - [ £ ( x ,) ] 1/20 , V (X 2) = E { X \ ) - \ E ( X 2) f = 3 /8 0
£(X,X2) x xx 2 f ( x x, x 2) d x x dx 2
Cov(X,, X2)
0,577.
JV(X,)’v(X2)
On doit conclure que X, et X2sont linéairement dépendantes. Puisque p est positif, lorsque X, prend de
grandes valeurs, X2prend aussi de grandes valeurs, et les deux variables prennent de petites valeurs en
même temps. Or, le lien n’est pas tellement fort, car p n’est pas assez proche de 1.
Les distributions de probabilité conjointes
1 si -x2
0 sinon.
.•
j
!
:
f
// —
!i
0 si b 0
CHAPITRE 3
Exemple 3.18
La figure 3.18 illustre quatre résistances montées en série. La résistance électrique de chacun de ces
composants est une variable aléatoire. Si on la note Y, la résistance électrique de l’ensemble correspond
à Y = X.I + X,z + X,J + X,.4 On a ici une combinaison linéaire où an
0
= 0 et a,1
= an
2
= • • • = a n
=1.
V A — W v — W v — VW
xi X X3 X
Exemple 3.19
Soit deux pièces à assembler comme le montre la figure 3.19. On peut représenter l’espace résiduel par
Y = X i X2 ou par Y = (1)X, + (-1)X2. Un espace négatif signifie évidemment qu’il est impossible
d’emboîter ces deux pièces. On a ici une combinaison linéaire où 0, = 1 et 1.
X2
. . . « » - - . ■
Exemple 3.20
On tire au hasard 10 unités parmi les extrants d’un processus visant à fabriquer de petits arbres pour les
moteurs de ventilateurs électriques. On veut mesurer le diamètre de ces arbres et calculer la moyenne
de l’échantillon, soit
X = — (X! + X2 + ••• + XI0).
Y = X l +X2. (3.28)
et
Exemple 3.21
Soit les deux pièces à assembler de l’exemple 3.19. Supposons que les diamètres [X,, XJ, en cm, ont
une densité conjointe qui permet d’établir les quantités suivantes :
£(X,) = 5,1 V(X,) = 0,0025 p = -0,2.
£(X2) = 4,9 V(X2) = 0,0016
Peut-on déterminer l’espace résiduel moyen entre les deux pièces ? Et l’écart-type de l’espace ?
EiX) = £(X, - X2) = £(X,) - £(X2) = 5,1 - 4,9 = 0,2 cm
V(Y) = V(X, - X2) = V(X.) + V(X2) + 2(-l) Cov (X„ X2)
= 0,0025 + 0,0016 - 2p JV{Xx) ^/V(X2)
= 0,0025 + 0,0016 - 2(-0,2) (0,05)(0,04)
= 0,0049 cm2 ►
102 CHAPITRE 3
Exemple 3.22
L’exemple 3.18 traitait de quatre résistances montées en série de telle façon que l’ensemble a une résis
tance électrique de Y = X, + X2+ X3+ X4, où X, représente la résistance électrique du premier compo
sant, et ainsi de suite. On peut aisément calculer la moyenne et la variance de Y en fonction de celles
des divers composants. Si les résistances utilisées ont été choisies au hasard, on peut raisonnablement
supposer que les variables X,, X2, X3 et X4 sont indépendantes, de sorte que
A»y= Ai + A2 +A3 +A4
2 2 2 2 2
Gy =<7f +(72 +G3 +G4.
On ne sait encore rien de la distribution de Y. Toutefois, les variables X,, X2, X3et X4étant indépendantes,
il suffit de connaître la moyenne et la variance de chacune pour pouvoir déterminer celles de Y
Exemple 3.23
On peut s’attendre à ce que les variables X,, X2,..., X10de l’exemple 3
du processus d’échantillonnage aléatoire. Comme le montre la figure 3.20, ces variables sont en outre
identiquement distribuées, car elles proviennent de la même production. On s’intéresse à la combinai
son linéaire constituant la moyenne de l’échantillon
1 1
X X,1 + ...+ Xio-
10 10
et que
•V(X2) + ••• +
Il est normal que plusieurs valeurs de X prises sur différents échantillons de taille 10 aient la même
espérance qu’un diamètre pris isolément, mais que la variabilité des X 10) soit plus faible que celle
des unités individuelles (g 2).
Distribution ppci, b) f ( x ., b)
conditionnelle de Xt, | Pxx\bC*i) = X.\X
Px, V>)
sachant que X 2 = b
Espérance
E(Xi\b) = ' ^ x lPx EiXx| b) (jCj ) dx
conditionnelle de X x,
sachant que X 2- b
Distribution ^ p ( x i,x2) f ( x x, x 2) d x x
Px->(X2)
marginale de X.
Distribution p(a,x 2) f ( a , x 2)
conditionnelle de X J Px2\a(* 2 )
Px, («)
sachant que X x H
Espérance
conditionnelle de X 2, l L x iPx x J x 2\a(x i) d x 2
sachant que X.
104 CHAPITRE 3
• Si X xet X2 sont indépendantes, alors leur covariance et leur corrélation sont nulles.
Covariance et corrélation
• Covariance: C ov(X pX 2) = EIXXj - p , ) (X2 - p 2)] = E(X 1X 2) - E ( X 1)E (X 2)
^ „ . C ov(X pX 2)
• Corrélation : p = . 1 =
V v ( x ,) v ( x 2)
• Propriétés :
-o o < C 0 V(XpX2)<oo
Cov(Xj, X, ) = V(Xj )
si a ^ 0 et b ■*- 0
Cov(aXl , b X 2)= ov(X ,, X2)
si a = 0 ou b —0
Cov(X, p(X,
+ a , X 2 +b)= C o \ ( X 1, X2) + a , X 2 + b) =p (X p X 2)
si b 0^
Cov(Xj, a + b X x) - p ( X)x,a + b X x) = <
si Z? = 0
1/4 si v == 0
nombre de commandes de son entreprise, 1/2 si JC == î
puis a mis en relief la distribution con Px M ~ ' 1/4 et pY(y) = < 1/2 si y-= 1
si JC == 2
•
3.5 Le tableau suivant donne une partie de e) Calculez la probabilité que le joueur
la fonction de masse p(x> y) d’un vecteur gagne (c’est-à-dire que le gain du joueur
[X, Y]. soit supérieur à sa mise).
f ) Calculez la moyenne du gain net de ce
joueur.
3.7 Soit le vecteur aléatoire discret [Xp X2],
où Xi et X2représentent respectivement
le nombre de tubes d’aspirine vendus à
la pharmacie du coin en août et en sep
tembre. Le tableau suivant présente la
distribution conjointe de ces deux variables.
On connaît aussi l’information ci-dessous.
51 52 53 55
5 4
y -1 0 1
0,06 0,05 0,05 1 0,01 0,01
l 5 1
fD
) éterminez la distribution condition
nelle de X2 sachant X,.
3.11 Soit X, le résultat obtenu à un test d’aptitude
en mathématiques, et X2le résultat obtenu x
à un test d’habiletés physiques. Le vecteur a) Quelle est la probabilité qu’une tache
[Xt, X2] a la fonction de densité soit située dans la moitié inférieure de
r la plaque, c’est-à-dire pour 1/2 ?
si 0 < Xj < 1; 0 < x2 < 1
f ( x l, x 2) = < b) Quelle est la distribution de la hauteur
sinon. du centre de la tache (y) sachant que
x=l?
Déterminez le résultat moyen au second c) Les deux coordonnées du centre d’une
test à partir du résultat au premier test. tache sont-elles indépendantes ?
3.12 Supposons que X, y et Z sont trois varia
bles aléatoires ayant les caractéristiques 3.14 La demande d’un certain produit est une
suivantes : variable aléatoire dont la moyenne s’éta
blit à 20 unités par jour et la variance, à 9.
E(X) = 6 V(X) = 25 pXY= 0 , 9 On appelle « délai d’approvisionnement »
E(Y) = - 1 V(Y) = 1 6 pxz = - 0 , 6 l’intervalle entre le moment où l’on passe
E(Z) = 0 V(Z 36 P j , z = 0 , l . une commande et celui où on la reçoit.
108 CHAPITRE 3
c) Les positions horizontales et verticales père et celle de son fils aîné est 0,75.
d’un éclat sont-elles indépendantes selon On peut en déduire que la taille des fils
cette distribution ? aînés est en moyenne 75 % de la taille
de leur père dans cette population.
3.21 Sachant que
d) Dans une certaine population, on sait
si0<A:<l;0<>’<l que la corrélation entre la taille d’une
f(x,y) = i mère et celle de sa fille aînée est 0,65.
sinon,
On peut en déduire que les filles aînées
déterminez sont en moyenne plus petites que leur
a) E[X\y]- mère dans cette population.
b) £(X |F = 1/2); 3.24 Soit les densités conjointes définies ci-
0 E [ X ]; dessous, o ù /(jc, y) vaut 0 hors des inter
d) E[Y] ; valles spécifiés. Indiquez pour chacune si
e) si X et Y sont indépendantes. les variables X et F sont indépendantes
ou non.
3.22 Soit X une variable aléatoire continue dont
a) /( jc, y) = 4jc ye~(x‘+r) si 0, > 0
les valeurs possibles sont dans l’intervalle
(x, jc0), et Y une variable aléatoire conti- b) /( jc, y) = 3;c2y"3 si 0<jc<y < 1
c) /( jc, y) = 1/8 si 0 < x < 2 ;
nue dont les valeurs possibles sont dans
(y , y ). Les énoncés suivants sont-ils vrais 0<y <4
ou faux ? 3.25 Chez un certain distributeur alimentaire, la
a) Si X et F sont indépendantes, alors variable aléatoire X représente le moment
la loi conjointe de (X, Y) est de la de la journée (un nombre entre 0 et 1) où
forme/(x, y) = 1 pour une certaine une commande d’un client pour un produit
constante k. est reçue. La variable F représente le
b) Si la loi marginale de X est la même que moment de la journée où une livraison de
la loi marginale de Y, alors X et sont ce type de produit arrive dans les entrepôts.
indépendantes. Leur fonction de densité conjointe est
c) Si X et Y sont indépendantes, alors
la loi marginale de X est la même que la s i 0 < ; c < l ; 0 < y < l
f(x, y)
loi marginale de Y. sinon.
d) Si X et F sont indépendantes, alors la loi
marginale de X est la même que la loi a) Quelle est la probabilité qu’une com
conditionnelle de X| (pour les valeurs mande et une livraison soient reçues
de y où f Y(y) est non nulle). dans la première moitié de la journée ?
b) Quelle est la probabilité qu’une com
3.23 Déterminez si les énoncés suivants sont mande soit reçue après la livraison de
vrais ou faux. ce type de produit ?
a) Si les variables X et F sont indépen c) Supposez que les marchandises sont
dantes, alors leur corrélation est nulle. très périssables et qu’elles doivent être
b) Si Cov(V, T)= 0, alors on peut conclure vendues au plus tard un quart de journée
que V est indépendante de T. après leur arrivée à l’entrepôt. Quelle est
c) Dans une certaine population, on sait la probabilité que ces fournitures ne se
que la corrélation entre la taille d’un gaspillent pas ?
«
T sera ici question de plusieurs lois de probabilité discrètes d o n t nous établirons
la forme analytique à p a rtir d ’hypothèses élém entaires p o rta n t s u r des phéno-
• mènes du monde réel. Nous verrons quelques applications de chacune de ces
lois, lesquelles sont fréquem m ent utilisées en génie, en recherche opérationnelle
et en gestion. Trois d'entre elles, soit la loi binomiale, la lot géom étrique et la loi
de Pascal, également définie comme une loi binomiale négative, découlent d ’un
processus aléatoire formé d ’une suite d'épreuves de Bernoulli. Une telle épreuve
est une expérience aléatoire simple dont l’issue peut être un «succès» ou un
«échec», comme le lancer d ’une pièce de monnaie. La loi hypergéom étrique
et la loi de Poisson feront aussi l’objet d ’une étude dans ce chapitre.
En présence d’une seule variable aléatoire, nous omettrons ici encore (lorsque cela ne crée
aucune ambiguïté) l’indice désignant la variable dans la notation de sa fonction de masse ou de
répartition, en écrivant p(x) au lieu de p x(x) et F(x) au lieu de Fx(x). Il en ir
chapitres subséquents.
0 smon.
/ *
:
p(x) t p(x) t
0 ,8 - 0, 8 -
0,6 0, 6 -
0,4 0,4-
0,2 0,2
0,0 0,0
0 1 x 0 1 JC
a) b)
E(X) 0 • (1 - p ) + 1 • p P
et une variance de
V(X) 2 .
[0 (1 - p ) + l2 2
P( 1- P)• (4.2)
On voit sur la figure 4.2a) que l'espérance de X (le «point d’équilibre» de la fonc
tion de masse) est p = 0,2, et que la dispersion peut se mesurer avec l’écart-type de , soit
V/?(1- p) yjo,l6 = 0,4. La distribution de la figure 4.2b) a une espérance de 0,6 et un écart-
type d’environ 0,49.
Exemple 4.1
Soit un procédé de fabrication où une machine automatique produit des lots de petites pièces en acier.
À l’inspection, chaque pièce d’un lot de 1000 est jugée parfaite ou défectueuse. On peut envisager la
fabrication d’une pièce donnée comme une épreuve individuelle se soldant par un succès (soit ici une
pièce défectueuse) ou par un échec (une pièce parfaite). La probabilité p qu’une pièce soit défectueuse
constitue ici la proportion moyenne de défectuosité du procédé de fabrication. ►
112 CHAPITRE 4
S’il y a lieu de croire que la probabilité que la machine produise une pièce défectueuse est la même
d’un lot à l’autre et qu’elle ne varie pas quels que soient les résultats associés aux lots précédents,
on peut raisonnablement supposer que chaque lot de production est une suite de 1000 épreuves de
Bernoulli indépendantes.
À l’exemple précédent, l’hypothèse voulant qu’on ait affaire à une suite d’épreuves de
Bernoulli indépendantes dénote une idéalisation mathématique de la situation réelle. En
effet, elle ne tient pas compte des effets de l’usure du matériel, du réglage de la machine et
des difficultés liées à l’emploi d’instruments. On a ici représenté la réalité par un modèle qui
néglige certains éléments, mais qui s’avère néanmoins suffisamment fidèle pour générer des
résultats utiles.
Notons qu’une variable de Bernoulli est définie à partir d’une seule épreuve de Bernoulli.
Lorsqu’on considère une suite de plusieurs épreuves de Bernoulli, on a donc également plu
sieurs variables de Bernoulli. Ces variables permettent de modéliser d’autres phénomènes liés
aux épreuves, tels que le nombre total de succès en n essais, ou le nombre d’essais nécessaires
à l’atteinte d’un premier ou d’un r-ième succès. Ces variables font l’objet des trois sections
suivantes.
Exemple 4.2
Soit une expérience constituée de l’évaluation de trois pièces d’acier choisies au hasard dans la pro
duction. On veut étudier le nombre de pièces défectueuses dans cet échantillon. Il s’agit donc de trois
épreuves de Bernoulli indépendantes ayant chacune une probabilité de succès p, où un succès est une
pièce défectueuse ( v o ir la figure 4.3).
Quelques lois de probabilité discrètes 113
L’exemple précédent se généralise lorsque l’on s’intéresse au nombre de succès qu’on peut
obtenir lorsqu’un nombre fixé d’épreuves de Bernoulli indépendantes sont effectuées.
La forme de la fonction de masse ainsi que les valeurs possibles de X dépendent de la valeur
de chacun des paramètres n et p, comme le montre la figure 4.4 (voir à la page suivante).
L’exemple 4.2 présentait une loi binomiale de paramètre = 3. Les paramètres n et p de la
loi binomiale sont tels que n est un nombre entier positif et 0 < < 1. En termes simples, voici
comment on arrive à cette loi. Soit
p(x) = P(X = x) = P(x succès en n épreuves).
Étant donné l’indépendance des épreuves, la probabilité du résultat particulier de où
les x premières épreuves se traduisent par un succès S et les - dernières, par un échec E
correspond à
x n—x ^
-A.
n-x
P SSS...SSEE...EE PX(\~P)
J
n n\
Il y a résultats possibles qui comptent exactement x succès et (n - x) échecs
\x x !(n -x )!
Par conséquent,
n n-x
Px(1 si x = 0,1,2,..., n
p(x) ■i x J
0 sinon,
ce qui constitue la fonction de masse d’une variable binomiale
114 CHAPITRE 4
0, 4-
0, 3-
i
1
•:
I— I— I— I— I— I— i--- r + —f X
4
a
*•
1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9
b) Binomiale(rt = 9, p = 0,2) d) Binomiale(n 9 ,P 0 , 6 ) 1
t
I
L a m o y e n n e e t la v a r i a n c e d e la lo i b i n o m i a l e
Une façon simple de déterminer la moyenne et la variance consiste à considérer X comme la
somme de n variables aléatoires indépendantes de Bernoulli ayant chacune une moyenne p et
une variance p( 1 - p), de sorte que X=
7 - S ^ * 1 *
i, *t
Exemple 4.3
L’installation de fabrication représentée schématiquement à la figure 4.5 produit chaque jour des mil
liers d’unités.
Transporteur
Atelier ■
*
1
I
■
1
| Echantillonnage «=100
horaire
. . . » » • . * . . ■ . . . . .
fi'
fa
2} \
i « J L ,
y . T v V
f fi f
y 'V
9 M v"
Un échantillonnage pour la vérification d'attributs
Le pourcentage moyen d’unités défectueuses se situe à 1 % et ne varie pas au fil du temps. Une fois
l’heure, on prélève au hasard 100 unités du transporteur de manutention. Une inspectrice en exa
mine et en mesure plusieurs caractéristiques et qualifie chaque unité de parfaite ou de défectueuse.
Si l’on envisage ce processus d’échantillonnage comme = 100 épreuves de Bernoulli où = 0,01,
le nombre total X d’unités défectueuses de l’échantillon obéit à la loi binomiale
nocn 100-x
(0,01)* (0,99) si x = 0,1,2,..., 100
P(x) X J
0 smon.
L’inspectrice doit faire cesser la production lorsqu’un échantillon renferme plus de 2 unités défectueuses
Or, PiX > 2) = 1 - P(X < 2), et on peut calculer
P(X < 2) = P(X = 0) + P{X = 1) + P(X = 2)
10(A 100 - jc
(0,01)* (0,99)
x J
100 99 2
(0,99) +100(0,01)'(0,99r+4950(0,01)z(0,99) 98
0,921.
Il y a donc une probabilité d’environ 1 0,921 0,079 que l’inspectrice fasse cesser la production.
Le nombre moyen d’unités défectueuses trouvées dans les échantillons de taille 100 correspond à
E(X) = np= 100(0,01) = 1, avec un écart-type de y/V{X) = - p) = >/0,99 « 0,995.
Pour la distribution représentée à la figure 4.7a), la valeur moyenne de X est E{X) = 1/0,2 = 5,
0,8
avec une dispersion mesurable par l’écart-type \jv(X) 2
4,47. La distribution de la
0,2
figure 4.7b) a une espérance de 5/3 et un écart-type d’environ 1,05.
Exemple 4.4
On compte refaire une certaine expérience jusqu’à l’obtention d’un succès. Chaque tentative est indépen
dante des autres et coûte 25 000 $, mais il faut dépenser 5000 $ de plus pour la préparer si la tentative pré
cédente a échoué. L’expérimentateur souhaite déterminer le coût moyen d’un tel projet. Si X représente le
nombre de tentatives à effectuer pour obtenir un succès, la fonction de coût se traduit par
C(X) = 25 000X + 5000(X - 1)
= 30 000X - 5000.
Par conséquent,
£[C(X)] = 30 000 •£(X) - £(5000)
1
30 000 5000
P\
Si la probabilité de succès de toute tentative est de 0,25, alors
£[C(X)] = 3QQQ0-5000
0,25
= 115 000$.
Ce coût pourra sembler acceptable ou non à l’expérimentateur. Notons que la valeur la plus probable de
X est 1, donc le coût le plus probable est 25 000 $. Il faut aussi reconnaître qu’il est possible de répéter
l’épreuve à l’infini sans jamais obtenir de succès.
118 CHAPITRE 4
Imaginons que l’expérimentateur dispose de 500 000 $. Il souhaitera peut-être déterminer la probabi
lité que le coût total de l’expérience dépasse ce montant, c’est-à-dire
P(C(X) > 500 000) = P(30 000X - 5000 > 500 000)
505 000
P X>
30 000 J
P(X> 16,833)
l - P ( X < 16)
16
1—£0,25(0,75)*-'
x=\
0 , 01 .
L’expérimentateur ne sera peut-être pas prêt à courir le risque (la probabilité étant de 0,01) de dépenser
tout l’argent disponible sans obtenir de succès.
L a p r o p r i é t é d 'a b s e n c e d e m é m o i r e
La loi géométrique a une propriété intéressante et utile : elle est sans m ém oire. En effet, pour
tout s > 0,
P(X >k + s\X>s) = P(X>k). (4.5)
Autrement dit, même si nous avons obtenu s échecs lors de nos s prem iers essais, la proba
bilité de devoir réaliser au moins k essais supplémentaires pour obtenir un succès est la même
qu’au début de l’expérience.
Cette absence de mémoire distingue la loi géométrique de toutes les autres lois de proba
bilité discrètes.
Exemple 4.5
Soit X le nombre de tentatives nécessaires pour obtenir un six en lançant un dé équilibré. On a déjà
effectué 5 tentatives sans obtenir le résultat voulu. La probabilité qu’il faille plus de 2 autres tentatives
pour y arriver (donc plus de 7 tentatives au total) correspond à la probabilité que le nombre d’essais
nécessaires soit supérieur à 2 dès le début de l’expérience.
1 6 6 6
6 25
-î
T 36
1
V6 /
25
36
Quelques lois de probabilité discrètes 119
4.4 La loi de
La loi de Pascal, ou loi binomiale négative, se fonde elle aussi sur des épreuves de Bernoulli et
constitue en fait un prolongement logique de la loi géométrique.
masse
On considère une suite d’épreuves de Bernoulli indépendantes, dont la probabilité de succès est o.
La variable aléatoire X, qui désigne le nombre d’épreuves necessaires pour obtenir 1
e r-ieme succe
étant un nombre entier, est dite « de loi de Pascal de paramètres r et p ». La fonction de masse de X
jc - n x -r
p ' ^ - p) six = r , r + l ,r + 2...
P(x) r - 1J
IH.O
0 sinon.
En abrégé, on écrit X ~ Pascal(f , p).
p(x) I P(x)
0,08- 0,4
0,06 0,3
0,04 0,2 I
0,02 0,1
0,00 T 0,0 I
0 5 10 0
a) Pascal(r = 2, = 0,2) c) Pascal(r = 2, = 0,6)
P(x) | P(x)
0,08- 0,4
0,06 0,3
0 ,0 4 n 0,2
0, 02 - 0,1 S
0,00 T 0,0 i
T T 1
0 0 20 i
b) Pascal(r = 4, p = 0,2) d) Pascal(r
Notons que certains auteurs ou logiciels définissent la variable X comme le nombre d’échecs
survenus avant le r-ième succès. Cela les amène à définir la fonction de masse différemment h
existe également des contextes où r n’est pas nécessairement entier, mais nous n’aborderons pas
ces situations.
(4.7)
(4.8)
2
À titre d’exemple, la distribution de la figure 4.8a) a une espérance de E ( X ) 10,
0,2
2( 0 , 8)
et un écart-type d’environ yJV(X) 2 6,32
0,2
Exemple 4.6
Lorsqu’il a une décision à prendre, le président d’une grande société lance des fléchettes sur une cible
mention le centre de la cible, ce
demeure Le président lance une
fléchette après l’autre jusqu’à ce qu’il ait obtenu 3 succès.
Soit X le numéro du lancer lui apportant un troisième succès. La moyenne de X est de 3/0,6 = 5, ce qui veut
dire qu’il lui faut en moyenne 5 lancers pour atteindre 3 fois le centre de la cible. Le président applique
une règle simple pour prendre toute décision : s’il atteint le centre de la cible 3 fois en effectuant au plus
5 lancers, il tranche favorablement. Dans ces conditions, la probabilité d’une décision favorable est de
P(X < 5) =p(3) +/?(4) +p(5)
2} 3'\ 4 2
(0,6)3(0,4)° + (0,6)3(0,4)‘ (0,6)3(0,4)
2J 2J 2
0,683.
lot de production ou de personnes ayant les yeux bleus (par rapport à celles qui n’ont pas les
yeux bleus) dans un groupe de N étudiants.
D\
x J
si jc g {max(0, n - N+ D),. . min(n, D)}
p(x) ( N\
\n J
V
0 sinon.
p(x)
0,5
0,4
0,3
0,2
0,1
0,0 r f + JC
0 1 2 3 4 5
c) Hypergéométrique(N = 10, = 6, = 5)
P(x). P(x)
0,5- 0,5
0,4 0,4
0,3 0,3
0,2 0,2
0,1 0,1
0,0 t T T x 0,0 t
0 1 2 3 0 1 2 3 4 5 x
4 5
b) Hypergéométrique(AT = 20, D = 3, n = 5) d) Hypergéométrique(iV = 20, D —6, n = 5)
S * "
i - . v * - , \ r ? r
/ 7.
^ * .1
■b » \ ^
des paramètres N, O et n
*
CHAPITRE 4
Exemple 4.7
Un client reçoit un lot de 25 articles d’un fournisseur parmi lesquels 3 sont non conformes. Le client
tire au hasard et sans remise un échantillon de 5 articles du lot et les inspecte. Soit X le nombre d’ar
ticles non conformes qu’il observe dans l’échantillon.
1. Donnez le nom ainsi que les paramètres de la loi de probabilité de X.
Exemple 4.8
On reçoit périodiquement des lots de 100 axes de pompe qui doivent faire l’objet d’un contrôle de récep
tion. Voici le plan d’échantillonnage utilisé pour ce contrôle. On prélève du lot, sans remise, un échantil
lon aléatoire de 10 axes. Si cet échantillon renferme au plus 1 axe défectueux, on accepte le lot. Supposons
qu’un lot reçu a une proportion d’axes défectueux dep'. Quelle est la probabilité qu’on l’accepte? >
Quelques lois de probabilité discrètes
La probabilité qu’on accepte le lot est manifestement fonction de la qualité de ce lot. Par exemple,
si p' = 0,05, alors
On dit qu’une variable aléatoire X est distribuée selon une loi de Poisson de paramètre c > 0 si sa
^ *
Le param ètre c désigne le nombre moyen de réalisations du type d’événement étudié dans l’intervalle
de temps considéré ou dans l’espace considéré.
En abrégé, on écrit X ~ Poisson(c).
124 CHAPITRE 4
Sur la figure 4.10, on voit que plus c augmente, plus la distribution se déplace vers la droite,
ce qui correspond à l’interprétation de ce paramètre, soit le nombre moyen de réalisation d’un
événement dans l’intervalle de temps considéré. Notons également que lorsque est grand, la
fonction de masse prend une forme de cloche. Nous reviendrons sur ce phénomène au chapitre 6.
/
P(.x) p(x)
0,20 0, 2 0 -
0,15 0,15
0,10 0,10
0,05 0,05
0,00 0,00
x x
0 5 10 15 0 5 10 15
a) Poisson(c = 4) b) Poisson(c = 8)
La fonction de masse de la loi de Poisson avec différentes valeurs
du paramètre c
Il existe deux façons d’expliquer dans quelles conditions on peut s’attendre à ce qu’une
loi de Poisson s’applique dans les faits. La première repose sur la définition d’un processus de
Poisson. Dans la seconde, on considère la loi de Poisson comme un cas lim ite de la loi bino
miale. Voici un bref aperçu de ces deux approches.
/
EE E E E
T
0 t t + At Temps
Des événements surviennent de façon aléatoire à un taux constant
Quelques lois de probabilité discrètes
V. y§t
A
1
J T r * < . v . . f
*. V '
B fl I
4 % .
f* •
v
.
c .
*
a
• _ *
x
. ’
l
>
v
v .
1
i
/ <
» ,
;
•
j . î ' .
L
. .
* f
’
S *
- ,
- ! # • /#
* \ C
•
.
c l y *
t " : -
, ^
>
v
>
•
I * *
'
'
-
» ;v
*
■ > . v
■ i . l V
.
j
a
e *
>
• t
• • v
-
•
v
. n
»
V
• . » » v
^ »
-
A .V
.
.* * * • % Z j ■ r S * ■ " ’ - i l ï * ‘ r \ , ‘ C » - i a r » * .
» t t
• f ■ . *• * • « — . * * . . " j * , 4
Si X x, X 2, ...>X i sont des variables aléatoires indépendantes distribuées selon une loi de
paramètre c,, où i —1 ,2 ,..., k, et si Y
- X, +
c —c, + c*, + • •
+ ck.
Cette propriété d’additivité de la loi de Poisson s’avère très utile. En termes simples, il en
découle que la somme de variables aléatoires indépendantes distribuées chacune selon une loi de
Poisson obéit elle-même à une loi de Poisson.
CHAPITRE 4
Exemple 4.9
Un détaillant a établi que la demande d’un certain appareil électroménager durant une semaine obéit
à une loi de Poisson de paramètre c = 15. Il veut déterminer la quantité qu’il doit avoir en stock en
début de semaine pour que la probabilité de remplir toutes les commandes reçues durant la période
soit d’au moins 0,95. Le détaillant souhaite éviter toute rupture de stock et tout réapprovisionnement
en cours de période. Soit X le nombre de commandes reçues. Le détaillant veut connaître la valeur de
k telle que
F(k) = P{X <k)> 0,95,
de sorte que
On peut trouver la solution en consultant une table de la fonction de répartition de la loi de Poisson ou
en utilisant un logiciel. Dans le cas présent, k = 22, donc le détaillant doit avoir 22 appareils en stock
pour répondre à la demande avec une probabilité de 95 %.
Exemple 4.10
Soit un lot de production de 200 unités dont 8 sont défectueuses. On prélève un échantillon aléatoire
de 10 unités, et on s’intéresse à la probabilité qu’il renferme exactement 1 unité défectueuse. Cette
probabilité est de
8V 192^
9
P(X = 1) \ 0,288
(200
10 J ►
Quelques lois de probabilité discrètes 127
Toutefois, le taux de sondage étant petit (niN = 10/200 = 0,05), on pourrait recourir à l’approximation
fournie par la loi binomiale de paramètre p= 8/200 = 0,04, soit
Cette dernière probabilité aurait été exacte si le tirage des 10 unités avait été fait avec remise.
Exemple 4.11
Chacun des 4000 rivets de l’aile d’un avion neuf a une probabilité de 0,001 d’être défectueux. Quelle
est la probabilité que l’aile ne compte pas plus de 2 rivets défectueux ?
2 4000 \
P(X < 2) (0,001)* (0,999)4000- * = 0,237 96.
X
x=0 J
Si l’on utilise la loi de Poisson comme approximation,
c = 4000(0,001) = 4
et
2
P(X < 2)~ «rV /x! = 0,238 10
;c=0
X ~ Pascal (r , p ) Y ~
Pascal(r, p), où r= r
-—
—
--------------------------_—
— —-, --t
X.~ Poisson (c ) Y ~ Poisson (c), où c = c,1+ ••• + ctk
0
» «
o
>
12
H
m
3 3
Quelques lois de probabilité discrètes 129
/ • - ■
d) Supposons maintenant que p = 2/3 et qu’elle épuise cette somme sans obtenir
q —1/3. Calculez la probabilité de une seule commande ?
gagner pour la quatrième fois à la e) Quel est l’écart-type du coût de cette
septième partie. opération ?
4.10 Vous appelez un service à la clientèle 4.13 La probabilité qu’une compagnie d’explora
jusqu’à ce que vous réussissiez à parler tion pétrolière trouve du pétrole en creusant
à un employé. On sait que la probabilité un puits dans une certaine région est de 0.8.
que vous ayez à appeler deux fois est Sachant que les forages s’effectuent de façon
de 0,16. indépendante, déterminez la probabilité que
a) Déterminez la loi du nombre d’appels la compagnie trouve du pétrole en procédant :
à effectuer ainsi que son ou ses para a) à 2 forages ou moins ;
mètres, si possible.
b) à 3 forages ou moins ;
b) On vous informe que la probabilité de
c) à 8 forages ou moins, sachant que les
devoir appeler trois fois pour parler à
5 premiers forages n’ont pas permis de
quelqu’un est inférieure à 10%. Quelle
trouver de pétrole.
est la probabilité qu’un employé vous
réponde dès votre premier appel ? 4.14 Chaque jour du printemps, la probabilité
4.11 On compte effectuer en laboratoire 5 expé
qu’un orage survienne à Atlanta est de
0,05. On suppose que les occurrences sont
riences identiques et indépendantes.
Chacune de ces expériences n’a qu’une pro indépendantes et que le printemps débute le
babilité de succès p en raison de l’incidence 21 mars.
importante des conditions ambiantes. a) À quelle date en moyenne se produira le
a) Déterminez, en fonction de p, la proba
premier orage du printemps à Atlanta ?
bilité que la cinquième expérience soit la b) Quelle est la probabilité que le premier
première à échouer. orage se produise le 25 avril ?
b) Déterminez mathématiquement la valeur c) Quelle est la probabilité d’un premier
de p qui maximise la probabilité que la orage le 25 avril, sachant que nous
cinquième expérience soit la première sommes le 15 avril et qu’il n’a pas
à échouer. encore plu ?
d) Quelle est la probabilité que le 3e orage
4.12 Une entreprise spécialisée en systèmes de
survienne le 1er mai ?
chenilles a décidé de faire une tournée de
clients possibles jusqu’à ce qu’elle décroche e) Quelle est la probabilité que le 3e orage
une commande. Or, la première visite coûte survienne le 1er mai, sachant que
10 000 $, et il faut débourser 4 000 $ pour nous sommes le 15 avril et qu’il a plu
chaque visite supplémentaire. On considère aujourd’hui pour la première fois du
que les clients prennent des décisions indé printemps ?
pendamment les uns des autres. 4.15 Chaque heure, un client potentiel se pré
a) Quel est le coût le plus probable de cette sente chez un concessionnaire automobile.
opération ? Chaque fois, la vendeuse a 1 chance sur 5
b) Quel est le coût moyen d’une vente si . de conclure une transaction. Cette employée
la probabilité de réaliser une vente à la décide de travailler jusqu’à ce qu’elle ait
suite de toute visite est de 0,10? vendu 2 véhicules.
c) Devrait-on effectuer ces visites si le a) Quelle est la probabilité que la vendeuse
bénéfice prévu de chaque vente est ait à travailler exactement 8 heures ?
de 25 000 $ ? b) Si elle utilise la même tactique chaque
d) Si l’entreprise ne consacre que 100 000 $ jour, combien d’heures en moyenne
au démarchage, quelle est la probabilité travaillera-t-elle en une journée ?
CHAPITRE 4
4.16 On procède à des entrevues pour combler moins 7 unités défectueuses. Si elle décide
2 postes vacants. La probabilité que toute que la présence d’une seule unité défectueuse
personne rencontrée possède les qualités dans un échantillon est suffisante pour justi
voulues et accepte un poste est de 0,8. fier le refus d’un lot, quelle devra être la taille
a) Quelle est la probabilité de devoir de l’échantillon ?
effectuer exactement 4 entrevues pour 4.21 On estime qu’en moyenne 25 véhicules tra
combler les 2 postes ? versent une intersection donnée en 1 heure.
b) Quelle est la probabilité de devoir effec Supposez que le nombre de véhicules obéit
tuer moins de 4 entrevues ? - à une loi de Poisson.
4.17 Soit une expérience dont la probabilité de a) Déterminez la probabilité que 8 à
succès est de 0,80. On compte refaire cette 10 véhicules traversent cette intersection
expérience jusqu’à ce qu’on l’ait réussie durant un intervalle quelconque de
5 fois. 1 heure.
a ) Combien de fois en moyenne doit- b) Déterminez la moyenne et l’écart-type
on s’attendre à devoir effectuer du nombre de véhicules qui traversent
l’expérience ? cette intersection en 24 heures si on
b) Quelle est la variance du nombre considère que le trafic est constant.
d’exécutions ? c) En raison d’une défectuosité du comp
teur automatique, chaque véhicule a
4.18 Une compagnie minière veut déterminer
une probabilité de 10 % de ne pas être
s’il est pertinent d’exploiter un site en
détecté. Déterminez alors la probabilité
particulier. Il faut 4 forages fructueux
que de 8 à 10 véhicules soient détectés
pour qu’un site soit choisi. Si la proba
lors d’une heure quelconque.
bilité de découvrir le minerai est de 0,9
dans cette région, et que la compagnie 4.22 Soit un métier où un fil se brise environ
peut se permettre 6 forages d’essais avant toutes les 10 heures en moyenne. La fabri
d’abandonner l’exploration, quelle est la cation d’un certain type de tissu à l’aide de
probabilité que ce site soit sélectionné pour ce métier exige 25 heures. S’il faut 3 bris
l’exploitation ? de fil ou plus pour rendre le produit fini
4.19 Un lot de 25 téléviseurs doit subir un essai inacceptable, quelle est la probabilité qu’on
d’acceptation. On prélève 5 téléviseurs au obtienne un tissu de qualité satisfaisante ?
hasard, sans remise, et on les vérifie. Si 4.23 Le nombre de globules rouges par cellule
2 téléviseurs ou moins connaissent une de comptage de 4 mm2 sur une lamelle de
défaillance, on accepte le reste du lot. Dans microscope obéit à une loi de Poisson
le cas contraire, on refuse le lot. Supposez de moyenne 28.
ici que le lot renferme 4 téléviseurs a) Déterminez la probabilité qu’on observe
défectueux. exactement 28 globules rouges dans
a) Quelle est la probabilité exacte qu’on 1 cellule de comptage.
accepte le lot ?
b) Considérons 10 cellules de comptage
b) Quelle est la probabilité qu’on accepte indépendantes. Quelle est la probabilité
le lot selon la loi binomiale de qu’au moins 2 d’entre elles contiennent
paramètre p = ^ ? exactement 28 globules rouges ?
c) Si l’on avait un lot de 100 téléviseurs c) Déterminez la probabilité qu’on observe
au lieu de 25, la loi binomiale plus de 4 globules rouges sur une
donnerait-elle encore une approximation surface de 1 mm2.
satisfaisante ?
d) Si une lamelle contient 100 cellules
4.20 Une acheteuse reçoit des appareils de haute de comptage remplies de sang, déter
précision en lots de 25. Elle veut s’assurer de minez la moyenne et la variance du
refuser 95 % du temps tout lot renfermant au nombre de globules rouges par lamelle.
Quelques lois de probabilité discrètes 133
4.24 Des équipes d’entretien en quête d’une c) Quelle loi de probabilité pourrait être
certaine pièce de rechange se présentent utilisée comme approximation de la loi
chaque jour à un local à outils selon une déterminée en a) ?
loi de Poisson de paramètre = 2. Or, d) Quelle est la valeur de la probabilité
on conserve normalement à cet endroit calculée en b) avec cette approximation ?
3 exemplaires de la pièce en question.
Si ce stock est épuisé, les équipes doivent 4.26 Un libraire reçoit chaque semaine 4 exem
effectuer un long déplacement jusqu’au plaires d’un magazine. En moyenne.
magasin central. 3 clients se présentent par semaine à la
a) Quelle est la probabilité qu’une ou recherche d’un exemplaire du magazine,
plusieurs équipes aient à se rendre au et ce, selon un processus de Poisson. On
magasin central au cours d’une journée suppose que les exemplaires non vendus au
quelconque ? cours d’une semaine ne peuvent être vendus
b) Quelle est la demande quotidienne la semaine suivante.
moyenne de la pièce de rechange ? a) Quelle est la probabilité que le libraire
c) Quel est le nombre moyen d’équipes vende tous les exemplaires reçus du
d’entretien qu’on approvisionne chaque magazine au cours d’une semaine
jour au local à outils ? donnée ?
d) Quel est le nombre moyen d’équipes b) Quelle est la probabilité qu’au cours d’un
devant se rendre au magasin central ? mois (4 semaines), il y ait au moins une
semaine durant laquelle le libraire ne vend
e) En vous basant sur les valeurs de la
m
+ * + >+ * i f **►
«4 ^ ^ r »i < »
Comme nous l’avons mentionné au chapitre 2, l’image d’une variable aléatoire continue X est
formée d’un ou de plusieurs intervalles et implique une certaine idéalisation. Par exemple, les
instruments de mesure servant à déterminer la durée de fonctionnement avant défaillance d’un
composant électronique ou le temps nécessaire au traitement d’une commande ne peuvent générer
qu’un nombre fini de résultats possibles. Néanmoins, on suppose une situation idéale où la durée
ou le temps recherché peut prendre n’importe quelle valeur à l’intérieur d’un intervalle donné. Ici
encore, nous remplacerons f x(x) par f(x) et Fx(x) par F(x) pour simplifier la notation, lorsque cela
ne crée aucune ambiguïté.
si a < x < fi
sinon,
où a et fi sont des constantes réelles telles que En abrégé, on écrit X ~ U(a, fi).
La figure 5.1 montre deux représentations graphiques de la fonction de densité de cette loi.
Comme une variable aléatoire uniforme a une fonction de densité constante sur un
intervalle de longueur finie, la valeur de cette fonction doit nécessairem ent correspondre à
l ’inverse de la longueur de l ’intervalle pour vérifier la condition
Quelques lois de probabilité continues
J r f. v » ,r A ▼ ‘ / t ~ * w * A
La fonction de densité d'une variable de loi uniforme continue seion differentes
valeurs de paramètres
Le fait de choisir au hasard un point de l’intervalle [a, p\ signifie tout simplement que la valeur
choisie, appelons-la Y, est uniformément distribuée sur [a, p\.
.
J
]
soit le point milieu de l’intervalle [a, p] (ce qui est évident en raison de la sym étrie), et sa
variance, par
Exemple 5.1
On choisit au hasard un point de l’intervalle [0, 10]. Supposons qu’on veut déterminer la probabilité
que ce point se situe entre | et La variable aléatoire X a comme fonction de densité = ^ pour
0 < x < 10 et f(x) = 0 ailleurs. De ce fait, la probabilité recherchée correspond à l’aire du r
sous la densité, entre | et représentée par la surface en gris dans la figure 5.3a). On peut aussi cal
culer cette probabilité avec la fonction de répartition, ce qui donne P(3/2 <X< 7/2) = F(1/2) —F(3/2)
= 7/20 —3/20 = 2/10. Les deux valeurs de l’équation sont mises en évidence dans la figure 5.3b).
Exemple 5.2
Voici une méthode utilisée pour arrondir à l’entier le plus près les nombres de la forme N N,N. Lorsqu’un
nombre a une partie décimale inférieure à 0,5, on l’arrondit à l’entier inférieur par simple suppression
de la décimale. Lorsqu’il a une partie décimale supérieure à 0,5, on l’arrondit à l’entier supérieur, ce qui
donne \_NN, N\ + 1, où LJ représente la partie entière. Lorsque sa partie décimale égale exactement 0,5,
on lance une pièce en l’air pour déterminer si l’on arrondira le nombre à l’entier inférieur ou supérieur.
L’erreur d’arrondi, ici notée X,se définit comme la différence entre le nombre
sement. Elle obéit en général à une loi uniforme sur l’intervalle [-0,5, 0,5], autrement dit
1 si-0 ,5 <x <0,5
f(x)
0 smon.
Quelques lois de probabilité continues 137
Exemple 5.3
Une variable U est dite «uniforme sur [0, 1] » dans le cas particulier où = 0 et /?= 1. En recourant
aux équations 5.3 et 5.4, on obtient E(U) = x et V(JJ) = s* 1 m
5 .2 La loi exponentielle
Fonction de densité de la loi exponentielle
Une variable aléatoire continue X est dite «de loi exponentielle de paramètre 1
V
V V
~ *
O
V/ J
1
La figure 5.4 montre deux représentations graphiques de la fonction de densité de cette loi.
/
i
i
t
!
i
t
• - j .
aa
- . ~ *
La fonction de densité d'une variable de loi exponentielle, pour deux valeurs
du paramètre X
Afin de démontrer que f(x) constitue bel et bien une fonction de densité, soulignons que
f(x) > 0 pour tout x (car X > 0) et que
-kx - kx
f °°Xe dx e 1.
Jo o
0 six < 0
FU) Ax
(5.6)
Xe~h dî 1 six > 0.
o
La figure 5.5 (voir à la page suivante) montre deux représentations graphiques de cette
fonction.
CHAPITRE 5
Par conséquent, on peut décrire comme suit la relation entre la loi exponentielle et la loi
de Poisson : si le nombre de réalisations d’un événement obéit à une loi de Poisson conformé
ment à l’équation 5.7, alors le temps d’attente entre deux réalisations successives obéit à une
loi exponentielle, conformément à l’équation 5.11. Soit, par exemple, le nombre de commandes
qu’une entreprise reçoit chaque semaine. Si ce nombre obéit à une loi de Poisson, le temps
d’attente entre la réception de deux commandes obéit à une loi exponentielle. On a ici deux
variables, l’une discrète (le nombre de commandes) et l’autre continue (le temps d’attente),
dont les distributions reposent sur le même phénomène.
Exemple 5.4
Soit un composant électronique dont on peut représenter la durée de vie utile (X) par une fonction de den
sité exponentielle indiquant un taux de défaillance de 10-5 à l’heure (c’est-à-dire X= 10~5), d’où une durée
moyenne de fonctionnement avant défaillance, E(X), de l/X= 105heures. On veut déterminer la proportion
des composants de ce type qui feront défaut avant d’avoir atteint leur durée de vie moyenne ou prévue, soit
( n P /A
l , l/A -i
A
P X <- [ Xe dx - 1- e
1
1
l x ) Jo o
0,632.
Le résultat sera le même pour toute valeur de X supérieure à zéro. Dans cet exemple, 63,2 % des
composants fonctionneront moins de 105heures avant de connaître une défaillance (voir lafigure 5.6).
/ ' 1
f(x)
îr
X six > 0 I
fix) =
il
sinon
o
0,632
0.368 *
*
0 \ 1 X
EÇC)
X
La moyenne d'une variable de loi exponentielle
140 CHAPITRE 5
Exemple 5.5
On hésite entre deux procédés pour la fabrication d’un composant. Le coût de revient à l’unité sera de
100 dollars si l’on choisit le procédé Aet de £• 100 dollars (où £ >
deux procédés génèrent des composants dont la durée de fonctionnement avant défaillance obéit à une
101 exponentielle, mais le procédé Aprésente un taux de défaillance de 1/200 à
un taux de défaillance de 1/300 à l’heure. Les composants fabriqués selon le procédé A ont ainsi une du
rée de vie moyenne de 200 heures et ceux qui sont fabriqués selon le procédé B (plus chers), une
durée de vie moyenne de 300 heures.
Or, une clause de garantie oblige le fabricant à verser une indemnité de 50 dollars pour tout composant
qui fonctionne moins de 400 heures avant de connaître une défaillance. Si X représente la durée de
fonctionnement avant défaillance de chaque composant, on peut noter les coûts comme suit :
et
100 + 50(l-éT2)
et à
f 400 1
- jc/300 1 - jc/300
E(Cb) = (£*100 + 50) e dx + k 100 Jf* e dx
300 400 300
£•100 + 50(1 - e-4'3).
On peut s’attendre à ce que le fabricant opte pour le procédé B si E(CB) < E(CA). Cela survient lorsque
50 -2 -4/3
£< 1 (e e ) 1,0641. Il faudrait donc que le coût de revient de B soit inférieur à 106,41 $.
100
À titre d’illustration, soit un tube cathodique dont la durée de fonctionnement avant défail
lance obéit à une loi exponentielle. Si ce tube fonctionne encore après 1000 heures, sa durée
de fonctionnement avant défaillance obéira alors à la même loi exponentielle qu’au moment de
la mise en marche du tube. Autrement dit, la probabilité qu’il cesse de fonctionner durant la
prochaine heure est la même que la probabilité de cesser de fonctionner durant l’heure suivant
sa mise en marche.
Cette propriété d’absence de mémoire (ou de «non-vieillissement») indique que la loi
exponentielle ne tient pas compte de la fatigue ni de l’usure. Par conséquent, cette loi doit être
utilisée avec prudence dans la pratique si on veut modéliser la durée de fonctionnem ent (ou de
vie) d’un composant.
Exemple 5.6
Considérons un détecteur de mouvement activé en moyenne toutes les 6 minutes par un passant. Le
temps écoulé entre deux passants suit donc une loi exponentielle de paramètre A= 1/6, dont la densité
est illustrée à la figure 5.7.
La probabilité que le prochain passant à générer un signal arrive dans plus de 4 minutes correspond à
la surface A de la figure 5.7a), et se calcule ainsi :
—(l/6 )(4 )
P(X > 4) = 1- F(4) = 0,513.
Supposons que personne n’est passé depuis 6 minutes. Quelle est la probabilité qu’aucun passant n’active
le détecteur d’ici les 4 prochaines minutes ? Autrement dit, quelle est la probabilité qu’un intervalle
de 10 minutes s’écoule sans passant, sachant que rien n’a été détecté dans les 6 premières minutes ?
P(X > 10 |X > 6) correspond au rapport des surfaces C/(B + C) de la figure 5.7b), et se calcule ainsi :
-0/6X 10)
P(X > 10) _ g -0 /6 X 4 )
P(X>10 X > 6) -0/6 X 6 )
e 0,513.
P(X > 6) “ e
Le fait que personne ne soit passé dans les 6 premières minutes ne change donc rien à la probabilité
que quelqu’un passe dans les 4 prochaines minutes. Voilà pourquoi on parle d’absence de mémoire
pour la loi exponentielle.
m A
0, 2 -
4 8 12 16 20 x \
t
pour a0.
L ’intégration par parties de cette fonction met en lumière une im portante relation récursive:
T(a) = ( a - 1) T ( a - 1). (5.16)
Lorsque a est un nombre entier positif n, on a
r(n ) = ( n - 1)!, (5.17)
sinon,
où r > 0 et X>0. En abrégé, on écrit X Gamma(r, A).
si jc < 0
si x > 0.
Lorsque r est un nombre entier positif, on peut intégrer cette fonction par parties, ce qui donne
Quelques lois de probabilité continues 143
0 si x < 0
FtX) < /•-1 (5.21)
1 e (Ax)k/k\ si x 0>,
Jt=0
rm Iv
%
suit une loi de Poisson de paramètre Ax.On peut donc évaluer la fonction de rép
f L iL / 9 v
gamma répartition
0, 2 -
b) r = 5,A= 1 d) r = 5, A= 1/2
Im aginons un contexte où des événements surviennent à un taux moyen constant, par exemple,
des patients se présentant à l’urgence d’un hôpital au rythm e moyen de 10 patients par heure.
On pourrait définir plusieurs variables aléatoires à partir de ce contexte, par exemple les trois
suivantes :
W= nombre de patients qui arrivent en une heure ~ Poisson(X 10);
X temps écoulé entre l’arrivée de deux patients Exp(A 10);
Y temps écoulé jusqu’à l’arrivée de cinq patients ~ G am m a(r 5, 10)
On utilise parfois le terme « loi d ’Erlang» pour désigner le cas particulier où r est un
nombre entier positif.
E{X) = (5.23)
et sa variance, par
V(X) = (5.24)
Ces deux équations s’appliquent, que r soit ou non un nombre entier. Si r est un nombre
entier, il suffit d’adopter l’interprétation où X est une somme de r variables exponentielles indé
pendantes pour découvrir que
E
(X=) E ( X l) + •••+ r • 1/X =
et que
V( X) = V ( X l)+ ■■■+ V ( X r) = r • 1/A2 = r / X 2.
Exemple 5.7
Soit le système redondant présenté à la figure 5.9. Au début, l’élément 1 est en fonction, tandis que les
éléments 2 et 3 sont en attente. Dès que l’élément 1 connaît une défaillance, le commutateur active
l’élément 2. Lorsque ce dernier tombe en panne à son tour, le commutateur active l’élément 3. On
suppose que le commutateur effectue parfaitement son travail, ce qui permet d’envisager la durée de
vie X du système comme la somme de la durée de vie de ses trois éléments, d ’où X = X t + X2 + Xy
j Élément 1 b n
Élément 2
—
Élément 3
Si la durée de vie de chaque élément (en jours), soit X., pour = 1, 2, 3, est indépendante de celle des
autres et présente une densité exponentielle (X = 0,01), alors X est une variable gamma de paramètres
r = 3 et X = 0,01 et sa fonction de densité est ►
Quelques lois de probabilité continues 145
0,01 2 _-0,0l*
(0,0lxYe si x > 0
/(*) 2!
0 sinon.
Puisque chaque élément a une durée de vie exponentielle de paramètre X - 0,01, la durée moyenne est
de 100 jours.
La durée de vie du système est la somme des durées de vie des éléments individuels, donc il dure en
moyenne 300 jours. Son écart-type est égal à V3/0,01 = 173,2 jours.
La probabilité que le système fonctionne pendant au moins x jours, notée /?(*), porte le nom de « fonc
tion de fiabilité ». Dans le présent cas, cette fonction se traduit par
-0,01J /r\ n i ,.\k
R(x) 1- F e (0,01x)/&!
4 =0
La loi de Weihull
La loi de Weibull constitue une excellente approximation de la loi de probabilité de nombreuses
variables aléatoires. On l’utilise entre autres fréquemment pour modéliser la durée de fonction
nement avant défaillance d’éléments et de systèmes électriques ou mécaniques.
si * > y
sinon.
où p > 0, ô > 0 et —oo < y < °o. En abrégé, on écrit X ~ Weibulfi)' (5, ô).
Lorsqu’on attribue aux trois paramètres une valeur appropriée, la loi de Weibull fournit
une très bonne approximation de la loi de probabilité de nombreux phénomènes expérimentaux.
• Le paramètre p est un param ètre de forme. Lorsqu’il est inférieur à 1, il fait réference
à un taux de panne décroissant, idéal pour modéliser les défaillances précoces. Lorsqu’il
est supérieur à 1, la densité correspond à un taux de panne croissant, comme dans les phé
nomènes de vieillissement ou d’usure. On modélise alors la fin de vie utile d’un produit
• Le paramètre ô est un param ètre de dispersion, ou d’échelle. Plus il est élevé, plus la
variance est grande.
• Le paramètre /constitue un param ètre de position. Les valeurs possibles de * sont
supérieures à /
146 CHAPITRE 5
La figure 5.10 montre la courbe de la fonction de densité d’une variable de Weibull pour
différentes valeurs de paramètres.
■ /
Quatre fonctions de densité de la loi de Weibull avec différentes valeurs de paramètres
(5.26)
? —•
>
et sa variance, par
Exemple 5.8
Un certain sous-ensemble électronique a une durée de fonctionnement avant défaillance (en heures)
qui obéit à une loi de Weibull de paramètres y = 0, 100. Par conséquent, on s’attend
à ce que la proportion des sous-ensembles qui fonctionnent encore au bout de 400 heures soit égale à
Exemple 5.9
Berrettoni (1964) a énuméré un certain nombre d’applications de la loi de Weibull. Voici quelques
exemples de processus naturels obéissant à une loi de probabilité dont la loi de Weibull fournit une très
bonne approximation. La variable aléatoire est notée X dans chaque cas.
1. La résistance à la corrosion de tôles en alliage de magnésium.
X : la perte de poids (en 10*
21543mg/[cm2][jour]) attribuable à la corrosion lorsqu’on plonge les tôles
dans une solution aqueuse à 20 % de MgBr2avec inhibiteur.
2. Les marchandises retournées, classées selon le nombre de semaines qui séparent l’envoi de ces
marchandises de leur retour.
X: le temps écoulé (en 10-1 semaines) entre le moment où l’on expédie un article et celui où le
client le retourne parce qu’il est défectueux.
3. Le nombre de temps d’arrêt par quart de travail.
X : le nombre de temps d’arrêt par quart de travail (multiplié par 10-1) dans le cas d’une chaîne
de montage continue, complexe et automatisée.
4. L’apparition de fuites dans des piles sèches.
X: l’âge des piles (en années) au moment où celles-ci commencent à fuir.
5. La fiabilité de condensateurs.
X : la durée de vie utile (en heures) de condensateurs au tantale de 3,3 pF et de 50 V à
température ambiante C, sachant que la tension nominale est de 33 V.
T ' A '
• » « i v i* ■ ï . - I * ____
R ésum é £
00
Lois de probabilité continues 0
1
>
T>
n * X r
v v • ’r . ^
'S J
r • # ;: . j s s » / y
DD
> * | ç # ,v
^ rare rares?%»?irâ&r<tvff m
en
Temps Uniforme
d'attente d'un
phénomène
régulier
événement
♦ V
Durée de de Weibull
vie avant (y, <5, 0)
défaillance
Fonction gamma
oo
a-\ -x
r(a) x e dx, et T(n) si n est entier.
/ ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
5.4 Une agente immobilière exige un tarif fixe
Pour tous les exercices qui s’y prêtent :
•>
b) Quelle est la probabilité que l’équation 5.10 On considère que la durée de vie (en jours)
y2 + 4Xy + 1 = 0 possède des racines d’un type de pile est une variable X dont la
réelles ? fonction de répartition est donnée par
c) Quelle est la probabilité que l’équation r
a) P(X > 5) ou P(X < 5) 400 $. Il lui en coûte 150 $ pour remplacer
tout tube défectueux. Le fabricant n’est
b) P(X> 1/5) ou P(X< 1/5) cependant pas tenu de remplacer plus d’une
c) P(X>5)ouP(X>5\X>2) fois le tube d’un même écran.
d) P(0 < X < 2) ou P(1 <X<3) a) Comment le bénéfice se définit-il en
e) JP ( A ' > 5 | X > 4 ) o u / >( X > 5 | X > 1) fonction de la durée de vie d ’un écran?
f) X
(P >5 |X > 3) ou P(X >1\ b) Quelle est la fonction de masse du
g) P(X >5 \X>4) ou P(X >1) bénéfice ?
Quelques lois de probabilité continues 151
c) En moyenne, à quel bénéfice le fabricant 20 000 heures. Or, un tel transistor, utilisé à
peut-il s’attendre? une fin particulière, fonctionne déjà depuis
20 000 heures. Quelle est la probabilité qu’il
5.13 Existe-t-il une loi exponentielle pour fonctionne moins de 30 000 heures au total ?
laquelle la condition suivante s’applique?
5.17 Un traversier se met en route dès que 10 véhi
P(X<2) = - P(X>2) cules sont à son bord. On sait que les véhicules
Si oui, déterminez la valeur de A. arrivent au quai de façon indépendante, à
un rythme moyen de 7 à l’heure.
5.14 Le temps de traitement d’un appel dans un
a) Déterminez la loi de probabilité du temps
certain service public suit une loi exponen
écoulé entre deux traversées consécutives.
tielle de paramètre A. On sait que 90 % des
appels sont traités en moins de 5 minutes. b) Quel est le temps moyen écoulé entre
deux traversées et quel est son écart-type ?
a) Quel est le temps moyen de traitement
d’un appel? c) Vous êtes passager dans la neuvième
voiture qui vient tout juste d'embarquer
b) Quel est le temps médian d’un appel, sur le traversier. Quelle est la probabilité
c’est-à-dire le temps t tel que 50 % des
que le départ se fasse d’ici 15 minutes ?
appels sont traités en moins de minutes ?
c) Sachant que vous discutez avec un agent 5.18 Une boîte renferme 24 friandises. L’inter
depuis 3 minutes, quelle est la proba valle entre les moments où l’on vend l’une
bilité que votre appel dure encore au de ces friandises obéit à une loi exponen
moins 3 autres minutes ? tielle et est en moyenne de 10 minutes.
a) Combien faut-il de temps en moyenne
5.15 On hésite entre deux procédés de fabrica
pour vendre le contenu d’une boîte ?
tion. Le procédé I entraîne un coût unitaire
fixe de C $ et le procédé II, un coût unitaire b) Comment calcule-t-on la probabilité que la
de 3C $. Qu’on utilise un procédé ou l’autre, boîte soit vide à 12 h si on l’a ouverte à 8 h ?
la durée de fonctionnement avant défail 5.19 Associez chacun des graphiques ci-dessous
lance des articles fabriqués obéit à une loi à une des distributions proposées dans la liste.
exponentielle. Toutefois, on obtient un taux
moyen de 1/25 défaillance à l’heure avec 1) U(0, 50) 5) Gamma(r = 1, A = 3)
le procédé I et de 1/75 avec le procédé II. 2) U{-50, 50) 6) Gamma(r = 1, A = 1/3)
En outre, on doit remplacer tout article qui
connaît une défaillance avant d’avoir fonc 3 ) Exp(A=l/7) 7) Gamma(r = 6, A = 2)
tionné 15 heures, et ce, au coût de 5 $. 4)Exp(A=7) 8 )Gamma(r= 6, A - 1/2)
a) Complétez la définition du coût selon les
deux procédés :
C si...
C +5 si...
3C si...
3C + 5 si...
b) Quel est le coût unitaire moyen de
chaque procédé ?
c) Pour quelle valeur de C le procédé I est-
il préférable au procédé II ?
5.16 La durée de fonctionnement avant défail
lance d’un certain transistor obéit à une
loi exponentielle et est en moyenne de
CHAPITRE 5
5.20 Une compagnie produit des cartes la moyenne est de 40 jours et la variance,
graphiques en silicone. Ces cartes sont de 400jours2. Déterminez la probabilité de
constituées de 100 composants qui fonction recevoir ce produit dans un délai de
nent indépendamment les uns des autres, 20 j ours après 1’avoir commandé.
chacun d’eux ayant 1 chance sur 1000
5.23 Déterminez si les énoncés suivants sont vrais
d’être défectueux. Certaines cartes
défectueuses sont tout de même vendues. ou faux.
On suppose que les réparateurs de la a) La loi Gamma(r = 1, 8) est équiva
compagnie réparent en moyenne une carte lente à la loi Exp(= 1/8
par 2 heures, et ce, selon un processus de b) Si X~Gamma(r = 3,= 10) et
Poisson. On suppose que ce taux est cons Y ~ Gamma(r = 5, A = 10), et si X et Y
tant durant les heures d’ouverture. sont indépendantes, alors
a) Quelle est la probabilité qu’une carte X + Y ~ Gamma(r = 8, A = 10).
soit défectueuse ? c) SiW ~ U(.2, 4) et T ~ Exp(/l = 3),
b) Quelle est la probabilité qu’on répare alors W et T ont la même valeu
au moins 4 cartes dans les 6 prochaines moyenne théorique.
heures ? d) Si R ~ Exp(A = 10) et
c) Vous vous présentez à la boutique à 8 h H ~ Gamma(r = 2, = 10), alors une
pour faire réparer votre carte graphique valeur de R choisie au hasard sera tou
et vous êtes le premier client. Quelle est jours inférieure à une valeur de H choi
la probabilité que votre carte soit réparée sie au hasard.
en moins de 1 heure ? e) Si X suit une loi exponentielle de
d) Supposons qu’il est maintenant 16 h 30. paramètre A = 4, alors il y a autant
Vous appelez à la boutique et on vous dit de chances qu’une valeur de X choisie au
que votre carte n’est toujours pas prête. hasard soit inférieure à 1/4 que supé
Quelle est la probabilité que vous ne rieure à 1/4.
puissiez pas récupérer votre carte réparée f) Si on suppose que la durée de vie des
avant 17 h 30 ? ampoules suit une loi exponentielle,
e) Quelle est la distribution du temps alors une ampoule neuve a autant de
nécessaire à la réparation de 5 cartes chances de cesser de fonctionner dans la
graphiques ? prochaine heure qu’une ampoule utilisée
depuis 500 heures.
5.21 La durée de vie utile d’un système électro
g) Dans un certain département d’urgence,
nique correspond à Y =Xx+ X2+ X3+ X4, les patients arrivent à un rythme moyen
c’est-à-dire à la somme de la durée de vie
de 12 personnes par heure. On pourrait
utile de ses composants. Chaque compo
modéliser le temps écoulé entre l’arrivée
sant est indépendant des autres. La durée
de deux patients (en heures) par une loi
de fonctionnement avant défaillance d’un
exponentielle de paramètre A = 1/12.
composant obéit à une loi exponentielle, et
le temps moyen entre les pannes est de 5.24 La loi bêta se traduit par la fonction
4 heures. de densité
a) Combien de temps en moyenne le sys
tème fonctionne-t-il ? /(*) = ! si0^Sl.A>0,r>0
b) Quel est l’écart-type du temps de fonc 0 sinon.
tionnement du système ?
c) Que deviendraient l’espérance et l’écart-
a) Montrez que la loi bêta se réduit à la loi
type du temps de fonctionnement si on uniforme lorsque = 1.
utilisait 5 composants au lieu de 4 ?
* ' • • > ' - * ' • . • • ,
b) Montrez que la loi bêta a une fonction de
- . > -
c) Montrez que la loi bêta se réduit à une a) Quelle est la probabilité qu’une telle pile
loi parabolique lorsque = 2. fonctionne plus de 700 heures ?
5.25 Soit des tiges en acier dont le diamètre b) Quelle est la probabilité qu’une pile dure
(en cm) obéit à une loi de Weibull de para plus de 700 heures avant que les métaux
mètres y = l, fi = 2 e t ô = 0,5. Déterminez coulent, sachant qu’elle est en fonction
la probabilité que le diamètre d’une tige depuis 600 heures ?
choisie au hasard ne dépasse pas 1,5 cm. c) Quelle est la probabilité qu’une pile
fonctionne durant plus de 100 heures
5.26 Soit des transistors dont la durée de avant de commencer à fuir?
fonctionnement avant défaillance (en d) Si la distribution du temps avant une
heures) obéit à une loi de Weibull de para fuite était exponentielle de même
mètres y =0, fi= 1/3 et = 400.
moyenne que la loi de Weibull spécifiée
a) Quelle proportion de ces transistors (environ 625 heures), que deviendraient
peut-on s’attendre à voir fonctionner les probabilités calculées en a), b) et c) ?
au moins 600 heures ? À la lumière de ces comparaisons, lequel
b) L’espérance de vie des transistors serait- des deux modèles semble le mieux tenir
elle supérieure ou inférieure à celle de la compte de l’usure des matériaux ?
loi décrite...
5.28 Soit de petits systèmes informatiques
i) si /? = 1 au lieu de /? = 1/3 ?
dont la durée de fonctionnement avant
ii) si ô=600 au lieu de 400 ? défaillance (en heures) obéit à une loi
iii) si y = 100 au lieu de 7 = 0? de Weibull de paramètres = 0, /? = 1/4
5.27 On s’attend à ce que le temps écoulé et ô = 200.
(en heures) avant qu’un certain type de a) Quelle proportion de ces systèmes fonc
pile sèche se mette à fuir obéisse à une loi tionnera au moins 1000 heures ?
de Weibull de paramètres = 0, = 3 et b) Quelle est la durée moyenne de fonc
<5= 700. tionnement avant défaillance ?
s. chapitre porte sur la loi norm ale, qui revêt beaucoup cTim * +9
C ’est au xvm e siècle qu’on s’est intéressé pour la première fois à la loi normale, après avoir
observé que les erreurs de mesure présentaient une distribution symétrique en forme de cloche.
De Moivre a formulé le premier énoncé mathématique de cette loi en 1733. Il y voyait un cas
limite de la loi binomiale. Laplace avait également pris conscience de cette loi en 1775. On a
attribué à tort sa découverte à Gauss, qui a publié en 1809 le premier texte en faisant mention,
d’où le nom de « loi gaussienne » parfois donné à cette loi. On en est venu à qualifier cette loi de
« normale » à la suite des efforts déployés tout au long des xvm e et xixe siècles pour en faire la
loi de probabilité sous-jacente à toutes les variables aléatoires continues.
1. J f(x ) dx = \ ( 6 .2 )
requis de toute fonction de densité.
2. f ( x ) > 0 pour tout x
3. lim = 0 et limx .„/(*) = 0.
4. f(ju + x) =f(ju - x), c’est-à-dire une courbe de densité symétrique par rapport à //
5. La courbe de/atteint son maximum au point
6. Les points d’inflexion de la courbe d e/se situent en
c°°
Pour démontrer que J —OOf(x) dx = 1, il faudra faire voir que I2= 1 et en déduire que I égale nécessai-
rement 1 puisque la valeur de / ne peut être que positive. Après avoir défini une deuxième variable
aléatoire normale, notée U, on obtient
2 1 —(l/2)y 1 0/2 ) u
I e dy e -
du
yflït 4 ïk
1 moo poo
-(l/2 )(y 2+ « 2)
e dy du.
2n J —oo J —oo
2 1
I 2*re-m)rl dd dr
2 ttj o Jo
-(l/2 )r
re dr = 1,
On ne peut évaluer cette intégrale qu’en recourant à des méthodes numériques, et on doit alors en
.
déterminer la valeur pour chaque couple
. , ^ ^ i
(fl,
- .
a2).
* ' . • * . . ■ i .► i • * * * *
Or, comme la première fonction à intégrer n’est autre que la fonction de densité d ’une variable
normale de paramètres fl = 0 et a 2 = 1, la première intégrale a une valeur de 1. L a valeur de la
deuxième intégrale est par ailleurs nulle, puisque
Par conséquent,
E( X) = fl. ( 6 .4 )
V(X) = £ [(X - f i ) 2]
dx.
o ^!2k
de sorte que
V(X) = a 2. (6.5)
En résumé, la fonction de densité d’une variable normale, définie par l’équation 6.1,
présente une moyenne de fl et une variance de a 2.
De nombreuses tables en indiquent les valeurs ainsi que certaines calculatrices. La table II
de l’annexe fournit ainsi la valeur de l’intégrale de l’équation 6.7 selon les valeurs positives de z.
Pour les valeurs négatives, on se sert de la symétrie de la fonction de densité d’une loi N(0, 1)
par rapport à 0. En effet, pour tout nombre réel a, on a toujours
O(-a) = 1 - O(a).
La relation ci-dessus traduit le fait que sous la courbe de densité d’une loiiV(0, 1), l’aire à
gauche de -a est toujours égale à celle à droite de a (voir la figure 6.2).
CH APITRE 6
L'intérêt de la loi normale centrée réduite est qu’elle permet de calculer des probabilités
basées sur des lois normales pour n’importe quelle valeur des paramètres, à partir du change
ment de variables suivant :
La figure 6.3 illustre le passage d’une normale quelconque à une normale centrée réduite,
parfois appelé « standardisation ».
La section qui suit montre comment tout calcul de probabilité pour une normale quel
conque se ramène toujours à celui d’une normale centrée réduite.
104-100
2
La probabilité que la variable normale centrée réduite Z prenne une valeur inférieure ou
égale à 2 est alors égale à la probabilité que la variable normale initiale X prenne une valeur
inférieure ou égale à 104. En termes mathématiques,
F(104) = 0(2).
La table II de l’annexe indique la valeur de la fonction de répartition d’une variable normale
centrée réduite pour différentes valeurs de z. On peut y voir que
0(2) = 0,977 25.
Soulignons que dans la relation z = (x — la variable z indique le nombre d’écarts-types
a qui séparent x de la moyenne fx. Dans le cas ci-dessus, F(104) = 0(2), ce qui veut dire que
104 se situe à deux écarts-types (<J = 2) au-dessus de la moyenne. En règle générale, = // +
Donc ici, 104 =/u+g (2) = 100 + 2(2).
Pour résoudre certains problèmes, il ne suffit pas de consulter une table ; il faut aussi faire
appel à la symétrie de la courbe de (p. On peut esquisser la courbe de densité pour estimer la
valeur recherchée, en plaçant // et les points d’inflexion pour se donner une idée de l’échelle de
l’axe des valeurs de x.
Exemple 6.1
Soit un tissu synthétique dont la résistance à la rupture (en newtons) est une variable aléatoire X de loi
/V(800,144). Un acheteur exige que ce tissu ait une résistance à la rupture d’au moins 772 newtons. On
prélève un échantillon au hasard afin d’en vérifier la résistance.
Pour déterminer P(X > 772), on calcule d’abord
J X - f i 772-800^1
P(X<772) = ^ _ £ < _ _ j
= P(Z<- 2,33)
= <D(-2,33)
= 0,0099.
La probabilité recherchée, soit P(X> 772), est donc de 0,9901. On peut voir à la
page suivante) la probabilité calculée relativement à X et à Z. On a choisi d’utiliser la variable Z parce
qu’il existe des tables indiquant les valeurs de sa fonction de répartition. ►
CHAPITRE 6
Z= | Q° 1)
12
|
______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ __________________________________________ |
Exemple 6.2
Il faut X minutes pour réparer une chargeuse automatique servant à réaliser une opération complexe
de conditionnement des aliments à l’intérieur d’une chaîne de production. Selon des études effectuées,
cette variable obéit de près à une loi /V(120, 16). La figure 6.5 montre sa fonction de densité. Si l’inter
ruption de la production dure plus de 125 minutes, on est obligé de nettoyer le matériel et de jeter tous
les aliments en cours de transformation, ce qui entraîne une perte de 10 000 $. La probabilité que cela
se produise correspond à
125-120 ^
P(X > 125) Z> P{Z > 1,25)
4 J
1-0(1,25)
1-0,8944
0,1056.
// i
X- 120
i
»
Z W(0, 1) 1
4 *
iI
M l 20, 16)
1
*
S
i
k
' » i r f » . , ' ,
u • t ■ 1 ___ M m s . 1 _
M l
[ 9 1 I 1 9 k * ' 1
\ ■ . * • ' Ç/r A c N
Le coût moyen d’une telle interruption s’établit par conséquent à E(C) = 0,1056(10 000 + CR)
+ 0,8944(C/?), où C représente le coût total et CR, le coût de la réparation. En simplifiant, on obtient ►
La loi normale 161
E(C) = CR + 1056. Imaginons que la direction puisse réduire la durée moyenne de réparation à
115 minutes en augmentant les effectifs du service d’entretien. On aurait alors un coût de réparation
CR > CR]. Toutefois,
125-115^
P(X > 125) = Z> P(Z > 2,5)
4 J
= 1-0(2,5)
= 1-0,9938
= 0,0062,
de sorte que le coût total moyen serait de + 62. Il serait donc logique d’augmenter les effectifs du
service d’entretien si
C*, + 62 < CRt + 1056,
c’est-à-dire si
Q , - C„, < 994 $.
On a ici supposé que la fréquence des pannes demeurait inchangée.
Exemple 6.3
Une entreprise fabrique des raccords dont le filetage a un diamètre sur flancs normalement distribué,
avec une moyenne de 0,4008 centimètre et un écart-type de 0,0004 centimètre. Les normes de concep
tion de l’entreprise prévoient un diamètre sur flancs de 0,4000 ± 0,0010 centimètre (voir la figure 6.6).
La moyenne de la fabrication diffère donc ici de la valeur nominale. On veut déterminer quelle propor
tion des raccords respecte les exigences. En utilisant la même méthode que précédemment, on obtient
0,3990-0,4008 < < 0,4010-0,4008
P(0,399<X< 0,401) = />
0,0004 0,0004
P(-4,5 < Z < 0,5)
0(0,5)-<î>(-4,5)
0,6915-0,0000
0,6915.
/
de la norme de la norme
«v
fnn3aaj| La distribution du diamètre sur flancs du filetage : X ~ /V(0,4008; 0,Ô0042)
►
CHAPITRE 6
Après avoir étudié le résultat de ces calculs, un ingénieur des procédés de fabrication décide de rem
placer un outil de coupe usé et de régler la machine servant à fabriquer les raccords de manière à faire
correspondre la moyenne réelle à la valeur nominale de 0,4000. On a alors n = 0,4, donc
^0,3990 —0,4 0,4010 —0 ,4 ^
P(0,3990 < X < 0,4010) = P
0,0004 0,0004 J
P(-2,5 < Z < 2,5)
= 0>(2,5)-d>(—2,5)
= 0,9938-0,0062
= 0,9876.
Grâce à ces modifications, 98,76% des raccords produits respectent désormais les exigences. La
figure 6.7 montre la nouvelle distribution du diamètre sur flancs de leur filetage.
> “ ■ - ▼ * m J i n * i / A m
Exemple 6.4
On doit parfois résoudre un autre type de problème exigeant l’utilisation d’une table des valeurs asso
ciées à la loi normale. Soit X ~ N(50, 4). On veut déterminer la valeur x de cette variable telle que
P(X > x) = 0,025, ce qui se traduit par
x 50^
P(X > x) = P\ Z> 0,025
2 J
ou
Z< 0,975
de sorte que
x = 50+ 2(1,96) = 53,92.
La loi normale
—" —* n ■ v - 7 ' - *■ n — — a — f c — — 1— — 1 — — — — é
ttÊi . ■, ' — 1 . * .J k . .
I J 0 * , w L J & J O tX ’ J ' A V * ' . T & 5 ? v i V . ^ v . . , * ,\ * v v . > r s - • % ') » ^ t f ^ / V ' ^ v u iL Î* *■ . .‘ A . ; ? • > . . . . » > * > ^ S L > 7 .^ .« ■ «**> !
i f ■ , T / _ y
*, . V . .1 Æ L
r *• a /.
■ ^ * k. 5
T « j|
| I iB
; • • ■r a i 4 Æ | 00* ■ # 1 ' flH V «
î t L 1
_* 0
,V « ry
0 . ' s V» ' ‘ y ■ f . ^ **
* . -B 0 —~■ 00 _ ■ B B _ ir 1 b v .* 1 1 f " T v i * 7 y i \ j h ■ « . __ ^ .t \ > - . , * ____• - i . ) » ^ w ^
+ Gn
Exemple 6.5
Soit trois éléments reliés de la façon présentée à la figure 6.8. Les distributions respectives des lon
gueurs X,, X2et X3sont
X, ~ N(12, 0,02)
X2~ N(24, 0,03)
X3~ Af(18, 0,04).
Comme ces éléments sont fabriqués par des machines et des personnes différentes, on peut raisonna
blement supposer l’indépendance des variables X,, X2et X3. On s’intéresse à la longueur totale, notée Y.
On veut ici déterminer P(53,8 < Y < 54,2). Or, puisque Y =Xx+ X2+ X3, la variable Y obéit à une loi
normale de moyenne jliy= 12 + 24 + 18 = 54 et de variance
On peut étendre les résultats du théorème 6.1 aux com binaisons linéaires de variables
aléatoires indépendantes de loi normale. En effet, une autre propriété plus générale de la loi
normale est que toute combinaison linéaire de variables indépendantes de loi normale est aussi
une variable de loi normale, d’où le théorème 6.2.
— * - '• • / — ,— T r ' + r r - T V v « — ~ ''r r ~ T r V 'T ' O } * ' ' . / • » *■ .
* M * . . — . . - * .
P B p p p m n p n p
» 1 ^ D I . 4 - J 5 — - L V i é W i g f t J l i M l i l i l H 1 A ï Ê r * V j 1 r ^ L ' % ; ‘
r ^ y f î i d p : i § i o i u
p • r ? « <
Soit « variables aléatoires indépendantes, notées Xv telles que X, ~ NijU^ <j?) pour .. . . w »■. .* * ~** * _* ^
i= 1,2,..., n,et a0, av ..., an, des nombres réels quelconques. Alors la variable aléatoire Y défin
Y Gq+ ûjXf + ••• + a..X
n n ( 6.11)
+ a2o 2n
Exemple 6.6
Soit un arbre (tige cylindrique) qu’on doit insérer dans un palier (une sorte de tube fixe) (voir lafigure 6.9)
r *
Le jeu entre ces éléments correspond à la différence des diamètres, soit Y = X, —X2. Si
X. ~ Af(l,50 ; 0,0016)
et
X2 ~ N( 1,48 ; 0,0009),
alors
[iy —axpix+ o.2^i2
= (1)(1,50) + (—1)(1,48)
= 0,02 ►
La loi normale 165
et
aY2 2_2 , 2—.2
^1 C7j + ^2^2
2
(1)2(0,0016) + (-1)^(0,0009)
0,0025,
de sorte que
CFy = 0,05.
Lorsque Y < 0, un serrage (jeu négatif) rend l’arbre impossible à insérer dans le palier, d’où
0 0,02 -
N
P(serrage) = P(Y< 0) = P Z<
0,05 J
O(-0,4) = 0,3446.
Ainsi, 34,46 % des tentatives d’assemblage échoueront. Si l’équipe de conception juge qu’il est
impossible d’accroître le jeu nominal actuel de fiY= 0,02, le seul moyen de réduire cette proportion
d’échecs consiste à réduire la variance des dimensions. Or, on peut y arriver dans bien des cas en
améliorant le réglage des équipements de production, en formant mieux les opérateurs, etc.
?
Soit X , X ,..., Xnune suite de n variables aléatoires indépendantes telles que E(Xt) = fjt et V(Xt) = <yj
(avec .~
7<
finie). Soit
Y = X +X, + ••• +X„, %
alors dans certaines conditions générales, lorsque n tend vers l’infini, la variable Y obéit approxima
tivement à une loi /V(/i, + ju, + ••• + jun, cr2 + cr; + ••• + <72).
Autrement dit, si F est la fonction de répartition de
fl
Y
Zn (=1 ( 6 . 12)
n
ai
/»1
alors
Les conditions générales mentionnées plus haut se résum ent com m e suit. Pris seul, chaque
terme X i exerce une influence négligeable sur la variance de la somme, et il est peu probable
qu’un seul terme contribue pour beaucoup à la somme. La dém onstration de ce théorème et
l’examen rigoureux des hypothèses requises dépassent les lim ites de cet exposé.
L’importance de la loi normale résulte avant tout du fait que la loi de probabilité de Y s’avère
approximativement normale alors que les termes X t peuvent essentiellem ent obéir à n’importe
quelle loi, qu’elle soit discrète ou continue. Dans bien des cas, on peut envisager la variable à
l’étude comme la somme de nvariables aléatoires indépendantes dont
senter des erreurs de mesure, des considérations matérielles, etc., de sorte que la loi normale
fournit une bonne approximation.
On observe un cas particulier du théorème central lim ite lorsque chaque term e obéit à la
même loi.
Soit Xj5 X2, ..., X nune suite de n variables aléatoires indépendantes et identiquement dis
telles que E(X) = juet L(X.) = <r2 > 0. Si n est assez grand, la variable
X i+ X 2 + +xn
X
n
obéit approximativement à une loi N(ju, a /ri).
La loi normale
n =5 : Densité de n - 30 : Densité de
n = 1: Densité de Xj x Y+x2+ - + x5 Àj + X-, + *•• + XjQ
0,2 -f
0,4
0,2
0,0
0 1 2 3 4 5 6 0 5 10 15 20 25 30
Exemple 6.7
On emballe des pièces dans des caisses à claire-voie qui en contiennent chacune 250. Le poids de
chaque pièce est une variable aléatoire indépendante ayant une moyenne de 0,5 kg et un écart-type
de 0,10 kg. On charge 20 caisses sur une palette. Quelle est la probabilité que les pièces chargées sur
cette palette pèsent plus de 2510 kg au total (sans tenir compte du poids des caisses et de la palette) ?
Soit
y=x,+x2
le poids total des pièces, de sorte que
flY= n fi- 5000(0,5) = 2500,
a \ = na2= 5000(0,10)2 = 50.
1 6 8 CHAPITRE 6
Puisque n est grand, même si on ne connaît pas la distribution du poids de chaque pièce, on peut
appliquer le théorème central limite et utiliser l’approximation normale
N(2500, 50).
On aura ainsi
(
2510 —2500^1
P(X > 2510)~ P z >
v V5Ô J
1-0(1,41) = 0,08.
Exemple 6.8
Afin de permettre la planification et l’ordonnancement d’un projet de construction, on a créé un réseau
logique montrant les tâches ou étapes à effectuer. Ce réseau comprend un chemin critique formé de
30 étapes. Le tableau ci-dessous indique la moyenne et la variance du temps nécessaire (en semaines
et en semaines2) à la réalisation de quelques-unes de ces étapes.
Étape Moyenne Variance
1 2,7 1,0
2 3,2 0,8
3 4,6 1,0
4 2,1 0,3
••• ••♦ •••
29 7,1 1,9
30 1,5 0,5
On peut envisager la durée de chaque étape comme une variable indépendante et le délai d’achèvement
du projet comme la somme du temps requis pour réaliser les différentes étapes formant le chemin cri
tique, c’est-à-dire Y=Xl +X2-\--- + X30, où Y représente le délai d’achèvement du projet et X„ la durée
de la i-ième étape. On ne sait pas à quelle loi obéissent les variables X,, mais on connaît leurs moyennes
et leurs variances. En les additionnant, on obtient
HY= 49 semaines
16 semaines2.
L’entrepreneur désire connaître le délai assurant une probabilité de 0,90 d’avoir terminé le projet à
l’échéance, ce que la figure 6.11 peut aider à déterminer.
On cherche la valeur y 0 telle que
P(Y < y0) = 0,90.
On « standardise » Y pour obtenir la variable centrée réduite Z,
Exemple 6.9
On génère 50 nombres au hasard dans l’intervalle [0, 1]. Est-il exact de penser que la probabilité que
la moyenne de ces 50 nombres excède 0,6 est de 40 % ?
Soit X la moyenne des 50 nombres. Les X, sont des variables indépendantes et identiquement distri
buées selon une loi uniforme dans l’intervalle [0, 1], c’est-à-dire X, - (7(0, 1), = 1, ..., 50. Puisque
E(X) = fi = 1/2, et que V(X,) = a 2 = 1/12, on a donc
E(X) = p =
Ainsi,
= 1-0(2,45)
0,007.
Bref, même si la probabilité qu’un seul des nombres excède 0,6 est de 40 %, il en va autrement pour la
probabilité que la moyenne de ces nombres excède 0,6. En effet, la moyenne de 50 nombres a beau
coup plus de chances de se trouver autour de fx - 0,5 qu’un seul de ces nombres.
Démonstration
Compte tenu du fait que X représente la somme des résultats d’épreuves indépendantes de
Bernoulli (de sorte que E(X) = np et V{X) = np( 1 —p)), le théorème central lim ite nous permet
d’affirmer que la loi normale fournit une bonne approximation à la loi binomiale.
La quantité (X —np)/^Jnp(\ —p) est donc approximativement distribuée selon une loi 7V(0, 1).
Cette approximation se révèle assez juste lorsque la valeur de p est proche de j , tandis que n > 10.
Elle exige cependant une plus grande valeur de pour toute autre valeur de p. On sait par
expérience que la loi normale offre en général une assez bonne approximation tant que
np >5 pour <
p ^ ou tant que «(1 - p) >5 pour
La figure 6.12 illustre la forme de cloche de la distribution binomiale de plus en plus évi
dente lorsque n grandit.
L’utilisation d’un procédé de fabrication engendre 20 % d’articles défectueux. Pendant tout quart de
travail, on prélève une fois l’heure un échantillon aléatoire de 100 articles. Soit X le nombre d’articles
défectueux dans un échantillon. On en déduit que X suit une loi binomiale qui peut être approchée par
une loi normale, puisque n est grand.
X ~ Binomiale (n = 100, p = 0,20)
X « #(100(0,2), 100(0,2)(0,8))
X * #(20, 16)
Pour déterminer P(X < 15), on peut recourir à l’approximation fournie par la loi normale, d’où
15-20
P(X < 15) * P\ Z <
VÏ6
P(Z < -1,25) = 0 (-l,2 5 ) = 0,1056
La probabilité exacte, calculée avec la loi binomiale, est
Une illustration de l'approximation d'une Binomiale(n = 20, p = 0,5) par une loi
N[fi= 10, (T2= 5)
Exemple 6.11
À l’aide des données de l’exemple 6.10, où n = 100 et p = 0,2, évaluons P(X = 15), P(X < 15), P{X < 18),
P(X > 22) et P( 18 < X < 21) avec l’approximation normale en corrigeant cette fois pour la continuité.
La vraie valeur est donnée dans la colonne de droite.
15,5
P(X < 15) 0,130 0,1285
17,5
P(X < 18) = P(X < 17) 0,266 0,2712
21,5
P(X > 22) 0,354 0,3460
R e m a rq u e
V si ■ 5 ^ T > « t * -« ■ J V , ^ ( / <“ «• . -, y " i. h v j.., ^ ^ . „
tr » _ . ^ ■ >, ■ » _ i ^ \ i t > * » . j »■ v* » „ . ^ ^
La correction pour la continuité est présentée ici dans le cas de l’approximation d’une loi binomiale
par une loi normale. Toutefois, de façon générale, on utilise cette correction lors de toute approxima
tion d’une loi discrète par une loi continué; • » • ■
• * % . * * • . * » . . y ' • * -
. »
E(p)= p (6.14)
et que
V(p) = .
n
En vertu du théorème central limite, la variable
<6,s’
obéit approximativement à une loi N (0 ,1). Ce résultat est utile dans de nombreuses applications
liées, entre autres, au contrôle de la qualité, à la mesure du travail, à l’ingénierie de la fiabilité
et aux sciences économiques.
Exemple 6.12
Au lieu de chronométrer les activités d’un mécanicien d’entretien pendant une semaine afin de déterminer
quelle proportion de son temps est consacrée à des tâches « secondaires mais essentielles », une techni
cienne décide de recourir à la méthode des observations instantanées. Pour ce faire, elle choisit au hasard
400 moments de la semaine où elle effectue une observation ponctuelle visant à déterminer quel type
d’activité occupe alors le mécanicien. La variable X représente ici le nombre de fois où il s’agit d’une tâche
« secondaire mais essentielle », donc le nombre de « succès », et X/400. Si, en réalité, ce type de tâches
occupe 20 % du temps du mécanicien, la probabilité que p (c’est-à-dire la proportion observée) se situe
entre 0,15 et 0,25 correspond à
0,25-0,2 N 0,15-0,2 N
P (0,15< p< 0,25)«0 O
VVo, 16/400 J J0,16/400 J
0(2,5)-<ï>(-2,5)
0,9876.
Notons qu’il est possible d’utiliser une correction pour la continuité pour les calculs impli
quant la proportion afin d’augmenter la précision de l’approximation. Il faudrait alors ajouter ou
soustraire 1/2n, et non seulement 1/2 au quantile impliqué dans la probabilité.
La loi normale 173
six > 0
( 6 . 16)
sinon.
La représentation graphique de cette fonction de densité est généralement une courbe asy
métrique se prolongeant sur la droite.
ê
et sa variance,
Dans la pratique, on peut aussi avoir besoin de connaître la médiane et le mode de la loi
lognormale. Or, la médiane, c’est-à-dire la valeur Je telle que P(X <x) = 0,5, correspond ici à
Quant au mode, soit la valeur de x pour laquelle la fonction/(x) atteint son maximum, il vaut
%MO e1**~°r.
tandis que b= ed
est une seule constante, alors le produit
W= b f [
;=i
obéit à une loi lognormale de paramètres
n n
d + Y<ajVr, et •
j =\ 7=14
4. Soit Xv X2, ..., Xn des variables lognormales indépendantes ayant chacune pour
paramètres jliy et a Y, alors leur moyenne géométrique
M J
obéit à une loi lognormale de paramètres jliy et a Y/n.
La loi normale
Exemple 6.13
loi N(10,4). Si Y=\n X
, alors X obéit à une loi lognormale de paramètres
M 10 et <72 = 4, dont la moyenne et la variance correspondent respectivement à
E(X) = el0+0/2)4 = e12 162 754,79
et à
V(X) = el2(10)+4](e4 - 1) = e24(e4 - 1) » 53,598e24.
Le mode et la médiane de cette loi sont
10
mode = 403,43 et médiane = e 22 026,47.
Pour déterminer une probabilité donnée, telle que P(X < 1000), on recourt à la transformation
P(ln X < ln 1000) = P(Y l<n 1000), d’où
ln 1000-10
P(Y < ln 1000) = P Z< 0 (-l, 55) = 0,0606.
2 J
Exemple 6.14
Soit
*1-=lnXr - N (4, 1)
K= =lnX2-- N(3, 0,5)
*>-=lnX3-- N(2, 0,4)
K- =ln X4 --N(l,0,01),
où X„ X2, X3etX4sont des variables aléatoires indépendantes. La variable aléatoire Wdéfinie ci-dessous
revêt une importance primordiale en matière de rendement dans le cas d’un système de télémétrie.
W = eU5[X2'5X°2'2X°3J X4]].
Compte tenu de la propriété n° 3 énoncée plus tôt, la variable Wobéit à une loi lognormale de paramètres
1,5 + (2,5 • 4 + 0,2 • 3 + 0,7 • 2 + 3,1 • 1) = 16,6
et
(2,5)2 • 1 + (0,2)2 • 0,5 + (0,7)2 • 0,4 + (3,1)2 • (0,01) = 6,562.
En d’autres termes, ln W ~ N(16,6,6,562). Si la valeur de W doit être comprise entre 20 000 et 600 000
selon les normes de conception établies, on peut calculer comme suit la probabilité qu’elle remplisse
cette exigence :
/ ( * , , * 2 ) =
O '+%
La fonction de densité associée à cette loi comporte cinq paramètres : p , , jl l ,, ct,“ , c r2 et p,
où p est le coefficient de corrélation de X x et X2 tels que < //j < °°, —<» < /p < ©o, o f > 0.
o f > 0 et -1 < p < 1.
La probabilité conjointe P(ax<X{ <bxC\ a2<X2< b2) est donnée par
(6 .22)
D.B. Owen (1962) a établi une table des probabilités liées à la loi normale à deux variables.
La valeur de la corrélation
Les variables X{ et X2 d’une loi normale bivariée sont indépendantes lorsque p = 0, car on peut
alors décomposer leur fonction de densité conjointe en un produit de leurs fonctions de densité
marginales respectives. Une corrélation nulle est par conséquent synonyme d’indépendance
pour cette loi.
La loi normale 177
Si la corrélation est non nulle, c’est qu’il existe un lien linéaire entre les deux variables aléa
toires. Si l’on ajoutait à la figure 6.15 des plans parallèles au plan xxOxv l’intersection de chacun
de ces plans et de la surface représentant la fonction de densité conjointe formerait une ellipse.
Les ellipses ainsi formées sont appelées des « courbes de niveaux ». Plus p s’approche de l ou
de —1, plus les ellipses sont étirées, concentrées autour d’un grand axe représentant la relation
linéaire entre X xet X2. Plus p s’approche de 0, plus les ellipses ressemblent à des cercles (lorsque
X x et X 2 ont les mêmes unités de mesure), ou du moins à des ellipses dont les axes sont parallèles
aux axes Oxxet Oxr La figure 6.16 illustre l’effet de la corrélation sur la densité normale bivariée.
>. w . . . a
Densité conjointe de la loi jV2(50, 45, 36, 64; 0,10) Courbes de niveaux A',(50. 45. 36. 64: (),]())
4 *
/(*!. X2) “ X2
0,003 - 60
0,002 -
50-
0,001 -
40 J
30-
T “ T“
0 40 50 60 i
Densité conjointe de la loi N2(50, 45, 36, 64 ; 0,75) Courbes de niveaux AL(50,45, 36, 64 ; 0,75)
. A
f ( x x, X 2) ‘
A i if U
0,004 *
/
y
»
i :
:
x[
XJ i ■ K v •\
•
:
? : .
:
*V •/*i'1'V'j
.* .n j
t
>
. 'w
t
*
\
\
• W A V
. . y ' ? , '
0,002-
0,000
0 40 50 60 i
BÿfgaæÉ&sm
1a J l l i i IM La distribution normale bivariée et les courbes de niveaux associées pour des
corrélations de 0,10 et 0,75 (densité conjointe mise en évidence lorsque X, = 44
et lorsque X=, 56)
178 CHAPITRE 6
Xl (6.25)
et
X,2 ~ Nij^,
Ainsi, si [X , X 2] suit une loi normale bivariée, alors X] et X2 suivent des lois normales uni
variées. Notons cependant que l’inverse n’est pas toujours vrai.
E(X2\xl) = n 2 + P & 2
et une variance de
Le lieu géométrique des valeurs moyennes de X2étant donné x v lequel est défini par l’équa
tion 6.28, traduit la droite de régression de X2 sur que nous aurons l’occasion d’aborder au
chapitre 12. Soulignons aussi que la variance de ces distributions conditionnelles est constante
pour tout jc,.
La loi normale 179
Exemple 6.15
La résistance au cisaillement X2 et le diamètre X, de soudures par points ont fait l’objet d’une étude
visant à remplacer un essai destructif par un essai non destructif. Voici les conclusions de cette
étude.
1. Le vecteur [X,, X2] obéit à une loi normale à deux variables.
2. p, = 0,20 cm, p, = 1100 kg, d\ = 0,02 cm2, <r2= 525 kg2 et p = 0,9. ►
1 8 0 CHAPITRE 6
Le coefficient devant xxest positif, donc la résistance croît avec le diamètre des soudures.
La variance de X2 sachant xxest
v(x2\Xi) = G ja - p 2)
= 525(0,19)
= 99,75.
Exemple 6.16
Au moment d’établir la politique d’admission d’une grande université, on a observé que la note accor
dée aux étudiants à l’examen d’admission et leur moyenne cumulative à la fin de leur première année
d’études, notées respectivement X, et X2, obéissent à une loi normale bivariée. Une moyenne cumula
tive de 4,0 correspond à un « A ». Une étude a permis d’obtenir les données ci-dessous.
p, = 1300
& = 2,3
G*= 6400
g\ = 0,25
p = 0,6 ►
La loi normale 181
foute personne qui termine sa première année d’études avec une moyenne cumulative inférieure à 1,5
doit quitter l’université. On juge toutefois satisfaisante une moyenne de 2,0. » ■»
Supposons qu’un candidat se voit refuser l’admission après avoir obtenu une note de 900 à l’examen.
Mécontents, ses parents affirment qu’il peut réussir à l’université et terminer sa première année avec
une moyenne cumulative supérieure à 2,0. Laissant de côté les éléments non probabilistes, le regis-
traire veut déterminer P(X2> 2,0 |X, = 900) en se basant sur les données. Après avoir établi que
900-1300
E(X21900) = 2,3 + (0,6)(0,5)
80
0,8
et que
il arrive au résultat
2,0-0,8
P(X2> 2,0\Xl = 900) = 1 - 0
0,4
0,0013.
me
Loi normale: X ,<T2)
1
Fonction de densité : e-<m , pour °° < X < 00
-, .
<tV2n ^ V » . • %
X-fi
Si X N {fi., a 2), alors Z> N( 0, 1) (loi normale centrée réduite)
* * ' • -
G
» , \ •
x-fl
Fonction de P(X < x) = O O(z)
G
_ - •
• * . . . . . - * - *
v’
• -
•
. . . . .
1 1 \ \ \
x i -P i x i ~Pi x2 /i2 *2~M2
\ 2
/ ( x , , x 2) exp 2P 4~
2 k 0 \ 0 2J \ - p
2
2 0 - p 2) y cr, y \ G 2 J y
pour < jc, , jc2 < 00
L ois m arginales :
2
1 N i / u ^ o f ) et X 2 ~ N ( ju2, o ;)
L ois conditionnelles:
\ \
X2 P 2 0 j2( l
X1 x 2 N P i+ P ^ i P 2)
cr2 y y
A
X1 Pl 2
x 2 x1 TV P 2 + P°2 G220 P*)
<71 y y
r
La loi normale
6.1 Soit Z une variable normale centrée réduite. g) La probabilité de sélectionner une
Calculez les probabilités qui suivent en valeur située à moins d'un écart-type
vous aidant d’une représentation graphique de la moyenne est la même pour toutes
approximative de la densité. les variables aléatoires normales, peu
a) P(0 < Z < 2) importe les paramètres ju et a 2.
b) P ( - l < Z < 1) h) Si X . - i2N, 1) (pour / = 1.100).
c) P(Z< 1,65) alors X, + X, + ••• -f X„ suit approxi
d) P (Z > -1,96) mativement une loi ;V(200, 100) si les
variables X sont indépendantes.
e) P(|Z| > 1,5)
1) La loi MO. 100) est une bonne approxi
f) P(—1,9 < Z< 2)
mation de la distribution de la somme de
g) P(Z< 1,37) 100 variables aléatoires indépendantes
h) P(|Z| <2,57) de moyenne 0 et de variance 1.
6.2 Soit X ~ A^(10, 9). Tracez sommairement j) La loi N(5, 25) est une bonne approxima
la cloche normale en y indiquant la valeur tion de la distribution de la moyenne de
de la moyenne et des points d’inflexion. 100 variables aléatoires indépendantes
a) Évaluez P(X < 7). de moyenne 500 et de variance 2500.
b) Évaluez P(X > 12,4). Soit X ~ (V(80, 100). Calculez les probabi
c) Évaluez P(4 < X<suivent.
lités qui 10). Tracez sommairement la
cloche normale pour estimer les probabili
6.3 Pour chaque énoncé de probabilité ci-dessous,
tés avant de les calculer.
déterminez la valeur de c qui le vérifie,
sachant que Z ~ i0, 1).
N a) P(X < 100)
a) O(c) = 0,940 62 b) P(X < 80)
b) P(|Z| < c) = 0,95 c) iP5 7< X < 100)
c) P(|Z| < c) = 0,99 d) PiX > 75)
d) P(Z < c) = 0,05 e) P (|X - 80 < 19,6)
f) P (|X - 70 > 10)
6.4 Déterminez si les affirmations suivantes
sont vraies ou fausses. 6.6 La durée de vie d’un certain type de piles
a) Si X ~ N(5, 1), alors la probabilité que X sèches obéit à une loi normale, avec une
soit supérieur à 6 est égale à la probabi moyenne de 600 jours et un écart-type
lité que X soit supérieur à 7. de 60 jours.
b) Si X~ 7N
( , 9), alors 2 - 5, 9). a) Quelle proportion de ces piles peut-on
s’attendre à voir fonctionner plus de
c) Si X ~ Ni6, 4), alors X/2 - N(3, 2).
699 jours ?
d) Si X ~ Ni 12, 16) et que Y -N i5, 4), alors
une valeur de X choisie au hasard est b) On achète une boîte contenant 10 de
ces piles. Quelle est la probabilité qu'au
toujours supérieure à une valeur de Y
moins deux d’entre elles fonctionnent
choisie au hasard.
durant plus de 699 jours ?
e) Si X - N( 12, 16), que Y ~ W(5, 4) et que
X et T sont des variables indépendantes, 6.7 Une grande entreprise fait passer un test
alors X - Y - N i l , 12). aux personnes qui veulent y travailler. Pour
f ) Lorsqu’une variable aléatoire est obtenir un emploi, les candidats doivent
distribuée selon une loi normale, il obtenir une note minimale de 500.
est aussi probable de sélectionner a) Quel pourcentage des candidats satisfait
au hasard une valeur supérieure à la à cette exigence si les notes sont norma
moyenne qu’une valeur inférieure à la lement distribuées avec une moyenne de
moyenne. 485 et un écart-type de 30 ?
184 CHAPITRE 6
b) Un candidat reçoit une lettre lui annon est supérieure, inférieure ou égale à la
çant qu’il est convoqué à une entrevue valeur calculée en a), lorsque le produit
car 95 % des candidats obtiennent en fini est trop alcalin avec un pH moyen
général une note inférieure à la sienne. de 7,25.
Quelle note a-t-il obtenue au test ? c) Sans faire de calcul, déterminez si la
probabilité qu’on modifie les réglages
6.8 On sait par expérience que le temps
est supérieure, inférieure ou égale à la
de développement d’un certain type
probabilité calculée en b), lorsque le
de papier photo est une variable de loi
N(30secondes, 1,21 seconde2). produit fini est trop acide avec un pH
moyen de 6,75.
a) Déterminez la probabilité que le temps
de développement soit d’au moins 6.12 Le prix demandé pour un certain titre
28 secondes. constitue une variable de loi normale
b) Déterminez la probabilité que ce avec une moyenne de 50 $ et un écart-
temps ne dépasse pas 31 secondes. type de 5 $. Le prix offert par les gens
c) Déterminez la probabilité que ce temps désireux d’acquérir ce titre obéit lui aussi
s’écarte de plus de 2 secondes de sa à une loi normale, avec une moyenne de
valeur moyenne. 45 $ et un écart-type de 2,50 $. Quelle
est la probabilité qu’une transaction ait
6.9 Le flux lumineux d’un certain type d’am lieu?
poules obéit à une loi normale, avec une
moyenne de 2500 lumens et un écart-type 6.13 Des condensateurs doivent fonctionner de
de 75 lumens. Pour être jugées conformes 1000 à 5000 heures pour être conformes
pour un certain usage, les ampoules doi aux exigences. On sait que leur durée de vie
vent émettre un flux d’au moins lumens. est en moyenne de 3000 heures et qu’elle
Si seulement 5 % des ampoules sont obéit à une loi normale. Chaque condensa
rejetées, quel est ce flux minimal k ? teur rapporte 9 $ au fabricant, mais celui-ci
doit remplacer tout condensateur défectueux
6.10 Soit des segments de piston dont le dia à un coût de 3 $. Deux procédés permettent
mètre intérieur est normalement distribué de fabriquer des condensateurs ayant
avec une moyenne de 12 centimètres et un une durée de vie moyenne satisfaisante.
écart-type de 0,02 centimètre. L’écart-type s’établit à 1000 heures avec
a) Quelle proportion de ces segments a un le procédé A et à 500 heures avec le pro
diamètre supérieur à 12,05 centimètres ? cédé B. Toutefois, le procédé A entraîne
b) Quelle valeur c du diamètre
unintérieur est
coût de production deux fois moins
excédée par 90 % des segments ? élevé que le procédé B.
c) Quelle est la probabilité que le diamètre a) Quelle est la proportion de conden
intérieur d’un segment donné se situe sateurs non conformes avec chaque
entre 11,95 et 12,05 centimètres? procédé ?
6.11 La direction d’une usine ordonne l’arrêt b) Déterminez la fonction de masse du
de la production et la modification des bénéfice de chaque procédé, où C cor
réglages chaque fois que le produit fini a respond au coût de production avec le
un pH supérieur à 7,20 ou inférieur à 6,80. procédé A.
Le pH des échantillons obéit à une loi 9-C 9 - C - 3 J£b
normale dont la moyenne fi est inconnue
et dont l’écart-type a égale 0,10. P(XA) p(x b) 1 0
a) Déterminez la probabilité qu’on modifie
les réglages alors que le pH moyen
c) Quelle valeur de C fait pencher la
s’écarte un peu de la valeur recherchée, balance en faveur du procédé A ?
avec p = 7,05. 6.14 On s’intéresse à la probabilité qu’une
b) Sans faire de calcul, déterminez si la variable aléatoire normale prenne
probabilité qu’on modifie les réglages une valeur supérieure à 10. En estimant
La loi normale
cette valeur à l’aide d’une esquisse de la 6.17 Soit des variables aléatoires notées X
densité (sans calculer explicitement la pour i = 1, 2, ..., n, lesquelles sont indépen
probabilité), associez chaque probabilité dantes et identiquement distribuées avec-
à la bonne distribution. une moyenne fi et une variance cj2. et la
moyenne de l’échantillon
Distribution P(X > 10)
X = i( X , + X 2 + - " + X„) = i ÿ x , .
N( 16, 16) 0,09 n n 7T\
N (10,0,01) 0,31
Démontrez que E(X)= et que
N(6, 9) 0,50
V(X) = <j2/n.
N(0, 400) 0,93
On doit insérer un tronc d'arbre dont le dia
6.15 a) Estimez les paramètres et <T2 de mètre est une variable de loi M l,20; 0,0016)
chacune des distributions ci-dessous. dans un tube dont le diamètre intérieur
est une variable de loi N(\,25 ; 0,0009).
Déterminez la probabilité d’un serrage,
c’est-à-dire qu’on ne réussisse pas l’insertion
(voir l’exemple 6.6, à la page 164).
6.19 Soit trois éléments indépendants assem
blés bout à bout. La longueur de chacun
présente une distribution normale avec
une moyenne de 2 cm et un écart-type
de 0,2 cm. Or, les assemblages produits
doivent avoir une longueur totale de 5,7
à 6,3 cm. Quelle proportion d’entre eux
satisfait à cette exigence ?
6.20 a) Déterminez la moyenne et la variance
b) Quelle est la distribution de la variable de la combinaison linéaire
X + Y +Z si on suppose que les trois r=x,+ 2x2+x3+x4,
variables sont indépendantes ? où X, ~ N(4,3), X2~ N(4,4), X3~ N(2,4),
c) Quelle est la distribution de la moyenne X4~ N(3, 2), et où les variables X,, X2,
de 20 mesures indépendantes de la X3, X4sont indépendantes.
variable X ?
b) Quelle est la probabilité que 15 < Y < 20 ?
6.16 L’indice de dureté Rockwell d’un certain c) Que devient cette probabilité si la corré
alliage est une variable aléatoire normale lation entre X, et X est de 0,5 ?
de moyenne 70 et d’écart-type 4.
6.21 Toute erreur d’arrondi constitue une
a) Quelle est la probabilité qu’un échan
variable indépendante uniformément dis
tillon choisi au hasard satisfasse aux
tribuée sur l’intervalle [-0,5, +0,5]. Si l'on
exigences s’il doit avoir un indice de
dureté compris entre 62 et 72 ? additionne 50 nombres indépendants après
les avoir arrondis, quelle est la probabilité
b) Si l’on accepte tout indice de dureté
que l’erreur d’arrondi totale (en valeur
compris dans l’intervalle [70 - c, 70 + c],
absolue) dépasse 5 ?
pour quelle valeur de c obtient-on 95 %
des échantillons avec la dureté voulue ? 6.22 Soit une boîte renfermant 100 petits
c) Selon les valeurs indiquées en a), boulons. Chacun de ces boulons pèse
combien d’échantillons acceptables en moyenne 1 gramme, avec un écart-
peut-on s’attendre à trouver parmi type de 0,01 gramme. On considère les
9 échantillons choisis au hasard, boulons indépendants les uns des autres.
sachant qu’ils ont chacun un indice Déterminez la probabilité que la boîte pèse
de dureté indépendant ? plus de 102 grammes.
186 CHAPITRE 6
6.23 Une machine automatique remplit des a) En un point d’un circuit où la tension est
boîtes de détergent en poudre. Chaque boîte stable, vous utilisez ce voltmètre pour
doit contenir de 11,8 à 12,2 centilitres de prendre deux lectures consécutives,
détergent. Les seules données mesurées ont qu’on supposera indépendantes. Quelle
trait au poids total du contenu d’ensembles est la probabilité que les deux lectures
de 9 boîtes, lequel s’établit à 107,1 centi diffèrent de plus de 0,25 volt en valeur
litres en moyenne, avec un écart-type de absolue ?
0,45 centilitre. b) Au même point du circuit, vous prenez
a) En supposant que le poids des boîtes suit 10 lectures consécutives indépendantes.
une loi normale, déterminez le poids Quelle est la probabilité que la
moyen d’une boîte et son écart-type. moyenne des 10 erreurs de mesure,
b) Quelle proportion des boîtes produites soit comprise entre -0,05 et 0,05 ?
ne respecte pas la norme ?
6.27 Soit X,, ..., X40 des variables aléatoires
6.24 Un autobus assure la liaison entre deux indépendantes et identiquement distri
villes en passant par trois autres localités. La buées telles que X, ~ Exponentielle(0,2).
moyenne et l’écart-type de la durée de chaque Considérons la variable aléatoire Y, qui
déplacement sont présentés ci-dessous. représente la somme de tous les X,, c’est-
à-dire Y = X, + ••• + X40-
Villes Durée moyenne Écart-type a) Quelle est la loi exacte de la variable Y1
(par paire) (en heures) (en heures) b) En utilisant la loi exacte de Y, on
peut vérifier que P(Y> 150) = 0,9537.
1 -2 3 0,4
Calculez une approximation de cette
2 -3 4 0,6
probabilité en utilisant le théorème
3 -4 3 0,3
central limite.
4 -5 5 1,2
c) Considérons maintenant que la va
riable T est la somme de 100 variables
En considérant que la durée du trajet aléatoires indépendantes suivant une loi
entre deux localités suit une loi normale, Exponentielle(0,2). La probabilité exacte
quelle est la probabilité que l’autobus effec P(400 < T < 600) est de 0,955. Calculez
tue le trajet total en moins de 16 heures ? une approximation de cette probabilité
6.25 L’utilisation d’un procédé de fabrication en utilisant la loi normale.
engendre 8 % d’unités défectueuses. On 6.28 Soit X,, ..., X200des variables aléatoires
prélève chaque jour un échantillon aléatoire indépendantes et identiquement distribuées
de 200 unités pour en déterminer le nombre telles que X, ~ Poisson(0,5). Considérons
d’unités défectueuses, noté X.En recourant à la variable aléatoire Y, qui représente la
la loi normale comme approximation de la loi somme de tous les X(, c’est-à-dire
binomiale, effectuez les calculs qui suivent.
1Y = X h— +' ^200*
X
a) P(X < 16) a) Quelle est la loi exacte de la variable Y1
b) P(X= 15) b) En utilisant la loi exacte de Y, on peut
c) P( 12 < X < 20) calculer les probabilités suivantes :
d) P(X = 14) P(Y= 100) = 0,0399 et P(89 <Y< 120)
6.26 Vous possédez un voltmètre ayant une = 0,831. Calculez une approximation
erreur de mesure distribuée selon une loi de ces deux probabilités en utilisant le
normale de moyenne 0 et de variance théorème central limite.
0,1 volt2. En somme, chaque fois qu’on c) Quelle est la probabilité (approximative,
prend une mesure de tension X,, celle-ci sans correction de continuité) que la
correspond à la somme de la vraie valeur S moyenne de ces 200 valeurs soit infé
et de l’erreur de mesure <?,. rieure à 0,42 ?
La loi normale 187
6.29 Une entreprise produit des bouteilles de jus 6.31 Une compagnie fabrique des fusibles dont
d’orange d’environ 2 litres. Une machine la durée de fonctionnement peut être appro
remplit à moitié chaque bouteille de chée par une distribution normale ayant une
concentré, et une autre machine la remplit moyenne de 1000 heures et un écart-type
à moitié d’eau. de 200 heures.
• La quantité (en litres) de concentré a) Quelle est la probabilité qu’un fusible
versée par la première machine (notée X) fonctionne pendant plus de 1330 heures ?
suit une loi N(0,9& ; 0,0009). b) La compagnie aimerait offrir une
• La quantité (en litres) d’eau versée par la garantie de remplacement pour tout
seconde machine (notée Y) suit une loi fusible dont la durée de fonctionnement
N(l,02; 0,0016). ne dépasse pas x0heures. Déterminez la
a) Quelle est la probabilité qu’une bouteille plus grande valeur de a;, si la compagnie
contienne plus de 1,98 litre de jus ? compte remplacer au maximum 2,5 %
b) Une fois la production terminée, 90 % de ses fusibles avec cette garantie.
*
des bouteilles contiennent moins de c) Un échantillon de 10 fusibles est pris
k millilitres de jus (un mélange d’eau au hasard et mis en service dans un
et de concentré). Quelle est la valeur procédé où ils fonctionnent indépen
de k l damment les uns des autres.
c) On choisit aléatoirement 25 bouteilles i) Calculez la probabilité qu’au moins
pour le contrôle de qualité et on mesure 8 des fusibles de l’échantillon ne
le volume de jus de chacune. Quelle fonctionnent plus après 1330 heures ?
est la probabilité que le volume de jus Justifiez votre raisonnement.
moyen de ces bouteilles soit supérieur ii) Quelle est la probabilité que la
à 1,98 litre? v. durée moyenne de fonctionnement
des 10 fusibles de l’échantillon soit
6.30 Un procédé est utilisé pour la production
supérieure à 1100 heures ?
de cylindres dont la longueur (en centi
mètres) est distribuée selon une loi normale 6.32 Une machine sert à produire des panneaux
(gaussienne) de moyenne 5 avec un écart- de clôture dont la longueur (en mètres) X
type G ajustable. Un cylindre est considéré est distribuée selon une loi uniforme dans
comme étant conforme si sa longueur l’intervalle [2,995, 3,005]. Supposons que
se trouve dans l’intervalle (spécifications) pour une application particulière, un pan
5 ± 0,02 centimètres. neau est considéré comme étant conforme
a) Supposez que l’écart-type est ajusté à si sa longueur (en mètres) se situe dans
G = 0,01 centimètre. l’intervalle [2,996, 3,004].
i) Calculez la probabilité qu’un cylindre a) Quelle est la proportion de panneaux
ait une longueur conforme. conformes de la production ?
ii) De manière approximative, quelle b) Supposez que le contrôle de la qualité
est la probabilité qu’un lot de de cette production consiste à examiner
180 cylindres contienne moins un panneau de la production toutes les
de 5 cylindres non conformes ? demi-heures. Déterminez la moyenne et
b) Les cylindres produits sont utilisés dans l’éCart-type (en minutes) du temps néces
des assemblages. Chaque assemblage est saire pour trouver un premier panneau
constitué de 4 cylindres placés bout à non conforme.
bout. Les spécifications pour la longueur c) Un client commande 120 panneaux
totale (en centimètres) de l’assemblage qu’il mettra bout à bout pour construire
sont de 20 ± 0,033 centimètres. une clôture. Soit T la longueur totale
Quelle devrait être la valeur maximale de la clôture que le client obtiendra.
de G pour qu’au moins 95 % des assem Calculez approximativement la probabi
blages soient conformes ? lité P(359,95 < T< 360,05).
CHAPITRE 6
il se peut que les échantillons de matières utilisées diffèrent, tout comme la façon de travail
ler des gens, les variables liées au procédé (telles que la température, la pression ou le temps
de séjour) et les facteurs ambiants telle l’humidité relative. La variabilité des données résulte
également des instruments de mesure utilisés. Il arrive, entre autres, qu’une balance fournisse
une mesure différente selon l’endroit où se trouve l’objet à peser sur son plateau. Le mode
de sélection des unités à examiner peut aussi engendrer une certaine variabilité, ainsi que la
diversité naturelle entre les individus d’une population.
Variable
La population est l’ensemble des N individus sur lesquels porte l’étude. Il arrive que N soit considéré
comme infini, par exemple si on étudie des bactéries ou une production de vis.
Échantillon
L’échantillon aléatoire simple est un échantillon pigé au hasard dans la population, de telle sorte que
tous les éléments ont la même chance d’être pigés.
On notera Xr X2, ..., Xn un échantillon aléatoire théorique (avant qu’il soit pigé), et je, x 2,
..., x l’échantillon observé. On utilisera des parenthèses sur les indices pour Léchant il km
ordonné (dont les observations sont placées en ordre croissant) :
minimum maximum.
• •
j Qualitatives Quantitatives
Elles ne font pas référence à un système Elles font référence à un système numérique.
| numérique.
1 Nominales Ordinales Discrètes J Continues j
Les modalités ne Les modalités peuvent L’ensemble des valeurs Les valeurs possibles se
peuvent pas être être ordonnées. possibles est fini ou trouvent dans un inter
ordonnées. dénombrable. valle de la droite réelle.
Exemples: Exemples : Exemples : ' Exemples :
couleur
• •niveau de scolarité • nombre d’enfants temps
•
ville
• • niveau de satisfaction • nombre de produits vitesse
•
de dés
La statistique descriptive
On appelle « statistique descriptive » la branche de la statistique visant à structurer, à résumer
et à présenter des données. Nombre de méthodes utilisées en statistique descriptive existent
depuis plus de 200 ans et tirent leur origine des activités de sondage et de recensement. Grâce
à l’informatique en général et à l’infographie en particulier, la statistique descriptive s’est beau
coup développée au cours des dernières années. On peut recourir aux méthodes statistiques
descriptives lorsqu’on étudie soit l’ensemble d’une population finie, soit un échantillon.
Il existe un large éventail de logiciels qu’on peut utiliser en statistique descriptive. Ces logi
ciels varient quant à leur utilisation première, leur degré de complexité et leur portée. Il peut
s’agir de simples tableurs comme Excel® de Microsoft, de logiciels plus évolués mais néanmoins
conviviaux tel Minitab®, de logiciels libres comme R, ou de progiciels complets comme SAS®.
dont il est question, mais plutôt évoquer ce qu’il cherche à représenter. Or, nous ferons quelques
exceptions à cette règle dans ce chapitre pour des raisons pédagogiques, car nous étudions pour
la première fois chaque type de représentation.
M-jI'
■
194 CHAPITRE 7
Exemple 7.1
La figure 7.1 montre chacune des variables du tableau 7.2 sous la forme d’un graphique de points.
//
~r
10 20 30 40 50 60 70
Résistance à la traction
5 10 15 20
Longueur des fils
Deux variables
Lorsqu’on souhaite présenter ensemble les valeurs de deux variables, on recourt à l’équivalent bidi
mensionnel d’un graphique de points, appelé « nuage de points » ou « diagramme de dispersion ».
On délimite un simple plan cartésien où l’une des variables figurera en abscisse et l’autre, en ordon
née. Il n’est pas nécessaire que les axes commencent à 0, mais il faut s’assurer que tous les points
sont représentés sur le diagramme. On reporte ensuite chaque observation dans ce plan.
Exemple 7.2
La figure 7.2 illustre, sous forme de nuages de points, la résistance à la traction par rapport à la lon
gueur des fils et par rapport à la hauteur de la puce selon les données du tableau 7.2.
•
• •
• •
•
•
• •
•
•
• •
•••
• t
••
• •
• •
Si des couples de données sont identiques et occupent ainsi un même point du plan, on peut
laisser les points se superposer, ou l’indiquer en remplaçant les points par des lettres. La lettre A
représente alors un point où figure une seule observation, la lettre B, un point où figurent deux
observations identiques, et ainsi de suite.
Non seulement un nuage de points fait voir la région où se situent les données et leur
concentration à l’intérieur de celle-ci, mais il révèle des liaisons possibles entre les variables.
Par ailleurs, son utilité ne se limite pas aux petits ensembles de données.
Trois variables
dimension
tion des données associées à trois variables, on peut créer un nuage de points tridimensionnel
comme celui de la figure 7.3 (qui reflète les données du tableau 7. 2 ),
.
4
Une autre possibilité consiste à tracer un diagramme à deux dimensions où l’aire de chaque
point est proportionnelle à la valeur de la troisième variable. À l’instar d’un nuage de points, ces
deux types de diagrammes révèlent eux aussi des liaisons possibles entre les variables en cause.
Exemple 7.3
Comme on a ici un ensemble de 100 données, on s’attend à ce qu’une distribution de fréquences
satisfaisante compte environ V 100 = 10 classes. Il faut s’assurer d’inclure toutes les observations
dans nos intervalles. Neuf classes englobant chacune 20 lb/po2, allant de 170 à 350, permettent ici
d’établir une bonne distribution de fréquences ( voirle tableau 7
La quatrième colonne du tableau 7.5 indique la fréquence relative de chaque classe, déterminée en
divisant sa fréquence observée par le nombre total d’observations. La dernière colonne du tableau
indique pour sa part la fréquence relative cumulée. Une distribution de fréquences se révèle souvent
plus facile à interpréter qu’une table de données. On découvre ainsi aisément à la lecture du tableau 7.5 ►
La statistique en bref et la description des données 197
que la plupart des bouteilles ont éclaté sous une pression de 230 à 290 lb/po2 et que 13 % d’entre elles
ont éclaté sous une pression inférieure à 230 lb/po2.
■BFl J!f-Y*
S
.
- . < - ^ . k ~ A . — ^ X _ #
,
X y , . ,
.
,
1 .
a - r * ^
.
. L
*
. ,
*FI fT^XjT1giikJT|^W|
}
t
-
1 \
. f w
> 4
i .
!
, ‘k j f n
>
n
j l
a ' '
J ,
« < ■
,
> ,
y T J y
--- \
■
/
X I
î v . . / . A
~» ,.
, ______ - *
W T
^ 7 : v . A . _____ 1
• y
2 !
t
S
*-
1. j l A
- . * • « H » « '
fT*Pi7TTnTT>TyW*»[AT?Jpi
a
^
i
_
j *
*
'
i .
/ V
* .
v ’i w
/
A
»
V
,
’.
\
j j i .
> . * y , ” - ~ l r " , 3
!
f
' V .
i / i . ^ 1
. 7 *
V ? . A J j l i
y
I . A L
■"
J
* X r * , y
V i . ,
. y
. V
]
v V
rj^|
’v 4 .
__
I . . . 4 • .* - ■ . , ■ ' m V yft ^ v • a ' , ' . V > . / ' H c u i t M T ^ • * » * . 7 .■ A T * • r ^ . • " . ' / k C " < - * > A h • * " • . ^ ’ > • - ! + - j r ._ * ' , * -, £ ■
1 j 1 1 1
n= 100 1 1,00
Exemple 7.4
L’importance du choix du nombre de classes dans la distribution de fréquences est bien représen
tée par les figures 7.4 à 7.6 ( voirà la page suivante). La figure 7.4 présente
libré des 100 mesures de résistance du tableau 7.4. Par contre, l’histogramme à 3 classes ( la
figure 7.5) n’illustre pas suffisamment de détails dans la distribution des données. À l’inverse, l’histo-
gramme à 36 classes ( voirla figure 7.6) peine à faire ressortir les tendances globales qu
dans les données, à cause de l’excès de détails. ►
CHAPITRE 7
/
i
!
Résistance à l’éclatement (lb/po2)
' *
-
c
. -
Hji K ; f
F*
>•
-V
«*>
. " »
*
a
^
. « , V -, . * - J
t > X
V r K
fc
i "
V J
J .
i . .
i.
KV • - i
I /
Un histogramme ayant un nombre insuffisant de classes
/ >
«
î
;
■ W
\
M
i
B
r •
Un histogramme ayant un trop grand nombre de classes
La statistique en bref et la description des données 199
Si l’on observe plusieurs intervalles vides après avoir groupé les données à l’intérieur de
classes de même longueur, on peut les fusionner avec des intervalles conLtus et ainsi créer
de plus larges classes pour rendre l’histogramme de densité plus attrayant. Toutefois, il est plus
facile d’interpréter un histogramme où toutes les classes sont de même loi.tueur.
Exemple 7.5
Longueur
de la classe ' V
Fréquence )
6° 1 3
2° 13
20 32
20 24
20 11
40 7
1 100
200 CHAPITRE 7
En résumé, les histogrammes sont des graphiques d’une grande utilité pour mettre en
évidence la position et la variabilité des données ainsi que la forme de leur distribution. Par
contre, ils ne permettent pas de distinguer les données individuelles, puisque toutes les obser
vations comprises dans une même classe y sont confondues.
Exemple 7.6
La figure 7.8 présente sous la forme d’un diagramme en boîte les données relatives à la résistance à
l’éclatement de bouteilles.
• Les trois quartiles prennent les valeurs suivantes (voir l'exemple 7.14) :
0 = 248,
Ql = 265,
Q3 = 280.
Ce sont ces trois valeurs qui positionnent la boîte.
• L’écart interquartile vaut EIQ = Q3 - Ql =280 - 248 = 32.
• La moustache inférieure s’étend jusqu’à la dernière donnée supérieure ou égale à Ql —1,5 x EIQ
= 200 (donc jusqu’à 202).
• La moustache supérieure s’étend jusqu’à la dernière donnée inférieure ou égale à <23 + 1,5 x EIQ
= 328 (donc jusqu’à 328).
Les six observations se situant à l’extérieur de l’intervalle [200, 328] sont considérées comme
extrêmes. ►
La statistique en bref et la description des données 201
On voit sur le diagramme que la distribution des données est relativement symétrique par
rapport à la valeur centrale, les deux moustaches et les deux parties du rectangle étant à peu près
de même longueur, et que les valeurs dites extrêmes sont réparties également de chaque côté du
graphique.
Exemple 7.7
Les données du tableau 7.7 sont des mesures de viscosité associées à trois mélanges différents
de matières premières qu’on utilise à l’intérieur d’une chaîne de fabrication. La figure 7.9 ( à
la page suivante) nous permet de voir que le mélange 1 semble plus visqueux que le mélange 2,
lui-même plus visqueux que le mélange 3. La viscosité de chacun n’est pas distribuée de façon
symétrique, et la valeur maximale de la viscosité du mélange 3 semble anormalement élevée par
rapport aux autres mesures obtenues. Il pourrait s’agir d’une observation aberrante méritant une
analyse plus poussée.
202 CHAPITRE 7
Exemple 7.8
La figure 7.10, construite à partir de 77 observations, représente la distribution des types de défauts
d’une pièce métallique faisant partie de l’armature de portières d’automobiles. On voit tout de suite
quelles sont les failles les plus souvent identifiées : la forme déficiente et le mauvais détourage.
/
30
gP 25
ooo
20
•8
8 15
a
<D
§<i°
5
0
& -N. sV «&
,J ? «JP
X) sSy
« O
&
S J
Type de défauts
J
k
Dans le cas de variables qualitatives (catégoriques), il arrive qu’on place les bâtons en ordre
décroissant d’importance. Cela n’a évidemment pas de sens pour des variables quantitatives
discrètes.
Le diagramme circulaire
On voit souvent une autre représentation graphique pour les données qualitatives : le diagramme
circulaire (ou diagramme en pointes de tarte). Pour chaque secteur circulaire, l’angle au centre
est proportionnel à la fréquence de la modalité. Il faut donc évaluer des surfaces en pointes de
tarte pour comparer l’importance des catégories. À moins d’avoir 2 ou 3 catégories seulement,
le diagramme en bâtons est toujours préférable, car il est plus facile de comparer des longueurs
que des surfaces.
Exemple 7.9
Pour illustrer le diagramme quantile-quantile, considérons les données suivantes :
-0,314 1,080 0,863 -0,179 -1,390 -0,563 1,436 1,153 0,504 -0,801.
Supposons qu’on veut vérifier graphiquement l’hypothèse que ces données sont convenablement
modélisées par une loi normale. On arrange les observations par ordre croissant et on calcule les
fréquences relatives cumulées (j - 0,5)/n pour j = 1,..., n. On calcule ensuite les quantiles théoriques
de la loi (0, 1) correspondant à ces fréquences relatives cumulées. Ces quantiles, appelés «cotes Zj»,
N
satisfont à
P(Z <
<ï>(z,).
La figure 7.11 représente le graphique des quantiles échantillonnaux x(j) en fonction des quantiles
théoriques zr Comme les points sont généralement alignés, on conclut qu’une loi normale décrit bien
les données.
/ ——
— -- ■■
, .
» '
■ ■
—-------■
■
«
- ------ - .... .... ... .......*
.. "------- ' ' "
"' '
» »
•
1,5 - •
1
• •
O
1
• 1
' J
• 1
0,5-
1
o,o -
•
• ♦
*i
-0,5- • ij
•
-1,0-
--- 1
•
-- 1------- 1------- 1------- 1-------1-------T
-------1--
7
Ws
La plupart des logiciels de traitement de données tracent des graphiques de probabilité pour
diverses lois, ce qui évite des calculs fastidieux. Il existe de légères variations dans le calcul des
quantiles d’un logiciel à l’autre, mais le principe général reste le même.
particulier ; les fluctuations journalières, mensuelles ou trimestrielles d’un indice boursier ; les
variations annuelles de l’indice des prix à la consommation établi par Statistique Canada.
Un diagramme chronologique présente généralement le temps en abscisse, son axe vertical
portant une échelle définie en fonction de l’étendue des valeurs observées.
Exemple 7.10
La figure 7.12 illustre la demande horaire d’électricité d’un immeuble à bureaux (en kilowatts). Dans
ce cas, les données horaires obtenues représentent véritablement la moyenne de l’ensemble des don
nées mesurées à l’intérieur de chaque heure.
D’ordinaire, lorsqu’une série se compose de moyennes associées à des intervalles de temps, le degré
de variation des données est fonction de la longueur de ces intervalles, des intervalles plus courts
entraînant une plus grande variabilité. Si l’on avait par exemple mesuré aux 15 minutes la demande
d’électricité en kilowatts, on aurait dû reporter 96 points dans le graphique, et les données auraient
semblé fluctuer bien davantage.
/ /
..
i
»
I
t
t
♦
»
.
*
l
1
Moyenne échantillonnai
Si l’on note x , x2, . x les observations d'un échantillon de taille /?, alors la moyenne de cet échan-
tillon se traduit par
Exemple 7.11
Dans le cas des données du tableau 7.3, la moyenne de l’échantillon s’établit à
26408
264,08.
100
D’après la figure 7.4, cette moyenne de 264,08 lb/po2semble constituer une valeur typique de la
résistance à l’éclatement des bouteilles, puisqu’elle se situe près du centre de la distribution, là où se
concentrent les observations. Pareille impression peut toutefois être trompeuse. Examinons l’histo-
gramme de la figure 7.13. La moyenne des données présentées ici constitue toujours une mesure de
tendance centrale, mais cela ne veut pas dire que la plupart des observations se concentrent autour
d’elle. Si l’on suppose que chaque valeur observée a une masse, la moyenne de l’échantillon n’est
rien de plus que le centre de masse des données, ce qui signifie que l’histogramme sera à peu près
en équilibre si on le place sur un pivot situé à l’endroit correspondant à cette moyenne.
/~
A
<
D
O
ao
cr Moyenne
«Uh de l’échantillon
Comme nous l’avons vu dans les chapitres précédents, la valeur // peut aussi représenter
l’espérance d’une variable aléatoire, c’est-à-dire sa moyenne théorique en supposant un modèle
probabiliste prédéfini. Dans les chapitres traitant de l’inférence statistique, on étudiera diverses
méthodes permettant de tirer des conclusions au sujet de la moyenne d’une population (fi) à
partir de la moyenne d’un échantillon (3c).
La médiane
La médiane, c’est-à-dire le point où l’échantillon ordonné se divise en deux sous-groupes de
même fréquence, constitue une autre mesure de tendance centrale.
Médiane échantillonnais
Soit un échantillon ordonné dont les valeurs sont notées x 1f*1 \a£*rj.plus petite
lus srunc 11cathématiuues.
lthé
A
X
((fl+])/2 si nset impair
X
**(///2) **((«/2)+l) (7.3)
si nest pair.
9
Exemple 7.12
Soit les observations ci-dessous, placées en ordre croissant :
1, 2, 3, 5, 6, 7 et 8.
La moyenne de cet échantillon s’établit à 4,57 et sa médiane, à x((7+1},2) = x{4) = 5. Toutes deux four
nissent une bonne indication de la tendance centrale des données. Supposons maintenant que la der
nière observation diffère, de sorte qu’on a
1, 2, 3, 5, 6, 7 et 2519.
La moyenne de l’échantillon passe alors à 363,29. Manifestement, elle ne révèle pas grand-chose au
sujet de la tendance centrale de la plupart des données. La médiane, par contre, est toujours de 5, ce
qui constitue probablement une indication beaucoup plus valable de la tendance centrale de-, la majorité
des données.
On peut donc dire que la moyenne est beaucoup plus sensible aux valeurs extrêmes que
la médiane. Par contre, la moyenne de l’échantillon tient compte de toutes les données, alors
que la médiane n’en considère qu’une ou deux. De plus, la distribution échantiUonnale de la
moyenne de l’échantillon est souvent facile à établir. C’est pourquoi beaucoup de méthodes
d’analyse statistique y font appel.
On peut s’intéresser à la médiane 3cd’un échantillon, mais aussi à la médiane fi d’une popu
lation. Il s’agit là de la valeur de la variable à l’étude telle qu’une moitié de la population se situe
au-dessous de fi et l’autre moitié, au-dessus.
CHAPITRE 7
Le mode
Mode échantillonnai
La valeur la plus fréquente à l'intérieur d’un échantillon porte le nom de «mode», que nous identifie
rons par la lettre ni.
Exemple 7.13
Soit les 12 données suivantes :
1, 2, 2, 2, 2, 4, 4, 5, 5, 6, 6, 9.
Le mode est ici 2, car cette valeur se répète quatre fois et aucune autre n’est aussi fréquente.
Les quantités
Les quantiles échantillonnaux sont d’autres mesures de position pouvant être vues comme
des nombres qui séparent l’échantillon ordonné en sous-groupes de même fréquence. On leur
donne souvent des noms particuliers, selon le nombre de sous-groupes créés. Par exemple, les
3 « quartiles » séparent l’échantillon en 4 classes de fréquence égale. Les 99 « centiles » séparent
l’échantillon en 100 classes de fréquence égale.
On peut aussi envisager le quantile comme un nombre qui divise l’échantillon ordonné en
deux parties, de façon à ce qu’une proportion yde données
proportion 1 - y lui soit supérieure. Il existe plusieurs façons de calculer les quantiles ; l’une
d’elles est décrite ci-après.
La statistique en bref et la description des données
Quantité d'ordre y
Ainsi, un quantile n’est pas nécessairement égal à une valeur observée dans l’écha
Selon cette méthode, les trois quartiles d’un échantillon de taille se calculent comme
0 =” ^0,25 ’” *(0,25n+0,5)’
Q2--" #0,50 “=médiane = x (0 ,5 m + 0 .5 ) ’
Q3--“ #0,75 "~*(0,75n+0,5)'
Exemple 7.14
Reprenons les 100 données du tableau 7.4 indiquant la résistance à l’éclatement de bouteilles. Les
trois quartiles se calculent comme suit :
QX--' * (0 .2 5 x100 + 0.5) — * (2 5 .5 ) "" [* (2 5 ) * (2 6 )-^ 2 ~=[248 + 248]/2 =
= 248,
Q2--“ * (0 ,5 n + 0.5) _ * (5 0 .5 ) ' = [ * ( 5 0 , + * ( 5 .,] / 2 ==[265 + 265J/2 =
= 265,
0 =" *(0,75/1 +0,5) —* (7 5 ,5 ) '” [* (7 5 ) * (7 6 )^ 2 “= [280 + 280]/2 =
= 280.
Le dixième centile consiste en l’observation de rang (0,1)(100) + 0,5 = 10,5 (une valeur à mi-chemin
entre les 10e et 11e observations), ce qui donne (220 + 221)/2 = 220,5.
Exemple 7.15
Voici la résistance à l’éclatement des six bouteilles de deux échantillons différents.
Échantillon 1: 230 250 245 258 265 240
Échantillon 2 : 190 228 305 240 265 260
La résistance moyenne est de 248 lb/po2pour chaque échantillon. On remarque cependant que les valeurs
obtenues sont beaucoup plus étalées ou dispersées dans le cas de l’échantillon 2 (voir la figure 7.15).
-----*
/
O O OO O O
• • • • • • *
t
t
i i 1 ! i ■
Échantillon 1 = Échantillon 2 *
»
La variance
L a principale mesure de dispersion est la variance de l’échantillon.
Variance échantillonnais
Soit un échantillon formé de n observations notées x , x , . . . , jc . Sa variance se traduit par
On doit prendre soin de conserver un nombre suffisant de décimales afin d’éviter toute erreur
d’arrondi.
Pour découvrir com m ent la variance de l’échantillon reflète la dispersion ou la variabi
lité des données, reportez-vous à la figure 7.16, qui montre les écarts jc. — de la résistance à
l’éclatem ent des six bouteilles de l’échantillon 2. Plus les données observées varient, plus la
valeur absolue de certains écarts x. —x est grande. Comme la somme des écarts jc. —x est tou
jours nulle, il faut utiliser une mesure de variabilité qui transforme les écarts négatifs en des
grandeurs non négatives. Or, c’est le cas de la variance de l’échantillon, qui demande d’élever
le s écarts au carré. Une faible valeur de s2 indique ainsi que les données varient relativement
peu, et une valeur élevée, qu’elles varient beaucoup. Notons que la variance est très sensible
aux valeurs extrêmes, et qu’il suffit de quelques valeurs très éloignées du centre pour la faire
grossir très rapidement.
Exemple 7.16
/
xi *2 x4 x6 x5 x3
O O O O O O
1— i “ T— ~I— T
180 200 220 280 300 320
Observations X -JC
.*>': !/ 1, (JC - x)2
- . •- .-----— — — — ,
I502(lb/po2)2.
1502 (lb/po2)2.
Pour une population finie, constituée de N valeurs, on peut représenter la variance par
ce qui correspond simplement à la moyenne des carrés des écarts entre les valeurs de la variable
et la moyenne de la population. Tout comme la moyenne d’un échantillon peut servir à tirer des
conclusions au sujet de la moyenne d’une population, sa variance peut servir à tirer des conclu
sions au sujet de la variance de la population.
Une autre façon d’envisager les choses veut que la variance de l’échantillon s*2 repose sur
n —1 degrés de liberté. On parle de degrés de liberté parce que la somme des écarts x. —
x2 —x, ..., xn— x est toujours nulle, de sorte qu’il suffit d’indiquer 1 de ces valeurs
obtenir la valeur manquante. De ce fait, seuls n - 1 des n écarts x - x sont indépendants.
L'écart-ty p©
Comme on élève au carré l’unité de mesure des données pour en exprimer la variance, cette
statistique est difficile à interpréter. La variabilité constitue en outre une notion moins facile à
saisir et moins familière que la position ou la tendance centrale. On peut toutefois simplifier les
choses en calculant l’écart-type de l’échantillon.
Écart-type échantillonnai
0. . ^
.* _
. i-» _ . • , *
. . . i . . ,
. *
. . •
%,* . * ' .
■. * .
. . . . . / . -
. . . . * . «.
On obtient ainsi une mesure de dispersion exprimée dans les mêmes unités que les valeurs
prises par la variable, qu’on peut interpréter comme une distance « typique » entre les observa
tions et leur moyenne. On ne peut pas parler de distance moyenne, car on ferait alors référence
à l’écart moyen, calculé à partir des écarts en valeur absolue x ( - x
Exemple 7.17
Soit les bouteilles de l’échantillon 2 dont il est question à l’exemple 7.15 et à la figure 7.15. L’écart-type
de leur résistance à l’éclatement est de
s= V1502 = 38,76 lb/po2.
Exemple 7.18
Calculons la variance et l’écart-type de l’échantillon à partir des données du tableau 7.3 ayant trait à la
résistance à l’éclatement de bouteilles. On remarque que
100 100
^ x f = 7075 062 et ]£*,.= 26 408.
i= l i= l
Conséquemment,
S = 7 075 062 - (26 408)2/100 = 101 237,4
2 101237,4 . . . . . ... . 2\?
et s2
= -= 1022,6 (lb/po2)2,
99
de sorte que l’écart-type de l’échantillon est de
L'étendue
Étendue
L’étendue de l’échantillon constitue une autre mesure de dispersion utile, dont la notation provient
de l’anglais range. On la note
R = max (*.)
y r - min (jc
x r) =x,
(n) -x,,.
(!) (7.7)
Exemple 7.19
Calculons l’étendue des données relatives à la résistance à l’éclatement énumérées à l’exemple 7.15 et
présentées graphiquement à la figure 7.15. Dans le cas du premier échantillon, on obtient
Ri 265 - 230 = 35,
tandis que, dans le cas du second, on obtient
R = 305 - 190 = 115.
Le second échantillon présente ainsi une étendue beaucoup plus grande que le premier. Lorsque l’on
considère seulement les deux valeurs les plus extrêmes, on parvient à la même conclusion qu’en calcu
lant la variance, c’est-à-dire que le deuxième échantillon se caractérise par une plus grande variabilité.
Le coefficient de variation
Il est parfois souhaitable d’exprimer la variation en fonction de la moyenne.
Coefficient de variation
On appelle « coefficient de variation» de l’échantillon la mesure de la variation relativ i ’ï
s
CV
X
Il s’agit là d’une mesure utile pour comparer la variabilité de deux ou de plusieurs ensembles
de données qui diffèrent considérablement en raison de l’ampleur des valeurs observées. On
pourrait y recourir afin de comparer la variabilité de la consommation quotidienne d’électricité,
en janvier, de maisons unifamiliales situées à Québec et à Vancouver.
où, dans le cas d’une population finie, le k-ième moment centré correspond à
Comme on l’a déjà mentionné, une distribution peut être plus ou m oins sym étrique par
rapport à sa moyenne. Une distribution asymétrique négative (/?3 < 0) s’étire du côté où les
valeurs de la variable vont en diminuant (vers la gauche), et une distribution asym étrique
positive > 0), du côté où elles vont en augmentant (vers la droite). Les variables dont
la densité est symétrique, comme celles qui obéissent à une loi norm ale ou uniform e, ont
un coefficient d’asymétrie nul. La loi exponentielle, étirée vers la droite, engendre par
exemple un coefficient /?3 égal à 2.
Quant au coefficient d’aplatissement (kurtosis en anglais), il s’interprète surtout dans le
cas d’une distribution symétrique. Il indique à quel point une distribution est plate ou poin
tue par rapport à celle d’une variable normale, une valeur négative dénotant une distribution
relativement plate et une valeur positive, une distribution relativement pointue. Ce coefficient
s’établit ainsi à —1,2 dans le cas d’une variable uniforme, alors qu’il est nul dans le cas d ’une
variable normale.
Si les données à analyser résultent de mesures échantillonnales, on peut estim er les coeffi
cients y33 et /?4 à l’aide des équations 7.11 et 7.12.
. . *»
ti /
%
.
#.
3
» .
. i v » .
n i=1
P3 ( n - \) ( n - 2 ) S
n > 2, s ^ \ ^ -
< >
(7.11)
n
2
(«)(« +1) i=\ 3(n - 1)
P n > 3. ( 7. 12)
(n - 1)(n - 2)(n - 3) S (n - 2){n - 3) -
La statistique en bref et la description des données 215
V
Exemple 7.20
À titre d’exemple, les données relatives à la résistance à la traction du tableau 7.2 donnent lieu à un
coefficient d’asymétrie de 0,865 et à un coefficient d’aplatissement de 0,161.
asymétrie lég
de coefficient
près de 0 (0,161).
(7.13)
(7.14)
2 1 6 CHAPITRE 7
Comme son équivalent théorique p, la valeur de r est comprise dans l’intervalle [—1, 1].
Cette grandeur sans dimension mesure le degré d’association linéaire entre deux variables. Plus
une association est forte, plus |r 1. Si les données ne traduisent aucune association linéaire,
ce coefficient est nul.
Exemple 7.21
Revenons aux données du tableau 7.2, ainsi qu’aux nuages de points de la figure 7.2 qui montrent la
résistance à la traction de fils d’interconnexion (qu’on appellera la variable R) par rapport à la longueur
des fils (disons la variable L) et par rapport à la hauteur de la puce (disons la variable H).
Les coefficients de corrélation échantillonnaux sont = 0,982 et rRH= 0,493. Puisque rRLest positif et
près de 1, on conclut qu’une grande valeur de Lest associée à une
appelle une « association positive ». La figure 7.2 illustre bien ce phénomène. On observe aussi une
relation linéaire positive entre H et R, mais de façon moins importante.
Même si les coefficients de corrélation diffèrent de 0, il ne faut pas en déduire qu’il existe
une relation de cause à effet entre les variables, car on ne peut prétendre qu’une augmentation
de L ou de H fait augmenter celle de R. On oublie souvent ce point important, ce qui engendre
parfois de graves erreurs d’interprétation, puisqu’il peut très bien y avoir une variable causale
non observée qui influe sur toutes les variables à l’étude.
( 7. 16)
n —1 n —1
La statistique en bref et la description des données
( 7. 17)
;=1
Exemple 7.22
Voyons comment utiliser les équations 7.17 et 7.18 en calculant la moyenne et la variance de la résis
tance à l’éclatement selon les données de la distribution de fréquences du tableau 7.5. Le tableau
ci-dessous donne le point milieu de chacune des c = 9 classes, ainsi que le nombre d’observations
contenues dans chaque classe.
Point milieu
de la classe Fréquence
m, = 180 /, = 2
m2= 200 4
m3= 220 / 3= 7
m4= 240 f A= 13
m5= 260 / s = 32
m6= 280 f 6=24
m7= 300 / 7= 11
W8= 320 /,= 4
m9= 340 / 9= 3 ►
218 CHAPITRE 7
De ce fait,
9
j =i 26460 2
x 264,60 lb/po
n 100
et
9
2
^ f j m j2 - l O O x
2
2 7=1 7 091900-100(264,60) 2x2
s
_
914,99 (lb/po )
99 99
Il s’agit là de valeurs très proches de celles que fournissent les données non groupées, c’est-à-dire
x = 264,08 et s2 = 1022,6.
et que le nombre d’observations inférieures à x est d e / , alors la médiane pourrait s’estimer par
la valeur suivante :
, (0,5/7 - / )
jc = x_. H (x m + \
--------------------------------------------------------------------------------------------------------------------------------------------------
^m ) ' (7.19)
f
/,m+1 J m
v . • ». .
■>
, ** . . . , - •
Diagramme en boîte
Diagramme en bâtons (variables discrètes ou qualitatives)
Diagramme quantile-quantile
- <■
.* ■ • • .
, * *
' v ..
. .
••
✓
>*■*. • .
•a '
•
»
N
.* * *
__
•
, è —
. . _
' n '
.c
»
•' . / .
§ ' .
* . • • . . . .
:*
- «■*
I
*
% .*
' • > •
/•
. r , ,
% - -
: • * v
■y
La statistique en bref et la description des données 219
r y ~ ■» ^ * c • i l - t » * j a . • > > ? ^ . v . ^ -5 - - . « x l / j u w ?
r V , • , * , ; ; ' ' > v » ; *. + 4 V t*. « . ' ' “ > | « T ^ . . J
ï ^ 1 5 kM K 1
^2 _S î .
^
* * - v ^ . -, \ - K - ^ ^ A K A L h . - r — i l — — — — . ----------------------:---------------------------- ;-----------------------------------
Mesures de position
Moyenne X 1 n
1V
~ L xi i
n 7 ? i
. ,
■
- V . .
s,
/.• . * . ■ ' •,
- - r • •
g
|r.:
{ y n + QS) :
Mesures de dispersion
Variance 7
‘ .X t x i - D *
. . -
n ~ l 13 _________________ ______________________________ - ..................................................................................|
I •
Ecart-type s
4? '
«
A 1■'
1Ecart interquartile 1 EIQ (2 3 -0 1
Mesures de forme B
n
Coefficient d’asymétrie 1 A
03
n . i= i
1 ( n - l ) ( n - 2) s3
Coefficient 1 A
/» «
d’aplatissement n(n + 1) f?î 3 ( n - l )2
\
11’
__. \
Mesure d’association
l\>
' ■
Coefficient de r r
r.
n
<
$xy
corrélation
(S „ -5 „)''2 L
1
- -- i
220 CHAPITRE 7
•
V %' • . f B ' 0 lm . T j , • | fl
Moyenne 1^
X =- ^ fjX j
H j = l
Variance
S = i ^ u f j i
s2 «
'l 1 7= 1
. * " * , . . . ^ - v
/ %
.
»
‘
*. * . '
•■■■ :: • I*
» .
» .•
•
.
«
• ' , * , /
b) Déterminez les 65e et 95e centiles de
Les données des exercices avec le symbole J+' l’échantillon, c’est-à-dire les quantiles
sont aussi disponibles en format électronique. $ d’ordre 0,65 et 0,95.
c) Tracez un diagramme en boîte à partir
7.1 Le fabricant d’une pellicule photographique des données associées à la durée de
(î+J de sensibilité élevée en étudie la durée de conservation.
conservation en jours. Voici les données qu’il 7.2 Le tableau ci-dessous indique le pourcen-
a recueillies, placées en ordre croissant. ®T tage de coton que renferme le tissu servant à
la confection de chemises. Les données sont
m 125 129 132 141 présentées en ordre croissant.
116 125 129 133 143
117 126 129 133 145 32,1 33,4 33,8 34,3 34,7 35,0 35,5 36,8
117 126 129 134 147
32,5 33,5 34,0 34,5 34,7 35,1 35,6 36,8
120 126 130 134 148
32,6 33,6 34,1 34,5 34,7 35,1 35,7 36,8
120 127 130 134 149
32,7 33,6 34,1 34,6 34,7 35,1 35,8 37,1
120 127 131 136 150
32,8 33,6 34,1 34,6 34,7 35,2 35,9 37,3
122 128 131 140 162
32,9 33,6 34,2 34,6 34,7 35,3 36,2 37,6
40 40 33,1 33,6 34,2 34,6 34,9 35,4 36,4 37,8
« = 40; î > .= =5252; =694 024 33,1 33,8 34,3 34,6 35,0 35,4 36,6 37,9
1=1 1=1
64 64
a) Calculez la moyenne et la variance n = 64; £ X{ = 2225,1 ; ^ jc?= 77 475,63
de l’échantillon. /=! i=l
La statistique en bref et la description des données
7.6 Voici des données, disposées en ordre d) Pourriez-vous ajouter deux observations
(7+T croissant, concernant la durée de fonction de valeurs différentes à l’échantillon
nement avant défaillance (en heures) de initial sans modifier sa moyenne ?
turboréacteurs. 7.7 Voici l’histogramme de l’indice d’octane de
différentes essences ( la figure 7.18).
2 165 197 255
171 a) Combien y a-t-il d’observations dans
53 200 262
65 179 203 ce jeu de données ?
286
93 183 206 291 b) Combien y a-t-il d’indices d’octane
144 187 213 compris entre 86 et 90 ?
150 197 223 c) Quelle est la proportion des valeurs de
155 197 232 cet échantillon qui sont supérieures à 94 ?
d) Dans quel intervalle se situe la médiane
Voici quelques statistiques descriptives de cet échantillon ?
issues de ces données. e) Lequel des diagrammes en boîte ci-
n = 25 Je= 197 dessous représente cet échantillon ?
3c = 180,36 = 4825,4 i) _
• • I-------- | -----------1
a) Supposons que ces durées doivent être
converties en minutes. Que deviennent 80 85 90 95 100
les statistiques ci-dessus ?
b) On s’aperçoit que la valeur minimale H)
de ce jeu de données est erronée. I---------- 1 | 1-------- 1 • •
On la retire de la liste. Sans faire
de longs calculs, déterminez si les
statistiques ci-dessus seront égales, 80 85 90 95 100
supérieures ou inférieures aux valeurs
initiales. iü)
c) Pourriez-vous ajouter une observation • 1--------- 1 | 1-------- 1
à l’échantillon initial sans modifier sa
moyenne ? 80 85 90 95 100
7.8 Les données ci-dessous ont trait aux envois 7.12 L’épaisseur d’une carte de circuit imprimé
(gT retournés au manufacturier et à la raison revêt beaucoup d’importance. Les 8 cartes
expliquant le retour de ces marchandises. d’un échantillon ont respectivement 63, 61,
Présentez ces données sous la forme d’un 65, 62, 61, 64, 60 et 66 millièmes de pouce
diagramme approprié. d’épaisseur.
a) Quelle est l’unité de mesure de chacune
Nombre d’envois des valeurs suivantes : la moyenne,
Raison retournés la variance, l’écart-type, le mode, le
Refus 195 000 premier quartile et l’étendue de cet
Mauvais choix 50 000 échantillon ?
Mauvais envoi 68 000 b) On soustrait 63 de chaque donnée. Quel
Annulation 5 000 sera l’effet sur les six statistiques calcu
Autre 15 000 lées en a) ?
c) On multiplie chaque donnée par 100.
7.9 Démontrez que : Quel sera l’effet sur les six statistiques
n calculées en a) ?
a) X ( x< ~ * )= 0;
1= 1 7.13 Jean veut évaluer sa performance aux exa
mens dans un cours par rapport aux notes
b) I ,( x t. - x ) 2 = T ^ - n x 2. des autres étudiants. Voici les résultats qu’il
i=l i=l a obtenus, et les statistiques du groupe.
7.10 Déterminez si les énoncés ci-dessous sont
vrais ou faux. Écart-
a) L’écart-type, l’étendue et l’écart inter- Note Moyenne type du
quartile sont trois mesures de tendance de Jean du groupe groupe
centrale. Examen 1 75 60 20
b) On préfère souvent l’écart-type à la Examen 2 83 73 5
variance, car il n’a pas d’unités.
Examen 3 85 80 10
c) Lorsqu’on tire un échantillon d’une
distribution symétrique, on s’attend à ce
que la moyenne échantillonnai soit très a) Selon ces informations, à quel examen
proche de la médiane. Jean s’est-il le plus démarqué du groupe ?
d) L’écart-type peut prendre des valeurs b) Si la moyenne du groupe était de 70 à
positives, négatives ou être nul. chacun des examens (sans que rien d’autre
e) La moyenne, la médiane et l’écart-type ne change dans le tableau ci-dessus), votre
ont les mêmes unités de mesure. réponse en a) changerait-elle ?
f ) Si la variance d’un échantillon est nulle, c) Si l’écart-type des notes était de 10 à
c’est que toutes les observations sont chacun des examens (sans que rien d’autre
égales. ne change dans le tableau ci-dessus),
votre réponse en a) changerait-elle ?
g) La moyenne est plus sensible aux
valeurs extrêmes que la médiane. 7.14 Un embouteilleur de boissons non alcoo
lisées étudie la résistance à la pression
7.11 Déterminez le type de variable dont il est
question dans chacun des cas ci-dessous. interne des bouteilles en verre de 1 litre
non consignées. Il teste un échantillon
a) La distance entre deux villes aléatoire de 16 bouteilles. Le graphique de
b) La variété d’un érable probabilité pour la loi normale (graphique
c) L’accélération d’un véhicule sur 100 m quantile-quantile) associé à ces données
d) Le nombre de commandes reçues en une se trouve à la page suivante. Semble-t-il
heure raisonnable de conclure que la résistance
e) Le sexe d’un individu à la pression est normalement distribuée ?
CHAPITRE 7
Classe Fréquence
10 < x < 20 121
20 < x < 30 165
30 < x < 40 184
40 < x < 50 173
£ Ii ^
j * f. - î i .
La manière de prélever un échantillon influe souvent sur les conclusions qu’on peut formu
ler au sujet de la population. Une méthode fréquemment utilisée pour prélever un échantillon
est l’échantillonnage aléatoire simple, où n unités sont pigées au hasard avec la même pro
babilité de sélection. Chaque échantillon a la même probabilité d’être tiré. Il existe plusieurs
autres méthodes permettant de tirer un échantillon aléatoire afin qu’il soit plus représenta
tif de certaines caractéristiques de la population, soit pour en m inim iser le coût ou l’erreur
d’échantillonnage. On peut penser à l’échantillonnage stratifié (où on divise la population en
groupes homogènes avant de prendre aléatoirement un échantillon dans chacun d’eux) ou à
l’échantillonnage par grappes (où on sélectionne des groupes d’individus appelés «grappes»).
Ces méthodes ne seront pas abordées ici. La plupart des procédés statistiques décrits dans cet
ouvrage supposent que l’échantillon est aléatoire simple.
Si on dispose d’une liste des individus ou des unités de la population, on peut obtenir
un échantillon aléatoire simple à l’aide d’une table de nombres aléatoires. Celle-ci permet de
déterminer objectivement les individus (ou unités) qui seront sélectionnés dans l’échantillon.
Un générateur de nombres aléatoires est un programme informatique qui perm et d’effectuer le
même travail de façon plus automatique.
Les échantillons aléatoires et les distributions échantillonnâtes
m
v
^
4, W
•» ”
f ''
f - ■
’ «r «
. ' • „
.1 m f *J
• ” b
1
' k . • “ / • æ ,
p .
Exemple 8.1
j » ( v ^ 4 ^ v • f »■ <* y . * ” * 7 « fc , #
Soit 25 lots de matière première dont on veut tirer un échantillon aléatoire de 5 lots. On peut ici numé
roter ces lots de 1 à 25 et utiliser la table IX présentée en annexe. La façon de procéder consiste à lire 3a
table de haut en bas et de gauche à droite, à partir d’une colonne et d’une ligne choisies arbitrairement.
Dans notre exemple, on relève deux chiffres à la fois jusqu’à ce qu’on obtienne cinq nombres accep
tables (c’est-à-dire compris entre 1 et 25).
Supposez, par exemple, que dans la table IX, on commence à la première colonne et à la sixième liane. En
gardant les deux derniers chiffres de chaque nombre, on aurait : 21,62,01,79,75, * 53,29,65,19,85,68,
11, etc. Les nombres en gras désignent les lots de matière première qui formeru»*» férùanml-m aléatoire.
Statistique
On appelle «statistique» toute fonction des observations d'un échantillon aléatoire qui n'est
dépendante de paramètres inconnus.
Si Xv X2, ...,X n représentent les valeurs prises par la variable aléatoire X à l’intérieur d’un
échantillon aléatoire de taille n,les quantités X et S2, définies au chapitre 7 par l
et 7.4, constituent ainsi des statistiques. Il en va de même pour la médiane, le mode, l’étendue,
le coefficient d’asymétrie et le coefficient d’aplatissement de l’échantillon. (On utilisera ici des
lettres majuscules comme symboles parce qu’on se réfère à des variables aléatoires et non à des
valeurs numériques particulières, comme c’était le cas au chapitre 7. Les valeurs numériques,
quant à elles, seront présentées en lettres minuscules.)
Les statistiques occupent une place importante dans le processus qui consiste à tirer des
conclusions au sujet d’une population à partir de données d’échantillon. En outre, les méthodes
utilisées nécessitent la compréhension du comportement probabiliste de certaines statistiques.
On appelle en général «distribution échantillonnale» la distribution de probabilité d’une sta
tistique. Plusieurs distributions échantillonnâtes, qui sont définies et présentées brièvement à
l’aide d’exemples dans ce chapitre, joueront un rôle clé dans les chapitres subséquents. Nous
allons d’abord fournir quelques définitions pertinentes et d’autres éléments expliquant l’impor
tance de ces distributions.
Distribution échantillonnale
La distribution échantillonnale d'une statistique correspond à la fonction de densité ou de masse qui
décrit le comportement probabiliste de cette statistique lorsqu’on procède à des tirages répétés à partir
d’une même population.
La forme d’une distribution échantillonnale varie selon les hypothèses formulées quant à la
distribution des valeurs de la variable d’intérêt. Rappelons que le prélèvement d’un échantillon
aléatoire de taille n associé à une variable notée X fournit les résultats Xv X2, ..., Xn, lesquels consti
tuent des variables aléatoires mutuellement indépendantes ayant chacune la même distribution.
CHAPITRE 8
La distribution échantillonnais de K
Considérons par exemple la statistique X , la moyenne éch an tillo n n ai, qui consiste en
une combinaison linéaire de n variables indépendantes. Or, on sait que si E{X) = fi et que
V(X) = CT2, alors E(X) = net V(X) = c J 2/A
n.
alors X ~ N(jU, a 2/n), ce qui correspond à la distribution éch an tillo n n ai de X pour n > 1.
Si le modèle qui détermine les valeurs prises par la variable X diffère du modèle normal
(s’il est par exemple exponentiel ou uniforme), il est possible que le théorèm e central limite
puisse s’appliquer et qu’il soit raisonnable d’affirmer que la moyenne suit approximativement
une loi normale lorsque n est suffisamment grand.
Erreur-type
L’erreur-type d’une statistique correspond à l’écart-type associé à sa distribution échantillonnale. Si
certains des paramètres en cause ont une valeur inconnue, on utilise l’estimateur pour déterminer une
erreur-type estimée.
Si, ne connaissant pas l’écart-type g , on lui substitue l’écart-type s de l’échantillon dans l’équa
tion précédente, on obtient alors l’erreur-type estimée de X, soit
Exemple 8.2
On recueille des données sur la résistance en traction d’un mortier de ciment de Portland modifié.
Voici les 10 valeurs observées en kilogrammes-force par centimètre carré (kgf/cm2) :
16,85; 16,40; 17,21 ; 16,35; 16,52; 17,04; 16,96; 17,15; 16,59; 16,57
On suppose ici que la loi normale décrit bien la résistance en traction du mortier. La moyenne de
l’échantillon est de
x = 16,76 kgf/cm2.
Si l’on sait (ou si l’on suppose) que la résistance en traction présente un écart-type de = 0,25 kgf/cm2,
alors l’erreur-type de la moyenne de l’échantillon correspond à
a/yfn = 0,25/VÏÔ = 0,079 kgf/cm2.
Si l’on ne peut pas supposer que <r = 0,25 kgf/cm2, on peut utiliser l’écart-type de l’échantillon, soit
s = 0,316 kgf/cm2, pour déterminer l’erreur-type estimée, ce qui donne
s/yfn = 0,316/VÏÔ = 0,100 kgf/cm2.
Les échantillons aléatoires et les distributions échantillonnâtes
s
e
1 8.3
Pour mieux comprendre le concept de distribution échantillonnale de X, considérons une variable X,
par exemple la vitesse des véhicules à un endroit précis sur une route de campagne. Supposons que la loi
de probabilité de X est la loi normale de moyenne p - 9 5 km/h et d
on peut dire que si on mesure la vitesse individuelle d’un très grand nombre de voitures choisies aléa
toirement à cet endroit, qu’on note chacune d’elles dans la colonne d’une feuille de calcul (par exemple
dans le tableur Excel), alors l’histogramme de ces observations aura approximativement la forme d’une
cloche normale centrée à 95 km/h, avec des points d’inflexion à 85 et à 105 km/h (voir la figure 8.1).
Supposons maintenant qu’au lieu de noter la vitesse d’une seule voiture à la fois dans le tableur,
on inscrit à chaque ligne la vitesse moyenne de quatre voitures choisies au hasard, et qu’on répète
cette opération un très grand nombre de fois. On obtient alors une colonne île chiffres représentant
plusieurs moyennes de quatre observations. L’histogramme de ces valeurs aura aussi une allure de
courbe normale centrée à 95 km/h, mais avec une erreur-type o N 'n = ! O/V’4 = 5 km/h. Les points
d’inflexion seront donc situés à 90 et à 100 km/h {voir la figure 8.2).
Il est normal que la variabilité soit réduite quand on considère des moyennes plutôt que des observa
tions individuelles. Une moyenne, même basée sur seulement 4 observations, a plus de chances d’être
proche de p qu’une seule observation choisie au hasard. Dans le même ordre d’idées, si on notait des
moyennes basées sur 25 observations plutôt que 4, la variabilité de X serait encore plus faible (l’erreur-
type serait alors égale à cr/Vn = 2 km/h), et les points d’inflexion de la courbe normale seraient situés
à 93 et à 97 km/h (voir la figure 8.3, à la page suivante).
Densité
/
/
.•
4
►
*
»
»
I
m_ jjn . * !
t V , U< * à f # ] S : \ tf * , L . y*-
——
» L * 1 BT A M . f 4% X
• F | / F • \ ^ J « '
\ r J : 1 j j? ... F ^ | * —_ F / y 1. ■, ^ _ y * J ®* f — * *■ '• . . / • ▲ , ' . J A ^ p ■ 1 ^~ pL ■ ' ^ J . * B
■ — * , L 4 V h •5 Vf C ▼ , ^ 1 , ♦ V .F F
B X . 1 .
r M
’ É » '
Soit Z,, Z2, ..., Zk des variables aléatoires indépendantes et normalement distribuées avec une
moyenne /z = 0 et une variance <r2 = 1. La variable aléatoire
2 2
U = Z2+ Z$ + ■■■+ z k
obéit alors à une loi du khi-carré avec k degrés de liberté, notée et sa fonction de densité est
1 (*/2)-l -«/2 si u > 0,
2 */2p' k
/(«) ( 8 . 1)
2
0 sinon.
La figure 8.4 montre la courbe associée à la fonction de densité de la loi du khi-carré avec
différents degrés de liberté. Soulignons que toute variable khi-carré est non négative et que sa
fonction de densité se traduit par une courbe asymétrique s’étirant sur la droite. Toutefois, plus
la valeur de k augmente, plus cette courbe devient symétrique. De plus, lorsque k —> °o la loi du
khi-carré se confond avec la loi normale de moyenne k et de variance 2k.
L es éch an tillo n s a léa to ire s e t les d istrib u tio n s é c h a n tillo n n a is
P ( V > x l . k) = ( , f ( u ) d u = oc.
J Xct\ k
0 y2 u
^or,k
Exemple 8.4
Par exemple, la densité du khi-carré à 10 degrés de liberté a une espérance de 10 et un écart-type <
>/2xlO = 4,472. En se basant sur la table 111, on peut déduire que
En d’autres termes, le 95e centile d’une loi du kbi-carté avec 10 degrés de liberté est x o.os,\o ” ^
CHAPITRE 8
Soit t/j, U2, ..., Up,des variables indépendantes suivant une loi du khi-carré ayant respectiv
kv k2, ...,k degrés de liberté. La variable
Y —U| -b U2+" • Up
obéit alors à une loi du khi-carré avec k degrés de liberté, où
k = k\+
Démonstration I
On peut présenter chaque variable U.sous la forme d’une somme des carrés d
centrées réduites, d’où
Par conséquent,
et, toutes les variables aléatoires Zi}étant indépendantes parce que les variables U le sont, la variable
Y correspond tout simplement à la somme des carrés de variables normales centrées réduites indé
pendantes. Or, selon le théorème 8.1, il s’ensuit que la variable Y obéit à une loi du khi-carré avec
k degrés de liberté.
On utilisera fréquemment cette variable aléatoire aux chapitres 9 et 10, car le fait qu’elle obéit
à une loi du khi-carré permet d’y recourir pour faire des estimations par intervalle de confiance
et pour effectuer des tests d’hypothèses au sujet de la variance d’une population normale.
Exemple 8.5
Considérons à nouveau la variable X représentant la vitesse des voitures sur une route de campagne
(voir l'exemple 8.3), où X ~ N(95, 100). Supposons qu’on échantillonne aléatoirement quatre voitures. ►
Les échantillons aléatoires et <es hismouttons échenrwonnaies
On calcule la variance échantillonnai de ces quatre observations (notée s2), nuis on inscrit la valeur
(n- l)s2 i
de —= -j^-Qdans une colonne d’un tableur. Ensuite, on répète cette opération un très grand nombre
2
de fois. L’histogramme de toutes les valeurs observées de aura alors l’allure d’une courbe du khi-
deux à 3 degrés de liberté, avec une moyenne de 3 et une variance de 6.
Si on répète la même expérience aléatoire avec 25 observations chaque fois au lieu de 4, Histogramme
des valeurs de — aura l’allure d’une courbe du khi-deux à 24 degrés de iiberté, avec une
moyenne de 24 et une variance de 48.
Soit Z une variable aléatoire suivant une loi /V(0, 1) et une variable aléatoire suivant une loi jfj. Si
ces deux variables sont indépendantes, alors la variable aléatoire
obéit à une loi de Student à k degrés de liberté, notée tk, et sa fonction de densité est
Æ r< * /2 )'[(,*/*>+il'**
Démonstration
La figure 8.6 ( voirà la page suivante) montre la fonction de densité de la loi t ave
rents degrés de liberté. La distribution obtenue ressemble à celle d’une variable normale cen
trée réduite, étant elle aussi symétrique et unimodale avec une ordonnée maximale au point où
t = 0. Elle se caractérise toutefois par des ailes plus épaisses, ce qui veut dire qu’elle comporte
une probabilité plus élevée pour les valeurs plus éloignées de la moyenne. Lorsque le nombre de
degrés de liberté k tend vers l’infini, la loi t se confond avec la loi normale centrée réduite. Pour
se représenter la fonction de densité d’une loi tyil peut être bon de savoir que son ordonnée au
CHAPITRE 8
point t = 0 est environ quatre à cinq fois supérieure à son ordonnée au point correspondant au
5e ou au 95e centile. Le rapport entre ces deux valeurs est en fait de 4,8 si la loi t a 10 degrés
de liberté, de 4,3 si elle en a 20 et de 4,1 si elle en a 30. À titre comparatif, le rapport s’établit
à 3,9 dans le cas d’une loi normale.
✓
/ / ----------------------- ------- - ................................... — ............ .. ................................. .......................... ................................................ ............. .....................................................................................................................................................................................................................................................— --------------------------------------------------------------------------------------------- *-------------- '---------------------------------------- -------------------------------------------------------------- ------ --------------------------------------------------------------------------------------------------------------------------------------------- ■■ --------------------
m k
■ v . 7 ^ J j r
La fonction de densité de la loi t avec différents degrés de liberté
Ce quantile est représenté graphiquement à la figure 8.7. Comme on a ici une distribution
symétrique par rapport à la moyenne, t_ = —ta. Il s’agit l
table IV ne fournit que des quantiles de la partie positive de la distribution, c’est-à-dire des
valeurs de t ûf.fCpour a < 0,50. y
■ ! I» P M . a W K .0 w «<1 „ , ,1< ............................. « ■ ■ ■ " ■ ' » « » » ■ ■ ■ ■ ■ '« I l ~ '■ i I- i. r . , m - i— ............................ . « « W M » — — — .................. 1 1 » ’* * «■■■■■■»■» ........... ..................... ................................... . . » — .................................... ^ i ......................................................................................................................................................................................................................................................................................................................... .................................................... — . ■ . . . . . w . . 0- . . —..1 • « , ........................................- »l 1 ■! » ■■■— 1
^
Les échantillons aléatoires et les distributions échantillonnais
En d’autres termes, le 95e centile d’une loi t avec 10 degrés de liberté, noté toos. I0, est 1,812. Il s’ensuit
que la valeur opposée est le 5e centile et se note t09i. 10= 5:10. Cette valeur correspond à -1,812.
n - 1*
Aux chapitres 9 et 10, on utilisera la variable aléatoire définie à l’équation 8.7 pour détermi
ner des intervalles de confiance et vérifier des hypothèses en ce qui concerne la moyenne d’une
loi normale, lorsque la variance de la population est inconnue.
Exemple 8.7
Reprenons l’exemple de la variable X désignant la vitesse des voitures sur une route de campagne, où
X~ (95, 100). Si on mesure la vitesse moyenne de 25 véhicules (notée J), qu’on inscrit dans une
N
.r-95
colonne de tableur la valeur de ’tjTJn= , et qu’on répète cette opération un
de fois, l’histogramme de ces valeurs aura la forme d’une courbe normale centrée réduite, c'est-à-dire
une loi MO, 1).
Par contre, si on utilise l’écart-type échantillonnai s au lieu de l’écart-type théorique <7, qu’on inscrit
x —u x —95
dans une colonne de tableur la valeur de j^ =
nombre de fois, l’histogramme de ces valeurs aura la forme d’une loi de Student à - 1 = 24 degrés de
liberté, c’est-à-dire une cloche centrée à 0, mais un peu plus évasée que celle de la loi MO, 1).
CHAPITRE 8
degrés de liberté. * %
Le rapport
Wht
F
Yh
U + V \ I U r u/2
(u/ 2)
r f
- I
2 v
/*(/) -i(// +v)/2 o < /< ( 8 . 8)
(v \ u .
r r - f +1
v2y (2 J _V
—
* /
Démonstration
^ \ i ' ' / . . . . . . • . - .
' 2 , ' -> ' -■ » J> » * . .1 x * * J . t •
La figure 8.8 montre la courbe associée à la fonction de densité de la loi F pour différents
degrés de liberté. Toute variable suivant une loi F est non négative. Sa fonction de densité se
traduit par une courbe asymétrique s’étirant sur la droite. Cette courbe ressemble beaucoup à
celle de la fonction de densité d’une variable suivant une loi du khi-carré (voir la figure 8.4),
mais son espérance est toujours légèrement supérieure à 1. . —
Notons que si on élève au carré une variable aléatoire X suivant une loi alors la nouvelle
« • * ' ■ * . . * ' * •
variable X2 suivra une loi Ft .. Voici le raisonnement derrière cette affirmation. Si X suit une
loi de Student, on peut la définir comme au théorème 8.3, c’est-à-dire en utilisant une variable
' . • ‘ * " ' • * '
V suivant une loi du khi-carré à k degrés de liberté, et une variable Z suivant une loi N (0, 1) :
«. # *
Z
X tk
* ~ -,
V râ
- J
2
En se rappelant que si Z ~ N(0, 1), alors Z2 ~ x\-> on obtient que
2
2 Z71
X
v • •
k
VTk
Les échantillons aléatoires et les distributions échantillonnâtes
quantile d’ordre 1 —oc de la loi F avec u et v degrés de liberté, soit la valeur pour laquelle la
probabilité que la variable F soit supérieure à ce quantile est
P(F S j* h (f)d f = a .
~ ' a ; u, v
Fi - a.*., = T r — ■ (8-9)
* a; v, u
Exemple 8.8
Si u = 5 et v = 10, par exemple, il ressort de la table V que
P(F > F0.0S;5j0) = P(F > 3,33) = 0,05. >
CHAPITRE 8
F«i-i,/i2-i • ( 8.10)
Cet état de choses s’explique par le fait que (nx - \ ) S 2/ g 2 ~ x î ,_i> tandis que
(n2 - Ï)S2I g 2 ~ XÎ2-i> et Par Ie théorème 8.4. La variable aléatoire définie par l’équation 8.10
jouera un rôle clé aux chapitres 9 et 10, dans les problèmes liés à l’estimation par intervalle de
confiance et aux tests d’hypothèses en ce qui concerne la variance de deux populations nor
males indépendantes.
Normale
centrée réduite N(0, 1) 0 1 ^a N ( 0,1)
G/ yfn
Khi-carré avec
k, 2k,
k degrés de xî x l.t
(k > 0) (k > 0)
liberté
Student avec
0,
k degrés de h k - 2’ ^a\ k n-l
liberté ! (* > d S/yfn
! (k > 2)
Fisher avec u V 1 2 v 2(u + v —2)
et v degrés de v -2 ’ m(v - 2)2(v - 4 ) ’
Si l o i F
K ,v Fa;u,v x «i-l,rt9-
liberté (v > 2) (v > 4)
* ^(Variable > Quantile) = a
** Basé sur des échantillons provenant d’une distribution N(ju, G2)
2
Si X F , alors MX F\\ U* Si X ~ tk, alors X fr, k •
Les échantillons aléatoires et les distributions échantillonnais
rcic
8.1 Soit une population de blocs d’alimentation distribution échantillonnai de la variable
pour micro-ordinateurs dont la tension aléatoire
de sortie obéit à une loi normale avec une
moyenne de 5,00 volts et un écart-type de X ,-X 2 - ( / q - ^ 2)
0,10 volt. On choisit au hasard huit de ces yl(<jf/nx) +(cr;/n2)
blocs d’alimentation.
8.4 Un fabricant de puces semi-conductrices
a) Indiquez à quelle loi X obéit.
en choisit 100 au hasard dans sa production
b ) Quelle est l’erreur-type de X ?
afin de vérifier si eiîes sont défectueuses
c) Imaginez qu’on ne connaît pas ou non. Qn p o s e ici X = 0 lorsque la Même
l’écart-type de la population. Dans puce vérifiée est non défectueuse, et X, = 1
ce cas, comment pourrait-on estimer lorsqu’elle est défectueuse. La proportion
l’erreur-type calculée en b) ? échantillonnai de puces défectueuses est
8.2 Un agent d’approvisionnement achète alors définie par
25 composants du fournisseur 1, et 30 du X j + X 2 +*’ *+ X 100
fournisseur 2. On suppose que les valeurs 100
X, ,, X,2, ..., X, 25 de la résistance électrique
des composants obtenus du fournisseur 1 a) Quelle est la distribution échantillonnai
sont indépendantes et obéissent à une loi approximative de p?
normale avec une moyenne de 100 ohms b) Déterminez l’erreur-type de Indiquez
et un écart-type de 1,5 ohm. De même, on ensuite son erreur-type estimée.
suppose que les valeurs X2 ,, X2 2, ..., X2 30
de la résistance électrique des composants 8.5 Déterminez si les énoncés suivants sont
obtenus du fournisseur 2 sont indépen vrais ou faux.
dantes et obéissent à une loi normale avec a) Si X,, X2, ..., XJ0constituent un échan
une moyenne de 105 ohms et un écart-type tillon aléatoire simple issu d’une dis
de 2,0 ohms. tribution /'/(100, 36), alors la moyenne
a) Quelle est la distribution échantillonnai échantillonnai de ces 10 valeurs suit
de X ,-X 2? une loi /V(100, 36).
b) Quelle est l’erreur-type de X, - X2? b) Si X,, X2, ..., X)0constituent un échantil
c) S’il était impossible de supposer que lon aléatoire simple issu d’une distribu
la résistance électrique obéit à une loi tion N(10, 3), alors la variable 3S2 a une
normale, que pourrait-on affirmer au espérance de 9 et une variance de 18.
sujet de la distribution échantillonnai c) Dans un contexte d’échantillonnage
de X ,-X 2? aléatoire simple, la variabilité d**. ia
d) Quelle est la distribution échantillonnai moyenne échantillonnai diminue
lorsque la taille d’échantillon augmente.
de la statistique 7
n si/4,00 d) Si K~ ts, alors P(Y> 2) = P(Y< -2).
e) Quelle est l’espérance de la statistique eî Si ^ ~ X 2,alors/,(W>4) = P (^ < 4 ).
dont il est question en d) ? f) Lorsqu’on pari d’erreur-type de la
8.3 Soit deux échantillons aléatoires indépen moyenne, on fait référence à l’écart-type
dants, l’un de taille n,, tiré d’une population deX.
normale de moyenne fixet de variance cr2, 9 ) Le pH d’une certaine rivière suit une
et l’autre de taille n2, tiré d’une population loi normale de moyenne 6,7 et de va
normale de moyenne et de variance cr2. riance 1 . On prend des mesures de pH
Sachant que X, et X2 représentent ici les sur 25 échantillons d’eau pris à des
moyennes d’échantillon, déterminez la endroits différents le long de cette
240 CHAPITRE 8
tiques choisis au hasard. Associez les situa 8.9 À l’aide de la table IV de l’annexe, déter
tions proposées dans la colonne de gauche minez chaque valeur ci-dessous. Tracez
avec les bonnes valeurs de et dans la une esquisse de la fonction de densité au
colonne de droite. préalable pour estimer la valeur cherchée
a) n =: 100, D a ==77,8 a) *0,25; 10
P(a <X <b) = 0,90 b ==124,5 b) *0,25;20
b) n ==25, 2) a -=-1,7 0 La valeur de k telle que
P(a <X <b) =0,90 b--= 1,7 P(T<k) = 0,95, où tw
c) n ==100, 3) a -= 128,4 d) La valeur de k telle que
P(a <S2 < 0,90 b == 131,6 P(T <k) = 0,025, où T~ tl0
d) n ==25, 4) a = 126,7 e) P(T> 1,311), où F~ t29
Ÿ-130 b■ = 133,3 f) P(T > -2,660), où T ~ t
a< <b 0,90
5/5 8.10 À l’aide de la table V de l’annexe, déter
minez chaque valeur ci-dessous. Tracez
8.7 Un employeur cherche à connaître la satis une esquisse de la fonction de densité au
faction moyenne de ses 1000 employés à préalable pour estimer la valeur cherchée
l’égard de leur travail. Il considère les scé F
a) 1 0,25; 4, 9
narios ci-dessous pour sonder ses employés.
Déterminez s’il s’agit d’un échantillon aléa b) F
1 0,05; 15, 10
toire simple ou non. c) 1F0,95 ; 6, 8
a) Envoyer lui-même un message à tous d) 1F0,90; 12,24
les employés demandant à ceux qui le e) La valeur de k telle que
souhaitent de répondre au sondage. P(F> k) = 0,10, où F ~ F10,5
b) Piger au hasard les noms de 50 employés, f) La valeur de k telle que
et les obliger à répondre au sondage le P(F <k) = 0,10, où F ~ F 10,5
plus honnêtement possible. 9) P(F < 8,65), où F - F2 ,8
c) Piger 4 départements au hasard parmi h) P(F > 0,0254), où F ~
les 25 départements, et exiger que
tous les employés de ces départements 8.11 Soit F, _a , le quantile d’ordre a de la
répondent au sondage. loi F v» tel que 0 < a < 1. Démontrez
u,
1
d) Puisque l’entreprise compte 60 % qUe^.-a;„, Fa\V. u
d’hommes, choisir au hasard
30 hommes et 20 femmes parmi les 8.12 On s’intéresse au poids des boîtes de spa
employés, et exiger qu’ils répondent ghetti d’une certaine compagnie, dont l’éti
au sondage. quette affiche 500 grammes. On tient pour
acquis que le poids d’une boîte suit une loi
8.8 À l’aide de la table III de l’annexe, déter normale avec une moyenne de 510 grammes
minez chaque valeur ci-après. Tracez une et un écart-type de 7 grammes.
Les échantillons aléatoires et les distributions échantillonnais
a) On répète 10 000 fois les trois opéra aient une moyenne d’environ
tions suivantes : __________ et un écart-type
• choisir une boîte au hasard dans la d’environ__________
production ; d) On répète 10 000 fois les trois opéra
• mesurer son poids ; tions suivantes :
• inscrire cette mesure dans un tableur • choisir 25 boîtes au hasard dans la
(tel Excel), dans une colonne intitulée production ;
« Poids ». • mesurer le poids de chacune d’elles,
Ainsi, on s’attend à ce que les évaluer la variance des 25 mesures
10 000 entrées de la colonne «Poids» et calculer la quantité h
aient une moyenne d’environ inscrire cette valeur dans un tableur,
__________ et un écart-type dans la colonne « Valeur u ».
d’environ__________ Ainsi, on s'attend à ce que les
b) On répète 10 000 fois les trois opéra 10 000 entrées de la colonne « Valeur u »
tions suivantes : aient une moyenne d’environ
• choisir 25 boîtes au hasard dans __________ et un écart-type
la production ; d’environ__________
• mesurer le poids de chacune 8.13 Soit deux échantillons indépendants prove
d’elles et calculer la moyenne des nant de populations normales, tels que :
25 mesures ;
X„X2,...,X 10~ W , a 2)
• inscrire cette valeur moyenne dans
un tableur, dans la colonne « Poids r„y2, ...,y20~v(8, a2).
moyen ». a) Quelle est la loi de X, + X, + X3?
Ainsi, on s’attend à ce que les b) Quelle est la loi de X ?
10 000 entrées de la colonne « Poids c) Quelle est la loi de 2X - 3K ?
moyen » aient une moyenne d’environ
__________ et un écart-type d) Quelle est la loi de xr 7 ?
d’environ__________ Quelle 15 V
c) On répète 10 000 fois les trois opéra f) Quelles sont l’espérance et la variance
tions suivantes : y- 8
de W Sy/JÏÔ 9'
• choisir 25 boîtes au hasard dans la
production ; g) Quelles sont l’espérance et la variance
• mesurer le poids de chacune d’elles, de T a2
évaluer la moyenne et la variance des h) Quelle est la loi de / 2?
25 mesures et calculer la quantité 8.14 Soit X„l X,,2 ..., X,t16 un échantillon aléatoire
_ 3c-5 1 0 d’une variable X de loi normale V(l0, 4).
~ 5/V25 ’ Calculez les probabilités suivantes:
• inscrire cette valeur dans un tableur, a) P(X, < 11)
dans la colonne «Valeur t». b) P(X< 11)
Ainsi, on s’attend à ce que les c) P(|X - 10| < 2 • S)
10 000 entrées de la colonne « Valeur » d) P(S2 > 2,28)
"inférence statistique se définit comme un raisonnement à l’aide duquel on
tire, à partir de renseignements fournis par les données d’un échantillon, des
/
- conclusions au sujet d’une population. Elle comporte deux grandes parties :
l’estimation de paramètres et les tests d’hypothèses. Nous parlerons ici de î’estima-
tion de paramètres, puis nous explorerons les tests d’hypothèses au chapitre 10.
Estimateur ponctuel
Soit Xune variable aléatoire de d e n s i t é f(x)caractérisée par le paramètre
un échantillon aléatoire de taille n des valeurs prises par X. Un estimateur ponctuel de 6 est une statis-
A
Soulignons que l’estimateur 6 est une variable aléatoire qui ne dépend pas de 0, car il s’agit
A
d’une fonction des données d’échantillon. Une fois l’échantillon obtenu, 6 prend une valeur
numérique particulière qu’on appelle la « valeur estimée de 6 » ou l’« estimation de 6 ».
Exemple 9.1
Supposons que la variable aléatoire X obéit à une loi normale de moyenne // inconnue. La moyenne
de l’échantillon X constitue alors un estimateur ponctuel du paramètre inconnu ju, soit la moyenne de
la population. En d’autres termes, fl = U
. ne fois l’échantillon obtenu, la valeur
X
une estimation ponctuelle de //. ►
0
L'estimation de paramètres
Soit x, = 2,5, x2= 3,1, jc3= 2,8 et x4= 3,0. L’estimation ponctuelle de p est alors
2,5 + 3,1 + 2,8 + 3,0
2,85.
4
De même, si l’on ne connaît pas la variance a 1 de la population, on peut utiliser la variance S2 de
l’échantillon comme estimateur ponctuel, la valeur numérique s2= 0,07, calculée à partir des données
d’échantillon, devenant alors l’estimation ou la valeur estimée de G2.
Les problèmes d’estimation sont chose courante dans le domaine du génie tout comme dans
l’ensemble de la recherche. En effet, on doit souvent estimer les paramètres suivants :
• la moyenne p d’une population ;
• la variance cr2 (ou l’écart-type a) d’une population ;
• la p r o p o r t i o n p des éléments d’une population qui appartiennent à une catégori
• la différence entre les moyennes de deux populations, soit p x- p 2;
• la différence entre les proportions dans deux populations, soit
Voici, pour chacun de ces paramètres, un estimateur ponctuel acceptable :
• un estimateur de p est p - X, soit la moyenne de l’échantillon ;
• un estimateur de a 2 est â 2= S2, soit la variance de l’échantillon ;
• un estimateur de p est p= X/n, soit la proport
le nombre d’éléments dans un échantillon aléatoire de taille n qui appartiennent à la
catégorie à l’étude ;
• un estimateur de p^ - p^est p x- /q = X, - X2, soit la d
deux échantillons aléatoires indépendants ou appariés ;
• un estimateur de p x- p 2 est p, - p2, soit la différence entre les proportions établies à
partir de deux échantillons aléatoires indépendants.
Un même paramètre peut compter plusieurs estimateurs ponctuels possibles. Dans le cas
de la moyenne d’une variable aléatoire, on pourrait ainsi envisager comme estimateur ponctuel
la moyenne d’un échantillon, sa médiane ou même la moyenne de la plus petite et de la plus
grande valeur observées dans l’échantillon. Afin de déterminer lequel des estimateurs ponc
tuels d’un paramètre donné convient le mieux, il faut en examiner les propriétés statistiques et
fixer certains critères de comparaison.
manière formelle, 0 constitue un estimateur sans biais (ou non biaisé) du paramètre ô lorsque
E(0) = 0. (9.1)
A
En d’autres termes, B se révèle un estimateur sans biais de 6 si les valeurs qu’il prend sont
en moyenne égales à 6, ce qui revient à exiger que la moyenne de la distribution échantillonnale
/ S
de B soit égale à B.
Exemple 9.2
Soit X une variable aléatoire de moyenne fi et de variance G2, ainsi que X,,X2, Xn un échantiJJor
aléatoire de taille n des valeurs prises par X. Démontrons que la moyenne X de l'échantillon est un
estimateur sans biais de fi.
Sachant que
n
X *. 1 n
i=l
E( X) X E ( X . >
n «M l
1^
E( X) M
” 1=1
n
2
y (x, - x )
E (S2) i=l
n —1
n
1 2
eY (x, - x )
Tl — 1 i=l
n
1
e £ (X? + X 2 - 2 X X i )
n —1 i= l
n
1 2
e y xf nX
n —1 i =l
n
1
Y E ( X ? ) - n E ( X 2) .
n —1 i=l
E ( S 2) = —M ^ ( p 2 + G 2) - n ( p 2 +cr 2/n)
• *
1
(n jl2 + n G 2 - n fl2 - G 2)
n — î
G 2.
Par contre, on peut montrer que l’écart-type S de l’échantillon s’avère un estimateur biaisé de l’écart-
type a de la population, bien que le biais ou l’erreur systématique en cause soit négligeable lorsque
l’échantillon est de grande taille.
% |L
f
I
'
EQM(0 H- fj1
IU /
(9.2)
On peut en réécrire la formule comine suit :
/ — V(0) Ri ni
I l 1ci I (9.3)
A
Efficacité relative
A A
Soit ôxet d2, deux estimateurs du paramètre Payant respectivement une erreur quadratique moyenne
A * A ^ A
EQM(d.) et EQM{6^). L’efficacité relative de 6 , par rapport à 6-, est définie par
t )
EOMidO
A
Si l’efficacité relative est inférieure à 1, on conclura que 6 Xest un estimateur plus efficace
A
de 0 que 6V, en ce sens qu’il présente une plus petite erreur quadratique moyenne.
Exemple 9.3
Supposons qu’on désire estimer la moyenne fl d’une population dont on a tiré un échantillon aléatoire
U,
moyenne X de l’échantillon et une seule observation, ici notée Xn provenant de cet échantillon. Comme
quadratique
variance. On a ainsi )= variance
EQM(X) = V(X,) EQM de X est inférieure à YEQM
observadon
En ce qui concerne l’efficacité relative de X, par rapport à X, on peut écrire que
EQM(X) o 2ln 1
2
EQM(XJ a n
Le fait que (1/n) < 1 pour tout échantillon de taille n>2 favorise X.
On souhaitera donc trouver, parmi les estimateurs sans biais d’un paramètre, celui dont
la variance est la plus faible. Il s’agit là de son estimateur sans biais de variance minimale, La
figure 9.1 (voir à la page suivante) illustre la distribution de probabilité de deux estimateurs
CHAPITRE 9
A A
de probabilité d’un estimateur biaisé 0 Xet celle d’un estimateur sans biais 02. Sa variance étant
A
moindre, 0 Xest plus susceptible de fournir une valeur estimée proche de la vraie valeur de 0.
e
La distribution de deux estimateurs sans biais, et 02. On voit que 9 1a une
variance inférieure à celle de 02.
L'estimateur biaisé Ôx a une plus faible variance que l'estimateur non biaisé 02-
La convergence
A
estimateur
si, pour 0,
lim P(\ên -|< =1 (9.4)
n
L'estimation de paramètres
La convergence est une propriété associée aux grands échantillons puisqu’elle décrit le
comportement limite de l’estimateur 0 lorsque la taille de l’échantillon tend vers l’infini. Il
est en général difficile de démontrer par l’équation 9.4 qu’un estimateur est convergent. Sont
convergents les estimateurs dont l’erreur quadratique moyenne tend vers zéro lorsque la taille
de l’échantillon approche de l’infini. On peut ainsi dire que X est un estimateur convergent de
la moyenne d’une population normale, car lim EQM(X) = lim (a 2ln) - 0.
n — > « r — > o o
Y
9.1.2 La méthode du maximum d vr
La méthode du maximum de vraisemblance compte parmi les m eilleures méthodes d’estima
tion ponctuelle.
Fonction de vraisemblance
Soit une variable aléatoire X dont la distribution de nro
seul paramètre inconnu. Si l’on note jc,, x2,• »X • « e s
On devra bien sûr vérifier que la dérivée seconde est négative pour garantir qu’on a bien
trouvé un maximum. On exprime finalement 6 comme une fonction de l’échantillon X,,X X,,
_
___ A Ji
...,
Xn. En général, 6 est une variable aléatoire qui a une distribution échantillonnaîe dont on peut
étudier les caractéristiques.
Exemple 9.4
Soit X une variable de Bernoulli ayant la fonction de masse
six = 0 ou 1,
P{X = x) = <
sinon,
W
►
CHAPITRE 9
On peut voir que si L(p) atteint son maximum pour une valeur p , il en va de même û
ln L(p), puisqu’il s’agit d’une fonction monotone croissante. Par conséquent,
On a ainsi
dlnL (p)
dp
un résultat intuitivem ent ju g é acceptable, car il s ’agit de la proportion de succès dans 1’échantillon qui
estim era la probabilité de succès théorique p. Il reste à vérifier que la dérivée seconde est négative . Et
c ’est bien le cas ici.
é
Exemple 9.5
Soit une variable X distribuée selon une loi normale de et de variance cr2 co n n u e
La fonction de vraisemblance d ’un échantillon de taille n se traduit ici par
n 1 - ( x , - /J) 2/2 cr 2
l (m ) = T 1 crJZn: e
n
- 0 / 2 ( 7 2) X (X, - M )
i 1= 1
2 n/2
e
(2 tto ) \
On aura donc
n
n 1
ln L(p) ln(27rcr 2) £ i- p )
(X
2 1=1
et
n
dlnL(p) 1 V (x. - p ) .
d/u CJ i=î
X
c o m m e estim ateur du m ax im u m de vraisem blance de ju. Encore une fois , le résu ltat nous a p p a ra ît
sensé, puisque la m oyenne é c h a n tillo n n a i sert d 9estim ateur à la
L'estimation de paramètres
On peut vérifier graphiquement que la vraisemblance atteint son maximum au point corres
pondant à la valeur de l’estimateur du maximum de vraisemblance. Soit un échantillon de taille
n = 10 tiré d’une population normale et formé des éléments
14,15; 21,86; 22,59; 23,70; 25,01 ; 25,19; 25,92; 26,47; 32,07; 32,30.
On sait que la variance de la population est de 4. Il a par ailleurs été démontré à l’exemple 9.5
que X constitue l’estimateur du maximum de vraisemblance de la moyenne d’une population
normale. Or, 3c = 25 selon les données fournies ici. La figure 9.3 présente graphiquement le
logarithme de la fonction de vraisemblance pour diverses valeurs de la moyenne. On y voit que
le maximum de la fonction log-vraisemblance se situe au point où u - 25.
r C lL
f T - , '; j r ' J * *
Le logarithme de la fonction de vraisemblance en fonction de la moyenne
Comme le montre l’exemple 9.6, il n’est pas toujours possible de recourir au calcul différen
tiel pour déterminer le maximum de la fonction L{6).
Exemple 9.6
Soit une variable aléatoire X uniforme sur l’intervalle [0, à\. La fonction de vraisemblance d’un échan
tillon aléatoire de taille n se traduit ici par
La courbe représentative de cette fonction ayant partout une pente non nulle, on ne peut recourir à des
méthodes de calcul pour déterminer â, l’estimateur du maximum de vraisemb
tefois que la fonction L{à) augmente à mesure que la valeur de a diminue. Il s’ensuit que cette fonction
atteint son maximum pour la plus petite valeur qu’on peut raisonnablement attribuer à a. Or, comme
la valeur de a ne peut manifestement pas être inférieure à la plus grande valeur observée au sein de
l’échantillon, c’est cette dernière qu’on attribuera à âLe paramè
maximum de vraisemblance â = max(.X, = X(n).
On peut utiliser la méthode du maximum de vraisemblance dans les cas où il faut estimer
plusieurs paramètres inconnus, ici notés 6V 02, ..., 6k. La fonction de vraisemblance est alors
une fonction de ces k paramètres inconnus 6V
A
, ..., 6k. Afin de déterminer les e
du maximum de vraisemblance {#,}, on rend égales à zéro les k dérivées partielles d’ordre 1
[9L(0,, 02, ..., 0k)ld6iy pour i = 1, 2, ..., k], et on résout le système d’équations ainsi obtenu.
CHAPITRE 9
Exemple 9.7
Soit une variable normale X dont on ne connaît ni la moyenne ni la variance cr2. Déterminons
l’estimateur du maximum de vraisemblance de fl et celui de cr2. La fonction de vraisemblance d’un
échantillon aléatoire de taille n se traduit ici par
n
L(^ ) = n - ^ w /2 *
n
-(l/2 cr2) ^ - fl)
i i=1
2 \n/2
e
{2 k g )
et
n
n 2 1 2
ln L(u, g 2) \n { ln G )
2
d\nL(fi,a2) 1 f (X|_ M) = 0i
dfl /=!
3lnL(/x,cr2) n 1 n
2
2
+ 2 > , - ao 0.
ô(cr2) 2cr
fi =- J lx, = x
n tr.
et
2
ce dernier étant étroitement lié à la variance sans biais de l’échantillon, S2, puisque â 2 = [(n —l)/n]5
reconnaît aussi une propriété d’invariance, laquelle fait en sorte que si 0 représente l’esti
mateur du maximum de vraisemblance de 6, et si u{6) est une fonction de 0 possédant une
fonction inverse à valeur unique, alors l’estimateur du maximum de vraisemblance de u{0)
A
est u{6).
L'estimation de paramètres
Moments échantillormaux
Si X., X ,, X„ forment un échantillon aléatoire de taille
t a i l l e n de y on peut définir
0
1 W r i . %
d e s iV/ oc tlC
p ii rt n n cac
U I h►aL/I ! oC N U il
\
comme suit les k premiers moments de cet échantilh n 4pk a r n A I1Xr fl ^CX 1i ovJIr 1C 1O %
I
l tA
1
l i11
l M/*%
il H ^ ^ ** /
_ _ a .
^ - A A
I 7 __ _
* — — 0 _ — — — -
M
1
m -n 2 , m (9.6)
i ~ I
Moments théoriques
Les moments {ju't} de la population sont en général des fonctions des k paramètres in
connus {#,.}.
Exemple 9.8
Soit une variable X de loi N(p, a 2), les paramètres fl et a 2étant ici inconnus. Pour trouver à chacun un
estimateur par la méthode des moments, il faut se rappeler que dans le cas de la loi normale,
p[ = EÇi) = /i,
p = E(X2) = a + pi2.
'2 2
1" J «
Les moments de l’échantillon se traduisent ici par m[ = - et = - Y X] En recourant à l’équa
tion 9.8, on obtient donc n »=i n «=i
CHAPITRE 9
Dans cet exemple, la méthode des moments donne les mêmes estimateurs de et de cr2 que la méthode
du maximum de vraisemblance.
Exemple 9.9
Soit X une variable uniforme sur l’intervalle [0, à\. On veut trouver un estimateur de a par la méthode
des moments. Or, le premier moment de la population par rapport à zéro est
La méthode des moments fournit souvent d’assez bons estimateurs. En règle générale, les
estimateurs obtenus par la méthode des moments présentent une distribution asymptotique nor
male et se révèlent convergents. Leur variance peut toutefois être plus grande que celle des esti
mateurs déterminés par d’autres méthodes comme celle du maximum de vraisemblance. Les
estimateurs fournis par la méthode des moments peuvent aussi, à l’occasion, laisser à désirer,
comme c’est le cas à l’exemple 9.9.
* w -
Dans la pratique, on ne prélève qu’un seul échantillon et on ne construit qu’un seul inter
valle de confiance. Comme cet intervalle ne renfermera pas nécessairement la vraie valeur de 9,
on ne peut raisonnablement associer une probabilité à cet intervalle particulier. On dira plutôt
qu’il est possible d’affirmer avec 100(1 - a) % de confiance que le paramètre 6 sera compris
dans l’intervalle observé [L, U]. Cet énoncé se prête à une interprétation axée sur la fréquence :
on ignore s’il se vérifie pour l’échantillon à l’étude, mais on sait que la méthode utilisée pour
établir l’intervalle [L, U] fournit un énoncé vrai dans 100(1 - a) % des cas.
La longueur de l’intervalle de confiance observé fournit une mesure importante de la qua
lité des renseignements tirés de l’échantillon. En effet, la longueur du demi-intervalle, soit 0 —L
ou U - 9, reflète la précision de l’estimateur. Plus un intervalle de confiance est long, plus on
a la certitude qu’il renferme la vraie valeur de 9. Toutefois, plus il est long, moins il fournit de
renseignements sur la vraie valeur de 9. L’idéal consiste à avoir un intervalle relativement court
et un degré de confiance élevé.
En comparant les équations 9.10 et 9.9, on découvre qu’un intervalle de confiance à 100(1 - a ) % pour
lorsque les données proviennent d’une loi normale de variance cr2 connue, se traduit par
X ± zal2<T/y/n (9.11)
ou, en d’autres termes,
L =X *‘Ctîï(j/sflî et U = X + ZaïïGlyfn.
La demi-longueur de l’intervalle, soit zanOl4n, s’appelle la «marge d’erreur de l’intervalle >>
L'estimation de paramètres
* é* . * . • _' m 1 * j ^ J / J | ' * « • .
Exemple 9.10
Un article paru dans le Journal of Heat Transfer (vol. 96, n° 1, 1974, p. 59-64) décrit une façon
de mesurer la conductivité thermique du fer Armco. Les 10 mesures de cette conductivité (en
BTU/h-pi-°F), énumérées ci-dessous, ont été obtenues à une température de 100 °F avec une puis
sance fournie de 550 W.
41,48 ; 41,60 ; 41,72 ; 41,81 ; 41,86 ; 41,95 ; 42,04 ; 42,18 ; 42,26 ; 42,34.
On veut établir un intervalle de confiance à 95% pour la conductivité thermique moyenne du fer
Armco dans ces conditions, sachant que la moyenne de l’échantillon est de 41,924 BTU/h-pi-°F
et en supposant que l’écart-type de la population (a) est de 0,10 BTU/h-pi-°F. Si l’on suppose que
la conductivité thermique obéit à une loi normale, on peut utiliser l’équation 9.11 pour définir cet
intervalle.
Dans le cas d’un intervalle à 95%, 1 - «=0,95, de sorte que 0,05. Or, = z005/2 z00-,5 = 1*96
selon la table II de l’annexe. On a ainsi l’intervalle de confiance
x ± z a/2<J/Jn = 41,924 ± 1,96(0,10)/VÏÏ) = 41,924 ±0,062.
paramètre. En règle générale, pour une même taille d’échantillon n et un même écart-type <7,
plus on choisit un niveau de confiance élevé, plus l’intervalle obtenu est long.
Puisque la longueur de l’intervalle établi indique la précision de l’estimation, cette préci
sion est inversement proportionnelle au niveau de confiance. Comme on l’a déjà souligné, il est
grandement préférable d’établir un intervalle de confiance assez court pour permettre la prise
de décision tout en assurant un degré de confiance adéquat. Une façon d’y parvenir consiste
à choisir une taille d’échantillon n suffisante pour obtenir un intervalle
L =X — X U =X + Za<j/\fn
* *
Lorsqu’il est possible de choisir la taille de l’échantillon, on peut attribuer à n une valeur
permettant d’avoir confiance à 100(1 - a) % que l’erreur commise en estimant // sera inférieure
à une valeur donnée e. Il suffit d’isoler n dans l’équation
za/2cr/Vn < e,
ce qui donne
Si la valeur du membre de droite de l’équation 9.12 n’est pas un nombre entier, il faut arrondir n à
l’entier supérieur. Soulignons que l’intervalle de confiance ainsi obtenu aura une longueur de 2e.
Exemple 9.11
Reprenons ici l’exemple 9.10 et supposons qu’on veut estimer la conductivité thermique moyenne du
fer Armco en ayant confiance à 95 % que l’erreur sera inférieure à 0,05 BTU/h-pi-°F. Sachant que
cr= 0,10 et que z0025= 1,96, on peut déterminer la taille requise de l’échantillon en posant
<0,05,
ce qui donne
obéit à une loi t avec n - 1 degrés de liberté. Voyons maintenant comment établir un intervalle
de confiance pour p.
La figure 9.7 {voir à la page suivante) présente graphiquement la fonction de densité de
T = (X - p)/{S/yfn). Si on note ta/2.n_l le quantile d’ordre 1 - a l2 de la loi t avec n - 1 degrés
de liberté, il ressort de cette figure que
P (X ~ * X + tan,n-is / 'fn)
H
E xe m p le 9.12
Selon un article paru dans le Journal ofTesting and Evaluation (vol. 10, n° 4, 1982, p. 133-143), des
essais effectués sur des échantillons traités de vêtements de nuit pour enfants ont permis d ’obtenir les
20 mesures ci-dessous du temps de propagation des flammes (en secondes) :
9,67, 9,67, 9,74, 9,75, 9,75, j
9,77, 9,83, 9,85, 9,85, 9,87,1
9,88, 9,89, 9,92, 9,92, 9,93,1 s = 0,0954
9,93, 9,94, 9,95, 9,95, 9,99.)
On veut construire un intervalle de confiance à 95 % pour le temps de propagation moyen.
\
X ± tai2,n-lS/yfn
9.8475 ± 2,093(0,0954)A/2Ô
9.8475 ± 0,0446.
L’intervalle de confiance à 95 % pour p est, par conséquent, [9,8029 ; 9,8921].
On s’attend, avec un niveau de confiance de 95 %, que le temps de propagation moyen se situe entre
9,8029 et 9,8921 secondes. Si on répétait cette expérience un grand nombre de fois et qu’on établissait
chaque fois l’intervalle de confiance pour p à 95 % en utilisant cette formule, environ 95 % des inter
valles contiendraient la vraie valeur de p ,e 15 % d’entre eux ne la contiendraient pas. Bien sûr, dans les
faits, on ne réalise l’expérience qu’une seule fois. On ignore donc si notre unique intervalle contient la
vraie moyenne de la population, mais on aura confiance à 95 % que c’est le cas.
Les procédés décrits ici supposent que la population échantillonnée est normale. Cela
s’avère important dans le cas des échantillons de petite taille. Heureusement, l’hypothèse de
normalité se vérifie dans nombre de situations concrètes. Lorsqu’elle ne s’applique pas, on doit
se tourner vers des intervalles de confiance non paramétriques, c’est-à-dire des méthodes qui
n’utilisent pas l’hypothèse de normalité, où l’on substitue souvent aux observations la valeur de
leur rang dans l’échantillon ordonné. (Ces méthodes ne sont pas présentées dans ce manuel.)
Cela s’explique par le fait que la longueur de l’intervalle est fonction de la valeur de S (qu’on
ne connaît pas au moment de recueillir les données) et de celle de n. En effet, la valeur de
n influe sur l’intervalle par le biais de 1/Vn et de taf2. n_l. Il faut donc fixer arbitrairement
(ou par une étude-pilote) la valeur de S et procéder par tâtonnement pour déterminer la taille
requise de l’échantillon.
En comparant les équations 9.15 et 9.9, on découvre qu’un intervalle de confiance à 100( (I ) V /
pour cr2, lorsque les données proviennent d’une loi normale, est
(n-\)S (n-\)S gU loi
< <7 < -
afl\r\ xi M
U
W i
I
r
— .
»
A
Exemple 9.13
Un fabricant de boissons gazeuses s’intéresse à l’uniformité du remplissage des canettes par une
machine. On suppose que ce volume obéit approximativement à une loi normale. Un échantillon
aléatoire de 20 canettes a donné lieu à la variance s2 = 0,0225 (once liquide)2. On veut établir un
intervalle de confiance à 95 % pour l’écart-type cr.On trouve d’abord un intervalle de confiance pour
la variance <T2 en remplaçant S2 dans l’équation 9.16 par sa valeur échantillonnale, ce qui donne
(n -l)s2 2 ^ (n -l)j2
—2------------------------
X0 ,0 2 5 ;1 9 X0 ,975; 19
c’est-à-dire
(19)0,0225 ^ 2 ^ (19)0,0225
----------------- < CT < ------------------ donc 0,013 < g 2 < 0,048.
32,85 8,91
On peut convertir cette dernière expression en un intervalle de confiance pour l’écart-type. Il suffit
d’extraire la racine carrée de chaque borne, d’où
0,114 < cr < 0,219 once liquide.
Z P~P
La quantité y]p(\ -/?)/« n’est autre que l’erreur-type de l’estimateur ponctuel p. Toute limite
de confiance fixée à partir de l’équation 9.17 renfermerait malheureusement le paramètre
L'estimation de paramètres
( 9 . 19 )
Notons que l’équation 9.19 peut engendrer un intervalle ayant une limite inférieure négative
qu’on ramène alors généralement à zéro. De même, la limite supérieure devrait être ramenée à
1 si elle dépasse cette valeur.
Exemple 9.14
i une surtace trop rugueuse
proportion p d’arbres hors
Pobs x/n 12/75 = 0,16. Afin d’établir
remplaçant p par p obs
A i Pobs(l-Pobs)
P Z 0,025
n
ou
0,16(0,84)
0,16 ±1,96
75
0,16 ± 0,08,
ce qui donne
0,08 < p<0,24.
ce qui donne
Pour a (< 0,5) et e(> 0) fixés, cette équation définit une parabole ouverte vers le bas
sommet au point p = 0,5. Afin de déterminer la valeur minimale de il faut d’abord est
Une possibilité consiste à effectuer une estimation subjective basée sur des expériences anté
rieures, par exemple. On peut aussi tirer un échantillon préliminaire, établir la valeur de p et
recourir ensuite à l’équation 9.20 pour déterminer le nombre d’observations additionnelles dont
on aura besoin afin d’estimer p avec la précision voulue.
Si on n’a aucune idée de la taille de /?, il faut savoir que la taille de l’échantillon dans
l’équation 9.20 atteint toujours son maximum pour p = 0,5 [c’est-à-dire pour p (l —p) = 0,25], et
cette valeur peut servir à fixer une limite supérieure dans le cas de En d’autres termes, on est
confiant à au moins 100(1 - a) % que l’erreur résultant de l’estimation de p par p sera inférieure
à e si la taille de l’échantillon est
(0,25).
Exemple 9.15
Soit les données de l’exemple 9.14. Quelle devrait être la taille de l’échantillon pour qu’on puisse affir
mer avec un niveau de confiance de 95 % que l’erreur commise en utilisant p dans le but d’estimer p
sera inférieure à 0,05 ? Si l’on adopte pobs= 0,16 comme valeur estimée in
révèle que la taille de l’échantillon devra être d’au moins
0,16(0,84) = 207.
Si l’on considère que l’échantillon n’a pas encore été tiré et qu’aucune valeur de p n’a été mesurée, on
utilise le pire cas de figure, c’est-à-dire la valeur de p qui donne la plus grande marge d’erreur, soit
p = 0,5. On obtiendrait alors
384,16,
ce qui signifie qu’il faudrait au moins 385 arbres pour que l’erreur d’estimation ne dépasse pas 0,05,
et ce, dans 95 % des cas.
Les procédés décrits dans la présente section reposent sur l’approximation de la loi binomiale
par la loi normale. Si la situation ne se prête pas à une telle approximation, ce qui est le cas en par
ticulier lorsque n est petit, il faut recourir à d’autres méthodes. L’une d’elles consiste à utiliser une
table de la loi binomiale. Lorsque n est grand tandis que p est petit, on peut aussi établir un inter
valle de confiance pour p en utilisant la loi de Poisson comme approximation de la loi binomiale.
L'estimation de paramètres
l. On sait que
X,,, ...,X,_ ~ N(fiv a l) et que X2l, ..., X2n, ~ a l).
2. Cela implique que
a 2 ’
N a;2 \
N l et que X2 N
*i ni J n2 J
3 Puisque Xj - X2est une combinaison linéaire de variables aléatoires normales, il s’agit
également d’une variable aléatoire normale, et donc
a 2 a 2 \
x,-x2 N l + 2
nî n2 )
4 Par standardisation, on obtient que la variable aléatoire
X 2) th )
Z
N
(X, - X 2)-(ju Mi)
P z al2 < < Za/2 1- a
J
On peut réécrire cette dernière équation en isolant au centre :
2A
P (X î X2)~z al 2 2 l +2 l < p x- p 2 <{ X x- X 2) + z 1- a . (9.21)
nî n2 ai 2
ni n2 y
CHAPITRE 9
>
Exemple 9.16
On soumet à un essai des longerons en aluminium de deux qualités différentes. Ces poutres doivent
faire partie de la voilure d’un avion de ligne. Le tableau 9.1 indique les données ainsi recueillies sur
leur résistance à la traction. Supposez que l’on connaît l’écart-type de cette résistance dans chaque cas,
le procédé de fabrication et de mise à l’essai des longerons ayant déjà fourni des données à ce sujet.
Considérez également que la loi normale est un bon modèle pour cette variable.
—
Taille de Moyenne de l’échan Écart-type
Qualité l’échantillon tillon (en kg/mm2) (en kg/mm2)
1 n, = 10 3c, = 87,6 fa= 1,0
2 «2= 12 x2= 74,5 cr2= 1,5
Si faet fa dénotent la résistance moyenne véritable des longerons de chaque qualité, on peut construire
un intervalle de confiance à 90% pour la différence entre ces paramètres, soit fa —fa, en posant
ÇTl + ^2
AT- 2
X X- X 2) ± Z 0,05
« i n2
1 O2 1 52
(87,6-74,5)±l,645j— + ’
10 12
13,1 ± 0,882 kg/mm2.
On obtient ainsi l’intervalle de confiance à 90 % suivant :
12,218 kg/mm2 < fa - fa < 13,982 kg/mm2.
On s’attend, avec un niveau de confiance de 90%, que la résistance à la traction des longerons de la
2
qualité 1 soit de 12,218 kg/mm2 à 13,982 kg/mmz supérieure à celle des longerons de la qualité 2.
L'estimation de paramètres
obéit à une loi t avec nx+ n2- 2 degrés de liberté, ce qui veut dire que
P (-t af2; n\ / j j - 2 “< xT < t
~ *a/2; /ij *f «2 “ 2 1 -a .
CHAPITRE 9
Exemple 9.17
Un certain procédé pour la gravure de circuits imprimés nécessite l’utilisation d’un catalyseur. On
veut comparer deux catalyseurs afin de déterminer si l’élimination d’une quantité donnée de photoré
sine exige ou non la même durée d’immersion dans chaque cas. Pour ce faire, on procède à 12 essais
avec le catalyseur 1, la durée d’immersion pour cet échantillon présentant une moyenne 3c, de 24,6 mi
nutes et un écart-type 5, de 0,85 minute. De même, on effectue 15 essais avec le catalyseur 2, la durée
d’immersion pour cet échantillon présentant une moyenne 5c2 de 22,1 minutes et un écart-type s2 de
0,98 minute.
On veut établir un intervalle de confiance à 95 % pour la différence f a - fa en supposant que les deux
populations suivent le modèle normal avec un même écart-type (ou une même variance). L’équa
tion 9.24 permet l’estimation combinée de leur variance commune, ce qui donne
2
2 l)^j2+ (w2 S 2
SP
nx+n2—2
11(0,85)2+14(0,98) 2
12 + 15-2
0,8557.
L’écart-type combiné est ainsi de s = >/0,8557 = 0,925. Puisque ta/2; n] + /i2_2 t0,025 ; 25 2,060, on aura
l’intervalle de confiance
1 1
(x î x2)± t 0 ,0 2 5 ; 25 Sp + —
n, n2
(24,6 - 22,1)±2,060(0,925) J T + ±
{Xl - X 2) - Q i i /i2)
T 2
S \/n\ Jr^ l / n2
obéit approximativement à une loi t avec v degrés de liberté, où
2
( j,7 n i+ 4 //î2)
v 2 2 2 (9.27)
2
S 1/«O (s2/n2)
+
rtj + 1 n ,+ 1
Supposons de façon générale que les données recueillies se composent de n paires (Xn, X2I),
(X12, X22), (Xln, X2n). On suppose que les variables X, et X2 obéissent toutes deux à une loi
normale, avec une moyenne de / ixet de
paires différentes sont indépendantes. Toutefois, il est clair que les deux mesures dans une
même paire ne sont pas indépendantes, étant donné qu’elles se rapportent à une même unité
expérimentale.
Plutôt que de calculer une covariance permettant d’estimer la dépendance entre les données
d’une même paire, on basera notre inférence sur la différence entre ces deux observations. Soit
les ndifférences D, = Xn - X21, D2= X12- X22, ..., = - X2n. La moye
différences D,notée fiD,est
fb = E(D) = E(Xx- X2) = E{Xx) - E(X2) = -
puisque l’espérance mathématique de Xj - X2 correspond à la différence entre l’espérance
mathématique de X, et celle de X2, que ces deux variables soient indépendantes ou non. On peut
donc établir un intervalle de confiance pour fa - fa simplement en déterminant un intervalle
de confiance pour fa . Or, comme les différences D. sont indépendantes et normalement distri
buées, on peut définir un intervalle de confiance pour fa en faisant appel à la loi t de la manière
décrite à la sous-section 9.2.2 par analogie avec l’équation 9.14.
• * • t ” * * . * . I _ I • -
Exemple 9.18
Le tableau 9.2 indique le temps que n = 14 sujets ont mis à garer deux véhicules.
Selon les données relatives aux différences dt observées, d = 1,21 et sd= 12,68. Afin d’établir un inter
valle de confiance à 90 % pour fiD= jix- fa, on rec
V o s ; 13S d / J n
1.21 ± 1,771(12,68)A/Ï4
1.21 ± 6,00
-4,79<jU<7,21 secondes.
L’intervalle obtenu comprend la valeur zéro. Il faut en conclure qu’à un degré de confiance de 90%,
les données ne démontrent aucunement qu’il existe une différence entre les temps moyens fa et fa.
En d’autres termes, la valeur jiD= fa - fa= 0 ne contre
L'estimation de paramètres
« ■ s 6 A | f * » y' V V > , J L « 1 v * f A j| 1 A ^
l
^
X
Il, .
i M 2i
1 37,0 17,8 19,2
2 25,8 20,2 5,6
3 16,2 16,8 -0,6
4 24,2 41,4 -17,2
5 22,0 21.4 .
A
0,6
6 33,4 38,4 -5,0
7 23,8 16,8 7,0
8 58,2 «r ' * A - * 26,0
9 33,6 27.8 5,8
10 24,4 23.2 • 1,2
11 23,4 29,6 -6,2
12 21,2 20,6 0,6
13 36,2 32,2 4,0
14 29,8 53,8 -24,0
Mentionnons que les échantillons de grande taille (où 30 paires, par exemple) rendent
inutile l’hypothèse de normalité.
En déterminant un intervalle de confiance à partir de données appariées plutôt qu’à p artir
de deux échantillons indépendants, on perd des degrés de liberté. Toutefois, on augmente en
général la précision de l’estimation, la valeur de SDétant inférieure à celle de S en raison de la
covariance positive qui unit les deux variables.
correspond à une loi F avec n2 — 1 et n, - 1 degrés de liberté. La figure 9.10 (voir à la page
suivante) présente graphiquement la fonction de densité de cette loi.
270 CHAPITRE 9
L
b p
La fonction de densité de la variable aléatoire F, soit une loi de Fisher
à n2- 1 et à nn- 1 degrés de liberté
Il en ressort que
A
*i- ct/2; «2-1,«i-l < Fa/2;n2-l,ni-l 1- a
y
De ce fait,
\
F l-a/2;«2- l. «i~l < - F
2 1 a/2; n2- l . «i-1 1- a
S2 J
- a l 2; n2 - 1 , nj -1
Fal2; nj —
1,
5
S2
; f 1-
,_ a/2\ ;tj - 1,H2- 1
Exemple 9.19
Revenons à l’exemple 9.17, où deux catalyseurs faisaient l’objet d’une étude visant à comparer leur
capacité à réduire la durée d’immersion nécessaire lors de la gravure de circuits imprimés. On a pro
cédé à n, = 12 essais avec le catalyseur 1 et à n2= 15 essais avec le ca
j, = 0,85 minute et que s2 = 0,98 minute. Supposons qu’on veut établir un intervalle de confiance à
90 % pour le rapport des variances a \ / o\. En recourant à l’équation 9.32, on obtient ►
L'estimation de paramètres
2
sl 2 2
< S 1
2
S ÏF {
2 c2r*
G 2
2 4 0 ,0 5 ; 11.14 **2 4 0 ,9 5 ; 11,14
(0,85) 2 2
(0,85) 2
< V
(0,98)22,57 ct,z 2
(0,98)z 0,365
2
2
0,29 < <Jl2 <2,06.
2
Comme cet intervalle de confiance renferme la valeur 1, on ne peut affirmer, à un niveau de confiance
de 90%, que la durée d’immersion présente un écart-type différent selon le catalyseur utilisé.
Lorsqu’on s’intéresse à deux proportions, telles que p, et p,, on peut définir un intervalle de
confiance à 100(1 - a) % pour la différence p, - p 2. Si l’or» tire deux échantillons indépendants,
l’un de taille n, > 30 et l’autre de taille n2> 30, de populations différentes, de sorte que X, et X2
sont des variables aléatoires binomiales indépendantes de paramètres («,, p,) et (n,, p 2) respec
tivement, où X, représente le nombre d’éléments de l’échantillon de la première population q u i
appartiennent à une catégorie donnée, et où X2représente le nombre d’éléments de l'échantillon
de la seconde population qui appartiennent à cette même catégorie, alors p x=X ,/n, et p , = X2/n ,
constituent des estimateurs indépendants de p, et de p2, respectivement. En d ’au tres m o ts, les
proportions échantillonnales estiment les proportions dans les populations.
De plus, si l’on suppose l’approximation de la loi binomiale par la loi normale, la variable
aléatoire
z (Pi ~ C P i ~ P 2)
jP i( l- P i) , P i ^ - P i )
V n\ n2
obéit approximativement à une loi normale centrée réduite. En utilisant p, et p 2 pour estim er
l’erreur-type et en appliquant le théorème central limite, on trouve une formule pour un inter-
valle approximatif pour la vraie différence de proportions.
on T «
1
Iill
f l ri
# | v
Exemple 9.20
Soit les données fournies à l’exemple 9.14. Imaginez qu’on modifie le procédé de finition de* a rnr
d’essieu pour ensuite prélever un second échantillon aléatoire de 85 arbres. Ce nouvel éehantillo
renferme 10 arbres hors normes. De ce fait, sachant que n, = 75 et que = 0,16, tandi s que ,
et que pobs2 10/85 0,12, on peut utiliser l’équation 9.33 afin d’établir un intervalle de conliane
CHAPITRE 9
approximatif au niveau de 95 % pour la différence entre les proportions d’arbres hors normes avant et
après la modification du procédé. On obtient ainsi
0,16(0,84) 0,12(0,88)
(0,16-0,12)±1,96 +
75 85
c’est-à-dire
0,04 ±0,11,
ou encore
-0,07 <p, - p2< 0,15.
Le zéro étant compris dans cet intervalle, il semble peu vraisemblable, selon les données d’échantil
lonnage, que les modifications apportées au procédé de finition aient réduit la proportion d’arbres hors
normes, avec un niveau de confiance de 95 %.
et sa variance, à
Var(Xn+l - X) = Var(Xn+l ) + Var(X)
a 2+
a 2
1+
n
L'estimation de paramètres
Du fait que Xtl+l et X sont des variables aléatoires normales et indépendantes, l’erreur de prévi
sion obéira elle aussi à une loi normale, et la variable aléatoire
suivra une loi normale centrée réduite. Si l’on ne connaît pas la variance cr2, on peut l’estimer
par la variance S2 de l’échantillon, et alors la variable aléatoire
obéit à une loi t avec n - 1 degrés de liberté. On procède ensuite comme dans le cas d'un inter
valle de confiance.
Exemple 9.21
On a mesuré, au cours de 10 vols, l’accélération maximale (en multiples de = 9,81 m/s2) d’un avion
de ligne assurant une certaine liaison. Voici les résultats obtenus :
1,15; 1,23; 1,56; 1,69; 1,71; 1,83; 1,83; 1,85; 1,90; 1,
La moyenne de cet échantillon est x = 1,666 et son écart-type, s = 0,273. Il peut être important de
prédire la force d’accélération maximale que l’avion subira au cours de son prochain vol. Or, puisque
t0025.9= 2,262, l’intervalle de prévision à 95 % pour correspond à
1,666 ± / 0025;9
1,666 ±0,648
1,018 <XU <2,314.
Il est normal que cet intervalle soit plus long que l’intervalle de confiance à 95 % pour fi (c’est-
à-dire 1,666 ± 0,195), car une observation individuelle est plus variable que la moyenne de plusieurs
observations.
CHAPITRE 9
que dire si l’on ne connaît pas les paramètres fx et a, de sorte qu’il faut les estimer ? A l’aide
des valeurs estimées x et s associées à un échantillon de taille n, on pourrait construire l’inter
valle x ± 1,965. Malheureusement, en raison de la variabilité liée à l’estimation de et de a,
il se peut que cet intervalle renferme moins de 95 % des valeurs. Dans le présent exemple, on
aura besoin d’une valeur supérieure à 1,96 pour éviter ce problème si l’on utilise les résultats
d’une estimation ponctuelle des paramètres de la population.
On peut cependant définir un intervalle qui comprendra la proportion voulue des valeurs
de la population et avoir relativement confiance dans le résultat obtenu. On pourrait ainsi vou
loir être confiant à 90 % que l’intervalle déterminé renfermera au moins 95 % des valeurs de la
population. L’intervalle ainsi obtenu porte le nom d’«intervalle de tolérance». On peut l’établir
pour divers niveaux de confiance.
Sous une forme générale, pour 0 < q < 100, un intervalle de tolérance comprenant au
moins q% des valeurs issues d’une population normale avec un degré de confiance de
1 —a se traduit par x ± ks, où k est une constante déterminée pour différentes combinaisons
de qet de 1 - a. La table VIII, présentée en annexe, indique la valeur de k pour q = 90, 95 et
99 et pour 1 —a = 0,90, 0,95 et 0,99. Les valeurs de cette table sont calculées selon la méthode
d’Odeh et Owens (1980).
Exemple 9.22
Soit les données de l’exemple 9.21 relatives à l’accélération maximale atteinte par un avion de ligne.
On veut définir un intervalle de tolérance dont on peut être confiant à 95 % qu’il comprendra 99 %
de toutes les accélérations maximales possibles. Or, selon la table VIII de l’annexe, si 1 - = 0,95
tandis que q= 99 et que n= 10, alors k = 4,433. Sachant que l’échantillon
et un écart-type s de 0,273, on obtient l’intervalle de tolérance
1,666 ±4,433(0,273)
ou
(0,456 ; 2,876).
On peut donc affirmer, avec un niveau de confiance de 95%, qu’au moins 99% des accélérations
maximales possibles se situent entre 0,456 g et 2,876 g.
Rappelons qu’il existe une différence fondamentale entre les limites de confiance et de tolé
rance. En effet, les limites de confiance (et les intervalles de confiance par le fait même) servent
à estimer un paramètre d’une population, tandis que les limites (et les intervalles) de tolérance
indiquent les limites à l’intérieur desquelles on peut s’attendre à trouver une certaine proportion
de la population. Lorsque n tend vers l’infini, la longueur d’un intervalle de confiance s’approche de
zéro, tandis que les limites de tolérance s’approchent des centiles correspondants de la population.
Résumé
L’estimation de paramètres
---------
2
S
—
fT S
—
-----------2
Xa!2\n -l
^ ■ » * ' ■ * . * ’ • , * <
échantillons aléatoires, l’un de taille n, et
Les données des exercices avec le symbole (£♦, l’autre de taille n2, ayant respectivement
sont aussi disponibles en format électronique. une moyenne de Z, et de Z2
a) Démontrez que
9.1 On tire un échantillon aléatoire de taille Z = aXx+ (1 - a)X2, 0<a<1
d’une population notée Z, où £(Z) = /zet est un estimateur sans biais de
V(Z) = (T2. Lequel des deux estimateurs de
b) Si l’on suppose que les moyennes Z,
{à définis ci-dessous est alors le meilleur?
et Z2sont indépendantes, quelle valeur
Justifiez votre réponse.
de a minimise la variance de Z ?
2n
1 1 n
9.3 Soit 0, et 02des estimateurs du paramètre 0 méthode des moments à partir d’un
dont on sait que £(0,) = 0, £(02) = 0/2, échantillon aléatoire de taille n.
V(0,) = 10 et V(02) = 4. Lequel de ces
estimateurs est le meilleur ? Dans quel 9.10 Soit Z une variable aléatoire géométrique de
sens? paramètre p. Trouvez un estimateur de à
/N A
partir d’un échantillon aléatoire de taille n,
9.4 Soit 0,, 02et 03des estimateurs du para a) avec la méthode du maximum
mètre 0 dont on sait que £(0,) = £(02) = 0, de vraisemblance.
£(03) * 0, V(0,) = 12, V(02) = 10 et b) avec la méthode des moments.
2
Eue 6. Lequel de ces trois
estimateurs préférez-vous ? Expliquez 9.11 Soit Z une variable de Bernoulli de para
votre réponse. mètre p. Trouvez un estimateur de p par
la méthode des moments à partir d’un
9.5 On tire d’une population de moyenne et de échantillon aléatoire de taille n.
variance G 2 trois échantillons aléatoires de
taille n, = 10, «2 = 8 et n3= 6, respectivement. 9.12 Soit Z une variable aléatoire binomiale
Sachant que S2, S2 et S2représentent la de paramètres n (connu) et p. Trouvez un
variance de ces échantillons, démontrez que estimateur de p à partir d’un échantillon
aléatoire de taille N,
2 2
2 1 OSf +SS2 + 6s; a) avec la méthode du maximum
S
24 de vraisemblance. .
est un estimateur sans biais de g 2. b) avec la méthode des moments.
9.6 Soit une variable aléatoire Z de moyenne ji 9.13 Soit une variable aléatoire Z présentant
et de variance g 2 . On sélectionne deux la fonction de densité suivante :
«
L’estimation de paramètres
9.18 On présente ci-dessous la résistance avec un écart-type crde 0,01 mm. Les
(£ j d’adhésion de 15 matériaux éner 15 segments d’un échantillon aléatoire
gétiques (explosifs, combustibles et présentent un diamètre moyen
compositions pyrotechniques) selon x = 74,036 mm.
un article paru dans Annual Reviews a) Établissez, pour le diamètre moyen
Material Research (vol. 31, 2001, des segments produits, un intervalle
p. 291-321). Définissez un intervalle de confiance à 95 %.
de confiance à 95 % pour la résistance b) Si on ne connaissait pas la vraie valeur
d’adhésion moyenne et pour la variance de g et qu’on l’estimait par l’écart-type
de la résistance d’adhésion selon ces échantillonnai s, obtiendrait-on nécessai
données. Considérez que la loi normale rement une plus grande marge d’erreur
est une bonne distribution pour modéli que dans l’intervalle calculé en a) ?
ser cette variable. 0
*
CHAPITRE 9
9.29 La tension de sortie de deux types de b) Y a-t-il une quelconque indication que
transformateurs fait l’objet d’une étude. l’un des deux types de manettes est
Après avoir choisi au hasard 10 transfor supérieur à l’autre ?
mateurs de chaque type, on en mesure
9.31 Le responsable d’un parc automobile veut
la tension de sortie, dont la distribution
(Vf mettre à l’essai deux marques de pneus à
est normale. Les moyennes d’échantil
carcasse radiale. A cette fin, il fait monter
lon obtenues sont 3c, = 12,13 volts et
un pneu de chaque marque sur les roues
3c2= 12,05 volts. On sait que la ten
arrière de huit véhicules choisis au hasard.
sion de sortie présente une variance de
Voici le kilométrage que chaque véhicule
o f = 0,7 pour le premier type de trans
a parcouru avec ces pneus avant leur usure
formateur et de o f - 0,8 pour le second.
complète.
Déterminez un intervalle de confiance à
95 % pour la différence entre les tensions
moyennes. Véhicule Marque 1 Marque 2 Différence
9.30 Les résultats d’une étude sur la conduite 1 36 925 34 318 2607
(7+f de fauteuils roulants motorisés ont été 2 #
45 300 42 280 3020
publiés dans Proceedings the IEEE 3 36 240 35 500 740
24th Annual Northeast Bioengineering 4 32 100 31 950 150
Conférence (1998, p. 130-132). Dans 5 37 210 38 015 -805
cette étude, on s’est intéressé à l’effet sur 6 48 360 47 800 560
la conduite de deux types de manettes 7 38 200 37 810 390
de direction, l’un avec capteur d’effort 8 33 500 33 215 285
(CE) et l’autre avec capteur de position
(CP). On a demandé à 10 sujets de faire Moyenne 38 479,4 37 611,0 868,4
l’essai de ces deux types de manettes. Écart-type 5590,3 5243,9 1290,0
Un élément ayant retenu l’attention est le
nombre de secondes que chacun a mis à Etablissez un intervalle de confiance à
effectuer un trajet prédéterminé. Voici 95 % pour la différence entre les kilo
des données caractéristiques de ce type métrages moyens, en supposant que la
d’expérience. loi normale est un bon modèle. Quelle
marque préférez-vous ?
Type Type 9.32 Nommez toutes les conditions d’applica
Sujet CE CP Différence tion de la formule ci-dessous pour l’inter
valle de confiance pour une différence de
1 25,9 33,4 -7,5 moyennes.
2 30,2 37,4 -7,2
3 33,7 48,0 -14,3 Y 2) i 2n
/
a
t ;, +«2-2
4 27,6 30,5 -2,9
5 33,3 27,8 5,5
6 34,6 27,5 7,1 9.33 Le diamètre des tiges d’acier produites par
7 33,1 36,9 -3,8 deux extrudeuses fait l’objet d’une étude.
8 30,6 31,1 -0,5 On tire deux échantillons aléatoires, l’un de
9 30,5 27,1 3,4 taille n, = 15 et l’autre de taille n2= 18. La
10 25,4 38,0 -12,6 moyenne et la variance du premier échantil
lon sont respectivement 3t, = 8,73 et sf = 0,30
Moyenne 30,49 33,77 -3,28 et celles du second, 3c2= 8,68 et s%= 0,34.
Écart-type 3,29 6,50 7,30
a) Établissez pour of/(72 un intervalle de
a) Établissez un intervalle de confiance à confiance :
95 % pour la différence entre les temps i) à 90%;
Hypothèse statistique
Une hypothèse statistique est un énoncé sur la loi de probabilité à laquelle obéit une variable aléatoire.
Les hypothèses statistiques concernent souvent au moins un paramètre de cette loi.
Exemple 10.1
Supposons qu’on s’intéresse à la résistance moyenne à la compression d’un certain type de béton. Plus
précisément, on veut déterminer si la résistance moyenne à la compression (c’est-à-dire ju) diffère de
2500 lb/po2. Ce qui précède s’exprime formellement ainsi :
H0: n = 2500 lb/po2,
H, \n* 2500 lb/po2. (10.1)
L’énoncé H0: fj.= 2500 lb/po2 dans l’équation 10.1 est appelé « hypothèse nulle » en
rence au statu quo, ou à l’absence de conséquences, et l’énoncé Hj : 2500lb/po2, «hypothèse
alternative». L’hypothèse Ht est souvent l’hypothèse de recherche, celle que l’on souhaite cor
roborer à l’aide de données probantes.
Les tests d'hypothèses 283
Comme l’hypothèse alternative dans l’exemple 10.1 spécifie des valeurs de fl supérieures
ou inférieures à 2500 lb/po2, elle est aussi appelée «hypothèse alternative bilatérale». Dans
certaines situations, on écrira une hypothèse alternative unilatérale, par exemple
Hj : /J.>2500 lb/po2 (unilatérale à droite) (10.2)
ou encore
Hj : // < 2500 lb/po2 (unilatérale à gauche).
Il importe de se souvenir que les hypothèses sont toujours des énoncés sur la population
ou la loi étudiée, et non sur l’échantillon. La valeur du paramètre de la population précisée
dans l’hypothèse nulle (2500 lb/po2 dans l’exemple précédent) est habituellement dérerminée
de l’une des trois façons suivantes. Premièrement, elle peut provenir de la comi .ix- -u-e du
processus, ou même d’une expérimentation antérieure. L’objectif du test d’hypothèse es» alors
de déterminer si la situation a changé. Deuxièmement, cette valeur peut être dé-erminée par
une théorie ou un modèle du processus étudié. Dans ce cas, l’objectif du test d’hypothèse est. de
vérifier la théorie ou le modèle. Troisièmement, la valeur du paramètre de la population peut
résulter de considérations extérieures, telles que les spécifications de conception, ou d’obliga
tions contractuelles. Dans ce cas, le test d’hypothèse sert habituellement à tester la conformité.
On aimerait décider de la véracité ou de la fausseté d’une hypothèse. Pour en avoir le cœur net,
il faudrait sonder toute la population, ce qui s’avère en général impossible. Par contre, une procé
dure, appelée «test d’hypothèse», peut être effectuée à partir des renseignements contenus dans un
échantillon aléatoire de la population en question. Si ces renseignements sont compatibles avec l’hy
pothèse nulle, l’hypothèse n’est pas rejetée; s’ils sont incompatibles, l’hypothèse nulle est rejetée.
T e s t d'hypothèse
Un test d’hypothèse est une procédure qui confronte une hypothèse statistique (portant sur une ou
plusieurs populations) à des observations provenant d’un échantillon (ou de plusieurs échantillons).
L’issue d’un test consiste à rejeter (ou non) l’hypothèse nulle au prolit d’une hypothèse alternative, en
contrôlant les probabilités d’erreur.
Pour tester une hypothèse, on sélectionne un échantillon aléatoire, on calcule une statis
tique, aussi appelée « statistique du test », à partir des données d’échantillon, puis on utilise les
renseignements contenus dans cette statistique pour prendre une décision.
Région de rejet de H 0
La «région de rejet de H0», ou «région critique» d’un test, est l’ensemble des
du test qui mènent au rejet de l’hypothèse nulle.
Exemple 10.2
Par exemple, pour tester l’hypothèse nulle H0: n = 2500 dans l’équation
de béton choisies aléatoirement sont testées et que la moyenne de l’échantillon est la stat istique du
test. Si la valeur observée de la moyenne échantillonnai, Je, est très grande ou très petite par rapport à
2500 lb/po2, on sera tenté de conclure que la valeur 2500 n’est pas représentative de la réalité. Mais de
combien d’unités x doit-elle s’éloigner de 2500 pour que cette valeur soit rejetée ? Disons pour l’in
qu’on utilise la règle suivante :
« Si x >2550 lb/po2ou si x <2450lb/po2, on considérera que la résistance moyenne à la compressio
type de béton est différente de 2500 lb/po2. Autrement dit, on rejettera l’hypothèse nulle H0: = 2500. » ►
CHAPITRE 10
Le rejet de H0 entraîne que l’hypothèse alternative H, est considérée comme plus plausible.
L’ensemble de toutes les valeurs possibles de X qui sont supérieures à 2550 lb/po2 ou inférieures à
24501b/po2 est appelé la «région critique» ou la «région de rejet» du test. D’autre part, si on obtient
2450lb/po2 < x < 2550lb/po2, alors on ne rejettera pas l’hypothèse nulle H0: fJ. = 2500. Donc, l’inter
valle [2450 lb/po2, 2550lb/po2] est appelé la «région de non-rejet» du test.
Remarquez que, dans l’exemple 10.2, les bornes de la région critique (souvent appelées
« valeurs critiques » de la statistique du test), soit 2450 lb/po2 et 2550 lb/po2, ont été déterminées
arbitrairement. Dans les sections suivantes, nous montrerons comment établir une statistique du
test appropriée et déterminer la région critique de plusieurs tests d’hypothèses de façon objective.
. ** • * .v . ' • , * - , y■ — , • ’•
•‘ •■
*• 4
• * .
m
.■ ... -». ■ y• «» • ■. • • . . . . « -. , . . i
, •
Réalité (dans la population)
Décision (basée sur l’échantillon)
. . #. _ s- y * "" * . ' rt -F. ‘ *— ■
H0 est vraie Ho est fausse y ' ‘ . • r % / • • «
Les probabilités de commettre des erreurs de première espèce et de deuxième espèce sont
appelées « risques » et notées respectivement par les symboles a et fi. La probabilité de l’erreur de
première espèce a est souvent appelée « seuil » ou « niveau de signification » du test. On définit
aussi la «puissance du test» par la probabilité de rejeter (à juste titre) une hypothèse nulle fausse.
Risque de l Te espèce = Seuil = a -'P(erreur die lrfî espèce) = P(rejeter H0|H0 est vraie) (1Ô.3) * ' . » ' • . •l ' y
de 2e espèce = f3=P(erreur de 2° espèce) = P(ne pas rejeter H0|H0 est fausse) (10.4)
Puissance = 1 - f5 = P(rejeter H0 H0 est fausse) (10.5)
Exemple 10.3
Dans l’exemple du test portant sur le béton, décrit précédemment, il y aura une erreur de première
espèce si la moyenne de l’échantillon 3c > 2550 lb/po2 ou si 3c < 2450 lb/po2 quand en fait la résis
tance moyenne réelle est fl = 2500 lb/po2. Il y aura une erreur de deuxième espèce si on obtient
2450 lb/po2 < 3c < 2550 lb/po2 et que, pourtant, la valeur réelle de fl diffère de 2500 lb/po2.
Les tests d'hypothèses
Comme les résultats d’un test d’hypothèse sont sujets à erreur, on ne peut pas «prouver» ou
«réfuter» hors de tout doute une hypothèse statistique à partir d’un échantillon. Cependant, il
est possible de concevoir des procédures de test qui feront en sorte que les probabilités d’erreurs
a et P prendront des valeurs suffisamment petites.
En règle générale, on considère que l’erreur de première espèce est la plus grave. On fixe
alors arbitrairement le seuil a à une petite valeur comme 0,01, 0,05 ou encore 0,10. Ainsi,
lorsqu’on rejettera H0 à l’issue d’un test d’hypothèse, ce sera avec une grande conviction, et on
dira qu’il s’agit d’une « conclusion forte ». À l’inverse, ne pas rejeter H0constituera une « conclu
sion faible », car cela signifie seulement que l’écart entre x et 2500 n’est pas assez grand pour
conclure que // diffère de 2500.
C’est en fixant la valeur de a qu’on détermine les bornes de la région critique (et non arbi
trairement, comme dans l’exemple précédent). Il faut donc faire certaines suppositions sur la
distribution de la statistique du test pour établir le critère de rejet de H0.
Toutes choses étant égales par ailleurs, plus a est petit, plus la probabilité d’erreur de
deuxième espèce (/?) est grande. Or, on verra plus loin que /? varie aussi en fonction du degré
de fausseté de H0 (c’est-à-dire la différence entre la valeur de p spécifiée sous H0 et la véri
table valeur de ju) et de la taille d’échantillon n. Il sera donc possible de corriger certaines
quantités pour s’assurer que n’est pas trop grand.
Par exemple, si une valeur P de 0,04 est obtenue, l’hypothèse nulle H0 sera rejetée au
seuil a —0,05, mais pas au seuil a —0,01.
On qualifie habituellement la statistique du test (et les données) de «significatives»
lorsque l’hypothèse nulle H0 est rejetée. On peut donc considérer la valeur P comme le plus
petit seuil a pour lequel les données sont significatives. Si une petite valeur P est calculée, le
décideur doit déterminer à quel point les données sont significatives scientifiquement, au-delà
de la signification statistique. Puisque c’est souvent une des seules valeurs rapportées dans les
résultats d’études scientifiques, il est très important de savoir interpréter des valeurs P. Nous
donnerons plusieurs exemples de calcul et d’interprétation du seuil observé dans les sections
qui suivent.
CHAPITRE 10
H0•
Par contre, supposons qu’on désire rejeter H0 seulement lorsque la vraie valeur de la moyenne
excède fi0.Ainsi, les hypothèses sont
H0• P Poi
( 10.6)
Les tests d'hypothèses
La région critique est alors située dans l’aile supérieure de la distribution de la statistique ; on
rejette H0 si x est trop grand. On conçoit le test unilatéral à droite en supposant que fl ne peut
être inférieure à ju0 ou, si tel est le cas, qu’il est souhaitable d’accepter l’hypothèse nulle. Nous
écrirons toujours l’hypothèse nulle avec un signe d’égalité même s’il est sous-entendu que, dans
plusieurs situations, cela signifie H0: fJ. n Q.
<
Une troisième possibilité consiste à faire un test unilatéral à gauche en posant les hypothèses
On rejette alors H0 lorsque la moyenne échantillonnai est trop petite. Mais comment choisir le
test idéal ? Cela dépend de l’objectif de l’étude et du point de vue de l’analyste.
Exemple 10.4
Supposons qu’un embouteilleur achète des bouteilles de 284 ml d’une verrerie. Lembouteilleur veut
être sûr que les bouteilles excèdent la spécification sur la pression interne moyenne (ou résistance à
l’éclatement), qui est de 200 lb/po2pour les bouteilles de 284 ml. L’embouteilleur a décidé de formuler
une hypothèse alternative unilatérale à droite, c’est-à-dire
H0: n = 200 lb/po2,
H, : /i > 200 lb/po2. (10.7)
Si l’hypothèse nulle est rejetée, les bouteilles sont jugées satisfaisantes ; tandis que si H0 n’est pas
rejetée, alors les bouteilles ne sont pas conformes aux spécifications et il faut les refuser. Comme le
rejet de H0est une conclusion forte, cette formulation force le verrier à «démontrer» que la résistance
moyenne à l’éclatement des bouteilles excède la spécification.
Une telle formulation convient si le verrier a déjà éprouvé des difficultés à respecter les spécifications
ou si des considérations sur la sécurité du produit nous forcent à maintenir fermement la spécification
de 200 lb/po2.
Considérons maintenant le cas où l’embouteilleur décide de formuler une hypothèse alternative uni
latérale à gauche :
H0: jj.= 200 lb/po2,
H, : n < 200 lb/po2. ( 10.8)
Dans cette situation, les bouteilles sont insatisfaisantes seulement lorsqu’il y a une preuve forte que
la moyenne est inférieure à 200 lb/po2. Cette formulation laisse supposer que les performances anté
rieures du verrier sont convenables et que les petits écarts relativement à la spécification sont peu
importants.
Lorsqu’on formule des hypothèses alternatives unilatérales, on doit se souvenir que le rejet
de H0 est toujours une conclusion forte et qu’il faut donc écrire l’énoncé pour lequel il est impor
tant de formuler une conclusion forte dans l’hypothèse alternative. Cela dépendra souvent de
notre point de vue et de notre expérience dans une telle situation.
Exemple 10.5
Considérons une situation où un intervalle de confiance de niveau 1 0,95 pour la moyenne
d’une population a été calculé à partir d’un échantillon, et où on a obtenu [41, 43]. Comme la valeur
40 n’appartient pas à cet intervalle, alors on sait qu’en conduisant un test d’hypothèse sur le même
échantillon, l’hypothèse
H0: /J. = 40
sera rejetée au seuil de a = 0,05, au profit de son alternative bilatérale.
théorème central limite s’applique. De plus, on suppose que la moyenne f iâ t X est inconnue,
mais que sa variance g 2 est connue. On veut tester les hypothèses
H0’ fl —/A)»
H (10.9)
où jUqest une constante spécifiée.
Un échantillon aléatoire simple de taille n est disponible. Notons-le Xt, X v ..., X n. Chaque
observation dans cet échantillon a une moyenne théorique fi inconnue et une variance théorique
G2 connue. Si l’hypothèse nulle H0: f l - fiQest vraie, alors X ~ N{fiQ, G2In). La procédure de
test utilise la statistique
(10.10)
laquelle, sous l’hypothèse nulle, obéit à la loi N (0,1). Donc, si H0: fi - fi0est vraie, la probabilité
est 1 - a qu’une valeur de la statistique Z0 soit entre - et za/2, où est le quantile de la loi
normale centrée réduite tel que P(ZQ> zal2) = cdl. Les figures 10.1 et 10.2 illustrent respective
ment la distribution de X et de Z0 lorsque H0 est vraie.
Zalï 0 Z2
290 CHAPITRE 10
Visiblement, un échantillon donnant une valeur de la statistique qui appartient aux extré
mités de la distribution de Z0 est peu probable si H0: H = ju0 est vraie. Le cas échéant, on aurait
raison de remettre en doute la véracité de H0.
et de ne pas rejeter H0 si
•7
c a /2
< -
— ^0
< r
— ^ a /2
( 10. 12)
Exemple 10.6
On étudie la vitesse de combustion du carburant d’une fusée. Le cahier des charges exige que la vitesse
moyenne de combustion soit de 40 cm/s. Supposons que l’écart-type de la vitesse de combustion est
d’environ 2 cm/s et que cette variable suit une distribution normale.
1. Hypothèses et seuil
L’expérimentateur décide de spécifier une probabilité d’erreur de première espèce = 0,05 et base le
test sur un échantillon aléatoire de taille n = 25. Il veut tester les hypothèses
H0: fi= 40 cm/s,
H] : jj.*40 cm/s.
2. Règle de rejet de H0
Puisque le test est bilatéral, on rejettera H0 si x est trop grand
On devra comparer la valeur observée (z0) de la statistique du test (Z0) avec les valeurs critiques
L^o 025 =: ±1,96. Si —1,96 < z0 < 1,96, l’hypothèse nulle ne sera pas rejetée.
3. Calcul de la statistique observée
Les 25 unités sont essayées, et la vitesse moyenne de combustion de l’échantillon obtenue est
x = 41,25 cm/s. La valeur de la statistique dans l’équation 10.10 est
3,125.
4. Décision
On remarque que z0appartient à la région critique, car 3,125 > 1,96. Donc, H0 est rejetée.
5. Conclusion
La vitesse moyenne de combustion excède 40 cm/s de façon significative au seuil de 5 %.
Une décision basée directement sur la distribution de la moyenne échantillonnai
Notons que les valeurs critiques auraient pu être calculées à partir de la distribution de X, soit la loi
N f 40, —1 plutôt que sous la forme centrée réduite. La règle de décision serait plutôt formulée ainsi : on
rejette H0 si x > 40 + l,9 6 x | = 40,784 ou si J < 40-1,96x | = 39,216. La décision est évidemment la
même à l’issue du test : on rejette H0, car la moyenne observée (41,25 cm/s) appartient à la région critique.
Les tests d'hypothèses 291
W , 1)
H0: ^ = A)>
H ,://> /i0. (10.13)
En définissant la région critique de ce test, on remarque qu’une valeur négative de la statistique
Z0 ne conduira jamais à conclure que H0: fl - /ll0e
st fausse. On
tique dans l’aile supérieure de la distribution N(0, 1) et rejeter H0 pour les trop grandes valeurs
de z0. Autrement dit, on doit rejeter H0 si
Zq^ Zqt* (10.14)
De même, pour tester l’hypothèse unilatérale à gauche
H0: ^ = A)>
H, : jj. </Uq, (10.15)
on doit calculer la statistique Z0et rejeter H0pour les trop petites valeurs de z0. Autrement dit, la
région critique est dans l’aile inférieure de la distribution N(Q, 1), et on rejette H0 si
Zq Za- (10.16)
CHAPITRE 10
Exemple 10.7
Dans l’exemple 10.6, le test unilatéral à droite aurait mené au rejet de H0, car 3,125 > z005 = 1,645. La
valeur Passociée à ce test aurait été P(ZQ> 3,125) = 0,0009. Par contre, le test unilatéral à gauche
n’aurait pas permis de rejeter l’hypothèse nulle, car la région critique contient toutes les valeurs infé
rieures à -1,645. La valeur P de ce test aurait été P(Z0 < 3,125) = 0,9991. Il faut cependant garder en
mémoire que les hypothèses et le seuil du test doivent être spécifiés avant la collecte des données.
/A) v Mi x
________________________________ ______ _ _____ _______________ _________________ .i
*
t
:
:
1
■
j
Les graphiques Via et VIb de l’annexe sont les courbes caractéristiques correspondant au
test bilatéral. Dans ce cas, le paramètre d est défini par
d = \tlZ£À
(10.19)
G
Exemple 10.8
Considérons le problème du combustible de fusée de l’exemple 10.6 et tenons pour acquis qu’on réalise
un test unilatéral à droite :
H0: p = 40 cm/s,
H,:/z>40 cm/s.
Supposons que l’analyste veut rejeter H0 avec une forte probabilité si la véritable vitesse moyenne de
combustion est p = 41 cm/s. En d’autres termes, il veut une faible probabilité d’erreur de deuxième
espèce si p = 41 cm/s.
L’utilisation des courbes caractéristiques
Utilisons d’abord les courbes caractéristiques pour trouver p. On note que 40, /i, = 41, = 25,
G= 2 et a= 0,05. Donc,
d =h ~ J k =i
G 2
et, à partir du graphique Vie de l’annexe, pour n = 25, on trouve que P~ 0,20. Autrement dit, si la vraie
vitesse moyenne de combustion est p = 41 cm/s, alors il y a environ 20 % de chances que cet écart ne
soit pas détecté par le test avec n - 25. ►
CHAPITRE 10
X -4 0 , ^
P I ----j= < 1,645 H, est vraie Région de non-rejet de H0
2/JÏ5 J
P( X<40,658 | /z = 4l) Isoler X
X -41 40,658-41
1 I ----7= < H = 41 Centrer et réduire avec 41
2/J25 2/V25 J
P{Z< -0,855) Z~N( 0, 1)
= 0,195.
/
Sous Sous Sous Sous
H 0'-M= Mo H, : // > H0’-M = Mo H ,: //> //0
N Ao» CT2
n
J
Po Al X
Exemple 10.9
Considérons encore le problème du carburant de fusée de l’exemple 10.6. Supposons que l’analyste
aimerait concevoir le test de manière à ce qu’il détecte si la véritable vitesse moyenne de combustion
est de 41 cm/s (autrement dit, rejeter H0: // = 40) avec une probabilité élevée, soit de 0,90.
L’utilisation des courbes caractéristiques
Comme d =ju^/cr = 1/2, a = 0,05 et J3=0,10, le graphique Vi
de l’échantillon doit être d’environ n =40.
Le calcul direct basé sur la loi normale
On peut aussi déterminer de manière plus exacte la taille de l’échantillon à utiliser pour obtenir une
valeur particulière de fd pour /j 1et adonnés, à partir de la définition de /3:
\
<1,645 H, est vraie Règle de non-rejet sans fixer n
J
Centrer et réduire avec /J = 41
Z~/V(0, 1)
En isolant n, on obtient n —34,22 (qu on arrondit à 35), une valeur proche de celle que donne la courbe
caractéristique.
H0• fl 0’
H {:H*fiQ. (10.20)
La procédure du test t repose sur la statistique
T -* Z £ o
( 10.21)
0 " SAÆ ’
t
qui obéit à la loi t avec n - 1 degrés de liberté si l’hypothèse nulle H0: fl - fi^ est vraie.
CHAPITRE 10
H0• —A»
H (10.23)
. , - - « , , _ _ * i t . . . . .. - . , •
^0 ^ ~t<x;1*
Exemple 10.10
La résistance à la rupture d’une fibre textile est une variable aléatoire normalement distribuée. Le
cahier des charges exige que la résistance moyenne à la rupture soit de 150 lb/po2. Le fabricant désire
• * * ^ *- ^ ’ • “ • • • # *.
détecter tout écart significatif à cette valeur à partir d’un échantillon de 15 fibres.
1. Hypothèses et seuil , %
. ;
* . k .
H0: fi= 150 lb/po2,
H, : H* 150 lb/po2.
i f
. , K%
< ; -
« - * » *. • •
- m . 4( . i ■ , * * « * • .* f 4 » * 9 m . • ■ .
Le cahier des charges spécifie une probabilité d’erreur de première espèce a = 0,05.
2. Règle de rejet de H0
On rejettera H0 s i\tQ\ > tQ02S. 14= 2,145, où t 3c—150
S /Jn
observée
rupture. La
noyenne et la variance de l’échantillon, calculées à partir = 152,18 et
s 2 = 16.63. Donc, la valeur observée de la statistiaue du tes / •» .
4
. .•
x-jii0 152,18-150
« V
to 2,07.
s/Jn J l6
4. Décision
Puisque la valeur absolue de t0est inférieure à cette valeur critique, on conclut qu’il n’y a pas de preuve
suffisante pour rejeter l’hypothèse que p —150 lb/po2. ►
Les tests d'hypothèses
On peut calculer la valeur P (voir la figure 10.9) de ce test en se rappelant qu’il s’agit de la probabilité
d’obtenir une valeur au moins aussi extrême que 2,07 si H0 était vraie. On obtient alors, à l’aide d’un
ordinateur,
Valeur P = 2 x P(T0 > 2,07) = 2 x 0,0287 = 0,0574,
une valeur légèrement supérieure au seuil du test, d’où le non-rejet de H0.
5. Conclusion
Les données n’ont pas fourni de preuve suffisante permettant de conclure que la résistance moyenne à
la rupture diffère significativement de 150 lb/po2, au seuil de 5 %.
où Tq représente la variable aléatoire qui suit la loi t décentrée. Ce calcul se fait à l’aide d’un
ordinateur ou des courbes caractéristiques, et nécessite qu’on spécifie une valeur de variabilité.
Les courbes caractéristiques des graphiques Vie, Vif, VIg et Vlh de l’annexe représentent
P en fonction d’un paramètre d pour diverses tailles d’échantillon n. Ces graphiques sont four
nis pour les hypothèses alternatives bilatérales et unilatérales et pour a - 0,05 ou a= 0,01. Dans
le cas de l’hypothèse alternative bilatérale de l’équation 10.20, c’est-à-dire si on considère que
fl prend la valeur particulière //„ le facteur d’échelle d de l’abscisse des graphiques Vie et V if
est, par définition,
d IMi-Mol ( 10.27)
G
300 CHAPITRE 10
Pour l’hypothèse alternative unilatérale à droite ( l’équation 10.23), c’est-à-dire fi > fig, on
utilise les graphiques VIg et Vlh avec
d = --- - —-, (10.28)
<T
Pour l’hypothèse alternative unilatérale à gauche ( l’équation 10.25), c’est-à-dire < fiQ,
d =— ~^ . (10.29)
G
On remarque que d dépend du paramètre inconnu G1. Il existe plusieurs façons d’éviter
cette difficulté. Dans certains cas, on peut utiliser les résultats d’une expérience antérieure ou
des renseignements dont on dispose pour estimer grossièrement la valeur de G1. Si l’on veut
examiner la courbe caractéristique une fois les données recueillies, on peut utiliser la variance
de l’échantillon s2pour estimer cr2. Si les analystes ne disposent d’aucune expérience an
pour estimer <r2, ils peuvent définir l’écart à la moyenne (//, - fig) qu’ils désirent détecter par
rapport à g . Par exemple, si l’on désire détecter un petit écart à la moyenne, on peut utiliser une
valeur de d= | fix—fig\/G = 1 et si l’on veut détecter seulement des écarts mod
à la moyenne, on peut prendre d=
\fi{ —]Uq\/g qui est importante dans la détermination de la taille de l’échantillon.
Exemple 10.11
Considérons le problème du test de fibre de l’exemple 10.10. Si la résistance à la rupture de cette fibre diffère
de 2,5 lb/po2 par rapport à 150 lb/po2, l’analyste aimerait rejeter l’hypothèse nulle H0: = 150 lb/po2 avec
une probabilité d’au moins 0,90. La taille d’échantillon 15 permet-elle d’assurer que le test ait
cette précision ?
Si l’on utilise l’écart-type de l’échantillon ql 6,63 pour estimer g , alors d = |/i, -/^|/cr= 2,5/4,08 = 0,61. En
se reportant aux courbes caractéristiques du graphique Vie, avec = 0,61 et = 15, on trouve ~ 0,45.
Donc, la probabilité de rejeter H q : jli= 150 lb/po2si la vraie moyenne diffère de ±2,5 lb/po2de cette valeur
est d’environ 1 - P = 1 - 0,45 = 0,55, et on conclut que la taille d’échantillon n = 15 ne convient pas.
Pour trouver la taille d’échantillon nécessaire qui donnera la précision désirée, on consulte les courbes
caractéristiques du graphique Vie avec d = 0,61 et fl = 0,10, et on lit la taille d’échantillon correspon
dante, soit environ n —35.
on utilise la statistique
(10.31)
où S2 est la variance de l’échantillon. Si H0: cr2 = a 2 est vraie, alors la statistique UQobéit à la
loi du khi-carré avec n —1 degrés de liberté.
Exemple 10.12
Considérons la machine de l’exemple 9.13, qui est utilisée pour remplir des canettes de boisson gazeu.se.
Si la variance du volume de remplissage excède 0,02 (once liquide)2, alors le pourcentage de canettes
remplies adéquatement risque d’être trop faible.
1. Hypothèses et seuil
L’embouteilleur désire tester les hypothèses suivantes :
H0: <t 2 = 0,02,
H,: (T2>0,02.
Il choisit d’utiliser a - 0,05 et prévoit mesurer le volume de 20 canettes.
2. Règle de rejet de H0
On rejettera H0 si fi0 >Xo,os -,19 = 30, 14.
CHAPITRE 10
21,38.
4. Décision
Puisque la valeur observée (21,38) est inférieure à la valeur critique (30,14), on ne rejette pas H0.
Puisque le test est unilatéral à droite, la valeur P (voir la figure 10.10) du test se calcule comme suit,
à l’aide d’un ordinateur :
Valeur P= P(U0> 21,38) = 0,316, où U0 ~ *f9.
Une valeur P supérieure au seuil amène au non-rejet de HQ. Puisque 0,316 est une probabilité assez
élevée, ceci indique que l’hypothèse H0 est plausible compte tenu des données.
5. Conclusion
Il n’y a pas de preuve forte que la variance du volume de remplissage excède 0,02 (once liquide)2.
X = — (10.37)
<7o
pour diverses tailles d’échantillon n, et où <
j x représente la valeur de l’écart-type lorsque l’on
considère que H, est vraie. Les graphiques Vlk et Vil correspondent à l’hypothèse alternative
Les tests d'hypothèses 303
unilatérale H, : G2 g
> 2, tandis que les graphiques VIm et Vin correspondent à l’autre h
thèse alternative unilatérale, H, : <r2 < g \ .
En utilisant ces graphiques, on considère <7, comme la valeur de l’écart-type qu’on désire
détecter, c’est-à-dire celle pour laquelle on souhaite rejeter H0 avec une forte probabilité.
Exemple 10.13
Reprenons le contexte de l’exemple 10.12. Trouvons la probabilité de rejeter H0: = 0,02 si la vraie
variance est aussi grande que 0,03.
Le calcul direct basé sur la loi du khi-carré
On peut calculer la valeur de j3 directement à partir de sa définition :
J3 = P(Ne pas rejeter H0 | H, est vraie)
2
PI (n w—
2 <30,14 G 0,03
a0
2
P((n-1)52 <30,14cr02 1a 1 0,03)
2 2
(n -l)5 ‘ 30.14CTo 2
2 G 1 0,03
a1 G 1
„ 30,14(0,02) , . rf
P U < ------------- , ou U Z 19
0,03
P((/< 20,09)
0,611.
Le calcul approximatif avec les courbes caractéristiques___ ____
On considère ici que H, est vraie. De ce fait, on a <7, = yj0,03 = 0,1732 et <70 = y/0,02 = 0,1414. Le
paramètre A est
Pour tester
H„: oJ= ff02,
H, : a 2 * <7q, (10.38)
la statistique du test est
ai
N
II
(10.39)
0e»
et elle suit approximativement une loi (0, 1) sous H0. On rejette H
N
même statistique pour les hypothèses alternatives unilatérales en ajustant les zones de rejet.
(10.41)
qui suit approximativement une loi N,0 1) si l’hypothèse nulle est vraie
On situe comme d’habitude les régions critiques des hypothèses alternatives unilatérales.
Les tests d'hypothèses 305
Exemple 10.14
Un fabricant de semi-conducteurs produit des dispositifs logiques. Selon le contrat avec un client, le
taux de dispositifs défectueux ne doit pas excéder 0,05. Le client doute que cette norme soit respectée
et prend un échantillon aléatoire de 200 dispositifs pour vérifier son impression.
1. Hypothèses et seuil
Le client veut tester
H0: p = 0,05,
Hi : /? > 0,05.
Il choisit un seuil de 5 %.
2. Règle de rejet de H0
On rejettera H0 si
4. Décision
Puisque la valeur observée (-1,30) est inférieure à la valeur critique (1,645), on ne peut donc pas rejeter
l’hypothèse nulle selon laquelle p = 0,05.
5. Conclusion
Les données ne permettent pas de conclure que la proportion de défauts excède 0,05 au seuil de 5 %.
Remarquons que, dans ce cas, la proportion échantillonnai était inférieure à = 5 %. Par consé
quent, il était évident que l’hypothèse alternative unilatérale n’allait pas être corroborée ! (On peut
faire l’exercice qui consiste à montrer que même le test bilatéral n’aurait pas mené au rejet de H0, au
seuil de 0,05.)
Le calcul du seuil observé
Le seuil observé associé à ce test et ces données peut se calculer de manière approximative (avec la loi
normale) ou exacte (avec la loi binomiale). Rappelons que cette probabilité se calcule en considérant
que H0 est vraie.
Valeur P = P(p > 0,03) - P(Z > -1,30) = 0,90
200 200N\ 200
Valeur P exacte (0,05)* (1-0,05) “ X
0,94
jr=6 X J
306 CHAPITRE 10
P = Pi
(10.43)
P o - P i - Z a y]p ( l - P o ) / n
0
1 -0 (10.44)
J Pi (1 “ Pi )!* J
(10.45)
La résolution de ces équations fournit la taille n de l’échantillon pour laquelle un test de seuil a
a un risque p spécifié. Les équations de la taille de l’échantillon sont
Za i2 V P o ü - P o ) + Z p y / P i Q - P i )
(10.46)
Pl - Po J
Les tests d'hypothèses 307
pour l’hypothèse alternative bilatérale (car on suppose que l’une des deux probabilités de
l’équation 10.45 est négligeable) et
Exemple 10.15
Soit la situation décrite à 1’ P 0.07. Selon
P
/ A
0,05 -0,07 +1,645^(0,05)(0,95) /200
0 =0
J(0,07)(0,93)/200 J
0(0,30)
0,618.
Cette probabilité d’erreur de deuxième espèce n’est pas aussi petite qu’on aimerait qu’elle soit, mais la
taille d’échantillon n= 200 pourrait peut-être être augmentée davantage. Supposons qu’on dés
le risque f5 ne soit pas plus grand que 0,10 si la véritable valeur du taux de dispositifs défectueux est
aussi grande que p = 0,07. Selon l’équation 10.47, la taille requise de l’échantillon est
1,645^(0,05)(0,95) +1,28^(0,07)(0,93)
n
0,07-0,05 J
1174,
une très grande taille d’échantillon. Remarquons toutefois qu’on essaie de détecter un très petit écart
à la valeur p0= 0,05.
Populations X2~ N ( f a to \ )
( 1 - f g\ \
Loi des moyennes échantillonnales Xr - N f a t - L X2 ~ N\
y ni J 1 n2 )
(10.49)
Les hypothèses alternatives unilatérales utilisent la même statistique Z0. Pour tester l’hypothèse
alternative unilatérale à droite (H fa), on calcule la valeur observée Zqselon l’équation 10.49
et on rejette H0: fa = fa si
Zq>za.(10.51)
Pour tester l’hypothèse alternative unilatérale à gauche (H, : fa < fa), on calcule la valeur
observée Zqselon l’équation 10.49 et on rejette H0: fa = fa si
Zq Zg- (10.52)
Les tests d'hypothèses 309
Exemple 10.16
La directrice d’une entreprise de mise en boîte de jus d’orange désire comparer la performance de
deux chaînes de mise en boîte de son usine. Comme la chaîne 1 est relativement récente, elle pense
qu’elle produit en moyenne un plus grand nombre de caisses par jour que la chaîne 2, plus ancienne.
On considère que la loi normale est un bon modèle pour cette variable. Dix jours de production
sont sélectionnés au hasard pour chaque chaîne. Selon ces données, J, = 824,9 caisses par jour et
x 2 —818,6 caisses par jour. On sait par expérience d’exploitation de ce type d’équipement que a: = 40
et que a \ = 50.
1. Hypothèses et seuil
On désire tester
H,: A >/^-
On utilisera a = 0,05.
2. Règle de rejet de H0
On rejettera H0 si z0 1,645.
3. Calcul de la statistique observée
La valeur observée de la statistique du test est
824,9-818,6
140 50
V10 + 10
4. Décision
Puisque z0 > z005, on rejette H0.
5. Conclusion
Le nombre moyen de caisses que produit la nouvelle chaîne par jour est significativement supérieur au
nombre moyen de caisses que produit la chaîne plus ancienne, au seuil de 5
À titre informatif, la valeur Passociée à ce test est P(Z0>2,10) = 0,0179. On aurait don
décision si on avait choisi le seuil a = 0,01.
(10.53)
VId. Le
facteur d’échelle des abscisses pour l’hypothèse alternative unilatérale à droite, H : //,i >M2
d Ml -1*2 (10.54)
Le facteur d’échelle des abscisses de l’hypothèse alternative unilatérale à gauche, H, : jix< est
d = -£ -■ & -. (10.55)
V<7|+<72
Dans certains problèmes, le coût de la collecte de données diffère fortement d’une popula
tion à l’autre, ou la variance d’une population est nettement supérieure à celle de l’autre. Dans
ces cas, on utilise souvent des tailles d’échantillons inégales. Si ^ et que leurs valeurs
sont fixées à l’avance, on consulte les courbes caractéristiques avec une valeur équivalente de
n calculée comme suit :
n = —=gV t g j — . (10.56)
<7 x/ n x
Exemple 10.17
Considérons les chaînes de mise en boîte de jus d’orange de l’exemple 10.16. Si la véritable différence
des productions moyennes de mise en boîte est de 10 caisses par jour, trouvons les tailles des échan
tillons nécessaires pour détecter cette différence avec une probabilité de 0,90. La valeur appropriée
du facteur d’échelle est
d _ P-X-P-2 _ 10
On peut trouver des formules pour la taille de l’échantillon requise afin d’obtenir une valeur
spécifiée de p étant donné //, - et a .Ces formules sont des suppléments utiles aux
téristiques. Pour l’hypothèse alternative bilatérale, la taille d’échantillon nx- n 2- n est
+ Z/3)Vl2+0~22)
(10.57)
)2
Cette approximation est valide lorsque & y-za,2 ~(Mi - + j est petit com para
tivement à p.
Pour une hypothèse alternative unilatérale, on a , où
(10.58)
Les tests d'hypothèses 311
La détermination des équations 10.57 et 10.58 est semblable au cas présenté à la sec
tion 10.2, où l’on avait un seul échantillon.
Exemple 10.18
Pour illustrer l’utilisation de ces équations, considérons la situation de l’exemple 10.17. On a une
hypothèse alternative unilatérale avec a = 0,05, /i, — = 10, o\ - 40, = 50 et = 0,10. Donc,
za = z0,05 = 1.645, Zp=z0,io= 1*28 et l’équation 10.58 donne la taille requise de l’échantillon
Ho:A=/*2>
H (10.59)
Supposons que Xn, X12, ..., Xlni est un échantillon aléatoire de nx observations de X, et que
X2„ X22, ..., X2 est un échantillon aléatoire de n2 observations de X2. Soit X,, X2, S2 et S2
les moyennes et les variances respectives des échantillons. Comme S? et S2 estiment tous
deux la variance commune cr2, on peut les combiner pour obtenir une seule estimation,
soit
(10.60)
p n j+ /i2- 2
CHAPITRE 10
On a déjà abordé cet estimateur combiné à la sous-section 9.3.2. Pour tester H0 : fix= de
l’équation 10.59, on calcule la statistique du test
(10.61)
(10.63)
Pour l’hypothèse alternative unilatérale à gauche (H! : fix < fl2), on calcule la valeur observée
î0 et on rejette H0: fix = fi^ si
(10.64)
Le test t sur deux échantillons présenté dans cette section est souvent appelé « test t combiné »
parce que l’on combine les variances des échantillons pour estimer la variance commune. Il est
aussi appelé « test t pour échantillons indépendants » parce qu’on suppose que les deux popula
tions normales sont indépendantes.
Deux catalyseurs sont analysés pour savoir comment ils modifient le rendement moyen d’un procédé
chimique. On utilise actuellement le catalyseur 1, mais le catalyseur 2 étant meilleur marché, il sera
adopté s’il ne change pas le rendement moyen du procédé. Le rendement est considéré comme une
variable aléatoire normale.
1. Hypothèses et seuil
On désire tester les hypothèses
4. Décision
Donc, on ne peut pas rejeter H0: fa = fa,car |t0| est inférieur à 2,145.
5. Conclusion
Autrement dit, on n’a pas de preuve forte permettant de conclure que le catalyseur 2 donnerait un
rendement moyen différent de celui du catalyseur 1 au seuil de 5 %. La figure 10.11 illustre ce résultat.
À titre indicatif, la valeur P de ce test est calculée comme suit :
Valeur P = 2 x P(T0< -2,03) = 2 x 0,031 = 0,062.
valeur
observée t0
d J j L z l i z l . (10.65)
2 (7
y ( 10.66 )
tandis que pour l’hypothèse alternative unilatérale à gauche, H0 : ju. < p , on utilise
d = B iz J L . (10.67)
2G
On remarque que le paramètre d est une fonction de g, qui est inconnu. Comme pour le test t
avec un seul échantillon ( voirla sous-section 10.2.2), on peut devoir utilis
tion grossière initiale de g o u utiliser une estimation subjective. D’autre part, on peut défi
nir les différences de moyennes qu’on désire détecter par rapport à G, c’est-à-dire en nombre
d’écarts-types.
Exemple 10.20
Considérons l’expérience des catalyseurs de l’exemple 10.19. Si le catalyseur 2 donne un rendement dif
férent de 3,0 % du rendement du catalyseur 1, on veut rejeter l’hypothèse nulle avec une probabilité d’au
moins 0,85. Quelle est la taille requise de l’échantillon ? En utilisant sp= 1,99 comme estimation gros
sière de l’écart-type commun a,onarf = \p{- p^!2c= 3,00/(2)(1,9
de l’annexe et avec d = 0,75 et p - 0,15, on trouve n = 20, environ. Donc, puisque n = 2n - 1,
n + 1 20 + 1
n = ------= ------- 10,5 « 11
2 2
et on utilise les tailles d’échantillon n{ = n2= n = 11.
(10.68)
Les tests d'hypothèses 315
est distribuée approximativement selon une loi de Student avec un nombre de degrés de liberté
donné par
(10.69)
2
si l’hypothèse nulle H0: /z, = /^ est vraie. Donc, si g ] * cri, on teste l’égalité des moyennes de
la même façon qu’au premier cas, mais T*0 sert de statistique et n, + 2 est remplacé par
v pour déterminer le nombre de degrés de liberté de la loi t. Ce problème général est souvent
appelé «problème de Behrens-Fisher».
Exemple 10.21
Un fabricant d’écrans cathodiques teste deux conceptions de microcircuits pour déterminer s’ils produi
sent des courants équivalents. Le bureau d’ingénierie de mise au point a obtenu les données suivantes.
Conception 1 n, = 15 x l = 24,2 s? 10
Conception 2 «2= 10 x2= 23,9 *22 20
1. Hypothèses et seuil
On désire tester
H0:/A=^2>
2
\
+
n, +1 W9 + 1 16 11
(10.71)
Les tests d'hypothèses 317
(10.72)
(10.73)
Exemple 10.22
Un article du Journal ofStrain Analysis (vol. 18, n° 2, 1983, p. 111-117) compare plusieurs méthodes
de prédiction de la résistance au cisaillement de poutres en acier. Le tableau 10.2 contient les don
nées de deux de ces méthodes, les procédures de Karlsruhe et Lehigh, appliquées à neuf poutres
spécifiques. Déterminons s’il existe une différence (en moyenne) entre ces deux méthodes, au seuil
de 10%.
S* ? « N M
_ 1_ I _ —
~ ^ m\ ..
ictions de la résistance au cisaillement de neuf poutres en acier
,
r
a
? » ? . / ,r - * * . v
^ ^ i • -
v
prédite/charge observée)
Poutre Méthode de Karlsruhe Méthode de Lehigh Différence d
Û86 1,061 0,125
1,151 0,992 0,159
1,322 1,063 0,259
1,339 1,062 0,277
1,200 1,065 0,135
1,402 1,178 0,224
1,365 1,037 0,328
1,537 1,086 0,451
1,559 1,052 0,507
1. Hypothèses et seuil
On désire tester
H0 • f^D
H, :pD*0,
où fJD= HK- i*v On a a= 0,10.
2. Règle de rejet de H0
On rejettera H0si \t0\> t005. 8 = 1,86.
CHAPITRE 10
2(7 2
n
Par contre, dans de nombreuses expériences appariées, il existe une corrélation positive entre
X, et X2. Autrement dit,
V(D) = V(X1- X 2)
= V(Xl ) + V(X2) Cov(X, , )
•
2<r2(l - p )
_ _ _
n
en supposant que les deux populations Xl etX2ont des variances identiques. De plus, S2Dln estim e
la variance de D. Chaque fois que la corrélation entre les paires est positive, le dénominateur du
test t apparié est inférieur au dénominateur du test t sur deux échantillons indépendants. Donc,
Les tests d'hypothèses 319
le test t sur deux échantillons indépendants diminue grandement la signification des données
s’il est appliqué à tort aux échantillons appariés.
Bien que l’appariement mène souvent à une plus petite valeur de la variance de X, - X2, il
présente un inconvénient. En effet, le test tapparié entraîne une
en comparaison avec le test t sur deux échantillons. On sait qu’en règle générale l’augmentation
du nombre de degrés de liberté augmente la puissance des tests.
Alors, comment peut-on décider de la conduite de l’expérience - doit-on apparier les obser
vations ou non ? Il est impossible de répondre d’une façon générale. Signalons toutefois que,
selon la discussion ci-dessus,
si les unités expérimentales sont relativement homogènes (petit G) et si la corréla-
mesures
l’appariement est contrebalancé par la perte de degrés de liberté et il faut donc
échantillonner indépendamment ;
si les unités expérimentales sont relativement hétérogènes (grand cr) et s'il existe une
grande corrélation positive entre les deux mesures d’une paire, alors il faut apparier.
On doit appliquer ces règles avec discernement parce que, habituellement, on ne connaît
pas précisément G et p. De plus, si le nombre de degrés de liberté est grand (40 ou 50, par
exemple), alors une perte de n- 1 degrés de liberté par appariement peut
Cependant, si le nombre de degrés de liberté est petit (10 ou 20, par exemple), alors la perte
de la moitié d’entre eux est potentiellement grave si la précision accrue par l’appariement ne la
compense pas.
(10.74)
on utilise le fait que la statistique
(10.75)
obéit à une loi F de Fisher, avec n, - 1 et n2- 1 degrés de liberté si l’hypothèse nulle H0: G2 - g \
est vraie.
CHAPITRE 10
La table V de l’annexe ne donne que les quantiles de l’aile supérieure de la loi F, de sorte
que pour trouver Fx_ al2._ h lf on doit utiliser l’égalité
i
al 2; n j - 1, «2-1 (10.77)
F.a /2 ; «2 "“1»«i —1
fo>F,a; «, - 1, «2 ~ 1* (10.79)
Exemple 10.23
On enlève du cuivre des cartes de circuits imprimés par décapage chimique, et X, et X représentent
les résultats du décapage pour deux concentrations différentes.
1. Hypothèses et seuil
On désire tester
H0: g \=
H,: cr?* g \.
ou si
(F, -1 (4,99) -î
fo < Fq,9 7 5 ; 7 , 7 0 , 0 2 5 : 7
4. Décision
Puisque la valeur observée (0,97) tombe entre les deux valeurs critiques, on ne peut pas rejeter
Ho : <T? = cf\.
5. Conclusion
Il n’y a pas de preuve forte que la concentration modifie la variance des résultats au seuil de 5 %.
(10.80)
Exemple 10.24
Soit le problème d’analyse des résultats du traitement chimique de l’exemple 10.23. Supposons qu’une
des concentrations a modifié la variance des résultats de manière telle qu’une des variances est quatre
fois plus grande que l’autre. Supposons aussi qu’on désire détecter ce qui précède avec une probabilité
d’au moins 0,80. Quelle taille d’échantillon doit-on utiliser? Si une des variances vaut quatre fois
l’autre, alors
A = — = 2.
cr2
En utilisant le graphique Vio avec /?= 0,20 et X=2, on trouve qu’il fa
d’environ n{ = n2= 20.
on utilise la statistique
où Sp est l’estimateur combiné de l’écart-type commun <7. Cette statistique a une distribution
approximativement normale centrée réduite lorsque g \ - a\.
Les régions de rejet ont la même forme que dans les autres tests basés sur la loi normale.
CHAPITRE 10
N P i(l-P i) et N P 2 Q --P 2 )
P\ P i Pi Pi
nî J n 2 J
Donc, si l’hypothèse nulle H0: p, = p 2 est vraie, en utilisant le fait que p, = p 2= p , la variable
aléatoire p x —p 2 obéit approximativement à une loi normale :
(
"1 il)
Ü?5
^3)
1
0, p ( l - p ) + —
to
l n i n 2 \J
La statistique du test pour H0: p, = p 2, qui suit une loi N(0, 1) lorsque H0 est vraie, est alors
P1 - P 2 (10.84)
Exemple 10.25
L’armée américaine envisage d’utiliser deux types différents de calculateurs de tir pour ses batteries
de 105 mm à six coups. Les deux systèmes informatiques sont soumis à un essai de vérification durant
lequel le nombre total de tirs dans la cible est compté. Le système 1 donne 250 tirs réussis sur 300 car
touches, le système 2 donne 178 tirs réussis sur 260 cartouches. Les deux systèmes informatiques
sont-ils statistiquement différents, au seuil de 5 % ?
1. Hypothèses et seuil
Pour répondre à cette question, on teste
Ho ■Pl =P
Hi:pl * p 2
et on utilise un seuil de 5 %.
2. Règle de rejet de H0
L’hypothèse nulle sera rejetée si la valeur observée de z0, en valeur absolue, excède -,0iP< = 1,96.
3. Calcul de la statistique observée
On remarque que p, = 250/300 = 0,8333, p2= 178/260 = 0,6846 et
„ xx+x2250 + 178 nn£AO
p = —---- - = ----------- = 0,7643.
n, +n2300 + 260
4. Décision
Puisque z0> z0025= 1,96, on rejette H0.
5. Conclusion
Les deux systèmes informatiques diffèrent de façon significative au seuil de 5 %. La proportion de tirs
réussis est statistiquement plus élevée avec le système 1.
( 10.86)
CHAPITRE 10
(10.87)
- _ n\P \+ n2p2
n\ + n2
- _ nl( l - p {) + n2( \ - p 7)
n\+ n 2
où qx= 1 - p xet q2 —1 - p 2. Pour les hypothèses alternatives unilatérales, on remplace za/2 dans
l’équation 10.88 par za.
La procédure du test
La procédure de test requiert un échantillon aléatoire de taille n de la variable aléatoire
X, dont la fonction de densité de probabilité est inconnue. Ces n observations sont d isp o
sées dans un tableau de fréquences ayant k classes. Soit O. la fréquence observée dans la
î-ième classe. À l’aide de la distribution hypothétique de probabilité, on calcule la fréquence
espérée dans la i-ième classe, notée E.. (Notons que les fréquences espérées ne sont pas
nécessairement des nombres entiers, et qu’elles n’ont pas à être arrondies puisqu’il s’agit
d’espérances.)
Les tests d'hypothèses
Cette statistique peut être considérée comme une « distance » entre le modèle proposé et les
quantités observées. On peut démontrer que UQobéit approximativement à la loi du khi-carré
avec k - p - 1 degrés de liberté, où p représente le nombre de paramètres delad^-nbi.-Ln. hypo
thétique estimés à partir de l’échantillon. Cette approximation s’améliore Un“siii«t* fj ruante.
Exemple 10.26
Une distribution complètement spécifiée
Un informaticien a développé un algorithme pour générer des nombres entiers pseudo-aléatoires sur
l’intervalle 0-9. Il code l’algorithme et génère 1000 nombres pseudo-aléatoires. Les données sur la
fréquence d’apparition de chacun des chiffres de 0 à 9 sont indiquées dans le tableau 10.3. Le généra
teur de nombres aléatoires fonctionne-t-il correctement au seuil de 5 %?
j fl*. ■» i"* ~» ■, % -v-' k*. f J f
, J ? T#**.
> f ^ , >
Lüi flfJ
*v**-V « .v > $ r :
¥ flijB r é _ ^ i y x *
1 # t _. ■ , —f i —— y w ■« i ■s • T .-v .* r < « » ?• . ■ .
r I C n r x * • . « ' : r ■» » • .* •* _ •-> * ' ‘ n W • » « J - ■ . . ' - ■* ' a • J ' - .# J - » • '
r V ■ ▼ X Z ^ | ™ t 1 W ¥ ' V ! ^ * ’ R » 1 Q J | 5
• Z 1/ \ i • . ' _ ^ *, V ■ / ■¥ r s . - -
’ 1 j v * ' - ' -f ‘ ’ >y ' "
_ _____ - ■ — ■ -
Chiffre généré
- -_________________________________________ ______________________________________________________________________________________________________________________________________________
Total 1 \
0 i 2 3 4 5 6 7 8 — -
9 ! n J ----------------- ■ ■
Comme on rejette H0 pour des grandes valeurs de f/0, c’est-à-dire lorsque la «distance» est grande
entre le modèle et les observations, la valeur du test se calcule comme suit (à l’aide d’un ordinateur) :
(U,72)
P 3 = 0,93, oùU0~ x l
4. Décision
Puisque la valeur P est supérieure à a et que u0<%2
0,05 \ 9
= 16,92, on ne peut pas rejeter l’hypothèse que
les données viennent d’une distribution uniforme discrète.
5. Conclusion
Par conséquent, le générateur de nombres aléatoires semble fonctionner de façon satisfaisante au seuil
de 5 %.
Exemple 10.27
Une distribution discrète
On veut tester l’hypothèse selon laquelle le nombre de défauts sur des cartes de circuit imprimé obéit à
la loi de Poisson. On collecte un échantillon aléatoire de 60 cartes de circuit imprimé et on observe
le nombre de défauts. On obtient les données suivantes.
1. Hypothèses et seuil
Les hypothèses appropriées sont
H0: Le nombre de défauts suit une loi de Poisson ;
H, : Le nombre de défauts ne suit pas une loi de Poisson.
Fixons le seuil à 5 %.
2. Règle de rejet de H0
L’hypothèse d’une loi de Poisson sera rejetée comme modèle si
2
0,05 ; A: - p - l
Pi Ê, = npi
0 0,472 28,32
1 0,354 21,24
2 0,133 7,98
>3 0,041 2,46
Comme la fréquence espérée dans la dernière classe est inférieure à 3, on combine les deux dernières
classes.
>2 13 10,44
Exemple 10.28
Une distribution continue
Un ingénieur de fabrication teste un bloc d’alimentation de poste de travail. Il désire déterminer si
la tension de sortie est convenablement décrite par une loi normale, au seuil de 10%. À partir d’un
échantillon aléatoire de n - 100 unités, il obtient les estimateurs de la moyenne x = 12,04 V et de
l’écart-type s = 0,08 V.
Il est courant, quand on établit des intervalles pour la distribution de fréquences utilisée dans le
test d’ajustement du khi-carré, de choisir des limites de classes de sorte que les fréquences espérées
E = np, soient égales pour toutes les classes. Donc, on choisit des limites de classes a0, ax, ak pour
les k classes de manière à ce que toutes les probabilités
f(x) dx , <X<a t) =
1
soient égales. Supposons qu’on désire k= 8 classes. Pour la loi normale centrée réduite, les intervalles qui
divisent l’étendue en huit segments équiprobables sont [0, 0,32), [0,32, 0,675), [0,675, 1,15), [1,15, <=o),
et leurs quatre équivalents négatifs. En notant a0, a{,..., ces born
on définit les nouvelles bornes des intervalles par la transformation + sat, = 0, 1, ..., 8. Par
exemple, la borne de droite du sixième intervalle est
a6 x + sa6= 12,04 + (0,08) (0,675) = 12,094.
i
intervalle, p, = ^ = 0,125, donc les fréquences espérées sont E{= npi = 100(0,125) = 12,5
Le tableau 10.4 donne les fréquences observées et espérées, et la figure 10.12 illustre leur distribution
< T A f ./ *
-v;
f /A
I p i l ü llip ii i
/ 1 * / • I *.—
gu mm
.W T - |ÿ>l A . ^ C M V A J A . A l
►
Les tests d'hypothèses
1. Hypothèses et seuil
H0: La loi normale est un bon modèle pour la tension de sortie ;
H, : La loi normale n’est pas un bon modèle pour la tension de sortie.
Le seuil a été fixé à a = 0,10. '
2. Règle de rejet de H0
Puisque les deux paramètres de la loi normale ont été estimés, on compare la valeur calculée u0 au
quantile d’une loi du khi-carré aveck - p - 1 = 8 —2 —1 = 5 degrés de liberté.
Le modèle normal sera rejeté si
A
II
wi z
v»
71y=l
/V C10.90)
v j ~=-n
n± O lr
= nW'Vj C10.91)
Ainsi, pour les grandes tailles n(ou plutôt pour des fréquences espérées p
la distribution approximative suivante sous H0:
r c
(10.92)
/=i j-i
Comme dans le cas du test d’ajustement du khi-carré, on peut interpréter la statistique UQ
comme une « distance » entre le modèle d’indépendance hypothétique et les fréquences obser
vées. Si cette distance est trop grande, il faut rejeter le modèle.
( r - l ) ( c - ,)■
y).
Les tests d'hypothèses
Exemple 10.29
Une entreprise doit choisir un régime de pension parmi trois. La direction désire savoir si la préférence
pour un régime est indépendante de la catégorie d’emploi au seuil de 5 %. Le tableau 10.6 donne les
opinions d’un échantillon aléatoire de 500 employés.
X, = Régime de pension
Xy = Catégorie d'emploi 1 ;
2 3 Tntal
1Uul 1
i _■ .. —
- »._.
1 : Cadres 160 140 40 340
2:Employés payés à l’heure 40 60 60 160
Total 200 200 100 500
1. Hypothèses et seuil
H0: Le régime de pension favori et la catégorie d’emploi sont indépendants;
Ht : Le régime de pension favori et la catégorie d’emploi sont liés.
2. Règle de rejet de H0
On rejettera H0 si uQ= . 2= 5,99.
3. Calcul de la statistique observée
On calcule d’abord les estimations des probabilités marginales :
P(Xr-
A
L’équation 10.92 donne la formule pour la statistique du test. Sa valeur observée est donc
CHAPITRE 10
4. Décision
Puisque uQ> %l05,2= 5,99, on rejette l’hypothèse d’indépendance.
5. Conclusion
La préférence pour les plans de pension n’est pas indépendante de la catégorie d’emploi.
Résumé
a = P (Rejeter H01H0 est vraie) = P (erreur de première espèce) = Seuil du test
P = P(Ne pas rejeter H0IH, est vraie) = P(erreur de deuxième espèce)
1—p - P(Rejeter H0IHj est vraie) = Puissance du test
Seuilobservé (valeur P) : probabilité que la statistique du test prenne une valeur au moins aussi
extrême que celle observée, si H0 est vraie. (On rejette H0 si la valeur P est inférieure à a.)
- .« r — * - » *»■— * * V V —»
„ * .-* 2 Hi Ai ^ A2
: kl Z<xl2 >
4 = lAi -Aal/V^ + CTj2
cr7 et c \ 1 2 2 J = (A, - H 2)/yJ<JÎ + <7\
H,: a, >Aa ^0 ^or
connues r + 1
T,o
où fa —fa —fa , sjyfn Hj • lljy^ 0 tn > t a\n - 1 t/ - ■
i/r,/
» «y (7
<7 ]et c 2 H| : < 0 a:«- ! à — ~£//; / (J
inconnues,
échantillons
appariés
H0: C H, : a 2 * a 2 “0 1 a,/CT0
0 ou
U<Fl-a/2;fl| - l.nj- I
H, : c?> c? fo>Fa: n. - I. j u - 1 A= c ,/c .
H o •P = P0* cr/2
n grand ’O
H, : p>P 0 2o>2,
H :p<p0
H0 : X x et r c
H, : X, et X2 o (r-IXc-D
X 2 sont 0 ne sont pas
indépendantes 1*1>*I indépendantes
CHAPITRE 10
/ ■w .
distribution. Les cinq derniers essais de
Les données des exercices avec le symbole Q*J ce traitement ont donné les rendements
sont aussi disponibles en format électronique. suivants (en pourcentage) :
91,60 ; 88,75 ; 90,80 ; 89,85 ; 91,30.
10.1 La résistance moyenne à la rupture a) Y a-t-il une raison de croire que le
d’une fibre utilisée pour fabriquer du rendement moyen soit inférieur à 90 ,
tissu doit être d’au moins 160 lb/po2. au seuil de 5 % ?
Selon l’expérience acquise, l’écart-type de
b) Quelle est la puissance du test si le
la résistance à la rupture est de 3 lb/po2,
rendement réel est de 87 % ?
et la loi normale est un bon modèle
pour cette variable. On soupçonne que la c) Calculez (à partir de la définition de p)
résistance moyenne n’est pas suffisam la taille de l’échantillon nécessaire pour
ment élevée, mais il faudrait le démontrer détecter un rendement moyen réel de
avec une conclusion forte pour apporter 87 % avec une probabilité de 0,95.
des changements à la production. On veut 10.3 On sait que le diamètre d’un certain type
effectuer un test d’hypothèse à partir d’un de boulon présente un écart-type de
échantillon aléatoire de quatre morceaux 0,001 cm, et que ce diamètre suit une loi
de tissu en utilisant un seuil de = 0,05. normale. Le responsable du contrôle de la
L’hypothèse nulle peut donc s’écrire qualité croit que le diamètre moyen diffère
H0: ju =160. de la norme en vigueur, soit 0,255 cm. Il
a) Quelle serait la bonne formulation pour effectue un test d’hypothèse au seuil de
l’hypothèse alternative ? 1 % à partir d’un échantillon aléatoire
b) Déterminez la loi de la moyenne de 10 boulons. Il obtient une valeur P
échantillonnai sous H0: = 160. égale à 0,028.
Tracez grossièrement la courbe qui la a) Quelles sont les hypothèses statistiques
représente et identifiez la zone de rejet appropriées pour répondre aux interro
de H0. gations du responsable ?
c) L’échantillon donne une résistance b) Quelle conclusion le responsable a-t-il
moyenne à la rupture de 158 lb/po2. tiré de son expérience ?
Quelle est votre conclusion ? c) Pouvez-vous déduire la valeur observée
d) Sur le graphique tracé en b), ajoutez la de la statistique du test (z0) ?
courbe représentant la loi de la moyenne d) Sachant que le diamètre moyen obtenu
échantillonnai lorsque la vraie valeur dans cet échantillon est supérieur à la
de juset de 156 lb/po2. Hachurez la zone norme en vigueur, déterminez sa valeur
correspondant à la probabilité d’erreur à la lumière des informations que vous
de deuxième espèce. possédez.
e) À partir de la figure tracée en d), esti
10.4 Un ingénieur veut tester l’hypothèse que
mez la probabilité de ne pas rejeter H0
le point de fusion moyen d’un alliage est
(à tort) si la fibre a une résistance réelle
de 1000 °C. Son équipe et lui conviennent
à la rupture de 156 lb/po2. Vaut-elle
de rejeter l’hypothèse nulle si le point
environ 1%, 15 %, 50 %, 85 % ou 99 % ?
de fusion moyen obtenu avec 5 mesures
10.2 On étudie le rendement (en pourcentage) échantillonnais est supérieur à 1010 ou
d’un traitement chimique. Selon une inférieur à 990 °C. Dans chacune des
expérience antérieure liée à ce pro situations ci-après, déterminez si une
cédé, la variance du rendement est de erreur est commise (et de quelle espèce)
5 %2, et la loi normale modélise bien la ou non.
Les tests d'hypothèses
aléatoire simple parmi tous les enfants ne versent pas le même volume net, que
de 10 ans du Canada) ? ce volume soit de 16 centilitres ou pas.
b) Supposons qu’une des équipes de Un échantillon aléatoire est prélevé de
recherche a aussi mesuré la taille des la production de chaque machine.
enfants. Ils ont obtenu des moyennes
échantillonnales de 137,9 cm chez les Machine 1 Machine 2
garçons et de 138,1 cm chez les filles. 16,03 16,01 16,02 16,03
Leur seuil observé du test bilaté 16,04 15,96 15,97 16.04
ral pour H0: fiQ= a été de 0,042. 16,05 15,98 15.96 16.02
Laquelle des conclusions ci-dessous 16,05 16,02 16.01 16.0!
vous apparaît la meilleure ? 16,02 15,99 15,99 16.00
La différence de taille entre les garçons
Moyenne 16,015 16.005
et les filles de 10 ans...
Écart-type 0,0303 0.0255
i) est significative statistiquement,
mais non significative en pratique.
a) Tracez la distribution de la différence
ii) est significative statistiquement, et
de moyennes échantillonnales sous H0,
significative en pratique.
et identifiez la zone de rejet de H().
ni) est non significative statistiquement,
b) Le service de contrôle de la qualité
mais significative en pratique. a-t-il raison? Utilisez a = 0,05.
iv) est non significative statistiquement, c) Calculez la puissance du test pour une
et non significative en pratique. véritable différence des moyennes de
10.14 Déterminez si les énoncés suivants sont 0,01 centilitre.
vrais ou faux.
10.16 La fabricante d’un nouvel analgésique
a) Dans un test d’hypothèse sur la moyenne
veut démontrer que son produit agit au
d’une loi normale, plus la taille d’échan
moins deux fois plus vite que l’analgé
tillon est grande, plus a sera petit.
sique de sa concurrente. Plus précisément,
b) Dans un test unilatéral de comparaison elle veut tester
de moyennes, plus le seuil a est petit,
plus la valeur Pest petite. H0: Afi = 2/z2,
c) À partir d’un échantillon aléatoire de H, : /i, > 2/6,
voitures d’un certain modèle, on a cal où //, est le temps moyen d’absorption de
culé un intervalle de confiance à 95 % l’analgésique de la concurrente et /6, le
pour la vitesse maximale (en km/h), temps moyen d’absorption du nouvel anal
soit [271, 274]. La valeur P du test gésique. En supposant que la loi normale
H0: ju = 273 contre H,: * 273 est est un bon modèle et que les variances
alors supérieure à 0,05. o \ et <72 sont connues, suggérez une
d) Dans un test de comparaison de procédure pour tester cette hypothèse. En
moyennes sur des échantillons appa d’autres mots, donnez la formule de la sta
riés, on peut supposer que la cova tistique du test, précisez sa loi et énoncez
riance entre Xt et est nulle sous H0. la règle de rejet de H0.
e) La finalité d’un test d’hypothèse est de
10.17 Un article de Proceedings of the
confirmer laquelle de H0 ou de H, est
Winter Simulation Conférence (1998,
vraie.
p. 1079-1086) traite de la validation des
10.15 Deux machines remplissent des bouteilles modèles de simulation de la circulation
©■ en plastique d’un volume net de 16 centi routière. Le but de l’étude est de modifier
litres. On suppose raisonnablement le réseau routier pour optimiser l’efficacité
que les procédés de remplissage sont et la sécurité de la circulation. Quatorze
normaux avec pour écarts-types cr, = 0,015 vitesses (en pieds par seconde) sont mesu
et cr2 = 0,018. Le service de contrôle de la rées à une intersection donnée. Quatorze
qualité soupçonne que les deux machines observations sont simulées à l’aide du
CHAPITRE 10
•
écart-type de 1,4 min. Un échantillon
Sur le terrain Modèle aléatoire de 10 photos est choisi pour
Moyenne 58,62 58,67 tester la nouvelle développeuse. Le temps
Ecart-type 5,49 8,03 moyen de développement est de 7,3 min
avec un écart-type de 0,9 min. (Consi
En supposant la loi normale avec des dérez que le temps de développement
variances égales, effectuez un test est une variable aléatoire normale dont
d’hypothèse afin de déterminer s’il y a une la variance est la même d’une dévelop
différence significative entre les données peuse à l’autre.)
sur le terrain et les données simulées par a) Au seuil de 5 %, le temps de dévelop
le modèle. Utilisez a = 0,05. pement moyen est-il plus court avec la
10.18 Les données suivantes sont les durées de nouvelle développeuse ?
(J+J combustion (en minutes) de deux types b) La direction précise qu’on achètera la
différents de torches. nouvelle développeuse si on peut mon
trer que le temps moyen est réduit
Type 1 Type 2 d’au moins 2 minutes. Sans refaire
de test, déterminez si l’hypothèse
63 82 64 56
81 68 72 63 Ho: ^ a„c“ /Vouv = 2 sera reietée au
profit de H ,://Anc- / ^ ouv>2.
57 59 83 74
66 75 59 82 10.20 On analyse deux méthodes de prépara-
82 73 65 82 Q+f tion d’essence à partir de pétrole brut.
Moyenne 70,6 70,0 On suppose que les rendements des deux
Ecart-type 9,42 10,02 procédés sont normalement distribués.
L’usine pilote a donné les rendements
On suppose que la loi normale est un bon ci-dessous.
modèle pour ces données.
Procédé Rendements (%)
a) Sachant que le seuil observé (la
valeur P)du test F bilatéral de1com24,2 26,6 25J 24,8 25,9 26,5
paraison de deux variances est 0,86, 2 21,0 22,1 21,8 20,9 22,4 22,0
testez l’hypothèse que les durées
moyennes de combustion sont inégales a) Y a-t-il une raison de croire que le
au seuil de 5 %. procédé 1 a un plus grand rendement
b) Quelle est la valeur P du test que vous moyen ? Utilisez a= 0,01 et su
avez réalisé en a) ? Toutes choses étant que les deux variances sont égales.
égales par ailleurs, la valeur P serait- b) À l’aide des courbes caractéristiques,
elle plus grande ou plus petite si la trouvez la puissance du test effectué
différence entre les deux moyennes en a) si le rendement moyen du pro
était plus importante ? Quelle serait cédé 1 est supérieur de 5 % à celui
la valeur P si le test de comparaison du procédé 2.
de moyennes était unilatéral à droite ?
c) À l’aide des courbes caractéristiques,
c) Est-il exact de dire que la valeur P est
calculez la taille requise de l’échan
la probabilité que l’hypothèse nulle soit
tillon du test effectué en a) pour que
vraie ?
l’hypothèse nulle soit rejetée avec une
10.19 Le service de développement de photos probabilité de 0,90 si le rendement
professionnelles envisage de remplacer moyen du procédé 1 dépasse de 5 %
sa développeuse. Un échantillon aléatoire le rendement moyen du procédé 2.
Les tests d'hypotheses
10.21 Un nouveau filtre est installé dans une même effet sur le rythme cardiaque. Les
cheminée. Avant son installation, un résultats obtenus sont les suivants.
échantillon aléatoire a fourni les don
nées suivantes à propos du pourcentage Sujet Type A Type B
d’impuretés :
1 162 161
x ] = 14,5, sf = I5l,l7 et = 8. 2 163 187
3 140 199
Après l’installation, un nouvel échantillon 4 191 206
aléatoire a fourni 5 160 16!
x2= 10,2, s= 54,73 et n2=6 9. 158 16! !
7 155 i«
•
»
î
y
It X
'
*, #
\ »
-
Nombre d ’unités Nombre Probabilité Fréquence
défectueuses d’observations théorique espérée (o, - &, ) '
A
p a r jo u r o{ Pt É( = npt Ef
0-10 6 0,054 6,27 0.012
11-15 11 0,092 10,76 0,005
16-20 16 0,163 19,06 0,493
21-25 28 0,214 24,99 0,362
26-30 22 0,207 24,25 0,209
31-35 19 •
9 ♦
9 ♦
9
36-40 11 ♦
9 •
9 ♦
9
■ ïtÿt/vr,, *»
(£ÿ) et le calcul de
manquantes. E‘J
— w
1,68 9
•
9
• 5,67 État
Politique Désuet Normal Moderne Total
b) Quelle est la valeur de la statistique Agressive 52 58 134
observée du test du khi-carré pour 24
17,0 62,3 54,7
l’indépendance ? 2,87 9• 0,20
c) Quelle est la valeur P du test ? Que J .
pouvez-vous conclure au seuil de 5 %? Neutre 15 73 86 174
22,1 9♦ 71,0
10.35 Un article du Research in Nursing and
2,28 0,77 3,16
Health (vol. 21, n° 4, 1998, p. 285-295)
rapporte une étude sur la relation entre Non 17 80 36 133
l’activité physique et le statut socioécono agressive 9♦ 61,8 54,3
mique de 1507 femmes blanches adultes. 9• 5,34 6,16
Les données sont présentées ci-dessous.
Total 56 205 180 441
Statut Activité physique
socioéconomique Inactive Active
•
Total 10.37 Soit le processus du moulage par
Faible 216 245 461 injection décrit à l’exercice 10.28.
Moyen 226 409 635 a) Présentez ces données sous la forme
Élevé 114 297 411 d’un tableau de contingence (deux
lignes et deux colonnes).
Total 556 951 1507
b) On décide de réaliser un test du khi-
carré à partir de ce tableau. Quelle sera
Testez l’hypothèse que l’activité physique l’hypothèse testée : l’homogénéité ou
est indépendante du statut socioécono l’indépendance ? Énoncez la règle de
mique au seuil de 5 %. rejet de Hqau seuil de 5 %, calculez la
10.36 Un article du Journal of Marketing valeur de la statistique observée et tirez
Research (vol. 7, n° 1, 1970, p. 36-42) vos conclusions.
rapporte une étude sur la relation entre c) Cette procédure équivaut-elle
l’état des installations des stations- à la procédure de test utilisée à
services et l’agressivité de leur politique l’exercice 10.28?
es expériences font partie intégrante du processus de découverte
et d'apprentissage. Les conclusions qu’on peut tirer d’une expérience
r aléatoire dépendent en partie de la façon dont elle est menée. P ar
S’il n’y a que deux méthodes de durcissement enjeu, l’expérience peut être planifiée et analysée
à l’aide des méthodes étudiées au chapitre 10. Autrement dit, l’expérimentateur ne considère
qu’un facteur - les méthodes de durcissement - et il n’y a que deux niveaux de facteur. Si l’expé
rimentateur cherche la méthode de durcissement qui maximise la résistance à la compression,
alors il utilise un test t pour découvrir si les deux moyennes diffèrent.
Dans de nombreuses expériences à un seul facteur, plus de deux niveaux de facteur
doivent être considérés. Par exemple, l’ingénieur civil peut devoir étudier cinq méthodes de
durcissement différentes. Dans ce chapitre, nous décrivons l’analyse de la variance, une
méthode qui permet de comparer les moyennes de plusieurs niveaux d’un facteur en isolant
les sources de variabilité de la mesure d’intérêt. Une généralisation de cette analyse de la
variance dans le cas de plusieurs facteurs, les plans factoriels d’expériences ainsi que l’ana
lyse par blocs (dans le cas où les unités expérimentales sont hétérogènes) seront également
présentés.
Exemple 11.1
Un fabricant de papier pour sacs d’emballage veut améliorer la résistance à la traction de son papier.
Le service technique de fabrication pense que la résistance à la traction est fonction de la concentration
en bois dur de la pâte et que les valeurs de concentration d’intérêt s’étendent de 5 à 20%. L’ingénieur
responsable de l’étude décide d’étudier quatre niveaux de concentration en bois dur: 5 %, 10%, 15 % et
20%. Il décide aussi de fabriquer 6 éprouvettes par niveau de concentration. Les 24 éprouvettes sont
testées dans un ordre aléatoire à l’aide d’un dynamomètre de laboratoire. Le tableau l l.l énumère les
résultats de cette expérience.
t
,y*»t
'
y
é
, \
V fv,
*
y
.J
/
-»
*1
71L
‘
.f
>
% y y
.
çTeÇ•kvJfv-j♦>c L(,*••<. -,*>*j'
'
J '' i
.
f
/y SL"I*n]*T*| *iî
■
[
Concentration Observations
en bois dur (%) 1 2 3 4 5 6 Toiai Moyenne
,
5 7 8 15 11 9 10 60 10.00
•
10 12 17 13 18 19 15 94 15.67
15 14 18 19 17 16 102 17,00
18 1
20 19 25 22 23 18 20 : 127 21,17
383 15,96
Il s’agit d’un exemple d’expérience complètement aléatoire à un facteur avec = 4 niveaux. Les niveaux
de facteur sont parfois appelés «traitements». Chaque traitement comporte ici = 6 observations ou
répétitions.
La description graphique
Il importe d’analyser graphiquement les données d’un plan d’expériences pour se donner une idée
de l’importance des effets observés avant de procéder à l’analyse numérique proprement dite. La
figure 11.1 {voir à la page suivante) présente les diagrammes en boîte de la résistance à la traction pour
les quatre niveaux de concentration en bois dur. Cette figure laisse croire qu’un changement de concen
tration en bois dur influe sur la résistance à la traction ; plus précisément, une plus grande concentra
tion en bois dur donne une plus grande résistance à la traction observée. Ces tendances sont peut-être
fortuites, c’est-à-dire peut-être dues au hasard de l’échantillonnage, ou peut-être sont-elles bien réelles
dans les groupes comparés. L’analyse statistique permettra de déterminer si les différences observées
sur le graphe sont statistiquement significatives ou non. En outre, la distribution de la résistance à la
traction d’un niveau de bois dur particulier est à peu près symétrique, et la variabilité de la résistance à
la traction ne change pas de façon draconienne lorsque la concentration en bois dur change. ►
346 CHAPITRE 11
L’interprétation graphique des données est toujours utile. Les diagrammes en boîte montrent
la variabilité des observations à l’intérieur d’un traitement (c’est-à-dire d’un niveau de facteur)
et la variabilité entre les traitements. Voyons maintenant comment analyser statistiquement les
données d’une expérience aléatoire à un seul facteur.
11.1.1 Le modèle
Supposons qu’on désire comparer a niveaux différents d’un facteur. La réponse observée pour
chacun des a traitements est une variable aléatoire. Les a niveaux du facteur de l’expérience
peuvent être choisis de deux façons différentes :
1. Le modèle à effets fixes - L’expérimentateur choisit spécifiquement les a traitements.
Dans ce cas, on désire tester des hypothèses sur les effets des traitements (et les
estimer), et les conclusions ne s’appliquent qu’aux niveaux de facteur considérés dans
l’analyse. Les conclusions ne peuvent être étendues aux traitements similaires qui n’ont
pas été considérés.
2. Le modèle à effets aléatoires ou à composantes de variance - Les a traitements
constituent un échantillon aléatoire d’une plus grande population de traitements. Dans
ce cas, on aimerait pouvoir étendre les conclusions (qui reposent sur l’échantillon de
traitements) à tous les traitements de la population, qu’ils soient explicitement considé
rés dans l’analyse ou non. Ici, les effets des traitements sont des variables aléatoires, et
savoir lesquels en particulier sont étudiés est peu utile. On teste plutôt des hypothèses
sur la variabilité entre les niveaux et on essaie d’estimer cette variabilité. (Ce modèle
n’est pas traité dans ce manuel.)
Cette section porte sur l’analyse de la variance pour le modèle à effets fixes d’un plan à un
facteur. Le tableau 11.2 montre une façon compacte de présenter les données. (Notons qu’un
L'analyse de la variance et les plans d'expériences
chiffrier servant de base à l’analyse par un logiciel ne contiendrait qu’une ligne par observation,
ainsi qu’une colonne identifiant le traitement.) On considère d’abord le cas équilibré, où un même
nombre d’observations n est effectué pour chaque traitement. Le plan d’expériences déséquilibré,
où le nombre d’observations varie d’un traitement à l’autre, sera traité à la sous-section 11.1.5.
•
9
9
•
♦
9
9
• 1
i a
«
• 9 • 9 • A
a y. Y 1 aï Y a n
Ya• V a m
Total Y•• y # #
r*
globale - y..
Y=•
n
" N’
où N = an est le nombre total d’observations. Un point en indice signifie donc une sommation
sur l’indice qu’il remplace.
Il est à noter que Y représente la variable aléatoire et y , sa réalisation. Cette conven
tion sera respectée pour la variable Y, mais pas nécessairement pour toutes les autres
quantités aléatoires dans ce chapitre.
. .. *
où Y. représente la /-ième observation effectuée durant le traitement r. jj est la moyenne globale d<
tous les traitements; T est le paramètre associé au Même traitement, appelé l’«ef et du 1P•V-rlnIiICfA tl lr i#il l l1 1
On exige que les observations soient effectuées dans un ordre aléatoire afin que le milieu
dans lequel les traitements sont appliqués soit aussi uniforme que possible, C’evi c e o u o n
CHAPITRE 11
appelle un « plan d’expériences complètement aléatoire ». Dans ce modèle, les « effets des trai
tements » (t.) sont habituellement définis comme la différence entre la moyenne du traitement i
et la moyenne globale, de sorte que
Autrement dit, si l’hypothèse nulle est vraie, alors chaque observation est constituée de
la moyenne globale n plus une réalisation de l’erreur aléatoire E . De façon générale, on écrit
souvent la moyenne du i-ième traitement comme suit :
/i; = JJ, + Tit = l , 2 , ...,
Les hypothèses à tester par l’analyse de la variance peuvent donc s’écrire :
Un critère d’estimation consiste à trouver les valeurs de fl et de T. qui minimisent la somme des
carrés des erreurs E.
.. Avec cette méthode d’estimation de paramètres, appelée la «
des moindres carrés», la supposition de normalité des erreurs n’est pas nécessaire. La somme des
carrés des erreurs à minimiser est
En dérivant l’équation 11.5 par rapport à ji et à T. et en égalisant à zéro les dérivées obtenues,
on obtient <3+1 équations, appelées « équations normales des moindres carrés ». Ces équations
ne sont pas linéairement indépendantes et, pour les résoudre, il faut ajouter la contrainte
naturelle
i “ 1 2»^
} • • ♦ y a §
Cette solution est intuitivement intéressante puisque la moyenne globale est estimée par la
moyenne de toutes les observations et que l’estimateur de tout effet de traitement est pré
cisément la différence entre la moyenne de traitement et la moyenne globale. Il faut noter
que cette solution n’est pas unique puisqu’elle dépend de la contrainte (voir l ’équation 11.6)
choisie.
Exemple 11.2
Estimons les résistances moyennes à la traction à différents niveaux de concentration en bois dur pour
l’expérience de l’exemple 11.1.
A
A
11
y » =~ ^10% V
NJ
•
=
ÿ3. == fia* = 17,00 lb/po2 V =y 3 . =-
1,04
A A
La somme totale des carrés, notée , est une mesure de la variabilité totale des données,
et s’écrit sous la forme
Décomposition de la variabilité
a n
X X (v
i- 17=1 1= 1 /=1 y = l
SS-T = SStraitements
. +
L’équation 11.9 montre que la variabilité totale des données, exprimée par la somme totale
des carrés S S T, peut être subdivisée en une somme des carrés des différences entre les moyennes
des traitements et la moyenne générale (55traitements, la somme intertraitements) et une somme
des carrés des différences entre les observations dans un traitement et la moyenne dans ce
traitement ( S S E, la somme intratraitements). La somme 5Straitements exprime les différences entre
les traitements, tandis que S S E exprime le fait que les différences entre les observations dans
un traitement et la moyenne du traitement sont dues à une erreur aléatoire ou à une autre cause
que le traitement considéré. (Bien que les sommes de carrés soient des variables aléatoires,
nous utiliserons toujours les lettres majuscules pour représenter à la fois les variables et leurs
réalisations, sans distinction.)
Certaines formules de calcul « efficaces » des sommes de carrés s’obtiennent en développant et
en simplifiant les définitions de 55|Mitememj et S S T de l’équation 11.9. (Elles ne sont utiles que si on fait
les calculs à la main. En général, les données de ce genre sont analysées à l’aide d’un ordinateur.)
a n
Y
I I = X X ij ( 11. 10)
.* h
1 1 N
y?.
» .
« Y12
A #
•
N.. . * SS traitenwm* x ^ (11.11)
- ✓ /=î n ~N %- -
V é •
, •< m . • » - • , * # V V ,•
par soustraction ou encore en combinant les variances
échantillonnâtes des traitements : a. *■*.
Si •• T
. v -
SS SS. SS traitements
» .\ • _
// > y
K n 1) S f , ( 11.12)
/r=! »V
s
-t.
Exemple 11.3
Considérons l’expérience de la concentration en bois dur décrite à l’exemple l l.l. Les sommes de car
rés se calculent à l’aide des équations 11.10, 11.11 et 11.12 comme suit:
SST 4 6 2 yl
;=i j-1 y‘J ~~N
/v
2
(383)
(7) +(8) + •—h(20) 512,96,
24
4 v2
cçtraitements yl
s,= i" n; N
(60)2+(94)2+(102)2+(127) (383)2
382,79,
6 24
ss SS-p ‘^ ‘^traitemenis
512,96-382,79 = 130,17.
traitements
~Xa -1 si H 0 est vraie,
et que, en général,
Toutefois, les trois sommes des carrés ne sont pas indépendantes puisque 5S ^ et SSf s’ad
ditionnent pour donner SST. Le théorème l l.l ( à la page suivante), qui est une forme par
ticulière du théorème de Cochran, sert à développer une procédure de test.
I
CHAPITRE 11
v&
ml&u&œ'1
m H
m B ^ I j !T^i c-i iti >J lnLn»T»in7HtMHBHHBHBIfr
t v V „ > ' • '• •• : V - , * \ î ' i ' > ^ l 3 r b * ; T . - - v s i ^ r V '- '' - l ' S r ^ ’ î v - ï - f ' ^ y V < X L i r ‘f v V * * : \C .' . - . V > £ ? • ^ ' - V . «.
< y.
«. •'st:.
f .
^ -. .
'■ 4&s^Sase
•
. . .
Soit Z, pour i = 1, 2, ..., v, des variables indépendantes suivant une loi N(0, i). On pose
V
SI
i=i
Q\ + 42?+ • « •
+ &>
Démonstration
Entre les i r a i tc m c n u i
a- MS
,
traitements
,
mse
1
traitements 4 traitements
Total 1
Exemple 11.4
On considère à nouveau l’expérience de la concentration en bois dur décrite à l’exemple 11.1. On peut
utiliser l’analyse de la variance pour tester l’hypothèse que des concentrations différentes en bois dur
n’influent pas sur la résistance moyenne à la traction du papier. On limite l’erreur de première espèce à 1 .
1. Hypothèses et seuil
HQ: ju{= F2= = ou encore H 0: t1 = t2 = t3 = t4=0.
2. Règle de rejet de H0
On rejettera H0 sif(3> F0Ql;3,20 4,94. ►
CHAPITRE 11
4. Décision
Comme la statistique observée est supérieure à F001.320 = 4,94, on rejette H0.
5. Conclusion
La concentration en bois dur de la pâte influe de façon significative sur la résistance du papier.
Si on voulait calculer la valeur P de ce test, il faudrait évaluer la probabilité d’observer une statistique
F0 au moins aussi extrême que 19,61 si H0 était vraie. En d’autres termes, quelle est la probabilité
qu’une variable aléatoire suivant une loi de Fisher à 3 et 20 degrés de liberté prenne une valeur au
moins aussi grande que 19,61 ? Cette probabilité est presque nulle, ce qui indique que H0 a été rejetée
avec une grande conviction.
traitements
traitements
= X (", - DS,2.
i=l
Pour résoudre les équations normales afin d’estimer les paramètres ji et T, on utilise la contrainte
XJL, niî i = 0. L’analyse de la variance n’exige aucun autre changement.
L'analyse de la variance et les pians d'expériences
Deux avantages importants militent en faveur du choix d’un plan d’expérience-s équilibré. Le
premier est la relative insensibilité de la statistique du test aux petits écarts à la supposition d’éga
lité des variances si les tailles des échantillons sont égales. Ce n’est pas le cas pour des tailles
d’échantillons inégales. Le deuxième est la maximisation de la puissance du test si les tailles des
échantillons sont égales.
IJ Y e 11
Exemple 11.5
Le tableau 11.5 indique les résidus (en livres par pouce carré) pour l’expérience de la concentration
en bois dur.
—V^
N«>f . à J P
*■ < À| * D*^^a
^B1^
^ AiW
BH f 4 V
f
l^^
BBw #■B. T
Vm_T• V
U)V u ■
■u 1JNA U
Af ^
BT Bit SJ i . { 1 I
"•^
B B V
V• T
jHV• r» 1r ^
1 W^r W
'
V ï JV 1 W ÆJ
f 1 Il »y w 1 1 bJ 1 l r l 1 • MB■ 1 ♦ I L >. * . I
Concentration 1
«
-/ I
Il existe des tests d’hypothèses sur les résidus qui permettent de valider les postulats du
modèle en spécifiant un seuil a, mais on se contentera ici de présenter des méthodes graphiques.
Exemple 11.6
La figure 11.4 montre l’histogramme et le diagramme quantile-quantile normal des résidus de l’expé
rience de concentration en bois dur. Ces graphiques ne révèlent aucune déviation grave du postulat de
normalité des observations.
. . . « *- ■«• I ■ t . i ^ ■
Exemple 11.7
La figure 11.5 représente les résidus tracés en fonction du numéro du traitement et de la valeur ajustée
ÿ... Bien que les étendues ne soient pas identiques d’un traitement à l’autre, les variations des observa
tions diffèrent trop peu pour qu’on s’inquiète que ce postulat ne soit pas respecté. ►
L'analyse de la variance et les plans d'expériences
&
La méthode de Fisher
L’idée de base de la méthode de Fisher consiste à calculer la plus petite différence significative
moyennes (PPDS, ou en anglais LSD, pour least significant différence) consi
dérer significative toute différence de moyennes échantillonnales supérieure à cette valeur. La
PPDS est en fait la marge d’erreur de l’intervalle de confiance sur une différence de moyennes.
Si l’on suppose que les erreurs sont normalement distribuées, chaque Y suit une loi
g 1!ri). En utilisant MSE comme estimateur de <72, on peut utiliser la loi t pour établir
l’intervalle de confiance sur la différence des moyennes. Ainsi,
La méthode de Bonferroni
Cette méthode consiste à diviser le seuil des tests par le nombre de comparaisons à effectuer,
soit m= a(a - l)/ 2. Supposons, de façon générale, qu’on a besoin de intervalles de confiance
et qu’on souhaite obtenir une probabilité de 1 - a que tous ces intervalles contiennent la vraie
valeur de la différence. Selon l’inégalité de Bonferroni,
P(les m énoncés sont tous simultanément justes) 1 a> 1 5>„ (11.15)
1=1
OÙ 1 a. représente le niveau de confiance associé au Même intervalle en cause. Dans la pra
tique, on définit le niveau de confiance simultané 1 - a, puis on choisit chaque valeur a. de
manière à ce que Z™, a, - a . Pour ce faire, on pose habituellement a. = a / m .
La plus petite différence significative selon cette méthode, notée BON pour Bonferroni, est donc
IM S E
BON = ta/2m\ N-a
n
Exemple 11.8
Reprenons l’exemple des concentrations en bois dur. La plus petite différence significative selon la
méthode de Fisher est
2(6,51)
PPDS = t0,025; 20 2,086(1,473) = 3,07.
6 ►
L'analyse de la variance et les plans d'expériences
Selon Bonferroni, on obtient une valeur un peu plus grande (donc plus conservatrice) :
4(4-1) a • x - H
m = -------- = 6 comparaisons à effectuer
2
2(6,51)
BON = t0,05/12:20 2,927(1,473) = 4,31.
6
Les différences significatives obtenues après avoir évalué les différences de moyennes observées sont
indiquées ci-dessous.
PPDS BON
bv - y J = 110,00 -- 15,67| == 5,67 (signif.) (signif.)
lÿ,. - ÿ j | = 1
10,00 -- 17,00| == 7,00 (signif.) (signif.)
= |10,00 -- 21,17| == 11,17 (signif.) (signif.)
i
&
•
|y2. ~ y 3*I = 1
15,67 -- 17,00| == 1,33
\ÿ2. ~ ÿ+1= 115,67 -- 21,17| == 5,50 (signif.) (signif.)
\ÿ* ~ ÿ . | = 1
17,00 -- 21,17| ==4,17 (signif.)
On peut tracer le graphique des moyennes des traitements en reliant par un trait horizontal les moyennes
qui ne sont pas différentes ( voir les figures 11.6et 11.7).
T T T -
10,0 12,0 14,0 16,0 18,0 20,0
■
'r
y v .
IhileS
*■. t ;
' ^
A * t Les résultats du test de Bonferroni
Le test de Tukey
La procédure de Tükey utilise une loi appelée « distribution de l’étendue studentisée ». La sta
tistique de l’étendue studentisée est
où Kmax est la plus grande moyenne d’échantillon et min, la plus petite moyenne d’échantillon.
Appelons qa. ale quantile d’ordre 1 — a de la distribution de , où a est le nombre d
360 CHAPITRE 11
(11.16)
La table VII de l’annexe contient les valeurs de q Of* ci%j pour a = 0,05 et 0,01, ainsi qu’un
choix de valeurs de a et d e / Dans la procédure de Tukey, le seuil de signification de l’ensemble
est exactement a pour des tailles d’échantillons égales et au plus a pour des tailles d’échantil
lons inégales.
Exemple 11.9
Appliquons le test de Tukey à l’expérience sur les concentrations en bois dur. On se souvient que
a = 4 traitements, n —6 et MSE = 6,51. Les moyennes des traitements sont
5v = 10,00 lb/po2, ÿ2. = 15,67 lb/po2, ÿ„ = 17,00 lb/po2, % = 21,17 lb/po2.
Selon la table VII de l’annexe, si a = 0,05,
rence significative entre deux moyennes est
En d’autres mots, on conclut que deux moyennes sont différentes de façon significative si
On peut aussi établir des intervalles de confiance simultanés sur les différences des paires
de moyennes selon la méthode de Tukey. Il est démontré que
lorsque les tailles des échantillons sont égales. Cette expression représente un intervalle de
confiance simultané à 100(1 — a )%sur toutes les paires de moyennes //. —
L’interprétation des intervalles de confiance est simple. Si la valeur 0 est comprise dans
l’intervalle, la différence entre les deux moyennes n’est pas significative au seuil de significa
tion a. On note que le seuil a , dans la procédure de comparaison multiple de Tukey, représente
L'analyse de la variance et les plans d'expériences 361
une probabilité d’erreur expérimentale. Par rapport aux intervalles de confiance, a repré
sente la probabilité qu’au moins un intervalle de confiance sur les différences deux à deux ne
contienne pas la véritable différence (pour des tailles d’échantillons égales).
Le plan d'expériences
A titre d’exemple, on peut revoir la situation de l’exemple 10.22, dans laquelle deux procé
dures différentes étaient utilisées pour prédire la résistance au cisaillement de poutres en acier.
Puisque chaque poutre avait une résistance potentiellement différente et que cette variabilité
de la résistance n’était pas d’un intérêt direct, on a planifié l’expérience en utilisant les deux
méthodes compare la différence des mesures de résistance moyenne
à 0 en utilisant un test t apparié
Le test t apparié est une procédure qui permet de comparer deux moyennes lorsqu’on ne peut
effectuer tous les essais expérimentaux dans des conditions homogènes. Donc, le test t apparié
diminue le bruit (les variations indues) dans l’expérience en bloquant l’effet d’une variable
confondante (ou nuisible). Le plan d’expériences en blocs aléatoires est un prolongement du test t
apparié qu’on utilise dans les situations où le facteur d’intérêt possède plus de deux niveaux.
À titre d’exemple, supposons qu’on désire comparer l’effet de quatre produits chimiques
différents sur la résistance d’un tissu particulier. On sait que l’effet de ces produits varie beau
coup d’un morceau de tissu à l’autre. Dans cet exemple, on n’a qu’un facteur : le type de produit
chimique. On peut donc choisir plusieurs morceaux de tissu et comparer l’effet des quatre pro
duits chimiques dans les conditions relativement homogènes fournies par chaque morceau de
élimine
complets
randomized complété block design) consiste à choisir b blocs et à répéter de façon identique
l’expérience à un facteur dans chaque bloc, comme l’illustre la figure 11.8. Il y a a observations
(une par niveau de facteur) dans chaque bloc, et l’ordre d’exécution de ces observations dans
chaque bloc est assigné au hasard.
L'analyse statistique
Maintenant, analysons statistiquement un plan d’expériences en blocs aléatoires.
(11.17)
où fj. représente la moyenne globale, T. est l’effet du i-ième traitement, f$ est l’effet aléatoire du y-ième
bloc et E.V, le terme d’erreur aléatoire.
,, * h. . ^
Les effets des traitements sont, par définition, des écarts à la moyenne globale, de sorte que
X“=, T, = 0. Le modèle suppose également que /?; ~ N(0, Gp), que cr2) et que les fi. et les
E..sont indépendantes.
Soit
Y et Y , la somme et la moyenne de toutes les observations effectuées avec le traitement i ;
Y et Y,., la somme et la moyenne de toutes les observations dans le bloc y;
y . et y ., la somme et la moyenne de toutes les observations ;
N = ab, le nombre total d’observations. «
SST
T
= SS,
traitements
, , +
blocs
SS» + SSF
E. (11.19)
La décomposition du nombre de degrés de liberté correspondant à l’équation 11.19 est
ab 1 (a 1) + (b - 1) + (a m i) . ( 11.20 )
• _ ■ V * • • ( à. ' . , . m ■ ■ . ( . •* ■ * ~ f - • . 'f
L’hypothèse nulle correspondant à aucun effet de traitement (HL: T. = 0 pour tout i) est testée par le
rapport F(), c'est-à-dire
SS traitem ents /(a - 1) MS traitem en ts
SSF/(a -\)(b -\) MS
qui suit une loi de Fisher à (a - 1) et (a - l)(b - 1) degrés de liberté lorsque H0 est vraie.
L'analyse de la variance et les plans d'expériences
Le tableau 11.6 résume l’analyse de la variance; il donne aussi les formules des sommes de-
carrés, pour le calcul à la main.
Tableau >a
. * • Nombre .
Source de 5 Somme de degrés Moyenne f. ; • ..
variation des carrés de liberté des carrés F. Valeur P
1UJ| |- -*
jp|'
a yr2 x/2 MStraitements
cetraitements lYIiJ P{F >/0). où
Traitements s s .
- y '•
JLu ^ ~ a- 1
traitem ents
a-l MSE
Y2 V 2
b
Blocs ss.. = y 'j Y~ b- 1 ^ ^ b lo c s
b,ocs % a ab b- 1
55£
Erreur ssF
E
= ssT
T
- SS, , ,
traitements
- SSM
blocs (a - 1 )(* - 1 )
(a- 1)0 - 1)
.
a b r^2
Total SST
T
- y y Y.2 -
JLujLu v _l. ab- 1
1*1 7=1
Exemple 11.10
Une expérience a été menée afin de déterminer l’effet de quatre produits chimiques différents sur la
résistance d’un tissu. Cinq échantillons de tissu ont été choisis, et chaque produit chimique a été testé
dans un ordre aléatoire sur chaque échantillon de tissu. Dans cette expérience, les quatre produits
chimiques représentent les traitements, et les cinq échantillons de tissu sont les blocs aléatoires. Le
tableau 11.7 présente les données en question.
Tableau 11.7 Les données relatives à la résistance du tissu (en livres par pouce carré)
A
- - -
Produit
...
Echantillon de tissu Somme par Moyenne par I
chimique traitement traitement j
1 2 3 4 5 % ÿ !
1 1,3 1,6 0,5 1,2 1,1 5,7 1,14
2 2,2 2,4 0,4 2,0 1,8 8,8 1,76
3 1,8 1,7 0,6 1,5 1,3 6,9 1,38
4 3,9 4,4 2,0 4,1 3,4
£
OO
3,56
#*>
Somme par bloc 9,2 10,1 3,5 8,8 7,6 y.. = 39,2 X. = 1,96
Moyenne par bloc ÿ 2,30 2,53 0,88 2,20 1,90
1. Hypothèses et seuil
H0• Ml ~/^2~ 7^3— ou encore Ho:r, = r = t = t =0.
Fixons a= 0,05. ►
CHAPITRE 11
2. Règle de rejet de H0
On rejettera H0 sif0> ^o.os;3.12— 3,49.
3. Calcul de la statistique observée
Les sommes de carrés de l’analyse de la variance sont calculées comme suit :
SST
2 2 (39,2) 2
18,044,
5 20
SS b lo cs y T-2, y2
;=1 <2^
2 2
(9,2)2 +(10,1)^ + (3,5)^ +( 8, 8)z +(7,6) (39,2) 2
6,693,
4 20
SS ^ S j ‘^'■^'blocs ‘“^‘■^traitem ents
0,951.
4. Décision
Puisque 75,9 dépasse largement la valeur critique de 3,49, on rejette clairement l’hypothèse d’égalité
des moyennes. La petite valeur P nous mène à la même conclusion.
5. Conclusion
La différence entre les produits chimiques (en ce qui concerne leur effet sur la résistance du tissu) est
significative.
20 observations et 12 degrés de liberté pour l’erreur. Si l’expérience avait été exécutée comme
un plan d’expériences complètement aléatoire à un seul facteur avec b répétitions pour chaque
niveau, on aurait eu 16 degrés de liberté pour l’erreur. Donc, le blocage a coûté 4 degrés de
liberté pour l’erreur. Par conséquent, puisque la perte en degrés de liberté pour l’erreur est petite
(comme c’est le cas habituellement), s’il existe un soupçon raisonnable que les effets des blocs
soient importants, l’expérimentateur doit utiliser un plan d’expériences en blocs aléatoires. Cela
lui permet de partitionner la somme des carrés des erreurs et d’augmenter la valeur observée de
la statistique F, donc d’augmenter la puissance du test.
Si l’expérimentateur se trompe sur l’effet des blocs, l’impact de la légère perte en
degrés de liberté pour l ’erreur est négligeable, sauf si le nombre de degrés de liberté est très
petit. Vous pouvez comparer cette discussion à celle qui est présentée à la fin de la sous-
section 10.3.4.
Exemple 11.11
Pour illustrer la procédure de Tukey, on se souvient que les quatre moyennes des produits chimiques
de l’exemple 11.10 sont
ÿ,. = 1,14, ÿ2. = 1,76, ÿ3. = 1,38, ÿ4. = 3,56.
La plus petite différence significative entre deux moyennes est
MS*
^0,05; 4,12 b - 4 , 2 0 . 1 ^ = 0,53
5
On conclut donc que deux moyennes sont différentes de façon significative si
ly, ~ yj.I > 0,53.
Les valeurs absolues des différences des moyennes des traitements sont énumérées ci-dessous.
l>,. -- >J == 11,14 - 1,76| ==0,62 (signif.)
l>,. -■ >3.l== |1,14 - 1,38| ==0,24
l>,.-- >4.l == |1,14 - 3,56| «= 2,42 (signif.)
I>2. ■" >3.l=- H,76 - 1.38| == 0,38
l>2.- - >4.1:= |1,76 - 3,56| =
= 1,80 (signif.)
I>3. ■“ >4.l =
: |1,38 -- 3,56| =
= 2,18 (signif.) ►
CHAPITRE 11
Les résultats indiquent que les produits chimiques 1 et 3 ne diffèrent pas, de même que les pro
duits 2 et 3. La figure 11.9 présente les résultats sous forme graphique ; les paires reliées par un
trait ne diffèrent pas.
I
A
1
•
ï
L’exemple suivant présente les comparaisons multiples avec les méthodes de Fisher et de
Bonferroni.
Exemple 11.12
La plus petite différence significative avec la méthode de Fisher (sans correction pour le seuil global),
est
2MS
PPDS = î0.025; 12 2,179J2(Q^Q8) =0,39.
b
2MSE
BON = t0,05/12; 12 3,153J =0,56.
b
Dans les deux cas, on obtient les mêmes résultats qu’avec le test de Tukey.
Exemple 11.13
Le tableau 11.9 indique les résidus de l’expérience de l’exemple 11.10.
7 . ■1 . ' J * J ‘ | a V
— j f j r . f a s 7 — * - l / » » ' V * «B p '
J * .
! » g
Les figures 11.10 et 11.11 présentent les graphiques importants des résidus de l'expérience. D'après le
graphique quantile-quantile, la loi normale semble un bon modèle pour les résidus. On remarque que
l’échantillon de tissu (bloc) 3 présente une plus grande variabilité en résistance lorsqu’il est traité avec
les quatre produits chimiques que les autres échantillons. De plus, on note que le produit chimique 4,
qui fournit la plus grande résistance moyenne, présente aussi un peu plus de variabilité en résistance.
Des expériences de suivi peuvent être nécessaires pour confirmer ces remarques si elles sont poten
tiellement importantes.
eu\ ea\
0,5- 0,5-
0 0 ♦
1 2 •3 A Traitement 1 .2 3 A \5 Bloc
-0,5- -0,5-
a) b)
Les résidus (en livres par pouce carré) : a) par traitement; b) par bloc
eij•*
0,5
0 ♦ ■t
2 4 6 y>j
2 1 0 1
0,5-
Z,
a) b)
a) Les résidus (en livres par pouce carré) en fonction des valeurs
prédites Y ; b) le graphique quantile-quantile normal des résidus
CHAPITRE 11
L'étude de l'interaction
Dans certaines expériences, l’effet d’un facteur n’est pas le même à tous les niveaux des autres
facteurs. Il y a alors une interaction entre les facteurs. Par exemple, prenons les données du
tableau 11.10, où les nombres représentent la moyenne échantillonnai pour chaque combinaison
de traitements. Au premier niveau du facteur B, la moyenne en A2 est supérieure à la moyenne
en A r Au deuxième niveau du facteur B, l’effet de A est inversé : c’est en A l que la moyenne est
supérieure. Puisque l’effet de A dépend du niveau du facteur il y a une interaction entre A et B.
\ ■ m . y , X _ 1 A 'S I * y . a A „ ^ \ yn
B M & «►-/ 9 \ v yiu-i <n 1'■ W 7 £ v . 5 * pj V *• j» . 1{ # ^ . X» 4. . m *' V .A md
Facteur B
Facteur A B 2
10 20
30 0
Lorsque l’interaction est importante, les effets principaux correspondants ont peu de signi
fication. Par exemple, selon les données du tableau 11.10, l’effet principal de A semble nul,
puisque les moyennes en A { et en A2 sont égales. Cela pourrait nous amener à conclure que le
facteur A n’a pas d’effet. Toutefois, lorsqu’on a considéré les effets de A à différents niveaux du
facteur B, on a vu que ce n’est pas le cas. L’effet du facteur A dépend du niveau du facteur B.
Ainsi, la connaissance de l’interaction AB est plus utile que celle des effets principaux. Une
forte interaction peut embrouiller l’interprétation des effets principaux.
Il est possible d’illustrer la notion d’interaction à l’aide de graphiques. La figure 11.12a) pré
sente un cas sans interaction des facteurs. On remarque que les droites B ] et B2 sont parallèles,
ce qui indique que les facteurs A et B n’interagissent pas. L’effet de B est le même peu im porte
le niveau de A, et vice versa.
La figure 11.12b) présente un cas avec interaction. Sur ce graphique, les droites B l et B ne
sont pas parallèles ; il y a donc une interaction entre les facteurs A et B. De telles représentations
graphiques s’avèrent souvent utiles lorsqu’on présente les résultats d’expériences.
Pour contourner ces difficultés, on pourrait être tenté de varier un facteur à la fois plutôt
que de varier tous les facteurs simultanément. Cette méthode est inefficace ; elle nécessite plus
d’expérimentations que la méthode factorielle, et elle n’offre pas la certitude d’obtenir les résul
tats appropriés, car elle ignore l’interaction potentielle (Montgomery, 2001).
L'analyse de la variance et les plans d'expériences
/ c a
O
C/3 oC/2
•a
c
-g G 50-
S g 40-
R s
O <L>30-1
c3 ’c3 20
O-H
g ji 10 -
C73
(U
0-
>
O > T
Al ^2
s
Facteur A
b)
Le modèle statistique
La forme la plus simple d’expérience factorielle ne met en jeu que deux facteurs, par exemple
A et B. On a a niveaux du facteur A et b niveaux du facteur B. Le tableau 11.11 présente le plan
factoriel à deux facteurs.
Facteur
Facteur A 1 2
1 Y Y
Z 1U’ '*112’ Y
•‘ lin Y121 Y122
’ ’ ’
Y
A1\2n YIM ’ *Y1*2’ Y
* l*n
2 Y Y Y
-*211* *212’ **•’ *21n Y221 Y Y
x222* ** x'22 *
Y2*1 Y2*2’ ’**’ Y
*2*n
c
Il y a « répétitions de l’expérience, et chaque répétition comporte toutes les ab combinai-
•
k 1.2 ... n.
où /u représente la moyenne globale, r. est l’effet du Même niveau du facteur A. (3 est l’effet du
y-ième niveau du facteur B, est l’effet de l’interaction entre A et B. et , est une composante
d’erreur aléatoire indépendante N(0, <r:) indépendamment distribuée.
T' AJ*vi
y\
-
T* ••1 370 CHAPITRE 11
On désire tester les hypothèses milles voulant que le facteur A n’ait aucun effet significa
tif, que le facteur B n’ait aucun effet significatif et que l’interaction AB ne soit pas significative.
La décomposition de la variabilité
Les facteurs A et B sont fixés, c’est-à-dire que les a niveaux du facteur A et les b niveaux du fac
teur B sont choisis par l’expérimentateur et que les inférences sont limitées à ces niveaux seulement.
Dans ce modèle, on définit généralement les effets T., J3. et (tj0) comme des écarts par rapport à la
moyenne. Ainsi, X?= l T. = 0, XjL l Pj = 0, Xf=, (rp)* = 0 et X *., (t/?).. = 0.
Soit Y./••7, la somme des observations au i-ième niveau du facteur A,’ Y«y.,*’ la somme des
observations au y-ième niveau du facteur B, Y , la somme des observations de la (/-ième
cellule du tableau 11.11 et Y• M7, la somme de toutes les observations. On définit *]*'
comme les moyennes de la ligne, de la colonne, de la cellule et, enfin, la moyenne
On a donc
y == z z > * l == 1,2,
•
• ♦•y CL^
7=1 *=1 bn
Y-r •
yV ^ J == 1, 2, • ••)
il
an
y
. y i == 1,2, •• •y CLy
#
• (11.23)
II
= z ^ n 7 == 1,2, •••j
*=1
y••• := z z î x <
A ÿ...=. Y~ +
Ainsi, la somme totale des carrés est composée d’une somme des carrés due au facteur A
(SS.), d’une somme des carrés due au facteur B (SSB), d’une somme des carrés due à l’interac
tion entre A et B (SSAB) et d’une somme des carrés due à l’erreur (SSE). On remarque qu’il doit
y avoir au moins deux répétitions pour obtenir une somme des carrés due à l’erreur non nulle.
L'analyse de la variance et les plans d'expériences 371
On peut écrire l’identité de la somme des carrés de l’équation 11.24 de façon symbolique:
E( MS a ) = E
J SS
E( MSb) = E — - j
v &- l y
i=l
E( MS AB) = E + y
(a-D(b-l)
E( MSe ) = E
Par conséquent, pour tester HQ:r. = 0 pour tout (aucun effet dû au facteur A),
H0: p = 0 pour tout j (aucun effet dû au facteur B) et HQ: (tjfi) = 0 pour tout i,j (aucun effet
dû à l’interaction), on divise la moyenne des carrés correspondante par l’erreur quadratique
moyenne. Chacun de ces rapports suivra une loi F, où le nombre de degrés de liberté du numé
rateur correspond au nombre de degrés de liberté de la moyenne des carrés du numérateur,
le nombre de degrés de liberté du dénominateur est a b { n - 1) et la région critique se situe à
l’extrémité supérieure de la fonction de densité. La procédure de test prend la forme d’un tableau
d’analyse de la variance {voir le tableau 11.12, à la page suivante).
En général, les données de ce genre d’étude sont analysées à l’aide d’un logiciel de statis
tique qui fournit la plupart des résultats, par exemple ceux du tableau 11.12. Il est rare que de
tels calculs soient faits à la main. Voici néanmoins des formules de calcul efficaces des sommes
des carrés de l’équation 11.25. La somme totale des carrés se calcule ainsi:
a b n \72
Y 2
*ijk (11.26)
i=l y=l *=1 abn
CHAPITRE 11
• aC ' ,* * . .■ --
S o u r c e d e 1 S o m m e N o m b r e d e
M o y e n n e d e s
v a r i a t i o n d e s c a r r é s d e g r é s d e l i b e r t é
c a r r é s
«
o
M S .
A
Traitements de ssA a
5
i l
A - 1
m se
I
ssa m sb
Traitements de B / ? - 1
S S .
M S » “ 6 - 1 m se
Interaction (a - )(b
m s a b
s s AB 1 - 1 ) M S = 5 S -
^ (a-\)(b-\) m s5
Erreur SSB a b ( n - 1 )
MS
ab(n
= , a *
E — 1 )
(11.27)
bn abn
(11.28)
an abn
On calcule généralement SSABen deux étapes. Premièrement, on calcule la somme des car
rés entre les totaux des ab cellules, appelée « somme des carrés due aux sous-totaux » :
Cette somme de carrés inclut SSA et SSB. Donc, la deuxième étape consiste à calculer
comme suit :
SSsous-totaux (11.29)
La somme des carrés due à l’erreur s’obtient par soustraction, c’est-à-dire
(11.30a)
SSsous-totaux (11.30b)
L'analyse de la variance et les plans d'expériences
Exemple 11.1
Il existe deux méthodes pour appliquer des apprêts sur les surfaces en aluminium des aéronefs : l’appli
cation au trempé et au pistolet. Le rôle de l’apprêt consiste à améliorer l’adhérence de la peinture.
Certaines pièces peuvent être apprêtées à l’aide de l’une ou l’autre méthode d’application. Le service
d’ingénierie souhaite également savoir si les trois différents types d’apprêt disponibles diffèrent dans
leurs propriétés d’adhérence.
Une expérience factorielle est entreprise dans le but d’étudier l’effet du type d’apprêt et celui de la
méthode d’application sur l’adhérence de la peinture. On applique à trois échantillons un type d’ap
prêt différent à l’aide de chacune des deux méthodes. Ensuite, on applique la peinture de finition et
on mesure la force d’adhérence. Les données recueillies durant cette expérience sont présentées au
tableau 11.13. Les nombres encerclés correspondent aux totaux y des différentes cellules.
Méthode d’application
Type d’apprêt Au trempé Au pistolet y,..
1 4,0 4,5 4,3 CEI) 5,4 4,9 5,6 (E3> 28,7
2 5,6 4,9 5,4 ( E l ) 5,8 6,1 6,3 (TQ) 34,1
3 3,8 3,7 4,0 Cü2> 5,5 5,0 5,0 (ES) 27,0
y.j. 40,2 49,6 89,8 = y...
7 ✓
La figure 11.13 présente un graphique de la force d’adhérence moyenne des cellules, , en fonction
des niveaux du type d’apprêt, pour chaque méthode d’application.
Au pistolet
trempé
------- 1-------
2
Type d’apprêt
Le parallélisme des deux courbes semble indiquer une absence d’interaction entre les deux facteurs.
De plus, étant donné qu’une réponse plus élevée correspond à une force d’adhérence supérieure, on
a l’impression que l’application au pistolet est la meilleure méthode et que le type d’apprêt n° 2 est le
plus efficace.
CHAPITRE 11
On calcule comme suit les sommes des carrés nécessaires pour effectuer l’analyse de la variance
55
;=1 ;=i *=i
2 (89,8)
(4,0)3+ (4,5)2H— + (5,0) 10,72,
18
a
\ *Ti*» y».»
, , 2 , , 2
55type (11.31)
bn abn
(28,7)2+ (34,l)2+ (27,0) (89,8)
4,58,
6 18
b v2
55méthode y 1 y..»
55interaction y...
types ‘^ ‘■^méthode
- - - . •
L a c o m p a ra is o n d e m o y e n n e s d e u x à deux
Lorsque les deux facteurs sont fixes et que les effets principaux des facteurs individuels
sont significatifs, il est possible de comparer les moyennes individuelles de l’un des facteurs
à l’aide du test de Tukey ou d’autres méthodes, comme celles de Fisher et de Bonferroni.
Dans les cas où il n’y a pas d’interaction, ces comparaisons peuvent se faire soit sur les
moyennes du facteur A, ÿ,-.., soit sur les moyennes du facteur B, ÿ.Jt. Par contre, lorsqu’il y a
une interaction significative, les comparaisons entre les moyennes d’un facteur (disons A)
peuvent être faussées par l’interaction AB. On peut alors effectuer les tests de comparai
sons multiples sur les moyennes du facteur A en fixant le facteur B à un niveau donné, et
inversement.
R é s id u s d'un plan à d e u x fa c te u rs
Exemple 11.15
Le tableau 11.15 présente les résidus des données de l’exemple 11.14 sur les apprêts pour les surfaces
d’aluminium des aéronefs.
La figure 11.14 (voir à la page suivante) présente les graphiques des résidus en fonction du type
d’apprêt, et en fonction de la méthode d’application. On peut en déduire que le type d’apprêt n° 3 occa
sionne une variabilité légèrement plus faible de la force d’adhérence que les deux autres types d’apprêt.
Le graphique des résidus en fonction de la valeur ajustée, y.Jk= ÿÿ„ de la figure 11.15a) ( à la page
suivante) ne révèle aucune tendance inhabituelle ou particulière.
A la figure 11.15b) ( voirà la page suivante), on peut voir
résidus. Les extrémités de ce diagramme ne se situent pas exactement le long d’une droite passant par
le centre du diagramme, ce qui indique qu’il y a potentiellement un problème avec la supposition de
normalité, mais l’écart relativement à la normalité ne semble pas très important
#. —
1Cft ~'da. * V L. .*V" » ^ ■ ^
''.'•ai a• T• I**; \ f 'Hr T'As f i _ _ %»~T ». * ,j - _•»
• ‘y - v t ._••* > .. n ^ 'I ■ * K , * v
BS2 S
. M ' y f*
vr ■ ff ht <' t i r r* V •L r ♦ ■ A ■ A 1 ^ V >» ^ w \P* m ^ W
‘V . X * t | ' A « J*1t ♦ VVa * J £ s Q ï Bf*
■ MK k l
< ■ Æ
i 7 • V tr ik v£
fv m. _V »
i
1i f *5 A ■■ a ! *•■*. , 1 *—
V 3k L ▼ U y J . fl S FJL H k • l » 'C ■ * jj ^ ï 1 • " • ^3 . i * f - * K 3 v 3 KB^Qt
\ j t M. d K—'' \ 'b» * 1 f t *—< iïi ,x » Aa, V i* , ->a ( » .. F1^
. /J f AA ’ ■*v_ > v . %J 4 >.•*.' Ml i s .' ’ •—«-CJ ‘ ^ y.
i «m‘ “ _**— .'a ' ■.^ «>. -k_vv
, a. B. "k, ^
WU -JT * * B CW• aC*" "
Méthode d’î
S— * F *
Type d’apprêt Au trempé j Au pistolet j
.
1 -0,27 0,23 0,03 0,10 -0,40 0,30
3 ►
CHAPITRE 11
i
?
i
J
;
Méthode
d’application
11.4.1 Le plan 22
La forme la plus simple du plan 2k est le plan 22, qui comporte deux facteurs .4 et B qui ont
chacun deux niveaux possibles. On désigne généralement ces niveaux par le niveau «faible » et
le niveau «élevé» du facteur. La figure 11.16 illustre le plan 22. On remarque que ce plan peut
être représenté géométriquement par un carré dont les coins sont définis par les 22 = 4 essais.
On emploie une notation particulière pour désigner les combinaisons de traitements. En effet,
on représente généralement une combinaison à l’aide d’une série de lettres minuscules. Si une
lettre est présente, cela signifie que le facteur correspondant est à son niveau élevé dans cette
combinaison de traitements; son absence indique que le facteur est à son niveau faible. Par
exemple, la combinaison de traitements a indique que le facteur A est au niveau élevé et que le
facteur B est au niveau faible. La combinaison de traitements où les deux facteurs sont au
niveau faible s’écrit (1). On utilise cette notation dans tous les plans 2k. Par exemple, la com
binaison de traitements dans un plan 24, où Aet C sont au
faible, s’écrit ac.
Élevé b• ■ -- ---— ob
---—•
(+)
J
;
Faible
(-) (1) a
Faible A Élevé
(-) (+)
■V- .V- *>-***- < — -A
•ê^ - ~V‘- *'’•
t v! Le plan factoriel 22
L e s e ffe ts d e s fa c te u rs
Les effets du plan 22 qui nous intéressent sont les effets principaux de A et de B, ainsi que
l’effet de l’interaction AB. Les expressions (1), a, b et ab représentent également les totaux
de toutes les n observations effectuées à ces points du plan. Il est facile d’estimer les effets de
ces facteurs. Pour estimer l’effet principal de A, on prend la moyenne des observations du côté
CHAPITRE 11
droit du carré, où A est au niveau élevé, et on soustrait la moyenne des observations du côté gauche
du carré, où A est au niveau faible :
a + ab 6 + (l)
A (11.32)
2n 2n
1
[a + ab —b —{1)].
2n
De même, pour calculer l’effet principal de B, on prend la moyenne des observations du
haut du carré, où B est au niveau élevé, et on soustrait la moyenne des observations du bas
du carré, où B est au niveau faible :
b + ab a + (1)
B (11.33)
2n 2n
1
[b + ab —a - (1)]
2n
Enfin, on estime l’interaction AB en calculant la différence des moyennes des deux diago
nales de la figure 11.16, soit
ab + (1) a + b
AB (11.34)
2n 2n
1
[ab + (1) - a - b].
2n
Les quantités entre crochets des équations 11.32,11.33 et 11.34 s’appellent des « contrastes ».
Par exemple, le contraste de A est
Contraste^ = a + ab — b — (1).
Dans ces équations, les coefficients du contraste sont toujours +1 ou -1. On se sert alors d’un
tableau de signes plus et moins, comme le tableau 11.16, afin de déterminer le signe de chaque
combinaison de traitements pour un contraste particulier. Les titres des colonnes du tableau 11.16
désignent les effets principaux de A et de B, l’effet de l’interaction AB et enfin, / représente le
total. Les titres des lignes représentent les combinaisons de traitements. On remarque que les
signes de la colonne AB correspondent aux produits des signes des colonnes A et B. Pour obtenir
un contraste à partir de ce tableau, on multiplie chaque signe de la colonne appropriée par la
combinaison de traitements correspondant à cette ligne, puis on additionne les termes.
A /
” /A i
♦ or
Effet factoriel
Combinaison de traitements / A B AB
(1) j + — —
+
1 61 + + — —
b + —
+ —
1 ab 1 + + + +
L'analyse de la variance et les plans d’expériences
On peut calculer les sommes des carrés pour A, B et AB à l’aide de la forme générale
suivante :
2
(Contraste)
SS 2
(11.35)
n Y (coefficients du contraste)
Pour terminer l’analyse de la variance, on calcule la somme totale des carrés SST (avec
An —1 degrés de liberté) comme d’habitude, et on calcule la somme des carrés due à l’erreur
SSE [avec A(n—1) degrés de liberté] par une soustraction. On calcule ensuite les moyennes de
carrés en divisant les sommes de carrés par les degrés de liberté appropriés, et les statistiques F
en divisant chaque moyenne de carrés par le MS£.
Exemple 11.16
Un article tiré du AT&T Technical Journal (vol. 65, n° 2, 1986, p. 39-50) décrit l’application de pians
d’expériences à deux niveaux à la fabrication de circuits intégrés. Dans cette industrie, une étape de
base de la fabrication consiste en la croissance d’une couche épitaxiale sur des plaquettes de silicium
polies. Les plaquettes sont disposées sur un suscepteur, puis elles sont insérées dans une cloche. Des
vapeurs chimiques sont introduites par les buses situées en haut de la cloche. Le suscepteur est mis
en rotation, et la cloche est chauffée. Ces conditions sont maintenues jusqu’à l’obtention d’une couche
épitaxiale d’épaisseur appropriée.
Le tableau 11.17 présente les résultats d’un plan factoriel 22 avec n = A répétitions, le facteur A étant
le temps de dépôt et le facteur B,le débit d’arsenic. Les deux niveaux du temps de
« court » et + pour « long », tandis que les deux niveaux du débit d’arsenic sont —pour « 55 ^ » et
+ pour « 59 % ». La réponse est l’épaisseur de la couche épitaxiale (en micromètres ou microns, pm).
380 CHAPITRE 11
1
A [a + a b - b - (1)]
2
1
[59,299 + 59,156 - 55,686 - 56,081] = 0,836,
2(4)
1
B [b + a b - a - ( 1)]
2n
1
[55,686 + 59,156-59,299-56,081] = -0,067,
2(4)
1
AB [ab + (1) —a —b]
2n
1
[59,156 + 56,081 - 59,299 - 55,686] = 0,032.
2(4)
L’effet de l’interaction AB semble faible. De l’estimation des effets, on déduit que l’effet du temps de
dépôt est important et que sa direction est positive (une augmentation du temps de dépôt occasionne
une augmentation de l’épaisseur). En effet, la variation du temps de dépôt du niveau faible au niveau
élevé correspond à une variation de l’épaisseur moyenne de la couche épitaxiale de 0,836 |im. L’effet
du débit d’arsenic ( B)semble faible.
On peut confirmer l’importance statistique de ces effets par une analyse de la variance. Les sommes
des carrés pour A, B et ABse calculent à l’aide de l’équation 11.35 :
(Contraste)
ss = J
«4
[a + a b - b - d)]2 ._ [6,688 f
SSA = 2,7956,
16 16
[b + ab —a —a » 2 _ [-0,538]
SSB = 0,0181,
16 16
[ab + (1) -1 --b]2 [0,256]2
s s AB = 0,0040
16 16
Le tableau 11.18 résume l’analyse de la variance.
>1 —
Source de Somme Nombre de degrés Moyenne
variation n
fi
•
■
-
^
•
__
des carrés
~
9
_^
.
r
^ •
_ * *
^
.^
dea
liberté
. * des carrés.
Ces résultats confirment les impressions obtenues lorsqu’on examine la grandeur et la direction des
effets : l’interaction n’est pas significative, le temps de dépôt a un effet significatif sur l’épaisseur de la
couche épitaxiale et, selon la direction de l’estimation de cet effet, on sait que des temps de dépôt plus
longs occasionnent des couches épitaxiales plus épaisses. Le débit d’arsenic, quant à lui, n’a pas d’effet
significatif sur l’épaisseur de la couche épitaxiale.
Il est facile de vérifier ce qui suit. Pour un temps de dépôt court î 1) et un débit d’arse-
0,836
nie élevé, y = 14,389 + ( - D 13,971 |im, les résidus sont
2
e5 13,880 - 13,971 0,091, e7 14,032 - 13,971 0,061,
e6 13,860 - 13,971 0 , 111, e8 13,914 - 13,971 0,057.
Pour un temps de dépôt long (x, = +1) et un faible débit d’arsenic,
0,836
y 14,389 + (+D 14,807 Lim, les résidus sont
2
e9 14,821 - 14,807 0,014, eh 14,843 - 14,807 0,036,
e 10 14,757 - 14,807 0,050, e 12 14,878 - 14,807 0,071.
CHAPITRE 11
. . . . . . » .*
Si l’on ne tient pas compte du résidu exceptionnellement grand (en valeur absolue) associé
à l’observation y , il n’y a pas de raison de conclure que le temps de dépôt ou le débit d’arsenic I
X
B/V- - ■■■■
(-) (+)
.
Résumé
%
• • »/ *É•* '»
Plan d'expériences complètement aléatoire à un facteur
a échantillons indépendants de taille n (donc N = an observations), variances égales
Modèle
Yu - M+ T, + Ev , où Ev ~ N ( 0 ,o 2) ,(i = 1..... a ,j =
de la variance
H0: T’j T2 T =0 (ou H o *• Mi MJ
1=1 U
S
~N *=U=1 <=iy=i TV
a n a
55 ey ~ Y y - Y /. = résidu
/-I /=! !*=1
r ce
U k J traitements
L'analyse de la variance et ies pians d'expériences
Modèle
Yu fl + Ti + (5j + E ij, où p j 2 2
N(0,G p) et E'j ~ N(Q,<j~),(i = 1,...,a yj= 1.....b)
Analyse de la variance
H 0.T, —Tj ••• Ta = 0
Source d e f . Degrés
;C'vr
variation
4>
des carrés de liberté Moyenne des carrés
Rl T-AÆ
i
Ï-*
ÇÇtraitements MS
* ^ traitem ent
P(F >/„)•
Traitements SStraitements
. a —1 MStraitem ents où F Q—1•(&
a- 1 MSH
SSblocs
Blocs SSblocs b- 1 MSblocs
b- 1
SSE *
a a xf 2 Y 2 a b « 6 Y
1 2
SS t r a i t e m e n t s Y..) E - SS T Y..)
é b ab
I I I I ^ ab
1= 1 «•=1y=1 (=i y=i
/? y 2
y •2•
blocs = a ± ( Ÿ . i - ÿ . . ) 2 = i — -
ab
y=i y= 1 u
a b
Ty - Y i .- Y .j + Y..= résidu
é r1
n
CC — cv
I l 4 = 0 0 traitements blocs
'=•y=>
✓
Plan d’expérience complètement aléatoire à deux facteurs
a x b échantillons indépendants de taille n (donc abn observations), variances égales
Modèle
Yijk H + T; + Pj + (Tp) .. + Eijk, où Eijk ~ N (0,G 21.a, l,..., k
Analyse de la variance
1) H0: (Tp).u= 0 pour tout (i, j)
2) H0: Ti T.2 Ta 0
1 2 A, = o ♦ «
CHAPITRE 11
Source de j ♦
fl zM
*“ l ’ - Sl 2- #- _ 'v
* îv >
*•' ■" m ( . \ -
U K » •;-« r ;♦!r - -K
: & . ' - V - .
« 7 , / ’lÇZ 4
r ’
V.
r v A
V * - ‘ jC ' . f t c 1
•*-*- >. 'rr
|
SS A MS44
a- 1 MS A fiCM W V i. a b ( n--n1) > h a)
a- 1 MS E
SS B MS B
b- 1 MS B fi0 B P(Fb-u a b ( n--nl ) > /o s )
b —1 MS E
SS A B MS A B
(a - 1Xb - 1) MS A B fiO A B MS E K F ia - ! ) ( / > - ! ) , a b ( n - l ) > fioA B )
(a -l)(fc -l)
SS E
ab(n —1) MS E
ab(n —1)
abn —1
.
2
» f
a a y2 y
y / t.. -* '
SS A b n J jY i Y...) SS E SS 7 SS AS SS A SS s
i=1 /=i rt/>/2 r=l/=l*=l
v ' -- . ‘ •
-« s
b b y z. y ■ *. - * a £> n a b n y #• •
SS B an I ( F . y y - .
SS T 2
an abn )
7= 1 7= 1 i=iy=lfc=l i = l 7 = 1*== 1
« £
SS AS 2
y, y .y .+ i7...) e ijk Ym ~ Y
i=\j=\
Analyse de la variance
1) H0: Pas d’interaction entre A et B
2) H(| : Pas d’effet du facteur A
H„ : Pas d’effet du facteur B
Source de
V: variation Somme des carrés
[a + ab
Facteur A MS A = SS A i ./ o a
[b + a b -a
Facteur B MSB = SS o i
[ab + ( l ) - a
Interaction MS = SS„D If iû A B
Total (Yiit- Y . . y
1=1 »'=1A=1
L'analyse de la variance et les plans d'expériences
• ✓
Vitesse de coupe . . . —. / •
Durée de vie de l’outil (h) Moyenne y Ecart-types
1 41 43 33 39 36 40 38,67 3,61
2 42 36 34 45 40 39 39,33 3,98
3 34 38 34 34 36 33 34,83 1,83
4 36 37 36 38 35 35 36,17 1,17
ÿ
*•• =37,25 <7 = 2,90
Vitesse de coupe
Vi) les moyennes théoriques d’au vi) Les observations d’un même
moins 2 vitesses de coupe dif échantillon sont indépendantes.
fèrent l’une de l’autre. vii) Les observations de la population
vii) les moyennes échantillonnales proviennent d’une loi normale de
des 4 vitesses de coupe diffèrent moyenne /i/.
toutes les unes des autres. d) Peut-on conclure, au seuil de 10%,
c) Créez et remplissez le tableau d’analyse que le débit de C2F6a un effet sur
de la variance. l’uniformité ?
d) Quelle est la valeur P (exacte ou e) La figure 11.22 présente les dia
approximative) du test de comparaison grammes en boîte juxtaposés des
des quatre moyennes ? observations ainsi que l’histogramme
e) Si le test global de comparaison des des résidus. Les résidus indiquent-ils
moyennes est significatif au seuil de 5 %, des problèmes liés aux suppositions
étudiez les différences entre les niveaux faites par le modèle ?
de la vitesse de coupe pris deux à deux. f) Pourquoi l’histogramme des observa
tions brutes ne permet-il pas de vérifier
11.2 Dans l’article «Orthogonal design for process
si la loi normale est un bon modèle ?
optimization and its application in plasma V
etching » ( SolidState , vol. 30, Une étude a porté sur la résistance (en
11.3
n° 5,1987, p. 127-132), G.Z. Yin et D.W. Jillie ( V f livres par pouce carré) à la compression
décrivent une expérience permettant de déter du béton. Les données recueillies pour les
miner l’effet du débit de C,F.
Z v) sur Funiformité quatre différentes techniques de mélange
de la gravure dans le cas d’une tranche de sili étudiées sont présentées dans le tableau 11.21.
cium. Les uniformités résultantes (en pour a) Remplissez le tableau d’analyse de la
centage) des six répétitions des trois débits variance suivant.
utilisés dans l’expérience sont présentées dans
le tableau 11.20. Somme Nombre Moyenne
a) Estimez la variance intratraitement Source de des de degrés des
b) Estimez l’effet du débit 125. variation carrés de liberté carrés / .
c) Identifiez toutes les conditions d’appli Technique
cation de l’analyse de variance dans la de mélange 489 740 ? ? ? • • •
— .* Æ * , » , ™ */ ^ A*i B . * | L^
, , . ï ^ , * —, . j J* 3 • j V* ■ f '• " ^ 7*'
i ^ . .. a " • i x & t- FL, <5 _ < - -rs *J 7 T '* ' S a S p y S - ; i % & ï i
r r . . c r * f / , 4 '■ . / ■ .* 7 v . . / C . f * * r * -v / / • k' •
w L z W »— ' * . M ^
I l i M i l r ~ T ' T I W Ê m m f l t H Ü T
Æ
M
t M V
I
a
w
, a—
m w
M
j
T
t
A 7
|\ri
♦ f m’ MB
W f ’S Q K 3 ' r . £ • g Q H * * X J J t '
X i ' ■*
4 -C V / f , . r . y * * W 4
ü . . P • B k v J i S t * * ; m ; -t
a ? A . >, Â;
.
Observations (%)
**_■“ « « • , — ■ • - **. — .1 o . —
. f •- - ^
/
5,0 5
4,5 4
vu
W
U
üC J-2
4,0
«2 3U
‘S CT
3,5 'H 2
b
3,0 1 r
2,5 0 1
125 160 200 l,5 - l,0-0,5 0,0 0,5 1.0 I.5
Débit de C2F6 Résidus
a) b)
jdg
TCI . V |
H W
I
i
Exercice 11.2: a) Distribution de l'uniformité par traitement;
•v •. :a a
|
Technique de mélange Résistance à la compression (lb/po2) 1 Moyenne .j Écart-type
1 3 129 3 000 2 865 2 890 2 971 120,56
2 3 200 3 300 2 975 3 150 3 156 135,98
3 2 800 2 900 2 985 3 050 2 934 108,27
4 2 600 2 700 2 600 2 765 2 666 80,97
/
150 3
100
50 t
\
P O 2 4
y
C/
5 0 e4}
'<L> 3
06 -50 CT
£tt.
100 1
150
i-------1-------1------ 1 r 0
2700 2800 2900 3000 3100 200 100 0 100 200
Valeurs prédites Résidus i
K
l
(
;
»
»
a) b)
Y ï4 j
Exercice 11.3: a) Distribution des résidus en fonction des valeurs prédites;
b) distribution des résidus de l'analyse de variance à un facteur
11.4 Soit une expérience destinée à déterminer si b) Sachant que SST=0,458, déterminez si la
(g r quatre températures de cuisson (en degrés température de cuisson influe sur la mavse
Fahrenheit) spécifiques influent sur la masse volumique des briques au seuil de 5 %.
volumique d’un certain type de brique. Les 11.5 Un ingénieur électronicien s’intéresse
données de l’expérience sont présentées dans à l’effet de cinq types de revêtement
(B
le tableau 11.22 ( voirà la page suivante).
sur la conductivité des tubes à rayons
a) Estimez les paramètres du modèle : cathodiques utilisés dans l’afficheur d’un
/Z, Tj, X T X4, G2 système de télécommunications. Cl obtient
CH A PITRE 11
Erreur 9 •
? 16,22
Total 1303,75 9
♦ 11.7 Supposez que quatre populations normales
ont une variance commune cr2 = 25 et des
b) Testez toutes les différences entre deux moyennes = 50, ju2= 60, ju3= 50 et
moyennes. Utilisez a = 0,05. HA= 60. Supposez aussi que cinq obser
c) Supposez que le type de revêtement 4 vations sont effectuées au hasard dans
est le type de revêtement actuel. Que chacune de ces populations.
recommanderiez-vous au fabricant ? a) À quelle valeur peut-on s’attendre pour
(On désire minimiser la conductivité.) le MS, ? • E
11.6 Voici les temps de réponse (en milli- b) À quelle valeur peut-on s’attendre pour
(t+T secondes) de trois types de circuits utilisés le MStraitements
. ?
T^pe de revêtement -■
Conductivité **. . ■»
Moyenne Écart-type
1 143 141 150 146 145,00 3,92
2 152 149 137 143 145,25 6,65
3 134 133 132 127 131,50 3,11
4 129 127 132 129 129,25 2,06
5 147 148 144 142 145,25 2,75
Type de circuit *. • • .. m
. Temps de réponse (ms) . ,-•-•.«-•'* Moyenne
.%* •. % Écart-type
1 19 22 20 18 25 20,8 2,77
2 20 21 33 27 40 28,2 8,41
3 16 15 18 26 17 18,4 4,39
ÿ =22,47 <7 = 5,71
L'analyse de la variance et les pians d’expériences
S
C
3
ce
&
a) b)
■
m
W r~
K * .
• .
1 1
1 f i
I
- ,
I • V *
i . r l ♦
1
i *
fl B ■
;
a n s r \
•
rn.
c 2 *
*.
T A \ Æ T' -, rn.
r C , ' V L
X
£KITIHH
t , , >. f "
r /’ i
. * ■i
i.'
.«A
J y
<
.r Æ ‘ ,*».
- .r ,
_ _v
f . 'y /. ‘LKÿ
< , »
-,
y ».«•
,
■
* “L
*>•_ ,
- v - T V ' . '
.
.
41y -
> ■ A• ê. ,«• -/i,
v l i ..
‘ . . a. 4\ C
' ^ .■
» vv*.
i, w
■- /
. . _
v
y
,■
v > VJ î i .
* >»»>
& M
- ..A.: . -p*•4 ,.V
f f iir .
' >
, '* ■
L -
« .y T tS f i* /,
v 4m. y y t a ,■» f .4 /■ ir .,
* '2 .. v
:^
F ** 9
j
né - • •
//
-
, . A/ 5 v ' V * / * / ’' V
y
>
-/y
. v
V ^ - ’Cv
i> *•> .
• ;-,
V i Jv ;
t
^ . i- «Wlik-A .
’J
i'
•i* V
y ,T
M
/î
•
• ' . •. i v p» *c , - r ’- A . »/. • >• « - >* . ., /• m f » V* ‘ / »»^ * *•,
.> r '> ■ ■' 54- r , >*• r}* ï» 9 F v • > $ . • * X v-»> .?■*> 2 -ÎT L v ' - i • y.
___- y____
; _______. * 7 ; .
__________________________________ _ - ■
Source de
—, P % • — •
Verre 14 450,0 1 ? •
? # 0,000
Luminophore 933,3 ? •
? •
? • 0,004
Interaction 133,3 ? •
? •
? • 0,318
Erreur ? •
? ♦
? •
Total 16 150,0 ? •
L'analyse de la variance et les plans d'expériences
\ \
jiÊèm
K
Mb l*■r
*'
^ ans rie nombreux problèmes, deux variables ou plus sont liées de façon intrin
sèque, et il faut explorer la nature de cette relation. L’analyse de régression
, est une méthode statistique de modélisation et d’analyse de la relation entre
deux variables ou plus. Dans un procédé chimique, par exemple, si Fou suppose que le
rendement d’un produit est lié à la température de fonctionnement du procédé, l’an a
lyse de régression peut permettre de construire un modèle qui exprime le rendement
en fonction de la température. Ce modèle peut servir à prévoir le rendement à une
température donnée. On peut aussi l’utiliser pour optimiser ou contrôler le procédé.
En règle générale, supposons qu’une variable dépendante unique est liée à k variables indé
pendantes, ou variables explicatives, X {, X2, ..., Xk. La variable dépendante Y est une variable
aléatoire, tandis que les variables explicatives X,, X2, ..., Xk sont mesurées avec une erreur
négligeable. Les variables Xs
ont fréquemment contrôlées par l’expérimentateur
régression sert aussi dans les situations où Y, X , X2, ••■,Xk sont toutes des variables aléatoires,
comme lorsque les données sont des mesures différentes d’une unité expérimentale commune.
La relation entre ces variables est caractérisée par un modèle mathématique appelé « équa
tion de régression». Plus précisément, on parle de la régression de Y sur X,, X , ..., X k. Ce
modèle de régression est ajusté sur un ensemble de données. Dans certains cas, l’expérimen
tateur connaît la forme exacte de la fonction qui lie Y et Xr X2, ..., Xk. Mais, dans la plupart
des cas, la vraie relation fonctionnelle est inconnue et l’expérimentateur choisit une fonction
appropriée, souvent un modèle polynomial.
Dans ce chapitre, nous discuterons du cas où une variable explicative unique, X, présente
un intérêt, et du cas où la relation entre y et X est une droite. Le chapitre 13 traite du cas où
plusieurs variables explicatives sont en cause.
4
La régression linéaire simple et la corrélation
Exemple 12.1
Un ingénieur chimiste analyse l’effet de la température de fonctionnement d’un procédé sur le rende
ment du produit. Il obtient les données suivantes.
Température (en degrés Celsius) (AT) 100 110 120 130 140 150 160 170 180 190
Rendement (en pourcentage) (F) 45 51 54 61 66 70 74 78 85 89
La figure 12.1 présente le diagramme de dispersion de ces 10 points. Ce diagramme montre qu’il existe
une forte relation entre le rendement et la température, et que cette relation est linéaire, du moins sur
l’intervalle de températures étudié. La supposition provisoire du modèle linéaire +
semble donc raisonnable.
/
i
V
i
1
-
i
i
—
.
:•
i
;
i
;
m m
m r
■
• v - .. •
L g y * i f l U
K Q 3 t t ' / .
L
g
6 » ’S V v '
'J tZ r J n « ' V A * / ** «x
« O . sr M S 9 1 S 1'
y , =f i , +l ” + »
b.
• • y /2j
CHAPITRE 12
et la somme des carrés des écarts verticaux des observations à la vraie droite de régression est
n n
2
L X e? 0 fi,X.) (12.3)
1= 1 1= 1
A /N
1
2y (y,
O
- f i i -
1
2Y v , 0
O
a s 1 Po>P\
A A
i=l
- f i i -
n P a + fr Y x , I r. X
i=1 II *~
(12.5)
Il
n n ~
j
*w
P o Y x i+ p y X -
II
1= 1 1= 1 / =1
Les équations 12.5 sont appelées les «équations normales des moindres carrés»
On appelle Sxx la somme des carrés corrigée de X, et S la som m e des p ro d u its c ro isé s
corrigée de X et de F.Les membres de droite des équations 12.8 et 12.9 sont des form ules de
calcul efficaces pour un calcul à la main.
La convention qui consiste à utiliser des lettres majuscules pour les variables aléatoires et
des lettres minuscules pour les valeurs observées de ces variables ne sera respectée que pour X A A
et Y dans ce chapitre. Nous ne l’appliquerons pas aux sommes de carrés, aux estimateurs f3Qet /?, ni
aux autres quantités aléatoires, par respect pour la tradition établie dans la littérature statistique.
La régression linéaire simple et la corrélation
Exemple 12.2
Quelques calculs sur les données de l’ingénieur chimiste de l’exemple I2.l permettent d’obtenir les
résultats suivants :
n = 10, x= 145, =6
10 10 10
xf =218 500, ^ y f = 47 22 X
/=! 1=1 /=1
Les estimations par la méthode des moindres carrés de la pente et de l’ordonnée à l’origine sont donc
j}\=2*L = — = 0,483
1 S„ 8250
et
Po=ÿ - ^ x = 67,3 - (0,483)145 = -2,739.
Q u e l q u e s p iè g e s à é v it e r
L’analyse de régression est fréquemment utilisée et souvent de façon abusive. Il est très facile d’éta
blir des relations statistiques complètement dénuées de sens pratique entre des variables. On pour
rait, par exemple, tenter de lier la résistance au cisaillement de points de soudure au nombre
de boîtes de papier utilisées par le service de traitement de données. Une droite pourrait même
sembler fournir un bon ajustement des données, mais il serait déraisonnable de tabler sur une
telle relation. Il faut soigneusement choisir les variables avec lesquelles on construit les modèles
de régression et déterminer la forme de la fonction d’approximation. Une forte association obser
vée entre des variables n’est pas nécessairement le reflet d’une relation causale entre ces variables.
De plus, les relations de régression ne sont valides que pour les valeurs de X situées dans
l’intervalle des données mesurées. La relation linéaire qu’on a supposée provisoirement n’est
peut-être pas valide pour des valeurs de X au-delà de cet intervalle. Autrement dit, à mesure
qu’on s’éloigne de la gamme des valeurs de X pour lesquelles les données ont été recueillies, il
devient plus risqué d’extrapoler à partir du modèle linéaire ajusté.
Finalement, on peut parfois penser que le modèle Y = J3X + E convient. L’omission de l’or
donnée à l’origine dans ce modèle entraîne, naturellement, que Y = 0 lorsque X = 0. Une telle
supposition forte est souvent injustifiée. Même lorsque deux variables, telles que la taille et le
poids d’individus, semblent convenir pour utiliser ce modèle, on obtient habituellement un meil
leur ajustement en incluant l’ordonnée à l’origine en raison de l’étendue limitée des données de la
variable indépendante.
H0:A=°>
H, :/?,*(). (I2.ll)
La régression linéaire simple et la corrélation 401
Ne pas pouvoir rejeter H0: fi = 0 équivaut à conclure que la relation linéaire entre X et Y
n’est pas significative selon nos observations. Cela peut impliquer que la variation de X influe
peu sur la valeur de Y et que le meilleur estimateur de Y pour tout x est Ÿ ( la figure 12.3a)
ou encore que la véritable relation entre Xe
t
contre, si H 0: p = 0 est rejetée, cela implique que X influe sur la valeur de Y {voir la figure 12.4).
Mais rejeter H0: p } = 0 peut signifier que le modèle linéaire est adéquat {voir la figure 12.4a) ou
que même s’il y a un effet linéaire de X, on pourrait obtenir de meilleurs résultats par l’ajout de
termes polynomiaux de degrés supérieurs en X {voir la figure 12.4b).
ii
i>
t
.
i
.
t
.
i
t
i
|i
t
!i
i
i
♦
1
I
»
l
l
i
I
i
;
:Î
î«
I!
A
i .
♦
\
.
t
À
.
1
I
On peut développer la procédure de test pour H0:/?, = () de deux façons. La première consiste
à décomposer la variabilité totale des Y. en deux sources : la variabilité expliquée par le modèle et
la variabilité résiduelle due à l’erreur aléatoire. On utilisera alors les techniques de l’analyse
de la variance décrites au chapitre 11, en adaptant les calculs des sommes de carrés au modèle de A
régression. La seconde est un test de Student basé directement sur les propriétés de p . Nous y
reviendrons plus loin.
402 CHAPITRE 12
L e t e s t s u r ^ b a s é s u r l'a n a ly s e d e la v a r ia n c e
Notons tout d’abord que les valeurs prédites par le modèle sont définies par
f m +M -
Il s’agit du point sur la droite estimée correspondant à chaque valeur X..
Considérons maintenant la partition suivante de la somme des carrés des écarts entre
les Y. et leur moyenne Y :
T e s t de signification de la régression
*. * . * * *.
• • ' . * . . . y "
Exemple 12.3
Testons la signification du modèle de régression développé à l’exemple 12.2. Le modèle ajuste est
7 2,739 + 0,483 jc, et l’on a
10
S S T = S YY yf-I0ÿ2
i= 1
2
47 2 2 5 -10(67,3)
1932,10.
La som m e des carrés due à la régression est
SSR = 0 .S xy = (0,483)(3985) = 1924,87,
et la som m e des carrés due à l’erreur est
SS, = SS -
E T R
1932,10 - 1924,87
7,23.
1 ______________________________________________________________
•' •r A ^T
4 \ vVC
l r ^ 1*' B •L
~ B U>’ 1 A . L 4 \ 0
JB ^k V
AmK WWFa'^k
Source de Somme Nombre de degrés Moyenne
variation des carrés de liberté des carrés /. 1
j R égression 1924,87 1 1924,87 2138,74
J E rreu r ou résidu 7,23 8 0,90
j Total 1932,10 9
En rem arquant q u e / = 2138,74 > F 001. 18 = 11,26, on rejette H0 au seuil de 1 % et l’on conclut que
* 0. P uisque la pente estim ée vaut 0,483, on peut même conclure qu’elle est significativement supé
rieure à 0. D ’ailleurs, le nuage de points était clairement aligné le long d’une droite de pente positive ;
il était facile de prévoir un résultat aussi fort.
Démonstration
Puisqu’on suppose que les E. sont indépendantes et suivent une loi N(0, cr2), il découle direc
tement que les observations Y. sont indépendantes et suivent la loi N(/30 + J3{X , a 2). On
remarque que /J, est une combinaison linéaire des observations Y. Donc, est une com
binaison linéaire de variables aléatoires normales indépendantes et, par conséquent, est une
variable aléatoire normale. De plus, la variance des observations autour de la droite, cr2, est
estimée par le MSE. On peut donc dire que
Supposons qu’on désire tester l’hypothèse que la pente est égale à une constante, soit 0
H„:A=A.o.
Hi: A * A,.- (12.16)
On rejette H0: fi = fi si
En posant /?, 0 = 0, on obtient le test de signification de la régression, qui donnera bien sûr
le même résultat que celui qu’on a précédemment obtenu à partir de l’analyse de la variance.
Notons que l’élévation au carré des deux membres de l’équation 12.17 donne
*
En règle générale, il est vrai que le carré d’une variable aléatoire suivant une loi tv suit une
loi Fx . Donc, le test utilisant TQéquivaut au test basé sur F0.
Exemple 12.4
Reprenons l’exemple 12.2 sur le rendement en fonction de la température. Supposons qu’on cherche
à savoir si une hausse de 10 degrés Celsius de la température de fonctionnement occasionne un gain
moyen de rendement supérieur à 3 %. ►
La régression linéaire simple et la corrélation
Puisque 17,5 est largement supérieur à 1,86, on rejette H0. Par conséquent, on conclut que le gain moyen
de rendement correspondant à une hausse de 10 degrés Celsius est significativement supérieur à 3
On note aussi que fi0 est une combinaison linéaire des Y. et qu’il suit par conséquent une loi
normale. On peut donc dire que
Pour tester
(12.19)
on utilise la statistique
( 12.20 )
On peut bien entendu adapter cette règle de décision aux cas unilatéraux.
ïïiis CHAPITRE 12
Supposons qu’on veut tester l’hypothèse suivante : l’ordonnée à l’origine du modèle de régression pour
le rendement en fonction de la température est inférieure à 0. (Le rendement du produit à 0 °C est
ici d’un faible intérêt pratique, mais répondons à la question pour illustrer la théorie.) L’hypothèse
alternative est unilatérale, et on utilisera un seuil de 10 % :
2,739-0
t 1,774.
Ainsi, au seuil de 10%, on conclut que l’ordonnée à l’origine est significativement inférieure à 0.
( 12.21)
MSe
0,483 ±2,306
0,483 ±0,024 ►
,v
La régression linéaire simple et la corrélation 407
et l’on obtient
0,459 < >3, < 0,507.
C et intervalle exclut la valeur 0, ce qui confirme la conclusion sur le test de signification de la régres
sion, soit le test bilatéral pour H0: P = 0.
a/2; n-2
% = A,+ A v
A A A
L a valeur prédite Y est un estimateur sans biais de E (Y |x ), puisque /30 et sont des estima-
teurs sans biais de /3Qet de . La variance de YQest
A A A
La longueur de l’intervalle de confiance pour E(Y| jc0) est une fonction de xQ.Cette longueur
est minimale pour xQ= xet augmente avec \xQ- 3c|. Cet élargissement est une raiso
le danger d’extrapoler lors d’une analyse de régression : plus xQest situé loin de x, plus notre
estimation de la valeur moyenne de Y correspondant à xQest imprécise. L’exemple 12.7 met ce
phénomène en évidence.
408 CHAPITRE 12
Exemple 12.7
Déterminons un intervalle de confiance à 95% pour la droite de régression avec les données de
l’exemple 12.1. Le modèle ajusté est y0 = -2,739 + 0,483x0, et l’intervalle de confiance à 95 % pour
£ (y |x 0), donné par l’équation 12.23, est
Le tableau 12.3 présente les valeurs ajustées y0et les limites de confiance à 95 % correspondantes pour
10 valeurs x0 allant de 100 à 190 °C.
[ 1 ÿ f _JB | y t 1# v
i^^^iwiTwiwTinnwTr1
f* . J V i u 1 w jy L '
1 [ • J T * T | 3 J g O . ‘w . ç a \ a jp j a i A \
B*
g
I. flp
0^ JB 9 U A A
_ ’jA H v ^ J»
■
m
h
» >/ v > r
jO m Wr
/ Vkæ ^ ‘. X
X 100 110 120 130 140 150 160 170 180 190
45,56 50,39 55,22 60,05 64,88 69,72 74,55 79,38 84,21 89,04
Marge d’erreur
±1,30 ±1,10 ±0,93 ±0,78 ±0,71 ±0,71 ±0,78 ±0,93 ±1,10 ±1,30
à 95%
Pour illustrer l’utilisation de ce tableau, on trouve par exemple que l’intervalle de confiance à 95 % sur
le véritable rendement moyen du procédé au point xQ= 140 °C est
64,88 ± 0,71,
0
S
Soit Y0 la future observation au point X = xQ, et soit YQl’estimateur de YQdonné par l’équa
tion 12.24. La variance associée à l’observation future sera constituée de la somme de deux
variabilités : celle d’une observation autour de la vraie droite (cr2) et celle de l’estimation de la
2
2 1 j, (x0 - X )
droite de régression a ■On peut l’exprimer comme suit
n Sxx J
1 , (x0 - X )
---1------------2
Var (Y0 - = a 2+a
n
On rem arque que la longueur de l’intervalle de prévision est minimale à xQ= x et qu’elle
augmente lorsque \x0- x\ croît, tout comme l’intervalle de confiance sur la droite de rég
En com parant l’équation 12.25 à l’équation 12.23, on observe que l’intervalle de prévision à xQ
est toujours plus grand que l’intervalle de confiance au point xQparce qu’il dépend de l’erreur de
la droite estim ée et de l’erreur associée aux futures observations.
Exemple 12.8
. . . . . . J . • • ' • ■. v ■ . ‘ *- • * .
Pour illustrer l’établissement d’un intervalle de prévision, utilisons les données de l’exemple 12.1 et
trouvons un intervalle de prévision à 95 % pour la prochaine observation du rendement du procédé au
point xQ= 160 °C. La figure 12.6 ( voirà la page suivante) montre l’intervall
Y pour toute valeur xQ. ►
410 CHAPITRE 12
, 1 (160-145)2
74,55 ±2,306 0,90
[ 10 8250 J
soit
74,55 ± 2,33
72,22 < Y0 <76,87.
On voit que l’intervalle est plus long que l’intervalle de confiance sur la moyenne dont la marge d’erreur
est de 0,78 pour x0= 160.
L’analyse des résidus est utile pour vérifier la supposition que les erreurs sont indépen
dantes et suivent une loi normale de variance constante, ainsi que pour déterm iner si l'ajout
d’autres termes dans le modèle serait utile.
il
;
i
.
4
(
i
i
I
i
i
:
!
4
:i
‘4
!i
i|
lI
i
>
t
[t
i
i
i
i
■
*
i
>
1I
\
s
*
J
»
*
i
i
l
I
i
i
«.
4
.
i>
*
ç
I
{
i
;
«
j4
Exemple 12.9
Voici les résidus calculés du modèle de régression de l’exemple 12.1.
V =45,00 -- 45,56 = -0,56 *6 := 70,00 -- 69,72 = 0,28
V =51,00 -- 50,39 = 0,61 *7 := 74,00 -- 74,55 = -0,55
=54,00 -- 55,22 = -1,22 = 78,00 -- 79,38 = -1,38
ëe%
V = 61,00 -- 60,05 = 0,95 =85,00 -- 84,21 = 0,79
=
*5 = 66,00 -- 64,88 = 1,12 =
*.0 = 89,00 -- 89,04 = -0,04
Sur le graphique quantile-quantile normal ( voirla figure 72.5), on rema
approximativement le long d’une droite. On conclut donc qu’il n’y a pas d’écart important à la nor
malité. Les résidus sont aussi représentés en fonction des à la figure 12.9a) et en fonction des à
la figure 12.9b). Ces représentations n’indiquent aucune lacune sérieuse du modèle, c’est-à-dire que la
répartition des résidus autour de 0 est uniforme pour toutes les valeurs de *i
y et de r
La régression linéaire simple et la corrélation 413
414 CHAPITRE 12
L
Coefficient de détermination
La grandeur
(12.26)
est appelée «coefficient de détermination» et est souvent utilisée pour juger du bon ajustement d’un
modèle de régression.
Visiblement, 0 < R2 < 1. Ainsi, R2 représente la proportion de variabilité dans les données,
expliquée ou justifiée par le modèle de régression. Pour les données de l’exemple 12.1, on a
R2 = SSR/SST= 1924,87/1932,10 = 0,9963. Autrement dit, le modèle explique 99,63 % de la va
riabilité des données (ce qui est très élevé). On verra ultérieurement que si X et Y sont des varia
bles aléatoires conjointement distribuées, R2 est le carré du coefficient de corrélation entre X et Y.
La statistique R2 doit être utilisée avec précaution, car on peut toujours faire augmenter
R2 en ajoutant des termes au modèle. Par exemple, on obtient un ajustement «parfait» sur
n observations avec un polynôme de degré n —1. De plus, R2 augmentera toujours si l’on ajoute
une variable au modèle, mais cela ne signifie pas nécessairement que le nouveau modèle est
supérieur à l’ancien. Cette augmentation doit être significative pour que la nouvelle variable
soit importante. La régression multiple (où plusieurs variables explicatives sont incluses dans le
modèle) sera traitée au chapitre 13.
Il y a plusieurs idées fausses entourant R2. Par exemple, R2 n’est pas toujours lié à la
pente de la droite de régression : une grande valeur de R2 n’entraîne pas nécessairement une
pente abrupte. De plus, R2 n’exprime pas toujours la justesse du modèle puisqu’on peut le gon
fler artificiellement en ajoutant des termes de polynômes de degrés supérieurs. Même si Y et X
sont liées de façon non linéaire, R2 sera souvent grand. Par exemple, R2 de l’équation de régres
sion de la figure 12.4b) {voir à la page 401) sera relativement grand, même si l’approximation
linéaire est faible.
Cette fonction peut être transformée en une droite par une transformation logarithmique
ln Y = ln
Cette transformation exige que les termes d’erreur transformés ln E soient normalement et
indépendamment distribués avec une moyenne nulle et une variance a 2. On pourra donc étu
dier le lien entre ln Y et X à l’aide du modèle de régression linéaire.
La régression linéaire simple et la corrélation 415
L
Y~ Po + ^+
D aniel et W ood (1980) donnent plusieurs autres exemples de modèles non linéaires oui oeuvent
4L
se transform er en une droite.
O n peut aussi utiliser des fonctions monotones pour transformer la variable Y afin >'«• sta
b iliser la variance ou d’améliorer le respect du postulat de normalité des erreurs. cette
situation, on tentera souvent d’ajuster à nouveau le modèle en changeant Y par ln ou 1/Y, ou
encore par V F ou Y 2.
12.7 La corrélation
Jusqu’à présent, dans notre développement de l’analyse de la régression, on a supposé que X
est une variable m esurée avec une erreur négligeable et que Y est une variable aléatoire. D e
nom breuses applications d’analyse de la régression mettent en jeu des situations où X et Y sont
tou tes le s d eu x des variables aléatoires. Dans ces situations, on suppose souvent que les obser
vation s (X., Y.), i — 1, 2, . . . , n, sont des variables aléatoires conjointement distribuées obtenues
d ’u n e distribution f ( x , y). Par exemple, supposons qu’on désire développer un modèle de régres
sio n lia n t la résistance au cisaillem ent de points de soudure au diamètre des points. Dans cet
ex em p le, on ne peut contrôler le diamètre des points. On choisit au hasard n points de soudure
et l’o n o b serv e un diam ètre (x ) et une résistance au cisaillem ent (y.) pour chacun. D onc, X et Y
so n t d e s variab les aléatoires conjointement distribuées.
(12.27)
Autrement dit, la distribution conditionnelle de Y étant donné X correspond à une loi normale
de moyenne
E(Y\X) = P0 + p xX (12.30)
et de variance cr2(l - p2). On remarque que la moyenne de la distribution conditionnelle de
Y étant donné X est un modèle de régression linéaire. De plus, il existe une relation entre
le coefficient de corrélation p et la pente p r Selon l’équation 12.29b), si p = 0, alors Px = 0,
ce qui implique qu’il n’y a pas de régression de Y en X. Dans ce cas, la connaissance de X
n’aide pas à prévoir .YD’autre part, si p = 1, les points (X, Y) forment une droite par
la variance autour de la droite est nulle.
(12.31)
On remarque que
(12.32)
2 2
R r f l , 2 S x x
S YY
B S XY
S YY
SS R
S YY
qui obéit à une loi r avec n - 2 degrés de liberté si H0: p = 0 est vraie. Par conséquent, on rejette Yhy
pothèse nulle si \tQ\> toti2-n-2’
Ce test équivaut aux tests de l’hypothèse HQ: /?, = 0 présentés à la section 12.2. Cette équi
valence découle directement de l’équation 12.32.
La procédure du test de l’hypothèse
H o - P = »
Hj : p ^ p0, (12.35)
où p 0 5* o est un peu plus compliquée. Pour des échantillons modérément grands (par exemple
n > 25), la statistique
Z = arctanh r = (12.36)
jiz = arctanh p =
et une variance
g\ = (n -3 )
CHAPITRE 12
Exemple 12.10
Montgomery, Peck et Vining (2001) décrivent une application de l’analyse de la régression dans
laquelle une ingénieure au service d’un embouteilleur de boissons non alcoolisées étudie la distribu
tion de ses produits et le routage d’approvisionnement de ses distributeurs automatiques. Elle pense
que le temps de chargement et d’approvisionnement d’un distributeur automatique est lié au nombre
de caisses du produit livré.
Un échantillon aléatoire de 25 magasins de détail ayant des distributeurs automatiques est choisi, et
le temps de livraison (en minutes) au magasin ainsi que le volume du produit livré (en caisses) sont
observés pour chaque magasin (voir le tableau 12.4 et la figure 12.10). On suppose que le temps de
livraison et le volume des produits livrés sont conjointement et normalement distribués.
La régression linéaire simple et la corrélation 419
/
70 H
G 60-
O
C/3
sC
V—
3
<
50 -
>
< D 40-
T3
<
/C>
X30-
S
eu
H 20-
10
Nombre de caisses
) . V' r^ r
C lV - - '
a n
R U
^ 3
(T h
k'
*
a
^
e
^
f?So La relation entre le temps de livraison et le nombre de caisses,
•Xi
On remarque que R2 2
= (0,982)^ = 0,964 ou que la relation linéaire avec le volume livré explique 96
de la variabilité du temps de livraison. Pour tester l’hypothèse
H0:p = 0,
H,: p*0,
on calcule la statistique du test de l’équation 12.34 comme suit:
r^fn - 2 0,982^23
to 24,80.
1 -r 2 0,964
Puisque tQ025.23= 2,069, on rejette H0et on conclut que le coefficient de corrélation p diffère de 0 au seuil
de 5 %. Finalement, l’équation 12.38 permet d’établir un intervalle de confiance à environ 95 % pour p.
Comme arctanh r= arctanh 0,982 = 2,351, l’équation 12.38 devient
1,96 \ 1,96
tanh 2,351 < p < tanh 2,351 +
V22 J V V22 J
et se réduit à
0,959 < p < 0,992.
420 CHAPITRE 12
Résumé
Modèle linéaire simple
Y, = P0 + PlX, + Ei (i = l,...,n ),
où les Y sont indépendantes et suivent une loi N(/30 + p,X (, (T“).
H :/i * 1)
’ é y i 'v *
, , » . *’ i C%? ^ | 4
- - - *[ •
_■ ■< '. y ? '* '■ ‘ *’ i '■» . ^
V r tt Jj $ W ^ ^JVÿ
n n n
S xy
H (. - x ) ( y i - r ) = Y l X ,Y ,- n X Y ssR= X ( r , - 0 2 = P iS xy
n
/=i /=!
n n
K>
- X ) 2 : - n X 2 SSE
II
= ± ( X ,
i
•
Sxx : =X *? l é
1=1 1=1 1=1
n n
O}
/=1 /=!
R 2=
.ssR_ f>2SxX = coefficient de détermination Y, -Ÿ , = Y ,- (/30 +
* O
n,
L7 \J
X
/ •
Pl °5Y Y ei =
SST
( i= 1,2, ..., n)
/ x = 2109
Les données des exercices avec le symbole i*
ÿ = 6,964
sont aussi disponibles en format électronique. ^
*
Sxx = 3 604 739
~ s * • » . *
12.2 La revue Motor Trend présente fréquem- 12.3 Un article de Technometrics (« Prédiction,
(V f ment des données de performance de (£J linear régression and a minimum sum of
voitures. Le diagramme ci-dessous illustre relative errors », vol. 19, n° 2, 1977,
des données concernant la performance (y) p. 185-190) présente les données sur le
et la cylindrée (X)du moteur de prix de vente (Y) et les taxes annuelles
15 voitures.
( X)de 24 maisons ( diagramme
de dispersion ci-dessous).
\
La régression linéaire simple et la corrélation
<
*
12 12
S x = 5062,24 S - , = 558
i=l i=i
30 470,47 Sn = 280 620,9
T T T I T T
Pureté (%) 86,91 89,85 90,28 86,34 92,58 87,33 86,29 91,86 95,61 89,86
Hydrocarbures ( %) 1,02 1,11 1,43 1,11 0,95 1,11 0,87 1,43 1,02
—L2L
Pureté (%) 96,73 99,42 98,66 96,07 93,65 87,31 95,00 96,85 85,20 90,56
Hydrocarbures (%) 1,46 1,55 1,55 1,55 __U0_ 1,15 1,01 0,99 0,95 0,98
<D
o< 120-
A /V
-1,00 0,04 1,00 9,63
où Y représente la durée de vie de l’outil, X, est la vitesse de coupe et X2, l’angle de l’outil. C’est
un modèle de régression linéaire multiple à deux variables explicatives. On utilise le terme
«linéaire» parce que l’équation 13.1 est une fonction linéaire des paramètres inconnus fa0,
et fa2. Ces paramètres sont appelés les «coefficients de régression». Le paramètre fa0 définit
l’ordonnée à l’origine du plan. Les paramètres fax et fa2 sont parfois appelés «coefficients de
régression partiels » parce que faxexprime l’espérance mathématique de
une augmentation de 1 unité de X, lorsque X2 est maintenu constant et que fa2 exprime l’espé
rance mathématique de la variation de Y pour une augmentation de 1 unité de X2 lorsque X, est
maintenue constante. Le terme E désigne une erreur aléatoire, c’est-à-dire une variation non
expliquée par X, ni par X2.
De façon générale, la variable dépendante Y est liée à k variables indépendantes.
j = 0, 1, ..., k, sont appelés les «coefficients de régression». Ce modèle décrit un hyperplan dans
l'espace à k dimensions des variables explicatives {X,, X ,,..., XJ.
k
On suppose que les termes d’erreur E. du modèle sont tels que E(JE) = 0, Var(E) = cr2 et que les {Et)
sont des variables aléatoires non corrélées et normalement distribuées.
La régression multiple
un modèle de régression linéaire. En règle générale, tout modèle de régression qui est linéaire
par rapport aux paramètres (les p) est un modèle de régression linéaire, peu importe la forme
de la surface qu’il génère.
Observation Y x2 • • »
**
1 Yx *.2 • « •
*u
2 y2 *2. *22 • • •
*2,
• * • • •
• • • • • •
• • • • •
n *„2 ♦ ♦ •
La notation scalaire
E c r i v o n s l e m o d è l e d e l ’é q u a t i o n 1 3 .2 e n f o n c t i o n d e s o b s e r v a t i o n s . O n o b t i e n t
L e s e s t i m a t e u r s f i 0 , /3 ,, . . . , (3 k d e s p a r a m è t r e s /? 0, /? ,, . . . , {3k p a r la m é th o d e d e s m o in d re s c a r r é s
d o iv e n t a lo r s s a tis f a ir e le s é q u a tio n s
m é th o d e d e s m o in d re s c a rré s :
n n n n
n p 0
+ / 3 , X * . i + Â X
/=1
x i2 +"'+ÂX^ = x ^
/=1
*=1 /=1
P o t , * , , + Â 1 x i + P 2 ' £ x n x r .■ + - - - + Â X * A ; =Z v ,
( 1 3 .1 0 )
/ =1 / =1 1= 1 /=1 1= 1
• • • • •
• • • • •
• • 9 • »
P o X X * + P , ' £ X * X .n, + À X ! + , *- + Â X ^
i= 1 i= \ 1= 1 1= 1 1=1
O n r e m a r q u e q u ’i l y a p = k + 1 é q u a tio n s n o rm a le s , u n e p o u r c h a c u n d e s c o e ffic ie n ts d e r é g r e s
La notation matricielle
L a notation matricielle facilite la résolution des équations normales. Donnons un développe
m ent m atriciel des équations normales qui équivaut au développement de l’équation 13.10.
Le modèle en fonction des observations de l’équation 13.7 s’écrit, sous forme matricielle
Y =XB + E,
ou
1
I-------
1____
1
1-------
1 Xn X{2 X
Æ \k,
1 *21 X ... x
Y y2 22 æ 2k Pl et E =
= » , X = é• ••
♦ ♦
• • . P . ! ,
,» • -•
•
•
•
0
''
Yn 1 x n2;----- ^ nk Pk E„
9§—
— J
= - 2 X Y + 2X'XP = 0,
qui se simplifie en
X X p = X'Y. (13.12)
L e système d’équations 13.12 constitue les équations normales de la méthode des moindres
carrés ; il est identique au système d’équations 13.10. Pour résoudre les équations normales, on
m ultiplie les deux membres du système 13.12 par l’inverse de la matrice X'X.
- ■ « . * ' • » . ■»
Exemple 13.1
Un article du Journal of Agricultural Engineering and Research (vol. 73, n° 3,1999, p. 275-282) décrit
l’utilisation d’un modèle de régression pour expliquer l’ampleur des dégâts (meurtrissures) sur les
pêches en fonction de la hauteur de leur chute (mesurée en millimètres) et de leur masse volumique
(mesurée en grammes par centimètre cube). Un des buts de l’analyse est de trouver un modèle de pré
vision de la taille des meurtrissures des pêches qui servira de guide pour la récolte et la postrécolte.
Le tableau 13.2 présente des données typiques de ce genre d’expérience, tandis que la figure 13.1
illustre le lien linéaire entre Y et les variables X et X prises une à la fois.
PfL * ï a ç
La 0 11 * Æ
. 1
On ajustera le modèle de régression linéaire multiple Y = fi0 + fî]Xl + fî2X2 + E sur ces données. La
matrice X et le vecteur Y de ce modèle sont
303.7
366.7
336.8
304.5
346.8
600,0
369.0
418.0
269.0
323.0
562.0
284,2
558.6
415.0
349,5
462.8
333.1
502.1
311.4
351.4
CHAPITRE 13
F 20 7767,8 19,93
7767,8 3 201646 7791,878
I 19,93 7791,878 19,9077
Selon l’équation 13.13, les estimateurs par la méthode des moindres carrés sont
On pourrait dire que, selon ce modèle ajusté, une hausse de 10 cm (ou 100 mm) de la hauteur de chute
correspond à une augmentation moyenne de 1,314 mm de la meurtrissure pour une m asse volum ique
fixée. De même, on peut estimer qu’un fruit ayant une masse volumique supérieure de 0,1 g/cm 3 à celle
d’un autre fruit aura une meurtrissure prédite de 3,5 mm plus grande s’ils tombent de la m êm e hauteur.
Notons que la valeur individuelle des coefficients doit être interprétée avec prudence, car elle peut varier
grandement en fonction des autres variables présentes dans le modèle, surtout si les variables explica
tives sont corrélées entre elles. La section 13.6 aborde ce problème appelé « multicolinéarité ».
La régression multiple
Le tableau 13.3 énumère les valeurs ajustées de Y et les résidus. La valeur 1,56 sur la première ligne,
par exemple, est la valeur prédite (sur le plan de régression) correspondant à une hauteur de chute de
303,7 mm et une masse volumique de 0,90 g/cm3. Elle est obtenue en calculant
l ■f. i #J A ( • i lJ 11 1■ 1I 1 1 [i, a .m ^ l F
*k v
'jK» ■*1
t
Numéro de * ^ ^ a
A
/\
2. La matrice des covariances de p se calcule comme suit :
Cov(/3) = E { l P - E ( j ) ) } [ j } - E m ' } = <72(* ’* )-'.
La matrice des covariances de p est une matrice symétrique de dimensions
(Jk + 1) x {k+ 1) dont l’élément (j,
A
j) est la variance *
3. Il faut habituellement estimer a 2 pour calculer des estimations des erreurs-types associées
aux pj• Pour développer cet estimateur, on considère la somme des carrés des résidus, soit
ssE=jj>',
1=1
= (Y-XP )XY-XB )
(13.16)
Démonstration
___________________________ /
L’équation 13.16 est appelée la « somme des carrés des résidus » ou « somme des carrés
due à l’erreur»; elle a n - (k + 1) degrés de liberté. La moyenne des carrés due à
l’erreur est
(13.17)
(13.18)
Exemple 13.2
Estimons la variance de l’erreur g 1 du problème de régression multiple de l’exemple 13.1. En se basant
sur le tableau 13.2, on a
20
Y'Y = ^ y f =904,60
/=!
120,79
P'X'Y = [-33,831 0,01314 34,890] 51129,17
122,70
866,39.
«-(& + 1)
38,21
2,247.
La régression multiple 437
7 = 0,1,..., k, (13.19)
<7 C j„j
est distribuée selon une loi t de Student avec n —(k+ 1) degrés de liberté, où C* est l’élément (/, j)
de la matrice ( X ï ) " 1 et<72, l’estimateur de la variance de l’erreur, obtenu de l’équation 13.18.
Exemple 13.3
*
ce qui se simplifie en
0,004 36 <fil <, 0,021 92.
À r.
On peut aussi obtenir un intervalle de confiance pour la réponse moyenne en un point par
ticulier, c’est-à-dire pour des valeurs spécifiées des variables X , . . X,. On définit le vecteur
1
x 01
X0 X 02
»
X 0k • x-v
L
CHAPITRE 13
Y0 = x'0p. (13-21)
A
Var (y0 1
) = o 2x 'J X 'X r'x „ . (13.22)
Y + r
*0 —1a!2; n- (k +1) (13.23)
L’équation 13.23 est un intervalle de confiance défini dans l’hyperplan de régression. C’est
la généralisation de la régression simple de l’équation 12.23.
Les scientifiques qui effectuent l’expérience sur les pêches meurtries de l’exemple 13.1 désirent établir
un intervalle de confiance à 95 % pour la taille moyenne des meurtrissures d’une pêche qui tombe
d’une hauteur *01 = 325 mm et qui a une masse volumique x02= 0,98 g/cm3. Donc,
1
x0 325
0,98
33,831
1 325 0 ,98 1 0, 01314 4,63
34,890
2,247(0,0718) = 0,1613.
Donc, selon l’équation 13.23, l’intervalle de confiance à 95 %pour la taille moyenne des meurtrissures
en ce point est
4.63 ± (2,110)^0,1613
%
4.63 ±0,85,
ce qui se réduit à
3,78 <£(V0|x 0)< 5,48
La régression multiple 439
est une estimation ponctuelle de la future observation Y0 au point (x01, a()2, ..., x,. i. et
*
Cet intervalle de prévision est une généralisation de l’intervalle de prévision pour une
future observation de la régression linéaire simple de l’équation 12.25.
Exemple 13.5
Supposons que les scientifiques mentionnés dans l’exemple I3.l désirent établir un intervalle de pré
vision à 95 % sur la taille d’une meurtrissure subie par une pêche tombant d’une hauteur xol = 325 mm
et de masse volumique x 02 = 0,98 g/cm3. On remarque que = [l 325 0,98) et que l’estimation
ponctuelle de la taille de la meurtrissure est 9o = x ofi= 4,63 mm.
À l’exemple 13.4, on a trouvé que (Ar'Ar)-Ijtü = 0,0718. Donc, selon l’équation 13.25,
X,A
I-- ]
' j|
. CS
«
=2 *<U V Région N.
3 *o \ conjointe d e s \
2: *3
B ’5Sb \ données \
g
•G n. originales \
ox
02 li J
±_ I ^ ----
l
l ;
I
-
I
4 * wy
*6l
Intervalle j
original de Xx
t
Un exemple d'extrapolation en régression multiple (à éviter)
H y p o th è s e s d u t e s t g lo b a l d e s ig n ific a tio n d e la r é g r e s s io n
= -------A - 0 ,
* •* . (I3.26)
Hj : f5j & 0 pour au moins un j.
Le rejet de H0: p =0 ,y = I, ..., Æimplique qu’au moins une des variables indépendantes X v X2, ..., Xk
contribue de façon significative au modèle.
2
et si Ho est vraie, alors SSR/cr2 ~ x\-> où le nombre de degrés de liberté pour la loi du % est égal
au nombre de variables explicatives du modèle. On peut aussi démontrer que SSEIO2 ~
et que SS, et SSKsont indépendantes.
C r i t è r e d e r e j e t d e H 0: = O
La procédure de test pour H0 consiste à calculer
SSR/k MS R
F,o
SS, /(n-k-1 ) MS,
Cette procédure est habituellement résumée dans un tableau d’analyse de la variance tel le
tableau 13.4.
mBsmmBasmmaaUmÊÉffl
' T r V \ T r * / - Vi K - î «Tl Z * I
^
^
: .1 ® . A J R J ! Xi
l ï ï < i U ■i, 'v«-t
b i d [ > l i T i ü ^ m » ] i i n 1 *J r M i l * r
K S * I fi
■( / ■ A *•
I fi $
■ A/- - . y*
•
im
a r ;
I ï i 1 * *
1 t l l r 1 M B I & ? j r»{KCM
£* ., * : J ïy ' l
>- f »
*■■■• • . •
•; ‘ :■
'.
-
• •' - •
:. V . T / • / ; / V - '/ :
:
'
•
;.v
••-■:•
-V :.
Une formule de calcul de SSR peut être déduite des formules de SST et de SSB. Rappelons
tout d’abord que la somme des carrés totale est
n / \2
ss T 2 lf2>, Y ' Y - -l \ ± Y ^ (13.28)
i=l n ; n{ t l j
Notons également que l’équation 13.16 donne une formule de calcul de la somme des car
rées due à l’erreur, à savoir
SSE= Y Y - P'X'Y. (13.29)
Puisque
* —
* i • 0. -• 4 ~ “ w\ ' • **»
Exemple 13.6
Testons la signification de la régression à l’aide des données sur les pêches meurtries de l’exemple 13.1.
Quelques-unes des grandeurs numériques nécessaires ont été calculées à l’exemple 13.2. On remarque
que
n
2
1
SST = Y'Y Y, y,
n '=1 J
(120,79) 2
904,60
20
175,089,
n \ 2
1
55 P'X'Y *Ly, R
n V'=*
(120,79) 2
866,39
20
136,88,
SS 55 55 «
38,21.
Le tableau 13.5 donne l’analyse de la variance. Pour tester H0: /?, = = 0, on calcule la valeur de la
statistique FQ,c’est-à-dire,
Comme f 0 > F0X)S.2,n = 3,59, la taille des meurtrissures des pêches est liée à la hauteur de chute, à la
masse volumique des fruits ou aux deux. Toutefois, on remarque que cela n’implique pas forcément
que la relation trouvée est la bonne pour prévoir la taille des meurtrissures en fonction de la hauteur
de chute ou de la masse volumique des fruits. Des tests supplémentaires sur la validité du modèle sont
nécessaires.
L’ajout d’une variable à un modèle de régression augmente toujours la somme des carrés
due à la régression et dim inue toujours la somme des carrés des résidus. On doit décider si
l’augmentation de la somme des carrés due à la régression suffit pour justifier l’ajout d’une
variable au modèle. De plus, l’ajout d’une variable sans importance au modèle peut augmenter
la moyenne des carrés due à l’erreur et donc diminuer l’utilité du modèle.
• ■. ^
H0: # = O,
Hj : Pj* 0. (13.31)
T e s t p a r t ie l d e s ig n if ic a t io n p o u r un c o e f f ic ie n t
La statistique du test bilatéral pour H ' P - 0 est
T,0
P, (13.32)
01 > taJ 2 ; n — k _j. On remarque que ce test est un test partiel (ou marginal) parce que le coefficient de
si |r0|
régression P dépend de toutes les autres variables explicatives X. (i j) du modèle.
Exemple 13.7
Pour illustrer l’utilisation de ce test, on considère les données de l’exemple 13.1. Supposons qu’on veut
tester
0,
H ,:A * 0 .
L’élément de la diagonale principale de (X’X)~l correspondant à P2est C22= 30,096. Donc, la valeur
observée de la statistique T0de l’équation 13.32 est
34,89
4,24
y[(2,247)(30,096)
Comme t0025. 17 = 2,110, on rejette H0: y32 = 0 au seuil de 5% et l’on conclut que la variable X2 (la
masse volumique) contribue de façon significative au modèle. Une démarche équivalente consisterait
à vérifier que la valeur 0 n’appartient pas à l’intervalle de confiance à 95 % pour fi . Ce test mesure la
contribution partielle ou marginale de X2étant donné que X, est dans le modèle.
444 CHAPITRE 13
Y =XP+E,
où Y est de dimensions n x 1; ,d
X e dimensions + 1) ; de
de dimensions n x 1. Déterminons si le sous-ensemble de variables explicatives X 2, ...
( r< k) contribue de façon significative au modèle de régression. Soit le vecteur des coefficients
de régression divisé comme suit :
H0:A = 0,
H, : p x0*. (13.33)
(13.34)
r y - p 'x 'Y
n —k —1
La variable aléatoire SSR(P) est appelée «somme des carrés due à la régression associée
à p ». Pour trouver la contribution des termes de à la régression, on ajuste le modèle en sup
posant que l’hypothèse nulle H0: Px= 0 est vraie. Selon l’équation 13.34, le modèle ré d u it est
Y = X2P2+ E. (13.35)
A
La somme des carrés due à la régression associée à /?, étant donné que est déjà dans le
modèle, est
Cette somme des carrés a r degrés de liberté. On l’appelle parfois la « somme des carrés
additionnelle» due (ou associée) à fi. On remarque que SSR(fi\fi) est l’augmentation de la
somme des carrés due à la régression attribuable à l’inclusion des variables X,, .., dans
le modèle. Notons que SSR(fil\fi2) est indépendante de MSE.
Si f 0 > Fa-.r,n-o
k-v n rejette H0 et on conclut qu’au moins un des paramètres de n’est pas nul et
donc qu’au moins une des variables X,, X2, ..., Xrde X, contribue de f
régression.
Certains auteurs qualifient le test de l’équation 13.38 de «test F partiel». Le test F partiel
est très utile. On peut l’utiliser pour mesurer la contribution de X. en la considérant comme la
dernière variable ajoutée au modèle et en calculant
Exemple 13.8
Considérons les données sur les pêches meurtries de l’exemple 13.1 et analysons la contribution de la
variable X2 (masse volumique) au modèle. Autrement dit, testons
H0:A = 0,
H, : fi * 0.
Pour tester cette hypothèse avec le test F partiel, il nous faut la somme des carrés additionnelle qui est
attribuable à fi, soit
ss„(/î2|A, A) = ssM .fr, A) - ssR(p0, fr)
= ss,<fi,. AIA) - ssjp.\fr„).
446 CHAPITRE 13
(2 degrés de liberté)
(1 degré de liberté).
Par conséquent, on a
S S R(P 2|A), A) = 136,88-96,21
= 40,67 (1 degré de liberté).
On remarque que MSEdu modèle complet, utilisant X, et X2, intervient au dénominateur de la statis
tique du test. Comme F00s. , 17= 4,45, on rejette H0: = 0 et l’on conclut que la masse volumique (X2)
contribue de façon significative au modèle.
Comme ce test F partiel comprend une variable unique, il est équivalent au test t. Pour illustrer
cette équivalence, on se souvient que le test t sur H0: = 0 a do
On se souvient aussi que le carré d’une vàriable aléatoire suivant une loi t avec v degrés de liberté
est une variable aléatoire suivant une loi F avec 1 et v degrés de liberté, et l’on remarque que
t l = (4,24)2 = 17,98 « / 0.
R2
Le coefficient de détermination multiple est
l *
(13.39)
La régression multiple 447 ]
Le R 2 représente la proportion de la variabilité de Y expliquée par les variables X v X2, ..., Xk.
Com m e dans le cas de la régression linéaire simple, on doit avoir 0 < < 1, car SSR+ SSF= SSr
Le R 2 sera égal à 1 si tous les points sont situés exactement sur l’hyperplan défini par l’équation de
régression. Cependant, une grande valeur de R2n’impliq
de régression est optimal. L’ajout d’une variable au modèle augmentera toujours R 2, que la
variable supplémentaire soit statistiquement significative ou non. Il est donc parfaitement plau
sible que des modèles à R2 élevé produisent des prévisions moins fiables qu’un autre modèle à
R2 plus bas.
R 2 a ju s té
Pour mesurer la qualité de l’ajustement d’un modèle, plusieurs praticiens préfèrent utiliser le coeffi
cient de détermination multiple ajusté défini par
SSE/ ( n - k - 1)
(13.40)
SST/ ( n - 1)
L a grandeur SST/(n — 1) est constante quel que soit le nombre de variables du modèle.
En outre, SSE/(n — k — 1) est la moyenne des carrés due à l’erreur, qui varie avec l’ajo
suppression de termes (nouvelles variables explicatives, termes d’interaction, termes de degré
supérieur) au modèle. Donc, le R J n’augmentera que si l’ajout d’un nouveau terme diminue
de façon considérable la moyenne des carrés due à l’erreur. Autrement dit, le coefficient
défavorisera l’ajout de termes au modèle qui ne sont pas importants dans la modélisation de la
réponse.
Exemple 13.10
Calculons le R2 pour le modèle de l’exemple 13.1. Selon l’exemple 13.6, SSE= 38,21 et SST= 175,09.
Alors,
{ 38,21/(20-3) 2,247
175,09/(20-1) 9,215
0,756.
448 CHAPITRE 13
Exemple 13.11
Dans l’exemple 13.1 sur les meurtrissures de pêches, il faut ajuster 3 modèles : celui contenant X(, celui
contenant X , et celui contenant X, et X2. Les critères d’ajustement de ces modèles sont présentés dans
le tableau 13.6.
| A| fl J * v F A W • .f l \ T a * « û ♦ $ 4 T ¥ * XF'J fs- «ÿ y
Si v l JW Si b. wJ 1 t I * Pv
-
►A A
Nombre de variables A A R2
1 0,02* —
0,549 0,525
1 —
49,08 * 0,653 0,634
2 0,01* 34,89 * 0,782 0,756
* Test partiel significatif
Selon les deux critères d’ajustement calculés, le meilleur modèle est celui contenant les deux variables
(hauteur de chute et masse volumique). Le meilleur modèle à une variable serait celui où X2 sert de
variable explicative. On remarque que les estimations des coefficients sont un peu différentes lorsqu’on
ajoute une seconde variable.
L'impact de la multicolinéarité
Dans la plupart des problèmes de régression linéaire multiple, les variables explicatives X.J sont
corrélées les unes avec les autres. Si cette intercorrélation est très grande, on dit qu’il y a multi
colinéarité. Dans une telle situation, les variances (et covariances) des coefficients de régression
deviennent très grandes, et par conséquent leur estimation est très volatile, donc peu fiable. Il faut
ainsi faire attention à l’interprétation des coefficients individuels de même qu’aux tests ou inter
valles de confiance sur fi que l’on utilise, et se rappeler qu’il s’agit d’inférence partielle, c’est-
à-dire une analyse qui prend en compte la présence des autres variables dans le modèle. La
multicolinéarité peut aussi avoir un impact sur les méthodes de sélection de variables, d’où l’im
portance d’avoir des critères globaux, ou même de comparer les résultats de plusieurs méthodes.
Exemple 13.12
Considérons les nuages de points à la figure 13.3, où on cherche à prédire Y à partir des variables
X| et X2 ou de seulement l’une d’entre elles. Les deux premiers graphiques nous portent à croire que
Xj et X2 ont toutes les deux une relation linéaire importante avec C’est d’ailleurs ce que les deux
modèles à une variable confirment: X, et X2 sont significatives lorsque prises séparément comme
prédicteur de Y. Devrait-on s’attendre à ce que le modèle comprenant X] et X2 soit le meilleur pour
expliquer la variabilité de L? ►
La régression multiple 449
Le tableau 13.7 présente les coefficients de détermination des trois sous-modèles pour prédire F: celui
incluant X , celui incluant X,, et celui incluant X] et Xr Le R2 favorise comme toujours le modèle ayant
toutes les variables. Par contre, le R2nous incite à n’inclure que X] dans le mo
que la variable X2, pourtant très liée à F, ne soit pas incluse dans le modèle ayant le meilleur ajustement
selon ce critère ?
Des variables explicatives très corrélées, comme c’est le cas pour X, et X2 ( la figure 13.3c),
expliquent la même portion de variabilité de F. Ainsi, X2 est moins utile individuellement lorsque X
est dans le modèle, et vice versa. On voit dans le tableau 13.7 que , et X2 perdent leur significativité
lorsqu’elles sont considérées simultanément dans le modèle linéaire. L’estimation de (32change même
de signe lorsqu’on inclut X, dans le modèle. Il ne faut pas en déduire que les deux variables sont inu
tiles: le test F sur le modèle à deux variables peut être significatif même si les tests partiels sur les
coefficients ne le sont pas. Ces derniers mesurent l’impact d’une variable une fois que toutes les aut res
sont prises en compte.
ii
1
i
t
Nombre de variables A Â R2 R l
Les résidus du modèle de régression multiple estimé, définis par ei = Yi - Y i (pour i — 1, ..., n),
jouent un rôle important dans l’évaluation de la validité du modèle, comme ils le font dans
la régression linéaire simple. Les mêmes graphiques de résidus nous seront utiles en régres
sion multiple afin de vérifier que les postulats de normalité des erreurs et d’homogénéité de la
variance sont respectés.
Il est aussi intéressant de représenter graphiquement les résidus en fonction de variables
qui sont absentes du modèle actuel, mais qu’on pourrait vouloir y inclure. L’ajout d’une variable
peut améliorer le modèle si une relation existe entre les résidus et cette variable.
450 CHAPITRE 13
Exemple 13.13
Le tableau 13.3 présente les résidus du modèle estimé de l’exemple 13.1. Ces résidus sont représentés
sur le diagramme de probabilité normal de la figure 13.4a). Les points sont assez bien alignés, donc
aucun écart sérieux par rapport à la loi normale n’est évident, même si le plus petit résidu (e3= -3,17)
n’est pas près des autres. A la figure 13.4b), les résidus sont représentés en fonction des valeurs pré
dites ; à la figure 13.5, ils le sont en fonction de X, et de X2. À la figure 13.5a), il semble que l’hypothèse
de la constance de la variance n’est peut-être pas parfaitement satisfaite. La suppression de l’obser
vation plus éloignée peut améliorer l’ajustement du modèle, mais rien n’indique une erreur dans la
collecte de données. Donc, le point sera conservé et l’homogénéité de la variance autour de la droite
sera considérée comme un postulat dont on ne s’éloigne pas trop.
hm
3
2 .
»
V5 1
."2
oc 0
ND 1
ûS -1
-2
-3
2 7 12
Quantiles échantillonnaux Valeurs ajustées
a) b)
Y= + (3xX +p x
Exemple 13.14
Les panneaux des parois latérales intérieures d’un avion sont formés à l’aide d’une presse de 1500 tonnes.
Les frais de fabrication unitaires sont fonction de la taille du lot à produire. Les données ci-dessous
fournissent les frais moyens unitaires (en centaines de dollars) pour ce produit, Y, et la taille du lot
à produire, X. Selon le diagramme de dispersion représenté à la figure 13.6, un polynôme du second
degré pourrait offrir un ajustement satisfaisant.
20 30 40 50 60 70 80 90 1
Taille du lot i
r o
_ i f a
K V 7
I l I fl * i
y, (
Ajustons le modèle
1,81 1 20 400
1,70 1 25 625
1,65 1 30 900
1,55 1 35 1225
1,48 1 40 1600
1,40 1 50 2500
, x=
1,30 1 60 3600
1,26 1 65 4225
1,24 1 70 4900
1,21 1 75 5625
1,20 1 80 6400
1,18 1 90 8100
La résolution des équations normales X'X f$= X'Y donne le modèle ajusté
Total 0,5265 11
Généralement, pour ajuster des polynômes, on préfère utiliser le modèle ayant le plus petit
degré tout en étant compatible avec les données. Dans cet exemple, il semblerait logique d’ana
lyser la pertinence du terme quadratique du modèle. Autrement dit, on devrait tester
H, : Ai * 0-
On utilise le test général de signification de la régression pour tester cette hypothèse. On
doit donc déterminer la somme des carrés additionnelle due à soit
Selon le tableau 13.8, la somme des carrés SSK(filt P U\P0) = 0,5254. Pour trouver SSR(P\fi0), on
ajuste un modèle de régression linéaire simple sur les données originales. On obtient
y = 1,9004 - 0,0091X.
O n vérifie facilement que la somme des carrés due à la régression de ce modèle est
S S M IA) = 0,4942.
Donc, la somme des carrés additionnelle due à /?,,, étant donné que P et f30 sont dans le
m odèle, est
s s M P v A) = s s P M ) - ssM P o )
= 0,5254 - 0,4942
= 0,0312.
L e tableau 13.9 décrit l’analyse de la variance avec le test de H0: p n = 0 incorporé dans la
procédure. On remarque que le terme quadratique contribue de façon significative au modèle,
puisque la valeur f 0 qui lui correspond, 257,85, est bien au-delà de la valeur critique au seuil
de 1% .
• ^ j v m Sl w J ■ ' -
w H ■ y 1 % ■# • . C . ■ 1 ► J. é Y æ 0 .j w* 0 ■ . Y 0 M A dk Y .
fjr# y, £ ÿ < i v h e &S i- .y A 'f +
Source de
w » * • «
Somme Nombre de Moyenne
variation des carrés degrés de liberté des carrés /.
Régression SS, (fi, A IA) = 0,5254 , 2 , 0,262 7 2171,07
linéaire SS, (Al A) = 0.4942 1 0,494 2 4084.30 |
quadratique (A J A. A) = 0,0312 1 0,031 2 ; 257,85
. 1
Erreur 0,0011 9 0,000 121
Total 0,5265 II
En règle générale, une variable qualitative à t niveaux est représentée par t - 1 variables
indicatrices, lesquelles prennent les valeurs 0 ou 1. Donc, s’il y avait trois opérateurs, on tien
drait compte des différents niveaux à l’aide de deux variables indicatrices définies comme suit :
Les variables indicatrices sont aussi appelées «variables nominales». L’exemple 13.15 pré
sente quelques-unes des utilisations des variables indicatrices. Pour d’autres applications, voir
Montgomery, Peck et Vining (2001).
Exemple 13.15
Cet exemple est adapté de l’ouvrage de Montgomery, Peck et Vining (2001). Un ingénieur méca
nicien analyse le fini de surface des pièces métalliques usinées sur un tour et la relation de
celui-ci avec la vitesse de rotation (en tours par minute - tr/min). Les données sont présentées au
tableau 13.10. On remarque que les données ont été obtenues avec deux types différents d’outils à
couper. Comme il est probable que le type d’outil à couper influe sur le fini de surface, on ajuste
le modèle
Y=P0+ {3lXi + p2X2+ E,
où Y est le fini de surface, Xxest la vitesse de rotation du tour et X2, une variable indicatrice dénotant
le type d’outil à couper utilisé, soit
L’interprétation des paramètres de ce modèle se fait comme suit. Si X2= 0, le modèle devient
Y=/30+PlXl + E,
un modèle linéaire de pente /?, et d’ordonnée à l’origine {30. Mais si X2= 1, alors le modèle devient
^ ^V ■
-'*f^*~,y**■w
yr»5.'I-T
#'
.
J
ÉP
?»
. f
V *
'
7 *<,y'jr tb.^ X.jHr,j K.Va\T,ib*RLyf ç• SC T a • L
._i« .•« ^j . f. . V
■rn
.S
s*r*'— k yJR êâJ»f»gH
Av'*R■ [^yrr’?* ^Vtt•.>/t 's.-'j
Numéro Fini de Vitesse de rotation TVpe d’outil Variable indicatrice
de l’observation, surface, (tr/min), X U a couper de l’outil, A’,,
1 45,44 1 225 1 302
1 0
42,03 200 302 0
2
50,10 250 302 0
3
4 48,75 245 302 0
5 47,92 235 302 0
6 47,79 237 302 0 i
'►
•»V
■ '■s»..»*• “/fÆ js^*kav..y».•^yr..-■■/*-./V’V f(,y^•V
,jg./»«?#»yg»—
< .vgj,fy‘Vi»8^£■
ia
B ./.IV
B ■
'•rW
B *^■
-j1.ja^ !
5 ^ ).‘T
-L44'* j
SR8i
vkAj ij
C% —: «
**-^'
• ^ .
C
fN * j f *
•'1a"*>«1/l.*,‘vjT*■ ».w 9
i f
H
y.v.|.*% r* < B '
♦•*
y
Il
**«• %|V4F|
f
l
CyA l
Hf f
, J^r'V-
s
jX
V-J
v
^O*V
-
*
T*%î
»
4\
^J
^*
y
• »^W^
n
i
oîR
v-
*
F Y|
r
Æ
**b
41
BAV
7»
4b6
!
)Y
•L
-7
*.
_
/W
,
ry^ v=.,-■»~ \1 -~=.
»*A
^F
-
,»^^'
S
rm
■%
4f
,
»l Æ
y
,4*f
lJ
KJ
Bf
l Mf
l%v
p
™ î!■'
flt
V
^B^
| S
t.
*
^'
\iy
.
-' -. a' . »w
y.ar.~_y'-»*
’.#y.s*v.*». / /X w v•svV
Source de Somme Nombre de Moyen ne
variation des carrés *s degrés de liberté des carrés /»
| Régression | 1012,0595 2 506,0297 1103,69*
SS„ ( A IA,) l 130,6091 1 130.6091 284,87 *
ss„(A lft, /?,) 881,4504 1 881,4504
-wi,* 1922,52*
•
Erreur 1 7,7943 17 0,4508
j Total 1 1019,8538 19
* Significatif au seuil de 1% ►
îs r’
CHAPITRE 13
On remarque que l’hypothèse H0: /?, 0 (signification de la régression) est rejetée. Le tableau 13.11
contient aussi la somme des carrés
SS,= SSM , Al ) 0)
= ssM P o) A. A).
ce qui permet de tester l’hypothèse H0: p2= 0. Comme cette hypothèse est aussi rejetée, on conclut que
le type d’outil influe sur le fini de surface.
On pourrait aussi utiliser des variables indicatrices pour déterminer si le type d’outil influe à la fois sur
la pente et l’ordonnée à l’origine.
Une autre façon d’analyser cet ensemble de données consiste à ajuster des modèles de régression dis
tincts sur les données de chaque type d’outil. Cependant, la méthode utilisant les variables indicatrices
présente plusieurs avantages : 1) on ne doit estimer qu’un seul modèle de régression ; 2) la combinaison
des données des deux types d’outils donne un plus grand nombre de degrés de liberté pour l’erreur;
3) les tests des deux hypothèses sur les paramètres supplémentaires sont simplement des cas particu
liers du test général de signification de la régression.
Modèle
K 0 + 13, Xn + /32X(2+ •••+ PkXik + £, (/ = 1, ...,
où les E sont indépendantes et suivent une loi /V(0, g2).
Forme matricielle
Y X(3 + E
Variance a 2 â 2 = MSe •
Vecteur P p = { x fx y xx ' y
/s
Coefficient p. pj - 1P s e ■c »
Moyenne £ (F |x 0) Y0 =x'0p Y0 ± . - *-1-Jm s c )
k 0
H|: ^ 0 pour au moins un
1
La régression multiple
C jj = élém en t ( j , j ) de ( X ' X ) ~ ]
\2
S S H/ ( n - k - l ) = SS r +SSI: = Y ' Y -
S S T/ ( n - 1) J
Of\
5,26 369,0 0,96 12,7 20,4 155,5
1 7
1 8 6,09 418,0 1,00 46,0 18,1 129,2
6,57 269,0 1,01 2,6 21,5 154,6
1 9
4,24 323,0 0,94 6,9 1 24,4 152,8
1 10
11 8,04 562,2 1,01 27,3 19,5 199,6
12 3,46 284,2 0,97 30,6 20,2 177,5
13 8,50 558,6 1,03 37,7 22,6 210,0
14 9,34 415,0 1,01 26,1 17,1 1 165,1
15 5,55 349,5 1,04 48,0 21,5 195,3
16 8,11 462,8 1,02 32,8 23,7 171,0
17 7,32 333,1 1,05 29,2 21,9 1 163,9
18 12,58 502,1 1,10 4,0 16,9 1 140,8
19 0,15 311,4 0,91 39,2 26,0 154,1
20 5,23 351,4 0,96 36,3 1 23,5 1 194,6
f) Établissez, à partir du modèle complet, complet ? Les coefficients /?,, ..., /?9
un intervalle de confiance à 95 % pour sont-ils tous significatifs ?
la taille moyenne des meurtrissures c) Ajustez un modèle de régression mul
d’une pêche tombée de 325 mm, de tiple établissant un lien entre le nombre
masse volumique = 0,98 g/cm3, ayant de matchs gagnés et les passes (en
une marque à 30 mm, une pulpe de verges) des équipes (X2), le pourcentage
21 mm et une énergie potentielle de jeux d’attaque ( X7
) et l’attaque
de 190 x 10~3 calories. Comparez votre verges) des adversaires (Xg). Donnez
réponse aux valeurs de l’exemple 13.4. l’équation du modèle estimé.
13.3 Le tableau 13.13 présente les statistiques d) En vous basant sur le modèle en c), calcu
(B des performances des équipes de la lez un intervalle de confiance à 95 % pour
National Football League en 1976. Ces la hausse moyenne du nombre de victoires
données sont tirées du magazine The lorsque les attaques augmentent de 1% et
Sporting News. que les passes de l’équipe et les attaques
a) Ajustez un modèle de régression mul des adversaires restent inchangées.
tiple incluant les neuf variables explica e) Retirez la variable Xgdu modèle en c).
tives pour prédire le nombre de matchs Interprétez l’estimation du coefficient
gagnés. associé au pourcentage d’attaque (X7).
b) Y a-t-il au moins une variable signifi Comparez avec votre réponse en d).
cative au seuil de 5 % dans le modèle Comment expliquez-vous cette variation ?
La régression multiple 459
MFlîl m KMi
»-J*w m
~LO V
"m
t"
;-
M •{
•' •-VV': : ' r
tA'
V f
■4-
.
Av ' -
,
6\2ci m
a• •\Jjjf
.
Equipe F 1 *3 X X 1 X 1 X^8 , I
Washington 10 1 2113 1985 38,9 64,7 +4 868 1 59,7 1 2205 ! 1917
Minnesota 11 2003 2855 38,8 61,3 +3 615 55,0 2096 1575 |
New England 11 2957 1737 40,1 60,0 +14 914 65,6 1847 2175 j
Oakland 13 2285 2905 41,6 45,3 -4 957 61,4 1903 2476 j
Pittsburgh 1° 2971 1666 39,2 53,8 +15 836 66,1 1457 - Î8n6
Baltimore 11 2309 2927 39,7 74,1 +8 786 61,0 1848 | v'mo
K -Jv«*
.
Los Angeles 10 2528 2341 38,1 65,4 +12 754 66,1 1564 >t / fei>
Dallas 11 2147 2737 37,0 78,3 -1 761 58,0 1821 i909
Atlanta 4 1689 1414 42,1 47,6 -3 714 57,0 2577 2001
Buffalo 2 2566 1838 42,3 54,2 -1 797 58,9 2476 2254
Chicago 7 2363 1480 37,3 48,0 +19 984 67,5 1984 2217
Cincinnati 10 2109 2191 39,5 51,9 +6 700 57,2 1917 1758 I
Cleveland 9 2295 2229 37,4 53,6 -5 1037 ! 58,8 ! 1761 2032 1
Denver 9 1932 2204 35,1 71,4 +3 986 58,6 1709 2025 1
Detroit 6 2213 2140 38,8 58,3 +6 819 59,2 1901 1686 1
| Green Bay 5 1722 1730 36,6 52,6 -19 791 54,4 2288 1835 1
Houston 5 | 1498 2072 35,3 59,3 -5 776 49,6 2072 1914 |
Kansas City 5 1873 2929 41,1 55,3 +10 789 54,3 2861 2496 1
Miami 6 2118 2268 38,2 69,6 +6 582 58,7 2411 2670 1
New Orléans 4 1775 1983 39,3 78,3 +7 901 51,7 2289 2202 1
New York Giants 3 1904 1792 39,7 38,1 -9 734 61,9 2203 1988 1
New York Jets 3 1929 1606 39,7 68,8 -21 627 52,7 2592 2324 1
Philadelphia 4 2080 1492 35,5 68,8 -8 722 57,8 2053 2550 1
St. Louis 10 2301 2835 35,3 74,1 +2 683 ' 59,7 1979 | 2110 1
San Diego 6 2040 2416 38,7 50,0 0 576 54,9 2048 t 2628 1
San Francisco 8 2447 1638 39,9 57,1 -8 848 65,3 1786 1776
Seattle 2 1416 2649 37,4 56,3 -22 684 43,8 2876 2524
1TampaBay 0 1503 1503 39,3 47,0 -9 875 1 53,5 1 2560 1 2241 j
JR
ÎÎJV A - •C'
.JJ*» '
'£ Sv- t *> «■><
__
■ « 'i i i / .
Voiture Y 1 x2 . *3
Apollo 18,90 350 165 260 200,3 69,9 3910
1Nova 20,00 250 105 185 196,7 72,2 3510
Monarch j 18,25 351 !j 143 ! 255 199,9 74,0 3890
Duster 20,07 p 225 95 170 194,1 71,8 3365
Jenson Conv. 11,20 440 215 F 330 184,5 69,0 4215
|Skyhawk | 22,12 1 231 110 | 175 179,3 65,4 3020
Scirocco 34,70 89,7 70 81 8,2 155,7 64.0 1905
Corolla SR-5 30,40 96,9 75 83 9,0 165,2 65.0 2320
Camaro 16,50 350 155 250 8,5 195,4 74,4 3885
Datsun B210 36,50 85,3 80 83 8,5 160,6 62,2 2009
Capri II | 21,50 171 109 1 146 8,2 170.4 66,9 2655
Pacer 19,70 258 110 1 195 8,0 171.5 77.0 3375
Granada 17,80 302 129 220 8,0 3,00 199,9 74.0 3890
Eldorado 14,39 500 190 360 8,5 224,1 79,8 5290
Impérial 14,89 440 215 330 8,2 231,0 79,7 5185
Nova LN 17,80 350 155 250 8,5 196,7 72,2 3910
1Starfire 23,54 231 110 175 8,0 2,56 179,3 65,4 3050
Cordoba 21,47 360 180 290 8,4 214,2 76,3 4250
Trans Am 16,59 400 NA 196,0 73,0 3850
Corolla E-5 31,90 96,9 4,30 165,2 2275
Mark IV 13,27 460 223 366 3,00 228,0 79,8 5430
Celica GT 23.90 1133,6 171.5 63.4
Charger SE 19,73 215,3 76,3 4370
Cougar 13.90 215.5 78.5 4540
Corvette 16,50 185,2 69,0 3660
b) On peut vérifier que la corrélation échan- son poids (X10), c’est-à-dire le meilleur
tillonnale entre la cylindrée (X,) et le modèle à 3 variables selon le Rf. Quelle
couple (X3) est de 0,992, la plus élevée de est l’estimation de <72 obtenue ?
toutes les paires de variables. Peut-on pen d) À partir du modèle en c), établissez un
ser que le meilleur modèle à deux variables intervalle de prédiction à 95 % pour la
explicatives serait celui incluant Xt et X3? consommation d’une voiture de cette
c) Ajustez un modèle de régression mul époque qui aurait un rapport de pont
tiple incluant le rapport de pont arrière de 3,1, une longueur de 192 pouces,
(X5), la longueur du véhicule (Xg) et et qui pèserait 3600 livres.
I
La régression multiple
/ V . r . «•-> V*
^ -
« * •/ *£>52
W fîÇ h K
;V I A V.
■ fS é S c a S Æ jf ‘'K V i T v ^ .-. • ; -■.. ♦. ' ^ î - - * » . r r « ?
> ,• J ? ; , r - ^ j v y** .4 u V
4L
.•V- 4ji>
'"«^ . j * k >
rV « • ,î t w * ,' l C I • ' '» - tiw * - ■'•T -
. « P ^ - 4fc & S .* > & S . f c * - • f K f c •: '
' /
«•*
■a 3 •-
£5;
km< ®.%î. . .vv -,v -R .
;^ 5 r . S v 'rflSfcYî:- '<>R
«£ÿcv:•'";'& .<— >- *■*’•. • ’, >»• • \ » z . » /*■•v' w % » . 'K *j , y '< •» l
a & & 9 S- c .9 5 9
I . „ ./■ r
■ ;. .• ,- V , •
S S r v A .. l l ^ S - r f R î A . ÇC 1» % ■ ,
C h a p itre 1
b) P
(Iu 5 u M) = 1- P
(Iu S u Af) = 0,75
c) P(/ u S)=0,18
AnP
A < jD = A n D (A nB)u(CoD )
A nB =AuB (A uB)n(CuD ) = (A u B )n C
i) AnB={5)
ii) ÂuB={l,3,4,5,6, 7, 8,9,10}
iii)Ânfl=Aufi={2, 3,4,5}
IV) Xn(finC) = {1’ 2’ 3’4’ 6’7>8,9, 10}
v) An (fi u C) = {1, 2, 5, 6,7, 8,9, 10}
96,8 %
C
a) b) c) d)
t\ 4- 0,06 t?
t2< 0,3
t2=t\- 0,06
t t ti ti
A ,i ) s y :h ± h 0,15
2 2
£ = {(f„ r2)€Sf:max(f1,f2)<0,15} = {(f,,r2)eS3:0</, <15 et 0 </2<15}
C = {(?„ t2) e SP: | f, —r2 1< 0,06} = {(tl, t 2) e i f : -0,06 < / , - / , < 0,06}
D = {(?,, t2) e ^ : f 2 > tx)
1.6 a) i f = {(x, )y:0 < b) i) 0 <<24} y- * < i5donc x <y < x + 1. ii) Exemple où t 5 et t2 = 8
V
y y
0 5 10 15 20 24
ri
a) Â = [500,600] d) A n B n C = [400,500[
b) A n C = [350,500[ e) (A u C) n B =[400,550]
c) Â o C =]550,600] f) (A u B) lj C =[350,550]
1.8 II existe 23 sous-ensembles de if: 0 , {a}, {c}, b), [a, c}, {b, c], [a, b, c}
1.9 a) i f = {DDD, DDN, DND, NDD, DNN, NDN, NND, N N N }
b) i f = [NNNN, D N N N , NDNN, N N D N , N NND}
466 RÉPONSES AUX EXERCICES
0,0588
2 J
r43^
0 1
1.16 a)
49 \ 13 983 816
6J
6^ 43 \
2J 13 545
b)
49\ 13 983 816
6J
1
c)
13 983 816J
49"ï
d) Paul a raison. Ce tirage comporte n combinaisons. Deux billets du même tirage lui donnent une
6J
1
probabilité de - de gagner alors que deux tirages lui donnent une probabilité -n n de gagner au moins
n
une fois.
RÉPONSES AUX EXERCICES 467
P(D = 0) + P(D = 1) =
= 28 comparaisons
1.28 P, [ l- ( l- P 3)(l-P 5[l-(l-/î2Xl- P4)))] = 0,9[1 -(1 - 0,9)(1 -0,9 [1-(1 -0,9)1 -0,9)])] = 0,890
1.36 ■
7r---^~ = 0,25
nr
1.37 a) (N uL) = 0,8 + 0,3 - 0,8(0,3) = 0,86
P
b) La présence des frais de livraison rapide est indépendante du type de produits sur la commande
c) i) (N uL) = 0,8 + 0,3 - 0,8(0,35) = 0,82
P
0,3-0,8(0,35)
H) P(L\N)= —-- —•- ■ -= 0,1
P 365
P 365
1.38 a) P(B) =1 25
25
0,569 b) P(B) = 1 ^ 7 pour n <365
365
1.39 a) P(S) = P(S uE) +P(S n £) - P(E) = 0,05 b) P(S\E) = - (-- - - - = 0,75
P{E)
1t i n i i 1/2 41
1.40 P(X) i n V ia ) + 7 a)+T
4U ; 4 4 4 5 60
RÉPONSES AUX EXERCICES 469
C h a p itre 2
2.1 a) x. 0 1 2 3 4
f4\
f 48 l
P(X = xi) = ^ j 15 - x J
'52") 0,658 84 0,299 47 0,03993 0,00174 0,00002
,5 J
b) P ( X = x)
▲
0,8-
0,6-
0,4-
0,2 -
0,0 + T T * x
0 1 2 3 4
-|2
13 83
2.2 V(X) = E(X2)
6 36
si t >0
2.4 a) Pour c 0>, /(/) = ) = -
ailleurs.
b) P (r > 5001r > 300) = éT200c =0,670
c) 1—e c' =0,90 <=> t = 1151,3 heures
2.5 a) Oui c) Oui e) Non, car K(x) =0 pour tout x >1.
b) Non, car x(Gest
) décroissante. d) Oui
470 RÉPONSES AUX EXERCICES
e si jc< 0
c) h(x) = H\x)
0 sinon.
4 29
2.8 b ) fi = E(X) b) <T= Vv(X)
5 25
c) p(x) d) F(X) A
4/10- 1-
2/10- 8/10-
6/10J
-1 0 1 2 4/10-
-9~ T
-1 0 1 2
29 --2 0
(20)x (= 0,978)
2.9 P(X< 29)
x —0 x\
2.10 a) F(x) 1Y+1
i,o- si x = 0,1, 2,
b) P(x) 2,
0,8 - 0 sinon.
0,6 - c) F(0 < X<8) = F(8)— F(0) = 0,498
0,4 d) P(3< X<5) = F(5)-F(2) = 0,109
02 - e) P(X>1) = 1-F(1) = 0,250
■
V
A 0.0
m
’
4 1
.•‘ Çkxdx +^k(4-x)dx = \, donc d) fl = 1 —
4 x2dx+ f
J2 4 (4jc—x2)dx = 2
4
21 41
(N | c o
0 si jc < 0
JC
si 0 < < 2 jc
►j: e) F(jc) 8
JC
1 + JC si 2 < < 4 jc
P(X < 1) _ 1 8
C) P(X< \\X<2) P(X < 2) 4 1 si j: > 4.
r
si jc< 0
si 0 < j : < a
C) F(x) = <
si a <x < 2a
si jc> 2a.
V.
f4¥ 1
v*, A 3 -J c j 5 15 9 1
P{X = jc,) = •
30 30 30 30
(? )
2.14
a) jc -1 1 10
Px(x) 29/36 6/36 1/36
b) E(X) = -13/36 = -0,361$
c) y -2 -1______ 1__ 2 10 20
py(y) 29/7/216 29/36 (l-/?)/6 p/36 1/36 />/216
d) E(F) = -(31p + 39)/108
e) f'CX) > (E seulement
X ) si p <0; donc, le jeu n’est jamais plus avantageux.
8
2.17 a. Cl I + I + i 1 , donc k c) E(X) est inférieure à 2.
7
b) /**) d) y/VÎXj est inférieur à . 2
0 si x < 0
x 3 32x 54
2.21 a) F(x) si 0 < x <3 c) F(X3) x — dx .
9 9 5
1 si x >3. p/n 2* , 1 . 3
—
Jo 9 dx = — , donc m ——= . 7
b) [mm,1 1 mm]
0 1 2 0
3
b) f(x)
2 - - * si 2 < x <3
3
0 sinon.
V.
r
0 si x < 0
x
si < x <
2
0 2
C) F(x) = -
6
x
-f .x- si 2 < x < 3
2
- 2 2
"T
1 si x >3.
RÉPONSES AUX EXERCICES
Lr\ \U)
d) P(X> 1) = 1—F(l) 5 F (2) - FOJ.
P( 1 < X < 2,5) = F(2,5)-F(l) 3
“3 4- 2
) 2
l 2) L2J 4 J 16
2.27 a) X y pY(y) b) F(K) = ]T ^ 0 0 = 14 C) VOO = 2 > P r O O -l
2 4 564
0 0 0 , 6
î 2 0 0,3
2 80 0 , 1
b 0 2 0 0
P(B= b) 0 , 2 2 1 0,779
Donc, E(B) = x 0,221 + 200 x 0,779 = 155,80 $. 0
2.30 a) P(Y > 0) = P{X < 13) = 0,8 c) V(X) = 140,4 -(11, = 1,16 jouis
8 ) 2 2
pY(y) 24 3 2 1 2 24
a) Y = 3600(1) - 600 = 3000 $ c) En moyenne 360 x 1/24 = 15 journées
b) E(Y) = 3600£(X) - 600 = 5100$ d) 360F(y) = 1836000 $
V(Y) = 36002V(X) = 9 630 000 $ 2
e z siz> 0
2.32 / Z(z) =
0 sinon.
3 ou 5 î 0 , 2
ou 2 6 2 0 , 2
1 ou 7 3 0 , 2
ou 0 4 8 0 , 2
9 5 0 , 1
2.34 R
(E=) 92P(A< 1,4) + 98P(A > 1,4) = 93,8 cents/litre
1
•e~m si y > 0
2.35 a) f y(y) = yfiÿ
0 sinon.
2ve si v > 0
b) / v (v ) = f ;( v) =
0 smon.
c) fu(u) = Fj(u) = pour tout u.
£fX
2.40 F(V) = F 1 3,1612
4
0 si y < 0
7 1/8 si 0 < y < 1
b) F, (y)
2.41 a) « H - O I j M ï M Î K J 8 4/8 si 1< y < 4
1 si y > 4.
71
V(X) = F(X )-(F(X)) 2
64
c) x y Py(y)
74,2 < x<75,860 0,96
* > 75,8 20 0,02
* < 74,2 -100 0,02
E(Y) = 56 $, oY 22,98 $
RÉPONSES AUX EXERCICES
2.43 a) Faux. Sinon toutes les variances seraient nulles ! a) Faux. —1) = V(Y)
b) Vrai f) Faux. V(X ) * [ V(X
4 ) ] 4
Chapitre 3
x 0 1 2 3 4 5
d)
Pv(*) 27/50 11/50 6/50 3/50 2/50 1/50
y 0 3 1 2 4
/v(y) 20/50 15/50 10/50 4/50 1/50
0 1 2 3 4
e)
/VioO ) 11/27 8/27 4/27 3/27 1/27
0 1 2 3 4 5
f)
Pxlo^ 1 1 / 2 0 4/20 2 / 2 0 1 / 2 0 1 / 2 0 1/20
1 1
g) X et F ne sont pas indépendantes puisque, par exemple : pi5,4) = * px (5) •py(4) 0
50 50
0,74-(0,9)(1,02)
h) P 0,135
V(1,57)(1,10)
y 0 1 2 3
3.2 a)
/Vi2(x) 2/6 1/6 3/6 0
X 1 2 3
b)
Pxix) 0,5 0,3 0,2
c) £ ( X ) = 1(0,5)+ 2(0,3)+ 3(0,2) = 1,7
d) p(l,l) + p(2,2) + p(3,3) = 0,30 + 0,15 + 0,10 = 0,55
e) Vrai. pYi0) = pYil) = 0,35
f) Vrai. px12(2) = 0,75 > p (3) = 0,25 x j 2
g) Les deux variables sont dépendantes. Par exemple, p(l,2) = 0 * (1)/V(2)= 0,5 *0,2.
3.3 a) y V 0 1 2 3
0 1/32 4/32 2/32 1/32
1
2/32 8/32 4/32 2/32
2
1/32 4/32 2/32 1/32
«
8 4 ” 32
c) 4
476 RÉPONSES AUX EXERCICES
3.4
X = Patients du groupe A
■
0 1 2
4950 4950
0
il 9
T3 45
2
4950
0 0
P(X = 2 n y ) 1/16
3.5 a) P(X = 2) 1 1
3/16 3
c) P(x = o | y = ) 0
1/2 8
d) X et y ne sont pas indépendantes puisque, par exemple : 0 0
3
, ) = — * py( ) • ( ) = —•— 0 0
1 1
1 6 4 2’
1 5 1
©) Cov(X,Y) — )EY—
(X E)Y=) ———•0 = —>0, donc X et ont tendance à prendre de gra
(X
simultanément et de petites valeurs simultanément.
27
f) V(T ) = V(X) +4V(Y) - 4Cov(X, Y)
16
3.6 a) et b) A* 0 1 2
P K 0 0
0 3/30 2/30 0 1 / 6
Px(x) 3/6 1 / 6 2 / 6 1
P(1,0) 3
c) P(x = i|y = o>
PY(0) 5
d) X et y ne sont pas indépendantes puisque, par exemple : 0 , )=
0 0 ( )pY( )
0 0
1 1
6*6
e) P(G > 0) = P(X + Y >)2= 14/30
f) E(G ) = E (X ) + E(Y) -2 = 1/3$
b) *i 51 52 53 54 55 55
2jc^ -*\
si x. > 0
3.9 a) U,)
0 smon.
R É P O N S E S A U X E X E R C I C E S
si 0 < x } < 2
sinon.
s i n o n .
3 .1 2 a ) C o v (X , Y ) = p X Y J V ( X ) V ( Y ) = 18
b ) E (X + Y) = E (X ) + )= 5 (Y
E
c ) V (X + Y) = V (X ) + + 2 • C ov(X , V ( Y ) Y ) = 77
d ) E (3 X - 2 Z ) = 3 • E (X ) - 2 • E (Z ) = 18
e ) V (3X - 2 Z ) = 9 V (X ) + 4 V ( Z ) + 2 • (3)(-2)C ov(X , Z) =
^ P3X.-2Z = P xz =
g ) C o v (2 X + 3 Y , Z — Y) = 2 C o v (X , Z ) + 2 ( - l) C o v ( X , + Z) + 3(-l)K (Z) = - 1 12,8
1 2 p1/2 3 17
3 .1 3 a ) P Y
Jn
o J O110
{x y2) dy dx =
2 40
3(1 + y2)
/ a . y) si O < y < 1
b) /yu (y) 4
/*(1) O sinon
O X et y ne sont pas indépendantes, car la loi conditionnelle de Y dépend de valeur de X. On peut aussi
montrer que f x(x) - f Y(y) ^ /(x , y).
3.14- a) E(Y) = E(Xl) + P(X4) = 4 x 20 = 80
V(Y) = V(X,) + V (X.) = 4 x 9 = 36
b) E(y) = 40
V(Y) = 2 x 9 + 2 • p XiX2 ^/VÏXJVÏX^ = 7,2
fC
MüX e x e r c ic e s
2
4^? 2 x 2 si —1 < x < 1
3.19 a) ) dy n
o n
0 sinon.
4 2 .A .
2 .y si 0 < 1
dx K
0 sinon.
î
f(x,y) 2 si —yï y2 < x <y j l - y 2
b) x..(*)
f
f Y ( y )
2-y/l
0 smon.
1 2
f ( x , y) 2 si 0 < y <> x
/fl* (y)
AW 0 smon.
X
2
c) E (Y \x ) = j y f rlx(y)dy =
2
E (X | y) = fx f x[y(x)dy = 0
23 2y si 0 < y < 1
3.20 a) f r (y) xy(2 —x) dx
>2 0 sinon.
3
xy(2 - x) si 0 < y < 1
2 2y
b) f ru(y) 3 0 sinon.
;c(2 —x)
4 x=\
3
c) X et Y sont indépendantes, car pour tout couple (x, y), f(x ,y ) = f x (x)fy (y) = -xyÇ2 - x)
x +y 2 + 3y
3.21 a) E (X \y ) x 1 dx pour 0 < < 1
y +- l
2
7
b) E(X IY = 1/2)
12
c) f (X) 2J 12
d) E(K)
y' + 2 J * = i l
1
e) yf et K ne sont pas indépendantes, car f(x ,y ) n est pas égale à _/*•(x)fy (y)
2
tous les couples (x, y).
RÉPONSES AUX EXERCICES
c) p lf x < y + -4l J= Jo
f3/4r
Jo +‘‘ l<ixdy+f' f'idxdys
^ J3/4J0 —
^ 32
Chapitre 4-
EÇY) = - = 6, VVÔÔ = =S
P V P
4 8 0 RÉPONSES AUX EXERCICES
4.4 a) X = nombre de valises égarées sur 90 valises b) Y = nombre de valises égarées sur 4 essais
X ~ Binomiale(n = 90, p = 0,006) Y~ Binomiale(n = 4, p = 0,006)
4^
P(X = 0) = (1 - 0,006) 90
0,582 P(X = 1) (1-0,006/(0,006) = 0,0236
4.5 a) X = nombre d’unités défectueuses parmi 50 b) X = nombre d’essais sans défaut parmi 3
X ~ Binomiale(n = 50, p = 0,02) Y ~ Binomiale(n = 3, p= (0,98)ÎO= 0,364
50 P(Y = 3) = (0,364/ = 0,048
P(X > 2) = 1 (0,02/(0,98) 50- jc
0,0784
jt=0 x
4.6 a) X = nombre de clignotants défectueux parmi 100
X ~ Binomiale(n = 100, p = 0,01)
>noo,
P(X < 2) XI |(0,01/(0,99)100-* = 0,9206
x=0 X
40^
b) P(X100 2\X„ i )= m . 40 1) (0,99 (0 ) = 0,270
) 3 9 , 0 1
ly
4.7 a) X = nombre de 0 changés en 1 c) Z = nombre d’erreurs sur 3 bits
X ~ Binomiale(n = 5, p = 0,1) Z - Binomiale(n = 3, p = 0,0086)
P(X >3) = 0,0086 P(Z 0=) = 0,9745
b) Y = nombre de 1 changés en 0
Y ~ Binomiale(n = 5, p = 0,1)
P(Y< 2) = 0,9914
X ~ Géométrique(1- p)
P(X = 5) = p4(l - p)
4.12 a) X = nombre de visites jusqu’à la première vente c) Non, car 46 0 0 0 $> 25 0 0 0 $.
X ~ Géométrique(p)
d) P(C >100 ) = P(X > 23,5) = 0,0886
C = 10 000 + 4000(X -1 )
0 0 0
4 -n 1 2^
a) P(X= 4) (0,8) (0,2 = 0,0768
2 ) 2 b) P(X<4) (0,8)2(0,2)° + (0,8) (0,2) = 0,896
2-1 J 2
P(X< ) = X
6
(0,9) (0,2r
4 “ 4
x=4
Y ~ Poisson(c = 28/4 = 7)
- 7 ^--
7°-f---
7 7 7 T
+ + — 0,827
1 2 3
P(Y> 4) = l-g
! ! ! 3! 4!
0 1 2
b) £(X) = 2
c) Y —nombre d’équipes approvisionnées au local en une journée
E(Y) = 0(0,135) +1 (0,271) + 2(0,271) + 3(0,323) = 1,782
d) E(X)-E(Y) = 2-1,782 = 0,218
e) F(3) = 0,857 et F (4) = 0,947, donc il faut au moins n - 4 exemplaires.
4.25 a) X -Binomiale(n = 15 000, p = 0,002) c) X ~ Poisson(c = np = 15 000 •0,002 = 30)
15 000^ g (3Q
0,0134 d) P(X = 20)
' 3 0 ) 2 0
P(X > 4) = 1- g
0! 1! 2! 3! J
RÉPONSES AUX EXERCICES 483
e~'l°
P(X = 0) 0,367 8 8
0!
-i
P(X > 2) = 1—e 0,264 24
0 ! + l!
Chapitre 5
7/4 1 j 5
5.1 a, P \ \ < X < \ — dx = — c) Oui. P(X < 2) = P(X > 2) = 1/2
' / 2 4 16
0 + 4
b) E{X) = _ _ =
16
2 Vnx)
2 12
5.2 X -6/(35,45)
0 si x <35
a) F(x) = - 1 = si 35 < x < 45
3510 10
1 si x >45.
41 1 3
b) P(X < 41) dx
35 10 5
c) L’écart-type est inférieur à 10, car la distance maximale observable entre une observation
et la moyenne 40 est de 5.
5.3 a) Vrai d) Vrai
b) Vrai e) Vrai
C) Faux. P(X > 4 1X > 2) = 1/3, P(X>2) = 3/4
5.4 X = montant de la vente d’un immeuble ; X ~ U (200 000,600 000)
E(H) = 0,04£(X) + 500 = 16500 $
V(H) = 0,042•V(X) = 21333 333 $ 2
5.5 oc yf3,p = j3
5.6 X = épaisseur des rondelles (en mm) ; X - 5,7]
(5 - 7) 0,577 mm
a) E (X ) = ^ = 6,JV
2 12
s 4 8 4 R É P O N S E S A U X EXERCICES
1000 $ si Y >1
5.8 a) Y = durée de vie du groupe b) B = \
motopropulseur (en années) 1 750 $ si y < l.
Y ~ Exponentielle(l/3) E
(B
) = 1000P(K > 1) + 750P(y < 1) = 929,13 $
P(Y < —) = 1- e(-‘/3x,,2) = 0,1535
2
5.9 a) P(X <)5 c) P (X > 5 |X > 2 ) e )P (X > 5 |X > 4 ) g) Égales
bî P(X > 1/5) d) P(0 < X < 2) f) Égales
5.10 X = durée de vie de la pile (en jours) ; X ~ Exp(A = k)
a) P(X > 23) = e~2U = 0,40 => k = 0,0398 c) W = nombre de piles en fonction après 20 jours
i parmi 10
b) £(X) = -------- = 25 jours
0,0398 w ~ Binomiale(n = 10, = e^'0398'20 = 0,451)
V(X) = ---- -— r = 630 jours2 * 9) = 0,0046
0.03982
5.11 a) E{X) = 1/A = 3
P (X < l) = l - e ' 1/3 = 0,283
C si X > 15 si X > 15
5.15 a) Coût. = c +5 s i x ^ 15 si X £ 15.
5.17 a) X, = temps écoulé (h) entre la (/ - l)-ième voiture et la i-ième voiture ~ Exp(A=7)
Y = X, + — h X10 - Gamma(r = 10, A = 7)
b) E(Y) = 1,429 heure (1 h 26 min)
yfVÇŸ)= 0,452 heure (27 min)
c) P(X10 < 0,25) = 1- e~m25} = 0,826
X - Gamma
1 si 0 < x < 1
5.24 a) /(•*) = „ .
0 smon.
fi-s-n2
5.25 P(X < 1,5) = 1—e 1 0 5 j =: 0,632
r60oy/3
5.26 a) P(X > 600) = e ^ =:0,318
b) £(X) = 0 + 400r(4) = 2400 heures
i) £(X) = 0 + 400r(2) := 400 (inférieure)
ii) £(X) = 0 + 600r(4) = 3600 (supérieure)
iii)£(X) = 100 + 400r(4) = 2500 (supérieure)
x-0
700
5.27 £(*) = !-<?
a) P(X> 0,368 700) -i
-i
b) P(X >7001X > 600) -(6 0 0 /7 0 0 )' 0,691
La loi de Weibull, avec un paramètre /3 > 1, est un meilleur modèle pour les phénomènes d’usure ou de
corrosion, car le taux de défaillance va en augmentant. La probabilité de durer encore 100 heures est plus
faible lorsque la pile a déjà servi durant 600 heures qu’au début de son utilisation.
5.28 a) P(X >000)
1 = 1—(1—e ~ 5 ’ ' 4 ) = 0,224
b) £(X) = 0 + 200r(5) = 4800 heures
C h a p it r e 6
Remarque : Certaines réponses de ce chapitre portent la mention «table II ». Le quantile y a été arrondi à 2 déci
males pour permettre une recherche de probabilité dans la table II. Un calcul par ordinateur garderait toutes les
décimales et résulterait en une probabilité légèrement différente.
6.1 a) <ï>(2) - 0(0) = 0,477 25 d) 0(1,96) = 0,975 00 g) 0(1,37) = 0,914 65
b) 2 ( 0 1= 0,682
) - 1 6 8 e) 2[1-0(1,5)] = 0,133 62 h) 20(2,57 ) = 0,98984
- 1
7 -1 0 ^
0,158 12,4 —10 ^
6.2 a) O 6 6 b) 1 -0 0,21186 c) 0,5-0(-2) = 0,477 25
3 y 3 7
6.3 a) c = 1,56 c) P(-c<X<c) = 0,99 2,57
b) O(c) - (1 - O(c)) = 0,95 1,96 d) c 1,645
6.4 a) Faux. P(X > ) est supérieure à P(X >7)
6 f) Vrai
b) Vrai g) Vrai
c) Faux. X/2~7V(3,1) h) Faux. La loi est exacte et non approximative
d) Faux. X et F prennent des valeurs entre et i) Vrai
e) Faux. X - Y ~ N(7,20) j) Faux. La loi 77(500,25) serait une bonne
approximation.
100-80
6.5 a) O 0,977 25 c) 0(2)-O(-0,5) = 0,668 71
10
b) Ol q8Q- | = 0,5 d) l-O(-0,5) = 0,69146
RÉPONSES AUX EXERCICES
6.7 a) P(X > 500) = 1- 0(0,5) = 0,308 54 b) P(X O ^ J = 0,95, donc N = 534.
( 1—30 ^
3
6 . 8 a) P(X> 28) = 0(1,82) = 0,9656 (table II) b) P(X <31) = 0 | —pj— 1= 0,8186 (table II)
c) P(| X - 301> 2) = P(X > 30 + 2) + P(X < 30- 2) = 0,0688 (table II)
k - 2500
6.9 P Z< 0,05 k - 2376,6 lumens
75
6.10 a) P(X> 12,05) = 1-0(2,5) = 0,006 21 c) P(11,95 < X < 12,05) = 0(2,5) - 0(-2,5) = 0,987 58
b) O c — 12 0,1, donc c = 11,97
0,02
7,2-7,05^ +o 6,8-7,05 \
6.11 a) P(X > 7,2) + P(X < 6,8) = 1 -0 0,073 02
0,1 J 0,1 J
b) Supérieure, car on sait que P(X > 7,2) > 0,5 dans cette situation.
c) Égale, par symétrie.
0-0,05 ^
6.18 P(X, X2<0) = O = 0,158 66
25 )
Vrjf.
'/■fV "V* > i
V -* * -H
._ _
RÉPONSES AUX EXERCICES
^
*
488
6,3-6 \
5,7-6 ,\
6.19 P(5,7 <Y <6,3) = 0 0 0,6156 (table II)
JÔ jl y VÔÜ2 y
6.20 a) £(y) = 4 + 2(4) + 2+3 = 17 V(Y) = 3 + 4(4) + 4 + 2 = 25
b) 0(0,6)-0(-O ,4) = 0,38117
c) V(X) = 3 + 4(4) + 4 + 2 + 2(2)(0,5XV3)(2) = 31,928
P( 15 < Y < 20) = 0(0,53) - 0(-O,35) = 0,338 77 (table II)
5 -0
6.21 P(|y|>5) = 2x 1 -0 0,014 28 (table II)
J5Ô/Î2
102-100 \
6.22 Y = X, H---- 1-X W(100xl, 100x0,012) />(y>lO2) = l - 0 0
1 0 0
0,1 y
0,2025
6.23 a) fi = ~ ~ ~ - 1 1>9 CT 0,15
J T 9
b) 1—P(11,8 < X- < 12,2) = 1- [0(2) —0(-O,67)] = 0,2742 (table II)
16 —15 ^
6.24 P(Y < 16) = 0 0,758 (table II)
^05 j
6.25 X ~ Binomiale(n = 200, p= 0,08) ~ N(np = 16, 1- = 14,72)
16.5- 16\ 20,5-16^ 11,5-16
a) 0 0,552 (table II) c) 0 0 = 0,758 (table II)
3.84 y 3,84 y 3,84
15.5- 16 14,5-16 14,5-16 13,5-16 \
b) 0 0 0,100 (table II) d) 0 0 = 0,090 (table II)
3.84 y 3,84 3,84 3,84 y
-0.25-0^ 0,25-0 \
6.26 a) P(|e, e2\>0,25) 0 + 1 0,5755 (table II)
V Jô y y.
0,05-0 -0,05-0 \
b) P(-O,O5<ê<O,O5) = 0 0 0,3829 (table II)
ÆÔÎ Vôôî y
6.27 a) y ~ Gamma(r = 40, A= 0,2)
150-200
b) P(y>15O) = l - 0 0,9430 (table II)
J 1000
c) P(400 < y < 600) - 0(2) - 0(-2) = 0,9545
p(89 < y < 120) » pi 89,5 100 < z < 120,5 100 0,8329
10 10
0,42-0,5 N
c) P(y< 0,42) = 0 0,0548
JO,0025 y
6.29 IV = X + y ~ W(2,00 ; 0,0025)
a) P(IV> 1,98) = 0,6554
b) P(W < *) = 0,9 =>k=
2064 ml
1,98-2
c) P(W> 1,98) = 1 - 0 0,977 25
0,01
RÉPONSES AUX EXERCICES 489
/ ™ r>2
200 \
ii) X ~ N 1000, P(X >1100) = 1- 0(1,58) = 0,0571
10 J
3 004 - 2 996
6.32 a) P(9
2,96 < <3,004) = - • = 0,8
X
3,005-2,995
b) W= nombre de panneaux avant d’obtenir un premier non conforme
W ~ Géométrique(0,2)
E ( T ) =30jE(W) = 150 minutes y/ŸÇ.T)= yl302V(W) = 134,16 minutes
c) T =X, + X 2+■■•+ Xm« N(360 ; 0,001) P(359,95 < <360,05) » 0,8859 (table II)
1950-1999,13
6.36 a) P(X, >19501X2= 0,098) = P Z > 0,9767 (table U)
V607,75 y
b) Corrélation positive, donc (X>, 19501
P X=2 0,11) sera pl
de 0,098.
\
80-86,2 0,9951
6.37 a) P(X2 >801x, = 80) = P Z>
JSJ6 J
b) Si p = —0,8, la probabilité d’avoir une note supérieure à 80 au second test diminue (par rapport à la situa
tion p= , ).
0 8
6.38 i
a) P{Xx>40)
b) Égales
15
c) P { X 2 > 10)
d) P ( X 2 >6
1X, = 44)
10 e) E(X21X, = 45)
f) V(X2)
5 g) Égales
0 -V/ i
45 50 55 1
RÉPONSES AUX EXERCICES
C h a p itre 7
Remarque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
2 694 024-40* 131,302
7.1 a) x =5252/40 = 131,30, 5 113,75
39
b) <7o.6S~ -*(26,5) 133, <?o,9s —■(3
* 8
.5) 149,5
c)
T
110 120 130 140 150 160
7.2 a)
15 -
U
O
c(U
3 10-
LL,
5-
0 7
32 33 34 35 36 37 38
Pourcentage de coton
b) x 34,767, x = x(325) = 34,65, m = 34,7
c) EIQ —x(48i5) *06.5) 1,65
77 475,63 - 64 •34,767
s 1,828, j = 1,352
63
R = 37,9-32,1 = 5,8
d)
—
r-
85 90 95
Rendement
RÉPONSES AUX EXERCICES 491
T3
1= 16
II
1
•
Raison du retour
—nx = 0
7.14 Les points sont relativement bien alignés sur le graphique. La loi normale pourrait être un bon modèle.
7.15 a)
20
8a 15
< u
ao"
'O 10
tu
5
0
pfV p
T b efc
V- >> V V V \V V N> \> \> *
b) À = *(65) = 120 15 509
x 120,225 m = 121
129
C) <7o.30 •*(39.2) —119
d) s2 5,660 5 = 2,379 CV = 0,0198
. 321,5 —286... _
* * 30 +---- —----(40 - 30) = 31,93
7
184
b) Non. Ql > 20, ce qui n’est pas le cas sur le graphique.
. _ 0 -11 +15 *12 + 25 *16 + 45 *15
7.18 a) * = -------------- —--------------- = 23,241
54
(02 -11 + 152 -12 + 252• 16 + 452•15) - 54(23,241)
54-1 262,4
4
x ~ 20 + (30 - 20) = 22,5
16
b)
0,030 -
0,025 -
0,020 -
on
a<D 0,015 -
Q 0,010
0,005 -
0,000
10 20 30 40 50 60
4 476 373
7.20 *y 0,985
J{\ 648 452,5)(12 522 303,6)
Il y a une relation positive très forte entre le délai d’épuisement et la distance parcourue
C h a p itre 8
Remarque: Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
8.7 a) Non (échantillon volontaire, non probabiliste) c) Non (échantillonnage par grappes)
b) Oui d) Non (échantillonnage stratifié)
8.8 a) 2,73 b) 11,34 c) 34,17 d) 20,48 e) 0,10 f) 0,90
8.9 a) 0,700 b) 0,687 c) 1,812 d) -2,228 e) 0,10 f) 0,995
8.10 a) 1,63 c) 0,241 e) 3,30 g) 0,99
b) 2,85 d) 0,490 f) 0,397 h) 0,975, car 39,37 = F0025.82.
1 1
8.11 X ~ FU,v P(X>F]_0'U'V) = P y < p— ---------------------------------------- l-a
\ l-a ,u .v y F.l - a , u . V
8.12 a) 510 et 7
b) 510e t^ = .,4
24
c) 0 et J ------- = 1,044
V2 4 -2
d) 24 et V2-24 = 6,928
4 9 4 RÉPONSES AUX EXERCICES
«2(
8.13 a) W(21,3<t 2) e) o,— +
l 10 20 J
b) N (7, CT2/10) f) W ~ ^19^ E(W) = 0, V ( W ) = 1 9 /1 1
Chapitre 9
Remarque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
— o2 — o2 — —
9.1 Les deux estimateurs sont sans biais, mais comme = — , on préfère X. à X,.
2n n
9.2 a) Les deux estimateurs sont sans biais pour b) Puisque V(/i, ) < V{fa), fa est meilleur que fa.
O2 *
9.3 E
Q
M(9!) = 10 ; E Q M ( 9 2) = 4 + —. Si < 2 4 , est préféré à 0,.
4
9.4 E
Q
M{0.) = 12; EQM(92) = \0\ 6. 03 est le meilleur.
n 1 1
9.8 a) X MV r* b) MM
X
Y.*,
i=i
A ___ X2
9.9 AMM * ^MM
y -
- X 2
- 2 > ,2- * 2
L ""
915 a) z0
02S *-7= < 0,25 => n > 13
yjn
b) Non. Quatre fois plus grand, car la marge d’erreur est proportionnelle à l/Jn.
c) Plus petit, car z005 = 1,645 et z0025 = 1,96-
9.16 a) Vrai
b) Faux. Le calcul de cette probabilité (ou d’un tel intervalle) nécessite la valeur de H-
c) Faux. C’est un intervalle de confiance, pas de tolérance.
d) Faux. C’est un intervalle de confiance sur la moyenne théorique.
e) Vrai
f) Faux. Cette probabilité est de 100%, c’est même le point milieu !
g) Vrai
h) Vrai
9.17 a) Le nombre moyen de mots dans une page de droite d’un livre de cette bibliothèque.
b) Non. Chacun a une valeur de x qui peut varier.
c) Non. Chacun a une valeur de s qui peut varier.
d) Oui. Le niveau de confiance est de 0,95 chaque fois.
e) Environ 0,95 x 120 = 114 étudiants
f ) Environ 0,025 x 120 = 3 étudiants
66,41
9.18 Moyenne : 2 19,8 ± 025;14 VI5 , soit [183,0; 256,6].
X + 2,33
X —c X _ S
9.20 a) N(0,1) b) X± — ou X ± zan - 7=
In
0,01
9.21 a) 74,036 ±1,96 [74,031; 74,041]
VÏ5
b) Non. Le quantile t est légèrement plus élevé que le quantité z, mais la valeur de s peut être inférieure
à celle de <7.
Chapitre 10
Remarque: Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
x
157,53 160
c) Puisque x X 157,53 (ou -1,33 X -1,645), on ne rejette pas H0. La résistance moyenne n’est pas significa
tivement inférieure à 160 au seuil de 5 %.
d)
7/(156, 9/4) N( 160, 9/4)
sous H sous H0
b) i) Non. P diminuesi n a u g m e n t e . i i i ) S i y = 1 0 . f l d i m i n u e lo r s q u e / / , a i
b) Onrejette H g si t 0 < - 1 , 8 9 5 . d ) n = 6
b) U - X u ■ 1- P = P ( U > 1 0 , 9 6 ) + P ( U < 1 , 9 1 ) = 0 , 4 5
0 ,1 0 0 ,1 2 4 7
s.
r----^ -
x,i —
10.16 On rejette H si z0 >*«•
a i + 4g
n n.
10.17 H0: ju, = , H, : fj.x * fi2. Puisque |/01= | -0,021X f0025;26 = 2,06, on ne rejette pas H0 au seuil de 5 %.
10.18 a) H0: /z, = , H, : jix * /x2.Puisque |/0| = 0,138 X t002s;i8 = 2,10, on ne rejette pas H0
b) Valeur P = 2 x P(T0 > 0,138) = 0,89. (La table IV indique que la valeur P e [0,80; 1].) La valeur P serait
plus petite si la différence entre les moyennes était plus importante. Si le test était unilatéral à droite, la
valeur P serait P(T0 > 0,138) = 0,45.
c) Non
10.19 a) H0: ^ - MNouv= 0, H, : ^ - /iNouv > 0. Puisque t0 = 1,56 X Vos;20 = 1.725, on ne rejette pas H0 au seuil
de 5 %. La direction ne devrait pas acheter la nouvelle développeuse.
b) H0 ne sera pas rejetée, car xAnc —xNouv n’est même pas de 2 minutes.
10.20 a) H 0:fj.l =/j2,H, : fixj>J^. Puisque t0 = 8,49 > Vomo = 2,76, on rejette H0. L
cédé 1 est significativement supérieur.
b) On utilise sp = 0,799 pour estimer G,d = 3,13, n, =n2 =6, et a = 0,01. Alors, 1— » 1.
c) n = 5
10.21 a) H0: Mi = AV, H, : /i, > /V- Puisque t0 = 0,86 X Vio;i2 = 1,356, on ne rejette pas H0. Le filtre n’a pas réduit le
pourcentage d’impuretés de façon significative.
b) Valeur P = P(T0 > 0,86) = 0,203
10.22 a) H0; o \ = o\, H, : o\ * a\. Puisque / 0 = 2,768 > F0i025;2*.yo ~ 2,14, on rejette H0. Les variances sont consi
dérées comme étant différentes.
b) H0: /t, = fjiz, H, : /x, * /V- Puisque |/0| = 4,187 > fao25;39 = 2,02, les moyennes sont significativement diffé
rentes.
10.23 a) H0: }iD= 0, H, : fiD* 0. Données appariées. Puisque 1101= 1,906 X Vo2s;6 = 2,447, on ne rejette pas H0.
b) T0 ~ t6 sous H0, alors valeur P = 2 x P(T0 > 1,906) = 0,105.
10.24 H0: fiD= -1 , H, ; fiD< -1. Puisque t0 = ~ “3,464 < - t 005;5 = -2,015, on rejette H0.
10.25 a) H0: fXD= 0, H, : fiD> 0. Puisque t0 = 2,39 > t0lO;l0 = 1,37, on rejette H0.
b) H0: A*i = AV H, : /t, > /v Variances inégales. Puisque tQ= 2,52 > r010;II = 1,36, on rejette H0.
1 1
10.26 a) On rejette H0 si | pH + JO,139(1-
- pF| > 1,96 0,0157.
0,139)
5000 3000
500 RÉPONSES AUX EXERCICES
b) H0: pH = pv, H o: P ^ Pt=-Puisque |z0| = 6,008 > z0025 = 1,96, on rejette H0.
h
b) u0 =10,708
c) Valeur P = 0,013. On rejette H0 au seuil de 5 %.
10.36 État
Politique Désuet Normal Moderne Total
Agressive 24 52 58 134
17,0 62,3 54,7
i 2,87 1,70 0,20
Neutre 15 73 86 174
22,1 80.9 71,0
2,28 0,77 3,16
Non
17 80 36 133
agressive
16,9 61,8 54,3
0,00 5,34 6,16
Total | 56 205 180 1 441
On rejette l’indépendance, car /i0 = 22,48 > Xo.ou* = 13,28. Valeur P = 0,00016
Chapitre 11
Rem arque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
11.1 a) Moyennes possiblement différentes (il faut le test F pour valider) ; distributions symétriques, donc loi
normale plausible ; variances potentiellement inégales.
b) vi)
c) Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés
Vitesse de coupe 80,17 3 26,72 3,17
Erreur 168,33 20 8,42
Total 248,50 23
d) Valeur P = 0,047, où F ~ F32Q(table V : [0,025 ; 0,05]).
e) Thkey = 4,69, PPDS = 3,49, BON = 4,90
Les méthodes de Tùkey et Bonferroni ne détectent aucune paire de différences significatives. La méthode
de Fisher PPDS donne les groupes ci-dessous.
yy ya- ÿv.
„2 . „2 , 2
^3
11.2 a) MS 0,51
3
500 RÉPONSES AUX EXERCICES
b) H0: pH= pF, H0: pH* pF. Puisque|z0| = 6,008 > z0025=1,96, on rejette H0.
10.27 a) H0: p, = p2, H0: p, < p2. Puisque z0= -2,023 X z001= — 2,2326, on ne rejette pas H0. La chaîne 2 ne pro
duit pas un pourcentage de défauts significativement plus élevé.
b) a. est fixée arbitrairement et n’est pas affectée par n. (3augmente lorsque n diminue (toutes choses étant
égales par ailleurs).
10.28 H0: p, = p2, H, : p, ^ p2. Puisque |z0| = 1,55 X z0025 = 1,96, on ne rejette pas H0. Les deux machines ne pro
duisent pas des proportions de défauts significativement différentes.
10.29 a) Test sur deux moyennes de lois normales, échantillons indépendants (r42)
b) Test sur deux moyennes de lois normales, échantillons appariés (f,,)
c) Test sur une moyenne de loi normale (f9)
d) Test sur deux moyennes de lois normales, échantillons appariés (t29)
e) Test sur deux moyennes de lois normales, échantillons indépendants (tm)
10.30 a) Nombre d’unités Nombre Probabilité 1 Fréquences 1
défectueuses d’observations théorique pmiprpps 1 ' 1 1'
/V p, Ê,
par jour 1| O 1
1
1 Pi ' È
,=
n
b) Oui. On regroupe les deux premières classes et les deux dernières classes.
c) On ne rejette pas H0, car «0 = 0,92 X Xo.m9 = 14,68. La loi de Poisson pourrait être un bon modèle.
10.33 a) H0: Le nombre de pannes est indépendant de l’équipe ;
H, : Le nombre de pannes n’est pas indépendant de l’équipe.
b) On rejette H0si u0> *0201;6= 16,81.
c) 6
d) On ne rejette pas H0.
10.34 a)
Position de Type de panne
montage A B C D
1 18,43 44,66 17,01 14,89
0,69 0,04 0,06 2,33
2 7,57 18,34 6,99 6,11
1,68 0,098 0,14 5,67
b) u0 =10,708
c) Valeur P = 0,013. On rejette H0au seuil de 5%.
10.35 On rejette l’indépendance, car u0 = 34,91 > ~ 5,99.
RÉPONSES AUX EXERCICES 501
10.36 1 État
Politique j Désuet Normal Moderne Total
Agressive 24 52 58 134
17,0 62,3 54,7
2,87 1,70 0,20
Neutre 15 73 86 I 174
22,1 80,9 71,0
2,28 0,77 3,16
Non 17 80 36 133
agressive
16,9 61,8 54,3
0,00 5,34 6,16
Total | 56 205 180 1 441
Chapitre 11
Remarque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
11.1 a) Moyennes possiblement différentes (il faut le test F pour valider) ; distributions symétriques, donc loi
normale plausible ; variances potentiellement inégales.
b) vi)
Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés fo
Vitesse de coupe 80,17 3 26,72 3,17
Erreur 168,33 20 8,42
Total 248,50 23
d) Valeur P = 0,047, où F ~ F3M(table V: [0,025 ; 0,05]).
e) Tükey = 4,69, PPDS = 3,49, BON = 4,90
Les méthodes de Tukey et Bonferroni ne détectent aucune paire de différences significatives. La méthode
de Fisher PPDS donne les groupes ci-dessous.
yy ya- ÿ\-
I I I I
I I I I I------- 1---------1----- *-
34 35 36 37 38 39 40
2 , 2 . 2
+ $2 + 5,
11.2 a) 0,51
3
RÉPONSES AUX EXERCICES
y\- >2-
c) Le revêtement 4 présente la plus petite conductivité observée, mais il ne diffère pas significativement
du revêtement 3 au seuil de 5 %.
11.6 Source de Somme Degrés de Moyenne
variation | des carrés liberté des carrés fo
Type de circuit 260,94 2 130,47 4,01
Erreur 390,79 12 32,57
1Total | 651,73 14
RÉPONSES AUX EXERCICES
11.9 a) Puisque f 0 = 2,38 > F001312 = 5,95, les différences entre les produits ne sont pas significatives.
b) i) Plus grande ii) Inchangée iii) Plus petite iv) Plus grande
11.10 a) Faux. On veut comparer les moyennes en isolant les sources de variabilité.
b) Vrai
c) Vrai
dî Faux. On doit interpréter les tests sur les facteurs simples lorsque l’interaction n’est pas significative
e) Faux. MS
11.11 a) ii)etv) b) ii)
11.12 a) dl(vitesse) = 2, dl(profondeur) = 2, dl(interaction) = 4 et dl(erreur) = 18, où dl signifie « degrés de liberté ».
b) Source de Somme Degrés de Moyenne
variation des carrés | liberté des carrés | /o Valeur
Vitesse (A) 0,03178 2 1 0,015 89 15,94 0,000
Profondeur (B) 0,02719 2 0,01359 13,64 1 0,000
Interaction (AB) 0,00069 4 0,00017 0,17 ! 0,950
Erreur 0,017 94 0,000997
18
Total 0,077 59 1 26 1 1
c) Puisque 0,17 < F0,05 ; 4,18 2,93, l’interaction n’est pas significative. Puisque 15,94 et 13,64 sont supérieurs
à F0,05; 2.18 3,55, la vitesse et la profondeur de coupe ont un effet significatif sur l’usure.
b) Puisque 1,26 < F0M:212 = 3,89 (valeur P > 0,05), l’interaction n’est pas significative.
Puisque 273,67 > F00J;, 12= 4,75, et que 8,84 > F00J;2 |2 = 3,89 (valeurs P < 0,05), le type de verre et de
luminophore a un effet significatif sur la luminosité du tube cathodique.
C) 20
15
10
(A 5
3
T3
• «H
'O
05 0
-5
-10
-1 5
210 230 250 270 290 310 -1 5 -1 0 -5 0 5 10 15 20
Valeurs prédites Résidus
L’hypothèse d’une variance constante est respectée (sauf une exception), et l’hypothèse de la normalité
des erreurs est plausible, malgré une légère asymétrie dénotée par la forme arquée des points du dia
gramme quantile-quantile.
11.14 a) Plan à deux facteurs avec interaction
Y = rendement de maïs, facteurs = densité et variété, dl(erreur) = 18, où dl signifie «degrés de liberté».
b) Plan à blocs aléatoires complets
Y = pression artérielle, facteur = dose, bloc = patient, dl (erreur) = 27, où dl signifie «degrés de liberté».
c) Plan à un facteur
Y = degré d’éthanol, facteur = appareil, dl(erreur) = 21, où dl signifie «degrés de liberté».
11.15 a) dl(erreur) = 8(n —1) = 8 • 1 = 8 et dl(total) = 8n —1= 8 • 2 —1= 15, où dl signifie «degrés de liberté».
Source de Somme Degrés de Moyenne
variation des carrés liberté des carrés fo , Valeur P
A 0,202 50 1 0,20250 64,80 0,0000
B 0,105 62 1 0,10562 33,80 0,0004
C 0,81000 1 0,81000 259,20 0,0000
AB 1,05063 1 1,05063 336,20 0,0000
AC 0,00000 1 0,00000 0,0000 1,0000
BC 0,330 62 1 0,330 62 105,80 0,0000
ABC 0,01563 1 0,01563 5,00 0,0558
Erreur 0,025 00 8 0,00313
Total 2,54000 15
Puisque F00J., g= 5,32 (ou si on considère les valeurs F), on peut conclure que l’interaction entre A et C
n’est pas significative et que celle entre les trois facteurs non plus. Puisque les interactions doubles AB et
BC sont significatives, il faudrait idéalement fixer le niveau d’un facteur pour étudier l’effet de l’autre.
RÉPONSES AUX EXERCICES
C h a p itre 12
Remarque: Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
12.1 a) y= 21,79-0,007 03*
b) MS 5,73
5,73
c) /3, ± f0i025 26 [-0,0096; -0,0044]
3 604 739
d) Puisque 0 n’est pas dans l’intervalle, la pente diffère de 0 de façon significative
t 1 (1800-2109)
©) 9,14 ± ta025.26J 5,7 3 1H----H--- [4,07; 14,21]
28 3 604 739
12.2 a) y=31,65 —0,041jc
b) Puisque/ = 57,4, on rejette H0: /3, = 0 au seuil de 5 %. Le modèle de régression est donc significatif.
Valeur 0.
224,43
C) R 81,5%
275,21
d) 20,38±f00513 13,91
1 (275-321,66) : 19,37 <E(Y 1275) <21,39
15 133 668,3
, 1 (275-321,66)
e) 20,38 ± r0>05; 13 3,91 1+ — + — : 16,74 < K <24,02
15 133 668,3
12.3 a) Puisque la valeur P = P(F > 72,56) ~ 0 (où F ~ Fx22), la pente de la droite de régression est significative
ment différente de 0.
636,15
b) R 76,7 %
829,05
c) Intervalle de confiance à 99 % : 6,07 < (30< 20,57. L’ordonnée à l’origine
à zéro au seuil de 1 %.
12.4 a) 93,34 : ordonnée à l’origine de la droite ; la valeur de la résistance du papier dont la pâte ne contien
drait aucun bois dur. (Attention : Cette interprétation est extrapolée à l’extérieur du domaine des
observations.)
15,65 : pente de la droite ; l’augmentation moyenne de la résistance du papier pour chaque hausse de 1%
de bois dur dans la pâte.
b) Source de Somme Degrés Moyenne
variation des carrés de liberté des carrés /o Valeur P
Régression 1755,77 1
-* *
1755,77 12,97 0,0029
Erreur 1895,04 14 135,36
Total 3650,81 15
Le modèle de régression est significatif.
1 , (2,7 —2,325)
c) 135,59 ±f0005;14 1135,36 1 H---------r : 99,56 < L < 171,62
16 7,17
d) L’intervalle sera plus long, car 3,1 % est plus éloigné de la moyenne x que l’était 2,7. La valeur prédite
sera plus grande, car la pente est positive.
e) L’histogramme sert à vérifier la normalité des observations (ici, une cloche unimodale mais un peu
asymétrique). Les résidus en fonction des valeurs prédites servent à vérifier l’homogénéité de la variance
(ici, une variabilité un peu plus importante au centre).
506 RÉPONSES AUX EXERCICES
9,208-10
b) | 0 23,441. On rejette H0: /3, = 10.
3,77
3309
c) Oui
d) Non. Une forte corrélation n’implique pas nécessairement une relation causale.
e) e, = 185,79-187,04 =-1,25; e2 = 214,47 - 214,67 = -0,20
12.6 a) Puisque f 0 > F005;118 = 4,41, on rejette H0: /?, = 0. Le modèle de régression est significatif.
b) y. =77,86 + 11,80*1,02 = 89,90
148,364
c) R 38,9% de variabilité expliquée par le pourcentage d’hydrocarbures
381,194
d) VMS 3,60
C h a p i t r e 13
Remarque : Une réponse calculée par ordinateur à partir des données brutes peut différer d’une réponse calculée
à la main à cause des erreurs d’arrondi.
13.1 a) Vrai b) Faux c) Faux d) Vrai e) Faux f) Faux
13.2 a) y = -20,897 + 0,01 IX. + 27,370X2 - 0,069X3- 0,257X4 + 0,017X,
b) f 0 = 28,15 > F00l;514 = 4,69. Au moins une des variables est significative.
RÉPONSES AUX EXERCICES 507
d) H0: /3, = 0:110 | = 2,083 < t0. S = 2,306 (non significatif : valeur P = 0,0708)
0 2 : 8
H0: A 0 :|r0 0,705 < t0025:8 2.306 (non significatif : valeur P = 0,5009)
H0: A 0 :|/0 0,135 < t0025:8 2.306 (non significatif : valeur P = 0,8959)
H0:A 0 :110 I-0,2031< t0.025:8 2,306 (non significatif : valeur P = 0,8441)
e) f 0 = (1217,82/3)/5,98 = 67,88 > /r005;3g= 4,07 (significatif, donc au moins une des trois variables est
significative si on les ajoute dans le modèle contenant déjà X,).
13.6 a) Le meilleur modèle inclut X, et X2(R2 = 0,6717).
b) R 0,7314, donc environ 73%.
c) Les deux postulats sont respectés.
508 RÉPONSES AUX EXERCICES
Total 32 185,99
/ 0 = 3,97 > F005.i30 = 3,32, la taille d’au moins un des parents explique la taille des filles de façon
significative.
b) 0,209
147,07/30
c) Raj 1 0,157
185,99/32
d) Mère : H0: /3, = 0, t 0 =2,75 > t0025,30 = 2,04. Si la taille du père est dans le mod
celle de la mère.
Père : H0: /J2 = 0, t0= 0,166 < /00 2= 2,04. Si la taille de la mère est dans le modèle, il n’est pas utile
5 . 3 o
c k
X 0,01 0,05 0,10 0,20 0,30 0,40 0,50 0,60
0 0,990 0,951 0,904 0,818 0,740 0,670 0,606 0,548
1 0 ,9 9 9 0 ,9 9 8 0,963 0,938 0,909 0,878
0.995 0,982
2 0,999 0,999 0,998 0,996 0,992 0.985 0,976
3 0,999 0.999 0.999 0,998 ■ Æ
A OÛA
■ -w ^ W m
4 • «■
0,999 0.999 0.999 0 "
5 0,999 ( ) OQÜ
k
0,70 0,80 0,90 1,00 1,10 1,20 1,30
0 0,496 0,449 0,406 0,367 0,332 0,301 0,272 0,246
1 0 ,8 4 4 0 ,8 0 8 0,772 0,735 0,699 0,662 0.626 0,591
2 ^ 0,965 0,952 0,937 0,919 0,900 0,879 0,857 0,833
3 0 ,9 9 4 0 ,9 9 0 0,986 0,981 0,974 0,966 0,956 0,946
4 0,999 0,998 0,997 0,996 0,994 0,992 0,989 0,985
5 0 ,9 9 9 0 ,9 9 9 0,999 0,999 0.999 0.998 0,997 0.996
6 0,999 0,999 0,999 0,999 0.999 0.999 0,999
7 0,999 0,999 0,999 0.999 0,999
«•
8 . . . . .
0.999 0,999
c— k . -
,—
r
x *»
■_ . ■»
r '\ - 1
f v * i r
510 TABLE I
- A . v |
h
X 2,30 2,40 2,50 2,60 2,70 2,80 2,90 3,00
0 0,100 0,090 0,082 0,074 0,067 0,060 0,055 0,049
î 0,330 0,308 0,287 0,267
S , w ■1
0,248 0,231 0,214 0 , 199
■ « .
0,999
.V ' ■
0,999 0,999 «
0 ,9 9 9
12 0,999 0,999
h
* 3,50 4,00 4,50 5,00 5,50 6,00 6,50 7,00
0 0,030 0,018 0,011 0,006 0,004 0,002 0,001 0,000
1 0,135 0,091 0,061 0,040 0,026 0,017 * i- ,
0,011 0 ,0 0 7
16
•
18 •-
0,999 0,999 0,999
19 0,999 0 ,9 9 9
20 0,999
-L W ,
&
Les valeurs de la fonction de répartition de la loi de Poisson 511
c=h
X 7,50 8,00 8,50 9,00 9,50 10,0 15,0 20,0
0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
a *
24 0,999
# _ s
0,999 0,988 0,843
25 0,999 0,993 0,887
-- £
26 0,996 0,922
27 •
0.998 0,947
28 0,999 0,965
29 0,999 0,978
30 0,999 0,986
31 0.999 0,991
32 0,999 0,995
0,999
•
33 0.997
34 0,998
X
* Les valeurs figurant dans cette table sont celles de F( x) = P(X < x) — T e ' V / i . On suppose que toute valeur manquante au bas
d ’une colonne est égale à 1,0. i*0
Table II Les valeurs de la fonction de répartition de la loi normale centrée réduite*
10
table
Deuxième décimale de z
II
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 t
•*
0,0 0,500 00 0,503 99 0,507 98 0,511 97 0,515 95 0,519 94 0,523 92 0,527 90 0,531 88 0,535 86
t ' * . ■ ,
• V * , .* '
0,543 79 : 111 0,547 76 «
a ■* / a . 1
a ,
i
k .
1
a ,
• » >
, a i t a
• *
a- , a
0,551,72 •
1
a . * *
• la •
0,555 67 a a
0,559 62
a . a a ? |
0,563 56 0,56749 •
•
a
0,571 42
r
* , * , • .
0,575 34
a • k
• . , ' , ' ê . f
0,2 \ f- .
0,579 26 0,583 17 0,587 06 0,590 95 0,594 83 0,598 71 0,602 57 0,606 42 0,610 26 0,614 09
* , s • »
0,3
, ( ,
0,61791 0,62172 0,625 51 0,629 30 0,633 07 0,63683 0,640 58 0,644 31 0,648 03 0,651 73
0,4 0,655 42 0,659 10 0,662 76 0,666 40 0,670 03 0,673 64 0,677 24 0,680 82 0,684 38 0,687 93
■>, • u , . . -
, a . , a . 1 > * t • , ■ f a , a , * a *
0,5 0,691 46 , * *
0,694 97 0,698 47 • i , 1
0,701 94 0,705 40 0,708 84 0,71226 0,715 66 0,719 04 0,722 40
» a ■ 1 a l
# • a . • p a a» k a a a ' ,
0,6 0,725 75 0,729 07 0,732 37 0,735 65 0,738 91 0,742 15 0,745 37 0,748 57 0,751 75 0,754 90
* •
a a 1 •
0,7 0,758 03 0,761 15 0,764 24 0,76730 0,770 35 0,773 37 0,776 37 0,779 35 0,782 30 0,785 23
Prem ière décimale de z
• 1 i « - | v J # * i , * * ‘ " # *
* a a , • 1 a ,
0,8 0,788 14 0,791 03 0,793 89 0,796 73 0,799 54 0,802 34 0,805 10 0,807 85 0,810 57 0,813 27
t i * .
1,0 0,841 34 0,843 75 0,846 13 0,848 49 0,850 83 0,853 14 0,855 43 0,857 69 0,859 93 0,862 14
,
1,1 • t ■
0,864 33 , , • *
0,866 50 0,868 64 0,87076 0,872 85 0,874 93 0,876 97 0,879 00 0,881 00 0,882 97
' • • • * # , k
/ . | r
1,2 0,884 93 0,886 86 0,888 77 0,890 65 0,892 51 0,894 35 0,896 16 0,897 96 0,899 73 0,901 47
1 " a a
1,3 0,903 20 0,904 90 0,906 58 0,908 24 ; 0,909 88 0,911 49 0,913 08 0,914 65 0,916 21 0,917 73
1,4 0,919 24 0,920 73 0,922 19 0,923 64 0,925 06 0,926 47 0,927 85 0,929 22 0,930 56 0,931 89
a ’ *’ 1 . k - .
1,5 0,933 19
a •
0,93448 0,935 74 0,936 99 a
0,938 22 0,939 43 0,940 62 0,94179 0,942 95 0,944 08
1,6 0,945 20 0,946 30 0,947 38 0,948 45 0,949 50 0,950 53 0,951 54 0,952 54 0,953 52 0,954 48
, , , a >
* ; . . *’ ;
1,7 * • / • .
:
■ ,
0,955 43 0,956 37 0,957 28 0,958 18 0,959 07 0,959 94 0,960 80 0,961 64 0,962 46 0,963 27
/
1,8 0,964 07 0,964 85 0,965 62 0,966 37 0,967 11 0,967 84 0,968 56 0,969 26 0,969 95 0,970 62
| a .
, * * 1 •
2,2 0,986 10 0,986 45 0,986 79 0,987 13 0,987 45 0,987 78 0,988 09 0,988 40 0,988 70 0,988 99
Table II Lesvaleurs de la fonction de répartition de la loi normale centrée réduite* (suite)
Deuxième décimale de z
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,4 0,991 80 0,992 02 ' 0,992 24 0,992 45 0,992 6 6 0,992 8 6 0,993 05 0,993 24 0,993 43 0,993 61
, a , t , ' • , a V
2,5 0,993 79 0,993 96 0,994 13 0,994 30 0,994 46 0,994 61 0 ,9 9 4 7 7 0,994 92 0,995 06 0,995 20
2,6 0,995 34
• * ■ * 'a
0,995 47 0,995 60 0,995 73 0,995 85 0,995 98 0,996 09
,
0,996 21 0,996 32 0,996 43
2,7 , 0,996 53 0,996 64 0,996 74 0,996 83 0,996 93 0,997 02 0,997 11 0,997 20 0,997 28 0,997 36
0,997 44 0,997 52
3,0 0,998 65 0,998 69 0,998 74 0,998 78 0,998 82 0,998 8 6 0,998 89 0,998 93 0,998 97 0,999 00
0,999 03 0,999 06 0,999 10 0,999 13 0,999 16 0,999 18 0,999 21 0,999 24 0,999 26 0,999 29
3,1
0,999 31 0,999 34 0,999 36 0,999 38 0,999 40 0,999 42 0,999 44 0,999 46 0,999 48 0,999 50
3,2
0,999 52 0,999 53 0,999 55 0,999 57 0,999 58 0,999 60 0,999 61 0,999 62 0,999 64 0,999 65
3,3
0,999 6 8 0,999 69 0,999 70 0,999 71 0,999 72 0,999 73 0,999 74 0,999 75 0,999 76
3,4 0,999 6 6 « I r
' J ) , ,
1 _„2
* Les valeurs figurant dans cette table sont celles de <ï>(z ) e 2 du,où Z ~ /'/((), 1). La première décim ale de z
yj2n
est indiquée dans la l re colonne , et sa deuxième décimale est indiquée sur la F ligne . Par exemple , <t>(l , 23 ) = 0,890 65 .
514
TABLE III
Table in Us
quantités de la loi du khi-carré*
Probabilité
0,995 0,990 0,975 0,950 0,900 0,500 0,050 0,025 0,010 0,005
0,0 0 + 0,0 0 + 0,0 0 + 0,00+ 0,02 0,45 2,71 3,84 5,02 6,63 7,88
0,01 0,02
3
0,05 0,10 0,21 1,39 4,61 5,99 7,38 9,21 10,60
0 ,0 7 0,11 0,22 0,35
•' .N * ,
• 0* «
8,23 9,39 10,87 17.34
19
* % • •
25,99 28,87 31,53 34,81 37,16
6 ,8 4 7,63 8.91 10,12 11.65 18.34 27.20 30,14 32,85
20 7,43 8.26
ê *9 •, .
36,19 38,58
9,59 10.85 12,44 19.34 28,41
21 0
31,41 34,17 37,57 4 0 ,0 0
8,03 8,90 10,28 11,59 13,24
oo 8.64
20.34
0 0
29,62 32,67 35,48 38,93 41,40
9.54 10,98 12,34
■ .
10,20
«0 0
>0%
*■ ^ m • * 38,89 41,92 4 5 ,6 4 4 8 ,2 9
11,81 12,88 14,57 16,15
. _ y ■ * . • **..
28
18,11 26.34 36,74 10,11 43,19 4 6 ,9 6 49,65
12,46 13,57 15,31 16,93 18,94
29
27.34 .
37.92 • * 11,34 4 4 ,4 6 48,28 50,99
13,12 14,26 16,05 17,71 19,77 28.34 39,09 2 ,5 6 45,72 49,59 5 2 ,3 4
30 13,79 14,95 16,79 18,49
' . ^ —,
Source : E . S . Pearson et H .O . Hartley , 1966 , Biometrika Tablesfor Statisticians, 3 e éd ., Cambridge : Cambridge University
Press , vol . 1. Table adaptée avec l’autorisation des administrateurs de Biometrika .
*Les valeurs figurant dans cette table sont les quantiles ta.vtels que
P(T >ta.v) = oc, où T ~ tv.
0
Les quantîles de fa loi de Fisher avec 0,25 *
• ' , • ' 1 ' ' * 1 # • * / ' # . " ' I ' * . * * * ‘ ,! • * . ' . »
table
1 Nombre de degrés de liberté du numérateur (Vj)
1 - 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 «>
V
1 5,83 7,50 8,20 8,58 8,82 8,98 9,1 9,19 9,26 9,32 9,41 9,49 9,58 9,63 9,67 9,71 9,76 9,8 9,85
2 2,57 3,00 3,15 3,23 3,28 3,31 3,34 3,35 3,37 3,38 3,39 3,41 3,43 3.43 3,44 3,45 3,46 3,47 3,48
3 2,02 2,28 2,36 2,39 2,41 2,42 2,43 2,44 2,44 2,44 2,45 2,46 2,46 2,46 2,47 2,47 2,47 2,47 2,47
4 1,81 2,00 2,05 2,06 2,07 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08
5 1,69 1,85 1,88 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,88 1,88 1,88 1,88 1,87 1,87 1,87
6 1,62 1,76 1,78 1,79 1,79 1,78 1,78 1,78 1,77 1,77 1,77 1,76 1,76 1,75 1,75 1,75 1,74 1,74 1,74
7 1,57 1,70 1,72 1,72 1,71 1,71 1,70 1,70 1,70 1,69 1,68 1,68 1,67 1,67 1,66 1,66 1,65 1,65 1,65
8 1,54 1.66
T
1,67 1,66 1,66 1,65 1,64 1,64 1,63 1,63 1,62 1,62 1,61 1,60 1,60 1,59 1,59 1,58 1,58
9 1,51 1,62 1,63 1,63 1,62 1,61 1,60 1,60 1,59 1,59 1,58 1,57 1,56 1,56 1,55 1,54 1,54 1,53 1,53
10 1,49 1,60 1,60 1,59 1,59 1,58 1,57 1,56 1,56 1,55 1,54 1,53 1,52 1,52 1,51 1,51 1,50 1,49 1,48
11 1,47 1,58 1,58 1,57 1,56 1,55 1,54 1,53 1,53 1,52 1,51 1,50 1,49 1,49 1,48 1,47 1,47 1,46 1,45
12 1,46 1,56 1,56 1,55 1,54 1,53 1,52 1,51 1,51 1,50 1,49 1,48 1,47 1,46 1,45 1,45 1,44 1,43 1,42
13 1,45 1,55 1,55 1,53 1,52 1,51 1,50 1,49 1,49 1,48 1,47 1,46 1,45 1,44 1,43 1,42 1,42 1,41 1,40
14 1,44 1,53 1,53 1,52 1,51 1,50 1,49 1,48 1,47 1,46 1,45 1,44 1,43 1,42 1,41 1,41 1,40 1,39 1,38
15 1,43 1,52 1,52 1,51 1,49 1,48 1,47 1,46 1,46 1,45 1,44 1,43 1,41 1,41 1,40 1,39 1,38 1,37 1,36
16 1,42 1,51 1,51 1,50 1,47
OO'
1,46 1,45 1,44 1,44 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,35 1.34
* V
)
17 1,42 1,51 1,50 1,49 1,47 1,46 1,45 1,44 1,43 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,35 1,34 1,33
18 1,41 1,50 1,49 1,48 1,46 1,45 1,44 1,43 1,42 1,42 1,40 1,39 1,38 1,37 1,36 1,35 1,34 1,33 1,32
i . *
19 1,41 1,49 1,49 1,47 1,46 1,44 1,43 1,42 1,41 1,41 1,40 1,38 1,37 1,36 1,35 1,34 1,33 1,32 1,30
1,40 1,49 1,48 1,47 1,45 1,44 1,43 1,42 1,41 1,40 1,39 1,37 1,36 1,35 1,34 1,33 1,32 1,31 1,29
T a b le V L e s q u a n t i t é s d e la l o i d e F is h e r a v e c a = 0 , 2 5 * { s u it e )
F0,25 ; v., y.
21 1.40 1.48 1,48 1,46 1.44 1,43 1,42 1,41 1,40 1.39 1,38 1,37 1,35 1,34 1,33 1,32 1,31 1,30 1,28
Nombre de degrés de liberté du dénominateur (v2)
22 1.40 1.48 1.47 1.45 1.44 1.42 1.41 1.40 1.39 1.39 1.37
t'»
1,36 1.34 1.33 1.32 1.31 1.30
0
1,29 1,28
23 1.39 1.47 1.47 1.45 1.43 1.42 1.41 1.40 1.39 1.38 1.37 1.35 1.34 1.33 1.32 1,31 1,30 1,28 1,27
24 1.39 1.47 1.46 y
1.44 1.43 1.41 1.40 1.39 1.38 1.38 1.36 1.35 1.33 1.32
/ i 1.31 1,30 1,29 1,28 1,26
25 1.39 1.47 1.46 1.44 1.42 1.41 1.40 1.39 1.38 1.37 1.36 1.34 1.33 1.32 1.31 1,29 1,28 1,27 1,25
■ i , \ • , *
* *
26 1.38 1.46 1.45 1.44 1.42 1.41 1.39 1.38 1.37 1.37 1.35 1.34 1.32 1.31 1.30 1,29 1,28 1,26 , 1,25
27 1.38 1.46 1.45 1.43 1.42 1.40 1.39 1.38 1.37 1.36 1.35 1.33 1.32 1.31 1.30 1,28 1,27 1,26 1,24
28 1.38 1.46 1.45 1.43 1.41 1.40 1.39 1.38 1.37 1.36 1.34 1.33 1.31 1.30 1.29 1,28 1,27 1,25 1,24
29 1.38 1.45 1.45 1.43 1.41 1.40 1.38 1.37 1.36 1.35 1.34 1.32 1.31 1.30 1.29 1.27 1,26 1,25 1,23
30 1.38 1.45 1,44 1,42 1.41 1,39 1.38 1.37 1.36 1.35 1.34 1.32 1.30 1,29 1,28 1.27 1,26 1,24 1,23
40 1,36 1,44 1,42 1,40 1,39 1,37 1,36 1,35 1,34 1,33 1,31 1,30 1,28 1,26 1,25 1,24 1,22 1,21 U9
60 1,35 1,42 1,41 1,38 1,37 1,35 1,33 1,32 1,31 1,30 1,29 1,27 1,25 1,24 1,22 1,21 1,19 1,17 1,15
120 1,34 1,40 1,39 1,37 1,35 1,33 1,31 1,30 1,29 1,28 1,26 1,24 1,22 1,21 1,19 1,18 1,16 1,13 1,10
1,32 1,39 1,37 30 1,35 1,33 1,31 1,29 1,28 1,27 1,25 1,24 1,22 1,19 1,18 1,16 1,14 1,12 1.08 1.00
Source: E.S. Pearson et H.O. Hartley
Densité F. *Les valeurs figurant dans cette table sont les quantiles F025;Vi Vjtels que P (F > F025.vv) = 0,25, où F ~ Fv „
0,25 ; v„ v*
01
M
Nombre de degrés de liberté du dénominateur (v2)
F,0,10; v,, v2
TABLE V
T a b le V L e s q u a n t i t é s d e la lo i d e F i s h e r a v e c a - 0 , 1 0 * ( s u i t e )
0.10 ; V|, vs
> * •
« ^ , iii
■ <'• • • V • , ..l \'.r • . . , . . «• ‘ ’ ■ . , » . • • •
•. 1 . • ’ ‘ • , 1 • > • • \ ‘ . • ‘ ,» ' .* '■ i
table V
a
1 161,4 199,5 215,7 224,6 230,2 234 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
• a * “ t , i . » a , > a , * a*
p 1 , * a / * , /
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19.45 19,46 19,47 19,48 •
19,49 19,50
• v •»■
. • i ■ » ,
i ■« • w \ » * ' ^
i . ■ i * • * *■ ■ » . » * , , . 1 f
. . > - V a , / . , 1 ■ ,
a i » ■. * ' / • • V
’ • , *
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
. * i
4 7,71 6,94 6,59 6.39 6,26 6,16 6,09 5,80 5,77 5,75 5,72 5.69 5,66 5,63
, *.
■
, , ■.
• -
/
• •
• •
>
» j
'
• » • . ,6,04 6,00.
*
t
•
* ,
B '
*
5,96
P a / , 1 * p
5,91 5.86 a i •
a a ,
N om bre de degrés de liberté du dénominateur ( v2)
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,36
a
a , /
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
i ■ ■<
»
» . *
. ,# . , #*
8 5,32 4,46 4,07 3,84 3.69 3,58 3,50 3M 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 , 2,97 2,93
. ■ , •
, ,
. 1 . • , * •
■ *
• » »
,
* i a
•
* * * a * ■
P P » * . . . . . _ • , . a •
» ■» a ■ » * * i
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
* .* i aa
V
10 4.96 4,10 3.71 3,48 3,33 3 22 3,14 3,07 3,02 2,98 2,91 2,85 2 ,7 7 . 2,74 2,70 2,66 2,62 2,58 2,54
■•
i * *
‘ t . r
,
»
•
*
*
*
>
\ * ■
> •
i *
i *
» ,
' j
i
• 1 > 1 *v • •
■ t
• , » a, a
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
. « , a
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2.47 2,43 2 , 3 8 .. 2,34 2,30
, ,
. ., '
•» * , « * , % .
. • » .
* » *
*
t i
. a j
t- < * .
»
" \ * P • *
/ *
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
, ,, ■ » , • * . * , »
•
#
,»
, . •
i .
• •
, . . _
, , • ■/ » , ». , . i • j \ ,
. * a a * »
■ •
• * »
a
» a » * p .
a » .
14 4,60 3,74 3,34 3,11 1 2 ,9 6 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2 ,31 2,27 2,22 2,18 2,13
* a
• ■ i
\
. .
• :
► *
• i * * .a »
* a
a
v p
* /
# a a P
• /
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
»• #•.• • « 1 * ».■_•* p
16 4,49 3,63 3,24 3,01 ,•» 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
• .* v■,•,' *> •v, V
*, » .i * .» • * *.* ■ i f
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
i,‘ ■
> » *
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2.06 2 ,0 2 1,97 1,92
, i » *
•
• , , i . <, . »
' ‘ ' • ■' . » . ►. r. 1 P
»
■ .
’ , ’ a
; c
P
a
i a'
. a * ,
* » m
w
<
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88
T a b le V L e s q u a n t i t é s d e la lo i d e F is h e r a v e c = 0 ,0 5 * (s u ite )
F0,05 ; v„I’v 2
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
2 1 4,32 3,47 3,07 2,84 2 , 6 8 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2 , 1 0 2,05 2 , 0 1 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2.07 2,03 1,98 1,94 1,89 1.84 1.78
V
3 -
4
<L> 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2 , 2 0 2,13 2,05 1,96 1,91 1,81 1,76
cü
2 , 0 1 1 , 8 6
«!■(
0
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1.89 1,84 1.79 1,73
S
O
'T
Oc 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 1,96 1,92 1,87 1,82 1,77
3 2 , 0 1
1,71
"N O
D 2,74
D 26 4,23 3,37 2,98 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
t(L>
X) 27 1 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2 , 2 0 2,13 2,06 1,97 1,93 1 , 8 8 1,84 1,79 1,73 1,67
T3 < u 28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19
C/5 2,12 2,04 1,96 1.91 1,87 1.82 1,77 1,71 1,65
u- 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,18
2 , 2 2 2 , 1 0 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64
T)
"O< u 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2.01 1,93 1,89 1,84 1.79 1,74 1.68 1,62 CD
C/)
<u JD
X 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,08 1,92 1,84 1,79 1,74 1,69 1,64 1,58 ûU)
E 2 , 1 2 2 , 0 0
1,51
G 60 4.00 3,15 2,76 2,53 2,37
Z 2.25 2,17 2.10 2,04 1,99 1,92 1,84 1,75 1,70 1.65 1,59 1,53 1,47 1,39 CD
(/>
120 3,92 3,07 2,45 2,29 2,17 2,09 1,96 1,91 1,83 1,75 1,61 1,55 1,55 Q .
2 , 6 8
2 , 0 2
1 , 6 6
1,43 1,35 1,25 CD
OC 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 ûT
1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1 . 0 0
6~
O
CD
.
Densitc F Les valeurs figurant dans cette table sont les quantiles FÜUJ„ vtels que P(F> F{0,05; v,, v2) =0,05, où F ~ F. Tl
(/)
*VV
CD
Q)
CD
o O
/ f 1 I I A,
II
O
O
en
T a b le V L e s q u a n t i l e s d e la lo i d e F i s h e r a v e c a = 0 ,0 2 5
F,0,025; v,, v
I*
TABLEV
2
Nombre de degrés de liberté du dénominateur (v2)
6,62
•_« #* 6,52 6,43
5,46 5,37 5,27
4,76 4,67 4,57
4,30 •1
a»«« 1, 4,20 4,10
* *.*f
3,96 3,87 3,77
, • \ •,>,*p
3,72 3,62 3,52
3,53 3,43 3,33
■3,37 3,28 3,18
3,25 3,15 3,05
, *,
3,15 3,05 2,95
3,06 2,96 2,86
2,99 2,89 * 2,79 •4•
2,92 2,82 2,72
2,87 2,77 «2,674
2,82 2,72 2,62 2,33 2,27 2,20
T a b le V L e s q u a n t it é s d e la lo i d e F is h e r a v e c a = 0 , 0 2 5 * (su ite )
F,0,025; v.,,, v 2
1 2 3 4 5 6 7 8 9 10 12 15 20 24 ♦
30 40 60 120 00
, .) •
20 5,87 4,46 3,86
/ •
3 , 51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46
1
2,41 2.35 2,29 2.22 2,16 2,09
21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,42 2,37 2,31 2,25 2,18 2,11 2,04
•
M 22 5,79 4,38 3,78 3,44 3,22 3,05
•. \ '
2,93
■*V
2,84 2,76 2,70 2,60 2,50 2,39 2,33 2,27 2,21 2,14 2,08 2.00
U.
<U 23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,36 2,30 2,24 2,18 2,11 2,04 1,97
G 9 0]
aO 24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64
, t 2,54 2,44 2,33 2,27 2,15 2,08 2,01 1.94
'-o
O c 2,68
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,61 2,51 2,41 2,30 2,24 2,18 2,12 2,05 1,98 1,91
26 5,66 4,27 3,67 3.33 3.10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,28 2 22 2,16 2,09 2,03 1,95 1,88
'S
c
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,25 2,19 2,13 2,07 2,00 1,93 1,85
0
>
*0 28 5,61 4,22 3,63 3,29 3.06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,23 2,17 2,11 2,05 1,98 1,91 1,83
CO t *
'S
W ) 29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,21 2,15 2,09 2,03 1,96 1,89 1,81
a) CD
<o 30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,5 ! 2,41 2,31 2,20 2,14 2,01 </>
X) 2,07 1,94 1,87 1,79 JQ
Xa 40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 2,01 1,94 1,88 1,80 1,72 1,64
Û)
a
O CD
Z 60 5,29 3,93 3,34 3,01 2,79 2.63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1.88 1,82 1.74 1.67 1,58 1,48 en
Ql
CD
120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,76 1,69 1,61 1,53 1,43 1,31 oT
OC 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2.05 1,94 1,83 1,71 1,64 1,57 1,48 1,39 1,27 1,00 O
Q.
CD
*n
Densité K * Les valeurs figurant dans cette table sont les quantités F 0025. tels que P (F > 025;»,.^) = 0 ,025 , où ~ F V|,Vj. (/)'
CD
Û
<>
CD
O
«
0 F ,0,025 ; v,, v2 II
O
O
N)
en
Table V Les quantités de la loi de Fisher 0.01 #
F
r 0,01 ; v,, v2 >
00
1 Nombre de degrés de liberté du numérateur (v,) m
2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 00
4052 4999,5 5403 5625 5764 5859 5928 5982 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
98,50 99.00 99,17 99.25 99,30 99,33 99,36 99,37 99,39. 99.40 99,42 99,43 99,45 99,46 99.47 99,47 99,48 99,49 99,50
34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
21,20 18,00 16.69 15.98 15,52 15,21
»•
i
14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75
» • v * , •
13,65 13,56 13,46
* • \ * t
16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05
Nombre de degrés de liberté dudénominateur (v2)
9,78
v . • / 1 a t
9.15 8,75 8,47 8,26 8,10 7.98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
8 11,26 8.65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86 a ^ • , ,
/ * * . \ 4 a *• / ' ,
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31
%
10 10,04 7.56 6,55 5,99 5,64 5,39 5.20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91 h K
* , / i
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,1 4,02 3,94 3,86 3,78 3,69 3,60
12 9,33 6.93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4.01 3,86 3.78 3,70 3,62 3,54 3,45 3,36 •
13
* • k a a 1
9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17 m
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00 g ,
15 8,68 6,36 5,42 4,89 4,36 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87
16
* /
4,03 3,89
j
3,69
V
19 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2.76 2.67 2.58 7 5Q
i > * , * *
F0,01 ; v„i*V
2
Nombre de degrés de liberté du dénominateur (v2)
0 F0.01;
GRAPHIQUE VI
0 ,8 0
c3
C/3 0 ,7 0
CJ
Xc 0 ,6 0
X
a> 0 ,5 0
!/î
cz 0 ,4 0
<D
Z,
K 0 ,3 0
0,20
0,10
0
-0 ,8 -0 ,6 -0 ,4 -0 ,2 0 0 ,2 0 ,4 0 ,6 0 ,8 1 ,0 1,2 1,4 1 ,6 1,8 2 ,0 2 ,2 2 ,4 2 .6 2 .8 3 ,0 3 .2
d
g) Courbes caractéristiques du test t unilatéral avec a = 0,05
- Test sur une moyenne : d est défini à la page 300.
- Test sur une différence de moyennes : d est défini à la page 314
1,00
0 ,9 0
H
cd
0 ,8 0
C/3 0 ,7 0
a>
Xc 0 ,6 0
X
o
H
£
<D
0 ,5 0
i-H
C/3
CZ 0 ,4 0
<D
Z 0 ,3 0
ST
n
0,20
0,10
0
-0 ,8 -0 ,6 -0 ,4 -0 ,2 0 0 ,2 0 ,4 0 ,6 0 ,8 1,0 1,2 1,4 1 ,6 1,8 2 ,0 2 ,2 2 ,4 2 ,6 2 ,8 3 ,0 3 ,2
d
h) Courbes caractéristiques du test î unilatéral avec 0,01
- Test sur une moyenne : d est défini à la page 300.
- Test sur une différence de moyennes : d est défini à la page 314
GRAPHIQUE VI
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0
•a
t/3
<L>
JEC
en
S
<0
*ÊT
3
<L>
Z
K
h
k) Courbes caractéristiques du test unilatéral (à droite) sur une variance avec a = 0,05
- X est défini aux pages 302 et 303.
I) Courbes caractéristiques du test unilatéral (à droite) sur une variance avec a - 0,01
- X est défini aux pages 302 et 303.
à un et deux échangions
thèses
\es tests tf hVP°
cténst'Ques Pour
Courbes cara
tests d'hVpo
. -,«tiQues
r a c te t's J}
P ° ° !
(su ite!
'f
C o u rP e * c *"a é c t t a ^ '" ooS (*
et deo*
G ra p*»,c»u e
%0 4’°°
ariances avec
de deux
bilatéral sur
- “ - r i - « « r“ ■
avances avec
Végalité de deux
bilatéral sur
énsüques du test
Courbes caract 32t.
P) défini à Vapage
_ lest
GRAPHIQUE VI
0 ,8 0
(U
2>
X 0 ,6 0
af
Vu.
V
a?
u.
O
ajC
Cu 0 ,4 0
U
Z
ST
II
0,20
0
1 2 3 4
A
q) Courbes caractéristiques du test unilatéral sur l’égalité de deux variances avec # = 0,05
- A est défini à la page 321.
0 1,00 2 ,0 0 4 ,0 0 5 ,0 0 8 ,0 0 1 0 ,0 0 1 2 ,0 0 1 4 ,0 0 1 6 ,0 0
2
r) Courbes caractéristiques du test unilatéral sur l’égalité de deux variances avec a = 0,01
- A est défini à la page 321.
Sources: C.L. Ferris, F.E. Grubbs et C.L. Weaver, Juin 1946, «Operating characteristics for the common statistical
tests of significance », Annals of Mathematical Statistics, pour les courbes en a), e), f), k), m) et q). A.H. Bowker et
G.J. Lieberman, 1972, Engineering Statistics, 2e éd. Englewood Cliffs (N.J.) : Prentice-Hall, pour les courbes
en b), c), d), g), h), i), j), 1), n), o), p) et r).
Table V II Les quantités de la distribution de l'étendue studentisée avec a - 0,01 *
tfo.OI \ p j
/ 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
1 90,0 135 164 186 202 216 227 *
237 246 253 260 266 272 272 282 286 290 294 298
2 14,0 19,0 22,3 24,7 26,6 28,2 29,5 30.7 31,7 32,6 33,4 31,4 34,8 35,4 36,0 36,5 37,0 37,5 37,9
3 8,26 10,6 12,2 13,3 14,2 15,0 15,6 16,2 16,7 17,1 17,5 17,9 18,2 18,5 18,8 19,1 19,3 19,5 19,8
4 6,51
$
8,12 9,17 9,96 10,6 11,1 11,5 11,9 12,3 12,6 12,8 13,1 13,3 13,5 13,7 13,9 14,1 14,2 14,4
5 5,70 6,97 7,80 8,42 8,91 9,32 9,67 9,97 10,24 10,48 10,70 10,89 11,08 11,24 11,40 11,55 11,68 11,81 11,93
6 5,24 6,33 7,03 7,56 7,97 8,32 8,61 8.87 9,10 9,30 9,49 9,65 9,81 9,95
»
10,08
y 10,21 10,32 10,43 10.54
7 4,95 5,92 6,54 7,01 7,37 7,68 7,94 8,17 8,37 8,55 8,71 8,86 9,00 9,12 9,24 9,35 9,46 9,55 9,65
8 4,74 5,63 6,20 6,63 6,96 7,24 7,47 7,68 7.87 8,03 8,18 8,31 8,44 8,55 8,66 8,76 8,85 8,94 : 9,03
9 4.60 5,43 5,96 6,35 6,66 6,91 7,13 7,32 7,49 7,65 7,78 7,91 8,03 8,13 8,23 8,32 8,41 8,49 8,57
10 4,48 5,27 5,77 6,14 6,43 6,67 6,87 7,05 7,21 7,36 7,48 7,60 7,71 7,81 7,91 7,99 8,07 8,15 S.22
11 4,39 5,14 5,62 5,97 6,25 6,48 6,67 6,84 6,99 7,13 7,25 7,36 7,46 7,56 7,65 7,73 7,81 7,88 7,95
12 4,32 5,04 5,50 5.84 6,10 6,32 6,51 6,67 6,81 6.94 7,06 7.17 7,26 7,36 7,44 7,52 7,59 7,66 .7.73
13 4,26 4,96 5,40 5,73 5,98 6,19 6,37 6,53 6,67 6,79 6,90 7,01 7,10 7,19 7,27 7,34 7,42 7,48 7,55
14 4,21 4,89 5,32 5,63 5,88 6,08 6,26 6.41 6,54 6,66 6,77 6,87 6,96 7,05 7,12 7,20 7,27 7.33 7,39
15 4,17 4,83 5,25 5,56 5,80 5,99 6,16 6,31 6,44 6,55 6,66 6,76 6,84 6,93 7,00 7,07 7,14 7,20 7,26
16 4,13 4,78 5,19 5,49 5,72 5,92 6,08 6,22 6,35 6,46 6,56 6,66 6,74 6,82 6,90 6,97 7,03 7,09 7,15
17 4,10 4.74 5,14 5,43 5,66 5,85 6,01 6,15 6,27 6,38 6,48 6,57 6,66 6,73 6,80 6,87 6,94 7,00 7,05
18 4,07 4,70 5,09 5,38 5,60 5,94 6,08 6,20 6,31 6.41 6,50 6,58 6,65 6,72 6,79 6,85 6.91 6,96
5,79
19 4,05 4,67 5,05 5,33 5,55 5,73 5,89 6,02 6,14 6,25 6,34 6,43 6,51 6,58 6,65 6,72 6,78 6,84 6,89
20 4,02 4,64 6,09 6,19 6,29 6,37 6,45 6 5"> 6,59 6,65 6,71 6,76
5,02 5,29 5,51 5,69 5,84 5,97 6,82
24 3,96 4,54 4,91 5,17 5,37 5,54 5,69 5,81 5,92 6,02 6,11 6,19 6,26 6,33 6,39 6,45 6,51 6,56 6.61
5,85 5 93 6.01 6,08 ATA 6,26 6,31
30 3,89 4,45 4.80 5,05 5,24 5,40 5,54 5,65 5,76 6,36 6,41
4,37 4,70 5,50 5,60 5.69 5,77 5,84 5,90 6,02 6,07 6,12 6,17
40 3,82 4,93 5,11 5,27 5,39 6,21
5.45 5 53 5,60 5,67 V /I
5,89 5 9}
60 3,76 4,28 4,60 4,82 4,99 5,13 5,25 5,36 ; «b * ^ V *
5.98 6,02
120 5,21 5,30 5,38 5,44 5,51 5,56 5,6» 5,66 5,71 5,75
3,70 4,20 4,50 4,71 4,87 5,01 5,12 5,79 5,83
5,23 5,29 5 35
OC 3,64 4,12 4.40 4,60 4,76 4.88 4.99 5,08 5,16 lin II r
5,54 5,57 5,61 5,65
* f - le nombre de degrés de liberté associés à l’erreur
p - le nonibre de moyennes à comparer
T a b le V N Les quantiles de la distribution de I avec #= 0,05 #
4 0.05-, p , f
1 18,1 26,7 32,8 37,2 40,5 43,1 45,4 47,3 49,1 50,6 51,9 53,2 54,3 55,4 56,3 57,2 58,0 58,8 59,6
2 6,09 8,28 9,80 10,89 11,73 12,43 13,03 13,54 13,99 14,39 14,75 15,08 15,38 15,65 15,91 16,14 16,36 16,57 16,77
3 4,50 5,88 6,83 7,51 8,04 8,47 8,85 9,18 9,46 9,72 9,95 10,16 10,35 10,52 10,69 10,84 10,98 11,12 11.24
4 3,93 5,00 5,76 6,31 6,73 7,06 7,35 7,60 7,83 8,03 8,21 8,37 8,52 8,67 8,80 8.92 9.03 9,14 9.24
5
r 1
3,64 4,60 5,22 5,67 6,03 6,33 6,58 6,80 6,99 7,17 7,32 7,47 7,60 7,72 7,83 7.93 8.03 8,12 8,21
«
6 3,46 4,34 4,90 5,31 5,63 5,89 6,12 6,32 6,49 6.65 6,79 7.59
6,92 7,04 7.14 7.24 7,34 7,43 7,51
7 3,34 4,16 4,68 5,06 5,35 5,59 5,80 5,99 6,15 6,29 6,42 6,54 6,65 6,75 6,84 6,93 7,01 7,08 7,16
* 1 # -- , ■
3,11
4
3,82 4,26 4,58 4,82 5,03 5,20 5,35 5,49 5,61 5,71 5,81 5,90 5,98 6,06 6,14 6,20 6,27 6,33
. * * 4 . • * . . . . • •
3,01 3,67 4
4,08 4,37 4,59 4,78 4,94 5,08 5,20 5,31 •
5,40 5,49 5,57 5,65 5,72 5,79 5,85 5,91 5,96
. • * > • . ■
16
t .
3,00
.
3,65 4,05 4,34 4,56 4,74 4,90 5,03 5,15 5,26 < 5,35 5,44 5,52 5,59 5,66 5 ,73 . 5,79 5,84 5,90
••
17 2,98 3,62 4,02 4,31 4,52 4,70 4,86 4,99 5,11 5,21 5,31 5,39 5,47 5,55 5,61 5,68 5,74 5,79 5,84
'• 'V- ' ‘ .• ■. . ■ ■ • »• , ,, • .i.
'. y ' ÿ • - y , . ••
5,36
• ' s ;
5,43 5,50 • « .
5,56 i % ?
5,61 5,66 t
5 ,71
24
.• : v . * . * :
2,92 3,53 3,90 4,37 4,17 4,54 4,68 4,81 4,92 5,01 5,10 5,18 5,25 5,32 5,38 5,44 5,50 5,55 5,59
30 2,89 3,48 3,84 4,30 4,11 4,46 4,60 S 4,72 4,83 4,92 < - 1 ,
5,00 * * .
, »
* '
a
» *
5,08 5,15 #
5,21
. 9 ■ •
5 ,2 7 . 5,33 • , . t
5,38 5,43 5,48
40 2,86 3,44 3,79
• • ‘ S
■ *
4,23
■ V■
4,04 • ,
4,39 4,52 4,63 4,74 4,82 4,90 4,98 5,05 5,11 5,17 5,22 5,27 5,32 5,36
• V .
Intervalles de tolérance
table IX
Table IX Nombresaléatoires
10480 15011 01536 69179 14194 62590
02011 81647 91646
22368 46573 25595 27982 53402 93965
85393 30995 89198
24130 48360 22527 15179 24830 49340
97265 76393 64809
42167 93093 06243 16376 39440 53537 71341
61680 07856
37570 39975 81837 06121 91782 60468 81305 49684
16656
77921 06907 11008 53498 18602 70659 90655
4275,1 27756
99562 72905 56420 69994 98872 31016 71194 18738 44013
96301 91977 05463 07972 18876 20922 94595 56869 69014
89579 14342 63661 10281 17453 18103 57740 84378 25331
85475 36857 53342 53988 53060 59533 38867 62300 08158
28918 69578 88231 33276 70997 79936 56865 05859 90106
63553 40961 48235 03427 49626 69445 18663 72695 52180
09429 93969 52636 92737 88974 33488 36320 17617 30015
10365 61129 87529 85689 48237 52267 67689 93394 01511
07119 97336 71048 08178 77233 13916 47564 81056 97735
51085 12765 51821 51259 77452 16308 60756 92144 49442
02368 21382 52404 60268 89368 19885 55322 44819 01188
01011 54092 33362 94904 31273 04146 18594 29852 71585
52162 53916 46369 58586 23216 14513 83149 98736 23495
07056 97628 33787 09998 42698 06691 76988 13602 51851
48663 91245 85828 14346 09172 30168 90229 04734 59193
54164 58492 22421 74103 47070 25306 76468 26384 58151
32639 32363 05597 24200 13363 38005 94342 28728 35806
29334 27001 87637 87308 58731 00256 45834 15398 46557
02488 33062 28834 07351 19731 92420 60952 61280 50001
81525 72295 04839 96423 : 24878 82651 66566 14778 76797
29676 20591 68086 26432 46901 20849 89768 81536 86645
00742 57392 39064 66432 84673 40027 32832 61362 98947
05366 04213 25669 26422 44407 44048 37937 63904 45766
91921 26418 64117 94305 26766 25940 39972 22209 71500
00582 04711 87917 77341 42206 35126 74087 99547 81817
00725 69884 62797 56170 86324 88072 76222 36086 84637
69011 65795 95876 55293 18988 27354 26575 08625 40801
25976 57948 29888 88604 67917 48708 18912 82271 65424
09763 83473 73577 12908 30883 18317 28290 35797 05998
91567 42595 27958 30134 04024 86385 29880 99730 55536
17955 56349 90999 49127 20044 59931 06115 20542 18059
46503 18584 18845 :;‘- 49618 02304 51038 20655 58727 , 28168
92157 89634 94824 78171 84610 82834 09922 25417 44137
14577 62765 35605 81263 39667 47358 56873 56307 61607
98427 07523 33362 64270 01638 92477 66969 98420 04880
34914 63976 88720 82765 34476 17032 87589 40836 32427
70060 28277 39475 46473 23219 53416 94970 25832 69975
53976 54914 06990 67245 68350 82948 11398 42878 80287
76072 29515 40980 07391 58745 25774 22987 80059 39911
90725 52210 83974 29992 65831 38857 50490 83765 55657
64364 67412 33339 31926 14883 24413 59744 92351 97473
Agresti, A., et Coull, B. (1998). Approximate is better Daniel, C., et Wood, F.S. (1980). Fitting Equations
than «exact» for interval estimation of binomial to Data (2e éd.). New York: John Wiley & Sons.
proportions. TheAmerican 52(2).
Davenport, W.B., et Root, W.L. (1958). An
Anderson, V.L., et McLean, R.A. (1974). Design o f Introduction to the Theory of Random Signais
Experiments: A prN
Realistic A ew York: and Noise. New York : McGraw-Hill.
Marcel Dekker. Draper, N.R., et Hunter, W.G. (1969). Transformations :
Banks, J., Carson, J.S., Nelson, B.L., et Nicol, D.M. Some examples revisited. Technometrics, II, 23-40.
(2001). Discrete-Event System Simulation (3e éd.). Draper, N.R., et Smith, H. (1998). Applied Régression
Upper Saddle River (N.J.): Prentice-Hall. Analysis (3e éd.). New York: John Wiley & Sons.
Bartlett, M.S. (1947). The use of transformations. Duncan, A.J. (1986). Quality Control and Industrial
B i o m é t r i e s ,3, 39-52. Statistics (5e éd.). Homewood (111.) : Richard D. Irwin.
Bechhofer, R.E., Santner, T.J., et Goldsman, D. (1995). Duncan, D.B. (1955). Multiple range and multiple
Design and Analysis o f Experiments fo r Statistical F tests. Biométries, II, 1-42.
Sélection, Screening and Multiple Comparisons. Efron, B., et Tibshirani, R. (1993). An Introduction
New York: John Wiley & Sons. to the Bootstrap. New York : Chapman and Hall.
Belsley, D.A., Kuh, E., et Welsch, R.E. (1980). Régression Elsayed, E. (1996). Reliability Engineering. Reading
Diagnostics. New York : John Wiley & Sons. (Mass.) : Addison Wesley Longman.
Berrettoni, J.M. (1964). Practical applications of the English, J.R., et Taylor, G.D. (1993). Process capability
Weibull distribution. Industrial Quality Control, analysis : A robustness study. International
21(2), 71-79. Journal o f Production Research, 31(7).
Bowker, A.H., et Lieberman, G.J. (1972). Engineering Sta- Epstein, B. (1960). Estimation from life test data.
tistics (2eéd.). Englewood Cliffs (N.J.) : Prentice-Hall. IRE Transactions on Reliability, RQC-9.
Box, G.E., et Cox, D.R. (1964). An analysis of Feller, W. (1968). An Introduction to Probability
transformations. Journal o f the Royal Statistical Theory and its Applications (3e éd.). New York:
Society, B26, 211-252. John Wiley & Sons.
Box, G.E., et Müller, M.F. (1958). A note on the Ferris, C.L., Grubbs, F.E., et Weaver, C.L. (1946).
génération of normal random deviates. Annals Operating characteristics for the common
o f Mathematical Statistics, 29, 610-611. statistical tests of significance. Annals o f
Bratley, P., Fox, B.L., et Schrage, L.E. (1987). A Guide Mathematical Statistics, 17(2), 178-197.
to Simulation (2e éd.). New York: Springer-Verlag. Fishman, G.S. (1978). Principles o f Discrète Event
Cheng, R.C. (1977). The génération of gamma Simulation. New York : John Wiley & Sons.
variables with nonintegral shape parameters. Furnival, G.M., et Wilson, Jr., R.W. (1974). Régression
Applied Statistics, 26(1), 71-75. by leaps and bounds. Technometrics, 16, 499-512.
Cléments, J.A. (1989). Process capability calculations Hahn, G., et Shapiro, S. (1967). Statistical Models in
for non-normal distributions. Quality Progress, Engineering. New York : John Wiley & Sons.
22(9), 95-100. Hald, A. (1952). Statistical Theory with Engineering
Cochran, W.G. (1947). Some conséquences when the Applications. New York : John Wiley & Sons.
assumptions for the analysis of variance are not Hawkins, S. (1993). Cumulative sum control charting:
satisfied. Biométries, 3, 22-38. An underutilized SPC tool. Quality Engineering,
Cochran, W.G. (1977). Sampling Techniques (3eéd.). 5, 463-477.
New York : John Wiley & Sons. Hocking, R.R. (1976). The analysis and sélection of
Cochran, W.G., et Cox, G.M. (1957). Experimental variables in linear régression. Biométries, 32, 1-49.
Designs. New York : John Wiley & Sons. Hocking, R.R., Speed, F.M., et Lynn, M.J. (1976).
Cook, R.D. (1977). Détection of influential observations A class of biased estimators in linear régression.
in linear régression. Technometrics, 19, 15-18. Technometrics, 18, 425-437.
Cook, R.D. (1979). Influential observations in linear Hoerl, A.E., et Kennard, R.W. (1970a). Ridge
régression. Journal o f the American Statistical régression : Biased estimation for non-orthogonal
Association, 74, 169-174. problems. Technometrics, 12,55-67.
Crowder, S. (1987). A simple method for studying Hoerl, A.E., et Kennard, R.W. (1970b). Ridge
run-length distributions of exponentially weighted régression : Application to non-orthogonal
moving average charts. Technometrics, 29,401-407. problems. Technometrics, 12,69-82.
BIBLIO G RAPH IE
Kelton, W.D., et Law, A.M. (1983). A new approach for in terms of an independent estimate of standard
dealing with the startup problem in discrète event déviation. Biometrika, 31, 20.
simulation. Naval Research Logistics Quarterly, Odeh, R., et Owens, D. (1980). Tables fo r Normal
30, 641-658. Tolérance Limits, Sampling Plans, and Screening.
Kendall, M.G., et Stuart, A. (1963). The Advanced New York : Marcel Dekker.
Theory of Statistics. New York: Hafner Publishing Owen, D.B. (1962). Handbook o f Statistical Tables.
Company. Reading (Mass.) : Addison-Wesley Publishing
Keuls, M. (1952). The use of the studentized range Company.
in connection with an analysis of variance. Page, E.S. (1954). Continuous inspection schemes.
Euphytics, 1,112. Biometrika, 14, 100-115.
Kotz, S., et Lovelace, C.R. (1998). Process Capability Pearson, E.S., et Hartley, H.O. (1966). Biometrika
Indices in Theory and Practice. London : Arnold. Tables for Statisticians, 1 (3e éd.). Cambridge :
Law, A.M., et Kelton, W.D. (2000). Simulation Modeling Cambridge University Press.
and Analysis (3eéd.). New York: McGraw-Hill. Pearson, E.S., et Hartley, H.O. (1972). Biometrika
Lloyd, D.K., et Lipow, M. (1972). Reliability: Tables for Statisticians, 2. Cambridge : Cambridge
Management, Methods, and Mathematics, University Press.
Englewood Cliffs (N.J.): Prentice-Hall. Roberts, S. (1959). Control chart tests based on
Lucas, J., et Saccucci, M. (1990). Exponentially weighted géométrie moving averages. Technometrics,
moving average control schemes : Properties and 1, 239-250.
enhancements. Technometrics, 32, 1-12. Rodriguez, R.N. (1992). Recent developments in
Luceno, A. (1996). A process capability ratio with process capability analysis. Journal o f Quality
reliable confidence intervals. Communications in Technology, 24.
Statistics: Simulation and Computation, 25(1). Scheffé, H. (1953). A method for judging ail
Marquardt, D.W., et Snee, R.D. (1975). Ridge régression contrasts in the analysis of variance. Biometrika,
in practice. The American Statistician, 29,3-20. 40, 87-104.
May, J.M. (1952). Extended and corrected tables of the Shapiro, S.S. (1980). How to Test Normality and
upper percentage points of the studentized range. Other Distributional Assumptions, 3. The ASQC
Biometrika, 39, 192-193. Basic References in Quality Control : Statistical
Montgomery, D.C. (2001). Design and Analysis of Techniques, ASQC, Milwaukee (WI).
Experiments (5eéd.). New York: John Wiley & Sons. Snee, R.D. (1977). Validation of régression models :
Montgomery, D.C. (2001). Introduction to Statistical Methods and examples. Technometrics, 19(4),
Quality Control (4eéd.). New York: John 415-428.
Wiley & Sons. Somerville, S.E., et Montgomery, D.C. (1996). Process
Montgomery, D.C., Peck, E.A., et Vining, G.G. (2001). capability indices and nonnormal distributions.
Introduction to Linear Régression Analysis Quality Engineering, 9(2).
(3e éd.). New York: John Wiley & Sons. Tucker, H.G. (1962). An Introduction to Probability
Montgomery, D.C., et Runger, G.C. (1993a). Gauge and Mathematical Statistics. New York : Academie
capability and designed experiments : Part I : Basic Press.
methods. Quality Engineering, 6. Tukey, J.W. (1953). The problem of multiple comparisons.
Montgomery, D.C., et Runger, G.C. (1993b). Gauge [Notes non publiées], Princeton University.
capability analysis and designed experiments : Tukey, J.W. (1977). Exploratory Data Analysis.
Part II : Experimental design models and variance Reading (Mass.) : Addison-Wesley.
component estimation. Quality Engineering, 6. United States Department of Defense. (1957). Military
Montgomery, D.C., et Runger, G.C. (2003). Applied Standard Sampling Procedures and Tables fo r
Statistics and Probability for Engineers (3eéd.). Inspection by Variables fo r Percent Defective
New York : John Wiley & Sons. (M1L-STD-414). Washington (D.C.): Government
Mood, A.M., Graybill, F.A., et Boes, D.C. (1974). Printing Office.
Introduction to the Theory of Statistics (3eéd.). Welch, D. (1983). The statistical analysis of simulation
New York : McGraw-Hill. results. The Computer Performance Modeling
Neter, J., Kutner, M., Nachtsheim, C., et Wasserman, Handbook, sous la direction de S. Lavenberg.
W. (1996). Applied Linear Statistical Models Orlando (Fl.) : Academie Press.
(4e éd.). Homewood (111.) : Irwin Press. White, C. (1952). The use of ranks in a test of
Newman, D. (1939). The distribution of the range significance for comparing two treatments.
in samples from a normal population expressed Biométries, 8, 37.
A intervalle de _, 253, 257, 260, Échantillon(s), 191
263, 265, 269,417 aléatoire simple, 191, 226
Absence de mémoire
Convergence, 246, 247 Échantillonnage, 21
de la loi exponentielle, 140 Effet
Correction pour la continuité,
de la loi géométrique, 118 d’un facteur, 368, 377
171, 172
propriété d’_, 118, 141 principal, 368
Corrélation, 97, 99, 176, 177,
Additivité Efficacité relative, 245
415
propriété d’_, 125, 163, 232 Ensemble(s), 2
coefficient de _, 97, 215, 415,
Analyse complémentaire d’un 4
416,418
de la variance, 344, 349, 402 intersection des 4
Courbes
de régression, 396, 400, 409 -puissance, 21
caractéristiques, 293
Appariement, 318 sous-_, 3, 21
de niveaux, 177
non-_, 318 union des , 4
Covariance, 97, 99 S
centrée réduite, 157, 158 méthode des _, 251, 252 Propriété d’absence de
propriété d’additivité de la _, théoriques, 251 mémoire, 118, 141
163 Moyenne, 205, 242 Propriété d’additivité
propriétés de la 155 Multicolinéarité, 448 de la loi de Poisson, 125
variance d’une _, 259 Multiplication de la loi du khi-carré, 232
Loi t de Student, 233, 234, 257, principe de _, 17, 19 de la loi normale, 163
265, 297, 315 Puissance
décentrée, 299 du test, 284, 286
Loi uniforme continue, 134 U ensemble-_, 21
moyenne et variance de la _, Non-appariement, 318
136 Notation
matricielle, 431
a
scalaire, 430 Quantile(s), 208
M
Nuage de points, 193 d’ordre y, 209
Maximum de vraisemblance de la loi du khi-carré. 23î
estimateurs du _, 247, 250 diagramme quantile-_, 203
méthode du 247, 249 P méthode de calcul de
Médiane, 207 Paramètre (s) probabilité et de _, 158
Mesures de dispersion, 209 de dispersion, 142, 145 théoriques, 204
Méthode (s) de forme 142, 145
de Bonferroni, 358 de position, 145
de dénombrement, 23
estimation de _, 242
R
de Fisher, 358 R2, 414
Partition, 30
de Tukey, 358
Permutation (s), 18, 19 ajusté, 447
des moindres carrés, 349,
d’objets semblables, 23 de base, 446
430, 431, 435
Plan, 22, 377 Région critique, 285, 287, 290
des moments, 251, 252
Plan (s) d’expériences, 344, 361 Région de rejet de H0, 283 (voir
du maximum de
complètement aléatoire, 348 aussi Région critique)
vraisemblance, 247, 249
déséquilibré, 354 Règle
Mode, 208
en blocs aléatoires de multiplication, 26
Modèle (s), 346
avec interactions, 429 complets, 361 de rejet, 288
d’analyse de la variance Plan (s) factoriel (s), 368, 376 Régression
à un facteur, 347, 355 2 \ 377, 383 analyse de _, 396, 400, 409
polynomiaux, 429 Population, 191, 283 équation de _, 396
Modèle à effets Postulat de normalité, 411 linéaire simple, 396, 397
aléatoires, 346 Prévision multiple, 428
fixes, 346 intervalles de _, 272, 439 polynomiale, 451
Modèle (s) de régression, 381, Principe de multiplication, test de signification de la _,
439, 446, 453 17, 19 400, 402
ajusté, 432 Probabilité(s), 1, 10 Résidu, 355
ajustement du _, 410 conditionnelle(s), 23, 26 Résidu (s) d’un plan
linéaire multiple, 428, 431 détermination d’une _, 12 2*, 381
linéaire simple, 397, 428 distribution de _, 47, 58 à blocs aléatoires, 366
polynomiale, 451 totales, 31 à deux facteurs, 375
résidus du 411,432, 449 Problème de Behrens-Fisher, Résidus du modèle de
Moments 315 régression, 411,432, 449
d’une distribution, 57 Processus de Poisson, 124, 138 linéaire multiple, 43
échantillonnaux, 251 Proportion multiple estimé, 449
estimateur par la méthode de succès, 39, 172, 322 Résultats équiprobables, 12,16
des _, 251 tests sur une _, 304 Risque, 284
544 INDEX