Académique Documents
Professionnel Documents
Culture Documents
1. a) La superficie des lacs du Canada est une variable quantitative puisque, ayant convenu des
unites (par exemple, en km 2 ), elle s'exprime au moyen d'un nombre. Cette variable est
continue car, du moins en theorie, on peut la mesurer avec autant de decimales desirees.
b) Le pays d'origine des immigrants est une variable qualitative car les valeurs qu'elle peut
prendre (Ita lie, [aport, etc.) ne sont pas des nombres.
c) La cause du deces est une variable qualitative. Les va leurs qu'elie peut prendre sont cancer,
tuberculose, etc .
d) Les effectifs etudiants sont une variable quantitative. En toute rigueur, cette variable est
discrete (les valeurs possibles sont des entiers) mais ces nombres sont si grands qu'on peut, en
pratique, la traiter comme une variable continue.
e) Le nombre de tonnes-kilometriques transportees par les compagnies de camions est une
variable quantitative et continue.
f ) L'intensite dun courant electrique, exprirne en amperes, est une variable quantitative
continue.
g) L'etat matrimonial des gens est une variable qualitative. Les gens peuvent etre maries,
veufs, celibataires, etc.
h) Le quotient intellectuel des etudiants est une variable quantitative et continue.
i ) L'anciennete des employes d 'une compagnie est une variable quantitative et continue. Si elle
est exprimee en annees entieres, la variable est plutot du type discret.
j) L'allegeance politique des electeurs est une variable qualitative. Les va leurs possibles sont:
parti liberal, parti communiste, etc.
2. a) En theorie, la distribution du salaire annuel des salaries canadiens devrait avoir une allure
generale voisine de celle illu st r ee par la «cou rb e douce ». Exp rirnee sous forme
d'histogramme, la rneme distribution prendra plutot la forme «en escalier» superposes a la
courbe continue.
+- Revrenu en dollars -+
Remarquons que, pour chaque intervalle utilise pour tracer l'histogramme, la surface du
rectangle est la merne que celie sous la courbe continue.
b)
40 000 .,.------:---,------:--~~---;-~---;-~-....,...---~-~----:--~----:------.
30 000
20 000
10 000
o
a 10 20 30 40 SO 60 70 80
-- Age de Ia me:te --.
N ote: L'echelle verticale ind ique les effectifs correspondant a chaque tranche d'une annee
pour l' age de la m ere. Reference: Statistique Canada 1984 .
c)
Ame:ticains
\
a a,s 1,0 1,5
+- Taille enrnetres --.
d)
Frangais Ame:ticains
e)
60
SO
~
4lJ
.......s,... 30
0
,::...
0
d:: 20
10
0 1 2 3 4 5 6 7 8 9 10 11 12
f)
30
~
.......§,.. 20
0
,::...
0 10
d::
0 1 2 3 4 5 6 7 8 9 10 11 12
g)
8000
6000
4000
2000
a
1 2 3 4 5 6
Note: Nous avons illustre le cas ideal ou chaque face du de apparait exactement 6 000 fois.
Lors d'une realisation concrete de cette experience, les effectifs observes ne seront
certainement pas tous rigoureusement egaux.
h)
j)
3. La plus petite observation est 0,1 et la plus grande est 11,6. Convenons de considerer 12
intervalles egaux: Osx-cl, l:5:x<2, ..., II:5:x<12.
Clas se O$x<l 1$x<2 2$x<3 3$x<4 4$x<5 5$x<6 6$x<7 7$x<8 8$x<9 9$x<1O 10$x<11 11$x<12 Total
Effectif 8 8 18 25 30 19 12 10 9 4 5 2 150
Frequence 0,053 0,053 0,120 0,167 0,200 0,127 O,OBO 0,067 0,060 0,027 0,033 0,013 1,00
,
03
30
....t:: 2025
'+<
0,2
Q.I
~ 15
~
10
'"-- 0,1
5
I I I I
0 1 2 3 4 5 6 7 8 9 10 11 12
0,3
30
25
...... .
'+<
20
0,2 Q.I
v
~
v
Q.I
'+<
'+<
~
15 ....
-Q.I
10
0,1 ~
0 1 2 3 4 5 6 7 8 9 10 11 12
4. La plus petite observation est 315, la plus grande 718. Convenons de considerer 14 intervalles
egaux, chacun de largeur 30: 310~x<340, 340~x<370, ..., 700~x<730 . On obtient la distribution
suivante:
15
0,15 Q.I
........
'+<
10
v
v
Q.I
'+<
0,10
~
....
-Q.I
'+<
~ 5 0,05 ~
5.
- ....--""-
- r-
I
'11
~ 0,10
cr'
'~
~J
0 05
LMMJ VS D
Jow de la sernaine
6. a) L'hvpothese nulle est que Ie jour de la semaine n'exerce aucune influence sur Ie nombre
d'accouchement; rnathematiquement, cette hypothese se traduit pas le fait que les 300
accouchements se distribuent uniformement, soit selon les frequences 1/7, 1/7, ..., 1/7.
b) Les effectifs theoriques traduisent la distribution uniforme des frequences: chacun vaut
1
300 x 7' = 42,86.
2
(50-42.86)2 (35 - 42.86)2
c) X =
42.86 + ... + 42.86 = 3.29
d) v = 6; le point critique est done 12,59. On ne rejette done pas Ho: l'ecart entre les effectifs
observes et les effectifs theoriques peut etre du au hasard.
7. a) L'hypothese nulle est que les six faces du de sont equiprobables, c'est-a-dire: chaque face a
une chance sur six d'etre obtenue.
b) En 36 lancers de de, les effectifs theoriques sont 36 x 1/6 = 6 pour chaque face du de.
c) Pour calculer la valeur de X2, il faut d'abord traduire les frequences echantillonnales en
effectifs. On obtient le tableau suivant:
Resultats 1 2 3 4 5 6 total
Frequence 2 Z 1 1 ~ 1 1
echan tillonnale 9 36 4 12 36 9
Effectif 8 7 9 3 5 4 36
echantillonnal
Frequence 1 1 1 1 1 1 1
theorique 6 6 6 6 6 6
Effectif 6 6 6 6 6 6 36
theorique
Confrontant les effectifs echantillonnaux (Oj) aux effectifs theoriques (T[), on obtient:
X2 = (8-6)2/6 +(7-6)2/6 +(9-6)2/6 +(3-6)2/6 +(5-6)2/6 +(4-6)2/6 = 28/6 = 4,67
d) Le nombre de degres de liberte est v = 6 - 1 = 5. Le point critique obtenu de la table de la
page 12 est done 11,07. La valeur obtenue pour X2 (4,67) n'est done pas significativement
grande; l'hypothese nulle (selon laquelle Ie de est bien equilibre) n'est donc pas rejetee,
8. L'hypothese nulle que l'on veut tester est que, lors d'une naissance, les probabilites d'avoir un
gar<;on ou une fiile sont exactement egales, c'est-a-dire, 1/2 pour chaque cas.
Si cette hypothese nulle est vraie, en 33 540 naissances, on devrait obtenir 16 770 gar<;ons et 16 770
filles. Ce sont la les effectifs theoriques, Les effectifs observes sont 17 206 garc;ons et 16 334 filles.
On obtient done:
2
X =
L
(Oi - Ti)
Ti =
(17206 - 16 770)2
16770 +
(16334 - 16 770)2
16770 22/67
Le nombre de degres de liberte est V = 2 - 1 = 1. La valeur critique obtenue de la table est done
3/84. Puisque X2 est superieur a cette valeur critique, on conclut que l'hypothese nulle est fausse.
La probabilite d'avoir un gar<;on est significativement plus grande que 1/2.
9. Lorsqu'on dit que l'ecart est tres significatif, on affirme etre tres sur que la probabilite d'avoir un
gar<;on n'est pas 1/2. Mais on n'affirrne pas que cette probabilite est tres eloignee de 1/2.
10. L'hypothese nulle ici est que la distribution de frequence des scores des orientaux est la meme que
celles des americains de race blanche. Le tableau qui suit presente les donnees pertinentes:
Score 200 a 300 a 400 a 500 a 600 a 700 a Total
290 390 490 590 690 800
Frequence 0/020 0/148 0/301 0/314 0/172 0/045
1/000
theorique
Effectif 201/9 1494,4 3039/2 3170/5 1 736/7 454/4 10097
theorique
Effectif 208 1309 2788 3190 2001 601 10097
observe
, , ..
X,2 = 131/6 avec 5 degres de hberte (valeur critique: 11/07). Les onentaux ont des resultats
nettement superieurs a ceux des arnericains.
11. Ce problema re ssemble au probleme precedent sauf que tous les effectifs (echantillonnaux comme
theoriques) sont dix fois plus grands. On obtient Ie tableau suivant:
Resultats 1 2 3 4 5 6 total
Effectif 80 70 90 30 50 40 360
echan tillonnal
Effectif 60 60 60 60 60 60 360
theorique
On obtient done:
46/67. Comme dans le probleme precedent le nombre de degres de liberte est v = 5 et le point
critique est encore 11/07. La valeur obtenue pour X2 (46/67) etant nettement plus grande que Ie
point critique, l'hypothese nulle (selon laquelle le de est bien equilibre) est re~etee.
En multipliant tous les effectifs par 10/ tous les termes dont la somme donne X ont ete multiplies
par 100 au numerateur et par 10 seulement au denominateur, ce qui explique que ce nouveau X2
0,5 Hommes
0.4
0,3
0,2
0,1-~
I I I I
015 10 15 20 25 30 35 50
Revenu
Femmes
0,4
0,3
0,2
tL~_L~t==t==J:::::=::t==:::::l======--
I
0,1 I I
__
015 10 15 20 25 30 35 50
Revenu
Fxequence
Polygones des fxequences (hommes, femmes)
0,5
0,4
0,3
0,2
0,1 ~~_-=:====:::::~:;;;;;;;;;;;;;;;~~_
o1 5 10 15 20 25 30 35 50
Revenu
13.
90000 -
80000 - _r---f-
70000 r-- -
..... 60000 r--
-
.-Ed! 50000
-
::::: 40000
~ 30000
20000
10000
o
1234 56789mll~mM~UVW~~
+-Age-+
Remarque: Puisque toutes les classes sont de me me largeur, on a pu indiquer une echelle verticale.
Ces donnees peuvent aussi etre considerees comme etant discretes et etre representees par un
diagramme a batons plut6t que par un histogramme.
1"- Afin de comparer les trois distributions, il faut d'abord les exprimer chacune en frequences
7 (frequences relatives, se referant uniquement a la sous-population consideree). On obtient le
tableau suivant:
Celibataires Veuves Divorcees
Age Effectifs Frequences Effectifs Frequences Effectifs Frequences
relatives relatives relatives
15-19 44 827 0,285 20 0,004 86 0,004
20-24 81345 0,518 175 0,031 2558 0,115
25-29 21774 0,139 391 0,069 6162 0,278
30-34 5216 0,033 394 0,070 4785 0,216
35-39 1768 0,011 425 0,075 2958 0,133
40-44 833 0,005 529 0,094 2121 0,096
45-49 521 0,003 795 0,141 1589 0,072
50-54 383 0,002 932 0,165 1125 0,051
55-59 265 0,002 1041 0,184 563 0,025
60-64 176 0,001 947 0,168 235 0,011
Total 157108 0,999"", 1 5 649 1,001 "'" 1 22 182 1,001 "'" 1
Celiba taires
15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64
+- Age de la rnariee +
Ces trois polygones de frequences illustrent bien (comme on pouvait s'y attendre), que les femmes
divorcees qui se remarient sont, en general, plus agees que celles qui etaient celibataires mais
plus jeunes que celles qui etaient veuves.
15. a) Bien que ce ne soit pas toujours le sens qu'on lui attribue, Ie terme «rep resen tatif» sera
considere ici comme synonyme de «tire au hasard», L'hypothese nulle est done que
I'echantillon a ete tire au hasard, auquel cas il devrait comprendre 20% de blessures
mortelles, 30% de blessures tres graves, 30% de blessures graves et 20% de blessures «pas
graves».
b) Les effectifs observes s'obtiennent en multipliant par l'effectif total (600) chacune des
frequences echantillonnales donnees dans Ie tableau. Les effectifs theoriques (valides si
l'hypothese nulle est vraie) s'obtierment en multipliant encore par 600 les frequences
observees dans la population entiere, consideree comme etant infinie. Ces frequences
correspondant a la population entiere seront done traitees comme representant les «vraies
probabilites» de chaque type d'accident. On obtient Ie tableau suivant:
Le nombre de degres de liberte est v = 4 - 1 = 3. Le point critique est 7,82. Puisque X2 = 50 >
7,82 l'hypothese nulle est rejetee. On conclut que notre echantillon de 600 accidents n'est pas
blessures, dans cet echantillon, est significativement differente de celle qu'on obtient en
16. Le tableau suivant presente, en plus des effectifs absolus, les frequences relatives dans chaque
sous-population.
Commentaires: On remarque que, quand le chef de famille est une femme, il est plus souvent age.
Ceci est vraisemblablement du au fait bien connu que les femmes vivent, en moyenne,
plus longtemps que les hommes. A l'autre extreme, on observe aussi une surabondance
de femmes quand le chef de famille est tres jeune. Peut-etre est-ce du aux jeunes
couples separes ou les enfants vivent avec la mere.
Une premiere solution consiste a considerer 9 classes: 10 000-19 999, 20 000-29 999, 30 000-39 999,
..., 90 000-99999. La classe dans laquelle chaque nombre de cinq chiffres sera place ne dependra
done que de son premier chiffre. Si l'hypothese nulle (chiffres choisis au hasard) est vraie, on
s'attend a ce que les 72 nombres se partagent egalement entre les 9 classes (8 pour chacune: ce sont
la les effectifs theoriques). Or parmi ces 72 nombres, 8 commencent par I, 10 commencent par un
2, etc. Les effectifs observes sont done 8, 10,9,8,8,8,7,6,8, et on obtient: X2 = (8-8)2/8 + 00
8)2/8 +(9-8)2/8 +...+ (8-8)2/8 = 1,25. Le nombre de degres de liberte est v = 9-1 = 8. Le point
critique obtenu de la table est done 15,51. Puisque la valeur de X2 est inferieure au point critique,
on ne peut rejeter l'hypothese nulle selon laquelle les chiffres ont ete tires au hasard (en fait, la
valeur 1,25 obtenue pour X2 est meme etonnamment petite et eveille de nouveaux soupcons: la
distribution trap uniforme).
Une autre facon de proceder est de compter combien de fois chacun des chiffres de 0 a 9 apparait
parmi les 72 x 5 = 360 chiffres tires. Puisque Ie premier chiffre de chaque nombre ne peut ailer
que de 1 a 9 (Ie zero est interdit en premiere position) on s'attend a ce que, si l'hypothese nuile
est vraie, le nombre total de zeros soit pres de 4 x 72 x 1/10 = 28,8. Pour chacun des autres
chiffres (de 1 a 9), l'effectif theorique est (72 x 1/9) + (4 x 72 x 1/10) = 36,8 . Les effectifs
observes sont 6, 67, 61, 42, 31, 25, 29, 44, 29 et 26. On trouve done: X2 = (6-28,8)2/28,8 + (67
36,8)2/36,8 +...+ (26-36,8)2/36,8 = 72,07. Avec v = 10 - 1 = 9, Ie point critique est 16,93. Puisque
X2 est superieur au point critique, l'hypothese nulle est rejetee: certains chiffres apparaissent
significativement plus souvent que d'autres. En particulier, il y a une nette surabondance de 2 et
de 3 (qui sont sortis respectivement 67 et 61 fois alors qu'on n'en attendait que 36,8) et une nette
sous-abondance de 0 (qui n'est sorti que 6 fois alors qu'on devrait en trouver 28,8).
18.
.---...
..., 2500
,..
...Q,I
...... 2000
....
......
1500
E
§j
1000
........
""-'"
+'
500
'-'
.....
Q,I
..... 0
~ -.::l' 0... 0...
-.::l' ...... 0... -.::l' 0... -.::l'
~I
-.::l' -.::l' 0... -.::l' 0... 0...
...... ~I
C":' 0...
I I
Lr,) I C\l C\l <C':I I Lr,)
Lr,)
\,S) \,S) r--I <lO coI
'=' I I I I I
I
I I I
-
r- -
- ~
l-
I
-.::l' 0... -.::l' 0... -.::l' 0... -.::l'
I I ...... ...... C\l C\l <C':I
o l/') I t I I I
'='
......
Lr,)
......
0
C\l
Lr,) '='
C\l <C':I
Remarque: Seul Ie premier histogramme est muni d'une echelle verticale car il est le seul a etre
forme de classes de largeurs egales.
19. L'hypothese nulle est que la distribution des sexes dans notre echantillon est la meme que dans
la population generale, soit 51,95% de gar<;on et 48,05% de filles. Dans un echantillon de 1 687
personnes, les effectifs theoriques sont donc 876,4 gar<;ons et 810,6 filles. Or notre echantillon
compte 847 gar<;on et 840 Hiles. Ce sont la les effectifs observes.
On trouve donc: X2 = (847-876,4)2/876,4 + (840-810,6)2/810,6 = 2,05. Avec v = 2-1 = 1, le point
critique est 3,84. Puisque X2 est inferieur au point critique, l'hypothese nulle n'est pas rejetee.
20.
Niveau sec.l sec.2 sec.3 secA sec.s Total
scolaire
Sexe M F M F M F M F M F
Frequence 0,104 0,088 0,089 0,113 0,106 0,095 0,110 0,092 0,092 0,111 1,000
theorique
Effectif 175,4 148,5 150,1 190,6 178,8 160,3 185,6 155,2 155,2 187,3 1687
theorique
Frequence 0,107 0,099 0,105 0,101 0,110 0,105 0,100 0,099 0,086 0,088 1,000
observee
Effectif 180,5 167,0 177,1 170,4 185,6 177,1 168,7 167,0 145,1 148,5 1687
observe
21.
22 . Exprimees en frequences, les donnees du recensement donnent 0,440 56 et 0,559 44 pour les deux
categories de scolarite. Dans un echantillon de 787 personnes, les effectifs theoriques seraient
done, respectivement, 346,7 et 440,3. Les effectifs observes etant 162 et 625, on obtient X2 = 062
346,7)2/346,7 + (625-440,3)2/440,3 = 175,91. Puisque v = 2 - 1 = 1, la valeur critique est 3,84.
L'hypothese nulle, selon laquelle l'echantillon est representatif de la population entiere, est
done rejetee. L'echantillon est beaucoup plus scolarise que la population. (Les auteurs du rapport
signalent que leur echantillon a ete preleve en 1978 alors que le recensement date de 1971, et c'est
a cela qu'ils attribuent la difference entre les proportions echantillonnales et les proportions de
la population. Bien que ce facteur ait surernent contribue a la difference, il est peu
vraisemblable qu'il l'explique entierement),
23. a)
Jour Lu Ma Me Je Ve Sa Di Total
Effectif 941 941 941 941 941 941 941 6587
theorique
Effectif 1001 1035 982 1033 905 737 894 6587
observe
x2 = 71,95 avec v = 7 - 1 = 6.
La valeur critique etant 12,59, on conclut que certains jours sont
plus favorables aux suicides que d'autres.
b) Ne considerons ici que deux classes: la classe «ven d red i a dimanche» et la classe «lundi a
jeudi». On obtient le tableau suivant:
x2 = 51,06 avec v = 2 - 1 = 1. La valeur critique est 3,84. Les suicides sont done moins
frequents a l'approche d'un week-end.
c) Dans notre echantillon, 4 051 suicides ont lieu entre le lundi et le jeudi. Si Ie taux de suicide
est le merne du lundi au jeudi, on devrait observer 1 012,75 suicides a chacun de ces quatres
jours; ce sont la les effectifs theoriques, On obtient le tableau suivant:
Jour Lu Ma Me Je Total
Effectif 1 012,75 1 012,75 1 012,75 1012,75 4051
theorique
Effectif 1001 1035 982 1033 4051
observe
Jour Ve Sa Di Total
Effectif 845,3 845,3 845,3 2536
theorique
Effectif 905 737 894 2536
observe
x2= 20,90 avec 2 degres de liberte, La valeur critique etant 5,99, on conclut que les jours du
week-end ne sont pas equivalents les uns aux autres; il y a nettement moins de suicides le
samedi.
e) Le taux de suicide est significativement plus bas durant le week-end (du vendredi au
dimanche) que durant les autres jours de la semaine. Du lundi au jeudi, ce taux est
sensiblement constant. Durant le week-end, il n'est pas constant: il y a nettement moins de
suicide Ie samedi.
24. a)
Jour Lu Ma Me Je Ve Total
Production 90 000 109 000 106 000 105 000 90 000
500,000
Frequence 0,180 0,218 0,212 0,210 0,180 1,000
theorique
Effectif 144 174,4 169,6 168 144 800
theorique
Effectif 200 144 128 136 192 800
observe
x2 = 59,38 avec 4 degres de liberte (valeur critique: 9,49). Le taux de defectuosite depend bel
et bien du jour de fabrication.
b)
Jour Lundi Vendredi Total
Productior 90000 90 000 180 000
Frequence 0,500 0,500 1,000
theorique
Effectif 196 196 392
theorique
Effectif 200 192 392
observe
x2 = 0,163 avec 1 degre de liberte (valeur critique 3,84). Les taux de defectuosite du lundi et
du vendredi sont egaux,
c)
Jour Mardi Mercredi [eudi Total
Productior 109 000 106 000 105 000 320 000
Frequence 0,340625 0,331 25 0,328125 1,000
theorique
Effectif 138,975 135,15 133,875 408
theorique
Effectif 144 128 136 408
observe
x2 = 0,59
avec 2 degre de liberte (valeur critique 5,99). Les taux de defectuosite sont les
memes pour le mardi, le mercredi et le jeudi.
d)
[ours Lu et Ve Ma,Me et Je Total
Productior 180000 320000 500 000
Frequence 0,36 0,64 1,00
theorique
Effectif 288 512 800
theorique
Effectif 392 408 800
observe
x2 = 58,68 avec 1 degre de Iiberte (valeur critique 3,84). Le taux de defectuosite est plus bas
au milieu de la semaine qu'aux extrernites.
25. a)
Marque A Autre Total
Effectif 50 450 500
theorique
Effectif 80 420 500
observe
On trouve X2 = 1,43 et v = 4 - 1 = 3. La valeur critique (7,82) etant plus grande que X2,
l'hypothese nulle n'est pas rejetee. L'analyste a saute aux conclusions un peu trop vite.
26. a)
[ours Lu et Ve Ma,Me et Je Total
Frequence 2/5 3/5 1
theorique
Effectif 200 300 500
theorique
Effectif 257 243 500
observe
X2 = 27,1 avec 1 degre de liberte (valeur critique 3,84). Les absences sont reellement plus
frequentes le lundi et le vendredi.
b) Afin d'evaluer les effectifs theoriques dans ce nouveau modele qui tient compte du nombre de
jours que durent les maladies, imaginons un ensemble ideal de 70 maladies, parmi lesquelles
10 debutent un lundi, 10 debutent un mardi, et ainsi de suite pour les 7 [ours de la semaine.
Parmi les maladies qui debutent chaque jour, il y en a 5 qui ne dureront que ce jour, 2 dureront
2 jours, 1 durera 3 jours et 2 s'etendront sur 4 jours.
Dans les statistiques compilees par le patron, on ne retiendra donc que 5 maladies pour
chacun des jours du milieu de la semaine (mardi, mercredi et jeudi),soit les 5 maladies qui
debutent ce jour et ne durent qu'une [ournee. La situation du lundi est differente: en plus de
compter les 5 maladies du lundi qui ne durent qu'un jour, on comptera aussi les 2 maladies qui
ont debute un dimanche et ont dure 2 jours ainsi que celle qui a debute un samedi et a dure 3
jours. En tout, on trouvera done 8 maladies comptees le lundi.
--15-
La situation du vendredi est semblable: en plus de compter les 5 maladies qui debutent un
vendredi et ne durent qu'un jour, on comptera les 2 maladies qui commencent vendredi et
durent 2 jours ainsi que celie qui dure 3 jours, allant du vendredi au dimanche. En tout, done,
8 maladies seront comptees pour le vendredi. Le tableau suivant illustre la situation
globale:
[ours Lu Ma Me Je Ve Total
Nombre de maladies
detectees parmi les 70
maladies idealement
distribuees 8 5 5 5 8 31
Frequence theorique 8/31 5/31 5/31 5/31 8/31 1
Effectif theorique 129 80,6 80,6 80,6 129 500
Effectif observe 129 80 82 81 128 500
1. a) n = 16; SXi = 68; X = 68/16 = 4,25. Les donnees sont deja en ordre croissant: la mediane est la
moyenne entre les deux donnees centrales (de rangs 8 et 9); mediane = (4 + 4)/2 = 4. Le mode
est 4 car cette valeur, qui apparatt 6 fois, est la plus frequente.
b) n = 7; SXi = 81,2; x = 81,2/7 = 11,6. Presentees en ordre croissant, les donnees sont 7,2, 8,2,
9,4, 11,2, 12,5, 14,5 et 18,3. La mediane est la donnee centrale, c'est-a-dire, la quatrierne, qui
est 11,2. Chacune des 7 donnees est un mode car elles sont toutes distinctes.
c) n = 8; SXi = 35; x = 35/8 = 4,375. Presentees en ordre croissant, les donnees sont 1,9,2,7, 2,8,
2,8, 3,9, 4,7, 7,8 et 8,4. La mediane est la moyenne entre les deux donnees centrales (la
quatrieme et la cinquieme, qui valent 2,8 et 3,9). Mediane = (2,8 + 3,9)/2 = 3,35. Le mode est
2,8, la seule valeur qui apparait 2 fois.
1 1 3 1
3. a) n = 15. Les donnees sont deja en ordre croissant. Avec a = 4" 2' et 4" an + 2' vaut
respectivement 4,25, 8 et 11,75. Les trois quartiles sont done les donnees de rangs 4, 8 et 12.
Ql = 1; Q2 = 3; Q3 = 9.
1 1
b) n = 9. Les donnees, presentees en ordre croissant, sont 2, 4, 4, 6.6.6.8, 10 et 1O~ Avec a = 4" 2'
3 1
et 4" an + 2' vaut respectivement 2,75, 5 et 7,25. Les trois quartiles sont donc les donnees de
rangs 3, 5 et 7. Ql = 4; Q2 = 6; Q3 = 8.
1 1 3 1
c) n = 13. Les donnees sont deja en ordre croissant. Avec a = 4" 2' et 4" an + 2' vaut
respectivement 3,75, 7 et 10,25. Les trois quartiles sont done les donnees de rangs 4, 7 et 10.
Ql= 2; Q2 = 2; ~ = 12.
4. a) La moyenne de plusieurs nombres consecutifs est la moyenne entre les deux valeurs extremes;
1 1 3 1
)( = (l + 31)/2 = 16. n = 31; avec a = 4" 2' et 4" an + 2' vaut respectivement 8,25, 16 et 23,75 .
Les trois quartiles sont done les donnees de rangs 8, 16 et 24. Ql = 8; Q2 = mediane = 16;
Q3 = 24.
b) La moyenne de plusieurs nombres consecutifs est la moyenne entre les deux va leurs extremes;
_ 1 1 3 1 .
x = (-20 + 20)/2 = O. n = 41 avec a = 4" 2'et 4" an + 2' vaut respectivement 10,75,21 et 31,25.
Les trois quartiles sont done les donnees de rangs II, 21 et 31. Ql = -10; Q2 = mediane = 0;
Q3 = 10.
5. 1 a) n = 16', SX'l
= 68'
' sl-i = 330'' x = 425' x2 = 20625' s2 = x2 _)(2 = 25625' s = 160078
II " , I I •
S = 3,60397.
I c) n = 8', Sx,l= 35
'' sl-i= 19528'
'l x = 4,375', x2 = 2441' s2 =5269375 ' s = 229551
I I ' , , .
2a) n = 5; SXi = 110; Sxf = 2430; x = 22; ";I. = 486; s2 = ";I. - x 2 = 2; s = 1,41421.
2b) n = 5', SX'1 = 124'' sl-i = 3298'' -x = 248' x2 = 6596' s2 =4456' s = 6675 33
II II " , •
2c) n = 5; SXj = 95; Sxf = 2 055; x = 19; x2 = 411; s2 =50; s = 7,071 07.
17
6. Serie A : n = 5; SXi = 250; S~ = 12 702; X = 50; ;J. = 2 540,4; s2 =40,4; s = 6,356 1.
Serie B : n = 5; SXi = 250; SxT = 12510; X = 50; ~ = 2502; s2 =2; s = 1,41421.
8. Les deux ecart-types devraient etre egaux car l'ajout d'une constante a chaque donnee n'en modifie
que la moyenne et non la dispersion.
sl
Serie A .• n = 5', SX'1 = 50'' i = 750'' x = 10', x2 = 150', s2 =50', s = 7071
, 1.
9. L'ecart-type de la serie B devrait etre 5 fois plus grand que celui de la serie A.
Serie A: n = 5; SXi = 50; SXT = 750; x = 10; x2 = 150; s2 =50; s = 7,071.
Serie B : n = 5; SXi = 250; SXT = 18 750; x = 50; ~ = 3750; s2 =1 250; s = 35,355 = 5 x 7,071.
a) s2 = ~ S (Xi - x)2 = ~ «5 - 12)2 + (8 -12)2 + (12 -12)2 + (16 - 12)2 + (19 - 12)2)
1 130
= 5' (72 + 42 + 02 + 42 + 72) = 5 = 26.
b) s2 = n = 5 = 5 = 5 = 26.
'" -2
c) s 2 =xL.- 850 2
x =5-12 =170-144=26.
11. Numero 3 : a) E = 03 - Q1 = 9 - 1 = 8.
b) E = Q3 - Q1 = 8 - 4 = 4.
c) E = Q3 - Q1 = 12 - 2 = 10.
Numero 4: a) E = Q3 - Q1 = 24 - 8 = 16.
b) E = 03 - Q1 = 10 - (-10) = 20.
12. n = 19; SXi = 118; SxT = 872. Mises en ordre croissant, les donnees sont 0,0,4,4,4,4,7,7,7,7,8,
8, 8, 8, 8, 8, 8, 8, 10.
Moyenne = x = 118/19 = 6,210 5; mode = 8 (cette donnee apparait 8 fois): mediane = «la dixieme
donnee» = 7.
s2 = x2 - x 2 = 872/19 - (118/19)2 = 7,324 1; s = 2,706 3; Q1 = «la 5ieme donnee» = 4; Q3 = «la
TSieme donnee» = 8;
E = Q3 - Q1 = 8 -4 = 4.
13. n = 100; les donnees sont deja en ordre croissant. La mediane est la moyenne entre les deux
donnees centrales (de rangs 50 et 51); mediane = (21 240 + 21 295)/2 = 21 267,5. Les charnieres
sont les medianes des 50 premieres observations «18 555 + 18 712)/2 = 18 633,5) et des
50 dernieres «24 130 + 24 299)/2 = 24 214,5). L'ecart entre les charnieres est 24214,5 - 18 633,5 =
5 581. L'ecart normal aux charnieres est 1,5 x 5 581 = 8 371,5. L'intervalle des donnees normales
18
po
est (18 633,5 - 8 371,5 ; 24 214,5 + 8 371,5) = (10 262 ; 32 586). La plus petite donnee normale est
13 441; la plus grande donnee normale est 30 214. Les 9 dernieres donnees sont anormalement
grandes. La moustache est:
'<;f' ['-.
...... o C'J0~ ~ L/)
['-. 0
C'J g! ~~~ ...... C'J ~
0 :g
C'J ~~'<;f' 00 0
~
1---------'1 I l'--------t
~ ~ ~~~ ~
I II I I
I
\----.--...........----.--....,--,----.---r--T-I----.--.....--T--r--.----r--..--.----r----t--....---.-----r---r--r-----r--....--T""--r---I----.--.....--T--r----r---T---r-""r'-T----l
I
10 000 20000 30000 40 000 50000
14. n = 74; les donnees sont deja en ordre croissant. La mediane est la moyenne entre les donnees de
rangs 37 et 38, c'est-a-dire, (4,5 + 4,6) /2 = 4,55. La premiere charniere est la mediane des
37 premieres donnees, c'est-a-dire, la donnee de rang 19 : 3,4. La seconde charniere est la
mediane des donnees de rangs 38 a 74, c'est-a-dire, la donnee de rang 56 : 6,9. L'ecart entre les
charnieres est 6,9 - 3,4 = 3,5. L'ecart normal au charniere est 1,5 x 3,5 = 5,25. L'intervalle des
donnees normales est (3,4 - 5,25 ; 6,9 + 5,25) = (-1,85 ; 12,15). La plus petite donnee normale est
0,1; la plus grande donnee normale est 9,4 . Les trois dernieres donnees sont anormalement
grandes. La moustache est:
L/)
C'J
u->
......
ro
......
I I
I
o 2 4 6 8 10 12 14 16 18 20 22 24 26 28
16.
Y:
19
La variable X prend plus souvent des va leurs extremes. On devrait trouver "x > Sy' En effet:
"x = 10; SXi ni = 30; Sx7 ni = 116; s~ = (116/10) - (30/10)2 = 2,6; Sx = 1,6125.
n y = 10; SYi ni = 30; SYT ni = 102; s~ = (102/10) - (30/10)2 = 1,2; Sy = 1,0954.
17. x = S Xi fi = (1 x 0,1) + (2 x 0,4) + (3 x 0,2) + (4 x 0,2) + (5 x 0,1) = 2,8.
~ = SxT fi = (1 x 0,1) + (4 x 0,4) + (9 x 0,2) + (16 x 0,2) + (25 x 0,1) = 9,2.
s2 = 9,2 - (2,8)2 = 1,36; s = 1,166 2. Le mode est la valeur la plus frequente, c'est-a-dire, 2. La
mediane est (2 + 3) /2 = 2,5. 50% des donnees sont < 2,5 et 50% des donnees sont > 2,5.
1 3 1
18. a) n = 37. Av ec a. = 4' et 4' ' no. + 2" vaut respectivement 9,75 et 28,25. Les quantiles Ql et ~
sont les donnees de rangs 10 et 28. La dixieme donnee est un 5. La 28iem e donnee (c'est-a
dire, la dixieme en partant de la droite) est un 9. E = Q3 - Ql = 9 - 5 = 4.
b) 12% des donnees sont < 4. 49% des donnees sont < 8. Le quantile Ql sera situe au (25%
12%)/37% = 35,135 % de l'intervalle allant de 4 a 8, c'est-a-dire, a 4 + 0,351 35 (8 - 4) = 5,405.
68% des donnees sont < 16; 100% des donnees sont $; 20. Le quantile ~ sera situe au (75%
68%)/32% = 21,875 % de l'intervalle allant de 16 a 20, c'est-a-dire, a 16 + 0,218 75 (20 - 16) =
16,875. E = ~ - Ql = 16,875 - 5,405 = 11,47.
20. nX = 5; SXi = 35; SxT = 7; s~ = 60,6 - 72 = 11,6; Sx = 3,406. Chaque Yi est de la forme
= 303; x
2 000 + 6~. On aura done y = 2 000 + 6 x 7 = 2 042 et Sy = 6s X = 20,44. On peut verifier qu'on a
bien SYi = 10210 et SYT = 20 850 908, ce qui donne y = 2 042, s~ = 417,6 et Sy = 20,44.
23. x = 8; ~ = 68; 52 = 4; 5 = 2. Les 5 cotes Z sont (5 - 8)/2 = -1,5; (7 - 8)/2 = -0,5; (8 - 8)/2 = 0; (9
8)/2 = 0,5 et (11 - 8)/2 = 1,5. SZi = 0; SZT = 5; Z = 0; 52 = 1.
24. Votre cote Z est (23 - 17)/2,5 = 2,4. La proportion de la population dont la cote Z, en valeur
absolue, est superieure a 2,4 est au maximum 1/(2,4)2 = 0,173 61 ce qui, dans une population de
100000, represente 17361 personnes. Le nombre reel est probablement beaucoup plus petit.
20
26. Nombre de voitures vendues
A B C o Total
Concessionnaire X 43 50 70 150 313
Concessionnaire Y 10 20 65 200 295
Total 53 70 135 350 608
En ajustant les prix de vente moyens selon la ponderation basee sur les effectifs marginaux 53,
70, 135 et 350 on obtient, pour Ie concessionnaire X une moyenne ajustee valant «30 x 54) + (22 x
70) + (15 x 135) + (11 x 350»/608 = 9005/608 = 14,811, c'est-a-dire, 14811$.
Pour le concessionnaire Y, la moyenne ajustee est «31 x 53) + (23 x 70) + (14 x 135) + (12 x
350»/608 = 9 343/608 = 15,367, c'est-a-dire, 15367$.
27. sx est surernent beaucoup plus grand que sy car les valeurs vraisernblables pour X sont beaucoup
plus grandes que celles qu'on s'attend d'observer pour Y.
28. Pour janvier, nX = 12; Sx, = -109,6; 5Xf = 1 079,94; x = -9,133; s~ = 6,577; sx = 2,565.
30. a), b) et c) sont fausses. Contre-exemple: 1, 2, 2, 3. La mediane d e ces 4 donnees est 2. 25% des
donnees sont inferieures a la mediane (et non 50%); 25% des donnees sont superieures a la
mediane (et non 50%); 75% des donnees sont inferieures ou egales a la med iane (et non 50%);
75% n'est pas inferieur ou egal a 50%. d) et e) sont vraies.
31. a) La mediane sera la moyenne entre les observations de rangs 197 363 et 197 364. Les 84 100
premieres observations sont des 1; les 109 905 observations suivantes (occupant les rangs
84 101 a 194 005) sont des 2; les 70 735 observations suivantes (occupant les rangs 194 006 a
264740) sont des 3. La mediane est done 3. Le mode est 2, cette valeur, observee 109 905 fois,
etant la plus Frequente.
b) La mediane sera l'observation de rang 403 013. Les rangs 1 a 120370 sont occupes par des 1;
les rangs 120371 a 321 480 sont occupes par des 2; les rangs 321 481 a 469 990 sont occupes par
des 3. La mediane est done 3. Le mode est probablement 2, mais il est possible, quoique peu
probable, qu'il soit 4 ou 5 si les 240 630 observations de cette categoric sont tres inegalement
reparties entre ces deux valeurs.
32. La variance est sfuement beaucoup plus grande pour la serie A car les temperatures a Montreal
varient beaucoup plus qu'a Miami entre janvier et juillet.
33. Le supermarche A a probablement des depenses plus elevees car il dolt avoir un personnel
suffisant pour ne pas etre deborde en periode de pointe.
34. Les precipitations ne peuvent pas etre negatives. Puisque la moyenne est zero, chaque
observation individuelle est necessairernent zero. Toutes les donnees etant egales, leur variance
est nulle, de meme que leur ecart-type,
35. a) Si l'ecart-type est 1, un score de 65 correspond a une cote Z de (65 - 60)/1 = 5, ce qui est
exceptionnel. L'inegalite de Tchebychev nous permet d'affirrner qu'au plus 1/52 = 4% des
observations s'ecartent autant de la moyenne. La proportion reelle est probablement encore
beaucoup plus petite.
21
b) Si l'ecart-type est 20, un score de 65 correspond a. une cote Z de (65 - 60)/20 = 0,25, ce qui est
tout-a-fait quelconque et n'a rien d'exceptionnel.
36. En utilisant les valeurs 2 sao, 7 sao, 11 000, 13 sao, etc. comme points-milieux des classes, on
trouve
x = SXifi = (2500 x 0,017) + (7 500 x 0,063) + ... + (55 000 x 0,101) = 29 820;
x2 = SXT fi = (25002 x 0,017) + ... + (55 0002 x 0,101) = 1 097622 500;
s2 = ~ - x 2 = 208 390 100; s = 14436.
44,7% des donnees sont inferieures a. 27 000; 51,4% des donnees sont inferieures a. 30 000. Par
·
mterpo ation, 1a me'd lane
lati ' est d one 27 000 + 0.500 - 0.447 (30 000 - 27 000)
= 29 373.
0.067
23,6% des donnees sont inferieures a 17 000; 29,8% des donnees sont inferieures a 20 ODD. Par
·
mterpo ation, 1e premier
lati . quarti'1e est d one Q 1 = 17 000 + 0.250 - 0.236 (20000 - 17000) = 17677.
0.062
73,5 % des donnees sont inferieures a. 40 000; 82,7% des donnees sont inferieures a 45 ODD. Par
·
mterpo ation, 1e troisieme
lati . " quarti'1 e est d O
one Q3D
= 4O 0 + 0.750 - 0.735 (45 000 - 40 000 ) = 40 815.
0.092
E = Q3 - Ql = 23 138.
37. La proportion X provenant d'un plus petit echantillon, son ecart-type sera plus grand.
38. L'ecart-type depend de l'unite de mesure. Si, par exernple, X est la taille en pouces et Y la
taille en centimetres, alors Y = 2,54X et sY = 2,54sX' La cote Z, par centre, reste inchangee.
39. La cote Z de l'etudiant A est (69 - 60)/3 = 3. La cote Z de l'etudiant Best (75 - 60)/10 = 1,5. A
est mieux situe par rapport a sa classe que B par rapport a la sienne.
40. Le premier etudiant a obtenu une cote Z de 0 a l'intra et de (80 - 60)/20 = 1 au final. Le second
etudiant a obtenu une cote Z de (80 - 60)/10 = 2 a l'intra et une cote Z de 0 au final. Le second
etudiant a eu un meilleur resultat global.
41. 11 est raisonnable d'attribuer la baisse de recettes aux travaux municipaux car une cote Z de
(19500 - 20000)/100 = -5 est tres significative.
42. On rejette les rouleaux dont l'ecart a la moyenne est de 3 ecarts-type «65-62,03)/0,99 =
(67,97-65)/0,99 = 3). Selon le theorerne de Tchebycheff, la proportion rejetee est au maximum de
1/32 = 1/9 = 11,11%.
43. Supposant que les moyennes echantillonnales sont de bonnes estimations des vraies moyennes des
strates, alors le montant total des comptes a payer est estime par (3010,75 x 70) + (580,60 x 500) +
(89,78 x 10 000) = 1398852,50 $.
pour les hommes : (0,6 x 0,114) + (D,S x 0,117) + + (198,5 x 0,008) = 9,8322;
pour les femmes : (0,4 x 0,114) + (0,3 x 0,117) + + (163,3 x 0,008) = 5,8373.
22
Le revenu moyen des femmes, calcule de facon analogue, est 3 864 $. La difference est de
3 247$ en faveur des hommes.
b) Les moyennes ajustees seront calculees en utilisant les effectifs marginaux des 5 classes, qui
sont, respectivement, 508,5, 611,0, 678,7, 1 059,2 et 4817,6; effectif total = 7675,0.
Pour les hommes, le revenu moyen ajuste est
508:5 611.0 4817.6
7 675.0 x 1 591 + 7 675.0 x 2 973 + ... + 7 675.0 x 8 230 = 6 920$.
Pour les femmes, le revenu moyen ajuste, calcule de facon analogue, est 4 125$. En utilisant
des moyennes ajustees, la difference a ete ramenee a 2795$, toujours en faveur des hommes.
Cette difference entre hommes et femmes ne peut etre attribuee au fait que les femmes ont
moins travaille (puisqu'on utilise la merne ponderation): elle ne peut s'expliquer que par une
difference reelle de traitements.
46. a) Pour chacune des 8 categories de revenu, l'imp6t moyen paye en 1973 a ete, respectivement,
13.8 millions
571.0 milliers = 24,2; 189,3; 467,9; 871,3; 1 547,2; 2855,S; 6 563,3; 21 919,8.
Pour les memes 8 categories, l'imp6t moyen paye en 1974 a ete
1.2 millions
427.8 milliers = 2,8; 114,5; 372,8; 765,1; 1 433,6; 2 695,3; 6 165,7; 21 426,0.
Pour chaque tranche de revenu, le contribuable a paye moins en 1974 qu'en 1973.
23
CHAPITRE 3
1. a) Vrai. b) Vrai. c) Faux: 9,9% etaient des gan;ons et avaient un poids moyen; 19,11 %
(= 0,099 x 100/0,518) des gan;ons ont un poids moyen. d) Vrai. e) Faux: 12,8% des
bebes etaient des filles et avaient un poids moyen; 56,38% (= g'~;~ )des bebes de poids moyen
etaient des filles.
40 x 54 2160 20 x 66 1320
2. a) Par exemple, = 120 = 18; = 120 = 11, etc.
120 120
b) Y inferieur Superieur ou
a 100 egal a 100 Total
On verifie que la frequence d'une case est egale au produit de la frequence totale de la ligne
par la frequence totale de la colonne. Par exemple, la frequence a I'intersection de la ligne 1
et de la colonne 1 est 0,150 = 0,333 x 0,450; celle a l'intersection de la ligne 3 et de la colonne
2 est 0,092 = 0,167 x 0,550.
Sexe Total
Frequence 1,000
Age de la mere
Sexe 19 et moins De 20 a 24 De 25 a 29 30 et plus Total
Masculin 0,117 0,356 0,312 0,216 1,001
Feminin 0,115 0,357 0,312 0,216 1,000
TOllS 0,116 0,356 0,312 0,216 1,000
4. Note : la question devrait plutot referer au tableau 3.8. On obtient alors comme tableau des
distributions conditionnelles de X:
24
5. Distributions conditionnelles de la religion de l'epouse
Y: religion de l'epouse
X: religion de l'epoux Anglicane Baptiste Catholique Eglise Unie Total
Anglicane 0,421 0,039 0,329 0,211 1,000
Baptiste 0,120 0,510 0,216 0,154 1,000
Catholique 0,123 0,024 0,707 0,146 1,000
Eglise Unie 0,149 0,031 0,281 0,538 0,999
On voit bien que les distributions conditionnelles sont tres differentes les unes des autres.
Naissances Mortinaissances
vivantes
< 20 0,992 0,008
20-24 0,993 0,007
25-29 0,993 0,007
30-34 0,992 0,008
35-39 0,984 0,016
4044 0,976 0,024
~ 45 0,958 0,042
Naissances Mortinaissances
vivantes
< 20 0,115 0,120
20-24 0,332 0,287
25-29 0,356 0,317
30-34 0,144 0,153
35-39 0,042 0,088
40-44 0,010 0,031
~45 0,001 0,004
7. a) Pour chaque emplacement, determinons les distributions conditionnelles des ventes etant
donne l'emballage:
Emplacement
Ventes Niveau des yeux Niveau des
chevilles
Emballage Emballage
Bleu Rouge Bleu Rouge
Bonnes 0,4 0,9 0,2 0,2
Mauvaises 0,6 0,1 0,8 0,8
I,D 1,0 1,0 1,0
Lorsque Ie produit est place au niveau des yeux, l'emballage rouge attire les clients: 90% des
magasins ont de bonnes ventes lorsque l'emballage est rouge, compare a 40% pour les magasins
avec l'emballage bleu. Par contre, lorsque Ie produit est place au niveau des chevilles, 20%
25
des magasins ont de bonnes ventes, quelle que soit la couleur de l'emballage. En resume,
l'emballage a un effet sur les ventes, mais seulement quand le produit est au niveau des yeux.
b) Pour chaque couleur d 'emballage, voyons les distributions conditionnelles des ventes, etant
donne l'amplacement:
Couleur de l'emballage
Ventes Bleu Rouge
Emplacement Emplacement
Niveau Niveau Niveau Niveau
yeux chevilles yeux chevilles
Bonnes 0,4 0/2 0/9 0/2
Mauvaises 0/6 0/8 0/1 0/8
1/0 1/0 1/0 1/0
Lorsque l'emballage est bleu et lorsqu'il est rouge, l'emplacement a un effet sur les ventes.
Mais l'effet de l'emplacement est plus remarquable lorsque l'emballage est rouge: la
difference entre 0/9 et 0/2 est plus importante que celle entre 0,4 et 0/2 .
8. Pour chaque tableau on peut calculer le pourcentage de femmes bien rernunerees (avec un salaire
2: 30 000$) et le pourcentage d'hornmes bien rernuneres.
a) Les femmes sont favorisees dans les emplois techniques (80% sont bien rernunerees compare a
45% pour les hommes): elles sont defavorisees dans les emplois administratifs (57% pour les
femmes, 85% pour les hornmes). Lorsqu'on rassemble les deux tableaux, on constate que les
femmes ne sont ni favorisees ni defavorisees (67% pour les hommes et pour les femmes).
b) Les femmes sont favorisees et dans les emplois techniques et dans les emplois administratifs.
Globalement, elles ne sont ni favorisees, ni defavorisees.
c) Les femmes sont favorisees dans les deux categories, mais globalement elles sont defavorisees.
La raison est qu'elles sont faiblement represen tees dans les emplois administratifs ou les
salaires sont eleves,
Y: religion de l'epouse
X: religion de l'epoux Anglicane Baptiste Catholique Eglise Unie Total
Anglicane 2418/8 741/15 6420/61 3398/44 12979
Baptiste 742/65 227/56 1 971/35 1 043/44 3985
<;:a tholique 6232/34 1 909/65 16543/5 8 756/51 33442
Eglise Unie 3334/21 1 021/64 8 850/54 4 684/61 17891
Total 12728 3900 33786 17883 68297
x2 = 33 289. Cette valeur enorme est due en partie a la grande taille de l'echantillon et, bien
sur, a la tres forte dependance entre la religion de l'epoux et celle de l'epouse. Le tableau des
distributions conditionnelles donne au numero 5 expose clairement cette dependance. Le
pourcentage d'hommes qui ont epouse des anglicanes, par exemples, qui est de 42/1% pour les
hommes anglicans, baisse a 1,2% pour les hommes baptistes, a 12/3% pour les catholiques et a
14/9% pour les membres de l'Eglise Unie.
10. L'hypothese nulle est que Ie taux de mortinatalite est independant de l'age de la mere. Voici
le tableau des effectifs theoriques:
Age de la mere
<20 20-24 25-29 30-34 35-39 40-44 > 45
naissances 38638/3 111 291/23 119138/55 48 165,41 14252,47 3387/37 234/16
mortinaissances 303/7 874/77 936,45 378/59 112/03 26/63 1/84
26
11. Effectifs theoriques, calcules a partir des 5483 qui ont repondu.
Scolarite
Classe Elementaire Secondaire Collegial U niversi taire Total
ou moins
Superieure 256,4 207,9 92,6 32,1 589
Interrnediaire 741,8 601,4 267,9 92,9 1704
Inferieure 1388,8 1125,8 501,5 174 3190
Total 2387 1935 862 299 5483
x 2 = 863,1 , ce qui signifie qu'il y a sfirement une dependance entre la classe sociale et la scola
rite. Les distributions conditionnelles suivantes montrent bien que plus le niveau social est
eleve, plus Ie niveau de scolarite est eleve.
Scolarite
Classe Elementaire Secondaire Co~egial Universitaire
ou moins
Superieure 0,183 0~26 0,258 0,233 1
Interrnediaire 0,309 0~91 0,230 0,069 1
Inferieure 0,549 0,337 0,100 0,014 1
0,435 0,353 0,157 0,055 1
Classe
Niveau Superieure Interrnediaire Inferieure Total
Elementaire 0,078 0,281 0,642 1,001
Secondaire 0,107 0,309 0,584 1,000
Collegial 0,130 0,352 0,518 1,000
L'intention est sans doute de faire remarquer que, par exemple, on trouve proportionnellement
plus de personnes de classe superieure au collegial (13%) qu'au secondaire (10,7 %) ou a
I'elernentaire (7,8 %).
b) L'hypothese nulle: Ie phenornene «d ro p -ou t» ne touche pas les enfants d'une classe plus que
ceux d'une autre. Supposant cette hypothese vraie, la distribution des enfants selon la classe
sociale est la meme a tous les niveaux. Voici les effectifs theoriques:
Effectifs theoriques
Niveau Superieure In termediaire Inferieure Total
Elementaire 43,35 124,94 230,71 399
Secondaire 606,53 1747,9 3227,57 5582
Collegial 103)2 297,16 548,72 949
753 2170 4007 6930
x 2 = 22,62, avec 4 degres de liberte. Cela etant significatif, nous pouvons conclure que la
distribution de la classe sociale varie avec le niveau: en general, il y a relativement moins
d'eleves de la classe sociale inferieure aux niveaux eleves,
13. a) Le taux de renouvellement a ete de 21 749/(21 749+21 071) = 50,8 % en janvier et de 4733/(4
733+2 155) = 68,7% en fevrier. Done il y a une amelioration dans le taux de renouvellement.
27
b) Void les taux de renouvellement pour chaque categoric. Categoric A: janvier, 81/2%; fevrier,
79,6%. Categoric B: janvier, 78,9%; fevrier, 76%. Categoric C: janvier, 20,8%; fevrier,
14/1%. Dans chaque categorie il y a une baisse dans Ie taux de renouvellement alors que
globalement il y a eu une hausse. Cette hausse globale est due surtout a une diminution
disproportionnee d'abonnements dans la categoric C/ une categoric ou Ie taux de
renouvellement est particulierement bas.
x 2 = 43/7/ avec 2 degres de liberte. II y a done des differences entre les 3 groupes .
La valeur de X2 est 17/75/ avec 1 degre de liberte, ce qui est significa tif (point critique de
3/84). II Y a done une difference entre les deux groupes ethniques quant a la connaissance de
l'anglais. Les distributions conditionnelles suivantes montrent que ce sont les personnes
d 'origine ethnique anglaise qui Ie plus souvent connaissent l'anglais.
Origine ethnique
Francaise Anglaise
Unilingues 0/542 0,424
28
15. Il s'agit de trois tests d'independance bases sur les tableaux d'effectifs observes suivants:
Sa von A Groupe
Temoin Experimental
Achete 15 17 32
Pas achete 785 783 1568
800 800 1600
Cereales B Groupe
Temoin Experimental
Achete 31 44 75
Pas achete 769 756 1525
800 800 1600
A B C
16 16 37/5 37/5 18 18
784 784 762/5 762/5 782 782
Savon A : X2 = 0/128 avec 1 degre de liberte. Les annonces ne semblent pas avoir d'effet.
Cereales B : X2 = 2/36 avec 1 degre de liberte. Les annonces ne semblent pas avoir d'effet.
Orner congele C: x2 = 4/09/ avec 1 degre de liberte. Les annonces ont un effet: ceux qui voient les
annonces sont plus portes a acheter Ie diner congele,
La proportion d'acheteurs du produit a ete de 1/5% pour Ie groupe temoin et 3% pour Ie groupe
experimental. La difference entre les deux est petite et n'aurait pas ete trouvee significative
avec un echantillon plus petit. Par exemple, si ces memes proportions avaient ete observees
avec des echantillons de 600/ la valeur de X2 aurait ete X2 = 3/07/ ce qui n'est pas significatif.
16. Les test ici sont tous a 1 degre de liberte. Le point critique est done 3/84.
x2 = 2/85/ ce qui est non significatif. Le fait d'etre marie ou non n'est pas Iiee a la tendance a
lire les annonces publicitaires.
29
x2 = 3,09, ce qui est non significatif. La scolarite ne semble pas etre lie a la tendance a lire les
annonces publicitaires.
Sexe Les effectifs theoriques sont:
x2 =55,12, ce qui est tres significatif. Les distributions conditionnelles suivantes montrent que la
proportion de lecteurs est plus elevee parmi les hommes.
x2 = 0,453, ce qui est non significatif. Le pourcentage de lecteur est Ie merne, quelle que soit la
taille de la famille. Finalement, un seul facteur semble influencer la lecture des annonces: les
hommes ont plus tendance a les lire.
Score au SAT
Ma thema tiques Orientaux Blancs Total
700-800 455,86 22709,14 23165
600-690 1742,02 86779,98 88522
500-590 3173,01 158066 161239
400-490 3035,55 151218,4 154254
300-390 1491,8 74315,21 75807
200-290 198,76 9901,24 10100
10097 502990 513087
x2 = 130,4 » 11,07. On rejette l'hypothese. La conclusion est qu'il y a une dependance entre la
race et Ie score; ou que la distribution des scores des Orientaux est differente de celle des Blancs.
Les distributions conditionnelles suivantes permettent la conclusion que les Orientaux ont de
meilleurs scores.
30
Score au SAT
Ma thema tiques Orientaux
Blancs
700-800 0,05 0,05 0,05
600-690 0,20 0,17 0,17
500-590 0,32 0,31 0,31
400-490 0,28 0,30 0,30
300-390 0,13 0,15 0,15
200-290 0,01 0,02 0,02
1,00 1,00 1,00
18. Le nombre de degres de liberte est de 3 dans chaque cas. Le point critique est 7,815.
x2 = 34,46. Les distributions conditionnelles suivantes montrent que les fondamentalistes ont
davantage.tendance a favoriser le contr6le des livres dans les bibliotheques,
31
Zero Faible Fort Tres fort
D'accord 0,92 0,84 0,71 0,60 0,77
Pas d'accord 0,08 0,16 0,29 0,40 0,23
1,00 1,00 1,00 1,00 1,00
19. a) Le tableau des effectifs observes a partir duquella valeur de X2 est calculee est celui-ci:
Quebec Pays angl,
Bilingues 3098 132 3230
Unilingues 3770 32 3802
6868 164 7032
b) Effectifs observes:
Lieu de naissance
Quebec et pays Pays Autres pays
Francophones anglophones
Bilingues 3159 132 15 3306
Unilingue 3842 32 7 3881
7001 164 22 7187
Effectifs theoriques:
Lieu de naissance
Quebec et pays Pays Autres pays
Francophones anglophones
Bilingues 3220,4 75,4 10,1 3306
Unilingues 3780,6 88,6 11,9 3881
7001 164 22 7187
x2 = 85,21, a 2 degres de liberte. Le fait d'etre bilingue ou pas depend du lieu de naissance.
Les distributions conditionnelles suivantes donnent une indication de la nature de la
dependance:
Lieu de naissance
Quebec et pays Pays Autres pays
Francophones anglophones
Bilingues 0,451 0,805 0,682 0,46
Unilingues 0,549 0,195 0,318 0,54
1,000 1,000 1,000 1,00
32
x y
Y1 Y2
xl 0,75 0,25 1
x2 0,67 0,33 1
0,70 0,30 1
X Y
Y1 Y2
xl 30 10 40
x2 40 20 60
70 30 100
X Y
Y1 Y2
xl 28 12 40
x2 42 18 60
70 30 100
x2 = 0,79. Lorsque l'effectif total est 1000, chacun des effectifs des tableaux ci-dessus est
multiplie par 10, et la valeur de X2 egalement. Done lorsque l'effectif total est 1000, X2 =
7,9. La dependance relativement faible observee en a) peut etre attribuee au hasard lorsque
l'effectif est petit, mais elle est significative lorsque l'effectif est grand.
Effectifs theoriques:
33
b) Effectifs observes:
Scolarite du pere Statut du diplome
Travail Inactif
Secondaire ou moin 11160 591 11751
Plus que secondaire 3727 230 3957
14887 821 15708
x2 = 3,66 a 1 degre de Iiberte. Si l'on se limite a ceux qui ne sont pas aux etudes, on ne peut
pas conclure que le pourcentage d'inactifs depend de Ia scolarite du pere. II semble done que
le resultat significatif obtenu en a) ci-dessus reflete essentiellement le fait que Ie pourcentage
de diplomes aux etudes n'est pas Ie meme dans les deux cas.
Effectifs theoriques:
x2 == 3 717, a 3 degres de
liberte. 11 est evident que la tendance a epouser une coreligionnaire
depend de la religion de l'epoux. Ainsi 70% des catholiques le font, contre 42% pour les
anglicans.
x2 = 6,73 avec 1 degre de liberte. La proportion de femmes baptistes qui epousent des
coreligionnaires est superieure a 50%.
34
c) Homme catholique Homme baptiste
Femme baptiste Femme catholique
IEffectifs observes 806 861 I
IEffectifs theoriques 833,5 833,5 I
23. Les distributions conditionnelles de Y etant donne les va leurs de X sont donnees dans le tableau
suivant:
Y
X A B C Total
5-9 0,522 0,403 0,075 1,000
10-49 0,450 0,302 0,248 1,000
50+ 0,516 0,172 0,312 1,000
Les compagnies de toutes tailles ont des problemes de marche. Environ 50% ont ferme leurs
portes pour cette raison. Pour les petites compagnies, les problemes financiers sont serieux et les
problernes d'operation ne le sont pas. Pour les grandes compagnies, c'est le contraire. Le test
khi-deux poserait ici quelques problemes d'interpretation: de quelle population ces compagnies
sont-elles un echantillon?
24. L'hypothese est celle d' vindependance» entre les donnees de 74 et celles de 84, et done que le
comportement des hommes baptistes n'a pas change avec les annees, Les effectifs theoriques
sont:
x2 = 35,14 avec 1 degre de liberte. Les choses ont done change entre 1974 et 1984:
significativement moins d'hommes baptistes, en 1984, ont epouse des non coreligionnaires.
Occupation
Langue maternelle Aux etudes Au travail Inactif ou Total
au chomage
Francais 240,7 2503,8 142,5 2887
Anglais 1047,9 10902,6 620,5 12571
Autre 133,5 1388,S 79 1601
1422 14795 842 17059
x2 = 431,16 a 4 degres de liberte. Les distributions conditionnelles suivantes montrent que les
Francophones ont le plus grand pourcentage de diplomes aux etudes; les anglophones ont le
plus grand pourcentage de diplomes au travail; et les allophones ont le plus grand
pourcentage de diplomes inactifs ou au ch6mage.
Occupation
Langue matemelle Aux etudes Au travail Inactif ou
Total au chomage
Francais 0,155 0,795 0,050 . 1,000
Anglais 0,060 0,896 0,044 1,000
Autre 0,136 0,771 0,094 1,000
0,083 0,867 0,049 1,000
35
b) Effectifs observes:
Occupation
Langue maternelle Au travail Inactif ou Total
au chomage
Francais 2294 145 2439
Anglais 11267 547 11814
Autres 1234 150 1384
Tous 14795 842 15637
Effectifs theoriques:
Occupation
Langue maternelle Au travail Inactif ou Total
au chornage
Francais 2307,7 131,3 2439
Anglais 11177,9 636,1 11814
Autres 1309,5 74,5 1384
Tous 14795 842 15637
x2 = 95,498 a 2 degres de liberte. On rejette l'hypothese que le taux de chomage est le merne
pour les 3 groupes linguistiques.
Occupation
Langue maternelle Au travail Inactif ou Total
au chomage
Francais 0,941 0,059 1,000
Anglais 0,954 0,046 1,000
Autres 0,892 0,108 1,000
Tous 0,946 0,054 1,000
Premier-ne Cadet
Scientifique 51 62 113
Non scientifiqu 17 45 62
68 107 175
Effectifs theoriques:
Premier-ne Cadet
Scientifique 43,9 69,1 113
Non scientifiqu 24,1 37,9 62
68 107 175
Premier-ne Cadet
Scientifique 0,451 0,549 1,000
Non scientifique 0,274 0,726 1,000
0,389 0,611 1,000
36
Effectifs theoriques:
Catholiques
Effectifs observes:
Effectifs theoriques:
x2 = 4,76 a 4 degres de liberte. Chez les catholiques, l'attitude face a l'avortement n'est pas
Protestants
Effectifs observes:
37
Effectifs theoriques:
x2 = 16,82 a 4 degre de liberte. Puisque le point critique est 9,488 on conclut que l'attitude face a
l'avortement depend du niveau de scolarite: plus favorable parmi les plus scolarises,
Distributions conditionnelles:
Cancereux Sain
Bien dorrni 18 18 36
Mal dormi 12 6 18
30 24 54
Effectifs theoriques:
Cancereux Sain
Bien dormi 20 16 36
Mal dormi 10 8 18
30 24 54
x2 = 1,35 a 1 degre de liberte, Le cancer ne semble pas avoir d'effet sur le sommeil.
b) Effectifs observes:
Cardiaque Sain
Bien dorrni 5 18 23
Mal dorrni 22 6 28
27 24 51
Effectifs theoriques:
Cardiaque Sain
Bien dormi 12,2 10,8 23
Mal dormi 14,8 13,2 28
27 24 51
x2 = 16,4 a 1 degre de liberte. 11 y a done une dependance entre le fait d'etre cardiaque ou
pas et la tendance a mal dormir; les cardiaques dorment moins bien. Ce que l'on peut voir
par les distributions conditionnelles suivantes:
38
Cardiaque Sain
Bien dorrni 0,185 0,750 0,451
Mal dormi 0,815 0,250 0,549
1,000 1,000 1,000
29. a) X2 = 10,85, avec 2 degres de liberte. Les faiblement scola rises vont plus souvent au Quebec et
moins souvent a l'exterieur du continent.
b) Oui. Les faiblement scolarises ont generalement un revenu plus faible, et il est possible que
ce so it le revenu faible et non la scolarite faible qui explique pourquoi ils ont tendance a
rester au Quebec.
c) 11 faudrait prelever des donnees assez nombreuses pour pouvoir dresser un tableau comme
celui qui est donne dans l'exercice, pour chaque niveau de revenu; et un tableau qui montre le
lien entre la direction prise et le revenu, pour chaque niveau de scolarite, Void des tableaux
fictifs qui illustrent ce phenomene:
Revenus faibles:
Direction prise
americain
Revenus eleves:
Direction prise
america in
Lorsqu'on rassemble les deux tableaux on trouve qu 'il y a une dependance entre la scola rite et
la direction prise.
Effectifs theoriques:
x2 = 2,192 7, avec 1 degre de liberte. 11 n'y a pas d'evidence que la repartition des sexes dans
cette secte est differente de ceile de la population.
Test d 'ajustement. Ce test est base sur le fait que la proportion de gan;ons dans la population
generale est 179781/348 862 = 0,515 336. On teste alors l'hypothese que la probabilite d'avoir
un gar<;on parmis les gens de cette secte est 0,515 336. On obtient done les effectifs suivants:
39
Garcons Filles
Effectifs observes 31 19 50
Effectifs theoriques 25,766778 24,233222 50
x2 = 2,192 99, avec 1 degre de liberte. Ce deuxieme test n'est pas strictement correct, car il
considere les 348 862 naissances comme la population a laquelle on veut comparer les membres de
la secte religieuse. Or malgre sa taille, cet ensemble de naissances n'est qu'un echantillon, issu
d'une population assez vague dont la definition pourrait etre celie-ci: c'est l'ensemble de toutes
les naissances possibles dans une population qui ne se livre pas aux pratiques sexuelles de cette
secte. Le test d'independance effectue plus haut traite le 348 862 naissances comme un
echantillon.
31. a) Cette procedure teste correctement l'hypothese qu'Arthur a une chance sur 2 de faire une
bonne prediction. La conclusion du test est qu'Arthur a plus d'une chance sur 2 de faire une
bonne prediction. Mais il est incorrect de conclure de la qu'il a des capacites particulieres de
prevision du temps. Son taux eleve de succes vient du fait qu'il a tendance a predire de la
pluie souvent et qu'il vit dans un pays ou il pleut souvent.
x2 = 1,5. n pleut aussi souvent lorsqu'Arthur predit de la pluie que lorsqu'il predit du beau
temps.
32. Des 300 scientifiques appartenant a des families de 2 enfants, la moitie, soit 150, devraient etre
prerniers-nes: des 60 appartenant a des familles de 3 enfants, 20 devraient etre premiers-nee.
Done le nombre de premiers-nes parmi les 360 scientifiques est theoriquement 150 + 20 = 170. Par
un raisonnement semblable, le nombre de premiers-nee parmi les 360 non scientifiques est
theoriquement 30 + 100 = 130.
33. a) L'enonce formel du problerne traite au nurnero 17 est le suivant: on dispose d'un echantillon de
chacune de deux populations (les Orientaux et les Blancs), et on veut tester l'hypothese que
la distribution d 'une certaine variable (Ie score au SAT) est la meme dans les deux
populations. C'est le test d'independance qui s'applique et qui est utilise correctement au
numero 17. Le test decrit dans ce numero et traite au chapitre 1, s'emploie dans les
circonstances suivantes: on dispose d'un echantillon issu d'une certaine population (un
echantillon d'Orientaux issu d'une population d'Orientaux) et on veut tester l'hypothese que
la distribution dans la population est donnee par certaines frequences I}, 12 ,.··, 16 (en
l'occurence, 0,045, 0,172,..., 0,020). Le test decrit ici ne s'applique done que si ces frequences
sont vraiment celles auxquelles on veut comparer celles des Orientaux. Mais ce n'est pas le
cas, car on ne veut pas comparer les frequences des Orientaux a celles des seuls 502990 Blancs:
on veut les comparer aux frequences reelles des Blancs de la population, et celles-ci ne sont pas
connues. Elles sont esiimees par les frequences observees dans l'echantillon.
b) Scores
700-800 600-690 500-590 400-490 300-390 200-290
Effectifs observes 601 2001 3190 2788 1309 208 10 097
Effectifstheoriques 454,4 1736,7 3170,5 3039,2 1494,4 201,9 10097,1
40
supposee connue. Au numero 17, nous comparons a une distribution qui doit etre estimee. Mais
l'echantillon des Blancs etant tres grand, la distribution estimee est tres proche de la
distribution reelle et les deux procedures sont alors tres semblables.
34. a) C'est un test d'independance sur l'ensemble des donnees. Les effectifs theoriques sont:
boivent habituellement
ont prefere A B
A 55 55 I 110
B 45 45 I 90
Ont prefere
A B
Effectifs observes 45 55
Effectifs theoriques 50 50
Ont prefere
A B
Effectifs observes 65 35
Effectifs theoriques 50 50
d) Test d'independance pour les buveurs des deux marques de biere quant a leur capacite a
discriminer. Voici le tableau des effectifs.
Boivent habituellement
A B
discriminent Effectifs observes 65 55 120
Effectifs theoriques 60 60
ne discriminent pas Effectifs observes 35 45 80
Effectifs theoriques 40 40
x2 = 2,083 3, avec 1 degre de Iiberte: il n'y a pas de difference significative entre les buveurs
de A et ceux de B.
41
CHAPITRE 4
1.
14
12 • Onan=4
10 +- Dzoite des
Xl =2 Y1 =5
moindzes
i 8 • canes x2 =3 Y2 =8
y • x3=5 Y3=7
~ 6 x4=7 Y4 =12
•
o
o 2 4 6 8 10
'-X--+
1
_ _ 32 17
En utilisant la droite des moindres carres, on trouve Y1 = 5,407, Y2= 6,559, Y3= 8,864 et
Y4= 11,169. On a done 0 = (0,407)2 + 0 ,441)2 + 0 ,864)2 + (0,831)2 = 6,41.
2. 2
n = 4, LXi = 25, LYi = 40, LXi = 211, LXiYi = 211.
(4 x 211) - (25 x 40) -156 _ _
b 2 = 219 = -0,712. a = Y - b x = 10 - (-0,712 x 6,25) = 14,45.
(4 x 211) - 25
42
15
•
10
i
y
1 5
o
o 5 10 15
+- to( -+
4. Lorsqu'il n'y a que deux points (avec xl ~ x2)' on peut toujours faire passer une droite exactement
par ces deux points. On trouvera alors 0 = 0 puisque les deux points sont exactement situes sur la
droite. Si xl = x2' la droite de regression n'est pas definie (la pente est arbitraire).
5. n = 6, LXi = 21, LYi = 77, LXi2 = 91, LXiYi = 320, Y = 2,733 + 2,886x.
A A A A A A
Y1 = 5,62, Y2= 8,50, Y3 = 11,39, Y4 = 14,28, Y5 = 17,16 et Y6 = 20,05.
L(Yi - Yi) = 0,38 + 0,50 - 1,39 + 0,72 - 1,16 + 0,95 = 0
6. a)
6
i 3
Y
12
1
0
0 1 2 3 4 5 6
+-- to( --+
b) n = 10, LXi = 27, LYi = 43,5, LX~ = 95,5, LXiYi = 128,75. b = 0,5, a = 3.
Y = 3 + 0,5x. 0 = 0 (les points sont exactement alignes le long de la droite).
c) L'equation Y = 3 + 0,5x correspond a la structure tarifaire typique des taxis: un montant fixe,
plus tant du kilometre. lei le montant fixe est $3 et le taux par kilometre est de $0,50/km.
43
7. On n'obtient pas la meme droite en general. La droite des moindres carres minimise la somrnes
des carres des distances verticales IYi - }\ I; l'ecart IYi - YiI represente l'erreur comrnise lorsqu'on
estime Yi par Yi. Si on interchange X et Y on se trouve a minimiser la somme des carres des
distances horizontales, c'est-a-dire, les erreurs commises en estimant X a partir de Y. Dans
l'exercice 1/ on avait obtenu la droite de regression Y = 3/102 + 1/1525x. La somme des carres des
ecarts verticaux etait 6,41. Si on reprend les calculs en remplacant les x par les Y et les Y par les x,
on obtiendra la nouvelle droite de regression x = -0/981 + 0/6538y. Avec cette nouvelle droite, la
somrne des carres des ecarts horizontaux est minimisee et vaut 3/63. C'est ce type de regression qu'il
conviendrait de faire si on voulait exprimer x en fonction de Y (plutot que yen fonction de x).
14
dxoite qui
12
minimise les
ecaxts +--- dx.oi.te 9,ui
10
mmrrruse Remarquons que les deux droites
horizontaux
les ecaxts
de regression se rencontrent au
i 8 verticaux «centre de gravite- du nuage de
Y • points, c'est-a-dire, precisement
16 au point (x/y) = (4/25;8).
o
o 2 4 6 8 10
+- N-+
8. Y = -7/10 + 1/13 (5) = -1,45. Une note negative ne peut pas etre consid eree comme une estimation
raisonnable. Le modele que nous avons adopte, qui suppose que Y est lie a X par une equation
lineaire, n'est pas correct a. l'exterieur d'un certain intervalle des valeurs de X.
20 •
•
•
15
t
y 10
1
5
o
10 15 20 25 30
+- N -+
9. n = 4/ LXi = 25/ LXf = 211/ LYi = 40/ LY~ = 430/ LXiYi = 211.
(4 x 211) - (25 x 40)
r= -0/962.
44
Une telle valeur de r, voisine de -1, indique un alignement tres net le long d'une droite de pente
negative (voir graphique presente dans la solution de l'exercice 2).
10. Le coefficient de correlation vaut +1 ou -1 car la droite des moindres carres passera exactement
par les deux points. Si les deux points ont la meme valeur pour x (alignement vertical) ou la
rneme valeur pour Y (alignement horizontal), Ie coefficient de correlation n'est pas defini: la
formule mene a une indetermination 0/0.
11. Puisque tous les points sont exactement alignes le long d'une droite de pente positive, le
coefficient de correlation vaut 1.
12. n = 11, LXi = 55, LX~ = 385, LYi = 142, LY~ = 2 284, LXiYi = 710, r = o.
30
25
20
i • •
y 15 • •
1
10 • •
5
• •
•
0 2 4 6 8 10 12
+- >ol --+
Les variables X et Y sont visiblement depend antes. Cette dependance n'est cependant pas
lineaire (on a une relation en V). Le coefficient de correlation vaut zero.
En remplacant toutes les valeurs de x par 2 + 4x et toutes les valeurs de Y par 30 + 2y, on obtient
le nouveau tableau suivant:
~
On a done n = 4, LXi = 108, LX~ = 3 792, LYi = 200, LY~ = 10 120, LXiYi = 5 088, r = -0,962.
En remplacant to utes les valeurs de x par 2 + 4x et toutes les valeurs de Y par 30 - 2y, on obtient
2 2
On a done n = 4, LXi = 108, LXi = 3 792, LYi = 40, LYi = 520, LXiYi = 1 392, r = 0,962.
En general, si on remplace tous les x par a + bx et tous les Y par c + dy, la valeur absolue du
coefficient de correlation ne sera pas rnodifiee. Seul son signe sera change si l'un ou l'autre des
nombres b et d est negatif, Si les deux constantes b et d sont negatives, le nouveau coefficient de
correlation sera exactement le meme que le premier.
45
14. Si on echange X et Y dans la formule, on obtient la merne formule. Done le coefficient d e correlation
ne change pas.
:~::r~:l~::~r·=·:
··..·..··T·····..·T"·······T······..·
o
o 1 2 3 4
r::·-:r·:·1::I ::
O+--j---;---r--,.
o 1 2 3 4
+- N -+
L'echantillon {O,I), (2,2), (3,1») donnera r =0 3
i 2 ..........~: :
~
:
.
y
~ 1
··tl--r
o +--j----;---+--,
o 1 2 3 4
46
16. Les variables sont consid erees reellement dependantes si IZ I > 2 ou Z = ~~
2
" 1-r
On n e peut declarer que les variables sont dependantes que dans les cas d) et D.
17 . a) Si n = 5, on a Z = 0,76 (I Z I < 2) .
b) Si n = IS, on a Z = 1,57 (I Z I < 2)
c) Si n = 20, on a Z = 1,85 (I Z I < 2)
d) Si n = 30, on a Z = 2,31 > 2) (I Z I
Seulement dans le dernier cas peut-on conclure que les variables sont reellement dependantes.
18. a) Puisque c'est la scolarite qui peut avoir une influence sur les habitudes de lecture, et non
l'inverse, nous prenons X = scolarite et Y = nombre de revues ou livres.
b)
1:~ •
i 6 •
r 4
•
2 •
•
0
6 8 10 12 14 16 18 20
+- N -+
n = 17, ~xi = 231, ~xf = 3 331, ~Yi = 80, ~yf = 458, ~xiYi = 1200, r = 0,902.
(17 xl 200) - (231 x 80) 80 231
c) b= (17 x 3 331) _ (231 x 231) =0,588. a = 17 - 0,558 x ""17= -3,28.
La droite de regression est Y = -3,28 + O,588x.
d) Z
__ ...In-2 r __ m 0.902
---;:====:....;:~ 8,09, ce qui est tres significatif.
£2 .y 1 - (0.902)2
Nous concluons que le nombre de revues et livres Ius depend de la scolarite.
47
19. a)
15
o
o
13
<>
o
o
i <>
... lO1. te d
"d ' . n
e :.:egtess1Cf
Y 11 point --+ o <>
(voiz b)
double
L §
9
/
o +-- point triple
7
1 2 3 4 5 6
+- N -+
48
20. a)
9
•
•• / droi te. de 1egtessicm
i
y 8 •
!
,/ point double
•
•
• •
7
140 160 180 200 220 240 260
+- N -+
r = -0,884
b) Y = 10,99 - 0)7x.
2l. a)
1200
1000
d:oite~e - ,
1egtesslcm
i 800
y
! 600
400
200
OA 0,6 0,8 1,0 1,2 lA
+ N-+
n = 12, LXi = 10,12, Lxf = 9,317 8, LYi = 6 500, Lyf = 4 118 ISO, LXiYi = 6 164A5, r = 0,9982
b) Y = -193A8 + 871,71x
1\
c) Avec x = 1,00, on trouve Y = -193A8 + 871,71 x 1,00 = 678,23.
49
22. a)
320
•
300
•
•
280
•
260
i
y
240
•
•
•
~ droi te de legtession
1 220 •»:
•• ••
200 •
180
160
•
140
70 80 90 100 110 120 130 140 150
+- N ---+
r = 0,6240
b) y = -2,32 + 2,255x
1\
c) Avec x = 118, Y = -2,32 + 2,255 (118) = 263,8
23, a)
320
droite de •
300 '~~."i:" ~ :
i •
y 280 • •
•
1
•
260 • •
•
•
240 -t-----,----.--...,...----,--.....,..--r---,--..,..-----,--,--..----.-.....,..---,r
40 50 60 70 80 90 100 110
+- N ---+
r =0,737
b) y = 217,47 + O,777x
c) Z ~ r-;:)=
=_ n-2 r 4, 37, ce qUI' est tres , ificati'f"
. slgm II sembl e bilen yavOlr
" deepend ance en tr e Ie pOlid S e t
'J 1-r2
le taux de cholesterol.
50
24.
500
a) r = 0,897; Z = 10,76. 11 semble y avoir une forte correlation entre l'aptitude verbale et les
ventes.
b) Pour chaque groupe, le coefficient de correlation est nul. 11 ne semble done pas y avoir de
relation de cause a effet entre l'aptitude verbale et les ventes. Mais l'age a une influence sur
l'aptitude verbale et, parce qu'il a une relation avec l'anciennete, il a aussi une influence sur
les ventes. C'est cette influence de l'age sur l'aptitude verbale et sur les ventes qui fait que
ces deux dernieres variables sont liees,
25.
90
80
• •• •
i 70
y •
1 • •
60
50
40
40
.: 50
•
••
60 70
•
80 90 100
+- x ---+
La droite des moindres carres est y = -14,1 + l,31x pour le groupe A et y = -29,3 + l,23x pour le
~roupe B. Considerons un etudiant moyen avec une note X = 70. Sa note en calcul est estimee par
y = -14,1 + 1,31 x 70 = 77,6 s'il a suivi le cours de rattrapage, et par y = -29,3 + 1,23 x 70 =
56,8 s'il n'a pas suivi le cours de rattrapage. On s'attend donc a ce qu'il ait une meilleure note
51
26.
100
•
---.
..... 90 •
•
....,..
Q.I
.<:11 •
.....
lii i 80 •
.S
...... y
..... 1
<:II
Q.I
..... 70 •
liis;:l.t
-
-Q.I
'""CI
60 •
50
0 100 200 300 400 500 600
+- N ---+ (lev-enU)
a) r:=: 0,669 6
b) Y :=: 65,73 + O,0668x. $65,73 devrait etre a peu pres Ie minimum que depenserait toute famille,
quel que soit son revenu. Apres ce minimum, elles depensent 6,68% de leurs revenus pour la
nourriture.
c) (i) y:=: 65,73 + 0,0668 x 150 :=: 75,75.
(ii) y:=: 65,73 + 0,0668 x 500:=: 99,13.
d) (i) $46,31; (ii) $ 154,36. Les families ne depensent pas une proportion fixe de leurs revenus pour
la nourriture, Les families riches consacrent a la nourriture une moins grande proportion de leurs
revenus que la families pauvres.
e) Si Ie revenu est $5 000, la droite de regression donne y:=: 65,73 + 0,066 8 x 5000 :=: 399,73, ce qui est
excessif. La droite de regression fournit un modele acceptable seulement pour un certain
intervalle de valeurs de x.
f) Z:=: 3,25, ce qui est significatif. On peut done affirmer qu'il y a dependance entre les variables x
(revenu) et y (depenses alimentaires).
29. a) Le graphique suivant montre une certaine courbure dans le nuage de points
52
0,1 N uage de points pow Xvs y
0,09
0,08
•• •
0,07
Y 0,06
••••
0,05
• •• • ••• •
0,04
0,03
0,02
0,01
•••
o
0 1 2 ..' 4 5 6 7 8 9
b) b' et a' sont calcules par les formules usuelles en rernplacant Yi par log Yi
n ~ xi log Yi - ~ xi ~ log Yi 18( -305. 98) - (85.5)(-59.195)
b' ~ - '=t. '=t. = -02048
'" 2 (2) 18(527.25) - (85.5)2 '
nL.J\ - LXi
et
1 n - -59.195 855
i = 1
e) a = e = e- 2,315 8 = 0,098 7, b = - b' = 0,204 8. L'equation est done Y = 0,098 7 e-0,2048x.
a'
d) Y = O,0987e-O,204 8(2,25) = 0,062.
Ix-y
30 . Dans la formule b =-T ' nous remplacons xi et Yi par log xi et log Yi, respeetivement:
Ix.1
b
I log xi log Yi =--=2,3938
18.037
I (log Xi)2 7.535
Voici Ie graphique du nuage de points et de la fonetion Y =x b = x2,393 9:
0,9 Lenuage et la fonction ajusb~e
0,8
••
0.. 7
0,6
•••
••
Y 0,5
0,4
0,3
0,2
0,1
o +-<==--_-+__4____4-~ _ _-+__4____4-+___I____4___1
53
x2 = 0/436)[22 x (22) + 28 x (62) + ... + 25 x (302)] = 139080/436 = 318,991;
-- --
xy - x y 0 282,344 - 05,752)(77,353))
b x2 - x 2 = (318,991-15,7522) = 0,901
33. Ce qu'il y a a noter ici, c'est que si on elimine tous ceux qui ont un score inferieur a 50, on se
retrouve avec Ie nuage que l'on voit encadre dans le graphique ci-dessous:
Moyenne
100
90
80 ••
•• .
....
•
•
• •••
•••
70
• • •• • • L..- ...J
60 • • ••• •
50 • • •
• • •
40
30
."• • • •
20 •
0 10 20 30 40 50 60 70
Resultat
Il n'est pas necessaire d 'effectuer des calculs pour voir que la correlation basee sur le groupe
54
selectionne est beaucoup plus faible que celie basee sur l'ensemble des candidats.
34. Le graphique suivant montre pourquoi la correlation s'estompe lorsqu'elie est calculee globale
ment:
65 • Petite
60
55 Classe oUVliele
• bourgeoisie 0
0 0
Classe dizigeante
•
111
~
.....
50
•
..... 45 • •
... o:lI
-111
40
• 0 0
,...Cl
~
35 ••
30 • 0
25 • 0
••
20 • 0 0 0
• •
15
4 6 8 10 12 14
•16 18 20 22
Scolazite
35. a) Pour les femmes, y = 5,17; pour les hommes, y = 5,82, une difference de $650, plus petite
que pour les moyennes non ajustees. Done merne si l'on tient compte de leur niveau de
scolarite inferieur, les femmes demeurent moins bien payees.
b) Pour les femmes, y =5,12; pour les hommes, y =6,00; une difference de $800, plus grande que
la difference de 818 entre les moyennes non ajustees, Si les femmes n'avaient pas eu
l'avantage d'avoir ete engagees plus tard, elles auraient eu un salaire inferieur de $880 a
celui des hommes.
c) Pour les femmes, y = 4,927 + 0,002 1(100,93) = 5,14; pour les hommes, on peut s'en tenir a la
moyenne non ajustees de 5,96, ou calculer y
= 5,964 - 0,000 1(100,93) = 5,95. Tout porte a
croire que l'experience ne joue pas un role important dans la determination du salaire initial
des hommes.
d) La droite de regression pour les femmes est plus elevee que pour les hommes a gauche du
point x = 3,74 . On ne doit pas attribuer trop de signification a la droite de regression des
valeurs de x trop eloignees de celles qu'on trouve dans I'echantillon. Done, il demeure vrai
que pour une scolarite donnee, les hommes sont mieux payes que les femmes.
e) Pour les femmes, y = 5,16; pour les hommes, 5,86. Si les femmes et les hommes avaient eu
une scolarite moyenne de 12,51 et une date d'engagement de 16,72, leurs salaires moyens
auraient ete de $5 160 et $5 860 respectivement. La difference de $700 ne peut etre expliquee
ni par la difference de scolarite ni par la date d'engagement.
55
CHAPITRE 5
1. a) Q = {pppp, pppf, ppfp, pfpp, fppp, ppff, pfpf, pffp, fppf, fpfp, ffpp, pfff, fpff, ffp£, fffp,
ffff}.
b) Q = {Liberal, Conservateur, NPD, autre reponse ou pas de reponse] .
c) Q = L'ensemble des nombres reels dans un intervalle raisonnable, par exemple, tous les
nombres reels entre -30 et 45.
d) L'ensemble decrit en a) pourrait convenir.
e ) La somme des trois resultats est un entier qui peut aller de 3, lorsque les trois des donnent
«1», a 18, lorsque les trois des donnent «6». Done Q = {3,4,5,6,7,8,9,lO,ll,12,13,14,15,16,17,18}.
f) Le nombre de pneus defectueux dans un echantillon de 10 pneus peut etre 0,1, ..., ou 10. Donc
Q = {O,l,2,3,4,5,6,7,8,9,lO}.
g) Q = {Urbain, Rural] . L'espace echantillon peut etre plus detaille, Par exemple, on pourrait
distinguer plusieurs sons-categories de I'<Urbain», selon l'importance de l'agglomeration.
2. a) (i) La personne choisie est en faveur de la peine de mort pour le meurtre d'un policier mais
pas pour tout meurtre.
(i i) La personne choisie est en faveur de la peine de mort pour le meurtre d 'un policier, ou
elle est en faveur de la peine de mort pour un meurtre cornrnis par un detenu en prison.
(iii) 0 U E = Q, car toute personne est soit dans E soit dans 0 ou bien elle est en faveur de
l'abolition de la peine de mort (E), ou bien elle favorise la peine de mort pour certains
crimes (D).
(iv) A n E = f. l'evenement impossible: si on est pour l'abolition de la peine de mort (E), on
n 'est pas en faveur de la peine de mort pour Ie meurtre d'un policier (A).
b) C C A: si on est en faveur de la peine de mort pour tout meurtre (C) alors on est en faveur de
la peine de mort pour le meurtre d'un policier.
3. a) Non, La balle de golf etant plus grande qu'une bille, on a surement Pfb) > P(j) = Ptv).
b) (i) Vraie: seule la couleur distingue les boules verte et jaune, et la couleur ne peut pas
, influencer la probabilite de tirage.
(i1) Si P(b) = I, ceci signifie que seule la balle de golf peut etre tiree, Si le mode de tirage
/ consiste a plonger la main dans le sac et saisir le premier objet touche, alors il est tout a
,. fait possible de toucher sur l'une des deux billes.
(iii) Necessairement vrai, puisque v, j et b constituent l'ensemble de tous les resultats de
r experience.
(i v ) Faux.
(v) Faux: comme on l'a dit en a), Ptv) < Pfb).
(vi) Necessairernent vrai, si on admet que Ptv) = P(j).
4. a) et b) sont inacceptables parce que la somme des probabilites de tous les resultats n'est pas
egale a 1; d) est inacceptable car l'une des probabilites est negative; c) est acceptable.
6. a) Puisque P(A U B) = P(A) + P(B) - P(A n B), on a P(A n B) = P(A) + P(B) - P(A U B) =
56
6. a) Puisque P(A U B) = P(A) + P(B) - P(A n B), on a P(A n B) = P(A) + P(B) - P(A U B) =
0,3 + a,s - 0,7 = 0,1.
b) Par la loi de De Morgan, AC U BC = (A n B)". Done P(AC U BC) = P(A U B)C =
c) P(B n A C) = P(B - A) = P(B) - P(B n A) par la loi 5, page 99. Done P(B n A C) = a,s - 0,1 =
0,4.
9. a) A et B sont incompatibles; ils ne sont pas independents: et aucun n'est contenu dans l'autre.
b) A et B sont incompatibles; ils ne sont pas independants: et aucun n'est contenu dans l'autre,
c) A et B ne sont pas incompatibles; ils ne sont pas independants: et A C B.
d) A et B ne sont pas incompatibles; ils sont presque certainement independants: aucun n'est
compris dans l'autre.
e) A et B ne sont pas incompatibles; ils ne sont pas independants: et A C B.
f) B = <1>. Done A et B sont incompatibles, puisque A n B =A n <I> = <1>; ils sont independents,
puisque P(A n B) = P(<I» = a et P(A)P(B) = P(A)P(<I» = P(A) x a = a, done P(A n B) =
P(A)P(B); et bien sur B C A, puisque l'ensemble vide est sous-ensemble de tout ensemble.
12. a) X = nombre de billes rouges. Les valeurs de X sont a et 1. Ou Y = nombre de billes vertes.
Les va leurs de Y sont a et 1.
57
b) X = nombre de billes rouges, X = 0,1,2,3. Y = nombre de billes vertes, Y = 0,1,2,3.
c) X = nombre de femmes dans le comite, X = 0,1,2,3,4. Y = Ie nombre d'hommes dans le comite,
Y = 0,1,2,3,4 .
d) X = la note de l'etudiant. L'ensemble des valeurs possibles de X est l'ensemble des notes des
etudiants de la classe. Y = la taille de l'etudiant. L'ensemble des valeurs possibles de Y est
l'ensemble de toutes les tailles des eleves de la classe.
13. La correspondance entre les elements de W et les valeurs de X est donnee dans le tableau
suivant:
Element de Q x Element de Q X
pppp / o pfff .
fpff 3
pppf '" ffpf
ppfp / 1 fffp
pfpp / /
fppp fHf / 4
ppff l /
pfpf /
pffp 2
fppf
fpfp /
ffPP v
La probabilite de chaque element de Q est 1/16. Donc P(X = 0) = P({pppp)) = 1/16. P(X = 1) =
P({pppf, ppfp, pfpp, fppp)) = 4/16 = 1/4, etc .
4
1/16
o 1 2 3 4
5 - 4 = 1. Remarquez qu'on obtient les memes reponses avec E(X) = 4 P = 40/2) = 2 et Var(X) =
npq = 40/2)(1/2) = 1.
58
_ 2 _2_ 2 998_
Var(X) - 000 - 0,2) x 1000 + (0 - 0,2) x 1000 - 19,96
15.
a) Si X est le gain d'un invite, alors
1 1 998
E(X) = 1000 x 1000 + 100 x 1000 + 0 x 1000 = 1,10$,
Var(X) - (1000 - 1,1) x 1000 + 000 - 1,1) x 1000 + (0 1,1) x 1000 - 1008,79.
b) Si X est le gain d'un couple d'invites, alors
E(X) = EO er invite) + E(2 e invite) = 2,20$,
2 2 2 998 2 998
Var(X) = 0100 - 2,2) x 999000 + (1000 - 2,2) x 999000 x 2 + 000 - 2,2) x 999000 x 2 +
2 995006
(0 - 2,2) x 999000 2015,56.
16. Supposons que P(2) = P(3) = P(4) = P(5) = P(6) = P: Alors PO) = 3p. La somme des probabilites
des six resultats est 3p + P + P + P + P + P = 8p. Puisque cette somme doit etre egale a 1, on
deduit que p = 1/8. Done PO) = 3/8 et la probabilite de chacun des autres resultats est 1/8.
a) P(un nombre < 4) = PO) + P(2) + P(3) = 3/8 + 1/8 + 1/8 = 5/8
b) Votre gain net X prend la valeur 5 avec probabilite 3/8 et -1 avec probabilite 5/8, E(X) =
5(3/8) - 1(5/8) = 10/8 = $ 1,25.
17. a) i ) E(8X+9Y)=8x30+9x40=600$;
Var(8X + 9Y) = Var(8X) + Var(9Y)
= 64 Var(X) + 81 Var(Y)
= 2896.
i i ) E02X + 6Y) = 600
Var02X + 6Y) = 4176
Xl + X2 E(X1) + E(X2) 1
18. X = 2 ' done E(X) = 2 »
= 1,50$, et Var(X) = 4" (Var(X 1) + Var(X 2 = 50. Vous
et votre ami avez chacun la merne esperance de gain qu'en jouant independamrnent, mais avec
une variance moindre (50 versus 100).
19. Ces probabilites entrainent une contradiction. D'une part, par I'incornpatibilite, on a P(A U B)
= P(A) + P(B) = 0,4 + 0,3 = 0,7. D'autre part P(AC nBC) = P(A U B)C par la loi de De Morgan,
et P(AC nBC) = 0,2 fi P(A U B)C = 0,2 fi P(A U B) = 0,8 -j:. 0,7. Remarquez qu'il y aurait
contradiction, merne sans l'hypothese de l'incompatibilite, puisque P(A U B) :=; P(A) + P(B) =
0,7, contredit P(A U B) = 0,8
a) X prend les valeurs 1, 2 et 3 avec probabilites 0,4, 0,2 et 0,4. Done E(X) = 1(0,4) + 2(0,2) +
3(0,4) = 2
59
b) La fonct!-0n de masse de Y est identique a celle de X, mais un developpernent comme Ie tableau
ci-dessus est necessaire pour le demontrer, On a P(Y = 1) = P({(1,I), (2,1), (3,1)}) = 1/10 + 1/10 +
2/10 = 4/10; de rneme P(Y = 2) = 1/10 + 1/10 = 2/10; et P(Y = 3) = 2/10 + 1/10 + 1/10 = 4/10. Nous
avons que E(Y) = 2.
c) Nous pouvons utiliser la propriete 3, p.151; E(X + Y) = E(X) + E(Y) = 2 + 2 = 4. au bien nous
pouvons developper la fonction de masse de Y et appliquer la definition desperance
mathernatique. La fonction de masse de Z = X + Y est:
= 1 - (:~O)O = 0,2603.
22. P (Louis Lacasse brise 5 assiettes de suite) = (~J - 0,004, ce qui est tres petit. La part du hasard
. 3 . 1
23. P (beau JOur) = 4' P (pluie) = 4'
60
1 5
. 27. Votre gain net X prend les va leurs K et -2 avec les probabilites respectives 6'et 6" Done E(X) =
1 5 k 10
= 0 => 6= ~ done K = 10$.
= K(6') - 2(6') et la condition E(X)
28. a) P(AC n C) = P(C - A) = P(c) - P(A n C) = P(C) - P(A)P(c) = 1/5 - 0/3)0/5) = 2/15
b) P(A U CC) = P(A) + P(CC) - P(A n CC) = P(A) + P(CC) - (P(A) - P(A n C» = P(CC) + P(A n C) =
P(CC) + P(A)P(C) = (4/5) + 0/3)0/5) = 13/15.
n X Probabillte
N 1 (2/5) = 2/5
BN 2 (3/5)(2/4) = 3/10
BBN 3 (3/5)(2/4)(2/3) = 1/5
BBBN 4 (3/5)(2/4)0/3)(2/2) = 1/10
61
.32. Si X est Ie poids total de 14 personnes de poids respectifs Xl' ..., Xl 4' alors
E(X) = 1: E(Xi) = 14 x 64 = 896,
Var(X) = 1: Var(Xi) = 14 x 144 = 2016, done 1:x = ,]2016
34 . Si X est le poids des 6 oeufs dans un des deux plateaux, et Y le poids des 6 oeufs dans l'autre, alors
E(X) = E(Y) = 336; Varix) = VarfY) = 120, et E(X -Y) = 0; VariX - Y) = 240.
35. Si X est le gain net (par client), la fonction de masse de X est la suivante
x 25 -775
0,98 0,02
x
p(x)
50
0,98
-1550
0,02
I
et E(X) = 18$,
Var(X) = (50 -18)2 0,98 + (-1550 - 18)2 0,02
=50176.
36. Si l'on designe par A la valeur de la prime et par C le cout d'annulation, alors la fonction de masse
du gain net (profit) X est
X A -C+A I
p(X) 0,98 0,02
Donc E(X) = A - 0,02 C. Ce profit devant representer 30% de la prime, on obtient l'equation
0.02
A - 0,02 C = 0,3 A. Done A = 0.7 C = 2,857% de C.
37. Si l'on designe par A (resp, B,C) Ie fait que Ie 1er juge (resp. le 2e, le 3e) prenne la bonne decision,
alors la probabilite que Ie jury prenne Ia bonne decision (au moins deux juges sur trois) correspond a:
1 1 1 1
= _2 x - + pO - p) x - + pO - p) x - + p2 x
p- 2 222
= p2 + 0 - p) p = P:
62