Vous êtes sur la page 1sur 62

CHAPITRE 1

1. a) La superficie des lacs du Canada est une variable quantitative puisque, ayant convenu des
unites (par exemple, en km 2 ), elle s'exprime au moyen d'un nombre. Cette variable est
continue car, du moins en theorie, on peut la mesurer avec autant de decimales desirees.
b) Le pays d'origine des immigrants est une variable qualitative car les valeurs qu'elle peut
prendre (Ita lie, [aport, etc.) ne sont pas des nombres.
c) La cause du deces est une variable qualitative. Les va leurs qu'elie peut prendre sont cancer,
tuberculose, etc .
d) Les effectifs etudiants sont une variable quantitative. En toute rigueur, cette variable est
discrete (les valeurs possibles sont des entiers) mais ces nombres sont si grands qu'on peut, en
pratique, la traiter comme une variable continue.
e) Le nombre de tonnes-kilometriques transportees par les compagnies de camions est une
variable quantitative et continue.
f ) L'intensite dun courant electrique, exprirne en amperes, est une variable quantitative
continue.
g) L'etat matrimonial des gens est une variable qualitative. Les gens peuvent etre maries,
veufs, celibataires, etc.
h) Le quotient intellectuel des etudiants est une variable quantitative et continue.
i ) L'anciennete des employes d 'une compagnie est une variable quantitative et continue. Si elle
est exprimee en annees entieres, la variable est plutot du type discret.
j) L'allegeance politique des electeurs est une variable qualitative. Les va leurs possibles sont:
parti liberal, parti communiste, etc.

2. a) En theorie, la distribution du salaire annuel des salaries canadiens devrait avoir une allure
generale voisine de celle illu st r ee par la «cou rb e douce ». Exp rirnee sous forme
d'histogramme, la rneme distribution prendra plutot la forme «en escalier» superposes a la
courbe continue.

o 10000 20000 30000 40 000 50000 60000 70000

+- Revrenu en dollars -+

Remarquons que, pour chaque intervalle utilise pour tracer l'histogramme, la surface du
rectangle est la merne que celie sous la courbe continue.

b)
40 000 .,.------:---,------:--~~---;-~---;-~-....,...---~-~----:--~----:------.

30 000

20 000

10 000

o
a 10 20 30 40 SO 60 70 80
-- Age de Ia me:te --.

N ote: L'echelle verticale ind ique les effectifs correspondant a chaque tranche d'une annee
pour l' age de la m ere. Reference: Statistique Canada 1984 .
c)

Ame:ticains

\
a a,s 1,0 1,5
+- Taille enrnetres --.
d)

Frangais Ame:ticains

a 0,5 1,0 1,5


+- Taille enrnetres --.

e)

60

SO

~
4lJ
.......s,... 30
0
,::...
0
d:: 20

10

0 1 2 3 4 5 6 7 8 9 10 11 12

f)

30

~
.......§,.. 20
0
,::...
0 10
d::

0 1 2 3 4 5 6 7 8 9 10 11 12

g)

8000

6000

4000

2000

a
1 2 3 4 5 6

Note: Nous avons illustre le cas ideal ou chaque face du de apparait exactement 6 000 fois.
Lors d'une realisation concrete de cette experience, les effectifs observes ne seront
certainement pas tous rigoureusement egaux.

h)

Question: ya-t-il une taille


infelie~ele~ernentaile?

o 0)5 1)0 1)5


~ Taille enmehes -+

j)

9rrrm 10rrrm llrrrm

3. La plus petite observation est 0,1 et la plus grande est 11,6. Convenons de considerer 12
intervalles egaux: Osx-cl, l:5:x<2, ..., II:5:x<12.

Clas se O$x<l 1$x<2 2$x<3 3$x<4 4$x<5 5$x<6 6$x<7 7$x<8 8$x<9 9$x<1O 10$x<11 11$x<12 Total
Effectif 8 8 18 25 30 19 12 10 9 4 5 2 150
Frequence 0,053 0,053 0,120 0,167 0,200 0,127 O,OBO 0,067 0,060 0,027 0,033 0,013 1,00

,
03
30
....t:: 2025
'+<
0,2
Q.I
~ 15
~

10
'"-- 0,1
5

I I I I

0 1 2 3 4 5 6 7 8 9 10 11 12

0,3
30

25

...... .
'+<

20

0,2 Q.I
v

~
v
Q.I

'+<

'+<
~
15 ....
-Q.I

10
0,1 ~

0 1 2 3 4 5 6 7 8 9 10 11 12

4. La plus petite observation est 315, la plus grande 718. Convenons de considerer 14 intervalles
egaux, chacun de largeur 30: 310~x<340, 340~x<370, ..., 700~x<730 . On obtient la distribution
suivante:

Classe 310 340 370 400 430 460 490


~x ~x ~x ~x ~x ~x ~x
340 370 400 430 460 490 520
Effectif 3 4 11 12 11 8 10
Frequence 0,043 0,057 0,157 0,171 0,157 0,114 0,143

Classe 520 550 580 610 640 670 700 Total


~x ~x ~x ~x ~x ~x ~x
550 580 610 640 670 700 730
Effectif 2 6 1 1 0 0 1 70
Frequence 0,029 0,086 0,014 0,014 0 0 0,014 0,999

15
0,15 Q.I

........
'+<
10
v

v
Q.I

'+<

0,10
~
....
-Q.I
'+<
~ 5 0,05 ~

310 370 430 490 550 610 700

5.

- ....--""-­

- r-­

'11

~ 0,10
cr'
'~
~J
0 05

LMMJ VS D
Jow de la sernaine

6. a) L'hvpothese nulle est que Ie jour de la semaine n'exerce aucune influence sur Ie nombre
d'accouchement; rnathematiquement, cette hypothese se traduit pas le fait que les 300
accouchements se distribuent uniformement, soit selon les frequences 1/7, 1/7, ..., 1/7.
b) Les effectifs theoriques traduisent la distribution uniforme des frequences: chacun vaut
1
300 x 7' = 42,86.
2
(50-42.86)2 (35 - 42.86)2
c) X =
42.86 + ... + 42.86 = 3.29
d) v = 6; le point critique est done 12,59. On ne rejette done pas Ho: l'ecart entre les effectifs
observes et les effectifs theoriques peut etre du au hasard.

7. a) L'hypothese nulle est que les six faces du de sont equiprobables, c'est-a-dire: chaque face a
une chance sur six d'etre obtenue.
b) En 36 lancers de de, les effectifs theoriques sont 36 x 1/6 = 6 pour chaque face du de.
c) Pour calculer la valeur de X2, il faut d'abord traduire les frequences echantillonnales en
effectifs. On obtient le tableau suivant:

Resultats 1 2 3 4 5 6 total
Frequence 2­ Z 1 1 ~ 1 1
echan tillonnale 9 36 4 12 36 9
Effectif 8 7 9 3 5 4 36
echantillonnal
Frequence 1 1 1 1 1 1 1
theorique 6 6 6 6 6 6
Effectif 6 6 6 6 6 6 36
theorique

Confrontant les effectifs echantillonnaux (Oj) aux effectifs theoriques (T[), on obtient:
X2 = (8-6)2/6 +(7-6)2/6 +(9-6)2/6 +(3-6)2/6 +(5-6)2/6 +(4-6)2/6 = 28/6 = 4,67
d) Le nombre de degres de liberte est v = 6 - 1 = 5. Le point critique obtenu de la table de la
page 12 est done 11,07. La valeur obtenue pour X2 (4,67) n'est done pas significativement
grande; l'hypothese nulle (selon laquelle Ie de est bien equilibre) n'est donc pas rejetee,

8. L'hypothese nulle que l'on veut tester est que, lors d'une naissance, les probabilites d'avoir un
gar<;on ou une fiile sont exactement egales, c'est-a-dire, 1/2 pour chaque cas.

Si cette hypothese nulle est vraie, en 33 540 naissances, on devrait obtenir 16 770 gar<;ons et 16 770
filles. Ce sont la les effectifs theoriques, Les effectifs observes sont 17 206 garc;ons et 16 334 filles.
On obtient done:
2
X =
L
(Oi - Ti)
Ti =
(17206 - 16 770)2
16770 +
(16334 - 16 770)2

16770 22/67

Le nombre de degres de liberte est V = 2 - 1 = 1. La valeur critique obtenue de la table est done
3/84. Puisque X2 est superieur a cette valeur critique, on conclut que l'hypothese nulle est fausse.
La probabilite d'avoir un gar<;on est significativement plus grande que 1/2.
9. Lorsqu'on dit que l'ecart est tres significatif, on affirme etre tres sur que la probabilite d'avoir un
gar<;on n'est pas 1/2. Mais on n'affirrne pas que cette probabilite est tres eloignee de 1/2.
10. L'hypothese nulle ici est que la distribution de frequence des scores des orientaux est la meme que
celles des americains de race blanche. Le tableau qui suit presente les donnees pertinentes:
Score 200 a 300 a 400 a 500 a 600 a 700 a Total
290 390 490 590 690 800
Frequence 0/020 0/148 0/301 0/314 0/172 0/045
1/000
theorique
Effectif 201/9 1494,4 3039/2 3170/5 1 736/7 454/4 10097
theorique
Effectif 208 1309 2788 3190 2001 601 10097
observe
, , ..
X,2 = 131/6 avec 5 degres de hberte (valeur critique: 11/07). Les onentaux ont des resultats
nettement superieurs a ceux des arnericains.
11. Ce problema re ssemble au probleme precedent sauf que tous les effectifs (echantillonnaux comme
theoriques) sont dix fois plus grands. On obtient Ie tableau suivant:

Resultats 1 2 3 4 5 6 total
Effectif 80 70 90 30 50 40 360
echan tillonnal
Effectif 60 60 60 60 60 60 360
theorique

On obtient done:

X2 = (80-60)2/60 +(70-60)2/60 +(90-60)2/60 +(30-60)2/60 +(50-60)2/60 +(40-60)2/60 = 2 800/60 =

46/67. Comme dans le probleme precedent le nombre de degres de liberte est v = 5 et le point

critique est encore 11/07. La valeur obtenue pour X2 (46/67) etant nettement plus grande que Ie

point critique, l'hypothese nulle (selon laquelle le de est bien equilibre) est re~etee.

En multipliant tous les effectifs par 10/ tous les termes dont la somme donne X ont ete multiplies

par 100 au numerateur et par 10 seulement au denominateur, ce qui explique que ce nouveau X2

soit 10 fois plus grand que celui obtenu au problerne 6.


12.

0,5 Hommes
0.4
0,3
0,2­
0,1-~
I I I I
015 10 15 20 25 30 35 50
Revenu
Femmes
0,4
0,3
0,2

tL~_L~t==t==J:::::=::t==:::::l======--
I

0,1 I I
__
015 10 15 20 25 30 35 50
Revenu
Fxequence
Polygones des fxequences (hommes, femmes)
0,5
0,4
0,3
0,2

0,1 ~~_-=:====:::::~:;;;;;;;;;;;;;;;~~_
o1 5 10 15 20 25 30 35 50
Revenu

13.
90000 -
80000 - _r---f-­

70000 r--­ -
..... 60000 r--­

.-Ed! 50000
-
::::: 40000
~ 30000
20000
10000
o
1234 56789mll~mM~UVW~~
+-Age-+

Remarque: Puisque toutes les classes sont de me me largeur, on a pu indiquer une echelle verticale.
Ces donnees peuvent aussi etre considerees comme etant discretes et etre representees par un
diagramme a batons plut6t que par un histogramme.

1"- Afin de comparer les trois distributions, il faut d'abord les exprimer chacune en frequences
7 (frequences relatives, se referant uniquement a la sous-population consideree). On obtient le
tableau suivant:
Celibataires Veuves Divorcees
Age Effectifs Frequences Effectifs Frequences Effectifs Frequences
relatives relatives relatives
15-19 44 827 0,285 20 0,004 86 0,004
20-24 81345 0,518 175 0,031 2558 0,115
25-29 21774 0,139 391 0,069 6162 0,278
30-34 5216 0,033 394 0,070 4785 0,216
35-39 1768 0,011 425 0,075 2958 0,133
40-44 833 0,005 529 0,094 2121 0,096
45-49 521 0,003 795 0,141 1589 0,072
50-54 383 0,002 932 0,165 1125 0,051
55-59 265 0,002 1041 0,184 563 0,025
60-64 176 0,001 947 0,168 235 0,011
Total 157108 0,999"", 1 5 649 1,001 "'" 1 22 182 1,001 "'" 1

Celiba taires

15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64
+- Age de la rnariee +
Ces trois polygones de frequences illustrent bien (comme on pouvait s'y attendre), que les femmes
divorcees qui se remarient sont, en general, plus agees que celles qui etaient celibataires mais
plus jeunes que celles qui etaient veuves.

15. a) Bien que ce ne soit pas toujours le sens qu'on lui attribue, Ie terme «rep resen tatif» sera
considere ici comme synonyme de «tire au hasard», L'hypothese nulle est done que
I'echantillon a ete tire au hasard, auquel cas il devrait comprendre 20% de blessures
mortelles, 30% de blessures tres graves, 30% de blessures graves et 20% de blessures «pas
graves».
b) Les effectifs observes s'obtiennent en multipliant par l'effectif total (600) chacune des
frequences echantillonnales donnees dans Ie tableau. Les effectifs theoriques (valides si
l'hypothese nulle est vraie) s'obtierment en multipliant encore par 600 les frequences
observees dans la population entiere, consideree comme etant infinie. Ces frequences
correspondant a la population entiere seront done traitees comme representant les «vraies
probabilites» de chaque type d'accident. On obtient Ie tableau suivant:

Blessure Mortelle Tres grave Grave Pas grave Total


Effectif 120 180 180 120 600
theorique (T)
Effectif 60 180 240 120 600
observe (0)
Le calcul de X2 donne

x2 = (60-120)2/120 + 080-180)2/180 + (240-180)2/180 + 020-120>2/120 = 30 + 0 + 20 + 0 = 50.

Le nombre de degres de liberte est v = 4 - 1 = 3. Le point critique est 7,82. Puisque X2 = 50 >

7,82 l'hypothese nulle est rejetee. On conclut que notre echantillon de 600 accidents n'est pas

representatif de l'ensemble de tous les accidents puisque la distribution de la gravite des

blessures, dans cet echantillon, est significativement differente de celle qu'on obtient en

considerant la population entiere, Plus specifiquement, on trouve, dans notre echantillon,

trop peu d'accidents mortels et trop d'accidents avec blessures graves.

16. Le tableau suivant presente, en plus des effectifs absolus, les frequences relatives dans chaque
sous-population.

Sexe du chef de famille


Age Masculin Feminin
Effectif Frequence Effectif Frequence
(en milliers) relative (en milliers) relative
15-24 431 0,075 154 0,109
25-34 1457 0,253 222 0,157
35-44 1 185 0,206 154 0,109
45-54 1 115 0,194 190 0,134
55-64 841 0,146 238 0,168
65-74 567 0,099 286 0,202
75-84 153 0,027 172 0,121
Total 5749 1,000 1416 1,000

15-24 25-34 35-44 45-54 55-64 65-74 75-84


+- Age du chef de famille-+

Commentaires: On remarque que, quand le chef de famille est une femme, il est plus souvent age.
Ceci est vraisemblablement du au fait bien connu que les femmes vivent, en moyenne,
plus longtemps que les hommes. A l'autre extreme, on observe aussi une surabondance
de femmes quand le chef de famille est tres jeune. Peut-etre est-ce du aux jeunes
couples separes ou les enfants vivent avec la mere.

17. II Y a plusieurs facons de resoudre ce probleme.

Une premiere solution consiste a considerer 9 classes: 10 000-19 999, 20 000-29 999, 30 000-39 999,
..., 90 000-99999. La classe dans laquelle chaque nombre de cinq chiffres sera place ne dependra
done que de son premier chiffre. Si l'hypothese nulle (chiffres choisis au hasard) est vraie, on
s'attend a ce que les 72 nombres se partagent egalement entre les 9 classes (8 pour chacune: ce sont
la les effectifs theoriques). Or parmi ces 72 nombres, 8 commencent par I, 10 commencent par un
2, etc. Les effectifs observes sont done 8, 10,9,8,8,8,7,6,8, et on obtient: X2 = (8-8)2/8 + 00­
8)2/8 +(9-8)2/8 +...+ (8-8)2/8 = 1,25. Le nombre de degres de liberte est v = 9-1 = 8. Le point
critique obtenu de la table est done 15,51. Puisque la valeur de X2 est inferieure au point critique,
on ne peut rejeter l'hypothese nulle selon laquelle les chiffres ont ete tires au hasard (en fait, la
valeur 1,25 obtenue pour X2 est meme etonnamment petite et eveille de nouveaux soupcons: la
distribution trap uniforme).

Une autre facon de proceder est de compter combien de fois chacun des chiffres de 0 a 9 apparait
parmi les 72 x 5 = 360 chiffres tires. Puisque Ie premier chiffre de chaque nombre ne peut ailer
que de 1 a 9 (Ie zero est interdit en premiere position) on s'attend a ce que, si l'hypothese nuile
est vraie, le nombre total de zeros soit pres de 4 x 72 x 1/10 = 28,8. Pour chacun des autres
chiffres (de 1 a 9), l'effectif theorique est (72 x 1/9) + (4 x 72 x 1/10) = 36,8 . Les effectifs
observes sont 6, 67, 61, 42, 31, 25, 29, 44, 29 et 26. On trouve done: X2 = (6-28,8)2/28,8 + (67­
36,8)2/36,8 +...+ (26-36,8)2/36,8 = 72,07. Avec v = 10 - 1 = 9, Ie point critique est 16,93. Puisque
X2 est superieur au point critique, l'hypothese nulle est rejetee: certains chiffres apparaissent
significativement plus souvent que d'autres. En particulier, il y a une nette surabondance de 2 et
de 3 (qui sont sortis respectivement 67 et 61 fois alors qu'on n'en attendait que 36,8) et une nette
sous-abondance de 0 (qui n'est sorti que 6 fois alors qu'on devrait en trouver 28,8).
18.
.---...
..., 2500
,..
...Q,I
...... 2000
....
......
1500
E
§j
1000
........
""-'"

+'
500
'-'
.....
Q,I
..... 0
~ -.::l' 0... 0...
-.::l' ...... 0... -.::l' 0... -.::l'
~I
-.::l' -.::l' 0... -.::l' 0... 0...
...... ~I
C":' 0...
I I
Lr,) I C\l C\l <C':I I Lr,)
Lr,)
\,S) \,S) r--I <lO coI
'=' I I I I I
I
I I I

...... ...... '='


Lr,) Lr,) Lr,) Lr,) Lr,)
'=' C\l C\l '='
C":' C":' ~ ~ '='
Lr,) Lr,)
0
\,S) \,S)
Lr,)
r--
0
co
Lr,)
co

-
r-­ -
- ~

l-

I
-.::l' 0... -.::l' 0... -.::l' 0... -.::l'
I I ...... ...... C\l C\l <C':I
o l/') I t I I I

'='
......
Lr,)
......
0
C\l
Lr,) '='

C\l <C':I

Remarque: Seul Ie premier histogramme est muni d'une echelle verticale car il est le seul a etre
forme de classes de largeurs egales.
19. L'hypothese nulle est que la distribution des sexes dans notre echantillon est la meme que dans
la population generale, soit 51,95% de gar<;on et 48,05% de filles. Dans un echantillon de 1 687
personnes, les effectifs theoriques sont donc 876,4 gar<;ons et 810,6 filles. Or notre echantillon
compte 847 gar<;on et 840 Hiles. Ce sont la les effectifs observes.
On trouve donc: X2 = (847-876,4)2/876,4 + (840-810,6)2/810,6 = 2,05. Avec v = 2-1 = 1, le point
critique est 3,84. Puisque X2 est inferieur au point critique, l'hypothese nulle n'est pas rejetee.
20.
Niveau sec.l sec.2 sec.3 secA sec.s Total
scolaire
Sexe M F M F M F M F M F
Frequence 0,104 0,088 0,089 0,113 0,106 0,095 0,110 0,092 0,092 0,111 1,000
theorique
Effectif 175,4 148,5 150,1 190,6 178,8 160,3 185,6 155,2 155,2 187,3 1687
theorique
Frequence 0,107 0,099 0,105 0,101 0,110 0,105 0,100 0,099 0,086 0,088 1,000
observee
Effectif 180,5 167,0 177,1 170,4 185,6 177,1 168,7 167,0 145,1 148,5 1687
observe

x2 = 080,5-175,4)2/175,4 + 067,0-148,5)2/148,5 +...+ 048,5-187,3)2/187,3 = 22,6 . Avec v = 10-1 =


9, la valeur critique est 16,93. Puisque X2 est superieur a la valeur critique, l'hypothese nulle est
rejetee. II y a une difference significative entre la population et l'echantillon en ce qui concerne
la repartition selon le niveau et le sexe.

21.

Age 12 13 14 15 16 17 18+ Total


Frequence 13,53% 19,47% 20,79% 20,58% 16,83% 5,81% 2,55% 99,56%
theorique
Effectif 228 328 351 347 284 98 43 1679
theorique
Frequence 9,2% 19,9% 20,1% 19,5% 20,2 % 8,2 % 2,3% 99,4%
observee
Effectif 155 336 339 329 341 138 39 1677
observe

x2 = 055-228)2/228 + (336-328)2/328 +...+ (39-43)2/43 = 53,1. Avec v = 7 - 1 = 6, la valeur


critique est 12,59. Puisque X2 est superieur a la valeur critique, l'hypothese nulle est rejetee. II
y a une difference significative entre la population et l'echantillon en ce qui concerne la
distribution selon l'age. Le probleme souleve ici est plus complexe qu'il ne parait. Les
chercheurs n'ont pas, en fait, preleve leur echantillon d'une facon purement aleatoire: ils ont
utilise un mode d'echantillonnage appele echantillonnage par grappes (voir chapitre 10). Ce mode
d'echantillonnage n'a pas les memes proprietes probabilistes que l'echantillonnage aleatoire
simple et on ne peut pas, sans un examen plus approfondi, interpreter le resultat de ce test et
expliquer la contradiction entre la conclusion tiree ici et celle du numero 19.

22 . Exprimees en frequences, les donnees du recensement donnent 0,440 56 et 0,559 44 pour les deux
categories de scolarite. Dans un echantillon de 787 personnes, les effectifs theoriques seraient
done, respectivement, 346,7 et 440,3. Les effectifs observes etant 162 et 625, on obtient X2 = 062­
346,7)2/346,7 + (625-440,3)2/440,3 = 175,91. Puisque v = 2 - 1 = 1, la valeur critique est 3,84.
L'hypothese nulle, selon laquelle l'echantillon est representatif de la population entiere, est
done rejetee. L'echantillon est beaucoup plus scolarise que la population. (Les auteurs du rapport
signalent que leur echantillon a ete preleve en 1978 alors que le recensement date de 1971, et c'est
a cela qu'ils attribuent la difference entre les proportions echantillonnales et les proportions de
la population. Bien que ce facteur ait surernent contribue a la difference, il est peu
vraisemblable qu'il l'explique entierement),
23. a)

Jour Lu Ma Me Je Ve Sa Di Total
Effectif 941 941 941 941 941 941 941 6587
theorique
Effectif 1001 1035 982 1033 905 737 894 6587
observe

x2 = 71,95 avec v = 7 - 1 = 6.
La valeur critique etant 12,59, on conclut que certains jours sont
plus favorables aux suicides que d'autres.
b) Ne considerons ici que deux classes: la classe «ven d red i a dimanche» et la classe «lundi a
jeudi». On obtient le tableau suivant:

Jour Vendredi a Dimanche Lundi a [eudi Total


Effectif 2823 3764 6 587 theorique
Effect if 2536 4051 6 587 observe

x2 = 51,06 avec v = 2 - 1 = 1. La valeur critique est 3,84. Les suicides sont done moins
frequents a l'approche d'un week-end.
c) Dans notre echantillon, 4 051 suicides ont lieu entre le lundi et le jeudi. Si Ie taux de suicide
est le merne du lundi au jeudi, on devrait observer 1 012,75 suicides a chacun de ces quatres
jours; ce sont la les effectifs theoriques, On obtient le tableau suivant:

Jour Lu Ma Me Je Total
Effectif 1 012,75 1 012,75 1 012,75 1012,75 4051
theorique
Effectif 1001 1035 982 1033 4051
observe

x2 = 1,96 avec v = 4 - 1 = 3. La valeur critique (7,82) etant superieure a x2 , l'hypothese


nulle
n'est pas rejetee, La frequence des suicides semble etre la merne pour chacun des jours du lundi
au jeudi.
d) Si l'hypothese est vraie, les 2 536 suicides observes du vendredi au dimanche devraient se
repartir uniformement parmi ces trois jours: 845,3 pour chacun.

Jour Ve Sa Di Total
Effectif 845,3 845,3 845,3 2536
theorique
Effectif 905 737 894 2536
observe

x2= 20,90 avec 2 degres de liberte, La valeur critique etant 5,99, on conclut que les jours du
week-end ne sont pas equivalents les uns aux autres; il y a nettement moins de suicides le
samedi.
e) Le taux de suicide est significativement plus bas durant le week-end (du vendredi au
dimanche) que durant les autres jours de la semaine. Du lundi au jeudi, ce taux est
sensiblement constant. Durant le week-end, il n'est pas constant: il y a nettement moins de
suicide Ie samedi.
24. a)
Jour Lu Ma Me Je Ve Total
Production 90 000 109 000 106 000 105 000 90 000
500,000
Frequence 0,180 0,218 0,212 0,210 0,180 1,000
theorique
Effectif 144 174,4 169,6 168 144 800
theorique
Effectif 200 144 128 136 192 800
observe

x2 = 59,38 avec 4 degres de liberte (valeur critique: 9,49). Le taux de defectuosite depend bel
et bien du jour de fabrication.
b)
Jour Lundi Vendredi Total
Productior 90000 90 000 180 000
Frequence 0,500 0,500 1,000
theorique
Effectif 196 196 392
theorique
Effectif 200 192 392
observe

x2 = 0,163 avec 1 degre de liberte (valeur critique 3,84). Les taux de defectuosite du lundi et
du vendredi sont egaux,
c)
Jour Mardi Mercredi [eudi Total
Productior 109 000 106 000 105 000 320 000
Frequence 0,340625 0,331 25 0,328125 1,000
theorique
Effectif 138,975 135,15 133,875 408
theorique
Effectif 144 128 136 408
observe

x2 = 0,59
avec 2 degre de liberte (valeur critique 5,99). Les taux de defectuosite sont les
memes pour le mardi, le mercredi et le jeudi.
d)
[ours Lu et Ve Ma,Me et Je Total
Productior 180000 320000 500 000
Frequence 0,36 0,64 1,00
theorique
Effectif 288 512 800
theorique
Effectif 392 408 800
observe

x2 = 58,68 avec 1 degre de Iiberte (valeur critique 3,84). Le taux de defectuosite est plus bas
au milieu de la semaine qu'aux extrernites.
25. a)
Marque A Autre Total
Effectif 50 450 500
theorique
Effectif 80 420 500
observe

x2 = (80-50)2/50 + (420-450)2/450 = 20. Avec v = 2 - 1 = I, le point critique est 3,84.


L'hypothese nulle est donc rejetee: les lecteurs du magazine utilisent la marque A
significativement plus frequemment que la population generale.
b) La conclusion parait vraisemblable. 11 se peut, cependant, qu'il n'y ait pas reellement de
relation causale entre la publicite dans le magazine et Ie choix d'une marque de detergent
plutot qu'une autre; peut-etre un troisieme facteur influe-t-il simultanement sur Ie choix du
detergent et Ie choix du magazine. Supposons, par exemple, que le detersif A soit le seul qui
se presente comme etant un savon ecologique et bio-degradable; si le magazine x est lui-meme
oriente vers la promotion des valeurs ecologiques, il est naturel que ce soient les memes gens
qui soient attires a la fois vers le detergent A et vers le magazine x, sans que la publicite
n 'ait un bien grand role a [ouer. 11 reste a juger si cette explication constitue un «doute
raisonnable».
c) Dans notre echantillon de 500 personnes, on en a trouve 420 qui utilisaient une marque autre
que A. L'hypothese nulle est que ces personnes se distribuent dans les memes proportions que
toutes celles qui, dans la population, choisissent une autre marque que A, c'est-a-dire, 20/90
pour B, 30/90 pour C, 10/90 pour D et 30/90 pour toutes les autres marques. On obtient done Ie
tableau suivant:

Marque B C D Autre Total


Effectif 93,3 140 46,7 140 420
theorique
Effectif 100 130 50 140 420
observe

On trouve X2 = 1,43 et v = 4 - 1 = 3. La valeur critique (7,82) etant plus grande que X2,
l'hypothese nulle n'est pas rejetee. L'analyste a saute aux conclusions un peu trop vite.

26. a)
[ours Lu et Ve Ma,Me et Je Total
Frequence 2/5 3/5 1
theorique
Effectif 200 300 500
theorique
Effectif 257 243 500
observe

X2 = 27,1 avec 1 degre de liberte (valeur critique 3,84). Les absences sont reellement plus
frequentes le lundi et le vendredi.
b) Afin d'evaluer les effectifs theoriques dans ce nouveau modele qui tient compte du nombre de
jours que durent les maladies, imaginons un ensemble ideal de 70 maladies, parmi lesquelles
10 debutent un lundi, 10 debutent un mardi, et ainsi de suite pour les 7 [ours de la semaine.
Parmi les maladies qui debutent chaque jour, il y en a 5 qui ne dureront que ce jour, 2 dureront
2 jours, 1 durera 3 jours et 2 s'etendront sur 4 jours.

Dans les statistiques compilees par le patron, on ne retiendra donc que 5 maladies pour
chacun des jours du milieu de la semaine (mardi, mercredi et jeudi),soit les 5 maladies qui
debutent ce jour et ne durent qu'une [ournee. La situation du lundi est differente: en plus de
compter les 5 maladies du lundi qui ne durent qu'un jour, on comptera aussi les 2 maladies qui
ont debute un dimanche et ont dure 2 jours ainsi que celle qui a debute un samedi et a dure 3
jours. En tout, on trouvera done 8 maladies comptees le lundi.

--15-­
La situation du vendredi est semblable: en plus de compter les 5 maladies qui debutent un
vendredi et ne durent qu'un jour, on comptera les 2 maladies qui commencent vendredi et
durent 2 jours ainsi que celie qui dure 3 jours, allant du vendredi au dimanche. En tout, done,
8 maladies seront comptees pour le vendredi. Le tableau suivant illustre la situation
globale:

[ours Lu Ma Me Je Ve Total
Nombre de maladies
detectees parmi les 70
maladies idealement
distribuees 8 5 5 5 8 31
Frequence theorique 8/31 5/31 5/31 5/31 8/31 1
Effectif theorique 129 80,6 80,6 80,6 129 500
Effectif observe 129 80 82 81 128 500

x2 = 0,04 avec 4 degres de liberte (valeur critique 9,49).


Les donnees experimentales sont done
en excellent accord avec le nouveau modele et le patron a tort de pretendre qu'il y a des abus.
CHAPITRE 2

1. a) n = 16; SXi = 68; X = 68/16 = 4,25. Les donnees sont deja en ordre croissant: la mediane est la
moyenne entre les deux donnees centrales (de rangs 8 et 9); mediane = (4 + 4)/2 = 4. Le mode
est 4 car cette valeur, qui apparatt 6 fois, est la plus frequente.
b) n = 7; SXi = 81,2; x = 81,2/7 = 11,6. Presentees en ordre croissant, les donnees sont 7,2, 8,2,
9,4, 11,2, 12,5, 14,5 et 18,3. La mediane est la donnee centrale, c'est-a-dire, la quatrierne, qui
est 11,2. Chacune des 7 donnees est un mode car elles sont toutes distinctes.
c) n = 8; SXi = 35; x = 35/8 = 4,375. Presentees en ordre croissant, les donnees sont 1,9,2,7, 2,8,
2,8, 3,9, 4,7, 7,8 et 8,4. La mediane est la moyenne entre les deux donnees centrales (la
quatrieme et la cinquieme, qui valent 2,8 et 3,9). Mediane = (2,8 + 3,9)/2 = 3,35. Le mode est
2,8, la seule valeur qui apparait 2 fois.

2. La mediane vaut 22 dans chaque cas. Chaque donnee est un mode.

1 1 3 1
3. a) n = 15. Les donnees sont deja en ordre croissant. Avec a = 4" 2' et 4" an + 2' vaut
respectivement 4,25, 8 et 11,75. Les trois quartiles sont done les donnees de rangs 4, 8 et 12.
Ql = 1; Q2 = 3; Q3 = 9.
1 1
b) n = 9. Les donnees, presentees en ordre croissant, sont 2, 4, 4, 6.6.6.8, 10 et 1O~ Avec a = 4" 2'
3 1
et 4" an + 2' vaut respectivement 2,75, 5 et 7,25. Les trois quartiles sont donc les donnees de
rangs 3, 5 et 7. Ql = 4; Q2 = 6; Q3 = 8.
1 1 3 1
c) n = 13. Les donnees sont deja en ordre croissant. Avec a = 4" 2' et 4" an + 2' vaut
respectivement 3,75, 7 et 10,25. Les trois quartiles sont done les donnees de rangs 4, 7 et 10.
Ql= 2; Q2 = 2; ~ = 12.

4. a) La moyenne de plusieurs nombres consecutifs est la moyenne entre les deux valeurs extremes;
1 1 3 1
)( = (l + 31)/2 = 16. n = 31; avec a = 4" 2' et 4" an + 2' vaut respectivement 8,25, 16 et 23,75 .
Les trois quartiles sont done les donnees de rangs 8, 16 et 24. Ql = 8; Q2 = mediane = 16;
Q3 = 24.
b) La moyenne de plusieurs nombres consecutifs est la moyenne entre les deux va leurs extremes;
_ 1 1 3 1 .
x = (-20 + 20)/2 = O. n = 41 avec a = 4" 2'et 4" an + 2' vaut respectivement 10,75,21 et 31,25.
Les trois quartiles sont done les donnees de rangs II, 21 et 31. Ql = -10; Q2 = mediane = 0;
Q3 = 10.

5. 1 a) n = 16', SX'l
= 68'
' sl-i = 330'' x = 425' x2 = 20625' s2 = x2 _)(2 = 25625' s = 160078
II " , I I •

Ib) n = 7', SX 1' = 812'


"
Sx2i = 1 03284'
' , -x = 11 6' II
";I. = 147548 57' s2 = ";I. _)(2 = 12988 57 '
" "

S = 3,60397.

I c) n = 8', Sx,l= 35
'' sl-i= 19528'
'l x = 4,375', x2 = 2441' s2 =5269375 ' s = 229551
I I ' , , .

2a) n = 5; SXi = 110; Sxf = 2430; x = 22; ";I. = 486; s2 = ";I. - x 2 = 2; s = 1,41421.
2b) n = 5', SX'1 = 124'' sl-i = 3298'' -x = 248' x2 = 6596' s2 =4456' s = 6675 33
II II " , •

2c) n = 5; SXj = 95; Sxf = 2 055; x = 19; x2 = 411; s2 =50; s = 7,071 07.

17
6. Serie A : n = 5; SXi = 250; S~ = 12 702; X = 50; ;J. = 2 540,4; s2 =40,4; s = 6,356 1.
Serie B : n = 5; SXi = 250; SxT = 12510; X = 50; ~ = 2502; s2 =2; s = 1,41421.

La serie A est plus dispersee.

7. Serie A : n = 5; SXi = 300; SxT = 19 000; x = 60; s2 =200; s = 14,142 1.


Sene B : n = 5; SXi = 300; SxT = 18 802; x = 60; s2 =160,4; s = 12,664 9.

La serie A est plus dispersee.

8. Les deux ecart-types devraient etre egaux car l'ajout d'une constante a chaque donnee n'en modifie
que la moyenne et non la dispersion.
sl
Serie A .• n = 5', SX'1 = 50'' i = 750'' x = 10', x2 = 150', s2 =50', s = 7071
, 1.

Serie B : n = 5; SXi = 100; SXT = 2 250; x = 20; x2 = 450; s2 =50; s = 7,071 1.

9. L'ecart-type de la serie B devrait etre 5 fois plus grand que celui de la serie A.
Serie A: n = 5; SXi = 50; SXT = 750; x = 10; x2 = 150; s2 =50; s = 7,071.

Serie B : n = 5; SXi = 250; SXT = 18 750; x = 50; ~ = 3750; s2 =1 250; s = 35,355 = 5 x 7,071.

10. n = 5; SXi = 60; SxT = 850; x = 12.

a) s2 = ~ S (Xi - x)2 = ~ «5 - 12)2 + (8 -12)2 + (12 -12)2 + (16 - 12)2 + (19 - 12)2)
1 130
= 5' (72 + 42 + 02 + 42 + 72) = 5 = 26.

SxT - (SXi)2/ n 850 - 3600/5 850 -720 130

b) s2 = n = 5 = 5 = 5 = 26.

'" -2
c) s 2 =xL.- 850 2
x =5-12 =170-144=26.

11. Numero 3 : a) E = 03 - Q1 = 9 - 1 = 8.
b) E = Q3 - Q1 = 8 - 4 = 4.
c) E = Q3 - Q1 = 12 - 2 = 10.
Numero 4: a) E = Q3 - Q1 = 24 - 8 = 16.

b) E = 03 - Q1 = 10 - (-10) = 20.

12. n = 19; SXi = 118; SxT = 872. Mises en ordre croissant, les donnees sont 0,0,4,4,4,4,7,7,7,7,8,
8, 8, 8, 8, 8, 8, 8, 10.
Moyenne = x = 118/19 = 6,210 5; mode = 8 (cette donnee apparait 8 fois): mediane = «la dixieme
donnee» = 7.
s2 = x2 - x 2 = 872/19 - (118/19)2 = 7,324 1; s = 2,706 3; Q1 = «la 5ieme donnee» = 4; Q3 = «la

TSieme donnee» = 8;

E = Q3 - Q1 = 8 -4 = 4.

13. n = 100; les donnees sont deja en ordre croissant. La mediane est la moyenne entre les deux
donnees centrales (de rangs 50 et 51); mediane = (21 240 + 21 295)/2 = 21 267,5. Les charnieres
sont les medianes des 50 premieres observations «18 555 + 18 712)/2 = 18 633,5) et des
50 dernieres «24 130 + 24 299)/2 = 24 214,5). L'ecart entre les charnieres est 24214,5 - 18 633,5 =
5 581. L'ecart normal aux charnieres est 1,5 x 5 581 = 8 371,5. L'intervalle des donnees normales

18
po
est (18 633,5 - 8 371,5 ; 24 214,5 + 8 371,5) = (10 262 ; 32 586). La plus petite donnee normale est
13 441; la plus grande donnee normale est 30 214. Les 9 dernieres donnees sont anormalement
grandes. La moustache est:

'<;f' ['-.
...... o C'J0~ ~ L/)
['-. 0
C'J g! ~~~ ...... C'J ~
0 :g
C'J ~~'<;f' 00 0­
~

1---------'1 I l'--------t
~ ~ ~~~ ~

I II I I

I
\----.--...........----.--....,--,----.---r--T-I----.--.....--T--r--.----r--..--.----r----t--....---.-----r---r--r-----r--....--T""--r---I----.--.....--T--r----r---T---r-""r'-T----l

I
10 000 20000 30000 40 000 50000

14. n = 74; les donnees sont deja en ordre croissant. La mediane est la moyenne entre les donnees de
rangs 37 et 38, c'est-a-dire, (4,5 + 4,6) /2 = 4,55. La premiere charniere est la mediane des
37 premieres donnees, c'est-a-dire, la donnee de rang 19 : 3,4. La seconde charniere est la
mediane des donnees de rangs 38 a 74, c'est-a-dire, la donnee de rang 56 : 6,9. L'ecart entre les
charnieres est 6,9 - 3,4 = 3,5. L'ecart normal au charniere est 1,5 x 3,5 = 5,25. L'intervalle des
donnees normales est (3,4 - 5,25 ; 6,9 + 5,25) = (-1,85 ; 12,15). La plus petite donnee normale est
0,1; la plus grande donnee normale est 9,4 . Les trois dernieres donnees sont anormalement
grandes. La moustache est:

L/)
C'J
u->
......
ro
......
I I

I
o 2 4 6 8 10 12 14 16 18 20 22 24 26 28

15. n = 10; SXi ni = (0 x 1) + (5 x 3) + (7 x 4) + (8 x 2) = 59; Sxf ni = (02 x 1) + (52 x 3) + (72 x 4) + (82


x 2) = 399;
"")( = 5,9; ~ = 39,9; s2 = x2 - "")(2 = 5,09; s = 2,256
1. Le mode est 7 (cette donnee apparait 4 fois) ,
La med iane est la moyenne entre les donnees de rangs 5 et 6, c'est-a-dire (7 + 7)/2 = 7. En
utilisant les 10 donnees individuelles, on retrouve encore SXi = 59 et Sx'f = 399. Aucun pararnetre
ne change de valeur.

16.

Y:

19

La variable X prend plus souvent des va leurs extremes. On devrait trouver "x > Sy' En effet:

"x = 10; SXi ni = 30; Sx7 ni = 116; s~ = (116/10) - (30/10)2 = 2,6; Sx = 1,6125.
n y = 10; SYi ni = 30; SYT ni = 102; s~ = (102/10) - (30/10)2 = 1,2; Sy = 1,0954.
17. x = S Xi fi = (1 x 0,1) + (2 x 0,4) + (3 x 0,2) + (4 x 0,2) + (5 x 0,1) = 2,8.
~ = SxT fi = (1 x 0,1) + (4 x 0,4) + (9 x 0,2) + (16 x 0,2) + (25 x 0,1) = 9,2.
s2 = 9,2 - (2,8)2 = 1,36; s = 1,166 2. Le mode est la valeur la plus frequente, c'est-a-dire, 2. La
mediane est (2 + 3) /2 = 2,5. 50% des donnees sont < 2,5 et 50% des donnees sont > 2,5.

1 3 1
18. a) n = 37. Av ec a. = 4' et 4' ' no. + 2" vaut respectivement 9,75 et 28,25. Les quantiles Ql et ~

sont les donnees de rangs 10 et 28. La dixieme donnee est un 5. La 28iem e donnee (c'est-a­
dire, la dixieme en partant de la droite) est un 9. E = Q3 - Ql = 9 - 5 = 4.
b) 12% des donnees sont < 4. 49% des donnees sont < 8. Le quantile Ql sera situe au (25% ­
12%)/37% = 35,135 % de l'intervalle allant de 4 a 8, c'est-a-dire, a 4 + 0,351 35 (8 - 4) = 5,405.
68% des donnees sont < 16; 100% des donnees sont $; 20. Le quantile ~ sera situe au (75% ­
68%)/32% = 21,875 % de l'intervalle allant de 16 a 20, c'est-a-dire, a 16 + 0,218 75 (20 - 16) =
16,875. E = ~ - Ql = 16,875 - 5,405 = 11,47.

19. Les Yi sont 20,24,32,36,40.

nX = 5; S Xi = 51; SxT = 589; x = 10,2; s~ = ~ -x 2 = 13,76.

ny = 5; SYi = 152; SYT = 4 896;= 30,4; s~ = Y2 -y2 = 55,04.


y
On remarque que y= 2x + 10 = 2 x 10,2 + 10 = 30,4 et que s~ = 22 s~ = 4 x 13,76 = 55,04.

20. nX = 5; SXi = 35; SxT = 7; s~ = 60,6 - 72 = 11,6; Sx = 3,406. Chaque Yi est de la forme
= 303; x
2 000 + 6~. On aura done y = 2 000 + 6 x 7 = 2 042 et Sy = 6s X = 20,44. On peut verifier qu'on a
bien SYi = 10210 et SYT = 20 850 908, ce qui donne y = 2 042, s~ = 417,6 et Sy = 20,44.

21. Soit X la temperature en degres Celcius et Y la temperature en degres Fahrenheit. On a Y = 32


+ l,8X . Si x = 18 et s~ = 25, on a y = 32 + 1,8 x = 64,4 et s~ = (1,8)2 s~ = 81.

22. Z = (x - x )/5 = (68 - 54)/14 = 14/14 =1.

23. x = 8; ~ = 68; 52 = 4; 5 = 2. Les 5 cotes Z sont (5 - 8)/2 = -1,5; (7 - 8)/2 = -0,5; (8 - 8)/2 = 0; (9 ­
8)/2 = 0,5 et (11 - 8)/2 = 1,5. SZi = 0; SZT = 5; Z = 0; 52 = 1.

24. Votre cote Z est (23 - 17)/2,5 = 2,4. La proportion de la population dont la cote Z, en valeur
absolue, est superieure a 2,4 est au maximum 1/(2,4)2 = 0,173 61 ce qui, dans une population de
100000, represente 17361 personnes. Le nombre reel est probablement beaucoup plus petit.

25. x =(nl xl+ n2 x2+ ·.. + n6 x6)/(nl+ n2+· .. + n6)


= «47 x 63) + (38 x 61) + (30 x 68) + (55 x 54) + (40 x 72) + (40 x 73»/250
= 16089/250 = 64,356.

20
26. Nombre de voitures vendues
A B C o Total
Concessionnaire X 43 50 70 150 313
Concessionnaire Y 10 20 65 200 295
Total 53 70 135 350 608

En ajustant les prix de vente moyens selon la ponderation basee sur les effectifs marginaux 53,
70, 135 et 350 on obtient, pour Ie concessionnaire X une moyenne ajustee valant «30 x 54) + (22 x
70) + (15 x 135) + (11 x 350»/608 = 9005/608 = 14,811, c'est-a-dire, 14811$.

Pour le concessionnaire Y, la moyenne ajustee est «31 x 53) + (23 x 70) + (14 x 135) + (12 x
350»/608 = 9 343/608 = 15,367, c'est-a-dire, 15367$.

27. sx est surernent beaucoup plus grand que sy car les valeurs vraisernblables pour X sont beaucoup
plus grandes que celles qu'on s'attend d'observer pour Y.

28. Pour janvier, nX = 12; Sx, = -109,6; 5Xf = 1 079,94; x = -9,133; s~ = 6,577; sx = 2,565.

Pour juillet, ny = 12; 5Yi = 264,4; 50 = 5 838,12; V = 22,033; s? = 1,042; Sy = 1,021.

29. a) Le mode est 1; cette valeur est nettement la plus frequente.


b) La mediane est 1; si toute les 1 026 925 observations etaient ordonnees, l'orservation centrale
(la 513 463 iem e) serait un 1. Les 293 390 premieres seraient des 0; les 8 560 dernieres seraient
des 2, 3, etc.

30. a), b) et c) sont fausses. Contre-exemple: 1, 2, 2, 3. La mediane d e ces 4 donnees est 2. 25% des
donnees sont inferieures a la mediane (et non 50%); 25% des donnees sont superieures a la
mediane (et non 50%); 75% des donnees sont inferieures ou egales a la med iane (et non 50%);
75% n'est pas inferieur ou egal a 50%. d) et e) sont vraies.

31. a) La mediane sera la moyenne entre les observations de rangs 197 363 et 197 364. Les 84 100
premieres observations sont des 1; les 109 905 observations suivantes (occupant les rangs
84 101 a 194 005) sont des 2; les 70 735 observations suivantes (occupant les rangs 194 006 a
264740) sont des 3. La mediane est done 3. Le mode est 2, cette valeur, observee 109 905 fois,
etant la plus Frequente.

b) La mediane sera l'observation de rang 403 013. Les rangs 1 a 120370 sont occupes par des 1;
les rangs 120371 a 321 480 sont occupes par des 2; les rangs 321 481 a 469 990 sont occupes par
des 3. La mediane est done 3. Le mode est probablement 2, mais il est possible, quoique peu
probable, qu'il soit 4 ou 5 si les 240 630 observations de cette categoric sont tres inegalement
reparties entre ces deux valeurs.

32. La variance est sfuement beaucoup plus grande pour la serie A car les temperatures a Montreal
varient beaucoup plus qu'a Miami entre janvier et juillet.

33. Le supermarche A a probablement des depenses plus elevees car il dolt avoir un personnel
suffisant pour ne pas etre deborde en periode de pointe.

34. Les precipitations ne peuvent pas etre negatives. Puisque la moyenne est zero, chaque
observation individuelle est necessairernent zero. Toutes les donnees etant egales, leur variance
est nulle, de meme que leur ecart-type,

35. a) Si l'ecart-type est 1, un score de 65 correspond a une cote Z de (65 - 60)/1 = 5, ce qui est
exceptionnel. L'inegalite de Tchebychev nous permet d'affirrner qu'au plus 1/52 = 4% des
observations s'ecartent autant de la moyenne. La proportion reelle est probablement encore
beaucoup plus petite.

21
b) Si l'ecart-type est 20, un score de 65 correspond a. une cote Z de (65 - 60)/20 = 0,25, ce qui est
tout-a-fait quelconque et n'a rien d'exceptionnel.

36. En utilisant les valeurs 2 sao, 7 sao, 11 000, 13 sao, etc. comme points-milieux des classes, on
trouve
x = SXifi = (2500 x 0,017) + (7 500 x 0,063) + ... + (55 000 x 0,101) = 29 820;
x2 = SXT fi = (25002 x 0,017) + ... + (55 0002 x 0,101) = 1 097622 500;
s2 = ~ - x 2 = 208 390 100; s = 14436.

44,7% des donnees sont inferieures a. 27 000; 51,4% des donnees sont inferieures a. 30 000. Par

·
mterpo ation, 1a me'd lane
lati ' est d one 27 000 + 0.500 - 0.447 (30 000 - 27 000)
= 29 373.
0.067
23,6% des donnees sont inferieures a 17 000; 29,8% des donnees sont inferieures a 20 ODD. Par
·
mterpo ation, 1e premier
lati . quarti'1e est d one Q 1 = 17 000 + 0.250 - 0.236 (20000 - 17000) = 17677.
0.062
73,5 % des donnees sont inferieures a. 40 000; 82,7% des donnees sont inferieures a 45 ODD. Par
·
mterpo ation, 1e troisieme
lati . " quarti'1 e est d O
one Q3D
= 4O 0 + 0.750 - 0.735 (45 000 - 40 000 ) = 40 815.
0.092
E = Q3 - Ql = 23 138.

37. La proportion X provenant d'un plus petit echantillon, son ecart-type sera plus grand.

38. L'ecart-type depend de l'unite de mesure. Si, par exernple, X est la taille en pouces et Y la
taille en centimetres, alors Y = 2,54X et sY = 2,54sX' La cote Z, par centre, reste inchangee.

39. La cote Z de l'etudiant A est (69 - 60)/3 = 3. La cote Z de l'etudiant Best (75 - 60)/10 = 1,5. A
est mieux situe par rapport a sa classe que B par rapport a la sienne.

40. Le premier etudiant a obtenu une cote Z de 0 a l'intra et de (80 - 60)/20 = 1 au final. Le second
etudiant a obtenu une cote Z de (80 - 60)/10 = 2 a l'intra et une cote Z de 0 au final. Le second
etudiant a eu un meilleur resultat global.

41. 11 est raisonnable d'attribuer la baisse de recettes aux travaux municipaux car une cote Z de
(19500 - 20000)/100 = -5 est tres significative.

42. On rejette les rouleaux dont l'ecart a la moyenne est de 3 ecarts-type «65-62,03)/0,99 =
(67,97-65)/0,99 = 3). Selon le theorerne de Tchebycheff, la proportion rejetee est au maximum de
1/32 = 1/9 = 11,11%.

43. Supposant que les moyennes echantillonnales sont de bonnes estimations des vraies moyennes des
strates, alors le montant total des comptes a payer est estime par (3010,75 x 70) + (580,60 x 500) +
(89,78 x 10 000) = 1398852,50 $.

44. a) En ponderant selon les frequences (conjointes) donnees, on trouve

pour les hommes : (0,6 x 0,114) + (D,S x 0,117) + + (198,5 x 0,008) = 9,8322;

pour les femmes : (0,4 x 0,114) + (0,3 x 0,117) + + (163,3 x 0,008) = 5,8373.

b) En calculant le taux de mortalite de chaque sexe a. partir de sa propre distribution d'age, le


taux des hommes diminue et celui des femmes augmente. En partant du fait (reel) que les
femmes vivent plus longtemps que les hornrnes, on voit alors que l'image d'une frequence
commune d efavorise les hommes puisqu'ils sont alors surrepresentes dans les classes d'age
avarice (et reciproquement pour les femmes).

45. a) Le revenu moyen des hommes est calcule par


274.5 352.3 3541.1

5 346.3 x 1 591 + 5346.3 x 2 973 + ... + 5 346.3 x 8 230 = 7 111$

22
Le revenu moyen des femmes, calcule de facon analogue, est 3 864 $. La difference est de
3 247$ en faveur des hommes.

b) Les moyennes ajustees seront calculees en utilisant les effectifs marginaux des 5 classes, qui
sont, respectivement, 508,5, 611,0, 678,7, 1 059,2 et 4817,6; effectif total = 7675,0.
Pour les hommes, le revenu moyen ajuste est
508:5 611.0 4817.6
7 675.0 x 1 591 + 7 675.0 x 2 973 + ... + 7 675.0 x 8 230 = 6 920$.
Pour les femmes, le revenu moyen ajuste, calcule de facon analogue, est 4 125$. En utilisant
des moyennes ajustees, la difference a ete ramenee a 2795$, toujours en faveur des hommes.
Cette difference entre hommes et femmes ne peut etre attribuee au fait que les femmes ont
moins travaille (puisqu'on utilise la merne ponderation): elle ne peut s'expliquer que par une
difference reelle de traitements.

46. a) Pour chacune des 8 categories de revenu, l'imp6t moyen paye en 1973 a ete, respectivement,
13.8 millions
571.0 milliers = 24,2; 189,3; 467,9; 871,3; 1 547,2; 2855,S; 6 563,3; 21 919,8.
Pour les memes 8 categories, l'imp6t moyen paye en 1974 a ete
1.2 millions
427.8 milliers = 2,8; 114,5; 372,8; 765,1; 1 433,6; 2 695,3; 6 165,7; 21 426,0.
Pour chaque tranche de revenu, le contribuable a paye moins en 1974 qu'en 1973.

. ~ impot total 8832.8 millions


b) En 1973; impot moyen = effectif total = 8 357.6 milliers = 1 057$.
10615.2 millions
En 1974; imp6t moyen 8857.1 milliers = 1 198$.
Merrie si, pour chaque tranche de revenu, le contribuable a paye moins en 1974 qu'en 1973, il
a, en moyenne, paye plus en 1974 qu'en 1973 . Ceci est dil au fait qu'il y avait
proportionnellement plus de contribuables a revenu eleve en 1974 qu'en 1973.

23

CHAPITRE 3

1. a) Vrai. b) Vrai. c) Faux: 9,9% etaient des gan;ons et avaient un poids moyen; 19,11 %
(= 0,099 x 100/0,518) des gan;ons ont un poids moyen. d) Vrai. e) Faux: 12,8% des
bebes etaient des filles et avaient un poids moyen; 56,38% (= g'~;~ )des bebes de poids moyen
etaient des filles.

40 x 54 2160 20 x 66 1320
2. a) Par exemple, = 120 = 18; = 120 = 11, etc.
120 120

b) Y inferieur Superieur ou
a 100 egal a 100 Total

Francais 0,150 0,183 0,333

Anglais 0,225 0,275 0,500

Autres 0,075 0,092 0,167

Total 0,450 0,550 1,000

On verifie que la frequence d'une case est egale au produit de la frequence totale de la ligne
par la frequence totale de la colonne. Par exemple, la frequence a I'intersection de la ligne 1
et de la colonne 1 est 0,150 = 0,333 x 0,450; celle a l'intersection de la ligne 3 et de la colonne
2 est 0,092 = 0,167 x 0,550.

3. a) Distribution marginale de l'age de la mere:

Age Age de la mere Total


19 et moins I De 20 a 24 I De 25 a 29 I 30 et plus
Frequence 0,116 I 0,356 I 0,312 I 0,216 1,000

b) Distribution marginale du sexe de l'enfant:

Sexe Total
Frequence 1,000

c) Distributions conditionnelles de l'age de la mere:

Age de la mere
Sexe 19 et moins De 20 a 24 De 25 a 29 30 et plus Total
Masculin 0,117 0,356 0,312 0,216 1,001
Feminin 0,115 0,357 0,312 0,216 1,000
TOllS 0,116 0,356 0,312 0,216 1,000

4. Note : la question devrait plutot referer au tableau 3.8. On obtient alors comme tableau des
distributions conditionnelles de X:

Y: rang social du pere de l'epouse


professionnel Commis ou Ouvrier non-specialise
X: rang social du pere du mari ou gerant ouvrier specialise
Professionnel ou gerant 0,571 0,386 0,176
Commis ou ouvrier specialise 0,273 0,376 0,392
Ouvrier non specialise 0,156 0,238 0,432
Total 1,000 1,000 1,000

24
5. Distributions conditionnelles de la religion de l'epouse

Y: religion de l'epouse
X: religion de l'epoux Anglicane Baptiste Catholique Eglise Unie Total
Anglicane 0,421 0,039 0,329 0,211 1,000
Baptiste 0,120 0,510 0,216 0,154 1,000
Catholique 0,123 0,024 0,707 0,146 1,000
Eglise Unie 0,149 0,031 0,281 0,538 0,999

On voit bien que les distributions conditionnelles sont tres differentes les unes des autres.

6. a) Distributions conditionnelles de Y etant donne les valeurs de X:

Naissances Mortinaissances
vivantes
< 20 0,992 0,008
20-24 0,993 0,007
25-29 0,993 0,007
30-34 0,992 0,008
35-39 0,984 0,016
4044 0,976 0,024
~ 45 0,958 0,042

b) Distributions conditionnelles de X etant donne les va leurs de Y:

Naissances Mortinaissances
vivantes
< 20 0,115 0,120
20-24 0,332 0,287
25-29 0,356 0,317
30-34 0,144 0,153
35-39 0,042 0,088
40-44 0,010 0,031
~45 0,001 0,004

c) Le premier tableau ci-dessus donne Ie pourcentage de naissances vivantes et de


mortinaissances pour chaque tranche d'age, ce qui permet les comparaisons naturelles comme:
0,7% de mortinaissances pour les 20-24 ans, compare a 4,2% pour les 45 ans et plus. Les
donnees du 2e tableau se lisent moins bien.

7. a) Pour chaque emplacement, determinons les distributions conditionnelles des ventes etant
donne l'emballage:

Emplacement
Ventes Niveau des yeux Niveau des
chevilles
Emballage Emballage
Bleu Rouge Bleu Rouge
Bonnes 0,4 0,9 0,2 0,2
Mauvaises 0,6 0,1 0,8 0,8
I,D 1,0 1,0 1,0

Lorsque Ie produit est place au niveau des yeux, l'emballage rouge attire les clients: 90% des
magasins ont de bonnes ventes lorsque l'emballage est rouge, compare a 40% pour les magasins
avec l'emballage bleu. Par contre, lorsque Ie produit est place au niveau des chevilles, 20%

25

des magasins ont de bonnes ventes, quelle que soit la couleur de l'emballage. En resume,
l'emballage a un effet sur les ventes, mais seulement quand le produit est au niveau des yeux.

b) Pour chaque couleur d 'emballage, voyons les distributions conditionnelles des ventes, etant
donne l'amplacement:

Couleur de l'emballage
Ventes Bleu Rouge
Emplacement Emplacement
Niveau Niveau Niveau Niveau
yeux chevilles yeux chevilles
Bonnes 0,4 0/2 0/9 0/2
Mauvaises 0/6 0/8 0/1 0/8
1/0 1/0 1/0 1/0

Lorsque l'emballage est bleu et lorsqu'il est rouge, l'emplacement a un effet sur les ventes.
Mais l'effet de l'emplacement est plus remarquable lorsque l'emballage est rouge: la
difference entre 0/9 et 0/2 est plus importante que celle entre 0,4 et 0/2 .

8. Pour chaque tableau on peut calculer le pourcentage de femmes bien rernunerees (avec un salaire
2: 30 000$) et le pourcentage d'hornmes bien rernuneres.
a) Les femmes sont favorisees dans les emplois techniques (80% sont bien rernunerees compare a
45% pour les hommes): elles sont defavorisees dans les emplois administratifs (57% pour les
femmes, 85% pour les hornmes). Lorsqu'on rassemble les deux tableaux, on constate que les
femmes ne sont ni favorisees ni defavorisees (67% pour les hommes et pour les femmes).
b) Les femmes sont favorisees et dans les emplois techniques et dans les emplois administratifs.
Globalement, elles ne sont ni favorisees, ni defavorisees.
c) Les femmes sont favorisees dans les deux categories, mais globalement elles sont defavorisees.
La raison est qu'elles sont faiblement represen tees dans les emplois administratifs ou les
salaires sont eleves,

9. Tableau des effectifs theoriques:

Y: religion de l'epouse
X: religion de l'epoux Anglicane Baptiste Catholique Eglise Unie Total
Anglicane 2418/8 741/15 6420/61 3398/44 12979
Baptiste 742/65 227/56 1 971/35 1 043/44 3985
<;:a tholique 6232/34 1 909/65 16543/5 8 756/51 33442
Eglise Unie 3334/21 1 021/64 8 850/54 4 684/61 17891
Total 12728 3900 33786 17883 68297

x2 = 33 289. Cette valeur enorme est due en partie a la grande taille de l'echantillon et, bien
sur, a la tres forte dependance entre la religion de l'epoux et celle de l'epouse. Le tableau des
distributions conditionnelles donne au numero 5 expose clairement cette dependance. Le
pourcentage d'hommes qui ont epouse des anglicanes, par exemples, qui est de 42/1% pour les
hommes anglicans, baisse a 1,2% pour les hommes baptistes, a 12/3% pour les catholiques et a
14/9% pour les membres de l'Eglise Unie.

10. L'hypothese nulle est que Ie taux de mortinatalite est independant de l'age de la mere. Voici
le tableau des effectifs theoriques:

Age de la mere
<20 20-24 25-29 30-34 35-39 40-44 > 45
naissances 38638/3 111 291/23 119138/55 48 165,41 14252,47 3387/37 234/16
mortinaissances 303/7 874/77 936,45 378/59 112/03 26/63 1/84

26

x2 = 306,65. Le point critique a 6 degres de liberte etant 12,59, on rejette l'hypothese


d'independance: le taux de mortinatalite depend de l'age de la mere. Le tableau des
distributions conditionnelles du numero 6 montre, en gros, que la probabilite d'une mortinaissance
augmente avec l'age.

11. Effectifs theoriques, calcules a partir des 5483 qui ont repondu.

Scolarite
Classe Elementaire Secondaire Collegial U niversi taire Total
ou moins
Superieure 256,4 207,9 92,6 32,1 589
Interrnediaire 741,8 601,4 267,9 92,9 1704
Inferieure 1388,8 1125,8 501,5 174 3190
Total 2387 1935 862 299 5483

x 2 = 863,1 , ce qui signifie qu'il y a sfirement une dependance entre la classe sociale et la scola­
rite. Les distributions conditionnelles suivantes montrent bien que plus le niveau social est
eleve, plus Ie niveau de scolarite est eleve.

Scolarite
Classe Elementaire Secondaire Co~egial Universitaire
ou moins
Superieure 0,183 0~26 0,258 0,233 1
Interrnediaire 0,309 0~91 0,230 0,069 1
Inferieure 0,549 0,337 0,100 0,014 1
0,435 0,353 0,157 0,055 1

12. a) Void Ie tableau des distributions conditionnelles:

Classe
Niveau Superieure Interrnediaire Inferieure Total
Elementaire 0,078 0,281 0,642 1,001
Secondaire 0,107 0,309 0,584 1,000
Collegial 0,130 0,352 0,518 1,000

L'intention est sans doute de faire remarquer que, par exemple, on trouve proportionnellement
plus de personnes de classe superieure au collegial (13%) qu'au secondaire (10,7 %) ou a
I'elernentaire (7,8 %).
b) L'hypothese nulle: Ie phenornene «d ro p -ou t» ne touche pas les enfants d'une classe plus que
ceux d'une autre. Supposant cette hypothese vraie, la distribution des enfants selon la classe
sociale est la meme a tous les niveaux. Voici les effectifs theoriques:

Effectifs theoriques
Niveau Superieure In termediaire Inferieure Total
Elementaire 43,35 124,94 230,71 399
Secondaire 606,53 1747,9 3227,57 5582
Collegial 103)2 297,16 548,72 949
753 2170 4007 6930

x 2 = 22,62, avec 4 degres de liberte. Cela etant significatif, nous pouvons conclure que la
distribution de la classe sociale varie avec le niveau: en general, il y a relativement moins
d'eleves de la classe sociale inferieure aux niveaux eleves,

13. a) Le taux de renouvellement a ete de 21 749/(21 749+21 071) = 50,8 % en janvier et de 4733/(4
733+2 155) = 68,7% en fevrier. Done il y a une amelioration dans le taux de renouvellement.

27
b) Void les taux de renouvellement pour chaque categoric. Categoric A: janvier, 81/2%; fevrier,
79,6%. Categoric B: janvier, 78,9%; fevrier, 76%. Categoric C: janvier, 20,8%; fevrier,
14/1%. Dans chaque categorie il y a une baisse dans Ie taux de renouvellement alors que
globalement il y a eu une hausse. Cette hausse globale est due surtout a une diminution
disproportionnee d'abonnements dans la categoric C/ une categoric ou Ie taux de
renouvellement est particulierement bas.

14. a) II s'agit de tester l'hypothese d'independance entre l'origine ethnique et la connaissance de


l'anglais. Les effectifs theoriques sont:

Connaissanc Origine ethnique


de l'anglais Francaise Anglaise Autres Total
Unilingues 3077/83 177,07 159/10 3414

Connaissent 2745,17 157/93 141/90 3045


l'anglais
Total 5823 335 301 6459

x 2 = 43/7/ avec 2 degres de liberte. II y a done des differences entre les 3 groupes .

b) Le tableau sur lequel Ie test est base est

Connaissance Origine ethnique


de l'anglais Francaise Anglaise Total
Unilingues 3156 142 3298

Connaissent 2667 193 2860


l'anglais
Total 5823 335 6158

Le tableau des effectifs theoriques est:

Connaissanc Origine ethnique


de I'anglais Francaise Anglaise Total
Unilingues 3118/6 179,4 3298

Connaissent 2704,4 155,6 2860


I'anglais
Total 5823 335 6158

La valeur de X2 est 17/75/ avec 1 degre de liberte, ce qui est significa tif (point critique de
3/84). II Y a done une difference entre les deux groupes ethniques quant a la connaissance de
l'anglais. Les distributions conditionnelles suivantes montrent que ce sont les personnes
d 'origine ethnique anglaise qui Ie plus souvent connaissent l'anglais.

Origine ethnique
Francaise Anglaise
Unilingues 0/542 0,424

Connaissent 0,458 0,576


I'a nglais
Total 1/000 1,000

28

15. Il s'agit de trois tests d'independance bases sur les tableaux d'effectifs observes suivants:

Sa von A Groupe
Temoin Experimental
Achete 15 17 32
Pas achete 785 783 1568
800 800 1600

Cereales B Groupe
Temoin Experimental
Achete 31 44 75
Pas achete 769 756 1525
800 800 1600

Diner congele Groupe


Temoin Experimental
Achete 12 24 36
Pas achete 788 776 1564
800 800 1600

Les effectifs theoriques sont presentes schematiquernent dans Ie tableau suivant::

A B C
16 16 37/5 37/5 18 18
784 784 762/5 762/5 782 782

Savon A : X2 = 0/128 avec 1 degre de liberte. Les annonces ne semblent pas avoir d'effet.
Cereales B : X2 = 2/36 avec 1 degre de liberte. Les annonces ne semblent pas avoir d'effet.
Orner congele C: x2 = 4/09/ avec 1 degre de liberte. Les annonces ont un effet: ceux qui voient les
annonces sont plus portes a acheter Ie diner congele,

La proportion d'acheteurs du produit a ete de 1/5% pour Ie groupe temoin et 3% pour Ie groupe
experimental. La difference entre les deux est petite et n'aurait pas ete trouvee significative
avec un echantillon plus petit. Par exemple, si ces memes proportions avaient ete observees
avec des echantillons de 600/ la valeur de X2 aurait ete X2 = 3/07/ ce qui n'est pas significatif.

16. Les test ici sont tous a 1 degre de liberte. Le point critique est done 3/84.

Etat matrimonial Les effectifs theoriques sont:

Lecteur Non lecteur


Marie 675/94 190/06 866
Pas marie 206/06 57/94 264
822 248 1130

x2 = 2/85/ ce qui est non significatif. Le fait d'etre marie ou non n'est pas Iiee a la tendance a
lire les annonces publicitaires.

Scolarite Les effectifs theoriques sont:

Lecteur Non lecteur


Secondaire ou moins 581/4 170/6 752
Universite 287/6 84,4 372
869 255 1124

29

x2 = 3,09, ce qui est non significatif. La scolarite ne semble pas etre lie a la tendance a lire les
annonces publicitaires.
Sexe Les effectifs theoriques sont:

Lecteur Non lecteur


Femmes 429,26 124,74 554
Hommes 451,74 131,26 583
881 256 1137

x2 =55,12, ce qui est tres significatif. Les distributions conditionnelles suivantes montrent que la
proportion de lecteurs est plus elevee parmi les hommes.

Lecteur Non lecteur


Femmes 0,68 0,32 1,0
Hommes 0,86 0,14 1,0

Taille de la famille Les effectifs theoriques sont:

Lecteur Non lecteur


1 98,34 28,66 127
2 301,23 87,77 389
3 191,29 55,73 247
4 173,46 50,54 224
5+ 117,70 34,30 152
882 257 1139

x2 = 0,453, ce qui est non significatif. Le pourcentage de lecteur est Ie merne, quelle que soit la
taille de la famille. Finalement, un seul facteur semble influencer la lecture des annonces: les
hommes ont plus tendance a les lire.

17. Les effectifs theoriques sont:

Score au SAT
Ma thema tiques Orientaux Blancs Total
700-800 455,86 22709,14 23165
600-690 1742,02 86779,98 88522
500-590 3173,01 158066 161239
400-490 3035,55 151218,4 154254
300-390 1491,8 74315,21 75807
200-290 198,76 9901,24 10100
10097 502990 513087

x2 = 130,4 » 11,07. On rejette l'hypothese. La conclusion est qu'il y a une dependance entre la
race et Ie score; ou que la distribution des scores des Orientaux est differente de celle des Blancs.
Les distributions conditionnelles suivantes permettent la conclusion que les Orientaux ont de
meilleurs scores.

30

Score au SAT
Ma thema tiques Orientaux
Blancs
700-800 0,05 0,05 0,05
600-690 0,20 0,17 0,17
500-590 0,32 0,31 0,31
400-490 0,28 0,30 0,30
300-390 0,13 0,15 0,15
200-290 0,01 0,02 0,02
1,00 1,00 1,00

18. Le nombre de degres de liberte est de 3 dans chaque cas. Le point critique est 7,815.

Reglementation de la presse Les effectifs theoriques sont:

Zero Faible Fort Tres fort


D'accord 32,77 32,43 32,43 15,36 113
Pas d'accord 63,23 62,57 62,57 29,64 218
96 95 95 45 331

x2 = 68,18. 11 Y a une relation certaine entre le degre de fondamentalisme et la preference pour


une reglementation de la presse plus rigoureuse. Le tableau des distributions conditionnelles
suivantes montre que plus un repondant est fondamentaliste, plus il a de chance de preferer la
reglernenta tion.

Zero Faible Fort Tres fort


D'accord 0,16 0,26 0,37 0,84 0,34
Pas d'accorc 0,84 0,74 0,63 0,16 0,66
1,00 1,00 1,00 1,00 1,00

Bibliotheques Les effectifs theoriques sont:

Zero Faible Fort Tres fort


D'accord 68,8 68,1 66,7 69,5 273,1
Pas d'accord 29,2 28,9 28,3 29,5 115,9
98,0 97,0 95,0 99,0 389,0

x2 = 34,46. Les distributions conditionnelles suivantes montrent que les fondamentalistes ont
davantage.tendance a favoriser le contr6le des livres dans les bibliotheques,

Zero Faible Fort Tres fort


D'accord 0,87 0,79 0,62 0,53 0,70
Pas d'accord 0,13 0,21 0,38 0,47 0,30
1,00 1,00 1,00 1,00 1,00

Television Les effectifs theoriques sont:

Zero Faible Fort Tres fort


D'accord 73,9 73,13 72,37 71,6 291
Pas d'accord 22,1 21,87 21,63 21,4 87
96 95 94 93 378

x2 = 30,992. 11 Y a une dependance entre le degre de fonda mentalisme et la tendance a vouloir


contr6ler les emissions de television. Les distributions conditionnelles suivantes montrent que ce
sont les fondamentalistes qui favorisent les contr6les.

31
Zero Faible Fort Tres fort
D'accord 0,92 0,84 0,71 0,60 0,77
Pas d'accord 0,08 0,16 0,29 0,40 0,23
1,00 1,00 1,00 1,00 1,00

19. a) Le tableau des effectifs observes a partir duquella valeur de X2 est calculee est celui-ci:
Quebec Pays angl,
Bilingues 3098 132 3230
Unilingues 3770 32 3802
6868 164 7032

Le tableau des effectifs theoriques est:

Quebec Pays angl.


Bilingues 3154,67 75,33 3230
Unilingues 3713,33 88,67 3802
6868 164 7032

x2 = 80,7 a 1 degre de Iiberte,


La proportion d'unilingues est plus elevee parmi ceux qui sont
nes au Quebec que parmi ceux qui viennent de pays anglophones (55% contre 20% dans
I'echan tillon).

b) Effectifs observes:

Lieu de naissance
Quebec et pays Pays Autres pays
Francophones anglophones
Bilingues 3159 132 15 3306
Unilingue 3842 32 7 3881
7001 164 22 7187

Effectifs theoriques:

Lieu de naissance
Quebec et pays Pays Autres pays
Francophones anglophones
Bilingues 3220,4 75,4 10,1 3306
Unilingues 3780,6 88,6 11,9 3881
7001 164 22 7187

x2 = 85,21, a 2 degres de liberte. Le fait d'etre bilingue ou pas depend du lieu de naissance.
Les distributions conditionnelles suivantes donnent une indication de la nature de la
dependance:

Lieu de naissance
Quebec et pays Pays Autres pays
Francophones anglophones
Bilingues 0,451 0,805 0,682 0,46
Unilingues 0,549 0,195 0,318 0,54
1,000 1,000 1,000 1,00

32

20. a) Tableau des distributions conditionnelles de Y:

x y
Y1 Y2
xl 0,75 0,25 1
x2 0,67 0,33 1
0,70 0,30 1

b) Lorsque l'effectif total est 100, les effectifs observes sont:

X Y
Y1 Y2
xl 30 10 40
x2 40 20 60
70 30 100

et les effectifs theoriques sont:

X Y
Y1 Y2
xl 28 12 40
x2 42 18 60
70 30 100

x2 = 0,79. Lorsque l'effectif total est 1000, chacun des effectifs des tableaux ci-dessus est
multiplie par 10, et la valeur de X2 egalement. Done lorsque l'effectif total est 1000, X2 =
7,9. La dependance relativement faible observee en a) peut etre attribuee au hasard lorsque
l'effectif est petit, mais elle est significative lorsque l'effectif est grand.

21. a) Effectifs observes:

Scolarite du pere Statut du di olome


Etudes Travail Inactif
Secondaire ou moms 808 11160 591 12559
Plus que secondaire 544 3727 230 4501
1352 14887 821 17060

Effectifs theoriques:

Scolarite du pere Statut du diplome


Etudes Travail Inactif
Secondaire ou moms 995,3 10959,31 604,39 12559
Plus que secondaire 356,7 3927,69 216,61 4501
1352 14887 821 17060

x2 = 148,65 a 2 degres de liberte, ce qui est significatif. II y a une dependance entre la


scolarite du pere et le statut du diplome. Les distributions conditionnelles suivantes montrent
que les diplornes dont le pere a une scolarite superieure au secondaire sont plus souvent aux
etudes.

Scolarite du pere Statut du diplome


Etudes Travail Inactif
Secondaire ou moms 0,064 0,888 0,047 1,00
Plus que secondaire 0,121 0,828 0,051 1,00
0,08 0,87 0,05 1,00

33
b) Effectifs observes:
Scolarite du pere Statut du diplome
Travail Inactif
Secondaire ou moin 11160 591 11751
Plus que secondaire 3727 230 3957
14887 821 15708

Les effectifs theoriques sont:

Scolarite du pere Statut du diplorne


Travail Inactif
Secondaire ou moins 11136,82 614,18 11751
Plus que secondaire 3750,18 206,82 3957
14887 821 15708

x2 = 3,66 a 1 degre de Iiberte. Si l'on se limite a ceux qui ne sont pas aux etudes, on ne peut
pas conclure que le pourcentage d'inactifs depend de Ia scolarite du pere. II semble done que
le resultat significatif obtenu en a) ci-dessus reflete essentiellement le fait que Ie pourcentage
de diplomes aux etudes n'est pas Ie meme dans les deux cas.

22. a) Effectifs observes:

Religion de l'epoux A epouse un coreligion­ N'a pas epouse un Total


naire coreligionnaire
Anglican 5469 7510 12979
Baptiste 2031 1954 3985
Catholique 23632 9810 33442
Eglise Unie 9632 8259 17891
40764 27533 68297

Effectifs theoriques:

Religion de l'epoux A epouse un coreligion­ N 'a pas epouse un Total


naire coreligionnaire
Anglican 7747 5232 12979
Baptiste 2379 1606 3985
Catholique 19960 13 482 33442
Eglise Unie 10678 7213 17891
40764 27533 68297

x2 == 3 717, a 3 degres de
liberte. 11 est evident que la tendance a epouser une coreligionnaire
depend de la religion de l'epoux. Ainsi 70% des catholiques le font, contre 42% pour les
anglicans.

b) Distribution de la religion de l'epoux des femmes baptistes:

Ba ptiste Non baptiste


IEffectifs observes 2031 1869 I
IEffectifs theoriques 1950 1950 I

x2 = 6,73 avec 1 degre de liberte. La proportion de femmes baptistes qui epousent des
coreligionnaires est superieure a 50%.

34
c) Homme catholique Homme baptiste
Femme baptiste Femme catholique
IEffectifs observes 806 861 I
IEffectifs theoriques 833,5 833,5 I

x2 = 1,814 avec 1 degre de liberte. Nous ne pouvons rejeter l'hypothese.

23. Les distributions conditionnelles de Y etant donne les va leurs de X sont donnees dans le tableau
suivant:

Y
X A B C Total
5-9 0,522 0,403 0,075 1,000
10-49 0,450 0,302 0,248 1,000
50+ 0,516 0,172 0,312 1,000

Les compagnies de toutes tailles ont des problemes de marche. Environ 50% ont ferme leurs
portes pour cette raison. Pour les petites compagnies, les problemes financiers sont serieux et les
problernes d'operation ne le sont pas. Pour les grandes compagnies, c'est le contraire. Le test
khi-deux poserait ici quelques problemes d'interpretation: de quelle population ces compagnies
sont-elles un echantillon?

24. L'hypothese est celle d' vindependance» entre les donnees de 74 et celles de 84, et done que le
comportement des hommes baptistes n'a pas change avec les annees, Les effectifs theoriques
sont:

Homme baptistes Homme baptiste


ayant epouse une n'ayant pas epouse
coreligionnaire une coreligionnaire
I 1974 2361,25 2. 612,75 I
I 1984 1 891,75 2093,25 I

x2 = 35,14 avec 1 degre de liberte. Les choses ont done change entre 1974 et 1984:
significativement moins d'hommes baptistes, en 1984, ont epouse des non coreligionnaires.

25. a) Effectifs theoriques:

Occupation
Langue maternelle Aux etudes Au travail Inactif ou Total
au chomage
Francais 240,7 2503,8 142,5 2887
Anglais 1047,9 10902,6 620,5 12571
Autre 133,5 1388,S 79 1601
1422 14795 842 17059

x2 = 431,16 a 4 degres de liberte. Les distributions conditionnelles suivantes montrent que les
Francophones ont le plus grand pourcentage de diplomes aux etudes; les anglophones ont le
plus grand pourcentage de diplomes au travail; et les allophones ont le plus grand
pourcentage de diplomes inactifs ou au ch6mage.

Occupation
Langue matemelle Aux etudes Au travail Inactif ou
Total au chomage
Francais 0,155 0,795 0,050 . 1,000
Anglais 0,060 0,896 0,044 1,000
Autre 0,136 0,771 0,094 1,000
0,083 0,867 0,049 1,000

35

b) Effectifs observes:

Occupation
Langue maternelle Au travail Inactif ou Total
au chomage
Francais 2294 145 2439
Anglais 11267 547 11814
Autres 1234 150 1384
Tous 14795 842 15637

Effectifs theoriques:

Occupation
Langue maternelle Au travail Inactif ou Total
au chornage
Francais 2307,7 131,3 2439
Anglais 11177,9 636,1 11814
Autres 1309,5 74,5 1384
Tous 14795 842 15637

x2 = 95,498 a 2 degres de liberte. On rejette l'hypothese que le taux de chomage est le merne
pour les 3 groupes linguistiques.

Distributions selon les lignes:

Occupation
Langue maternelle Au travail Inactif ou Total
au chomage
Francais 0,941 0,059 1,000
Anglais 0,954 0,046 1,000
Autres 0,892 0,108 1,000
Tous 0,946 0,054 1,000

26. Effectifs observes:

Premier-ne Cadet
Scientifique 51 62 113
Non scientifiqu 17 45 62
68 107 175

Effectifs theoriques:

Premier-ne Cadet
Scientifique 43,9 69,1 113
Non scientifiqu 24,1 37,9 62
68 107 175

x2 = 5,29 a 1 degre de liberte. La difference entre scientifiques et non scientifiques est


significative, comme le montre le tableau des distributions conditionnelles suivant, les
scientifiques ont une plus forte tendance a etre des premiers-nes,

Premier-ne Cadet
Scientifique 0,451 0,549 1,000
Non scientifique 0,274 0,726 1,000
0,389 0,611 1,000

36

27. Effectifs observes:

Pour Mixte Contre


Moins de 8 ans 31 23 56 110
Entre 9 et 12 ans 171 89 177 437
Plus de 12 ans 116 39 74 229
318 151 307 776

Effectifs theoriques:

Pour Mixte Contre


Moins de 8 ans 45,1 21,4 43,5 110
Entre 9 et 12 ans 179,1 85,0 172,9 437
Plus de 12 ans 93,8 44,6 90,6 229
318 151 307 776

x2 = 17,71 a 4 degres de liberte. II y a une dependance entre le niveau de scolarite et l'attitude


face a l'avortement: selon les distributions conditionnelles ci-dessous, l'attitude face a
l'avortement est plus favorable parmi ceux qui ont un haut niveau de scolarite.

Pour Mixte Contre


Moins de 8 ans 0,282 0,209 0,509 1,000
Entre 9 et 12 ans 0,391 0,204 0,405 1,000
Plus de 12 ans 0,507 0,170 0,323 1,000
0,410 0,195 0,396 1,000

Catholiques

Effectifs observes:

Pour Mixte Contre


Moins de 8 ans 8 10 24 42
Entre 9 et 12 ans 65 39 89 193
Plus de 12 ans 37 18 43 98
110 67 156 333

Effectifs theoriques:

Pour Mixte Contre


Moins de 8 ans 13,9 8,5 19,7 42
Entre 9 et 12 ans 63,8 38,8 90,4 193
Plus de 12 ans 32,4 19,7 45,9 98
110 67 156 333

x2 = 4,76 a 4 degres de liberte. Chez les catholiques, l'attitude face a l'avortement n'est pas

influencee par la scolarite,

Protestants

Effectifs observes:

Pour Mixte Contre


Moins de 8 ans 23 13 32 68
Entre 9 et 12 ans 106 50 88 244
Plus de 12 ans 79 21 31 131
208 84 151 443

37
Effectifs theoriques:

Pour Mixte Contre


Moins de 8 ans 31,9 12,9 23,2 68
Entre 9 et 12 ans 114,6 46,3 83,2 244
Plus de 12 ans 61,S 24,8 44,7 131
208 67 151 443

x2 = 16,82 a 4 degre de liberte. Puisque le point critique est 9,488 on conclut que l'attitude face a
l'avortement depend du niveau de scolarite: plus favorable parmi les plus scolarises,

Distributions conditionnelles:

Pour Mixte Contre


Moins de 8 ans 0,338 0,191 0,471 1,000
Entre 9 et 12 ans 0,434 0,205 0,361 1,000
Plus de 12 ans 0,603 0,160 0,237 1,000
0,470 0,190 0,341 1,000

28. a) Effectifs observes:

Cancereux Sain
Bien dorrni 18 18 36
Mal dormi 12 6 18
30 24 54

Effectifs theoriques:

Cancereux Sain
Bien dormi 20 16 36
Mal dormi 10 8 18
30 24 54

x2 = 1,35 a 1 degre de liberte, Le cancer ne semble pas avoir d'effet sur le sommeil.

b) Effectifs observes:

Cardiaque Sain
Bien dorrni 5 18 23
Mal dorrni 22 6 28
27 24 51

Effectifs theoriques:

Cardiaque Sain
Bien dormi 12,2 10,8 23
Mal dormi 14,8 13,2 28
27 24 51

x2 = 16,4 a 1 degre de liberte. 11 y a done une dependance entre le fait d'etre cardiaque ou
pas et la tendance a mal dormir; les cardiaques dorment moins bien. Ce que l'on peut voir
par les distributions conditionnelles suivantes:

38
Cardiaque Sain
Bien dorrni 0,185 0,750 0,451
Mal dormi 0,815 0,250 0,549
1,000 1,000 1,000

29. a) X2 = 10,85, avec 2 degres de liberte. Les faiblement scola rises vont plus souvent au Quebec et
moins souvent a l'exterieur du continent.
b) Oui. Les faiblement scolarises ont generalement un revenu plus faible, et il est possible que
ce so it le revenu faible et non la scolarite faible qui explique pourquoi ils ont tendance a
rester au Quebec.
c) 11 faudrait prelever des donnees assez nombreuses pour pouvoir dresser un tableau comme
celui qui est donne dans l'exercice, pour chaque niveau de revenu; et un tableau qui montre le
lien entre la direction prise et le revenu, pour chaque niveau de scolarite, Void des tableaux
fictifs qui illustrent ce phenomene:

Revenus faibles:

Direction prise

Reste du Canada Hors

Scolarite Quebec et continent continent TOTAL

americain

0-11 ans 150 75 25 250

12 ans + 150 75 25 250

TOTAL 300 150 50 500

Revenus eleves:

Direction prise

Reste du Canada Hors

Scolarite Quebec et continent continent TOTAL

america in

0-11 ans 20 40 40 100

12 ans + 80 160 160 400

TOTAL 100 200 200 500

Lorsqu'on rassemble les deux tableaux on trouve qu 'il y a une dependance entre la scola rite et
la direction prise.

30. Test d'independance

Effectifs theoriques:

Garcons Fiiles Total


Secte 25,767529 24,232471 50
Autres 179 786,232 5 169 075,7675 348862
Total 179812 169100 348912

x2 = 2,192 7, avec 1 degre de liberte. 11 n'y a pas d'evidence que la repartition des sexes dans
cette secte est differente de ceile de la population.

Test d 'ajustement. Ce test est base sur le fait que la proportion de gan;ons dans la population
generale est 179781/348 862 = 0,515 336. On teste alors l'hypothese que la probabilite d'avoir
un gar<;on parmis les gens de cette secte est 0,515 336. On obtient done les effectifs suivants:

39
Garcons Filles
Effectifs observes 31 19 50
Effectifs theoriques 25,766778 24,233222 50

x2 = 2,192 99, avec 1 degre de liberte. Ce deuxieme test n'est pas strictement correct, car il
considere les 348 862 naissances comme la population a laquelle on veut comparer les membres de
la secte religieuse. Or malgre sa taille, cet ensemble de naissances n'est qu'un echantillon, issu
d'une population assez vague dont la definition pourrait etre celie-ci: c'est l'ensemble de toutes
les naissances possibles dans une population qui ne se livre pas aux pratiques sexuelles de cette
secte. Le test d'independance effectue plus haut traite le 348 862 naissances comme un
echantillon.

31. a) Cette procedure teste correctement l'hypothese qu'Arthur a une chance sur 2 de faire une
bonne prediction. La conclusion du test est qu'Arthur a plus d'une chance sur 2 de faire une
bonne prediction. Mais il est incorrect de conclure de la qu'il a des capacites particulieres de
prevision du temps. Son taux eleve de succes vient du fait qu'il a tendance a predire de la
pluie souvent et qu'il vit dans un pays ou il pleut souvent.

b) Le test correct est base sur le tableau suivant:

De la pluie a Du beau temps


Temperature ete predite a ete predit TOTAL
Il pleut 70 30 100
Il fait beau 30 20 50
Total 100 50 150

x2 = 1,5. n pleut aussi souvent lorsqu'Arthur predit de la pluie que lorsqu'il predit du beau
temps.

32. Des 300 scientifiques appartenant a des families de 2 enfants, la moitie, soit 150, devraient etre
prerniers-nes: des 60 appartenant a des familles de 3 enfants, 20 devraient etre premiers-nee.
Done le nombre de premiers-nes parmi les 360 scientifiques est theoriquement 150 + 20 = 170. Par
un raisonnement semblable, le nombre de premiers-nee parmi les 360 non scientifiques est
theoriquement 30 + 100 = 130.

33. a) L'enonce formel du problerne traite au nurnero 17 est le suivant: on dispose d'un echantillon de
chacune de deux populations (les Orientaux et les Blancs), et on veut tester l'hypothese que
la distribution d 'une certaine variable (Ie score au SAT) est la meme dans les deux
populations. C'est le test d'independance qui s'applique et qui est utilise correctement au
numero 17. Le test decrit dans ce numero et traite au chapitre 1, s'emploie dans les
circonstances suivantes: on dispose d'un echantillon issu d'une certaine population (un
echantillon d'Orientaux issu d'une population d'Orientaux) et on veut tester l'hypothese que
la distribution dans la population est donnee par certaines frequences I}, 12 ,.··, 16 (en
l'occurence, 0,045, 0,172,..., 0,020). Le test decrit ici ne s'applique done que si ces frequences
sont vraiment celles auxquelles on veut comparer celles des Orientaux. Mais ce n'est pas le
cas, car on ne veut pas comparer les frequences des Orientaux a celles des seuls 502990 Blancs:
on veut les comparer aux frequences reelles des Blancs de la population, et celles-ci ne sont pas
connues. Elles sont esiimees par les frequences observees dans l'echantillon.

b) Scores
700-800 600-690 500-590 400-490 300-390 200-290
Effectifs observes 601 2001 3190 2788 1309 208 10 097
Effectifstheoriques 454,4 1736,7 3170,5 3039,2 1494,4 201,9 10097,1

x2 = (601-454,4)2/454,4 + (2001-1736,7)2/1736,7 +...+ (208-201,9)2/201,9 = 47,3 + 40,2 + 0,1 +


20,8 + 23,0 + 0,2 = 131,6. Cette valeur est tres proche de celie obtenue au numero 18. Dans la
procedure decrite ici, nous comparons la distribution des Orientaux a une distribution

40
supposee connue. Au numero 17, nous comparons a une distribution qui doit etre estimee. Mais
l'echantillon des Blancs etant tres grand, la distribution estimee est tres proche de la
distribution reelle et les deux procedures sont alors tres semblables.

34. a) C'est un test d'independance sur l'ensemble des donnees. Les effectifs theoriques sont:

boivent habituellement
ont prefere A B
A 55 55 I 110
B 45 45 I 90

x2 = 8,08, significatif (I degre de liberte): il y a une difference.

b) Test d'ajustement sur l'ensemble des buveurs de B. Les effectifs sont

Ont prefere
A B
Effectifs observes 45 55
Effectifs theoriques 50 50

x2 = 1; les buveurs de la biere B ne semblent pas faire la difference.


c) Test d'ajusternent parmi les buveurs de A.

Ont prefere
A B
Effectifs observes 65 35
Effectifs theoriques 50 50

x2 = 9; les buveurs de A font la difference.

d) Test d'independance pour les buveurs des deux marques de biere quant a leur capacite a
discriminer. Voici le tableau des effectifs.

Boivent habituellement
A B
discriminent Effectifs observes 65 55 120
Effectifs theoriques 60 60
ne discriminent pas Effectifs observes 35 45 80
Effectifs theoriques 40 40

x2 = 2,083 3, avec 1 degre de Iiberte: il n'y a pas de difference significative entre les buveurs
de A et ceux de B.

41

CHAPITRE 4

1.
14
12 • Onan=4

10 +- Dzoite des
Xl =2 Y1 =5
moindzes
i 8 • canes x2 =3 Y2 =8
y • x3=5 Y3=7
~ 6 x4=7 Y4 =12

o
o 2 4 6 8 10

'-X--+

a) En utilisant la droite Y = 1 + 2x, on obtient Y1 = 1 + 2x1 = 1 + (2 X2) = 5,


Y2 = 1 + (2 X3) = 7, Y3 = 1 + (2 x 5) = 11 et Y4 = 1 + (2 x 7) = 15. La distance 0 vaut done
4
0= I/Yi - Yi=02+1 2+42+32=26.
i = 1
b) En utilisant la droite Y = 2 + 2x, on obtient Y1 = 2 + (2 x 2) = 6, Y2= 8, Y3 = 12 et Y4 = 16. La
distance 0 vaut done 0 = 12 + 02 + 52 + 42 = 42.
• 1\ 1\ 1\ 1\ 2
c) La droite Y = 3 + l,lx donne Y1 = 5,2, Y2= 6,3, Y3 = 8,5 et Y4 = 10,7. On trouve done 0 = (0,2) +
0 ,7)2 + 0 ,5)2 + 0 ,3)2 = 6,87.

Lxi = 2 + 3 + 5 + 7; ~\ = 87; LYi = 32; LXiYi = 153.

b n LXiYi - (Lxi)(LYi) (4 x 153) - 07 x 32) = 68 = 1 1525.

nLx? -( L Xi)2 (4 x 87) - 17 2 59'

1
_ _ 32 17

a= Y -b x ="'4 -l,1525x"'4 =3,102.

En utilisant la droite des moindres carres, on trouve Y1 = 5,407, Y2= 6,559, Y3= 8,864 et
Y4= 11,169. On a done 0 = (0,407)2 + 0 ,441)2 + 0 ,864)2 + (0,831)2 = 6,41.

2. 2
n = 4, LXi = 25, LYi = 40, LXi = 211, LXiYi = 211.
(4 x 211) - (25 x 40) -156 _ _
b 2 = 219 = -0,712. a = Y - b x = 10 - (-0,712 x 6,25) = 14,45.
(4 x 211) - 25

La droite de regression est done Y = 14,45 - O,712x.

42
15


10
i
y
1 5

o
o 5 10 15
+- to( -+

3. La droite est horizontale. Pour tout x, Y = 6.

4. Lorsqu'il n'y a que deux points (avec xl ~ x2)' on peut toujours faire passer une droite exactement
par ces deux points. On trouvera alors 0 = 0 puisque les deux points sont exactement situes sur la
droite. Si xl = x2' la droite de regression n'est pas definie (la pente est arbitraire).

5. n = 6, LXi = 21, LYi = 77, LXi2 = 91, LXiYi = 320, Y = 2,733 + 2,886x.
A A A A A A
Y1 = 5,62, Y2= 8,50, Y3 = 11,39, Y4 = 14,28, Y5 = 17,16 et Y6 = 20,05.
L(Yi - Yi) = 0,38 + 0,50 - 1,39 + 0,72 - 1,16 + 0,95 = 0

L(Yi - Yi)2 = (0,38)2 + (0,50)2 + (-1,39)2 + (0,72)2 + (1,16)2 + (0,95)2 = 5,10

On peut montrer que la somme L(Yi - Yi) vaut toujours zero.

6. a)
6

i 3
Y
12
1

0
0 1 2 3 4 5 6
+-- to( --+
b) n = 10, LXi = 27, LYi = 43,5, LX~ = 95,5, LXiYi = 128,75. b = 0,5, a = 3.
Y = 3 + 0,5x. 0 = 0 (les points sont exactement alignes le long de la droite).
c) L'equation Y = 3 + 0,5x correspond a la structure tarifaire typique des taxis: un montant fixe,
plus tant du kilometre. lei le montant fixe est $3 et le taux par kilometre est de $0,50/km.

43
7. On n'obtient pas la meme droite en general. La droite des moindres carres minimise la somrnes
des carres des distances verticales IYi - }\ I; l'ecart IYi - YiI represente l'erreur comrnise lorsqu'on
estime Yi par Yi. Si on interchange X et Y on se trouve a minimiser la somme des carres des
distances horizontales, c'est-a-dire, les erreurs commises en estimant X a partir de Y. Dans
l'exercice 1/ on avait obtenu la droite de regression Y = 3/102 + 1/1525x. La somme des carres des
ecarts verticaux etait 6,41. Si on reprend les calculs en remplacant les x par les Y et les Y par les x,
on obtiendra la nouvelle droite de regression x = -0/981 + 0/6538y. Avec cette nouvelle droite, la
somrne des carres des ecarts horizontaux est minimisee et vaut 3/63. C'est ce type de regression qu'il
conviendrait de faire si on voulait exprimer x en fonction de Y (plutot que yen fonction de x).
14

dxoite qui
12
minimise les
ecaxts +--- dx.oi.te 9,ui
10
mmrrruse Remarquons que les deux droites
horizontaux
les ecaxts
de regression se rencontrent au
i 8 verticaux «centre de gravite- du nuage de
Y • points, c'est-a-dire, precisement
16 au point (x/y) = (4/25;8).

o
o 2 4 6 8 10
+- N-+

8. Y = -7/10 + 1/13 (5) = -1,45. Une note negative ne peut pas etre consid eree comme une estimation
raisonnable. Le modele que nous avons adopte, qui suppose que Y est lie a X par une equation
lineaire, n'est pas correct a. l'exterieur d'un certain intervalle des valeurs de X.

20 •

15

t
y 10
1
5

o
10 15 20 25 30
+- N -+

9. n = 4/ LXi = 25/ LXf = 211/ LYi = 40/ LY~ = 430/ LXiYi = 211.
(4 x 211) - (25 x 40)
r= -0/962.

-V (4 x 211 - 252)(4 x 430 - 40 2)

44

Une telle valeur de r, voisine de -1, indique un alignement tres net le long d'une droite de pente
negative (voir graphique presente dans la solution de l'exercice 2).

10. Le coefficient de correlation vaut +1 ou -1 car la droite des moindres carres passera exactement
par les deux points. Si les deux points ont la meme valeur pour x (alignement vertical) ou la
rneme valeur pour Y (alignement horizontal), Ie coefficient de correlation n'est pas defini: la
formule mene a une indetermination 0/0.

11. Puisque tous les points sont exactement alignes le long d'une droite de pente positive, le
coefficient de correlation vaut 1.
12. n = 11, LXi = 55, LX~ = 385, LYi = 142, LY~ = 2 284, LXiYi = 710, r = o.
30

25

20
i • •
y 15 • •
1
10 • •

5
• •

0 2 4 6 8 10 12
+- >ol --+
Les variables X et Y sont visiblement depend antes. Cette dependance n'est cependant pas
lineaire (on a une relation en V). Le coefficient de correlation vaut zero.

13. Les donnees sont

et Ie coefficient de correlation est r = -0,962 (voir exercice 9)

En remplacant toutes les valeurs de x par 2 + 4x et toutes les valeurs de Y par 30 + 2y, on obtient
le nouveau tableau suivant:
~

On a done n = 4, LXi = 108, LX~ = 3 792, LYi = 200, LY~ = 10 120, LXiYi = 5 088, r = -0,962.

En remplacant to utes les valeurs de x par 2 + 4x et toutes les valeurs de Y par 30 - 2y, on obtient

le nouveau tableau suivant:

2 2
On a done n = 4, LXi = 108, LXi = 3 792, LYi = 40, LYi = 520, LXiYi = 1 392, r = 0,962.
En general, si on remplace tous les x par a + bx et tous les Y par c + dy, la valeur absolue du
coefficient de correlation ne sera pas rnodifiee. Seul son signe sera change si l'un ou l'autre des
nombres b et d est negatif, Si les deux constantes b et d sont negatives, le nouveau coefficient de
correlation sera exactement le meme que le premier.

45
14. Si on echange X et Y dans la formule, on obtient la merne formule. Done le coefficient d e correlation
ne change pas.

15. L'ech antillon {O,3), (2,2), (3,1)) donnera r = -1 4

:~::r~:l~::~r·=·:
··..·..··T·····..·T"·······T······..·
o
o 1 2 3 4

L'echantillon {O,I), (2,2), (3,3») donnera r = 1 4


3 : : ,i, ..

r::·-:r·:·1::I ::
O+--j---;---r--,.
o 1 2 3 4
+- N -+
L'echantillon {O,I), (2,2), (3,1») donnera r =0 3

i 2 ..........~: :
~
:
.
y
~ 1
··tl--r
o +--j----;---+--,­
o 1 2 3 4

L'echantillon {O,I), (2,3), (3,3») donnera r = 0,866


4

i 3 ·..· ·!··....·.. l·.. . .·r··..··


I : :···f .::.;.: .f··:··
o-l--i-----r----i---r­
o 1 2 3 4
+- N-+
Pour l'ensemble des 9 points qui forment la population, le coefficient de correlation vaut O.

46
16. Les variables sont consid erees reellement dependantes si IZ I > 2 ou Z = ~~
2
" 1-r

a) Si r = 0,1, on a Z = 0,53 ( IZ I < 2)

b) Si r = 0,2, on a Z = 1,08 (I Z I < 2)

c) Si r = 0,3, on a Z = 1,66 ( IZ I < 2)

d) Sir = 0,4, on a Z = 2,31 (I Z I > 2)

e) Sir= -O,2,onaZ=-l,08 (IZI < 2)

f) Si r = -0,5, on a Z = -3,06 ( IZ I > 2)

On n e peut declarer que les variables sont dependantes que dans les cas d) et D.

17 . a) Si n = 5, on a Z = 0,76 (I Z I < 2) .
b) Si n = IS, on a Z = 1,57 (I Z I < 2)
c) Si n = 20, on a Z = 1,85 (I Z I < 2)
d) Si n = 30, on a Z = 2,31 > 2) (I Z I
Seulement dans le dernier cas peut-on conclure que les variables sont reellement dependantes.

18. a) Puisque c'est la scolarite qui peut avoir une influence sur les habitudes de lecture, et non
l'inverse, nous prenons X = scolarite et Y = nombre de revues ou livres.

b)

1:~ •

i 6 •

r 4

2 •

0
6 8 10 12 14 16 18 20
+- N -+
n = 17, ~xi = 231, ~xf = 3 331, ~Yi = 80, ~yf = 458, ~xiYi = 1200, r = 0,902.
(17 xl 200) - (231 x 80) 80 231
c) b= (17 x 3 331) _ (231 x 231) =0,588. a = 17 - 0,558 x ""17= -3,28.
La droite de regression est Y = -3,28 + O,588x.

d) Z
__ ...In-2 r __ m 0.902
---;:====:....;:~ 8,09, ce qui est tres significatif.
£2 .y 1 - (0.902)2
Nous concluons que le nombre de revues et livres Ius depend de la scolarite.

47
19. a)
15

o
o

13
<>
o
o

i <>
... lO1. te d
"d ' . n
e :.:egtess1Cf
Y 11 point --+ o <>
(voiz b)
double
L §

9
/
o +-- point triple

7
1 2 3 4 5 6
+- N -+

(25 x 887.92) - (72.8 x 288.7)


r= 0,904
--J (25 x 240.54 - (72.8)2)(25 x 3 429.57 - (288.7)2)
(25 x 887.92) - (72.8 x 288.7) 288.7 1.654 x 72.8
b) b 1,654 a=--­
25 25
= 6,73
(25 x 240.54) - (72.8)2
Y = 6,73 + 1,654x.

c) Avec x = 4, on trouve y= 6,73 + 1,654 x 4 = 13,35 (litres par 100 km),

48

20. a)
9


•• / droi te. de 1egtessicm
i
y 8 •
!
,/ point double



• •
7
140 160 180 200 220 240 260
+- N -+
r = -0,884
b) Y = 10,99 - 0)7x.

2l. a)
1200

1000
d:oite~e - ,
1egtesslcm
i 800
y
! 600
400

200
OA 0,6 0,8 1,0 1,2 lA
+­ N-+

n = 12, LXi = 10,12, Lxf = 9,317 8, LYi = 6 500, Lyf = 4 118 ISO, LXiYi = 6 164A5, r = 0,9982
b) Y = -193A8 + 871,71x
1\
c) Avec x = 1,00, on trouve Y = -193A8 + 871,71 x 1,00 = 678,23.

49

22. a)
320

300

280

260

i
y
240




~ droi te de legtession
1 220 •»:
•• ••
200 •
180
160

140
70 80 90 100 110 120 130 140 150
+- N ---+

r = 0,6240

b) y = -2,32 + 2,255x

1\
c) Avec x = 118, Y = -2,32 + 2,255 (118) = 263,8

d) Le nombre de pIantules ne peut pas croitre indefinirnent.

23, a)
320

droite de •
300 '~~."i:" ~ :
i •
y 280 • •

1

260 • •


240 -t-----,----.--...,...----,--.....,..--r---,--..,..-----,--,--..----.-.....,..---,r­
40 50 60 70 80 90 100 110
+- N ---+
r =0,737
b) y = 217,47 + O,777x

c) Z ~ r-;:)=
=_ n-2 r 4, 37, ce qUI' est tres , ificati'f"
. slgm II sembl e bilen yavOlr
" deepend ance en tr e Ie pOlid S e t
'J 1-r2
le taux de cholesterol.

50
24.

500

a) r = 0,897; Z = 10,76. 11 semble y avoir une forte correlation entre l'aptitude verbale et les
ventes.
b) Pour chaque groupe, le coefficient de correlation est nul. 11 ne semble done pas y avoir de
relation de cause a effet entre l'aptitude verbale et les ventes. Mais l'age a une influence sur
l'aptitude verbale et, parce qu'il a une relation avec l'anciennete, il a aussi une influence sur
les ventes. C'est cette influence de l'age sur l'aptitude verbale et sur les ventes qui fait que
ces deux dernieres variables sont liees,

25.
90

80

• •• •
i 70

y •

1 • •

60

50

40

40
.: 50

••

60 70

80 90 100

+- x ---+­
La droite des moindres carres est y = -14,1 + l,31x pour le groupe A et y = -29,3 + l,23x pour le

~roupe B. Considerons un etudiant moyen avec une note X = 70. Sa note en calcul est estimee par

y = -14,1 + 1,31 x 70 = 77,6 s'il a suivi le cours de rattrapage, et par y = -29,3 + 1,23 x 70 =

56,8 s'il n'a pas suivi le cours de rattrapage. On s'attend donc a ce qu'il ait une meilleure note

en calcul s'il a suivi le cours de rattrapage. Ce cours est done utile.

51

26.

100

---.
..... 90 •

....,..
Q.I

.<:11 •
.....
lii i 80 •
.S
...... y
..... 1
<:II
Q.I
..... 70 •
liis;:l.t

-
-Q.I
'""CI
60 •

50
0 100 200 300 400 500 600
+- N ---+ (lev-enU)
a) r:=: 0,669 6
b) Y :=: 65,73 + O,0668x. $65,73 devrait etre a peu pres Ie minimum que depenserait toute famille,
quel que soit son revenu. Apres ce minimum, elles depensent 6,68% de leurs revenus pour la
nourriture.
c) (i) y:=: 65,73 + 0,0668 x 150 :=: 75,75.
(ii) y:=: 65,73 + 0,0668 x 500:=: 99,13.
d) (i) $46,31; (ii) $ 154,36. Les families ne depensent pas une proportion fixe de leurs revenus pour
la nourriture, Les families riches consacrent a la nourriture une moins grande proportion de leurs
revenus que la families pauvres.
e) Si Ie revenu est $5 000, la droite de regression donne y:=: 65,73 + 0,066 8 x 5000 :=: 399,73, ce qui est
excessif. La droite de regression fournit un modele acceptable seulement pour un certain
intervalle de valeurs de x.
f) Z:=: 3,25, ce qui est significatif. On peut done affirmer qu'il y a dependance entre les variables x
(revenu) et y (depenses alimentaires).

27 Le coefficient de correlation est


n L/iYi - L/i LYi 36(22 509) - (887)(828)
-J 36(24381) - (887)2'\j 36(21 746) - (828)2

36(22 509) - (887)(828)


b -..:....---'---'-----::-2- :=: 0,834
36(24 381) - (887)

29. a) Le graphique suivant montre une certaine courbure dans le nuage de points

52
0,1 N uage de points pow Xvs y

0,09

0,08
•• •

0,07

Y 0,06
••••
0,05

• •• • ••• •
0,04
0,03

0,02

0,01

•••
o
0 1 2 ..' 4 5 6 7 8 9

b) b' et a' sont calcules par les formules usuelles en rernplacant Yi par log Yi­
n ~ xi log Yi - ~ xi ~ log Yi 18( -305. 98) - (85.5)(-59.195)
b' ~ - '=t. '=t. = -02048
'" 2 (2) 18(527.25) - (85.5)2 '
nL.J\ - LXi

et

1 n - -59.195 855

a' =~ Llog Yi - b'X = 18 - (-0,204 8) 1t


= 2,315 8

i = 1
e) a = e = e- 2,315 8 = 0,098 7, b = - b' = 0,204 8. L'equation est done Y = 0,098 7 e-0,2048x.
a'
d) Y = O,0987e-O,204 8(2,25) = 0,062.

Ix-y­
30 . Dans la formule b =-T ' nous remplacons xi et Yi par log xi et log Yi, respeetivement:
Ix.1

b
I log xi log Yi =--=2,3938
18.037
I (log Xi)2 7.535
Voici Ie graphique du nuage de points et de la fonetion Y =x b = x2,393 9:
0,9 Lenuage et la fonction ajusb~e
0,8
••
0.. 7

0,6

•••
••
Y 0,5
0,4

0,3

0,2

0,1

o +-<==--_-+__4____4-~ _ _-+__4____4-+___I____4___1

31. L'effeetif total est 436.


xY = 0/436)[22 x (2x 70) + 28 x (6 x 68) + ... + 25 x (30 x 92)] = 559102/436 = 1282,344;
x = (1/436)[22 x (2) + 28 x (6) + ... + 25 x (30)] =6 868/436 = 15,752;

Y = 0/436)[22 x (70)+28 x (68) + ... + 25 x (392)] = 33726/436 =77,353;

53
x2 = 0/436)[22 x (22) + 28 x (62) + ... + 25 x (302)] = 139080/436 = 318,991;
-- --
xy - x y 0 282,344 - 05,752)(77,353))
b x2 - x 2 = (318,991-15,7522) = 0,901

a = y - b x = 77,353 - 0,901 05,752) =63,16.

32. Le graphique suivant illustre clairement la situation:


60 Sec,4
55
50 Sec. 3
••••

45 • • ••
Sec.2 •
•••• •
40
35
30 • Sec,l
25 • • •• •
25 30 35 40 45 50 55 60 65 70 75
Il ne semble pas y avoir de dependance reelle entre l'aptitude mentale et la dexterite manuelle,
puisque, a l'interieur de chaque niveau scolaire, on trouve une correlation presque nulle. Mais
ces deux habiletes sont influencees par l'age, done par le niveau scolaire: les eleves du
secondaire 1 ont une faible aptitude mentale et une faible dexterite manuelle, alors que pour
ceux du sencondaire 5 les deux aptitudes les deux habiletes sont fortes. La dependance globale
pourrait done s'expliquer par le fait que l'age (ou le niveau scolaire) influence X et Y dans le
meme sens,

33. Ce qu'il y a a noter ici, c'est que si on elimine tous ceux qui ont un score inferieur a 50, on se
retrouve avec Ie nuage que l'on voit encadre dans le graphique ci-dessous:
Moyenne
100

90
80 ••
•• .

....

• •••
•••
70
• • •• • • L..- ...J

60 • • ••• •
50 • • •
• • •
40

30
."• • • •

20 •

0 10 20 30 40 50 60 70
Resultat
Il n'est pas necessaire d 'effectuer des calculs pour voir que la correlation basee sur le groupe

54
selectionne est beaucoup plus faible que celie basee sur l'ensemble des candidats.

34. Le graphique suivant montre pourquoi la correlation s'estompe lorsqu'elie est calculee globale­
ment:
65 • Petite
60
55 Classe oUVliele
• bourgeoisie 0
0 0
Classe dizigeante

111
~
.....
50

..... 45 • •
... o:lI
-111
40
• 0 0
,...Cl
~
35 ••
30 • 0
25 • 0
••
20 • 0 0 0
• •
15
4 6 8 10 12 14
•16 18 20 22
Scolazite

35. a) Pour les femmes, y = 5,17; pour les hommes, y = 5,82, une difference de $650, plus petite
que pour les moyennes non ajustees. Done merne si l'on tient compte de leur niveau de
scolarite inferieur, les femmes demeurent moins bien payees.
b) Pour les femmes, y =5,12; pour les hommes, y =6,00; une difference de $800, plus grande que
la difference de 818 entre les moyennes non ajustees, Si les femmes n'avaient pas eu
l'avantage d'avoir ete engagees plus tard, elles auraient eu un salaire inferieur de $880 a
celui des hommes.
c) Pour les femmes, y = 4,927 + 0,002 1(100,93) = 5,14; pour les hommes, on peut s'en tenir a la
moyenne non ajustees de 5,96, ou calculer y
= 5,964 - 0,000 1(100,93) = 5,95. Tout porte a
croire que l'experience ne joue pas un role important dans la determination du salaire initial
des hommes.
d) La droite de regression pour les femmes est plus elevee que pour les hommes a gauche du
point x = 3,74 . On ne doit pas attribuer trop de signification a la droite de regression des
valeurs de x trop eloignees de celles qu'on trouve dans I'echantillon. Done, il demeure vrai
que pour une scolarite donnee, les hommes sont mieux payes que les femmes.
e) Pour les femmes, y = 5,16; pour les hommes, 5,86. Si les femmes et les hommes avaient eu
une scolarite moyenne de 12,51 et une date d'engagement de 16,72, leurs salaires moyens
auraient ete de $5 160 et $5 860 respectivement. La difference de $700 ne peut etre expliquee
ni par la difference de scolarite ni par la date d'engagement.

55

CHAPITRE 5

1. a) Q = {pppp, pppf, ppfp, pfpp, fppp, ppff, pfpf, pffp, fppf, fpfp, ffpp, pfff, fpff, ffp£, fffp,
ffff}.
b) Q = {Liberal, Conservateur, NPD, autre reponse ou pas de reponse] .
c) Q = L'ensemble des nombres reels dans un intervalle raisonnable, par exemple, tous les
nombres reels entre -30 et 45.
d) L'ensemble decrit en a) pourrait convenir.
e ) La somme des trois resultats est un entier qui peut aller de 3, lorsque les trois des donnent
«1», a 18, lorsque les trois des donnent «6». Done Q = {3,4,5,6,7,8,9,lO,ll,12,13,14,15,16,17,18}.
f) Le nombre de pneus defectueux dans un echantillon de 10 pneus peut etre 0,1, ..., ou 10. Donc
Q = {O,l,2,3,4,5,6,7,8,9,lO}.
g) Q = {Urbain, Rural] . L'espace echantillon peut etre plus detaille, Par exemple, on pourrait
distinguer plusieurs sons-categories de I'<Urbain», selon l'importance de l'agglomeration.

2. a) (i) La personne choisie est en faveur de la peine de mort pour le meurtre d'un policier mais
pas pour tout meurtre.
(i i) La personne choisie est en faveur de la peine de mort pour le meurtre d 'un policier, ou
elle est en faveur de la peine de mort pour un meurtre cornrnis par un detenu en prison.
(iii) 0 U E = Q, car toute personne est soit dans E soit dans 0 ou bien elle est en faveur de
l'abolition de la peine de mort (E), ou bien elle favorise la peine de mort pour certains
crimes (D).
(iv) A n E = f. l'evenement impossible: si on est pour l'abolition de la peine de mort (E), on
n 'est pas en faveur de la peine de mort pour Ie meurtre d'un policier (A).
b) C C A: si on est en faveur de la peine de mort pour tout meurtre (C) alors on est en faveur de
la peine de mort pour le meurtre d'un policier.

3. a) Non, La balle de golf etant plus grande qu'une bille, on a surement Pfb) > P(j) = Ptv).
b) (i) Vraie: seule la couleur distingue les boules verte et jaune, et la couleur ne peut pas
, influencer la probabilite de tirage.
(i1) Si P(b) = I, ceci signifie que seule la balle de golf peut etre tiree, Si le mode de tirage
/ consiste a plonger la main dans le sac et saisir le premier objet touche, alors il est tout a
,. fait possible de toucher sur l'une des deux billes.
(iii) Necessairement vrai, puisque v, j et b constituent l'ensemble de tous les resultats de
r experience.
(i v ) Faux.
(v) Faux: comme on l'a dit en a), Ptv) < Pfb).
(vi) Necessairernent vrai, si on admet que Ptv) = P(j).

4. a) et b) sont inacceptables parce que la somme des probabilites de tous les resultats n'est pas
egale a 1; d) est inacceptable car l'une des probabilites est negative; c) est acceptable.

5. A U B = Q; la personne choisie est soit une fille, soit un gar<;on.


A n B: la personne choisie est une fille aux yeux bleus.
A e = B: la personne choisie est un gan;on.
C n 0: la personne choisie ales yeux bleus et les cheveux blonds.
Ce n 0: la personne choisie ales cheveux blonds mais n'a pas les yeux bleus.
A n C n 0: la personne choisie est une fille aux yeux bleus et cheveux blonds.
A - C: la personne choisie est une fille qui n'a pas les yeux bleus.
D - C: la personne choisie ales cheveux blonds mais n'a pas les yeux bleus, 0 - C = ce n 0
D - B: la personne choisie est une fille aux cheveux blonds. 0 - B = 0 n Be = 0 n A

6. a) Puisque P(A U B) = P(A) + P(B) - P(A n B), on a P(A n B) = P(A) + P(B) - P(A U B) =

56
6. a) Puisque P(A U B) = P(A) + P(B) - P(A n B), on a P(A n B) = P(A) + P(B) - P(A U B) =
0,3 + a,s - 0,7 = 0,1.
b) Par la loi de De Morgan, AC U BC = (A n B)". Done P(AC U BC) = P(A U B)C =

1 - P(A n B) = 1 - 0,1 = 0,9.

c) P(B n A C) = P(B - A) = P(B) - P(B n A) par la loi 5, page 99. Done P(B n A C) = a,s - 0,1 =
0,4.

7. X et Y denotent «X accepte le projet» et «Y accepte le projet», respectivement. On sait que


p(X) = a,s, P(YC) = 0,6, et P(XCU YC) = 0,7.
a) p(X n Y) = 1- P(X n Y)C = 1- P(XC U YC) par la loi de De Morgan = 1- 0,7 = 0,3.
b) Sachant que P(X) = P(X n Y) + P(X nyC), nous avons P(X nyC) = P(X) - P(X n Y) =
a,s - 0,3 = 0,2.

c) P(X U Y) = P(X) + P(Y) - P(X n Y) = 0,5 + 0,4 - 0,3 = 0,6.

8. P(F) = P(MC) = 1- P(M) = 1- a,s = a,s.


P(D) = P(GC) = 1- P(G) = 1- a,] = 0,9.
P(F U G) = P(F) + P(G) - P(F n G) = a,s + 0,1 - 0,03 = 0,57.

P(F n D) = P(F) - P(F n DC) = P(F) - P(F n G) = 0,5 - 0,03 = 0,47.

9. a) A et B sont incompatibles; ils ne sont pas independents: et aucun n'est contenu dans l'autre.
b) A et B sont incompatibles; ils ne sont pas independants: et aucun n'est contenu dans l'autre,
c) A et B ne sont pas incompatibles; ils ne sont pas independants: et A C B.
d) A et B ne sont pas incompatibles; ils sont presque certainement independants: aucun n'est
compris dans l'autre.
e) A et B ne sont pas incompatibles; ils ne sont pas independants: et A C B.
f) B = <1>. Done A et B sont incompatibles, puisque A n B =A n <I> = <1>; ils sont independents,
puisque P(A n B) = P(<I» = a et P(A)P(B) = P(A)P(<I» = P(A) x a = a, done P(A n B) =
P(A)P(B); et bien sur B C A, puisque l'ensemble vide est sous-ensemble de tout ensemble.

10. a) Go) (:9) (:8) = 2~~


b) ao) (;9) (1~) 11~0 =

c) Go) (:9) (:8) 2~


=
d) P(au moins 1 blanche) = 1 - P(aucune blanche)

17) (16) (15)


= 1 - ( 20 19 18 = 23
57

e) GO) (:9) (;8) = :5


11. Soit M: elle reussit au cours de Marketing; S: elle reussit au eours de Statistique. On a P(M) =
o.s. P(S) = 0,7; P(M n S) = 0,3.

a) P(M U S) = P(M) + P(S) - P(M n S) = a,s + 0,7 - 0,3 = 0,9.

b) P(MC n SC) = P(M US)C = 1 - P(M U S) = 1 - 0,9 = 0,1.

c) P(M n SC) = P(M - S) = P(M) - P(M n S) = a,s - 0,3 = 0,2.

12. a) X = nombre de billes rouges. Les valeurs de X sont a et 1. Ou Y = nombre de billes vertes.
Les va leurs de Y sont a et 1.

57
b) X = nombre de billes rouges, X = 0,1,2,3. Y = nombre de billes vertes, Y = 0,1,2,3.
c) X = nombre de femmes dans le comite, X = 0,1,2,3,4. Y = Ie nombre d'hommes dans le comite,
Y = 0,1,2,3,4 .
d) X = la note de l'etudiant. L'ensemble des valeurs possibles de X est l'ensemble des notes des
etudiants de la classe. Y = la taille de l'etudiant. L'ensemble des valeurs possibles de Y est
l'ensemble de toutes les tailles des eleves de la classe.

13. La correspondance entre les elements de W et les valeurs de X est donnee dans le tableau
suivant:

Element de Q x Element de Q X
pppp / o pfff .
fpff 3
pppf '" ffpf
ppfp / 1 fffp
pfpp / /
fppp fHf / 4

ppff l /
pfpf /
pffp 2
fppf
fpfp /
ffPP v

La probabilite de chaque element de Q est 1/16. Donc P(X = 0) = P({pppp)) = 1/16. P(X = 1) =
P({pppf, ppfp, pfpp, fppp)) = 4/16 = 1/4, etc .

La fonction de masse est done:

4
1/16

o 1 2 3 4

E(X) = 00/16) + 1(1/4) + 2(3/8) + 3(1/4) + 40/16) = 2


Var(X) = E(X2) - (E(X»2 = 020/16) + 120/4) + 22(3/8) + 320/4) + 42(1/16) - 22 =

5 - 4 = 1. Remarquez qu'on obtient les memes reponses avec E(X) = 4 P = 40/2) = 2 et Var(X) =

npq = 40/2)(1/2) = 1.

14. a) Si X est Ie gain d'un invite, alors


1 999
E(X) = 100 x 1000 + 0 x 1000 = 0,10$,
2 1 2 999
Var(X) = 000 - 0,1) x 1000 + (0 - 0,1) x 1000 = 9,99
b) Si X est le gain d 'un couple d'invites, alors on voit que P(X = 100) = PO er invite gagne) +
2
P(2 e invite gagne) = 100' On trouve done
2
E(X) = 100 x 1000 = 0,20$,

58

_ 2 _2_ 2 998_
Var(X) - 000 - 0,2) x 1000 + (0 - 0,2) x 1000 - 19,96

15.
a) Si X est le gain d'un invite, alors
1 1 998
E(X) = 1000 x 1000 + 100 x 1000 + 0 x 1000 = 1,10$,

_ 2 _1_ 2 _1_ _ 2 998_

Var(X) - (1000 - 1,1) x 1000 + 000 - 1,1) x 1000 + (0 1,1) x 1000 - 1008,79.
b) Si X est le gain d'un couple d'invites, alors
E(X) = EO er invite) + E(2 e invite) = 2,20$,
2 2 2 998 2 998
Var(X) = 0100 - 2,2) x 999000 + (1000 - 2,2) x 999000 x 2 + 000 - 2,2) x 999000 x 2 +
2 995006
(0 - 2,2) x 999000 2015,56.

16. Supposons que P(2) = P(3) = P(4) = P(5) = P(6) = P: Alors PO) = 3p. La somme des probabilites
des six resultats est 3p + P + P + P + P + P = 8p. Puisque cette somme doit etre egale a 1, on
deduit que p = 1/8. Done PO) = 3/8 et la probabilite de chacun des autres resultats est 1/8.

a) P(un nombre < 4) = PO) + P(2) + P(3) = 3/8 + 1/8 + 1/8 = 5/8
b) Votre gain net X prend la valeur 5 avec probabilite 3/8 et -1 avec probabilite 5/8, E(X) =
5(3/8) - 1(5/8) = 10/8 = $ 1,25.

17. a) i ) E(8X+9Y)=8x30+9x40=600$;
Var(8X + 9Y) = Var(8X) + Var(9Y)
= 64 Var(X) + 81 Var(Y)
= 2896.
i i ) E02X + 6Y) = 600
Var02X + 6Y) = 4176

Xl + X2 E(X1) + E(X2) 1
18. X = 2 ' done E(X) = 2 »
= 1,50$, et Var(X) = 4" (Var(X 1) + Var(X 2 = 50. Vous
et votre ami avez chacun la merne esperance de gain qu'en jouant independamrnent, mais avec
une variance moindre (50 versus 100).

19. Ces probabilites entrainent une contradiction. D'une part, par I'incornpatibilite, on a P(A U B)
= P(A) + P(B) = 0,4 + 0,3 = 0,7. D'autre part P(AC nBC) = P(A U B)C par la loi de De Morgan,
et P(AC nBC) = 0,2 fi P(A U B)C = 0,2 fi P(A U B) = 0,8 -j:. 0,7. Remarquez qu'il y aurait
contradiction, merne sans l'hypothese de l'incompatibilite, puisque P(A U B) :=; P(A) + P(B) =
0,7, contredit P(A U B) = 0,8

20. La correspondance entre les elements de Q et les valeurs de X, Y, et X + Y est la suivante:


Q Probabilite X Y X+Y
11 (2/5)(1/4) = 1/10 1 1 2
12 (2/5)0/4) = 1/10 1 2 3
13 (2/5)(2/4) = 2/10 1 3 4
21 0/5)(2/4) = 1/10 2 1 3
23 0/5)(2/4) = 1/10 2 3 5
31 (2/5)(2/4) = 2/10 3 1 4
32 (2/5)0/4) = 1/10 3 2 5
33 (2/5)0/4) = 1/10 3 3 6

a) X prend les valeurs 1, 2 et 3 avec probabilites 0,4, 0,2 et 0,4. Done E(X) = 1(0,4) + 2(0,2) +
3(0,4) = 2

59
b) La fonct!-0n de masse de Y est identique a celle de X, mais un developpernent comme Ie tableau
ci-dessus est necessaire pour le demontrer, On a P(Y = 1) = P({(1,I), (2,1), (3,1)}) = 1/10 + 1/10 +
2/10 = 4/10; de rneme P(Y = 2) = 1/10 + 1/10 = 2/10; et P(Y = 3) = 2/10 + 1/10 + 1/10 = 4/10. Nous
avons que E(Y) = 2.
c) Nous pouvons utiliser la propriete 3, p.151; E(X + Y) = E(X) + E(Y) = 2 + 2 = 4. au bien nous
pouvons developper la fonction de masse de Y et appliquer la definition desperance
mathernatique. La fonction de masse de Z = X + Y est:

M 0~1 I 0~2 I O~ I 0~2 1-­


Et alors E(2) = 2(0,1) + 3(0,2) + 4(0,4) + 5(0,2) + 6(0,1) = 4.

21. P(au moins 1 eleve appartienne au 1er centile)


= 1- P (aucun eleve n'appartienne au l er centile)

= 1 - P (les 30 eleves appartiennent aux 99 centiles inferieurs)

= 1 - (:~O)O = 0,2603.

22. P (Louis Lacasse brise 5 assiettes de suite) = (~J - 0,004, ce qui est tres petit. La part du hasard

etant minime, on peut conclure que Louis semble particulierement maladroit.

. 3 . 1
23. P (beau JOur) = 4' P (pluie) = 4'

E(X) = 400 (i) -100 (~) = 25$


24. a) P(la 1ere carte soit un roi) = 4/52 = 1/13.
b) P(la 1ere carte ne soit pas un roi, la 2e non plus, mais que la 3 e soit un roi) = (48/52)(47/51)(4/50)
=376/5525
c) Pour que le premier roi rencontre soit la 50e carte retournee, il faudrait qu'aucun des 49 premiers
tirages ne donne de roi. Or il est impossible d 'avoir 49 tirage distincts (sans remise) sans aucun
ror,

• 25. a) OS/25)(14/24) = 7/20.


b) 00/25)05/24) = 1/4.
c) 15/25 = 3/5.
d) Soit A: un garc;on est choisi au premier tirage, B: un garc;on est choisi au deuxieme tirage. P(B) =
P(B n A) + P(B n AC) = P(A)P(B I A) + P(AC)P(B lAC) = OS/25)04/24) + 00/25)05/24) = 3/5.
Autre notation: P(garc;on choisi au 2e tirage) = P(GG ou FG) = P(GG) + P(FG) = OS/25)04/24) +
00/25)05/24) = 3/5.

26. a) 4/52 = 1/13.


b) poereestunas) P(2eest un as I 1ere est un as) =(4/52)(3/51)= 1/221.
c) P(au moins une des cartes soit un as) = 1 - P (aucune des deux cartes ne soit un as) = 1 - poere n'est
pas un as) P(2e n'est pas un as I l ere n'est pas un as) = 1- (48/52)(47/51) = 33/221
d) P(aucune des deux cartes ne soit un as) = 1 - P(au moins l'une des deux cartes est un as) =
= 1 - 33/221 = 188/221.

60
1 5
. 27. Votre gain net X prend les va leurs K et -2 avec les probabilites respectives 6'et 6" Done E(X) =
1 5 k 10
= 0 => 6= ~ done K = 10$.
= K(6') - 2(6') et la condition E(X)

28. a) P(AC n C) = P(C - A) = P(c) - P(A n C) = P(C) - P(A)P(c) = 1/5 - 0/3)0/5) = 2/15
b) P(A U CC) = P(A) + P(CC) - P(A n CC) = P(A) + P(CC) - (P(A) - P(A n C» = P(CC) + P(A n C) =
P(CC) + P(A)P(C) = (4/5) + 0/3)0/5) = 13/15.

29. a) P(A U B) = P(A) + P(B) - P(A~ B) = 0,4 + 0,3 - 0,1 = 0,6.


b) P(A U B) = P(A) + P(B) = 0,4 + 0,3 = 0,7.
c) P(A I B) = 0,8 => P(A n = 0,8 => P(A n B) = (O,8)P(B) = (0,8)-(0,3) = 0,24. Done
B)/P(B)

P(A U B) = P(A) + P(B) - P(A n B) = 0,4 + 0,3 - 0,24 = 0,46.


d) P(A nBC) = P(A - B) = P(A) - P(A n B) et P(A) - P(A n B) = 0,15 => P(A U B) = P(A) + P(B) ­

P(A n B) = P(B) + (P(A) - P(A n B» = 0,3 + 0,15 = 0,45.


e) B::;; A => A U B = A et done P(A U B) = P(A) = 0,4.

30. Void la correspondance entre les elements de n et les valeurs de X.

n X Probabillte
N 1 (2/5) = 2/5
BN 2 (3/5)(2/4) = 3/10
BBN 3 (3/5)(2/4)(2/3) = 1/5
BBBN 4 (3/5)(2/4)0/3)(2/2) = 1/10

E(X) =1(2/5) + 2(3/10) + 30/5) + 40/10) =2.

31. PO) + P(2)+ P(3) + P(4) = P + 2p + P + 2p = 1 => 6p = 1 => P =1/6.


a) E(X) = 10/6) + 2(2/6) + 30/6) + 4(2/6) = 8/3.
b) Soit Y le resultat au 2e lancer. Alors Y suit la meme loi que X; et X et Y sont independantes car
elles correspondent a des lancers independants. On peut determiner la fonction de masse de la
somme
Z = X + Y en utilisant l'independance. Par exemple, P(Z = 2) = P(X = 1 et X = 1) =
P(X = l)P(Y = 1) = 0/6)0/6) = 1/36, P(Z = 3) = P(X = l)P(Y = 2) + P(X = 2)P(Y = 1) = 0/6)(2/6) +
(2/6)0/6) = 4/36. De merne on trouve P(Z =4) = 6/36; P(Z = 5) = 8/36; P(Z = 6) = 9/36; P(Z = 7) =
4/36; P(Z = 8) = 4/36.
(i) P(B) = P(Z = 3) + P(Z == 5) + P(Z == 7) = 4/36 + 8/36 + 4/36 =4/9.
(ii) P(A n B) == P(Z soit paire et impaire) = P(<j» = O.
(iii) P(BC - A) = P(BC n AC) = P(Z ne soit ni paire ni impaire) = o.
(iv) P(C I B) == P(C n B)/P(B) - P(C n B) = P(Z > 5 et Zest impaire) = P(Z = 7) = 4/36. Done
P(C IB) = P(C n B)/P(B) = (4/36)/(4/9) =9/36 = 1/4.
(v) P(B u C) = P(B) + P(C) - P(B n C), P(B) = 4/9, P(B n C) = 4/36 et P(c) = P(Z > 5) = P(Z = 6) +
P(Z = 7) + P(Z = 8) = 17/36. Done P(B u C) = P(B) + P(C) - P(B n C) = 4/9 + 17/36 - 4/36 =
29/36.

61
.32. Si X est Ie poids total de 14 personnes de poids respectifs Xl' ..., Xl 4' alors
E(X) = 1: E(Xi) = 14 x 64 = 896,
Var(X) = 1: Var(Xi) = 14 x 144 = 2016, done 1:x = ,]2016

33. Si X est le poids d 'une douzaine d'oeufs,


E(X) = 12 x 56 =672
Va r(X) = 12 x 20 = 240

34 . Si X est le poids des 6 oeufs dans un des deux plateaux, et Y le poids des 6 oeufs dans l'autre, alors
E(X) = E(Y) = 336; Varix) = VarfY) = 120, et E(X -Y) = 0; VariX - Y) = 240.

35. Si X est le gain net (par client), la fonction de masse de X est la suivante

x 25 -775
0,98 0,02

a) E(X) = 25 (0,98) + (-775)(0,02) = 9$


Var(X) = (25 - 9)2 (0,98) + (-775 - 9)2 (0,02) = 12 544.
b) Si X = Xl + X2 est le gain associe a deux clients, alors
Var(X) = Var Xl + Var X2 = 25 088 pour deux clients etrangers
Si les deux clients annulent ou non ensemble, alors la fonction de masse de X est

x
p(x)
50
0,98
-1550
0,02
I
et E(X) = 18$,
Var(X) = (50 -18)2 0,98 + (-1550 - 18)2 0,02

=50176.

36. Si l'on designe par A la valeur de la prime et par C le cout d'annulation, alors la fonction de masse
du gain net (profit) X est

X A -C+A I
p(X) 0,98 0,02

Donc E(X) = A - 0,02 C. Ce profit devant representer 30% de la prime, on obtient l'equation
0.02
A - 0,02 C = 0,3 A. Done A = 0.7 C = 2,857% de C.

37. Si l'on designe par A (resp, B,C) Ie fait que Ie 1er juge (resp. le 2e, le 3e) prenne la bonne decision,
alors la probabilite que Ie jury prenne Ia bonne decision (au moins deux juges sur trois) correspond a:

P(A n B n C) + P(A c n B n C) + P(A n BC n C) + P(A n B n CC)

1 1 1 1

= _2 x - + pO - p) x - + pO - p) x - + p2 x­
p- 2 222

= p2 + 0 - p) p = P:

62

Vous aimerez peut-être aussi