Sol 02

Solutions des exercices du Chapitre 2
2.1 Soit X le vecteur à m = 20 composantes contenant les mesures à faible niveau protéique
et Y le vecteur à n = 17 composantes contenant les mesures à niveau protéique élevé.
(a) On pose α = 0.25 et β = 0.75 et on obtient:
• m(X) = 0.454, med(X) = 0.750, s(X) = 2.805,
• mα = 5, [⌈mα⌉] = 5, [⌊mα + 1⌋] = 6 et donc
qα (X) = (x[5] + x[6] )/2 = (−0.50 − 0.25)/2 = −0.375,
• mβ = 15, [⌈mβ⌉] = 15, [⌊mβ + 1⌋] = 16 et donc
qβ (X) = (x[15] + x[16] )/2 = (1.27 + 1.50)/2 = 1.385,
• Iq (X) = qβ (X) − qα (X) = 1.76
⋆ n(Y ) = 0.273, med(Y ) = 0.750, s(Y ) = 2.007,

⋆ nα = 4.25, [⌈nα⌉] = 5, [⌊nα + 1⌋] = 5 et donc
qα (Y ) = (y[5] + y[5] )/2 = y[5] = −0.50,
⋆ nβ = 12.75, [⌈nβ⌉] = 13, [⌊nβ + 1⌋] = 13 et donc
qβ (Y ) = (y[13] + y[13] )/2 = y[13] = 1.25,
⋆ Iq (Y ) = qβ (Y ) − qα (Y ) = 1.75
(b) m(X) > m(Y ), mais les médianes sont identiques. On ne peut pas conclure que ces
résultats soutiennent l’hypotèse.
(c) Après suppression de la donnée 9.00 dans X, on obtient:
• m(X) = 0.004, med(X) = 0.750, s(X) = 2.058,
• mα = 4.75, [⌈mα⌉] = 5, [⌊mα + 1⌋] = 5 et donc
qα (X) = (x[5] + x[5] )/2 = x[5] = −0.5,
• mβ = 14.25, [⌈mβ⌉] = 15, [⌊mβ + 1⌋] = 15 et donc
qβ (X) = (x[15] + x[15] )/2 = x[15] = 1.27,
• Iq (X) = qβ (X) − qα (X) = 1.77
On remarque que m(X) et s(X) changent de façon importante, tandis que med(X)
et Iq (X) sont presque insensibles à la suppression de la mesure extrême.
2.2 Soit N le nombre d’étamines. Après élimination de la plus petite valeur dans les
deux ensembles de données on obtient:
(a) m(N ) = 659.32, med(N ) = 422, m(log(N )) = 6.056, med(log(N )) = 6.045.
(b) La médiane représente le milieu de la distribution; la moyenne est infuencée par les
valeurs extrêmes (en particulier par les valeurs élevées de N ). La moyenne et la
médiane de N sont très différentes car la distribution de N est très asymétrique. La
médiane et la moyenne de log(N ) sont très proches, car la distribution de log(N ) est
presque symétrique.
(c) On observe que log(med(N )) = 6.045 = med(log(N )).
Ceci s’explique de la façon suivante. Soient n[1] ≤ . . . ≤ n[99] les valeurs ordonnées de
N . Donc med(N ) = n[50] et log(med(N )) = log(n[50] ). En outre, comme log est une
fonction monotone croissante, les valeurs ordonnées de log(N ) sont log(n[1] ) ≤ . . . ≤
log(n[99] ). Donc med(log(N )) = log(n[50] ) = log(med(N )).
Avec toutes les données (100), on obtient med(log(N )) = 6.030581 ≈ 6.030685 =
log(med(N )). Il n’y a pas une parfaite égalité car
med(log(N )) = [log(n[50] ) + log(n[51] )]/2 6= log[(n[50] + n[51] )/2].
(d) Évidemment, la propriété de la médiane que l’on vient d’établir s’étend à tout quantile
(de façon approximative ou exacte selon le cas et la définition).
(e) On peut étendre les propriétés susmentionnées à d’autres transformations, pourvu
qu’elles soient monotones croissantes. (Que se passe-t-il pour des transformations
décroissantes ?) La propriété ne vaut pas pour des transformations non monotones:
par exemple, med(sin(N )) = −0.18472 6= 0.85554 = sin(med(N )).
(f) On a m(log(N )) = 6.056395 < 6.419214 = log(m(N )). La propriété ne vaut pas pour
la moyenne.
2.3 Les boxplots sont donnés ci-dessous. La transformation logarithmique rend la distri-
bution presque symétrique.
Boxplot of N Boxplot of log(N)

5000
8
4000
7
3000
6
2000
5
1000
4
0
2.4 Propriétés de la moyenne.
(a) est évident.
(b) m(aX) = (ax1 + . . . + axn )/n = a(x1 + . . . + xn )/n = am(X).
(c) m(X +a) = (x1 +a+. . .+xn +a)/n = (x1 +. . .+xn +na)/n = (x1 +. . .+xn )/n+na/n =
m(X) + a.
(d) m(X +Y ) = (x1 +y1 +. . .+xn +yn )/n = (x1 +. . .+xn +y1 +. . . yn )/n = m(X)+m(Y ).
En utilisant cette propriété, ainsi que (b) et (c), on obtient:
m(aX + bY + c) = m(aX) + m(bY ) + c = am(X) + bm(Y ) + c.
(e) Il suffit de donner un contrexemple. Soit X = (1, 9) et Y = (2, 0). Donc m(X) = 5,
m(Y ) = 1 et m(X)m(Y ) = 5. D’autre part, XY = (2, 0) et m(XY ) = 1.
2.5 Pour démontrer les propriétés de la variance et de l’écart type on utilise les définitions
et les propriétés de la moyenne.
(a) On a m(c) = c. Donc, s2 (c) = m([c − m(c)]2 ) = m(02 ) = 0.
(b) s2 (aX + b) = m([aX + b − m(aX + b)]2 ) = m([aX + b − am(X) − b]2 )
= m([aX − am(X)]2 ) = a2 m([X − m(X)])2 = a2 s2 (X).
(c) En prenant la racine carrée de s2 (aX + b) = a2 s2 (X) on obtient s(aX + b) = as(X).
(d) Il suffit de donner un contrexemple. Soit X = (1, 2) et Y = (1, 2). Donc s2 (X) = 0.52
et s2 (Y ) = 0.52 . D’autre
P P part, X + Y = (2, 4) et s2 (X + Y ) = 1 6= 0.52 + 0.52 .
(e) (xi − m(X)) = xi − nm(X) = nm(X) − nm(X) = 0.
(f) s2 (X) = m([X − m(X)]2 ) = m(X 2 − 2Xm(X) + m(X)2 )
= m(X 2 ) − 2m(X)m(X) + m(X)2 = m(X 2 ) − m(X)2 .

Sol 02

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Sol 02

Transféré par

Droits d'auteur :

Formats disponibles

Solutions des exercices du Chapitre 2

qα (X) = (x[5] + x[6] )/2 = (−0.50 − 0.25)/2 = −0.375,

• mβ = 15, [⌈mβ⌉] = 15, [⌊mβ + 1⌋] = 16 et donc

qβ (X) = (x[15] + x[16] )/2 = (1.27 + 1.50)/2 = 1.385,

• Iq (X) = qβ (X) − qα (X) = 1.76

⋆ n(Y ) = 0.273, med(Y ) = 0.750, s(Y ) = 2.007,

qα (Y ) = (y[5] + y[5] )/2 = y[5] = −0.50,

⋆ nβ = 12.75, [⌈nβ⌉] = 13, [⌊nβ + 1⌋] = 13 et donc

qβ (Y ) = (y[13] + y[13] )/2 = y[13] = 1.25,

(c) Après suppression de la donnée 9.00 dans X, on obtient:

• m(X) = 0.004, med(X) = 0.750, s(X) = 2.058,

• mα = 4.75, [⌈mα⌉] = 5, [⌊mα + 1⌋] = 5 et donc

qα (X) = (x[5] + x[5] )/2 = x[5] = −0.5,

• mβ = 14.25, [⌈mβ⌉] = 15, [⌊mβ + 1⌋] = 15 et donc

qβ (X) = (x[15] + x[15] )/2 = x[15] = 1.27,

• Iq (X) = qβ (X) − qα (X) = 1.77

Boxplot of N Boxplot of log(N)

Vous aimerez peut-être aussi