Académique Documents
Professionnel Documents
Culture Documents
Exercice 1
Solution :
1. Tableau statistique :
Solution :
Les calculs nécessaires à la résolution de l’exercice sont donnés dans le tableau suivant :
3 4
2 3 xi −x xi −x
xi ni ni xi ni |xi − x| ni x2i ni (xi − x) ni (xi − x) ni σx ni σx
5 7 35 144.13 175 2967.64 -61103.64 -35.63 61.28
15 11 165 116.49 2475 1233.63 -13064.13 -7.62 6.74
27 28 756 39.48 20412 55.67 78.49 0.05 0.01
44 12 528 220.92 23232 4067.14 74876.0 43.66 67.15
Σ 58 1484 521.02 46294 8324.08 786.72 0.46 135.18
4
1X
x= ni xi
n i=1
1
= (n1 x1 + n2 x2 + n3 x3 + n4 x4 )
n
1
= (7 × 5 + 11 × 15 + 28 × 27 + 12 × 44)
58
1484
=
58
= 25.59 litres
Le centre de la distribution statistique de X se situe à 25.59 litres. Cette valeur centrale concentre toute
l’information contenue dans les observations de la variable X étudiée.
2. La dispersion d’une distribution statistique autour de sa moyenne arithmétique est mesurée par son écart absolu
moyen, par sa variance, par son écart-type ou par son coefficient de variation :
4
1X
EAM = ni |xi − x|
n i=1
1
= [n1 |x1 − x| + n2 |x2 − x| + n3 |x3 − x| + n4 |x4 − x|]
n
1
= [7 |5 − 25.59| + 11 |15 − 25.59| + 28 |27 − 25.59| + 12 |44 − 25.59|]
58
521.02
=
58
= 8.98 litres
Les observations de la variable statistique X sont dispersées autour du centre x = 25.59 litres et s’en
écartent, en termes absolus, de EAM = 8.98 litres en moyenne.
• La variance σx2 de la variable statistique X est donnée par :
4
1X 2
σx2 = ni (xi − x)
n i=1
1h 2 2 2 2
i
= n1 (x1 − x) + n2 (x2 − x) + n3 (x3 − x) + n4 (x4 − x)
n
1 h 2 2 2 2
i
= 7 (5 − 25.59) + 11 (15 − 25.59) + 28 (27 − 25.59) + 12 (44 − 25.59)
58
8324.08
=
58
= 143.52 "litres2 "
4
La variance σx2 peut également se calculer selon la formule réduite de König-Huygens comme suit :
σx2 = x2 − x2
4
!
1X
= ni x2i − x2
n i=1
1
n1 x21 + n2 x22 + n3 x23 + n4 x24 − x2
=
n
1
7 × 52 + 11 × 152 + 28 × 272 + 12 × 442 − 25.592
=
58
46294
= − 654.85
58
= 143.32 "litres2 "
• L’écart-type σx est égal à la racine carrée de la variance σx2 (on retiendra le résultat de la formule réduite) :
p
σx = σx2
p
= 143.32 "litres2 "
= 11.97 litres
Les observations de la variable statistique X sont dispersées autour du centre x = 25.59 litres et s’en
écartent de σx = 11.97 litres en moyenne.
Imaginons que l’écart-type d’une autre variable Y exprimée également en litres soit de σy = 15 litres. Alors,
la distribution de la variable Y est plus dispersée autour de sa moyen y que celle de la variable X autour
de sa moyenne x.
• Le coefficient de variation est une mesure de dispersion relative des observations autour de la moyenne
arithmétique x, il est obtenu comme suit :
σx
CV =
x
litres
11.97
=
litres
25.59
= 0.47
Les observations de la variable statistique X sont dispersées autour du centre x = 25.59 litres et s’en
écartent, en termes relatifs, de CV = 0.47 en moyenne.
3. L’asymétrie d’une distribution statistique est mesurée par un coefficient d’asymétrie :
• Le coefficient d’asymétrie (ou de skewness) de Fisher γ1 est donné par :
4 3
1X xi − x
γ1 = ni
n i=1 σx
" 3 3 3 3 #
1 x1 − x x2 − x x3 − x x4 − x
= n1 + n2 + n3 + n4
n σx σx σx σx
" 3 3 3 3 #
1 5 − 25.59 15 − 25.59 27 − 25.59 44 − 25.59
= 7 + 11 + 28 + 12
58 11.97 11.97 11.97 11.97
0.46
=
58
= 0.01
Ce coefficient étant non nul signifie que la distribution statistique de X est asymétrique. Le sens de
l’asymétrie est donné par le signe du moment centré µ3 donné par :
4
1X 3
µ3 = ni (xi − x)
n i=1
1h 3 3 3 3
i
= n1 (x1 − x) + n2 (x2 − x) + n3 (x3 − x) + n4 (x4 − x)
n
1 h 3 3 3 3
i
= 7 (5 − 25.59) + 11 (15 − 25.59) + 28 (27 − 25.59) + 12 (44 − 25.59)
58
786.72
=
58
= 13.56
La distribution statistique de la variable X est asymétrique à droite puisque le moment centré µ3 est positif.
Cela signifie que les observations qui sont supérieures à la moyenne arithmétique (x = 25.59 litres) sont
plus fréquentes que celles qui lui sont inférieures.
Solution :
6
1. La médiane de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est immédiatement
supérieure à 50% (i.e. 0.5). On a : Me = 27 litres. Cela signifie que 50% des observations de la variable X sont
inférieures ou égales à 27 litres.
2. Le premier quartile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 25% (i.e. 0.25). On a : Q1 = 15 litres. Cela signifie que 25% des observations de la
variable X sont inférieures ou égales à 15 litres.
Le dernier quartile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 75% (i.e. 0.75). On a : Q3 = 27 litres. Cela signifie que 75% des observations de la
variable X sont inférieures ou égales à 27 litres.
3. Le premier décile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 10% (i.e. 0.1). On a : D1 = 5 litres. Cela signifie que 10% des observations de la
variable X sont inférieures ou égales à 5 litres.
Le dernier décile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 90% (i.e. 0.9). On a : D9 = 44 litres. Cela signifie que 90% des observations de la
variable X sont inférieures ou égales à 44 litres.
4. Le premier centile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 1% (i.e. 0.01). On a : C1 = 5 litres. Cela signifie que 1% des observations de la
variable X sont inférieures ou égales à 5 litres.
Le dernier centile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 99% (i.e. 0.99).On a : C99 = 44 litres. Cela signifie que 99% des observations de la
variable X sont inférieures ou égales à 44 litres.
7. L’écart interdécile EID de la distribution statistique de X est l’amplitude de l’intervalle interdécile ID délimité
par le premier et le dernier déciles de X (i.e. ID = [5; 44]). On a EID = 44 − 5 = 39 litres. Cela signifie que
80% des observations centrales de la variable X se trouvent dans un intervalle d’amplitude 39 litres.
8. L’écart intercentile EIC de la distribution statistique de X est l’amplitude de l’intervalle intercentile IC délimité
par le premier et le dernier centiles de X (i.e. IC = [5; 44]). On a EIC = 44 − 5 = 39 litres. Cela signifie que
98% des observations centrales de la variable X se trouvent dans un intervalle d’amplitude 39 litres.