Vous êtes sur la page 1sur 6

TD de statistique descriptive

Exercice 1

Ahmed Khattab & Jaouad Madkour


2

Exercice 1 : Tableau statistique


Le tableau suivant résume la distribution statistique d’une variable statistique discrète X :
xi 5 15 27 44
ni 7 11 28 12

1. Construire le tableau statistique de la variable X ;


2. Représenter graphiquement chacune des colonnes du tableau statistique ;
3. Quel est le nombre d’observations égales à 27 ?
4. Quelle est la proportion d’observations égales à 27 ?
5. Quel est le nombre d’observations au plus égales à 44 ?
6. Quel est le nombre d’observations au moins égales à 5 ?
7. Quelle est la proportion d’observations au plus égales à 44 ?
8. Quelle est la proportion d’observations au moins égales à 44 ?

Solution :
1. Tableau statistique :

xi ni fi Ni− Ni+ Fi− Fi+


5 7 0.12 58 7 1 0.12
15 11 0.19 51 18 0.88 0.31
27 28 0.48 40 46 0.69 0.79
44 12 0.21 12 58 0.21 1
Σ 58 1 – – – –

2. Représentations graphiques : (se reporter au cours)


• Représentation graphique des effectifs : Diagramme en bâtons.
• Représentation graphique des fréquences : Diagramme en bâtons.
• Représentation graphique des effectifs cumulés croissants : Courbe cumulative ascendante.
• Représentation graphique des effectifs cumulés décroissants : Courbe cumulative descendante.
• Représentation graphique des fréquences cumulées croissantes : Courbe cumulative ascendante.
• Représentation graphique des fréquences cumulées décroissantes : Courbe cumulative descendante.
3. Le nombre d’observations égales à la modalité x3 = 27 est donné par l’effectif de cette modalité, c’est à dire
n3 = 28.
4. La proportion d’observations égales à la modalité x3 = 27 est donnée par la fréquence de cette modalité, c’est à
dire f3 = 0.48.
5. Le nombre d’observations au plus égales à la modalité x4 = 44 est donné par l’effectif cumulé croissant de cette
modalité, c’est à dire N4+ = 58.
6. Le nombre d’observations au moins égales à la modalité x1 = 5 est donné par l’effectif cumulé décroissant de
cette modalité, c’est à dire N1− = 58.
7. La proportion d’observations au plus égales à la modalité x4 = 44 est donnée par la fréquence cumulée croissante
de cette modalité, c’est à dire F4+ = 1.0.
8. La proportion d’observations au moins égales à la modalité x4 = 44 est donnée par la fréquence cumulée
décroissante de cette modalité, c’est à dire F4− = 0.21.
Exercice 1 (suite) : Mesures de centre, de dispersion et de forme
Le tableau suivant résume la distribution statistique d’une variable statistique discrète X mesurée en litres :
xi 5 15 27 44 n
ni 7 11 28 12 58

1. Calculer la moyenne arithmétique de la variable statistique X ;


2. Mesurer la dispersion de la distribution statistique de X autour de sa moyenne arithmétique ;
3

3. Mesurer l’asymétrie de la distribution statistique de X ;

4. Mesurer l’aplatissement de la distribution statistique de X.

Solution :
Les calculs nécessaires à la résolution de l’exercice sont donnés dans le tableau suivant :
 3  4
2 3 xi −x xi −x
xi ni ni xi ni |xi − x| ni x2i ni (xi − x) ni (xi − x) ni σx ni σx
5 7 35 144.13 175 2967.64 -61103.64 -35.63 61.28
15 11 165 116.49 2475 1233.63 -13064.13 -7.62 6.74
27 28 756 39.48 20412 55.67 78.49 0.05 0.01
44 12 528 220.92 23232 4067.14 74876.0 43.66 67.15
Σ 58 1484 521.02 46294 8324.08 786.72 0.46 135.18

1. La moyenne arithmétique x de la variable statistique X est donnée par :

4
1X
x= ni xi
n i=1
1
= (n1 x1 + n2 x2 + n3 x3 + n4 x4 )
n
1
= (7 × 5 + 11 × 15 + 28 × 27 + 12 × 44)
58
1484
=
58
= 25.59 litres

Le centre de la distribution statistique de X se situe à 25.59 litres. Cette valeur centrale concentre toute
l’information contenue dans les observations de la variable X étudiée.

2. La dispersion d’une distribution statistique autour de sa moyenne arithmétique est mesurée par son écart absolu
moyen, par sa variance, par son écart-type ou par son coefficient de variation :

• L’écart absolu moyen EAM de la variable statistique X est donné par :

4
1X
EAM = ni |xi − x|
n i=1
1
= [n1 |x1 − x| + n2 |x2 − x| + n3 |x3 − x| + n4 |x4 − x|]
n
1
= [7 |5 − 25.59| + 11 |15 − 25.59| + 28 |27 − 25.59| + 12 |44 − 25.59|]
58
521.02
=
58
= 8.98 litres

Les observations de la variable statistique X sont dispersées autour du centre x = 25.59 litres et s’en
écartent, en termes absolus, de EAM = 8.98 litres en moyenne.
• La variance σx2 de la variable statistique X est donnée par :

4
1X 2
σx2 = ni (xi − x)
n i=1
1h 2 2 2 2
i
= n1 (x1 − x) + n2 (x2 − x) + n3 (x3 − x) + n4 (x4 − x)
n
1 h 2 2 2 2
i
= 7 (5 − 25.59) + 11 (15 − 25.59) + 28 (27 − 25.59) + 12 (44 − 25.59)
58
8324.08
=
58
= 143.52 "litres2 "
4

La variance σx2 peut également se calculer selon la formule réduite de König-Huygens comme suit :

σx2 = x2 − x2
4
!
1X
= ni x2i − x2
n i=1
1
n1 x21 + n2 x22 + n3 x23 + n4 x24 − x2

=
n
1
7 × 52 + 11 × 152 + 28 × 272 + 12 × 442 − 25.592

=
58
46294
= − 654.85
58
= 143.32 "litres2 "

• L’écart-type σx est égal à la racine carrée de la variance σx2 (on retiendra le résultat de la formule réduite) :
p
σx = σx2
p
= 143.32 "litres2 "
= 11.97 litres

Les observations de la variable statistique X sont dispersées autour du centre x = 25.59 litres et s’en
écartent de σx = 11.97 litres en moyenne.
Imaginons que l’écart-type d’une autre variable Y exprimée également en litres soit de σy = 15 litres. Alors,
la distribution de la variable Y est plus dispersée autour de sa moyen y que celle de la variable X autour
de sa moyenne x.
• Le coefficient de variation est une mesure de dispersion relative des observations autour de la moyenne
arithmétique x, il est obtenu comme suit :
σx
CV =
x
litres
11.97  
=
litres
25.59  
= 0.47

Les observations de la variable statistique X sont dispersées autour du centre x = 25.59 litres et s’en
écartent, en termes relatifs, de CV = 0.47 en moyenne.
3. L’asymétrie d’une distribution statistique est mesurée par un coefficient d’asymétrie :
• Le coefficient d’asymétrie (ou de skewness) de Fisher γ1 est donné par :
4  3
1X xi − x
γ1 = ni
n i=1 σx
"  3  3  3  3 #
1 x1 − x x2 − x x3 − x x4 − x
= n1 + n2 + n3 + n4
n σx σx σx σx
"  3  3  3  3 #
1 5 − 25.59 15 − 25.59 27 − 25.59 44 − 25.59
= 7 + 11 + 28 + 12
58 11.97 11.97 11.97 11.97
0.46
=
58
= 0.01

Ce coefficient étant positif, la distribution statistique de la variable X est en conséquence asymétrique à


droite. Cela signifie que les observations qui sont supérieures à la moyenne arithmétique (x = 25.59 litres)
sont plus fréquentes que celles qui lui sont inférieures.
• Le coefficient d’asymétrie (ou de skewness normalisé) de Pearson β1 est donné par :
" 4  3 # 2
1X xi − x
β1 = ni
n i=1 σx
= γ12
= 0.0001
5

Ce coefficient étant non nul signifie que la distribution statistique de X est asymétrique. Le sens de
l’asymétrie est donné par le signe du moment centré µ3 donné par :
4
1X 3
µ3 = ni (xi − x)
n i=1
1h 3 3 3 3
i
= n1 (x1 − x) + n2 (x2 − x) + n3 (x3 − x) + n4 (x4 − x)
n
1 h 3 3 3 3
i
= 7 (5 − 25.59) + 11 (15 − 25.59) + 28 (27 − 25.59) + 12 (44 − 25.59)
58
786.72
=
58
= 13.56

La distribution statistique de la variable X est asymétrique à droite puisque le moment centré µ3 est positif.
Cela signifie que les observations qui sont supérieures à la moyenne arithmétique (x = 25.59 litres) sont
plus fréquentes que celles qui lui sont inférieures.

4. L’aplatissement d’une distribution statistique est mesurée par un coefficient d’aplatissement :

• Le coefficient d’aplatissement (ou de kurtosis) de Pearson β2 est donné par :


4  4
1X xi − x
β2 = ni
n i=1 σx
"  4  4  4  4 #
1 x1 − x x2 − x x3 − x x4 − x
= n1 + n2 + n3 + n4
n σx σx σx σx
"  4  4  4  4 #
1 5 − 25.59 15 − 25.59 27 − 25.59 44 − 25.59
= 7 + 11 + 28 + 12
58 11.97 11.97 11.97 11.97
135.18
=
58
= 2.33

Ce coefficient étant inférieur à 3, la distribution statistique de la variable X est en conséquence platykurtique.


Cela signifie que les observations extrêmes sont excessivement rares.
• Le coefficient d’aplatissement (ou d’excès de kurtosis) de Fisher γ2 est donné par :
4  4
1X xi − x
γ2 = ni −3
n i=1 σx
= β2 − 3
= −0.67

Ce coefficient étant négatif, la distribution statistique de la variable X est en conséquence platykurtique.


Cela signifie que les observations extrêmes sont excessivement rares.

Exercice 1 (suite) : Mesures de centre et de dispersion fondées sur les quantiles

1. Calculer la médiane de la distribution statistique de X ;

2. Calculer le premier et le dernier quartiles de la distribution statistique de X ;

3. Calculer le premier et le dernier déciles de la distribution statistique de X ;

4. Calculer le premier et le dernier centiles de la distribution statistique de X ;

5. Mesurer la dispersion de la distribution statistique de X par son étendue ;

6. Mesurer la dispersion de la distribution statistique de X par son écart interquartile ;

7. Mesurer la dispersion de la distribution statistique de X par son écart interdécile ;

8. Mesurer la dispersion de la distribution statistique de X par son écart intercentile.

Solution :
6

1. La médiane de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est immédiatement
supérieure à 50% (i.e. 0.5). On a : Me = 27 litres. Cela signifie que 50% des observations de la variable X sont
inférieures ou égales à 27 litres.
2. Le premier quartile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 25% (i.e. 0.25). On a : Q1 = 15 litres. Cela signifie que 25% des observations de la
variable X sont inférieures ou égales à 15 litres.
Le dernier quartile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 75% (i.e. 0.75). On a : Q3 = 27 litres. Cela signifie que 75% des observations de la
variable X sont inférieures ou égales à 27 litres.
3. Le premier décile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 10% (i.e. 0.1). On a : D1 = 5 litres. Cela signifie que 10% des observations de la
variable X sont inférieures ou égales à 5 litres.
Le dernier décile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 90% (i.e. 0.9). On a : D9 = 44 litres. Cela signifie que 90% des observations de la
variable X sont inférieures ou égales à 44 litres.
4. Le premier centile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 1% (i.e. 0.01). On a : C1 = 5 litres. Cela signifie que 1% des observations de la
variable X sont inférieures ou égales à 5 litres.
Le dernier centile de la distribution statistique de X est la modalité dont la fréquence cumulée croissante est
immédiatement supérieure à 99% (i.e. 0.99).On a : C99 = 44 litres. Cela signifie que 99% des observations de la
variable X sont inférieures ou égales à 44 litres.

5. L’étendue E de la distribution statistique de X est l’amplitude de l’intervalle de variation IV délimité par la


valeur minimale et la valeur maximale de X (i.e. IV = [5; 44]). On a E = 44 − 5 = 39 litres. Cela signifie que
l’ensemble des observations de la variable X se trouvent dans un intervalle d’amplitude 39 litres.
6. L’écart interquartile EIQ de la distribution statistique de X est l’amplitude de l’intervalle interquartile IQ
délimité par le premier et le dernier quartiles de X (i.e. IQ = [15; 27]). On a EIQ = 27 − 15 = 12 litres. Cela
signifie que 50% des observations centrales de la variable X se trouvent dans un intervalle d’amplitude 12 litres.

7. L’écart interdécile EID de la distribution statistique de X est l’amplitude de l’intervalle interdécile ID délimité
par le premier et le dernier déciles de X (i.e. ID = [5; 44]). On a EID = 44 − 5 = 39 litres. Cela signifie que
80% des observations centrales de la variable X se trouvent dans un intervalle d’amplitude 39 litres.
8. L’écart intercentile EIC de la distribution statistique de X est l’amplitude de l’intervalle intercentile IC délimité
par le premier et le dernier centiles de X (i.e. IC = [5; 44]). On a EIC = 44 − 5 = 39 litres. Cela signifie que
98% des observations centrales de la variable X se trouvent dans un intervalle d’amplitude 39 litres.

Vous aimerez peut-être aussi