Vous êtes sur la page 1sur 12

Correction de TD N° 2 de statistique descriptive GBI1

Exercice 1 :

1. Population : Les jours de fonctionnement de l’entreprise E.


Taille de l’échantillon: n=25 jours d’observation.
L’individu : 1 jour d’observation.
Le caractère : le nombre des chèques de ‘’montant élevé : supérieur à 50000 DH’’
Nature de caractère : quantitatif discret

2. Distribution en termes d’effectifs

Nombre des 0 1 2 3 4 5 Total


chèques xi
Effectifs ni 5 8 6 3 2 1 25

3.

Nombre de chèques par jour pour l'entreprise E


8
Effectif ni (nombre de jours)

7
6
5
4 8
3 6
5
2
3
1 2
1
0
0 1 2 3 4 5
Nombre de chèques

4. Les paramètres de tendance centrale :


Le mode : M0=1
6

n x i i
0  5  1 8  2  6  3  3  4  2  5 1
La moyenne : m  X  i 1
  1.68
N 25
La médiane : (25+1)/2=13 ; La médiane se trouve au rang 13 après avoir rangé les caractères
dans un ordre croissant
0000011111111222222333445
Alors, Me=1
5. Courbe cumulative décroissante :

Nombre des 0 1 2 3 4 5 Total


chèques
Effectifs ni 5 8 6 3 2 1 25
NDi 25 20 12 6 3 1
décroissant

Courbe cumulative décroissante


30

25

20

15
25
10 20

5 12
6 3 1
0
0 1 2 3 4 5

6. Calcul des quantiles


Q1 :
0000011111111222222333445
N/4=25/4=6.25

Le premier quartile Q1 est le terme de rang immédiatement supérieur à 6.25 qui


est 7. Alors Q1=1

D2 :
0000011111111222222333445
2N/10=50/10=5
Le deuxième décile D2 est le terme de rang 5. Alors D2=3.

D7 :
0000011111111222222333445
7N/10=175/10=17.5

Le septième décile D7 est le terme de rang immédiatement supérieur à 17.5 qui


est 18. Alors D7=2.

C35 :
0000011111111222222333445
35N/100=875/100=8.75

Le trente cinquième centile C35 est le terme de rang immédiatement supérieur à


8.75 qui est 9. Alors C35=1.

7. L’écart interdécile
0000011111111222222333445
N/10=25/10=2.5

Le premier décile D1 est le terme de rang immédiatement supérieur à 2.5 qui est
3. Alors D1=0. Et on a,

9N/10=225/10=22.5

Le neuvième décile D9 est le terme de rang immédiatement supérieur à 22.5 qui


est 23. Alors D9=4.

Alors l’écart interdécile est : EI=D9-D1=4-0=4.

8. L’étendue :

E=5-0=5
1 q
sx  (  ni x i )  x 2
2 2
La variance : n i 1
Nombre des 0 1 2 3 4 5 Total
chèques xi
xi2 0 1 4 9 16 25
Effectifs ni 5 8 6 3 2 1 25
ni*xi2 0 8 24 27 32 25 116

116
( )  1.68 2  1.82
2
s x
25
L’écart type :

s x  s x2  1.82  1.35

Coefficient de variation :
Le coefficient de variation CV d'une variable statistique est le ratio entre l'écart-type et la moyenne
exprimé sous la forme d'un pourcentage:

 s 1.35
CV  estimé par CV  x   80%
 m 1.68

Le coefficient de variation est un indicateur de l'homogénéité de la population. On considère qu'un


coefficient de variation inférieur à 15% indique que la population est homogène, tandis qu'un coefficient
supérieur à 15% indique que les valeurs sont relativement dispersées. Le coefficient de variation est une
mesure sans unité et indépendante de l'ordre de grandeur. On peut donc l'utiliser pour comparer la
dispersion de variables statistiques avec des ordres de grandeur et des unités différentes.

9. Coefficient d’asymétrie de Yule

Q  Q  2Q
A  3 1 2
Y
Q Q 3 1

3n/4=3*25/4=18.75

Le troisième quartile Q3 est le terme de rang immédiatement supérieur à 18.75


qui est 19.

0000011111111222222333445

Alors Q3=2
2  1  2 1
A  1
Y
2 1
Par la suite,

Interprétation : Puisque AY >0, la distribution est allongée à droite (asymétrie en i)

8
7
6
5
Effectif ni

4 8
3 6
5
2
3
1 2
1
0
0 1 2
Nombre 3
de chèques 4 5

10. Coefficient d’aplatissement de Fisher


4
G2  3
s4

1 n
 4
 
n i1
(xi  x ) 4

Nombre des 0 1 2 3 4 5 Total


chèques
( xi  x ) 4 7.97 0.21 0.01 3.04 28.97 121.49 162.69

 4

162.69
25
 6.47

 (1.82) 2  3.31
4
Et s x

Alors,
6.47
G2   3  1.05
3.31
Puisque G2 < 0 , Le centre de la distribution s'aplatit et devient moins pointue que la distribution
normale correspondante. Il y a une plus grande fréquence de scores observés de la variable éloignés de
la moyenne. C'est une distribution platykurtique.

Exercice 2 :

1. Population : Les familles d’un quartier d’une ville.


Taille de l’échantillon: n=550 familles.
L’individu : une famille de quartier.
Le caractère : le revenu mensuel en dirhams
Nature de caractère : quantitatif continu
2.
Revenus [2000,2600[ [2600,3000[ [3000,3400[ [3400,4000[ [4000,4800[
Effectif 142 116 154 100 38

Nombre
de famille
Revenus mensuels par famille en DH
140

120

100
142
80

116 154 100


60

40

20 38

0
2000 DH 2600 DH 3000 DH 3400 DH 4000 DH 4800 DH

3. Polygone des fréquences

Revenus xi [2000,2600[ [2600,3000[ [3000,3400[ [3400,4000[ [4000,4800[ Total

Effectif ni 142 116 154 100 38 550


Fréquence fi 26% 21% 28% 18% 7% 100%

Fréquence cumulée croissante FCCi 26% 47% 75% 93% 100%


Fréquence cumulée décroissante
100% 74% 53% 25% 7%
FCDi

Polygone de fréquences
28%
30% 26%
25% 21%
18%
20%
15%
10% 7%

5%
0
0%
2000 2600 3000 3400 4000 4800

4.

Courbe cumulative croissante 100%


93%
100%
75%
80%

60% 47%

40% 26%

20%
0
0%
2000 2600 3000 3400 4000 4800

5.
100%
Courbe cumulative décroissante
100%
74%
80%
53%
60%

40% 25%
20% 7%
0%
0%
2000 2600 3000 3400 4000 4800

6. Les paramètres de position (paramètres de position)


Le mode
La classe modale : [3000,3400[

Nombre
de famille
Revenus mensuels par famille en DH
140

120

100

80

142 116 154 100


60

40

20 38

0
M0
2000 DH 2600 DH 3000 DH 3400 DH 4000 DH 4800 DH

( )

( )
( ) ( )

Alors,
6

nc i i
La moyenne : m  x  i 1
n

Revenus xi [2000,2600[ [2600,3000[ [3000,3400[ [3400,4000[ [4000,4800[ Total

Effectif ni 142 116 154 100 38 550

Centre de classe ci 2300 2800 3200 3700 4400

ni*ci 326600 324800 492800 370000 167200 1681400

1681400
m X   3057.09Dhs
550
La médiane :
120%
Histogrammme de fréquences cumulées
100%

80%

60%

40%
75% 93% 100%
47%
20%
26%

0%
2000 2600 Me
3000 3400

Alors

7. Les quantiles
120%
Histogrammme de fréquences cumulées
100%
90%
80%

60%

100%
40%
75% 93%
25%
20%
26% 47%
10%
0%
D1 Q1 C40 Q3 D9
2000 2600 3000 3400 4000 4800

Alors

Et on a,

Et

On a aussi

Alors

Par la même manière,


Alors

Et

Alors

8. Ecart interdécile :

9. Etendue

La variance

Revenus xi [2000,2600[ [2600,3000[ [3000,3400[ [3400,4000[ [4000,4800[ Total

Effectif ni 142 116 154 100 38 550


Centre de
2300 2800 3200 3700 4400
classe ci
2
ni*ci 751180000 909440000 1576960000 1369000000 735680000 5342260000

1 q
sx  ( n  ni ci )  x 2
2 2

i 1

5342260000
  3057.092  367400,73
2
s x
550
  606,14
2
L’écart type : s x s x

Le coefficient de variation :

 s 606,14
CV  estimé par CV  x   19,83%
 m 3057,09
10. Le coefficient d’asymétrie de Pearson

x  xM
Ap 
Alors sx

3057.09  3165,22
Ap   0.18
606,14

• Interprétation : Puisque le coefficient d’asymétrie est négatif alors la distribution est allongée à
gauche. Cette allongement est légère, on peut dire aussi que la distribution est symétrique.

11. Coefficient d’aplatissement de Fisher


4
G2  3
s4

1 n
4  n 
i 1
(ci  x ) 4

Revenus xi [2000,2600[ [2600,3000[ [3000,3400[ [3400,4000[ [4000,4800[ Total

Effectif ni 142 116 154 100 38 550


Centre de
2300 2800 3200 3700 4400
classe ci
(ci  x ) 4 3,2854E+11 4,37E+09 4,17E+08 1,71E+11 3,25E+12 3,75645E+12

 4
 6829907656

 (367400,73) 2  134983296405
4
Et s x

Alors,
G2  2.95
Interprétation : Le centre de la distribution s'aplatit et devient moins pointue que la distribution normale
correspondante. C'est une distribution platykurtique.

Vous aimerez peut-être aussi