Vous êtes sur la page 1sur 8

Statistiques Descriptives

TD 1

QUESTION 1

En période de récession, les dentistes (comme bien d’autres professionnels) éprouvent


des problèmes à se faire payer ce qui leur est dû par leurs clients. Pour un échantillon de
30 comptes à recevoir non payés, le dentiste Laterreur a noté le nombre X de jours
écoulés depuis l’envoi de sa facture à son client (que nous appellerons le temps écoulés),
ce qui a permis d’obtenir les résultats suivants :

17 57 10 35 26 2
21 11 7 12 5 76
6 20 77 40 14 42
12 32 28 13 19 28
45 8 19 21 38 20

1- En utilisant la règle de Sturges, déterminer le nombre de classes nécessaires pour


regrouper ces données ? (Si par accident cette règle donne un nombre qui n’est
pas un entier, prenez uniquement la partie entière de ce nombre : par exemple, la
partie entière de 4.98 est 4 ; la partie entière de 3.25 est 3 ; etc.) ?

N c =1+3. 3 log(n )=1+3 . 3 log (30)=5. 8745 donc 5 classes.

2- Déterminer l’amplitude des différentes classes, notée A , en utilisant la formule


Étendue
A= +1
suivante : nombre de classe ?
77−2
A= +1=16
5

3- Présenter dans un tableau les informations suivantes :


a. Les limites (ou les bornes) de chaque classe (commencer par
2≤classe 1<.. . ) ;
b. Le centre de chaque classe ;
c. La fréquence de chaque classe ;
d. La fréquence relative de chaque classe ;
e. La fréquence relative cumulée de chaque classe.

Classe Centre de la Fréquence de la Fréquence Fréquence


classe classe relative relative cumulée
2≤classe 1<18 10 12 0.4 0.4
18≤classe 1<34 26 10 0.33 0.73
34≤classe 1<50 42 5 0.17 0.90
50≤classe 1<66 58 1 0.03 0.93
66≤classe 1<82 74 2 0.07 1

4- Pour ces comptes non payés, depuis combien de jours attend-il, en moyenne, pour
être payé ?
5
1
x̄≃ ∑ ni mi =26 .53
30 i=1

5- Déterminer la médiane du temps d’attente.

n 30
Mé≃LB Mé +
2
− F Mé
f Mé ( )
. A Mé =18+
2
10
− 12
×16=22 .8 ( )
6- Déterminer l’écart type du temps d’attente autour de la moyenne.

5 2

s=
√ 5 (
∑ ni x^ 2i −30
i=1
29
∑ ni x^ i
i=1
)
= 18 .55
7- À l’aide d’un indice approprié, déterminer si cette série de données est homogène
ou non ?
S 18. 55
CV ( X ) = ( )

⋅100 %= (
26. 53 )
⋅100 %=69 . 92 %
Ce coefficient est très élevé, donc la série de donnée n’est pas homogène.

QUESTION 2

Un nouveau concessionnaire d’automobiles neuves a enregistré au cours de ces 40


semaines d’opération le nombre X d’automobiles qu’il a vendues hebdomadairement. Il a
obtenu les résultats suivants :

5 7 2 6 3 4 8 5 4 3
9 6 5 7 6 8 3 4 4 0
8 6 7 1 5 5 4 6 6 10
9 8 1 5 5 6 7 8 5 5

Sans regrouper ces valeurs en classes,

1. Déterminer un tableau statistique pour la variable X :

modalité fréquence Fréquence relative Fréquence relative cumulée


0 1 0.025 0.025
1 2 0.050 0.075
2 1 0.025 0.100
3 3 0.075 0.175
4 5 0.125 0.300
5 9 0.225 0.525
6 7 0.175 0.700
7 4 0.100 0.800
8 5 0.125 0.925
9 2 0.050 0.975
10 1 0.025 1.000

2. Représenter graphiquement les distributions de fréquence et de fréquence


relative cumulée :
Diagramme en batons

10

9
8
7

6
Fréquence

5
4
3

2
1

0
0 1 2 3 4 5 6 7 8 9 10
nombre de voitures vendues

Diagramme en escalier

1,2

1
Fréquence relative cumulée

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12
nombre de v oiture s v e ndue s

3. Pour la variable X, calculer:


a. La moyenne,
11
1
x̄= ∑ n x =5. 4
n i=1 i i
b. Le mode,
Mo=5
c. La médiane,
Méd=5 (Elle est déterminée à partir du diagramme en escalier).
d. Les trois quartiles,
Q1 =4 , Q 2 =5 , Q3 =7 (on peut les déterminer à partir du
diagramme en escalier)
e. L’étendue et
E=10−0=10
f. L’écart type.
h 2

QUESTION 3
s=
√ h
∑ ni x 2i −
i
n−1
( ∑ ni x i
i
n
)
=2. 2736

Le ratio prix/bénéfice d’un certain groupe d’actions inscrites à la bourse de New York se
présente comme suit :

14.6 25.4 12.2 9.3 20.3 7.6


13.4 9.6 14.7 25.3 13.7 10.1
11.9 18.9 8.5 12.3 14.8 8.6
28.2 16.2 12.8 16.2 12.1 14.0
15.4 27.5 30.4 16.2 16.5 11.6
9.7 21.1 12.9 9.8 30.4 13.3
11.7 8.7 31.6 19.5 22.4 8.3

Pour ce ratio,

1. Déterminer un tableau statistique (prenez 7.5 comme limite inférieure de la


première classe et construire des classes d’amplitude 2)

classes Centre de la Fréquence de la Fréquence Fréquence relative


classe classe relative cumulée
7.5 – 9.49 8.5 6 0.143 0.143
9.5 – 11.49 10.5 4 0.095 0.238
11.5 – 13.49 12.5 10 0.238 0.476
13.5 – 15.49 14.5 6 0.143 0.619
15.5 – 17.49 16.5 4 0.095 0.714
17.5 – 19.49 18.5 1 0.024 0.738
19.5 – 21.49 20.5 3 0.071 0.809
21.5 – 23.49 22.5 1 0.024 0.833
23.5 – 25.49 24.5 2 0.048 0.881
25.5 – 27.49 26.5 0 0 0.881
27.5 – 29.49 28.5 2 0.048 0.929
29.5 – 31.49 30.5 2 0.048 0.977
31.5 – 33.49 32.5 1 0.024 1

2. Calculer à partir du tableau déterminé en 1) :

a. La moyenne,
h
1
x̄≃ ∑ n i x i =16 .02
n i =1
b. La médiane,

n 42
Mé≃LB Mé +
2
( )
− F Mé
f Mé
. A Mé =13. 5+
2
6 ( )
− 20
×2=13.83

c. Le mode,
Δ1 6
Mo= LBMo +
( Δ1+ Δ2) ( )
. A Mo =11 . 5+
6+ 4
×2=12 . 7

d. Les trois quartiles et

n 42
Q1≃LB Q1 +
4
( )
− FQ
f Q1
1
. AQ1 =11. 5+
4
10
( )
− 10
× 2=11. 6

3×42
Q3 ≃19.5+
4
(
3
− 31
×2=19.83 )
Q2 =Mé≃13. 83
e. L’écart type.

h 2

QUESTION 4
s=
√ ∑
h

i
ni x^ 2i −

n−1
(∑ )
i
ni x^ i

n
=6. 72

Dans une manufacture, le temps pendant lequel une machine n’est pas en opération est
appelé « temps mort ». Le tableau suivant donne la distribution d’un échantillon de 100
« temps mort » pour une machine :

« temps mort » Centre de la classe Fréquence


(minutes)
0 – 9.99 5 3
10 – 19.99 15 13
20 – 29.99 25 30
30 – 39.99 35 25
40 – 49.99 45 14
50 – 59.99 55 8
60 – 69.99 65 4
70 – 79.99 75 2
80 – 89.99 85 1

On aimerait vérifier si cette distribution peut être considérée comme « normale ». Pour
effectuer cette vérification, calculer un coefficient d’asymétrie et un coefficient
d’aplatissement pour cette distribution et tirer des conclusions qui en découlent au sujet
de la normalité.

Pour déterminer l’asymétrie nous utilisons par exemple le coefficient de Pearson basé
sur le mode.

x̄ -Mo 34−27 . 73
Asp= = =0. 397 On a donc une asymétrie positive.
s 15 .7954

Δ1 30−13
Mo= LBMo +
( Δ 1+ Δ 2
. A Mo =20+
)
( 30−13 )+( 30−25 ) (
×10=27 .73
)
h 2

s=
√ h

i
ni x^ 2i −

n−1
(∑ )i
ni x^ i

n
= 15 .7954
h
1
x̄≃ ∑ n x =34
n i=1 i i

Pour déterminer l’aplatissement nous utilisons l’indice suivant :


m 4 218845 1
AP = = =3. 5157≠3 m4 = ∑ f i ( x^ i− x̄ )4 =218845
s 4 15 . 79544 avec n i , on donc
a une distribution leptocurtique.

Finalement, nous pouvons conclure, en se basant sur ces les indices précédents, que
cette distribution n’est pas normale.