Vous êtes sur la page 1sur 14

Exercices sur Statistique

Descriptive à une dimension

Indications par Pr. Saïd Hamdoune


Exercice 1 (a). Un contrôle est effectué sur des plaques de laiton. La surface d’une
plaque est vérifiée pour détecter des taches de cuivre ou d’oxygénation ou autres dé-
fectuosités apparentes. On a noté le nombre de défauts par plaque pour 50 contrôles
successifs.

N ombre de déf auts 0 1 2 3 4


N ombre de plaques 12 18 11 6 3
1. Identifier la variable statistique et préciser sa nature.
2. Tracer le diagramme en bâtons des fréquences.
3. Tracer les courbes des fréquences cumulées croissante et décroissante.
4. Quel pourcentage de pièces ont une défectuosité ou moins ?
5. Quel est en moyenne le nombre de défauts par plaque ?
6. Déterminer pour le nombre de défauts : l’étendue, la variance, l’écart-type, la
dominante, la médiane et l’écart-interquartile.
Solution. Le tableau statistique, fournissant les éléments permettant de répondre
aux questions, est :
i xi ni fi Fcc Fcd xi fi x2i fi
1 0 12 0.24 0.24 1 0 0
2 1 18 0.36 0.6 0.76 0.36 0.36
3 2 11 0.22 0.82 0.40 0.44 0.88
4 3 6 0.12 0.94 0.18 0.36 1.08
5 4 3 0.06 1 0.06 0.24 0.96

/// 50 1 /// /// 1.4 3.28

1. La variable statistique X est le nombre de défauts, étudiée sur la population des


50 plaques de laiton.
Elle est de nature quantitative discrète.
2. Le diagramme en bâtons des fréquences est :

1
2

3. En calculant les fréquences et les fréquences cumulées, on a :

4. Fcc (1) × 100 = 0.6 × 10 = 60%



5
5. Le nombre de défauts moyen par plaque : X = xi .fi = 1.4 défaut
i=1
6. – Etendue : 4 défauts

5
2
2
– Variance : σ (X) = x2i .fi − X = 3.28 − 1.42 = 1.32

i=1

– Ecart-type : σ(X) = V ar(X) = 1.32 = 1.148 ≈ 1.15 défaut
– Dominante=mode : M o(X) = 1 défaut
– Médiane : X1/2 = 1 défaut
– Ecart interquartile : Q3 − Q1 = 2 − 1 = 1 défaut. 
3

Exercice 2 (g). On relevé la répartition des exploitations agricoles d’une région selon
leurs superficies en 1999.
Superf icie en ha des exploitations % de la région superf icie totale en ha
0−5 12.7 3658
5 − 10 25.6 18432
10 − 25 21.2 30740
25 − 50 14.5 44950
50 − 75 12.3 75399
75 − 100 13.7 109600

Le nombre des exploitations agricoles en 1999 est 9100.


1. (a) Préciser la population. Identifier la caractère statistique et préciser sa nature.
(b) Tracer l’histogramme des fréquences.
(c) Quelle est la valeur modale ?
(d) Quel est le pourcentage de la première classe par rapport à la superficie totale
des exploitations de la région ?
(e) Tracer sur le même graphique les polygones des effectifs cumulés.
(f) Calculer la moyenne, la variance, l’écart-type, le cœfficient de variation, la
médiane et l’écart interquartile.
2. Une entreprise spécialisée dans la vente de matériels agricoles, désire toucher les
exploitations les plus importantes. Déterminer la taille minimale des exploitations
contactées dans les deux cas suivants :
(a) L’entreprise veut toucher les 30% les plus importantes.
(b) L’entreprise veut toucher les plus importantes, représentant 40% de la su-
perficie totale.
Solution.
1. (a) – Population :l’ensemble des exploitations de la région, elle est de taille 9100.
– La variable statistique X est la superficie en hectare.
Elle est de nature quantitative Continue.
(b) Le tableau statistique, détaillant les valeurs utiles pour la suite, est :
classe fi superf icie
% fi ai hi = ni Ncc Ncd
en ha ai totale en ha
0−5 12.7 0.127 5 0.025 1156 1156 9100 3658
5 − 10 25.6 0.256 5 0.051 2330 3486 7944 18 432
10 − 25 21.2 0.212 15 0.014 1929 5415 5614 30 740
25 − 50 14.5 0.145 25 0.006 1319 6734 3685 44 950
50 − 75 12.3 0.123 25 0.005 1119 7853 2366 75 399
75 − 100 13.7 0.137 25 0.006 1247 9100 1247 109 600

100 1 /// /// 9100 /// /// 282 779

– L’histogramme des fréquences, basé sur les fréquences moyennes des classes
fi
hi = puisque les amplitudes sont différentes, est :
ai
4

(c) La classe modale est la classe qui a la fréquence moyenne hi (et non pas la
fréquence fi ) la plus élevée. Donc c’est [5, 10[. On prend alors pour mode la
superficie 7.5 ha ; le centre de la classe modale.
3658
(d) La première classe [0, 5[ représente .100 ≃ 1.29% de la superficie
282 779
totale de la région.
(e) Par la formule ni = fi .9100 et en arrondissant les valeurs à l’unité près tout
en respectant la taille de la population, on dresse dans le tableau statistique
la liste des effectifs ni de chaque classe. Par suite, les polygones cumulés des
effectifs sont :
5

(f) Pour le calcul des caractéristiques de X, on utilise les fréquences pour plus
de précision. La suite du tableau statistique est :

classe % pi de la Pcd := cumul


en fi xi xi .fi x2i .fi Fcc superf icie décroissant
ha totale des pi
0−5 0.127 2.5 0.318 0.794 0.127 1.29 100
5 − 10 0.256 7.5 1.920 14.400 0.383 6.52 98.71
10 − 25 0.212 17.5 3.710 64.925 0.595 10.87 92.19
25 − 50 0.145 37.5 5.438 203.906 0.740 15.90 81.32
50 − 75 0.123 62.5 7.688 480.469 0.863 26.66 65.42
75 − 100 0.137 87.5 11.988 1048.906 1 38.76 38.76

1 /// 31.062 1813.4 /// 100 ///


6
– Moyenne : X = xi fi = 31.062 ≃ 31.06 ha
i=1

6
2
– Variance : σ 2 (X) = x2i fi − X = 1813.4 − 31.062 = 848.6764 ≃ 848.68

i=1

– Ecart-type : σ(X) = σ 2 (X) = 848.68 = 29.132 ≃ 29.13 ha
σ(X) 29.13
– Cœfficient de variation : Cv = = = 0.9378 ≃ 0.94 = 94%
X 31.06
– Médiane :
X Graphiquement : La médiane M e, qui correspond à l’abscisse du point
d’intersection des courbes cumulatives des effectifs, vaut approximative-
ment 18 ha
6

X Par le calcul : La classe médiane, qui correspond à la fréquence cumulées


de 0.50, est [10, 25[.
M e − 10 0.50 − 0.383
L’interpolation linéaire permet d’écrire : =
25 − 10 0.595 − 0.383
0.50 − 0.383
D’où, M e = (25 − 10). + 10 = 18.278 ≃ 18.28 ha
0.595 − 0.383
– Ecart interquartile
X Premier Quartile Q1 , valeur de X qui correspond à la fréquence cumulée
croissante de 0.25, appartient à [5, 10[.
Q1 − 5 0.25 − 0.127
L’interpolation linéaire permet d’écrire : =
10 − 5 0.383 − 0.127
0.25 − 0.127
D’où, Q1 = (10 − 5). + 5 = 7.4023 ≃ 7.40 ha
0.383 − 0.127
X Troisième Quartile Q3 , valeur de X qui correspond à la fréquence cu-
mulée croissante de 0.75, appartient à [50, 75[.
Q3 − 50 0.75 − 0.74
L’interpolation linéaire permet d’écrire : =
75 − 50 0.863 − 0.74
0.75 − 0.74
D’où, Q3 = (75 − 50). + 50 = 50.032 ≃ 52.03 ha.
0.863 − 0.74
Donc, l’écart interquartile est : Q3 − Q1 ≃ 44.63 ha
2. (a) La valeur x de la superficie X qui caractérise les 30% des exploitations les
plus importantes vérifie Fcd (x) = 0.30 ⇐⇒ Fcc (x) = 0.70. Donc x ∈ [25, 50[.
50 − x 0.74 − 0.70
L’interpolation linéaire sur [25, 50[ permet d’écrire : =
50 − 25 0.74 − 0.595
0.74 − 0.70
D’où, x = 50 − (50 − 25). = 43.1034 ≃ 43.10 ha
0.74 − 0.595
Donc, l’entreprise doit toucher les exploitations dont la surface est supérieure
ou égale à 43.10 ha
(b) La valeur x′ de la superficie X qui caractérise les exploitations les plus im-
portantes repésentant les 40% de la superficie totale vérifie Pcd (x′ ) = 0.40.
Donc x′ ∈ [50, 75[.
x′ − 50 40 − 65.42
L’interpolation linéaire sur [50, 75[ permet d’écrire : =
75 − 50 38.75 − 65.42
40 − 65.42
D’où, x′ = (75 − 50). + 50 = 73.828 ≃ 73.83 ha
38.75 − 65.42
Donc, l’entreprise doit toucher les exploitations dont la surface est supérieure
ou égale à 73.83 ha 

Exercice 3 (p). Les 50 données ci-après représentent le temps requis en minutes pour
solutionner les demandes par le centre d’assistance à la clientèle d’une entreprise de
service.

62 56 72 83 66 77 62 71 50 58 74 81 76 67 70 70 69 67 80 81
74 53 73 55 66 88 73 61 63 70 72 63 75 68 78 75 61 69 80 82
87 57 74 74 85 68 75 63 81 73

1. Calculer le temps moyen requis pour solutionner les demandes.


7

2. Quelle est l’étendue des données ?


3. Calculer la variance et l’écart-type du temps requis.
4. Quel intervalle, autour de la moyenne, englobe au moins 90% des données ?
Solution. On a une distribution brute (Xi )1≤i≤50 d’un caractère X donnant le
temps, en minutes, requis pour solutionner les demandes.
1 ∑50
1
1. Temps moyen : X = Xi = .3528 = 70.56 mn
N i=1 50
2. Etendue : e = M ax − M in = 88 − 50 = 38 mn
1 ∑50
2 1
3. – Variance : σ 2 (X) = Xi2 −X = .252878−70.562 = 78.8464 ≃ 78.85mn
N 50
√ i=1 √
– Ecar-type : σ(X) = V ar(X) = 78.85 = 8.8797 ≃ 8.88 mn
4. D’après la règle de Tchebychev, l’intervalle autour de la moyenne ]X −kσ, X +kσ[,
1
englobe au moins une proportion 1 − 2 de données.
k √
1 1
Donc, la proportion 90% correspond à k tel que 0.9 = 1 − 2 ⇔ k = ≃ 3.16.
k 0.1
Par conséquent, l’intervalle qui contient au moins 90% des données est :
]X − kσ, X + kσ[=]70.56 − 3.16 × 8.88 , 70.56 + 3.16 × 8.88[≃]42.49 , 98.63[ 
Exercice 4 (o). On considère les données suivantes :
11582 5231 35756 8916 5852 5354 11417 10705 4588 2025 11096
8167 5788 4627 5678 2921 5771 4672 16948 9015 20217 1766
1. Dépouiller ces données par classes de même amplitude.
2. Donner un découpage en classes plus approprié d’amplitudes inégales.
Solution.
1. La règle de Sturges donne un nombre de classes approximativement égal à
10 10
1 + .log10 (N ) = 1 + .log10 (22) ≃ 5.47 ≃ 6
3 3
En optant donc pour 6 classes de même amplitude, on pourait prendre pour am-
plitude ≃
étendue 35 756 − 1 766
= = 5 665 ≃ 6 000
6 6
On a alors, la série dépouillée suivante :

i classe ni
1 0 − 6 000 12
2 6 000 − 12 000 7
3 12 000 − 18 000 1
4 18 000 − 24 000 1
5 24 000 − 30 000 0
6 30 000 − 36 000 1

/// 22
8

2. On note que la majorité des données sont concentrées dans 2 des 6 classes. Il vaut
mieux faire un découpage en classes d’amplitudes inégales.
On opte alors pour des classes fines là où le caractère est plus fréquent, et des
classes larges là où le caractère est rare.
En optant toujours pour 6 classes et en s’inspirant du résultat trouvé à la question
1., on peut proposer le découpage suivant qui paraît plus intéressant.
i classe ai ni
1 0 − 3 000 3 000 3
2 3 000 − 5 000 2 000 3
3 5 000 − 7 000 2 000 6
4 7 000 − 9 000 2 000 2
5 9 000 − 12 000 2 000 5
6 12 000 − 36 000 24000 3

/// /// 22
La solution n’est pas unique, on peut aussi considérer le découpage suivant qui
paraît aussi intéressant
i extrémité ai ni
0
1 4000 3
4000
2 1000 3
5000
3 3000 6
8000
4 2000 3
10000
5 2000 4
12000
6 24000 3
36000

/// /// 22
Exercice 5 (an). La production des gisements pétroliers sous- marins, par région est
la suivante(en millions de tonnes) :
Région 1960 1970 1975 1981
Amérique du N ord 13.3 82.5 68 53
Amérique latine 81.3 134 99 121
Af rique 0 36.2 54 71
M oyen − Orient 9 87.9 162 237
Extrême − Orient 0.1 10.9 43 74
Europe 0.5 1.4 13 118
Autres 7 13 11 10
9

1. Calculer pour ces 4 années la production totale de pétrole "offshore".


2. Donner une représentation graphique de ce phénomène.
3. La production totale de pétrole était :
– 1052 millions de tonnes en 1960
– 2336 millions de tonnes en 1970
– 2715 millions de tonnes en 1975
– 2852 millions de tonnes en 1981
Calculer la part du pétrole "offshore" en pourcentage.
4. Donner une représentation graphique montrant en 1981 la part du pétrole "off-
shore" par rapport à la production totale mondiale.

Solution.
1.
Année 1960 1970 1975 1981
P roduction totale offshore
111.2 365.9 450 684
en millions de tonnes

2. Le phénomène peut être représenté dans un même graphique par les tuyaux d’orgue
pour les différentes années
10

P roduction totale offshore


3. P art du offshore = × 100. D’où :
P roduction totale P étrole
Année 1960 1970 1975 1981
P roduction totale offshore
111.2 365.9 450 684
en millions de tonnes
P roduction totale du pétrole
1052 2336 2715 2852
en millions de tonnes
P art du offshore en % 11 16 17 24

4. En 1981, la production "offshore" du pétrole représente 24% de la production totale,


qui correspond à un secteur d’angle θ = 0.24 × 180 ≃ 43˚dans une représentation
camembert demi-cerle. D’où,


11

Exercice 6 (d-bis). La compilation de l’ensemble des résultats obtenus par 180 étu-
diants en gestion des affaires pour un cours de statistique est résumée dans l’histo-
gramme des effectifs suivant :

1. Reconstituer la distribution des effectifs.


2. Calculer la moyenne, l’écart-type et la médiane de la distribution.
3. Déterminer la valeur modale de la distribution.
On a tracé la courbe des fréquences cumulées de la distribution et on a obtenu :

4. Utiliser cette courbe pour répondre aux questions suivantes :


(a) Déterminer le premier et le troisième quartile.
(b) Déterminer l’écart-interquartile.
12

(c) Déterminer la proportion d’étudiants qui se situent entre les valeurs M e ± Q


Q3 − Q1
avec Q =
2
(d) Déterminer le 5ème décile, le 9ième décile, le 15ième centile et le 65ième centile.
Solution.
1. La distribution des effectifs est :
Classes ef f ectif s
40 − 45 1
45 − 50 5
50 − 55 8
55 − 60 10
60 − 65 22
65 − 70 28
70 − 75 34
75 − 80 30
80 − 85 20
85 − 90 14
90 − 95 5
95 − 100 3

2. X = 72, σ(X) ≃ 11.01 et M e(X) = 72.35


3. M o(X) = 72.5
4. (a) Q1 ≃ 65 et Q3 ≃ 80
(b) Ecartinterquartile = 15
(c) 50%
(d) d5 ≃ 72.5, d9 ≃ 87, c15 ≃ 60 et c65 ≃ 77 
Exercice 7 (ai). Calculez la moyenne et la variance de la distribution statistique sui-
vante :
M odalités 0 1 2 ... ... n
Ef f ectif Cn0 Cn1 Cn2 . . . . . . Cnn

m
k k m−k
Solution. On utilisera la formule du binôme de Newton : Cm a b = (a+b)m
k=0

n ∑
n ∑
n
– La taille de la population : N = ni = Cni = Cni .1i .1n−i = (1 + 1)n = 2n
i=0 i=0 i=0
– Moyenne :
1 ∑ n
1 ∑n
i
1 ∑
n
n!
X = xi ni = n iCn = n
N i=0 2 i=1 2 i=0 (i − 1)!(n − i)!
n ∑
n−1
(n − 1)! ∑
n n−1 k n
= = Cn−1 = n .2n−1
k=i−1 2 k=0 k!(n − 1 − k)!
n n
2 k=0 2
n
=
2
13

– Variance
1 ∑ n
2 1 ∑ n ( n )2 1 ∑ n [ ] n2
σ 2 (X) = x2i ni − X = n i2 Cni − = n i(i − 1) + i Cni −
N i=0 2 i=0 2 2 i=0 4
1 ∑n
1 ∑n
n 2
1 ∑n
n! n n2
= i(i − 1)C i
n + iC i
n − = + −
2n i=2 2n i=0 4 2n i=2 (i − 2)!(n − i)! 2 4
n(n − 1) ∑
n−2
(n − 2)! n n 2
n(n − 1) ∑
n−2
n n 2
= + − = k
Cn−2 + −
k=0 k!(n − 2 − k)!
k=i−2 2 n 2 4 2 n 2 4
k=0
n(n − 1) n−2 n n2
= n
.2 + −
n 2 2 4
=
4
Exercice 8 (ah). : On a relevé la moyenne et la variance d’une série de 10 observa-
tions et on a obtenu les résultats suivants :X = 5.9 et σ 2 (X) = 4.83. On a constaté
ultérieurement qu’une des observations initiales avait été transcrite de façon erronée :
la valeur considérée au cours des calculs était 8.5, alors que la valeur exacte était en
réalité 6.5. Déterminez la moyenne et la variance exacte.
Solution. On peut supposer, quitte à changer la numérotation, que l’observation
erronée est la première. Notons donc 8.5 := X1,er et 6.5 := X1,ex = X1,er − 2.
2
En notant aussi 5.9 := X er et 4.83 := σer , on a :
– Moyenne exacte :
1 ∑ n
1( ∑10 ) 1( ∑10 )
X ex = Xi = X1,ex + Xi = X1,er − 2 + Xi
N i=1 10 i=2 10 i=2
1 ( ∑10 )
= X1,er + Xi − 0.2 = X er − 0.2 = 5.9 − 0.2 = 5.7
10 i=2
– Variance exacte
1 ∑ n
2 1( 2 ∑10 )
2
σex = Xi2 − X ex = X1,ex + Xi2 − (X er − 0.2)2
N i=1 10 i=2
1 [ ∑10 ] 2
= (X1,er − 2)2 + Xi2 − (X er − 0.4X er + 0.04)
10 i=2
1
= σer + (−4X1,er + 4) + 0.4X er − 0.04
2
10
1
= 4.83 + (−4 × 8.5 + 4) + 0.4 × 5.9 − 0.04 = 4.15
10

Exercice 9 (u). On a réalisé une enquête sur le salaire annuel du personnel féminin
d’un groupe industriel. L’analyse a conduit aux résultats suivants :
Salaire annuel
25 − 30 30 − 35 35 − 40 40 − 45 45 − 55 55 − 65 65 − 85 85 − 100
en Dirhams
ef f ectif 960 1704 2640 2196 2808 996 516 180

1. Calculer le salaire moyens des femmes exprimé en dirhams et à l’unité près.


2. Calculer l’écart-type du salaire annuel des femmes exprimé en DH et à l’unité
près.
14

3. Déterminer la médiane, le coefficient de variation et l’écart interquartile du salaire


annuel des femmes.
4. Si le salaire annuel des 18000 salariés hommes est de 52965 DH, quel est le salaire
moyen de l’ensemble du personnel du groupe ?

Solution.

Exercice 10 (ag_Rmip-18-19). Une entreprise fabrique des lampes, et a testé un échan-


tillon de ces lampes pour mesurer la durée de fonctionnement. Les résultats sont consi-
gnés dans le tableau suivant :

Durée en centaines d′ heures 0−1 1−2 2−4 4 − 12


ef f ectif s 22 22 22 15

1. Dresser le tableau des fréquences cumulées croissante et décroissante.


2. Tracer l’histogramme et le polygone de la distribution.
3. Déterminer la moyenne et l’écart-type de la série statistique.
4. Calculer la médiane de cette série.
5. Quel pourcentage de lampes a une durée inférieure à la valeur moyenne ?

Solution.



Vous aimerez peut-être aussi