Vous êtes sur la page 1sur 11

Solutions des exercices du chapitre 1

Exercice 1.1.
Plusieurs solutions sont possibles, selon le choix de l'intervalle de classes et de la valeur extrême inférieure
de la première classe.

SI on se fixe comme objectif initial de regrouper les données en 10 clases de même intervalle, ce dernier
serait égal à :

En respectant la règle qui veut que le nombre de classes doit être un nombre simple, on peut choisir un
intervalle de 5 mm (on pourrait choisir aussi 3 ou 4).

Ensuite, si on fixe la valeur extrême inférieure de la première classe à 30 (on aurait pu choisir aussi 31), la
valeur extrême supérieure de cette classe sera égale à :

VES(1) = 30 + 5 – 1 = 34.

Ainsi, on obtient la distribution de fréquences suivante :

Longueurs ni (  n'i ) N ( xi ) ( N '( xi ))


(mm)
(*) (*)
30 – 34 3 3
35 – 39 8 11
40 – 44 18 29
45 – 49 25 54
50 – 54 18 72
55 – 59 17 89
60 – 64 7 96
65 – 69 4 100
Totaux 100 -
(*) Etant donné que l'effectif est égal à 100, les fréquences absolues sont égales aux fréquences
relatives(en %).

On peut remarquer que le nombre final de classes n'est plus que de 8 au lieu des 10 visées initialement.
Ceci est dû au fait qu'on a choisi un intervalle de classes plus large (5) au lieu de celui calculé (3,9), mais
on gagne beaucoup en simplicité car les classes obtenues sont plus faciles à percevoir et à manipuler.

La classe médiane est celle qui contient la médiane. Elle est identifiée en cherchant la classe où la
fréquence relative cumulée dépasse 50% pour la première fois. Il s'agit donc de la 4ème classe, avec :

- valeurs extrêmes: VEI = 45 , VES = 49

- limites : ,

- point central : .

IAV \D.S.A.\ Statistique Page 1


Exercice 1.2.

a- Distribution de fréquences non cumulées et cumulées des longueurs des corps de 228 vaches laitières.

Classes
de
longueurs ni N ( xi ) n'i (%) N ' ( xi ) (%)
130 - 133 2 2 0,9 0,9
134 - 137 3 5 1,3 2,2
138 - 141 8 13 3,5 5,7
142 - 145 25 38 11,0 16,7
146 - 149 37 75 16,2 32,9
150 - 153 62 137 27,2 60,1
154 - 157 60 197 26,3 86,4
158 - 161 21 218 9,2 95,6
162 - 165 6 224 2,6 98,2
166 - 169 4 228 1,8 100,0
Totaux 228 - 100 -

b- Polygone de fréquences relatives cumulées (le polygone de fréquences absolues cumulées aura la
même forme, avec un simple changement d'échelle.

100

90

80

70

60

50

40

30

20

10

0
129,5 133,5 137,5 141,5 145,5 149,5 153,5 157,5 161,5 165,5 169,5

c. pour le calcul des paramètres, on utilise les fréquences et les points centraux des classes.

Avant de calculer l'écart-type, on calcule d'abord la variance :

D'où

IAV \D.S.A.\ Statistique Page 2


d- La classe médiane est celle qui contient la médiane. Elle est identifiée en cherchant la classe où la
fréquence relative cumulée dépasse 50% pour la première fois. Il s'agit donc de la 6ème classe :
153 :

La médiane peut être déterminée de manière approchée, par interpolation linéaire :


Sachant que :

- limite inférieure de la classe médiane : ,

- Intervalle de la classe médiane :


- Fréquence relative de la classe médiane (en %) : 27,2
- Fréquence relative cumulée de la classe précédent la médiane (en %) : 32,9
Donc :

e- L'écart d'une observation par rapport à la moyenne est la distance qui sépare entre cette observation et
la moyenne. Comme les observations peuvent être supérieures ou inférieures à la moyenne, l'écart est
exprimé en valeur absolue :

Ce qui est demandé, c'est donc la fréquence relative (en %) des observations tels que ;

Comme peut s'écrire :

Ou encore :

Il s'agit donc de trouver la fréquence relative (en%) des observations comprises dans l'intervalle :
;
c'est-à-dire, en remplaçant la moyenne et l'écart-type par leurs valeurs, l'intervalle :

cette fréquence relative peut être déterminée par la différence entre les fréquences relatives cumulées :

Comme les valeurs 164,2 et 139,0 ne correspondent pas à des limites de classes, leurs fréquences
relatives cumulées ne peuvent pas être lues directement du tableau de la distribution de fréquences, mais
elles peuvent être déterminées de manière approchée par interpolation linéaire telle qu'illustrée ci-
dessous :

IAV \D.S.A.\ Statistique Page 3


98.2
5.7
N2

a
95.6 N1

b
2.2

164.2 165.5 137.5 139 141.5


161.5

A B

Si on pose , on a dans la figure A :

Ce qui permet de déduire la valeur

De même, si on pose , on a dans la figure B :

Ce qui permet de déduire la valeur

On en déduit ainsi que le pourcentage demandé est égal à 97,4 – 3,5 = 93,9%.

On peut donc affirmer qu'il y a 93,9% des observations qui s'écartent de la moyenne d'une distance
inférieure à 2 fois l'écart-type.

Exercice 1.3.
a-

Moyenne des rendements par parcelle :

2 2
Comme la parcelle mesure 2 m , il suffit de diviser par 2 pour obtenir le rendement par m , soit :

Variance :

IAV \D.S.A.\ Statistique Page 4


On en déduit l'écat-type :

Le coefficient de variation :

b-
Il s'agit d'un changement d'unités :
Sachant que : donc

Si on désigne par , on a la relation


Par conséquent :

Exercice 1.4.

Moyenne :
Sachant que la moyenne est obtenue par la formule :

Alors, la prise en considération d'une valeur au lieu d'une autre se répercutera sur la somme des
observations. Donc c'est cette dernière qu'il faut corriger pour retrouver la moyenne correcte.

Soient :
la moyenne erronée (5,9),

la moyenne correcte.

On peut déduire la somme erronée par :

On corrige cette somme en retirant la valeur fausse (8,5) et en ajoutant la valeur correcte (6,5) :

Et finalement la moyenne correcte est obtenue par division de la somme par l'effectif :
IAV \D.S.A.\ Statistique Page 5
Ecart-type :
Comme d'habitude, pour trouver l'écart-type, on passe par la variance :

Ici, la prise en considération d'une valeur au lieu d'une autre se répercutera sur la somme des carrés des
observations et sur la moyenne. Il faut donc corriger la somme des carrés.

Soient :
la variance erronée ( ),

la variance correcte

On peut déduire la somme des carrés erronée par :

Pour corriger cette somme, on retire le carré de la valeur fausse et on ajoute celui de la valeur correcte :

Et par la suite :

4,16
Et

Exercice 1.5.
Sachant que la différence entre les points centraux des classes successives est égale à l'intervalle de classe, on a:

Ainsi, on peut déterminer les valeurs extrêmes de la première classe en posant :

On en déduit :

IAV \D.S.A.\ Statistique Page 6


Les valeurs extrêmes des autres classes sont déduites en ajoutant chaque fois l'intervalle de classe (5). On obtient
ainsi la distribution de fréquences :

Classes ni N ( xi ) n'i (%) N '( xi ) (%)


8 - 12 7 7 28 28
13 -17 10 17 40 68
18 -22 5 22 20 88
23 - 27 2 24 8 96
28 - 32 1 25 4 100
Totaux 25 - 100 -

25

20
fréq. absolues

15

Histogramme des
fréquences non
10 cumulées

0
10 15 20 25 30
centres des classes

100

80
freq. absolues cumulées

60
Histogramme des
fréquences cumulées

40

20

0
10 15 20 25 30
centres des classes

IAV \D.S.A.\ Statistique Page 7


100

90

80
fréq. absolues cumulées

70

60
Polygone de
50 fréquences cumulées

40

30

20

10

0
7,5 12,5 17,5 22,5 27,5 32,5 37,5
limites des classes

Calcul des paramètres de dissymétrie et d'aplatissement (g1 et g2) :

Avec :

on a :

D'où :

Il s'agit donc d'une distribution dissymétrique, avec une dissymétrie gauche ou positive, et plus aplatie que la courbe
de Gauss.

IAV \D.S.A.\ Statistique Page 8


Exercice 1.6.
a- Pour corriger il faudrait ajouter 2 kg à chaque valeur, ce qui reviendrait à faire la transformation suivante :

, qui est de la forme


Dans ces conditions, on sait que :

b- Cette fois-ci, Pour corriger il faudrait ajouter, à chaque valeur, une quantité égale à 2% de cette dernière, ce qui
reviendrait à faire la transformation suivante :
, qui est de la forme
Dans ces conditions, on sait que :

IAV \D.S.A.\ Statistique Page 9


Exercice 1.7.
Remarque. Attention ici à ne pas confondre la variable (nombre d'œufs) avec les individus (nombre de poules).
a.

Nombre d'œufs Nombre de


(xi) poules
ni N ( xi ) n'i (%) N '( xi ) (%)
0 7 7 3,5 3,5
1 18 25 9,0 12,5
2 30 55 15,0 27,5
3 40 95 20,0 47,5
4 50 145 25,0 72,5
5 30 175 15,0 87,5
6 15 190 7,5 95,0
7 10 200 5,0 100,0
Totaux 200 - 100 -

b.
Mode ou valeur dominante : c'est la valeur qui a la fréquence maximale. Ici la fréquence maximale c'est 50 (si on
prend les fréquences absolues) ou 25% (si on prend les fréquences relatives), qui correspondent à xi = 4 :
Mode = 4
Médiane:

Comme il s'agit d'une distribution non groupée d'effectif pair (n=200), donc la médiane est donnée par :

ème ème
Pour trouver la 100 observation et la 101 observation, il faut se servir de la colonne des fréquences absolues
cumulées :

ème ème
Sachant que la 95 observation, par ordre croissant, est égale à 3 (N(3)=95) et la 145 observation est égale à 4
ème ème
(N(4)=145), donc forcément, puisqu'il ne peut y avoir de valeur intermédiaire entre 3 et 4, la 96 , …, la 100 , la
ème ème ème
101 , la 102 , …, et la 145 sont égale à 4.
Ainsi :

c.

d-

IAV \D.S.A.\ Statistique Page 10


20,709

D'où :

Distribution presque symétrique (légère dissymétrie gauche), plus pointue que la courbe de Gauss.

IAV \D.S.A.\ Statistique Page 11

Vous aimerez peut-être aussi