Vous êtes sur la page 1sur 7

Année Universitaire : 2020/2021 / Semestre 2

Statistiques descriptives

Correction de la série 2

Remarque concernant les exercices 1 et 2 : Quand utilise-t-on l’une ou l’autre moyenne ?

« Le statisticien est cet homme qui croit que la tête dans un four et les pieds dans la glace, on jouit,
en moyenne, d’une température fort agréable ! »

-  Lorsque la logique est additive, on utilise la moyenne arithmétique. Par exemple : salaires, notes obtenues dans un
examen…
-  Lorsque la logique est multiplicative ou cumulative c’est-à-dire lorsque les valeurs de la variable se multiplient (elles
suivent une progression géométrique), on utilise la moyenne géométrique par exemple dans le calcul du taux
d’accroissement moyen, le taux de croissance démographique moyen d’une population …
-  Lorsque la variable varie selon une raison inverse d’une autre grandeur, on utilise la moyenne harmonique par
exemple dans le calcul des durées moyennes, des moyennes de rapports et de pourcentage, de pouvoir d’achat…
-  Pour la moyenne quadratique, elle n’a pas d’application dans le champ économique. Elle est appliquée dans le
calcul de la variance (formule simplifiée de la variance : V = Q$ − ' X $)

Pour résoudre ces deux exercices, nous n’allons pas utiliser directement une moyenne spécifique, mais nous allons
monter pourquoi on a recours à une moyenne plutôt qu’une autre.

Solution de l’exercice 1
Le prix moyen d’achat d’un Kg de M n’est pas dans ce cas la moyenne arithmétique des trois prix car on n’a pas la
même quantité achetée.
En effet :
+
-  Pendant la 1ère année, l’entreprise a acheté :  q* = $,,, Kg de M
+
-  Pendant la 2ème année, l’entreprise a acheté :  q$ = $/,, Kg de M
+
-  Pendant la 3ème année, l’entreprise a acheté :  q0 = $//, Kg de M
Au total, l’entreprise a acheté pendant les trois années la quantité : q  =  q1+q2+q3 de M au prix égal à 3S (chaque
année, elle achète une quantité au même prix S)
Donc le prix moyen d’achat égale à :

Prix  total  dépensé 3S 3S 3S


 p678 = = = = + + +
Quantité  totale  achée q q* + q$ + q0 + $/,, + $//,
$,,,

On a alors :
𝟏 𝟏
𝐩𝐦𝐨𝐲 = 𝟏 𝟏 𝟏 𝟏 =𝟏 𝟏 = 𝟐𝟑𝟐𝟏. 𝟕  𝐃𝐡
( S S ) ∑𝟑
𝟑 𝟐𝟎𝟎𝟎 𝟐𝟓𝟎𝟎 𝟐𝟓𝟓𝟎 𝟑 𝐢X𝟏𝐩𝐢

avec pi  : le prix du Kg de chaque année

1
Donc, le prix moyen d’un Kg de M est la moyenne harmonique simple des prix (2000, 2500,2550).
C’est l’inverse de la moyenne arithmétique des inverses des prix.

Solution de l’exercice 2
L’augmentation annuelle moyenne des bénéfices réalisés n’est pas dans ce cas la moyenne arithmétique des dix
augmentations.
En effet :
Soit B0 le bénéfice réalisé par l’entreprise l’année précédant la période écoulée avec B0 ¹0.

Alors, le bénéfice était :


-   1 an plus tard : B1 = B0 + B0 ´ 0.05 = B0 ´ 1.05 ß 1.05 est appelé coefficient multiplicateur
-   2 ans plus tard : B2 = B1 + B1 ´ 0.05 = B1 ´1.05 = B0´1.052
-   3 ans plus tard : B3 = B2 + B2 ´ 0.09 = B2 ´1.09 = B0 ´ 1.052 ´ 1.09
-   4 ans plus tard : B4 = B3 + B3´ 0.09 = B3 ´1.09 = B0 ´ 1.052 ´ 1.092
-   …….
-   7 ans plus tard : B7 = B0 ´ 1.052 ´ 1.095
-   8 ans plus tard : B8 = B0 ´ 1.052 ´ 1.095 ´ 1.12
-   …….
-   10 ans plus tard : B10 = B0 ´ 1.052 ´ 1.095 ´ 1.123 ß 1.05 , 1.05, 1.09, …,1.09, 1.12, ..,1.12 sont les 10
coefficients multiplicateurs pendant les 10 années écoulées.

Si on note par a l’augmentation annuelle moyenne (taux d’accroissement moyen) sur les 10 ans. On aura alors :

B10 = B0 ´ (1+a)10 (en faisant le même procédé)

Dans ce cas, 1+a est le coefficient multiplicateur moyen pendant les 10 ans.

Donc : B10 = B0 ´ (1+a)10 = B0 ´ 1.052 ´ 1.095 ´ 1.123


Þ (1+a)10 = 1.052 ´ 1.095 ´ 1.123
Þ (1+a) = (1.052 ´ 1.095 ´ 1.123)1/10

De cette formule, on conclut le résultat suivant :

Si a est le taux d’accroissement moyen alors le coefficient multiplicateur moyen (1+a) est une moyenne
géométrique pondérée des coefficients multiplicateurs.

A.N. 1+a = 1.09 Þ a = 0.09.


Donc l’augmentation annuelle moyenne ou le taux d’accroissement moyen des bénéfices sur les 10 ans est de 9%.

2
Solution de l’exercice 3
Pour tracer la courbe de Lorenz, il faut calculer les fréquences relatives cumulées croissantes Fi (axe des abscisses)
et les valeurs globales relatives cumulées croissantes Gi (axe des ordonnées). Les calculs sont résumés dans le
tableau suivant :

xi ni fi % Fi % ni * x i gi % Gi%

[2 - 3[ 50 25 25 125 15,63 15.63


[3 - 5[ 125 62.5 87.5 500 62,5 78.13
[5 - 8[ 20 10 97.5 130 16,25 94.38
100 .01
[8 -10[ 5 2.5 100 45 5,63
»100
Total 200 100

100 Gi

80
ß S4
60
Courbe  de  Lorenz
40 S3 Droite  d'équirépartition
S2
20
S1
0 Fi
0 20 40 60 80 100

On joint la courbe à l’origine (0,0)


D’après ce graphique, on remarque que la courbe de Lorenz (courbe bleue) est très proche de la droite
d’équirépartition (courbe rouge) ce qui laisse penser à une concentration faible.

Calculons l’indice de Gini :


_`ab  cb  ^7d^bdeafe`7d /,,,g(+*S+$S+0S+h)
On a : I^ = =
/,,, /,,,
Avec :
S1 = (25 x 15.63)/2 = 195.4
S2 = (87,5-25) x (78.13+15.63) = 2930
S3 = (97.5-87,5) x (94.38+78.13)/2 = 862.6
S4 = (100-97.5) x (100+94.38)/2 = 243

Donc Ic = 0.1538 soit 15.38%

On en déduit que la concentration est faible c’est-à-dire que l’inégalité de répartition des terres au sein de cette
commune est faible.

3
Solution de l’exercice 4
Une entreprise a effectué un sondage auprès de sa clientèle pour connaître son appréciation sur le service livraison.
Les résultats sont présentés dans le tableau croisé des effectifs :
On note par :
-   X le premier caractère : Nombre de clients selon leur ancienneté. X a deux modalités (x1 : Nombre de clients de
plus de 2 ans d’ancienneté et x2 : Nombre de clients d’au plus de 2 ans d’ancienneté).
-   Y le deuxième caractère : Degré de satisfaction. Y a quatre modalités (y1 : Pas du tout Satisfait, y2 : Plutôt pas
satisfait, y3 : Plutôt satisfait, y4 : Très satisfait).

Y
Pas du tout Plutôt pas Plutôt Très
X satisfait satisfait satisfait satisfait
Nombre de clients de plus de 2 ans d’ancienneté 10 50 245 195
Nombre de clients d’au plus de 2 ans d’ancienneté 40 90 205 165

1.   10 est le nombre (en terme de fréquence : 10/1000 = 0.01 soit 1%) des clients qui ont plus de 2 ans d’ancienneté
et qui ne sont pas du tout satisfaits. (1000 est le nombre total des clients interrogés).
165 est le nombre (en terme de fréquence : 165/1000 = 0.165 soit 16.5%) des clients qui ont au plus 2 ans
d’ancienneté et qui sont très satisfaits.

2.   Ligne marginale et colonne marginale :


Y
Pas du tout Plutôt pas Plutôt Très Colonne
satisfait satisfait satisfait satisfait marginale
X
500=10+50+245
Nombre de clients de plus de 2 ans d’ancienneté 10 50 245 195
+195
Nombre de clients d’au plus de 2 ans d’ancienneté 40 90 205 165 500
Ligne marginale 50=10+40 140 450 360 1000

On lit par exemple :


-   450 est le nombre total (en terme de fréquence : 450/1000 = 0.45 soit 45%) des clients qui sont plutôt
satisfaits indépendamment de leur nombre d’année d’ancienneté.
-   500 est le nombre total (en terme de fréquence : 500/1000 = 0.50 soit 50%) des clients qui ont au plus 2 ans
d’ancienneté indépendamment de leur degré de satisfaction.

3.   Le pourcentage total des clients plutôt satisfaits ou très satisfaits indépendamment de leur ancienneté :
((245+205)+(195+165)) / 1000 = (450 + 360) / 1000 = 810 / 1000 soit 81 %

4.   Le pourcentage des clients de plus de 2 ans d’ancienneté parmi les clients plutôt satisfaits ou très satisfaits :
(245+195) / (450+360) = 440 / 810 = 0,5432 soit 54.32 %

5.   Le tableau de contingence obtenu en regroupant d’une part, les clients pas du tout satisfaits et plutôt pas
satisfaits et d’autre part, les clients plutôt satisfaits et très satisfaits.

4
Y
Pas du tout satisfait Plutôt satisfait Colonne
ou plutôt pas satisfait ou très satisfait marginale
X
Nombre de clients de plus de 2 ans d’ancienneté 60 440 = n12 500 = n1.
Nombre de clients d’au plus de 2 ans d’ancienneté 130 370 500
Ligne marginale 190 810 = n.2 1000

6.   On remarque dans le dernier tableau ci-dessus, que les lignes (et les colonnes) ne sont pas proportionnelles
entre elles.
𝐧𝟏. ×  𝐧.𝟏 𝟓𝟎𝟎×𝟏𝟗𝟎
Aussi, par exemple l’effectif n11 = 60 est différent du rapport 𝐧
= 𝟏𝟎𝟎𝟎
= 𝟗𝟓.
On confirme alors que les deux caractères X et Y ne sont pas indépendants.

𝐧𝐢. ×  𝐧.𝐣
Si les deux caractères étaient indépendants, on doit avoir : ∀𝐢, ∀𝐣, 𝐧𝐢𝐣 = 𝐧
en particulier pour i=1 et j=2.
Dans ce cas d’indépendance, l’effectif nij est appelé effectif théorique.

𝐧𝟏. ×  𝐧.𝟐 𝟓𝟎𝟎×𝟖𝟏𝟎


L’effectif théorique n12 est donné par 𝐧𝟏𝟐 = = = 𝟒𝟎𝟓
𝐧 𝟏𝟎𝟎𝟎
Donc si les deux caractères étaient indépendants on aurait, au lieu de 440, un effectif de 405 clients de plus de 2
ans d’ancienneté qui sont plutôt satisfait ou très satisfait.

Solution de l’exercice 5
Cet exercice est analogue à celui vu en cours (chapitre3).
Ajoutons dans le tableau, la ligne marginale et la colonne marginale.

Salaires Y
5-10 10-15 15-30 30-40 Colonne marginale
Nombre de voitures X
1 20 18 4 0 42
2 15 24 10 6 55
3 0 3 2 4 9
Ligne marginale 35 45 16 10 106

1.   Nombre moyen des voitures possédées.


Pour cela, on utilise la distribution marginale de X (distribution à une seule variable) puis calculer la moyenne
marginale de cette distribution. On a :

Nombre de
ni. ni.  *  xi  
voitures : X
1 42 42  
2 55 110  
3 9 27  
Total   106   179  

5
r = 𝟏𝟕𝟗 = 𝟏. 𝟔𝟗
Donc 𝑿 𝟏𝟎𝟔
En faisant l’arrondissent, on peut conclure que 2 est le nombre moyen des voitures possédées.

2.   Salaire moyen et écart-type s (Y ) .


Pour cela, il faut utiliser la distribution marginale de Y (distribution à une seule variable) puis calculer la
moyenne et l’écart type de cette distribution. On a :

Salaire : Y n.j Centre  yjc   n.j  *  yj   n.j*  yj  *  yj  


5-10 35 7.5   262.5   1968.75  
10-15 45 12.5   562.5   7031.25  
15-30 16 22.5   360   8100  
30-40 10 35   350   12250  
Total 106     1535   29350  

r = 𝟏𝟓𝟑𝟓 =  𝟏𝟒. 𝟒𝟖𝟏𝟏𝟑                


Donc 𝐘 𝟏𝟎𝟔

Le salaire moyen est de 14481.13 Dh.

3.   Calculons les moyennes conditionnelle X 2 et Y 3 :


-   X 2 est la moyenne conditionnelle de la distribution conditionnelle de X sous la condition Y= y2. C’est le
nombre moyen des voitures possédées par les salariés qui perçoivent un salaire compris entre 10000 et
15000 (y2 : deuxième modalité du salaire).
Pour calculer cette moyenne, il faut utiliser la distribution conditionnelle de X sachant y2. On se trouve alors
dans le cas d’une distribution à une seule variable X avec la condition y2 = [10-15[.

Nombre de
ni2 ni2*  xi  
voitures : X
1 18 18  
2 24 48  
3 3 9  
Total   45   75  

𝟕𝟓
Donc uuuu
𝑿𝟐 = 𝟒𝟓 = 𝟏. 𝟔𝟕 .
On peut conclure que 2 (en faisant l’arrondissement) est le nombre moyen des voitures possédées par les
salariés qui perçoivent un salaire compris entre 10000 et 15000.

-   Y 3 est la moyenne conditionnelle de la distribution conditionnelle de Y sous la condition X= x3. C’est le


salaire moyen perçu par les salariés qui possèdent 3 voitures (x3 : troisième modalité de la variable nombre
de voitures).
Pour calculer cette moyenne, il faut utiliser la distribution conditionnelle de Y sachant x3. On se trouve alors
dans le cas d’une distribution à une seule variable Y avec la condition x3 = 3.

6
Salaire : Y   n3j   centre   n3j  *yj  
5-10   0   7.5   0  
10-15   3   12.5   37.5  
15-30   2   22.5   45  
30-40   4   35   140  
Total   9     222.5  

$$$./
Donc 𝑌'0 = w = 24.72222. On peut conclure que 24722.22 Dh est le salaire moyen des salariés qui
possèdent 3 voitures.

Vous aimerez peut-être aussi