Vous êtes sur la page 1sur 31

1

Formation à Distance

Année Universitaire 2020 – 2021


Mention INFORMATIQUE

Cours
De
STATISTIQUE DESCRIPTIVE
1ère Partie

Niveau Licence 1

par

RAMILISON Désiré

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
2

STATISTIQUE DESCRIPTIVE (Ière Partie)

Table des matières

Chapitre 1. Vocabulaires de base et notations. 3


I. Vocabulaire de base 3
1. Définition
2. Tableaux – Individus – Caractères
3. Les variables statistiques
II. Représentations graphiques des distributions à un 6
caractère
1. Caractères qualitatifs
2. Caractères quantitatifs
2.1. Variables statistiques discrètes
2.2. Variables statistiques continues
Chapitre 2. Les caractéristiques d’une variable statistique 11
quantitative à un caractère
I. Les caractéristiques de valeur centrale ou de position 11
II. Les caractéristiques de dispersion 14
III. Les caractéristiques de forme 15
IV. Les caractéristiques de concentration. 16
.
Exercices sur le chapitre 1 19
Exercices sur le chapitre 2 26

Indications bibliographiques 31

ooooooooooooooooOOOOOOOOOOOOoooooooooooo

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
3

Chapitre 1
Vocabulaires de base et notations
Le terme statistique a un double sens :
1. Statistiques (au pluriel) désigne la totalité des données numériques (ex.
Consommation des ménages d’une localité) ou non numériques (ex. Situation
matrimoniale) d’un ensemble.
2. Statistique (au singulier) désigne un ensemble cohérent de méthodes scientifiques
(ex. Le calcul de la consommation moyenne des ménages d’une localité) qui
permettent de résumer l’ensemble de données numériques ou non numériques
d’un ensemble.

I. VOCABULAIRES DE BASE
1. Définitions
 Statistique = ensemble des méthodes scientifiques basées sur le recueil –
l’organisation – la présentation de données, ainsi que la modélisation et la construction
de résumés numériques
 Statistique descriptive = décrit et analyse un ensemble sans tirer de conclusion.
 Statistique inductive = lorsqu’on tire des conclusions sur une partie d’un ensemble
et que l’on tente d’étendre ces conclusions sur tout l’ensemble.
 Population ou univers = ensemble d’éléments, d’objets ou d’individus regroupés
dans une catégorie bien définie.
 Echantillon = une partie de la population qui lui est représentative, c’est à dire qui doit
posséder les propriétés fondamentales de l’ensemble dont il est issu.
 Individu ou unité statistique = élément constitutif d’une population ou d’un
échantillon qui permet de donner des informations sur les données statistiques
recherchées.
 Enquêtes exhaustives ou recensement = Opérations servant à recueillir des
données statistiques (numériques ou non ) auprès de la totalité de la population.
 Enquêtes partielles ou sondage = lorsqu’on s’intéresse à une partie (appelée
« échantillon ») représentative des individus qui composent la population étudiée
 Caractère = une des multiples facettes selon laquelle on peut étudier un individu d’une
population ou d’un échantillon. Un individu extrait d’une population peut être étudié
selon plusieurs caractères.
 Caractère qualitatif : un caractère est dit qualitatif si ses diverses modalités ne sont
pas quantifiables (Exemple : sexe, type d’occupation, situation matrimoniale,
profession, appréciation (excellent, bon, passable, médiocre))
 Caractère quantitatif : un caractère est dit quantitatif si ses différentes modalités sont
mesurables ou repérables, c’est-à-dire si à chacune de ses modalités correspond un
nombre. Ce nombre s’appelle variable statistique notée 𝑥𝑖 (x étant la valeur du
caractère quantitatif et i le numéro de la modalité correspondante) (Exemple : âge, nb
de voitures, nb d’enfants à charge, la taille d’un individu, le revenu…)
Ainsi, les modalités d’un caractère quantitatif sont les différentes valeurs possibles de
la variable statistique.
 Modalités : ce sont les différentes situations possibles d’un caractère
 Caractéristiques des modalités :
- Incompatibilité : un individu n’appartient qu’à une et une seule des modalités du
caractère envisagé.
ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
4

Le nombre des modalités d’un caractère varie selon le degré de détail de l’information
disponible. Par exemple, le caractère « état matrimonial » peut comporter, suivant le
cas :
o Deux modalités : marié, non marié.
o Trois modalités : célibataire, marié, veuf ou divorcé
o Quatre modalités : célibataire, marié, veuf, divorcé
o Cinq modalités ; célibataire, marié, veuf, divorcé, non déclaré
- Exhaustivité : toutes les modalités d’un caractère susceptibles d’exister doivent être
considérées dans la base de données.

2. Tableaux – individus – caractères

Base de données : on appelle base de données, le recueil des données d’une


enquête où sont inscrites pour chaque individu les modalités de réponses à un
ensemble de caractères retenus pour l’étude.

 Exemple : Informations recueillies dans une enquête sur 50 individus :

N° Nb N° Nb
Sexe Age Sit Matr Sexe Age Sit Matr
individu Enfants individu Enfants
1 M 40 M 3 26 M 34 M 1
2 M 15 C 0 27 M 31 M 2
3 M 26 M 1 28 F 28 C 0
4 F 50 V 3 29 M 27 C 0
5 F 35 M 2 30 F 26 M 1
6 M 36 M 3 31 F 31 M 0
7 F 35 M 3 32 M 32 M 0
8 M 40 M 4 33 M 37 M 1
9 F 45 M 3 34 F 19 C 0
10 F 46 M 2 35 M 22 C 0
11 F 47 V 3 36 F 26 ND 0
12 FM 50 D 3 37 F 61 M 5
13 F 27 C 0 38 M 59 M 4
14 M 52 D 2 39 F 58 M 5
15 F 53 V 3 40 M 51 M 3
16 M 71 V 5 41 M 37 M 2
17 F 42 M 3 42 F 40 M 3
18 M 19 ND 0 43 F 41 ND 3
19 F 30 M 1 44 F 43 M 2
20 F 25 C 0 45 M 46 M 4
21 M 26 C 0 46 M 23 C 0
22 M 32 ND 1 47 F 21 C 0
23 F 28 C 0 48 F 69 V 4
24 F 29 C 0 49 M 26 M 1
25 M 34 M 1 50 M 27 C 0

Dépouillement : c’est le décompte du nombre d’individus possédant le caractère


qu’on veut étudier.

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
5

La base de données ci-dessus peut fournir les informations suivantes :

Caractère Type Modalités


M Masculin
Sexe Qualitatif
F Féminin
inf 20 Regroupées selon
20 - 30 la précision qu’on
30 - 40 veut obtenir.
Age Quantitatif
(dans notre cas, on
40 - 50
veut ne retenir que
sup 50 5 modalités)
C Célibataires
M Marié
Situation matrimoniale Qualitatif V Veuf
D Divorcé
ND Non déclaré
0 Regroupées selon
1 la précision qu’on
2 veut obtenir.
Nombre d’enfants Quantitatif
(dans notre cas, on
3
veut ne retenir que
4et + 5 modalités)

3. Les variables statistiques : les différents types de variables statistiques


 Variable statistique discrète (vsd)
Lorsque ses valeurs possibles sont des nombres isolés. Le cas le plus fréquent
de vsd est celui où les valeurs possibles sont des nombres entiers. Exemple :
o L’âge en années révolues,
o Le nombre d’enfants à charge,
o Le nombre de pièces d’un logement
o ……………….
 Variable statistique continue (vsc)
Lorsque ses valeurs possibles sont à priori en nombre infini et quelconque dans
un intervalle de valeur. Exemple :
o L’âge exact d’une personne,
o Le diamètre d’une pièce,
o La taille des étudiants d’une promotion,
o …………………..

4. Opérateurs somme et produit


i étant le numéro de la modalité et k le numéro de la dernière modalité
Somme : n = n1 + n2 + n3 + …. + nk = ∑𝑘𝑖=1 𝑛𝑖
Produit x = x1 • x2. • x3 • x4.. xi......xk =∏𝑘𝑖=1 𝑥𝑖

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
6

II. Tableaux statistiques et représentations graphiques

A) Tableaux statistiques

C’est pour résumer l’information contenue dans une distribution statistique


(quantitative ou qualitative)
A partir de la base de données, on peut concevoir différents tableaux faisant ressortir
la répartition de l’univers selon les différentes modalités du caractère étudié. Ce
tableau est, d’une manière générale, de la forme :

Modalités du Effectifs dans


caractère C chaque modalité
C1 n1
C2 n2
…… ……
Ci ni
…… ……
Ck nk
Total n

1. Caractères qualitatifs.

Lorsque le caractère C est qualitatif, le tableau statistique est de la forme générale


présentée ci-dessus : entre les lignes figurent à la fois les modalités et les effectifs.

2. Caractères quantitatifs

a. Variables statistiques discrètes

Lorsque la variable statistique est discrète, on porte entre les lignes du tableau
statistique, à la fois, les valeurs possibles et les effectifs (ou les fréquences) de
chacune des modalités.

Exemple : Répartition des ménages selon le nombre d’enfants à charge


Modalités Effectifs
(Variable statistique = ( = Nombre de ménages)
Nombre d’enfants à charge)
0 𝑛1
1 𝑛2
2 𝑛3
3 𝑛4
4 𝑛5
5 et plus 𝑛6
Total n

b. Variables statistiques continues

Si la variable statistique est continue (vsc), on regroupe les valeurs des variables en
classes, et ces classes constituent les modalités.

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
7

Exemple : Répartition du personnel d’une entreprise selon leur revenu mensuel


Modalités = classes Effectifs dans
6
des revenus en 10 chaque
Ar modalité
Moins de 1 n1
1 à moins de 1,5 n2
1,5 à moins de 2,0 n3
2,0 à moins de 3,0 n4
3,0 et plus n5
Total n

NOTATIONS
xi = variables statistiques d’une modalité i
ni = nb d’individus de la modalité i en effectif
k = nombre de modalités ou classes
n = ∑𝑘𝑖=1 𝑛𝑖 = effectif cumulé des k modalités
ei = extrémités de classes
𝑒 +𝑒
ci = centre de classes = 𝑖−12 𝑖
ai = amplitude de classe = ei - 𝑒𝐼−1
𝑛𝑖 ∑𝑘
𝑖 𝑛𝑖 𝑛
fi = fréquence relative =  ∑𝑘𝑖=1 𝑓𝑖 = = =1
𝑛 𝑛 𝑛
Fi = fréquence cumulée jusqu’à i -1
𝑖−1

⇒ 𝐹𝑖 = ∑ 𝑓𝑗
𝑗=1

B) Représentation graphique des distributions à un caractère

1. Caractères qualitatifs
 Diagramme en tuyaux d’orgue
Dans ce type de représentation, les rectangles (tuyaux d’orgue) ont pour base
une modalité et comme hauteur l’effectif 𝑛𝑖 (diagramme absolu), ou la fréquence
𝑓𝑖 (diagramme relatif). La base de chacun des rectangles (base sur l’axe des
abscisses) ne possède aucune signification numérique (variable qualitative).
 Base = modalité (ne possède aucune signification numérique)
 Hauteur = effectif 𝑛𝑖 (diagramme absolu) ou fréquence 𝑓𝑖 (diagramme
relatif).
 Diagramme en secteurs ou en camembert
Dans ce type de représentation, on utilise un disque (plus communément appelé
camembert). Chacune des modalités est représentée par un secteur qui est
proportionnel à l’effectif (ou à la fréquence), l’angle au centre 𝛳𝑖 étant égal au
produit de la fréquence 𝑓𝑖 par 360°.
𝛳𝑖 = 𝑓𝑖 x 360°

 Diagramme figuratif
C’est un jeu de silhouettes figuratives dans laquelle chaque figure représente une
modalité et sa taille dépend de l’effectif (ou fréquence) relatif à cette modalité.

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
8

a. Variable qualitative nominale


 On appelle Variable qualitative nominale une variable à caractère qualitatif
NON ORDONNEE i.e. le classement dans le tableau est arbitraire
Exemple : La situation matrimoniale des employés d’une entreprise ;
Célibataire, Marié, Divorcé, Veuf
b. Variable qualitative ordinale :
On appelle variable qualitative ordinale une variable à caractère qualitatif
mais ORDONNEE, le classement des modalités n’est pas « arbitraire »
Exemple : Les mentions dans une faculté : Excellent, Très Bien, Bien, Passable,
Médiocre

2. Caractères quantitatifs
Lorsque le caractère à représenter est quantitatif, c’est-à-dire, lorsqu’on décrit une
population selon une variable statistique, on utilise deux types de représentation
graphique :
 Le diagramme différentiel en bâtons (si la variable est discrète) ou
l’histogramme (si la variable est continue)
 Le diagramme intégral ou courbe cumulative.

2.1 Variable statistique discrète

a) Diagramme en bâtons :
C’est une représentation d’une distribution statistique discrète où chaque bâton a
une hauteur proportionnelle à l’effectif ni (absolu) ou à la fréquence fi (relative) de la
modalité 𝑖

ni ou fi

0 1 2 3 4 5 6 7et plus 𝑥𝑖
b) Polygone des fréquences
Le polygone des fréquences d’une variable statistique discrète est la courbe
qui joint les sommets des bâtons d’un diagramme en bâtons.

ni ou fi

0 1 2 3 4 5 6 7et plus 𝑥𝑖
c) Courbe cumulative
On appelle courbe cumulative ou courbe intégrale la courbe représentative des
fréquences cumulées Fi
avec 𝐹𝑖 = ∑𝑖−1
𝑗=1 𝑓𝑗

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
9

𝐹𝑖 représente la proportion des individus de la population dont le caractère est


inférieur à 𝑥𝑖
La courbe cumulative correspondante est une courbe en escalier de la forme :
𝐹𝑖
1 ___________






⃒ 𝑥𝑖
0 1 2 3 4 5 6 7et plus

2.2 Variable statistique continue


a) Histogramme de fréquence relative ou absolue
C’est la représentation d’une distribution statistique continue (𝑥𝑖 ,𝑛𝑖 ) (histogramme des
fréquences absolues), ou (𝑥𝑖 ,𝑓𝑖 %) (histogramme des fréquences relatives) groupées
en classes où chaque classe est représentée par un rectangle de base proportionnelle
à l’amplitude et de surface proportionnelle à l’effectif. La hauteur ℎ𝑖 de l’histogramme
sera alors égale à :
𝑃𝐺𝐶𝐷 (𝑎𝑖 )
ℎ𝑖 =
𝑎𝑖

𝑓𝑖

𝑃𝐺𝐶𝐷 (𝑎𝑖 )
𝑓𝑖 ℎ𝑖 = 𝑓𝑖
𝑎𝑖

0 𝑒𝑖−1 𝑎𝑖 𝑒𝑖 𝑥𝑖
b) Polygone des fréquences :
 Le polygone des fréquences d’une variable aléatoire continue est la courbe qui joint les
milieux des sommets des tuyaux de l’histogramme de fréquence.
𝑓𝑖

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
10

0 𝑥𝑖

c) Courbe cumulative ou courbe intégrale

C’est la représentation graphique de la distribution des effectifs cumulés absolus


(𝑒𝑖 , 𝑁𝑖 ) ou des fréquences cumulées relatives (𝑒𝑖 , 𝐹 (𝑒𝑖 ).

𝐹 (𝑒𝑖 ) représente la proportion des individus de la population dont le caractère est


inférieur à 𝑒𝑖

𝐹𝑖
Fréquences cumulées

Extrémités de classe (𝑒𝑖 )

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
11

Chapitre 2

Les caractéristiques d’une variable statistique quantitative à une


dimension

Les caractéristiques ou résumés numériques d’une variable statistique doivent


posséder certaines propriétés appelées conditions de Yule :
- être définies de manière objective
- dépendre de toutes les observations
- avoir une signification concrète
- être facilement calculables et interprétables
- être peu sensibles aux fluctuations et échantillonnage
- se prêter aisément aux calculs algébriques
Il existe 4 grands groupes d’indicateurs sur les caractéristiques d’une variable
statistique quantitative :
1. les caractéristiques de valeur centrale ou de position :
 qui permettent de substituer à une distribution statistique une valeur
représentative (Ex. La moyenne)
 qui tiennent compte de la position d’une valeur précise dans la distribution
statistique (Ex. Le mode, la médiane)
2. Les caractéristiques de dispersion
 qui permettent de mesurer les écarts par rapport à une valeur centrale (Ex.
la variance)
3. les caractéristiques de forme
 qui permettent de préciser l’allure de la distribution
4. les caractéristiques de concentration
 qui s’appliquent à la description d’unités économiques selon leur taille

I. Les caractéristiques de valeur centrale ou de position

1) La Médiane Me

La Médiane d’une variable statistique, notée Me , est la valeur de cette variable


qui partage les individus en deux effectifs égaux. Cela correspond à
1
F(Me) = 2 .
Rappel : F(𝑥𝑖 ) désigne la proportion des individus de la population dont le caractère
est inférieur à 𝑥𝑖
1
Si cette proportion est égale à 50% ( c’est-à-dire 2 ) , 𝑥𝑖 sera alors appelée la
Médiane et se note Me .
La Médiane se calcule soit par lecture graphique soit par interpolation linéaire.

2) Les quartiles, les déciles, les centiles.


a) Les quartiles
 Le premier quartile, noté 𝑄1, est la valeur de la variable statistique qui délimite
le premier quart des individus de la population. C’est-à- dire :
1
F(Q1) = 4
 Le troisième quartile, noté 𝑄3 , est la valeur de la variable statistique qui
délimite les trois premiers quarts des individus de la population. C’est-à- dire :

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
12

3
F(Q3) =
4

b) Les déciles

 Le premier décile, noté 𝐷1 , est la valeur de la variable statistique qui délimite


le premier dixième des individus de la population. C’est-à- dire :
1
F(D1) = 10
 Le neuvième décile, noté 𝐷9 , est la valeur de la variable statistique qui délimite
les neuf premiers dixièmes des individus de la population. C’est-à- dire :
9
F(D9) = 10
De même, on peut définir le 2ème, 3ème, 4ème …. Décile

c) Les centiles

 Le premier centile, noté 𝐶1 , est la valeur de la variable statistique qui délimite


le premier centième des individus de la population. C’est-à- dire :
1
F(C1) = 100
 Le 90ème centile, noté 𝐶90 , est la valeur de la variable statistique qui délimite
les premiers 90% des individus de la population. C’est-à- dire :
90
F(C90) = 100
De même, on peut définir le 2ème, 3ème, 4ème …. centile

3) Le mode Mo

Le mode, noté Mo , d’une variable statistique est la valeur correspondant au


maximum du diagramme différentiel ou de l’histogramme .
Le Mode est ainsi la valeur la plus fréquente (si vad) ou la classe la plus
dominante (si vac).
Cette classe modale peut être remplacée par une valeur modale qui se calculera
par interpolation linéaire de la manière suivante, par application des principes
des triangles semblables :

𝒇𝒊

d1 d2

0 ei 𝑀0 ei+1

𝑀0 − ei d1 d1
= Or, ei+1 − ei = 𝑎𝑖 , D’où 𝑀0 = ei + 𝑎𝑖 .
ei+1 − ei d1+ d2 d1+ d2

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
13

Si la distribution présente deux valeurs dominantes, on dit que la distribution est


bimodale.

4) La moyenne

̅
4.1 La moyenne arithmétique notée 𝒙
a. Moyenne arithmétique simple

1
𝑥̅ = ∑𝑘𝑖=1 𝑥𝑖 .
𝑛
b. Moyenne arithmétique pondérée
𝑛𝑖 𝑥𝑖
𝑥̅ = ∑𝑘𝑖=1 = ∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖 .
𝑛
C’est un résumé numérique qui tient compte de toutes les observations faites sur
la variable statistique. Elle est rarement une valeur observée.

4.2 La moyenne géométrique notée G

𝑓 𝑓 𝑓 𝑓 𝑓 𝑓𝑖
G = 𝑥11 . 𝑥22 . 𝑥33 … . . 𝑥𝑖 𝑖 … . . 𝑥𝑘 𝑘 = ∏𝑘
𝑖=1 𝑥𝑖

ln G = 𝑓1 ln𝑥1 + 𝑓2 ln𝑥2 + 𝑓3 ln𝑥3 + …. + 𝑓𝑘 ln𝑥𝑘 = ∑𝑘𝑖=1 𝑓𝑖 ln𝑥𝑖

𝑓
ln 𝑥𝑖 𝑖 𝑓
G = 𝑒 𝑓1 ln𝑥1 + 𝑓2 ln𝑥2 + 𝑓3 ln𝑥3 + ……𝑓𝑖 ln𝑥𝑖 …….+ 𝑓𝑘ln𝑥𝑘 = ∏𝑘
𝑖=1 𝑒 = ∏𝑘𝑖=1 𝑥𝑖 𝑖
𝑘 𝑘
𝑓
ln 𝑥𝑖 𝑖 𝑓
𝐺 = ∏𝑒 = ∏ 𝑥𝑖 𝑖
𝑖=1 𝑖=1
La moyenne géométrique est utilisée quand les valeurs de la variable statistique
sont liées de façon multiplicative les unes aux autres.

4.3 La moyenne harmonique notée H

1 𝑛1 1 𝑛2 1 𝑛𝑖 1 𝑛𝑘 1 1 𝑛𝑖
= + + −⋯ +⋯ = ∑𝑘𝑖=1
𝐻 𝑛 𝑥1 𝑛 𝑥2 𝑛 𝑥𝑖 𝑛 𝑥𝑘 𝑛 𝑥𝑖

𝑛
⇒ 𝐻 = 𝑛𝑖 .
∑𝑘
𝑖=1 𝑥
𝑖
La moyenne harmonique est utilisée quand les valeurs observées varient en
sens contraire (exemple prix et quantité)
4.4 La moyenne quadratique notée Q
𝑘
𝑛1 2 𝑛2 2 𝑛𝑖 𝑛𝑘 𝑛𝑖
𝑄2 = 𝑥1 + 𝑥2 + ⋯ 𝑥𝑖2 + ⋯ 𝑥𝑘2 = ∑ 𝑥𝑖2
𝑛 𝑛 𝑛 𝑛 𝑛
𝑖=1

𝑛𝑖
Q = √ ∑𝑘
𝑖=1 𝑥𝑖2 = √∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖2
𝑛

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
14

La moyenne quadratique donne une importance accrue aux valeurs aberrantes


de la variable statistique.

Il existe une relation d’ordre entre les différentes moyennes :


H < G < ̅𝑥 < Q
𝑥̅ , H et G sont utilisées pour calculer des indices synthétiques des prix ou
quantités (voir Chapitre 3 sur les Indices infra)

II. Les caractéristiques de dispersion

1. Etendue, intervalle interquantile

 Etendue ou range
On appelle étendue ou range, l’écart entre les deux extrémités de la première et de
la dernière classe :
Etendue = ek – e1 .
Elle est très influencée par les valeurs extrêmes de la variable statistique qui sont
parfois aberrantes, donc elle est peu utilisée.

 Ecart absolu moyen


On appelle écart absolu moyen le nombre, noté 𝑥̅𝑒 , défini par :
1
𝑥̅𝑒 = ∑𝑘𝑖=1 𝑛𝑖 |𝑥𝑖 − 𝑥̅ |
𝑛
C’est un indicateur difficilement maniable très peu utilisé

 Intervalle interquantile
o intervalle interquartile
C’est la valeur Q3 - Q1 = 50% des valeurs de la variable
o Intervalle interdécile : D9-D1=80% des valeurs de la variable
o Intervalle intercentile : C90-C10=80% des valeurs de la variable

Ces 2 intervalles sont liés à des variables possédant un nombre important de


valeurs.

2. Variance notée V(x)


La variance, appelée aussi moyenne quadratique des écarts à la moyenne
arithmétique pondérée est la valeur :

V(x) = ∑𝑛
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )
2
.
En développant ce calcul, on obtient :

V(x) = ∑𝑛 2
𝑖=1 𝑓𝑖 𝑥𝑖 − 𝑥̅
2
.
Qu’on appelle théorème de König

La variance mesure la dispersion de la distribution par rapport à la moyenne : plus la


variance est élevée, plus la distribution est dispersée. Elle renseigne ainsi sur le sens
de la moyenne : plus la variance est grande, moins la moyenne est significative.

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
15

3. Ecart-type noté 𝜎(x) ou 𝜎

𝜎(x) = 𝜎 = √𝑉(𝑥)

4. Autres caractéristiques de dispersion


4.1. Les quantiles
On appelle quantile d’ordre 𝛼 (0 ≼ 𝛼 ≼ 1) notée 𝑥𝛼 la racine de l’équation F(𝑥𝛼 ) = 𝛼,
1 1
o F(𝑄1) = ⟺ 𝑄1est le quantile d’ordre 4 ou le 1er quartile
4
3 3
o F(𝑄3 ) = ⟺ 𝑄3 est le quantile d’ordre 4 ou le 3ème quartile
4
1 1
o F(𝐷1 ) = ⟺ 𝐷1 est le quantile d’ordre ou le 1er décile
10 10

4.2. Les moments


On appelle moment d’ordre r (r entier positif) par rapport à la valeur a, la
quantité :
a𝑚𝑟 = ∑𝑘𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑎)𝑟 .
En particulier,
Si a = 0 ⇒ 0𝑚𝑟 = 𝑚𝑟 = ∑𝑘 𝑟
𝑖=1 𝑓𝑖 𝑥𝑖 qu’on appelle moment non centré d’ordre
r

 Si r = 1 ⇒ 𝑚1 = ∑𝑘
𝑖=1 𝑓𝑖 𝑥𝑖 = 𝑥̅ et on retrouve la moyenne
arithmétique

Si a = 𝑥̅ ⇒ x𝑚𝑟 = ∑𝑘 𝑟
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ ) = 𝜇𝑟 qu’on appelle moment centré
d’ordre r

 Si r = 2 ⇒ 𝜇2 = ∑𝑘 2
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ ) = V(x) et on retrouve la variance

4.3. Les moments factoriels


On appelle moment factoriel d’ordre r, noté 𝜇[𝑟] , la quantité :

𝑥𝑖 !
𝜇[𝑟] = ∑𝑘𝑖=1 𝑓𝑖 𝑥𝑖 (𝑥𝑖 − 1)(𝑥𝑖 − 2)(𝑥𝑖 − 3) … . . (𝑥𝑖 − 𝑟 + 1) = ∑𝑘𝑖=1 𝑓𝑖 (𝑥
𝑖 − 𝑟) !

Cette caractéristique est surtout utilisée dans le cas des variables discrètes à
valeurs entières positives.

 Si r = 1, ⇒ 𝜇[1] = 𝑚1 = ∑𝑘
𝑖=1 𝑓𝑖 𝑥𝑖 = 𝑥̅ et on retrouve la moyenne
arithmétique

III. Les caractéristiques de forme

Les caractéristiques de forme renseignent sur l’allure générale de la distribution à


partir de 2 coefficients qu’on appelle coefficients de Fisher qui sont des nombres
sans dimension et invariants par changement d’origine et d’échelle.

1. Le coefficient d’asymétrie de Fisher noté 𝛄𝟏


Le coefficient d’asymétrie 𝛾1 renseigne sur la symétrie de la distribution statistique
par rapport à la moyenne.
ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
16

𝜇3
𝛾1 = .
𝜎3

Si 𝛾1 = 0 ⟺ la distribution statistique est symétrique par rapport à la moyenne


Si 𝛾1 > 0 ⟺ 𝑀0 ≺ 𝑥̅ ⟺ La distribution est décentrée à gauche par rapport à la
moyenne et étalée vers la droite
Si 𝛾1 < 0 ⟺ 𝑀0 ≻ 𝑥̅ ⟺ La distribution est décentrée à droite par rapport à la
moyenne et étalée vers la gauche

2. Le coefficient d’aplatissement de Fisher noté 𝛄𝟐


Le coefficient d’aplatissement 𝛾2 renseigne sur la hauteur de la distribution par
rapport à la distribution dite « normale »
𝜇4
𝛾2 = -3
𝜎4

Si 𝛾2 = 0 ⟺ L’histogramme (ou le diagramme) a la même hauteur que la distribution


dite « normale »
Si 𝛾2 ≺ 0 ⟺ L’histogramme (ou le diagramme) est moins élevé que la distribution
normale
Si 𝛾2 ≻ 0 ⟺ L’histogramme (ou le diagramme) est plus élevé que la distribution
normale

IV. Les caractéristiques de concentration

Dans ce paragraphe, on va étudier :


 La répartition des individus selon les classes de caractères
 L’importance du caractère possédé par classe.
On considère un ensemble d’individus ou d’unités de production classés selon leur
salaire, ou le chiffre d’affaires ou la surface cultivée (caractère).
Il est possible de classer cet ensemble :
 Selon leur nombre (exemple : effectifs)
 Ou selon l’importance du caractère possédé (exemple : la masse salariale, la
superficie totale cultivée…)
Cette distinction conduit à une double représentation, c’est-à-dire à construire :
 Un histogramme donnant le nombre des effectifs (𝑛𝑖 ) par classe (1er cas),
 Un histogramme donnant l’importance du caractère possédé (𝑛𝑖 𝑥𝑖 ) par classe
(2ème cas)
Dans le 1er cas, on peut calculer la Médiane (notée 𝑴𝒆 ) ,c’est-à-dire la valeur de la
variable qui délimite la moitié du caractère.
Dans le 2nd cas, on peut calculer la valeur de la variable qui délimite la moitié de la
masse de caractère, qu’on appelle la Médiale (notée Ml ).

Ainsi la médiale Ml est la valeur du caractère telle que tous les caractères supérieurs
constituent une moitié de la masse globale du caractère, l’autre moitié étant
constituée par tous les caractères inférieurs.

On peut représenter ces deux distributions sur un même graphique appelé courbe
de concentration ou courbe de Gini ou courbe de Lorentz.

Cette courbe se construit à partir des fréquences cumulées relatives dont :


 En abscisses, la fréquence relative cumulée du nombre des effectifs (𝐹𝑖 ),

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
17

 Et en ordonnées, la fréquence relative cumulée du caractère possédé par


classe
(𝐹 ′ 𝑖 = ∑𝑖𝑘=1 𝑓𝑘 𝑥𝑘 )

1) Construction de la courbe de concentration ou courbe de Lorentz ou courbe de


Gini
𝑛𝑘 𝑥𝑘
𝐹′𝑖 = ∑𝑖𝑘=1 𝑛
100

t
t
t t
0 100 Fi cumulée

S = aire de concentration
t = trapèze élémentaire
1
Aire du trapèze t = (grande base + petite base) x hauteur x 2
S = 0,5 – somme des trapèzes élémentaires
2) Calcul de l’indice de Gini i (ou encore indice de concentration)

i = 2S .

Interprétation : (exemple sur la distribution des salaires)

a. Si i ≺ 0,5 : La concentration est faible.

Si i ⋍ 0 , il y a une distribution égalitaire des


salaires, c’est-à-dire, chaque ouvrier touche
à peu près les mêmes salaires

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
18

b. Si i ≻ 0,5 : la concentration est forte

Si i ⋍ 1 , une forte proportion d’ouvriers ne


gagnent à peu près rien, tandis qu’une faible
fraction du personnel se partage la quasi-
totalité de la masse des salaires

3) Coefficient de variation

Le coefficient de variation est le rapport :


𝜎
CV = ,
𝑥̅

Il permet de comparer, par exemple, des distributions de salaires pour


différentes qualifications ou dans différents pays : le caractère en question est
plus homogène dans une qualification (ou dans un pays) où le coefficient de
variation (CV) est plus faible.

ooooooooooooooooOOOOOOOOOOOOOoooooooooooooo

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
19

Exercices sur le Chapitre 1

Exercice 1.1
Le tableau suivant présente la répartition des étudiants d’une promotion de
l’ESUM selon les appréciations à la suite d’un examen :

Modalités Effectifs
Très bien 4
Bien 11
Assez Bien 45
Passable 110
Total 170

1) Quelle est la nature de ce caractère ?


2) Définir la variable statistique associée à ce caractère
3) Calculer l’effectif par modalité, l’effectif total, et la fréquence de cette
distribution
4) Donner plusieurs représentations graphiques de cette variable

Exercice 1.2
Etant donné la série statistique ci-après :

0 enfant 45 ménages
1 enfant 71 ménages
2 enfants 49 ménages
3 enfants 24 ménages
4 enfants 20 ménages
5 enfants 18 ménages
6 enfants 9 ménages
7 enfants 3 ménages
8 enfants 2 ménages
Total 241 ménages

1) Donner un titre à ce tableau


2) Préciser la population, le caractère étudié, les modalités, le type de
variable.
3) Calculer les fréquences relatives
4) Représenter graphiquement le diagramme des fréquences relatives.
5) Tracer le polygone des fréquences.
6) Calculer les fréquences cumulées.
7) Tracer la courbe cumulative.

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
20

Exercice 1.3
Etant donné la statistique suivante :

Tranche de salaire net Effectif du


3
annuel (en 10 UM) personnel
Inf 40 354
40 – 60 231
60 – 80 177
80 – 100 81
100 – 120 56
120 – 150 119
150 – 200 185
200 – 300 112
Sup 300 136
Total 1 451
1) Donner un titre à ce tableau
2) Dans ce tableau statistique, préciser la population, l’unité statistique, le
caractère étudié, les modalités.
3) Indiquer dans un même tableau : les extrémités de classe, les centres
de classes, les amplitudes de classes.
4) Calculer les fréquences relatives
5) Représenter graphiquement l’histogramme des fréquences relatives.
6) Tracer le polygone des fréquences.
7) Calculer les fréquences cumulées.
8) Tracer la courbe intégrale.

ooooooooooooooOOOOOOOOoooooooooooooo
Solution 1.1
1) Caractère nominal associé à une variable statistique qualitative ordinale.
Les modalités du caractère « appréciation » sont des rubriques
ordonnées.
2) La variable qualitative nominale (Très bien, Bien, Assez Bien, Passable)
est une variable statistique ordonnée dont le classement des modalités
dans le tableau n’est pas arbitraire.
3)

Fréquence
Effectifs Fréquence cumulée
Modalités 𝑛
𝑛𝑖 𝑓𝑖 = 𝑛𝑖
𝐹𝑖 = ∑𝑖−1
𝑗=1 𝑓𝑗
Très bien 4 0,024
0,024
Bien 11 0,065
0,089
Assez Bien 45 0,264
0,353
Passable 110 0,647
1
Total 170 1,000
n = ∑𝑘𝑖=1 𝑛𝑖 = 170
Attention :
 les fréquences individuelles 𝑓𝑖 s’écrivent entre les lignes
 les fréquences cumulées 𝐹𝑖 s’écrivent sur les lignes
4)
 Diagramme en secteurs
 Diagramme en tuyaux d’orgues
ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
21

Solution 1.2
1. Répartition de 241 ménages selon le nombre d’enfants par ménage
2.
 Population : les 241 ménages
 Caractère étudié : le nombre d’enfants par ménage
 Modalités : 9 (nombre possible d’enfants par ménage)
 Type de variable : variable discrète

3. Fréquences relatives 𝑓𝑖 :
𝑥𝑖 𝑛𝑖 𝑓𝑖
0 45 18,7%
1 71 29,5%
2 49 20,3%
3 24 10,0%
4 20 8,3%
5 18 7,5%
6 9 3,7%
7 3 1,2%
8 2 0,8%
Total 241 100%

4. 5. Diagramme des fréquences relatives : c’est la représentation graphique


de (𝑥𝑖 , 𝑓𝑖 ) et polygone des fréquences

Répartition des ménages selon le nombre


d'enfants
Fréquence relative des ménages (𝑓𝑖 )

35,0%

30,0%

25,0%

20,0%

15,0%

10,0%

5,0%

0,0%
0 1 2 3 4 5 6 7 8

Nombre d’enfants par ménage (𝑥𝑖 )

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
22

6. Fréquences cumulées 𝐹𝑖 :

𝑥𝑖 𝑓𝑖 𝐹𝑖
0 18,7%
---------- ---------- 18,7%
1 29,5%
---------- ---------- 48,1%
2 20,3%
--------- ---------- 68,5%
3 10,0%
---------- ---------- 78,4%
4 8,3%
---------- ---------- 86,7%
5 7,5%
---------- ---------- 94,2%
6 3,7%
---------- ---------- 97,9%
7 1,2%
---------- ---------- 99,2%
8 0,8%
---------- ---------- 100,0%
Total 100%

7. Courbe cumulative de la distribution des ménages selon le nombre


d’enfants

120,00%
Fréquences cumulées (𝐹𝑖 )

100,00%

80,00%

60,00%

40,00%

20,00%

0,00%
0 1 2 3 4 5 6 7 8 9

Nombre d’enfants (𝑥𝑖 )


Solution 1.3 𝑥𝑖
1) Répartition du personnel d’une entreprise selon le salaire net annuel en milliers UM

2) Population : le personnel de l’entreprise


Unité statistique : un agent
Caractère étudié : le salaire (variable statistique continue)
Modalités : les 9 classes de salaire
ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
23

3) Extrémités de classe (𝑒𝑖 ), centres de classe (𝑐𝑖 ), amplitudes de classe (𝑎𝑖 )


Tranches de salaire 𝑒𝑖 𝑐𝑖 𝑎𝑖
(en 103 UM)
--------------------------- 20 --------- ---------
Moins de 40 30 20
--------------------------- 40 --------- ---------
40 – 60 50 20
--------------------------- 60 --------- ---------
60 – 80 70 20
--------------------------- 80 --------- ---------
80 – 100 90 20
--------------------------- 100 --------- ---------
100 – 120 110 20
--------------------------- 120 --------- ---------
120 – 150 135 30
--------------------------- 150 --------- ---------
150 – 200 175 50
--------------------------- 200 --------- ---------
200 – 300 250 100
--------------------------- 300 ---------
Sup 300 350 100
400
Total
Notez bien :
a. les 𝒆𝒊 doivent se trouver sur les lignes du tableau, et les
𝒄𝒊 et 𝒂𝒊 entre les lignes
b. pour la première et la dernière classe ouverte, prendre comme amplitude
de classe, l’amplitude de classe juste adjacente.
4) Fréquences relatives 𝑓𝑖
Tranches de salaire 𝑛𝑖 𝑓𝑖 (%)
(en 103 UM)
Inf 40 354 24,40%
40 – 60 231 15,92%
60 – 80 177 12,20%
80 – 100 81 5,58%
100 – 120 56 3,86%
120 – 150 119 8,20%
150 – 200 185 12,75%
200 – 300 112 7,72%
Sup 300 136 9,37%
Total 1 451 100,00%

Attention : les 𝒏𝒊 et les 𝒇𝒊 se mettent entre les lignes du tableau

5) 6) Histogramme des fréquences relatives et polygone des fréquences

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
24

C’est un histogramme en tuyau d’orgue car la variable est continue, la hauteur de


chaque tuyau est égal à :

𝑃𝐺𝐶𝐷 (𝑎𝑖 )
ℎ𝑖 = 𝑓𝑖
𝑎𝑖
𝑥𝑖 𝑛𝑖 𝑓𝑖 𝑎𝑖 ℎ𝑖
Inf 40 354 24,40% 20 24,40
40 – 60 231 15,92% 20 15,92
60 – 80 177 12,20% 20 12,20
80 – 100 81 5,58% 20 5,58
100 – 120 56 3,86% 20 3,86
120 – 150 119 8,20% 30 5,47
150 – 200 185 12,75% 50 5,10
200 – 300 112 7,72% 100 1,54
Sup 300 136 9,37% 1,87
Total 1 451 100,00%

𝑓𝑖

20 40 60 80 100 120 150 200 300 400 ei

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
25

7) Calcul des fréquences cumulées

𝑥𝑖 𝑒𝑖 𝑓𝑖 % 𝐹𝑖 %
------------------ 20 ------------------ 0
Inf 40 24,40
------------------ 40 ------------------ 24,40
40 – 60 15,92
------------------ 60 ------------------ 40,32
60 – 80 12,20
------------------ 80 ------------------ 52,52
80 – 100 5,58
------------------ 100 ------------------ 58,10
100 – 120 3,86
------------------ 120 ------------------ 61,96
120 – 150 8,20
------------------ 150 ------------------ 70,16
150 – 200 12,75
------------------ 200 ------------------ 82,91
200 – 300 7,72
------------------ 300 ------------------ 90,63
Sup 300 9.37
------------------ 400 ------------------ 100,00
Total 1 451 100,00%

Remarque : les 𝐹𝑖 se mettent sur les lignes


8) Courbe intégrale
𝐅𝐢

0 20 40 60 80 100 120 150 200 300 400 𝑒𝑖

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
26

Exercices sur le chapitre 2

Exercice 2.1
Une enquête auprès de 500 visiteurs d’un musée âgés d’au moins 15 ans
permet d’obtenir la distribution statistique ci-après :

Age Nombre de
(en années) visiteurs
15 – 25 96
25 – 35 118
35 – 50 138
50 – 65 101
65 ans et plus 47
1. Définir la variable associée au caractère âge. (On nommera cette
variable X)
2. Tracer l’histogramme de fréquence relative de cette distribution.
3. Déterminer le mode. Calculer une valeur pour le mode. Commenter
4. Déterminer la médiane. Commenter.
5. Calculer le premier et le troisième quartile. Commenter.
6. Calculer le premier et le neuvième décile. Commenter.
7. Représenter toutes ces valeurs de position sur le diagramme de
fréquence.
8. Tracer la courbe intégrale de cette distribution.
9. Calculer la moyenne arithmétique. Commenter.
10. Calculer les caractéristiques de dispersion suivantes : l’étendue,
l’écart absolu moyen et l’écart-type.
11. Calculer les caractéristiques de forme de Fisher. Commenter

Exercice 2.2
Le tableau suivant donne les notes d’examen d’un étudiant, cotées sur
20, sur 5 matières avec les coefficients respectifs par matière :
Note Coefficient de la
Matières
sur 20 matière
A 2 2
B 8 3
C 17 1
D 12 3
E 3 2
1) Calculer la moyenne arithmétique des notes
2) Calculer la moyenne géométrique des notes
3) Calculer la moyenne quadratique des notes
4) Calculer la moyenne harmonique des notes
5) Comparer les différentes moyennes obtenues.

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
27

Exercice 2.3
Soit la distribution statistique suivante donnant le nombre d’employés par
classe de salaires :
Classe de Nombre
salaire d’employés
moins de 10 4
10 à 20 3
20 à 30 2
30 à 40 1
Total 10
1) Déterminer la Médiane. Interpréter
2) Calculer la Médiale. Interpréter
3) Construire la courbe de concentration
4) Calculer l’indice de Gini. Interpréter.

ooooooooooooooOOOOOOOOoooooooooooooo

Solutions des exercices


Solution 2.1
1) X = variable statistique continue
2) Histogramme de fréquences relatives : c’est la représentation
graphique des 𝑓𝑖
Age 𝑥𝑖 𝑛𝑖 𝑎𝑖 𝑓𝑖 ℎ𝑖
𝑃𝐺𝐶𝐷 (𝑎𝑖 )
15-25 96 10 0,192 0,096 ℎ𝑖 = 𝑓𝑖
25-35 118 10 0.236 0,118 𝑎𝑖
35-50 138 15 0,276 0,092 PGCD(𝑎𝑖 ) = 5
50-65 101 15 0,202 0,067 ℎ𝑖 étant la hauteur de
65 et + 47 15 0,094 0,031 l’histogramme
Total 500 1,000 ///

0,118
𝑑1 𝑑2

0,092

I I I I I I
15 25 𝑀0 35 50 65 80 𝑒𝑖

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
28

3) Le mode

d1
𝑀0 = ei + 𝑎𝑖 .
d1+ d2

𝑑1 = 0,118 - 0,096 = 0,022


𝑑2 = 0,118 - 0,092 = 0,026

D’où 𝑀0 = 29,58 ans

Classe modale = 29 – 35 ans : la majorité des visiteurs ont entre 25 - 35


ans.
La valeur modale 𝑀0 est 29,58 ans
4) La médiane
Age 𝑒𝑖 𝑓𝑖 𝐹𝑖 𝑐𝑖 𝑓𝑖 𝑐𝑖
----------- 15 ----------- 0 --------- ---------
15 – 25 0,192 20 3,84
----------- 25 ----------- 0,192 --------- ---------
25 – 35 0,236 30 7,080
----------- 35 ----------- 0,428 --------- ---------
35-50 0 ,276 42,5 11,73
----------- 50 ----------- 0,704 --------- ---------
50 – 65 0,202 57,5 11,615
----------- 65 ----------- 0,906 --------- ---------
65 et + 0,094 72,5 6,815
----------- 80 ----------- 1,000 --------- ---------
Total 1,000 41,08

Médiane = 𝑀𝑒 = 38,91 ans : la moitié des visiteurs ont moins de 38,91


ans
5) 𝑄1 = 25,73 ans : le quart des visiteurs ont moins de 25,73 ans
𝑄3 = 53,42 ans : 75% des visiteurs ont moins de 53,42 ans
6) 𝐷1 = 20,21 ans : 10% des visiteurs ont moins de 20,21 ans
𝐷9 = 64,55 ans : 90% des visiteurs ont moins de 64,55 ans
7) (à faire par l’étudiant)
8) (à faire par l’étudiant)
9) 𝑥̅ = 41,08 ans les visiteurs sont âgés de 41,08 ans en moyenne
10) é𝑡𝑒𝑛𝑑𝑢𝑒 = 𝑒5 - 𝑒1 = 65 ans avec 𝑒5 = 80 ans : il y a 65 ans d’écart
entre l’individu le moins âgé et le plus âgé de l‘enquête.
1
écart absolu moyen = 𝑥̅𝑒 = ∑𝑘𝑖=1 𝑛𝑖 |𝑥𝑖 − 𝑥̅ | = 13,32 ans
𝑛
écart-type 𝜎 = 16,19 ans
𝜇
11) Coefficient d’asymétrie 𝛾1 = 33 = 0,3985 > 0 : la distribution est
𝜎
décentrée à gauche et étalée vers la droite, c’est-à-dire 𝑀0 < 𝑥̅
𝜇4
Coefficient d’aplatissement 𝛾2 = – 3 = - 0,8491 < 0 : la distribution
𝜎4
est moins élevée que la distribution normale

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
29

Solution 2.2
1) 𝑥̅ = 7,909 ≈ 7,9
2) 𝐺 = 6,21 ≈ 6,2
3) 𝑄 = 9,239 ≈ 9,2
4) 𝐻 = 4,769 ≈ 4,8
5) 𝐻 < G < 𝑥̅ < Q
Solution 2.3
On dresse le tableau de calcul :
Classe 𝑛𝑖 𝑐𝑖
𝑛𝑖 𝑒𝑖 𝑓𝑖 𝐹𝑖 𝑐𝑖 𝑛𝑖 𝑐𝑖 𝑖 𝐹′𝑖
𝑥𝑖 ∑𝑘=1 𝑛𝑖 𝑐𝑖
0 - 10 4 0,4 5 20 0,133
10 0,4 0,133
10 –20 3 0,3 15 45 0,300
20 0,7 0,433
20 -30 2 0,2 25 50 0,333
30 0,9 0,766
30 - 40 1 0,1 35 35 0,234
40 1,0 1,000
Total 10 1,0 150 1,000
1) Calcul de la médiane
0,50−0,4
𝑀𝑒 = 10 + 10 = 13,33
0,7−0,4
Interprétation : 50% des employés perçoivent un salaire inférieur à 13,33

2) Calcul de la médiale
0,50−0,433
Ml = 20 + 10 = 22,012
0,766−0,433
Interprétation : 50% (la moitié) de la masse salariale est perçue par les
employés dont le salaire est inférieur à 22,012

3) Construction de la courbe de concentration


𝑛 𝑥
𝐹′𝑖 = ∑𝑖𝑘=1 𝑘𝑛 𝑘
1 --

0,766

𝑡4

S
𝑡3
0,433

𝑡2

0,133

𝑡1

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
30

0 0,4 0,7 0,9 1 Fi

Surfaces des trapèzes :


1
t1 = 2 (0,4 x 0,133) = 0,0266
1
t2 = (0,133 + 0,433) x 0,3 = 0,0849
2
1
t3 = 2 (0,433 + 0,766) x 0,2 = 0,1199
1
t4 = 2 (0,766 + 1) x 0,1 = 0,0883
Surfaces des trapèzes = 0,0266 + 0,0849 + 0,1199 + 0,0883 = 0,3197
S = 0,5 – 0,3197 = 0,1803
4) Indice de Gini i
i = 2S = 0,3606
Interprétation :
Comme i ≺ 0,5 , on a une concentration relativement faible

ooooooooooooOOOOOOOOOoooooooooo

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021
31

INDICATIONS BIBLIOGRAPHIQUES

 Cours de statistique descriptive, par Gérard CALOT, éditions Dunod, 488 pages
 Statistique descriptive, travaux dirigés, par J.L. MONINO, J.M. KOSIANSKI, F. LE
CORNU, éditions Dunod , 248 pages
 STATISTIQUE, Exercices corrigés avec rappel de cours, Tome 1, par Christian
LABROUSSE, éditions Dunod, 374 pages

ooooooooooooooOOOOOOOOoooooooooooooo

ESUM Cours de Statistique Descriptive I par RAMILISON Désiré Année universitaire 2020-2021

Vous aimerez peut-être aussi