Vous êtes sur la page 1sur 32

Faculté d’économie et de Gestion

de Kenitra

Statistique descriptive

PREMIERE PARTIE : Introduction à la statistique


DEUXIÈME PARTIE : Concepts fondamentaux
TROIXIÈME PARTIE : Tableaux et graphiques statistiques
QUATRIÈME PARTIE : PARAMETRES D’UNE SERIE STATISTIQUE
• Paramètres de tendance centrale
• Paramètres de dispersion

Professeur Omar EL FOURCHI

Semestre 1 Année universitaire 2021/2022

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Chapitre
1
La statistique descriptive à une seule variable

I. Introduction à la statistique

I.1 Les statistiques désignent les chiffres et les données se rapportant à un


phénomène particulier.

Exemple
On parle des statistiques du chômage pour désigner l’évolution du taux de
chômage sur une période de temps

I.2 La statistique (au singulier) est une activité organisée et méthodique.


C’est une méthode scientifique basée sur les observations d’événements
réels à partir desquelles on cherche à établir des hypothèses plausibles en
vue des prévisions concernant des circonstances analogues.

L’étude d’un problème statistique peut se décomposer en étapes suivantes :

Recueil des données d’observation


Classement et réduction de ces données
Représentation graphique de ces données
Analyse de ces données et Expliquer les résultats obtenus.
Tirer les conclusions et obtenir une interprétation visant à la déduction
de prévisions

La statistique, en tant que méthodes d’analyse des données, comporte deux


niveaux :

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


❖ La statistique descriptive regroupe les méthodes dont l’objectif
principal est la description des données étudiées : c’est à dire la
statistique descriptive vous apprendre comment décrire de façon claire
et concise l’information apportée par des observations nombreuses et
variées sur un phénomène donné. Il s’agit de trier ces données, les
décrire, les résumer sous forme de tableaux, de les schématiser sous
forme de graphiques et de les décrire sous forme d’un petit nombre de
paramètres- clés (moyenne, médiane…etc.)

Dans cette optique, il n’est pas fait appel à des modèles probabilistes.

On notera que les termes de statistique descriptive, statistique


exploratoire et analyse des données sont quasiment synonymes.

Exemple :
Sur un ensemble de 150 élèves, on note les notes des individus. Un bon
résumé des 150 valeurs est obtenu en calculant la moyenne et l’écart type de
cette distribution. On peut aussi donner une représentation graphique qui peut
résumer les 150 résultats.

❖ La Statistique inférentielle regroupe les méthodes dont l’objectif


principal est de préciser un phénomène sur une population globale, à
partir de son observation sur une partie restreinte de cette population,
d’une certaine manière, il s’agit d’induire (ou encore inférer) du
particulier au général. Le plus souvent, ce passage ne pourra se faire
que moyennant des hypothèses de type probabiliste.

On notera que les termes de statistique inférentielle, statistique


mathématique, statistique analytique ou inductive sont eux aussi
quasiment synonymes.

Exemple
1. Une école comporte 500 élèves. On mesure la taille de 20 d’entre eux.
L’objectif est de répondre à la problématique suivante: Comment, à partir
d’informations (moyenne/écart type) calculées sur l’ensemble des 20 élèves
(une partie de la population), retrouver ou plutôt estimer celles de l’ensemble
de la population des 500 élèves ?

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


2. La statistique s’intéresse à l’étude de grand ensemble « parfois infinis », il
est souvent impossible ou simplement très coûteux d’étudier directement une
population. Le seul moyen pour avoir des informations sur la population à
laquelle on s’intéresse est d’en observer une partie.

Sous ces deux aspects, la statistique, science de la signification et de


l’interprétation de la variabilité, apparaît comme une science de la décision.
Ainsi, sous son double aspects descriptive et classificatoire d’une part et
analytique et décisionnel d’autre part, la méthode statistique représente un des
outils scientifiques essentiels du raisonnement de l’éducation.

II. Terminologies de base et concepts fondamentaux

La statistique utilise une terminologie de base et un vocabulaire propre qu’il est


nécessaire de connaitre et de pouvoir utiliser avec précision.

II.1. Population statistique (noté Ω au sens mathématique du terme) ou un

univers statistique : c’est l’ensemble de référence « fini ou infini » concerné par


une étude statistique. On parle parfois de champs de l’étude.

Une population peut désigner un ensemble de personnes physiques, de


personnes morales, d’objets, ou n’importe quel ensemble d’unités homogènes.

Exemples
• La population des élèves inscrit au baccalauréat au titre de l’année 2012-
2013
• La population des S.A sises à la ville de Rabat
• La population des ordinateurs disponibles à la CRMEF
• La population des moutons à sacrifier le jour de l’aïd
• La population marocaine

II.2. Unité statistique (𝜔 Є Ω au sens mathématique du terme) ou individu est

tout élément de la population statistique.

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Exemples
• Chaque élève inscrit au baccalauréat est une unité statistique

• Chaque ordinateur disponible à la CRMEF est un individu

II.3. Echantillon : Une partie (sous ensemble) de la population sur lequel sont

effectivement réalisées les observations.

Le nombre d’individus qui constituent l’échantillon étudié s’appelle la taille de


l’échantillon (notée 𝑛).

II.4. Enquête : Est une activité organisée et méthodique de collecte de

données sur des caractéristiques d’intérêt d’une partie ou de la totalité des


unités d’une population à l’aide de concepts, de méthodes et des procédures
bien définis. Elle est suivie d’un exercice de compilation permettant de
présenter les données recueillies sous forme récapitulative utile.

Il ya deux genres d’enquête, le recensement et l’enquête-échantillon

Lorsque l’enquête cible la collecte des renseignements pour toutes les


unités de la population on parle d’enquête exhaustive ou recensement.

Exemple : Recensement général de la population

Remarque : chaque individu de la population est connu

Lorsque l’enquête porte sur une partie seulement des individus de la


population on parle d’enquête partielle ou sondage (l’enquête dans ce cas est
non exhaustive)

Exemple : l’enquête d’opinions

Remarque : la méthode des sondages est utilisée pour essayer d’en déduire
des informations sur la totalité de la population. Cette méthode comprend deux
parties, l’échantillonnage et l’estimation.

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


II.5. Les caractères (noté X, Y, Z,….)

Les individus d’une population statistique peuvent être classés en fonction


d’une ou plusieurs caractéristiques. Ces aspects particuliers des individus sont
appelés caractères statistiques. Le caractère est donc une caractéristique
prise par les individus d’une population ou le critère que l’on décide de retenir
pour décrire une population.

Exemples : La population des élèves du baccalauréat d’un lycée peut être


étudiée selon un ou plusieurs caractères :

-la nature du bac, la profession de père, la groupe sanguin, le sexe,…….

-la taille, l’âge, le poids, la moyenne, le nombre d’absence,…………

II.6. Modalités : Les modalités d’un caractère sont les différentes valeurs ou

les différentes situations et états possibles que peut présenter le caractère


selon lequel la population est étudiée. Les modalités sont notées par les lettres
minuscules: x1, x2,. . , xk et y1, y2,. ..yk …

Exemples

-Le caractère ‘’nature du bac’’ présente six modalités : économique, lettres,


mathématiques, technique, science expérimentale et sport.

- Le caractère ‘’ moyenne du bac’’ présente une infinité de modalités qui


appartient théoriquement à [10, 20]

- Le caractère ‘’sexe’’ présente deux modalités : féminin ou masculin

- Le caractère ‘’l’âge’’ présente les modalités : 18, 19,…….

- Le caractère ‘’couleur’’ présente les modalités : noir, blanc, rouge,…..

Les modalités que peut présenter un caractère doivent vérifier deux principes :

a. Le principe de l’exhaustivité : pour chaque individu, on doit pouvoir lui


associer une modalité

b. Le principe de l’incompatibilité : pour chaque individu, on ne lui associer


qu’une et une seule modalité.

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


II.7. Les différents types de caractères

Les modalités que peut présenter un caractère définissent sa nature :

Le caractère est dit qualitatif si les modalités d’un caractère ne sont pas
mesurables mais s’expriment par des expressions littérales.

On distingue 3 sortes de caractères qualitatifs :

o Variable Ordinale : Si l’ensemble des modalités qu’elle peut prendre est


munie d’un ordre total.

Exemple : La taille des vêtements. XS<S<M<L<XL<XXL.

o Variable Nominale : Si l’ensemble des modalités ne peut pas prendre un


ordre précis.

Exemple : Le genre de sport, La couleur des yeux. ..etc.

o Variable Dichotomique : Si on a 2 modalités seulement. Exemple : Sexe : M


ou F. Qualité : Bonne ou Mauvaise.

Le caractère est dit quantitatif ou Numérique (le caractère est également


connu sous le nom de variable statistique) (Les caractères seront notés par :
X, Y, . . .,) lorsque les modalités sont mesurables c-à-d s’expriment par des
chiffres réels sur lesquels les opérations arithmétiques courantes ont un sens.

On distingue 2 sortes de variables :

o Variable Discrète : Elle ne prend que des valeurs isolées (souvent


entières). Exemple : Le nombre des absents par jours X ={0,1,2,3……...},
on ne peut jamais avoir des valeurs intermédiaires telle que 0,2 ou 1,55
absents.

o Variable Continue : Elle peut prendre n’importe quelle valeur dans un


intervalle donné. Exemple : L’âge des élèves, La taille des individus, le
poids.

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


D’après ces modalités, une variable statistique peut être discrète si elle prend
des valeurs isolées (dans IN), ou continue si elle prend des valeurs dans un
intervalle de IR
Résumé :

VARIABLES
Quantitative
Qualitatives

Discrètes Normale Ordinales


Continue

Nombre d’enfants Taille Sexe Taille


vestimentaire
Nombre des absents Poids Couleur
.
Nombre de pièce Age Ville

III. Tableaux et graphiques statistique

III.1 Série et distribution statistique

Série statistique : Une série statistique est la correspondance entre les


individus d’une population et les modalités du caractère étudié.
Donc c’est est un ensemble de chiffres ou de données. Une fois ces chiffres
sont ordonnés dans un sens déterminé (croissant ou décroissant), on obtient
une distribution statistique.

Exemple: Les chiffres 0, 1, 2, 0, 10, 4, 3, 2, 1, 1, 2, 1 représentent une série


statistique. La série ci-dessus devient alors une distribution lorsqu'on l'ordonne
dans le sens croissant ou décroissant comme suit: 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 4,
10 ou 10, 4, 3, 2, 2, 2, 1, 1, 1, 1, 0, 0.
En général

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Soit un caractère statistique X. Un échantillon (ou série statistique) pour ce
caractère peut se représenter par la donnée d’une suite de nombres
{x1, x2, x3……. xi……..xn}=X;
Où n est le nombre d’observations (ou encore la taille de l’échantillon) et
pour tout i, tel que 1≤ i ≤ n, xi représente la valeur du caractère X pour
l’individu i.
Chacune des valeurs élémentaires xi est liée à une fréquence absolue ni (ou
effectif : le nombre de fois que la modalité xi apparaît ou se répète). La somme
des effectifs ni ( ∑ 𝑛𝑖 = 𝑁) définit l’effectif total N de l’échantillon étudié. Ces
valeurs xi sont également définies par leurs fréquences relatives f i (c’est la
proportion des individus de la population qui présentent la modalité i) ainsi
i =n
et la somme des fréquences relatives est égale à l’unité (  fi = 1 ).
𝑛𝑖
𝑓𝑖 = 𝑁
i =1

L’étendue de variation de la variable X est définie par l’intervalle {x 1, xn}.

III.2 REPRESENTATIONS GRAPHIQUES

Pour exploiter au mieux une série de valeurs expérimentales, plusieurs


opérations s’avèrent indispensables :

- La première opération consiste à recueillir toutes les informations voulues.

- Elles doivent être ordonnées et classer par ordre croissant ou décroissant dans
des tableaux statistiques.
- Transformer les effectifs 𝑛𝑖 en fréquence 𝑓𝑖 .
- Donner des visualisations graphiques, qui donnent un résumé plus clair et
facilite l’interprétation des données

On peut dans ce cas établir les fréquences relatives cumulées ascendantes


fi , 𝑓𝑖+ , 𝒏𝒊𝒄↑ ou 𝑓𝑖𝑐𝑎 = ∑𝑖𝑘=0 𝑓𝑘 ( pour cela, on attribue à chaque valeur

élémentaire xi, la somme des fréquences de toutes les valeurs qui lui sont
égales ou inférieures) ou descendantes f i , 𝑓𝑖− ou ou 𝑓𝑖𝑐𝑑 = ∑𝑛𝑘=𝑖 𝑓𝑘 (pour

cela, on attribue à chaque valeur élémentaire xi, la somme des fréquences de


toutes les valeurs qui lui sont égales ou supérieures).

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Exemple: 𝑓4+ = f1 + f2 + f3 + f4 et 𝑓4𝑐𝑑 = f4 + f5 + f6 +…+ fn-1 + fn..

- Répartition des valeurs xi en classes Ci ; il s’agit là d’une répartition en


intervalles ; égaux ou inégaux selon les séries étudiées; et définies par leurs
fréquences relatives.
En résume :
Le nombre d’individus ni de la population, pour les quels la variable X prend la
valeur xi, est appelé effectif ou fréquence absolue de la valeur xi.
• La fréquence relative fi de la valeur xi d’effectif ni est donnée par la formule
ni
fi = , ou N est l’effectif total de la population.
N
• Le pourcentage pi de la valeur 𝑥𝑖 d’effectif 𝑛𝑖 est donné par la formule

ni
pi = f i  100 =  100 .
N
Remarques :
k
- n
i =1
i = N et 0  ni  N , ou k est le nombre des valeurs différentes.

k k
- 
i =1
f i = 1 et p
i =1
i = 100 .

- La correspondance entre les valeurs de xi et leurs effectifs s’appelle


distribution d’effectifs.
Exemple [ Tableau -1-] .
Un fabriquant de tissue essaie une nouvelle machine, il compte le nombre de
défauts sur 75 échantillons de 10 mètres. Il a obtenu les résultats suivants
Nombre de défauts xi Nombre d’échantillons ni

0 38
1 15
2 11
3 6
4 3
5 2
Total 75

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Tableau -1-

Effectifs cumulés.
Par la lecture du tableau ; répondre aux des questions suivantes :
• Quel est le nombre d’individus pour lesquels la variable X prend au moins xi ?
• Quel est le nombre d’individus pour lesquels la variable X prend au plus xj ?

La réponse à la 1ére question se fait en additionnant les effectifs à partir de la


première valeur n1 jusqu’à nj (1 ≤ j ≤ k). Les nombres ainsi obtenus sont appelés
effectifs cumulés croissants ou fréquences absolus cumulées croissantes,
notés par nic↑.
La réponse à la 2ème question se fait en additionnant les effectifs à partir de n j
(1 ≤ j ≤ k) jusqu’à la dernière valeur nk. Les nombres ainsi obtenus sont appelés
effectifs cumulés décroissants ou fréquences absolus cumulées décroissantes,
notés par nic↓.
Par exemple, la 4ème ligne du tableau -1-, se lit aussi :
• 6 échantillons contiennent 3 défauts.
• 70 échantillons contiennent au plus 3 défauts.
• 11 échantillons contiennent au moins 3 défauts.
Le tableau -1- pourra être compléter de la manière suivante

Nombre de défauts xi Nombre d’échantillons ni nic↑ nic↓

0 38 38 75
1 15 53 37
2 11 64 22
3 6 70 11
4 3 73 5
5 2 75 2
Total 75
Tableau -1-
Remarque :
De la même manière on peut définir

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


- Les fréquences relatives cumulées (croissantes et décroissantes).
- Les pourcentages cumulés (croissants et décroissants).
III.2.1 CAS DES VARIATIONS DISCONTINUES

Diagramme en bâtons : Dans un système d’axe cartésien, on place en


abscisse les valeurs des observations xi et on élève de chacun de ces points
un segment de droite parallèle à l’axe des ordonnées et ayant une longueur
proportionnelle à la fréquence 𝑓𝑖 (ou à l’effectif 𝑛𝑖 ) de la valeur considérée
𝑥𝑖 . Si les données sont ordonnées en classes, les ordonnées auront les centres
de classes.

Fréqu

Valeurs de
Histogramme des fréquences : Dans ce cas, on utilise une représentation
proportionnelle aux surfaces. Cette représentation est principalement adoptée
aux distributions en classes. Les valeurs des différentes classes sont disposées
en abscisse et on représente les fréquences par des rectangles ayant pour
base la classe et une surface dont l’aire est proportionnelle à la fréquence
correspondante. On peut également utiliser cette représentation avec les
fréquences cumulées.

450

400

350
Effectif ou fréquence

300

250

200

150

100

50

0
1 2 3 4 5 6 7 8 9

Valeur de la variable xi

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Diagramme circulaire : Dans ce cas l’effectif (ou la proportion) de chacune
des modalités de la variable est représenté(e) par un secteur du centre dont
l’angle est proportionnel à la fréquence relative de la modalité.

7%
33% 13%
20%
27%

Diagramme semi-circulaire: Dans ce cas, les modalités sont représentées


dans un demi-cercle divisé en secteur et l’angle de chaque secteur est
proportionnel à la fréquence relative de la modalité correspondante.

III.2.2 CAS DES VARIATIONS CONTINUES

Histogramme des fréquences : Dans le cas où les données sont organisées


en classes et on les représente sous forme d’histogrammes de fréquences.

35
30
25
20
15
10
5
0 161 163 165 167 169 171 173 175 177 179

Polygones des fréquences: Il est possible d’établir les polygones des


fréquences en joignant les sommets successifs des milieux des classes. Si les
données ne sont pas organisées en classes, chaque valeur individuelle
correspond elle-même à une classe de dimension très réduite. Ceci conduit à

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


des rectangles de base très réduites, ce qui donne au graphique l’allure d’une
courbe continue.
Exemples d’application :

Exemple 1 : Soit X le nombre des absents dans un collège.

X 0 1 2 3 4 5 6 7
𝑛𝑖 82 55 30 16 9 5 2 1
𝑓𝑖 0.410 0.275 0.150 0.080 0.045 0.025 0.010 0.005

Représenter graphiquement cette distribution.

Réponse. Il s’agit d’une distribution discontinue, la valeur xi = 0 correspond aux


absents est la plus fréquente, celle de xi = 7 étant la moins fréquente. On peut
la présenter sous forme d’un diagramme en battons.
9
0
8
0
7
0
6
0
5
0
4
0
3
0
2
0
1
0
0
0 1 2 3 4 5 6 7

Exemple 2 : Soit X la taille en cm des individus dans un échantillon de 140


personnes. Sur le tableau suivant, on représente les centres C i de classes
réparties en intervalles égaux, les effectifs ni correspondant ainsi que les
fréquences relatives 𝑓𝑖 de ces classes :

Ci 161 163 165 167 169 171 173 175 177 179
ni 2 8 10 22 28 32 18 11 7 2
fi 0.0143 0.0571 0.1140 0.1571 0.2000 0.2286 0.1286 0.0786 0.0500 0.0143

Représenter graphiquement cette distribution.

Réponse. La zone de variation s’étend de 160 à 180 cm. La variation étant


continue, on peut la présenter sous forme d’un histogramme de fréquence. Le
Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi
polygone des fréquences est obtenu en joignant les centres des sommets des
rectangles. 35
30
25
20
15
10
5
0 161 163 165 167 169 171 173 175 177 179

Etablir les histogrammes des fréquences relatives cumulées ascendantes et


descendantes et les polygones des fréquences correspondantes.
Réponse.
14 14
0 0
12 12
0 0
10 10
0 0
8 8
0 0
6 6
0 0
4 4
0 0
2 2
0 0
0 0
16 16 16 16 16 17 17 17 17 17 16 16 16 16 16 17 17 17 17 17
1 3 5 7 9 1 3 5 7 9 1 3 5 7 9 1 3 5 7 9

En résume :
Dans le cas d’une variable continue, théoriquement les valeurs recueillies sont
infinies et très proches l’une de l’autre. Alors, pour simplifier l’étude on construit
des classes (intervalles) en divisant l’étendue de la série statistique en
plusieurs intervalles.
• L’étendue d’une série statistique est la différence entre la plus grande et la
plus petite valeur dans la série.
• Les classes sont des intervalles de la forme [ai , ai+ 1[, tel que
k −1

 [a , a
i =1
i i +1 [ = [a 0 , a k ] ; ou a0 et ak sont respectivement la plus petite et la plus

grande valeur de la série.


• Dans la classe [ai , ai+ 1[, les valeurs ai et ai+ 1 sont les bornes ou les limites
de cette classe.
ai + ai +1
• Le nombre xi = s’appelle le centre de la classe [ai , ai+ 1[.
2
• Le nombre  i = ai +1 − ai s’appelle l’étendue ou amplitude de la classe[ai , ai+1[.

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


• L’effectif ni la classe [ai , ai+ 1[.correspond au nombre de valeurs appartenant
à cette classe
Remarque Le nombre de classes k ne doit pas être trop petit, perte
d’information, ni trop grand, le regroupement en classe est alors inutile.
Diverses formules empiriques permettent d’établir le nombre de classes pour
une population (échantillon) de taille N , principalement :
❖ La règle de Sturge : Nombre de classe k= 1 + (3.3 log N )
❖ La règle de Yule : Nombre de classe k= 2.5 (N) 0.25
L’intervalle (l’amplitude) de chaque classe est obtenu de la manière suivante :
𝑚𝑎𝑥 𝑥 −𝑥
𝑚𝑖𝑛
𝑎𝑖 = 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒𝑠

Le nombre de classe qu’on peut construire est donné par la formule k = N .


Exemple [Tableau -2-]
Une étude concernant le poids de 80 nouveaux née dans une maternité a
donné les résultats suivants

Les classes Les centres de classes xi Les effectifs ni nic↑ nic↓


[2.2 , 2.5[ 2.35 2 2 80
[2.5 , 2.8[ 2.65 5 7 78
[2.8 ,3.1[ 2.95 20 27 73
[3.1 , 3.4[ 3.25 19 46 53
[3.4 , 3.7[ 3.55 20 66 34
[3.7 , 4.0[ 3.85 8 74 14
[4.0 , 4.3[ 4.15 4 78 6
[4.3 , 4.6[ 4.45 2 80 2

∑ 80

Tableau -2-

IV. PARAMETRES D’UNE SERIE STATISTIQUE

Les représentations graphiques ont des formes très variées. On remarque


d’une part l’accumulation d’effectifs importants pour certaines valeurs de la

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


série et d’autre part, l’étalement plus ou moins grand des diverses valeurs et
qui constitue la dispersion de la série. L’idéal serait d’établir l’équation Y = f(X)
de la courbe des fréquences Y. L’utilisation des équations n’est pas souvent
très commode du fait que certaines distributions expérimentales ne s’en
approchent pas pour que l’on puisse utiliser les calculs effectués une fois pour
toute et consignés dans les tables théoriques.
On caractérise très souvent une série statistique par deux types de
paramètres :
✓ Les paramètres de tendance centrale ou de position ou d’ordre 1.
✓ Les paramètres de dispersion ou d’ordre 2.

IV.1. Les paramètres dits de position ou d’ordre 1.


Il existe de nombreux paramètres de position dont le plus intéressant est la
moyenne.
i. La moyenne arithmétique :
On considère une série composée de N valeurs xi ayant chacune un effectif ni.
La moyenne est par définition la valeur la plus caractéristique de la série et est
donnée par :
i =n
1
x=m=
N
n x
i =1
i i

i =n
ni
On peut écrire x = m =  fi xi , fi =
i =1 N
Lorsque la variable est continue, les modalités sont regroupées en classes,
chacune représentée par un centre noté ci la moyenne est alors donnée par
i =n
1
x=
N
n c
i =1
i i

Remarques :
i= p
1
- Si n1 = n2 = n3 = .... = n p , on aura tout simplement : x=m=
N
x
i =1
i

- Si les données sont organisées en classes de centre ci et de fréquences


i =n
f i , on aura : x = m =  fi ci
i =1

- La moyenne arithmétique est la caractéristique la plus utilisée.

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


ii. La moyenne géométrique :
Si xi sont les observations d’une variable quantitative, la moyenne

géométrique est égale à :

G ( X ) = n x1n1.x2n 2 ...........xknk
1
log G =  n1 log( x1 ) + n2 log( x2 ) + .... + nk log( xk )
n
Ce type de moyenne est surtout utilisé pour calculer des pourcentages moyens.

La moyenne géométrique s’utilise pour calculer des pourcentages moyens et


le calcul des moyennes des taux de croissance. r étant un taux
d'accroissement, 1 + r est appelé coefficient multiplicateur et le coefficient
multiplicateur moyen est alors égal à la moyenne géométrique des coefficient
multiplicateurs
Exemple :
Sur une période de 5 ans, le produit intérieur brut (PIB) d’une nation a
progressé de 3% chaque année durant les deux premières années et de 5%
par an durant les trois dernières.
On souhaite déterminer le taux de croissance annuel du PIB
Réponse : Nous avons 𝑥1 = 1,03 et 𝑥2 = 1,05 et nous avons aussi 𝑛 =
2 3
5 𝑒𝑡 𝑛1 = 2 𝑛2 = 3 de même 𝑓1 = 5 et 𝑓2 = 5 donc

𝐿𝑜𝑔(𝐺) = 𝑓1 log(𝑥1 ) + 𝑓2 log(𝑥2 ) = 0,04109


D’où 𝐺 = exp(0,04109) = 1,042
par conséquent le PIB de ce pays a progressé en moyenne de 4,2% par
an durant les 5 années considérées.
iii. La moyenne harmonique :
Si xi sont les observations d’une variable quantitative, la moyenne

harmonique est égale à :


N
H(X ) = k
ni

i =1 xi

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


La moyenne harmonique se définit comme l’inverse de la moyenne des
inverses des valeurs. On exprime souvent la moyenne harmonique par
k
ni
1
 xi
i =1
son inverse =
𝐻 𝑁

La moyenne harmonique est utilisée pour le calcul de pourcentages et


des moyennes de rapport qui est sous forme de quotient de deux
variables x/y (km/h, km/litre,...). Attention, il faut cependant bien étudier le
problème car il peut aussi s'agir d'une moyenne arithmétique
Exemple :
Un atelier est composé de deux ouvriers. Le premier fabrique 30 pièces
par heure et le second 50 pièces par heure. On souhaite calculer la
vitesse moyenne de fabrication des 80 pièces
30 𝑝𝑖è𝑐𝑒𝑠 50 𝑝𝑖è𝑐𝑒𝑠
Réponse : La variable vitesse est un rapport 𝑣1 = et 𝑣2 =
1 ℎ𝑒𝑢𝑟𝑒 1 ℎ𝑒𝑢𝑟𝑒
1
∑2𝑖=1 1
+
1
1 𝑣𝑖 3000
L’inverse de la moyenne est 𝐻 = = 30 2 50 =
2 80

Donc 𝐻 = 37,5 pièces par heure.

iv. La moyenne quadratique : Si xi sont les observations d’une variable

quantitative, la moyenne quadratique est égale à :

n1 x12 + n2 x22 + .....nk xk2


Q( X ) =
N
Formule générale :
i =n
1
m=x=
N
 n f (x )
i =1
i i

• Si 𝑓(𝑥) = 𝑥 alors m est la moyenne arithmétique


• Si 𝑓(𝑥) = 𝑥 2 alors m est la moyenne quadratique
1
• Si 𝑓(𝑥) = 𝑥 alors m est la moyenne harmonique

• Si 𝑓(𝑥) = ln 𝑥 alors m est la moyenne géométrique avec 𝑥𝑖 > 0

Remarque Pour une série statistique X, on a


H ( X )  G ( X )  X  Q( X )
Exemple :

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Dans l’exemple [ Tableau -1-], Pour trouver la valeur de la moyenne, on rajoute
une colonne dans le tableau statistique dont laquelle on calcule le produit 𝑛𝑖 𝑥𝑖 ,
1 8 77
pour tout i. on a x = 
75 i =1
ni xi =
75
= 1.02666 = x .
−−−−−−−−−−−

Nombre de défauts xi Nombre d’échantillons ni 𝑛𝑖 𝑥𝑖


0 38 0
1 15 15
2 11 22
3 6 18
4 3 12
5 2 10
Total 75 77

1 8 266
- Pour l’exemple de [ Tableau -2-], on a x = 
80 i =1
ni x i = = 3.325 = x .
80 − −− − −− − −− − −
Les classes Les centres de classes xi Les effectifs ni ni xi
[2.2 , 2.5[ 2.35 2 4.7
[2.5 , 2.8[ 2.65 5 13.25
[2.8 ,3.1[ 2.95 20 59
[3.1 , 3.4[ 3.25 19 61.75
[3.4 , 3.7[ 3.55 20 71
[3.7 , 4.0[ 3.85 8 30.8
[4.0 , 4.3[ 4.15 4 16.6
[4.3 , 4.6[ 4.45 2 8.9
Total 80 266

Propriétés de la moyenne
- La moyenne ne change pas si on remplace un nombre déterminé de valeurs
par leur moyenne multipliée par la somme de leurs effectifs.
- La moyenne conserve les changements de l’axe et l’origine
X ( xi , ni ) → Y ( y i = axi + b, ni )
x  y = ax + b

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


IV.2. Autres paramètres de position

o Mode ou valeur modale : Mo C’est la valeur de l’observation dont la


fréquence est maximale; Il peut exister pour une même série plusieurs valeurs
du mode; quand il n’y a qu’une, la distribution est dite unimodale .

Exemple : On considère la distribution suivante

𝑏
Formule pour obtenir le mode 𝑀𝑜 = 𝑎 + 𝑐 𝑏+𝑑

Le mode de cette distribution est


4
𝑀𝑜 = 49 + 2 = 50,14
4+3
Exemple :
Dans l’exemple [ Tableau -1-], le mode Mo = 0.
Dans l’exemple [ Tableau -2-], on a 2 classes modales qui sont [2.8 , 3.1[ et
[3.4 ,3.7[, donc il y 2 mode Mo1 = 2.95 et Mo2 = 3.55.

o La médiane : Me C’est la valeur de l’observation située exactement au milieu


de la série rangée par ordre de grandeur croissante. Ceci est simple si l’effectif
total est impair. Si l’effectif est pair, la médiane sera située entre les deux
valeurs correspondant au milieu de la série. La détermination peut s’obtenir à
partir des données en recherchant la valeur de la variable correspondant à une
N 1
fréquence cumulée égale à (effectif cumulé) ou 2 (fréquence cumulée). Cad
2

il y a autant d’observations rangées avant que d’observations rangées après la


valeur de la médiane.

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


(i) Variable discrète. Soit x1 , x2 , . . ., xN une série ordonnée de valeurs de la
variable statistique.
- Si N est impaire i. e. N = 2p + 1, alors la médiane est donnée par. Me = x p +1 .

x p +1 + x p
- Si N est impaire i. e. N = 2p, alors la médiane est donnée par Me = .
2
Exemples :
• Soient les résultats obtenus par un étudiant dans le module de statistiques
10 9 12 10 13 14 18 13 15
La série ordonnée est : 9 10 10 12 13 13 14 15 15
4 valeurs 4 valeurs

n = 9 = 2 × 4 +1 alors la médiane Me = xk + 1 = x5 = 13 = Me.


• On garde la même série et on ajoute la valeur 11, donc la série ordonnée
devient :
9 10 10 11 12 13 13 14 15 15
5 valeurs 5 valeurs

n = 10 = 2 × 5, alors la médiane Me = ( xk + xk + 1)/2 = ( x5 + x6 )/2 = 12.5 = Me.


• Dans l’exemple [ Tableau -1-], on a n =75 = 2 ×37 + 1, alors
Me = ( xk + xk + 1)/2.
D’après le tableau -1- on a : Me = ( x34 + x34 + 1)/2 = Me = ( 0 + 0)/2 = 0 = Me.

(ii) Variable continue.


La lecture du tableau nous permet de déterminer la classe à partir de laquelle
la moitié des effectifs est atteinte. La médiane appartient donc à cette classe.
Cette dernière est appelé classe médiane. La valeur exacte de la médiane est
calculée en utilisant l’interpolation linéaire. Si [ai , ai+1[ est la classe médiane,
alors on a

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


i −1
i
N i −1
n − n j j − nj
2 j =1 i −1 i

 n j et n(i+1) = n
j =1 j =1
tgb = = , où nic =
ai +1 − ai Me − ai
j
j =1 j =1

N i −1
− nj
2 j =1
Donc Me = ai + i i −1
(ai +1 − ai ).
n − n
j =1
j
j =1
j

Exemple :
Reprenons l’exemple [Tableau -2-], comme N/2 = 80/2 = 40, on en déduit d’après le
[tableau -2-] que Me  3.1, 3.4 , donc on utilisant l’interpolation linéaire on obtient

46 − 27 40 − 27 46 − 27
tg = =  Me = 3.1 + (3.4 − 3.1) = 3.3053kg = Me
3.4 − 3.1 Me − 3.1 3.4 − 3.1 −−−−−−−−−−−−−−−−−

Les quartiles
Les quartiles sont les valeurs qui partagent la série statistique ordonnée en 4
parties de même effectifs et Leur détermination peut s’obtenir comme suit
• Le premier quartile est le nombre Q1 tel que 25% des valeurs sont
inférieur ou égale à Q1, correspondant à une fréquence cumulée
𝑁
égale à 4 .

• Le troisième quartile est le nombre Q3 tel que 75% des valeurs sont
inférieur ou égale à Q3, correspondant à une fréquence cumulée
3𝑁
égale à 4

• Le deuxième quartile Q2 est la médiane.

Remarques :

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


• Le premier quartile Q1 est la médiane de la première moitié de la série
statistique.
• Le troisième quartile Q3 est la médiane de la deuxième moitié de la série
statistique.
• La méthode de calcul des quartiles est donc identique à celle du calcul
de la médiane.

Ecart interquartile.

L’écart interquartile est le nombre IQR tel que IQR = Q3 – Q1. Il donne
l’étendue de la moitié centrale des observations.
Exemples :
1) Soient les résultats obtenus par un étudiant dans le module de statistiques
10 9 12 10 13 14 18 13 15
La série ordonnée est : 9 10 10 12 13 13 14 15 15
4 valeurs 4 valeurs

La 1er moitié de la série content 4 (= 2 × 2 = 2 × k) valeurs, donc la médiane de


cette partie est
Q1 = (xk +xk + 1)/2 = (x2 +x3)/2 = 10 = Q1 .
La 2ème moitié de la série contient aussi 4 valeurs, donc donc la médiane de
cette moitié est
Q3 = (x4+1+k +x4+1+k + 1)/2 = (x7 +x8)/2 = (14 + 15)/2 = 14.5 = Q1
2) On garde la même série et on ajoute la valeur 11, donc la série ordonnée
devient :
9 10 10 11 12 13 13 14 15 15 .
La 1er moitié de la série content 5 (= 2 × 2 +1 = 2 × k +1) valeurs, donc la médiane
de cette partie est
Q1 = xk + 1 = x3 = 10 = Q1 .
La 2ème moitié de la série contient aussi 5 valeurs, donc la médiane de cette
moitié est
Q3 = x5+k + 1 = (x7 +x8)/2 = 14 = 14 = Q1

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Reprenons l’exemple de [ Tableau -2-] , N/4 = 20, alors d’après le Tableau -2-
Q1 est [2.8 , 3.1 [. Donc en utilisant l’interpolation linéaire on obtient

27 − 7 20 − 7 27 − 7
tgb = =  Q1 = 2.8 + (3.1 − 2.8) = 2.995kg = Q1 .
3.1 − 2.8 Q1 − 2.8 3.1 − 2.8 −−−−−−−−−−−−−−−−−

IV.2. Les paramètres de dispersion, du 2ème ORDRE.

Ces paramètres essayent de synthétiser par une seule valeur numérique la


dispersion de toutes les valeurs observées.

a. L’étendue : Notée 𝑒,est la différence entre la plus grande et la plus


petite observation de la variable. 𝑒 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

b. L’intervalle inter-quartile : IQR C’est la différence entre le 3ème et le 1er


quartile. i.e., IQR = Q3 – Q1

c. L'écart moyen absolu et l'écart médian absolu


L'écart moyen absolu, noté em, est la moyenne des valeurs absolues des
différences entre les observations et la moyenne x :
k

n | x − x |
i i
em := i =1
n
L'écart médian absolu, noté eM est la moyenne des valeurs absolues des
différences entre les observations et la médiane Me:

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


k

 n | x − Me |
i i
eM := i =1
n
d . Variance et Ecart type :

- La variance d’une série statistique quantitative est la moyenne des carrés


des écarts à la moyenne arithmétique. On la note 𝜎 2 tel que.
1 i=n
2 = 
N i =1
( xi − x) 2

- L’écart type ou déviation standard est la racine carrée de la variance, ou


encore, la moyenne quadratique des écarts (à la moyenne). On la note σ.
1 i=n
Ainsi  = 
N i =1
( xi − x) 2

Ces paramètres de dispersion permettent de mesurer la façon dont les valeurs


du caractère sont réparties autour de la moyenne x . L’écart type s’exprime
avec la même unité que la moyenne (ce n’est pas le cas de la variance
exprimées en unités ‘au carré’)

Pour toute valeur 𝑥𝑖 d’effectif 𝑛𝑖 (effectif global 𝑛 = 𝑁 ) :  i = xi − x

Ces écarts peuvent être positifs ou négatifs. La somme de ces écarts est :

 n  = i =1 ni ( xi − x) = i =1 ni xi − i =1 ni x = n x − n x = 0
i=n i=n i=n i=n
i =1 i i


1 i=n
i =1 ni xi et
i=n
En effet x= i =1
x = nx
N
Ce qu’on veut établir, c’est l’écart quadratique moyen :  x
i =n

n i  i2
x = i =1
N

C’est l’écart type ou déviation standard.


i =n
ni  i2
La variance est le carré de l’écart type :  x2 = ( i =1
)2
N

On utilise très souvent une méthode plus pratique pour calculer la variance  x2

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi



i=n
ni  i2 i=n
=( )2 = 1
 2
x
i =1
N N
n 
i =1
i
2
i

i =n i =n
1 1
 n (x  n (x
2
 x2 = i i − x) 2 = i
2
i − 2 xi x + x )
N i =1 N i =1
i =n i =n
1 1
n x n x
2 2 2 2
 x2 = i
2
i − 2x + x = i
2
i −x = x2
 − x

N i =1 N i =1 moyenne.des.carrés carré.de.la. moyenne

i =n
 =  f i .xi2 − x
2 2
Dans le cas des données organisées en fréquences 𝑓𝑖 : x
i =1

Dans le cas d’une distribution continue, la variance sera donnée par :

1 i =n i =n
 =  ni .ci − c =  c =  f i .ci2 − c
2 2 2 2 2
c (𝑐𝑖 = centres des classes).
N i=1 i =1

Généralement, on établit plutôt une estimation de la variance S c2


1 i =n N c2
 i i
2
S c2 = n .c 2
− c =
N − 1 i =1 N −1

Proposition
Soit X une variable statistique et a; b deux réels. On pose 𝑌 = 𝑎𝑋 + 𝑏.
(i.e. les modalités de Y sont donnés par ax1 + b; : : : ; axk + b avec des effectifs
correspondants n1; : : : ; nk.)
i =n
ni
 N .x
2
1. V ( X ) =  = − x (Formule de Koenig)
2 2
x i
i =1

2. V (Y ) = a V ( X )
2

3.  (Y ) =| a |  ( X )

Exemple
Reprenons l’exemple [ Tableau -1-], on a
xi ni ni xi2
0 38 0
1 15 15
2 11 44
3 6 54
4 3 48
5 2 50
Total 75 211

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


1  6 2 211
Donc V X =   ni x i  − x 2 = − x 2 = 1.7593 = V x et dans ce cas  X = 1.3264.
75  i =1  75 −−−−−−−−−−−−−

Propriétés de la variance.
1) La variance est toujours positive ou nulle.
2) Changement d’échelle et d’origine
X ( xi , ni ) → Y ( y i = axi + b, ni )
V X  VY = a 2V X

Coefficient de variation.

Aussi, pour comparer la dispersion de deux ou plusieurs distributions


exprimées dans des unités différentes et qui n’ont pas le même ordre de
grandeurs (les moyennes sont différentes), on utilise un indicateur de
dispersion relative indépendant de l’unité de mesure et de l’ordre de grandeur
X
des valeurs observées. C’est le coefficient de variation Cv X = 100 
x
(qui est en %) est un nombre sans unité, et qui permet de comparer deux ou
plusieurs distributions qui ont des moyennes différentes et des unités de
mesures différentes.
le coefficient de variation est utilisé pour caractériser l’homogénéité ou
l’hétérogénéité d’un échantillon.
- Si C.V < 10% alors la population peut être considérée comme homogène
- Si C.V est entre 10% et 20% alors la population peut être considérée comme
relativement homogène
- Si C.V est entre 20% et 30% alors la population peut être considérée comme
relativement hétérogène
- Si C.V > 30% alors la population peut être considérée comme hétérogène.
Remarque
Si une série statistique se distribue suivant une loi dite normale, sa courbe
des effectifs, appelée courbe de Gauss met en évidence que :
✓ 68 % environ des valeurs appartiennent à [ x- -  ; x- + ]
✓ 95 % environ des valeurs appartiennent à [ x- - 2  ; x- + 2 ]
✓ 98 % environ des valeurs appartiennent à [x- - 3  ; x- + 3 ]

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


d. Décomposition de la variance
m – 3 m – 2 m –  m m –  m – 2 m
– 3 68 %

95 %
99 %
Les moments

La notion de moments est une généralisation des concepts de moyenne et de


variance. Il existe deux types de moments : les moments simples (font partie
des caractéristiques de tendance centrale) et les moments centrés (font partie
des caractéristiques de dispersion).

Les moments simples


On appelle moment simple d’ordre 𝑟, noté 𝑚𝑟 , la moyenne des valeurs à la
puissance 𝑟, soit
1 k
mr := 
n i =1
ni xir

Ainsi, on peux calculer les moments simples d’ordres 0, 1, 2, 3, ……

1 k
m0 = 1 , m1 = x et m2 = 
n i =1
ni xi2

Les moments centrés

On appelle moment centré d’ordre 𝑟, noté 𝜇𝑟 , la moyenne à la puissance 𝑟, des


écarts des valeurs par rapport à la moyenne arithmétique. Soit
1 k
r :=  ni ( xi − x) r
n i =1
Ainsi,

0 = 1 , 1 = 0 et 2 =  2
1 k

2
Comme 2 = ni xi2 − x . Nous avons 2 = m2 − m12
n i =1

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Les caractéristiques de forme et de concentration

Les caractéristiques de forme


Deux distributions qui présentent les mêmes caractéristiques de tendance
centrale et de dispersion peuvent avoir des formes très différentes. La forme
d’une distribution est appréhendée par des mesures d’asymétrie et
d’aplatissement.
Le coefficient d’asymétrie
L’asymétrie d’une distribution est mesurée en référence à une distribution
parfaitement symétrique. Une distribution est dite parfaitement symétrique si
les valeurs observées se répartissent de la même manière de part et d’autre
des valeurs de tendance centrale. (Mo, Me, et x ). Il existe plusieurs
coefficients qui donnent une mesure quantitative de l’asymétrie, le plus utilisé
est le coefficient de Fisher, noté 𝐹1 . Il est basé sur le calcul des moments
3
centrés F1 =
23
Où 2 et 3 sont les moments centrés respectivement d’ordre 2 et 3.
• Si 𝐹1 = 0 la distribution est dite symétrique
• Si 𝐹1 > 0 la distribution est étalée vers la droite
• Si 𝐹1 < 0 la distribution est étalée vers la gauche

Le coefficient d’asymétrie
On mesure l’aplatissement d’une distribution par rapport à une distribution
théorique normale ( distribution de Gauss-Laplace).
Là encore, il existe plusieurs coefficients pour mesurer l’aplatissement d’une
distribution. On retient le coefficient de Fisher notée 𝐹2
4
F2 = −3
22

• Si 𝐹2 = 0 la distribution est dite mésokurtique


• Si 𝐹2 > 0 la distribution est léptokurtique
• Si 𝐹2 < 0 la distribution est platykurtique

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Les caractéristiques de concentration
La notion de concentration est très liée à celle de dispersion. En pratique, elle
met en relation les fréquences cumulées et les masses cumulées. Elle se
mesure à l’aide de l’indice de concentration ou de graphique particuliers.
L’indice de concentration
Avant de présenter cet indice.il est nécessaire de définir la notion de médiale
utilisée dans la construction de l’indice de concentration.
La médiale notée 𝑀𝑙 est un concept très proche de la médiane, c’est une
caractéristique de tendance centrale . Elle se définit comme la valeur de la
variable qui partage la masse donnée par 𝑛𝑥 en deux partie égales
La médiale se calcule de la même manière que la médiane. On détermine
d’abord une classe médiale ensuite la médiale par interpolation linéaire.
L’indice de concentration, noté IC, est alors l’écart relatif ( à l’étendue ) entre
la médiale et la médiane. Il est donné par
M l − Me
IC = 100
e
La procédure graphique

La concentration d’un caractère peux être également apprécie à l’aide d’un


graphique appele courbe de concentration. Cette courbe appelé également
courbe de Lorenz, est tracée sur un repere orthonormé et elle met en relation
la masse relative cumulée 𝐹(𝑛𝑥) d’une part et la fréquence relative cumulée
𝐹(𝑥) d’autre part. Elle s’inscrit dans le carrée [0,1].[0,1] et a la forme suivante

Plus la courbe de Lorenz d’écarte de la bissectrice et plus la concentration est


élevée.

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi


Pour mieux lire ce graphique on définit un indice, appelé indice de Gini et qui
est la rapport entre la surface de concentration notée S (c’est la surface
comprise entre la bissectrice et le triangle dans lequel s’inscrit cette courbe )
et la surface du triangle
S
I G= = 2S
1/ 2

Pr. Omar EL FOURCHI –……………mail–elfourchi@gmail.com ………… web : https://elfourchi.wixsite.com/elfourchi

Vous aimerez peut-être aussi