Vous êtes sur la page 1sur 183

STATISTIQUE DESCRIPTIVE

Pr. OUCHICHA Chaimae

Ecole Nationale de Commerce et de Gestion


ENCG- Settat

2021/2022
Plan du cours
Chapitre préliminaire : Définition et éléments du vocabulaire
Partie 1: Séries statistiques simples
Chapitre 1: Tableaux statistiques et Représentations graphiques
Chapitre 2: Caractéristiques de tendance centrale
Chapitre 3: Caractéristiques de dispersion
Chapitre 3: Caractéristiques de forme
Chapitre 4: Caractéristiques de concentration
Partie 2: Séries statistiques doubles
Chapitre 1: la liaison entre deux variables: Régression, Ajustement et corrélation.
Partie 3: Les indices.
Partie 4: Les séries chronologiques
3/23/2022 STATISTIQUE DESCRIPTIVE 2
INTRODUCTION

▪ Définitions : statistique et statistiques;

▪ Objet et intérêt de la statistique;

▪ Démarche de la statistique;

▪ Vocabulaire de la statistique.

3/23/2022 STATISTIQUE DESCRIPTIVE 3


Définitions: la statistique et les statistiques
Au pluriel, on désigne souvent par « Statistiques » un ensemble de
données numériques observées ou d’informations relatives à un
phénomène ou à un processus donné.

Exemples:

Statistiques relatives à la situation de l’emploi au Maroc,


Statistiques relatives à la population marocaine,
Statistiques relatives aux élections,
Statistiques relatives aux ventes d’une entreprise, …

3/23/2022 STATISTIQUE DESCRIPTIVE 4


Définitions: la statistique et les statistiques

Au singulier, le mot « Statistique » désigne la science qui permet


d’obtenir et de traiter ces données .

Ensemble des méthodes scientifiques visant à collecter, à analyser des


données numériques, de même qu’à tirer des conclusions valables et à
prendre des décisions raisonnables sur la base de cette analyse.

3/23/2022 STATISTIQUE DESCRIPTIVE 5


Objet et intérêt de la Statistique
▪ La Statistique est utilisée presque dans tous les domaines :
économie, politique, démographie, médecine, biologie, psychologie,
sociologie, ….

▪ Dans le domaine de la gestion et de l’économie, la Statistique


constitue un outil d’aide à la prise de décision.

▪ Elle constitue également un outil de prévision : elle permet aux


gestionnaires de faire des prévisions dans le futur (prévision des
ventes par exemple).

3/23/2022 STATISTIQUE DESCRIPTIVE 6


Objet et intérêt de la Statistique

La statistique a pour objet la collecte, la caractérisation, l'analyse et


l'interprétation d'observations relatives à des phénomènes concernant
des ensembles plus ou moins importants d'objets, d'événements ou
d'individus.

L’objectif est de faire « parler » les chiffres afin de prendre une


décision.

Cette démarche statistique peut être présenter dans le schéma


suivant

3/23/2022 STATISTIQUE DESCRIPTIVE 7


La démarche de la Statistique

Phase 1 Phase 2 Phase 3

Collecte des Analyse Décision


données statistique statistique

3/23/2022 STATISTIQUE DESCRIPTIVE 8


La démarche de la Statistique

Phase 1: Collecte des données


Avant de commencer à étudier les données numériques concernant
certains phénomènes, il faut d’abord aller chercher ces données qui
constituent la matière première de la statistique. Ainsi:
▪ Il faut déterminer de quel type d’information ou de données on a
besoin;
▪ Préciser de quelle façon ces données seront recueillies:
▪ Sur quoi portent-elles ? population ou échantillon;
▪ Comment peut-on les obtenir ?

3/23/2022 STATISTIQUE DESCRIPTIVE 9


La démarche de la Statistique
Phase 2: Analyse statistique
Dans cette étape intervient la Statistique descriptive, et l’inférence
Statistique.

Quand les données sont exhaustives c'est-à-dire concernent toute la


population, comme dans le cas du recensement, on fait recours à la
statistique descriptive (Statistique déductive).

Or, lorsque les données concernent un échantillon de la population, on


fait recours à la statistique inférentielle (Statistique inductive).

3/23/2022 STATISTIQUE DESCRIPTIVE 10


La démarche de la Statistique

Phase 3: Décision statistique

Cette phase regroupe un ensemble de méthodes et de modèles


quantitatifs (modèle linéaire ou non linéaire) qui permettent d’aider
à la prise de décision dans un contexte d’incertitude.

3/23/2022 STATISTIQUE DESCRIPTIVE 11


Les différentes types de statistique
Statistique descriptives :
il s’agit d’organiser et résumer des observations. On ne fait pas de
comparaisons et on s’intéresse en général à un seul groupe, échantillon ou
population.

Statiques inférentielles (ou inductives) :


on peut ici viser 2 buts :
- Déduire les propriétés d’une population à partir de l’étude d’un échantillon.
- Comparer 2 ou plusieurs populations ou échantillons.
Un troisième type de Statistique
Elle est à la charnière entre Statistique descriptives et inférentielles a trait aux
notions de corrélation et prédiction.
3/23/2022 STATISTIQUE DESCRIPTIVE 12
Vocabulaires de la statistique

▪ Population
▪ Échantillon
▪ Caractère ou variable statistique
▪ Modalité
▪ Série statistique
▪ Fréquences absolues, relatives, cumulées
▪ Distribution statistique

3/23/2022 STATISTIQUE DESCRIPTIVE 13


Vocabulaires de la statistique
Définition: Population statistique ou univers statistique, Ensemble des
éléments sur lesquels porte une étude statistique. Les éléments de la
population sont appelés unités statistiques (ou individus).
Exemple
▪ Les logements dans une résidence.
▪ L’étude des accidents dans un département
Définition: Échantillon, Il est souvent impossible, pour des raisons
pratiques ou pour des raisons de coût, d'observer la population de
façon exhaustive et l'étude est alors faite sur un échantillon prélevé
d’une population C’est un sous-ensemble prélevé d’une population. les
résultats obtenus sont extrapolés à la population mère.
3/23/2022 STATISTIQUE DESCRIPTIVE 14
Vocabulaires de la statistique
Caractère ou variable statistique (𝑿)
▪ Chaque individu de la population peut être étudié par rapport à un ou
plusieurs traits ou caractéristiques ou critères appelés caractères ou
variables statistiques.
▪ Une variable statistique peut être qualitative ou quantitative.
▪ Si la variable étudiée est mesurable numériquement, on dit qu’il est
quantitative (âge, poids, taille, salaire,…).
▪ Par contre, si le caractère étudié est non mesurable numériquement, on
dit qu’il est qualitatif (sexe, niveau d’étude, état matrimonial,
nationalité, …).

3/23/2022 STATISTIQUE DESCRIPTIVE 15


Vocabulaires de la statistique

Modalité (𝒙𝒊 ) : Valeur que peut prendre une variable statistique.

Par exemple,
la variable « sexe » comporte deux modalités (masculin, féminin);
la variable « état matrimonial » comporte quatre modalités
(célibataire, marié, divorcé et veuf);
la variable âge comporte plusieurs valeurs (1,2,3, … , 99, …).

3/23/2022 STATISTIQUE DESCRIPTIVE 16


Vocabulaires de la statistique
Variables statistiques discrètes (V.S.D.) / Variables statistiques
continues (V.S.C.)
▪ Variable statistique est discrète si l’ensemble de ses modalités est fini
ou dénombrable (le plus souvent contient des valeurs entières).
Exemples : nombre d’enfant par ménage, nombre de pièces par
appartement, nombre de véhicules par ménage,...
▪ Une variable statistique est continue si elle peut prendre n’importe
quelle valeur dans un intervalle donné. Autrement dit, si l’ensemble
de ses modalités n’est pas dénombrable.
Exemples: L’âge, la taille, le poids d’un individu, le salaire, les
dépenses publicitaires,…
3/23/2022 STATISTIQUE DESCRIPTIVE 17
Vocabulaires de la statistique

Caractère qualitatif nominal/ caractère qualitatif ordinal

Un caractère qualitatif peut être:

Ordinal : si ses modalités peuvent être naturellement ordonnées


Exemple : satisfaction plus ou moins grande après l’achat d’un produit;

Nominal : si ses modalités ne peuvent être naturellement ordonnées


Exemple : état matrimoniale, couleur des yeux,...

3/23/2022 STATISTIQUE DESCRIPTIVE 18


Vocabulaires de la statistique
Série statistique

Une série statistique est la suite des modalités d’une population


donnée.

Une population peut être étudiée selon une seule variable : on parle
alors de série simple (partie I).

Lorsqu’on s’intéresse à étudier deux variables en même temps sur une


même population : on parle dans ce cas de série double ou bivarié
(partie II).
3/23/2022 STATISTIQUE DESCRIPTIVE 19
Vocabulaires de la statistique
Fréquences absolues, relatives, cumulées

Dans le cas des variables discrètes, on appelle :

▪ Fréquence absolue 𝑛𝑖 ou effectif, associée à une valeur 𝑥𝑖 de la


variable aléatoire X, le nombre d’apparitions de cette variable
dans la population ou dans l’échantillon.

L’ensemble des couples (𝑥𝑖 , 𝑛𝑖 ) s’appelle la distribution statistique du


caractère statistique X.

3/23/2022 STATISTIQUE DESCRIPTIVE 20


Vocabulaires de la statistique
Fréquences absolues, relatives, cumulées

▪ Fréquence relative, associée à la valeur 𝑥𝑖 de la variable aléatoire


X, le nombre

𝑛𝑖
𝑓𝑖 =
𝑛

où 𝑛𝑖 est la fréquence absolue et n le nombre total de données.

3/23/2022 STATISTIQUE DESCRIPTIVE 21


Vocabulaires de la statistique
Fréquences absolues, relatives, cumulées
Fréquence cumulée absolue, associée à une valeur 𝑥𝑖 de la variable, le
nombre d’individus dont la mesure est inférieure ou égale à 𝑥𝑖 .
𝑖

𝑁𝑖 = ෍ 𝑛𝑘
𝑘=1
On définit la fréquence cumulée relative :
𝑖

𝐹𝑖 = ෍ 𝑓𝑘
𝑘=1

3/23/2022 STATISTIQUE DESCRIPTIVE 22


Vocabulaires de la statistique
Fréquences absolues, relatives, cumulées
Exemple: Défauts relevés sur une pièce de tissu
Un fabricant de tissu essaie une nouvelle machine ; il compte le nombre
de défauts sur 75 échantillons de 10 mètres. Il a trouvé les résultats
suivants :
Tableau 1.1 – Nombre de défauts sur une pièce de tissus.

Nombre d’individus : les 75 échantillons.


3/23/2022 STATISTIQUE DESCRIPTIVE 23
Vocabulaires de la statistique
Fréquences absolues, relatives, cumulées

Fréquence absolue associée à la valeur 𝑘, le nombre 𝑛𝑘 : par exemple, sur les


75 échantillons examinés, 11 présentent 𝑘 = 2 défauts.
Fréquence relative associée à la valeur k : le quotient 𝑛𝑘 /n.
11/75 =0,146 est la fréquence relative associée à la valeur k=2.
Fréquence cumulée absolue associée à la valeur 𝑘 : 38+15 +11+64 est la
fréquence cumulée absolue associée à la valeur 𝑘 = 2.
Fréquence cumulée relative associée à la valeur k, le nombre d’échantillons
ayant au plus k défauts (k compris) divisé par 𝑛. 64/75=0,853 est la
fréquence cumulée relative associée à la valeur 𝑘 = 2.
3/23/2022 STATISTIQUE DESCRIPTIVE 24
PARTIE 1
SERIES SIMPLES

CHAPITRE 1 :
Tableaux statistiques et représentations
graphiques
TABLEAUX STATISTIQUES
Exemple Introductif : Supposons que l'on ait fait une enquête auprès
de 20 femmes selon 9 caractères : Prénom, nom, jour de naissance,
mois de naissance, années de naissance, nombre d'enfants, revenu
annuel du ménage, ville natale, opinion sur la qualité d'un produit
alimentaire pour bébé.

Ces données ont été reportées sur un bordereau, sous forme d'une
matrice de 20 éléments qui comprennent chacun les 9 données
concernant une femme.
3/23/2022 STATISTIQUE DESCRIPTIVE 26
I. TABLEAUX STATISTIQUES

3/23/2022 STATISTIQUE DESCRIPTIVE 27


TABLEAUX STATISTIQUES
Représentation de la distribution d’un
caractère X par un Tableau

1. Cas d’un caractère qualitatif :


Soit la distribution d’un caractère qualitatif X
étudié sur une population de n individus :
{(𝑥1 , 𝑛1 ), (𝑥2 , 𝑛2 ), … , (𝑥𝑘 , 𝑛𝑘 )}

Sa représentation par tableau est alors comme suit :

3/23/2022 STATISTIQUE DESCRIPTIVE 28


TABLEAUX STATISTIQUES
Exemple: On reprend les 20 femmes selon l’opinion
«caractère ordinal » :
▪ Ma, Tb, Ma, Ma, Mo, Mo, Bo, Mo, Pa, Mo, Pa, Bo,
Bo, Mo, Bo, Pa, Ma, Mo, Tb, Pa.
▪ Une fois classées : Ma, Ma, Ma, Ma, Pa, Pa, Pa,
Pa, Mo, Mo, Mo, Mo, Mo, Mo, Bo, Bo, Bo, Bo, Tb,
Tb.
▪ On a donc 5 modalités (𝑘 = 5).
La distribution s’écrit :
{(Ma,4); (Pa,4); (Mo, 6); (Bo ,4); (Tb, 2)}
• Le Tableau statistique est comme suit :

3/23/2022 STATISTIQUE DESCRIPTIVE 29


I. TABLEAUX STATISTIQUES
2. Cas du caractère quantitatif :
a. Variable Statistique Discrète
Soit X le caractère qui désigne le nombre d’enfants par ménage pour les
20 femmes :

La distribution est alors :


{(0,1), (1,3), (2,5), (3,6 ), (4,3), (5,2)}
Le tableau est alors le suivant :

3/23/2022 STATISTIQUE DESCRIPTIVE 30


I. TABLEAUX STATISTIQUES
b. Variable statistique continue
Dans le cas d’une v.s.c., les modalités sont regroupées en classes. Soit k le
nombre de ces classes :
[𝑒0 , 𝑒1 [ ; [𝑒1 , 𝑒2 [ ; ... ; [𝑒𝑖−1 , 𝑒𝑖 [ ; ... ; [𝑒𝑘−1, 𝑒𝑘 [

• Pour la ième classe, on note :

• 𝑎𝑖 = 𝑒𝑖 – 𝑒𝑖−1 l’amplitude de cette classe.

• le centre de cette classe.

3/23/2022 STATISTIQUE DESCRIPTIVE 31


I. TABLEAUX STATISTIQUES
Exemple : on relève le revenu des 20 femmes(€) Il est plus commode
de regrouper les revenus en classe, par exemple, on choisi 4 classes de
même amplitude.

3/23/2022 STATISTIQUE DESCRIPTIVE 32


I. TABLEAUX STATISTIQUES
Complétons notre tableau :

Interprétation :
✓Il y a 𝐹2 =75% des femmes
touchent au plus 𝑒2 = 70 m€ .
([𝑒1 , 𝑒2[)
✓Il y a 𝐹3 =25% des femmes
touchent au moins 𝑒2 = 70 m€
. ([𝑒2 , 𝑒3[)

3/23/2022 STATISTIQUE DESCRIPTIVE 33


II. REPRESENTATIONS GRAPHIQUES
–Le graphique est une traduction visuelle de l’information qu’elle soit
qualitative ou quantitative.
1. Cas du caractère qualitatif :
a. Le graphique en tuyaux d’orgue
est formé de rectangles de même base constante et dont les hauteurs
sont proportionnelles aux effectifs
(ou fréquences) des modalités associées.

Exemple : On reprend les 20 femmes

3/23/2022 STATISTIQUE DESCRIPTIVE 34


II. REPRESENTATIONS GRAPHIQUES
b. Le diagramme circulaire

C’est une représentation en disque. Chaque secteur est proportionnel à


l’effectif (ou fréquence) de la modalité associée. En terme d’angle, à 𝑥𝑖 on
associe l’angle au centre α𝑖 , du secteur i, vérifiant: α𝑖 = 𝑐.𝑓𝑖 ; i=1,...,k
K K
Or 
i =1
i = c  fi  360o = c  1  c = 360o
i =1

L’égalité devient:
α𝑖 = 360.𝑓𝑖 ; i=1,...,k

3/23/2022 STATISTIQUE DESCRIPTIVE 35


II. REPRESENTATIONS GRAPHIQUES
Exemple :

3/23/2022 STATISTIQUE DESCRIPTIVE 36


II. REPRESENTATIONS GRAPHIQUES
2. Cas du caractère quantitatif
a. Les V.S.D.
On utilise deux types de graphiques selon que l’on considère les effectifs
(ou fréquences) simple ou les effectifs (ou fréquences) cumulés:
i. Diagramme en bâtons
–À chaque modalité 𝑥𝑖 on associe un Segment de longueur
proportionnelle à l’effectif (ou fréquence).

3/23/2022 STATISTIQUE DESCRIPTIVE 37


II. REPRESENTATIONS GRAPHIQUES
Exemple : On reprend l’exemple des 20 femmes

3/23/2022 STATISTIQUE DESCRIPTIVE 38


II. REPRESENTATIONS GRAPHIQUES
ii. Courbe Cumulative
Définition : On appelle fonction de répartition 𝐹(𝑋), la fonction qui à
chaque valeur 𝑥 de ℝ associe la proportion d’individus pour lesquels la
valeur de la variable 𝑋 est inférieure ou égale à 𝑥.
Notation : 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥)
Remarques:
–Si 𝑥 = 𝑥𝑖 alors 𝐹(𝑥𝑖 ) = 𝑓1 + ⋯ + 𝑓𝑖 = 𝐹𝑖 .
–Si 𝑥𝑖 ≤ 𝑥 < 𝑥𝑖+1 alors 𝐹(𝑥) = 𝐹𝑖 + 0 = 𝐹𝑖 .
Conclusion : 𝐹(𝑥) = 𝐹𝑖 pour tout 𝑥 tel que 𝑥𝑖 ≤ 𝑥 < 𝑥𝑖+1

3/23/2022 STATISTIQUE DESCRIPTIVE 39


II. REPRESENTATIONS GRAPHIQUES
La représentation graphique de 𝐹(𝑥) est appelée Courbe cumulative,
c’est une courbe «en escalier» dont les paliers sont horizontaux, puisque
𝐹(𝑥) est constante sur chaque intervalle [𝑥𝑖 , 𝑥𝑖+1 [.

Propriété de 𝑭:
• La fonction 𝐹 est définie sur ℝ et à valeurs dans [0,1].
• 𝐹(𝑥) = 0 si 𝑥 < 𝑥1
• 𝐹(𝑥) = 1 si 𝑥 ≥ 𝑥𝑘
• 𝐹(−∞) = 0 et 𝐹(+∞) = 1
• 𝐹 est constante sur chaque intervalle séparant deux modalités
consécutives .
3/23/2022 STATISTIQUE DESCRIPTIVE 40
II. REPRESENTATIONS GRAPHIQUES
Remarque : On obtient la courbe cumulative des effectifs en remplaçant
les 𝐹𝑖 par les 𝑁𝑖
• Pour notre exemple, on a :

3/23/2022 STATISTIQUE DESCRIPTIVE 41


II. REPRESENTATIONS GRAPHIQUES
b. Les V.S.C.
On a souvent recourt à trois types de graphiques :
i. Histogramme
À chaque classe, on associe un rectangle dont la base est égale à
l’amplitude de la classe et dont la hauteur est de telle sorte que sa
surface (𝑆𝑖 = 𝑏𝑖 × ℎ𝑖 ) soit proportionnelle à la fréquence de la classe.
La juxtaposition de tous ces rectangles forment un histogramme.

3/23/2022 STATISTIQUE DESCRIPTIVE 42


II. REPRESENTATIONS GRAPHIQUES
La procédure à suivre :

• Toutes les classes ont même amplitude (𝑎𝑖 = 𝑐𝑡𝑒 = 𝑎 ; 𝑖 = 1, … , 𝑘)


alors ℎ𝑖 = 𝑓𝑖 (𝑜𝑢 𝑛𝑖 ).

• Au moins une classe a une amplitude différente des autres : dans ce


cas on choisi une amplitude de référence 𝑎𝑟 (par exemple la plus
petite ou la plus répandu) Par suite, on corrige la fréquence des classes
différentes en la divisant par l’amplitude associée et en multipliant par
𝑎𝑟 :

3/23/2022 STATISTIQUE DESCRIPTIVE 43


v
II. REPRESENTATIONS GRAPHIQUES
Exemple : On reprend les 20 femmes Toutes les classes ont même
amplitude donc pas besoin de corriger les fréquences

3/23/2022 STATISTIQUE DESCRIPTIVE 44


II. REPRESENTATIONS GRAPHIQUES
Exemple : Si On regroupe les 2 dernières classes

Remarque : 𝑓𝑖 ’ s’appelle densité de fréquence (sans pourcentage)


3/23/2022 STATISTIQUE DESCRIPTIVE 45
II. REPRESENTATIONS GRAPHIQUES
ii. Polygone de fréquences
• On subdivise l’histogramme en sous rectangles de même base égale à
l’amplitude de référence 𝑎𝑟 . 𝑎𝑟 étant choisie comme la plus petite
des amplitudes et vérifiant :
𝑎𝑖 = 𝑘 𝑎𝑟 ; k = 1,2,3,4,...
• Après avoir ajouter aux extrémités de l’histogramme deux rectangles
fictifs de hauteur nulle et de base 𝑎𝑟 ,on joint, par des segments de
droites, les milieux des sommets des sous rectangles ainsi obtenus.

3/23/2022 STATISTIQUE DESCRIPTIVE 46


II. REPRESENTATIONS GRAPHIQUES
Exemple :

3/23/2022 STATISTIQUE DESCRIPTIVE 47


II. REPRESENTATIONS GRAPHIQUES

ii. Courbe Cumulative


–On construit la courbe de la fréquence cumulée en joignant les
points (𝑒𝑖 , 𝐹𝑖 ), où 𝑒𝑖 est la borne supérieure de la 𝑖è𝑚𝑒 classe
[𝑒𝑖−1 , 𝑒𝑖 [ et 𝐹𝑖 est la fréquence cumulée de cette même classe. On
note 𝐹𝑖 = 𝑃(𝑋 ≤ 𝑒𝑖 )

3/23/2022 STATISTIQUE DESCRIPTIVE 48


II. REPRESENTATIONS GRAPHIQUES
Exemple : On reprend les 20 femmes

3/23/2022 STATISTIQUE DESCRIPTIVE 49


Chapitre 2

Les caractéristiques de
tendance centrale
Les caractéristiques de tendance centrale
La tendance centrale se propose de synthétiser l’ensemble d’une série
statistique en faisant ressortir une position centrale de la valeur du
caractère étudié.
Dans ce chapitre, on analysera trois de ces paramètres qui sont : les
moyennes, le mode et la médiane.
1. Le mode
Définition : Le mode, noté 𝑀0 , d’une série statistique est la valeur de
cette série, dont l’effectif (ou la fréquence) est maximal(e).
➢C’est le plus simple mais le moins utilisé !
3/23/2022 STATISTIQUE DESCRIPTIVE 51
Les caractéristiques de tendance centrale
Détermination du mode
a. Cas d'une v.s.d.
Dans le cas d'une v.s.d. la détermination du mode est immédiate à
partir du tableau statistique ou du diagramme en bâtons.
Exemples : Ci-dessous on donne trois diagrammes en bâtons associés
respectivement, à une distribution unimodale, et à une distribution
bimodale , et à une distribution qui a un intervalle modal.
Les caractéristiques de tendance centrale
Exemple 1 : On reprend l’exemple des 20 femmes selon le nb
d’enfants

l’effectif maximal est 6


La variable est quantitative discrète.
On a 𝑀0 =3 enfants .
Cette distribution est unimodale.

3/23/2022 STATISTIQUE DESCRIPTIVE 53


Les caractéristiques de tendance centrale
b. Cas d’une v.s.c.
Dans le cas d’une v.s.c. la détermination du mode est immédiate à
partir de l’histogramme.

3/23/2022 STATISTIQUE DESCRIPTIVE 54


Les caractéristiques de tendance centrale
Le mode se trouve dans la classe modale, c'est la classe qui correspond
à la plus grande fréquence corrigée.
l’expression algébrique du mode est comme suit :

3/23/2022 STATISTIQUE DESCRIPTIVE 55


Les caractéristiques de tendance centrale
Exemple : On reprend les 20 femmes

3/23/2022 STATISTIQUE DESCRIPTIVE 56


Les caractéristiques de tendance centrale
2. LA MEDIANE
Définition : La Médiane, notée M, d’une série statistique, est la valeur
de la série qui partage la population en deux parties d’effectifs
égaux. Par conséquent, on aura autant d’observations inférieures à M
que d’observations supérieures à M
Détermination de la médiane
a. Cas d’une série brute
Soit la série ordonnée (par ordre croissant) de n observations :
𝑥1 , 𝑥2 , … , 𝑥𝑛 .

3/23/2022 STATISTIQUE DESCRIPTIVE 57


Les caractéristiques de tendance centrale
• Si n est impaire, alors la valeur médiane est l’observation qui occupe
le rang (n+1)/2 .
• Si n est paire, on ne peut plus déterminer exactement la médiane,
mais on a un intervalle médian 𝑥𝑛/2 , 𝑥(𝑛/2)+1

b. Cas d’une distribution


i. Cas d’une VSD
Soit 𝑋 une v.s.d. de distribution 𝑥𝑖 , 𝑓𝑖 1≤i≤k pour déterminer sa
médiane, on utilise les fréquences cumulées croissantes 𝐹𝑖 .

3/23/2022 STATISTIQUE DESCRIPTIVE 58


Les caractéristiques de tendance centrale

Procédure à suivre
▪ S'il existe une modalité 𝑥𝑖 pour laquelle 𝐹𝑖 = 0,5, dans ce cas on
parle d’un intervalle médian : [𝑥𝑖 , 𝑥𝑖+1 ].

▪ Si ∀𝑖 𝐹𝑖 ≠ 0,5 ; autrement dit, si aucune fréquence cumulée 𝐹𝑖 n’est


égale à 0,5 , dans ce cas la médiane est la modalité 𝑥𝑖 qui
correspond à la plus petite fréquence cumulée dépassant strictement
0,5.

3/23/2022 STATISTIQUE DESCRIPTIVE 59


Les caractéristiques de tendance centrale
Exemple : On reprend l’exemple des 20 femmes selon le nb d’enfants

3/23/2022 STATISTIQUE DESCRIPTIVE 60


Les caractéristiques de tendance centrale
ii. Cas d’une v.s.c.
Dans le cas continue, la médiane est toujours unique : c’est la valeur qui
partage exactement la population en deux parties égales. En d'autres
termes, 𝑀 est la solution de l’équation : 𝐹(𝑀) = 0,5
où 𝐹 est la fonction de répartition de 𝑋.
On a deux méthodes pour déterminer la médiane :
▪ Détermination graphique
▪ Détermination par interpolation :

3/23/2022 STATISTIQUE DESCRIPTIVE 61


Les caractéristiques de tendance centrale
Détermination graphique :
La médiane correspond à l’abscisse du point de la courbe cumulative
qui admet pour ordonnée la valeur 0,5 (ou 50%).

3/23/2022 STATISTIQUE DESCRIPTIVE 62


Les caractéristiques de tendance centrale
Détermination par interpolation:
D'après le tableau ou la courbe cumulative, on détermine la classe
contenant la médiane 𝑀 ; c’est la classe [𝑒𝑖−1 , 𝑒𝑖 [ telle que,
𝐹𝑖−1 ≤ 0,5 < 𝐹𝑖 ; puis on détermine 𝑀 par interpolation linéaire.
donc on a :

3/23/2022 STATISTIQUE DESCRIPTIVE 63


Les caractéristiques de tendance centrale
Exemple :

3/23/2022 STATISTIQUE DESCRIPTIVE 64


Les caractéristiques de tendance centrale
3. LES MOYENNES
a. La moyenne arithmétique

Définition: La moyenne arithmétique, notée 𝑥,ҧ d’une variable statistique


𝑋 de distribution 𝑥𝑖 , 𝑛𝑖 1≤𝑖≤𝑘 est la quantité:

Où, 𝑛 est la taille de la population, et les 𝑥𝑖 sont les modalités dans le


cas d'une v.s.d. et les centres des classes dans le cas d'une v.s.c.
.

3/23/2022 STATISTIQUE DESCRIPTIVE 65


Les caractéristiques de tendance centrale
Exemple 1 : On reprend l’exemple des 20 femmes selon le nb d’enfants

3/23/2022 STATISTIQUE DESCRIPTIVE 66


Les caractéristiques de tendance centrale
Exemple 2 : Pour les revenus des femmes.

𝑥ҧ = ෍ 𝑓𝑖 𝑥𝑖 = 55,125
𝑖=1

3/23/2022 STATISTIQUE DESCRIPTIVE 67


Les caractéristiques de tendance centrale
Changement d’origine et d’échelle

Propriété :
Soit 𝑋 une variable statistique de moyenne arithmétique 𝑥ҧ . Si 𝑌 est une
variable statistique telle que 𝑌 = 𝑎𝑋 + 𝑏, où 𝑎 et 𝑏 sont des réels
quelconques, alors la moyenne arithmétique de 𝑌 est :
𝑦ത = 𝑎 𝑥ҧ + 𝑏

Démonstration :

3/23/2022 STATISTIQUE DESCRIPTIVE 68


Les caractéristiques de tendance centrale
Propriété algébrique de la moyenne arithmétique
la moyenne des écarts à la moyenne arithmétique est nulle :
𝒌

෍ 𝒇𝒊 𝒙𝒊 − ഥ
𝒙 =𝟎
𝒊=𝟏
Propriété de l’agrégation
Soit une population 𝑃 de taille 𝑛, composée de m sous populations 𝑃1 ,
𝑃2 ,..., 𝑃𝑚 ; de tailles respectives 𝑛1 , 𝑛2 ,..., 𝑛𝑚 et de moyennes
respectives 𝑥ҧ1 , 𝑥ҧ2 ,..., 𝑥ҧ𝑚 . Alors la moyenne arithmétique de la
population 𝑃 est donnée par :
1 𝑚
𝑥ҧ = ෍ 𝑛𝑖 𝑥ҧ𝑖
𝑛 𝑖=1
3/23/2022 STATISTIQUE DESCRIPTIVE 69
Les caractéristiques de tendance centrale
Exemple : Le salaire moyen des cadres dans l’entreprise 𝐸 est de
4000 DH. Le salaire moyen des cadres masculins est de 4200 DH. Le
salaire moyen des cadres féminins est de 3000 DH.
Quelle est la répartition hommes - femmes des cadres ?
➢ Soit 𝑥ҧ le salaire moyen global dans 𝐸, 𝑥ҧ1 celui des hommes et
𝑥ҧ2 celui des femmes. On a 𝑥ҧ = 𝑓1 𝑥ҧ1 + 𝑓2 𝑥ҧ2
➢ On aboutit alors au système :
𝑓1 + 𝑓2 = 1 𝑓1 + 𝑓2 = 1
ቊ ቊ
𝑓1 𝑥ҧ1 + 𝑓2 𝑥ҧ2 = 𝑥ҧ 4200𝑓1 + 3000𝑓2 = 4000
⇒ 𝑓1 =83,3% et 𝑓2 =16,7%
3/23/2022 STATISTIQUE DESCRIPTIVE 70
Les caractéristiques de tendance centrale
b. La moyenne géométrique
Définition : On appelle moyenne géométrique de la distribution
𝑥𝑖 , 𝑛𝑖 1≤𝑖≤𝑘 que l’on note 𝐺, la racine 𝑛ème du produit des 𝑥𝑖 𝑛𝑖

Où 𝑛 = σ𝑘𝑖=1 𝑛𝑖
Domaines d’application :
• On utilise la moyenne géométrique dans le calcul du taux
d’accroissement moyen et dans le calcul de certains indices
statistique.
3/23/2022 STATISTIQUE DESCRIPTIVE 71
Les caractéristiques de tendance centrale
➢ C’est plus pratique d’utiliser le logarithme

3/23/2022 STATISTIQUE DESCRIPTIVE 72


Les caractéristiques de tendance centrale
Exemple :calculons la moyenne géométrique de 2, 12, 2, 50:

D’une autre façon, calculons 𝐿𝑜𝑔(𝐺) :

D'où
3/23/2022 STATISTIQUE DESCRIPTIVE 73
Les caractéristiques de tendance centrale
c. La moyenne harmonique

Définition et propriété: La moyenne harmonique , notée 𝐻, d’une


distribution 𝑥𝑖 , 𝑛𝑖 1≤𝑖≤𝑘 est l’inverse de la moyenne arithmétique
de la distribution : 1/𝑥𝑖 , 𝑛𝑖 1≤𝑖≤𝑘

Domaines d’application :
On utilise cette moyenne dans le calcul des durées moyennes, dans le
calcul des moyennes de rapports et de pourcentages et dans les études
du pouvoir d’achat.
3/23/2022 STATISTIQUE DESCRIPTIVE 74
Les caractéristiques de tendance centrale
Exemple :calculons la moyenne harmonique de 2 , 12 , 2 , 50 :

d. La moyenne quadratique
Définition et propriété : La moyenne quadratique, notée 𝑄 , d’une
distribution 𝑥𝑖 , 𝑛𝑖 1≤𝑖≤𝑘 est la racine carrée de la moyenne
arithmétique de la distribution 𝑥𝑖2 , 𝑛𝑖 1≤𝑖≤𝑘

3/23/2022 STATISTIQUE DESCRIPTIVE 75


Les caractéristiques de tendance centrale
Domaines d’application :
La moyenne quadratique intervient dans le calcul de certains
paramètres de dispersion.
Exemple :calculons la moyenne quadratique de 2 , 12 , 2 , 50 :

Résultat comparatif
Pour une même série statistique, on montre que les quatre moyennes
vérifient toujours l’ordre suivant : 𝐻 < 𝐺 < 𝑥ҧ < 𝑄
3/23/2022 STATISTIQUE DESCRIPTIVE 76
Les caractéristiques de tendance centrale
Comparaison entre les paramètres de tendance centrale

3/23/2022 STATISTIQUE DESCRIPTIVE 77


Les caractéristiques de tendance centrale
Comparaison entre les paramètres de position
Moyenne:
• Avantages:
- répandue +++
- facilité du calcul
• Inconvénients:
- fortement influencée par les valeurs extrêmes
- représente mal les valeurs d’une population hétérogène

3/23/2022 STATISTIQUE DESCRIPTIVE 78


Les caractéristiques de tendance centrale
Médiane
• Avantages
- excellent indicateur des valeurs extrêmes.
• Inconvénients
- ne représente que la valeur qui sépare l’échantillon en 2 parties
de même effectif sans tenir compte de l’ensemble des données.

3/23/2022 STATISTIQUE DESCRIPTIVE 79


Chapitre 3

Les caractéristiques de
dispersion
Les caractéristiques de dispersion
On appelle dispersion statistique la tendance qu’ont les valeurs de la
distribution d’un caractère à s’étaler et à se disperser d’une valeur
centrale.
Les indicateurs de dispersion sont nombreux, les plus courants sont:
L’étendue, l’écart interquartile, la variance, l’écart-type et le cœfficient
de variation.
1. L’étendue
a. Variable quantitative discrète
L’étendue mesure l’écart entre la plus petite valeur de la variable et
la plus grande : e = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
où 𝑥𝑚𝑖𝑛 (resp. 𝑥𝑚𝑎𝑥 ) est la valeur minimale (resp. maximale ) prises
par la variable
3/23/2022 STATISTIQUE DESCRIPTIVE 81
Les caractéristiques de dispersion
Exemple: Soit la série statistique suivante
(𝑎) 20, 22, 21, 20, 20, 19, 18, 20, 20
𝐸𝑡𝑒𝑛𝑑𝑢𝑒 𝑎 = 22 − 18 = 4
b. Variable quantitative continue
Dans ce cas l’étendue est la différence entre la borne supérieure de
la dernière classe et la borne inférieure de la première classe.
e = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
où 𝑥𝑚𝑖𝑛 (resp. 𝑥𝑚𝑎𝑥 ) est la borne inférieure (resp. supérieure) de la
première (resp. dernière) classe.

3/23/2022 STATISTIQUE DESCRIPTIVE 82


Les caractéristiques de dispersion
2. Les quartiles
Nous savons que la médiane divise la distribution en deux parties
égales. Il existe d’autres indicateurs utiles :
a) Les quartiles qui divise la distribution en quatre parties égales
b) Les déciles qui divise la distribution en dix parties égales
c) Les centiles qui divise la distribution en cent parties égales.
Les quartiles sont notés 𝑄1 , 𝑄2 et 𝑄3 et on a 𝐹(𝑄1 ) = 0.25,
𝐹(𝑄2 ) = 0.5 𝑒𝑡 𝐹(𝑄3 ) = 0.75. La médiane est le 2ème quartile, le
5ème décile et le 50ème centile.

3/23/2022 STATISTIQUE DESCRIPTIVE 83


Les caractéristiques de dispersion
a. Variable quantitative discrète
On considère une série statistique dont les valeurs du caractère
étudié, ont été rangés dans un ordre croissant :
𝑥1 ≤ 𝑥2 ≤ 𝑥3 ≤ · · · ≤ 𝑥𝑛−1 ≤ 𝑥𝑛
La médiane 𝑀 sépare la série en deux séries de même effectif.
La série inférieure dont les valeurs du caractère sont inférieures ou
égale à la médiane 𝑀, et la série supérieure dont les valeurs du
caractère sont supérieures ou égale à la médiane 𝑀.
On appelle premier (resp. troisième) quartile, la médiane de la série
inférieure (resp. supérieure) on le note 𝑄1 (resp. 𝑄3).
3/23/2022 STATISTIQUE DESCRIPTIVE 84
Les caractéristiques de dispersion
Exemple : Considérons la distribution suivante

On a N = 30

𝑁1 est impair d’où (𝑁1 +1)/2 = 8 ⇒ 𝑄1 = 𝑥((𝑁1 +1)/2 ) = 𝑥(8) = 20


et 𝑄3 = 𝑥((𝑁1 +1)/2 ) = 𝑥(8) = 40
3/23/2022 STATISTIQUE DESCRIPTIVE 85
Les caractéristiques de dispersion
• Considérons la distribution suivante

On a 𝑁 = 33

x( N1 /2) + x( N1 /2+1) x(8) + x(9)


𝑁1 est pair d’où 𝑁1 /2 = 8 ⇒ Q1 = = = 20
2 2
x( N1 /2 ) + x( N1 /2+1) x(8) + x( 9 )
et Q3 = = = 40
2 2
3/23/2022 STATISTIQUE DESCRIPTIVE 86
Les caractéristiques de dispersion
b. Variable quantitative continue
Des techniques similaires à celles utilisées pour déterminer la médiane
dans le cas continue permettent de déterminer ces indicateurs.
Pour le premier quartile.

Pour le troisième quartile

3/23/2022 STATISTIQUE DESCRIPTIVE 87


Les caractéristiques de dispersion
Exemple : la distribution des salaires mensuels.

3/23/2022 STATISTIQUE DESCRIPTIVE 88


Les caractéristiques de dispersion
L’écart interquartile
𝑄1 étant le premier quartile et 𝑄3 le troisième quartile, l’écart
interquartile est la différence entre le troisième et le premier
quartile, il est noté 𝑅(𝑄) = 𝑄3 − 𝑄1 .
L’intervalle [𝑄1 , 𝑄3 ] est appelé intervalle interquartile. Il contient
50% des observations, le reste se réparti avec 25% à gauche de 𝑄1
et 25% à droite de 𝑄3 .
L’écart interquartile 𝑅(𝑄) est la largeur de l’intervalle interquartile.
C’est une mesure de dispersion des données autours de la médiane.

3/23/2022 STATISTIQUE DESCRIPTIVE 89


Les caractéristiques de dispersion

• Plus il est petit, plus les données sont proches de la médiane.


• Plus il est grand, plus les données sont dispersées autours de la
médiane.
Exemple : Reprenons l’exemple de la distribution des salaires
mensuels.
L’intervalle interquartile est [3,24; 6,19] et l’écart interquartile est
𝑅(𝑄) = 6, 19 − 3, 24 = 2, 85

3/23/2022 STATISTIQUE DESCRIPTIVE 90


Les caractéristiques de dispersion

Diagramme en boîte
Ce diagramme est aussi appelé boîte à moustaches. Il utilise la valeur
du 1er quartile 𝑄1 , la valeur du 2ème quartile 𝑄2, la valeur du 3ème
quartile 𝑄3 , l’écart interquartile 𝑅(𝑄) et les valeurs minimum et
maximum de la série.
On représente sur un axe gradué (horizontal ou vertical) les
différentes valeurs de la série 𝑄1 , 𝑄2 , 𝑄3 , 𝑥𝑚𝑖𝑛 , 𝑥𝑚𝑎𝑥 ainsi
que 𝑄1 − 1.5 × 𝑅(𝑄) 𝑒𝑡 𝑄3 + 1.5 × 𝑅(𝑄).

3/23/2022 STATISTIQUE DESCRIPTIVE 91


Les caractéristiques de dispersion

La boîte a pour largeur l’écart interquartile généralement sur 1.5 fois


la largeur de la boîte. Dans ce cas, une valeur est atypique ou
aberrante si elle dépasse de 1.5 fois l’écart interquartile à gauche
du 1er quartile ou à droite du 3ème quartile.
3/23/2022 STATISTIQUE DESCRIPTIVE 92
Les caractéristiques de dispersion
La boîte à moustaches permet de répondre à certaines questions :
• Existe-t-il des observations atypiques ?
• La distribution est-elle symétrique ?
• La partie centrale (50% des effectifs) est-elle plus ou moins
concentrée ou étalée par rapport au reste de la distribution ?
• Comparaisons de distributions selon des groupes ? Pour comparer
les distributions d’une même variable selon les groupes, on
juxtapose sur le même graphique les boîtes à moustaches définies
respectivement pour les groupes en utilisant la même échelle

3/23/2022 STATISTIQUE DESCRIPTIVE 93


Les caractéristiques de dispersion
Exemple : Deux groupes de S3 Statistique comparent leurs résultats
du contrôle final et déclarent : “nos classes ont le même profil puisque
dans les deux cas la médiane et le mode des résultats est 10”.
Qu’en pensez-vous ?

Vérifier que les deux médianes valent 10 et déterminer les quartiles


de chaque série. Tracer côte à côte les diagrammes en boîtes de ces
deux séries.

3/23/2022 STATISTIQUE DESCRIPTIVE 94


Les caractéristiques de dispersion
Les effectifs cumulés des deux groupes est:

Les séries inférieures et supérieurs du groupe 1 et 2 sont :

3/23/2022 STATISTIQUE DESCRIPTIVE 95


Les caractéristiques de dispersion
Les effectifs des séries inférieures et supérieurs du groupe 1 et 2 sont :

3/23/2022 STATISTIQUE DESCRIPTIVE 96


Les caractéristiques de dispersion
Le graphique ci-dessous met bien en évidence
que l’écart interquartile est plus resserré pour le
groupe 2 que le groupe 1 donc les élèves du
groupe 2 ont globalement un niveau plus
homogène que ceux de du groupe 1.
On peut remarquer que 17 est une valeur
atypique pour le groupe 2 tandis que le groupe
1 n’a pas de valeur atypique.
La distribution du groupe 1 est symétrique car
la boîte est symétrique par rapport au segment
Boîte à moustaches des Gr 1 et 2 de la médiane tandis que celle du groupe 2 est
asymétrique à gauche.
3/23/2022 STATISTIQUE DESCRIPTIVE 97
Les caractéristiques de dispersion

3. La variance et l’écart-type
La variance est un résumé statistique qui mesure la concentration ou
la dispersion des observations autour de la moyenne.
L’écart-type permet d’avoir une idée de la façon dont les valeurs de
la série s’écartent par rapport à la moyenne, c’est donc une mesure
de dispersion.
Un écart-type faible correspond à une série concentrée autour de la
moyenne.

3/23/2022 STATISTIQUE DESCRIPTIVE 98


Les caractéristiques de dispersion
a. Variable quantitative discrète
La variance 𝑉(𝑥) est la moyenne arithmétique des carrés des écarts
des valeurs de la variable à la moyenne arithmétique

La racine carrée de la variance est appelée l’écart-type

3/23/2022 STATISTIQUE DESCRIPTIVE 99


Les caractéristiques de dispersion
Exemple : Considérons la distribution suivant

on a 𝑁 = 31 et 𝑥ҧ = 32.58

Relation de König :

3/23/2022 STATISTIQUE DESCRIPTIVE 100


Les caractéristiques de dispersion
b. Variable quantitative continue
La variance 𝑉(𝑥) est la moyenne arithmétique des carrés des écarts
des centres des classes à la moyenne arithmétique

où 𝑐𝑖 est le centre de la classe associée à 𝑛𝑖


La racine carrée de la variance est appelée l’écart-type

3/23/2022 STATISTIQUE DESCRIPTIVE 101


Les caractéristiques de dispersion
Exemple: Reprenons la distribution des salaires mensuels.

Relation de König :
3/23/2022 STATISTIQUE DESCRIPTIVE 102
Les caractéristiques de dispersion
4. Cœfficient de variation
Le cœfficient de variation, qui est un nombre sans dimension, permet
comparer des dispersions de distributions statistiques hétérogènes.
Il s’écrit

Si 𝐶𝑉 < 0, 5 alors la dispersion n’est pas importante.


Si 𝐶𝑉 > 0, 5 alors la dispersion est importante

3/23/2022 STATISTIQUE DESCRIPTIVE 103


Les caractéristiques de dispersion
Exemple : Dans une maternité on a relevé le poids ( en kg ) à la
naissance de 47 nouveau-nés. Les données collectées sont résumées
dans le tableau suivant :

Le cœfficient de variation étant faible, le poids à la naissance est


concentré autour de la moyenne.
3/23/2022 STATISTIQUE DESCRIPTIVE 104
Les caractéristiques de dispersion
5. Moments
Définition 1: Le moment d’ordre 𝑟 d’une variable statistique est la
quantité

Pour 𝑟 = 0, 𝑚0 = 1.
Pour 𝑟 = 1, 𝑚1 = 𝑥ҧ la moyenne arithmétique.
Définition 2: Le moment centré d’ordre 𝑟 d’une variable est la
quantité

Pour 𝑟 = 0, 𝜇0 = 1.
Pour 𝑟 = 1, 𝜇1 = 0.
Pour 𝑟 = 2, 𝜇2 = 𝑉(𝑥) la variance.
3/23/2022 STATISTIQUE DESCRIPTIVE 105
Les caractéristiques de dispersion
Changement d’origine et d’unité
Définition: On appelle changement d’origine l’opération consistant à
ajouter la même quantité 𝑏 ∈ 𝐼𝑅 à toutes les observations:
𝑦𝑖 = 𝑥𝑖 + 𝑏, 𝑖 = 1,· · · , 𝑛.
On appelle changement d’unité l’opération consistant à multiplier
par la même quantité 𝑎 ∈ 𝐼𝑅 toutes les observations :
𝑦𝑖 = 𝑎 × 𝑥𝑖 , 𝑖 = 1,· · · , 𝑛.
On appelle changement d’origine et d’unité l’opération consistant à
multiplier toutes les observations par la même quantité 𝑎 ∈ 𝐼𝑅 puis
à ajouter la même quantité 𝑏 ∈ 𝐼𝑅 à toutes les observations :
𝑦𝑖 = 𝑎 × 𝑥𝑖 + 𝑏, 𝑖 = 1,· · · , 𝑛.
3/23/2022 STATISTIQUE DESCRIPTIVE 106
Les caractéristiques de dispersion
Théorème: Si on effectue un changement d’origine et d’unité sur une
variable X, alors

• Sa moyenne est affectée du même changement d’origine et


d’unité, 𝑦ത = 𝑎𝑥ҧ + 𝑏

• Sa variance et son écart-type sont affectés par le changement


d’unité et pas par le changement d’origine,

3/23/2022 STATISTIQUE DESCRIPTIVE 107


Les caractéristiques de dispersion

Remarque :
• Les paramètres de position (mode, médiane et moyenne) sont tous
affectés par un changement d’origine et d’unité.
• Les paramètres de dispersion sont tous affectés par un changement
d’unité mais pas par un changement d’origine (sauf le coefficient de
variation).
3/23/2022 STATISTIQUE DESCRIPTIVE 108
Chapitre 4

Les caractéristiques de
forme
Les caractéristiques de forme
1. Symétrie et asymétrie
Une distribution est dite symétrique si le mode, la médiane et la
moyenne sont confondus. Une distribution qui n’est pas symétrique est
dite asymétrique.
Remarque : Une variable statistique est symétrique si ses valeurs sont
réparties de manière symétrique autour de la moyenne c’est à dire si le
polygone des fréquences a la forme d’une cloche comme dans la figure
ci-après.

3/23/2022 STATISTIQUE DESCRIPTIVE 110


Les caractéristiques de forme
A la différence de la médiane, la moyenne arithmétique est fortement
influencée par les valeurs extrêmes.
Lorsque les valeurs sont distribuées de manière symétrique, la
moyenne arithmétique coïncide avec la médiane et le mode.
Lorsque la distribution est asymétrique, la moyenne arithmétique
dépasse la médiane si les valeurs extrêmes sont élevées et se situe en
dessous de la médiane si les valeurs extrêmes sont basses.

3/23/2022 STATISTIQUE DESCRIPTIVE 111


Les caractéristiques de forme
Une distribution est dite asymétrique à droite, si la courbe du
polygone des fréquences est étalée à droite, on a généralement :
mode < médiane < moyenne.
Une distribution est dite asymétrique à gauche, si la courbe du
polygone des fréquences est étalée à gauche, on a généralement :
moyenne < médiane < mode.

3/23/2022 STATISTIQUE DESCRIPTIVE 112


Les caractéristiques de forme
2. Cœfficient d’asymétrie
le coefficient d’asymétrie a pour rôle de fournir une mesure de
dissymétrie d’une distribution.
a. Cœfficient d’asymétrie de Pearson
Le premier cœfficient d’asymétrie de Pearson est basé sur une
comparaison de la moyenne et de la médiane et est normalisé par
l’écart-type. Il est calculé à partir de la formule suivante :
𝑥ҧ − 𝑀
𝐴𝑝1 = 3 ×
𝜎
où 𝑥ҧ est la moyenne, 𝑀 la médiane et 𝜎 l’écart-type.
3/23/2022 STATISTIQUE DESCRIPTIVE 113
Les caractéristiques de forme
𝑆𝑖 𝐴𝑝1 = 0 ∶il y a une symétrie parfaite de la distribution
𝑆𝑖 𝐴𝑝1 < 0 ∶ la série des valeurs de la distribution est étalée à gauche
𝑆𝑖 𝐴𝑝1 > 0 ∶ la série des valeurs de la distribution est étalée à droite
Lorsque la distribution statistique est unimodale, on peut utiliser le
second coefficient de Pearson basé sur une comparaison de la
moyenne et du mode et est normalisé par l’écart-type. Il est calculé à
partir de la formule suivante :
𝑥ҧ − 𝑀0
𝐴𝑝2 =
𝜎
où 𝑥ҧ est la moyenne, 𝑀0 le mode et 𝜎 l’écart-type.
3/23/2022 STATISTIQUE DESCRIPTIVE 114
Les caractéristiques de forme
𝑆𝑖 𝐴𝑝2 = 0 ∶ La distribution est symétrique
𝑆𝑖 𝐴𝑝2 < 0 ∶ La distribution est étalée à gauche
𝑆𝑖 𝐴𝑝2 > 0 ∶ La distribution est étalée à droite
b. Cœfficient d’asymétrie de Yule
Le cœfficient d’asymétrie de Yule est basé sur les positions des trois
quartile et est normalisé par l’écart interquartile. Il est calculée à
𝑄 +𝑄3 −2𝑄2
partir de la formule suivante : 𝐴𝑌 = 1 𝑅(𝑄)
où 𝑄1, 𝑄2, 𝑄3 les 3 quartiles , et 𝑅(𝑄) l’écart interquartile.

3/23/2022 STATISTIQUE DESCRIPTIVE 115


Les caractéristiques de forme
𝑆𝑖 𝐴𝑌 = 0 ∶ La distribution est symétrique
𝑆𝑖 𝐴𝑌 < 0 ∶ La distribution est étalée à gauche
𝑆𝑖 𝐴𝑌 > 0 ∶ La distribution est étalée à droite
c. Cœfficient d’asymétrie de Fisher
Le coefficient d’asymétrie de Fisher est basé sur le moment d’ordre 3 et
est normalisé par le cube de l’écart-type. Il est calculée à partir de la
formule suivante :
𝜇3
𝐴𝐹 = 3
𝜎
où 𝜇3 le moment centré d’ordre 3 , et 𝜎 l’écart-type.
3/23/2022 STATISTIQUE DESCRIPTIVE 116
Les caractéristiques de forme

• Si la distribution est symétrique, le coefficient est nul. On admettra


que si le cœfficient de Fisher𝐴𝐹 ∈ ] − 0.1, 0.1[, la distribution est
symétrique.

• Si la distribution est asymétrique à droite (resp. à gauche), le


cœfficient est positif (resp. négatif).

3/23/2022 STATISTIQUE DESCRIPTIVE 117


Les caractéristiques de forme
Exemple:
On considère la série statistique suivante (masse en grammes des œufs
de poule d’un élevage).
Masse: 𝑥𝑖 40 45 50 55 60 65 70 75 80 85 90
Effectif: 𝑛𝑖 16 20 75 141 270 210 165 63 21 12 7

𝑥ҧ 𝜎 𝜇3 𝑄2 𝑀0 𝑄1 𝑄3 𝑅(𝑄) 𝐴𝑃1 𝐴𝑃2 𝐴𝑌 𝐴𝐹


62.5 8.59 91.1 60 60 55 70 15 0.87 0.29 0.33 0.14

La distribution des masses est asymétrie à droite car les cœfficients


d’asymétrie sont positifs.
3/23/2022 STATISTIQUE DESCRIPTIVE 118
Les caractéristiques de forme
3. Le cœfficient d’aplatissement
Le cœfficient d’aplatissement mesure le degré d’aplatissement d’une distribution.
On l’obtient à partir du moment centré d’ordre 4.
• Cœfficient d’aplatissement de Pearson:
𝜇4
𝛽2 =
𝑉(𝑥)2
où 𝑉(𝑥) est la variance et 𝜇4 le moment centré d’ordre 4
𝑆𝑖 𝛽2 = 3: La courbe est proche de la courbe normale
𝑆𝑖 𝛽2 < 3 La courbe est leptokurtique, c’est-à-dire plus plate que la loi normale
𝑆𝑖 𝛽2 > 3: la courbe est platykurtique c’est-à-dire plus pointue que la loi
normale
3/23/2022 STATISTIQUE DESCRIPTIVE 119
Les caractéristiques de forme
• Cœfficient d’aplatissement de Ficher:
𝐹2 = 𝛽2 − 3 où 𝛽2 est le coefficient d’aplatissement de Pearson
3 est le degré d’aplatissement d’une loi gaussienne centrée réduite.
• Si 𝐹2 = 0 , le polygone statistique de la variable à le même aplatissement
qu’une courbe en cloche, on dit que la variable est mesokurtique.
• Si 𝐹2 > 0 , le polygone statistique de la variable est moins aplati qu’une
courbe en cloche, la concentration des valeurs de la série autour de la
moyenne est forte, on dit que la variable est leptokurtique.
• Si 𝐹2 < 0 , le polygone statistique de la variable est plus aplati qu’une
courbe en cloche, la concentration des valeurs autour de la moyenne est
faible, on dit que la variable est platykurtique.
3/23/2022 STATISTIQUE DESCRIPTIVE 120
Les caractéristiques de forme

Exemple: Reprenons la distribution des masse des oeufs de poule


𝜇4 = 17523.91, 𝑉 𝑥 = 73.8, 𝛽2 = 3.22 𝑒𝑡 𝐹2 = 0.22 > 0
⇒ la variable est leptokurtique et le polygone statistique de la
variable est moins aplati qu’une courbe en cloche, la concentration des
valeurs de la série autour de la moyenne est forte.
3/23/2022 STATISTIQUE DESCRIPTIVE 121
Chapitre 5

Les caractéristiques de
concentration
Les caractéristiques de concentration
• Corrado Gini est le statisticien derrière La notion de concentration.
Ce statisticien italien a introduit cette notion notamment à propos
des distributions de salaires et de revenus.

• L'objectif de la concentration est de mesurer les inégalités dans la


répartition d’une variable a l’intérieur d’une population.

• La concentration s'applique a la description d’unités économiques


selon la taille, par exemple des entreprises suivant le chiffre
d’affaire, la production, le nombre de salarié... etc.

3/23/2022 STATISTIQUE DESCRIPTIVE 123


Les caractéristiques de concentration
• La concentration permet d'étudier la densité des données autour de la
valeur centrale. La mesure de celle concentration concerne les variables
statistiques quantitatives continues représentant une valeur positive
cumulable.
• Les caractéristiques de concentration sont utiles pour mesurer la
répartition de la masse salariale.
• La répartition de la masse salariale se situe entre les deux cas extrêmes
suivants:
➢ Concentration nulle: la répartition des salaires est parfaitement
équitable; un certain pourcentage de salariés reçoit le même
pourcentage de la masse salariale.
➢ Concentration maximale: un seul salarié reçoit toute la masse salariale
(et les autres ne reçoivent rien).
3/23/2022 STATISTIQUE DESCRIPTIVE 124
Les caractéristiques de concentration
Les caractéristiques de concentration, se présentent comme suit:
❑ Écart entre médiale et médiane

❑ La courbe de concentration appelée Courbe de Lorentz

❑ L'indice de Gini.

Néanmoins, pour procéder au calcule de ces caractéristiques il


convient d'abord de déterminer:
❑ Les valeurs globales ( les masses)

❑ La médiale

3/23/2022 STATISTIQUE DESCRIPTIVE 125


Les caractéristiques de concentration
Les masses
▪ Soit une série statistique où la variable statistique 𝑋 étudiée est

continue et dont les valeurs sont positives et regroupées en 𝑘


classes, d'effectifs respectifs 𝑛1 , 𝑛2 , … , 𝑛𝑘 et de centres
respectifs 𝑐1 , 𝑐2 , … , 𝑐𝑘 . On appelle:
▪ 𝑺𝒊 , la masse associée à la classe [𝑒𝑖 ; 𝑒𝑖+1 [ d'effectif 𝑛𝑖 , tel que:
𝑆𝑖 = 𝑛𝑖 𝑐𝑖
▪ 𝑺, la masse globale de la variable 𝑋, tel que:

𝑆 = σ𝑘𝑖=1 𝑆𝑖 = σ𝑘𝑖=1 𝑛𝑖 𝑐𝑖
3/23/2022 STATISTIQUE DESCRIPTIVE 126
Les caractéristiques de concentration

𝒈𝒊 , la masse relative ( appelée également proportion de la masse


globale) associée à la classe [𝑒𝑖 ; 𝑒𝑖+1 [ , tel que:
𝑆𝑖 𝑛 𝑖 𝑐𝑖
𝑔𝑖 = = 𝑘
𝑆 σ𝑖=1 𝑛𝑖 𝑐𝑖
𝑮𝒊 , la masse relative cumulée croissante associée à la classe
[𝑒𝑖 ; 𝑒𝑖+1 [ , tel que:
𝐺𝑖 = σ𝑘𝑖=1 𝑔𝑖

3/23/2022 STATISTIQUE DESCRIPTIVE 127


Les caractéristiques de concentration
Exemple: le tableau suivant présente la distribution de salaire de 50
employés d'une entreprise:
Salaire (en DH) 𝒏𝒊 𝒄𝒊 𝒇𝑖 (%) 𝑭𝑖 (FCC)

[600;1200[ 15 900 30 30
[1200;1800[ 25 1500 50 80
[1800;2100[ 10 1950 20 100
Total 50 - 100 -
Calculer la masse salariale globale, ainsi que les masse relatives et les
masses relatives cumulées croissantes.
3/23/2022 STATISTIQUE DESCRIPTIVE 128
Les caractéristiques de concentration

3/23/2022 STATISTIQUE DESCRIPTIVE 129


Les caractéristiques de concentration
La médiale
❖ La médiale d'une série statistique est la valeur du caractère 𝑋 qui
partage en deux parties égales la masse totale du caractère. La
médiale s'exprime dans la même unité que la variable étudiée:
𝑴𝒍 = 𝑮 𝑴𝒍 = 𝟎. 𝟓 = 𝟓𝟎%
❖ Comme la médiane, la médiale est calculée par interpolation
linéaire à partir d'une classe médiale. La classe médiale est la
classe dont la masse salariale relative cumulée croissante et
supérieure ou égale à 50% (𝑮 𝒆𝒊 < 𝟎. 𝟓 𝒆𝒕 𝑮(𝒆𝒊 ) ≥ 𝟎. 𝟓)

3/23/2022 STATISTIQUE DESCRIPTIVE 130


Les caractéristiques de concentration

Attention! Ne pas confondre médiane et médiale.


✓ La médiale est la médiane de la série masse associée.
✓ La médiale de la série (𝑥𝑖 , 𝑛𝑖 ) est la médiane de la série (𝑥𝑖 , 𝑔𝑖 ).
✓ La médiale est calculée par la formule suivante:

3/23/2022 STATISTIQUE DESCRIPTIVE 131


Les caractéristiques de concentration
Exemple précédent: calculer la médiale
Salaire (en DH) 𝒏𝒊 𝒄𝒊 𝒇𝑖 (%) 𝑭𝑖 𝑺𝒊 (𝒏𝒊 𝒄𝒊 ) 𝒈 𝑖 % 𝑮𝒊 %
(FCC) (𝑺𝒊 /S)
[600; 1200[ 15 900 30 30 13500 19.15 19.15
[1200;1800[ 25 1500 50 80 37500 53.19 72.34
[1800;2100[ 10 1950 20 100 19500 27.66 100
Total 50 - 100 - 70500 100 -

3/23/2022 STATISTIQUE DESCRIPTIVE 132


Les caractéristiques de concentration
Ecart médiale -médiane
La différence entre la médiale et la médiane, 𝑀𝑙 − 𝑀, est une mesure
de la concentration d'une distribution.
Ce rapport est compris entre 0 et 1
❑ Concentration forte: lorsque cette différence est grande par
rapport à l'étendue.
❑ Concentration faible: lorsque cette différence est petite.
❑ Concentration nulle: la médiane est égale à la médiale (𝑀𝑙 − 𝑀 =
0 ). Dans ce cas la distribution est égalitaire : l'ensemble des 𝑥𝑖 sont
égaux.
3/23/2022 STATISTIQUE DESCRIPTIVE 133
Les caractéristiques de concentration
Exemple précédent: calculer l'écart médiale-médiane.
Salaire (en DH) 𝒏𝒊 𝒄𝒊 𝒇𝑖 (%) 𝑭𝑖 𝑺𝒊 𝒈𝑖 % 𝑮𝒊 %
[600; 1200[ 15 900 30 30 13500 19.15 19.15
[1200;1800[ 25 1500 50 80 37500 53.19 72.34
[1800;2100[ 10 1950 20 100 19500 27.66 100
Total 50 - 100 - 70500 100 -
Médiale: 𝑀𝑙 =1548 ∆= (1548 − 1440)/(2100 − 600)
Médiane: 𝑀= 1440 ∆ =7.2%
L'écart médiale-médiane représente 7.2% de l'étendue. Ce qui
montre que la concentration des salaires est faible.
3/23/2022 STATISTIQUE DESCRIPTIVE 134
Les caractéristiques de concentration
Courbe de Lorentz
❑ La courbe de concentration, appelée courbe de Lorentz, est obtenue à
partir des calculs des Fréquences cumulées croissantes (𝐹𝑖 ) et des masses
cumulées croissantes (𝐺𝑖 ) .
❑ Pour tracer cette courbe on pose:
En abscisse, les fréquences cumulées croissantes de la série (𝑥𝑖 , 𝑛𝑖 ): 𝑭𝒊
En ordonnée, les fréquences cumulées croissantes de la série (𝑥𝑖 , 𝑔𝑖 ):
𝑮𝒊 .
❑ On trace par la suite la droite d'équirépartition ou droite d'égalité
parfaite. Cette droite présente une situation d'égalité où la répartition
est parfaitement équitable.
3/23/2022 STATISTIQUE DESCRIPTIVE 135
Les caractéristiques de concentration

3/23/2022 STATISTIQUE DESCRIPTIVE 136


Les caractéristiques de concentration

3/23/2022 STATISTIQUE DESCRIPTIVE 137


Les caractéristiques de concentration
Exemple précédent: tracer la courbe de Lorentz.

Salaire (en DH) 𝒏𝒊 𝒄𝒊 𝒇𝑖 (%) 𝑭𝑖 𝑺𝒊 𝒈𝑖 % 𝑮𝒊 %


[600; 1200[ 15 900 30 30 13500 19.15 19.15
[1200;1800[ 25 1500 50 80 37500 53.19 72.34
[1800;2100[ 10 1950 20 100 19500 27.66 100
Total 50 - 100 - 70500 100 -

3/23/2022 STATISTIQUE DESCRIPTIVE 138


Les caractéristiques de concentration

3/23/2022 STATISTIQUE DESCRIPTIVE 139


Les caractéristiques de concentration

3/23/2022 STATISTIQUE DESCRIPTIVE 140


Les caractéristiques de concentration

3/23/2022 STATISTIQUE DESCRIPTIVE 141


Les caractéristiques de concentration

3/23/2022 STATISTIQUE DESCRIPTIVE 142


PARTIE 2
SÉRIES STATISTIQUES DOUBLES

CHAPITRE 1 :
la liaison entre deux variables:
Régression, Ajustement et corrélation.
Plan

3/23/2022 STATISTIQUE DESCRIPTIVE 144


Introduction
• Souvent on s’intéresse à l’étude d’un phénomène à travers plusieurs
variables qui l’influencent simultanément

• En particulier soient deux variables statistiques 𝑥 et 𝑦. Pour chaque


unité 𝑖 on observe des valeurs : 𝑥𝑖 et 𝑦𝑖 ; la série bivariée est :
{(𝑥𝑖 , 𝑦𝑖 ), 𝑖 = 1, . . . , 𝑛}
• Comment organiser les données d’une grande taille dans un
tableau? Existe t’il une relation entre les deux variables 𝑥 et 𝑦?

• Si oui, comment peut on mesurer son intensité? son sens?

• Peut on la formuler sous forme d’une relation explicite (fonction,


modèle)?
3/23/2022 STATISTIQUE DESCRIPTIVE 145
Introduction
Exemple 1 Le manager d’un magasin s’intéresse à la relation qui
pourrait exister entre le nombre des spots publicitaires diffusés au
cours du week-end et les ventes effectuées la semaine suivante. Il
observe les données de dix semaines

3/23/2022 STATISTIQUE DESCRIPTIVE 146


Introduction
Exemple 1 (suite)
Pour schématiser cette relation on représente les points P1 = (2, 50),
P2 = (5, 57), . . . , P10 = (2, 46), le graphe ainsi obtenu est dit
nuage de points

3/23/2022 STATISTIQUE DESCRIPTIVE 147


Covariance
Définition de la covariance

Afin de mesurer l’intensité de la dépendance (liaison) entre deux


variables 𝑥 et 𝑦 ainsi que son sens (positive ou négative), on définit la
covariance de 𝑥 et 𝑦

3/23/2022 STATISTIQUE DESCRIPTIVE 148


Covariance
Définition de la covariance (suite)

3/23/2022 STATISTIQUE DESCRIPTIVE 149


Covariance
Propriétés

3/23/2022 STATISTIQUE DESCRIPTIVE 150


Covariance
Exemple 1 (suite)

3/23/2022 STATISTIQUE DESCRIPTIVE 151


coefficient de corrélation

Définition du coefficient de corrélation


on définit un coefficient dit le coefficient de corrélation de Bravais-
Pearson ; ce coefficient mesure l’intensité de la «dépendance linéaire»
entre deux variables

3/23/2022 STATISTIQUE DESCRIPTIVE 152


coefficient de corrélation

Définition du coefficient de corrélation (suite)


▪ r ≈ 1 quand tous les points observées sont situées à proximité d’une
même droite de pente positive : on parle d’une forte corrélation positive

▪ r ≈ −1 quand tous les points observés sont situés à proximité d’une


même droite de pente négative : forte corrélation négative

▪ r ≈ 0 quand le nuage de points est allongé parallèlement à l’un des


axes de coordonnées: faible corrélation

3/23/2022 STATISTIQUE DESCRIPTIVE 153


coefficient de corrélation

3/23/2022 STATISTIQUE DESCRIPTIVE 154


coefficient de corrélation

3/23/2022 STATISTIQUE DESCRIPTIVE 155


coefficient de corrélation

3/23/2022 STATISTIQUE DESCRIPTIVE 156


coefficient de corrélation

3/23/2022 STATISTIQUE DESCRIPTIVE 157


coefficient de corrélation

3/23/2022 STATISTIQUE DESCRIPTIVE 158


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 159


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 160


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 161


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 162


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 163


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 164


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 165


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 166


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 167


Ajustement linéaire simple

3/23/2022 STATISTIQUE DESCRIPTIVE 168


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 169


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 170


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 171


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 172


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 173


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 174


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 175


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 176


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 177


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 178


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 179


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 180


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 181


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 182


Tableau de contingence

3/23/2022 STATISTIQUE DESCRIPTIVE 183

Vous aimerez peut-être aussi