Académique Documents
Professionnel Documents
Culture Documents
2021/2022
Plan du cours
Chapitre préliminaire : Définition et éléments du vocabulaire
Partie 1: Séries statistiques simples
Chapitre 1: Tableaux statistiques et Représentations graphiques
Chapitre 2: Caractéristiques de tendance centrale
Chapitre 3: Caractéristiques de dispersion
Chapitre 3: Caractéristiques de forme
Chapitre 4: Caractéristiques de concentration
Partie 2: Séries statistiques doubles
Chapitre 1: la liaison entre deux variables: Régression, Ajustement et corrélation.
Partie 3: Les indices.
Partie 4: Les séries chronologiques
3/23/2022 STATISTIQUE DESCRIPTIVE 2
INTRODUCTION
▪ Démarche de la statistique;
▪ Vocabulaire de la statistique.
Exemples:
▪ Population
▪ Échantillon
▪ Caractère ou variable statistique
▪ Modalité
▪ Série statistique
▪ Fréquences absolues, relatives, cumulées
▪ Distribution statistique
Par exemple,
la variable « sexe » comporte deux modalités (masculin, féminin);
la variable « état matrimonial » comporte quatre modalités
(célibataire, marié, divorcé et veuf);
la variable âge comporte plusieurs valeurs (1,2,3, … , 99, …).
Une population peut être étudiée selon une seule variable : on parle
alors de série simple (partie I).
𝑛𝑖
𝑓𝑖 =
𝑛
𝑁𝑖 = 𝑛𝑘
𝑘=1
On définit la fréquence cumulée relative :
𝑖
𝐹𝑖 = 𝑓𝑘
𝑘=1
CHAPITRE 1 :
Tableaux statistiques et représentations
graphiques
TABLEAUX STATISTIQUES
Exemple Introductif : Supposons que l'on ait fait une enquête auprès
de 20 femmes selon 9 caractères : Prénom, nom, jour de naissance,
mois de naissance, années de naissance, nombre d'enfants, revenu
annuel du ménage, ville natale, opinion sur la qualité d'un produit
alimentaire pour bébé.
Ces données ont été reportées sur un bordereau, sous forme d'une
matrice de 20 éléments qui comprennent chacun les 9 données
concernant une femme.
3/23/2022 STATISTIQUE DESCRIPTIVE 26
I. TABLEAUX STATISTIQUES
Interprétation :
✓Il y a 𝐹2 =75% des femmes
touchent au plus 𝑒2 = 70 m€ .
([𝑒1 , 𝑒2[)
✓Il y a 𝐹3 =25% des femmes
touchent au moins 𝑒2 = 70 m€
. ([𝑒2 , 𝑒3[)
L’égalité devient:
α𝑖 = 360.𝑓𝑖 ; i=1,...,k
Propriété de 𝑭:
• La fonction 𝐹 est définie sur ℝ et à valeurs dans [0,1].
• 𝐹(𝑥) = 0 si 𝑥 < 𝑥1
• 𝐹(𝑥) = 1 si 𝑥 ≥ 𝑥𝑘
• 𝐹(−∞) = 0 et 𝐹(+∞) = 1
• 𝐹 est constante sur chaque intervalle séparant deux modalités
consécutives .
3/23/2022 STATISTIQUE DESCRIPTIVE 40
II. REPRESENTATIONS GRAPHIQUES
Remarque : On obtient la courbe cumulative des effectifs en remplaçant
les 𝐹𝑖 par les 𝑁𝑖
• Pour notre exemple, on a :
Les caractéristiques de
tendance centrale
Les caractéristiques de tendance centrale
La tendance centrale se propose de synthétiser l’ensemble d’une série
statistique en faisant ressortir une position centrale de la valeur du
caractère étudié.
Dans ce chapitre, on analysera trois de ces paramètres qui sont : les
moyennes, le mode et la médiane.
1. Le mode
Définition : Le mode, noté 𝑀0 , d’une série statistique est la valeur de
cette série, dont l’effectif (ou la fréquence) est maximal(e).
➢C’est le plus simple mais le moins utilisé !
3/23/2022 STATISTIQUE DESCRIPTIVE 51
Les caractéristiques de tendance centrale
Détermination du mode
a. Cas d'une v.s.d.
Dans le cas d'une v.s.d. la détermination du mode est immédiate à
partir du tableau statistique ou du diagramme en bâtons.
Exemples : Ci-dessous on donne trois diagrammes en bâtons associés
respectivement, à une distribution unimodale, et à une distribution
bimodale , et à une distribution qui a un intervalle modal.
Les caractéristiques de tendance centrale
Exemple 1 : On reprend l’exemple des 20 femmes selon le nb
d’enfants
Procédure à suivre
▪ S'il existe une modalité 𝑥𝑖 pour laquelle 𝐹𝑖 = 0,5, dans ce cas on
parle d’un intervalle médian : [𝑥𝑖 , 𝑥𝑖+1 ].
𝑥ҧ = 𝑓𝑖 𝑥𝑖 = 55,125
𝑖=1
Propriété :
Soit 𝑋 une variable statistique de moyenne arithmétique 𝑥ҧ . Si 𝑌 est une
variable statistique telle que 𝑌 = 𝑎𝑋 + 𝑏, où 𝑎 et 𝑏 sont des réels
quelconques, alors la moyenne arithmétique de 𝑌 est :
𝑦ത = 𝑎 𝑥ҧ + 𝑏
Démonstration :
𝒇𝒊 𝒙𝒊 − ഥ
𝒙 =𝟎
𝒊=𝟏
Propriété de l’agrégation
Soit une population 𝑃 de taille 𝑛, composée de m sous populations 𝑃1 ,
𝑃2 ,..., 𝑃𝑚 ; de tailles respectives 𝑛1 , 𝑛2 ,..., 𝑛𝑚 et de moyennes
respectives 𝑥ҧ1 , 𝑥ҧ2 ,..., 𝑥ҧ𝑚 . Alors la moyenne arithmétique de la
population 𝑃 est donnée par :
1 𝑚
𝑥ҧ = 𝑛𝑖 𝑥ҧ𝑖
𝑛 𝑖=1
3/23/2022 STATISTIQUE DESCRIPTIVE 69
Les caractéristiques de tendance centrale
Exemple : Le salaire moyen des cadres dans l’entreprise 𝐸 est de
4000 DH. Le salaire moyen des cadres masculins est de 4200 DH. Le
salaire moyen des cadres féminins est de 3000 DH.
Quelle est la répartition hommes - femmes des cadres ?
➢ Soit 𝑥ҧ le salaire moyen global dans 𝐸, 𝑥ҧ1 celui des hommes et
𝑥ҧ2 celui des femmes. On a 𝑥ҧ = 𝑓1 𝑥ҧ1 + 𝑓2 𝑥ҧ2
➢ On aboutit alors au système :
𝑓1 + 𝑓2 = 1 𝑓1 + 𝑓2 = 1
ቊ ቊ
𝑓1 𝑥ҧ1 + 𝑓2 𝑥ҧ2 = 𝑥ҧ 4200𝑓1 + 3000𝑓2 = 4000
⇒ 𝑓1 =83,3% et 𝑓2 =16,7%
3/23/2022 STATISTIQUE DESCRIPTIVE 70
Les caractéristiques de tendance centrale
b. La moyenne géométrique
Définition : On appelle moyenne géométrique de la distribution
𝑥𝑖 , 𝑛𝑖 1≤𝑖≤𝑘 que l’on note 𝐺, la racine 𝑛ème du produit des 𝑥𝑖 𝑛𝑖
Où 𝑛 = σ𝑘𝑖=1 𝑛𝑖
Domaines d’application :
• On utilise la moyenne géométrique dans le calcul du taux
d’accroissement moyen et dans le calcul de certains indices
statistique.
3/23/2022 STATISTIQUE DESCRIPTIVE 71
Les caractéristiques de tendance centrale
➢ C’est plus pratique d’utiliser le logarithme
D'où
3/23/2022 STATISTIQUE DESCRIPTIVE 73
Les caractéristiques de tendance centrale
c. La moyenne harmonique
Domaines d’application :
On utilise cette moyenne dans le calcul des durées moyennes, dans le
calcul des moyennes de rapports et de pourcentages et dans les études
du pouvoir d’achat.
3/23/2022 STATISTIQUE DESCRIPTIVE 74
Les caractéristiques de tendance centrale
Exemple :calculons la moyenne harmonique de 2 , 12 , 2 , 50 :
d. La moyenne quadratique
Définition et propriété : La moyenne quadratique, notée 𝑄 , d’une
distribution 𝑥𝑖 , 𝑛𝑖 1≤𝑖≤𝑘 est la racine carrée de la moyenne
arithmétique de la distribution 𝑥𝑖2 , 𝑛𝑖 1≤𝑖≤𝑘
Résultat comparatif
Pour une même série statistique, on montre que les quatre moyennes
vérifient toujours l’ordre suivant : 𝐻 < 𝐺 < 𝑥ҧ < 𝑄
3/23/2022 STATISTIQUE DESCRIPTIVE 76
Les caractéristiques de tendance centrale
Comparaison entre les paramètres de tendance centrale
Les caractéristiques de
dispersion
Les caractéristiques de dispersion
On appelle dispersion statistique la tendance qu’ont les valeurs de la
distribution d’un caractère à s’étaler et à se disperser d’une valeur
centrale.
Les indicateurs de dispersion sont nombreux, les plus courants sont:
L’étendue, l’écart interquartile, la variance, l’écart-type et le cœfficient
de variation.
1. L’étendue
a. Variable quantitative discrète
L’étendue mesure l’écart entre la plus petite valeur de la variable et
la plus grande : e = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
où 𝑥𝑚𝑖𝑛 (resp. 𝑥𝑚𝑎𝑥 ) est la valeur minimale (resp. maximale ) prises
par la variable
3/23/2022 STATISTIQUE DESCRIPTIVE 81
Les caractéristiques de dispersion
Exemple: Soit la série statistique suivante
(𝑎) 20, 22, 21, 20, 20, 19, 18, 20, 20
𝐸𝑡𝑒𝑛𝑑𝑢𝑒 𝑎 = 22 − 18 = 4
b. Variable quantitative continue
Dans ce cas l’étendue est la différence entre la borne supérieure de
la dernière classe et la borne inférieure de la première classe.
e = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
où 𝑥𝑚𝑖𝑛 (resp. 𝑥𝑚𝑎𝑥 ) est la borne inférieure (resp. supérieure) de la
première (resp. dernière) classe.
On a N = 30
On a 𝑁 = 33
Diagramme en boîte
Ce diagramme est aussi appelé boîte à moustaches. Il utilise la valeur
du 1er quartile 𝑄1 , la valeur du 2ème quartile 𝑄2, la valeur du 3ème
quartile 𝑄3 , l’écart interquartile 𝑅(𝑄) et les valeurs minimum et
maximum de la série.
On représente sur un axe gradué (horizontal ou vertical) les
différentes valeurs de la série 𝑄1 , 𝑄2 , 𝑄3 , 𝑥𝑚𝑖𝑛 , 𝑥𝑚𝑎𝑥 ainsi
que 𝑄1 − 1.5 × 𝑅(𝑄) 𝑒𝑡 𝑄3 + 1.5 × 𝑅(𝑄).
3. La variance et l’écart-type
La variance est un résumé statistique qui mesure la concentration ou
la dispersion des observations autour de la moyenne.
L’écart-type permet d’avoir une idée de la façon dont les valeurs de
la série s’écartent par rapport à la moyenne, c’est donc une mesure
de dispersion.
Un écart-type faible correspond à une série concentrée autour de la
moyenne.
on a 𝑁 = 31 et 𝑥ҧ = 32.58
Relation de König :
Relation de König :
3/23/2022 STATISTIQUE DESCRIPTIVE 102
Les caractéristiques de dispersion
4. Cœfficient de variation
Le cœfficient de variation, qui est un nombre sans dimension, permet
comparer des dispersions de distributions statistiques hétérogènes.
Il s’écrit
Pour 𝑟 = 0, 𝑚0 = 1.
Pour 𝑟 = 1, 𝑚1 = 𝑥ҧ la moyenne arithmétique.
Définition 2: Le moment centré d’ordre 𝑟 d’une variable est la
quantité
Pour 𝑟 = 0, 𝜇0 = 1.
Pour 𝑟 = 1, 𝜇1 = 0.
Pour 𝑟 = 2, 𝜇2 = 𝑉(𝑥) la variance.
3/23/2022 STATISTIQUE DESCRIPTIVE 105
Les caractéristiques de dispersion
Changement d’origine et d’unité
Définition: On appelle changement d’origine l’opération consistant à
ajouter la même quantité 𝑏 ∈ 𝐼𝑅 à toutes les observations:
𝑦𝑖 = 𝑥𝑖 + 𝑏, 𝑖 = 1,· · · , 𝑛.
On appelle changement d’unité l’opération consistant à multiplier
par la même quantité 𝑎 ∈ 𝐼𝑅 toutes les observations :
𝑦𝑖 = 𝑎 × 𝑥𝑖 , 𝑖 = 1,· · · , 𝑛.
On appelle changement d’origine et d’unité l’opération consistant à
multiplier toutes les observations par la même quantité 𝑎 ∈ 𝐼𝑅 puis
à ajouter la même quantité 𝑏 ∈ 𝐼𝑅 à toutes les observations :
𝑦𝑖 = 𝑎 × 𝑥𝑖 + 𝑏, 𝑖 = 1,· · · , 𝑛.
3/23/2022 STATISTIQUE DESCRIPTIVE 106
Les caractéristiques de dispersion
Théorème: Si on effectue un changement d’origine et d’unité sur une
variable X, alors
Remarque :
• Les paramètres de position (mode, médiane et moyenne) sont tous
affectés par un changement d’origine et d’unité.
• Les paramètres de dispersion sont tous affectés par un changement
d’unité mais pas par un changement d’origine (sauf le coefficient de
variation).
3/23/2022 STATISTIQUE DESCRIPTIVE 108
Chapitre 4
Les caractéristiques de
forme
Les caractéristiques de forme
1. Symétrie et asymétrie
Une distribution est dite symétrique si le mode, la médiane et la
moyenne sont confondus. Une distribution qui n’est pas symétrique est
dite asymétrique.
Remarque : Une variable statistique est symétrique si ses valeurs sont
réparties de manière symétrique autour de la moyenne c’est à dire si le
polygone des fréquences a la forme d’une cloche comme dans la figure
ci-après.
Les caractéristiques de
concentration
Les caractéristiques de concentration
• Corrado Gini est le statisticien derrière La notion de concentration.
Ce statisticien italien a introduit cette notion notamment à propos
des distributions de salaires et de revenus.
❑ L'indice de Gini.
❑ La médiale
𝑆 = σ𝑘𝑖=1 𝑆𝑖 = σ𝑘𝑖=1 𝑛𝑖 𝑐𝑖
3/23/2022 STATISTIQUE DESCRIPTIVE 126
Les caractéristiques de concentration
[600;1200[ 15 900 30 30
[1200;1800[ 25 1500 50 80
[1800;2100[ 10 1950 20 100
Total 50 - 100 -
Calculer la masse salariale globale, ainsi que les masse relatives et les
masses relatives cumulées croissantes.
3/23/2022 STATISTIQUE DESCRIPTIVE 128
Les caractéristiques de concentration
CHAPITRE 1 :
la liaison entre deux variables:
Régression, Ajustement et corrélation.
Plan