Académique Documents
Professionnel Documents
Culture Documents
PAMBOU
CHAPITRE 1
CONCEPTS FONDAMENTAUX
INTRODUCTION
La statistique est une science qui a pour objet de recueillir des données relatives à tel ou tel
phénomène en vue de les analyser, les commenter ou de les critiquer.
Le terme statistique vient du latin, statisticus qui signifie relatif à l’Etat (status) et peut être employé
sous trois formes différentes :
- dans un sens plus général, la statistique, pour évoquer l’ensemble des méthodes scientifiques
basées sur la collecte, l’organisation et le traitement des données en vue d’établir des lois ;
- dans un sens plus restreint, les statistiques, le terme statistique est employé au pluriel pour
évoquer un ensemble des faits chiffrés (les données récoltées) ; par exemple les statistiques de la
Banque Centrale sur la masse monétaire du Sénégal de 1994 à 2012 ;
- employé au singulier avec l’article indéfini, une statistique, le terme désigne un résultat
obtenu à partir des données récoltées, ou une formule mathématique qui permet de transformer un
ensemble des données récoltées en une ou plusieurs valeurs numériques. Exemple : la moyenne, la
variance, l’écart-type, la covariance
I. TERMINOLOGIE
1. Population – Individu
1.1. Population
La population est l’ensemble dans lequel l’on récolte les données étudiées.
La population doit être définie avec précision, c’est-à-dire qu’il sera toujours possible de savoir si
un élément appartient ou non à cette population.
1
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
Exemple :
- Si l’on veut étudier le chiffre d’affaires mensuel réalisé par les entreprises de la Zone Franche
Industrielle de Dakar, la population est l’ensemble de toutes les entreprises de la zone franche
industrielle de Dakar ;
- Si l’on veut étudier le montant des factures payées par l’entreprise GERTY au cours de l’année
2019, la population est l’ensemble de toutes les factures de cette entreprise.
- Si l’on veut étudier le nombre d’absences au poste de travail des salariés de l’entreprise
GERTTY, la population est l’ensemble de tous les salariés de cette entreprise.
- Si l’on veut étudier la marque des téléphones des étudiants de la classe, la population est
l’ensemble de tous les étudiants de la classe.
1.2. Individu
Aussi appelé une unité statistique, un individu est tout élément de la population étudiée.
En statistique, le terme individu désigne aussi bien une personne qu’un objet (concret ou abstrait).
2. Caractères et modalités
2.1. Caractères
Un caractère, appelé aussi variable, est tout critère ou aspect particulier commun aux individus
étudiés auquel on s’intéresse.
Exemples
i) Le chiffre d’affaires, le bénéfice, le statut juridique, le secteur d’activités, le nombre de
salariés d’un ensemble d’entreprises
ii) Le nombre d’enfants, l’âge, le sexe, la taille, la nationalité, ethnie, le sexe, l’ethnie, la
nationalité, l’âge, la religion, l’état matrimonial, le nombre d’absences aux cours d’un
groupe de salariés.
2.2. Modalités
On appelle modalités d’un caractère les différentes valeurs que peut prendre ce caractère sur
l’ensemble des individus étudiés.
Remarque
i) Les modalités d’un caractère doivent être exhaustives (au complet) et disjointes (c’est-à-
dire qu’à chaque individu étudié on lui associe une modalité et une seule du caractère
observé).
ii) Lorsqu’on n’est pas sûr de couvrir toutes les modalités possibles pour un caractère qualitatif
donné, il faut prendre soin d’ajouter une rubrique supplémentaire « Autres » afin d’assurer
l’exhaustivité des modalités.
2
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
Exemples
i) Pour le caractère état matrimonial, on retient 4 modalités : marié, veuf, célibataire,
divorcé ;
ii) Pour le caractère ethnie des étudiants de la classe, on peut avoir : « Sérère, Diola, Wolof,
Toucouleur, Peulh, « Autre ».
iii) Pour le caractère « nombre d’enfants » on peut avoir 0, 1, 2, 3, 4, 5, …
iv) Le caractère « chiffre d’affaires » exprimé en million de francs, on peut avoir [0, 5[, [5,
10[, [10, 20[, …
Selon la nature des modalités on distingue deux types de caractères : les caractères qualitatifs et les
caractères quantitatifs.
Parmi les caractères quantitatifs certains peuvent être discrets (c’est-à-dire ces caractères ne prennent
que des valeurs isolées, en général, des valeurs entières) comme le nombre d’enfants d’un salarié ; et
d’autres peuvent être continus (c’est-à-dire si pour ce caractère toutes les valeurs d’un intervalle de ℝ
sont acceptables) comme le chiffre d’affaires d’une entreprise, âge d’un salarié, le salaire d’un employé,
la taille du disque dur, ….
Caractères observés
Individus 𝑿𝟏 … 𝑿𝒋 … 𝑿𝒑
𝟏 𝑥11 … 𝑥1𝑗 … 𝑥1𝑝
… … … … … …
𝒊 𝑥𝑖1 … 𝑥𝑖𝑗 … 𝑥𝑖𝑝
… … … … … …
𝑵 𝑥𝑁1 … 𝒙𝑵𝒋 … 𝑥𝑁𝑝
- 𝑁 est le nombre d’individus étudiés
- 𝑝 est le nombre de caractères observés.
- 𝑥𝑖𝑗 est la valeur prise par l’individu 𝜔𝑖 pour le caractère 𝑋𝑗 ;
Exemple
Statut
N° Sexe Age Niveau d'études Statut Résident Nbef Chômage Salaire
matrimoniale.
1 Féminin 27 Marié Licence Logée 3 Assez inquiète 645
2 Masculin 32 Marié CEP Locataire 5 Beaucoup 253
3 Masculin 21 Célibataire Master Accédant 5 Un peu 828
4 Féminin 42 Marié BEPC Accédant 5 Très inquiet 310
5 Masculin 29 Marié CEP Accédant 4 Beaucoup 190
6 Féminin 35 Célibataire Licence Locataire 1 Un peu 520
7 Masculin 62 Marié Master Propriétaire 2 Pas du tout 750
8 Masculin 61 Marié Licence Propriétaire 2 Pas du tout 828
9 Féminin 32 Séparée Licence Accédant 4 Beaucoup 458
10 Masculin 34 Célibataire Master Logé gratuit 5 Assez inquiet 1542
2. Tableaux à effectifs
Pour un seul caractère observé X, on peut résumer le tableau des données brutes en utilisant la
distribution en fréquences absolues (couramment appelées effectifs et notées 𝑛𝑖 ) ou fréquences relatives
(couramment appelées fréquences et notées 𝑓𝑖 ).
Ainsi
- 𝑛𝑖 est l’effectif de la modalité 𝑀𝑖 , c’est-à-dire le nombre d’individus ayant la modalité 𝑀𝑖 du
caractère observé X:
𝑛𝑖 = 𝑁𝑏(𝑋 = 𝑀𝑖 )
4
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
Soit X une variable ayant k modalités. La forme générale d’un tableau à effectifs représentant la
distribution de X est la suivante :
Remarque On a toujours :
𝑘 𝑘
𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = ∑ 𝑛𝑖 = 𝑁 𝑒𝑡 𝑓1 + 𝑓2 + ⋯ +𝑓𝑘 = ∑ 𝑓𝑖 = 1
𝑖=1 𝑖=1
Exemple : Le tableau suivant donne la répartition des employés de l’entreprise GERTY selon leur
statut matrimonial :
Soit 𝑋 un caractère quantitatif discret observé sur une population de taille 𝑁 et dont les valeurs
observées sont 𝑥1 < 𝑥2 < ⋯ < 𝑥𝑖 < ⋯ < 𝑥𝑘 dans cet ordre.
On définit :
- 𝐹𝑖 est la Fréquence Cumulée Croissante de la valeur 𝑥𝑖 : elle représente la proportion ou le
pourcentage d’individus étudiés dont la valeur du caractère observé est strictement inférieure à 𝑥𝑖 :
𝐹𝐶𝐶(𝑥𝑖 ) = 𝐹𝑖 = %(𝑋 < 𝑥𝑖 )
5
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
𝐹𝑖 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖−1
Remarque :
On définit de la même manière les effectifs cumulés en remplaçant dans les formules précédentes les
fréquences relatives partielles (𝑓𝑖 ) par les effectifs partiels (𝑛𝑖 ) :
- 𝑁𝑖↑ Effectif Cumulé Croissant de la valeur 𝑥𝑖 : représente le nombre d’individus étudiés dont
la valeur du caractère observé est strictement inférieure à 𝑥𝑖 :
𝑁𝑖↑ = 𝑁𝑏(𝑋 < 𝑥𝑖 )
𝑁𝑖↑ = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑖−1
- 𝑁𝑖↓ Effectif Cumulé Décroissant de la valeur 𝑥𝑖 représente le nombre d’individus étudiés dont
la valeur du caractère observé est supérieure ou égale à 𝑥𝑖 :
𝑁𝑖↓ = 𝑁𝑏(𝑋 ≥ 𝑥𝑖 )
𝑁𝑖↑ + 𝑁𝑖↓ = 𝑁
6
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
Exercice d’application
Le tableau suivant donne la répartition des salariés de l’entreprise GERTY selon leur nombre
d’enfants :
2) Quel est le caractère observé ? Quelles sont ses modalités ? Indiquer sa nature.
3) Compléter le tableau statistique en faisant figurer les effectifs cumulés et les fréquences
relatives cumulées.
Corrigé
2) Quel est le caractère observé ? Quelles sont ses modalités ? Indiquer sa nature.
Modalités : 0, 1, …, 6 et 7.
7
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
3) Compléter le tableau statistique en faisant figurer les effectifs cumulés et les fréquences
relatives cumulées.
𝒙𝒊 𝒏𝒊 𝑵𝒊↑ 𝑵𝒊↓ 𝒇𝒊 en % 𝑭𝒊 en % 𝑮𝒊 en %
0 8 0 250 0,032 0 1
1 32 8 242 0,128 0,032 0,968
2 46 40 210 0,184 0,16 0,84
3 52 86 164 0,208 0,344 0,656
4 45 138 112 0,18 0,552 0,448
5 37 183 67 0,148 0,732 0,268
6 24 220 30 0,096 0,88 0,12
7 6 244 6 0,024 0,976 0,024
≥8 0 250 0 0 1 0
Total 250 1
𝑵𝒃(𝑿 = 𝒙𝒊 ) 𝑵𝒃(𝑿 < 𝒙𝒊 ) 𝑵𝒃(𝑿 ≥ 𝒙𝒊 ) %(𝑿 = 𝒙𝒊 ) %(𝑿 < 𝒙𝒊 ) %(𝑿 ≥ 𝒙𝒊 )
50
40
30
20
10
0
0 1 2 3 4 5 6 7 8
8
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
Pour un caractère quantitatif continu, il est possible que la variable prenne n’importe quelles valeurs
dans un intervalle donné. On présente alors les valeurs observées dans des intervalles disjoints de la
forme [𝑏𝑖 , 𝑏𝑖+1 [ appelés classes.
Dans cette classe la valeur de la borne supérieure sera comptabilisée dans la classe suivante.
On note :
- 𝑛𝑖 : effectif de la classe [𝑏𝑖 , 𝑏𝑖+1 [ , soit 𝑛𝑖 = 𝑁𝑏(𝑋 ∈ [𝑏𝑖 , 𝑏𝑖+1 [ )
- 𝑓𝑖 : fréquence de la classe [𝑏𝑖 , 𝑏𝑖+1 [ , soit 𝑓𝑖 = %(𝑋 ∈ [𝑏𝑖 , 𝑏𝑖+1 [ )
- 𝐹𝑖 = 𝐹𝐶𝐶(𝑋 ∈ [𝒃𝒊 , 𝑏𝑖+1 [ ) = %(𝑋 < 𝒃𝒊 ) - 𝑁𝑖↑ = 𝐸𝐶𝐶(𝑋 ∈ [𝒃𝒊 , 𝑏𝑖+1 [ ) = 𝑁𝑏(𝑋 < 𝒃𝒊 )
On définit :
- 𝑁𝑖↑ est l’Effectif Cumulé Croissant de la valeur 𝑥𝑖 du caractère observé ; il est égal au nombre
d’individus étudiés dont la valeur du caractère observé est strictement inférieure à 𝑥𝑖 :
𝑁𝑖 = 𝑁𝑏(𝑋 < 𝑏𝑖 ) = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑖−1
- 𝑁𝑖↓ est l’Effectif Cumulé Décroissant de la valeur 𝑥𝑖 du caractère observé ; il est égal au nombre
d’individus étudiés dont la valeur du caractère observé est supérieure ou égale à 𝑥𝑖 :
𝑁𝑖↓ = 𝑁𝑏(𝑋 ≥ 𝑥𝑖 ) = 𝑛𝑖 + 𝑛𝑖+1 + ⋯ + 𝑛𝑘 = 𝑁 − (𝑛1 + 𝑛2 + ⋯ + 𝑛𝑖−1 )
- 𝐹𝑖 est la fréquence Cumulée Croissante de la valeur 𝑥𝑖 du caractère observé ; elle est égale à la
proportion ou au pourcentage d’individus étudiés dont la valeur du caractère observé est
strictement inférieure à 𝑥𝑖 : 𝐹𝑖 = %(𝑋 < 𝑏𝑖 )
- 𝐺𝑖 est la Fréquence Cumulée Décroissante de la valeur 𝑥𝑖 du caractère observé ; elle est égale à
la proportion ou au pourcentage d’individus étudiés dont la valeur du caractère observé est
supérieure ou égale à 𝑥𝑖 :𝐺𝑖 = %(𝑋 ≥ 𝑏𝑖 )
9
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
Exercice d’application 2
Le tableau suivant donne la répartition des employés de l’entreprise GERTY selon leur salaire
mensuel (exprimé en dizaines de milliers de francs) :
Salaire X [10, 20[ [20, 30[ [30, 40[ [40, 60[ [60, 80[ [80, 120[ [120, 150[
Effectif 𝑛𝑖 8 15 36 48 37 64 42
Les données statistiques se présentent avant tout traitement sous forme désordonnée. Après une mise en
ordre et la présentation de ces données sous forme des tableaux, les représentations graphiques
permettent de visualiser la distribution. La représentation graphique dépend de la nature du caractère
examiné.
Soit X une variable discrète dont les valeurs observées sont 𝑥1 < 𝑥2 < … < 𝑥𝑘 dans cet ordre. Soient
𝑛1 , 𝑛2 , … , 𝑛𝑘 les effectifs correspondants à chacune de ces valeurs.
Pour représenter la variable discrète X, on peut envisager le diagramme différentiel (ou diagramme en
bâtons), le polygone des fréquences ou le diagramme cumulatif.
10
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
Chaque valeur observée (𝑥𝑖 ) est représentée par un bâton vertical dont la hauteur est
proportionnelle à sa fréquence. Polygone des fréquences
Après avoir construit le diagramme en bâtons on relie les sommets des bâtons par des segments de
droite. La ligne polygonale obtenue est appelée « polygone des fréquences ».
Le polygone des fréquences permet de visualiser l’évolution de la série.
C’est une courbe en escaliers représentant la fonction F des fréquences cumulées croissantes définie
par :
0 𝑠𝑖 𝑥 ∈ ]−∞ , 𝑥1 ]
𝑓1 𝑠𝑖 𝑥 ∈ ] 𝑥1 , 𝑥2 ]
𝑓1 + 𝑓2 𝑠𝑖 𝑥 ∈ ] 𝑥2 , 𝑥3 ]
𝐹(𝑥) = ⋮ ⋮
𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖−1 𝑠𝑖 𝑥 ∈ ] 𝑥𝑖−1 , 𝑥𝑖 ]
⋮ ⋮
{ 1 𝑠𝑖 𝑥 ∈ ] 𝑥𝑘 , +∞ [
3.1.Histogramme
Attention ! Avant de construire un histogramme il faut veiller sur les amplitudes des classes. Deux cas
sont possibles :
A chaque classe, on associe un rectangle dont la hauteur est proportionnelle à la fréquence (𝑛𝑖 𝑜𝑢 𝑓𝑖 ) de
la classe correspondante.
A chaque classe, on associe un rectangle dont la hauteur est proportionnelle à la densité (𝑑𝑖 ) ou à
l’effectif corrigé (ℎ𝑖 ) de la classe correspondante.
11
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU
Après avoir construit l’histogramme, on relie les milieux des segments supérieurs des rectangles par des
segments de droite. Pour refermer le polygone sur l’axe des abscisses on ajoute une classe avant et une
classe après l’histogramme ; les deux classes étant de même amplitude et d’effectif nul.
- La Courbe cumulative croissante représentant la fonction F des FCC (ou ECC) passant par
les points d’abscisse 𝑏𝑖 et d’ordonnée 𝐹(𝑏𝑖 ).
- La courbe cumulative décroissante représentant la fonction G des FCD (ou ECD) passant par
les points d’abscisse 𝑏𝑖 et d’ordonnée 𝐺(𝑏𝑖 ).
12