Vous êtes sur la page 1sur 12

Chapitre 1 : Concepts fondamentaux Abdon Privat.

PAMBOU

CHAPITRE 1
CONCEPTS FONDAMENTAUX

INTRODUCTION

La statistique est une science qui a pour objet de recueillir des données relatives à tel ou tel
phénomène en vue de les analyser, les commenter ou de les critiquer.

Le terme statistique vient du latin, statisticus qui signifie relatif à l’Etat (status) et peut être employé
sous trois formes différentes :

- dans un sens plus général, la statistique, pour évoquer l’ensemble des méthodes scientifiques
basées sur la collecte, l’organisation et le traitement des données en vue d’établir des lois ;

- dans un sens plus restreint, les statistiques, le terme statistique est employé au pluriel pour
évoquer un ensemble des faits chiffrés (les données récoltées) ; par exemple les statistiques de la
Banque Centrale sur la masse monétaire du Sénégal de 1994 à 2012 ;

- employé au singulier avec l’article indéfini, une statistique, le terme désigne un résultat
obtenu à partir des données récoltées, ou une formule mathématique qui permet de transformer un
ensemble des données récoltées en une ou plusieurs valeurs numériques. Exemple : la moyenne, la
variance, l’écart-type, la covariance

En tant que méthode d’analyse, la statistique se compose de deux niveaux :

- La statistique descriptive : qui a pour but de synthétiser, de résumer et de structurer


l’information contenue dans les données récoltées grâce aux représentations de celles-ci sous forme
de tableaux, de graphiques ou d’indicateurs numériques.

- La statistique mathématique ou l’inférence statistique : aussi appelée induction statistique, elle


prend la suite à la statistique descriptive. Elle a pour but d’étendre les propriétés constatées sur
l’échantillon à la population-mère et de valider ou d’infirmer des hypothèses formulées a priori ou
après une phase exploratoire.

I. TERMINOLOGIE

Comme toute science, la statistique utilise un vocabulaire spécifique identique à celui de la


démographie.

1. Population – Individu
1.1. Population

La population est l’ensemble dans lequel l’on récolte les données étudiées.
La population doit être définie avec précision, c’est-à-dire qu’il sera toujours possible de savoir si
un élément appartient ou non à cette population.
1
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

Exemple :
- Si l’on veut étudier le chiffre d’affaires mensuel réalisé par les entreprises de la Zone Franche
Industrielle de Dakar, la population est l’ensemble de toutes les entreprises de la zone franche
industrielle de Dakar ;
- Si l’on veut étudier le montant des factures payées par l’entreprise GERTY au cours de l’année
2019, la population est l’ensemble de toutes les factures de cette entreprise.

- Si l’on veut étudier le nombre d’absences au poste de travail des salariés de l’entreprise
GERTTY, la population est l’ensemble de tous les salariés de cette entreprise.

- Si l’on veut étudier la marque des téléphones des étudiants de la classe, la population est
l’ensemble de tous les étudiants de la classe.

1.2. Individu

Aussi appelé une unité statistique, un individu est tout élément de la population étudiée.
En statistique, le terme individu désigne aussi bien une personne qu’un objet (concret ou abstrait).

Exemple : Un étudiant, une entreprise, un étudiant, une facture.

2. Caractères et modalités
2.1. Caractères

Un caractère, appelé aussi variable, est tout critère ou aspect particulier commun aux individus
étudiés auquel on s’intéresse.

Exemples
i) Le chiffre d’affaires, le bénéfice, le statut juridique, le secteur d’activités, le nombre de
salariés d’un ensemble d’entreprises
ii) Le nombre d’enfants, l’âge, le sexe, la taille, la nationalité, ethnie, le sexe, l’ethnie, la
nationalité, l’âge, la religion, l’état matrimonial, le nombre d’absences aux cours d’un
groupe de salariés.

2.2. Modalités
On appelle modalités d’un caractère les différentes valeurs que peut prendre ce caractère sur
l’ensemble des individus étudiés.

Remarque
i) Les modalités d’un caractère doivent être exhaustives (au complet) et disjointes (c’est-à-
dire qu’à chaque individu étudié on lui associe une modalité et une seule du caractère
observé).
ii) Lorsqu’on n’est pas sûr de couvrir toutes les modalités possibles pour un caractère qualitatif
donné, il faut prendre soin d’ajouter une rubrique supplémentaire « Autres » afin d’assurer
l’exhaustivité des modalités.

2
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

Exemples
i) Pour le caractère état matrimonial, on retient 4 modalités : marié, veuf, célibataire,
divorcé ;
ii) Pour le caractère ethnie des étudiants de la classe, on peut avoir : « Sérère, Diola, Wolof,
Toucouleur, Peulh, « Autre ».
iii) Pour le caractère « nombre d’enfants » on peut avoir 0, 1, 2, 3, 4, 5, …
iv) Le caractère « chiffre d’affaires » exprimé en million de francs, on peut avoir [0, 5[, [5,
10[, [10, 20[, …

II. LES DIFFERENTS TYPES DE CARACTERES

Selon la nature des modalités on distingue deux types de caractères : les caractères qualitatifs et les
caractères quantitatifs.

1. Les caractères qualitatifs


Ce sont des caractères qui ne sont pas mesurables. Ils s’expriment par l’appartenance à une catégorie.

Parmi les caractères qualitatifs certains peuvent être :


- nominaux (les modalités sont des catégories)
Exemples : le sexe ou la religion, l’état matrimonial…
et d’autres peuvent être
- ordinaux (c’est-à-dire que leurs modalités peuvent être hiérarchisées)
exemples : classement des étudiants par mention : Excellent, très bien, bien, assez bien, moyen, passable,
insuffisant, faible, très faible, médiocre.
En général, les variables ordinales sont des variables liées aux questions d’opinion.

2. Les caractères quantitatifs


Ce sont des caractères qui sont mesurables (c’est-à-dire qu’on peut mesurer ou compter).

Parmi les caractères quantitatifs certains peuvent être discrets (c’est-à-dire ces caractères ne prennent
que des valeurs isolées, en général, des valeurs entières) comme le nombre d’enfants d’un salarié ; et
d’autres peuvent être continus (c’est-à-dire si pour ce caractère toutes les valeurs d’un intervalle de ℝ
sont acceptables) comme le chiffre d’affaires d’une entreprise, âge d’un salarié, le salaire d’un employé,
la taille du disque dur, ….

III. PRESENTATION DES DONNEES

On considère une population Ω composée de 𝑁 individus sur lesquels on observe


𝑝 variables 𝑋1 , 𝑋2 , … , 𝑋𝑝 .
Les données récoltées sont présentées dans un tableau et, la forme du tableau peut varier selon la nature
de la question examinée.

1. Tableau des données brutes


A chaque individu 𝝎𝒊 de la population étudiée, on lui affecte une et une seule modalité 𝒙𝒊𝒋 du caractère
𝑋𝑗 qui lui convient.
3
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

Caractères observés
Individus 𝑿𝟏 … 𝑿𝒋 … 𝑿𝒑
𝟏 𝑥11 … 𝑥1𝑗 … 𝑥1𝑝
… … … … … …
𝒊 𝑥𝑖1 … 𝑥𝑖𝑗 … 𝑥𝑖𝑝
… … … … … …
𝑵 𝑥𝑁1 … 𝒙𝑵𝒋 … 𝑥𝑁𝑝
- 𝑁 est le nombre d’individus étudiés
- 𝑝 est le nombre de caractères observés.
- 𝑥𝑖𝑗 est la valeur prise par l’individu 𝜔𝑖 pour le caractère 𝑋𝑗 ;

Exemple

Statut
N° Sexe Age Niveau d'études Statut Résident Nbef Chômage Salaire
matrimoniale.
1 Féminin 27 Marié Licence Logée 3 Assez inquiète 645
2 Masculin 32 Marié CEP Locataire 5 Beaucoup 253
3 Masculin 21 Célibataire Master Accédant 5 Un peu 828
4 Féminin 42 Marié BEPC Accédant 5 Très inquiet 310
5 Masculin 29 Marié CEP Accédant 4 Beaucoup 190
6 Féminin 35 Célibataire Licence Locataire 1 Un peu 520
7 Masculin 62 Marié Master Propriétaire 2 Pas du tout 750
8 Masculin 61 Marié Licence Propriétaire 2 Pas du tout 828
9 Féminin 32 Séparée Licence Accédant 4 Beaucoup 458
10 Masculin 34 Célibataire Master Logé gratuit 5 Assez inquiet 1542

2. Tableaux à effectifs

Pour un seul caractère observé X, on peut résumer le tableau des données brutes en utilisant la
distribution en fréquences absolues (couramment appelées effectifs et notées 𝑛𝑖 ) ou fréquences relatives
(couramment appelées fréquences et notées 𝑓𝑖 ).
Ainsi
- 𝑛𝑖 est l’effectif de la modalité 𝑀𝑖 , c’est-à-dire le nombre d’individus ayant la modalité 𝑀𝑖 du
caractère observé X:
𝑛𝑖 = 𝑁𝑏(𝑋 = 𝑀𝑖 )

- 𝑓𝑖 est la fréquence relative de la modalité 𝑀𝑖 , c’est-à-dire la proportion ou le pourcentage


d’individus ayant la modalité 𝑀𝑖 du caractère observé
𝑛𝑖
𝑓𝑖 = %(𝑋 = 𝑀𝑖 ) = × 100
𝑁
où 𝑁 est l’effectif total de la population étudiée.

4
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

2.1. Forme générale

Soit X une variable ayant k modalités. La forme générale d’un tableau à effectifs représentant la
distribution de X est la suivante :

Caractère observé X Effectif Fréquence Pourcentage


Modalité 1 𝑛1 𝑛1 𝑛1
𝑓1 = × 100
𝑁 𝑁
⋮ ⋮ ⋮ ⋮
Modalité i 𝑛𝑖 𝑛𝑖 𝑛𝑖
𝑓𝑖 = × 100
𝑁 𝑁
⋮ … ⋮ ⋮
Modalité k 𝑛𝑘 𝑛𝑘 𝑛𝑘
𝑓𝑘 = × 100
𝑁 𝑁
Total 𝑵 1 100

Remarque On a toujours :
𝑘 𝑘

𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = ∑ 𝑛𝑖 = 𝑁 𝑒𝑡 𝑓1 + 𝑓2 + ⋯ +𝑓𝑘 = ∑ 𝑓𝑖 = 1
𝑖=1 𝑖=1

Exemple : Le tableau suivant donne la répartition des employés de l’entreprise GERTY selon leur
statut matrimonial :

Statut matrimonial Effectif 𝒏𝒊 Fréquence 𝒇𝒊 Pourcentage 𝒇𝒊 × 𝟏𝟎𝟎


Mariés 124 0,496 49,6
Divorcés 28 0,112 11,2
Veufs 8 0,032 3,2
Célibataires 90 0,36 3,6
Total 250 1 100

- Le caractère observé est : le statut matrimonial


- La population étudiée est l’ensemble des employés de l’entreprise GERTY
- La taille de la population est 𝑁 = 250 et le nombre de modalités est 𝑘 = 4

2.2. Tableau relatif à un caractère quantitatif discret

Soit 𝑋 un caractère quantitatif discret observé sur une population de taille 𝑁 et dont les valeurs
observées sont 𝑥1 < 𝑥2 < ⋯ < 𝑥𝑖 < ⋯ < 𝑥𝑘 dans cet ordre.
On définit :
- 𝐹𝑖 est la Fréquence Cumulée Croissante de la valeur 𝑥𝑖 : elle représente la proportion ou le
pourcentage d’individus étudiés dont la valeur du caractère observé est strictement inférieure à 𝑥𝑖 :
𝐹𝐶𝐶(𝑥𝑖 ) = 𝐹𝑖 = %(𝑋 < 𝑥𝑖 )

5
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

𝐹𝑖 = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖−1

- 𝐺𝑖 est la Fréquence Cumulée Décroissante de la valeur 𝑥𝑖 : représente la proportion ou le


pourcentage d’individus étudiés dont la valeur du caractère observé est supérieure ou égale à 𝑥𝑖 :
𝐺𝑖 = %(𝑋 ≥ 𝑥𝑖 )

𝐺𝑖 = 𝑓𝑖 + 𝑓𝑖+1 + ⋯ + 𝑓𝑘 = 1 − (𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖−1 ) = 1 − 𝐹𝑖

Remarque :
On définit de la même manière les effectifs cumulés en remplaçant dans les formules précédentes les
fréquences relatives partielles (𝑓𝑖 ) par les effectifs partiels (𝑛𝑖 ) :

- 𝑁𝑖↑ Effectif Cumulé Croissant de la valeur 𝑥𝑖 : représente le nombre d’individus étudiés dont
la valeur du caractère observé est strictement inférieure à 𝑥𝑖 :
𝑁𝑖↑ = 𝑁𝑏(𝑋 < 𝑥𝑖 )

𝑁𝑖↑ = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑖−1

- 𝑁𝑖↓ Effectif Cumulé Décroissant de la valeur 𝑥𝑖 représente le nombre d’individus étudiés dont
la valeur du caractère observé est supérieure ou égale à 𝑥𝑖 :
𝑁𝑖↓ = 𝑁𝑏(𝑋 ≥ 𝑥𝑖 )

𝑁𝑖↓ = 𝑛𝑖 + 𝑛𝑖+1 + 𝑛𝑖+2 + ⋯ + 𝑛𝑘

𝑁𝑖↓ = 𝑁 − (𝑛1 + 𝑛2 + ⋯ + 𝑛𝑖−1 ) = 𝑁 − 𝑁𝑖↑


On a toujours

𝑁𝑖↑ + 𝑁𝑖↓ = 𝑁

Valeurs du Effectif Fréquence Fréquence Cumulée Fréquence Cumulée


caractère X 𝑛𝑖 𝑓𝑖 Croissante : 𝑭𝒊 Décroissante : 𝑮𝒊
𝑥1 𝑛1 𝑓1 0 1
𝑥2 𝑛2 𝑓2 𝑓1 1 − 𝑓1
𝑥3 𝑛3 𝑓3 𝑓1 + 𝑓2 1 − (𝑓1 + 𝑓2 )
⋮ ⋮ ⋮ ⋮ ⋮
𝑥𝑖 𝑛𝑖 𝑓𝑖 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖−1 1 − (𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖−1 )
⋮ ⋮ ⋮ ⋮ ⋮
𝑥𝑘 𝑛𝑘 𝑓𝑘 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑘−1 𝑓𝑘
> 𝑥𝑘 0 0 1 0
Total 𝑁 1
   
Exactement 𝒙𝒊 Exactement 𝒙𝒊 Moins de 𝒙𝒊 Au moins 𝒙𝒊
𝑵𝒃(𝑿 = 𝒙𝒊 ) %(𝑿 = 𝒙𝒊 ) %(𝑿 < 𝒙𝒊 ) %(𝑿 ≥ 𝒙𝒊 )

6
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

Exercice d’application

Le tableau suivant donne la répartition des salariés de l’entreprise GERTY selon leur nombre
d’enfants :

Nombre d’enfants 𝑥𝑖 0 1 2 3 4 5 6 7 Total


Nombre de salariés 𝑛𝑖 8 32 46 52 45 37 24 6 250

1) Quelle est la population étudiée ? En préciser une unité statistique.

2) Quel est le caractère observé ? Quelles sont ses modalités ? Indiquer sa nature.

3) Compléter le tableau statistique en faisant figurer les effectifs cumulés et les fréquences
relatives cumulées.

4) A l’aide du tableau statistique, déterminer le pourcentage de salariés qui ont :


a) « au moins 2 enfants »
b) « moins de 4 enfants»
c) « exactement 3 enfants »
d) « au moins 1 enfant et moins de 5 enfants »

5) Représenter cette distribution ( puis tracer le polygone des fréquences

6) Construire la courbe cumulative (courbe en escaliers)

Corrigé

1) Quelle est la population étudiée ? En préciser une unité statistique.

Population étudiée : L’ensemble des salariés de l’entreprise GERTY

Unité statistique : Un salarié

2) Quel est le caractère observé ? Quelles sont ses modalités ? Indiquer sa nature.

Caractère observé : Le nombre d’enfants

Modalités : 0, 1, …, 6 et 7.

Nature du caractère : Caractère quantitatif discret

7
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

3) Compléter le tableau statistique en faisant figurer les effectifs cumulés et les fréquences
relatives cumulées.

𝒙𝒊 𝒏𝒊 𝑵𝒊↑ 𝑵𝒊↓ 𝒇𝒊 en % 𝑭𝒊 en % 𝑮𝒊 en %
0 8 0 250 0,032 0 1
1 32 8 242 0,128 0,032 0,968
2 46 40 210 0,184 0,16 0,84
3 52 86 164 0,208 0,344 0,656
4 45 138 112 0,18 0,552 0,448
5 37 183 67 0,148 0,732 0,268
6 24 220 30 0,096 0,88 0,12
7 6 244 6 0,024 0,976 0,024
≥8 0 250 0 0 1 0
Total 250 1
𝑵𝒃(𝑿 = 𝒙𝒊 ) 𝑵𝒃(𝑿 < 𝒙𝒊 ) 𝑵𝒃(𝑿 ≥ 𝒙𝒊 ) %(𝑿 = 𝒙𝒊 ) %(𝑿 < 𝒙𝒊 ) %(𝑿 ≥ 𝒙𝒊 )

4) A l’aide du tableau statistique, déterminer le pourcentage de salariés qui ont :


a. « au moins 2 enfants » : 84% c. « exactement 3 enfants » :20,8%
b. « moins de 4 enfants» : 55,2% d. «au moins 1enfant et moins de 5 enfants » :70%

5) Représenter cette distribution ( puis tracer le polygone des fréquences

Diagramme en bâtons et polygone des fréquences


60

50

40

30

20

10

0
0 1 2 3 4 5 6 7 8

6) Construire la courbe cumulative (courbe en escaliers)

8
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

2.3. Tableau relatif à un caractère quantitatif continu

Pour un caractère quantitatif continu, il est possible que la variable prenne n’importe quelles valeurs
dans un intervalle donné. On présente alors les valeurs observées dans des intervalles disjoints de la
forme [𝑏𝑖 , 𝑏𝑖+1 [ appelés classes.

Dans cette classe la valeur de la borne supérieure sera comptabilisée dans la classe suivante.

On note :
- 𝑛𝑖 : effectif de la classe [𝑏𝑖 , 𝑏𝑖+1 [ , soit 𝑛𝑖 = 𝑁𝑏(𝑋 ∈ [𝑏𝑖 , 𝑏𝑖+1 [ )
- 𝑓𝑖 : fréquence de la classe [𝑏𝑖 , 𝑏𝑖+1 [ , soit 𝑓𝑖 = %(𝑋 ∈ [𝑏𝑖 , 𝑏𝑖+1 [ )

- 𝑎𝑖 = 𝑏𝑖+1 −𝑏𝑖 est l’amplitude de la classe

- 𝑐𝑖 = ( 𝑏𝑖 + 𝑏𝑖+1 )/2 est le centre de classe

- 𝑑𝑖 = 𝑛𝑖 /𝑎𝑖 est la densité de la classe

- ℎ𝑖 = (𝑛𝑖 /𝑎𝑖 ) × 𝑎𝑢 , l’effectif corrigé de la classe

(Ici, 𝑎𝑢 est une amplitude de référence, en général l’amplitude la plus fréquente)

- 𝐹𝑖 = 𝐹𝐶𝐶(𝑋 ∈ [𝒃𝒊 , 𝑏𝑖+1 [ ) = %(𝑋 < 𝒃𝒊 ) - 𝑁𝑖↑ = 𝐸𝐶𝐶(𝑋 ∈ [𝒃𝒊 , 𝑏𝑖+1 [ ) = 𝑁𝑏(𝑋 < 𝒃𝒊 )

- 𝐺𝑖 = 𝐹𝐶𝐷(𝑋 ∈ [𝒃𝒊 , 𝑏𝑖+1 [ ) = %(𝑋 ≥ 𝒃𝒊 ) - 𝑁𝑖↓ = 𝐹𝐶𝐷(𝑋 ∈ [𝒃𝒊 , 𝑏𝑖+1 [ ) = 𝑁𝑏(𝑋 ≥ 𝒃𝒊 )

On définit :
- 𝑁𝑖↑ est l’Effectif Cumulé Croissant de la valeur 𝑥𝑖 du caractère observé ; il est égal au nombre
d’individus étudiés dont la valeur du caractère observé est strictement inférieure à 𝑥𝑖 :
𝑁𝑖 = 𝑁𝑏(𝑋 < 𝑏𝑖 ) = 𝑛1 + 𝑛2 + ⋯ + 𝑛𝑖−1

- 𝑁𝑖↓ est l’Effectif Cumulé Décroissant de la valeur 𝑥𝑖 du caractère observé ; il est égal au nombre
d’individus étudiés dont la valeur du caractère observé est supérieure ou égale à 𝑥𝑖 :
𝑁𝑖↓ = 𝑁𝑏(𝑋 ≥ 𝑥𝑖 ) = 𝑛𝑖 + 𝑛𝑖+1 + ⋯ + 𝑛𝑘 = 𝑁 − (𝑛1 + 𝑛2 + ⋯ + 𝑛𝑖−1 )

- 𝐹𝑖 est la fréquence Cumulée Croissante de la valeur 𝑥𝑖 du caractère observé ; elle est égale à la
proportion ou au pourcentage d’individus étudiés dont la valeur du caractère observé est
strictement inférieure à 𝑥𝑖 : 𝐹𝑖 = %(𝑋 < 𝑏𝑖 )

- 𝐺𝑖 est la Fréquence Cumulée Décroissante de la valeur 𝑥𝑖 du caractère observé ; elle est égale à
la proportion ou au pourcentage d’individus étudiés dont la valeur du caractère observé est
supérieure ou égale à 𝑥𝑖 :𝐺𝑖 = %(𝑋 ≥ 𝑏𝑖 )

9
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

Exercice d’application 2

Le tableau suivant donne la répartition des employés de l’entreprise GERTY selon leur salaire
mensuel (exprimé en dizaines de milliers de francs) :

Salaire X [10, 20[ [20, 30[ [30, 40[ [40, 60[ [60, 80[ [80, 120[ [120, 150[
Effectif 𝑛𝑖 8 15 36 48 37 64 42

1) Quelle est la population étudiée ? En préciser une unité statistique.


2) Quel est le caractère observé ? Indiquer sa nature.
3) Compléter le tableau en faisant figurer les effectifs (partiels et cumulés) et fréquences
relatives (partielles et cumulées), les centres de classe, les amplitudes, les effectifs corrigés.
4) Déterminer le pourcentage des employés de cette entreprise qui ont un salaire :
a. inférieur à 60 dizaines de milliers de francs
b. au moins de 40 dizaines de milliers de francs
c. au moins de 20 dizaines de milliers de francs et moins de 80 dizaines de milliers de
francs (pour cette question on donnera le résultat de trois manières différentes).

Tranches Effectif Effectif Effectif Fréque Fréquence Fréquence


de valeurs Cumulé Cumulé nce 𝑓𝑖 Cumulée Cumulée
de X Croissant Décroissant Croissante : 𝐹𝑖 Décroissante : 𝐺𝑖
[10, 20[ 8 0 250 0,032 0 1
[20, 30[ 15 8 242 0,06 0,032 0,968
[30, 40[ 36 23 227 0,144 0,092 0,908
[40, 60[ 48 59 191 0,192 0,236 0,764
[60, 80[ 37 107 143 0,148 0,428 0,572
[80, 120[ 64 144 106 0,256 0,576 0,424
[120, 150[ 42 208 42 0,168 0,832 0,168
[150, +[ 0 250 0 0 1 0
Total 250 𝟏 - -

IV. REPRESENTATIONS GRAPHIQUES

Les données statistiques se présentent avant tout traitement sous forme désordonnée. Après une mise en
ordre et la présentation de ces données sous forme des tableaux, les représentations graphiques
permettent de visualiser la distribution. La représentation graphique dépend de la nature du caractère
examiné.

1. Représentation graphique d’une variable discrète

Soit X une variable discrète dont les valeurs observées sont 𝑥1 < 𝑥2 < … < 𝑥𝑘 dans cet ordre. Soient
𝑛1 , 𝑛2 , … , 𝑛𝑘 les effectifs correspondants à chacune de ces valeurs.
Pour représenter la variable discrète X, on peut envisager le diagramme différentiel (ou diagramme en
bâtons), le polygone des fréquences ou le diagramme cumulatif.

10
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

2.1. Diagramme différentiel ou diagramme en bâtons

Chaque valeur observée (𝑥𝑖 ) est représentée par un bâton vertical dont la hauteur est
proportionnelle à sa fréquence. Polygone des fréquences

Après avoir construit le diagramme en bâtons on relie les sommets des bâtons par des segments de
droite. La ligne polygonale obtenue est appelée « polygone des fréquences ».
Le polygone des fréquences permet de visualiser l’évolution de la série.

2.2. Courbe cumulative

C’est une courbe en escaliers représentant la fonction F des fréquences cumulées croissantes définie
par :
0 𝑠𝑖 𝑥 ∈ ]−∞ , 𝑥1 ]
𝑓1 𝑠𝑖 𝑥 ∈ ] 𝑥1 , 𝑥2 ]
𝑓1 + 𝑓2 𝑠𝑖 𝑥 ∈ ] 𝑥2 , 𝑥3 ]
𝐹(𝑥) = ⋮ ⋮
𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖−1 𝑠𝑖 𝑥 ∈ ] 𝑥𝑖−1 , 𝑥𝑖 ]
⋮ ⋮
{ 1 𝑠𝑖 𝑥 ∈ ] 𝑥𝑘 , +∞ [

2. Représentation graphique d’une variable continue

Pour représenter une variable continue, on utilise des histogrammes.

3.1.Histogramme

Définition : Un histogramme est un ensemble de rectangles contigus.

Attention ! Avant de construire un histogramme il faut veiller sur les amplitudes des classes. Deux cas
sont possibles :

1er cas : si les classes sont de même amplitude

A chaque classe, on associe un rectangle dont la hauteur est proportionnelle à la fréquence (𝑛𝑖 𝑜𝑢 𝑓𝑖 ) de
la classe correspondante.

2ème cas : si les classes ne sont pas de même amplitude

A chaque classe, on associe un rectangle dont la hauteur est proportionnelle à la densité (𝑑𝑖 ) ou à
l’effectif corrigé (ℎ𝑖 ) de la classe correspondante.

11
Chapitre 1 : Concepts fondamentaux Abdon Privat. PAMBOU

3.2. Polygone des fréquences

Après avoir construit l’histogramme, on relie les milieux des segments supérieurs des rectangles par des
segments de droite. Pour refermer le polygone sur l’axe des abscisses on ajoute une classe avant et une
classe après l’histogramme ; les deux classes étant de même amplitude et d’effectif nul.

3.3. Courbes cumulatives

On distingue deux courbes cumulatives :

- La Courbe cumulative croissante représentant la fonction F des FCC (ou ECC) passant par
les points d’abscisse 𝑏𝑖 et d’ordonnée 𝐹(𝑏𝑖 ).

- La courbe cumulative décroissante représentant la fonction G des FCD (ou ECD) passant par
les points d’abscisse 𝑏𝑖 et d’ordonnée 𝐺(𝑏𝑖 ).

12

Vous aimerez peut-être aussi