Académique Documents
Professionnel Documents
Culture Documents
L’objet de ce chapitre est de déterminer comment on présente l’information pour qu’elle soit
« lisible » et compréhensible. Les tableaux et les graphiques relèvent d’un certain nombre de
normes. Les données statistiques brutes (c’est-à-dire à peines recueillies) sont le plus souvent
inutilisables, et non interprétables immédiatement. Il faut les « mettre en ordre ». Ainsi, par
exemple, si une enquête sur le nombre d’enfants par ménage donne les résultats suivants : 5, 0, 2,
1, 3, 0, 1, 5, il faudra les ranger (par exemple sous forme de tableau) pour pouvoir les interpréter :
Effectif (ni) 2 2 1 1 0 2
Une fois mise en ordre, les observations forment une distribution statistique ou une série statistique
qui est donc l’ensemble des modalités et des effectifs d’un caractère :
Distribution statistique = {𝑥𝑖 ; 𝑛𝑖 }
Il est clair que la somme des fréquences est égale à l’unité (le total des pourcentages est égal à
100% si l’on exprime fi en pourcentages)
On peut, comme dans une nomenclature détaillée, coder les diverses rubriques (ici, de 01 à 05).
Notation : on pourra également noter la colonne fréquence cumulée ascendante F(x) ou Fi pour les
cumuls en proportion et N(x) ou Ni pour les cumuls en effectifs.
2) Variable statistique continue
Ici, les individus (ou observations) sont nécessairement regroupés en classes, définies par leurs
bornes ou extrémités.
Exemple : une classe de salaire mensuel :
De 8000F à moins de 9000F
Ou [𝑒𝑖−1 ; 𝑒𝑖 [ ( 𝑒𝑖 = 𝑣𝑎𝑙𝑒𝑢𝑟 𝑑′ 𝑢𝑛𝑒 𝑏𝑜𝑟𝑛𝑒 )
𝑒𝑖−1 +𝑒𝑖 8000+9000
Le centre de classe sera : 𝑥𝑖 = = =8500F
2 2
Dans l’exemple 4, la dernière classe n’est pas bornée à droite. On choisit donc une extrémité dictée
par la logique ou par la connaissance du domaine, pour pouvoir calculer un centre de classe (ici nous
avons choisi 25000f comme borne supérieure, ce qui donne un centre de classe de 21500F). Ce choix
dépend de l’utilisateur ; il est subjectif : cependant, il ne porte dans la plupart des cas que sur des
effectifs faibles, ce qui minimise les risques d’erreurs
Toujours dans cet exemple 4, on peut voir que la classe III est « mal choisie » : vu l’effectif
correspondant, on aurait pu, lors du traitement des données saisies, diviser en 2 classes d’amplitudes
500F, pour faire apparaitre plus d’informations.
Le choix d’un centre de classe par cette méthode suppose que les données sont uniformément
réparties dans la classe, ce qui est une hypothèse simplificatrice (Les effectifs peuvent, en effet, à la
limite, se concentrer aux bornes).
D- Remarques terminales sur les tableaux statistiques
Un tableau doit fournir des renseignements clairs, précis, facilement compréhensibles, sans avoir
recours au texte qui l’accompagne généralement.
Retenons les 4 règles primordiales de présentation :
1. Le titre : il doit nécessairement figurer de façon complète, en indiquant le phénomène étudié,
la façon dont il est étudié, le lieu, la date, le champ de l’enquête, le critère du classement.
Exemple : « répartition des ménages par catégories socio-professionnelle (CSP) selon la CSP
du chef de ménage, par commune de la région de l’Adamaoua au recensement de 2001 »
2. Les intitulés des lignes et des colonnes : Il faut comprendre aisément s’il s’agit de nombres
ou de pourcentages, de fréquences ou de taux, etc…La encore, les valeurs doivent
correspondre sans ambiguïté aux variables définies.
3. L’unité utilisée : Elle doit être précisée de façon claire… afin qu’on ne puisse confondre par
exemple, des milliards de francs avec des millions, des mètres carrés, des taux de chômage
avec des pourcentages de chômeurs rapportés au total.
4. La source : quand on cite une statistique, il faut en connaitre la « source », c’est-à-dire le nom
de l’organisme ou de la personne qui a élaboré cette statistique. On dira par exemple :
« source : Institut National de la Statistique (INS), 2020 ». Exemple 5 :
Tableau 1 : Utilisateurs d’internet par zones géographiques (Effectifs en mars 2005)
Note : Pour connaître la liste des pays inclus dans chaque zone, voir la source des données.
II- Graphiques
A– Données groupées par modalités ou valeurs
1) Diagramme en bâtons
C’est peut-être la représentation la plus simple qui soit. En réalité, le diagramme en bâtons s’inspire
directement de la présentation tige et feuilles, mais le contenu en information est moins riche.
Où le premier chiffre de chaque couple correspond par exemple au nombre d’enfants. On obtient
alors le graphique de la figure 1 (b).
2) Diagramme en barres
Le diagramme en barres repose sur le même principe que le diagramme en bâtons, sauf qu’au lieu de
bâtons, on a des barres rectangulaires de base identique et identiquement espacées les unes des
autres. La taille de la base, ainsi que celle de l’espacement n’ont pas de signification particulière. On
ordonne généralement les valeurs des effectifs de la plus grande à la plus faible en partant de l’origine
des axes. La figure 2 représente les mêmes données que la figure 1, mais ces données sont exprimées
en pourcentage.
Figure 2 : Diagramme en barres verticales
3) La « courbe cumulative »
Il s’agit de représenter les fréquences cumulées ou les effectifs cumulés. La courbe obtenue à partir
des valeurs du tableau est une courbe « en escaliers » dont les paliers sont horizontaux.
Dans le cas des fréquences cumulées ascendantes, elle représente la proportion des individus pour
lesquels la valeur de la variable est strictement inférieur à 𝑥𝑖 .
La fonction étant définie pour toute valeur de 𝑥, on emploiera indifféremment les termes de
« fonction cumulative » ou « fonction de répartition » (Notation : Fi ou F(x) pour les fréquences
relatives et Ni ou N(x) pour les effectifs)
Exemple 2 : soient les données ci-dessous du nombre d’enfants par ménage d’un échantillon de 180
ménages : le diagramme en bâtons est le suivant :
Chaque palier de la courbe est ouvert à gauche et fermé à droite (sauf le dernier). 61% des ménages
ont « moins de » deux enfants.
Il est aussi possible de tracer sur le même diagramme la courbe cumulative des effectifs ou des
fréquences relatives correspondant aux fréquences cumulées descendantes faisant apparaitre la
relation « plus de ».
3) Nuage de points dans le cas d‘une série unidimensionnelle
Le nuage de points peut être employé pour représenter graphiquement une simple série de chiffres.
Les données des figures 2 à 4 peuvent également être représentées par un nuage de points ou par
une ligne joignant ces points.
Figure 4 : Nuages de points, reliés et non reliés- Nombre d’enfants par foyer
Tableau 1 : Chiffre d’affaires en millions d’euros de quatre entreprises qui contrôle un marché
Chiffre Part de
Entreprise
d’affaires marché
A 50 31,25
B 70 43,75
C 10 6,25
D 30 18,75
Total 160 100
La part de marché (colonne 3) n’est en fait qu’un pourcentage. Chaque ligne de la colonne 2 est
divisée par la dernière ligne (total) et multipliée par 100.
Notons qu’il s’agit d’un caractère qualitatif, les modalités étant les quatre entreprises. Pour faire le
graphique en camembert, il reste à calculer la part que le chiffre d’affaires de chacune de ces
entreprises représente dans 360° (voir le tableau 2 ci-dessous).
La dernière colonne du tableau 2 va nous permettre de dessiner le camembert, puis de « couper les
parts ». Il suffit pour cela de tracer un cercle, puis au moyen d’un rapporteur, de déterminer les angles
correspondant à chaque part. On obtient alors le résultat voulu. La figure 5 ci-dessous illustre 2
variantes du même graphique. Dans la seconde variante, l’entreprise qui a la part de marché la plus
élevée est détachée du lot.
Figure 5 : Le Camembert ou pie-chart
Le
camembert peut aussi servir à représenter des variables quantitatives, y compris des variables
quantitatives groupées par classes.
D– L‘histogramme
L’histogramme convient particulièrement aux variables quantitatives quand celles-ci sont
regroupées par classes. Parfois les classes ont des amplitudes égales. C’est le cas le plus évident.
Parfois, cependant, les amplitudes des classes sont différentes. Il faut alors opérer une correction en
suivant la méthode indiquée ci-après.
Exemple 3 : Soit 100 ménages distribués selon leur revenu mensuel en Franc. On définit des classes
d’amplitudes égales à 1 500F.
Tableau 3 : Répartition d’un échantillon de 100 ménages par classe de revenu mensuel (amplitude
de classe= 1500F)
Classe de revenu ni fi
[0 ;1500[ 20 0,2
[1500 ;3000[ 40 0,4
[3000 ;4500[ 30 0,3
[4500 ;6000[ 10 0,1
L’histogramme peut être construit à partir des effectifs (les ni) ou à partir des fréquences (et d’ailleurs
aussi en prenant les pourcentages). Contrairement au diagramme en barre, avec lequel il ne faut pas
le confondre, les rectangles qui composent l’histogramme ont une base qui est définie par l’amplitude
de la classe qu’ils représentent et, de plus, ils sont collés les uns aux autres.
Figure 6 : Histogramme correspondant aux données du tableau 3
Exemple 4 : Supposons que l’on regroupe les données de l’exemple 3 en classes d’amplitudes
inégales ([0-1500[; [1500-4500[; [4500-6000]).
Il faut dans ce cas effectuer une correction pour tenir compte des différences d’amplitude. Il convient
en fait de diviser la fréquence de chaque classe par l’amplitude correspondante. On obtient ainsi
l’amplitude corrigée (hi).
Tableau 4 : Calcul de l’amplitude corrigé
Amplitude
Classe de
de classe ni fi hi =fi/ai
revenu
(ai)
[0;1500[ 1500 20 0,2 0,00013
[1500;4500[ 3000 70 0,7 0,00023
[4500;6000] 1500 10 0,1 0,00007
Sur l’histogramme de la figure 7, on aura donc l’amplitude corrigée en abscisse et des classes
d’inégales amplitudes en ordonnée.