Vous êtes sur la page 1sur 12

Chapitre II : Tableaux et graphiques

L’objet de ce chapitre est de déterminer comment on présente l’information pour qu’elle soit
« lisible » et compréhensible. Les tableaux et les graphiques relèvent d’un certain nombre de
normes. Les données statistiques brutes (c’est-à-dire à peines recueillies) sont le plus souvent
inutilisables, et non interprétables immédiatement. Il faut les « mettre en ordre ». Ainsi, par
exemple, si une enquête sur le nombre d’enfants par ménage donne les résultats suivants : 5, 0, 2,
1, 3, 0, 1, 5, il faudra les ranger (par exemple sous forme de tableau) pour pouvoir les interpréter :

Nombre d’enfants par ménage (xi) 0 1 2 3 4 5

Effectif (ni) 2 2 1 1 0 2

Une fois mise en ordre, les observations forment une distribution statistique ou une série statistique
qui est donc l’ensemble des modalités et des effectifs d’un caractère :
Distribution statistique = {𝑥𝑖 ; 𝑛𝑖 }

I- Les tableaux statistiques


A- La notion de fréquence
Un tableau à une dimension se présente généralement sous la forme suivante où le ni individus sont
considérés comme équivalents du point de vue du caractère x.

A chaque modalité correspond un nombre d’individus « ni » appelé effectif ou fréquence absolue de


la modalité xi.
La somme des effectifs est l’effectif total de la population
La fréquence relative (ou « fréquence » pour simplifier) « fi » est la proportion d’individus présentant
la même modalité dans la population totale. Donc :

On la calcule dans le tableau en divisant


chaque effectif par l’effectif total :

Exemple 1 : Echantillon de 10 ménages (ni) selon le nombre d’enfants (xi)

Il y a donc 50% des ménages de l’échantillon qui


possèdent un enfant.

Il est clair que la somme des fréquences est égale à l’unité (le total des pourcentages est égal à
100% si l’on exprime fi en pourcentages)

B- Les tableaux des caractères qualitatifs


Lorsqu’on est en présence de caractères non mesurables (qualitatifs) on les range dans le tableau
selon la logique qui permet au mieux l’interprétation.

Exemple 2 : Répartition des salariés de l’entreprise X au 31 décembre 1987 selon la CSP

On peut, comme dans une nomenclature détaillée, coder les diverses rubriques (ici, de 01 à 05).

C- Les tableaux à caractères quantitatifs


1) Variable statistique discrète et fréquence cumulée
Le tableau est du type de celui présenté plus haut : « Nombre d’enfants par ménage » ; les valeurs
sont discrètes : 0, 1, 2, 3, 4.
La notion de fréquence cumulée permet de répondre à la question : « combien de ménages ont « plus
de 2 enfants ou « moins de 4 enfants » par exemple.
Ce résultat « plus de… » ou « moins de … » peut s’exprimer en nombres (fréquences absolues) ou en
proportion (fréquences relatives). Le calcul se fait comme suit : on somme (ou « cumule ») les
fréquences relatives ou absolues (les effectifs) dans une colonne du tableau :

Exemple 3 : (sur les données précédentes)

Il y a 7 ménages de l’échantillon qui ont moins de 2 enfants (ou « au plus » 1 enfant)


3 ménages ont plus de 1 enfant (ou « au moins » 2 enfants)
80% des ménages ont des enfants (ou « plus de » 0 enfant
20% des ménages sont sans enfants (ou « moins de » 1 enfant

Notation : on pourra également noter la colonne fréquence cumulée ascendante F(x) ou Fi pour les
cumuls en proportion et N(x) ou Ni pour les cumuls en effectifs.
2) Variable statistique continue
Ici, les individus (ou observations) sont nécessairement regroupés en classes, définies par leurs
bornes ou extrémités.
Exemple : une classe de salaire mensuel :
De 8000F à moins de 9000F
Ou [𝑒𝑖−1 ; 𝑒𝑖 [ ( 𝑒𝑖 = 𝑣𝑎𝑙𝑒𝑢𝑟 𝑑′ 𝑢𝑛𝑒 𝑏𝑜𝑟𝑛𝑒 )
𝑒𝑖−1 +𝑒𝑖 8000+9000
Le centre de classe sera : 𝑥𝑖 = = =8500F
2 2

L’amplitude de la classe est :


𝑎𝑖 = 𝑒𝑖 − 𝑒𝑖−1 = 9000 − 8000 = 1000𝐹
Les amplitudes peuvent parfois être inégales comme dans l’exemple ci-dessous : Exemple 4 :

Dans l’exemple 4, la dernière classe n’est pas bornée à droite. On choisit donc une extrémité dictée
par la logique ou par la connaissance du domaine, pour pouvoir calculer un centre de classe (ici nous
avons choisi 25000f comme borne supérieure, ce qui donne un centre de classe de 21500F). Ce choix
dépend de l’utilisateur ; il est subjectif : cependant, il ne porte dans la plupart des cas que sur des
effectifs faibles, ce qui minimise les risques d’erreurs
Toujours dans cet exemple 4, on peut voir que la classe III est « mal choisie » : vu l’effectif
correspondant, on aurait pu, lors du traitement des données saisies, diviser en 2 classes d’amplitudes
500F, pour faire apparaitre plus d’informations.
Le choix d’un centre de classe par cette méthode suppose que les données sont uniformément
réparties dans la classe, ce qui est une hypothèse simplificatrice (Les effectifs peuvent, en effet, à la
limite, se concentrer aux bornes).
D- Remarques terminales sur les tableaux statistiques
Un tableau doit fournir des renseignements clairs, précis, facilement compréhensibles, sans avoir
recours au texte qui l’accompagne généralement.
Retenons les 4 règles primordiales de présentation :
1. Le titre : il doit nécessairement figurer de façon complète, en indiquant le phénomène étudié,
la façon dont il est étudié, le lieu, la date, le champ de l’enquête, le critère du classement.
Exemple : « répartition des ménages par catégories socio-professionnelle (CSP) selon la CSP
du chef de ménage, par commune de la région de l’Adamaoua au recensement de 2001 »
2. Les intitulés des lignes et des colonnes : Il faut comprendre aisément s’il s’agit de nombres
ou de pourcentages, de fréquences ou de taux, etc…La encore, les valeurs doivent
correspondre sans ambiguïté aux variables définies.
3. L’unité utilisée : Elle doit être précisée de façon claire… afin qu’on ne puisse confondre par
exemple, des milliards de francs avec des millions, des mètres carrés, des taux de chômage
avec des pourcentages de chômeurs rapportés au total.
4. La source : quand on cite une statistique, il faut en connaitre la « source », c’est-à-dire le nom
de l’organisme ou de la personne qui a élaboré cette statistique. On dira par exemple :
« source : Institut National de la Statistique (INS), 2020 ». Exemple 5 :
Tableau 1 : Utilisateurs d’internet par zones géographiques (Effectifs en mars 2005)

Zones géographiques (1) Effectifs en millions


Asie 302,2
Europe 259,6
Amérique du Nord 221,4
Amérique du Sud/Caraïbes 56,2
Moyen-Orient 19,3
Océanie/Australie 16,2
Afrique 13,4
Total 883,3
Source : www.internetworldstats.com/stats

Note : Pour connaître la liste des pays inclus dans chaque zone, voir la source des données.

II- Graphiques
A– Données groupées par modalités ou valeurs
1) Diagramme en bâtons

C’est peut-être la représentation la plus simple qui soit. En réalité, le diagramme en bâtons s’inspire
directement de la présentation tige et feuilles, mais le contenu en information est moins riche.

Exemple 1 : On interroge 11 personnes sur leurs préférences concernant les 4 produits A, B, C, D.


Chaque personne doit choisir seulement un produit. On obtient les résultats groupés suivants :
{{A, 4}, {B, 4}, {C, 1}, {D,1}}
Dans chaque couple de données, le premier chiffre correspond au produit (A, B, C, D) et le second
correspond au nombre de personnes qui ont choisi ce produit. La figure 1 (a) illustre le résultat.

Si le regroupement se fait par valeur, on a par exemple les couples :

{{1, 4}, {2, 4}, {3, 1}, {4, 1}}

Où le premier chiffre de chaque couple correspond par exemple au nombre d’enfants. On obtient
alors le graphique de la figure 1 (b).

Figure 1 : Diagramme en bâtons

2) Diagramme en barres

Le diagramme en barres repose sur le même principe que le diagramme en bâtons, sauf qu’au lieu de
bâtons, on a des barres rectangulaires de base identique et identiquement espacées les unes des
autres. La taille de la base, ainsi que celle de l’espacement n’ont pas de signification particulière. On
ordonne généralement les valeurs des effectifs de la plus grande à la plus faible en partant de l’origine
des axes. La figure 2 représente les mêmes données que la figure 1, mais ces données sont exprimées
en pourcentage.
Figure 2 : Diagramme en barres verticales

3) La « courbe cumulative »
Il s’agit de représenter les fréquences cumulées ou les effectifs cumulés. La courbe obtenue à partir
des valeurs du tableau est une courbe « en escaliers » dont les paliers sont horizontaux.
Dans le cas des fréquences cumulées ascendantes, elle représente la proportion des individus pour
lesquels la valeur de la variable est strictement inférieur à 𝑥𝑖 .
La fonction étant définie pour toute valeur de 𝑥, on emploiera indifféremment les termes de
« fonction cumulative » ou « fonction de répartition » (Notation : Fi ou F(x) pour les fréquences
relatives et Ni ou N(x) pour les effectifs)
Exemple 2 : soient les données ci-dessous du nombre d’enfants par ménage d’un échantillon de 180
ménages : le diagramme en bâtons est le suivant :

Figure 3 : courbe cumulative

Chaque palier de la courbe est ouvert à gauche et fermé à droite (sauf le dernier). 61% des ménages
ont « moins de » deux enfants.
Il est aussi possible de tracer sur le même diagramme la courbe cumulative des effectifs ou des
fréquences relatives correspondant aux fréquences cumulées descendantes faisant apparaitre la
relation « plus de ».
3) Nuage de points dans le cas d‘une série unidimensionnelle

Le nuage de points peut être employé pour représenter graphiquement une simple série de chiffres.
Les données des figures 2 à 4 peuvent également être représentées par un nuage de points ou par
une ligne joignant ces points.
Figure 4 : Nuages de points, reliés et non reliés- Nombre d’enfants par foyer

C– Camembert ou graphique « en tarte » ?


Les anglo-saxons l’appellent « Pie Chart » c’est-à-dire, littéralement « graphique en tarte ». En France,
on l’appelle le camembert. Ce graphique universel convient à toutes les données, dès l’instant où il
s’agit d’exprimer des parts ou des pourcentages.
Exemple 3 : Soit les chiffres d’affaires en millions d’euros des quatre principales entreprises du
marché d’un produit (pour simplifier, on suppose que ces entreprises contrôlent la totalité du
marché) :

Tableau 1 : Chiffre d’affaires en millions d’euros de quatre entreprises qui contrôle un marché

Chiffre Part de
Entreprise
d’affaires marché
A 50 31,25
B 70 43,75
C 10 6,25
D 30 18,75
Total 160 100

La part de marché (colonne 3) n’est en fait qu’un pourcentage. Chaque ligne de la colonne 2 est
divisée par la dernière ligne (total) et multipliée par 100.

Notons qu’il s’agit d’un caractère qualitatif, les modalités étant les quatre entreprises. Pour faire le
graphique en camembert, il reste à calculer la part que le chiffre d’affaires de chacune de ces
entreprises représente dans 360° (voir le tableau 2 ci-dessous).

Tableau 2 : Calcul des parts des chiffres d’affaires dans 360°.


Part de
Entreprise Degrés
marché
A 31,25 (31,25 *360) / 100 = 112,5
B 43,75 (43,75 *360) / 100 = 157,5
C 6,25 (6,25 *360) / 100 = 22,5
D 18,75 (6,25 *360) / 100 = 22,5
Total 100 360

La dernière colonne du tableau 2 va nous permettre de dessiner le camembert, puis de « couper les
parts ». Il suffit pour cela de tracer un cercle, puis au moyen d’un rapporteur, de déterminer les angles
correspondant à chaque part. On obtient alors le résultat voulu. La figure 5 ci-dessous illustre 2
variantes du même graphique. Dans la seconde variante, l’entreprise qui a la part de marché la plus
élevée est détachée du lot.
Figure 5 : Le Camembert ou pie-chart

Le
camembert peut aussi servir à représenter des variables quantitatives, y compris des variables
quantitatives groupées par classes.

D– L‘histogramme
L’histogramme convient particulièrement aux variables quantitatives quand celles-ci sont
regroupées par classes. Parfois les classes ont des amplitudes égales. C’est le cas le plus évident.
Parfois, cependant, les amplitudes des classes sont différentes. Il faut alors opérer une correction en
suivant la méthode indiquée ci-après.

Exemple 3 : Soit 100 ménages distribués selon leur revenu mensuel en Franc. On définit des classes
d’amplitudes égales à 1 500F.
Tableau 3 : Répartition d’un échantillon de 100 ménages par classe de revenu mensuel (amplitude
de classe= 1500F)
Classe de revenu ni fi

[0 ;1500[ 20 0,2
[1500 ;3000[ 40 0,4
[3000 ;4500[ 30 0,3
[4500 ;6000[ 10 0,1

L’histogramme peut être construit à partir des effectifs (les ni) ou à partir des fréquences (et d’ailleurs
aussi en prenant les pourcentages). Contrairement au diagramme en barre, avec lequel il ne faut pas
le confondre, les rectangles qui composent l’histogramme ont une base qui est définie par l’amplitude
de la classe qu’ils représentent et, de plus, ils sont collés les uns aux autres.
Figure 6 : Histogramme correspondant aux données du tableau 3

Exemple 4 : Supposons que l’on regroupe les données de l’exemple 3 en classes d’amplitudes
inégales ([0-1500[; [1500-4500[; [4500-6000]).

Il faut dans ce cas effectuer une correction pour tenir compte des différences d’amplitude. Il convient
en fait de diviser la fréquence de chaque classe par l’amplitude correspondante. On obtient ainsi
l’amplitude corrigée (hi).
Tableau 4 : Calcul de l’amplitude corrigé

Amplitude
Classe de
de classe ni fi hi =fi/ai
revenu
(ai)
[0;1500[ 1500 20 0,2 0,00013
[1500;4500[ 3000 70 0,7 0,00023
[4500;6000] 1500 10 0,1 0,00007
Sur l’histogramme de la figure 7, on aura donc l’amplitude corrigée en abscisse et des classes
d’inégales amplitudes en ordonnée.

Figure 7 : Histogramme avec amplitudes inégales

E- Polygone de fréquences et courbe de fréquence


Parfois l’histogramme en donne pas une image « directe » du phénomène à étudier. Pour obtenir une
interprétation moins « lourde » à visualiser, on peut tracer :
a) Le polygone des fréquences qui joint les milieux des sommets des rectangles des classes
d’amplitude égales

Pour tracer : on ajoute deux


« fausses classes » aux extrémités.
Il y a toujours conservations des aires : En fréquences relatives, la surface sous le polygone est
toujours égale à 1.
b) La courbe des fréquences est un ajustement graphique du polygone des fréquences. On conçoit
que si l’amplitude de classe devient de plus en plus petite, jusqu’à tendre vers zéro, le polygone
des fréquences peut tendre vers une courbe continue. Ceci est particulièrement important en
calcul des probabilités et en statistique mathématique, où l’on cherche à ajuster la distribution
observée à une « loi de probabilité connue. Ainsi, la courbe des fréquences représente une
estimation de la loi de probabilité qu’est censé suivre le phénomène.
F – L‘utilisation des graphiques à des fins de comparaisons : Le radar, excellent moyen d‘effectuer
des comparaisons visuelles
C’est dans les possibilités de comparaisons qu’ils offrent que les graphiques sont particulièrement
utiles : comparaisons dans le temps, comparaisons spatiales, etc.
La figure 6 utilise le graphique dit « en radar » afin de comparer la répartition réelle des parts de
marché des 4 entreprises A, B, C et D avec une répartition égalitaire où chacune aurait 25% du marché
(cette répartition égalitaire est représentée par le losange en pointillé). Les parts de marché réelles
sont indiquées sur chaque axe. On voit ainsi immédiatement que A et B ont une part de marché
supérieure à la répartition égalitaire et B et C une part de marché inférieure. On peut à partir de là
calculer combien il faut retrancher à A et à B (et combien par conséquent il faut redistribuer à C et D)
pour revenir à une répartition égalitaire).
Figure 6 : Le graphique en radar pour représenter et comparer les parts de marché des entreprises
du tableau 1

Vous aimerez peut-être aussi