Vous êtes sur la page 1sur 7

II.2.

Reprsentation graphique des donnes


Aprs avoir obtenu un chantillon ou dnombr une population, on
dispose le plus souvent de donnes numriques brutes prsentes
sous la forme dune srie de valeurs (dans le cas dune VA
quantitative) ou sous la forme dun tableau donnant le nombre
dindividu prsentant un caractre qualitatif. Prsentes ainsi, ces
donnes sont rarement parlantes et il est ncessaire de dresser
une reprsentation graphique afin de faire ressortir une partie de
linformation. Suivant le type de variable alatoire, le mode de
reprsentation graphique va tre diffrent.
2.1. VA qualitative
Le tableau suivant donne les On dispose alors de 4 classes ou nombre
de personnes (effectif absolu) prsentant une couleur donne dans un
chantillon. Ce tableau peut tre reprsent tel quel (en nombre) ou
en pourcentage sur une graphique secteur.

Couleurs de cheveux d'un groupe de personne

Reprsentation graphique par secteur
2.2. VA discrte (quantitative discontinue)
Ce type de variable est associe gnralement un diagramme en
btons o laxe horizontal des abscisses porte les valeurs prises par la
VA (x
i
) tandis que laxe vertical des ordonnes porte leffectif absolu
(n
i
) observ.
Exemple :
Si lon sintresse au nombre de personnes bord dune voiture dans
2 villes diffrentes, on peut dresser le tableau suivant :

Nombre de personnes bord d'une voiture dans 2 villes diffrentes
Le diagramme en btons correspondant est le suivant :

Diagramme en bton
Ce type de reprsentation permet de mieux visualiser la distribution
observe et semble indiquer que loccupation des vhicules est plus
importante dans la ville A que dans la ville B. Mais on ne peut faire
confiance cette affirmation simplement la vue dun graphique ; il
faudrait une analyse statistique plus approfondie...
Un autre mode de reprsentation est le diagramme des frquences
cumules.
Dfinition : Frquence absolue
La frquence absolue est le nombre de rptition dune valeur
numrique.
Exemple :
Dans lexemple prcdent, frquence absolue et effectif se
confondent. En ajoutant chaque effectif (dans une classe donne)
leffectif prcdent, on obtient les effectifs absolus cumuls qui se
reprsentent graphiquement de la faon suivante :

Diagramme des frquences cumules
Le diagramme des frquences cumules permet la lecture du nombre
de voiture transportant par exemple au plus 4 personnes dans la ville
B.
Il est souvent intressant de tracer le diagramme des frquences
relatives cumules. Dans ce cas, leffectif est exprim en
pourcentage. La lecture du graphique devient alors indpendante de
la taille de lchantillon.
2.3. VA quantitative continue
Dans le cas de ces variables, suivant la grandeur mesure et la
sensibilit de la mthode utilise, il est frquent dobtenir autant de
valeurs diffrentes que de donnes si bien que la reprsentation
graphique na dans ces conditions aucun sens. On est donc
gnralement amen regrouper les donnes en classes.
A la diffrence des VA discrtes, une classe donne ne contient pas
une seule valeur mais une infinit de valeurs possibles sur un
intervalle dfini (appel intervalle de classe). Cet intervalle permet
de dfinir galement une amplitude de classe (diffrence entre les
valeurs suprieure et infrieure de la classe). La valeur centrale de la
classe est appele centre de classe.
La rpartition des donnes brutes en classes ncessite donc de la part
du statisticien de faire un choix sur le nombre de classes et donc sur
lamplitude. Ce choix doit tre suffisamment judicieux pour permettre
la reprsentation graphique des donnes sans perdre pour autant trop
dinformation initialement contenue dans la srie statistique.
Dfinition : Histogramme
Cest un ensemble de rectangles accols ayant les caractristiques
suivantes :
1. la base de chaque rectangle correspond lamplitude dune
classe. Gnralement toutes les classes dune srie statistique
ont mme amplitude.
2. la hauteur du rectangle est gale soit leffectif absolu (ou
frquence absolue) de la classe, soit la frquence relative
(correspondant au rapport n
i
/n o n
i
est leffectif absolu de la
classe i et n leffectif total de la srie statistique). La surface de
chacun des rectangles, si lamplitude de classe est constante est
alors proportionnelle leffectif de la classe
3. Il peut tre intressant de tracer lhistogramme des densits de
frquences. La densit de frquence f
xi
correspond au rapport
, o
xi
est lamplitude de classe (ou base du rectangle).
La surface dun rectangle (f
xi
. xi ) dans cette reprsentation
graphique est alors gale la frquence relative de la classe
correspondante et la surface totale des rectangle est gale 1
quelle que soit la distribution initiale On verra par la suite que lon
peut gnraliser ce rsultat la distribution dune variable
continue.
Exemple :
Lexemple suivant montre la distribution des poids de naissance de
nouveau-ns dans une maternit (donnes extraites de : D.
Schwartz, mthodes statistiques lusage des mdecins et des
biologistes, Mdecine-Sciences, Flammarion 4
me
ed. )

Distribution des poids de naissance
Dans cet exemple, toutes les classes ont mme amplitude (200 g) et
il y a au total 16 classes ce qui est un nombre suffisant pour
reprsenter la distribution initiale (200 valeurs). On remarquera
quune partie de linformation initiale a t perdue puisqu la vue du
tableau il nest plus possible de diffrencier les nouveau-ns dune
mme classe.
A partir de ce tableau de valeurs, on peut tracer les histogrammes
des effectifs absolus, des frquences relatives et des densits de
frquence.

Distribution des poids la naissance

Distribution des poids la naissance
Dfinition : Polygone des frquences
Le polygone des frquences est reprsent en joignant les milieux des
cots suprieurs des rectangles dans un histogramme. Cest une ligne
brise dont les extrmits rejoignent laxe des abscisses.

Polygone des frquences relatives
Dfinition : courbe des frquences relatives cumules

Courbe des frquences relatives
Ce type de courbe permet une lecture rapide du pourcentage de
nouveau-ns dont le poids est compris entre deux valeurs. Il suffit de
faire la diffrence entre les 2 ordonnes correspondant lintervalle
de poids fix.
2.4. Conclusion
La reprsentation graphique dune srie statistique est une tape trs
importante dans lanalyse dun problme statistique car elle donne
une information sur la forme de la distribution observe. Cette forme
est souvent caractristique, comme lallure en cloche observe pour
les histogrammes de poids des nouveau-ns. Nous verrons que cette
allure en cloche caractrise la distribution dun grand nombre de
variable alatoires.
Pour un chantillon donn, lanalyse graphique de la distribution,
couple une tude statistique plus approfondie fournit une
indication sur la distribution de la variable alatoire dans la population
do lon a extrait lchantillon.
Dans la dmarche de qualit visant matriser un processus
industriel, cette approche permet de contrler le procd et de
prdire les proprits d'une fabrication. Ainsi, si la forme de la
distribution ne varie pas d'un lot de fabrication un autre, on dispose
d'un lment positif pour dmontrer la stabilit du processus.
Deux lments, autres que la forme de la distribution apparaissent
galement lorsque l'on dcrit graphiquement une srie statistique. On
remarque en effet que les valeurs se distribuent autour d'une valeur
centrale avec un talement (une dispersion) plus ou moins grand(e).
L'analyse de ces deux paramtres, tendance centrale et dispersion,
permettent de dcrire de faon quantitative une distribution
statistique.

Vous aimerez peut-être aussi