Aprs avoir obtenu un chantillon ou dnombr une population, on dispose le plus souvent de donnes numriques brutes prsentes sous la forme dune srie de valeurs (dans le cas dune VA quantitative) ou sous la forme dun tableau donnant le nombre dindividu prsentant un caractre qualitatif. Prsentes ainsi, ces donnes sont rarement parlantes et il est ncessaire de dresser une reprsentation graphique afin de faire ressortir une partie de linformation. Suivant le type de variable alatoire, le mode de reprsentation graphique va tre diffrent. 2.1. VA qualitative Le tableau suivant donne les On dispose alors de 4 classes ou nombre de personnes (effectif absolu) prsentant une couleur donne dans un chantillon. Ce tableau peut tre reprsent tel quel (en nombre) ou en pourcentage sur une graphique secteur.
Couleurs de cheveux d'un groupe de personne
Reprsentation graphique par secteur 2.2. VA discrte (quantitative discontinue) Ce type de variable est associe gnralement un diagramme en btons o laxe horizontal des abscisses porte les valeurs prises par la VA (x i ) tandis que laxe vertical des ordonnes porte leffectif absolu (n i ) observ. Exemple : Si lon sintresse au nombre de personnes bord dune voiture dans 2 villes diffrentes, on peut dresser le tableau suivant :
Nombre de personnes bord d'une voiture dans 2 villes diffrentes Le diagramme en btons correspondant est le suivant :
Diagramme en bton Ce type de reprsentation permet de mieux visualiser la distribution observe et semble indiquer que loccupation des vhicules est plus importante dans la ville A que dans la ville B. Mais on ne peut faire confiance cette affirmation simplement la vue dun graphique ; il faudrait une analyse statistique plus approfondie... Un autre mode de reprsentation est le diagramme des frquences cumules. Dfinition : Frquence absolue La frquence absolue est le nombre de rptition dune valeur numrique. Exemple : Dans lexemple prcdent, frquence absolue et effectif se confondent. En ajoutant chaque effectif (dans une classe donne) leffectif prcdent, on obtient les effectifs absolus cumuls qui se reprsentent graphiquement de la faon suivante :
Diagramme des frquences cumules Le diagramme des frquences cumules permet la lecture du nombre de voiture transportant par exemple au plus 4 personnes dans la ville B. Il est souvent intressant de tracer le diagramme des frquences relatives cumules. Dans ce cas, leffectif est exprim en pourcentage. La lecture du graphique devient alors indpendante de la taille de lchantillon. 2.3. VA quantitative continue Dans le cas de ces variables, suivant la grandeur mesure et la sensibilit de la mthode utilise, il est frquent dobtenir autant de valeurs diffrentes que de donnes si bien que la reprsentation graphique na dans ces conditions aucun sens. On est donc gnralement amen regrouper les donnes en classes. A la diffrence des VA discrtes, une classe donne ne contient pas une seule valeur mais une infinit de valeurs possibles sur un intervalle dfini (appel intervalle de classe). Cet intervalle permet de dfinir galement une amplitude de classe (diffrence entre les valeurs suprieure et infrieure de la classe). La valeur centrale de la classe est appele centre de classe. La rpartition des donnes brutes en classes ncessite donc de la part du statisticien de faire un choix sur le nombre de classes et donc sur lamplitude. Ce choix doit tre suffisamment judicieux pour permettre la reprsentation graphique des donnes sans perdre pour autant trop dinformation initialement contenue dans la srie statistique. Dfinition : Histogramme Cest un ensemble de rectangles accols ayant les caractristiques suivantes : 1. la base de chaque rectangle correspond lamplitude dune classe. Gnralement toutes les classes dune srie statistique ont mme amplitude. 2. la hauteur du rectangle est gale soit leffectif absolu (ou frquence absolue) de la classe, soit la frquence relative (correspondant au rapport n i /n o n i est leffectif absolu de la classe i et n leffectif total de la srie statistique). La surface de chacun des rectangles, si lamplitude de classe est constante est alors proportionnelle leffectif de la classe 3. Il peut tre intressant de tracer lhistogramme des densits de frquences. La densit de frquence f xi correspond au rapport , o xi est lamplitude de classe (ou base du rectangle). La surface dun rectangle (f xi . xi ) dans cette reprsentation graphique est alors gale la frquence relative de la classe correspondante et la surface totale des rectangle est gale 1 quelle que soit la distribution initiale On verra par la suite que lon peut gnraliser ce rsultat la distribution dune variable continue. Exemple : Lexemple suivant montre la distribution des poids de naissance de nouveau-ns dans une maternit (donnes extraites de : D. Schwartz, mthodes statistiques lusage des mdecins et des biologistes, Mdecine-Sciences, Flammarion 4 me ed. )
Distribution des poids de naissance Dans cet exemple, toutes les classes ont mme amplitude (200 g) et il y a au total 16 classes ce qui est un nombre suffisant pour reprsenter la distribution initiale (200 valeurs). On remarquera quune partie de linformation initiale a t perdue puisqu la vue du tableau il nest plus possible de diffrencier les nouveau-ns dune mme classe. A partir de ce tableau de valeurs, on peut tracer les histogrammes des effectifs absolus, des frquences relatives et des densits de frquence.
Distribution des poids la naissance
Distribution des poids la naissance Dfinition : Polygone des frquences Le polygone des frquences est reprsent en joignant les milieux des cots suprieurs des rectangles dans un histogramme. Cest une ligne brise dont les extrmits rejoignent laxe des abscisses.
Polygone des frquences relatives Dfinition : courbe des frquences relatives cumules
Courbe des frquences relatives Ce type de courbe permet une lecture rapide du pourcentage de nouveau-ns dont le poids est compris entre deux valeurs. Il suffit de faire la diffrence entre les 2 ordonnes correspondant lintervalle de poids fix. 2.4. Conclusion La reprsentation graphique dune srie statistique est une tape trs importante dans lanalyse dun problme statistique car elle donne une information sur la forme de la distribution observe. Cette forme est souvent caractristique, comme lallure en cloche observe pour les histogrammes de poids des nouveau-ns. Nous verrons que cette allure en cloche caractrise la distribution dun grand nombre de variable alatoires. Pour un chantillon donn, lanalyse graphique de la distribution, couple une tude statistique plus approfondie fournit une indication sur la distribution de la variable alatoire dans la population do lon a extrait lchantillon. Dans la dmarche de qualit visant matriser un processus industriel, cette approche permet de contrler le procd et de prdire les proprits d'une fabrication. Ainsi, si la forme de la distribution ne varie pas d'un lot de fabrication un autre, on dispose d'un lment positif pour dmontrer la stabilit du processus. Deux lments, autres que la forme de la distribution apparaissent galement lorsque l'on dcrit graphiquement une srie statistique. On remarque en effet que les valeurs se distribuent autour d'une valeur centrale avec un talement (une dispersion) plus ou moins grand(e). L'analyse de ces deux paramtres, tendance centrale et dispersion, permettent de dcrire de faon quantitative une distribution statistique.