Vous êtes sur la page 1sur 40

CAPACITES D'ORTHOPHONIE ET D'ORTHOPTIE

Statistiques descriptives

Grard Soula LERTIM Facult de Mdecine Marseille

Support de cours d'aprs le polycopi : Biostatistique en PCEM1 H. Chaudet, B. Giusiano, J. Gouvernet, M. Roux, E. Sanchez, M. Fieschi

Introduction gnrale aux statistiques

Avant propos
Objectif = initiation mthodologique l'analyse et au traitement des donnes en biologie et en mdecine.

Gnralits
La mthode statistique a pour but de: dgager certaines proprits d'un ensemble de mesures (ou d'observations) ou de dcrire cet ensemble (appel population).

Population, chantillon Une population peut tre tout aussi bien un groupe d'tres humains ou un ensemble d'objets. Tous ces lments ont en commun un attribut ou encore une proprit qui caractrise cet ensemble d'lments.
Exemple: Les individus de sexe masculin.

Le statisticien n'tudie pas le caractre sur lensemble de la population, mais sur un chantillon extrait de la population: La taille de la population peut tre trs importante et le cot de l'enqute serait trop important. L'accs tous les individus de la population est matriellement impossible. L'tude du caractre peut dtruire les lments de la population. Le nombre dlments constituant l'chantillon est appel l'effectif ou la taille de l'chantillon. Un bon chantillon doit constituer une image rduite de l'ensemble de la population dont on veut tudier un caractre bien dfini. Dans le cas contraire, on dit que l'chantillon est biais. Le choix de l'chantillon, le recueil des donnes ncessaires l'tude que l'on se propose, constituent la partie fondamentale, la plus longue, de l'tude. Afin de gnraliser les rsultats obtenus sur l'chantillon, on dsire que celui-ci reprsente le mieux possible la population cible cest dire celle sur laquelle porte ltude.

Echantillonnage Comment choisir un chantillon pour qu'il soit reprsentatif? Tirage au hasard Un chantillon ne doit en aucun cas tre choisi par commodit. Afin de disposer dun chantillon reprsentatif, il faut le constituer dune manire alatoire: un vritable tirage au sort , utilisation des tables de nombres alatoires Stratification On subdivise la population en sous groupes (ou strates). On choisit ensuite l'chantillon en tirant au sort dans les strates. Chaque strate peut tre reprsente en fonction de son importance dans la population.
Exemples: Si l'on veut faire une enqute pidmiologique sur l'hypertension artrielle, on pourra constituer un chantillon qui sera un modle rduit de la population tudie. En stratifiant de telle sorte quil respecte les mmes proportions que la composition de la population quant aux catgories socioprofessionnelles, aux tranches d'ges, au sexe.... Dans un essai thrapeutique d'un traitement anticancreux, on pourra dfinir les strates en tenant compte des facteurs pronostiques tels que: taille de la tumeur, extension locorgionale, mtastase distance,....

Le prlvement de l'chantillon doit tre fait au hasard.

Il n'est pas toujours facile de prlever un bon chantillon.


Exemple de difficults dans le chois d'un chantillon: On se propose d'tudier le pourcentage de dcs dans la population franaise des sujets atteints d'un infarctus du myocarde. On peut constituer un chantillon en observant les dcs des malades qui ont t hospitaliss dans un service hospitalier donn. Le biais introduit, si la population cible est la population de tous les franais, est vident. En effet, le service hospitalier a un recrutement particulier et une renomme telle qu'il hrite, peut-tre, de malades plus graves, ou d'une catgorie sociale dont le genre de vie, l'alimentation, l'ge...., sont des facteurs pronostiques qui peuvent modifier l'issue de la phase aigu. Un chantillon reprsentatif de la population franaise atteinte d'un infarctus du myocarde pourrait tre obtenu par tirage au sur tous les cas d'infarctus du myocarde recenss en France. Toutefois on ne les connat pas tous et il est toujours possible d'introduire un biais.

Problme de lestimation
Il sagit dvaluer un paramtre (une caractristique) sur un chantillon pour pouvoir estimer ce paramtre pour la population toute entire.
Exemple: Evaluation, partir de la mesure de la glycmie pratique sur un chantillon de sujets sains ayant entre 20 et 40 ans, de la valeur moyenne de la glycmie pour tous les sujets sains de cette tranche d'ge. Si l'on veut que cette estimation soit aussi prcise que possible, il est ncessaire que l'chantillon soit aussi reprsentatif que possible de la population.

Les tests statistiques


Problme: de tirer des conclusions sur la population partir de l'tude d'un ou plusieurs caractres observs sur les individus d'un ou de plusieurs chantillons issus de cette population. Ce problme inclut celui de la comparaison de caractristiques (une ou plusieurs) issues de 2 ou plusieurs populations. (comparer la glycmie moyenne des sujets urbains et des sujets ruraux). Solution: les tests statistiques qui sont des tests d'hypothses. Ils permettent de faire des infrences statistiques.

Statistique descriptive

Buts de la statistique descriptive

Toute srie d'observations comporte un certain nombre de donnes relatives un ou plusieurs caractres ou encore variables.

Le but des statistiques descriptives est de dcrire un ensemble d'observations l'aide de quelques lments caractristiques.
Exemple: la taille des Franais adultes. Dans ce cas les mesures seront nombreuses, le tableau des donnes, c'est-dire la liste des tailles de tous les sujets, ne donnera, au premier abord, aucun renseignement clair. Grce aux statistiques descriptives, on caractrisera cet ensemble d'individus par un moyen simple qui permettra de rduire le nombre de donnes. Par exemple, si on s'intresse la taille, on procdera au calcul de la valeur moyenne de la taille.

De cette faon, il est bien certain que l'on perd de l'information, mais on gagne en commodit de manipulation.

Pour prsenter les donnes, le premier travail consiste donc rassembler et prsenter clairement les observations. Plusieurs cas sont envisager suivant le type des donnes recueillies: qualitatif, ordinal, quantitatif.

Les diffrents types de donnes

1) Les donnes de type qualitatif Un caractre est qualitatif s'il peut se prsenter sous plusieurs aspects ou suivant plusieurs modalits. Ces donnes donnent lieu des dnombrements.
Exemples: le sexe, la couleur des yeux, l'efficacit ou la non efficacit d'un traitement, la nature des cellules d'un tissu, le groupe sanguin,....

On est amen dfinir des catgories ou classes exclusives correspondant aux diffrentes modalits du caractre observ, puis dterminer quelle classe appartient chaque individu.

Un individu appartient une classe et une seule.

2) Donnes de type ordinal

Le caractre observ est de type ordinal s'il existe entre les diverses classes une relation d'ordre.
Exemple de relation d'ordre: plus grave que...., de meilleur pronostic que.... Exemple: Classification en stades 1, 2, 3, 4 des patients atteints de la maladie de Hodgkin. Les malade au stade 2 sont plus gravement atteints que ceux qui sont classs au stade 1...

on affecte chaque individu une classe et une seule.

Il existe un ordre sur les classes.

3) Donnes de type quantitatif

Une variable quantitative prend pour valeur un nombre rsultant de la mesure, avec une unit, du caractre chez chaque individu.

La mesure est telle qu'une mme diffrence entre des valeurs observes a toujours la mme signification.
Exemple de la mesure de la taille: Soient 4 individus A, B, C, D dont les tailles sont exprimes en centimtres: A = 175 cm; B = 180 cm; C = 165 cm; D = 170 cm. (On peut dire que 180 - 175 = 170 - 165 = 5 cm.)

Un caractre quantitatif est : discret s'il prend des valeurs isoles, continu s'il prend toutes les valeurs, de son intervalle de variation.
Exemples de caractres quantitatifs discontinus (ou discrets): nombre d'enfants dans une fratrie, nombre de cellules par mm3,... Exemples de caractres quantitatifs continus: tension artrielle, glycmie,...)

Caractrisation des donnes

I) Caractrisation des donnes qualitatives et ordinales unidimensionnelles

II) Caractrisation des donnes qualitatives deux dimensions

III) Caractrisation des donnes quantitatives une dimension

IV) Caractrisation des donnes quantitatives deux dimensions

Caractrisation des donnes qualitatives et ordinales unidimensionnelles

1) Frquence absolue et tableau des effectifs

2) Frquences relatives

3) Frquences cumules (relatives et absolues)

4) Diagramme "camembert" 5) Diagramme en btons et mode

1) Frquence absolue et tableau des effectifs La frquence absolue est le nombre d'individus par classe.

Ce dnombrement donne lieu une reprsentation des donnes sous forme de tableau.
Exemple: On a dnombr sur une ensemble de 180 sujets, les individus qui appartenaient aux diffrents groupes sanguins.

A+ 80

A10

B+ 20

B5

AB+ 5

AB2

O+ 50

O8

Description de l'chantillon des groupes sanguins Sur les classes ainsi formes, seules les oprations suivantes sont permises: raliser des classes disjointes partir d'une seule classe, regrouper certaines classes. La seule relation qui puisse tre utilise sur ces donnes est la relation d'appartenance une mme classe.
Exemple: regrouper les classes correspondant aux rhsus + ou -, ou ignorer le rhsus pour former les groupes A, B, AB, O

A 90

B 25

AB 7

O 58

Description de l'chantillon des groupes sanguins sans facteur rhsus

2) Frquences relatives

Les frquences relatives sont, pour chaque classe, le rapport de son effectif au nombre total d'individus de la srie des mesures.

La somme des frquences relatives est gale 1.

Parfois, les rsultats sont exprims en pourcentage, chacune des frquences relatives tant multiplie par 100 et arrondies l'unit A 50% B 14% AB 4% O 32%

Frquences relatives (exprimes en pourcentage)

3) Frquences cumules (relatives et absolues) Les frquences cumules sont utilises pour les donnes ordinales qui prsentent des classes ordonnes.

Exemple: Sur un chantillon de 500 malades cancreux, on a not le stade de la maladie. On peut rsumer ou prsenter ces donnes par des frquences relatives.

Stade

Nombre de Frquence Frquence malades relative (%) relative cumule(%) 350 110 30 10 70 22 6 2 70 92 98 100

1 2 3 4

Rpartition du Stade de la maladie


Cette prsentation permet de dire, par exemple, que 92% des sujets examins ont un stade infrieur ou gal 2.

4) Diagramme "camembert"

On peut reprsenter les effectifs absolus ou relatifs des classes par des secteurs de cercle dont la surface est proportionnelle l'effectif.

Le diagramme "camembert" est bien adapt la reprsentation des donnes qualitatives "pures".
Exemple:

Yeux Effectif

marron 50

vert 10

bleu 28

noir 12

Couleur des yeux dans un chantillon de 100 sujets

Diagramme "camembert"

5) Diagramme en btons et mode 5.1) Diagramme en btons Pour les donnes ordinales on peut galement reprsenter les frquences absolues, relatives ou cumules par un diagramme en btons.
Exemple: chantillon de 500 cancreux dont on a not le stade.

Stade

Nombre de Frquence Frquence malades relative (%) relative cumule 350 110 30 10 70 22 6 2 70 92 98 100

1 2 3 4

Rpartition du Stade de la maladie

Diagramme en btons des stades de la maladie

5.2) Mode Le mode ou classe modale est la classe (catgorie) qui offre la plus grande frquence.
Exemple:

Diagramme en btons des stades de la maladie


La classe caractrise par le stade 1 est la classe qui contient le plus grand nombre de sujets, c'est le mode ou classe modale.

Dans le cas de variables ordinales, si les donnes montrent plusieurs classes d'effectifs suprieurs aux effectifs des classes voisines, on dit que le diagramme reprsente une distribution multimodale: bi-modale, tri-modale... Dans le cas contraire, on dit que la distribution est uni-modale.

Caractrisation des donnes qualitatives deux dimensions


Les modalits de deux variables qualitatives permettent de constituer des classes exclusives auxquelles sont affectes chaque observation. Les classes exclusives sont reprsentes sous la forme d'un tableau appel tableau de contingence.
Exemple: Dans un chantillon de 200 sujets on a relev la prsence ou l'absence d'un signe clinique S cet d'une maladie M. Les malades prsentant la maladie sont dnombrs dans la colonne M, les autres dans la colonne non M.

M S non S Total 90 30 120

non M 30 50 80

Total 120 80 200

Tableau de contingence Ce tableau comporte deux parties: les effectifs dnombrs pour chacune des modalits, pour chacun des deux caractres tudis, les effectifs de chaque modalit d'un caractre, quelles que soient les modalits de l'autre caractre. Ces effectifs sont situs dans la dernire colonne et la dernire ligne. La dernire ligne et la dernire colonne sont appeles: les "marginales", (marge ligne et marge colonne) ou encore "distributions marginales".

Caractrisation des donnes quantitatives une dimension


1) Gnralits Rappel: les variables quantitatives peuvent tre de deux types: variables discontinues (ou discrtes) et variables continues. Dans le cas des variables discontinues, il est possible de reprsenter les donnes par un diagramme en btons, comme dans le cas de donnes ordinales. Dans tous les cas, on peut diviser l'intervalle de variation de la variable en un certain nombre de classe et l'on dnombre toutes les mesures l'intrieur de chaque classe.
Exemple: soit la srie de mesures reprsentant les ges de 20 individus, ranges par ordre croissant: 3, 5, 6, 7, 8, 11, 15, 20, 21, 22, 23, 23, 23, 30, 31, 32, 35, 36, 40, 45 On peut dcider de dterminer des classes d'ge de 10 ans en 10 ans: 0-10 ans, 10-20 ans, 20-30 ans, 30-40 ans, 40-50 ans.

Classe 1 2 3 4 5

Effectif/Classe 5 2 6 5 2

Effectifs par classe

2) Histogramme Construction: on porte sur l'axe des abscisses les extrmits de chaque classe et pour chacune d'elles on construit un rectangle dont la base est le segment limit aux extrmits de la classe et la surface est proportionnelle l'effectif de la classe. La surface limite par la ligne polygonale obtenue en bordant la partie suprieure de l'ensemble des rectangles s'appelle l'histogramme.

Histogramme Un histogramme est trac en respectant deux rgles: l'chelle sur l'axe des abscisses est identique pour tous les intervalles de classes, la surface de chacun des rectangles est proportionnelle au nombre d'individus de la classe. La deuxime rgle se simplifie si les intervalles de classe ont tous la mme largeur. Cette simplification est trs souvent utilise. En effet quand les intervalles de classe sont de mme largeur, la hauteur du rectangle est proportionnelle l'effectif, ce qui facilite la lecture de

l'histogramme.

Le contour polygonal joignant les milieux des bases suprieures des rectangles s'apple le polygone des frquences.

Histogramme et polygone des frquences

Si on augmente le nombre des classes recouvrant l'tendue de l'chantillon, l'intervalle de chaque classe devenant trs petit, on peut admettre, condition que la population soit "infinie", que l'histogramme et le polygone des frquences se "rapprochent", et que leur limite commune est une courbe continue.

Courbe de frquences et distribution des frquences Cette courbe est dite "courbe des frquences". L'ensemble des classes affectes de leur frquence constitue une distribution de frquences. Quand le nombre de classes tend vers l'infini, le polygone des frquences devient une ligne continue: la courbe des frquences.

3) Paramtres statistiques dcrivant un ensemble de mesures quantitatives.

Problme: prsenter de faon simple et abrge, les caractristiques principales de l'ensemble des mesures qui ont t effectues sur un chantillon ou une population.

Solution: utiliser des grandeurs numriques appeles paramtres de la distribution rparties en deux catgories: les paramtres de position: moyenne, mdiane, mode les paramtres de dispersion: variance, cart-type, quantiles.

Ces paramtres font partie des grandeurs statistiques que l'on nomme parfois "statistiques". On dira par exemple que le calcul de la moyenne est le calcul d'une statistique.

3.1) Paramtres de tendance centrale ou de position: moyenne, mdiane, mode Ces paramtres dfinissent l'ordre de grandeur de l'ensemble des mesures de la distribution. Ce sont les valeurs autour desquelles se groupent les diffrentes mesures. La moyenne La valeur centrale la plus utilise est la moyenne arithmtique de la variable mesure, c'est--dire le rapport de la somme des mesures au nombre de mesures effectues. On peut caractriser la tendance centrale par la moyenne note:
1 n x = n xi X=n i i=1 n i=1

La moyenne s'exprime dans les mmes units que les valeurs observes.

Notations: {x1, x2,....... xn} la srie de mesures, X la moyenne, n l'effectif.


Exemple: Considrons la srie de mesures constitue par les poids en Kg de 5 individus: 72,5 ; 70,0 ; 76,0; 68,5 ; 73,0. La moyenne est gale 72 kg.

La mdiane La mdiane est l'abscisse du point qui laisse de part et d'autre un nombre gal d'observations. C'est donc un nombre de mme nature et de mme unit que les valeurs observes. Pour dterminer la mdiane d'une srie de nombres, il est ncessaire d'ordonner cette srie de mesures.
Exemple : poids en Kg de 5 individus: 72,5 ; 70,0 ; 76,0; 68,5 ; 73,0. mesures ordonnes: 68,5 ; 70 ; 72,5 ; 73,0 ; 76,0. La mdiane est gale 72,5 Kg. (il y a autant de mesures infrieures 72,5 que de mesures suprieurs 72,5) .

Deux cas peuvent se prsenter: si n est impair (n = 2k + 1), la mdiane est la valeur de la mesure qui se situe au milieu de la srie de mesures ordonnes: c'est xk+1 Si n est pair (n = 2k), on appelle mdiane toute valeur comprise entre xk et xk+1. En effet, il n'y a pas de valeur observe qui soit au milieu de la srie de mesures. Remarques: La mdiane est moins influence que la moyenne arithmtique par les valeurs extrmes de la variable.
Exemple :Si le premier des poids (68,5 kg) est remplac par 55 kg, la moyenne est influence alors que la mdiane reste identique.

La mdiane peut aussi tre utilise dans le cas des donnes ordinales, puisque sa dtermination se base sur l'ordre des donnes.

Le mode Le mode, encore appel valeur dominante, est la valeur de la variable dont la frquence est maximale.

Si les donnes sont affectes des classes, on parle de classe modale. La classe modale est celle dont la frquence est maximale. C'est, dans le cas d'une courbe continue des frquences, l'abscisse du point d'ordonne maximale.

Si la distribution de frquences est symtrique et unimodale, moyenne arithmtique, mdiane et mode sont confondus.

Distribution symtrique et dissymtrique

Il peut, dans certaines distributions, n'y avoir qu'un petit nombre d'observations dans le voisinage de la moyenne ou de la mdiane Aucune valeur de X ne se trouve prs de la moyenne et de la mdiane.

Moyenne et dispersion Une distribution peut avoir plusieurs classes modales, elle est dite alors: bimodale, trimodale,....., plurimodale (plusieurs classes dont les effectifs sont grands, spares par des classe effectifs faibles). Une telle distribution traduit gnralement un chantillon d'individus htrognes.

Proprit de la moyenne Soit la srie de mesures {x1, x2,....xn} de moyenne constantes a et b (a 0). Considrons la srie: {y1,..... yn} telle que y1 = ax1 + b , y2 = ax2 + b ,....... yn = axn + b ; soit {ax1 + b;....; axn +b} La moyenne de cette nouvelle srie est gale
Y

et deux

= aX + b

3.2) Paramtres de dispersion Problme: la moyenne ne suffit pas pour caractriser un ensemble de donnes.
Exemples: La valeur moyenne de la srie suivante: 1, 8, 9, 10, 11, 12, 19 est gale 10. La valeur moyenne de la srie 8, 8, 9, 10, 11, 12, 12 est gale 10. La dispersion des mesures autour de la moyenne 10 est beaucoup moins importante.

Paramtres de dispersion et de position

Solutions: Variance, cart-type, Etendue, Quantiles

Variance Le paramtre le plus efficace pour rendre compte de la dispersion d'une srie de mesures est la variance ou sa racine carre: l'carttype.

La variance est dfinie comme la moyenne arithmtique des carrs des carts la moyenne de l'chantillon.

n (xi X )2 Var(X)= n i=1


o
X

est la moyenne de la srie de mesures et n l'effectif.

Proprit de la variance

Var(X)=

x2 i=1 i

"Moyenne des carrs moins carr de la moyenne"

Attention: Var(X) est la variance de l'chantillon, ce n'est ni la variance de la population dont est issu l'chantillon, ni l'estimation de la variance de la population.

Ecart-type l'cart-type est la racine carre de la variance, afin de disposer d'un indice de dispersion qui s'exprime dans la mme unit que la grandeur mesure.

Ecart type(X)= Var(X)


Exemple: calcul de variance et d'cart-type de la mesure des poids d'individus dans un chantillon de moyenne 72 kg.

xi x iX

70 -2 4

68,5 -3,5 12,25

72,5 0,5 0,25

73 1 1

76 4 16

(xi- X )2

Variance = 33,5 / 5 = 6,7 Kg2 Ecart-type = 2,59Kg.

xi

70

70

72,5

73

76

Ecart-type = 2,23Kg.

xi

70

60

72,5

73

76

Ecart-type = 5,5Kg.

Proprit de la variance: Soit la srie {x1, x2,......xn} de moyenne X et de variance Var (X) et deux constantes a et b (a0). Considrons la srie {y1,..., yi,...,yn} sachant que yi = axi + b. Soit {y1 = ax1 + b;......;yn = axn + b}. Le calcul montre que la variance de cette nouvelle srie (que nous noterons Var(Y)) est gale :

Var(Y)= a2Var(X) ecart type(Y)= a Var(x) = a ecart type(X)

Etendue On dfinit l'tendue d'une srie de mesures comme la diffrence entre la plus grande et la plus petite valeur de la srie:

e=xmax-xmin

Quantiles Les quantiles sont les valeurs de la variable qui divisent l'chantillon ordonn en groupes d'effectifs gaux.

Selon le nombre de groupes souhaits les quantiles portent des noms diffrents: quartiles pour 4 groupes, dciles pour 10 groupes, percentiles pour cent groupes.

Les quartiles Les quartiles sont les abscisses correspondant aux valeurs de la srie X qui partagent l'effectif total, aprs l'avoir ordonn, en 4 classes de mme effectif. Entre la limite infrieure de l'tendue et le premier quartile, on retrouve un quart des observations. Un autre quart des observations se retrouve entre le premier et le deuxime quartile. Remarque: le deuxime quartile n'est autre que la mdiane.
Exemple: Ages de n = 20 individus: 3, 5, 6, 7, 8, 11, 15, 20, 21, 22, 23, 23, 23, 30, 31, 32, 35, 36, 40, 45. L'effectif de chaque quartile est de 5. La valeur qui spare le 1er groupe du 2me est situe entre 8 et 11. Toute valeur comprise entre 8 et 11 peut tre retenue comme premier quartile, toute valeur entre 22 et 23 comme deuxime quartile.

Les carts inter-quartiles donnent une ide de la dispersion: plus les donnes sont groupes, plus l'espace inter-quartile est faible. (Diffrence entre la premire et dernire valeur contenue dans le quartile). Les percentiles Les percentiles dfinissent 100 groupes d'effectifs correspondants chacun 1% de l'effectif de l'chantillon. Le 50ime percentile correspond la mdiane. Remarque: Mode, mdiane, quantiles peuvent tre utiliss dans le cas de donnes ordinales

Caractrisation des donnes quantitatives deux dimensions

Considrons des mesures X et Y effectues sur un chantillon d'effectif n. Deux mesures ont t effectues en mme temps sur le mme individu "i": xi et yi.
Exemple: On peut mesurer chez n individus la concentration sanguine du potassium et du chlore. Nous obtenons pour chaque individu le couple de mesures(xi , yi).

Problme: comment caractriser ces mesures ?

Solutions: nuage de points, covariance, coefficient de corrlation

1) Nuage de points Chacune des observations (xi , yi) est reprsente par un point dans le plan.

L'ensemble des points constitue "un nuage de points". L'aspect de ce nuage est important observer.

Le point ayant pour coordonnes ( X , Y ) reprsente le point "moyen". Ce point, not G, dont les coordonnes sont les moyennes des deux sries d'observations, s'appelle: "centre de gravit".

Nuage de points

2) Covariance Rappel: Variance = dispersion d'une donne quantitative. Covariance = dispersion d'une donne quantitative deux dimensions. La covariance caractrise la dispersion des points de coordonnes (xi , yi) par la moyenne du produit des carts, pour chaque point, entre ses coordonnes et leurs valeurs moyennes.

1 n (x X )(y Y ) Covar(X,Y)= n i i=1 i


3) Coefficient de corrlation Le coefficient de corrlation, not r, est une grandeur qui reflte la dispersion des couples (xi , yi) en fonction de la dispersion observe pour chacune des deux sries de mesures X et Y.

r=

Covar(X,Y) Var(X)Var(Y)

Remarque: r est un nombre sans dimension et on montre qu'il est compris entre -1 et 1.

Ce qu'il faut savoir absolument


Type de donnes Prsentation des donnes Dnombrement par classes Qualitatif Frquences absolues Frquences relatives Dnombrement par classes ordonnes Ordinal Frquences absolues Frquences relatives Frquences cumules Tableau des mesures Paramtres de tendance Quantitatif centrale (ex: moyenne) Paramtres de dispersion (ex: variance, carttype) Histogramme Covariance Coefficient de corrlation Nuage de points Diagramme en bton Camembert Reprsentation graphique Donnes 2 dimensions Tableau de contingence Regroupement libre

Tableau de contingence Regroupement des classes contigus

Reprsentation des diffrents types de donnes

Type de donnes
Quantitatif

Paramtre central moyenne


mdiane

Calcul
n n xi X = 1 x = n n i=1 i i=1

Unit
celle des xi

Ordinal

mode

Valeur(s) qui spare(nt) l'ensemble des donnes ordonn(es) en deux celle des xi sous ensembles de mme effectif classe de plus grand celle des xi effectif

Paramtres de tendance centrale d'une srie d'observations

Type de donnes

Paramtre de dispersion variance

Calcul

Unit
unit des xi au carr celle des xi

n (xi X )2 Var(X)= n i=1


Var(X)

Quantitatif cart-type quantiles

Ordinal

quantiles

valeur de la variable divisant l'ensemble ordonn des donnes en celle des xi sous ensembles d'effectifs gaux valeur de la variable divisant l'ensemble ordonn des donnes en celle des xi sous ensembles d'effectifs gaux

Paramtres de dispersion