Vous êtes sur la page 1sur 5

PARAMETRES DE POSITION (VALEURS CENTRALES)

ET DE DISPERSION

INTRODUCTION
Avec ltude des paramtres de position (les valeurs centrales) et des paramtres de dispersion, cest une nouvelle phase dans lexploration des distributions statistiques. Paramtres de position : ! Moyenne ! Mode ! Quantiles (mdiane, quartiles, dciles, centiles) Paramtres de dispersion : ! Ecart type ! Ecarts interquantiles ! Etendue

QUEL EST LINTERET DE CES VALEURS ?


Les paramtres de position (ou valeurs centrales) sont des valeurs numriques qui rsument une srie statistique en caractrisant lordre de grandeur des observations. Ils sexpriment dans la mme unit que les observations. Les paramtres de position permettent de situer la position de plusieurs sries comparables. Lorsque la distribution est parfaitement symtrique, mode, moyenne et mdiane sont confondues.
ni

xi Paramtres de position 1 Paramtres de position 2

Les deux courbes ont la mme allure, mais ne se positionnent pas du tout au mme endroit sur laxe des valeurs (des modalits). Les paramtres de position le mettent clairement en vidence.

Cependant, comme le montre le schma qui suit, ces paramtres ne suffisent pas pour rsumer , pour dcrire (de faon synthtique) une distribution. En effet, ces paramtres permettent de situer la gamme de valeur o la srie se situe, mais, pour des paramtres de position trs proches, on peut rencontrer des courbes dont la dispersion (la forme) est trs diffrente. Cest ici quinterviennent les paramtres de dispersion.
Forte dispersion xi Mmes paramtres de position Faible dispersion ni

RAPPELS
A) PARAMETRES DE POSITION (VALEURS CENTRALES)

La moyenne arithmtique (

x ) dune variable est gale la somme des valeurs prises par cette

variable divise par le nombre dindividus.

Le mode (Mo) dune distribution est la valeur de la variable pour laquelle leffectif, la frquence ou la densit de frquence est la plus leve. Pour une variable discrte ou quantitative continue non classe, le mode est dfini avec prcision. Sil y a deux valeurs qui se suivent et qui ont le mme effectif, on parle dintervalle modal. Si elle ne se suivent pas, on dit que la distribution est plurimodale. Pour les variables quantitatives classes (discrtises), on parle de classe modale. Si les classes sont dgales amplitudes, la classe modale sera la classe o leffectif ou la frquence est la plus leve. Si les classes sont dingales amplitudes, la classe modale sera la classe o la densit de frquence est la plus leve. Dans les deux cas, on value graphiquement le mode en joignant les bornes suprieures et les bornes infrieures des classes qui prcdent et succdent la classe modale, comme le montre le schma ci-contre.
Mo xi dens. de fi classe modale

La mdiane (Me) dune distribution est la valeur de la variable qui partage la srie statistique en deux sous-ensembles dgal effectif, c-a-d 50% a une valeur infrieure la Me, et 50% une valeur suprieure. La mdiane est un quantile particulier. On appelle quantile dordre %, et on note Q la valeur xi de la variable telle que % des valeurs observes soient infrieures strictement xi. Ainsi, la mdiane est le quantile dordre 50%. Parmi les quantiles, on calcule gnralement certains dentre eux (bien quon puisse calculer le quantile que lon veut) : les quartiles, les dciles ou les centiles.

Les 3 quartiles partagent la distribution en 4 sous-population de mme taille : 25 % de la population est infrieure au 1er quartile Q25 ou Q1, 50 % de la population est infrieure au 2me quartile Q50 ou Q2 (la mdiane Me), 75 % de la population est infrieure au 3me quartile Q75 ou Q3. Les 9 dciles et les 99 centiles partagent la distribution en 10 et 100 sous-population de mme taille.

Calcul des quantiles dordre k :

1) rang du quantile Qk RQk = (n x FQk) + 0,5_ n : effectif total FQk : frquence du quantile dordre k, c-a-d : D1 0,1 ; Q1 0,25 ; Q2 (Me) 0,5 ; Q3 0,75 ; D9 0,9 ; etc 2) valeur du quantile Qk

X RQk = [ (RQk - RQk inf) x (X RQk sup - X RQk inf)] + X RQk inf_
RQk : rang du quantile recherch RQk inf : rang de valeur entire infrieure de RQk

X RQk : valeur du quantile recherch X RQk sup : valeur de lindividu de rang RQk sup X RQk inf : valeur de lindividu de rang RQk inf

B) PARAMETRES DE DISPERSION Lcart-type () sexprime dans la mme unit que les valeurs observes et mesure la dispersion autour de la moyenne. Plus lcart-type est grand, plus la dispersion de la distribution autour de la moyenne est importante. Plus lcart-type est petit, plus la distribution est rassemble autour de la moyenne. Cest une caractristique de dispersion couramment utilise car son traitement mathmatique est facile.

variance

1 n

(x

x) 2

Les carts interquantiles ou intervalles interquantiles dordre % contiennent % des valeurs observes centrales.

Lintervalle interquantile [Q25 ; Q75] ou [Q1 ; Q3] contient 50 % des observations centrales ; Lintervalle interdcile [Q10 ; Q90] ou [D1 ; D9] contient 80 % des observations centrales ; Lintervalle intercentile [Q1 ; Q99] ou [C1 ; C99] contient 98 % des observations centrales.
C1 xmin 50% : interquartile 80% : interdcile 98% : intercentile D1 Q1 Q2 = Me Q3 D9 C99 Xmax

Reprsentation graphique : les botes moustaches

La bote moustaches (box plots en anglais) est une reprsentation graphique dune variable numrique rsume par les caractristiques suivantes : ! ! ! ! ! ! ! valeur minimale D1 (facultatif) Q1 Q2 (Me) Q3 D9 (facultatif) valeur maximale

Ces boites permettent de comparer diffrentes distributions selon ces 5 (ou 7) paramtres de position et dillustrer leur dispersion en mettant en vidence lintervalle interquartile, lintervalle interdcile et ltendue de chacune delles.

Cette reprsentation graphique est construite sur un axe gradu vertical (ou horizontal) de la faon suivante :

1. on trace un rectangle, de largeur arbitraire, qui stend du premier au dernier quartile ; 2. on partage ce rectangle par une ligne trace au niveau de la mdiane ; 3. on ajoute les moustaches c-a-d des segments stendant de la valeur minimale au 1er quartile (Q1) et du dernier quartile (Q3) la valeur maximale. 4. on repre, sur ces segments, lemplacement des dciles (D1 et D9).

110 100 90

valeur maximale dernier dcile 25 % 25 %


10 %

dernier quartile 80 70 50 % 60 50 premier quartile 40 30 20


10 %

25 % 80 %

mdiane 25 %

premier dcile

25 %

25 %

10 Valeur de la variable x

valeur minimale

Ltendue est gale la diffrence entre la valeur maximale de la distribution est la valeur minimale.

"