Vous êtes sur la page 1sur 14

L1-S1 Lire et caractriser l'information gographique

- Le traitement statistique univari

Statistique : le terme statistique dsigne la fois :

1) l'ensemble des donnes numriques concernant une catgorie de faits (sens trs ancien). Il s'agit de
l'expression dans sa signification la plus usuelle (ex. "la statistique du chmage en 1995")
2) l'ensemble des mthodes mathmatiques permettant :
a) de rsumer quantitativement l'information recueillie sur un ensemble d'lments au moyen d'une
investigation exhaustive. C'est la statistique descriptive, qui fait l'objet de ce cours.
b) de gnraliser de grands ensembles d'lments les conclusions tires des rsultats obtenus avec
des ensembles beaucoup plus restreints appels chantillons. C'est la statistique infrentielle ou
probabiliste, qui n'est pas aborde dans cette UE

1. Vocabulaire : Introduction au tableau lmentaire

Ensemble : c'est la collection (le plus souvent finie en gographie) d'units, ou d'lments, sur laquelle porte
l'observation. Pour que cet ensemble soit correctement dfini, il faut lui donner une dfinition prcise de
faon ce que deux personnes diffrentes aboutissent toujours la mme liste d'lments. L'ensemble des
lments observs sera appel E.

Elment : les lments sont les objets constitutifs de l'ensemble. Ce sont des objets dtermins dont
l'appartenance tel ou tel ensemble E est sans ambigut. Les lments peuvent tre dsigns par leur
position dans le tableau de donnes : 1 pour le premier, i pour un lment quelconque, N pour le dernier
lment.

Caractre : les lments d'un ensemble sont dcrits par un caractre. Cela revient tablir une
correspondance entre chaque lment i de l'ensemble E et l'ensemble X des modalits ou des valeurs du
caractre. La fonction f E --> X i --> xi est une application au sens mathmatique: chaque lment de E a
une modalit (caractre qualitatif) ou une valeur (caractre quantitatif) et une seule dans X.

Modalit, Mesure : les diffrentes situations o les lments de E peuvent se trouver l'gard d'un caractre
qualitatif considr, sont les diffrentes modalits du caractre qualitatif X. Dans le cas ou le caractre X est
quantitatif, les diffrentes situations o les lments de E peuvent se trouver sont des mesures. Ces
modalits ou ces mesures doivent tre la fois incompatibles (un lment de E ne peut prendre qu'une seule
modalit) et exhaustive ( chaque lment de E doit pouvoir correspondre une modalit de X) de sorte que
chaque lment de E ait une modalit et une seule dans X.

Tableau lmentaire : c'est un tableau simple entre o les lignes correspondent aux lments de
l'ensemble tudi et les colonnes aux caractres (ou variables) dcrivant ces lments (figure 1). La premire
colonne est en principe rserve la liste nominale des lments.
Types de caractres
caractre qualitatif : les modalits ne sont pas mesurables, ce sont des noms ou ce qui revient au mme
des sigles ou des codes. Les diffrentes modalits ne sont pas ordonnables. Attention, mme si les
modalits sont des codes numriques, les oprations sur les modalits n'ont aucun sens. exemple: type
de relief avec trois modalits (plaine, montagne, plateau), ou encore taille de la ville avec quatre
modalits (petite, moyenne, grande, trs grande

Caractre ordinal: il est exprim sur une chelle ordinale: chaque modalit est explicitement
significative du rang pris par chaque individu pour le caractre considr. Si E possde N lments, les
modalits seront 1er, 2eme, 3eme, ...neme. Comme on possde juste l'ordre des individus, on ne sait rien de
l'intervalle des valeurs. Exemple: Rang des dpartements pour la population en 1999.

Caractre quantitatif : les diffrentes situations o peuvent se trouver les lments sont des mesures;
elles sont ordonnables et la moyenne a une signification

* reprable ou mesurable
- quantitatif reprable sur une chelle d'intervalle. Ces caractres permettent de reprer la
position de chaque lment par rapport une origine arbitraire. La valeur 0 est donc
conventionnelle et ne signifie pas l'absence du phnomne. Exemple: Latitude, longitude,
temprature, altitude, ...
- quantitatif mesurable sur une chelle numrique . Le 0 signifie bien l'absence du phnomne
Exemple: population, taux de fcondit, prcipitations

*stock ou taux
- les caractres quantitatifs de stock expriment des quantits concrtes : la somme des valeurs
prises par l'ensemble E des lments a un sens. Exemple: Population totale d'un dpartement.

- les caractres quantitatifs de taux expriment le rapport entre deux valeurs, on les appelle
parfois caractres de rapport. Leur total n'a pas de signification. Exemple: Densit de population
d'un dpartement , ou proportion des actifs chmeurs une date donne.

* discret ou continu
- les caractres quantitatifs discrets sont des caractres dont les diffrentes situations o peuvent
se trouver les lments sont des nombres isols dont la liste peut tre tablie a priori. Exemple:
Nombre de villes de plus de 100 000 h dans chaque dpartement.

- les caractres quantitatifs continus sont des caractres les diffrentes situations o peuvent se
trouver les lments ne sont pas dnombrables et qui sont dfinies sur un intervalle (continu) de
valeur donne. Exemples: Superficie des dpartements, Altitude moyenne des dpartements,
salaire moyen des employs en 1999

2
L1-S1 Lire et caractriser l'information gographique
- Le traitement statistique univari

2. Vocabulaire : Rsumer une distribution statistique par une mesure : les


valeurs centrales

Le but des valeurs centrales est de rsumer en une seule valeur l'ensemble des valeur d'une distribution
statistique. Il existe trois valeurs centrales : le mode, la mdiane, la moyenne.

Le mode

Le mode, ou valeur dominante, est la valeur la plus frquente d'une distribution. Cette valeur se calcule
toujours partir d'un dnombrement des modalits du caractre. Il faut donc distinguer le cas des caractres
discrets et des caractres continus (Cf. Vocabulaire 2).

* caractre qualitatif et caractre discret


Pour un caractre qualitatif, ou pour un caractre quantitatif discret ayant un nombre de modalits
infrieur au nombre d'lments, le mode est la modalit ou la valeur qui a la frquence simple la plus
leve (ou l'effectif le plus lev, ce qui revient au mme).

* Caractre quantitatif continu

Les modalits tant en nombre infini, il est peu probable que deux lments aient la mme valeur. Dans
ce cas, le mode ne peut pas tre dfini directement, il faut au pralable tablir une partition en classes. Le
mode est alors le centre de la classe modale, c'est dire de la classe qui a la frquence moyenne la plus
leve.
Le mode correspond la valeur lue en abscisse du sommet de l'histogramme. Lorsque celui-ci prsente
deux pics spars par un creux, on dit que la distribution est bimodale.

La mdiane

Les valeurs du caractre X tant classes par ordre croissant, la mdiane est la valeur du caractre qui
partage l'ensemble dcrit par X en deux sous ensembles d'effectifs gaux : 50 % des lments ont des
valeurs de X suprieures X md et 50% prennent des valeurs infrieures. La mdiane ne peut tre
calcule que pour les caractres quantitatifs.

Calcul partir du tableau lmentaire :

On ordonne le tableau, et on cherche l'lment qui partage la distribution en deux parties gales: on
repre l'lment qui a le rang (N+1)/2 pour le caractre X. Si la distribution a un nombre impair
d'lments on trouve une valeur unique qui est la mdiane, si la distribution a un nombre pair d'lments,
on trouve deux valeurs qui dterminent un intervalle mdian : on prend alors pour mdiane le centre de
cet intervalle mdian.

Calcul partir de la courbe des frquences cumules :


(Cf. Vocabulaire 2)

3
Calcul partir d'un tableau de dnombrement :
On repre la classe j qui contient la mdiane, puis on ralise une interpolation linaire pour estimer la
valeur de celle-ci selon la formule :

Mdiane = Binfj + [Aj/ Fj* (0.5-Fascj-1)]

Proprits de la mdiane
La mdiane est la valeur du caractre qui est la plus proche de toutes les autres. C'est celle qui minimise
les distances en valeur absolue :

N
xi - xmd est minimum si et seulement si xmd est la mdiane du
i=1
caractre X

La moyenne

Elle est calcule pour les caractres quantitatifs

calcul partir du tableau lmentaire:


La moyenne est la somme des valeurs divise par le nombre d'lments :

n
X = X i N
i =1

calcul partir du tableau de dnombrement:


On effectue une moyenne pondre en assimilant chaque classe j son centre X j et en pondrant par
l'effectif nj de la classe.

k
X =(X j n j ) N
j =1

moyenne pondre :
Plus gnralement, on recourt la pondration lorsque les units n'ont pas le mme poids. Si chaque
unit i est dcrite par sa modalit xi et son poids pi, la moyenne pondre est :

n n
X p =(X i pi) p i
i =1 i =1

Proprits de la moyenne

1) Si A = moyenne de X
n

X =n X
i =1
i

2) La somme des carts la moyenne est gale zro.

( X X )=0
n
i
i =1
_

4
3) La moyenne minimise les distances au carr

( X A)
2
i
i =1

est minimum si ,et seulement si, A est la moyenne du caractre X

Avantages et inconvnients des diffrentes valeurs centrales :

Le statisticien Yule (XIXme sicle) a dfini six proprits souhaitables pour les valeurs centrales. Le
tableau ci-dessous permet de montrer les avantages et inconvnients des trois valeurs centrales (proprit
+ ralise, - non ralise

Proprits Mode M M
d oy
ia en
ne ne
1) est dfinie de faon objective + + +
2) dpend de toutes les valeurs observes - - +
3) a une signification concrte + + -
4) est simple calculer + + +
5) est peu sensible aux fluctuations de l'chantillon - + -
6) se prte au calcul algbrique - - +

5
L1-S1 Lire et caractriser l'information gographique
- Le traitement statistique univari

Vocabulaire 3. Evaluer le degr de dispersion des valeurs dune


distribution statistique

Dispersion statistique : On appelle dispersion statistique, la tendance qu'ont les valeurs de la distribution
d'un caractre s'taler, se disperser, de part et d'autre d'une valeur centrale. On distingue la dispersion
absolue (mesure dans l'unit de mesure du caractre) et la dispersion relative (mesure par un nombre sans
dimension).

LES PARAMETRES DE DISPERSION ABSSOLUE

Les paramtres de dispersion absolue indiquent de combien les valeurs d'une distribution s'cartent en
gnral de la valeur centrale de rfrence. Un paramtre de dispersion absolue s'exprime toujours dans
l'unit de mesure de la variable considre. Les quatre paramtres de dispersion absolue les plus courants
sont l'tendue, l'intervalle inter quantile, l'cart absolu moyen et l'cart type.

1) Etendue : l'tendue d'une distribution est gale la diffrence entre la plus grande et la plus petite valeur
de la distribution :

Etendue de X = Xmax - Xmin

2) Mesures de la dispersion statistique en rfrence la mdiane

Quantiles : on appelle quantiles les valeurs du caractre qui dfinissent les bornes d'une partition en classes
d'effectifs gaux.

- Les quartiles sont les trois valeurs qui permettent de dcouper la distribution en quatre classes d'effectifs
gaux. On les note Xq1 , Xq2 et Xq3.

Partition du caractre Xmin Xq1 Xq2 Qq3 Xmax


frquence des lments 25% 25% 25% 25%

Remarque : Xq2 est gal la mdiane.

- L'intervalle interquartile est l'tendue de la distribution sur laquelle se trouvent concentre la moiti des
lments dont les valeurs de X sont les plus proches de la mdiane. On exclut alors de la distribution les
25% des valeurs les plus faibles et les 25 % des valeurs les plus fortes de X. Cet intervalle se note:(Xq3-Xq1).

- Les dciles sont les neufs valeurs de X qui permettent de dcouper la distribution en dix classes d'effectifs
gaux. 0n les note Xd1...Xd9.

6
- L'intervalle inter dcile est l'tendue de la distribution sur laquelle se trouvent concentrs 80% des
lments dont les valeurs de X sont les moins diffrentes de la mdiane. On exclut alors de la distribution
les 10 % des valeurs les plus faibles et les 10% des valeurs les plus fortes. Il se note (Xd9-Xd1).

3) Mesures de la dispersion statistique en rfrence la moyenne arithmtique

3-1 Ecart absolu moyen : Ce paramtre est la moyenne arithmtique de la valeur absolue des carts la
moyenne.

N _
E.A.M. de X = Xi - X / N
i=1

3-2 Variance et cart-type :

- Variance : La variance, note (x) est la moyenne du carr des carts la moyenne.
N _
(x)2 = (Xi - X) / N
i=1

La variance n'est pas un paramtre de dispersion absolue mais plutt une mesure globale de la variation d'un
caractre de part et d'autre de la moyenne arithmtique (quantit d'information). Pour obtenir un paramtre
de dispersion absolue, on effectue la racine carre de la variance, appel cart-type et que l'on note x

- Ecart-type : L'cart type, not x est la racine carr de la moyenne du carr des carts la moyenne, c'est
dire la racine carre de la variance.
_____
x = (x)2

L'cart-type est une mesure de dispersion par rapport la moyenne qui intgre les valeurs algbriques des
carts la moyenne et qui pourra, ce titre tre rintroduite dans des calculs algbriques ultrieurs. Elle
prsente de plus l'avantage d'avoir une signification probabiliste que ne possde pas l'cart absolu moyen.
La thorie des probabilits permet en effet d'estimer la chance qu'a une valeur d'tre loigne de la moyenne
de plus d'un certain nombre d'cart-types.

Lorsqu'une distribution est gaussienne (on dit aussi "normale") les probabilits de trouver les valeurs a une
distance donne de la moyenne sont les suivantes :
_ _
68.3 % des valeurs sont comprises entre (x-x) et (x-x)
_ _
95.5 % des valeurs sont comprise entre (x-2x) et (x+2x)
_ _
99.7 % des valeurs sont comprises entre (x-3x) et (x+3x)

LES PARAMETRES DE DISPERSION RELATIVE

La comparaison des paramtres de dispersion absolue de deux caractres n'a de sens que si les deux
caractres sont de mme nature et de mme ordre de grandeur. Dans le cas contraire, la comparaison n'est
possible qu'en ayant recours des mesures de dispersion relative, c'est dire en effectuant le rapport entre
un paramtre de dispersion absolue et la valeur centrale qui lui tient de rfrence .

7
Un paramtre de dispersion relative est une mesure de l'cart relatif des valeurs d'une distribution une
valeur centrale. C'est donc le rapport d'un paramtre de dispersion absolue divis par une valeur centrale. On
obtient un nombre sans dimension qui peut tre exprim en %.

Dispersion relative = Paramtre de dispersion absolue/Valeur centrale __________

- le coefficient interquartile relatif

= (Xq3-Xq1)/ mdiane X

- l'cart moyen relatif


= E.A.M. / X

- le coefficient de variation
= x / X

Remarque trs importante : Le calcul d'un paramtre de dispersion relative n'est possible que pour les
caractres quantitatifs positifs (toutes les modalits sont des nombres positifs).

8
L1-S1 Lire et caractriser l'information gographique
- Le traitement statistique univari

Vocabulaire 4 Discrtisations dune distribution statistique et


reprsentations graphiques

4.1 Distribution statistique et discrtisation

Distribution statistique: pour un caractre quantitatif, ensemble ordonn des modalits prises par le
caractre X par l'ensemble des lments de E

Le tableau de dnombrement donne un rsum numrique d'une distribution


statistique.
Les reprsentations graphiques donnent un rsum visuel d'une distribution statistique
Les reprsentations cartographiques donnent une image de la rpartition dans l'espace
de la distribution statistique

La construction du tableau de dnombrement et des reprsentations graphiques sera diffrente selon que le
caractre tudi quantitatif discret, quantitatif continu, ou caractre qualitatif.

CARACTERES DISCRETS

* Tableau de dnombrement : le tableau de base se compose de trois colonnes:

1- La liste ordonne des valeurs Xi du caractre, ou la suite des classes de valeur du caractre, si les
modalits numriques ont t regroupes en classes. Les modalits dun caractre qualitatif nont pas
dordre.

2- L'effectif ni d'une valeur (ou classe de valeurs) de Xi est le nombre d'lments qui prennent cette
valeur (ou classe de valeurs) dans la distribution observe. La somme du nombre des lments
concerns par chaque modalit (caractre qualitatif) ou par chaque valeur (caractre quantitatif) donne le
nombre d'lments N de l'ensemble observ. Pour k modalits on a :

K
ni = N
i=1

La frquence simple fi d'une modalit ou d'une valeur Xi est le rapport entre l'effectif correspondant
cette modalit et l'effectif total. La frquence varie de 0 1 elle est alors note sous forme dcimale dans
[0;1]. Elle peut tre exprime en pourcentage, elle varie alors de 0% 100%.

fi = ni / N (frquence sous forme dcimale)


fi =100* fi / N (frquence en pourcentage)

La somme des frquences simples est gale 1 (ou 100 %) des lments.

K
fi =1=100%
i=1

9
CARACTERES CONTINUS

* Tableau de dnombrement : Il est un tableau qui a autant de lignes que l'on a retenu de classes de
valeurs quand on a discrtis la variable

1- Discrtisation de la variable ou mise en classes. Les classes correspondent une partition de


l'ensemble de l'intervalle de variation du caractre. (intervalle allant de la valeur minimum prise
par X dans l'ensemble tudi, la valeur minimum prise par X dans l'ensemble tudi). Ces
classes doivent tre disjointes (l'intersection de deux classes est nulle, un lment ne peut
appartenir qu' une seule classe), et continues (la partition doit tre exhaustive, elle doit intgrer
toutes les valeurs que pourrait prendre le caractre dans l'intervalle de variation considr.
Chacune des k classes, j tant une classe quelconque, est dfinie par une borne infrieure XBinfj et
une borne suprieure XBsupj, nj est le nombre d'lments compris dans l'intervalle [XBinfj; XBsupj[

2- L'amplitude de la classe :

Pour chaque classe j, Aj = XBsup j - XBinf j

3- Le centre de la classe :

Cj = [ XBsupj + XBinf j] / 2

4- L'effectif de la classe A chaque classe j correspond un effectif nj qui est le nombre d'lments de
l'ensemble E concentrs dans cette classe

5- La frquence simple de la classe :

fi = nj / N ou 100* nj / N

6- La frquence moyenne ou densit d'effectif :

fmj = fj / Aj

7- La frquence cumule ascendante de la classe j est la proportion d'lments qui pour le caractre
X enregistrent une valeur infrieure celle de sa borne suprieure.

j= j-1
F asc j = fj + fj
j=1

8- La frquence cumule descendante de la classe j est la proportion d'lments qui, pour le


caractre X enregistrent une valeur suprieure celle de sa borne infrieure

Fdesj = 1- Fascj

10
4.2 Reprsentations graphiques dune distribution statistique

CARACTERES QUALITATFS

Diagramme en btons : Il est tabli partir d'un tableau de dnombrement. Il prsente en abscisse la suite
des modalits du caractre X (pas dorientation donne labscisse), et en ordonne leffectif ou la
frquence de chacune des modalits.

CARACTERES QUANTITATIFS DISCRETS

Diagramme en barres : Il est tabli partir d'un tableau de dnombrement. Cest la reprsentation
graphique normale d'un caractre discret. Il prsente, en abscisse la suite ordonne des valeurs du
caractre X, et en ordonne leur frquence simple ou leur effectif. Les btons ne doivent pas tre jointifs
car le caractre est discret.

CARACTERES QUANTITATIFS CONTINUS

1- L'histogramme est tabli partir d'un tableau de dnombrement. C'est une reprsentation bi-
dimensionnelle qui prsente chaque classe sous la forme d'une rectangle dont la surface est
proportionnelle l'effectif ou la frquence de la classe. Pour ce faire la base (sur l'axe Ox) est
proportionnelle l'amplitude de la classe et la hauteur (sur l'axe Oy) est proportionnelle la frquence
moyenne de la classe.:

Surface du rectangle = ( longueur x largeur) = ( fmj x Aj) = (fj / Aj) x Aj = fj

La lgende d'un histogramme est constitue par un lment de surface dont on indique la part des
lments qu'il reprsente (exprime en frquence simple ou en effectif).

L' histogramme permet une double lecture de la distribution statistique:

La hauteur du rectangle (ordonne) renseigne sur la densit des lments dans chaque classe.
Une forte frquence moyenne indique une concentration des valeurs, une faible frquence
moyenne indique une dispersion des valeurs.
La surface des rectangles renseigne sur l'effectif de chaque classe.

2- Les courbe des frquences cumules ascendantes et descendantes sont tablies partir du
tableau de distribution statistique ou partir d'un tableau de dnombrement. C'est un graphique bi-
dimensionnel reprsentant en abscisse les modalits j du caractre X ou les bornes des classes (dans le
cas d'une variable mise en classes) et en ordonne, les frquences cumules. Sa construction est la
suivante :

- La frquence cumule ascendante On porte en abscisse les valeurs correspondant aux bornes des
classes de la partition du caractre X et en ordonne les frquences cumules ascendantes
correspondantes. On repre les points correspondant ces couples de valeurs auxquels on ajoute le
point qui a pour abscisse la borne infrieure de la premire classe, qui correspond X min, et pour
ordonne 0 (en effet, 0 ou 0% des lments enregistrent des valeurs infrieures X min). On procde

11
une extrapolation linaire entre ces points (hypothse d'quirpartition des lments dans chaque
classe), en reliant ces points par une droite.

- La frquence cumule descendante On porte en abscisse les valeurs correspondant aux bornes
des classes de la partition du caractre X et en ordonne les frquences cumules descendantes
correspondantes. On repre les points correspondant ces couples de valeurs auxquels on ajoute le
point qui a pour abscisse la borne suprieure de la dernire classe, qui correspond X max, et dont
l'ordonne est 0 (en effet, 0 ou 0% des lments enregistrent des valeurs suprieures X max). On
procde une interpolation linaire entre ces points (hypothse d'quirpartition des lments dans
chaque classe), en les reliant par une droite.

Les courbes obtenues se croisent au point de frquence cumule ascendante ou descendante 0.5 ou
50%. La valeur du caractre X correspondant cette frquence cumule 0.5 ou 50% et que l'on peut
directement lire sur le graphique en ordonne est la mdiane (50 % des lments sont suprieurs
cette valeur de X et 50 % lui sont infrieurs). On notera ce point X md

12
5. Comment transformer lunit de mesure dun caractre, ou
liminer leffet de cette unit

La comparaison de plusieurs caractres quantitatifs ou bien, celle de caractres quantitatifs et qualitatifs,, n'est
gnralement pas possible partir du tableau lmentaire de dpart, car les caractres comparer peuvent avoir :

- des units de mesure diffrentes.


- des ordres de grandeur diffrents (valeurs centrales)
- des dispersions diffrentes (paramtres de dispersion).
- des modalits qualitatives

Il est donc gnralement ncessaire de transformer les caractres quantitatifs tudier avant de pouvoir les
comparer les uns aux autres. Quatre types de transformations sont proposes :

1) La discrtisation, ou transformation des valeurs dune distribution en modalits dun caractre


qualitatif nominal

* dichotomie (2 classes)

On fixe un seuil Xs qui dfinit la limite entre les valeurs fortes et faibles de Xi. Xs peut tre une valeur centrale
(moyenne, mdiane) ou bien une valeur qui possde une signification particulire pour l'interprtation. On cre la
variable qualitative X' ayant deux modalits :

Xs peut tre une modalit quelconque de X

* largissement : au lieu de se limiter deux classes, on peut dcider que chaque variable se composera n classes
("fort/moyen/faible", trs grand, grand, petit trs petit, etc..).

si Xs = X mdiane, alors la mdiane est une limite de classe et on construit des classes d'effectifs gaux de part et
d'autre de la mdiane

si Xs = X moyenne, alors la moyenne est une limite de classe et on construit des classes d'amplitude gale de part
et d'autre de la moyenne.

Si on souhaite comparer deux caractres, la discrtisation doit tre effectue dans les deux cas en suivant
strictement le mme principe.

2) La transformation dun caractre quantitatif en un caractre ordinal

Chaque caractre quantitatif X i est transform en un caractre qualitatif ordinal X' i qui indique le rang pris par i
dans la srie X.

X'i => rang de X i dans la distribution statistique de X

La mthode ne pose pas de problme mais il faut faire attention deux choses
l'ordre de classement (croissant ou dcroissant) doit tre spcifi et tre le mme pour les deux caractres
lorsqu'il y a des ex-aequo, on leur attribue comme rang la moyenne des places qu'ils auraient occupes s'ils
avaient t la suite les uns des autres. On reprend ensuite le classement aprs les rangs virtuellement occups.

exemple rang des rgions franaises pour la densit de population en 1946 et en 1990

3) La standardisation

13
La standardisation est la transformation la plus efficace quand on veut comparer deux variables quantitatives.
Elle consiste oprer une double transformation de centrage et de rduction.

Centrage : L'opration de centrage consiste transformer un caractre X en un caractre X' qui exprime les
carts positifs ou ngatifs par rapport une valeur de rfrence qui est la moyenne arithmtique de la distribution
X' i = ( X i - X )
Rduction : l'opration de rduction consiste transformer une variable X en la divisant par l'cart-type de la
distribution

X' i = X i / X

Dans la plupart des cas, on utilise l'cart-type pour effectuer la rduction.

Standardisation: une variable standardise (on dit aussi centre-rduite) a t centre par la moyenne et rduite
par l'cart-type :

X' i = ( X i - X )/X

Une variable standardise (centre-rduite) possde une moyenne de 0 et un cart- type de 1. Elle exprime l'cart
d'un lment de la distribution la moyenne, mesur en carts-types. L'unit de mesure de la variable d'origine a donc
disparu et il est toujours possible de comparer deux variables standardises.

Transformer les caractres pour pouvoir les comparer 2 2

Types de
caractres quantitatif ordinal qualitatif nominal
comparer

comparaison aprs aprs transformation aprs transformation


limination de l'effet de du caractre du caractre quantitatif
quantitatif
l'unit de mesure quantitatif en en caractre qualitatif
(standardisation) caractre ordinal (discrtisation)

aprs transformation du aprs transformation


ordinal caractre quantitatif en comparaison directe du caractre ordinal en
caractre ordinal caractre qualitatif

aprs transformation du
aprs transformation
qualitatif caractre quantitatif en comparaison sous
du caractre ordinal
nominal caractre qualitatif conditions
en caractre qualitatif
(discrtisation)

14