Vous êtes sur la page 1sur 13

Chapitre 2: Résumés numériques d’une variable quantitative

I. Indicateurs de position

Soit X une variable quantitative

Les indicateurs de position donnent une idée globale de l’ordre de


grandeur de la variable et s’expriment dans l’unité de la variable.

a) Indicateurs de tendance centrale

 Mode = valeur (non nécessairement unique) de X la plus


représentée dans l’échantillon.
Variable discrète: la (ou les) valeur(s) qui correspond(ent) à
l’effectif maximal.
Exemple: variable Ncharg
Variable continue: on peut répérer sur l’histogramme la (ou les)
classe(s) modale(s) = classe(s) de densité de proportion maximale.
Exemple: variable Salaire (données regroupées en classes).

 Moyenne : soit {x1 . . . , xn } une série statistique :

Exemple : variable Salaire

Calculer le salaire horaire moyen. (réponse : x ̄ = 5, 90$)


Rq 1: pour une variable discrète, lorsqu’on dispose du tableau des
effectifs, on utilise plutôt:

Valeurs 0 1 2 3 4 5 6 Total
prises par
Ncharg
Effectif 252 105 99 45 16 7 2 526
Fréquence 0,479 0,200 0,188 0,086 0,030 0,013 0,004 1
relative
Fréquence 0,479 0,679 0,867 0,953 0,983 0,996 1
relative
cumulée

Exemple : variable Ncharg.


Calculer le nombre de personnes à charge moyen.

(105 + 99*2 + 45*3 + 16*4 + 7*5 + 6*2)/526 = 1,043

Rq 2: dans le cas d’une variable continue dont on n’a que les valeurs
regroupées en classes, on peut définir une moyenne approchée:

Centre des classes:

Moyenne approchée:
Exemple : variable Salaire (données regroupées en classes)

Calculer le salaire horaire moyen approché.

Classes de [0;2 [ [2;4[ [4;6[ [6; 10[ [10;15[ [15; 25[


salaire
Effectif 8 187 134 130 48 19
Proportion 0,015 0,356 0,255 0,247 0,091 0,036
Prop. Cum 0,015 0,371 0,626 0,873 0,964 1
Amplitude 2 2 2 4 5 10
Densité de 0,0075 0,178 0,1275 0,0618 0,0182 0,0036
proportion

X app = (8*1 + 187*3 + 134*5 + 130*8 + 48812,5 + 19*20)/526 =


6,20$.

b) Propriétés de la moyenne:

1. La somme des écarts à la moyenne des observations est nulle:

2. La moyenne x- est le réel a qui minimise

3. Changement de variable affine: si Y = aX + b (yi = axi + b, i = 1, ….,


n), alors y- = ax- + b démo. au programme de l’examen

Exemple : calcul du salaire horaire moyen en livres sterling ( 1 dollar =


0,81 livres sterling) rep :y = 0, 81 x = 0, 81 × 5, 90 = 4, 78 LS

4. Moyenne de la somme de deux variables : si Z = X + Y (zi = xi + yi , i


= 1, . . . , n), alors z- = x- + y-
Remarque

L’inconvénient de x ̄ est qu’elle est sensible aux valeurs extrêmes. En


statistique, on dit que x ̄ n’est pas robuste.

 Médiane: trung bình


C’est la valeur de X qui partage l’effectif en deux parties
d’effectifs égaux → 50 % des observations ont une valeur de X ≤ à
la médiane (et donc 50 % des observations ont une valeur de X ≥ à
la médiane).

Définition

Soit {x1 . . . , xn } une série statistique. La médiane est définie par


Q2 = Inf {xi |F (xi ) ≥ 0, 5} où F est la fonction de répartition empirique.

Rq : on peut visualiser la médiane sur le graphe de la fonction de


répartition empirique.

Calcul pratique sur données brutes : on ordonne les observations dans


l’ordre croissant (il peut y avoir des répétitions) → 2 cas :

 si n impair, médiane = (n+1)/2 -ème observation 2

 si n pair, médiane = n/2 -ème observation


Exemple : médiane de la variable Salaire

Q2 = 4, 65 $

Rq 1 : Par défaut, pour n pair, le logiciel tableur Excel prend une


convention différente pour le calcul de la médiane : il prend la moyenne
des n/2-ème et (n/2 + 1)-ème observations, ce qui peut conduire à une
valeur différente.
Rq 2 : variable discrète : Q2 est égale à la plus petite valeur vj pour
laquelle la proportion cumulée est supérieure ou égale à 0, 5

Exemple : médiane de la variable Ncharg (réponse : Q2 = 1)

Rq 3 : dans le cas d’une variable continue regroupée en classes, on


peut calculer par interpolation linéaire une médiane approchée, notée
Q2app à l’aide du théorème de Thalès.

Détermination de Q2app en pratique :

1. si l’une des fréquences relatives cumulées Φj (= F (bj )) vaut

exactement 0,5, alors Q2app = bj

1. sinon, on détermine la classe [bj−1, bj [ pour laquelle Φj−1 < 0, 5


< Φj .

C’est la classe médiane et Q2app ∈ [bj−1,bj[.

Exemple : médiane approchée de la variable Salaire regroupée en


classes.

II. Médiane avec le théorème de Thalès


ABC et ADE sont des triangles semblables
→ d’après le théorème de Thalès : AB/AD = BC/DE

Calcul de la médiane approchée de la variable Salaire regroupée en


classes.

0,38 < 0,5 < 0,63 donc Q2app ∈ [4; 6[


0 , 5−0 , 38
Q2app = 4 + 2* 0 , 63−0 , 38
= 4,96

Remarque

1. La médiane est plus robuste que la moyenne aux valeurs extrêmes.

2. La comparaison de la médiane et de la moyenne renseigne sur


l’asymétrie de la série.

• Si Q2 << x ̄ : asymétrie avec sur-représentation des petites valeurs de X

• Si Q2 >> x ̄ : asymétrie avec sur-représentation des grandes valeurs de


X

b) Autres indicateurs de position

 Maximum = valeur la plus grande de la série (notée xmax )

 Minimum = valeur la plus petite de la série (notée xmin)

 Quantiles : ils généralisent la notion de médiane


Pour p ∈ [0, 1], le quantile d’ordre p est la valeur qp de X telle que
p × 100% de la population ait une valeur de X inférieure ou égale à
qp .

Quantiles particuliers :

- médiane : Q2 = q0,5

- quartiles : Q1 = q0,25 = 1er quartile, Q3 = q0,75 = 3ème

- quartile - déciles : q0,1 à q0,9

- percentiles : q0,01 à q0,99 (q0,65 = 65ème percentile)

Définition

Soit{x1...,xn}une série statistique. On a qp = Inf{xi|F(xi)≥p} où F est la


fonction de répartition empirique.

Détermination pratique des quantiles :

On ordonne les xi par ordre croissant. Deux cas :

 si np entier, qp= np-ème observation


 si np non entier, qp= E(np) + 1-ème observation (où E(k) désigne
la partie entière de k).
Rq 1 : variable discrète : qp premier vj tel que Φj >= p

Exemple : 1er et 3ème quartile puis q0,9 pour la variable Ncharg

rep: Q1 = 0, Q3 = 2, q0,9 = 3

Rq 2 : variable continue regroupée en classes : on peut calculer une


valeur approchée du quantile d’ordre p

→ calcul du quantile qpapp : même méthode que pour le calcul de la


médiane en remplaçant 0,5 par p.

Exemple : 3ème quartile approché de la variable Salaire (données


regroupées en classes)
0,63 < 0,75 < 0,88 donc Q3app ∈ [6; 10[

III. Indicateurs de dispersion

Plusieurs indicateurs:

a) Etendue (range en anglais) : e = xmax − xmin

Remarque

Elle s’exprime dans l’unité de X. Elle ne tient pas du tout compte de la


répartition des données dans l’intervalle [xmin, xmax].

Exemple : étendue de la variable Salaire (rép : e= 24,98-0,53= 24,45 $)

b) Autour de la médiane :

Intervalle inter-quartile : I = [Q1, Q3]

Remarque:

Il contient 50% des observations.

Distance inter-quartile : Q3 − Q1

Remarque:

Elle s’exprime dans l’unité de X. On peut la diviser par Q2 pour avoir un


indicateur sans unité.

Exemple: intervalle et distance inter-quartile de la variale Salaire (sur


données brutes I = [3,33; 6,88] et distance inter-quartile = 3,55)
c) Autour de la moyenne

 Variance

C’est la moyenne des carrés des écarts à la moyenne.

Remarque : La variance s’exprime dans le carré de l’unité de la variable.

Elle permet de comparer la dispersion de variables qui ont à peu près la


même moyenne.

Pour un calcul plus facile de la variance

→ Formule de König-Huyghens démo. au programme de l’examen

Pour une variable discrète

Pour une variable continue regroupée en classes

On n’a qu’une valeur approchée de la variance:


Propriétés de la variance:

1. La variance est toujours positive ou nulle: Var (X) ≥ 0.

2. Elle est nulle si et seulement si toutes les observations sont identiques:

3. Changement de varIAble affine: si Y = aX + b

(yi = axi + b; i = 1, …, n) alors Var(Y) = a2Var(X)

démo. au programme de l’examen

 Écart-type:

σX s’exprime dans l’unité de X

Coefficient de variation d’une variable X positive: CV(X) = σx/x-

Remarque:

CV(X) n’a pas d’unité. Il permet de mesurer l’intensité de la dispersion:


on pourra par exemple considérer qu’un CV(X) supérieur à 0,25
correspond à une série plutôt dispersée (peu dispersée dans le cas
contraire).
Il permet aussi de comparer la dispersion de deux variables de moyennes
différentes: la variable la plus dispersée est celle qui le plus grand
coefficient de variation.

Exemple : variance, écart-type et coefficient de variation des variables


Ncharg et Salaire

Pour la variable Salaire, on donne:

 Variable Salaire (données brutes)

Var(X) = 25 446,29/526 – (3 101,35/526)*2 = 13,61

σX =3,68$

CV(X) = 3,68/5,90 = 0,62

 Variable Ncharg

Var(X) = (252×02 +105×12 +99×22 +45×32 +16×42 + 7×52 + 2×62


)/526 – 1,042 = 1,60

σX = 1,26

CV(X) = 1,26/1,04 = 1,21

IV. Variable centrée réduite

Soit une variable X de moyenne x- et d’écart-type σX

Variable centrée réduite associée à X:


Remarque

Elle est centrée (y- = 0 et réduite (VAR(Y) = 1).

Elle est sans unité.

Intérêt: la transformation en variable centrée réduite retire à la variable


toute l’information sur son échelle et sa localisation. (?)

Exemple: variable centrée réduite associée à la variable Ncharg, à la


variable Salaire.

Autre utilisation: appliquée à un individu i de valeur xi, cette


transformation permet de le situer par rapport aux autres observations en
calculant son écart à la moyenne réduit:

Exemple: quel est l’écart à la moyenne (lệch chuẩn), mesuré en écarts-


types, d’un individu ayant un salaire horaire de 18 dollars?

Réponse: écart = (18 – 5,90)/3,68 = 3,29

Vous aimerez peut-être aussi