Vous êtes sur la page 1sur 3

Fiche 3 : Paramètres caractéristiques

(Indices de dispersion)
Comme leur nom l'indique, ces caractéristiques essayent de synthétiser
par une seule valeur numérique la dispersion des valeurs observées.
L'étendue
C'est la différence entre la plus grande et la plus petite observation. Peu utilisée car ne
prend en compte que les valeurs extrêmes.

La variance (moment d’ordre 2)


La variance mesure la dispersion des données autour de la moyenne.
Variance : Moyenne arithmétique des carrés des écarts par rapport à la moyenne.
2

å (x )
N
1
s =
2
i -x à Égal à la moyenne des carrés – moyenne au carré
N i =1

Propriétés de la variance :
• La variance n’est jamais négative.
• Plus elle est grande, plus les données sont éparpillées ou dispersées autour de la moyenne
et vice et versa. Elle dépend toutefois de l’ordre de grandeur des données.
• Tout comme la moyenne, elle est influencée par les valeurs extrêmes.

Exercice : calculer la variance sur les résultats à un test de rappel de mots sur 7 patients
évalués en consultation mémoire.
mots carrés
Sujet 1 0
Sujet 2 6
Sujet 3 7
Sujet 4 7
Sujet 5 9
Sujet 6 10
Sujet 7 24

N
Moyenne
Somme des carrés -->
Variance -->

Vous pouvez aussi utiliser les formules suivantes pour le calcul de la variance:
N
1
s2 =
N åx
i =1
2
i - x 2 (moyenne des carrés moins la moyenne au carré)

8
L'écart type
On utilise plus couramment l'écart-type qui est la racine carrée de la variance et qui a
l'avantage d'être un nombre de même dimension que les données (contrairement à la variance
qui en est le carré).

s= s = 2 1 n
(
å xi - x
N i =1
)
Propriétés de l’écart type :
• Mêmes unités que la variable elle-même.
• Ne peut pas être négatif.
• Pour la plupart des distributions unimodales:
75% des données se situent à ± 1 écart-type de la moyenne.
95% des données se situent à ± 2 écarts-types de la moyenne.
La quasi-totalité des données se situent à ± 3 écarts-types de la moyenne.

Le coefficient de variation :
Lorsqu’on veut comparer la dispersion ou l’étalement de deux séries d’observations qui n’ont
pas le même ordre de grandeur ou qui portent sur des variables différentes, il peut être
impossible ou trompeur d’utiliser directement les écarts types.
Le coefficient de variation se définit comme le rapport de l’écart type divisé par la moyenne,
exprimé en pourcentage. Mathématiquement, le CV est sans unité et est normalisé par la
moyenne, ce qui permet de comparer la dispersion de variables différentes.
s
CV =
x
Considérons l’exemple suivant : Un groupe d’enfant de 4 ans a une taille moyenne de 100 cm
et un écart type de 3.11cm. Un second groupe d’enfants de 11 ans a une taille moyenne de
140 cm et un écart type de 3.96 cm. On pourrait alors penser que la dispersion de la taille des
enfants de 11 ans est plus élevée que celle des enfants de 4 ans. Or quand on fait le coefficient
de variation, il apparaît que la dispersion ou CV est de 3.11% pour les plus jeunes et
seulement de 2.83 pour les plus âgés !
Les quantiles
Les quantiles sont des points essentiels pris à des intervalles réguliers d'une fonction de
distribution cumulative d'une variable aléatoire. Diviser des données ordonnées en plusieurs
sous-jeux de données de dimension essentiellement égale est la motivation des quantiles ; les
quantiles sont les valeurs de données marquant les limites entre deux sous-jeux consécutifs.
Certains quantiles ont des noms spéciaux :
• Les 100-quantiles sont appelés centiles ou percentiles ;
• Les 10-quantiles sont appelés déciles ;
• Les 4-quantiles sont appelés quartiles ;
• Le 2-quantile est appelé médiane.
Ainsi, centiles, déciles etc… ne sont que des cas particuliers des premiers.
Exemple du quartile :

9
Le quartile est calculé en tant que 4-quantiles
• le 1er quartile sépare les 25 % inférieurs des données ;
• le 2e quartile est la médiane de la série ;
• le 3e quartile sépare les 75 % inférieurs des données.
La différence entre le 3e quartile et le 1er quartile s'appelle écart interquartile ; c'est un critère
de dispersion de la série.
Le premier quartile et le troisième quartile d'une série statistique rangée dans l'ordre croissant
(x1 , x2 , x3 , x4 , ....., xn) sont les nombres Q1 et Q3 définis de la façon suivante :

- si n/4 est un entier, le premier quartile Q1 est le terme de rang n/4 et le troisième quartile Q3
est le terme de rang 3n/4.
- si n/4 n'est pas un entier, Q1 et Q3 sont respectivement les termes de rang immédiatement
supérieur à n/4 et 3n/4.
Exemple :
Les valeurs dans l'ordre ascendant 1, 11, 15, 19, 20, 24, 28, 34, 37, 47, 50, 57.
Q1 =
Q2 =
Q3 =

10

Vous aimerez peut-être aussi