Académique Documents
Professionnel Documents
Culture Documents
La représentation graphique est intéressante pour effectuer une comparaison visuelle entre
deux séries d’observations. Cependant, celle-ci demeure relativement sommaire. Elle est
incommode, devient difficile, voire impossible quand on s’intéresse à un grand nombre de
séries d’observations. A partir de ces constatations, les statisticiens ont eu l’idée de résumer
une série statistique par des paramètres uniques chargés de représenter ces caractéristiques.
On en distingue, en particulier, deux types :
Les paramètres de tendance centrale proche du "centre" de la distribution,
Les paramètres de dispersion qui visent à donner une mesure de la dispersion des
données autour du paramètre de tendance centrale,
L'indice de tendance centrale permet de positionner l'ensemble des observations. Cependant
deux séries de mesures peuvent avoir le même "centre", mais des valeurs peuvent être plus ou
moins étalées autour de cet indice. Pour différencier ces deux séries, on utilise donc un indice
de dispersion.
Le paramètre de tendance centrale permet de positionner la distribution.
Performances
ère
à un test de résolution de problème noté de 0 à 20 sur des enfants de 6ème ou
1 .
Autre exemple :
La moyenne des deux séries de mesures est identique mais visiblement les deux séries de
données diffèrent car on a une dispersion plus importante des données autour du paramètre de
tendance centrale.
4
Le mode
Le mode d'une série d'observations (ou distribution) est la modalité de la variable qui
fait l'objet du plus grand nombre d'observations. C’est donc la modalité à laquelle est
associé le plus grand effectif ou la plus grande fréquence
Cas des variables discrètes : classer les données par ordre croissant. Celle d'effectif maximum
donne le mode.
Deux valeurs consécutives xi, xi+1 peuvent avoir le même effectif maximum ; on parlera
d'intervalle modal [xi , xi+1]. Il peut aussi y avoir un mélange de deux populations qui
conduit à un diagramme en bâtons où apparaissent deux bosses ; on considérera deux modes.
Il est déconseillé, sauf raison explicite, d'envisager plus de deux modes.
Variable continue : Dans ce cas, les modalités sont des classes de valeurs et le mode
correspondra à la classe ayant l’effectif maximum. On parle alors de classe modale. Comme
pour le cas discret, on peut avoir deux classes modales.
5
On retiendra comme classe modale, celle présentant l’effectif ou la fréquence la plus élevée.
La classe dans laquelle l’effectif ni ou fréquence f i est la plus élevée est ici [1,70 ; 1,80[
La médiane
Les valeurs étant rangées par ordre croissant, c'est la valeur de la variable qui sépare les
observations en deux groupes d'effectifs égaux. Elle se situe donc au milieu de la série
d’observations lorsque celles-ci sont rangées en ordre croissant (ou décroissant).
Classe
médiane
Dans cette population, 6 individus ont une valeur <
1,60 et 13 individus ont une valeur < 1,70. Ainsi, la
médiane est comprise entre 1,60 et 1,70m. La classe
médiane est [1,60; 1,70[.
6
La moyenne arithmétique
La moyenne arithmétique d’une série de n mesures x1, x2, …..xn est définie par
x1 + .... + xn 1 n
x= ce qui peut aussi s’écrire sous la forme suivante : x = xi avec n
n n i =1
qui correspond à la taille de l’échantillon.
Dans le cas où les données sont regroupées par modalité, on pondère chaque valeur xi par
n1 x1 + .... + nk xk
son effectif ni. On a alors x= pour k modalités ou classes différentes. On
n
1 k
x = ni xi
peut aussi l’écrire de la manière suivante : n i =1
Propriétés de la moyenne :
• La moyenne correspond au centre de gravité de la distribution.
• Elle n’a de sens que pour un caractère quantitatif
• Influencée par les valeurs extrêmes (observations très grandes ou très petites).