Académique Documents
Professionnel Documents
Culture Documents
.
Les statistiques descriptives paramétrique ont pour objectif aussi de résumer l'information
contenue dans une série de données en utilisant différents paramètres numériques:
Moyenne Ecart-type
Médiane Variance
… Etendue
28/10/2020 2
Description paramétrique des données
Paramètres de position
La moyenne arithmétique:
La moyenne (arithmétique) renseigne le centre de gravité d’une distribution des valeurs d’une variable.
En d'autres termes, le poids des résultats à gauche de la moyenne est égal au poids des résultats se trouvant à
droite. Si x1, … xn représentent les n résultats, la moyenne arithmétique est estimée de la façon suivante:
28/10/2020 3
Description paramétrique des données
Paramètres de position
La moyenne pondérée:
La moyenne pondérée est obtenue en tenant compte de poids de chaque mesure. Elle est calculée
de la façon suivante:
w1 x1 w2 x2 wn xn w x i i
xw i 1
w1 w2 wn n
w
i 1
i
28/10/2020 4
Description paramétrique des données
Paramètres de position
La moyenne pondérée:
Dans la représentation suivante, la taille des points représente leur poids (wi).
w1 w2
x1 x2
moyenne
Si tous les poids sont égaux à 1, alors la moyenne pondérée devient la moyenne arithmétique.
moyenne
28/10/2020 5
Description paramétrique des données
Paramètres de position
La médiane
La médiane est le percentile 50 qui se situe au centre d’une série des données classée en ordre
croissant, c'est-à-dire la valeur à laquelle 50% des résultats se situent à sa gauche et le reste à sa droite.
vs
La moyenne la médiane
La moyenne est très sensible aux valeurs Alors que la médiane n’est plus sensible à la présence des
atypiques ou aberrantes valeurs aberrantes.
La variance:
La variance est le paramètre de dispersion le plus courant. Elle représente l'écart des résultats par rapport à leur
moyenne (arithmétique). Dans une population, elle s'estime comme suit:
La variance est exprimée dans les unités des résultats au carré. Par exemple, si les résultats sont en mg alors la
variance de ceux-ci sera en mg².
Si la variance est petite, cela signifie que les résultats sont proches de la moyenne ou encore que ces résultats sont
peu dispersés. Une variance égale à 0 signifie que tous les résultats sont identiques. Inversement, si la variance est
grande, cela signifie que les résultats sont fortement dispersés.
28/10/2020 7
Description paramétrique des données
Paramètres de dispersion
L’écart type:
L'écart-type représente un paramètre de dispersion exprimé dans les mêmes unités que les résultats (ainsi la
moyenne). Cette caractéristique rend l'écart-type bien plus utilisé que la variance.
La problème de travailler avec ce type de paramètres est de déterminer quand une variance ou un écart-type
peuvent être considérés comme important ou non. Tout cela dépend bien évidemment de la moyenne des
résultats.
Par exemple, un écart-type de 10 traduira une plus grande variabilité lorsque la moyenne est de 100 que lorsque la
moyenne est de 1000.
28/10/2020 8
Description paramétrique des données
Paramètres de dispersion
Coefficient de variation:
Pour surmonter le problème de définir l’importance d’une dispersion, le coefficient de variation qui est
défini comme le rapport entre l'écart-type et la moyenne n'a plus d'unité et facilite considérablement
l'interprétation des résultats.
Ce coefficient sans unité permet de savoir le part d’erreur de mesure par rapport la grandeur mesurée
Il permet aussi de comparer la dispersion de différentes mesures quelle que soit l’unité de mesure.
28/10/2020 9
Description paramétrique des données
Paramètres de dispersion
Dans de nombreux cas, on peut fréquenter des groupes de données ( séries de mesures) qui ont été obtenues à des
moments différents ou sur différents échantillons (mais semblables) et l'on veut obtenir une moyenne générale et
un écart-type de ces données regroupées.
28/10/2020 10
Description
Description paramétrique
paramétrique des
des données
données
Paramètres
Paramètres de
de dispersion
dispersion
Exemple: Nous disposons de 7 séries de mesures du % d’humidité dans 7 types de fromages, les résultats sont résumés dans
le tableau ci-dessus:
nous voulons déterminer l'écart-type pour un dosage de l'eau dans 7 types de fromage
On souhaite déterminer la moyenne générale et un écart standard unique pour le fromage dans son ensemble
Ou
28/10/2020 12
Condition d’utilisation de l’écart type commun:
A première vue, nous pourrions utiliser l’équation précédente avec les 8 catégories au lieu de 7 types de fromage.
Cependant, l'écart-type de type 8 est manifestement très différente de celle des autres 7 types.
L'écart-type commun serait (trop) fortement influencé par le type 8 de fromage, de sorte que la valeur résultante ne serait
pas représentative.
• Cet exemple montre que seuls les écarts similaires devraient être mis en commun. Autrement dit d'une manière plus
scientifique, nous pouvons mettre en commun des écarts types à condition qu'elles soient homogènes.
28/10/2020 13
Description paramétrique des données
Paramètres de dispersion
Ecart interquartiles:
L'écart interquartiles est la différence entre le percentile 75 ou Q3 (75% des valeurs sont inférieures à cette
valeur) et le percentile 25 ou Q1. Entre P75 et P25 se trouve 50% de la distribution.
Plus cet écart est élevé, plus la dispersion est importante. Inversement, plus il est faible, moins la dispersion
est importante.
28/10/2020 14
Relation entre IQR et le Boxplot
M: la médiane
Q1: quantile 25
Valeur abérrente
Q3: quantile 75
IQR : Q3 – Q1
Description paramétrique des données
L’étendue: Paramètres de dispersion
L‘étendue ou l’amplitude est la différence entre la valeur la plus grande (le maximum) et la valeur la plus
petite (le minimum).
Elle représente donc la longueur de l'intervalle dans lequel se trouve l'entièreté des résultats.
Plus l'amplitude est élevée, plus la dispersion est importante. Inversement, plus l'amplitude est faible, moins la
dispersion est importante.
28/10/2020 16