Vous êtes sur la page 1sur 16

Grain 3

Description paramétrique des données

Pr B. IHSSANE @FST Fès


Description paramétrique des données

.
Les statistiques descriptives paramétrique ont pour objectif aussi de résumer l'information
contenue dans une série de données en utilisant différents paramètres numériques:

Paramètres de position Paramètres de dispersion

Moyenne Ecart-type

Médiane Variance

Quartile 25, Quartile 75 Coefficient de Variation

… Etendue

! Les paramètres statistiques ne concernent que les variables quantitatives

28/10/2020 2
Description paramétrique des données
Paramètres de position

La moyenne arithmétique:

 La moyenne (arithmétique) renseigne le centre de gravité d’une distribution des valeurs d’une variable.

 En d'autres termes, le poids des résultats à gauche de la moyenne est égal au poids des résultats se trouvant à
droite. Si x1, … xn représentent les n résultats, la moyenne arithmétique est estimée de la façon suivante:

28/10/2020 3
Description paramétrique des données
Paramètres de position
La moyenne pondérée:

 La moyenne pondérée est obtenue en tenant compte de poids de chaque mesure. Elle est calculée
de la façon suivante:

w1 x1  w2 x2    wn xn w x i i
xw   i 1
w1  w2    wn n

w
i 1
i

28/10/2020 4
Description paramétrique des données
Paramètres de position
La moyenne pondérée:

 Dans la représentation suivante, la taille des points représente leur poids (wi).

w1 w2

x1 x2
moyenne
 Si tous les poids sont égaux à 1, alors la moyenne pondérée devient la moyenne arithmétique.

moyenne

28/10/2020 5
Description paramétrique des données
Paramètres de position

La médiane
La médiane est le percentile 50 qui se situe au centre d’une série des données classée en ordre
croissant, c'est-à-dire la valeur à laquelle 50% des résultats se situent à sa gauche et le reste à sa droite.

vs
La moyenne la médiane

 La moyenne est très sensible aux valeurs  Alors que la médiane n’est plus sensible à la présence des
atypiques ou aberrantes valeurs aberrantes.

La médiane est un paramètre de position robuste


Description paramétrique des données
Paramètres de dispersion

La variance:

La variance est le paramètre de dispersion le plus courant. Elle représente l'écart des résultats par rapport à leur
moyenne (arithmétique). Dans une population, elle s'estime comme suit:

 La variance est exprimée dans les unités des résultats au carré. Par exemple, si les résultats sont en mg alors la
variance de ceux-ci sera en mg².

Si la variance est petite, cela signifie que les résultats sont proches de la moyenne ou encore que ces résultats sont
peu dispersés. Une variance égale à 0 signifie que tous les résultats sont identiques. Inversement, si la variance est
grande, cela signifie que les résultats sont fortement dispersés.

28/10/2020 7
Description paramétrique des données
Paramètres de dispersion
L’écart type:

 L'écart-type représente un paramètre de dispersion exprimé dans les mêmes unités que les résultats (ainsi la
moyenne). Cette caractéristique rend l'écart-type bien plus utilisé que la variance.

 La problème de travailler avec ce type de paramètres est de déterminer quand une variance ou un écart-type
peuvent être considérés comme important ou non. Tout cela dépend bien évidemment de la moyenne des
résultats.

Par exemple, un écart-type de 10 traduira une plus grande variabilité lorsque la moyenne est de 100 que lorsque la
moyenne est de 1000.
28/10/2020 8
Description paramétrique des données
Paramètres de dispersion
Coefficient de variation:

 Pour surmonter le problème de définir l’importance d’une dispersion, le coefficient de variation qui est
défini comme le rapport entre l'écart-type et la moyenne n'a plus d'unité et facilite considérablement
l'interprétation des résultats.

 Le coefficient de variation est souvent exprimé en pourcent.

 Ce coefficient sans unité permet de savoir le part d’erreur de mesure par rapport la grandeur mesurée

 Il permet aussi de comparer la dispersion de différentes mesures quelle que soit l’unité de mesure.

28/10/2020 9
Description paramétrique des données
Paramètres de dispersion

Exemple d’application : L’écart type commun

Dans de nombreux cas, on peut fréquenter des groupes de données ( séries de mesures) qui ont été obtenues à des
moments différents ou sur différents échantillons (mais semblables) et l'on veut obtenir une moyenne générale et
un écart-type de ces données regroupées.

28/10/2020 10
Description
Description paramétrique
paramétrique des
des données
données
Paramètres
Paramètres de
de dispersion
dispersion

Exemple: Nous disposons de 7 séries de mesures du % d’humidité dans 7 types de fromages, les résultats sont résumés dans
le tableau ci-dessus:
nous voulons déterminer l'écart-type pour un dosage de l'eau dans 7 types de fromage
On souhaite déterminer la moyenne générale et un écart standard unique pour le fromage dans son ensemble

 Calculer la moyenne générale du taux d’humidité de l’ensemble des fromage?


28/10/2020 Attention les 7 séries n’ont pas le même nombre de mesures. 11
Spooled=S commun
Calcul de l’écart type commun:

Ou

28/10/2020 12
Condition d’utilisation de l’écart type commun:

 A première vue, nous pourrions utiliser l’équation précédente avec les 8 catégories au lieu de 7 types de fromage.
 Cependant, l'écart-type de type 8 est manifestement très différente de celle des autres 7 types.
 L'écart-type commun serait (trop) fortement influencé par le type 8 de fromage, de sorte que la valeur résultante ne serait
pas représentative.
• Cet exemple montre que seuls les écarts similaires devraient être mis en commun. Autrement dit d'une manière plus
scientifique, nous pouvons mettre en commun des écarts types à condition qu'elles soient homogènes.

28/10/2020 13
Description paramétrique des données
Paramètres de dispersion
Ecart interquartiles:

 L'écart interquartiles est la différence entre le percentile 75 ou Q3 (75% des valeurs sont inférieures à cette
valeur) et le percentile 25 ou Q1. Entre P75 et P25 se trouve 50% de la distribution.

 Plus cet écart est élevé, plus la dispersion est importante. Inversement, plus il est faible, moins la dispersion
est importante.

28/10/2020 14
Relation entre IQR et le Boxplot

M: la médiane
Q1: quantile 25
Valeur abérrente
Q3: quantile 75
IQR : Q3 – Q1
Description paramétrique des données
L’étendue: Paramètres de dispersion

 L‘étendue ou l’amplitude est la différence entre la valeur la plus grande (le maximum) et la valeur la plus
petite (le minimum).
 Elle représente donc la longueur de l'intervalle dans lequel se trouve l'entièreté des résultats.

 Plus l'amplitude est élevée, plus la dispersion est importante. Inversement, plus l'amplitude est faible, moins la
dispersion est importante.

28/10/2020 16

Vous aimerez peut-être aussi