Vous êtes sur la page 1sur 35

Statistiques descriptives

Chapitre III : Caractéristiques de position

Dr. Abou DIENG


abou.dieng@esp.mr

Ecole Superieure Polytechnique


Institut Superieur des Métiers de la Statistique
Première année LP-S1

January 5, 2021

A.DIENG Statistiques descriptives January 5, 2021 1 / 35


Plan du chapitre III

Mode
Définition mode

Détermination du mode

Médiane et quantiles
Généralisation aux quantiles

Moyennes
Moyenne arithmétique

Forme de la distribution

Moyenne géométrique

Moyenne harmonique

Généralisation de la notion de moyenne

A.DIENG Statistiques descriptives January 5, 2021 2 / 35


Mode
Définition mode

Définition
Le mode d’une distribution statistique est la valeur de la variable (ou la
modalité pour une variable qualitative) qui correspond au plus grand effectif
ou à la plus grande fréquence. C’est la valeur qui se rencontre le plus
fréquemment.

Surtout utilisé pour variables qualitatives ou quantitatives


discrètes.
Avantages :
Rapide à déterminer
Signification simple
Première notion de tendance centrale on lui préférera souvent les
concepts de médiane ou moyenne

A.DIENG Statistiques descriptives January 5, 2021 3 / 35


Mode
Détermination du mode

Si variable qualitative ou quantitative discrète :

Détermination immédiate par simple lecture de tableau ou


graphique.

Si variable continue :

On détermine la classe modale : la classe qui correspond à l’effectif


ou à la fréquence max ; la classe qui correspond au pic de
l’histogramme.

Attention : si les amplitudes de classes sont inégales, il faut


corriger les effectifs et les fréquences pour pouvoir déterminer la
classe modale sans erreur (comme on le fait pour pouvoir tracer un
histogramme correct)

A.DIENG Statistiques descriptives January 5, 2021 4 / 35


Mode
Exemple sur variable qualitative

Table: Marques de baskets portées par les etudiants agés de 18 à 25 ans

xi Modalité Effectif ni
x1 Nike Air Max 5
x2 Adidas Stan Smith 15
x3 Baskets Veja 2
x4 New Balance 8
x5 Autre 5
n Total 35

Aux étudiants : quel est le mode de la variable "basket" ?

A.DIENG Statistiques descriptives January 5, 2021 5 / 35


Mode
Exemple sur variable discrète

Figure: Répartition des Africains de + 50 ans selon leur nombre d’enfants

Aux étudiants : quel est le mode ?


A.DIENG Statistiques descriptives January 5, 2021 6 / 35
Mode
Exemple sur variable continue

Table: Répartition des Africains de plus de 50 ans selon le revenu annuel

Classe [ ai , ai+1 [ Fréquence f i Amplitude Coef corr H corrigée hi


[0 ; 10000 [ 10% 10000 1 10%
[10000 ; 20000 [ 21% 10000 1 21%
[20000 ; 60000 [ 50% 40000 4 50%/4 = 12,5%
60000 et plus 19% indeter indeter indeterminée
Total n 100%
Source : AFRISTAT

Aux étudiants : quelle est la classe modale de revenu ?

A.DIENG Statistiques descriptives January 5, 2021 7 / 35


Médiane et quantiles
La médiane

Définition
La médiane M d’une distribution statistique est la valeur de la variable qui
partage la série en deux sous-ensembles égaux (i.e. de mêmes effectifs).
Ainsi, la moitié des individus présentent une valeur supérieure à la médiane
et la moitié une valeur inférieure. Elle suppose, pour sa détermination, que les
individus soient rangés dans un certain ordre.

La médiane ne pourra être calculée que sur des variables


quantitatives, car elle nécessite de pouvoir donner un ordre aux
différentes valeurs.

Indicateur insensible aux variations des valeurs extrêmes car il


ne dépend que des valeurs centrales de l’échantillon. Plus
généralement, l’ajout de valeurs extrêmes à une série ne modifie
généralement que peu la valeur de la médiane.
A.DIENG Statistiques descriptives January 5, 2021 8 / 35
Médiane et quantiles
Exemple : La médiane

La médiane du premier CC de statistiques sur les 88 étudiants de


LP1 est de 9,4/20.

Cela signifie que la moitié des étudiants ont eu une note plus
faible que 9,4 et l’autre moitié ont eu une note supérieure à 9,4.

Cette médiane partage l’amphi de LP1 en deux sous-ensembles de


mêmes effectifs (44 étudiants chacun)

A.DIENG Statistiques descriptives January 5, 2021 9 / 35


Médiane et quantiles
Détermination : cas discret

Si le nombre d’observations n est impair (3, 5, 7, ), la médiane est


toujours déterminée parfaitement et simplement. Il s’agira de la
valeur M = x(n+1)/2 une fois les observations rangées par ordre
croissant.

Exemple : soit la série 12 ; 27 ; 5 ; 2 ; 33 ; 16 ; 24 ayant n=7


observations.

Il faut tout dabord classer les valeurs par ordre croissant : 2 ; 5 ; 12


; 16 ; 24 ; 27 ; 33.

n +1
La médiane sera la valeur prise par le 4eme élément car 2 = 4,
soit M=16

A.DIENG Statistiques descriptives January 5, 2021 10 / 35


Médiane et quantiles
Détermination : cas discret (2)

Si le nombre d’observations n est pair (2, 4, 6, ), on ne peut pas


définir une médiane à proprement parler mais seulement un
intervalle médian. Cet intervalle médian sera [xn/2 , xn/2+1 ] une
fois les observations rangées par ordre croissant.

Exemple : soit la série 2 ; 5 ; 12 ; 16 ; 22 ; 24 ; 27 ; 33 comportant


n=8 observations ordonnées.

L’intervalle médian sera alors [16 ;22] car xn/2 =x4 =16 et
xn/2+1 =x5 =22

A.DIENG Statistiques descriptives January 5, 2021 11 / 35


Médiane et quantiles
Détermination : cas continu

Lorsque la variable étudiée est continue, on va raisonner à partir


des fréquences cumulées.

La médiane sera déterminée par la valeur correspondant à une


fréquence cumulée ascendante (ou descendante) égale à 50% ou
0,5.

Remarque
Contrairement aux calculs sur les histogrammes et à la détermination du
mode, il n’est pas nécessaire, pour le calcul de la médiane, de corriger les
effectifs et fréquences en cas d’amplitudes inégales.

A.DIENG Statistiques descriptives January 5, 2021 12 / 35


Médiane et quantiles
Détermination : cas continu(2)

1ere étape : trouver la classe médiane [ ai ; ai+1 [, c’est-à-dire la classe


où la fréquence cumulée de 0,5 est franchie. Nous supposerons
une répartition uniforme des valeurs entre les bornes de la classe
médiane.

2eme étape : calculer la médiane par interpolation linéaire :

[ 0, 5 − F ] [ 0, 5 − F ]
i i
M = ai + amplitude × = ai + amplitude ×
Fi+1 − Fi fi
Avec
ai : borne inférieure de la classe médiane
amplitude : amplitude de la classe médiane
Fi : fréquence cumulée ascendante à l’entrée de la classe médiane
Fi+1 : fréquence cumulée ascendante à la sortie de la classe médiane
f i : fréquence associée à la classe médiane
A.DIENG Statistiques descriptives January 5, 2021 13 / 35
Médiane et quantiles
Mediane : exemple d’un cas continu

Table: Statut marital des Africains de plus de 50 ans

Classe [ ai , ai+1 [ Effectif ni Fréquence f i Eff CC Freq CA


[0 ; 10000 [ 4773 10% 4773 10%
[10000 ; 20000 [ 10006 21% 14779 31%
[20000 ; 60000 [ 23238 50% 38017 81%
60000 et plus 8941 19% 46958 1
Total n 46958 100%
Source : AFRISTAT

1ere étape : classe de revenu médiane = [20000 ; 60000 [ car la


fréquence cumulée à l’entrée de cette classe est 0,31 et la fréquence
cumulée à la sortie vaut 81%. La valeur de revenu médiane est
donc comprise entre 20000 et 60000 euros.

A.DIENG Statistiques descriptives January 5, 2021 14 / 35


Médiane et quantiles
Mediane : exemple d’un cas continu (suite)

2eme étape : Interpolation linéaire

ai : borne inférieure de la classe médiane = 20000


amplitude : amplitude de la classe médiane = 40000
Fi : fréquence cumulée ascendante à l’entrée de la classe médiane =
31%
Fi+1 : fréquence cumulée ascendante à la sortie de la classe médiane
= 81%
f i : fréquence associée à la classe médiane = 50%
On applique la formule :
[ 0, 5 − 0, 31 ]
M = 20000 + 40000 × = 35200
0, 81 − 0, 31
Le revenu annuel total médian du ménage des Africains de plus
de 50 ans est donc de 35200 euros dans l’échantillon étudié.

A.DIENG Statistiques descriptives January 5, 2021 15 / 35


Médiane et quantiles
Généralisation aux quantiles

Les quantiles sont construits sur le même principe que la


médiane. On les utilise en statistique descriptive, surtout, en
prenant en compte les intervalles quils définissent sur la série. Un
intervalle entre deux quantiles devient alors une caractéristique
de dispersion (cf. Chap. 4).

La logique de définition des quantiles est la même que celle de la


médiane : on cherche une valeur de la variable, partageant la série
non plus en deux sous-ensembles égaux mais en 4, 10, 100 ou le
nombre souhaité.

Les calculs de détermination des quantiles sont les mêmes que


pour la médiane, on ne visera simplement plus une fréquence
cumulée de 0,5 mais de 0,01 ; 0,10 ; 0,25 etc. selon les cas.

A.DIENG Statistiques descriptives January 5, 2021 16 / 35


Médiane et quantiles
Généralisation aux quantiles

Quartiles : valeurs de la variable qui partagent la série en 4


sous-ensembles égaux. Ils sont donc au nombre de 3. Lintervalle
interquartile est défini par lécart entre le 3ème quartile (noté Q3)
et le 1er quartile (noté Q1). Il contient 50% des observations.

Déciles : partagent la série en 10 sous-ensembles égaux. Ils sont


au nombre de 9. Lintervalle D9 - D1 s’appelle intervalle
interdécile (80% des observations).

Percentiles : partagent la série en 100 sous-ensembles égaux. Ils


sont au nombre de 99. Lintervalle P99 - P1 sappelle intervalle
intercentile (98% des observations)
A.DIENG Statistiques descriptives January 5, 2021 17 / 35
Moyennes
Moyenne arithmétique

Définition
La moyenne arithmétique d’une série statistique (x1 , x2 , , xn ) est égale au
rapport de la somme des valeurs observées par le nombre total d’observations
n. On la note x̄.

1 n 1
n i∑
x̄ = xi = × ( x1 + x2 + ... + xn )
=1
n
Les moyennes ne pourront être calculée que sur des variables
quantitatives, car elles nécessitent de pouvoir faire des opérations
mathématiques dessus.
La moyenne arithmétique est la moyenne la plus couramment
utilisée. Elle sutilise dès lors que l’addition des valeurs a un sens.
Lorsquon parle de "moyenne" sans préciser son type, on fait
généralement référence à la moyenne arithmétique.
A.DIENG Statistiques descriptives January 5, 2021 18 / 35
Moyennes
Remarque sur la moyenne arithmétique

Remarque (1)
La moyenne arithmétique est fonction de toutes les observations et est donc
sensible aux valeurs extrêmes : c’est un indicateur peu "robuste" bien
qu’universellement utilisé.

Remarque (2)
Lorsqu’on ne connait pas les valeurs exactes prises par la variable X dans
l’échantillon mais uniquement des classes, il est possible de calculer la
moyenne arithmétique en prenant pour valeur le centre de chaque classe.

Exemple
Le centre de la classe [20000 ; 60000 [ sera 40000 .

A.DIENG Statistiques descriptives January 5, 2021 19 / 35


Moyennes
Exemple : Moyenne arithmétique

Supposons que, cette année, vous obteniez 9/20 au 1er CC de


statistiques, 10/20 à la 1ere interrogation, 11/20 à la 2e me
interrogation et 8/20 au 2eme CC. Quelle sera votre moyenne en
statistiques si lon suppose que toutes les notes ont le même
coefficient ?

1 n
n i∑
x̄ = xi
=1
1
= × (9 + 10 + 11 + 8)
4
= 9,5

La moyenne arithmétique en statistique sera donc 9,5/20

A.DIENG Statistiques descriptives January 5, 2021 20 / 35


Moyennes
Moyenne arithmétique ponderée

Définition
On dit qu’une moyenne arithmétique est pondérée lorsqu’à chaque valeur xi
peut correspondre plusieurs observations ni . On multiplie alors chaque valeur
par son nombre d’occurrences pour obtenir la moyenne arithmétique
pondérée.

1 k
n i∑
x̄ = ni xi
=1

Avec k le nombre de valeurs différentes prises par la variable.

A.DIENG Statistiques descriptives January 5, 2021 21 / 35


Moyennes
Exemple : Moyenne arithmétique

Reprenons les mêmes notes en statistique que précédemment


9/20 au 1er CC de statistiques, 10/20 à la 1ere interrogation, 11/20
à la 2eme interrogation et 8/20 au 2eme CC. Quelle sera votre
moyenne en statistiques si lon suppose que toutes les notes ont le
même coefficient ?

Supposons désormais que ces différents examens nont pas les


mêmes coefficients : le QCM1 compte pour 10% de la moyenne,
la 1ere interrogation pour 30%, la 2eme interrogation pour 50% et le
QCM2 pour 10%.

Quelle sera votre moyenne pondérée en statistiques ?

A.DIENG Statistiques descriptives January 5, 2021 22 / 35


Moyennes
Exemple : Moyenne arithmétique (suite)

Tout se passe comme si vous aviez passé 100 examens : 10 fois le


QCM1, 30 fois le CC1, 50 fois le CC2 et 10 fois le QCM2. La
moyenne arithmétique pondérée vaut :

1 k
n i∑
x̄ = ni xi
=1
1 4
100 i∑
= ni xi
=1
1
= × (10 × +30 × +50 × +10×) = 10,2
100
La moyenne arithmétique pondérée sera donc de 10,2/20. Elle est
plus élevée que la moyenne non pondérée (9,5/20) car les
meilleurs notes (le 10/20 et le 11) ont une pondération plus
importante que les autres.
A.DIENG Statistiques descriptives January 5, 2021 23 / 35
Moyennes
Propriétés moyenne arithmétique

La moyenne dune constante c est égale à la constante c elle-même :

1 n 1
n i∑
c = × cn = c
=1
n

Laddition dune constante c à une série de valeurs fait augmenter


la moyenne de cette même constante c :
1 n 1 n 1 n
n i∑ n i∑ n i∑
( x i + c ) = x i + c = x̄ + c
=1 =1 =1

La multiplication des valeurs dune série par une constante c


multiplie la moyenne par ce même nombre :
1 n c n
n i∑ n i∑
( cx i ) = xi = c x̄
=1 =1

A.DIENG Statistiques descriptives January 5, 2021 24 / 35


Moyennes
Propriétés moyenne arithmétique

La somme des écarts à la moyenne arithmétique est nulle. Cette


propriété est l’un des fondements des techniques d’économétrie
que vous verrez à partir de la L3 :

n n
∑ (xi − x̄) = ∑ xi − n x̄ = n x̄ − nx̄ = 0
i =1 i =1

On peut également montrer que la somme des carrés des écarts à


la moyenne est plus petite que la somme des carrés des écarts à
n’importe quelle autre valeur. Cette propriété est également l’un
des fondements des techniques d’économétrie.

n
∑ (xi − x̄)2 = minimale
i =1

A.DIENG Statistiques descriptives January 5, 2021 25 / 35


Moyennes
Forme de la distribution

La comparaison du mode, de la médiane et de la moyenne fournit


une information sur la forme de la distribution statistique :
Si Moyenne < Médiane < Mode : la distribution est caractérisée par
une asymétrie négative, un étalement à gauche.
Si Moyenne = Médiane = Mode : la distribution est symétrique.
Si Moyenne > Médiane > Mode : la distribution est caractérisée par
une asymétrie positive, un étalement à droite.

A.DIENG Statistiques descriptives January 5, 2021 26 / 35


Moyennes
Moyenne ou Moyennes

La moyenne arithmétique n’est qu’un cas particulier de moyennes

En utilisant la même logique de construction, on peut définir


d’autres moyennes qui peuvent être plus appropriées selon le
phénomène que lon étudie : la moyenne géométrique, la
moyenne harmonique, etc.

C’est ce que nous allons voir dans le reste de ce chapitre

A.DIENG Statistiques descriptives January 5, 2021 27 / 35


Moyennes
Utilisation de la moyenne géométrique

La moyenne géométrique permet de calculer des taux de


croissance / de rendement annuels moyens ( Chapitre 8 ).

En effet, le taux de croissance annuel moyen ne se calcule pas à


partir d’une addition de taux annuels (i.e. dune moyenne
arithmétique) mais à partir d’une multiplication de taux (i.e.
d’une moyenne géométrique).

Le taux de croissance global sur une période n’est de même pas


basé sur une somme de taux mais sur un produit de taux

A.DIENG Statistiques descriptives January 5, 2021 28 / 35


Moyennes
Définition moyenne géométrique

Définition
La moyenne géométrique est la racine nieme du produit des n valeurs
( x1 , x2 , ..., xn ) prises par la variable X. On la note G.

n
G = ( ∏ xi ) n
1

i =1

= n
x1 x2 ...xn
Moyenne géométrique pondérée

k
G = (∏ xini ) n
1

i =1

Avec k le nombre de valeurs différentes prises par la variable.


A.DIENG Statistiques descriptives January 5, 2021 29 / 35
Moyennes
Exemple : moyenne géométrique

Supposons quune grandeur augmente de i1 = 20% une première


année puis de i2 = 4% une deuxième année.
1) Que donnerait la moyenne arithmétique ?

La moyenne arithmétique reviendrait à dire que la moyenne de 20%


et 4% est 12%. Est-ce vrai ?

Dans le premier cas, un capital K sera égal, au bout de 2 ans, à :

K × (1, 20) × (1, 04) = 1, 248 × K


Dans le second cas, le capital vaudra au bout de 2 ans :

K × (1, 12) × (1, 12) = 1, 254 × K


Une hausse de 20% puis de 4% n’est donc pas équivalente à deux
hausses de 12%

La moyenne arithmétique n’est donc pas adaptée lorsqu’on travaille


sur des taux.
A.DIENG Statistiques descriptives January 5, 2021 30 / 35
Moyennes
Exemple : moyenne géométrique (suite)

2) Il faut donc utiliser la moyenne géométrique pour calculer le


taux de croissance annuel moyen.

Notons x1 = 1 + i1 = 1, 20 et x2 = 1 + i2 = 1, 04 les deux


multiplicateurs.

Calculons le multiplicateur annuel moyen :

n 1
G = ( ∏ xi ) n
i =1
2 1
= ( ∏ xi ) 2
i =1
1
= (1, 20 × 1, 04) 2 = 1, 117

Le taux de croissance annuel moyen est donc de 11,7%


A.DIENG Statistiques descriptives January 5, 2021 31 / 35
Moyennes
Exemple introductif : Moyenne harmonique

Un individu décide de faire la distance Paris-Nice, que nous


noterons D, selon le trajet suivant : la moitié du chemin à vélo à la
vitesse moyenne de 30 km/h, lautre moitié en TGV à 300 km/h.
Quelle est sa vitesse moyenne sur l’ensemble du trajet ?

1) Que donnerait la moyenne arithmétique ?


La moyenne arithmétique donnerait une vitesse moyenne de :
30+300
2 = 165km/h
C’est faux, car l’individu passe en réalité 10 fois plus de temps sur
son vélo à rouler à 30 km/h que dans le TGV à rouler à 300 km/h.
Donc la vitesse moyenne est en réalité beaucoup plus proche de 30
km/h que des 300 km/h !
A.DIENG Statistiques descriptives January 5, 2021 32 / 35
Moyennes
Exemple introductif : Moyenne harmonique

2) Comment calculer la vitesse moyenne correcte ?


2.1) Calcul du temps mis par lindividu pour arriver à Nice :

Tempstotal = Tempsvelo + Temps TGV


Distancevelo DistanceTGV
= +
Vitessevelo VitesseTGV
D D
2 2 11D
= + =
30 300 600
2.2) On calcule la vitesse moyenne :

Distancetotale
Vitessemoyenne =
Tempstotal
D 600
= 11D = ≈ 55km/h
600
11

A.DIENG Statistiques descriptives January 5, 2021 33 / 35


Moyennes
Définition Moyenne harmonique

Lexemple que nous venons de traiter correspond à un calcul de


moyenne harmonique.
Définition
La moyenne harmonique permet en effet de calculer des moyennes sur des
fractions si les dénominateurs changent. C’est le cas de la vitesse
moyenne, la vitesse étant représentée par le rapport entre la distance et le
temps.

Moyenne harmonique n
H=
∑in=1 x1i
Moyenne harmonique pondérée
n
H= n
∑ik=1 xii
Avec k le nombre de valeurs différentes prises par la variable.
A.DIENG Statistiques descriptives January 5, 2021 34 / 35
Moyennes
Généralisation de la notion de moyenne

Il existe en réalité plein d’autres types de moyenne. On parlera de


moyenne pondérée d’ordre r :

[1 k ] 1r
∑ ni xir
n i =1

Pour r = 1 on retrouve la moyenne arithmétique


Pour r = 2 : moyenne quadratique (non traitée ici)
Pour r = −1 : moyenne harmonique
Pour r très petit : moyenne géométrique

A.DIENG Statistiques descriptives January 5, 2021 35 / 35

Vous aimerez peut-être aussi