Vous êtes sur la page 1sur 250

Statistique descriptive

Jaouad Madkour

jaouad.madkour@outlook.com

Licence Sciences économiques et Gestion - Semestre 1

Faculté des sciences juridiques, économiques et sociales - Tanger

Année universitaire 2019 - 2020

1 / 250
Introduction

Qu’est ce que la (les) statistique(s) ? Quelques références utiles

Objectif pédagogique du cours Ma page sur Facebook

Pré-requis nécessaires Mon site web

Plan du cours Wikipédia

2 / 250
Qu’est ce que la (les) statistique(s) ?

Définitions :
• Au sens large, la statistique est la science qui a pour objet l’extraction,
l’analyse et l’exploitation de l’information contenue dans des données.
• Au sens étroit, les statistiques sont des données concernant un phénomène
particulier et observées sur un groupe d’individus ou d’unités.

Il existe deux sortes de statistiques (en tant que science) :


• La statistique descriptive ou exploratoire : elle décrit l’information contenue
dans des données à l’aide de tableaux, de graphiques et d’indicateurs.
• La statistique inférentielle ou confirmatoire : elle induit les caractéristiques
inconnues d’une population à partir d’un échantillon de cette population.

3 / 250
Qu’est ce que la (les) statistique(s) ?

Statistique descriptive :

4 / 250
Qu’est ce que la (les) statistique(s) ?

Statistique inférentielle :

5 / 250
Objectif pédagogique du cours

Taxonomie de Bloom :

6 / 250
Pré-requis nécessaires

Bien que la statistique descriptive soit une branche des mathématiques qui s’ap-
plique à d’autres disciplines comme la biologie, l’économie, la finance et la ges-
tion, elle ne nécessite que des connaissances élémentaires en mathématiques
telles que les opérations arithmétiques, la factorisation, le développement...

7 / 250
Plan du cours

Chapitre 1 : Organisation des données

Chapitre 2 : Séries statistiques à une dimension

Chapitre 3 : Séries statistiques à deux dimensions

8 / 250
Quelques références utiles

9 / 250
Quelques références utiles

10 / 250
Quelques références utiles

11 / 250
Quelques références utiles

12 / 250
Quelques références utiles

13 / 250
Quelques références utiles

14 / 250
Ma page sur Facebook

15 / 250
Mon site web : jaouadmadkour.webnode.fr

16 / 250
Wikipédia

17 / 250
Chapitre 1 :
Organisation des données

Vocabulaire et opérateurs statistiques

Tableaux statistiques

Représentations graphiques

18 / 250
Vocabulaire et opérateurs statistiques

Section 1 :
Vocabulaire et opérateurs statistiques

Vocabulaire statistique

Typologie des variables statistiques

Opérateurs statistiques Σ et Π

19 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Sous-section 1 :
Vocabulaire statistique

Population, échantillon et individu

Caractère et modalité

Effectifs et fréquences

Série et distribution statistiques

20 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Population, échantillon et individu

Définitions :
• Population : Un ensemble d’éléments.

• Échantillon : Une partie de la population.

• Individu : Un élément de la population.

21 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Population, échantillon et individu

Exemple 1 :
• Population : Étudiants de la FSJES de Tanger.

• Échantillon : Étudiants de la filière Économie et gestion.

• Individu : Tout étudiant de la FSJES de Tanger.

Exemple 2 :
• Population : Entreprises installées à Tanger.

• Échantillon : Entreprises du secteur textile.

• Individu : Toute entreprise installée à Tanger.

22 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Caractère et modalité

Définitions :
• Caractère : Objet selon lequel la population est étudiée.

• Modalité : Valeur prise par le caractère étudié.

Remarque :
Un caractère est également appelé variable statistique. Il est noté en lettres
majuscules X et prend k ∈ N∗ modalités désignées par des lettres minuscules
numérotées x1 , x2 , · · · , xk .

23 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Caractère et modalité

Exemple 1 (suite) :
• Population : Étudiants de la FSJES de Tanger.

• Caractère X : Moyenne obtenue au baccalauréat.

• Modalités : x1 = 10, x2 = 11, x3 = 12, x4 = 13.

Exemple 2 (suite) :
• Population : Entreprises installées à Tanger.

• Caractère Y : Nombre d’employés.

• Modalités : y1 = 50, y2 = 100, y3 = 500.

24 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Définitions :
• Effectif ni d’une modalité xi : Nombre d’individus qui ont la modalité xi .

• Effectif total n : Nombre d’individus qui composent la population.

• Fréquence fi d’une modalité xi : Proportion d’individus qui ont la


modalité xi . Elle est donnée par : fi = ni /n.

25 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Remarques :
• L’effectif total n est égal à la somme de tous les effectifs ni :

n1 + n2 + · · · + nk = n

• Théoriquement, la somme des fréquences fi est égale à 1 car :

n1 n2 nk n
f1 + f2 + · · · + fk = + + ··· + = =1
n n n n

• Dans la pratique, si la somme des fréquences est différente de 1 à cause


des problèmes d’arrondis, il est d’usage de manipuler légèrement l’une des
fréquences de sorte à retrouver une somme précisément égale à 1.

26 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Exemple :

xi ni fi
1
x1 1 3 ≈ 0.33 → 0.34
1
x2 1 3 ≈ 0.33 → 0.33
1
x3 1 3 ≈ 0.33 → 0.33
Somme 3 0.99 → 1.00

27 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Application : Moyennes obtenues au baccalauréat

10 13 12 14 10 13 11 12 11 10
11 14 10 13 12 10 12 13 12 10
13 16 14 11 13 15 10 13 12 14
10 15 11 14 12 15 12 11 13 10
12 15 14 10 13 11 16 13 11 15
12 11 13 10 14 16 15 11 15 12
13 11 14 11 14 12 15 13 12 13
11 12 10 16 11 14 14 13 14 10

28 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Application : Moyennes obtenues au baccalauréat

xi ni fi = ni /n
10 13 13/80 = 0.1625
11 14 14/80 = 0.1750
12 14 14/80 = 0.1750
13 15 15/80 = 0.1875
14 12 12/80 = 0.1500
15 08 08/80 = 0.1000
16 04 04/80 = 0.0500
Somme n = 80 1

29 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Définitions :
• Effectif cumulé croissant Ni+ d’une modalité xi : Nombre d’individus qui
ont des modalités au plus égales à la modalité xi :

Ni+ = n1 + n2 + · · · + ni

• Effectif cumulé décroissant Ni− d’une modalité xi : Nombre d’individus qui


ont des modalités au moins égales à la modalité xi :

Ni− = nk + nk −1 + · · · + ni

30 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Application (suite) : Moyennes obtenues au baccalauréat

xi ni Ni+ Ni−
10 ↓ 13 13 67 + 13 = 80 ↑
11 ↓ 14 13 + 14 = 27 ↓ 53 + 14 = 67 ↑
12 ↓ 14 27 + 14 = 41 ↓ 39 + 14 = 53 ↑
13 ↓ 15 41 + 15 = 56 ↓ 24 + 15 = 39 ↑
14 ↓ 12 56 + 12 = 68 ↓ 12 + 12 = 24 ↑
15 ↓ 08 68 + 08 = 76 ↓ 04 + 08 = 12 ↑
16 ↓ 04 76 + 04 = 80 ↓ 04
Somme n = 80 – –

31 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Définitions :
• Fréquence cumulée croissante Fi+ d’une modalité xi : Proportion d’indivi-
dus qui ont des modalités au plus égales à la modalité xi :

Fi+ = f1 + f2 + · · · + fi

• Fréquence cumulée décroissante Fi− d’une modalité xi : Proportion d’indi-


vidus qui ont des modalités au moins égales à la modalité xi :

Fi− = fk + fk −1 + · · · + fi

32 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Application (suite) : Moyennes obtenues au baccalauréat

xi fi Fi+ Fi−
10 ↓ 0.1625 0.1625 0.8375+0.1625 = 1.0000 ↑
11 ↓ 0.1750 0.1625+0.1750 = 0.3375 ↓ 0.6625+0.1750 = 0.8375 ↑
12 ↓ 0.1750 0.3375+0.1750 = 0.5125 ↓ 0.4875+0.1750 = 0.6625 ↑
13 ↓ 0.1875 0.5125+0.1875 = 0.7000 ↓ 0.3000+0.1875 = 0.4875 ↑
14 ↓ 0.1500 0.7000+0.1500 = 0.8500 ↓ 0.1500+0.1500 = 0.3000 ↑
15 ↓ 0.1000 0.8500+0.1000 = 0.9500 ↓ 0.0500+0.1000 = 0.1500 ↑
16 ↓ 0.0500 0.9500+0.0500 = 1.0000 ↓ 0.0500
Somme 1.0000 – –

33 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Effectifs et fréquences

Remarques :
• Les effectifs ni sont aussi appelés des fréquences absolues et les fréquences
fi des fréquences relatives.

• Une fréquence fi est comprise entre 0 et 1 tandis qu’un pourcentage pi est


compris entre 0 et 100. Un pourcentage est une fréquence multipliée par
100, il est désigné par le symbole % : pi = (fi × 100) %.

• L’expression « au plus » est équivalente à « inférieur ou égal » et l’expres-


sion « au moins » est équivalente à « supérieur ou égal ».

• Les effectifs et les fréquences cumulés n’ont de sens que lorsqu’il est possible
de classer les modalités dans un ordre croissant ou décroissant.

34 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Série et distribution statistiques

Définition (Série statistique)


Une série statistique est une suite de modalités brute ou ordonnée. Il s’agit, par
exemple, des réponses collectées lors d’une enquête, des notes obtenues dans
une épreuve écrite...etc.

Exemples :

Série brute : 12 18 10 17 11 15 12 17 18 10
Série ordonnée : 10 10 11 12 12 15 17 17 18 18

35 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique

Série et distribution statistiques

Définition (Distribution statistique)


Une distribution statistique est l’association entre les modalités xi d’une variable
statistique et les effectifs ni ou les fréquences fi correspondants. Elle montre
comment les effectifs ou les fréquences sont distribués entre les modalités.

Exemples :
Distribution statistique des effectifs :
xi 10 11 12 15 17 18
ni 2 1 2 1 2 2

Distribution statistique des fréquences :


xi 10 11 12 15 17 18
fi 0.2 0.1 0.2 0.1 0.2 0.2
36 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques

Sous-section 2 :
Typologie des variables statistiques

Variable statistique quantitative

Variable statistique qualitative

37 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques

Variable statistique quantitative

Définitions (Variable quantitative)


Une variable statistique est quantitative si elle est mesurée par un nombre au
sens mathématique du terme.

→ Une variable quantitative est discrète si elle ne peut prendre que certaines
valeurs d’un intervalle.

→ Une variable quantitative est continue si elle peut prendre toutes les valeurs
possibles d’un intervalle rangées dans des classes.

→ Une classe est un intervalle semi-fermé [xi−1 ; xi [. Elle est caractérisée par
son amplitude ai = xi − xi−1 et par son centre ci = (xi−1 + xi )/2.

38 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques

Variable statistique quantitative

Exemples de variable continue :


• Poids en kilogrammes : [60; 120].

• Taille en centimètres : [160; 210].

• Volume en litres : [16; 45].

Exemples de variable discrète :


• Nombre d’enfants par famille : {0, 1, 2 · · · }.

• Nombre de salariés d’une entreprise : {1, 5, 20 · · · }.

• Nombre de pièces produites par une machine : {1000, 1200, 2000 · · · }.

39 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques

Variable statistique qualitative

Définitions (variable qualitative)


Une variable statistique est qualitative si elle ne peut pas être exprimée par un
nombre au sens mathématique du terme.

→ Une variable qualitative est ordinale s’il est possible d’établir un ordre
unique entre ses modalités.

→ Une variable qualitative est nominale s’il n’est pas possible d’établir un
ordre unique entre ses modalités.

→ Les modalités d’une variable qualitative sont aussi appelées des catégories.
De ce fait, une variable qualitative est une variable catégorielle.

40 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques

Variable statistique qualitative

Exemples de variable ordinale :


• Niveaux d’études : bacclauréat, licence, master ...

• Niveaux de satisfaction : pas satisfait, satisfait, très satisfait ...

• Mentions : assez bien, bien, très bien ...

Exemples de variable nominale :


• Couleurs : rouge, bleu, vert ...

• Moyens de transport : train, voiture, bus ...

• Genre : homme ou femme.

41 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques

Variable statistique qualitative

Remarque :
Les catégories d’une variable qualitative peuvent être codées par des nombres
qui n’ont pas de signification mathématique. On peut, par exemple, donner à
la couleur bleue le code 1, à la couleur rouge le code 2 et à la couleur verte le
code 3. Ces codes n’ont pas de sens mathématique car 1 + 2 = 3 ne signifie pas
que mélanger la couleur bleue avec la couleur rouge produit la couleur verte !

42 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Sous-section 3 :
Opérateurs statistiques Σ et Π

Opérateur statistique Σ (sigma)

Opérateur statistique Π (pi )

Applications

43 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Σ (sigma)

Définition (Opérateur Σ)
Soit X une variable quantitative prenant les valeurs x1 , x2 , · · · , xk avec k ∈ N∗ .
L’opérateur Σ permet d’écrire la somme x1 +x2 +· · ·+xk de façon plus compacte :

k
X
xi ≡ x1 + x2 + · · · + xk
i=1

où i est une variable muette représentant l’indice de sommation.


On prononce : « Somme des xi avec i allant de 1 à k ».

44 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Σ (sigma)

Quelques propriétés de l’opérateur Σ :


Soient X et Y deux variables quantitatives prenant les valeurs x1 , x2 , · · · , xk et
y1 , y2 , · · · , yk avec k ∈ N∗ . L’opérateur Σ vérifie les propriétés suivantes :

k
X k
X
axi = a xi , ∀a ∈ R
i=1 i=1
k
X k
X k
X
(xi + yi ) = xi + yi
i=1 i=1 i=1
k
X h
X k
X
xi = xi + xi , ∃h ∈ N∗ | 1 < h < k
i=1 i=1 i=h+1
k
X
a = k .a , ∀a ∈ R
i=1

45 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Σ (sigma)

Démonstrations :

k
X
axi = ax1 + ax2 + · · · + axk
i=1
= a (x1 + x2 + · · · + xk )
| {z }
Pk
i=1 xi
k
X
=a xi
i=1

46 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Σ (sigma)

Démonstrations :

k
X
(xi + yi ) = (x1 + y1 ) + (x2 + y2 ) + · · · + (xk + yk )
i=1
= (x1 + x2 + · · · + xk ) + (y1 + y2 + · · · + yk )
| {z } | {z }
Pk Pk
i=1 xi i=1 yi
k
X k
X
= xi + yi
i=1 i=1

47 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Σ (sigma)

Démonstrations :

k
X
xi = x1 + x2 + · · · + xb + xb+1 + xb+2 + · · · + xk
i=1
= (x1 + x2 + · · · + xh ) + (xh+1 + xh+2 + · · · + xk )
| {z } | {z }
Ph Pk
i=1 xi i=h+1 xi
h
X k
X
= xi + xi
i=1 i=h+1

48 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Σ (sigma)

Démonstrations :

k
X
a = a + a + ··· + a
| {z }
i=1 k fois
= k .a

49 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Π (pi)

Définition (Opérateur Π)
Soit X une variable quantitative prenant les valeurs x1 , x2 , · · · , xk avec k ∈ N∗ .
L’opérateur Π permet d’écrire le produit x1 ×x2 ×· · ·×xk de façon plus compacte :

k
Y
xi ≡ x1 × x2 × · · · × xk
i=1

où i est une variable muette représentant l’indice de multiplication.


On prononce : « Produit des xi avec i allant de 1 à k ».

50 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Π (pi)

Quelques propriétés de l’opérateur Π :


Soient X et Y deux variables quantitatives prenant les valeurs x1 , x2 , · · · , xk et
y1 , y2 , · · · , yk avec k ∈ N∗ . L’opérateur Π vérifie les propriétés suivantes :

k
Y
a = a k , ∀a ∈ R
i=1
k
Y k
Y k
Y
(xi × yi ) = xi × yi
i=1 i=1 i=1
k
Y h
Y k
Y
xi = xi × xi , ∃h ∈ N∗ | 1 < h < k
i=1 i=1 i=h+1
k
Y k
Y
axi = a k xi , ∀a ∈ R
i=1 i=1

51 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Π (pi)

Démonstrations :

k
Y
a = a × a × ··· × a
| {z }
i=1 k facteurs
k
=a

52 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Π (pi)

Démonstrations :

k
Y
(xi × yi ) = (x1 × y1 ) × (x2 × y2 ) × · · · × (xk × yk )
i=1
= (x1 × x2 × · · · × xk ) × (y1 × y2 × · · · × yk )
| {z } | {z }
Qk Qk
i=1 xi i=1 yi
k
Y k
Y
= xi × yi
i=1 i=1

53 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Π (pi)

Démonstrations :

k
Y
xi = x1 × x2 × · · · × xh × xh+1 × xh+2 × · · · × xk
i=1
= (x1 × x2 × · · · × xh ) × (xh+1 × xh+2 × · · · × xk )
| {z } | {z }
Qh Qk
i=1 xi i=h+1 xi
h
Y k
Y
= xi × xi
i=1 i=h+1

54 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Opérateur statistique Π (pi)

Démonstrations :

k
Y
axi = ax1 × ax2 × · · · × axk
i=1
= (a × a × · · · × a) × (x1 × x2 × · · · × xk )
| {z } | {z }
Qk
k facteurs xi
i=1

k
Y
= ak xi
i=1

55 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Applications

Calculer les sommes suivantes :


k
X
(xi + a)
i=1
k
X 2
(xi + a)
i=1
k
X 2
(xi + yi )
i=1

Que vaut le logarithme d’un produit ?


k
!
Y
log xi
i=1

56 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Applications

Solutions :

k
X
(xi + a) = (x1 + a) + (x2 + a) + · · · + (xk + a)
i=1

= x1 + a + x2 + a + · · · + xk + a

= (x1 + x2 + · · · + xk ) + (a + a + · · · + a)
k
X k
X
= xi + a
i=1 i=1
k
X
= xi + ka
i=1

57 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Applications

Solutions :

k
X 2 2 2 2
(xi + a) = (x1 + a) + (x2 + a) + · · · + (xk + a)
i=1

= x12 + 2ax1 + a 2 + x22 + 2ax2 + a 2 + · · · + xk2 + 2axk + a 2


  

= x12 + 2ax1 + a 2 + x22 + 2ax2 + a 2 + · · · + xk2 + 2axk + a 2

= (x12 + · · · + xk2 ) + (2ax1 + · · · + 2axk ) + (a 2 + · · · + a 2 )

k
X k
X k
X
= xi2 + 2axi + a2
i=1 i=1 i=1

k
X k
X
= xi2 + 2a xi + k .a 2
i=1 i=1
58 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Applications

Solutions :

k
X 2 2 2 2
(xi + yi ) = (x1 + y1 ) + (x2 + y2 ) + · · · + (xk + yk )
i=1

= x12 + 2x1 y1 + y12 + · · · + xk2 + 2xk yk + yk2


 

= x12 + 2x1 y1 + y12 + · · · + xk2 + 2xk yk + yk2

= (x12 + · · · + xk2 ) + (2x1 y1 + · · · + 2xk yk ) + (y12 + · · · + yk2 )


k
X k
X k
X
= xi2 + 2xi yi + yi2
i=1 i=1 i=1

k
X k
X k
X
= xi2 + 2 xi yi + yi2
i=1 i=1 i=1

59 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π

Applications

Rappel :

log (a × b) = log (a) + log (b)

Solutions :

k
!
Y
log xi = log (x1 × x2 × · · · × xk )
i=1

= log (x1 ) + log (x2 ) + · · · + log (xk )


k
X
= log (xi )
i=1

60 / 250
Tableaux statistiques

Section 2 :
Tableaux statistiques

Variables qualitatives nominales

Variables qualitatives ordinales

Variables quantitatives discrètes

Variables quantitatives continues

61 / 250
Tableaux statistiques

Définition (Tableau statistique)


Le tableau statistique est une représentation synthétique d’une distribution sta-
tistique. Il regroupe l’effectif de chaque modalité, sa fréquence ainsi que ses
effectifs et ses fréquences cumulés.

62 / 250
Tableaux statistiques Variables qualitatives nominales

Sous-section 1 :
Variables qualitatives nominales

63 / 250
Tableaux statistiques Variables qualitatives nominales

Exemple : Préférences pour des couleurs

B V R O R O R B R B
B V B R V B V B O R
V V R B R V O R O B
B B V B V R B B O R

B : Bleu
V : Vert
R : Rose
O : Orange

64 / 250
Tableaux statistiques Variables qualitatives nominales

Tableau statistique :

Catégories ni fi
Vert 9 0.225
Bleu 14 0.350
Orange 6 0.150
Rose 11 0.275
Σ 40 1.000

65 / 250
Tableaux statistiques Variables qualitatives ordinales

Sous-section 2 :
Variables qualitatives ordinales

66 / 250
Tableaux statistiques Variables qualitatives ordinales

Exemple : Niveaux d’études

B M L D B L M M B D L B
L B L B B L M B L B B B
B M B B L L B L B L L L
L M D B M B B L D B M M
B L B M L B M L D B M B

B : Baccalauréat
L : Licence
M : Master
D : Doctorat

67 / 250
Tableaux statistiques Variables qualitatives ordinales

Tableau statistique :

Niveaux d’études ni fi Ni+ Ni− Fi+ Fi−


Baccalauréat 25 0.42 25 60 0.42 1
Licence 18 0.30 43 35 0.72 0.58
Master 12 0.20 55 17 0.92 0.28
Doctorat 5 0.08 60 5 1 0.08
Σ 60 1 – – – –

Le nombre de personnes qui ont au moins une licence est donné par l’in-
tersection de la ligne Licence et de la colonne Ni− , c’est à dire N2− = 35.

La proportion d’individus qui ont au plus un master est donné par le croi-
sement de la ligne Master et de la colonne Fi+ , c’est à dire F3+ = 0.92.
68 / 250
Tableaux statistiques Variables quantitatives discrètes

Sous-section 3 :
Variables quantitatives discrètes

69 / 250
Tableaux statistiques Variables quantitatives discrètes

Exemple : Nombre d’enfants par famille

1111111111112222222222222
2222222222222222222222222
2233333333333333333333333
3333333334444444444444444

70 / 250
Tableaux statistiques Variables quantitatives discrètes

Tableau statistique :

xi ni fi Ni+ Ni− Fi+ Fi−


1 12 0.12 12 100 0.12 1
2 40 0.40 52 88 0.52 0.88
3 32 0.32 84 48 0.84 0.48
4 16 0.16 100 16 1 0.16
Σ 100 1 – – – –

Le nombre de familles qui ont au plus 4 enfants est donné par l’intersection
de la ligne 4 et de la colonne Ni+ , c’est à dire 100 familles.

La proportion de familles qui ont au moins un enfant est déterminée par la


ligne 1 et par la colonne Fi− , en l’occurrence 1.
71 / 250
Tableaux statistiques Variables quantitatives continues

Sous-section 4 :
Variables quantitatives continues

72 / 250
Tableaux statistiques Variables quantitatives continues

Exemple : Tailles d’individus

161.2 162.4 162.7 163.8 163.5 166.4 166.8 166.4 167.1 167.3 168.2
168.7 169.1 169.4 169.4 171.4 171.6 171.4 171.8 171.8 171.2 171.8
171.1 171.5 172.9 172.7 172.4 173.4 173.6 173.6 173.3 173.1 174.4
174.4 174.7 177.4 177.6 177.4 177.6 178.4 178.4 178.1 178.2 179.8
179.4 179.1 179.0 179.4 179.4 179.3 181.1 181.3 182.1 183.1 183.3

73 / 250
Tableaux statistiques Variables quantitatives continues

Tableau statistique :

Tailles ni fi Ni+ Ni− Fi+ Fi−


[160; 165[ 5 0.09 5 55 0.09 1
[165; 170[ 10 0.18 15 50 0.27 0.91
[170; 175[ 20 0.36 35 40 0.63 0.73
[175; 180[ 15 0.28 50 20 0.91 0.37
[180; 185] 5 0.09 55 5 1 0.09
Σ 55 1 – – – –

Le nombre d’individus qui ont des tailles au plus égales à 170 cm se trouve
sur la ligne de la classe qui a une borne supérieure égale à 170 et sur la
colonne Ni+ , c’est à dire N2+ = 15.
La proportion d’individus qui ont des tailles au moins égales à 170 cm se
trouve sur la ligne de la classe qui a une borne inférieure égale à 170 et sur
la colonne Fi− , c’est à dire F3− = 0.73.

74 / 250
Représentations graphiques

Section 3 :
Représentations graphiques

Diagramme en barres

Diagramme en bâtons

Histogramme

Courbes cumulatives

75 / 250
Représentations graphiques

Définition (Représentation graphique)


Une représentation graphique est une visualisation de l’allure générale de la
distribution statistique à l’aide de formes géométriques.

76 / 250
Représentations graphiques Diagramme en barres

Sous-section 1 :
Diagramme en barres

77 / 250
Représentations graphiques Diagramme en barres

Définition (Diagramme en barres)


Le diagramme en barres est un graphique qui associe à chaque catégorie d’une
variable qualitative un rectangle de hauteur égale son effectif ou à sa fréquence.

Utilisation :
Représentation graphique des effectifs et des fréquences d’une variable
qualitative.

78 / 250
Représentations graphiques Diagramme en barres

Diagramme en barres :

79 / 250
Représentations graphiques Diagramme en barres

Remarques :
Les rectangles d’un diagramme en barres sont disjoints.
L’ordre des catégories d’une variable qualitative ordinale doit être
respecté lors de la construction du diagramme en barres.

80 / 250
Représentations graphiques Diagramme en barres

Exemple : Préférences pour des couleurs

81 / 250
Représentations graphiques Diagramme en barres

Exemple : Niveaux d’études

82 / 250
Représentations graphiques Diagramme en bâtons

Sous-section 2 :
Diagramme en bâtons

83 / 250
Représentations graphiques Diagramme en bâtons

Définition (Diagramme en bâtons)


Le diagramme en bâtons est un graphique qui associe à chaque modalité un
segment de longueur égale à son effectif ou à sa fréquence.

Utilisation :
Représentation graphique des effectifs et des fréquences d’une variable
quantitative discrète.

84 / 250
Représentations graphiques Diagramme en bâtons

Diagramme en bâtons :

85 / 250
Représentations graphiques Diagramme en bâtons

Exemple : Nombre d’enfants par famille

86 / 250
Représentations graphiques Histogramme

Sous-section 3 :
Histogramme

87 / 250
Représentations graphiques Histogramme

Définition (Histogramme)
L’histogramme est un graphique qui associe à chaque classe d’une variable quan-
titative continue un rectangle d’aire égale à son effectif ou à sa fréquence.

Utilisation :
Représentation graphique des effectifs et des fréquences d’une variable
quantitative continue.

Remarques :
Les rectangles d’un histogramme sont juxtaposés.

Les hauteurs des rectangles sont données par les densités d’effectifs ou de
fréquences respectivement définies par :

ni fi
hi = hi =
ai ai

88 / 250
Représentations graphiques Histogramme

Illustration d’une densité :

89 / 250
Représentations graphiques Histogramme

Exemple : Tailles d’individus


Tailles en cm ni ai hi Tailles en cm fi ai hi

[160; 165[ 5 5 1 [160; 165[ 0.090 5 0.018


[165; 170[ 10 5 2 [165; 170[ 0.180 5 0.036
[170; 175[ 20 5 4 [170; 175[ 0.360 5 0.072
[175; 180[ 10 5 2 [175; 180[ 0.185 5 0.037
[180; 185] 10 5 2 [180; 185] 0.185 5 0.037

90 / 250
Représentations graphiques Histogramme

Densités d’effectifs :

91 / 250
Représentations graphiques Histogramme

Densités de fréquences :

92 / 250
Représentations graphiques Courbes cumulatives

Sous-section 4 :
Courbes cumulatives

Variable quantitative discrète

Variable quantitative continue

93 / 250
Représentations graphiques Courbes cumulatives

Définition (courbe cumulative)


La courbe cumulative est un graphique qui associe à chaque modalité ou à chaque
classe son effectif cumulé ou sa fréquence cumulée.

Utilisation :
Représentation graphique des effectifs et des fréquences cumulés d’une variable
quantitative.

Remarques :
Si l’effectif cumulé ou la fréquence cumulée sont croissants, alors la courbe
cumulative est dite ascendante et si l’effectif cumulé ou la fréquence cumulée
sont décroissants, alors la courbe cumulative est dite descendante.

La courbe cumulative est la courbe représentative d’une fonction réelle


définie sur l’ensemble R et à valeurs dans [0; 1] pour les effectifs cumulés et
à valeurs dans [0; n] pour les fréquences cumulées.

94 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète

Logique de construction d’une courbe cumulative

Courbe cumulative ascendante des effectifs

Courbe cumulative descendante des effectifs

Courbe cumulative ascendante des fréquences

Courbe cumulative descendante des fréquences

95 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Logique de construction d’une courbe cumulative

Tableau statistique :

xi ni fi Ni+ Ni− Fi+ Fi−


→ 1 12 0.12 12 100 0.12 1
→ 2 40 0.40 52 88 0.52 0.88
→ 3 32 0.32 84 48 0.84 0.48
→ 4 16 0.16 100 16 1 0.16

96 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Logique de construction d’une courbe cumulative

xi ni fi Ni+ Ni− Fi+ Fi−


−∞ 0 0 0 100 0 1
↑ 0 0 0 100 0 1
→ 1 12 0.12 12 100 0.12 1
0 0 12 88 0.12 0.88
.. 0 0 12 88 0.12 0.88
.
0 0 12 88 0.12 0.88
→ 2 40 0.40 52 88 0.52 0.88
0 0 52 48 0.52 0.48
.. 0 0 52 48 0.52 0.48
.
0 0 52 48 0.52 0.48
→ 3 32 0.32 84 48 0.84 0.48
0 0 84 16 0.84 0.16
.. 0 0 84 16 0.84 0.16
.
0 0 84 16 0.84 0.16
→ 4 16 0.16 100 16 1 0.16
↓ 0 0 100 0 1 0
+∞ 0 0 100 0 1 0

97 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative ascendante des effectifs

Étape 1 : Positionner les points de coordonnées (xi ; Ni+ )

xi Ni+
1 12
2 52
3 84
4 100

Ni+ est le nombre d’individus qui ont au plus la modalité xi .


98 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative ascendante des effectifs

Étape 2 : Tracer les demi-droites extrêmes

xi Ni+
1 12
2 52
3 84
4 100

Ni+ est le nombre d’individus qui ont au plus la modalité xi .


99 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative ascendante des effectifs

Étape 3 : Tracer les segments intermédiaires

xi Ni+
1 12
2 52
3 84
4 100

Ni+ est le nombre d’individus qui ont au plus la modalité xi .


100 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative descendante des effectifs

Étape 1 : Positionner les points de coordonnées (xi ; Ni− )

xi Ni−
1 100
2 88
3 48
4 16

Ni− est le nombre d’individus qui ont au moins la modalité xi .


101 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative descendante des effectifs

Étape 2 : Tracer les demi-droites extrêmes

xi Ni−
1 100
2 88
3 48
4 16

Ni− est le nombre d’individus qui ont au moins la modalité xi .


102 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative descendante des effectifs

Étape 3 : Tracer les segments intermédiaires

xi Ni−
1 100
2 88
3 48
4 16

Ni− est le nombre d’individus qui ont au moins la modalité xi .


103 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative ascendante des fréquences

Étape 1 : Positionner les points de coordonnées (xi ; Fi+ )

xi Fi+
1 0.12
2 0.52
3 0.84
4 1

Fi+ est la proportion d’individus qui ont au plus la modalité xi .


104 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative ascendante des fréquences

Étape 2 : Tracer les demi-droites extrêmes

xi Fi+
1 0.12
2 0.52
3 0.84
4 1

Fi+ est la proportion d’individus qui ont au plus la modalité xi .


105 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative ascendante des fréquences

Étape 3 : Tracer les segments intermédiaires

xi Fi+
1 0.12
2 0.52
3 0.84
4 1

Fi+ est la proportion d’individus qui ont au plus la modalité xi .


106 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative descendante des fréquences

Étape 1 : Positionner les points de coordonnées (xi ; Fi− )

xi Fi−
1 1
2 0.88
3 0.48
4 0.16

Fi− est la proportion d’individus qui ont au moins la modalité xi .


107 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative descendante des fréquences

Étape 2 : Tracer les demi-droites extrêmes

xi Fi−
1 1
2 0.88
3 0.48
4 0.16

Fi− est la proportion d’individus qui ont au moins la modalité xi .


108 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative discrète : Courbe cumulative descendante des fréquences

Étape 3 : Tracer les segments intermédiaires

xi Fi−
1 1
2 0.88
3 0.48
4 0.16

Fi− est la proportion d’individus qui ont au moins la modalité xi .


109 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue

Logique de construction d’une courbe cumulative

Courbe cumulative ascendante des effectifs

Courbe cumulative descendante des effectifs

Courbe cumulative ascendante des fréquences

Courbe cumulative descendante des fréquences

110 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Logique de construction d’une courbe cumulative

Tableau statistique :

[xi−1 ; xi [ ni fi Ni+ Ni− Fi+ Fi−


[160; 165[ 5 0.09 5 55 0.09 1
[165; 170[ 10 0.18 15 50 0.27 0.91
[170; 175[ 20 0.36 35 40 0.63 0.73
[175; 180[ 15 0.28 50 20 0.91 0.37
[180; 185] 5 0.09 55 5 1 0.09

111 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Logique de construction d’une courbe cumulative

Hypothèse d’uniformité :

112 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Logique de construction d’une courbe cumulative

[xi−1 ; xi [ xi ni fi Ni+ Ni− Fi+ Fi−


−∞ 0 0 0 55 0 1
] − ∞; 160[ ↑ 0 0 0 55 0 1
159 0 0 0 55 0 1
160 1 0.018 1 55 0.018 1
161 1 0.018 2 54 0.036 0.982
[160; 165[ 162 1 0.018 3 53 0.054 0.964
163 1 0.018 4 52 0.072 0.946
164 1 0.018 5 51 0.090 0.928
.. .. .. .. .. .. .. ..
. . . . . . . .
180 1 0.018 51 5 0.090 0.090
181 1 0.018 52 4 0.946 0.072
[180; 185[ 182 1 0.018 53 3 0.964 0.054
183 1 0.018 54 2 0.982 0.036
184 1 0.018 55 1 1 0.018
164 0 0 55 0 1 0
[185; +∞[ ↓ 0 0 55 0 1 0
+∞ 0 0 55 0 1 0
113 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative ascendante des effectifs

Étape 1 : Positionner les points de coordonnées (xi ; Ni+ )

[xi−1 ; xi [ Ni+
[160; 165[ 5
[165; 170[ 15
[170; 175[ 35
[175; 180[ 50
[180; 185] 55

Ni+ est le nombre d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
114 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative ascendante des effectifs

Étape 2 : Tracer les demi-droites extrêmes

[xi−1 ; xi [ Ni+
[160; 165[ 5
[165; 170[ 15
[170; 175[ 35
[175; 180[ 50
[180; 185] 55

Ni+ est le nombre d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
115 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative ascendante des effectifs

Étape 3 : Joindre les points par des segments de droite

[xi−1 ; xi [ Ni+
[160; 165[ 5
[165; 170[ 15
[170; 175[ 35
[175; 180[ 50
[180; 185] 55

Ni+ est le nombre d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
116 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative descendante des effectifs

Étape 1 : Positionner les points de coordonnées (xi−1 ; Ni− )

[xi−1 ; xi [ Ni−
[160; 165[ 55
[165; 170[ 50
[170; 175[ 40
[175; 180[ 20
[180; 185] 5

Ni− est le nombre d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
117 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative descendante des effectifs

Étape 2 : Tracer les demi-droites extrêmes

[xi−1 ; xi [ Ni−
[160; 165[ 55
[165; 170[ 50
[170; 175[ 40
[175; 180[ 20
[180; 185] 5

Ni− est le nombre d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
118 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative descendante des effectifs

Étape 3 : Joindre les points par des segments de droite

[xi−1 ; xi [ Ni−
[160; 165[ 55
[165; 170[ 50
[170; 175[ 40
[175; 180[ 20
[180; 185] 5

Ni− est le nombre d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
119 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative ascendante des fréquences

Étape 1 : Positionner les points de coordonnées (xi ; Fi+ )

[xi−1 ; xi [ Fi+
[160; 165[ 0.09
[165; 170[ 0.27
[170; 175[ 0.63
[175; 180[ 0.91
[180; 185] 1

Fi+ est la proportion d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
120 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative ascendante des fréquences

Étape 2 : Tracer les demi-droites extrêmes

[xi−1 ; xi [ Fi+
[160; 165[ 0.09
[165; 170[ 0.27
[170; 175[ 0.63
[175; 180[ 0.91
[180; 185] 1

Fi+ est la proportion d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
121 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative ascendante des fréquences

Étape 3 : Joindre les points par des segments de droite

[xi−1 ; xi [ Fi+
[160; 165[ 0.09
[165; 170[ 0.27
[170; 175[ 0.63
[175; 180[ 0.91
[180; 185] 1

Fi+ est la proportion d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
122 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative descendante des fréquences

Étape 1 : Positionner les points de coordonnées (xi−1 ; Fi− )

[xi−1 ; xi [ Fi−
[160; 165[ 1
[165; 170[ 0.91
[170; 175[ 0.73
[175; 180[ 0.37
[180; 185] 0.09

Fi− est la proportion d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
123 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative descendante des fréquences

Étape 2 : Tracer les demi-droites extrêmes

[xi−1 ; xi [ Fi−
[160; 165[ 1
[165; 170[ 0.91
[170; 175[ 0.73
[175; 180[ 0.37
[180; 185] 0.09

Fi− est la proportion d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
124 / 250
Représentations graphiques Courbes cumulatives

Variable quantitative continue : Courbe cumulative descendante des fréquences

Étape 3 : Joindre les points par des segments de droite

[xi−1 ; xi [ Fi−
[160; 165[ 1
[165; 170[ 0.91
[170; 175[ 0.73
[175; 180[ 0.37
[180; 185] 0.09

Fi− est la proportion d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
125 / 250
Chapitre 2 :
Séries statistiques à une dimension

Mesures de position

Mesures de dispersion

Mesures de forme

126 / 250
Remarques préliminaires :
Dans ce chapitre, seules seront considérées des variables statistiques quan-
titatives étant donné que les variables qualitatives ne se prêtent pas aux
calculs mathématiques qui seront présentés.

Les variables statistiques seront notées en lettres majuscules X , et leurs


k modalités en lettres minuscules x indicées par i . Chaque modalité xi
intervient un nombre ni de fois dans la population formée d’un nombre n
d’individus. Dans le cas d’une variable statistique continue, les modalités
seront regroupées en classes [xi−1 ; xi [ d’amplitudes respectives ai et de
centres respectifs ci .

127 / 250
Mesures de position

Section 1 :
Mesures de position

Mesures de tendance centrale ou de centre

Mesures de position relative ou quantiles

128 / 250
Mesures de position

Définition (Mesure de position)


Une mesure de position est un indicateur d’une position particulière dans une
série statistique. Cette position particulière peut être le centre autour duquel les
données sont réparties de façon équilibrée (mesure de tendance centrale), ou au
contraire une position telle que les données se répartissent dans des proportions
inégales de part et d’autre (mesure de position relative).

129 / 250
Mesures de position

Positions centrales :

Positions relatives :

130 / 250
Mesures de position Mesures de tendance centrale ou de centre

Sous-section 1 :
Mesures de tendance centrale ou de centre

Mode

Médiane

Moyenne arithmétique

131 / 250
Mesures de position Mesures de tendance centrale ou de centre

Mode

Définition (Mode)
Le mode d’une distribution statistique, noté Mo , est la modalité du caractère
la plus fréquemment rencontrée localement. C’est l’équivalent du maximum en
analyse mathématique. Une distribution statistique peut avoir un, deux ou plu-
sieurs modes, on parle alors respectivement de distributions unimodale, bimodale
et multimodale.

132 / 250
Mesures de position Mesures de tendance centrale ou de centre

Maximum local - Maximum global :

133 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination du mode dans le cas discret : A partir d’un diagramme en bâtons

Exemple :
Le mode est la modalité correspondant au bâton le plus élevé localement.

Mo = 2 enfants : 2 est le nombre d’enfants par famille le plus fréquent.

134 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination du mode dans le cas discret : A partir d’un tableau statistique

Exemple :
Le mode est la modalité correspondant à l’effectif (ou à la fréquence)
maximal(e) localement.

xi ni fi
1 12 0.12
2 38 0.38
3 22 0.22
4 18 0.18
Σ 100 1
Mo = 2 enfants : 2 est le nombre d’enfants par famille le plus fréquent.

135 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination du mode dans le cas continu : A partir d’un histogramme

Étape 1 : Identifier la classe modale [xi−1 ; xi [


C’est la classe correspondant au rectangle le plus élevé localement.

136 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination du mode dans le cas continu : A partir d’un histogramme

Étape 2 : Identifier la valeur modale Mo graphiquement


Le mode Mo est l’abscisse du point d’intersection des segments joignant les coins
supérieurs du rectangle de la classe modale aux coins supérieurs les plus proches
des rectangles adjacents :

137 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination du mode dans le cas continu : A partir de la colonne hi

Étape 1 : Identifier la classe modale [xi−1 ; xi [


C’est la classe correspondant à la densité hi la plus élevée localement.

[xi−1 ; xi [ ni ai hi
[160 ; 165 [ 5 5 1
[165 ; 170 [ 13 5 2.6
[170 ; 175 [ 20 5 4
[175 ; 185] 20 10 2
Total 58 –

138 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination du mode dans le cas continu : A partir de la colonne hi

Étape 2 : Calculer la valeur modale Mo analytiquement


La valeur modale Mo est égale à la borne inférieure de la classe modale [xi−1 ; xi [
plus une fraction d1d+d
1
2
de l’amplitude xi − xi−1 de la classe modale :

d1
M0 = xi−1 + × (xi − xi−1 )
d1 + d2
avec :

d1 = hi − hi−1 d2 = hi − hi+1

139 / 250
Mesures de position Mesures de tendance centrale ou de centre

Démonstration : Triangles semblables - Théorème de Thalès


Deux triangles sont semblables si leurs angles sont égaux deux à deux. Par
conséquent, ils ont la même forme mais pas nécessairement la même taille.

AB AC BC AH
= = 0 0 =
AB 0 AC 0 BC AH 0

AH et AH 0 désignent respectivement les hauteurs des triangles ABC et AB 0 C 0 .

140 / 250
Mesures de position Mesures de tendance centrale ou de centre

Démonstration (suite) : Les triangles ABE et CDE sont semblables

EH AB Mo −xi−1 d1
EH 0 = DC ⇐⇒ xi −Mo = d2

141 / 250
Mesures de position Mesures de tendance centrale ou de centre

Démonstration (suite) :
Mo − xi−1 d1
=
xi − Mo d2
d1
⇔ Mo − xi−1 = × (xi − Mo )
d2
d1
⇔ Mo − xi−1 = × [(xi − xi−1 ) − (Mo − xi−1 )]
d2
d1 d1
⇔ Mo − xi−1 = × (xi − xi−1 ) − × (Mo − xi−1 )
d2 d2
 
d1 d1
⇔ (Mo − xi−1 ) 1 + = × (xi − xi−1 )
d2 d2
d2 d1
⇔ Mo − xi−1 = × × (xi − xi−1 )
d1 + d2 d2
d1
Mo = xi−1 + d1 +d2 × (xi − xi−1 )

142 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemple : Tailles d’individus en centimètres

• Classe modale : Mo ∈ [170 ; 175 [


Tailles (cm) hi
[160 ; 165 [ 1 • Valeur modale :
[165 ; 170 [ 2.6
4 − 2.6
[170 ; 175 [ 4 Mo = 170 + × (175 − 170)
(4 − 2.6) + (4 − 2)
[175 ; 185] 2
≈ 172.06 cm
Total –
La taille d’individus la plus fréquente est 172.06 cm.

143 / 250
Mesures de position Mesures de tendance centrale ou de centre

Remarques :
Les modes des distributions statistiques multimodales ne sont pas des mesures
de centre mais plutôt une indication sur l’hétérogénéité de la population.

Exemple : Nombre de paires de chaussures vendues

144 / 250
Mesures de position Mesures de tendance centrale ou de centre

Remarques (suite) :
Le mode est sensible au découpage des classes d’une variable continue.

[xi−1 ; xi [ ni ai hi
[160 ; 165 [ 5 5 1 [xi−1 ; xi [ ni ai hi
[165 ; 170 [ 10 5 2 [160 ; 170 [ 15 10 1.5
[170 ; 175 [ 20 5 4 [170 ; 180 [ 35 10 3.5
[175 ; 180 [ 15 5 3 [180 ; 185 [ 5 5 1
[180 ; 185 [ 5 5 1
3.5 − 1.5
Mo = 170 + × 10
4−2 (3.5 − 1.5) + (3.5 − 1)
Mo = 170 + ×5
(4 − 2) + (4 − 3) = 174.44 cm
= 173.33 cm

145 / 250
Mesures de position Mesures de tendance centrale ou de centre

Médiane

Définition (Médiane)
La médiane d’une distribution statistique, notée Me , est la valeur du caractère
qui partage la série statistique ordonnée en deux parties contenant chacune la
moitié des observations environ.

146 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemples :
Série statistique 1 : 2 3 3 4 5 6 6 7 8

Série statistique 2 : 2 3 3 4 5 5 6 7 8 9

Série statistique 3 : 2 3 3 4 5 6 6 7 8 9

→ Série statistique 1 : La médiane est égale à 5 ;

→ Série statistique 2 : La médiane se situe entre 5 et 5 ;

→ Série statistique 3 : La médiane se situe entre 5 et 6.

147 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemples (suite) :
Série statistique 1 : 2 3 3 4 Me = 5 6 6 7 8

xi ni fi Fi+
2 1 0.11 0.11
3 2 0.22 0.33
4 1 0.11 0.44
5 1 0.11 0.55
6 2 0.22 0.77
7 1 0.11 0.88
8 1 0.12 1
Somme 9 1 –
Aucune fréquence cumulée croissante n’est égale à 0.5. La médiane correspond
à la fréquence cumulée croissante immédiatement supérieure à 0.5. La valeur
0.5 renvoie à la notion de milieu ou de moitié.

148 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemples (suite) :
Série statistique 2 : 2 3 3 4 5 Me 5 6 7 8 9

xi ni fi Fi+
2 1 0.1 0.1
3 2 0.2 0.3
4 1 0.1 0.4
5 2 0.2 0.6
6 1 0.1 0.7
7 1 0.1 0.8
8 1 0.1 0.9
9 1 0.1 1
Somme 10 1 –
Aucune fréquence cumulée croissante n’est égale à 0.5. La médiane correspond
à la fréquence cumulée croissante immédiatement supérieure à 0.5. La valeur
0.5 renvoie à la notion de milieu ou de moitié.

149 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemples (suite) :
Série statistique 3 : 2 3 3 4 5 Me 6 6 7 8 9

xi ni fi Fi+
2 1 0.1 0.1
3 2 0.2 0.3
4 1 0.1 0.4
5 1 0.1 0.5
6 2 0.2 0.7
7 1 0.1 0.8
8 1 0.1 0.9
9 1 0.1 1
Somme 10 1 –
L’une des fréquences cumulées croissantes est égale à 0.5, on a un intervalle
médian. Par convention, la médiane est égale au centre de cet intervalle médian.

150 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas discret : A partir de la colonne Fi+

Règles :
• Si aucune fréquence cumulée croissante n’est égale à 0.5, alors la médiane
est la modalité dont la fréquence cumulée croissante est immédiatement
supérieure à 0.5.
• S’il y a une fréquence cumulée croissante égale à 0.5, alors on a un intervalle
médian dont la borne inférieure correspond à fréquence cumulée croissante
égale à 0.5 et la borne supérieure correspond à fréquence cumulée croissante
immédiatement supérieure à 0.5. Dans ce cas, la valeur médiane est le centre
de l’intervalle médian.

151 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas discret : A partir de la colonne Fi+

Exemple 1 : Nombre d’enfants par famille

xi Fi+
1 0.12
2 0.52 Me = 2 enfants
3 0.84
4 1
La moitié des familles ont moins de 2 enfants et la moitié ont en plus de 2.

152 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas discret : A partir de la colonne Fi+

Exemple 2 : Nombre d’enfants par famille

xi Fi+
1 0.12
2+3
2 0.50 Me ∈ [2; 3] ⇒ Me = = 2.5 enfants
2
3 0.84
4 1
La moitié des familles ont moins de 2 enfants et la moitié ont en plus de 3.

153 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas discret : A partir de la courbe Fi+

Exemple 1 : Nombre d’enfants par famille

La moitié des familles ont moins de 2 enfants et l’autre moitié en ont plus de 2.
154 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas discret : A partir de la courbe Fi+

Exemple 2 : Nombre d’enfants par famille

La moitié des familles ont moins de 2 enfants et la moitié ont en plus de 3.


155 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas continu : A partir de la courbe Fi+

Règle :
La médiane est l’abscisse du point associé à la fréquence cumulée croissante
0.5.

156 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas continu : A partir de la courbe Fi+

Exemple : Tailles d’individus

157 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas continu : A partir des courbes Fi+ et Fi−

Règle :
La médiane est l’abscisse du point d’intersection des courbes cumulatives ascen-
dante et descendante, ce point correspond à des fréquences cumulées (croissante
et décroissante) égales à 0.5.

158 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas continu : A partir des courbes Fi+ et Fi−

Exemple : Tailles d’individus

159 / 250
Mesures de position Mesures de tendance centrale ou de centre

Détermination de la médiane dans le cas continu : A partir de la colonne Fi+

Règles :
• S’il y a une fréquence cumulée croissante égale à 0.5, alors la médiane est
égale à la borne supérieure de la classe correspondant à la fréquence cumulée
croissante égale à 0.5.
• Si aucune fréquence cumulée croissante n’est égale à 0.5, alors la classe
médiane [xi−1 ; xi [ est la classe dont la fréquence cumulée croissante est
immédiatement supérieure à 0.5. Dans ce cas, la valeur médiane Me est
calculée par interpolation linéaire comme suit :
+
0.5 − Fi−1
Me = xi−1 + + (xi − xi−1 )
Fi+ − Fi−1

160 / 250
Mesures de position Mesures de tendance centrale ou de centre

Démonstration : Coefficient directeur d’une droite

161 / 250
Mesures de position Mesures de tendance centrale ou de centre

Démonstration (suite) :

+
yB − yA 0.5 − Fi−1
a= =
xB − xA Me − xi−1
yC − yA F + − Fi−1
+
a= = i
xC − xA xi − xi−1
+
0.5 − Fi−1 F + − Fi−1
+
⇒ = i
Me − xi−1 xi − xi−1
+
0.5 − Fi−1
Me − xi−1 = + × (xi − xi−1 )
Fi+ − Fi−1
+
0.5−Fi−1
Me = xi−1 + Fi+ −Fi−1
+ × (xi − xi−1 )
La médiane Me est égale à la borne inférieure de la classe médiane [xi−1 ; xi [
+
0.5−Fi−1
plus une fraction Fi+ −Fi−1
+ de l’amplitude xi − xi−1 de la classe médiane.

162 / 250
Mesures de position Mesures de tendance centrale ou de centre

Dans la pratique :
1. Identifier la classe médiane [xi−1 ; xi [ et situer la valeur médiane Me à l’inté-
rieur de cette classe.

163 / 250
Mesures de position Mesures de tendance centrale ou de centre

Dans la pratique :
2. Associer la fréquence cumulée croissante 0.5 à la valeur médiane Me .

164 / 250
Mesures de position Mesures de tendance centrale ou de centre

Dans la pratique :
3. Trouver dans la colonne des fréquences cumulées croissantes les valeurs qui
encadrent 0.5 et les associer aux bornes de la classe médiane.

165 / 250
Mesures de position Mesures de tendance centrale ou de centre

Dans la pratique :
4. Calculer la médiane par interpolation linéaire comme suit :
+ +
Me − xi−1 0.5 − Fi−1 0.5 − Fi−1
= + + ⇔ Me − xi−1 = + + × (xi − xi−1 )
xi − xi−1 Fi − Fi−1 Fi − Fi−1

+
0.5 − Fi−1
Me = xi−1 + + × (xi − xi−1 )
Fi+ − Fi−1

166 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemple 1 : Tailles d’individus

Tailles (cm) Fi+


[160 ; 165 [ 0.09
[165 ; 170 [ 0.27
[170 ; 175 [ 0.63
[175 ; 180 [ 0.91
[180 ; 185] 1
0.5 − 0.27
Me = 170 + × 5 = 173.19 cm
0.63 − 0.27

La moitié des individus ont une taille inférieure à 173.19 cm et l’autre moitié
ont une taille supérieure à cette taille médiane.

167 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemple 2 : Tailles d’individus

Tailles (cm) Fi+


[160 ; 165 [ 0.09
[165 ; 170 [ 0.27
[170 ; 175 [ 0.50
[175 ; 180 [ 0.91
[180 ; 185] 1 0.5 − 0.27
Me = 170 + × 5 = 175 cm
0.5 − 0.27

La moitié des individus ont une taille inférieure à 175 cm et l’autre moitié ont
une taille supérieure à cette taille médiane.

168 / 250
Mesures de position Mesures de tendance centrale ou de centre

Moyenne arithmétique

Définition (Moyenne arithmétique)


La moyenne arithmétique d’une variable statistique, notée x , est la valeur qui
concentre toute l’information contenue dans la distribution statistique. C’est
l’équivalent d’un centre de gravité en géométrie. Elle est donnée par la formule
suivante :
k k
1X X
x= ni xi = fi xi
n i=1 i=1

169 / 250
Mesures de position Mesures de tendance centrale ou de centre

Centres de gravité :

170 / 250
Mesures de position Mesures de tendance centrale ou de centre

Remarques :
Si n1 = n2 = · · · = nk = 1, alors la moyenne arithmétique est dite simple.
Dans le cas contraire, elle est dite pondérée ;

Si la variable statistique X est continue, la moyenne arithmétique s’écrit :

k k
1X X
x= ni ci = fi ci
n i=1 i=1

où ci désigne le centre de la classe [xi−1 ; xi [.

171 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemple 1 : Nombre d’enfants par famille


xi ni ni xi
4
1 12 12 1X
x= ni xi
2 40 80 n i=1
3 32 96 252
=
4 16 64 100
Σ 100 252 = 2.52 enfants
Les familles concernées ont en moyenne 3 enfants.

172 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemple 2 : Tailles d’individus


Tailles (cm) ci ni ni ci
[160 ; 165[ 162.5 5 812.5 5
1X
[165 ; 170[ 167.5 10 1675 x= ni ci
n i=1
[170 ; 175[ 172.5 20 3450
9512.5
[175 ; 180[ 177.5 15 2662.5 =
55
[180 ; 185] 182.5 5 912.5
= 172.95 cm
Σ – 55 9512.5
Les individus concernés ont une taille moyenne égale à 172.95 cm.

173 / 250
Mesures de position Mesures de tendance centrale ou de centre

Propriétés :
Soient X et Y deux variables statistiques quantitatives prenant respectivement
les valeurs x1 , x2 , · · · , xk et y1 , y2 , · · · , yk avec k ∈ N∗ et a et b deux constantes
réelles.

La moyenne arithmétique vérifie les propriétés suivantes :

ax + by = ax + by
k
X
ni (xi − x ) = 0
i=1

174 / 250
Mesures de position Mesures de tendance centrale ou de centre

Démonstrations :

k
1X
ax + by = ni (axi + byi )
n i=1
k
1X
= (ani xi + bni yi )
n i=1
k k
1X 1X
= ani xi + bni yi
n i=1 n i=1
k
! k
!
1X 1X
=a ni xi + b ni yi
n i=1 n i=1
= ax + by

175 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemples :

x +y =x +y

2x + y = 2x + y

3x − y = 3x − y

x − 3y = x − 3y

x + 2y = x + 2y

3x + 2 = 3x + 2

3 − 2y = 3 − 2y

176 / 250
Mesures de position Mesures de tendance centrale ou de centre

Démonstrations (suite) :

k
X k
X
ni (xi − x ) = (ni xi − ni x )
i=1 i=1
k
X k
X
= ni xi − ni x
i=1 i=1
k k
1X X
=n× ni xi − x ni
n i=1 i=1
= nx − x n
=0

177 / 250
Mesures de position Mesures de tendance centrale ou de centre

Remarque :
La moyenne arithmétique est sensible aux valeurs extrêmes contrairement à la
médiane qui n’est pas influencée par de telles observations. La médiane est, de
ce fait, une mesure robuste du centre de la distribution statistique.

178 / 250
Mesures de position Mesures de tendance centrale ou de centre

Exemple : Notes sur 20 de deux groupes d’étudiants


Groupe A Groupe B
15 15 15 15 15 1 15 15 15 15
x = 15 x = 12.2
Me = 15 Me = 15

179 / 250
Mesures de position Mesures de position relative ou quantiles

Sous-section 2 :
Mesures de position relative ou quantiles

Quartiles

Déciles

Centiles

Généralisation

Mode de calcul

180 / 250
Mesures de position Mesures de position relative ou quantiles

Définition (Quantiles)
Les quantiles ou les fractiles sont des valeurs qui partagent la série statistique
ordonnée en un certain nombre de parties contenant chacune une même propor-
tion d’observations. Ils constituent, de ce fait, une généralisation de la notion
de médiane qui partage la série statistique en deux parties contenant chacune
la moitié des observations.
Les quantiles les plus connus sont les quartiles, les déciles et les centiles qui
divisent la série statistique en respectivement 4, 10 et 100 parties de même
effectif. Par conséquent, les quantiles ne se trouvent pas nécessairement au centre
de la distribution statistique mais dans des positions dites relatives.

181 / 250
Mesures de position Mesures de position relative ou quantiles

Quartiles

Définition (Quartiles)
Les quartiles sont des valeurs qui partagent la série statistique ordonnée en 4
parties contenant chacune 25% des observations. Ils sont au nombre de 3 et sont
notés Q1 , Q2 et Q3 .

182 / 250
Mesures de position Mesures de position relative ou quantiles

Déciles

Définition (Déciles)
Les déciles sont des valeurs qui partagent la série statistique ordonnée en 10
parties contenant chacune 10% des observations. Ils sont au nombre de 9 et
sont notés D1 , D2 ... et D9 .

183 / 250
Mesures de position Mesures de position relative ou quantiles

Centiles

Définition (Centiles)
Les centiles sont des valeurs qui partagent la série statistique ordonnée en 100
parties contenant chacune 1% des observations. Ils sont au nombre de 99 et sont
notés C1 , C2 ... et C99 .

184 / 250
Mesures de position Mesures de position relative ou quantiles

Généralisation

Définition (Quantiles d’ordre α)


De façon générale, on définit les quantiles d’ordre α, avec α ∈]0; 1[, comme les
valeurs qui partagent la série statistique ordonnée en 1/α parties contenant
chacune une proportion α des observations et on les note qα .
Ainsi, une proportion α des observations est inférieure à qα et une proportion
1 − α est supérieure à cette valeur.

185 / 250
Mesures de position Mesures de position relative ou quantiles

Mode de calcul

186 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives discrètes : A partir de la colonne Fi+

Règles :
• S’il y a une fréquence cumulée croissante égale à α alors on a un intervalle
quantile délimité par la modalité associée à la valeur α et par la modalité
suivante.

• Si aucune fréquence cumulée croissante n’est égale à α alors le quantile


recherché est la modalité ayant une fréquence cumulée croissante immédia-
tement supérieure à α.

187 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives discrètes : A partir de la colonne Fi+

Exemple : Nombre d’enfants par famille

xi Fi+ Médiane Quartiles Déciles Centiles


1 0.12 D1 C1
2 0.62 Me Q1 et Q2 D5 C55
3 0.84 Q3
4 1 D9 C99

188 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives discrètes : A partir de la courbe Fi+

Règle 1 :
Si la valeur α se situe entre deux paliers de la courbe cumulative ascendante,
alors le quantile recherché est l’abscisse commune aux deux paliers.

189 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives discrètes : A partir de la courbe Fi+

Exemple : Nombre d’enfants par famille

190 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives discrètes : A partir de la courbe Fi+

Règle 2 :
Si la valeur α est en face d’un palier de la courbe cumulative ascendante, alors
on a un intervalle quantile délimité par les abscisses des extrémités du palier.

191 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives discrètes : A partir de la courbe Fi+

Exemple : Nombre d’enfants par famille

192 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives continues : A partir de la colonne Fi+

Étape 1 :
La classe [xi−1 ; xi [ contenant le quantile d’ordre α est d’abord identifiée, c’est
la classe ayant une fréquence cumulée croissante immédiatement supérieure ou
égale à α :

[xi−1 ; xi [ Fi+ Médiane Quartiles Déciles Centiles


[x0 ; x1 [ 0.09 C1
[x1 ; x2 [ 0.27 Q1 D1
[x2 ; x3 [ 0.63 Me Q2 D5 C55
[x3 ; x4 [ 0.91 Q3 D9
[x4 ; x5 ] 1 C99

193 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives continues : A partir de la colonne Fi+

Étape 2 :
Le quantile d’ordre α est calculé par interpolation linéaire comme suit :

+ +
qα − xi−1 α − Fi−1 α − Fi−1
= + + ⇔ qα − xi−1 = + × (xi − xi−1 )
xi − xi−1 Fi − Fi−1 Fi+ − Fi−1
+
α − Fi−1
qα = xi−1 + + × (xi − xi−1 )
Fi+ − Fi−1

194 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives continues : A partir de la colonne Fi+

Exemple : Tailles d’individus

Taille (cm) Fi+ Médiane Quartiles Déciles Centiles


[160 ; 165 [ 0.09 C1
[165 ; 170 [ 0.27 Q1 D1
[170 ; 175 [ 0.63 Me Q2 D5 C55
[175 ; 180 [ 0.91 Q3 D9
[180 ; 185] 1 C99

195 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives continues : A partir de la colonne Fi+

Exemple (suite) : Tailles d’individus

0.50 − 0.27 0.50 − 0.27


Me = 170 + × 5 = 173.19 cm D5 = 170 + × 5 = 173.19 cm
0.63 − 0.27 0.63 − 0.27
0.25 − 0.09 0.90 − 0.63
Q1 = 165 + × 5 = 169.44 cm D9 = 175 + × 5 = 179.82 cm
0.27 − 0.09 0.91 − 0.63
0.50 − 0.27 0.01 − 0
Q2 = 170 + × 5 = 173.19 cm C1 = 160 + × 5 = 160.56 cm
0.63 − 0.27 0.09 − 0
0.75 − 0.63 0.55 − 0.27
Q3 = 175 + × 5 = 177.14 cm C55 = 170 + × 5 = 173.89 cm
0.91 − 0.63 0.63 − 0.27
0.10 − 0.09 0.99 − 0.91
D1 = 165 + × 5 = 165.28 cm C99 = 180 + × 5 = 184.44 cm
0.27 − 0.09 1 − 0.91

196 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives continues : A partir de la courbe Fi+

Le quantile qα est l’abscisse du point correspondant à la fréquence cumulée


croissante α.

197 / 250
Mesures de position Mesures de position relative ou quantiles

Variables quantitatives continues : A partir de la courbe Fi+

Exemple : Tailles d’individus

198 / 250
Mesures de dispersion

Section 2 :
Mesures de dispersion

Distance entre deux valeurs particulières

Distance par rapport à une valeur centrale

199 / 250
Mesures de dispersion

Exemple : Taux de rentabilité (en %)


Projet A Projet B Projet C

0 0 0 0 0 -2 -1 0 1 2 -4 -3 0 3 4
x = 0% x = 0% x = 0%
Me = 0% Me = 0% Me = 0%
Les mesures de tendance centrale ne donnent aucune idée sur la variabilité ou
la dispersion des données !

200 / 250
Mesures de dispersion

Définition (Mesure de dispersion)


Une mesure de dispersion permet de décrire la variabilité des données dans une
série statistique. Elle vient ainsi compléter les mesures de position qui passent
sous silence cet aspect.

201 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Sous-section 1 :
Distance entre deux valeurs particulières

Intervalle de variation et étendue d’une série

Intervalle interquartile et écart interquartile

Intervalle interdécile et écarts interdécile

Intervalle intercentile et écarts intercentile

Exemples

202 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Intervalle de variation et étendue d’une série

Définitions (Intervalle de variation - Étendue)


L’intervalle de variation d’une série statistique est l’intervalle borné par la va-
leur minimale xmin et la valeur maximale xmax de variable statistique X , il est
noté IV = [xmin ; xmax ]. Cet intervalle contient la totalité des données.
L’amplitude de l’intervalle de variation IV , notée E , est appelée étendue de la
série. On a :
E = xmax − xmin

203 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Intervalle de variation :

204 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Intervalle interquartile et écart interquartile

Définitions (Intervalle interquartile - Écart interquartile)


L’intervalle interquartile d’une série statistique est l’intervalle borné par le pre-
mier et le dernier quartiles de la variable X , il est noté IQ = [Q1 ; Q3 ]. Cet
intervalle contient la moitié des données.
L’amplitude de l’intervalle interquartile IQ, notée EIQ, est appelée écart inter-
quartile ou étendue interquartile. On a :

EIQ = Q3 − Q1

205 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Intervalle interquartile :

206 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Intervalle interdécile et écart interdécile

Définitions (Intervalle interdécile - Écart interdécile)


L’intervalle interdécile d’une série statistique est l’intervalle borné par le premier
et le dernier déciles de la variable X , il est noté ID = [D1 ; D9 ]. Cet intervalle
contient 80% des données.
L’amplitude de l’intervalle interdécile ID, notée EID, est appelée écart interdé-
cile ou étendue interdécile. On a :

EID = D9 − D1

207 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Intervalle interdécile :

208 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Intervalle intercentile et écart intercentile

Définitions (Intervalle intercentile - Écart intercentile)


L’intervalle intercentile d’une série statistique est l’intervalle borné par le pre-
mier et le dernier centiles de la variable X , il est noté IC = [C1 ; C99 ]. Cet
intervalle contient 98% des données.
L’amplitude de l’intervalle intercentile IC , notée EIC , est appelée écart inter-
centile ou étendue intercentile. On a :

EIC = C99 − C1

209 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Intervalle intercentile :

210 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Exemple 1 : Nombre d’enfants par famille


1 2 3 4

IV = [xmin ; xmax ] = [1; 4] → E = 4 − 1 = 3 enfants

IQ = [Q1 ; Q3 ] = [2; 3] → EIQ = 3 − 2 = 1 enfant

ID = [D1 ; D9 ] = [1; 4] → EID = 4 − 1 = 3 enfants

IC = [C1 ; C99 ] = [1; 4] → EIC = 4 − 1 = 3 enfants

211 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Exemple 2 : Tailles d’individus


[160 ;165[ [165 ;170[ [170 ;175[ [175 ;180[ [180 ;185]

IV = [xmin ; xmax ] = [160; 185] → E = 185 − 160 = 25 cm

IQ = [Q1 ; Q3 ] = [169.44; 177.14] → EIQ = 177.14 − 169.44 = 7.7 cm

ID = [D1 ; D9 ] = [165.28; 179.19] → EID = 179.19 − 165.28 = 13.91 cm

IC = [C1 ; C99 ] = [160.56; 184.44] → EIC = 184.44 − 160.56 = 23.88 cm

212 / 250
Mesures de dispersion Distance entre deux valeurs particulières

Remarque :
La dispersion d’une distribution statistique peut être résumée à l’aide d’une
boı̂te de Tukey. Il s’agit d’un diagramme représentant simultanément l’inter-
valle de variation, l’intervalle interquartile, la moyenne et la médiane de la série
statistique.

213 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Sous-section 2 :
Distance par rapport à une valeur centrale

Écart absolu moyen

Variance et écart-type

Coefficient de variation

214 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Distances par rapport à la moyenne arithmétique :

215 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Écart absolu moyen

Définition (Écart absolu moyen)


L’écart absolu moyen d’une variable statistique, notée EAM, est la moyenne
arithmétique des valeurs absolues des écarts des observations de la variable par
rapport au centre généralement mesuré par la moyenne arithmétique x :

k
1X
EAM = ni |xi − x |
n i=1

Dans le cas d’une variable continue, les modalités xi sont remplacées par les
centres des classes ci :
k
1X
EAM = ni |ci − x |
n i=1

216 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Exemple 1 : Nombre d’enfants par famille


xi ni ni xi ni |xi − x |
1 12 12 8.24
2 40 80 20.80
3 32 96 15.36
4 16 64 23.68
Σ 100 252 78.08

252
x= = 2.52 ≈ 3 enfants
100
4
1X 78.08
EAM = ni |xi − x | = = 0.7808 ≈ 1 enfant
n i=1 100

Le nombre d’enfants par famille s’éloigne de la moyenne x d’un enfant en


moyenne.

217 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Exemple 2 : Tailles d’individus


Tailles (cm) ci ni ni ci ni |ci − x |
[160; 165[ 162.5 5 812.5 52.25
[165; 170[ 167.5 10 1675 54.5
[170; 175[ 172.5 20 3450 9
[175; 180[ 177.5 15 2662.5 68.25
[180; 185] 182.5 5 912.5 47.75
Σ – 55 9512.5 231.75

9512.5
x= = 172.95 cm
55
5
1X 231.75
EAM = ni |ci − x | = = 4.21 cm
n i=1 55

Les tailles d’individus s’éloignent de la moyenne x de 4.21 centimètres en


moyenne.

218 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Variance et écart-type

Définitions (Variance et écart-type)


La variance d’une variable statistique X , notée σx2 ou V (X ), est la moyenne
des carrés des écarts à la moyenne x :

k
1X 2
σx2 = ni (xi − x ) (1)
n i=1

Dans le cas d’une variable continue, les modalités xi sont remplacées par les
centres des classes ci :
k
1X 2
σx2 = ni (ci − x )
n i=1

L’écart-type d’une variable statistique X , noté σx , est la racine carrée de la


variance : p
σx = σx2

219 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Théorème de König-Huygens :
La formule de la variance (1) peut être décomposée selon l’écriture alternative
suivante :
σx2 = x 2 − x 2

où
k
1X
x2 = ni xi2
n i=1

et dans le cas d’une variable continue :

k
1X
x2 = ni ci2
n i=1

Cette formulation alternative de la variance est très utilisée dans la pratique.

220 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Démonstration :

k
1X 2
σx2 = ni (xi − x )
n i=1
k
1X
ni xi2 − 2xi x + x 2

=
n i=1
k
1X
ni xi2 − ni 2xi x + ni x 2

=
n i=1
k k k
1X 1X 1X
= ni xi2 − ni 2xi x + ni x 2
n i=1 n i=1 n i=1
k k
! k
!
1X 1 X 1 X
= ni xi2 − 2x ni xi + x 2 ni
n i=1 n i=1 n i=1
= x 2 − 2x .x + x 2
= x2 − x2

221 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Exemple 1 : Nombre d’enfants par famille


2
xi ni ni xi ni xi2 ni (xi − x )
1 12 12 12 27.72
2 40 80 160 10.82
3 32 96 288 7.37
4 16 64 256 35.05
Σ 100 252 716 80.96

4
1X 2 80.96 p
σx2 = ni (xi − x ) = = 0.81 ⇒ σ = σx2 = 0.9 ≈ 1 enfant
n i=1 100
716 2
p
σx2 = x 2 − x 2 = − (2.52) = 0.81 ⇒ σ = σx2 = 0.9 ≈ 1 enfant
100
Le nombre d’enfants par famille s’éloigne de la moyenne x d’un enfant en
moyenne.

222 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Exemple 2 : Tailles d’individus


2
Tailles (cm) ci ni ni ci ni ci2 ni (ci − x )
[160; 165[ 162.5 5 812.5 132031.25 546.49
[165; 170[ 167.5 10 1675 280562.5 297.52
[170; 175[ 172.5 20 3450 595125 4.13
[175; 180[ 177.5 15 2662.5 472593.75 309.92
[180; 185] 182.5 5 912.5 166531.25 455.58
Σ – 55 9512.5 1646843.75 1613.64

5
1X 2 1613.64 p
σx2 = ni (ci − x ) = = 29.34 ⇒ σ = σx2 = 5.42 cm
n i=1 55
1646843.75 2
p
σx2 = c 2 − x 2 = − (172.95) = 30.91 ⇒ σ = σx2 = 5.56 cm
55
Les tailles d’individus s’éloignent de la moyenne x de 5.42 (ou 5.56) centimètres
en moyenne.

223 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Remarque :
La variance n’a pas de signification concrète, il s’agit simplement d’une étape
intermédiaire dans le calcul de l’écart-type. Néanmoins, elle peut être utilisée
comme mesure de dispersion tout en prenant garde à bien interpréter l’unité
de mesure transformée à la puissance 2 car ceci peut induire en erreur. A titre
d’exemples, le mètre qui est une unité de mesure des longueurs se transforme
en mètre carré qui est une unité de mesure des surfaces et le litre se transforme
en litre carré qui n’a pas aucune signification concrète.

224 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Propriétés :
Soit X une variable statistique quantitative et a et b deux constantes réelles.
La variance vérifie les propriétés suivantes :

V (aX ) = a 2 V (X )

V (X + b) = V (X )

V (aX + b) = a 2 V (X )

225 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Démonstrations :

k
1X 2
V (aX ) = ni (axi − ax )
n i=1
k X aX ni
1X 2
= ni (axi − ax ) x1 ax1 n1
n i=1
x2 ax2 n2
k .. .. ..
1X 2 . . .
= ni [a(xi − x )]
n i=1 xi axi ni
k
.. .. ..
1X 2 . . .
= ni a 2 (xi − x ) xk axk nk
n i=1
Σ n
k
1X2 2
=a ni (xi − x )
n i=1
= a 2 V (X )

226 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Démonstrations (suite) :

k
1X 2
V (X + b) = ni xi + b − x + b
n i=1 X X +b ni
k
x1 x1 + b n1
1X 2 x2 x2 + b n2
= ni [xi + b − (x + b)]
n i=1 .. .. ..
. . .
k xi xi + b ni
1X 2
= ni (xi + b − x − b) .. .. ..
n i=1 . . .
k xk xk + b nk
1X 2
= ni (xi − x ) Σ n
n i=1
= V (X )

227 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Démonstrations (suite) :
X aX + b ni
x1 ax1 + b n1
x2 ax2 + b n2
.. .. ..
V (aX + b) = V (aX ) . . .
xi axi + b ni
= a 2 V (X ) .. .. ..
. . .
xk axk + b nk
Σ n

228 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Exemples :

V (2X ) = 4V (X )

V (X + 3) = V (X )

V (2X + 3) = 4V (X )

229 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Coefficient de variation

Définition (Coefficient de variation)


Le coefficient de variation, noté CV , est une mesure de dispersion relative, il est
égal au rapport entre l’écart-type et la moyenne arithmétique, c’est un nombre
sans dimension :
σ
CV =
x
Le coefficient de variation permet de comparer les dispersions de variables quan-
titatives n’ayant pas la même unité de mesure.

230 / 250
Mesures de dispersion Distance par rapport à une valeur centrale

Exemples : Nombre d’enfants par famille vs Tailles d’individus

x = 2.52 enfants y = 172.95 cm


σx = 0.9 enfants σy = 5.42 cm
σ 0.9 
enfants σ 5.42cm

CVx = = = 0.36 CVy = =  = 0.03
x 2.52 
enfants y 172.95cm

La distribution statistique des nombres d’enfants par famille est plus dispersée
relativement à celle des tailles d’individus.

231 / 250
Mesures de forme

Section 3 :
Mesures de forme

Mesures d’asymétrie

Mesures d’aplatissement

232 / 250
Mesures de forme

Définition (Mesures de forme)


Une mesure de forme indique le niveau de déviation d’une distribution statis-
tique par rapport à une situation de référence - dite « normale » - représentée
par une courbe en cloche symétrique, ni pointue ni aplatie. Le degré de déviation
est donné par une mesure d’asymétrie et par une mesure d’aplatissement.

233 / 250
Mesures de forme Mesures d’asymétrie

Sous-section 1 :
Mesures d’asymétrie

Coefficient de Fisher

Coefficient de Pearson

234 / 250
Mesures de forme Mesures d’asymétrie

Distribution symétrique :
Les valeurs symétriques par rapport au centre de la distribution statistique ont
les mêmes effectifs et les mêmes fréquences.

235 / 250
Mesures de forme Mesures d’asymétrie

Distribution asymétrique à droite :


Les valeurs supérieures au centre de la distribution statistique sont plus fré-
quentes relativement à leurs symétriques.

236 / 250
Mesures de forme Mesures d’asymétrie

Distribution asymétrique à gauche :


Les valeurs inférieures au centre de la distribution statistique sont plus fré-
quentes relativement à leurs symétriques.

237 / 250
Mesures de forme Mesures d’asymétrie

Coefficient de (Sir Ronald) Fisher

Coefficient de skewness :
k  3
1X xi − x
γ1 = ni
n i=1 σ

Interprétation :
γ1 = 0 : la distribution est symétrique ;
γ1 > 0 : la distribution est asymétrique à droite ;
γ1 < 0 : la distribution est asymétrique à gauche.

238 / 250
Mesures de forme Mesures d’asymétrie

Coefficient de (Karl) Pearson

Coefficient de skewness normalisé :


" k  3 # 2
2 1X xi − x
β1 = γ 1 = ni
n i=1 σ

Interprétation :
β1 = 0 : la distribution est symétrique ;
β1 > 0 : la distribution est asymétrique à droite ou à gauche :
µ3 > 0 : la distribution est asymétrique à droite ;
µ3 < 0 : la distribution est asymétrique à gauche.
avec
k
1X 3
µ3 = ni (xi − x )
n i=1

239 / 250
Mesures de forme Mesures d’asymétrie

Exemple 1 : Nombre d’enfants par famille


 3
xi −x
xi ni ni σx
1 12 -57.81
2 40 -7.72
3 32 4.85
4 16 71.15
Σ 100 10.48

4  3
1 X xi − x 10.48
γ1 = ni = = 0.1048
100 i=1 σx 100
" 4  3 # 2
1 X xi − x
β1 = ni = (0.1048)2 = 0.011
100 i=1 σx

La distribution du nombre d’enfants par famille est asymétrique à droite. Cela


signifie que les nombres d’enfants par famille au-dessus de la moyenne sont plus
fréquents que ceux qui en sont au-dessous.

240 / 250
Mesures de forme Mesures d’asymétrie

Exemple 2 : Tailles d’individus


 3
ci −y
Tailles (cm) ci ni ni σy
[160; 165[ 162.5 5 -35.84
[165; 170[ 167.5 10 -10.17
[170; 175[ 172.5 20 -0.01
[175; 180[ 177.5 15 8.87
[180; 185] 182.5 5 27.35
Σ – 55 -9.79

5  3
1 X ci − y −9.79
γ1 = ni = = −0.1780
55 i=1 σy 55
" 5  3 #2
1 X ci − y
β1 = ni = (−0.1780)2 = 0.0317
55 i=1 σy

La distribution des tailles d’individus est asymétrique à gauche. Cela signifie


que les tailles d’individus au-dessous de la moyenne sont plus fréquentes que
celles qui en sont au-dessus.
241 / 250
Mesures de forme Mesures d’asymétrie

Remarque :
Il y a un lien entre l’asymétrie d’une distribution statistique et l’ordre de ses
mesures de tendance centrale. Celles-ci sont égales entre elles dans le cas d’une
distribution symétrique et différentes dans le cas d’une distribution asymétrique
et respectent un ordre bien précis suivant la nature de l’asymétrie :

242 / 250
Mesures de forme Mesures d’aplatissement

Sous-section 2 :
Mesures d’aplatissement

Coefficient de Pearson

Coefficient de Fisher

243 / 250
Mesures de forme Mesures d’aplatissement

Distribution mésokurtique :
Les valeurs extrêmes et les valeurs centrales ont des fréquences normales.

244 / 250
Mesures de forme Mesures d’aplatissement

Distribution leptokurtique :
Les valeurs extrêmes et les valeurs centrales sont plus fréquentes relativement à
une distribution normale.

245 / 250
Mesures de forme Mesures d’aplatissement

Distribution platykurtique :
Les valeurs extrêmes et les valeurs centrales sont moins fréquentes relativement
à une distribution normale.

246 / 250
Mesures de forme Mesures d’aplatissement

Coefficient de (Karl) Pearson

Coefficient de kurtosis :
k  4
1X xi − x
β2 = ni
n i=1 σ

Interprétation :
β2 = 3 : distribution mésokurtique (courbe normale) ;
β2 > 3 : distribution leptokurtique (moins aplatie que la normale) ;
β2 < 3 : distribution platykurtique (plus aplatie que la normale).

247 / 250
Mesures de forme Mesures d’aplatissement

Coefficient de (Sir Ronald) Fisher

Coefficient d’excès de kurtosis :


k  4
1X xi − x
γ 2 = β2 − 3 = ni −3
n i=1 σ

Interprétation :
γ2 = 0 : distribution mésokurtique (courbe normale) ;
γ2 > 0 : distribution leptokurtique (moins aplatie que la normale) ;
γ2 < 0 : distribution platykurtique (plus aplatie que la normale).

248 / 250
Mesures de forme Mesures d’aplatissement

Exemple 1 : Nombre d’enfants par famille


 4
xi −x
xi ni ni σx
1 12 97.63
2 40 4.46
3 32 2.59
4 16 117
Σ 100 221.68

4  4
1 X xi − x 221.68
β2 = ni = = 2.2168
100 i=1 σx 100
4  4
1 X xi − x
γ2 = ni − 3 = 2.2168 − 3 = −0.7832
100 i=1 σx

La distribution du nombre d’enfants par famille est platykurtique. Cela signifie


que les valeurs extrêmes sont moins fréquentes relativement à une distribution
normale.

249 / 250
Mesures de forme Mesures d’aplatissement

Exemple 2 : Tailles d’individus


 4
ci −x
Tailles (cm) ci ni ni σx
[160; 165[ 162.5 5 69.09
[165; 170[ 167.5 10 10.22
[170; 175[ 172.5 20 0
[175; 180[ 177.5 15 7.45
[180; 185] 182.5 5 48.19
Σ – 55 134.96

5  4
1 X ci − y 134.96
β2 = ni = = 2.4538
55 i=1 σy 55
5  4
1 X ci − y
γ2 = ni − 3 = 2.4538 − 3 = −0.5462
55 i=1 σy

La distribution des tailles d’individus est platykurtique. Cela signifie que les
valeurs extrêmes sont moins fréquentes relativement à une distribution normale.

250 / 250

Vous aimerez peut-être aussi