Académique Documents
Professionnel Documents
Culture Documents
Mémoire Statistique Descriptive 2019 2020
Mémoire Statistique Descriptive 2019 2020
Jaouad Madkour
jaouad.madkour@outlook.com
1 / 250
Introduction
2 / 250
Qu’est ce que la (les) statistique(s) ?
Définitions :
• Au sens large, la statistique est la science qui a pour objet l’extraction,
l’analyse et l’exploitation de l’information contenue dans des données.
• Au sens étroit, les statistiques sont des données concernant un phénomène
particulier et observées sur un groupe d’individus ou d’unités.
3 / 250
Qu’est ce que la (les) statistique(s) ?
Statistique descriptive :
4 / 250
Qu’est ce que la (les) statistique(s) ?
Statistique inférentielle :
5 / 250
Objectif pédagogique du cours
Taxonomie de Bloom :
6 / 250
Pré-requis nécessaires
Bien que la statistique descriptive soit une branche des mathématiques qui s’ap-
plique à d’autres disciplines comme la biologie, l’économie, la finance et la ges-
tion, elle ne nécessite que des connaissances élémentaires en mathématiques
telles que les opérations arithmétiques, la factorisation, le développement...
7 / 250
Plan du cours
8 / 250
Quelques références utiles
9 / 250
Quelques références utiles
10 / 250
Quelques références utiles
11 / 250
Quelques références utiles
12 / 250
Quelques références utiles
13 / 250
Quelques références utiles
14 / 250
Ma page sur Facebook
15 / 250
Mon site web : jaouadmadkour.webnode.fr
16 / 250
Wikipédia
17 / 250
Chapitre 1 :
Organisation des données
Tableaux statistiques
Représentations graphiques
18 / 250
Vocabulaire et opérateurs statistiques
Section 1 :
Vocabulaire et opérateurs statistiques
Vocabulaire statistique
Opérateurs statistiques Σ et Π
19 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Sous-section 1 :
Vocabulaire statistique
Caractère et modalité
Effectifs et fréquences
20 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Définitions :
• Population : Un ensemble d’éléments.
21 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Exemple 1 :
• Population : Étudiants de la FSJES de Tanger.
Exemple 2 :
• Population : Entreprises installées à Tanger.
22 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Caractère et modalité
Définitions :
• Caractère : Objet selon lequel la population est étudiée.
Remarque :
Un caractère est également appelé variable statistique. Il est noté en lettres
majuscules X et prend k ∈ N∗ modalités désignées par des lettres minuscules
numérotées x1 , x2 , · · · , xk .
23 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Caractère et modalité
Exemple 1 (suite) :
• Population : Étudiants de la FSJES de Tanger.
Exemple 2 (suite) :
• Population : Entreprises installées à Tanger.
24 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
Définitions :
• Effectif ni d’une modalité xi : Nombre d’individus qui ont la modalité xi .
25 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
Remarques :
• L’effectif total n est égal à la somme de tous les effectifs ni :
n1 + n2 + · · · + nk = n
n1 n2 nk n
f1 + f2 + · · · + fk = + + ··· + = =1
n n n n
26 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
Exemple :
xi ni fi
1
x1 1 3 ≈ 0.33 → 0.34
1
x2 1 3 ≈ 0.33 → 0.33
1
x3 1 3 ≈ 0.33 → 0.33
Somme 3 0.99 → 1.00
27 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
10 13 12 14 10 13 11 12 11 10
11 14 10 13 12 10 12 13 12 10
13 16 14 11 13 15 10 13 12 14
10 15 11 14 12 15 12 11 13 10
12 15 14 10 13 11 16 13 11 15
12 11 13 10 14 16 15 11 15 12
13 11 14 11 14 12 15 13 12 13
11 12 10 16 11 14 14 13 14 10
28 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
xi ni fi = ni /n
10 13 13/80 = 0.1625
11 14 14/80 = 0.1750
12 14 14/80 = 0.1750
13 15 15/80 = 0.1875
14 12 12/80 = 0.1500
15 08 08/80 = 0.1000
16 04 04/80 = 0.0500
Somme n = 80 1
29 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
Définitions :
• Effectif cumulé croissant Ni+ d’une modalité xi : Nombre d’individus qui
ont des modalités au plus égales à la modalité xi :
Ni+ = n1 + n2 + · · · + ni
Ni− = nk + nk −1 + · · · + ni
30 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
xi ni Ni+ Ni−
10 ↓ 13 13 67 + 13 = 80 ↑
11 ↓ 14 13 + 14 = 27 ↓ 53 + 14 = 67 ↑
12 ↓ 14 27 + 14 = 41 ↓ 39 + 14 = 53 ↑
13 ↓ 15 41 + 15 = 56 ↓ 24 + 15 = 39 ↑
14 ↓ 12 56 + 12 = 68 ↓ 12 + 12 = 24 ↑
15 ↓ 08 68 + 08 = 76 ↓ 04 + 08 = 12 ↑
16 ↓ 04 76 + 04 = 80 ↓ 04
Somme n = 80 – –
31 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
Définitions :
• Fréquence cumulée croissante Fi+ d’une modalité xi : Proportion d’indivi-
dus qui ont des modalités au plus égales à la modalité xi :
Fi+ = f1 + f2 + · · · + fi
Fi− = fk + fk −1 + · · · + fi
32 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
xi fi Fi+ Fi−
10 ↓ 0.1625 0.1625 0.8375+0.1625 = 1.0000 ↑
11 ↓ 0.1750 0.1625+0.1750 = 0.3375 ↓ 0.6625+0.1750 = 0.8375 ↑
12 ↓ 0.1750 0.3375+0.1750 = 0.5125 ↓ 0.4875+0.1750 = 0.6625 ↑
13 ↓ 0.1875 0.5125+0.1875 = 0.7000 ↓ 0.3000+0.1875 = 0.4875 ↑
14 ↓ 0.1500 0.7000+0.1500 = 0.8500 ↓ 0.1500+0.1500 = 0.3000 ↑
15 ↓ 0.1000 0.8500+0.1000 = 0.9500 ↓ 0.0500+0.1000 = 0.1500 ↑
16 ↓ 0.0500 0.9500+0.0500 = 1.0000 ↓ 0.0500
Somme 1.0000 – –
33 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Effectifs et fréquences
Remarques :
• Les effectifs ni sont aussi appelés des fréquences absolues et les fréquences
fi des fréquences relatives.
• Les effectifs et les fréquences cumulés n’ont de sens que lorsqu’il est possible
de classer les modalités dans un ordre croissant ou décroissant.
34 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Exemples :
Série brute : 12 18 10 17 11 15 12 17 18 10
Série ordonnée : 10 10 11 12 12 15 17 17 18 18
35 / 250
Vocabulaire et opérateurs statistiques Vocabulaire statistique
Exemples :
Distribution statistique des effectifs :
xi 10 11 12 15 17 18
ni 2 1 2 1 2 2
Sous-section 2 :
Typologie des variables statistiques
37 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques
→ Une variable quantitative est discrète si elle ne peut prendre que certaines
valeurs d’un intervalle.
→ Une variable quantitative est continue si elle peut prendre toutes les valeurs
possibles d’un intervalle rangées dans des classes.
→ Une classe est un intervalle semi-fermé [xi−1 ; xi [. Elle est caractérisée par
son amplitude ai = xi − xi−1 et par son centre ci = (xi−1 + xi )/2.
38 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques
39 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques
→ Une variable qualitative est ordinale s’il est possible d’établir un ordre
unique entre ses modalités.
→ Une variable qualitative est nominale s’il n’est pas possible d’établir un
ordre unique entre ses modalités.
→ Les modalités d’une variable qualitative sont aussi appelées des catégories.
De ce fait, une variable qualitative est une variable catégorielle.
40 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques
41 / 250
Vocabulaire et opérateurs statistiques Typologie des variables statistiques
Remarque :
Les catégories d’une variable qualitative peuvent être codées par des nombres
qui n’ont pas de signification mathématique. On peut, par exemple, donner à
la couleur bleue le code 1, à la couleur rouge le code 2 et à la couleur verte le
code 3. Ces codes n’ont pas de sens mathématique car 1 + 2 = 3 ne signifie pas
que mélanger la couleur bleue avec la couleur rouge produit la couleur verte !
42 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Sous-section 3 :
Opérateurs statistiques Σ et Π
Applications
43 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Définition (Opérateur Σ)
Soit X une variable quantitative prenant les valeurs x1 , x2 , · · · , xk avec k ∈ N∗ .
L’opérateur Σ permet d’écrire la somme x1 +x2 +· · ·+xk de façon plus compacte :
k
X
xi ≡ x1 + x2 + · · · + xk
i=1
44 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
k
X k
X
axi = a xi , ∀a ∈ R
i=1 i=1
k
X k
X k
X
(xi + yi ) = xi + yi
i=1 i=1 i=1
k
X h
X k
X
xi = xi + xi , ∃h ∈ N∗ | 1 < h < k
i=1 i=1 i=h+1
k
X
a = k .a , ∀a ∈ R
i=1
45 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Démonstrations :
k
X
axi = ax1 + ax2 + · · · + axk
i=1
= a (x1 + x2 + · · · + xk )
| {z }
Pk
i=1 xi
k
X
=a xi
i=1
46 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Démonstrations :
k
X
(xi + yi ) = (x1 + y1 ) + (x2 + y2 ) + · · · + (xk + yk )
i=1
= (x1 + x2 + · · · + xk ) + (y1 + y2 + · · · + yk )
| {z } | {z }
Pk Pk
i=1 xi i=1 yi
k
X k
X
= xi + yi
i=1 i=1
47 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Démonstrations :
k
X
xi = x1 + x2 + · · · + xb + xb+1 + xb+2 + · · · + xk
i=1
= (x1 + x2 + · · · + xh ) + (xh+1 + xh+2 + · · · + xk )
| {z } | {z }
Ph Pk
i=1 xi i=h+1 xi
h
X k
X
= xi + xi
i=1 i=h+1
48 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Démonstrations :
k
X
a = a + a + ··· + a
| {z }
i=1 k fois
= k .a
49 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Définition (Opérateur Π)
Soit X une variable quantitative prenant les valeurs x1 , x2 , · · · , xk avec k ∈ N∗ .
L’opérateur Π permet d’écrire le produit x1 ×x2 ×· · ·×xk de façon plus compacte :
k
Y
xi ≡ x1 × x2 × · · · × xk
i=1
50 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
k
Y
a = a k , ∀a ∈ R
i=1
k
Y k
Y k
Y
(xi × yi ) = xi × yi
i=1 i=1 i=1
k
Y h
Y k
Y
xi = xi × xi , ∃h ∈ N∗ | 1 < h < k
i=1 i=1 i=h+1
k
Y k
Y
axi = a k xi , ∀a ∈ R
i=1 i=1
51 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Démonstrations :
k
Y
a = a × a × ··· × a
| {z }
i=1 k facteurs
k
=a
52 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Démonstrations :
k
Y
(xi × yi ) = (x1 × y1 ) × (x2 × y2 ) × · · · × (xk × yk )
i=1
= (x1 × x2 × · · · × xk ) × (y1 × y2 × · · · × yk )
| {z } | {z }
Qk Qk
i=1 xi i=1 yi
k
Y k
Y
= xi × yi
i=1 i=1
53 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Démonstrations :
k
Y
xi = x1 × x2 × · · · × xh × xh+1 × xh+2 × · · · × xk
i=1
= (x1 × x2 × · · · × xh ) × (xh+1 × xh+2 × · · · × xk )
| {z } | {z }
Qh Qk
i=1 xi i=h+1 xi
h
Y k
Y
= xi × xi
i=1 i=h+1
54 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Démonstrations :
k
Y
axi = ax1 × ax2 × · · · × axk
i=1
= (a × a × · · · × a) × (x1 × x2 × · · · × xk )
| {z } | {z }
Qk
k facteurs xi
i=1
k
Y
= ak xi
i=1
55 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Applications
56 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Applications
Solutions :
k
X
(xi + a) = (x1 + a) + (x2 + a) + · · · + (xk + a)
i=1
= x1 + a + x2 + a + · · · + xk + a
= (x1 + x2 + · · · + xk ) + (a + a + · · · + a)
k
X k
X
= xi + a
i=1 i=1
k
X
= xi + ka
i=1
57 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Applications
Solutions :
k
X 2 2 2 2
(xi + a) = (x1 + a) + (x2 + a) + · · · + (xk + a)
i=1
k
X k
X k
X
= xi2 + 2axi + a2
i=1 i=1 i=1
k
X k
X
= xi2 + 2a xi + k .a 2
i=1 i=1
58 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Applications
Solutions :
k
X 2 2 2 2
(xi + yi ) = (x1 + y1 ) + (x2 + y2 ) + · · · + (xk + yk )
i=1
k
X k
X k
X
= xi2 + 2 xi yi + yi2
i=1 i=1 i=1
59 / 250
Vocabulaire et opérateurs statistiques Opérateurs statistiques Σ et Π
Applications
Rappel :
Solutions :
k
!
Y
log xi = log (x1 × x2 × · · · × xk )
i=1
60 / 250
Tableaux statistiques
Section 2 :
Tableaux statistiques
61 / 250
Tableaux statistiques
62 / 250
Tableaux statistiques Variables qualitatives nominales
Sous-section 1 :
Variables qualitatives nominales
63 / 250
Tableaux statistiques Variables qualitatives nominales
B V R O R O R B R B
B V B R V B V B O R
V V R B R V O R O B
B B V B V R B B O R
B : Bleu
V : Vert
R : Rose
O : Orange
64 / 250
Tableaux statistiques Variables qualitatives nominales
Tableau statistique :
Catégories ni fi
Vert 9 0.225
Bleu 14 0.350
Orange 6 0.150
Rose 11 0.275
Σ 40 1.000
65 / 250
Tableaux statistiques Variables qualitatives ordinales
Sous-section 2 :
Variables qualitatives ordinales
66 / 250
Tableaux statistiques Variables qualitatives ordinales
B M L D B L M M B D L B
L B L B B L M B L B B B
B M B B L L B L B L L L
L M D B M B B L D B M M
B L B M L B M L D B M B
B : Baccalauréat
L : Licence
M : Master
D : Doctorat
67 / 250
Tableaux statistiques Variables qualitatives ordinales
Tableau statistique :
Le nombre de personnes qui ont au moins une licence est donné par l’in-
tersection de la ligne Licence et de la colonne Ni− , c’est à dire N2− = 35.
La proportion d’individus qui ont au plus un master est donné par le croi-
sement de la ligne Master et de la colonne Fi+ , c’est à dire F3+ = 0.92.
68 / 250
Tableaux statistiques Variables quantitatives discrètes
Sous-section 3 :
Variables quantitatives discrètes
69 / 250
Tableaux statistiques Variables quantitatives discrètes
1111111111112222222222222
2222222222222222222222222
2233333333333333333333333
3333333334444444444444444
70 / 250
Tableaux statistiques Variables quantitatives discrètes
Tableau statistique :
Le nombre de familles qui ont au plus 4 enfants est donné par l’intersection
de la ligne 4 et de la colonne Ni+ , c’est à dire 100 familles.
Sous-section 4 :
Variables quantitatives continues
72 / 250
Tableaux statistiques Variables quantitatives continues
161.2 162.4 162.7 163.8 163.5 166.4 166.8 166.4 167.1 167.3 168.2
168.7 169.1 169.4 169.4 171.4 171.6 171.4 171.8 171.8 171.2 171.8
171.1 171.5 172.9 172.7 172.4 173.4 173.6 173.6 173.3 173.1 174.4
174.4 174.7 177.4 177.6 177.4 177.6 178.4 178.4 178.1 178.2 179.8
179.4 179.1 179.0 179.4 179.4 179.3 181.1 181.3 182.1 183.1 183.3
73 / 250
Tableaux statistiques Variables quantitatives continues
Tableau statistique :
Le nombre d’individus qui ont des tailles au plus égales à 170 cm se trouve
sur la ligne de la classe qui a une borne supérieure égale à 170 et sur la
colonne Ni+ , c’est à dire N2+ = 15.
La proportion d’individus qui ont des tailles au moins égales à 170 cm se
trouve sur la ligne de la classe qui a une borne inférieure égale à 170 et sur
la colonne Fi− , c’est à dire F3− = 0.73.
74 / 250
Représentations graphiques
Section 3 :
Représentations graphiques
Diagramme en barres
Diagramme en bâtons
Histogramme
Courbes cumulatives
75 / 250
Représentations graphiques
76 / 250
Représentations graphiques Diagramme en barres
Sous-section 1 :
Diagramme en barres
77 / 250
Représentations graphiques Diagramme en barres
Utilisation :
Représentation graphique des effectifs et des fréquences d’une variable
qualitative.
78 / 250
Représentations graphiques Diagramme en barres
Diagramme en barres :
79 / 250
Représentations graphiques Diagramme en barres
Remarques :
Les rectangles d’un diagramme en barres sont disjoints.
L’ordre des catégories d’une variable qualitative ordinale doit être
respecté lors de la construction du diagramme en barres.
80 / 250
Représentations graphiques Diagramme en barres
81 / 250
Représentations graphiques Diagramme en barres
82 / 250
Représentations graphiques Diagramme en bâtons
Sous-section 2 :
Diagramme en bâtons
83 / 250
Représentations graphiques Diagramme en bâtons
Utilisation :
Représentation graphique des effectifs et des fréquences d’une variable
quantitative discrète.
84 / 250
Représentations graphiques Diagramme en bâtons
Diagramme en bâtons :
85 / 250
Représentations graphiques Diagramme en bâtons
86 / 250
Représentations graphiques Histogramme
Sous-section 3 :
Histogramme
87 / 250
Représentations graphiques Histogramme
Définition (Histogramme)
L’histogramme est un graphique qui associe à chaque classe d’une variable quan-
titative continue un rectangle d’aire égale à son effectif ou à sa fréquence.
Utilisation :
Représentation graphique des effectifs et des fréquences d’une variable
quantitative continue.
Remarques :
Les rectangles d’un histogramme sont juxtaposés.
Les hauteurs des rectangles sont données par les densités d’effectifs ou de
fréquences respectivement définies par :
ni fi
hi = hi =
ai ai
88 / 250
Représentations graphiques Histogramme
89 / 250
Représentations graphiques Histogramme
90 / 250
Représentations graphiques Histogramme
Densités d’effectifs :
91 / 250
Représentations graphiques Histogramme
Densités de fréquences :
92 / 250
Représentations graphiques Courbes cumulatives
Sous-section 4 :
Courbes cumulatives
93 / 250
Représentations graphiques Courbes cumulatives
Utilisation :
Représentation graphique des effectifs et des fréquences cumulés d’une variable
quantitative.
Remarques :
Si l’effectif cumulé ou la fréquence cumulée sont croissants, alors la courbe
cumulative est dite ascendante et si l’effectif cumulé ou la fréquence cumulée
sont décroissants, alors la courbe cumulative est dite descendante.
94 / 250
Représentations graphiques Courbes cumulatives
95 / 250
Représentations graphiques Courbes cumulatives
Tableau statistique :
96 / 250
Représentations graphiques Courbes cumulatives
97 / 250
Représentations graphiques Courbes cumulatives
xi Ni+
1 12
2 52
3 84
4 100
xi Ni+
1 12
2 52
3 84
4 100
xi Ni+
1 12
2 52
3 84
4 100
xi Ni−
1 100
2 88
3 48
4 16
xi Ni−
1 100
2 88
3 48
4 16
xi Ni−
1 100
2 88
3 48
4 16
xi Fi+
1 0.12
2 0.52
3 0.84
4 1
xi Fi+
1 0.12
2 0.52
3 0.84
4 1
xi Fi+
1 0.12
2 0.52
3 0.84
4 1
xi Fi−
1 1
2 0.88
3 0.48
4 0.16
xi Fi−
1 1
2 0.88
3 0.48
4 0.16
xi Fi−
1 1
2 0.88
3 0.48
4 0.16
110 / 250
Représentations graphiques Courbes cumulatives
Tableau statistique :
111 / 250
Représentations graphiques Courbes cumulatives
Hypothèse d’uniformité :
112 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Ni+
[160; 165[ 5
[165; 170[ 15
[170; 175[ 35
[175; 180[ 50
[180; 185] 55
Ni+ est le nombre d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
114 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Ni+
[160; 165[ 5
[165; 170[ 15
[170; 175[ 35
[175; 180[ 50
[180; 185] 55
Ni+ est le nombre d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
115 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Ni+
[160; 165[ 5
[165; 170[ 15
[170; 175[ 35
[175; 180[ 50
[180; 185] 55
Ni+ est le nombre d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
116 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Ni−
[160; 165[ 55
[165; 170[ 50
[170; 175[ 40
[175; 180[ 20
[180; 185] 5
Ni− est le nombre d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
117 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Ni−
[160; 165[ 55
[165; 170[ 50
[170; 175[ 40
[175; 180[ 20
[180; 185] 5
Ni− est le nombre d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
118 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Ni−
[160; 165[ 55
[165; 170[ 50
[170; 175[ 40
[175; 180[ 20
[180; 185] 5
Ni− est le nombre d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
119 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Fi+
[160; 165[ 0.09
[165; 170[ 0.27
[170; 175[ 0.63
[175; 180[ 0.91
[180; 185] 1
Fi+ est la proportion d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
120 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Fi+
[160; 165[ 0.09
[165; 170[ 0.27
[170; 175[ 0.63
[175; 180[ 0.91
[180; 185] 1
Fi+ est la proportion d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
121 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Fi+
[160; 165[ 0.09
[165; 170[ 0.27
[170; 175[ 0.63
[175; 180[ 0.91
[180; 185] 1
Fi+ est la proportion d’individus qui ont au plus la borne supérieure de la classe [xi−1 ; xi [.
122 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Fi−
[160; 165[ 1
[165; 170[ 0.91
[170; 175[ 0.73
[175; 180[ 0.37
[180; 185] 0.09
Fi− est la proportion d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
123 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Fi−
[160; 165[ 1
[165; 170[ 0.91
[170; 175[ 0.73
[175; 180[ 0.37
[180; 185] 0.09
Fi− est la proportion d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
124 / 250
Représentations graphiques Courbes cumulatives
[xi−1 ; xi [ Fi−
[160; 165[ 1
[165; 170[ 0.91
[170; 175[ 0.73
[175; 180[ 0.37
[180; 185] 0.09
Fi− est la proportion d’individus qui ont au moins la borne inférieure de la classe [xi−1 ; xi [.
125 / 250
Chapitre 2 :
Séries statistiques à une dimension
Mesures de position
Mesures de dispersion
Mesures de forme
126 / 250
Remarques préliminaires :
Dans ce chapitre, seules seront considérées des variables statistiques quan-
titatives étant donné que les variables qualitatives ne se prêtent pas aux
calculs mathématiques qui seront présentés.
127 / 250
Mesures de position
Section 1 :
Mesures de position
128 / 250
Mesures de position
129 / 250
Mesures de position
Positions centrales :
Positions relatives :
130 / 250
Mesures de position Mesures de tendance centrale ou de centre
Sous-section 1 :
Mesures de tendance centrale ou de centre
Mode
Médiane
Moyenne arithmétique
131 / 250
Mesures de position Mesures de tendance centrale ou de centre
Mode
Définition (Mode)
Le mode d’une distribution statistique, noté Mo , est la modalité du caractère
la plus fréquemment rencontrée localement. C’est l’équivalent du maximum en
analyse mathématique. Une distribution statistique peut avoir un, deux ou plu-
sieurs modes, on parle alors respectivement de distributions unimodale, bimodale
et multimodale.
132 / 250
Mesures de position Mesures de tendance centrale ou de centre
133 / 250
Mesures de position Mesures de tendance centrale ou de centre
Exemple :
Le mode est la modalité correspondant au bâton le plus élevé localement.
134 / 250
Mesures de position Mesures de tendance centrale ou de centre
Exemple :
Le mode est la modalité correspondant à l’effectif (ou à la fréquence)
maximal(e) localement.
xi ni fi
1 12 0.12
2 38 0.38
3 22 0.22
4 18 0.18
Σ 100 1
Mo = 2 enfants : 2 est le nombre d’enfants par famille le plus fréquent.
135 / 250
Mesures de position Mesures de tendance centrale ou de centre
136 / 250
Mesures de position Mesures de tendance centrale ou de centre
137 / 250
Mesures de position Mesures de tendance centrale ou de centre
[xi−1 ; xi [ ni ai hi
[160 ; 165 [ 5 5 1
[165 ; 170 [ 13 5 2.6
[170 ; 175 [ 20 5 4
[175 ; 185] 20 10 2
Total 58 –
138 / 250
Mesures de position Mesures de tendance centrale ou de centre
d1
M0 = xi−1 + × (xi − xi−1 )
d1 + d2
avec :
d1 = hi − hi−1 d2 = hi − hi+1
139 / 250
Mesures de position Mesures de tendance centrale ou de centre
AB AC BC AH
= = 0 0 =
AB 0 AC 0 BC AH 0
140 / 250
Mesures de position Mesures de tendance centrale ou de centre
EH AB Mo −xi−1 d1
EH 0 = DC ⇐⇒ xi −Mo = d2
141 / 250
Mesures de position Mesures de tendance centrale ou de centre
Démonstration (suite) :
Mo − xi−1 d1
=
xi − Mo d2
d1
⇔ Mo − xi−1 = × (xi − Mo )
d2
d1
⇔ Mo − xi−1 = × [(xi − xi−1 ) − (Mo − xi−1 )]
d2
d1 d1
⇔ Mo − xi−1 = × (xi − xi−1 ) − × (Mo − xi−1 )
d2 d2
d1 d1
⇔ (Mo − xi−1 ) 1 + = × (xi − xi−1 )
d2 d2
d2 d1
⇔ Mo − xi−1 = × × (xi − xi−1 )
d1 + d2 d2
d1
Mo = xi−1 + d1 +d2 × (xi − xi−1 )
142 / 250
Mesures de position Mesures de tendance centrale ou de centre
143 / 250
Mesures de position Mesures de tendance centrale ou de centre
Remarques :
Les modes des distributions statistiques multimodales ne sont pas des mesures
de centre mais plutôt une indication sur l’hétérogénéité de la population.
144 / 250
Mesures de position Mesures de tendance centrale ou de centre
Remarques (suite) :
Le mode est sensible au découpage des classes d’une variable continue.
[xi−1 ; xi [ ni ai hi
[160 ; 165 [ 5 5 1 [xi−1 ; xi [ ni ai hi
[165 ; 170 [ 10 5 2 [160 ; 170 [ 15 10 1.5
[170 ; 175 [ 20 5 4 [170 ; 180 [ 35 10 3.5
[175 ; 180 [ 15 5 3 [180 ; 185 [ 5 5 1
[180 ; 185 [ 5 5 1
3.5 − 1.5
Mo = 170 + × 10
4−2 (3.5 − 1.5) + (3.5 − 1)
Mo = 170 + ×5
(4 − 2) + (4 − 3) = 174.44 cm
= 173.33 cm
145 / 250
Mesures de position Mesures de tendance centrale ou de centre
Médiane
Définition (Médiane)
La médiane d’une distribution statistique, notée Me , est la valeur du caractère
qui partage la série statistique ordonnée en deux parties contenant chacune la
moitié des observations environ.
146 / 250
Mesures de position Mesures de tendance centrale ou de centre
Exemples :
Série statistique 1 : 2 3 3 4 5 6 6 7 8
Série statistique 2 : 2 3 3 4 5 5 6 7 8 9
Série statistique 3 : 2 3 3 4 5 6 6 7 8 9
147 / 250
Mesures de position Mesures de tendance centrale ou de centre
Exemples (suite) :
Série statistique 1 : 2 3 3 4 Me = 5 6 6 7 8
xi ni fi Fi+
2 1 0.11 0.11
3 2 0.22 0.33
4 1 0.11 0.44
5 1 0.11 0.55
6 2 0.22 0.77
7 1 0.11 0.88
8 1 0.12 1
Somme 9 1 –
Aucune fréquence cumulée croissante n’est égale à 0.5. La médiane correspond
à la fréquence cumulée croissante immédiatement supérieure à 0.5. La valeur
0.5 renvoie à la notion de milieu ou de moitié.
148 / 250
Mesures de position Mesures de tendance centrale ou de centre
Exemples (suite) :
Série statistique 2 : 2 3 3 4 5 Me 5 6 7 8 9
xi ni fi Fi+
2 1 0.1 0.1
3 2 0.2 0.3
4 1 0.1 0.4
5 2 0.2 0.6
6 1 0.1 0.7
7 1 0.1 0.8
8 1 0.1 0.9
9 1 0.1 1
Somme 10 1 –
Aucune fréquence cumulée croissante n’est égale à 0.5. La médiane correspond
à la fréquence cumulée croissante immédiatement supérieure à 0.5. La valeur
0.5 renvoie à la notion de milieu ou de moitié.
149 / 250
Mesures de position Mesures de tendance centrale ou de centre
Exemples (suite) :
Série statistique 3 : 2 3 3 4 5 Me 6 6 7 8 9
xi ni fi Fi+
2 1 0.1 0.1
3 2 0.2 0.3
4 1 0.1 0.4
5 1 0.1 0.5
6 2 0.2 0.7
7 1 0.1 0.8
8 1 0.1 0.9
9 1 0.1 1
Somme 10 1 –
L’une des fréquences cumulées croissantes est égale à 0.5, on a un intervalle
médian. Par convention, la médiane est égale au centre de cet intervalle médian.
150 / 250
Mesures de position Mesures de tendance centrale ou de centre
Règles :
• Si aucune fréquence cumulée croissante n’est égale à 0.5, alors la médiane
est la modalité dont la fréquence cumulée croissante est immédiatement
supérieure à 0.5.
• S’il y a une fréquence cumulée croissante égale à 0.5, alors on a un intervalle
médian dont la borne inférieure correspond à fréquence cumulée croissante
égale à 0.5 et la borne supérieure correspond à fréquence cumulée croissante
immédiatement supérieure à 0.5. Dans ce cas, la valeur médiane est le centre
de l’intervalle médian.
151 / 250
Mesures de position Mesures de tendance centrale ou de centre
xi Fi+
1 0.12
2 0.52 Me = 2 enfants
3 0.84
4 1
La moitié des familles ont moins de 2 enfants et la moitié ont en plus de 2.
152 / 250
Mesures de position Mesures de tendance centrale ou de centre
xi Fi+
1 0.12
2+3
2 0.50 Me ∈ [2; 3] ⇒ Me = = 2.5 enfants
2
3 0.84
4 1
La moitié des familles ont moins de 2 enfants et la moitié ont en plus de 3.
153 / 250
Mesures de position Mesures de tendance centrale ou de centre
La moitié des familles ont moins de 2 enfants et l’autre moitié en ont plus de 2.
154 / 250
Mesures de position Mesures de tendance centrale ou de centre
Règle :
La médiane est l’abscisse du point associé à la fréquence cumulée croissante
0.5.
156 / 250
Mesures de position Mesures de tendance centrale ou de centre
157 / 250
Mesures de position Mesures de tendance centrale ou de centre
Détermination de la médiane dans le cas continu : A partir des courbes Fi+ et Fi−
Règle :
La médiane est l’abscisse du point d’intersection des courbes cumulatives ascen-
dante et descendante, ce point correspond à des fréquences cumulées (croissante
et décroissante) égales à 0.5.
158 / 250
Mesures de position Mesures de tendance centrale ou de centre
Détermination de la médiane dans le cas continu : A partir des courbes Fi+ et Fi−
159 / 250
Mesures de position Mesures de tendance centrale ou de centre
Règles :
• S’il y a une fréquence cumulée croissante égale à 0.5, alors la médiane est
égale à la borne supérieure de la classe correspondant à la fréquence cumulée
croissante égale à 0.5.
• Si aucune fréquence cumulée croissante n’est égale à 0.5, alors la classe
médiane [xi−1 ; xi [ est la classe dont la fréquence cumulée croissante est
immédiatement supérieure à 0.5. Dans ce cas, la valeur médiane Me est
calculée par interpolation linéaire comme suit :
+
0.5 − Fi−1
Me = xi−1 + + (xi − xi−1 )
Fi+ − Fi−1
160 / 250
Mesures de position Mesures de tendance centrale ou de centre
161 / 250
Mesures de position Mesures de tendance centrale ou de centre
Démonstration (suite) :
+
yB − yA 0.5 − Fi−1
a= =
xB − xA Me − xi−1
yC − yA F + − Fi−1
+
a= = i
xC − xA xi − xi−1
+
0.5 − Fi−1 F + − Fi−1
+
⇒ = i
Me − xi−1 xi − xi−1
+
0.5 − Fi−1
Me − xi−1 = + × (xi − xi−1 )
Fi+ − Fi−1
+
0.5−Fi−1
Me = xi−1 + Fi+ −Fi−1
+ × (xi − xi−1 )
La médiane Me est égale à la borne inférieure de la classe médiane [xi−1 ; xi [
+
0.5−Fi−1
plus une fraction Fi+ −Fi−1
+ de l’amplitude xi − xi−1 de la classe médiane.
162 / 250
Mesures de position Mesures de tendance centrale ou de centre
Dans la pratique :
1. Identifier la classe médiane [xi−1 ; xi [ et situer la valeur médiane Me à l’inté-
rieur de cette classe.
163 / 250
Mesures de position Mesures de tendance centrale ou de centre
Dans la pratique :
2. Associer la fréquence cumulée croissante 0.5 à la valeur médiane Me .
164 / 250
Mesures de position Mesures de tendance centrale ou de centre
Dans la pratique :
3. Trouver dans la colonne des fréquences cumulées croissantes les valeurs qui
encadrent 0.5 et les associer aux bornes de la classe médiane.
165 / 250
Mesures de position Mesures de tendance centrale ou de centre
Dans la pratique :
4. Calculer la médiane par interpolation linéaire comme suit :
+ +
Me − xi−1 0.5 − Fi−1 0.5 − Fi−1
= + + ⇔ Me − xi−1 = + + × (xi − xi−1 )
xi − xi−1 Fi − Fi−1 Fi − Fi−1
+
0.5 − Fi−1
Me = xi−1 + + × (xi − xi−1 )
Fi+ − Fi−1
166 / 250
Mesures de position Mesures de tendance centrale ou de centre
La moitié des individus ont une taille inférieure à 173.19 cm et l’autre moitié
ont une taille supérieure à cette taille médiane.
167 / 250
Mesures de position Mesures de tendance centrale ou de centre
La moitié des individus ont une taille inférieure à 175 cm et l’autre moitié ont
une taille supérieure à cette taille médiane.
168 / 250
Mesures de position Mesures de tendance centrale ou de centre
Moyenne arithmétique
169 / 250
Mesures de position Mesures de tendance centrale ou de centre
Centres de gravité :
170 / 250
Mesures de position Mesures de tendance centrale ou de centre
Remarques :
Si n1 = n2 = · · · = nk = 1, alors la moyenne arithmétique est dite simple.
Dans le cas contraire, elle est dite pondérée ;
k k
1X X
x= ni ci = fi ci
n i=1 i=1
171 / 250
Mesures de position Mesures de tendance centrale ou de centre
172 / 250
Mesures de position Mesures de tendance centrale ou de centre
173 / 250
Mesures de position Mesures de tendance centrale ou de centre
Propriétés :
Soient X et Y deux variables statistiques quantitatives prenant respectivement
les valeurs x1 , x2 , · · · , xk et y1 , y2 , · · · , yk avec k ∈ N∗ et a et b deux constantes
réelles.
ax + by = ax + by
k
X
ni (xi − x ) = 0
i=1
174 / 250
Mesures de position Mesures de tendance centrale ou de centre
Démonstrations :
k
1X
ax + by = ni (axi + byi )
n i=1
k
1X
= (ani xi + bni yi )
n i=1
k k
1X 1X
= ani xi + bni yi
n i=1 n i=1
k
! k
!
1X 1X
=a ni xi + b ni yi
n i=1 n i=1
= ax + by
175 / 250
Mesures de position Mesures de tendance centrale ou de centre
Exemples :
x +y =x +y
2x + y = 2x + y
3x − y = 3x − y
x − 3y = x − 3y
x + 2y = x + 2y
3x + 2 = 3x + 2
3 − 2y = 3 − 2y
176 / 250
Mesures de position Mesures de tendance centrale ou de centre
Démonstrations (suite) :
k
X k
X
ni (xi − x ) = (ni xi − ni x )
i=1 i=1
k
X k
X
= ni xi − ni x
i=1 i=1
k k
1X X
=n× ni xi − x ni
n i=1 i=1
= nx − x n
=0
177 / 250
Mesures de position Mesures de tendance centrale ou de centre
Remarque :
La moyenne arithmétique est sensible aux valeurs extrêmes contrairement à la
médiane qui n’est pas influencée par de telles observations. La médiane est, de
ce fait, une mesure robuste du centre de la distribution statistique.
178 / 250
Mesures de position Mesures de tendance centrale ou de centre
179 / 250
Mesures de position Mesures de position relative ou quantiles
Sous-section 2 :
Mesures de position relative ou quantiles
Quartiles
Déciles
Centiles
Généralisation
Mode de calcul
180 / 250
Mesures de position Mesures de position relative ou quantiles
Définition (Quantiles)
Les quantiles ou les fractiles sont des valeurs qui partagent la série statistique
ordonnée en un certain nombre de parties contenant chacune une même propor-
tion d’observations. Ils constituent, de ce fait, une généralisation de la notion
de médiane qui partage la série statistique en deux parties contenant chacune
la moitié des observations.
Les quantiles les plus connus sont les quartiles, les déciles et les centiles qui
divisent la série statistique en respectivement 4, 10 et 100 parties de même
effectif. Par conséquent, les quantiles ne se trouvent pas nécessairement au centre
de la distribution statistique mais dans des positions dites relatives.
181 / 250
Mesures de position Mesures de position relative ou quantiles
Quartiles
Définition (Quartiles)
Les quartiles sont des valeurs qui partagent la série statistique ordonnée en 4
parties contenant chacune 25% des observations. Ils sont au nombre de 3 et sont
notés Q1 , Q2 et Q3 .
182 / 250
Mesures de position Mesures de position relative ou quantiles
Déciles
Définition (Déciles)
Les déciles sont des valeurs qui partagent la série statistique ordonnée en 10
parties contenant chacune 10% des observations. Ils sont au nombre de 9 et
sont notés D1 , D2 ... et D9 .
183 / 250
Mesures de position Mesures de position relative ou quantiles
Centiles
Définition (Centiles)
Les centiles sont des valeurs qui partagent la série statistique ordonnée en 100
parties contenant chacune 1% des observations. Ils sont au nombre de 99 et sont
notés C1 , C2 ... et C99 .
184 / 250
Mesures de position Mesures de position relative ou quantiles
Généralisation
185 / 250
Mesures de position Mesures de position relative ou quantiles
Mode de calcul
186 / 250
Mesures de position Mesures de position relative ou quantiles
Règles :
• S’il y a une fréquence cumulée croissante égale à α alors on a un intervalle
quantile délimité par la modalité associée à la valeur α et par la modalité
suivante.
187 / 250
Mesures de position Mesures de position relative ou quantiles
188 / 250
Mesures de position Mesures de position relative ou quantiles
Règle 1 :
Si la valeur α se situe entre deux paliers de la courbe cumulative ascendante,
alors le quantile recherché est l’abscisse commune aux deux paliers.
189 / 250
Mesures de position Mesures de position relative ou quantiles
190 / 250
Mesures de position Mesures de position relative ou quantiles
Règle 2 :
Si la valeur α est en face d’un palier de la courbe cumulative ascendante, alors
on a un intervalle quantile délimité par les abscisses des extrémités du palier.
191 / 250
Mesures de position Mesures de position relative ou quantiles
192 / 250
Mesures de position Mesures de position relative ou quantiles
Étape 1 :
La classe [xi−1 ; xi [ contenant le quantile d’ordre α est d’abord identifiée, c’est
la classe ayant une fréquence cumulée croissante immédiatement supérieure ou
égale à α :
193 / 250
Mesures de position Mesures de position relative ou quantiles
Étape 2 :
Le quantile d’ordre α est calculé par interpolation linéaire comme suit :
+ +
qα − xi−1 α − Fi−1 α − Fi−1
= + + ⇔ qα − xi−1 = + × (xi − xi−1 )
xi − xi−1 Fi − Fi−1 Fi+ − Fi−1
+
α − Fi−1
qα = xi−1 + + × (xi − xi−1 )
Fi+ − Fi−1
194 / 250
Mesures de position Mesures de position relative ou quantiles
195 / 250
Mesures de position Mesures de position relative ou quantiles
196 / 250
Mesures de position Mesures de position relative ou quantiles
197 / 250
Mesures de position Mesures de position relative ou quantiles
198 / 250
Mesures de dispersion
Section 2 :
Mesures de dispersion
199 / 250
Mesures de dispersion
0 0 0 0 0 -2 -1 0 1 2 -4 -3 0 3 4
x = 0% x = 0% x = 0%
Me = 0% Me = 0% Me = 0%
Les mesures de tendance centrale ne donnent aucune idée sur la variabilité ou
la dispersion des données !
200 / 250
Mesures de dispersion
201 / 250
Mesures de dispersion Distance entre deux valeurs particulières
Sous-section 1 :
Distance entre deux valeurs particulières
Exemples
202 / 250
Mesures de dispersion Distance entre deux valeurs particulières
203 / 250
Mesures de dispersion Distance entre deux valeurs particulières
Intervalle de variation :
204 / 250
Mesures de dispersion Distance entre deux valeurs particulières
EIQ = Q3 − Q1
205 / 250
Mesures de dispersion Distance entre deux valeurs particulières
Intervalle interquartile :
206 / 250
Mesures de dispersion Distance entre deux valeurs particulières
EID = D9 − D1
207 / 250
Mesures de dispersion Distance entre deux valeurs particulières
Intervalle interdécile :
208 / 250
Mesures de dispersion Distance entre deux valeurs particulières
EIC = C99 − C1
209 / 250
Mesures de dispersion Distance entre deux valeurs particulières
Intervalle intercentile :
210 / 250
Mesures de dispersion Distance entre deux valeurs particulières
211 / 250
Mesures de dispersion Distance entre deux valeurs particulières
212 / 250
Mesures de dispersion Distance entre deux valeurs particulières
Remarque :
La dispersion d’une distribution statistique peut être résumée à l’aide d’une
boı̂te de Tukey. Il s’agit d’un diagramme représentant simultanément l’inter-
valle de variation, l’intervalle interquartile, la moyenne et la médiane de la série
statistique.
213 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Sous-section 2 :
Distance par rapport à une valeur centrale
Variance et écart-type
Coefficient de variation
214 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
215 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
k
1X
EAM = ni |xi − x |
n i=1
Dans le cas d’une variable continue, les modalités xi sont remplacées par les
centres des classes ci :
k
1X
EAM = ni |ci − x |
n i=1
216 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
252
x= = 2.52 ≈ 3 enfants
100
4
1X 78.08
EAM = ni |xi − x | = = 0.7808 ≈ 1 enfant
n i=1 100
217 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
9512.5
x= = 172.95 cm
55
5
1X 231.75
EAM = ni |ci − x | = = 4.21 cm
n i=1 55
218 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Variance et écart-type
k
1X 2
σx2 = ni (xi − x ) (1)
n i=1
Dans le cas d’une variable continue, les modalités xi sont remplacées par les
centres des classes ci :
k
1X 2
σx2 = ni (ci − x )
n i=1
219 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Théorème de König-Huygens :
La formule de la variance (1) peut être décomposée selon l’écriture alternative
suivante :
σx2 = x 2 − x 2
où
k
1X
x2 = ni xi2
n i=1
k
1X
x2 = ni ci2
n i=1
220 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Démonstration :
k
1X 2
σx2 = ni (xi − x )
n i=1
k
1X
ni xi2 − 2xi x + x 2
=
n i=1
k
1X
ni xi2 − ni 2xi x + ni x 2
=
n i=1
k k k
1X 1X 1X
= ni xi2 − ni 2xi x + ni x 2
n i=1 n i=1 n i=1
k k
! k
!
1X 1 X 1 X
= ni xi2 − 2x ni xi + x 2 ni
n i=1 n i=1 n i=1
= x 2 − 2x .x + x 2
= x2 − x2
221 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
4
1X 2 80.96 p
σx2 = ni (xi − x ) = = 0.81 ⇒ σ = σx2 = 0.9 ≈ 1 enfant
n i=1 100
716 2
p
σx2 = x 2 − x 2 = − (2.52) = 0.81 ⇒ σ = σx2 = 0.9 ≈ 1 enfant
100
Le nombre d’enfants par famille s’éloigne de la moyenne x d’un enfant en
moyenne.
222 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
5
1X 2 1613.64 p
σx2 = ni (ci − x ) = = 29.34 ⇒ σ = σx2 = 5.42 cm
n i=1 55
1646843.75 2
p
σx2 = c 2 − x 2 = − (172.95) = 30.91 ⇒ σ = σx2 = 5.56 cm
55
Les tailles d’individus s’éloignent de la moyenne x de 5.42 (ou 5.56) centimètres
en moyenne.
223 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Remarque :
La variance n’a pas de signification concrète, il s’agit simplement d’une étape
intermédiaire dans le calcul de l’écart-type. Néanmoins, elle peut être utilisée
comme mesure de dispersion tout en prenant garde à bien interpréter l’unité
de mesure transformée à la puissance 2 car ceci peut induire en erreur. A titre
d’exemples, le mètre qui est une unité de mesure des longueurs se transforme
en mètre carré qui est une unité de mesure des surfaces et le litre se transforme
en litre carré qui n’a pas aucune signification concrète.
224 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Propriétés :
Soit X une variable statistique quantitative et a et b deux constantes réelles.
La variance vérifie les propriétés suivantes :
V (aX ) = a 2 V (X )
V (X + b) = V (X )
V (aX + b) = a 2 V (X )
225 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Démonstrations :
k
1X 2
V (aX ) = ni (axi − ax )
n i=1
k X aX ni
1X 2
= ni (axi − ax ) x1 ax1 n1
n i=1
x2 ax2 n2
k .. .. ..
1X 2 . . .
= ni [a(xi − x )]
n i=1 xi axi ni
k
.. .. ..
1X 2 . . .
= ni a 2 (xi − x ) xk axk nk
n i=1
Σ n
k
1X2 2
=a ni (xi − x )
n i=1
= a 2 V (X )
226 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Démonstrations (suite) :
k
1X 2
V (X + b) = ni xi + b − x + b
n i=1 X X +b ni
k
x1 x1 + b n1
1X 2 x2 x2 + b n2
= ni [xi + b − (x + b)]
n i=1 .. .. ..
. . .
k xi xi + b ni
1X 2
= ni (xi + b − x − b) .. .. ..
n i=1 . . .
k xk xk + b nk
1X 2
= ni (xi − x ) Σ n
n i=1
= V (X )
227 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Démonstrations (suite) :
X aX + b ni
x1 ax1 + b n1
x2 ax2 + b n2
.. .. ..
V (aX + b) = V (aX ) . . .
xi axi + b ni
= a 2 V (X ) .. .. ..
. . .
xk axk + b nk
Σ n
228 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Exemples :
V (2X ) = 4V (X )
V (X + 3) = V (X )
V (2X + 3) = 4V (X )
229 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
Coefficient de variation
230 / 250
Mesures de dispersion Distance par rapport à une valeur centrale
La distribution statistique des nombres d’enfants par famille est plus dispersée
relativement à celle des tailles d’individus.
231 / 250
Mesures de forme
Section 3 :
Mesures de forme
Mesures d’asymétrie
Mesures d’aplatissement
232 / 250
Mesures de forme
233 / 250
Mesures de forme Mesures d’asymétrie
Sous-section 1 :
Mesures d’asymétrie
Coefficient de Fisher
Coefficient de Pearson
234 / 250
Mesures de forme Mesures d’asymétrie
Distribution symétrique :
Les valeurs symétriques par rapport au centre de la distribution statistique ont
les mêmes effectifs et les mêmes fréquences.
235 / 250
Mesures de forme Mesures d’asymétrie
236 / 250
Mesures de forme Mesures d’asymétrie
237 / 250
Mesures de forme Mesures d’asymétrie
Coefficient de skewness :
k 3
1X xi − x
γ1 = ni
n i=1 σ
Interprétation :
γ1 = 0 : la distribution est symétrique ;
γ1 > 0 : la distribution est asymétrique à droite ;
γ1 < 0 : la distribution est asymétrique à gauche.
238 / 250
Mesures de forme Mesures d’asymétrie
Interprétation :
β1 = 0 : la distribution est symétrique ;
β1 > 0 : la distribution est asymétrique à droite ou à gauche :
µ3 > 0 : la distribution est asymétrique à droite ;
µ3 < 0 : la distribution est asymétrique à gauche.
avec
k
1X 3
µ3 = ni (xi − x )
n i=1
239 / 250
Mesures de forme Mesures d’asymétrie
4 3
1 X xi − x 10.48
γ1 = ni = = 0.1048
100 i=1 σx 100
" 4 3 # 2
1 X xi − x
β1 = ni = (0.1048)2 = 0.011
100 i=1 σx
240 / 250
Mesures de forme Mesures d’asymétrie
5 3
1 X ci − y −9.79
γ1 = ni = = −0.1780
55 i=1 σy 55
" 5 3 #2
1 X ci − y
β1 = ni = (−0.1780)2 = 0.0317
55 i=1 σy
Remarque :
Il y a un lien entre l’asymétrie d’une distribution statistique et l’ordre de ses
mesures de tendance centrale. Celles-ci sont égales entre elles dans le cas d’une
distribution symétrique et différentes dans le cas d’une distribution asymétrique
et respectent un ordre bien précis suivant la nature de l’asymétrie :
242 / 250
Mesures de forme Mesures d’aplatissement
Sous-section 2 :
Mesures d’aplatissement
Coefficient de Pearson
Coefficient de Fisher
243 / 250
Mesures de forme Mesures d’aplatissement
Distribution mésokurtique :
Les valeurs extrêmes et les valeurs centrales ont des fréquences normales.
244 / 250
Mesures de forme Mesures d’aplatissement
Distribution leptokurtique :
Les valeurs extrêmes et les valeurs centrales sont plus fréquentes relativement à
une distribution normale.
245 / 250
Mesures de forme Mesures d’aplatissement
Distribution platykurtique :
Les valeurs extrêmes et les valeurs centrales sont moins fréquentes relativement
à une distribution normale.
246 / 250
Mesures de forme Mesures d’aplatissement
Coefficient de kurtosis :
k 4
1X xi − x
β2 = ni
n i=1 σ
Interprétation :
β2 = 3 : distribution mésokurtique (courbe normale) ;
β2 > 3 : distribution leptokurtique (moins aplatie que la normale) ;
β2 < 3 : distribution platykurtique (plus aplatie que la normale).
247 / 250
Mesures de forme Mesures d’aplatissement
Interprétation :
γ2 = 0 : distribution mésokurtique (courbe normale) ;
γ2 > 0 : distribution leptokurtique (moins aplatie que la normale) ;
γ2 < 0 : distribution platykurtique (plus aplatie que la normale).
248 / 250
Mesures de forme Mesures d’aplatissement
4 4
1 X xi − x 221.68
β2 = ni = = 2.2168
100 i=1 σx 100
4 4
1 X xi − x
γ2 = ni − 3 = 2.2168 − 3 = −0.7832
100 i=1 σx
249 / 250
Mesures de forme Mesures d’aplatissement
5 4
1 X ci − y 134.96
β2 = ni = = 2.4538
55 i=1 σy 55
5 4
1 X ci − y
γ2 = ni − 3 = 2.4538 − 3 = −0.5462
55 i=1 σy
La distribution des tailles d’individus est platykurtique. Cela signifie que les
valeurs extrêmes sont moins fréquentes relativement à une distribution normale.
250 / 250