Académique Documents
Professionnel Documents
Culture Documents
Plan du cours
FEMMES HOMMES
POIDS
Mesure de dispersion
FRÉQUENCE
BANQUES
MINES
PRIX DES
ACTIONS
Mesure de forme
FRÉQUENCE
SALAIRES
PRETS
x1 x 2 x 3 .... x n x i
x i 1
n n
Mesure de tendance centrale
Moyenne arithmétique – données individuelles
n
x1 x 2 x 3 .... x n x i
x i 1
n n
Exemple: soit l’âge de 5 étudiant-e-s choisi-e-s
au hasard:
17 18 19 20 21
17 18 19 20 21
alors: x 19
5
Mesure de tendance centrale
Moyenne arithmétique – données individuelles
Excel
• Soit le nombre d’années d’expérience des
dirigeants de l’Exemple 1.1 a du fichier Excel,
CHAPITRE 1_ANALYSE DESCRIPTIVE.xls
• La moyenne est
18 14 13 16 12
x 14 ,13
85
• On peut utiliser la fonction Excel,
moyenne(D4:D88)
Mesure de tendance centrale
Moyenne arithmétique – données groupées
k k
f x f x
i i i i
x i 1
i 1
k
n
f
i 1
i
xi = modalité i
fi = fréquence absolue de la modalité i
Mesure de tendance centrale
Moyenne arithmétique – données groupées
AGE FRÉQUENCE
xi fi xifi xi2 xi2fi
17 1 17 289 289
18 4 72 324 1296
19 6 114 361 2166
20 3 60 400 1200
21 1 21 441 441
15 284 5392
x 284 18,9 3 19
15
Mesure de tendance centrale
Moyenne arithmétique – données groupées
15 13 15,29% n i 1
16 11 12,94%
17 6 7,06%
x
10 1 11 3 18 2 14 ,13
18 2 2,35% 85
Total 85 100,00%
x 10 0 ,0118 11 0 ,0353 18 0 ,0235 14 ,13
k k
f m f m
i i i i
x i1
i1
k
n
f
i 1
i
x 20632, 5 275,1
75
Mesure de tendance centrale
Moyenne arithmétique : remarques
M e 21
Mesure de tendance centrale
Médiane, Me - données individuelles
• Nombre impair d’observations:
17 18 19 21 22 23 24
M e 21
Me 21
• Nombre pair d’observations:
17 17 18 19 21 22 23 24 24 26
21 22
Me 21,5
2
Mesure de tendance centrale
Médiane, Me - données groupées
n F
M B 2 a
e I
fMe
BI : borne inférieure de la classe médiane (*)
F : somme des fréquences absolues des classes précédant la
classe médiane
fMe : fréquence de la classe médiane
a : amplitude de la classe médiane
n : nombre d’observations de la série
me 265
75 28
2
15 273,4
17
Mesure de tendance centrale
Médiane, Me : remarques
Mo 272,5
Mesure de tendance centrale
Mode, Mo : remarques
• Le mode est une mesure appropriée pour les
variables qualitatives
• Il dépend uniquement des fréquences
• Il ne tient pas compte des valeurs de toutes
les observations de la série de données
• Une série peut avoir un seul mode
(distribution unimodale), plusieurs modes
(distribution bimodale, multimodale) ou
aucun mode.
Caractéristiques de tendance centrale
et de dispersion
Plan de la présentation
60 62 64 66 67
68 69 70 70 71
71 72 75 77 79
alors,
n 1
Écart-type: s = s2
Calcul simplifié
Mesures de dispersion
Variance, s2 et écart-type, s - données individuelles
ÉTUDIANT NOTES /100 ÉCARTS CARRÉ DES ÉCARTS
i xi xi x x i x 2
1 61 -6,67 44,44
2 58 -9,67 93,44
x 812 67,67
3 82 14,33 205,44
12
4 75 7,33 53,78
5 70 2,33 5,44
6 60 -7,67 58,78
7 72 4,33 18,78
8 68 0,33 0,11
9 66 -1,67 2,78
10 63 -4,67 21,78
11 65 -2,67 7,11
12 72 4,33 18,78
xi 812 0 530,67
Mesures de dispersion
Variance, s2 et écart-type, s - données individuelles
ÉTUDIANT NOTES /100 ÉCARTS CARRÉ DES ÉCARTS
i xi xi x x i x 2
1 61 -6.67 44.44
2 58 -9.67 93.44
x 812 67,67
3 82 14.33 205.44
12
4 75 7.33 53.78
5 70 2.33 5.44
6 60 -7.67 58.78
7 72 4.33 18.78 s2 530,67 48,24
8 68 0.33 0.11 121
9 66 -1.67 2.78
10 63 -4.67 21.78
11 65 -2.67 7.11 s 48,24 6,95
12 72 4.33 18.78
xi 812 0 530,67
Mesures de dispersion
Variance, s2 et écart-type, s - données individuelles
ÉTUDIAN NOTES AU
T NOTES / 100 CARRÉ
i xi xi2
2
1 61 3721 812
2 58 3364 55476
2
s 12 48,24
3 82 6724 12 1
4 75 5625
5 70 4900
6 60 3600
7 72 5184
8 68 4624
9 66 4356
10 63 3969 s 48,24 6,95
11 65 4225
12 72 5184
TOTAL 812 55476
Mesures de dispersion
Variance, s2 et écart-type, s - données
individuelles _ Excel
• Soit le nombre d’années d’expérience des dirigeants
de l’Exemple 1.1 b du fichier Excel,
CHAPITRE 1_ANALYSE DESCRIPTIVE.xls
• La variance est
2 2 2
2 ( 18 14 ,13 ) ( 14 14 ,13 ) ( 12 14 ,13 ) 241,58
s
85 1 84
s 2 2 ,88
et l’écart-type s 2 ,88 1,70
• On peut utiliser les fonctions Excel,
VAR(D4:D88) et ECARTYPE(D4:D88)
Mesures de dispersion
Variance, s2 et écart-type, s - données groupées
k k x f 2
x x
2 i i
i fi xi2 f i
2 i 1 i 1 n
Variance: s k
k
f 1
i 1
i f 1
i 1
i
Calcul simplifié
Écart-type: s s2
Mesures de dispersion
Variance, s2 et écart-type, s – données groupées
AGE FRÉQUENCE
2 2
xi fi xi fi xi xi fi
17 1 17 289 289
18 4 72 324 1296
19 6 114 361 2166
20 3 60 400 1200
21 1 21 441 441
15 284 5392
2
fx2
i i i i
n
s i 1
s i 1
n 1 n 1
s s2
Mesures de dispersion
Variance, s2 et écart-type, s - données groupées
en classes
Points
Ventes journalières milieux Fréquence
2
(en dollars) xi fi fi xi fi xi
220 234.99 227.5 3 682.5 155268.75
235 249.99 242.5 9 2182.5 529256.25
250 264.99 257.5 16 4120 1060900
265 279.99 272.5 17 4632.5 1262356.25
280 294.99 287.5 13 3737.5 1074531.25
295 309.99 302.5 10 3025 915062.5
310 324.99 317.5 5 1587.5 504031.25
325 339.99 332.5 2 665 221112.5
Total 75 20632.5 5722518.75
5722518,75 75275,1
2
x 20632,5 275,1 s2 628,62
75 751
s 628,62 25,01
Mesures de dispersion
L’écart-type: remarques
• Mesure de dispersion la plus utilisée
• Il tient compte de chacune des valeurs des
observations de la série
• Il est affecté par les valeurs aberrantes
• Il ne peut être calculé pour des données
groupées en classes ouvertes
• Il est unique
La règle de Tchebycheff
• Cette règle est un outil qui nous permet d’interpréter
la valeur de l’écart-type.
• Pour tout ensemble de données et un nombre k, k ≥1,
la proportion de données comprise dans un intervalle
x ks, x ks est supérieure ou égale à (1 –
(1/k2)).
Autrement dit: 1
P( x ks X x ks) 1 2
k
La règle de Tchebycheff
• La règle de Tchebycheff (suite) : P( x ks X x ks) 1 12
k
Puisque la valeur de k ne dépend pas de la valeur des
observations de la série, nous pouvons faire la
généralisation suivante :
• Si k = 1, la proportion est > 0
• Si k = 1,5, la proportion est > 0,55
• Si k = 2, la proportion est > 0,75
• Si k = 2,5, la proportion est > 0,84
• Si k = 3, la proportion est > 0,89
• etc.
La règle de Tchebycheff: exemple
1
P( 275,1 1,5 25,01 X 275,1 1,5 25,01 ) P( 235 X 310 ) 1 2
0 ,55
1,5
Mesures de dispersion
Coefficient de variation, CV
• Permet de comparer les dispersions de séries
d’observations qui ne sont pas nécessairement
dans les mêmes unités de mesure
• Donne une idée du degré d’homogénéité d’une
distribution. Une série est dite homogène si son
CV est plus petit que 15%
s
• Formule: CV % 100
x
• Est indépendant de l’unité de mesure de la
variable observée
• Est une mesure de dispersion relative
Mesures de dispersion
Coefficient de variation, CV - valeurs groupées en classes
1
i xi
61
par ordre croissant
58
•Calculons D2
2
3
58
82
60
61
• 12*20% = 2,4
4 75 63 •2,4 n’est pas un nombre
5 70 65
6 60 66 entier donc D2
7 72 68
8 68 70 correspond à la donnée
9 66 72
10 63 72 de rang 3
11
12
65
72
75
82 • D2 = 61
Mesures de position
Quantiles - données groupées
Cp BI
pn Fa
fCp
Cp: quantile p%
BI : borne inférieure de la classe contenant le quantile p%
p: pourcentage désiré sous forme décimale, par exemple 0.50
n: nombre total d’observations dans la série
F : somme des fréquences absolues de toutes les classes précédant la
classe contenant le quantile. Si le quantile désiré se situe dans la première
classe, F = 0
fC : fréquence de la classe contenant le quantile
p
1,0000
0,9000
0,8000
0,7000
0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000
220 235 250 265 280 295 310 325 340
VENTES JOURNALIERES
Mesure de position
Quantiles - données groupées en classes
FRÉQUENCE
CUMULÉE
1,0000
0,9000
0,8000
0,7000
0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000
220 235 250 265 280 295 310 325 340
VENTES JOURNALIERES
C80 298
Intervalle interquartile
Valeurs
aberrantes
1,5(Q3 – Q1)
(Q3 – Q1) 1,5(Q3 – Q1)
Échelle
Diagramme en boîte (Box plot)
Diagramme en boîte
des ventes journalières
x i x n 1
4
4
s4
• Si 4 > 3 , la courbe est aiguë
• Si 4 = 3 , la courbe est normale (distribution normale)
• Si 4 < 3 , la courbe est aplatie
Interprétation du coefficient
d’aplatissement
• Pour simplifier la compréhension de ce
coefficient, plusieurs logiciels, incluant
Excel, soustraient le nombre 3 de la valeur
de 4
• En utilisant Excel, le coefficient
d’aplatissement, 4, pour une distribution
de forme normale est donc égal à 0
Forme de la distribution
et le coefficient d’aplatissement
4 < 0 4 = 0 4 > 0
Mesure de forme
Coefficient d'asymétrie, Sk
• Dans une distribution symétrique, les valeurs de la variable statistique
sont également dispersées de part et d’autre d’une valeur centrale
x Me Mo
SK 0
Mesure de forme:
Coefficient d'asymétrie (Sk)
• Cette mesure indique le degré de symétrie.
• Le coefficient de Pearson Sk, est donné par :
3 xMe xMo
SK
s s
• Sk est situé entre -1 et +1
Interprétation du coefficient
d’asymétrie
• Une distribution est symétrique si les
observations de la série sont également
dispersées de part et d’autre d’une valeur
centrale
moyenne = médiane = mode
• Le coefficient d’asymétrie, Sk , tel que calculé
par Excel, a une valeur comprise entre -∞ et +∞
si Sk = 0, la série est symétrique
si Sk < 0, la série a une asymétrie négative
si Sk > 0, la série a une asymétrie positive
Forme de la distribution
et le coefficient d’asymétrie
Distribution Distribution Distribution
asymétrique symétrique asymétrique
positive négative
Mo Me x x Me Mo x Me Mo
Sk > 0 Sk = 0 Sk < 0
Mesures statistiques appropriées
Moyenne 275,0267474 x
Erreur-type 2,931280088
Médiane 274,4444071 M e
Mode M o #N/A
Écart-type 25,38563022 s
2
Variance de l'échantillon s 644,4302215
Kurstosis (Coefficient d'applatissement) -0,500776154 4
Coefficient d'assymétrie S k 0,12236697
Plage 114,10566 E
Minimum xmin 220,083113
Maximum 334,188773 xmax
Somme
Nombre d'échantillons
xi 20627,00605
75 n