Adm2703 2.tendance Centrale Et DispersionH18

Statistiques en gestion
Plan du cours
1. Collecte de données et statistique descriptive

2. Caractéristiques de tendance centrale et
de dispersion
3. Calcul des probabilités
4. Modèles probabilistes discrets
5. Modèles probabilistes continus
6. Introduction à l’échantillonnage
Caractéristiques de tendance centrale
et de dispersion
Plan de la présentation
• Définition des mesures descriptives

• Mesures de tendance centrale
• Mesures de dispersion
• Mesures de position
• Mesures de forme
et de dispersion

Définition des mesures
descriptives
- indiquent l’ordre de grandeur de la série
- indiquent la position autour de laquelle se
distribuent les données d’une série
- Déterminent le niveau de fluctuation des données
autour d’une valeur centrale
– Permettent de situer une donnée par rapport au x
autres
- fournissent une idée de la symétrie et de
l’aplatissement d’une série
Mesure de tendance centrale
FRÉQUENCE
FEMMES HOMMES
POIDS
Mesure de dispersion
FRÉQUENCE
BANQUES
MINES
PRIX DES
ACTIONS
Mesure de forme
FRÉQUENCE
SALAIRES
PRETS
MONTANT DES SALAIRES

ET DES PRETS
HYPOTHÉCAIRES
Mesures descriptives: notation
Mesures de tendance centrale
- Moyenne arithmétique ( x ) moyenne de grandeur
- Médiane (Me) moyenne de position
- Mode (Mo) moyenne de fréquences
Mesures de dispersion
- Étendue (E)
- Variance (s2), et Écart-type (s)
- Coefficient de variation (CV)
Mesures de position
– Quantiles (C)
Mesures de forme
- Coefficient d'aplatissement ( ) (Kurtosis)
- Coefficient d'asymétrie (SK) (Skewness)
Moyenne arithmétique - données individuelles
n
x1  x 2  x 3  ....  x n x i
x  i 1
n n
Moyenne arithmétique – données individuelles
n
x1  x 2  x 3  ....  x n x i
x  i 1
n n
Exemple: soit l’âge de 5 étudiant-e-s choisi-e-s
au hasard:
17 18 19 20 21
17  18  19  20  21
alors: x  19
5
Moyenne arithmétique – données individuelles
Excel
• Soit le nombre d’années d’expérience des
dirigeants de l’Exemple 1.1 a du fichier Excel,
CHAPITRE 1_ANALYSE DESCRIPTIVE.xls
• La moyenne est
18  14  13    16  12
x  14 ,13
85
• On peut utiliser la fonction Excel,
moyenne(D4:D88)
Moyenne arithmétique – données groupées
k k
f x f x
i i i i
x i 1
 i 1
k
n
f
i 1
i
xi = modalité i
fi = fréquence absolue de la modalité i
AGE FRÉQUENCE
xi fi xifi xi2 xi2fi
17 1 17 289 289
18 4 72 324 1296
19 6 114 361 2166
20 3 60 400 1200
21 1 21 441 441
15 284 5392
x  284  18,9 3  19
15
Expérience Fréquences Fréquences • La moyenne peut se calculer à l’aide

(années) absolues relatives des fréquences absolues ou des
xi fi fr i fréquences relatives
10 1 1,18%
11 3 3,53%
k
12 10 11,76%
13 17 20,00% fx i i
k
x   fri xi
14 22 25,88% x i 1
15 13 15,29% n i 1
16 11 12,94%
17 6 7,06%
x
10  1  11  3    18  2   14 ,13
18 2 2,35% 85
Total 85 100,00%
x  10  0 ,0118   11  0 ,0353    18  0 ,0235   14 ,13
Source: Exemple 1.1 b du fichier Excel, CHAPITRE 1_ANALYSE DESCRIPTIVE.xls

Excel
Expérience Fréquences Fréquences
(années) absolues relatives
xi fi fr i fixi fr i x i
10 1 1,18% 10 0,12
11 3 3,53% 33 0,39
12 10 11,76% 120 1,41
13 17 20,00% 221 2,60
14 22 25,88% 308 3,62
15 13 15,29% 195 2,29
16 11 12,94% 176 2,07
17 6 7,06% 102 1,20
18 2 2,35% 36 0,42
Total 85 100,00% 1201
moyenne = 14,13 14,13
Source: Exemple 1.1 b du fichier Excel, CHAPITRE 1_ANALYSE

DESCRIPTIVE.xls
Moyenne arithmétique - données groupées en classes
k k
f m f m
i i i i
x i1
 i1
k
n
f
i 1
i
mi = point milieu de la classe i

fi = fréquence absolue de la classe i
Moyenne arithmétique - données groupées en classes
Points
Ventes journalières milieux Fréquence
2
(en dollars) mi fi fi mi fi mi
220 234,99 227,5 3 682,5 155268,75
235 249,99 242,5 9 2182,5 529256,25
250 264,99 257,5 16 4120 1060900
265 279,99 272,5 17 4632,5 1262356,25
280 294,99 287,5 13 3737,5 1074531,25
295 309,99 302,5 10 3025 915062,5
310 324,99 317,5 5 1587,5 504031,25
325 339,99 332,5 2 665 221112,5
Total 75 20632,5 5722518,75
x 20632, 5  275,1
75
Moyenne arithmétique : remarques
•La moyenne arithmétique tient compte de

toutes les valeurs de la série.
•Elle est notamment affectée par les valeurs
aberrantes de la série
•Elle se calcule pour les variables quantitatives
mais non pour les variables qualitatives ni pour
les données groupées avec classes ouvertes
•Elle est unique
Médiane, Me
• La médiane correspond à la valeur de la série
d’observations à laquelle 50% des données
sont inférieures ou égales et 50% des données
sont supérieures ou égales.
• Elle divise la série de données en deux parties
égales.
Médiane, Me - données individuelles
• Ranger les observations en ordre croissant ou
décroissant
décroissant
• Si on a un nombre impair d’observations,
alors: ieme
 n  1
m e  valeur de la   observation
 2 
décroissant
• Si on a un nombre impair d’observations,
alors: ieme
 n  1
m e  valeur de la   observation
 2 
• Si on a un nombre pair d’observations, alors:

ieme ieme
 n n 
  observation    1 observation
 2 2 
me 
2
• Nombre impair d’observations:
17 18 19 21 22 23 24
17 18 19 21 22 23 24
M e  21
17 18 19 21 22 23 24
M e  21
• Nombre pair d’observations:

17 17 18 19 21 22 23 24 24 26
Médiane, Me - valeurs individuelles
17 18 19 21 22 23 24
Me  21
• Nombre pair d’observations:
17 17 18 19 21 22 23 24 24 26
21  22
Me   21,5
2
Médiane, Me - données groupées
•n= 15, Nombre impair

AGE FRÉQUENCE FRÉQUENCE
de données
xi fi CUMULÉE Fi
17 1 1
•La médiane correspond
18 4 5 à la donnée de rang
19 6 11 (15+1)/2= 8
20 3 14
21 1 15 •La donnée de rang 8 est
15 19
•Me = 19 ans
Médiane, Me - données groupées en classes
n  F
M B  2 a
e I
fMe
BI : borne inférieure de la classe médiane (*)
F : somme des fréquences absolues des classes précédant la
classe médiane
fMe : fréquence de la classe médiane
a : amplitude de la classe médiane
n : nombre d’observations de la série
(*) : la classe médiane est celle contenant la n/2ième observation

(50% des observations)
Ventes journalières Fréquence Fréquence

(en dollars) Fréquence relative cumulée
220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
250 264,99 16 0,2133 28
265 279,99 17 0,2267 45
280 294,99 13 0,1733 58
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
La 37,5ième
220 234,99 3 0,0400 3
observation
235 249,99 9 0,1200 12 est dans cette
250 264,99 16 0,2133 28 classe
265 279,99 17 0,2267 45
280 294,99 13 0,1733 58
295 309,99 10 0,1333 68 Classe médiane
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
Ventes journalières Fréquence Fréquence La 37,5ième
observation
220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
est dans cette
250 264,99 16 0,2133 28 classe
265 279,99 17 0,2267 45
280 294,99 13 0,1733 58
295 309,99 10 0,1333 68 Classe médiane
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
BI = 265 fMe=17 F=28

a = 15
me  265  
 
 75  28 
 2 
15  273,4
 17 

 
Médiane, Me : remarques
•Contrairement à la moyenne, la médiane n’est pas

affectée par les valeurs aberrantes
•Elle peut être utilisée avec des données groupées
avec des classes ouvertes
•Elle permet de mieux évaluer la tendance centrale
lorsque la distribution est très asymétrique
•Elle est unique
Mode, Mo
Mode: valeur de la variable statistique dont la
fréquence est la plus élevée
Exemple: valeurs individuelles
soit la série: 3, 1, 2, 3, 4, 4, 3, 2, 5, 3
1 |
2 ||
3 ||| |
4 ||
5 |
Mode, Mo
Mode: valeur de la variable statistique dont la
fréquence est la plus élevée
Exemple: valeurs individuelles
soit la série: 3, 1, 2, 3, 4, 4, 3, 2, 5, 3
1 |
2 ||
3 ||| | MODE
4 ||
5 |
Mode, Mo - valeurs groupées
Expérience Fréquences • Le mode correspond à la

(années) absolues
xi fi
modalité dont la fréquence
est la plus élevée
10 1
11 3 • Mo = 14 ans
12 10
13 17
14 22
15 13
16 11
17 6
18 2
Total 85
Mode, Mo - valeurs groupées en classes
• Classe modale: classe dont la fréquence est la
plus élevée
• Par convention, la valeur correspondant au
centre de cette classe
220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
Classe 250 264,99 16 0,2133 28
265 279,99 17 0,2267 45
Modale 280 294,99 13 0,1733 58
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
Classe 250 264,99 16 0,2133 28
265 279,99 17 0,2267 45
Modale 280 294,99 13 0,1733 58
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
Mo  272,5
Mode, Mo : remarques
• Le mode est une mesure appropriée pour les
variables qualitatives
• Il dépend uniquement des fréquences
• Il ne tient pas compte des valeurs de toutes
les observations de la série de données
• Une série peut avoir un seul mode
(distribution unimodale), plusieurs modes
(distribution bimodale, multimodale) ou
aucun mode.
et de dispersion

Étendue, E
• Soit les observations suivantes de l’âge des personnes
d’un échantillon tiré d’une association
60 62 64 66 67
68 69 70 70 71
71 72 75 77 79
alors,
E  xmax xmin  79  60  19 ans

Étendue, E: remarques
• L’étendue est facile à calculer et à interpréter
mais elle ne tient compte que des deux
observations extrêmes de la série de données
• Elle est unique
La variance et l’écart-type
• Ces deux mesures indiquent comment les
observations se répartissent autour de leur
moyenne arithmétique
• Une valeur élevée indique une forte dispersion
(ou variation) alors qu’une valeur peu élevée
indique une faible dispersion
• Il est plus facile d’interpréter la valeur de
l’écart-type que celle de la variance car il se
présente dans la même unité de mesure que la
moyenne arithmétique
Variance, s2 et écart-type, s - données
individuelles
Pour n observations x1, …, 2
xn , on a:  n

n n
  x i 
 i 1 
 x  x 
2 2
i x i 
n
Variance: s2  i 1
 i 1
n 1 n 1
 2
x i  nx
i 1
2

n 1
Écart-type: s = s2
Calcul simplifié
Variance, s2 et écart-type, s - données individuelles
ÉTUDIANT NOTES /100 ÉCARTS CARRÉ DES ÉCARTS
i xi xi  x x i  x  2
1 61 -6,67 44,44
2 58 -9,67 93,44
x  812  67,67
3 82 14,33 205,44
12
4 75 7,33 53,78
5 70 2,33 5,44
6 60 -7,67 58,78
7 72 4,33 18,78
8 68 0,33 0,11
9 66 -1,67 2,78
10 63 -4,67 21,78
11 65 -2,67 7,11
12 72 4,33 18,78
xi 812  0   530,67
ÉTUDIANT NOTES /100 ÉCARTS CARRÉ DES ÉCARTS
i xi xi  x x i  x 2
1 61 -6.67 44.44
2 58 -9.67 93.44
x  812  67,67
3 82 14.33 205.44
12
4 75 7.33 53.78
5 70 2.33 5.44
6 60 -7.67 58.78
7 72 4.33 18.78 s2  530,67  48,24
8 68 0.33 0.11 121
9 66 -1.67 2.78
10 63 -4.67 21.78
11 65 -2.67 7.11 s  48,24  6,95
12 72 4.33 18.78
xi 812  0   530,67
ÉTUDIAN NOTES AU
T NOTES / 100 CARRÉ
i xi xi2
2
1 61 3721 812 
2 58 3364 55476 
2
s  12  48,24
3 82 6724 12 1
4 75 5625
5 70 4900
6 60 3600
7 72 5184
8 68 4624
9 66 4356
10 63 3969 s  48,24  6,95
11 65 4225
12 72 5184
TOTAL 812 55476
individuelles _ Excel
• Soit le nombre d’années d’expérience des dirigeants
de l’Exemple 1.1 b du fichier Excel,
CHAPITRE 1_ANALYSE DESCRIPTIVE.xls
• La variance est
2 2 2
2 ( 18  14 ,13 )  ( 14  14 ,13 )    ( 12  14 ,13 ) 241,58
s  
85  1 84
s 2  2 ,88
et l’écart-type s  2 ,88  1,70
• On peut utiliser les fonctions Excel,
VAR(D4:D88) et ECARTYPE(D4:D88)
Variance, s2 et écart-type, s - données groupées
k k  x f  2
 x x  
2 i i
i fi xi2 f i 
2 i 1 i 1 n
Variance: s  k
 k
 f 1
i 1
i  f 1
i 1
i
Calcul simplifié
Écart-type: s  s2
Variance, s2 et écart-type, s – données groupées
AGE FRÉQUENCE
2 2
xi fi xi fi xi xi fi
17 1 17 289 289
18 4 72 324 1296
19 6 114 361 2166
20 3 60 400 1200
21 1 21 441 441
15 284 5392
5392 ( 284  /15)

2
2
s   1,07
15 1
x  284  18,93  19
15
s  1,07  1,03
groupées en classes
• Les calculs se font avec les points milieux des
classes (les classes doivent être fermées)
• Les formules sont les identiques à celles pour
les données groupées
k k
2
 fx
2
 f i ( xi  x ) 2
2
 fx2
i i  i i
n
s  i 1
s  i 1
n 1 n 1
s  s2
Variance, s2 et écart-type, s - données groupées
en classes
Points
Ventes journalières milieux Fréquence
2
(en dollars) xi fi fi xi fi xi
220 234.99 227.5 3 682.5 155268.75
235 249.99 242.5 9 2182.5 529256.25
250 264.99 257.5 16 4120 1060900
265 279.99 272.5 17 4632.5 1262356.25
280 294.99 287.5 13 3737.5 1074531.25
295 309.99 302.5 10 3025 915062.5
310 324.99 317.5 5 1587.5 504031.25
325 339.99 332.5 2 665 221112.5
Total 75 20632.5 5722518.75
5722518,75  75275,1
2
x  20632,5  275,1 s2   628,62
75 751
s  628,62 25,01
L’écart-type: remarques
• Mesure de dispersion la plus utilisée
• Il tient compte de chacune des valeurs des
observations de la série
• Il est affecté par les valeurs aberrantes
• Il ne peut être calculé pour des données
groupées en classes ouvertes
• Il est unique
La règle de Tchebycheff
• Cette règle est un outil qui nous permet d’interpréter
la valeur de l’écart-type.
• Pour tout ensemble de données et un nombre k, k ≥1,
la proportion de données comprise dans un intervalle
x  ks, x  ks est supérieure ou égale à (1 –
(1/k2)).
Autrement dit: 1
P( x  ks  X  x  ks)  1  2
k
La règle de Tchebycheff
• La règle de Tchebycheff (suite) : P( x  ks  X  x  ks)  1  12
k
Puisque la valeur de k ne dépend pas de la valeur des
observations de la série, nous pouvons faire la
généralisation suivante :
• Si k = 1, la proportion est > 0
• Si k = 1,5, la proportion est > 0,55
• Si k = 2, la proportion est > 0,75
• Si k = 2,5, la proportion est > 0,84
• Si k = 3, la proportion est > 0,89
• etc.
La règle de Tchebycheff: exemple
Ventes journalières Fréquences Fréquences • Si k = 1,5, on devrait avoir au

(en dollars) relatives
moins 55% des données qui
220 234,99 3 0,0400 tombent dans l’intervalle
235 249,99 9 0,1200 (235$ , 310$)
250 264,99 16 0,2133 • Selon la distribution de
265 279,99 17 0,2267 fréquences, on obtient:
280 294,99 13 0,1733 0,1200+0,2133+0,2267+0,1733
295 309,99 10 0,1333
+0,1333 = 0,8666
310 324,99 5 0,0667
325 339,99 2 0,0267
Total 75 1,0000
1
P( 275,1  1,5  25,01  X  275,1  1,5  25,01 )  P( 235  X  310 )  1  2
 0 ,55
1,5
Coefficient de variation, CV
• Permet de comparer les dispersions de séries
d’observations qui ne sont pas nécessairement
dans les mêmes unités de mesure
• Donne une idée du degré d’homogénéité d’une
distribution. Une série est dite homogène si son
CV est plus petit que 15%
s
• Formule: CV %    100
x
• Est indépendant de l’unité de mesure de la
variable observée
• Est une mesure de dispersion relative
Coefficient de variation, CV - valeurs groupées en classes
• De l’exemple précédent, on a trouvé que:

x 20632,5  275,1
75
s  628,62  25,01
alors, CV%  s  100  25,01  9,09%

x 275,1
• Puisque CV < 15%, on peut dire que la
distribution est homogène
Mesures de position
Quantiles, Cp
Ces mesures permettent de situer la position d’une

observation à l’intérieur de la série d’observations. Les
mesures de position sont appelées des quantiles.
Les quantiles les plus fréquemment utilisés sont :
 Les quartiles
 Les déciles
 Les centiles
Mesures de position
Quantiles, Cp
Il s’agit de partager les observations triées de la série en k groupes de

taille égale et d’indiquer à quel groupe appartient une
observation.
Si l’on divise la série d’observations

 en 4 groupes, on obtient des quartiles (Q1, Q2, Q3),
 en 10 groupes, on obtient des déciles (D1, D2, ... D9),
 en 100 groupes, on obtient des centiles (C1, C2, … C99),
 etc.
Et si la série d’observations est divisée en 2 groupes ?

on obtient la médiane (et Me = Q2)
Mesures de position
Quantiles, Cp
L’interprétation des quantiles:
• 1er quartile : 25 % des observations ont une valeur

inférieure ou égale à Q1,
• 3e quartile : 75 % des observations ont une valeur
inférieure ou égale à Q3
• 2e décile : 2/10e (ou 1/5e ou 20 %) des observations ont
une valeur inférieure ou égale à D2
• 85e centile : 85/100e (ou 85 %) des observations ont une
valeur inférieure ou égale à C85
• etc.
Mesures de position
Quantiles - données individuelles
• Il faut trier les observations en ordre croissant, puis

identifier les quantiles en multipliant le nombre total
d’observations (n) par la fraction identifiant le quantile.
• Si le nombre obtenu n’est pas un nombre entier, le
quantile correspond à la donnée de rang le nombre
entier immédiatement supérieur.
• Si le nombre obtenu est un nombre entier, le quantile
correspond à la moyenne des données de rang ce
nombre et le nombre entier immédiatement supérieur
Mesures de position
ÉTUDIANT NOTES /100 Notes rangées
i
1
xi
61
par ordre croissant
58
•Calculons Q1
2
3
58
82
60
61
• 12*25% = 3
4 75 63 •3 est un nombre entier
5 70 65
6 60 66 donc Q1 correspond à la
7 72 68
8 68 70 moyenne des valeurs de
9 66 72
10 63 72 rang 3 et 4
11
12
65
72
75
82 • Q1 = (61+63)/2 = 62
Calcul des quartiles avec
Excel
• Avec Excel on utilise la
fonction QUARTILE(C3:C14;1)
 1 pour le quartile Q25%
• Les valeurs calculées par cette
fonction peuvent être un peu
différentes de celles obtenues à
l’aide de la procédure décrite
auparavant
Mesures de position
ÉTUDIANT NOTES /100 Notes rangées
1
i xi
61
par ordre croissant
58
•Calculons D2
2
3
58
82
60
61
• 12*20% = 2,4
4 75 63 •2,4 n’est pas un nombre
5 70 65
6 60 66 entier donc D2
7 72 68
8 68 70 correspond à la donnée
9 66 72
10 63 72 de rang 3
11
12
65
72
75
82 • D2 = 61
Mesures de position
Quantiles - données groupées
Expérience Fréquences Fréquences

(années) absolues cumulées • Q25% correspond à la 25% ×
xi fi Fi
10 1 1 85 = 21,25 soit la 22ième
11 3 4 observation
12 10 14 • Q25% = 13 ans
13 17 31
14 22 53 • Q75% correspond à la 75% ×
15 13 66 85 = 63,75 soit la 64ième
16 11 77
observation
17 6 83
18 2 85 • Q75% = 15 ans
Total 85
Mesure de position
Quantiles – données groupées en classes
Cp  BI 
pn  Fa
fCp
Cp: quantile p%
BI : borne inférieure de la classe contenant le quantile p%
p: pourcentage désiré sous forme décimale, par exemple 0.50
n: nombre total d’observations dans la série
F : somme des fréquences absolues de toutes les classes précédant la
classe contenant le quantile. Si le quantile désiré se situe dans la première
classe, F = 0
fC : fréquence de la classe contenant le quantile
p
a : amplitude de la classe contenant le quantile

Mesure de position
Quantiles, Cp
• Estimer la valeur du quantile 80% (C80)

220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
250 264,99 16 0,2133 28
265 279,99 17 0,2267 45
280 294,99 13 0,1733 58
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
Mesure de position
Quantiles, Cp
Ventes journalières Fréquence Fréquence Le quantile
(en dollars) Fréquence relative cumulée 80% ( 80
220 234,99 3 0,0400 3 75 =
235 249,99 9 0,1200 12 60ième
250 264,99 16 0,2133 28 observation)
265 279,99 17 0,2267 45 est dans cette
280 294,99 13 0,1733 58 classe
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
• p = 0,80; n = 75, alors le quantile désiré (C80) sera dans la

classe contenant la n . p = 60ième observation
Mesure de position
Quantiles, Cp
Ventes journalières Fréquence Fréquence Le quantile
(en dollars) Fréquence relative cumulée 80% (80
220 234,99 3 0,0400 3 75 =
235 249,99 9 0,1200 12 60ième
250 264,99 16 0,2133 28 observation)
265 279,99 17 0,2267 45 est dans cette
280 294,99 13 0,1733 58 classe
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
BI = 295 fC =10 F=58
p
a = 15
Cp  BI 
p  n  F a = 295 + 0,80  75 58 15  298
fCp 10
Mesure de position
Quantiles - données groupées en classes
• C80 = 298$
• Le quantile C80 ainsi obtenu représente la
valeur approximative à laquelle 80% des
observations de la série sont inférieures
• 80% des observations des ventes/jour sont
inférieures à 298$
Mesure de position
• C80 = 298$
• Le quantile C80 obtenu représente la valeur
approximative à laquelle, au plus 80% des
observations de la série sont inférieures et, au
plus 20% des observations sont supérieures
• 80% des observations des ventes/jours sont
inférieures à 298$
• On pourrait également obtenir le même résultat
à partir de la courbe de fréquences cumulées
Mesure de position
Fréquence Fréquence relative
Ventes journalières Fréquence relative cumulée cumulée
(en dollars) Fréquence relative croissante décroissante
220 234,99 3 0,0400 0,0400 1,0000
235 249,99 9 0,1200 0,1600 0,9600
250 264,99 16 0,2133 0,3733 0,8400
265 279,99 17 0,2267 0,6000 0,6267
280 294,99 13 0,1733 0,7733 0,4000
295 309,99 10 0,1333 0,9067 0,2267
310 324,99 5 0,0667 0,9733 0,0933
325 339,99 2 0,0267 1,0000 0,0267
Total 75 1,0000
Mesure de position
FRÉQUENCE
CUMULÉE
1,0000
0,9000
0,8000
0,7000
0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000
220 235 250 265 280 295 310 325 340
VENTES JOURNALIERES
Mesure de position
FRÉQUENCE
CUMULÉE
1,0000
0,9000
0,8000
0,7000
0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000
220 235 250 265 280 295 310 325 340
VENTES JOURNALIERES
C80  298
Intervalle interquartile
• L’intervalle interquartile IQ est une mesure de

dispersion associée aux quartiles
• Il mesure l’étendue entre le 1er quartile et le 3ème
quartile:
IQ = Q3 – Q1
• Il contient 50% des observations situées au milieu
de la série
Données aberrantes
• Une donnée est dite aberrante si sa valeur est:

plus petite que Q1 – 1,5(Q3 – Q1)
Ou
plus grande que Q3 + 1,5(Q3 – Q1)
Diagramme en boîte (Box plot)
Plus petite valeur Plus grande valeur
de la série qui de la série qui n’est
n’est pas une Q1 Q2 Q3 pas une valeur
valeur aberrante aberrante
Valeurs
aberrantes
1,5(Q3 – Q1)
(Q3 – Q1) 1,5(Q3 – Q1)
Échelle
Diagramme en boîte (Box plot)
Diagramme en boîte
des ventes journalières
220,08 Q1 = 256,33 Q2 = 273,40 Q3 = 292,98 334,19

et de dispersion

Mesure de forme
Coefficient d'aplatissement, 4
• Une distribution est plus ou moins aplatie
selon que les fréquences des valeurs voisines
des valeurs centrales diffèrent peu ou
beaucoup les unes par rapport aux autres
 x i  x n  1
4
4 
s4
• Si 4 > 3 , la courbe est aiguë
• Si 4 = 3 , la courbe est normale (distribution normale)
• Si 4 < 3 , la courbe est aplatie
Interprétation du coefficient
d’aplatissement
• Pour simplifier la compréhension de ce
coefficient, plusieurs logiciels, incluant
Excel, soustraient le nombre 3 de la valeur
de 4
• En utilisant Excel, le coefficient
d’aplatissement, 4, pour une distribution
de forme normale est donc égal à 0
Forme de la distribution
et le coefficient d’aplatissement
Distribution Distribution Distribution

aplatie normale aigüe
4 < 0 4 = 0 4 > 0
Mesure de forme
Coefficient d'asymétrie, Sk
• Dans une distribution symétrique, les valeurs de la variable statistique
sont également dispersées de part et d’autre d’une valeur centrale
x  Me  Mo
SK  0
Mesure de forme:
Coefficient d'asymétrie (Sk)
• Cette mesure indique le degré de symétrie.
• Le coefficient de Pearson Sk, est donné par :
3 xMe  xMo
SK  
s s
• Sk est situé entre -1 et +1
Interprétation du coefficient
d’asymétrie
• Une distribution est symétrique si les
observations de la série sont également
dispersées de part et d’autre d’une valeur
centrale
moyenne = médiane = mode
• Le coefficient d’asymétrie, Sk , tel que calculé
par Excel, a une valeur comprise entre -∞ et +∞
 si Sk = 0, la série est symétrique
 si Sk < 0, la série a une asymétrie négative
 si Sk > 0, la série a une asymétrie positive
Forme de la distribution
et le coefficient d’asymétrie
Distribution Distribution Distribution
asymétrique symétrique asymétrique
positive négative
Mo  Me  x x  Me  Mo x  Me  Mo
Sk > 0 Sk = 0 Sk < 0
Mesures statistiques appropriées
selon les échelles de mesure

• Échelle nominale (sexe de l’employé)
 le mode
• Échelle ordinale (ordre de préférence pour des
vins)
 le mode et la médiane
• Échelle d’intervalle / de rapport (ventes)
 le mode, la médiane et la moyenne
arithmétique
 l’étendue, l’écart-type et les quantiles
Statistiques descriptives -
Excel
• On peut utiliser la fonction Statistiques
descriptives de l’utilitaire d’analyse d’Excel
pour obtenir les mesures descriptives
• Les données individuelles doivent être
disponibles
Statistiques descriptives
l’utilitaire d’analyse d’Excel
Ventes journalières
Moyenne 275,0267474 x
Erreur-type 2,931280088
Médiane 274,4444071 M e
Mode M o #N/A
Écart-type 25,38563022 s
2
Variance de l'échantillon s 644,4302215
Kurstosis (Coefficient d'applatissement) -0,500776154  4
Coefficient d'assymétrie S k 0,12236697
Plage 114,10566 E
Minimum xmin 220,083113
Maximum 334,188773 xmax
Somme
Nombre d'échantillons
 xi 20627,00605
75 n
Ventes journalières, voir le fichier Excel Exemples_notes_chap2.XLS

Adm2703 2.tendance Centrale Et DispersionH18

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Adm2703 2.tendance Centrale Et DispersionH18

Transféré par

Droits d'auteur :

Formats disponibles

Statistiques en gestion

1. Collecte de données et statistique descriptive

• Définition des mesures descriptives

• Définition des mesures descriptives

MONTANT DES SALAIRES

Expérience Fréquences Fréquences • La moyenne peut se calculer à l’aide

Source: Exemple 1.1 b du fichier Excel, CHAPITRE 1_ANALYSE DESCRIPTIVE.xls

Source: Exemple 1.1 b du fichier Excel, CHAPITRE 1_ANALYSE

mi = point milieu de la classe i

•La moyenne arithmétique tient compte de

• Si on a un nombre pair d’observations, alors:

• Nombre pair d’observations:

•n= 15, Nombre impair

(*) : la classe médiane est celle contenant la n/2ième observation

Ventes journalières Fréquence Fréquence

BI = 265 fMe=17 F=28

•Contrairement à la moyenne, la médiane n’est pas

Expérience Fréquences • Le mode correspond à la

• Définition des mesures descriptives

E  xmax xmin  79  60  19 ans

5392 ( 284  /15)

Ventes journalières Fréquences Fréquences • Si k = 1,5, on devrait avoir au

• De l’exemple précédent, on a trouvé que:

alors, CV%  s  100  25,01  9,09%

Ces mesures permettent de situer la position d’une

Il s’agit de partager les observations triées de la série en k groupes de

Si l’on divise la série d’observations

Et si la série d’observations est divisée en 2 groupes ?

L’interprétation des quantiles:

• 1er quartile : 25 % des observations ont une valeur

• Il faut trier les observations en ordre croissant, puis

Expérience Fréquences Fréquences

a : amplitude de la classe contenant le quantile

• Estimer la valeur du quantile 80% (C80)

• p = 0,80; n = 75, alors le quantile désiré (C80) sera dans la

• L’intervalle interquartile IQ est une mesure de

• Une donnée est dite aberrante si sa valeur est:

220,08 Q1 = 256,33 Q2 = 273,40 Q3 = 292,98 334,19

• Définition des mesures descriptives

Distribution Distribution Distribution

selon les échelles de mesure

Ventes journalières, voir le fichier Excel Exemples_notes_chap2.XLS

Vous aimerez peut-être aussi