Vous êtes sur la page 1sur 90

Statistiques en gestion

Plan du cours

1. Collecte de données et statistique descriptive


2. Caractéristiques de tendance centrale et
de dispersion
3. Calcul des probabilités
4. Modèles probabilistes discrets
5. Modèles probabilistes continus
6. Introduction à l’échantillonnage
Caractéristiques de tendance centrale
et de dispersion
Plan de la présentation

• Définition des mesures descriptives


• Mesures de tendance centrale
• Mesures de dispersion
• Mesures de position
• Mesures de forme
Caractéristiques de tendance centrale
et de dispersion
Plan de la présentation

• Définition des mesures descriptives


• Mesures de tendance centrale
• Mesures de dispersion
• Mesures de position
• Mesures de forme
Définition des mesures
descriptives
• Mesures de tendance centrale
- indiquent l’ordre de grandeur de la série
- indiquent la position autour de laquelle se
distribuent les données d’une série
• Mesures de dispersion
- Déterminent le niveau de fluctuation des données
autour d’une valeur centrale
• Mesures de position
– Permettent de situer une donnée par rapport au x
autres
• Mesures de forme
- fournissent une idée de la symétrie et de
l’aplatissement d’une série
Mesure de tendance centrale
FRÉQUENCE

FEMMES HOMMES

POIDS
Mesure de dispersion
FRÉQUENCE

BANQUES

MINES

PRIX DES
ACTIONS
Mesure de forme
FRÉQUENCE

SALAIRES

PRETS

MONTANT DES SALAIRES


ET DES PRETS
HYPOTHÉCAIRES
Mesures descriptives: notation
Mesures de tendance centrale
- Moyenne arithmétique ( x ) moyenne de grandeur
- Médiane (Me) moyenne de position
- Mode (Mo) moyenne de fréquences
Mesures de dispersion
- Étendue (E)
- Variance (s2), et Écart-type (s)
- Coefficient de variation (CV)
Mesures de position
– Quantiles (C)
Mesures de forme
- Coefficient d'aplatissement ( ) (Kurtosis)
- Coefficient d'asymétrie (SK) (Skewness)
Mesure de tendance centrale
Moyenne arithmétique - données individuelles
n

x1  x 2  x 3  ....  x n x i
x  i 1
n n
Mesure de tendance centrale
Moyenne arithmétique – données individuelles
n

x1  x 2  x 3  ....  x n x i
x  i 1
n n
Exemple: soit l’âge de 5 étudiant-e-s choisi-e-s
au hasard:
17 18 19 20 21

17  18  19  20  21
alors: x  19
5
Mesure de tendance centrale
Moyenne arithmétique – données individuelles
Excel
• Soit le nombre d’années d’expérience des
dirigeants de l’Exemple 1.1 a du fichier Excel,
CHAPITRE 1_ANALYSE DESCRIPTIVE.xls
• La moyenne est
18  14  13    16  12
x  14 ,13
85
• On peut utiliser la fonction Excel,
moyenne(D4:D88)
Mesure de tendance centrale
Moyenne arithmétique – données groupées

k k

f x f x
i i i i
x i 1
 i 1
k
n
f
i 1
i

xi = modalité i
fi = fréquence absolue de la modalité i
Mesure de tendance centrale
Moyenne arithmétique – données groupées

AGE FRÉQUENCE
xi fi xifi xi2 xi2fi
17 1 17 289 289
18 4 72 324 1296
19 6 114 361 2166
20 3 60 400 1200
21 1 21 441 441
15 284 5392

x  284  18,9 3  19
15
Mesure de tendance centrale
Moyenne arithmétique – données groupées

Expérience Fréquences Fréquences • La moyenne peut se calculer à l’aide


(années) absolues relatives des fréquences absolues ou des
xi fi fr i fréquences relatives
10 1 1,18%
11 3 3,53%
k
12 10 11,76%
13 17 20,00% fx i i
k
x   fri xi
14 22 25,88% x i 1

15 13 15,29% n i 1

16 11 12,94%
17 6 7,06%
x
10  1  11  3    18  2   14 ,13
18 2 2,35% 85
Total 85 100,00%
x  10  0 ,0118   11  0 ,0353    18  0 ,0235   14 ,13

Source: Exemple 1.1 b du fichier Excel, CHAPITRE 1_ANALYSE DESCRIPTIVE.xls


Mesure de tendance centrale
Moyenne arithmétique – données groupées
Excel
Expérience Fréquences Fréquences
(années) absolues relatives
xi fi fr i fixi fr i x i
10 1 1,18% 10 0,12
11 3 3,53% 33 0,39
12 10 11,76% 120 1,41
13 17 20,00% 221 2,60
14 22 25,88% 308 3,62
15 13 15,29% 195 2,29
16 11 12,94% 176 2,07
17 6 7,06% 102 1,20
18 2 2,35% 36 0,42
Total 85 100,00% 1201
moyenne = 14,13 14,13

Source: Exemple 1.1 b du fichier Excel, CHAPITRE 1_ANALYSE


DESCRIPTIVE.xls
Mesure de tendance centrale
Moyenne arithmétique - données groupées en classes

k k

f m f m
i i i i
x i1
 i1
k
n
f
i 1
i

mi = point milieu de la classe i


fi = fréquence absolue de la classe i
Mesure de tendance centrale
Moyenne arithmétique - données groupées en classes
Points
Ventes journalières milieux Fréquence
2
(en dollars) mi fi fi mi fi mi
220 234,99 227,5 3 682,5 155268,75
235 249,99 242,5 9 2182,5 529256,25
250 264,99 257,5 16 4120 1060900
265 279,99 272,5 17 4632,5 1262356,25
280 294,99 287,5 13 3737,5 1074531,25
295 309,99 302,5 10 3025 915062,5
310 324,99 317,5 5 1587,5 504031,25
325 339,99 332,5 2 665 221112,5
Total 75 20632,5 5722518,75

x 20632, 5  275,1
75
Mesure de tendance centrale
Moyenne arithmétique : remarques

•La moyenne arithmétique tient compte de


toutes les valeurs de la série.
•Elle est notamment affectée par les valeurs
aberrantes de la série
•Elle se calcule pour les variables quantitatives
mais non pour les variables qualitatives ni pour
les données groupées avec classes ouvertes
•Elle est unique
Mesure de tendance centrale
Médiane, Me
• La médiane correspond à la valeur de la série
d’observations à laquelle 50% des données
sont inférieures ou égales et 50% des données
sont supérieures ou égales.
• Elle divise la série de données en deux parties
égales.
Mesure de tendance centrale
Médiane, Me - données individuelles
• Ranger les observations en ordre croissant ou
décroissant
Mesure de tendance centrale
Médiane, Me - données individuelles
• Ranger les observations en ordre croissant ou
décroissant
• Si on a un nombre impair d’observations,
alors: ieme
 n  1
m e  valeur de la   observation
 2 
Mesure de tendance centrale
Médiane, Me - données individuelles
• Ranger les observations en ordre croissant ou
décroissant
• Si on a un nombre impair d’observations,
alors: ieme
 n  1
m e  valeur de la   observation
 2 

• Si on a un nombre pair d’observations, alors:


ieme ieme
 n n 
  observation    1 observation
 2 2 
me 
2
Mesure de tendance centrale
Médiane, Me - données individuelles
• Nombre impair d’observations:
17 18 19 21 22 23 24
Mesure de tendance centrale
Médiane, Me - données individuelles
• Nombre impair d’observations:
17 18 19 21 22 23 24

M e  21
Mesure de tendance centrale
Médiane, Me - données individuelles
• Nombre impair d’observations:
17 18 19 21 22 23 24

M e  21

• Nombre pair d’observations:


17 17 18 19 21 22 23 24 24 26
Mesure de tendance centrale
Médiane, Me - valeurs individuelles
• Nombre impair d’observations:
17 18 19 21 22 23 24

Me  21
• Nombre pair d’observations:
17 17 18 19 21 22 23 24 24 26

21  22
Me   21,5
2
Mesure de tendance centrale
Médiane, Me - données groupées

•n= 15, Nombre impair


AGE FRÉQUENCE FRÉQUENCE
de données
xi fi CUMULÉE Fi
17 1 1
•La médiane correspond
18 4 5 à la donnée de rang
19 6 11 (15+1)/2= 8
20 3 14
21 1 15 •La donnée de rang 8 est
15 19
•Me = 19 ans
Mesure de tendance centrale
Médiane, Me - données groupées en classes

n  F
M B  2 a
e I
fMe
BI : borne inférieure de la classe médiane (*)
F : somme des fréquences absolues des classes précédant la
classe médiane
fMe : fréquence de la classe médiane
a : amplitude de la classe médiane
n : nombre d’observations de la série

(*) : la classe médiane est celle contenant la n/2ième observation


(50% des observations)
Mesure de tendance centrale
Médiane, Me - données groupées en classes

Ventes journalières Fréquence Fréquence


(en dollars) Fréquence relative cumulée
220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
250 264,99 16 0,2133 28
265 279,99 17 0,2267 45
280 294,99 13 0,1733 58
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
Mesure de tendance centrale
Médiane, Me - données groupées en classes
Ventes journalières Fréquence Fréquence
La 37,5ième
(en dollars) Fréquence relative cumulée
220 234,99 3 0,0400 3
observation
235 249,99 9 0,1200 12 est dans cette
250 264,99 16 0,2133 28 classe
265 279,99 17 0,2267 45
280 294,99 13 0,1733 58
295 309,99 10 0,1333 68 Classe médiane
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
Mesure de tendance centrale
Médiane, Me - données groupées en classes
Ventes journalières Fréquence Fréquence La 37,5ième
(en dollars) Fréquence relative cumulée
observation
220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
est dans cette
250 264,99 16 0,2133 28 classe
265 279,99 17 0,2267 45
280 294,99 13 0,1733 58
295 309,99 10 0,1333 68 Classe médiane
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000

BI = 265 fMe=17 F=28


a = 15

me  265  
 
 75  28 
 2 
15  273,4
 17 

 
Mesure de tendance centrale
Médiane, Me : remarques

•Contrairement à la moyenne, la médiane n’est pas


affectée par les valeurs aberrantes
•Elle peut être utilisée avec des données groupées
avec des classes ouvertes
•Elle permet de mieux évaluer la tendance centrale
lorsque la distribution est très asymétrique
•Elle est unique
Mesure de tendance centrale
Mode, Mo
Mode: valeur de la variable statistique dont la
fréquence est la plus élevée
Exemple: valeurs individuelles
soit la série: 3, 1, 2, 3, 4, 4, 3, 2, 5, 3
1 |
2 ||
3 ||| |
4 ||
5 |
Mesure de tendance centrale
Mode, Mo
Mode: valeur de la variable statistique dont la
fréquence est la plus élevée
Exemple: valeurs individuelles
soit la série: 3, 1, 2, 3, 4, 4, 3, 2, 5, 3
1 |
2 ||
3 ||| | MODE
4 ||
5 |
Mesure de tendance centrale
Mode, Mo - valeurs groupées

Expérience Fréquences • Le mode correspond à la


(années) absolues
xi fi
modalité dont la fréquence
est la plus élevée
10 1
11 3 • Mo = 14 ans
12 10
13 17
14 22
15 13
16 11
17 6
18 2
Total 85
Mesure de tendance centrale
Mode, Mo - valeurs groupées en classes
• Classe modale: classe dont la fréquence est la
plus élevée
• Par convention, la valeur correspondant au
centre de cette classe
Mesure de tendance centrale
Mode, Mo - valeurs groupées en classes
Ventes journalières Fréquence Fréquence
(en dollars) Fréquence relative cumulée
220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
Classe 250 264,99 16 0,2133 28
265 279,99 17 0,2267 45
Modale 280 294,99 13 0,1733 58
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
Mesure de tendance centrale
Mode, Mo - valeurs groupées en classes
Ventes journalières Fréquence Fréquence
(en dollars) Fréquence relative cumulée
220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
Classe 250 264,99 16 0,2133 28
265 279,99 17 0,2267 45
Modale 280 294,99 13 0,1733 58
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000

Mo  272,5
Mesure de tendance centrale
Mode, Mo : remarques
• Le mode est une mesure appropriée pour les
variables qualitatives
• Il dépend uniquement des fréquences
• Il ne tient pas compte des valeurs de toutes
les observations de la série de données
• Une série peut avoir un seul mode
(distribution unimodale), plusieurs modes
(distribution bimodale, multimodale) ou
aucun mode.
Caractéristiques de tendance centrale
et de dispersion
Plan de la présentation

• Définition des mesures descriptives


• Mesures de tendance centrale
• Mesures de dispersion
• Mesures de position
• Mesures de forme
Mesure de dispersion
Étendue, E
• Soit les observations suivantes de l’âge des personnes
d’un échantillon tiré d’une association

60 62 64 66 67
68 69 70 70 71
71 72 75 77 79
alors,

E  xmax xmin  79  60  19 ans


Mesure de dispersion
Étendue, E: remarques
• L’étendue est facile à calculer et à interpréter
mais elle ne tient compte que des deux
observations extrêmes de la série de données
• Elle est unique
Mesures de dispersion
La variance et l’écart-type
• Ces deux mesures indiquent comment les
observations se répartissent autour de leur
moyenne arithmétique
• Une valeur élevée indique une forte dispersion
(ou variation) alors qu’une valeur peu élevée
indique une faible dispersion
• Il est plus facile d’interpréter la valeur de
l’écart-type que celle de la variance car il se
présente dans la même unité de mesure que la
moyenne arithmétique
Mesure de dispersion
Variance, s2 et écart-type, s - données
individuelles
Pour n observations x1, …, 2
xn , on a:  n

n n
  x i 
 i 1 
 x  x 
2 2
i x i 
n
Variance: s2  i 1
 i 1
n 1 n 1
 2
x i  nx
i 1
2


n 1

Écart-type: s = s2
Calcul simplifié
Mesures de dispersion
Variance, s2 et écart-type, s - données individuelles
ÉTUDIANT NOTES /100 ÉCARTS CARRÉ DES ÉCARTS
i xi xi  x x i  x  2
1 61 -6,67 44,44
2 58 -9,67 93,44
x  812  67,67
3 82 14,33 205,44
12
4 75 7,33 53,78
5 70 2,33 5,44
6 60 -7,67 58,78
7 72 4,33 18,78
8 68 0,33 0,11
9 66 -1,67 2,78
10 63 -4,67 21,78
11 65 -2,67 7,11
12 72 4,33 18,78
xi 812  0   530,67
Mesures de dispersion
Variance, s2 et écart-type, s - données individuelles
ÉTUDIANT NOTES /100 ÉCARTS CARRÉ DES ÉCARTS
i xi xi  x x i  x 2
1 61 -6.67 44.44
2 58 -9.67 93.44
x  812  67,67
3 82 14.33 205.44
12
4 75 7.33 53.78
5 70 2.33 5.44
6 60 -7.67 58.78
7 72 4.33 18.78 s2  530,67  48,24
8 68 0.33 0.11 121
9 66 -1.67 2.78
10 63 -4.67 21.78
11 65 -2.67 7.11 s  48,24  6,95
12 72 4.33 18.78
xi 812  0   530,67
Mesures de dispersion
Variance, s2 et écart-type, s - données individuelles

ÉTUDIAN NOTES AU
T NOTES / 100 CARRÉ
i xi xi2
2
1 61 3721 812 
2 58 3364 55476 
2
s  12  48,24
3 82 6724 12 1
4 75 5625
5 70 4900
6 60 3600
7 72 5184
8 68 4624
9 66 4356
10 63 3969 s  48,24  6,95
11 65 4225
12 72 5184
TOTAL 812 55476
Mesures de dispersion
Variance, s2 et écart-type, s - données
individuelles _ Excel
• Soit le nombre d’années d’expérience des dirigeants
de l’Exemple 1.1 b du fichier Excel,
CHAPITRE 1_ANALYSE DESCRIPTIVE.xls
• La variance est
2 2 2
2 ( 18  14 ,13 )  ( 14  14 ,13 )    ( 12  14 ,13 ) 241,58
s  
85  1 84
s 2  2 ,88
et l’écart-type s  2 ,88  1,70
• On peut utiliser les fonctions Excel,
VAR(D4:D88) et ECARTYPE(D4:D88)
Mesures de dispersion
Variance, s2 et écart-type, s - données groupées
k k  x f  2

 x x  
2 i i
i fi xi2 f i 
2 i 1 i 1 n
Variance: s  k
 k

 f 1
i 1
i  f 1
i 1
i

Calcul simplifié
Écart-type: s  s2
Mesures de dispersion
Variance, s2 et écart-type, s – données groupées
AGE FRÉQUENCE
2 2
xi fi xi fi xi xi fi
17 1 17 289 289
18 4 72 324 1296
19 6 114 361 2166
20 3 60 400 1200
21 1 21 441 441
15 284 5392

5392 ( 284  /15)


2
2
s   1,07
15 1
x  284  18,93  19
15
s  1,07  1,03
Mesures de dispersion
Variance, s2 et écart-type, s - données
groupées en classes
• Les calculs se font avec les points milieux des
classes (les classes doivent être fermées)
• Les formules sont les identiques à celles pour
les données groupées
k k
2
 fx
2
 f i ( xi  x ) 2

2
 fx2
i i  i i

n
s  i 1
s  i 1
n 1 n 1

s  s2
Mesures de dispersion
Variance, s2 et écart-type, s - données groupées
en classes
Points
Ventes journalières milieux Fréquence
2
(en dollars) xi fi fi xi fi xi
220 234.99 227.5 3 682.5 155268.75
235 249.99 242.5 9 2182.5 529256.25
250 264.99 257.5 16 4120 1060900
265 279.99 272.5 17 4632.5 1262356.25
280 294.99 287.5 13 3737.5 1074531.25
295 309.99 302.5 10 3025 915062.5
310 324.99 317.5 5 1587.5 504031.25
325 339.99 332.5 2 665 221112.5
Total 75 20632.5 5722518.75

5722518,75  75275,1
2
x  20632,5  275,1 s2   628,62
75 751
s  628,62 25,01
Mesures de dispersion
L’écart-type: remarques
• Mesure de dispersion la plus utilisée
• Il tient compte de chacune des valeurs des
observations de la série
• Il est affecté par les valeurs aberrantes
• Il ne peut être calculé pour des données
groupées en classes ouvertes
• Il est unique
La règle de Tchebycheff
• Cette règle est un outil qui nous permet d’interpréter
la valeur de l’écart-type.
• Pour tout ensemble de données et un nombre k, k ≥1,
la proportion de données comprise dans un intervalle
x  ks, x  ks est supérieure ou égale à (1 –
(1/k2)).
Autrement dit: 1
P( x  ks  X  x  ks)  1  2
k
La règle de Tchebycheff
• La règle de Tchebycheff (suite) : P( x  ks  X  x  ks)  1  12
k
Puisque la valeur de k ne dépend pas de la valeur des
observations de la série, nous pouvons faire la
généralisation suivante :
• Si k = 1, la proportion est > 0
• Si k = 1,5, la proportion est > 0,55
• Si k = 2, la proportion est > 0,75
• Si k = 2,5, la proportion est > 0,84
• Si k = 3, la proportion est > 0,89
• etc.
La règle de Tchebycheff: exemple

Ventes journalières Fréquences Fréquences • Si k = 1,5, on devrait avoir au


(en dollars) relatives
moins 55% des données qui
220 234,99 3 0,0400 tombent dans l’intervalle
235 249,99 9 0,1200 (235$ , 310$)
250 264,99 16 0,2133 • Selon la distribution de
265 279,99 17 0,2267 fréquences, on obtient:
280 294,99 13 0,1733 0,1200+0,2133+0,2267+0,1733
295 309,99 10 0,1333
+0,1333 = 0,8666
310 324,99 5 0,0667
325 339,99 2 0,0267
Total 75 1,0000

1
P( 275,1  1,5  25,01  X  275,1  1,5  25,01 )  P( 235  X  310 )  1  2
 0 ,55
1,5
Mesures de dispersion
Coefficient de variation, CV
• Permet de comparer les dispersions de séries
d’observations qui ne sont pas nécessairement
dans les mêmes unités de mesure
• Donne une idée du degré d’homogénéité d’une
distribution. Une série est dite homogène si son
CV est plus petit que 15%
s
• Formule: CV %    100
x
• Est indépendant de l’unité de mesure de la
variable observée
• Est une mesure de dispersion relative
Mesures de dispersion
Coefficient de variation, CV - valeurs groupées en classes

• De l’exemple précédent, on a trouvé que:


x 20632,5  275,1
75
s  628,62  25,01

alors, CV%  s  100  25,01  9,09%


x 275,1
• Puisque CV < 15%, on peut dire que la
distribution est homogène
Mesures de position
Quantiles, Cp

Ces mesures permettent de situer la position d’une


observation à l’intérieur de la série d’observations. Les
mesures de position sont appelées des quantiles.
Les quantiles les plus fréquemment utilisés sont :
 Les quartiles
 Les déciles
 Les centiles
Mesures de position
Quantiles, Cp

Il s’agit de partager les observations triées de la série en k groupes de


taille égale et d’indiquer à quel groupe appartient une
observation.

Si l’on divise la série d’observations


 en 4 groupes, on obtient des quartiles (Q1, Q2, Q3),
 en 10 groupes, on obtient des déciles (D1, D2, ... D9),
 en 100 groupes, on obtient des centiles (C1, C2, … C99),
 etc.

Et si la série d’observations est divisée en 2 groupes ?


on obtient la médiane (et Me = Q2)
Mesures de position
Quantiles, Cp

L’interprétation des quantiles:

• 1er quartile : 25 % des observations ont une valeur


inférieure ou égale à Q1,
• 3e quartile : 75 % des observations ont une valeur
inférieure ou égale à Q3
• 2e décile : 2/10e (ou 1/5e ou 20 %) des observations ont
une valeur inférieure ou égale à D2
• 85e centile : 85/100e (ou 85 %) des observations ont une
valeur inférieure ou égale à C85
• etc.
Mesures de position
Quantiles - données individuelles

• Il faut trier les observations en ordre croissant, puis


identifier les quantiles en multipliant le nombre total
d’observations (n) par la fraction identifiant le quantile.
• Si le nombre obtenu n’est pas un nombre entier, le
quantile correspond à la donnée de rang le nombre
entier immédiatement supérieur.
• Si le nombre obtenu est un nombre entier, le quantile
correspond à la moyenne des données de rang ce
nombre et le nombre entier immédiatement supérieur
Mesures de position
Quantiles - données individuelles
ÉTUDIANT NOTES /100 Notes rangées
i
1
xi
61
par ordre croissant
58
•Calculons Q1
2
3
58
82
60
61
• 12*25% = 3
4 75 63 •3 est un nombre entier
5 70 65
6 60 66 donc Q1 correspond à la
7 72 68
8 68 70 moyenne des valeurs de
9 66 72
10 63 72 rang 3 et 4
11
12
65
72
75
82 • Q1 = (61+63)/2 = 62
Calcul des quartiles avec
Excel
• Avec Excel on utilise la
fonction QUARTILE(C3:C14;1)
 1 pour le quartile Q25%
 2 pour le quartile Q50%
 3 pour le quartile Q75%
• Les valeurs calculées par cette
fonction peuvent être un peu
différentes de celles obtenues à
l’aide de la procédure décrite
auparavant
Mesures de position
Quantiles - données individuelles
ÉTUDIANT NOTES /100 Notes rangées

1
i xi
61
par ordre croissant
58
•Calculons D2
2
3
58
82
60
61
• 12*20% = 2,4
4 75 63 •2,4 n’est pas un nombre
5 70 65
6 60 66 entier donc D2
7 72 68
8 68 70 correspond à la donnée
9 66 72
10 63 72 de rang 3
11
12
65
72
75
82 • D2 = 61
Mesures de position
Quantiles - données groupées

Expérience Fréquences Fréquences


(années) absolues cumulées • Q25% correspond à la 25% ×
xi fi Fi
10 1 1 85 = 21,25 soit la 22ième
11 3 4 observation
12 10 14 • Q25% = 13 ans
13 17 31
14 22 53 • Q75% correspond à la 75% ×
15 13 66 85 = 63,75 soit la 64ième
16 11 77
observation
17 6 83
18 2 85 • Q75% = 15 ans
Total 85
Mesure de position
Quantiles – données groupées en classes

Cp  BI 
pn  Fa
fCp
Cp: quantile p%
BI : borne inférieure de la classe contenant le quantile p%
p: pourcentage désiré sous forme décimale, par exemple 0.50
n: nombre total d’observations dans la série
F : somme des fréquences absolues de toutes les classes précédant la
classe contenant le quantile. Si le quantile désiré se situe dans la première
classe, F = 0
fC : fréquence de la classe contenant le quantile
p

a : amplitude de la classe contenant le quantile


Mesure de position
Quantiles, Cp

• Estimer la valeur du quantile 80% (C80)


Ventes journalières Fréquence Fréquence
(en dollars) Fréquence relative cumulée
220 234,99 3 0,0400 3
235 249,99 9 0,1200 12
250 264,99 16 0,2133 28
265 279,99 17 0,2267 45
280 294,99 13 0,1733 58
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
Mesure de position
Quantiles, Cp
Ventes journalières Fréquence Fréquence Le quantile
(en dollars) Fréquence relative cumulée 80% ( 80
220 234,99 3 0,0400 3 75 =
235 249,99 9 0,1200 12 60ième
250 264,99 16 0,2133 28 observation)
265 279,99 17 0,2267 45 est dans cette
280 294,99 13 0,1733 58 classe
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000

• p = 0,80; n = 75, alors le quantile désiré (C80) sera dans la


classe contenant la n . p = 60ième observation
Mesure de position
Quantiles, Cp
Ventes journalières Fréquence Fréquence Le quantile
(en dollars) Fréquence relative cumulée 80% (80
220 234,99 3 0,0400 3 75 =
235 249,99 9 0,1200 12 60ième
250 264,99 16 0,2133 28 observation)
265 279,99 17 0,2267 45 est dans cette
280 294,99 13 0,1733 58 classe
295 309,99 10 0,1333 68
310 324,99 5 0,0667 73
325 339,99 2 0,0267 75
Total 75 1,0000
BI = 295 fC =10 F=58
p
a = 15
Cp  BI 
p  n  F a = 295 + 0,80  75 58 15  298
fCp 10
Mesure de position
Quantiles - données groupées en classes
• C80 = 298$
• Le quantile C80 ainsi obtenu représente la
valeur approximative à laquelle 80% des
observations de la série sont inférieures
• 80% des observations des ventes/jour sont
inférieures à 298$
Mesure de position
Quantiles - données groupées en classes
• C80 = 298$
• Le quantile C80 obtenu représente la valeur
approximative à laquelle, au plus 80% des
observations de la série sont inférieures et, au
plus 20% des observations sont supérieures
• 80% des observations des ventes/jours sont
inférieures à 298$
• On pourrait également obtenir le même résultat
à partir de la courbe de fréquences cumulées
Mesure de position
Quantiles - données groupées en classes
Fréquence Fréquence relative
Ventes journalières Fréquence relative cumulée cumulée
(en dollars) Fréquence relative croissante décroissante
220 234,99 3 0,0400 0,0400 1,0000
235 249,99 9 0,1200 0,1600 0,9600
250 264,99 16 0,2133 0,3733 0,8400
265 279,99 17 0,2267 0,6000 0,6267
280 294,99 13 0,1733 0,7733 0,4000
295 309,99 10 0,1333 0,9067 0,2267
310 324,99 5 0,0667 0,9733 0,0933
325 339,99 2 0,0267 1,0000 0,0267
Total 75 1,0000
Mesure de position
Quantiles - données groupées en classes
FRÉQUENCE
CUMULÉE

1,0000
0,9000
0,8000
0,7000
0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000
220 235 250 265 280 295 310 325 340
VENTES JOURNALIERES
Mesure de position
Quantiles - données groupées en classes
FRÉQUENCE
CUMULÉE

1,0000
0,9000
0,8000
0,7000
0,6000
0,5000
0,4000
0,3000
0,2000
0,1000
0,0000
220 235 250 265 280 295 310 325 340
VENTES JOURNALIERES
C80  298
Intervalle interquartile

• L’intervalle interquartile IQ est une mesure de


dispersion associée aux quartiles
• Il mesure l’étendue entre le 1er quartile et le 3ème
quartile:
IQ = Q3 – Q1
• Il contient 50% des observations situées au milieu
de la série
Données aberrantes

• Une donnée est dite aberrante si sa valeur est:


plus petite que Q1 – 1,5(Q3 – Q1)
Ou
plus grande que Q3 + 1,5(Q3 – Q1)
Diagramme en boîte (Box plot)
Plus petite valeur Plus grande valeur
de la série qui de la série qui n’est
n’est pas une Q1 Q2 Q3 pas une valeur
valeur aberrante aberrante

Valeurs
aberrantes
1,5(Q3 – Q1)
(Q3 – Q1) 1,5(Q3 – Q1)

Échelle
Diagramme en boîte (Box plot)

Diagramme en boîte
des ventes journalières

220,08 Q1 = 256,33 Q2 = 273,40 Q3 = 292,98 334,19


Caractéristiques de tendance centrale
et de dispersion
Plan de la présentation

• Définition des mesures descriptives


• Mesures de tendance centrale
• Mesures de dispersion
• Mesures de position
• Mesures de forme
Mesure de forme
Coefficient d'aplatissement, 4
• Une distribution est plus ou moins aplatie
selon que les fréquences des valeurs voisines
des valeurs centrales diffèrent peu ou
beaucoup les unes par rapport aux autres

 x i  x n  1
4

4 
s4
• Si 4 > 3 , la courbe est aiguë
• Si 4 = 3 , la courbe est normale (distribution normale)
• Si 4 < 3 , la courbe est aplatie
Interprétation du coefficient
d’aplatissement
• Pour simplifier la compréhension de ce
coefficient, plusieurs logiciels, incluant
Excel, soustraient le nombre 3 de la valeur
de 4
• En utilisant Excel, le coefficient
d’aplatissement, 4, pour une distribution
de forme normale est donc égal à 0
Forme de la distribution
et le coefficient d’aplatissement

Distribution Distribution Distribution


aplatie normale aigüe

4 < 0 4 = 0 4 > 0
Mesure de forme
Coefficient d'asymétrie, Sk
• Dans une distribution symétrique, les valeurs de la variable statistique
sont également dispersées de part et d’autre d’une valeur centrale

x  Me  Mo
SK  0
Mesure de forme:
Coefficient d'asymétrie (Sk)
• Cette mesure indique le degré de symétrie.
• Le coefficient de Pearson Sk, est donné par :

3 xMe  xMo
SK  
s s
• Sk est situé entre -1 et +1
Interprétation du coefficient
d’asymétrie
• Une distribution est symétrique si les
observations de la série sont également
dispersées de part et d’autre d’une valeur
centrale
moyenne = médiane = mode
• Le coefficient d’asymétrie, Sk , tel que calculé
par Excel, a une valeur comprise entre -∞ et +∞
 si Sk = 0, la série est symétrique
 si Sk < 0, la série a une asymétrie négative
 si Sk > 0, la série a une asymétrie positive
Forme de la distribution
et le coefficient d’asymétrie
Distribution Distribution Distribution
asymétrique symétrique asymétrique
positive négative

Mo  Me  x x  Me  Mo x  Me  Mo

Sk > 0 Sk = 0 Sk < 0
Mesures statistiques appropriées

selon les échelles de mesure


• Échelle nominale (sexe de l’employé)
 le mode
• Échelle ordinale (ordre de préférence pour des
vins)
 le mode et la médiane
• Échelle d’intervalle / de rapport (ventes)
 le mode, la médiane et la moyenne
arithmétique
 l’étendue, l’écart-type et les quantiles
Statistiques descriptives -
Excel
• On peut utiliser la fonction Statistiques
descriptives de l’utilitaire d’analyse d’Excel
pour obtenir les mesures descriptives
• Les données individuelles doivent être
disponibles
Statistiques descriptives
l’utilitaire d’analyse d’Excel
Ventes journalières

Moyenne 275,0267474 x
Erreur-type 2,931280088
Médiane 274,4444071 M e
Mode M o #N/A
Écart-type 25,38563022 s
2
Variance de l'échantillon s 644,4302215
Kurstosis (Coefficient d'applatissement) -0,500776154  4
Coefficient d'assymétrie S k 0,12236697
Plage 114,10566 E
Minimum xmin 220,083113
Maximum 334,188773 xmax
Somme
Nombre d'échantillons
 xi 20627,00605
75 n

Ventes journalières, voir le fichier Excel Exemples_notes_chap2.XLS

Vous aimerez peut-être aussi