Vous êtes sur la page 1sur 27

Paramètres de synthèse

M. FAGROUD – ENA Meknès mfagroud@gmail.com 1


Comparaison de groupes (1)

30 30

25 25

20 20

15 15

10 10

5 5

0 0
1,80 - 1,85 - 1,90 - 1,95 - 2,00 - 2,10 - 2,15 - 2,20 - 2,25 - 2,30 -
1,60 - 1,65 - 1,70 – 1,75 – 1,80 - 1,85 - 1,90 - 1,95 - 2,00 - 2,10 -
1,84 1,89 1,94 1,99 2,09 2,14 2,19 2,24 2,29 2,34
1,64 1,69 1,74 1,79 1,84 1,89 1,94 1,99 2,09 2,14

M. FAGROUD – ENA Meknès mfagroud@gmail.com 2


Comparaison de groupes (2)

35
30
30
25
25
20
20
15
15
10 10

5 5

0
0
1,80 - 1,85 - 1,90 - 1,95 - 2,00 - 2,10 - 2,15 - 2,20 - 2,25 - 2,30 -
1,84 1,89 1,94 1,99 2,09 2,14 2,19 2,24 2,29 2,34

M. FAGROUD – ENA Meknès mfagroud@gmail.com 3


Paramètres de tendance centrale

30

25

20

15

10

0
1,80 - 1,85 - 1,90 - 1,95 - 2,00 - 2,10 - 2,15 - 2,20 - 2,25 - 2,30 -
1,84 1,89 1,94 1,99 2,09 2,14 2,19 2,24 2,29 2,34

Appelés aussi paramètres de position : ils s'intéressent à la partie centrale de la


distribution ou à positionner une distribution sur l'échelle de variation de la
variable étudiée.

M. FAGROUD – ENA Meknès mfagroud@gmail.com 4


Le Mode (1)
Il s'agit de la valeur (la classe) la plus fréquente de la distribution. C'est celle
qui correspond à la fréquence la plus élevée.
Valeurs Effectif Fréquence classes Centre de Effectif Fréquence
observées (ni) (fi) classe (ni) (fi)
(xi) (ci)
09 12 11,43 1,60 – 1,69 1,645 18 22,5
10 20 19,05 1,70 – 1,79 1,745 22 27,5
11 22 20,95 1,80 – 1,89 1,845 26 32,5
12 14 13,33 1,90 – 1,99 1,945 14 17,5
13 11 10,48
14 08 7,62 Total 80 100
15 09 8,57
16 07 6,66
17 02 1,90
Total 105 100

M. FAGROUD – ENA Meknès mfagroud@gmail.com 5


Le mode (2)

Attention : pour les distributions groupées, et dans le cas où les intervalles de


classes ne sont pas identiques, la classe modale ne correspond pas à l'effectif le plus
grand.
La classe modale est une classe où les données sont les plus concentrées, en
d'autres termes, c'est celle qui à la fréquence unitaire la plus élevée.

M. FAGROUD – ENA Meknès mfagroud@gmail.com 6


Le mode (3)

Pour une même distribution, on peut avoir des modes différents selon le découpage
en classe qui a été choisi.

Le mode correspond au sommet de l'histogramme. Lorsque celui-ci présente deux


pics séparés par un creux, on dit que la distribution est bimodale. On distingue
alors un mode principal et un mode secondaire. Plus rarement, on peut trouver
des distributions ayant trois modes et plus.

M. FAGROUD – ENA Meknès mfagroud@gmail.com 7


La médiane (1)
 On ne peut la calculer que pour les caractères quantitatifs.

 Les valeurs étant classées par ordre croissant,

 la médiane est la valeur du caractère qui partage celui ci en deux ensembles


d'effectifs égaux : 50 % des valeurs lui sont supérieures et 50 % lui sont inférieures.
 On ordonne le tableau, et on cherche l'élément qui partage la distribution en
deux parties égales, c'est à dire celui qui a le rang (n+1)/2.

Si la distribution a un nombre impair d'élément on trouve une valeur unique qui est
la médiane,

08 10 12 14 16 17 18

n= 7 La médiane correspond au rang 4

M. FAGROUD – ENA Meknès mfagroud@gmail.com 8


La médiane (2)
si la distribution a un nombre d'éléments pair, on trouve deux valeurs qui
déterminent un intervalle médian : on prend alors pour médiane le centre de cet
intervalle médian.

08 10 12 14 16 17 18 19

n= 8 La médiane se trouve entre la valeur de rang 4


(14) et celle de rang 5 (16)

La médiane se trouve entre la rang n/2 et n/2 +1

M. FAGROUD – ENA Meknès mfagroud@gmail.com 9


La médiane (3)

(xi) (ni) (fi) (Ni) (Fi)


09 12 11,43 12 11,43
10 20 19,05 32 30,48
11 22 20,95 54 51,43
12 14 13,33 68 64,76
13 11 10,48 79 75,24
14 08 7,62 87 82,86
15 09 8,57 96 91,43
16 07 6,66 103 98,09
17 02 1,90 105 99,99

M. FAGROUD – ENA Meknès mfagroud@gmail.com 10


La médiane (4)

Nombres de Nombres de Fréquences Fréquences


ventes par jour jours cumulées
0 24 9,5 % 9,5%
1 57 22,5% 32,0%
2 75 29,6% 61,6%
3 53 21,0% 82,6%
4 33 13,0% 95,6%
5 7 2,8% 98,4%
6 4 1,6% 100,0%

Total 253 100 %

M. FAGROUD – ENA Meknès mfagroud@gmail.com 11


La médiane (5)
 Elle est facile à calculer

 Son interprétation est simple

 La médiane n'est pas influencée par des valeurs extrêmes

On peut diviser la distribution en quatre parties de même effectif.


Valeur minimale (la plus faible)
Min à Q1 Premier quartile
Q1 à Q2 Il s'agit des quartiles
Q2 à Q3 Troisième quartile
Q3 à max
Valeur maximale (la plus élevée)

Le Q2 est confondu avec la médiane

M. FAGROUD – ENA Meknès mfagroud@gmail.com 12


Les quartiles (1)
Les quartiles correspondent à une fréquence cumulée de 25% (1/4), 50% (1/2) et
75% (3/4)

L’intervalle interquartile est défini comme la différence entre le premier et le


troisième quartile: Q3 − Q1

L’intervalle interquartile contient 50% de la population avec 25% en dessous de


l’intervalle et 25% au–dessus.

Les techniques de calcul sont les mêmes que pour la médiane.

M. FAGROUD – ENA Meknès mfagroud@gmail.com 13


Les quartiles (2)

Nombres de Nombres de Fréquences Fréquences


ventes par jour jours cumulées
0 24 9,5 % 9,5%
1 57 22,5% 32,0%
2 75 29,6% 61,6%
3 53 21,0% 82,6%
4 33 13,0% 95,6%
5 7 2,8% 98,4%
6 4 1,6% 100,0%

Total 253 100 %

M. FAGROUD – ENA Meknès mfagroud@gmail.com 14


Diagrammes boites à moustaches

Comparer les trois situations suivantes :

M. FAGROUD – ENA Meknès mfagroud@gmail.com 15


La moyenne (1)
La moyenne arithmétique est un paramètre de tendance centrale plus utilisé que
les autres de par ses propriétés mathématiques.

Elle est calculée en divisant la somme des observations par le nombre


d'observations.
p

x i
x i 1

08 10 12 14 16 17 18 19

La somme = 114 114


n=8 x = 14,25
8

08 10 12 14 16 17 18

M. FAGROUD – ENA Meknès mfagroud@gmail.com 16


La moyenne (2)

Pour les distributions de fréquence, cette formule n'est pas valable.


En effet, il faut tenir compte du fait que chaque valeur apparait un certain nombre
de fois (effectif).
La formule devient :
p

n *x i i p

x i 1
p
ou encore x   f i * xi
n
i 1
i
i 1
p

n
i 1
i Effectif total

fi Fréquence correspondant à la ième valeur (valeur de position i dans le


tableau)

M. FAGROUD – ENA Meknès mfagroud@gmail.com 17


La moyenne (3)

(xi) (ni) x i * ni

09 12 108
10 20 200
11 22 242 1254
12 14 168 x  11,94
13 11 143
105
14 08 112
15 09 135
16 07 112
17 02 34
Total 105 1254

M. FAGROUD – ENA Meknès mfagroud@gmail.com 18


La moyenne (4)

(xi) (fi) xi * f i

09 0,1143 1,0287
10 0,1905 1,905
11 0,2095 2,3045
12 0,1333 1,5996
13 0,1048 1,3624
14 0,0762 1,0668
15 0,0857 1,2855
16 0,0666 1,0656
17 0,0190 0,323
Total 1 11,94

M. FAGROUD – ENA Meknès mfagroud@gmail.com 19


La moyenne (5)
Pour les distributions groupées, on utilise le point central dans les calculs

classes (ci) (ni) c i * ni


1,60 – 1,69 1,645 18 29,61
1,70 – 1,79 1,745 22 38,39 143,2
1,80 – 1,89 1,845 26 47,97 x  1,79
1,90 – 1,99 1,945 14 27,23
80

Total 80 143,2

M. FAGROUD – ENA Meknès mfagroud@gmail.com 20


mesure de dispersion (1)
Le paramètre le plus couramment employé se base sur les distances entre valeurs
observées et le centre de la distribution.

08 10 12 14 16 17 18 19

Moyenne = 14,25

-6,25 -4,25 -2,25 -0,25 1,75 2,75 3,75 4,75

- 13 13
Les écarts positifs compensent toujours les écarts négatifs. C'est pourquoi on utilise
les carrés de ces écarts.

39,06 18,06 5,06 0,06 3,06 7,56 14,06 22,56

109,48
M. FAGROUD – ENA Meknès mfagroud@gmail.com 21
mesure de dispersion (2)

08 10 12 13 14 15,5 16 17 18 19

Moyenne = 14,25

-6,25 -4,25 -2,25 -1,25 -0,25 1,25 1,75 2,75 3,75 4,75

39,06 18,06 5,06 2,5 0,06 2,5 3,06 7,56 14,06 22,56

114,48

Plus le nombre augmente plus cette somme est élevée.

M. FAGROUD – ENA Meknès mfagroud@gmail.com 22


mesure de dispersion (3)
Pour corriger ce problème, on divise cette somme par l'effectif total (nombre
d'observations). On obtient alors le paramètre appelé variance et qui constitue une
mesure de la dispersion.

109,48
2
var iance  s   13,68
8

114,48
2
var iance  s   11,45
10
La racine carrée de ce paramètre est appelé écart-type.

ecart  type  s  13,68  3,69

ecart  type  s  11,45  3,38

M. FAGROUD – ENA Meknès mfagroud@gmail.com 23


mesure de dispersion (4)
L'écart-type et la variance ont plus de sens et d'utilité quand on compare deux
distributions.

Admettons qu'on compare deux groupes d'étudiants et que les résultats sont :

s1= 8,2 et s2= 3,6

Lequel des deux groupes est plus dispersé ?

̅ x1= 78 et ̅x2= 12

Lequel des deux groupes est plus dispersé ?

M. FAGROUD – ENA Meknès mfagroud@gmail.com 24


Coefficient de variation (CV)
On doit tenir compte de la grandeur de la variable étudiée dans la comparaison
des dispersion.
Cette grandeur est matérialisée par la moyenne.
s
On calcule alors le coefficient de variation (CV). CV  *100
x

Pour les deux exemples cités, les valeurs des CV sont :

CV1= 10,51% et CV2= 30%

Le CV a la particularité d'être sans unité de mesure. On dit que c'est un nombre


parfait. De ce fait, il permet de comparer des distribution même très différentes.

M. FAGROUD – ENA Meknès mfagroud@gmail.com 25


Calcul de la variance (1)
1254
x  11,94
105

(xi) (ni) xi - x̅ (xi - x̅)2 (xi - x̅)2 * ni


09 12 -2,94 8,66 103,92
10 20 -1,94 3,77 75,49 495,66
s2   4,72
11 22 -0,94 0,89 19,56 105
12 14 0,06 0,01 0,05
13 11 1,06 1,12 12,29
s  4,72  2,17
14 08 2,06 4,23 33,85
15 09 3,06 9,34 84,11
16 07 4,06 16,46 115,22
17 02 5,06 25,57 51,15
Total 105 495,66

M. FAGROUD – ENA Meknès mfagroud@gmail.com 26


Calcul de la variance (2)
1254
x  11,94
105

(xi) (ni) xi 2 (xi)2 * ni


09 12 81 972
1
10 20 100 2000 15472  (1254) 2
105 495,66
11 22 121 2662 s2    4,72
105 105
12 14 144 2016
13 11 169 1859
s  4,72  2,17
14 08 196 1568
15 09 225 2025
16 07 256 1792
17 02 289 578
Total 105 15472

M. FAGROUD – ENA Meknès mfagroud@gmail.com 27

Vous aimerez peut-être aussi