Vous êtes sur la page 1sur 32

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement


Elments de statistique descriptive 2me partie
(Environ 40 minutes)

Elments de statistique descriptive

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Sommaire
1- Caractristique d'une distribution statistique 2- Indicateurs de position 3- Indicateurs de dispersion 4- Exemple

Elments de statistique descriptive

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


1- Caractristique d'une distribution statistique
But : Rsumer de manire quantitative une distribution statistique

Indicateurs ?

George Udny Yule 1871-1951

Dfinitions objectives d'indicateurs indpendants de l'observateur. Utiliser toutes les observations dans le calcul des indicateurs.
Elments de statistique descriptive
3

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


1- Caractristique d'une distribution statistique
Avoir une signification concrte des indicateurs compris par des non spcialistes. Les indicateurs doivent tre simples calculer. Les indicateurs doivent tre peu sensibles aux fluctuations d'chantillonnage. Les indicateurs doivent se prter aux oprations mathmatiques simples. Indicateur de position Indicateur de dispersion
Elments de statistique descriptive
4

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


1- Caractristique d'une distribution statistique
Les indicateurs de position donnent un ordre de grandeur de la tendance centrale de la variable tudie. Les indicateurs de dispersion donnent des informations sur la faon dont les individus se rpartissent autour de la tendance centrale.
Type de la variable Tendance centrale Mode Mode, mdiane, quantiles Mode, mdiane, quantiles, moyenne Mode, mdiane, quantiles, moyenne Ecart interquartile Etendue, Ecart-type, cart interquartile Etendue, Ecart-type, cart interquartile Dispersion

Nominale Ordinale Discrte Continue

Elments de statistique descriptive

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
Le mode : dfinitions X est une variable nominale, ordinale ou discrte Le mode de la distribution statistique associe est la modalit de X la plus reprsente, celle pour laquelle l'effectif est le plus grand. X est une variable continue Le mode de la distribution statistique associe est la classe, appele classe modale, dont la hauteur dans l'histogramme est la plus leve.

Elments de statistique descriptive

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
Le mode : exemple pour une variable nominale

classement

Emissions de gaz effet de serre par pays en 2011 en ktCO2/an (source : AEE).

Mode= Italie
Elments de statistique descriptive
7

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
Le mode : exemple pour une variable continue

Classe modale= [30 40[


Elments de statistique descriptive
8

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
La mdiane : dfinitions La mdiane (Me) est la valeur de la variable telle que le nombre d'observations suprieures ou gales cette valeur est gal au nombre d'observations strictement infrieures cette valeur. La mdiane de la distribution de X se calcule de diffrentes faon suivant le type de X.

Elments de statistique descriptive

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
La mdiane : calcul pour une variable discrte Si la frquence cumule en xi-1 est < 0,5 et celle de xi est > 0,5 alors la mdiane vaut xi.
xi ni fi Fi

F2 = 0, 24 < 0, 5 F3 = 0, 53 > 0, 5

Me= 3

Si la frquence cumule en xi-1 est gale 0,5 alors la mdiane vaut xi.

Elments de statistique descriptive

10

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
La mdiane : calcul pour une variable continue Les variables sont rparties en classes [ai-1 ai[ Si F(ai-1) < 0,5 et si F(ai) > 0,5 alors la classe mdiane est [ai-1 ai[ et on calcule la mdiane par interpolation linaire sur l'intervalle [ai-1 ai[ :
Me = ai 1 + ( ai ai 1 ) F ( ai ) F ( ai 1 ) 0, 5 F ( ai 1 )

Avec F la fonction de rpartition de X. Si F(ai-1) = 0,5 alors la mdiane vaut ai-1


Elments de statistique descriptive
11

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
La mdiane : calcul pour une variable continue Exemple
Classes [0 1,5 [ [1,5 1,6 [ [1,6 1,7 [ [1,7 1,8 [ [1,8 1,9 [ [1,9 2,0 [ [2,0 2,5[ ni 0
10 32 130 174 8 8

fi 0
0,03 0,09 0,37 0,49 0,02 0,02

Fi 0
0,03 0,12 0,49 0,98 1,00 1,00

ai-1 =1,8 et ai=1,9 F(ai-1) = F(1,8) = 0,49 < 0,5 F(ai) = F(1,9) = 0,98 > 0,5

Me = ai 1 + ( ai ai 1 )

F ( ai ) F ( ai 1 )

0, 5 F ( ai 1 )

Me = 1, 8 + (1, 9 1, 8 )
Me = 1, 802

0, 5 0, 49 0, 98 0, 49

Elments de statistique descriptive

12

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
Les quantiles : dfinitions Le quantile est la gnralisation de la mdiane. Soit 0 < < 1 Si F (ai 1 ) < et F (ai ) > on dfinit le quantile d'ordre Q par : F ( ai 1 ) Q = ai 1 + ( ai ai 1 ) F ( ai ) F ( ai 1 ) Les quantiles les plus utiliss sont : Les quartiles : Q1 (= Q0,25), Q2 (=Q0,5) qui est la mdiane, et Q3 (=Q0,75) Les dciles : D1 (= Q0,10), D2 (=Q0,20), D3 (=Q0,30), Les centiles : C1 (= Q0,01), C2 (=Q0,02) et C3 (=Q0,03),
Elments de statistique descriptive
13

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
Les quantiles : exemples
Calcul de Q0,25 = Q1 premier quartile ai-1 =19 et ai=23 F(ai-1) = F(19) = 0,18 < 0,25 F(ai) = F(23) = 0,53 > 0,25
Q = ai 1 + ( ai ai 1 ) F ( ai ) F ( ai 1 )

F ( ai 1 )

Q0 ,25 = 19 + ( 23 19 )

0, 25 0,18 = 19, 8 0, 53 0,18

Elments de statistique descriptive

14

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
Les quantiles : exemples
Calcul de Q0,75 = Q3 troisime quartile ai-1 =30 et ai=34 F(ai-1) = F(30) = 0,66 < 0,75 F(ai) = F(34) = 0,87 > 0,75
Q = ai 1 + ( ai ai 1 ) F ( ai ) F ( ai 1 )

F ( ai 1 )

Q0 ,75 = 30 + ( 34 30 )

0, 75 0, 66 = 31, 7 0, 87 0, 66

Elments de statistique descriptive

15

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
Les quantiles : exemples
Calcul de D7=Q0,70 septime dcile ai-1 =30 et ai=34 F(ai-1) = F(30) = 0,66 < 0,70 F(ai) = F(34) = 0,87 > 0,70
Q = ai 1 + ( ai ai 1 ) F ( ai ) F ( ai 1 )

F ( ai 1 )

D7 = Q0 ,7 = 30 + ( 34 30 )

0, 7 0, 66 = 30, 8 0, 87 0, 66

Elments de statistique descriptive

16

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
La moyenne arithmtique : dfinitions Si X est une variable quantitative discrte, donne par sa distribution d'effectifs (xi,ni), i=1,2,,k alors la moyenne arithmtique x se calcule selon l'expression : k 1 1 k N = ni x = ( n1 x1 + n2 x2 + n3 x3 + ... + nk xk ) = ni xi N N i =1 i =1 Si X est une variable quantitative continue range en classes [ai-1 ai[ alors la moyenne arithmtique x se calcule selon l'expression : 1 1 k a +a x = ( n1c1 + n2 c2 + n3c3 + ... + nk ck ) = ni ci ci = i 1 i N N i =1 2 NB : Dans chacun des calculs, les effectifs ni peuvent tre remplacs par les frquences fi
Elments de statistique descriptive
17

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
La moyenne arithmtique : exemple pour une variable discrte
xi ni

N = ni = ( 2 + 3 + 3 + ... + 6 ) = 50
i =1

1 x= N

ni xi =
i =1

1 ( 30 2 + 31 3 + ... + 45 6 ) = 37, 4km / h 50

Elments de statistique descriptive

18

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


2- Indicateurs de position
La moyenne arithmtique : exemple pour une variable continue
ai 1 + ai 2 16 + 19 c1 = = 17, 5 2 23 + 30 c3 = = 26, 5 2 34 + 40 c5 = = 37, 0 2 ci =
k i =1

c2 =

N = 85

19 + 23 = 21, 0 2 30 + 34 c4 = = 32, 0 2 40 + 57 c6 = = 43, 5 2

1 x= N

ni ci =

1 (15 17, 5 + 30 21, 0 + ... + 3 43, 5) = 25, 7keuros 85

NB : Me = 22, 7 keuros
Elments de statistique descriptive
19

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


3- Indicateurs de dispersion
L'tendue L'tendue E d'une distribution statistique est la diffrence entre la plus grande modalit du caractre et la plus petite modalit.

Etendue : E=45-30 = 15 Etendue : E=57-16 = 41

Elments de statistique descriptive

20

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


3- Indicateurs de dispersion
L'cart interquartile L'cart interquartile IQ = distance entre le 1er et le 3ime quartile : Q0,75 - Q0,25 L'cart interquartile reprsente les valeurs extrmes d'une dispersion de 50% des effectifs autour de la mdiane.

Q1 = 19, 8 Q3 = 31, 7

IQ = 11, 9

Elments de statistique descriptive

21

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


3- Indicateurs de dispersion
La variance et l'cart-type La variance Var(X) est la moyenne des carrs des carts la moyenne. Pour une variable discrte, on a : 2 1 k 1 Var ( X ) = n x x = i i N i =1 N

n x i x i =1
k 2 i

( )

Pour une variable continue range en classes [ai-1 ai[ on a:


2 1 k 1 Var ( X ) = ni ci x = N i =1 N

n c x i =1
k 2 i i

( )

Dans chaque cas on dfinit l'cart-type ( X ) = VAR( x )


Elments de statistique descriptive
22

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


3- Indicateurs de dispersion
La variance et l'cart-type : exemple pour une variable discrte
xi ni

N = 50

x = 37, 4

2 1 k 1 2 2 Var ( X ) = ni xi x = 2. ( 30 37, 4 ) + ... + 6. ( 45 37, 4 ) = 20, 7 N i =1 50

= Var ( X ) = 4, 55km / h

Elments de statistique descriptive

23

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


3- Indicateurs de dispersion
La variance et l'cart-type : exemple pour une variable continue
N = 85

x = 25, 7

2 1 k 1 2 2 Var ( X ) = ni ci x = 15. (17, 5 25, 7 ) + ... + 3. ( 43, 5 25, 7 ) = 51, 4 N i =1 85

= Var ( X ) = 7, 2keuros

Elments de statistique descriptive

24

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


4- Exemple
La boite de dispersion ("box-plot") : dfinition La boite de dispersion d'une distribution statistique se construit de la faon suivante :
John Wilder Tukey 1915-2000

Porter sur un axe gradu la mdiane, puis le premier et le troisime quartile (Q0,25 et Q0,75) de la distribution. Construire autour de l'axe, et centr sur l'axe, un rectangle de hauteur arbitraire et de largeur correspondant aux deux quartiles. La mdiane est repre par un trait plein dont la hauteur est celle du rectangle.

Elments de statistique descriptive

25

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


4- Exemple
La boite de dispersion ("box-plot") : dfinition Porter de chaque ct des quartiles une longueur gale 1,5 fois l'intervalle interquartile et on marque, par un trait orthogonal l'axe prolong par ces points, les modalits observes les plus proches des points obtenus (vers les quartiles), c'est l'intervalle [d1 d3]. On repre toutes les autres valeurs observes de la modalit extrieure l'intervalle [d1 d3] prcdent. Ces valeurs sont dites aberrantes (outliers).
1,5.IQ IQ 1,5.IQ

d1

Q0,25

Me Q0,75

d3
26

Elments de statistique descriptive

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


4- Exemple
La boite de dispersion ("box-plot") : exemple

Elments de statistique descriptive

27

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


4- Exemple
La boite de dispersion ("box-plot") : exemple

Elments de statistique descriptive

28

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


4- Exemple
La boite de dispersion ("box-plot") : exemple
Calcul de Q0,25 = Q1 premier quartile ai-1 =20 et ai=30 F(ai-1) = F(20) = 0,03 < 0,25 F(ai) = F(30) = 0,31 > 0,25
F ( ai 1 )

Q = ai 1 + ( ai ai 1 )

F ( ai ) F ( ai 1 )

Q0 ,25

0, 25 0, 03 = 20 + ( 30 20 ) 0, 31 0, 03

Q1 = 27, 9

Elments de statistique descriptive

29

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


4- Exemple
La boite de dispersion ("box-plot") : exemple
Calcul de Q0,75 = Q3 troisime quartile ai-1 =30 et ai=40 F(ai-1) = F(30) = 0,31 < 0,75 F(ai) = F(40) = 0,78 > 0,75
F ( ai 1 )

Q = ai 1 + ( ai ai 1 )

F ( ai ) F ( ai 1 )

Q0 ,75

0, 75 0, 03 = 30 + ( 40 30 ) 0, 78 0, 31

Q3 = 39, 4

Elments de statistique descriptive

30

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


4- Exemple
La boite de dispersion ("box-plot") : exemple
Calcul de Q0,5 = Q2 = Me (mdiane) ai-1 =30 et ai=40 F(ai-1) = F(30) = 0,31 < 0,50 F(ai) = F(40) = 0,78 > 0,50
F ( ai 1 )

Q = ai 1 + ( ai ai 1 )

F ( ai ) F ( ai 1 )

Q0 ,5

0, 50 0, 03 = 30 + ( 40 30 ) 0, 78 0, 31

Me = 34, 0

Elments de statistique descriptive

31

HSE118 Outils en mathmatiques et statistiques pour la sant-scurit au travail et l'environnement

Elments de statistique descriptive 2me partie


4- Exemple
La boite de dispersion ("box-plot") : exemple
60 d3=54,7 50 40 30 20 10 0 d1=12,3 10,6 39,4 34,0 27,9 56,7

IQ=17,3

Q1 = 27, 9 Q3 = 39, 4 Me = 34, 0

IQ = 11, 5 1, 5. IQ = 17, 3 Q1 1, 5. IQ = 10, 6 d1 = 12, 3 Q3 + 1, 5. IQ = 56, 7 d 3 = 54, 7

min = 12, 3 max = 54, 7

E = 42, 4
32

Elments de statistique descriptive