Vous êtes sur la page 1sur 6

Formules de statistiques descriptives

1. Mesures de tendance centrale

a. Moyenne arithmtique
Donnes en vrac Donnes regroupes

  
 =
  =
 = 

 
b. Mdiane
Au moins 50% des donnes sont infrieures ou gales la mdiane
et au moins 50% des donnes sont suprieures ou gales la mdiane

i. Donnes en vrac :

Nombre pair de donnes :


() + ()
 
 =

Nombre impair de donnes :

 =  
( )


ii. Donnes regroupes :

On repre la classe o se trouve la mdiane [aM, bM[ puis on interpole en utilisant


la formule suivante:


 

 =  + (  )

o nM est l'effectif de la classe contenant la mdiane et f* est la somme des
effectifs des classes qui prcdent celle o se trouve la mdiane

1
c. Quartiles
Au moins 25% des donnes sont infrieures ou gales Q1
et au moins 75% des donnes sont suprieures ou gales Q1

Donnes regroupes :

Premier quartile : On repre la classe o se trouve le premier quartile Q1,


[aQ1, bQ1[ puis on interpole en utilisant la formule suivante:

  

 =  +   




o nQ1 est l'effectif de la classe contenant le premier quartile et f* est la somme


des effectifs des classes qui prcdent celle o se trouve ce quartile.

Dernier quartile : On repre la classe o se trouve le dernier quartile Q3,


[aQ3, bQ3[ puis on interpole en utilisant la formule suivante:


  

 =  +   


o nQ3 est l'effectif de la classe contenant le dernier quartile et f* est la somme


des effectifs des classes qui prcdent celle o se trouve ce quartile.

d. Mode et classe modale


Donnes en vrac Donnes regroupes

Donne laquelle est associe le maximum Si les classes sont gales, classe laquelle est
des effectifs (ou des frquences). associe le maximum des effectifs (ou des
frquences).

Sinon, classe qui "se dtache" dans


l'histogramme une fois qu'on a rajust les
hauteurs pour que les surfaces des
rectangles soient proportionnelles aux
effectifs (ou aux frquences)

2
e. Bote moustaches (BoxPlot)

Li = max { minimum, Q1 1,5 (Q3 - Q1) }


Ls = min { maximum, Q3 + 1,5 (Q3 - Q1) }
Toute donne qui dborde de [Li, Ls] est considre extravagante (atypique)

3
2. Mesures de dispersion

a. Plage (Range) Plage = maximum - minimum

b. Variance
Donnes en vrac Donnes regroupes

Dfinition Dfinition

 )
(   )
( 
! = ! =
 
Formule de calcul Formule de calcul

(  ) (   )
  
! =  
 ! =

c. cart-type (standard deviation)

! = #! 

d. Thorme de Tchebycheff

La proportion des observations situes lextrieur de lintervalle dfini par ks


est dau plus 1/k ( k 1)

Exemples :
si k = 2, il y aura au plus 25% des donnes en dehors de 2s
(au moins 75% lintrieur)
si k = 3, il y aura au plus 11% des donnes en dehors de 3s
(au moins 89% lintrieur)
si k = 2,5, il y aura au plus 16% des donnes en dehors de 2,5s
(au moins 84% lintrieur)

Remarque : On ne doit pas dborder ni du minimum ni du maximum des observations


!

4
3. Autres mesures

a. Transformation linaire

 =+
Si & =  +   alors &  et !& = ||!

b. Cote-Z de X


0 =
!
Remarque : si |0 | >  on concluera que X est une donne extravagante.

Remarque : la cote Z est une transformation linaire de X o


a = -/s et b = 1/s

Remarque : =2
0 et !0 =  (dcoule de la remarque prcdente)

c. Coefficient de variation
!
34 = 5 5 22%


Critres dhomognit - pour ce cours:

Un phnomne industriel sera considr homogne si son CV est


infrieur 10%
On considrera tout autre phnomne comme homogne si son CV est
infrieur 30%

5
d. Coefficient d'asymtrie (Skewness)
Donnes en vrac Donnes regroupes

)
 (   ) 
 ( 
78 = 78 =
( )( )! ( )( )!

Interprtation - pour ce cours:

Si SK < 0 il y a une asymtrie ngative (ou un biais gauche)


Si SK 0 il y a une asymtrie positive (ou un biais droite)
Si |SK| 0,5, lasymtrie est ngligeable
Si 0,5 < |SK| 2, lasymtrie est modre
Si |SK| > 2, lasymtrie est prononce

e. Coefficient d'aplatissement (Kurtosis)


9:;;<= <; >?@A

 )
( + ) (  ( )
8 =
( )( )( )! ( )( )

Donnes regroupes
Donnes regroupes

 ) 
( + ) (  ( )
8 =
( )( )( )! ( )( )

Interprtation - pour ce cours:

On ne peut interprter ce coefficient que lorsque le biais est ngligeable i.e. pour
|SK| 0,5

Si K < 0 la courbe est aplatie (distribution platykurtique)


Si K 0 la courbe est tire (distribution leptokurtique)
Si |K| 0,5 la courbe nest ni trop aplatie, ni trop tire (distribution
msokurtique)
Si 0,5 < |K| 2, laplatissement est modr
Si |K| > 2, laplatissement est prononc