Vous êtes sur la page 1sur 41

Statistique Descriptive

Youssef SEFRI
FLSH Ben MSik

2012-2013

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

1 / 41

Introduction
Lobjectif de ce chapitre est de prsenter les principaux paramtres qui permettent de rsumer une srie statistique dobservations et dclairer sur la position du noyau (centre) de la srie. Ces paramtres permettent de savoir autour de quelles valeurs se situent les valeurs dune variable statistiques. Ces paramtres sont appels caractristiques de position ou de la tendance centrale de la srie statistique. Nous prsenterons ici le mode, la moyenne, la mdiane et les quantiles.

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

2 / 41

Le mode

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

3 / 41

Le mode

I. Le mode
Dnition : Le mode dune variable statistique cest la valeur la plus frquente dune srie (la modalit qui reprsente le plus grand effectif). Remarques : Le mode peut tre calcul pour tous les types de variable : quantitative et qualitative. Le mode nest pas ncessairement unique. Quand une variable continue est dcoupe en classes, on peut dnir une classe modale (classe correspondant leffectif le plus lev).

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

4 / 41

Le mode

I. Le mode
1. Variable statistique qualitative ou quantitative discrte : Exemple 1 : Si on considre la variable Etat civil, dont le tableau statistique est le suivant : xi ni C 9 M 7 V 2 D le mode est C : clibataire. 2 Leffectif associ ce mode : 9.
Exemple 3 : soit la srie suivante : {5; 4; 6; 4; 3; 1; 3} Les valeurs les plus frquentes sont : 3 et 4 Cette srie a 2 modes : 3 et 4. Distribution bimodale

Exemple 2 : soit la srie suivante : {5; 4; 6; 4; 3; 1} La valeur la plus frquente est : 4 Le mode est gal 4 Distribution unimodale

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

5 / 41

Le mode

I. Le mode
2. Variable statistique quantitative continue : Dans ce cas, leffectif le plus lev permet didentier la classe modale. 2.1. Classes damplitudes gales : Exemple 4 : Salaire [2000,3000[ [3000,4000[ [4000,5000[ [5000,6000[ [6000,7000[ effectif 83 102 78 117 90 Amplitude 1000 1000 1000 1000 1000

- La classe modale cest : [5000,6000[ - La classe infrieure la classe modale : [4000,5000[ - La classe suprieure la classe modale : [6000,7000[ .
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 6 / 41

Le mode

I. Le mode
Dtermination du mode au sein de la classe modale k1 (x2 x1 ) k1 + k2

Mo = x1 + Avec :

[x1 ; x2 [ cest la classe modale. k1 : la diffrence entre la frquence (ou leffectif) de la classe modale et de la classe prcdente k2 : la diffrence entre la frquence (ou leffectif) de de la classe modale et de la classe suivante. x1 et x2 reprsente respectivement la borne infrieure et suprieure de la classe modale.
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 7 / 41

Le mode

I. Le mode
Comme application de cette formule, reprenons lexemple 4 prcdent : - [x1 ; x2 [= [5000, 6000[ cest la classe modale.
k1 k2 = = = = leffectif de la classe modale leffectif de la classe [4000,5000[ 117 78 = 39 leffectif de la classe modale leffectif de la classe [5000, 6000[ 117 90 = 27

- Lamplitude x2 x1 = 1000 Si on remplace ces quantits dans lexpression de Mo, on trouve : Mo = 5000 + 39 1000 = 5590 39 + 27
FLSH 2012-2013 8 / 41

Youssef SEFRI (FLSH Ben MSik)

Le mode

I. Le mode

2.2. Classes damplitudes ingales : Pour des classes damplitudes ingales, la classe modale cest la classe ayant leffectif corrig ( ou la densit) le(a) plus lev(e). Exemple 5 : Reprenons un exemple vu dans le chapitre prcdent : Classes [6,9[ [9,11[ [11,14[ Effectif 4 5 3 Frquence en % 46,70 33,30 20,00 Amplitude 3 2 3 densit en % 15,60 16,70 6,70

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

9 / 41

Le mode

I. Le mode
Rappelons que la densit a pour expression di = leffectif corrig = ni =
ni ai . fi ai

et que

- Les amplitudes tant diffrentes, alors on utilise les densits pour dterminer la classe modale, ainsi [x1 , x2 [= [9, 11[.
k1 k2 = = = = la densit de la classe modale la densit de la classe [6,9[ 16.70 15.60 = 1.1 la densit de la classe modale la densit de la classe [11,14[ 16.70 6.70 = 10

- Lamplitude x2 x1 = 11 9 = 2 Si on remplace ces quantits dans lexpression de Mo, on trouve : Mo = 9 +


Youssef SEFRI (FLSH Ben MSik)

1.1 2 = 9.2 1.1 + 10


FLSH 2012-2013 10 / 41

Le mode

La moyenne

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

11 / 41

La moyenne

II. La moyenne
1.La moyenne arithmtique simple : Dnition : La moyenne arithmtique simple dune srie statistique (xi )n i =1 correspond la division de leur somme par leur nombre. , se calcule par la formule Elle se note x = x x1 + x2 + . . . + xn = n
n i =1 xi

Exemple : Considrons la srie {10, 12, 16, 12}, alors = x


Youssef SEFRI (FLSH Ben MSik)

10 + 12 + 16 + 12 = 12, 5 4
FLSH 2012-2013 12 / 41

La moyenne

II. La moyenne
2.La moyenne arithmtique pondre : Dnition : Lorsque les valeurs ( modalits) sont affectes de coefcients (ici deffectifs), on parle de moyenne arithmtique pondre. Elle se calcule par la formule r r 1 = x ni xi = fi xi , n
i =1 i =1

ou fi est la frquence de la modalit xi et r i =1 ni = n. Exemple 1 : Voici les rsultats dun tudiant lors dun concours
Matires coefcient Notes Maths 2 11.5 conomie 3 07 Franais 1 16 anglais 2 14

= x

2 11.5 + 3 7 + 1 16 + 2 14 = 11 2+3+1+2
FLSH 2012-2013 13 / 41

Youssef SEFRI (FLSH Ben MSik)

La moyenne

II. La moyenne

Exemple 2 : Qualit se service 1 2 3 4 5 TOTAL (Somme) Effectif 1 3 5 2 1 12 ni xi 1 6 15 8 5 35 fi 0.08 0.25 0.42 0.17 0.08 1
35 12

fi xi 0.08 0.5 1.26 0.68 0.4 2.92

= la moyenne de la variable qualit de service x

= 2.92

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

14 / 41

La moyenne

II. La moyenne
La moyenne arithmtique pondre sur variable continue en classe : Pour calculer la moyenne arithmtique des donnes issues dune variable continue et regroupes dans des classes, on applique la formule r r 1 = x ni ci = fi ci n
i =1 i =1

avec 1 fi est la frquence de la modalit xi . 2 ci est le centre de la classe [xi , xi +1 [ donn par ci =
Youssef SEFRI (FLSH Ben MSik)

xi + xi +1 2
2012-2013 15 / 41

FLSH

La moyenne

II. La moyenne
Exemple : On regroupe les notes des lves de la manire suivante Classes [0 ; 5[ [5 ; 10[ [10 ; 12[ [12 ; 15[ [15 ; 17[ [17 ; 20] Somme ni 2 3 7 5 3 1 21 fi 0.09 0.14 0.33 0.24 0.14 0.05 1 ci 2.5 7.5 11 13.5 16 18.5 ni ci 5 22.5 77 67.5 48 18.5 238.5 fi ci 0.225 1.05 3.63 3.24 2.24 0.925 11.3

= La moyenne des notes cest x

238.5 21

= 11.3

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

16 / 41

La moyenne

II. La moyenne
3.La moyenne gomtrique simple : Dnition : On dnit la moyenne gomtrique G de la faon suivante : G= n x1 x2 . . . xn = (x1 x2 . . . xn ) n
1

Remarque : Lune des applications de la moyenne gomtrique cest de trouver la moyenne de taux dintrt. Exemple : Supposons que les taux dintrt pour 3 annes conscutives soient respectivement de 5%; 10% et 15%. Que va-t-on obtenir aprs 3 ans si je place 100 DHS ?
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 17 / 41

La moyenne

II. La moyenne
Rponse : Aprs 1 an on a : 100 + 100 5% = 100 1.05 = 105 DHS ; Aprs 2 ans on a : 105 + 105 10% = 105 1.1 = 100 1.05 1.1 = 115.5DHS Aprs 3 ans on a : 115.5 + 115.5 15% = 115.5 1.15 = 100 1.05 1.1 1.15 = 132.825 DHS Si on calcule la moyenne arithmtique des taux on obtient 1.05 + 1.1 + 1.15 = x = 1.1 3 Si on calcule la moyenne gomtrique des taux, on obtient G = (1.05 1.1 1.15) 3 = 1.099241902 car si on applique 3 fois le taux Le bon taux moyen est bien G et non x moyen G aux 100 DHS, on obtient 100 G3 = 100 (1.099241902)3 = 132.825 DHS
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 18 / 41 1

La moyenne

II. La moyenne
4.La moyenne harmonique : moyenne de linverse : Dnition : On appelle moyenne harmonique la quantit H= n
n 1 i =1 xi

Remarque : Il est judicieux dappliquer la moyenne harmonique aux vitesses. Exemple : Un cycliste parcourt 4 tapes de 100km. Les vitesses respectives pour ces tapes sont de 10 km/h, 30 km/h, 40 km/h, 20 km/h. Quelle a t sa vitesse moyenne ?
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 19 / 41

La moyenne

II. La moyenne
Rponse : - Un raisonnement simple nous dit quil a parcouru la premire tape en 10h, la deuxime en 3h20 la troisime en 2h30 et la quatrime en 5h. Il a donc parcouru le total des 400km en 10h + 3h20 + 2h30 + 5h = 20h50 = 20.8333h sa vitesse moyenne est donc : Moy =
400 20.8333

= 19.2Km/h.

- Si on calcule la moyenne arithmtique des vitesses, on obtient = x 10 + 30 + 40 + 20 = 25Km/h 4 4 +

- Si on calcule la moyenne harmonique des vitesses, on obtient H=


Youssef SEFRI (FLSH Ben MSik)

1 10

1 30

1 40

1 20

= 19.2Km/h
2012-2013 20 / 41

FLSH

La moyenne

II. La moyenne
5.La moyenne quadratique simple : Dnition : La moyenne quadratique simple de n-nombres rels, note Q correspond la moyenne arithmtique de leurs carrs, c--d Q= 1 n
n

xi2
i =1

Exemple : Considre la srie {3, 4, 7, 9, 11, 13, 17, 19}. la moyenne quadratique est : Q= 32 + 42 + 72 + 92 + 112 + 132 + 172 + 192 = 11, 699 8
FLSH 2012-2013 21 / 41

Youssef SEFRI (FLSH Ben MSik)

La moyenne

La mdiane

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

22 / 41

La mdiane

III. La mdiane

Dnition : La mdiane, note Me, est la valeur de la variable statistique qui partage la population en deux effectifs gaux. Remarque importante : - La mdiane ne sapplique que lorsque les observations sont ordonnes : ordre croissant ou dcroissant. - Le calcul de la mdiane ne concerne que les variables mesures sur une chelle = variables qualitatives.

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

23 / 41

La mdiane

III. La mdiane
1.Calcul de mdiane pour des donnes non rparties en classes : Pour calculer la Mdiane, on commence par ordonner les valeurs prises par la variable statistique X . On note X(1) la premire valeur,X(2) la deuxime valeur, ..., X(n) la plus grande valeur. On a donc : X(1) X(2) . . . X(n) On distingue deux cas : 1 ) X( n + 2 Me = X( n ) +X( n )+1 2 2
2
Youssef SEFRI (FLSH Ben MSik) FLSH

si n est impair, si n est pair.


2012-2013 24 / 41

La mdiane

III. La mdiane
Exemples de donnes non rparties en classes : Premier Cas "n" est impair :la srie observe : {3 2 1 0 0 1 2} Le nombre dobservations cest n = 7 Aprs rangement on obtient {0 0 1 1 2 2 3} Donc Me = 1 Deuxime Cas "n" est pair : la srie observe : {0 1 2 1 2 4 0 3} Le nombre dobservations cest n = 8 Aprs rangement on obtient {0 0 1 1 2 2 3 4} La mdiane de cette srie se trouve entre 1 et 2. On calcul la moyenne arithmtique de ces deux valeurs : 1+2 = 1.5 Me = 2
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 25 / 41

La mdiane

III. La mdiane

Exemples dune variable discrte : Dans le cas dune variable discrte, la dtermination de la mdiane se fait directement laide des effectifs cumuls croissants. Nombre denfants 0 1 2 3 4 effectif 20 16 10 5 0 Effectif cumul croissant 20 36 46 51 51

La mdiane est la modalit "1 enfant" qui correspond au foyer 16.

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

26 / 41

La mdiane

III. La mdiane
2.Calcul de mdiane pour des donnes rparties en classes : Pour une variable continue, on dtermine la classe mdiane de la mme faon que pour une variable discrte en utilisant les effectifs cumuls. Pour calculer la valeur de la mdiane, on applique la relation n/2 N{i 1;cc } Me = xi + (xi +1 xi ) ni Avec [xi ; xi +1 [ est la classe mdiane ni est la frquence de la classe mdiane N{i 1;cc } est la frquence cumule croissante situe avant la classe mdiane. n est le nombre total dobservations
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 27 / 41

La mdiane

III. La mdiane
Exemple : Soit une tude sur la note dune population de 50 tudiants. Notes [0 ;5[ [5 ;8[ [8 ;12[ [12 ;15[ [15 ;20[ Total Effectifs 10 8 12 11 9 50 Effectifs cumuls 10 18 30 41 50

[xi ; xi +1 [= [8; 12[ est la classe mdiane deffectif ni = 12. N{i 1;cc } = 18 est l effectif cumul croissant situe avant la classe mdiane. Ainsi Me = 8 +
Youssef SEFRI (FLSH Ben MSik)

(50/2 18) 4 = 10.33 12


FLSH 2012-2013 28 / 41

La mdiane

III. La mdiane
3. Dtermination graphique de la mdiane :

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

29 / 41

Les quantiles : Gnralisation de la mdiane

IV. Les quantiles

Prsentation : Les quantiles sont des mesures de position qui ne tentent pas ncessairement de dterminer le centre dune distribution dobservations, mais de dcrire une position particulire. Cette notion est une extension du concept de la mdiane qui divise une distribution dobservations en deux parties de mme effectif.

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

30 / 41

Les quantiles : Gnralisation de la mdiane

IV. Les quantiles


Les quantiles les plus frquemment utiliss sont :
1

Les quartiles qui divisent un ensemble dobservations en quatre parties gales ; les dciles qui divisent un ensemble dobservations en dix parties gales ; les centiles qui divisent un ensemble dobservations en cent parties gales.

Remarque : Le calcul des quantiles na de sens que pour une variable quantitative pouvant prendre des valeurs sur un intervalle dtermin.
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 31 / 41

Les quantiles : Gnralisation de la mdiane

IV. Les quantiles


1. Les quartiles : Voici, schmatiquement, une distribution partage en quartiles. Entre chaque quartile se trouvent 25% des observations :
25% 25% 25% 25%

1er quartile

2eme quartile

3eme quartile

Notations : le jme quartile se note Qj Remarques : 1- Le processus de calcul du quartile est similaire celui de la mdiane (c.--d. : ordonner les donnes). 2- les quartiles correspondent aux observations pour lesquelles la frquence cumule croissante dpasse respectivement 25 %, 50 % et 75%
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 32 / 41

Les quantiles : Gnralisation de la mdiane

1. Les quartiles
Comment interprter des quartiles ? - Le premier quartile dune srie statistique est la plus petite valeur Q1 telle quau moins 25% des valeurs sont infrieures ou gales Q1 . - Le deuxime quartile dune srie statistique cest la mdiane. - Le troisime quartile dune srie statistique est la plus petite valeur Q3 telle quau moins 75% des valeurs sont infrieures ou gales Q3 . 1. Calcul de Qj pour des donnes non rparties en classes : On suppose que le nombre dobservations cest n On calcul dabord la quantit
n 4

= k . Deux cas sont possibles :

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

33 / 41

Les quantiles : Gnralisation de la mdiane

1. Les quartiles
Premier Cas : k est un entier (la division tombe juste) On vrie que les valeurs sont ranges par ordre croissant. Q1 est la valeur de la modalit correspondante au k ieme rang Q3 est la valeur de la modalit correspondante au 3k ieme rang. Exemple 1 : Considrons la srie suivante : 16 12 1 9 17 19 13 10 4 8 7 8 14 12 14 9 On commence dabord par ranger les 16 termes de la srie 1 4 7 8 8 9 9 10 12 12 13 14 14 16 17 19 Dterminer le premier quartile : on a 16 4 = 4 donc le premier quartile est la valeur de la modalit correspondant au 4eme rang. Ainsi Q1 = 8 Dterminer le troisime quartile : on a 3 16 4 = 12 donc le troisime quartile est la valeur de la modalit correspondant au 12eme rang. Ainsi Q3 = 14
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 34 / 41

Les quantiles : Gnralisation de la mdiane

1. Les quartiles
Exemple 2 :On donne la rpartition des notes un contrle dans une classe de 28 lves. Notes Effectif Effectif cumul 7 2 2 8 3 5 9 5 10 10 2 12 11 1 13 12 6 19 13 3 22 14 3 25 15 3 28 on a k = 28 4 = 7 N, le premier quartile est au 7e rang, soit Q1 = 9 le troisime quartile est au 3 7 = 21e rang, soit Q3 = 13.
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 35 / 41

Les quantiles : Gnralisation de la mdiane

1. Les quartiles
Deuxime Cas :
n 4

= k nest pas un entier (nombre dcimal)

On vrie que les valeurs sont ranges par ordre croissant. On arrondit le dcimal k lentier suprieur et Q1 sera la valeur de la modalit correspondante au rang de cet entier. On arrondit le dcimal 3 k lentier suprieur et Q3 sera la valeur de la modalit correspondante au rang de cet entier . Exemple : Prenons les valeurs ranges dans lordre croissant : 3 5 5 6 7 8 8 9 9 10 10 10 10 11 11 12 13 13 13 14 15 16 19 On a n = 23 ; k = n 3 n 4 = 5, 75 et 4 = 17, 25 donc Q1 est la 6me valeur de la srie range dans lordre croissant : Q1 = 8; Q3 est la 18 me valeur de la srie range dans lordre croissant : Q = 13. Youssef SEFRI (FLSH Ben MSik) 3 FLSH 2012-2013

36 / 41

Les quantiles : Gnralisation de la mdiane

1. Les quartiles
2. Calcul de Qj pour des donnes rparties en classes : Selon la mme analyse pour le calcul du mode ou la mdiane pour des variables continues, on dtermine dabord la classe du quartile. On applique la formule suivante Qj = xi + (n j) Ncc i1 (xi+1 xi ) ni

Avec 1 [xi ; xi +1 [ est la classe du quartile. 2 j= 1/4 ou 1/2 ou 3/4 correspondant Q1 , Q2 et Q3 . 3 ni cest leffectif ( ou la frquence) de la classe du quartile. 4 Nicc 1 cest leffectif cumule croissant de la classe prcdente.
5

xi +1 xi cest lamplitude de la classe du quartile.


FLSH 2012-2013 37 / 41

Youssef SEFRI (FLSH Ben MSik)

Les quantiles : Gnralisation de la mdiane

1. Les quartiles
Exemple : 75 ouvriers que lon classe en fonction du nombre dheures travailles pendant un mois.
On a

= 18.75 =

Classe de valeurs [ 50,70[ [ 70,100[ [ 100,130[

Effectif

Effectifs cumuls Croissant 6 15 30 53 70 75

La classe du premier quartile cest [ 100 ; 130[ = 100 + 75 0.25 15 (130 100) 15 = 107.5 On a 3 k = 3 18.75 = 56.25

6 9 15 23 17 5 75

[ 130,150[ [ 150,180[ [ 180,200[

La classe du troisime quartile cest [ 150 ; 180[ 75 0.75 53 (180 150) = 150 + 17 = Youssef SEFRI (FLSH Ben MSik) 155.735
FLSH

Total

2012-2013

38 / 41

Les quantiles : Gnralisation de la mdiane

1. Les quartiles
Vocabulaires : [Q1 ; Q3 ] est lintervalle interquartile, il contient peu prs 50% des valeurs de la srie. IQ = Q3 Q1 cest lcart interquartile. Dnition : Un rsum graphique des donnes dune enqute statistique, moyennant les paramtres de position, peut tre fourni sous la forme dun diagramme " en bote moustaches ". Les " moustaches " correspondent aux valeurs extrmes de la srie.

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

39 / 41

Les quantiles : Gnralisation de la mdiane

Bote moustaches-diagramme de Tuckey


Exemple : Soit une variable statistique X dont le maximum est 55, le minimum 20, la mdiane 38, le 1er quartile 32,5 et le 3e quartile 45. On construit alors la Bote moustaches comme suit :

Youssef SEFRI (FLSH Ben MSik)

FLSH

2012-2013

40 / 41

Les quantiles : Gnralisation de la mdiane

2. Les dciles
Les mmes procedures appliques prcdemment aux quartiles n (k = n 4 ) resteront valables pour la suite lexception que k = 10 . Lorsque k=10, les quantiles sont appels dciles. - Le premier dcile dune srie la plus petite valeur D1 des termes de la srie pour laquelle au moins un dixime (10%) des donnes sont infrieures ou gales D1 . - le neuvime dcile (D9 ) dune srie est la plus petite valeur des termes de la srie pour laquelle au moins neuf diximes (90%) des donnes sont infrieures ou gales D9 - lintervalle interdcile est [D1 ; D9 ] - lcart interdcile est le nombre D9 D1 .
Youssef SEFRI (FLSH Ben MSik) FLSH 2012-2013 41 / 41