Vous êtes sur la page 1sur 49

Mthodes quantitatives en sociologie Licence 1 Sociologie Anne 2008-2009

Partie 2 Introduction la statistique

Mthodes quantitatives en sociologie Partie 2 Introduction la statistique

Chapitre 5 Les paramtres de tendance centrale

Ch. 5 Les paramtres de tendance centrale

I- Le mode
Dfinition Le mode est la modalit ou la valeur qui a le plus grand effectif, la plus grande frquence. Il est not Mo. Une distribution peut avoir un mode. Il sagit alors du sommet de la distribution. On parle de !distribution unimodale!
f r q u e n c e

Mode

Ch. 5 Les paramtres de tendance centrale I- Le mode

Dfinition Une distribution peut aussi avoir plusieurs modes. * distribution bimodale (deux modes) * distribution multimodale (plusieurs modes). Elle est souvent le reflet dune population compose de plusieurs souspopulations distinctes. Ex: distribution de la taille des individus dans une population adulte
f r q u e n c e

taille mode pour les femmes mode pour les hommes

Ch. 5 Les paramtres de tendance centrale I- Le mode

A- Pour les variables qualitatives


Le mode dune variable qualitative est la modalit la plus frquemment observe. Exemple : Perception de ltat de sant Effectifs trs bon bon moyen mauvais trs mauvais Total 3303 6337 2325 354 71 12390

Le mode est la seule mesure de tendance centrale applicable aux variables qualitatives.

Ch. 5 Les paramtres de tendance centrale I- Le mode

A- Pour les variables qualitatives


Le mode dune variable qualitative est la modalit la plus frquemment observe. Exemple : Perception de ltat de sant Effectifs trs bon bon moyen mauvais trs mauvais Total 3303 6337 2325 354 71 12390 Le mode est la modalit !bon! Leffectif modal est 6337.

Le mode est la seule mesure de tendance centrale applicable aux variables qualitatives.

Ch. 5 Les paramtres de tendance centrale I- Le mode

B- Pour les variables quantitatives discrtes


Comme pour les variables qualitatives, le mode dune variable quantitative discrte est la valeur la plus frquemment observe. Exemple : Notes de philosophie dans une classe de terminale S
12 10 8
Effectifs

6 4 2 0

10

11

12

13

14

Notes de philo

Ch. 5 Les paramtres de tendance centrale I- Le mode

B- Pour les variables quantitatives discrtes


Comme pour les variables qualitatives, le mode dune variable quantitative discrte est la valeur la plus frquemment observe. Exemple : Notes de philosophie dans une classe de terminale S
12 10 8
Effectifs

Le mode est 9. Leffectif modal est 10.

6 4 2 0

10

11

12

13

14

Notes de philo

Ch. 5 Les paramtres de tendance centrale I- Le mode

C- Pour les variables quantitatives continues


* Non groupe

Ch. 5 Les paramtres de tendance centrale I- Le mode

C- Pour les variables quantitatives continues


* Non groupe

Le mode est 5 ans de mariage en 1975 et en 1985, 4 ans de mariage en 1995 et en 2005. La frquence modale est de 34 pour 1000 en 2005.

Ch. 5 Les paramtres de tendance centrale I- Le mode

C- Pour les variables quantitatives continues


* Groupe en classes damplitude constante

' (1 $ " Mo= Li+% !C % " & (1+(2 #


Mo = mode Li = borne infrieure de la classe modale C = amplitude de la classe modale "1 = effectif classe modale effectif classe prcdente "2 = effectif classe modale effectif classe suivante

Ch. 5 Les paramtres de tendance centrale I- Le mode

C- Pour les variables quantitatives continues


* Groupe en classes damplitude constante
Exemple : Moyenne en histoire-gographie dans une classe de terminale S

Classes [6; 8[ [8; 10[ [10; 12[ [12; 14] [14; 16[ Total

Effectifs(ni) 3 6 11 7 4 31

Ch. 5 Les paramtres de tendance centrale I- Le mode

C- Pour les variables quantitatives continues


* Groupe en classes damplitude constante
Exemple : Moyenne en histoire-gographie dans une classe de terminale S

Classes [6; 8[ [8; 10[ [10; 12[ [12; 14] [14; 16[ Total

Effectifs(ni) 3 6 11 7 4 31 La classe modale est [10;12[ avec un effectif modal de 11 Mo= 10 + [5/(5+4)]*2 = 11,1

Ch. 5 Les paramtres de tendance centrale I- Le mode

C- Pour les variables quantitatives continues


* Groupe en classes damplitude variable
Mme formule que prcdemment avec : "1 = valeur hi de la classe modale valeur hi de la classe prcdente "2 = valeur hi de la classe modale valeur hi de la classe suivante

Ch. 5 Les paramtres de tendance centrale I- Le mode

C- Pour les variables quantitatives continues


* Groupe en classes damplitude variable
Exemple : Rpartition en 3 tranches dge ni [20;30[ [30;50[ [50;55[ 2000 3000 500 5500 Amplitude 10 20 5 Hi (ni/A) 200 150 100

Ch. 5 Les paramtres de tendance centrale I- Le mode

C- Pour les variables quantitatives continues


* Groupe en classes damplitude variable
Exemple : Rpartition en 3 tranches dge ni [20;30[ [30;50[ [50;55[ 2000 3000 500 5500 La classe modale est [20;30[ avec un effectif rapport lamplitude de la classe de 200. Mo = 20 + [200/(200+50)]*10 = 28 ans Amplitude 10 20 5 Hi (ni/A) 200 150 100

Ch. 5 Les paramtres de tendance centrale

II- La moyenne
Dfinition La moyenne est la mesure la plus commune de tendance centrale. La moyenne est la somme des valeurs divise par leffectif total.

Ch. 5 Les paramtres de tendance centrale II- La moyenne

A- Pour les variables quantitatives discrtes

Moyenne

X=

!n x
i =1 i

Avec :

xi = valeur de la variable X ni = effectif correspondant la valeur xi n = taille de lchantillon (effectif total)

Ch. 5 Les paramtres de tendance centrale II- La moyenne

A- Pour les variables quantitatives discrtes


Exemple : Notes de philosophie dans une classe de terminale S xi
6 7 8 9 10 11 12 13 14 Total

ni
1 2 1 10 4 3 5 4 1 31

ni xi

Ch. 5 Les paramtres de tendance centrale II- La moyenne

A- Pour les variables quantitatives discrtes


Exemple : Notes de philosophie dans une classe de terminale S xi
6 7 8 9 10 11 12 13 14 Total

ni
1 2 1 10 4 3 5 4 1 31

ni xi
6 14 8 90 40 33 60 52 14 317

X = 317 =10,2 31

Ch. 5 Les paramtres de tendance centrale II- La moyenne

B- Pour les variables quantitatives continues


* Non groupe

Moyenne

X=

!x
i =1

Avec :

xi = valeur de la variable X n = taille de lchantillon (effectif total)

Ch. 5 Les paramtres de tendance centrale II- La moyenne

B- Pour les variables quantitatives continues


* Groupe en classes
Pour des donnes groupes en classes, on peut calculer une valeur approximative de la moyenne en supposant que tous les individus dune classe se situent au centre de celle-ci.

Moyenne

X=
Avec :

!n C
i =1 i

Ci = centre de la classe ni = effectif correspondant la valeur xi n = taille de lchantillon (effectif total)

Ch. 5 Les paramtres de tendance centrale II- La moyenne

B- Pour les variables quantitatives continues


* Groupe en classes
Exemple : Moyenne en histoire-gographie dans une classe de terminale S

ni [6; 8[ [8; 10[ [10; 12[ [12; 14] [14; 16[ Total 3 6 11 7 4 31

Ci

ni C i

Ch. 5 Les paramtres de tendance centrale II- La moyenne

B- Pour les variables quantitatives continues


* Groupe en classes
Exemple : Moyenne en histoire-gographie dans une classe de terminale S

ni [6; 8[ [8; 10[ [10; 12[ [12; 14] [14; 16[ Total 3 6 11 7 4 31

Ci 7 9 11 13 15

ni C i 21 54 121 91 60 347

X = 347 =11,2 31

Ch. 5 Les paramtres de tendance centrale

III- La mdiane
Dfinition La mdiane est la valeur de la variable qui partage en 2 parties gales ou en 2 sous-ensemble gaux la population. Elle divise une srie statistique ordonne en deux ensembles comportant chacun 50% des donnes. 50% des valeurs sont suprieures la mdiane et 50% infrieures

Ch. 5 Les paramtres de tendance centrale III- La mdiane

A- Pour les variables quantitatives discrtes


Pour dterminer la mdiane dun chantillon ou dune population!: (1) on classe les individus par ordre croissant (2) on prend celui du milieu Avec n le nombre dindividus dans lchantillon, la mdiane porte le numro dordre n + 1 dans la suite des individus classs par ordre croissant.
2

2 cas * Si n est impair, la mdiane est la valeur dordre


n +1 2
n 2

* Si n est pair, la mdiane est la moyenne entre la valeur dordre valeur dordre n+2
2

et la

Ch. 5 Les paramtres de tendance centrale III- La mdiane

A- Pour les variables quantitatives discrtes


Exemple!1: * Soit un chantillon de 9 personnes dont le poids est!:
45 68 89 74 62 56 49 52 63 kg

classs par ordre croissant :


45 49 52 56 62 63 68 74 89 4 mdiane 4 kg

* Soit un chantillon de 10 personnes dont le poids est!:


45 49 52 55 56 62 63 68 74 89 5 5

mdiane =

56 + 62 = 59 kg 2

Ch. 5 Les paramtres de tendance centrale III- La mdiane

A- Pour les variables quantitatives discrtes


Exemple 2!:

Ch. 5 Les paramtres de tendance centrale III- La mdiane

A- Pour les variables quantitatives discrtes


Exemple 2!:

Me = 0

Ch. 5 Les paramtres de tendance centrale III- La mdiane

B- Pour les variables quantitatives continues


* Groupe en classes
' n (( +...+ )$ n n 1 i (1 " % 2 Me=Li+ !C % " ni & #

Avec : Li = borne infrieure de la classe mdiane n = taille de lchantillon (effectif total) ni = effectif de la classe mdiane C = amplitude de la classe mdiane n1++ni-1 = effectifs cumuls des classes prcdant la classe mdiane

Ch. 5 Les paramtres de tendance centrale III- La mdiane

B- Pour les variables quantitatives continues * Groupe en classes

Ch. 5 Les paramtres de tendance centrale III- La mdiane

B- Pour les variables quantitatives continues * Groupe en classes

La mdiane se situe dans la classe dge [30;40[ Me = 30 + ((0,5 0,306)/0,205)*10 = 39,5 ans

Ch. 5 Les paramtres de tendance centrale III- La mdiane

B- Pour les variables quantitatives continues * Groupe en classes


La mdiane peut tre lue graphiquement partir de la courbe des frquences cumules.

0,5

39,5

Ch. 5 Les paramtres de tendance centrale

Exercice : Nombre de tus dans un accident de la route en 2002

Age 0 14 ans 15 24 ans 25 44 ans 45 64 ans 65 84 ans Total

Effectifs 246 1855 2435 1356 1265 7157

1. 2. 3.

Quel est le mode de la distribution? Calculer la moyenne Calculer la mdiane

Source : Scurit Routire

Ch. 5 Les paramtres de tendance centrale

Exercice : Nombre de tus dans un accident de la route en 2002

Classes dge [0;15[ [15;25[ [25;45[ [45;65[ [65;85[ Total

Effectifs 246 1855 2435 1356 1265 7157

Frquences

Amplitude

Hauteur

Centre

Frquences cumules

Ch. 5 Les paramtres de tendance centrale

Exercice : Nombre de tus dans un accident de la route en 2002

Classes dge [0;15[ [15;25[ [25;45[ [45;65[ [65;85[ Total

Effectifs 246 1855 2435 1356 1265 7157

Frquences 0,03 0,26 0,34 0,19 0,18 1

Amplitude 15 10 20 20 20

Hauteur 16,4 185,5 121,75 67,8 63,25

Centre 7,5 20 35 55 75

Frquences cumules 0,03 0,29 0,63 0,82 1

Ch. 5 Les paramtres de tendance centrale

Exercice : Nombre de tus dans un accident de la route en 2002


2. Quel est le mode de la distribution? La classe modale est
Li = borne infrieure de la classe modale

' $ ( 1 " Mo= Li+% % "!C + & (1 (2 #

C = amplitude de la classe modale "1 = valeur hi de la classe modale valeur hi de la classe prcdente "2 = valeur hi de la classe modale valeur hi de la classe suivante

Ch. 5 Les paramtres de tendance centrale

Exercice : Nombre de tus dans un accident de la route en 2002


2. Quel est le mode de la distribution? La classe modale est [15;25[
Li = borne infrieure de la classe modale

' $ ( 1 " Mo= Li+% % "!C + & (1 (2 #

C = amplitude de la classe modale "1 = valeur hi de la classe modale valeur hi de la classe prcdente "2 = valeur hi de la classe modale valeur hi de la classe suivante

185,5(16,4 ' % Mo=15+ % (185,5(16,4)+(185,5(121,75) &

$ "!10 = 22,3 " #

Ch. 5 Les paramtres de tendance centrale

Exercice : Nombre de tus dans un accident de la route en 2002


3. Calculer la moyenne

X=
Classes dge [0;15[ [15;25[ [25;45[ [45;65[ [65;85[ Total

!n C
i =1 i

Ci = centre de la classe
i

ni = effectif correspondant la valeur xi n = taille de lchantillon (effectif total)

Effectifs 246 1855 2435 1356 1265 7157

Centre

ni Ci

Ch. 5 Les paramtres de tendance centrale

Exercice : Nombre de tus dans un accident de la route en 2002


3. Calculer la moyenne

X=
Classes dge [0;15[ [15;25[ [25;45[ [45;65[ [65;85[ Total

!n C
i =1 i

Ci = centre de la classe
i

ni = effectif correspondant la valeur xi n = taille de lchantillon (effectif total)

Effectifs 246 1855 2435 1356 1265 7157

Centre 7,5 20 35 55 75

ni Ci 1845 37100 85225 74580 94875 293625

X = 293625 =41,0 7157

Ch. 5 Les paramtres de tendance centrale

Exercice : Nombre de tus dans un accident de la route en 2002


5. Calculer la mdiane
' n (( +...+ $ ) n n 1 i ( 1 % "!C Me=Li+ 2 % " n i & #
Classes dge [0;15[ [15;25[ [25;45[ [45;65[ [65;85[ Total Frquences Frquences cumules
Li = borne infrieure de la classe mdiane n = taille de lchantillon (effectif total) ni = effectif de la classe mdiane C = amplitude de la classe mdiane n1++ni-1 = effectifs cumuls des classes prcdant la classe mdiane

Ch. 5 Les paramtres de tendance centrale

Exercice : Nombre de tus dans un accident de la route en 2002


5. Calculer la mdiane
' n (( +...+ $ ) n n 1 i ( 1 % "!C Me=Li+ 2 % " n i & #
Classes dge [0;15[ [15;25[ [25;45[ [45;65[ [65;85[ Total Frquences 0,03 0,26 0,34 0,19 0,18 1 Frquences cumules 0,03 0,29 0,63 0,82 1
Li = borne infrieure de la classe mdiane n = taille de lchantillon (effectif total) ni = effectif de la classe mdiane C = amplitude de la classe mdiane n1++ni-1 = effectifs cumuls des classes prcdant la classe mdiane

La mdiane se situe dans la classe dge [25;45[ Me = 25+((0,5-0,29)/0,34)*20 = 37,4

Ch. 5 Les paramtres de tendance centrale

IV- Quelle mesure de tendance centrale utiliser? A- Valeurs centrales et formes des distributions
Exemple : Nombre de tus dans un accident de la route en 2002
Histogramme norm
200 180 160 140
Effectifs

120 100 80 60 40 20 0
0 4 8 72 76 80 12 16 20 24 28 32 36 40 84 44 48 52 56 60 64 68

Mo

M Age X

Ch. 5 Les paramtres de tendance centrale IV Quelle mesure de tendance centrale utiliser ?

A- Valeurs centrales et formes des distributions


La comparaison des trois valeurs centrales ou l'examen de l'histogramme permettent de dfinir la forme des distributions. Selon la forme d'une distribution le meilleur rsum sera fourni par l'une ou l'autre des trois valeurs centrales. Distributions unimodales symtriques Lorsque la distribution est unimodale et symtrique, on trouve peu prs moyenne = mdiane = mode. => Le meilleur rsum est alors donn par la moyenne car elle tient compte de toutes les observations et elle possde des proprits statistiques intressantes.

F r q u e n c e X Mode = Mdiane = Moyenne

Ch. 5 Les paramtres de tendance centrale IV Quelle mesure de tendance centrale utiliser ?

A- Valeurs centrales et formes des distributions


chantillon de 100 individus
n o m b r e d i n d i v i d u s

20 15 10 5

Un cas particulier : la loi normale La distribution normale est le seul cas o la moyenne, la mdiane et le mode prennent des valeurs identiques. Au fur et mesure que la taille de l'chantillon augmente, l'histogramme devient de plus en plus rgulier et se rapproche d'une courbe en cloche, appele loi normale
200
n o m b r e d i n d i v i d u s

120

140

160

taille (cm)

180

chantillon de 10 000 individus


n o m b r e d i n d i v i d u s

1500 1000 500 0 120

140

160

taille (cm)

180

200

120

140

160

taille (cm)

180

200

Ch. 5 Les paramtres de tendance centrale IV Quelle mesure de tendance centrale utiliser ?

A- Valeurs centrales et formes des distributions


F r q u e n c e X M o d e M d i a n e M o y e n n e

Distributions unimodales dissymtriques Deux cas peuvent se prsenter : - La distribution est tale droite mode < mdiane < moyenne - La distribution est tale gauche moyenne < mdiane <mode => Lorsqu'il y a une dissymtrie marque, la mdiane est gnralement prfrable la moyenne car elle est moins influence par les valeurs exceptionnelles qui sont souvent l'origine de la dissymtrie. Si la dissymtrie est peu marque, on pourra nanmoins utiliser la moyenne.

F r q u e n c e X M o y e n n e M d i a n e M o d e

Ch. 5 Les paramtres de tendance centrale IV Quelle mesure de tendance centrale utiliser ?

A- Valeurs centrales et formes des distributions


Distributions bimodales ou multimodales La distribution comporte plusieurs modes. Le mode principal est diffrent de la! moyenne et de la mdiane qui ont de fortes chances de correspondre une zone de dispersion des valeurs. Dans ce cas, ni la moyenne ni la mdiane ne sont significatives. La distribution ne peut pas tre rsume par une seule valeur. Elle se compose de deux groupes trs diffrencis. => le meilleur rsum est alors donn par les modes principaux et secondaires de la distribution.
f r q u e n c e

X modes mode principal mode secondaire

Ch. 5 Les paramtres de tendance centrale IV Quelle mesure de tendance centrale utiliser ?

B- Avantages et inconvnients du mode, de la moyenne et de la mdiane


Le mode est la plus mauvaise mesure du centre, car la classe la mieux reprsente nest pas ncessairement au centre de la distribution. Si les valeurs extrmes sont modifies, la mdiane ne change pas car elle nest pas sensible aux valeurs extrmes. Par contre, la moyenne change car elle tient compte de toutes les valeurs.
M o d e

Observations
M d i a n e

Mdiane 3 3

Moyenne 2,8 21,6

1, 1, 3, 3, 6
M o y e n n e

1, 1, 3, 3, 100

P o u r c e n t a g e

On prfrera la mdiane ou la moyenne selon que lon veut une mesure sensible ou non aux valeurs extrmes.
revenu

Ch. 5 Les paramtres de tendance centrale IV Quelle mesure de tendance centrale utiliser ?

B- Avantages et inconvnients du mode, de la moyenne et de la mdiane


Exemple : Salaire moyen et salaire mdian !La magie des ingalits de revenus fait que deux tiers de la population salarie temps plein reoivent moins que la moyenne des salaris temps plein[] Do vient ce paradoxe apparent? Les salaires correspondant une structure fortement dissymtrique, o les quelques trs haut salaires tirent vers le haut une moyenne qui, de ce fait, stablit un niveau nettement suprieur celui de la population situe proprement parler au milieu de la socit. Cest pourquoi on utilise souvent la notion de mdiane, ou de salaire mdian, savoir celui qui divise la population en deux parties gales : dune part, ceux qui gagnent plus, dautre part, ceux qui gagnent moins. Ce salaire mdian se situe 1500 euros mensuels nets, soit 18% de moins que la moyenne.! (L. Chauvel, Les classes moyennes la drive, 2006, p.23) Remarque : Seuil de pauvret en France * moiti du revenu mdian (681 euros pour un individu seul) ! 6% de la pop. * 60% du revenu mdian (788 euros pour un individu seul) ! 12% de la pop.