Lessentiel
de la
Les
CARRs
.........
Armelle Math
Statistique
descriptive
Les
CARRs
47
98
07
51
5
.........
x.
co
:Ig
at
eg
ro
up
:5
72
64
34
34
:
88
83
29
85
:
41
.
13
7.
68
.2
22
:1
Armelle Math est enseignante dans de nombreux cursus et pour des publics trs divers. Elle
assure en effet lenseignement des mathmatiques appliques (statistiques et probabilits,
mathmatiques financires, techniques doptimisation) luniversit Paris 1 Sorbonne,
au Conservatoire National des Arts et Mtiers. Elle enseigne galement le contrle de
gestion lInstitut national des techniques conomiques et comptables et lEnoes. Elle est
membre du jury du DCG de ltat et de lIntec et participe la rdaction de sujets dexamen
dans ces matires.
na
l.s
ch
ol
ar
vo
er
na
tio
Suivez-nous sur
PRSENTATION
88
83
29
85
:
41
.
13
7.
68
.2
22
:1
47
98
07
51
5
vo
x.
co
m
:Ig
at
eg
ro
up
:5
72
64
34
34
:
La premire tche de la statistique consiste dcrire de faon prcise et rigoureuse les ensembles
quelle tudie sous langle particulier qui lintresse. Cette partie de la statistique est appele statistique descriptive. Elle se propose de traiter les observations afin de les prsenter dune
faon aisment lisible (tableaux, graphiques, etc.) et de dgager par le calcul un certain nombre
de grandeurs caractristiques de lensemble (moyenne, mdiane, indicateurs de dispersion, etc.).
in
te
rn
at
io
n
al
.s
ch
o
la
r
La tche ne sarrte pas l. Au-del des observations quelle peut effectuer, la statistique cherche
laborer des hypothses plus ou moins probables concernant certains vnements chappant son
observation directe; soit parce que ces vnements concernent des ensembles plus vastes que ceux
qui ont t observs (exemple, sondages), soit quil sagisse dvnements venir (valuation de la
proportion probable de ventes dune entreprise au cours de lanne venir).
Par exemple, les organismes officiels fourniront des statistiques descriptives concernant les accidents
de la route. partir de celles-ci, il sera possible de dterminer un certain nombre de probabilits
relatives au nombre daccidents et au cot des sinistres. On pourra ainsi prendre les dcisions
adaptes.
Cette deuxime partie de la statistique est appele statistique infrentielle ou statistique inductive. Celle-ci part des rsultats obtenus sur les chantillons observs, et, connaissant les diffrents
modles dvelopps (thorie des probabilits) permet dlaborer des hypothses valables avec de
fortes probabilits portant sur la population alors mme que celle-ci naura pas t observe de
faon exhaustive.
rn
at
io
n
al
.s
ch
o
la
r
vo
x.
co
m
:Ig
at
eg
ro
up
:5
72
64
34
34
:
88
83
29
85
:
41
.
13
7.
68
.2
22
:1
47
98
07
51
5
Chaque notion nouvelle est illustre de nombreux exemples, de schmas, de faon faciliter son
assimilation.
te
in
SOMMAIRE
47
98
07
51
5
Prsentation 3
11
11
88
83
29
85
:
41
.
13
7.
68
.2
22
:1
co
m
:Ig
at
eg
ro
up
:5
72
64
34
34
:
Vocabulaire 11
Le tri des donnes
13
13
a) Modalits
13
b) Effectif dune modalit
c) Frquence dune modalit
15
la
r
vo
x.
16
in
te
rn
at
io
n
al
.s
ch
o
18
18
18
19
21
21
22
27
27
31
te
rn
at
io
n
al
.s
ch
o
la
r
vo
x.
co
m
:Ig
at
eg
ro
up
:5
72
64
34
34
:
88
83
29
85
:
41
.
13
7.
68
.2
22
:1
47
98
07
51
5
SOMMAIRE
55
57
58
59
61
62
64
68
69
47
98
07
51
5
88
83
29
85
:
41
.
1 - Dfinition 81
2 - Le lissage des sries chronologiques 82
ch
o
la
r
vo
x.
co
m
:Ig
at
eg
ro
up
:5
72
83
84
84
84
io
n
al
.s
te
rn
at
87
89
92
92
97
98
99
SOMMAIRE
99
100
100
109
109
110
47
98
07
51
5
88
83
29
85
:
41
.
13
7.
68
.2
22
:1
Principe 121
Cfficient de dtermination r2 121
ro
up
:5
72
3 - Mthode 122
vo
x.
co
m
:Ig
at
eg
la
r
al
.s
125
te
rn
at
2 - Proprits 125
3 - Indices synthtiques 127
in
SOMMAIRE
Indice de Laspeyres
a) Cas particulier de lindice de Laspeyres des prix
b) Cas particulier de lindice de Laspeyres des quantits
Indice de Paasche
a) Cas particulier de lindice de Paasche des prix
b) Cas particulier de lindice de Paasche des quantits
Indice de Fisher
127
128
130
131
132
133
134
135
135
135
135
139
141
144
13
7.
68
.2
22
:1
64
34
34
:
88
83
29
85
:
41
.
149
149
149
150
72
in
te
rn
at
io
n
al
.s
ch
o
la
r
vo
x.
co
m
:Ig
at
eg
ro
up
:5
156
158
158
SOMMAIRE
in
at
rn
te
io
n
al
.s
ch
o
la
r
x.
vo
:Ig
co
m
13
7.
68
.2
22
:1
41
.
88
83
29
85
:
64
34
34
:
72
:5
ro
up
eg
at
47
98
07
51
5
Chapitre
Chapitre 10
1
13
7.
68
.2
22
:1
47
98
07
51
5
Sries statistiques
dune variable
64
34
34
:
88
83
29
85
:
41
.
ro
up
:5
72
Attention enfin: le terme statistique a un sens diffrent selon quil est employ au singulier ou au
pluriel:
x.
co
m
:Ig
at
eg
les statistiques concernent un ensemble de donnes observes (exemple: les statistiques de vente
dune entreprise);
ch
o
la
r
vo
in
te
rn
at
io
n
al
.s
Elle peut galement dsigner la variable alatoire utilise pour effectuer des estimations ou des tests, en
statistique infrentielle.
1 Le vocabulaire de la statistique
Statistique descriptive: ensemble de techniques permettant dtudier des populations travers
un certain nombre de critres. Lobjectif est de rsumer linformation, de caractriser les donnes,
de les faire parler.
Vocabulaire
Population: on dsigne sous ce terme lensemble qui est tudi, mme si les individus qui le composent ne sont pas des tres humains. Il est souvent impossible, pour des raisons pratiques ou pour
13
7.
68
.2
22
:1
47
98
07
51
5
elle est qualitative si ses valeursne sont pas numriques (par exemple le sexe, les catgories socioprofessionnelles, etc.). Dans le cas o les valeursdune variable qualitative sont codes avec des
nombres, elle est appele variable nominale (par exemple le code postal, le sexe (1 ou 2), sont
des variables nominales: leurs valeurssont des nombres mais il ny a pas dordre sur ces valeurs);
88
83
29
85
:
41
.
elle est quantitative si ses valeurssont numriques ou bien peuvent tre ordonnes de manire
logique). Parmi les variables quantitatives, on distingue les variables:
ro
up
:5
72
64
34
34
:
discrtes: les valeursprises par la variable sont alors en nombre fini ou dnombrable (par
exemple le nombre denfants, le salaire, le nombre de pices dune production, le nombre
dtoiles, etc.);
x.
co
m
:Ig
at
eg
ordinales: les valeurssont ordonnes de manire logique (par exemple le niveau de satisfaction
dune prestation peut prendre les valeurs0, 1, 2, 3, 4, de pas du tout satisfait trs satisfait).
rn
at
io
n
al
.s
ch
o
la
r
vo
Aussi bien la variable nominale que la variable ordinale prennent des valeurscodes. On peut toutefois les distinguer car dans le cas dune variable nominale, effectuer des oprations algbriques
avec ces valeurs, comme calculer une moyenne na pas de sens, contrairement la variable ordinale.
Par exemple, la moyenne de 1,5 pour le sexe na aucune signification, alors quun degr moyen de
satisfaction de la prestation gale 2 en a.
te
12
in
Si la variable est quantitative discrte, chaque diffrence entre deux variables de la variable a le
mme sens: ainsi pour la variable nombre denfants, la modalit 2enfants signifie 2fois plus
denfants que la modalit 1enfant. Ce nest pas le cas pour une variable ordinale et par exemple
la valeur4 du degr de satisfaction ne signifie pas que lon est 4fois plus satisfait que pour la valeur1.
continues: la variable peut alors prendre une infinit de valeurs, appartenant lensemble des
nombres rels, ou un intervalle de nombres rels (par exemple la dure dun vnement, la
longueur, le poids, etc.). Lorsque la variable est continue ou lorsquelle est discrte mais prend
un grand nombre de valeurs, le statisticien est conduit regrouper les valeursde la variable par
classes qui sont des intervalles de nombres rels.
13
7.
68
.2
22
:1
les diffrentes valeursde la variable sont notes x ou xi, avec des minuscules.
88
83
29
85
:
41
.
72
64
34
34
:
lissue de la collecte des donnes, on dispose de la valeurprise par la variable pour chaque
individu.
:Ig
at
eg
ro
up
:5
Ces donnes sont appeles les donnes brutes et sont ranges dans un tableau individuvariable.
al
.s
ch
o
la
r
vo
x.
co
m
Les donnes peuvent alors tre tries en fonction des diffrentes valeursde la variable. On obtient
alors un tableau modalits-effectifs.
te
rn
at
io
n
a) Modalits
in
On appelle modalits les valeursou regroupements de valeurseffectues par le statisticien qui traite
les donnes. Ces modalits sont le rsultat dun choix.
G
13
14
10
12
16
16
12
12
11
12
16
8
11
12
16
Total
2
1
4
3
10
13
7.
68
.2
22
:1
47
98
07
51
5
64
34
34
:
88
83
29
85
:
41
.
Dans ce cas, le statisticien a choisi comme modalits les diffrentes valeursde la variable.
Le statisticien peut galement choisir de trier les valeursde la variable selon dautres modalits, pour
les besoins de son tude:
Effectif de la modalit: ni
la
r
vo
x.
co
m
:Ig
at
eg
2
5
3
10
io
n
al
.s
ro
up
:5
72
xi
ch
o
in
te
rn
at
Notons que dans ce cas, la variable Note, par nature discrte, a t regroupe par classes de valeurs,
et est traite comme une variable continue. Le statisticien a choisi de trier les valeursde la variable
laide de trois modalits.
Exemple 2
Une enqute portant sur lge des individus qui se sont prsents une exposition a donn les
rsultats suivants:
15
16
17
18
15
16
17
18
15
16
17
18
15
16
17
18
15
16
17
18
15
16
17
18
15
16
17
18
15
17
17
18
15
17
17
18
15
17
17
18
16
17
17
18
16
17
17
18
16
17
17
18
16
17
17
18
16
17
17
19
16
17
18
19
16
17
18
19
16
17
18
19
16
17
18
19
16
17
18
19
[15; 16[
10
[16; 17[
17
[17; 18[
28
n3 = 28
[18; 19[
19
il y a 28individus dont
[19; 20[
Total
6
80
41
.
13
7.
68
.2
22
:1
47
98
07
51
5
ge: X
co
m
:Ig
at
eg
ro
up
:5
72
64
34
34
:
Lamplitude de la classe est gale la diffrence entre lextrmit infrieure et lextrmit suprieure
de chaque classe. Toutes les classes sont ici damplitude 1. On a tri les donnes laide de 5modalits damplitude 1an.
On peut galement choisir des modalits damplitudes ingales:
[17; 18[
28
[18; 20[
25
Total
80
te
rn
io
n
al
.s
ch
o
at
Effectif: ni
27
in
ge: X
[15; 17[
la
r
vo
x.
Par exemple:
G
15
16
Ainsi:
fi = ni / n
(en dcimaux)
0,2
0,1
0,4
0,3
1
13
7.
68
.2
22
:1
2
1
4
3
n = 10
41
.
8
11
12
16
Total
Frquence fi = ni / n
Frquence fi = ni / n
88
83
29
85
:
ni
(en pourcentages)
20
10
40
30
100
:5
72
xi
47
98
07
51
5
64
34
34
:
at
eg
ro
up
Ainsi, par exemple, llve a eu 4 fois la note 12, soit encore 40% de ses notes sont des 12.
ch
o
la
r
vo
x.
co
m
:Ig
Attention: la somme des frquences est gale 1 (si elles sont exprimes en pourcentages, leur
somme vaut 100).
rn
at
io
n
al
.s
te
13
7.
68
.2
22
:1
47
98
07
51
5
la mthode des quotas: le principe est de btir un chantillon qui soit un modle rduit de la
population initiale. Cette mthode est surtout employe dans les enqutes dopinion.
88
83
29
85
:
41
.
64
34
34
:
:Ig
at
eg
ro
up
:5
72
Les documents que lon utilise sont ceux fournis par la comptabilit de lentreprise, ceux du service
du personnel ou bien encore ceux relatifs la production, etc.
vo
x.
co
m
io
n
al
.s
ch
o
la
r
volution globale du march, tat de la concurrence, importance des importations par type de
produit et par pays dorigine, etc.
in
te
rn
at
De nombreux organismes nationaux tels lINSEE (Institut national de la statistique et des tudes
conomiques) ou internationaux tels que lOCDE (Organisation de coopration et de dveloppement
conomique) ou la Banque mondiale publient des statistiques relevant de domaines divers tels que
lindustrie, le commerce, la sant, la dmographie, lconomie, etc.
Dpouillement
Les donnes sont tries en fonction des modalits dfinies par le statisticien.
G
17
18
qui rsument linformation. On distinguera parmi ces indicateurs les caractristiques de position et
celles de dispersion.
13
7.
68
.2
22
:1
47
98
07
51
5
Pratiquement tous les graphiques reprsentatifs des sries statistiques sont fonds sur la notion de
proportionnalit entre laire de la surface associe une modalit et leffectif ou la frquence de
cette modalit.
Les types de reprsentation sont toutefois diffrents selon la nature de la variable reprsente, il est
donc indispensable, avant de choisir un mode de reprsentation, de rflchir sur la nature des
modalits.
88
83
29
85
:
41
.
:5
72
a) Le graphique secteurs
ch
o
la
r
vo
x.
co
m
:Ig
at
eg
Chaque secteur a un angle au centre, et donc une aire proportionnelle leffectif de la modalit
quil reprsente.
al
.s
Exemple3
at
io
n
in
te
rn
On dispose de donnes portant sur le mode dhbergement en 2013 pour les voyages
personnels.
Nuites
Hbergement marchand
Htel
Camping
Location, gte ou chambre dhte
Autre
Hbergement non marchand
Rsidence secondaire
En millions
469
144
92
164
69
709
167
En pourcentage
39,8%
12,2%
7,8%
13,9%
5,9%
60,2%
14,2%
432
86
24
1178
19
36,7%
7,3%
2,0%
100,0%
Corrig
13
7.
68
.2
22
:1
47
98
07
51
5
88
83
29
85
:
41
.
Hbergement marchand
Htel
64
34
34
:
Camping
Famille
Amis
at
eg
Autre
la
r
vo
x.
co
m
:Ig
Autre
ro
up
:5
72
Location, gte ou
chambre d'hte
Rsidence secondaire
io
n
al
.s
ch
o
te
rn
at
Chaque sous-population relative une modalit est reprsente par une bande.
Les bandes sont toutes de mme largeur et leur hauteur ou leur longueur est proportionnelle leffectif de la sous-population quelle reprsente. Ce type de reprsentation facilite les comparaisons.
Exemple 4
Tlvision, Hi-Fi, vido, photo
Informatique
Disques, cassettes, pellicules photo
Presse, livres et papeterie
Services culturels(1)
2013
7,2
9,4
2,7
13,9
17,0
2014
6,8
9,1
2,3
13,6
17,5
20
12,0
12,5
10,4
9,9
4,9
100,0
12,1
12,8
10,6
10,1
4,9
100,0
(1) Cinma,
13
7.
68
.2
22
:1
47
98
07
51
5
88
83
29
85
:
41
.
ro
up
:5
72
64
34
34
:
Le diagramme en tuyaux dorgue reprsentant les dpenses par catgorie pour chaque anne est
le suivant:
co
m
:Ig
at
eg
x.
2014
2013
ch
o
la
r
Jeux de hasard
at
io
n
al
.s
te
rn
8 10 12 14 16 18 20
Comparaison des dpenses culturelles et de loisirs en 2013 et en 2014: la principale dpense est
celle consacre aux services culturels, ce, aussi bien en 2013 quen 2014.
21
Notons que toutes les dpenses ont augment de 2013 2014 exceptes celles qui concernent la
presse, les livres et papeterie, celles consacres aux disques, cassettes, pellicules photo, linformatique, ainsi qu la tlvision, la hi-fi, la vido, et la photo.
47
98
07
51
5
Si la srie est variable quantitative, on peut alors classer les diffrentes valeursde la variable sur
un axe gradu.
Le diagramme diffrentiel des effectifs ou des frquences est un diagramme cartsien reprsentatif
dune srie variable quantitative.
ro
up
:5
72
64
34
34
:
88
83
29
85
:
41
.
13
7.
68
.2
22
:1
Il prend une forme diffrente selon que la variable est discrte ou continue.
Notons bien la diffrence entre le diagramme en btons qui est un diagramme cartsien et le
diagramme en bandes. Un diagramme cartsien est un diagramme pour lequel les valeursde
la variable sont repres sur un axe gradu. Il ne faut pas confondre cet axe gradu, sur lequel
on a une chelle (une norme) et donc un ordre avec le simple segment dun diagramme en bandes
sur lequel reposent les diffrentes modalits dune variable qualitative, dont les places peuvent
commuter puisque les valeursde ces variables nont pas dordre.
:Ig
at
eg
x.
co
m
in
te
rn
at
io
n
al
.s
ch
o
la
r
Le diagramme en btons est un diagramme cartsien. Les valeursde la variable sont reprsentes
par ordre croissant sur laxe des abscisses. chacune de ces valeurs, correspond un bton dont la
hauteur est proportionnelle leffectif ou la frquence de la modalit.
Exemple5
On considre les donnes brutes suivantes, qui donnent le nombre de personnes vivant au foyer des
individus interrogs.
3
3
3
3
3
3
2
3
2
3
4
3
4
2
4
6
4
4
4
4
2
4
2
4
4
4
4
4
4
2
6
6
22
Corrig
Il faut dabord trier les donnes. On obtient le tableau modalits-effectifs suivant:
Nombre de personnes au foyer
2
3
4
6
Nombre de foyers
6
9
14
3
Nombre de foyers
13
7.
68
.2
22
:1
15
47
98
07
51
5
Do le diagramme en btons:
88
83
29
85
:
41
.
10
4
5
6
Nombre de personnes
:5
:Ig
at
eg
ro
up
72
64
34
34
:
vo
x.
co
m
lhistogramme
al
.s
ch
o
in
te
rn
at
io
n
Rappelons que si la srie est variable continue, les valeursde la variable sont regroupes sous forme
de classes, cest--dire dintervalles de nombres rels.
Lhistogramme est constitu de rectangles dont laire est proportionnelle leffectif (ou la frquence)
de chaque classe.
Laire dun rectangle tant gale au produit de la largeur par la hauteur, les bases des rectangles
correspondent aux diffrentes classes et les hauteurs des rectangles sont gales aux effectifs (frquences) par unit damplitude.
Effectif par unit damplitude =
On appelle effectif corrig ou effectif rectifi leffectif par unit damplitude dune classe.
23
41
.
13
7.
68
.2
22
:1
47
98
07
51
5
64
34
34
:
ro
up
:5
72
Corrig
x.
co
m
:Ig
at
eg
io
n
al
.s
ch
o
la
r
vo
Il faut donc dterminer les effectifs ou frquences par unit damplitude, de faon construire des
rectangles dont laire est proportionnelle leffectif ou la frquence de la classe.
in
te
rn
at
Amplitude de la classe: ai
Nombre dappartements
ni
[5; 10[
[10; 20[
[20; 40[
[40; 45[
[45; 50[
[50; 70[
[70; 100[
10 5 = 5
20 10 = 10
40 20 = 20
45 40 = 5
50 45 = 5
70 50 = 20
100 70 = 30
3
14
26
30
26
42
9
3/5 = 0,6
14/10 = 1,4
26/20 = 1,3
30/5 = 6
26/5 = 5,2
42/20 = 2,1
9/30 = 0,3
24
6
5
2,
5
7,
5
12
,5
17
,5
22
,5
27
,5
32
in
te
,5
rn
at
io
37
na
,5
l.s
ch
ol
4
ar
2,
vo
5
x.
co
4
m
7
:Ig
,5
at
eg
52
ro
up
,5
:5
725
647
3,45
3
62 4:88
,5 832
98
67
5:
41
,5
.1
37
72
.6
8.
,5
22
2:
14
77
79
,5
80
75
82
15
,5
87
,5
92
,5
97
,5
4
3
2
1
0
Superficies
Sur laxe horizontal, on lit les valeursde la variable, cest--dire les superficies, sur laxe vertical, on
lit les effectifs corrigs. On dtermine les effectifs des classes en multipliant le nombre dunits
damplitude des classes par les effectifs corrigs qui correspondent.
Il a t choisi 1mtre carr comme unit damplitude pour construire le prcdent histogramme.
Si lunit damplitude est maintenant gale 5mtres carrs, les amplitudes des classes et par
consquent les effectifs par units damplitudes sont modifis. On obtient:
Superficie en m: xi
Amplitude de la classe: ai
Nombre dappartements
ni
[5; 10[
[10; 20[
[20; 40[
[40; 45[
[45; 50[
[50; 70[
[70; 100[
(10 5)/5 = 1
(20 10)/5 = 2
(40 20)/5 = 4
(40 4)/5 = 1
(50 4)/5 = 1
(70 50)/5 = 4
(100 70)/5 = 6
3
14
26
30
26
42
9
3/1 = 3
14/2 = 7
26/4 = 6,5
30/1 = 30
26/1 = 26
42/4 = 10,5
9/6 = 1,5
25
35
30
25
2,
5
7,
5
12
,5
17
,5
22
,5
27
,5
in
32
te
rn
,5
at
io
37
na
l.s
,5
ch
ol
42
ar
vo
,5
x.
co
m
4
7,
:Ig
5
at
eg
ro
5
2,
up
5
:5
72
654
734,
534
62 :888
,5 329
85
67
:4
1.
,5
13
7.
68
72
.2
,5
22
:1
47
77
98
,5
07
51
82
5
,5
87
,5
92
,5
97
,5
20
15
10
5
0
Superficies
La forme de lhistogramme est exactement la mme, seule la graduation sur laxe vertical est modifie. Rappelons que les effectifs correspondent aux aires des rectangles, on retrouve le mme effectif
dans chacune des modalitsque lon choisisse le premier diagramme ou le second.
Par exemple, leffectif de la modalit [40; 45[ est gal 65 = 30 partir du premier histogramme
puisque lunit damplitude est gale 1; leffectif de cette mme modalit [40; 45[ est gal
301 = 30 pour le deuxime histogramme puisquune unit damplitude est gale 5. Ceci
correspond bien au nombre dappartements observs qui ont une surface comprise entre 40 et
45 mtres carrs.
On reprend lexemple 2: ge des individus qui se sont prsents
pour la visite dune exposition
On veut reprsenter graphiquement cette distribution.
Corrig
La variable ge est continue, la reprsentation de la srie est un histogramme.
26
Dans le cas o les donnes ont t tries dans 5classes damplitude 1an, la rpartition est rsume
dans le tableau ci-dessous:
[15; 16[
[16; 17[
[17; 18[
[18; 19[
[19; 20[
Total
10
17
28
19
6
80
47
98
07
51
5
Effectifs
10
17
28
19
6
13
7.
68
.2
22
:1
Classes dge
88
83
29
85
:
41
.
la
r
vo
x.
co
m
:Ig
at
eg
ro
up
:5
72
20,5
ges
te
rn
at
io
n
al
.s
30
25
20
15
10
5
0
64
34
34
:
ch
o
in
Dans le cas o la rpartition est faite en 3 classes damplitudes ingales: [15; 17[; [17; 18[;
[18; 20[. On a la rpartition suivante:
Classes dge
Effectifs
[15; 17[
[17; 18[
[18; 20[
Total
27
28
25
80
20,5
13
7.
68
.2
22
:1
ges
47
98
07
51
5
30
25
20
15
10
5
0
ro
up
:5
72
64
34
34
:
88
83
29
85
:
41
.
Nous constatons cette fois que la reprsentation graphique nest pas la mme. Selon le choix des
regroupements de valeurseffectu par le statisticien qui traite les donnes, les reprsentations graphiques sont diffrentes. Le choix des modalits nest pas sans consquence sur lanalyse de la srie.
Les courbes cumulatives permettent de dterminer le nombre dindividus (ou la proportion dindividus) pour lesquels la variable est infrieure (ou suprieure) une valeurparticulire.
co
m
:Ig
at
eg
al
.s
ch
o
la
r
vo
x.
Cette courbe permet de dterminer le nombre dindividus pour lesquels la variable prend une
valeurinfrieure x0, x0 tant un nombre rel.
in
te
rn
at
io
n
Dans le cas de variables continues: cest la courbe constitue par les points ayant pour abscisses
les bornes suprieures des classes et pour ordonnes les effectifs (frquences) cumuls croissants.
Cette courbe est, elle aussi, croissante.
G
27
28
at
eg
ro
up
:5
72
64
34
34
:
88
83
29
85
:
41
.
Effectifs
10
17
28
19
6
80
co
m
Classes dge
[15; 16[
[16; 17[
[17; 18[
[18; 19[
[19; 20[
Total
13
7.
68
.2
22
:1
47
98
07
51
5
partir des donnes tries, on somme les effectifs des classes pour obtenir les effectifs cumuls
croissants (ou les frquences cumules croissantes), cest--dire le nombre (ou la proportion) de
visiteurs qui ont moins de x annes.
Ces effectifs correspondront aux ordonnes des points de la courbe des effectifs cumuls
croissants.
:Ig
in
te
rn
at
io
n
al
.s
ch
o
la
r
vo
x.
Ainsi, par exemple, 10visiteurs ont moins de 16ans, 74 ont moins de 19ans.
Il est possible, bien sr, dextrapoler pour obtenir le nombre dindividus qui ont moins de tel ou tel
ge, ou de rsoudre le problme rciproque.
Il faut rajouter le point de coordonnes (15; 0) puisquaucun visiteur na moins de 15ans.
Courbe cumulative croissante des ges
100
80
60
40
20
0
14
16
18
20
22
ges
Effectifs
10
17
28
19
6
80
13
7.
68
.2
22
:1
Classes dge
[15; 16[
[16; 17[
[17; 18[
[18; 19[
[19; 20[
Total
88
83
29
85
:
41
.
Ainsi, par exemple, 70individus ont plus de 16ans, 53 ont plus de 17ans. Ce sont les bornes
suprieures des classes qui sont attaches aux effectifs cumuls dcroissants.
Il faut rajouter cette fois le point de coordonnes (20; 0) puisquaucun visiteur na plus de 20ans.
64
34
34
:
:5
72
100
co
m
:Ig
at
80
vo
x.
60
al
.s
ch
o
la
r
40
at
rn
te
14
in
io
n
20
16
18
20
22
ges
Remarques: le travail effectu avec les effectifs peut aussi bien ltre avec les frquences. Les deux
courbes cumulatives se coupent au point dordonne gal la moiti de leffectif total (frquence
gale 50%). Labscisse de ce point est gale la valeurmdiane de la srie.
Exemple 7: le cas dune variable quantitative discrte
On dispose dinformations quant au nombre dachats X par jour dun article A. Lobservation a t
faite sur 200jours et les frquences ont t calcules.
G
29
30
X = x1
0
1
2
3
Total
47
98
07
51
5
Corrig
co
m
:Ig
at
eg
ro
up
:5
72
64
34
34
:
f1 : frquences
0,8%
9,6%
38,4%
51,2%
1
vo
x.
X = x1
0
1
2
3
88
83
29
85
:
41
.
Il faut dabord dterminer les frquences cumules croissantes, cest--dire la proportion des jours
pour lequel le nombre dachat est infrieur x, o x est un nombre rel.
in
te
rn
at
io
n
al
.s
ch
o
la
r
F(x)
3 2 1 0
5 x
41
.
13
7.
68
.2
22
:1
les caractristiques de dispersion, qui permettent dapprhender la disparit des valeursobserves de la variable.
88
83
29
85
:
72
64
34
34
:
ro
up
:5
a) La moyenne arithmtique
in
te
rn
at
io
n
al
.s
ch
o
la
r
vo
x.
co
m
:Ig
at
La moyenne arithmtique est la caractristique de position la plus souvent utilise, elle prend en
compte toutes les diffrentes valeursprises par la variable.
Elle a galement lavantage de pouvoir tre calcule facilement, puisquelle est le rsultat dune
formule.
Toutes les calculatrices ont ainsi une fonctionnalit permettant dobtenir sa valeur.
Soit x la moyenne arithmtique des valeursxi de la variable.
Il faut, avant tout calcul, dterminer si les donnes dont on dispose sont des donnes brutes (on a
un tableau individus-variables), ou si elles ont t tries (on a un tableau modalits-effectifs ou
modalits-frquences).
x =
x i
i =1
G
31
32
x1 + x2 + x3 + xn
si les valeurs x1, x2, x3, xn reprsentent
n
les diffrentes valeursprises par la variable.
3
2
3
4
2
2
3
4
2
4
3
4
4
4
3
4
4
4
2
2
13
7.
68
.2
22
:1
3
4
3
4
41
.
3
4
3
4
47
98
07
51
5
Un lve a obtenu les notes: 12, 15, 6, 12, 12, 15. Sa moyenne sera: 12 + 15 + 6 + 12 + 12 + 15 = 12
6
Reprenons lexemple 4, portant sur le nombre de personnes vivant au foyer des individus
interrogs.
88
83
29
85
:
4
6
6
6
:Ig
at
eg
ro
up
:5
72
64
34
34
:
ch
o
la
r
vo
x.
co
m
te
rn
at
io
n
al
.s
x = 15 + 15 + L + 19 = 16,925
80
in
Lge moyen des visiteurs est gal 16,925ans, soit pratiquement 17ans.
x =
ni xi
i =1
Avec:
ni: effectif de la classe ou de la modalit;
fi: frquence de la classe ou de la modalit;
xi: valeurprise par la variable X.
ou x =
fi xi
i =1