Vous êtes sur la page 1sur 8

Statistique descriptive ECS 1

STATISTIQUE DESCRIPTIVE


I Vocabulaire de la statistique descriptive
1) Population
La statistique descriptive est une science qui recueille et analyse des informations sur
un ensemble fini, dont le cardinal est souvent trs grand.
Dfinition : Lensemble tudi sappelle une population. Les lments de cet ensemble
sappellent des individus.
La population tant en gnral trs grande, on tudie souvent une partie seulement.
Dfinition : Un chantillon est une partie de la population. Le cardinal de cette partie
sappelle la taille de lchantillon.
Dans la suite, dsignera la population ou lchantillon observ. Plus tard (en
seconde anne), on distinguera les deux car on voudra, partir dobservations sur
lchantillon, dduire des proprits de la population entire.
2) Caractre statistique
La question est maintenant : quest-ce quon tudie sur cette population ?
Exemple : la couleur des yeux, la taille, le poids, le nombre de frres et surs,
Dfinition : On appelle caractre statistique ou variable statistique toute application X
dfinie sur la population .
Si lapplication X est valeurs dans R, on dira que le caractre est quantitatif. Sinon,
on dira que le caractre est qualitatif.
Le premier exemple est qualitatif, alors que les autres sont quantitatifs.
3) Etude du caractre
Les diffrentes tapes dune tude statistique sont :
Recueillir les donnes.
Les classer car on les obtient en vrac .
Les reprsenter graphiquement pour avoir un aspect visuel.
Analyser ces donnes, cest--dire les rsumer par quelques
nombres significatifs.
Pour classer, la premire ide est de considrer toutes les valeurs possibles du
caractre, donc ( ) X et de regrouper tous les lments qui correspondent la
mme valeur. Par exemple si lon observe 10 individus numrots de 1 10 :
i 1 2 3 4 5 6 7 8 9 10
( )
i
X 2 5 5 8 4 5 4 4 5 8
On renumrote et on va classer sous la forme :
j
1 2 3 4
j
x
2 4 5 8
j
n
1 3 4 2
j
n reprsente le nombre dindividus dont le caractre prend la valeur
j
x . Cest
leffectif de la classe
j
x . Lensemble des couples ( , )
j j
x n est une srie statistique.
Cependant, dans le cas dun caractre quantitatif, lorsque les donnes sont trop
nombreuses ou trop proches, on les regroupe en classes qui peuvent tre des intervalles
de R. On dira que le caractre est quantitatif continu par opposition aux autres qui
sont quantitatifs discrets.
Cours de mathematiques - ECS1 - Catherine Laidebeure - Lycee Albert Schweitzer, Le Raincy - 2011
Statistique descriptive ECS 1
II - Variable qualitative
1) Classement des donnes
Pour une variable qualitative, chaque classe correspond une valeur du caractre. Le
nombre dindividus qui appartiennent cette classe sappelle leffectif de la classe. La
somme des effectifs de toutes les classes est leffectif total de la population.
Exemple : Moyen de transport pour le trajet domicile - travail. Le tableau suivant
donne les effectifs de chaque classe. Recopier le tableau et calculer leffectif total.
Classe Car - Bus Auto - Moto Vlo A pied Tram - Mtro
Effectif 162 204 18 72 144
Lintrt dune tude statistique tant de pouvoir rutiliser les rsultats obtenus pour
dautres populations, ce nest pas leffectif dune classe qui importe, mais la
proportion dindividus qui appartiennent cette classe.
Dfinition : On appelle frquence de la classe le quotient de leffectif de la classe par
leffectif total. La somme des frquences de toutes les classes est gale 1.
Exemple : la frquence de la classe Vlo est 03 , 0
600
18
= . Il y a 3% des employs
qui viennent vlo. Ajouter au tableau prcdent une ligne indiquant les frquences de
chaque classe et vrifier (aux erreurs dapproximation prs) que la somme des
frquences vaut 1.
2) Reprsentations graphiques
La reprsentation la plus courante est le diagramme circulaire : langle du secteur
reprsentant la classe est proportionnel leffectif (et donc la frquence).
Exemple : langle associ la classe Vlo serait de = 8 , 10 360 03 , 0 . Faire tout
le diagramme circulaire de lexemple prcdent.
Une autre reprsentation possible est le diagramme en btons : la hauteur du bton
reprsentant la classe est proportionnelle son effectif.
3) Analyse de la variable statistique
On ne peut dfinir quune seule caractristique.
Dfinition : On appelle mode ou classe modale la classe (ou les classes) qui a le plus
grand effectif.
Exemple : Dterminer la classe modale de lexemple prcdent.
III - Variable quantitative discrte
1) Classement des donnes
Pour une variable quantitative discrte, chaque classe correspond aussi une valeur du
caractre, mais qui a une valeur numrique relle
i
x . Le nombre dindividus qui
appartiennent cette classe sappelle leffectif
i
n de la classe. La somme des effectifs
de toutes les classes est leffectif total de la population :

=
=
p
i
i
n n
1
(sil y a p classes).
La frquence de la classe est le quotient de son effectif par leffectif total :
n
n
f
i
i
= .
On supposera que les classes sont numrotes par ordre croissant de la valeur du
caractre :
p
x x x < < < ...
2 1
.
Leffectif
i
n est le nombre dindividus tels que
i
x X = ) ( .
La famille
p i i i
n x
1
) , ( est appele srie statistique (discrte).
Cours de mathematiques - ECS1 - Catherine Laidebeure - Lycee Albert Schweitzer, Le Raincy - 2011
Statistique descriptive ECS 1
Exemple : On a relev les notes obtenues un devoir. Le tableau suivant donne les
effectifs de chaque classe.
Classe
i
x 4 5 6 7 8 9 10 11 12 13 14 15
Effectif
i
n 2 0 3 4 3 5 7 4 3 2 2 1
Dans cet exemple, il y a 12 classes : 12 = p . La 5
me
modalit (valeur du caractre
dans la classe) est 8
5
= x et leffectif correspondant est 3
5
= n : il y a 3 lves qui ont
eu 8 au devoir.
Recopier le tableau, calculer leffectif total et complter le tableau en calculant les
frquences.
Dfinition : On appelle effectif cumul croissant de la i-me classe :

=
=
i
k
k i
n N
1
et
frquence cumule croissante :

=
= =
i
k
k
i
i
f
n
N
F
1
.
Leffectif cumul croissant
i
N est le nombre dindividus tels que
i
x X ) ( .
On peut remarquer que 1 =
p
F .
Exemple : 12
5
= N , donc il y a 12 lves qui ont eu une note infrieure ou gale 8 et
33 , 0
5
= F , donc il y a 33% des lves qui ont eu une note infrieure ou gale 8.
Complter le tableau en calculant les effectifs cumuls croissants, ainsi que les
frquences cumules correspondantes.
2) Reprsentations graphiques
On se place dans un repre orthogonal et on trace partir du point de coordonnes
) 0 , (
i
x un segment vertical de hauteur proportionnelle leffectif
i
n (et donc la
frquence
i
f ). On obtient ainsi le diagramme en btons des effectifs (et des
frquences). La ligne polygonale qui joint les sommets des btons est appele
polygone des effectifs (ou des frquences).
On dfinit de mme le diagramme en btons des effectifs (ou des frquences) cumuls
ainsi que le polygone des effectifs (ou des frquences) cumuls.
Exemple : Tracer le diagramme en btons et le polygone des effectifs, puis sur une
autre figure le diagramme en btons et le polygone des effectifs cumuls croissants.
3) Analyse de la srie statistique
a) Caractristiques de position
Il sagit de rsumer la srie statistique par un nombre qui donne une image de son
comportement.
On peut dabord penser la valeur prise le plus souvent.
Dfinition : Le mode est la valeur (ou les valeurs) de la variable pour laquelle leffectif
est maximal. La (ou les) classe modale est la classe correspondante.
Exemple : Calculer le mode de la srie prcdente.
Le mode donne un renseignement intressant, mais le simple fait quil y en ait
plusieurs ne permet pas de lutiliser valablement.
On peut ensuite penser la valeur qui partage la population en deux parties gales.
Dfinition : La mdiane est une valeur m de la variable telle que le nombre dindividus
tels que m X < ) ( soit gal au nombre dindividus tels que m X > ) ( .
Cours de mathematiques - ECS1 - Catherine Laidebeure - Lycee Albert Schweitzer, Le Raincy - 2011
Statistique descriptive ECS 1
Dtermination pratique : Si leffectif total de la population est n, on classe par ordre
croissant les n valeurs ) ( X correspondantes. Si n est impair ( 1 2 + = q n ), la mdiane
est la valeur de rang ( 1 + q ). Si n est pair ( q n 2 = ), la mdiane est la moyenne des
valeurs de rang q et ( 1 + q ).
Exemple : Dans la srie prcdente, dterminer la parit de n, puis la valeur de q, puis
laide des effectifs cumuls la mdiane.
La mdiane prsente un intrt certain, mais se prte mal aux calculs thoriques.
Cest finalement la moyenne arithmtique qui est la plus usite.
Dfinition : On appelle moyenne de la srie statistique
p i i i
n x
1
) , ( deffectif total n le
rel

= =
= =
p
i
i i
p
i
i i
x f x n
n
x
1 1
1
.
Cest la caractristique la plus reprsentative. Cest la moyenne arithmtique simple de
toutes les valeurs ) ( X obtenues pour tous les individus ou encore la moyenne
arithmtique de toutes les valeurs
i
x du caractre pondres par les effectifs ou les
frquences.
Exemple : Calculer la moyenne de la srie prcdente.
Proprit : Si a et b sont des rels, b x a b ax + = + .
Dmonstration : On pose b aX Y + = . Donc pour tout , b aX Y + = ) ( ) ( .
Si 0 a , pour tout i, Y prend la valeur b ax y
i i
+ = si et seulement si X prend la
valeur
i
x , donc leffectif de la classe
i
y est
i
n . Donc :
b x a n
n
b x n
n
a b ax n
n
y n
n
y
p
i
i
p
i
i i
p
i
i i
p
i
i i
+ = + = + = =

= = = = 1 1 1 1
1 1
) (
1 1
.
Si 0 = a , Y est constante et prend une seule valeur b. Donc b x a b y + = = .
b) Caractristiques de dispersion
Il sagit de mesurer la rpartition de X autour de sa moyenne car un seul nombre ne
suffit pas prciser le comportement de la srie.
Par exemple, la srie tudie prcdemment et les sries suivantes ont mme moyenne,
mais la rpartition des notes est tout fait diffrente.
Classe
i
x 4 5 6 7 8 9 10 11 12 13 14 15
Effectif
i
n 2 3 5 8 1 2 1 0 1 3 4 6
Celle-ci est beaucoup plus disperse. La suivante est beaucoup plus concentre.
Classe
i
x 8 9 10 11 12
Effectif
i
n 9 8 12 6 1
On veut donc mesurer la dispersion de X, donc les carts la moyenne, cest--dire
tudier la variable centre associe X : x X Y = . Il y a diverses manires de
mesurer ces carts. La mthode la plus courante est le calcul de lcart-type, moyenne
quadratique des carts.
Dfinition : On appelle variance de la srie statistique
p i i i
n x
1
) , ( deffectif total n le
rel

=
=
p
i
i i
x x n
n
X V
1
2
) (
1
) ( et cart-type le rel ) ( X V
x
= (car 0 ) ( X V ).
Cours de mathematiques - ECS1 - Catherine Laidebeure - Lycee Albert Schweitzer, Le Raincy - 2011
Statistique descriptive ECS 1
Proprits : 1)
2
1
2
1
) ( x x n
n
X V
p
i
i i
=

=
2) ) ( ) (
2
X V a b aX V = + et
x b ax
a =
+

Dmonstration : 1)

= =
+ = =
p
i
i i i
p
i
i i
x x x x n
n
x x n
n
X V
1
2
2
1
2
) 2 (
1
) (
1
) (
2
1
2
2 2
1
2
1
2
1 1
2
1
2
1 1 2 1
) ( x x n
n
x x x n
n
n x
n
x n x
n
x n
n
X V
p
i
i i
p
i
i i
p
i
i
p
i
i i
p
i
i i
= + = + =

= = = = =
.
2) Si 0 = a , b aX Y + = est constante, gale b. Il ny a quune classe et b y = .
Donc : 0 ) ( = Y V . Donc ) ( 0 ) (
2
X V a b aX V = = + .
Si 0 a , b aX Y + = prend les valeurs b ax y
i i
+ = avec leffectif
i
n et b x a y + = .
Donc :

= =
+ + = =
p
i
i i
p
i
i i
b x a b ax n
n
y y n
n
Y V
1
2
1
2
)] ( ) [(
1
) (
1
) (
) ( ) (
1
) (
1
) (
2
1
2 2
1
2 2
X V a x x n
n
a x x a n
n
Y V
p
i
i i
p
i
i i
= = =

= =
.
Exemple : Calculer les carts-types des trois sries cites et les comparer.
On dmontre que en gnral lintervalle ] , [
x x
x x + contient environ 68% de
la population et que lintervalle ] 2 , 2 [
x x
x x + contient environ 95% de la
population. On en verra la justification thorique en probabilits plus tard.
IV - Variable quantitative continue
1) Classement des donnes
On regroupe les valeurs prises par la variable en p intervalles adjacents qui nont
dailleurs pas forcment tous la mme largeur : [ , [
2 1
a a , [ , [
3 2
a a , , [ , [
1 + p p
a a o
les
i
a sont des rels qui vrifient
1 2 1
...
+
< < < <
p p
a a a a . La i-me classe [ , [
1 + i i
a a
est lensemble des individus tels que
1
) (
+
<
i i
a X a . Il peut galement y avoir
des classes Moins de a (ensemble des individus tels que a X < ) ( ) ou Plus
de b (ensemble des individus tels que b X ) ( ).
Les dfinitions des effectifs, de leffectif total, des frquences restent les mmes que
pour une srie statistique discrte. On notera
i
n leffectif de la i-me classe,
i
f sa
frquence et n leffectif total.
Par contre, on dfinit deux types deffectifs et de frquences cumuls en vue du calcul
de la mdiane.
Leffectif cumul croissant de la i-me classe [ , [
1 + i i
a a est

=
=
i
k
k i
n N
1
et la frquence
cumule croissante est :

=
= =
i
k
k
i
i
f
n
N
F
1
.
Leffectif cumul dcroissant de la i-me classe [ , [
1 + i i
a a est

=
=
p
i k
k i
n N' et la
frquence cumule croissante est :

=
= =
p
i k
k
i
i
f
n
N
F
'
' .
Cours de mathematiques - ECS1 - Catherine Laidebeure - Lycee Albert Schweitzer, Le Raincy - 2011
Statistique descriptive ECS 1
Leffectif cumul croissant
i
N est le nombre dindividus tels que
1
) (
+
<
i
a X ,
tandis que leffectif cumul dcroissant
i
N' est le nombre dindividus tels que
i
a X ) ( .
On remarque que n N N
p
= =
1
' et que pour tout i, n N N
i i
= +
+1
' .
Et donc : n F F
p
= =
1
' et pour tout i, 1 '
1
= +
+ i i
F F .
Exemple : Le tableau suivant donne la rpartition des ges des 152 ouvriers dune
entreprise.
Classe Moins de 20 [20,25[ [25,30[ [30,35[ [35,40[ [40,50[ [50,60[ Plus de 60
Effectif 1 7 28 36 45 26 8 1
La troisime classe est [25,30[. Leffectif est 28
3
= n : il y a 28 ouvriers qui ont au
moins 25 ans et moins de 30 ans. La frquence est 184 , 0
152
28
3
= = f : il y a 18,4% des
ouvriers dans cette catgorie dge. Leffectif cumul croissant est 36
3
= N et la
frquence cumule croissante est 237 , 0
152
36
3
= = F : il y a 23,7% des ouvriers qui ont
moins de 30 ans. Leffectif cumul dcroissant est 144 '
3
= N et la frquence cumule
dcroissante de la classe est 947 , 0
152
144
'
3
= = F : il y a 94,7% douvriers qui ont au
moins 25 ans.
Recopier le tableau prcdent et le complter par des lignes donnant les frquences, les
effectifs et les frquences cumules croissants et dcroissants.
2) Reprsentations graphiques
On se place dans un repre orthogonal et on reprsente chaque classe [ , [
1 + i i
a a par un
rectangle dont la base est le segment qui joint les points de coordonnes (a ,0) et (a ,0)
et dont laire (et non la hauteur) est proportionnelle leffectif (et donc aux
frquences). Une telle reprsentation sappelle un histogramme.
Remarque : On considre laire et non la hauteur pour compenser le fait que les classes
nont pas toutes la mme largeur. Dans lexemple, les classes [40,50[ et [50,60[ ont
une largeur double des autres classes. Elles seront reprsentes par des rectangles dont
la hauteur sera respectivement 13 et 4. Le plus souvent, une classe de largeur double
sera reprsente en ralit par deux rectangles accols de mme largeur que les autres
classes (par exemple, la classe [40,50[ sera reprsente par deux rectangles de base 5
et de hauteur 13, comme sil y avait 13 ouvriers entre 40 et 45 ans et 13 ouvriers entre
45 et 50 ans). On dira que lon a utilis des classes unitaires.
Lorsque la classe est Moins de a ou Plus de b , sa reprsentation sera faite par
un rectangle dont la base aura mme largeur que la classe voisine.
Exemple : Dans toute la suite, la classe Moins de 20 sera identifie une classe de
mme largeur que [20,25[, cest--dire [15,20[, et donc reprsente par un rectangle de
base 5 et de hauteur 1, alors que la classe Plus de 60 sera identifie [60,70[ et
donc reprsente par un rectangle de base 10 et de hauteur 0,5.
Pour construire le polygone des effectifs (ou des frquences), on considre leffectif
(ou la frquence) concentr au centre de chaque classe (ventuellement unitaire), cest
dire en ) (
2
1
1 +
+ =
i i i
a a x et on joint les points de coordonnes ) , (
i i
n x ou ) , (
i i
f x .
Exemple : Tracer sur une figure lhistogramme et le polygone des effectifs de la srie
prcdente.
Leffectif cumul croissant
i
N de la classe [ , [
1 + i i
a a reprsentant le nombre
dindividus tels que
1
) (
+
<
i
a X , on le considre concentr en
1 + i
a et donc le
Cours de mathematiques - ECS1 - Catherine Laidebeure - Lycee Albert Schweitzer, Le Raincy - 2011
Statistique descriptive ECS 1
polygone des effectifs cumuls croissants est obtenu en joignant les points de
coordonnes ) , (
1 i i
N a
+
. Mme chose pour le polygone des frquences cumules
croissantes.
Leffectif cumul dcroissant
i
N' de la classe [ , [
1 + i i
a a reprsentant le nombre
dindividus tels que
i
a X ) ( , on le considre concentr en
i
a et donc le
polygone des effectifs cumuls dcroissants est obtenu en joignant les points de
coordonnes ) ' , (
i i
N a . Mme chose pour le polygone des frquences cumules
dcroissantes.
Exemple : Sur une mme figure, tracer les polygones des effectifs cumuls croissants
et dcroissants de la srie prcdente.
3) Analyse de la srie statistique
a) Caractristiques de position
On appelle classe modale toute classe correspondant un effectif maximal et mode le
centre de cette classe. Il peut y en avoir plusieurs.
Exemple : Dterminer la classe modale et le mode de la srie prcdente.
Dfinition : La mdiane est une valeur m de la variable telle que le nombre dindividus
tels que m X < ) ( soit gal au nombre dindividus tels que m X > ) ( .
Cela revient dire, en supposant une volution continue des effectifs cumuls, que
leffectif cumul croissant associ m est gal leffectif cumul dcroissant, donc
un effectif
2
n
puisque la somme des effectifs croissants et dcroissants est n.
Dtermination pratique : On la dtermine graphiquement en prenant labscisse du
point dintersection des polygones des frquences cumules croissantes et
dcroissantes. Elle se calcule en dterminant dabord la classe mdiane (classe dans
laquelle se trouve la mdiane), puis en faisant une interpolation linaire en supposant
la rpartition uniforme lintrieur de cette classe.
Exemple : Dans la srie prcdente, la classe mdiane est [35,40[, puisque cest dans
cette classe que leffectif cumul croissant dpasse 76 (moiti de 152). Sur le polygone
des effectifs cumuls croissants, on trouve les points ) 72 , 35 ( P et ) 117 , 40 ( Q . On
cherche sur le segment ] [PQ labscisse m du point M dordonne 76. Si lquation de
la droite ) (PQ est b ax y + = , alors
P M
P M
P Q
P Q
x x
y y
x x
y y
a

= . Donc :
72 117
35 40
72 76
35 1

=
m
a
, donc
72 117
35 40
) 72 76 ( 35

+ = m , donc 44 , 35 = m .
Effectuer le mme raisonnement sur le polygone des effectifs cumuls dcroissants et
montrer que lon trouve la mme valeur de m.
On peut aussi faire un calcul analogue sur le polygone des frquences cumules
croissantes (ou dcroissantes) pour trouver labscisse du point dordonne 0,5 sur le
segment correspondant la classe mdiane.
La dfinition de la moyenne est la mme que pour une variable discrte.
Dfinition : Si lon suppose leffectif
i
n de la classe [ , [
1 + i i
a a concentr au centre
2
1 +
+
=
i i
i
a a
x , la moyenne de la srie statistique est :

=
=
p
i
i i
x n
n
x
1
1
.
Bien sr, les classes moins de et plus de sont toujours supposes identifies
des classes de la forme [ , [
1 + i i
a a .
Exemple : Calculer lge moyen des ouvriers de lentreprise.
Cours de mathematiques - ECS1 - Catherine Laidebeure - Lycee Albert Schweitzer, Le Raincy - 2011
Statistique descriptive ECS 1
b) Caractristiques de dispersion
Avec les conventions prcdentes, les dfinitions de la variance et de lcart-type sont
les mmes que pour une variable discrte :
2
1
2
1
2
1
) (
1
) ( x x n
n
x x n
n
X V
p
i
i i
p
i
i i
= =

= =
) ( X V
x
=
Exemple : Calculer la variance et lcart-type de la srie prcdente.
Pour valuer la rpartition de la srie de manire plus fine, on introduit les quartiles
(on partage la population en 4 parties de mme effectif) et les dciles (on partage la
population en 10 parties de mme effectif) :
Dfinition : Soit k un entier gal 1,2 ou 3. On appelle k-me quartile de la srie
statistique la valeur
k
q de la variable qui correspond un effectif cumul croissant de
4
n
k et une frquence cumule croissante de 0,25k.
Il y a 25% des individus de la population tels que
1
) ( q X < , 50% tels que
2
) ( q X < (donc
2
q est la mdiane), 75% tels que
3
) ( q X < .
Lintervalle ] , [
3 1
q q sappelle lintervalle interquartile et reprsente lensemble des
valeurs du caractre associes 50% de la population (en liminant les individus les
moins significatifs ).
Dfinition : Soit k un entier compris entre 1 et 9. On appelle k-me dcile de la srie
statistique la valeur
k
d de la variable qui correspond un effectif cumul croissant de
10
n
k et une frquence cumule croissante de 0,1k.
Il y a % 10 k dindividus de la population tels que
k
d X < ) ( . La mdiane est
gale au 5-me dcile.
Les quartiles et les dciles se dterminent comme la mdiane par interpolation linaire.


Cours de mathematiques - ECS1 - Catherine Laidebeure - Lycee Albert Schweitzer, Le Raincy - 2011

Vous aimerez peut-être aussi