Vous êtes sur la page 1sur 30

1° Année MI coordination - Statistique descriptive

Partie I : Statistique simple

La statistique descriptive est un ensemble de méthodes, permettant de


décrire, présenter, résumer des données afin de les rendre
compréhensibles par tous. C’est à la fois une science, une méthode et un
ensemble de techniques.
Ces méthodes peuvent être numériques et mener à des représentations
graphiques. L’objectif de la Statistique Descriptive est de décrire de façon
synthétique des données observées pour mieux les analyser.

1- Définitions :
a- On appelle population un ensemble d’éléments homogènes
auxquels on s’intéresse. Par exemple, les étudiants d’une section,
les familles des travailleurs, les enseignants d’une université, les
élèves d’une école…., cet ensemble (population) est noté par 

b- Les éléments de la population sont appelées individus ou unités


statistiques. Ces éléments sont notés : i

c- Chaque individu d’une population, peut être décrit selon une ou


plusieurs variables qui peuvent être des caractéristiques qualitatives
ou quantitatives. Des observations concernant un thème particulier
ont été effectuées sur ces individus. La série de ces observations
forme ce que l’on appelle une variable statistique. Par exemple, les
notes des étudiants à l’examen, les Mentions qu’ils ont obtenues à
leur Bac, leur Sexe, les Couleurs de leurs Yeux, le Nombre
d’Enfants par famille, . . .il s’agit d’étudier un caractère . Les
réponses possibles données sont appelés modalités. Il y a deux
types de caractère (ou variable) :

Qualitatif : Un caractère est qualitatif si les modalités sont des


qualités (ne sont pas mesurables), par exemple :
 Les modalités de la variable Couleur des Yeux sont : Bleu,
Marron, Noir et Vert .
 Les modalités de la variable Mention au Bac sont : TB, B,
AB et P.

On distingue deux types de variables qualitatives :


Les variables qualitatives ordinales et les variables qualitatives
nominales. Plus précisément une variable qualitative est dite
ordinale, lorsque ses modalités peuvent être classées dans un certain
ordre naturel ( par exemple le cas de la variable Mention au Bac, le
La coordinatrice Mme Laboudi
Page 1
1° Année MI coordination - Statistique descriptive

grade des enseignants) ; une variable qualitative est dite nominale,


lorsque ses modalités ne peuvent être classées de façon naturelle
(Par exemple le cas de la variable Couleur des Yeux ou le groupe
sanguin.)

Quantitatif :
Un caractère est dit quantitatif si toutes les modalités sont
mesurables,
On distingue 2 types de caractères quantitatifs :
 Caractère quantitatif discret, si les modalités sont des
valeurs isolées. Par exemple le nombre d’enfants par ménage
ne peut être que 0, ou 1, ou 2, ou 3, . . . ; il ne peut jamais
prendre une valeur strictement comprise entre 0 et 1, ou 1 et
2, ou 2 et 3, . . . .
 caractère quantitatif continu, les modalités peuvent
prendre toute valeur dans un intervalle. Par exemple la
moyenne obtenue appartient à l’intervalle [0 , 20], la taille
d’un étudiant appartient à l’intervalle [150,190] mais si on
change de population, par exemple la taille d’un nouveau né
appartient à [40 cm, 60cm].

d- On appelle échantillon, un sous ensemble de la population, lorsque


l’échantillon est choisit au hasard, on dit qu’on a un échantillon
aléatoire.
Population

Caractère

Qualitatif Quantitatif

Nominal Ordinal Discret Continu

Groupe sanguin Mention du bac Nombre d’absences La moyenne obtenue


Situation familiale Grade des enseignants Nombre de pièces La taille
Couleur des yeux Le poids

La coordinatrice Mme Laboudi


Page 2
1° Année MI coordination - Statistique descriptive

2- Variable statistique :
On appelle statistique à une dimension, l’application notée X, définie
d’un ensemble  fini appelé population, vers un ensemble  appelé
ensemble des valeurs du caractère.
  X  
X : 
 X  


Pour chaque individu  , on associe la valeur prise par le caractère mesuré


X   .

Exemples :
1-  : les étudiants admis au baccalauréat
X : La mention du bac
X  :{passable, AB , B, TB, Excellent }

2-  : les enseignants universitaire


X : situation familiale
X  : {célibataire, marié, divorcé, veuf}

3-  : les travailleurs d’une entreprise


X : le nombre d’enfants
X  :{0 ,1 2, 3, 4, 5, 6..}

4-  : les étudiants d’une section


X : la moyenne générale obtenue
X  : [0 , 20]

3- Tableau statistique :
a. Cas discret :
Soit X une statistique à une dimension, supposons que :
X(  ) = x1 , x 2 ,..., x k .

 Effectif de la valeur xi : c’est le nombre de fois que cette valeur se


répète dans la population, ce nombre est noté ni .
 effectif cumulé en xi : c’est la somme de tous les effectifs
i
~   n = n  n  ...  n .
précédents, ce nombre est noté ni j 1 2 i
j 1

La coordinatrice Mme Laboudi


Page 3
1° Année MI coordination - Statistique descriptive

n
 fréquence de la valeur xi , le nombre noté f i  i .
n
k
n est la taille de l’échantillon ( n   ni  n1  n2  .....nk ).
i 1
~ i n~i
 fréquence cumulée en xi : fi   f j  .
j 1 n
les résultats concernant les observations, sont présentés dans un
tableau, en présentant les modalités numériques en ordre croissant,
et en donnant les effectifs, effectifs cumulés, fréquences et
fréquences cumulées.
k k
Remarque: n   ni ;  f i  1.
i 1 i 1
modalité Effectif Effectif fréquence Fréquence
cumulé cumulée
x1 n1 n1 f1 f1
x2 n2 n1  n2 f 2 f1  f 2
. . .
. . .
xk nk n fk 1
k k
 ni  n  fi  1
i 1 i 1

Exemple :
On a noté le nombre d'enfants X de 20 familles.
On a les résultats suivants:

X 1 1 2 1 2 0 3 2 0 2
2 1 3 2 4 1 3 4 3 2

On représente les données dans un tableau statistique :


 
xi ni ni fi fi
0 2 2 0.1 0.1
1 5 7 0.25 0.35
2 7 14 0.35 0.7
3 4 18 0.2 0.9
4 2 20 0.1 1
total 20 1
La coordinatrice Mme Laboudi
Page 4
1° Année MI coordination - Statistique descriptive

La population  : les 20 familles


Le caractère étudié X : le nombre d’enfants
La nature : quantitatif discret
Les modalités du caractère : X    0,1,2,3,4
L’effectif de la 2° modalité : n2  5
Combien de familles qui ont au moins 1 enfant ?
Combien de familles qui ont plus de 2 enfants ?
Quel est le pourcentage de familles qui ont moins de 3 enfants ?

b. Cas continu :
Soit X une statistique à une dimension, supposons que X(  ) = [a , b] tel
que cet intervalle soit subdivisé en k classes :
a0 , a1, a1, a2 ,....,ak 1 , ak  . Avec : a0  a et ak  b

a- Effectif de la i ème classe ai 1 , ai  , c’est le nombre de valeurs du


caractère qui sont dans cette classe.
i
~
b- Effectif cumulé en a i , le nombre ni   n j
j 1
n
c- fréquence de la i ème classe ai 1 , ai  , le nombre f i  i .
n
~ i n~i
d- fréquence cumulée en a i : fi   f j  .
j 1 n
k k
Remarque: n   ni ;  f i  1.
i 1 i 1

Les classes Effectif fréquence


a0 , a1 n1 f1
a1 , a2  n2 f2
. . .
. . .
. . .
ak 1 , ak  nk fk
k k
 ni  n  fi  1
i 1 i 1

La coordinatrice Mme Laboudi


Page 5
1° Année MI coordination - Statistique descriptive

Exemple :
Soient les données suivantes relevées sur un échantillon de 100 étudiants de MI :
Compléter ce tableau statistique suivant:
 
Taille (cm) ni ni fi fi
[150 ; 160 [ 5

[160 ; 170 [ 10

[170 ; 180 [ 40

[180 ; 190 [ 30

[190 ; 200 ] 15

a. Séries statistiques :
Définition :
 Le couple  xi , ni i 1, p est appelé série statistique discrète.
 Le couple ai 1 , ai , ni i 1, p est appelé série statistique
continue.

4- Représentations graphiques :
a. Caractère qualitatif :
 Représentation en secteurs circulaires :
On appelle diagramme en secteurs circulaire, le cercle contenant toutes
les modalités du caractère étudié, tel que la i ème modalité soit
représentée par l’angle  i  2  f i ( f i est la fréquence de la
i ème modalité).
 Représentation en tuyaux d’orgues :
On appelle représentation en tuyaux d’orgues d’un caractère qualitatif,
un rectangle obtenu pour la i ème modalité, en prenant une base
constante et une hauteur proportionnelle à l’effectif ni .
Exemple :
Le tableau suivant donne la répartition selon le groupe sanguin de
1000 individus pris au hasard

Le groupe sanguin A B AB O total


Les effectifs 350 50 100 500 1000
Les fréquences 0.35 0.05 0.1 0.5 1
i  2 fi 126° 18 36° 180° 360°

La coordinatrice Mme Laboudi


Page 6
1° Année MI coordination - Statistique descriptive

 Représentation en secteurs circulaires :

A
B
AB
O

 Représentation en tuyaux d’orgues :


600
500
400 O
AB
300
B
200
A
100
0
AB O

b. Représentations graphiques du caractère quantitatif discret :


Diagramme en bâtons :
 Soit  xi , ni i 1, p une série statistique discrète. On appelle
diagramme en bâtons, la figure obtenue, en plaçant dans un repère
orthonormé, les valeurs xi en abscisses et les effectifs ou les
fréquences en ordonnées. Et on trace des segments parallèlement à
l’axe des ordonnés.
 On appelle polygone des effectifs (ou des fréquences), la ligne
polygonale joignant les sommets des bâtons.
Exemple 1:
Une enquête réalisée dans un village porte sur le nombre d’enfants à
charge par famille.
On a les résultats suivants:
 
xi ni ni fi fi
0 18 18 0.09 0.09
1 32 50 0.16 0.25
2 66 116 0.33 0.58
3 41 157 0.2 0.78
4 32 189 0.16 0.94
5 9 198  0.05 0.99
6 2 200 0.01 1
total 200 1
La coordinatrice Mme Laboudi
Page 7
1° Année MI coordination - Statistique descriptive

Les modalités du caractère : X    0,1,2,3,4,5,6

c. Représentations graphiques du caractère quantitatif continu :


Histogramme :

Soit  ai 1 , ai , ni i 1, p ou  ai 1 , ai , f i i 1, p une série


statistique continue.
 On appelle histogramme de cette série, la figure obtenue en plaçant
les classes sur l’axe des abscisses, et les nombres ni ( ou f i ) sur
l’axe des ordonnées, et on obtient des rectangles.
 La ligne polygonale joignant les milieux des bandes supérieurs des
rectangles, s’appelle polygone des effectifs (ou des fréquences) de
la série.

La coordinatrice Mme Laboudi


Page 8
1° Année MI coordination - Statistique descriptive

5- Paramètres de caractérisation :

a- Etendu :
Etendu de la série, est le nombre noté e  X max  X min .

b- Amplitude :
Soit ai 1 , ai , ni i 1, p une série statistique continue, on appelle
e
amplitude de la classe ai 1, ai  , le nombre noté am  , ou k est le
k
nombre de classes.

Remarque :
Pour le moment, on choisit des classes de même amplitude. Diverses
formules empiriques permettent d’établir le nombre de classes pour un
échantillon de taille n .
 
On choisit le nombre de classes k  E n .

Exemple 2 :
On a noté la moyenne (X) obtenue de 30 étudiants. On a les résultats
suivants:
X 12 10 8 13.5 10 17 10.5 8.5 13.5 11.5
13 11.5 9 7 8 14 7 5 9.5 6
2 3 4 3 6 10 9 9 12 13

 La population étudiée : l’ensemble des 30 étudiants


 Le caractère étudié : la moyenne obtenue
 Sa nature : Quantitatif continu
 L’étendue de la série statistique : e  X max  X min 17  2  15
 
 Le nombre de classes : k  E 30  5
e 15
 L’amplitude : am   3
k 5
 Le tableau statistique : des effectifs, des effectifs cumulés, fréquences
et fréquences cumulés :

La coordinatrice Mme Laboudi


Page 9
1° Année MI coordination - Statistique descriptive
 
La moyenne ni ni fi fi
[2 ; 5 [ 4 4 0.13 0.13

[5 ; 8 [ 5 9 0.17 0.3

[8 ; 11 [ 11 20 0.37 0.67

[11 ; 14 [ 8 28 0.27 0.94

[14 ; 17 ] 2 30 0.06 1

total 30 1

12

10
[2 ; 5 [
8
[5 ; 8 [
6 [8 ; 11 [
[11 ; 14 [
4
[14 ; 17 ]
2

7. Fonction de répartition :
a- Cas discret :

On appelle fonction de répartition, la fonction notée F :

F : R  0 ,1
x  F ( x)   f i
x  xi
F est une fonction en escalier, continue sur chaque intervalle
xi 1 , xi  , et les xi sont les points de discontinuité. C’est-à-dire que
les points de X  sont les points de discontinuité.

La coordinatrice Mme Laboudi


Page 10
1° Année MI coordination - Statistique descriptive

Reprenons l’exemple 1 :
X : Le nombre d’enfants à charge par famille :
 
xi ni ni fi fi
0 18 18 0.09 0.09
1 32 50 0.16 0.25
2 66 116 0.33 0.58
3 41 157 0.2 0.78
4 32 189 0.16 0.94
5 9 198  0.05 0.99
6 2 200 0.01 1
total 200 1

0 x0
0.09 0  x 1

0.25 1 x  2

0.58 2 x3
F x   
0.78 3 x  4
0.94 4 x5

0.99 5 x6
1 x6

La coordinatrice Mme Laboudi


Page 11
1° Année MI coordination - Statistique descriptive

b- Cas continu :
On appelle fonction de répartition, la fonction notée F :
F : R  0 ,1
i 1 x  ai 1
x  F ( x)   f j  f i ,  x ai 1 , ai 
j 1 ai  ai 1

Pour les données de l’exemple 2 :


 
La moyenne ni ni fi fi
[2 ; 5 [ 4 4 0.13 0.13

[5 ; 8 [ 5 9 0.17 0.3

[8 ; 11 [ 11 20 0.37 0.67

[11 ; 14 [ 8 28 0.27 0.94

[14 ; 17 ] 2 30 0.06 1

total 30 1

La coordinatrice Mme Laboudi


Page 12
1° Année MI coordination - Statistique descriptive
i 1
x  ai 1
F ( x)   f j  f i ,  x ai 1 , ai 
j 1 ai  ai 1

0 x2
 x2
0  . 0.13 x  2,5
 52
 x5
0.13  . 0.17 x  5,8
 8  5
 x 8
F  x   0.3  . 0.37 x  8,11
 11  8
 x  11
0.67  14  11 . 0.27 x  11,14

0.94  x  14 . 0.06 x  14, 17 
 17  14
1 x  17

La coordinatrice Mme Laboudi


Page 13
1° Année MI coordination - Statistique descriptive

Remarque :
Le graphe de la fonction de répartition, appelé courbe cumulative, peut
s’obtenir directement à partir de l’histogramme des fréquences cumulées
en joignant les sommets internes des rectangles, cette fonction est
continue sur R .
La différence entre le cas discret et continu,
Dans le cas discret : La fonction de répartition, est une fonction en
escalier, continue sur chaque intervalle xi 1 , xi  , et les xi sont les points
de discontinuité.
Dans le cas continue, la fonction de répartition est continue sue R ;

6- Les paramètres de tendance centrale et de position :


a- Le mode :
 Cas discret :
On appelle Mode d’une série statistique discrète, noté M 0 , toutes
valeurs du caractère, qui correspond à l’effectif le plus élevé.
 
xi ni ni fi fi
0 18 18 0.09 0.09
1 32 50 0.16 0.25
2 66 116 0.33 0.58
3 41 157 0.2 0.78
4 32 189 0.16 0.94
5 9 198  0.05 0.99
6 2 200 0.01 1
total 200 1

M 0 =2 : le plus grand nombre de familles, ont le nombre d’enfants à charge = 2

 Cas continu :
On appelle classe modale, la classe qui correspond à l’effectif le
plus élevé. Si la classe modale est unique, alors le mode est
calculé par la formule suivante :
d1
M 0  LM 0  am
d1  d 2 0
Avec :
LM 0 la borne inferieure de la classe modale.
d1 : l’effectif de la classe modale – l’effectif précédent.
d 2 : l’effectif de la classe modale – l’effectif suivant.

La coordinatrice Mme Laboudi


Page 14
1° Année MI coordination - Statistique descriptive

am0 : l’amplitude de la classe modale


 
La moyenne ni ni fi fi
[2 ; 5 [ 4 4 0.13 0.13

[5 ; 8 [ 5 9 0.17 0.3

[8 ; 11 [ 11 20 0.37 0.67

[11 ; 14 [ 8 28 0.27 0.94

[14 ; 17 ] 2 30 0.06 1

Total 30 1

M 0  LM 0 
d1
a m0  8 
11  5 3  8  4 .3  10
d1  d 2 11  5  11  8 6
Le plus grand nombre d’étudiants, ont eu une moyenne  10

12

10
[2 ; 5 [
8
[5 ; 8 [
6 [8 ; 11 [
[11 ; 14 [
4
[14 ; 17 ]
2

b- La médiane :
 Cas discret :
Soit x1  x2  ...  xn un échantillon discret.
On appelle médiane de cette série, la valeur notée M ed , telle
n n
que valeurs sont inferieurs et valeurs sont supérieurs.
2 2
 xn  xn
 2 1
2
 si n pair
M ed   2
 x n 1 si n impair

 2

La coordinatrice Mme Laboudi


Page 15
1° Année MI coordination - Statistique descriptive
 
xi ni ni fi fi
0 18 18 0.09 0.09
1 32 50 0.16 0.25
2 66 116 0.33 0.58
3 41 157 0.2 0.78
4 32 189 0.16 0.94
5 9 198  0.05 0.99
6 2 200 0.01 1
total 200 1

x x 22
M ed  100 100 1  2
2 2
50% de familles ont le nombre d’enfants à charge  2

 Cas continu :
On appelle classe médiane, la 1° classe dont l’effectif cumulé
n
soit supérieur ou égal à . On calcule la médiane par la formule
2
d’interpolation suivante :
n 
  ncummed 
 a
2
M ed  LM ed med .
nmed
Avec :
LMed : la borne inferieure de la classe médiane.
ncummed : l’effectif cumulé jusqu’à la classe médiane
nmed : l’effectif de la classe médiane.
a med : l’amplitude de la classe médiane

La coordinatrice Mme Laboudi


Page 16
1° Année MI coordination - Statistique descriptive
 
La moyenne ni ni fi fi
[2 ; 5 [ 4 4 0.13 0.13

[5 ; 8 [ 5 9 0.17 0.3

[8 ; 11 [ 11 20 0.37 0.67

[11 ; 14 [ 8 28 0.27 0.94

[14 ; 17 ] 2 30 0.06 1

Total 30 1

n 
  ncummed 
M ed  LM ed  
2 a 15  9 .3  9.63
med  8 
nmed 11
50% d’étudiants ont eu une moyenne  9.63

c. Les quantiles :
Soit X une statistique telle que x1  x2  ...  xn , et soit    0 ,1  . On
appelle quantile d’ordre  , la valeur notée Q tel que n  valeurs sont
 Q et n  n  valeurs sont  Q .

La coordinatrice Mme Laboudi


Page 17
1° Année MI coordination - Statistique descriptive

En pratique :
 x n   x n  1
 si n   N
 Cas discret : Q   2
 x E n    1 si n   N

 Cas continu :
On détermine d’abord la classe  l1 ,l2  ,

la 1° classe dont l’effectif cumulé soit  n .


n  ncuml1
Q  l1  am
nl1 l 2 

ncum l1 : l’effectif cumulé jusqu’à l1


nl1 ,l2  : l’effectif de la classe  l1 ,l 2 
am : l’amplitude de la classe  l1 ,l 2  .

Remarque :
On peut déterminer graphiquement les quantiles d’ordre  , à partir du
graphe de la courbe cumulative, c’est la valeur x , qu’on peut lire sur
l’axe des abscisses, qui soit projection du point sur la courbe cumulative
correspondant à la valeur  représentée sur l’axe des ordonnés :
x  Q  F 1  

Cas particuliers :

i. Les quartiles :
Il y a 3 quartiles Q1 , Q2 , Q3 .
Le premier quartile Q1 est le quantile d’ordre   0.25
Le deuxième quartile Q2 est le quantile d’ordre   0.5
Le troisième quartile Q3 est le quantile d’ordre   0.75
x1    Q1      Q2    Q3    xn
25% 25% 25% 25%

La coordinatrice Mme Laboudi


Page 18
1° Année MI coordination - Statistique descriptive

ii. Les déciles :


Il y a 9 déciles D1 , D2 ,...., D9 .
i
Le i ème décile est le quantile d’ordre   .
10

iii. Les centiles :


Il y a 99 centiles C1 , C 2 ,...., C99 .
i
Le i ème centile est le quantile d’ordre   .
100

Exemples :
Pour les deux exemples 1 et 2 , précédents , calculer les quantiles
d’ordre 0.25, 0.7 et 0.75

Cas discret (exemple 1)


 
xi ni ni fi fi
0 18 18 0.09 0.09
1 32 50 0.16 0.25
2 66 116 0.33 0.58
3 41 157 0.2 0.78
4 32 189 0.16 0.94
5 9 198  0.05 0.99
6 2 200 0.01 1
total 200 1
x x
  0.25  n  5 0 N  Q0.25  50 51  1.5
2
x x
  0.7  n 140 N  Q0.7  140 141  3
2
x x
  0.75  n 15 0 N  Q0.75  150 151  3
2
Interprétation :
x1      Q0.25      Q0,5      Q0,75      x200
0 25% 1,5 25% 2 25% 3 25% 6

La coordinatrice Mme Laboudi


Page 19
1° Année MI coordination - Statistique descriptive

Cas continu : (exemple 2)


 
La moyenne ni ni fi fi
[2 ; 5 [ 4 4 0.13 0.13

[5 ; 8 [ 5 9 0.17 0.3

[8 ; 11 [ 11 20 0.37 0.67

[11 ; 14 [ 8 28 0.27 0.94

[14 ; 17 ] 2 30 0.06 1

total 30 1
7.5  4
   0.25  n  7.5  Q0.25  5,8  Q0.25  5  .3  7.1
5

25% ont eu une moyenne  7.1

 La médiane : M ed  9.63
21  20
   0.7  n  21  Q0.7  11,14  Q0.7  11  .3 11.37
8

70% ont eu une moyenne 11.37


donc 30%ont eu une moyenne 11.37

   0.75  n  22.5  Q0.75  11,14 


22.5  20
Q0.75  11  .3 11.93
8
75% ont eu une moyenne 11.93 .

Remarque :
On peut déterminer graphiquement les quantiles d’ordre  , à partir du
graphe de la courbe cumulative :

La coordinatrice Mme Laboudi


Page 20
1° Année MI coordination - Statistique descriptive

d. La moyenne arithmétique :
Soit  xi , ni i 1, p respectivement  ai 1 , ai , ni i 1, p une série
statistique discrète (respectivement continue).

On appelle moyenne arithmétique d’une série statistique, le nombre noté


X , défini par :
1 k
X   ni X i dans le cas discret
n i 1
1 k
X   ni Ci Dans le cas continu avec C i est le centre de classe.
n i 1
Cas discret :

xi ni ni xi
0 18 0
1 32 32
2 66 132
3 41 123
4 32 128
5 9 45
6 2 12
Total 200 472

1 k 472
X  ni X i   2.36
n i 1 200

La coordinatrice Mme Laboudi


Page 21
1° Année MI coordination - Statistique descriptive

Cas continu :
La moyenne Le ni ni Ci
centre

[2 ; 5 [ 3.5 4 14

[5 ; 8 [ 6.5 5 32.5

[8 ; 11 [ 9.5 11 104.5

[11 ; 14 [ 12.5 8 100

[14 ; 17 ] 15.5 2 31

Total 30 282

1 k 282
X  ni Ci   9.4
n i 1 30

e. Forme de la distribution :
Distributions uni-modales dissymétriques (à droite ou à gauche)

mod  med  Moy : Etalement à droite mod  med  Moy : Etalement à gauche

Distributions uni-modales symétriques

mod  med  Moy

La coordinatrice Mme Laboudi


Page 22
1° Année MI coordination - Statistique descriptive

Dans l’exemple du cas discret : mod  med  Moy : étalement à droite.

Le mode =la médiane =2, La moyenne arithmétique =2.36

Dans l’exemple du cas continu :

Le mode =10 , La médiane =9.63, La moyenne arithmétique=9.4

mod  med  Moy donc on a un étalement à gauche.

7- Les paramètres de dispersion


La variance- L’écart-type :

 On appelle variance de cette série, le nombre noté V (x) ou


 2  X  défini par :
2 2
  X    ni xi  X  (Respectivement  ni Ci  X  ).
2 1 k 1 k
n i 1 n i 1

 On appelle écart-type de la série, le nombre noté


  X   la var iance( X )
Proposition :
2
  X  V  X   ni xi  X    ni xi2  X 2 .
2 1 k 1 k
n i 1 n i 1
Démonstration :
2
  X   V  X    ni xi  X 
2 1 k
n i1

  ni xi2  X 2  2 xi X 
1 k
n i1
1 k 1 k 1 k
  ni xi   ni X  2  ni xi X
2 2

n ii n ii n ii


1 k
  ni xi2  X 2  2 X 2
n ii
1 k
  ni xi2  X 2
n ii

La coordinatrice Mme Laboudi


Page 23
1° Année MI coordination - Statistique descriptive

Le paramètre V (x) mesure la distance moyenne entre X et les valeurs


de X . Il sert à mesurer la dispersion d’une série statistique autour de sa
moyenne.
 Plus il est petit, plus les caractères sont concentrés autour de la
moyenne (on dit que la série est homogène).
 Plus il est grand, plus les caractères sont dispersés autour de la
moyenne (on dit que la série est hétérogène).

Reprenons les exemples 1 et 2, pour calculer la variance.

Cas discret exemple 1 :


xi ni ni xi ni x 2i
0 18 0 0
1 32 32 32
2 66 132 264
3 41 123 369
4 32 128 512
5 9 45 225
6 2 12 72
total 200 472 1474
1 k 472
X  ni X i   2.36
n i 1 200
1 k
V  X    ni xi2  X 2 
1474
 2.36 2  1.81 :La série est homogène
n i 1 200
Cas continu : exemple 2
La moyenne Ci ni ni Ci ni C 2i

[2 ; 5 [ 3.5 4 14 49

[5 ; 8 [ 6.5 5 32.5 211.25

[8 ; 11 [ 9.5 11 104.5 992.75

[11 ; 14 [ 12.5 8 100 1250

[14 ; 17 ] 15.5 2 31 480.5

Total 30 282 2983.5

La coordinatrice Mme Laboudi


Page 24
1° Année MI coordination - Statistique descriptive

1 k 282
X  ni Ci   9.4
n i 1 30
1 k
V  X    ni ci2  X 2 
2983 .5
 9.42  11.09 : Une dispersion
n i 1 30

8- Les Moments :
a- On appelle moment d’ordre r , le nombre :
1 k 1 k
mr   ni xir (respectivement : mr   ni Cir .
n i 1 n i 1

b- On appelle moment centrés d’ordre r , le nombre :


 r   ni xi  X  r (respectivement  r   ni ci  X  r
1 k 1 k
n i 1 n i 1

Remarque : m 1 X , 1  0,  2   2 .

9- Paramètres de formes :

a- On appelle coefficient de variation, le nombre : CV  .
X
3
b- On appelle coefficient d’asymétrie, le nombre :  .
 3

Si   0 étalement à droite
  0 symétrie
  0 étalement à gauche.

  0 : symétrique

La coordinatrice Mme Laboudi


Page 25
1° Année MI coordination - Statistique descriptive

  0 : étalement à droite   0 : étalement à gauche

c- On appelle coefficient d’aplatissement le nombre :

4
  3.
 4

Si :   0 aplatissement faible .
  0 aplatissement fort.

10- Changement de variables :


Si on pose Z i  a X i  b ,
Alors
Z  aX b
V Z   a 2 V  X 

r ( Z )   ni zi  Z   a r  r  X 
1 n r
n i1

La coordinatrice Mme Laboudi


Page 26
1° Année MI coordination - Statistique descriptive

Démonstration :

k k k k

 ni a xi  b 
1 1 1 1
Z 
n
 ni zi 
i 1 n i 1 n
 a ni xi 
i 1 n

i 1
ni b

1 k 1 k


n i1
ni xi  ba
n

i 1
ni

 a X b

V Z    ni zi  Z    ni (a xi  b)  (a X  b)
1 n 2 1 n 2

n i1 n i1
 2
  ni axi  X  
1 n
n i1
 2
 a 2  ni xi  X 
1 n
n i1
 a2 V X 


 ni zi  Z     b)  r
n
1 n
 r Z  
1

r
ni ( a xi  b )  ( a X
n i 1 n i1

  ni axi  X   r
1 n
n i1
 r
 a r  ni xi  X 
1 n
n i1
 ar  r X 
Exercice 1:
On a relevé entre les années 1974 et 1984, la production de blé (X en quintaux), On a
obtenu les résultats suivants :

Valeurs 200 184 225 250 240 195 210 225 250 230
de X

1- Répartir le caractère X en 3 classes de même amplitude.


2- Donner le tableau statistique.
X  217 1
3- En utilisant le changement de variable : Y  X  9.86
22 22
Calculer la production moyenne annuelle de blé et la variance de X.

La coordinatrice Mme Laboudi


Page 27
1° Année MI coordination - Statistique descriptive

Réponse :

Les classes Ci Yi ni ni yi ni yi 2
[184, 206[ 195 -1 3 -3 3
[206,228[ 217 0 3 0 0
[228,250] 239 1 4 4 4
1 7

e  X max  X min  250  184  66

e 66
am    22
k 3
1 3 1
Y   ni yi   0.1
n i 1 10
1 n
V Y    ni yi2  Y 2  . 7  0.12  0.69
1
n i 1 10

X  217 1
Y  X  9.86
22 22
X  217 1 1
Y  X  9.86  0.1  X  9.86  0.1  9.96
22 22 22
 X  219 .2
2
 1 
V Y   0.69    V  X   V  X   22 2 .. 0.69
 22 
 V  X   333 .96
  X  18.3

Exercice 2 :
L’étude de la taille de 50 nouveaux nés, a donné les résultats suivants :

Classes [40-42[ [42-44[ [44-46[ [46-48[ [48-50[ [50-52[ [52-54[


n~i 2 7 15 35 43 48 50

1. Tracer l’histogramme de cette série. Que peut-on remarquer ?


2. Calculer le mode et la médiane.
3. Calculer la moyenne et la variance.
4. Calculer les moments centrés d’ordre 3 et 4, en déduire le coefficient d’asymétrie et le
coefficient d’aplatissement. Que peut-on conclure ?

La coordinatrice Mme Laboudi


Page 28
1° Année MI coordination - Statistique descriptive

Réponse :

Xi Ci ni ni ni Ci Ci  X ni Ci  X  ni Ci  X  ni Ci  X 
2 3 4

[40 ; 42 [ 41 2 2 82 -6 72 -432 2592

[42 ; 44 [ 43 7 5 215 -4 80 -320 1280

[44 ; 46 [ 45 15 8 360 -2 32 -64 128

[46 ; 48 [ 47 35 20 940 0 0 0 0

[48 ; 50 [ 49 43 8 392 2 32 64 128

[50 ; 52 [ 51 48 5 255 4 80 320 1280

[52 ; 54 ] 53 50 2 106 6 72 432 2592

Total 50 2350 368 0 8000

Le mode :
d1
M 0  LM 0 am0  46 
20  8 2  47
d1  d 2 20  8  20  8
n 
  ncummed 
La médiane : M ed  LM ed  
2 a 25  15 .2  47
med  46 
nmed 20
2350
La moyenne : X   47
50
mod  med  Moy , donc la distribution est symétrique.

ni ci  X 
k
La variance : V  X    2 
1 368

2
  7,36
n i 1 50

 ni ci  X   0 donc le coefficient d’asymétrie :   3 .  0 .
1 k
3  2
n i 1 3
Alors la distribution est symétrique.

ni ci  X 
k
1 8000

4
4    160
n i 1 50

La coordinatrice Mme Laboudi


Page 29
1° Année MI coordination - Statistique descriptive

4 160
Donc le coefficient d’aplatissement :    3.   3   0.04  0
4 7,36 2
On peut dire que l’aplatissement est moyen.

La coordinatrice Mme Laboudi


Page 30

Vous aimerez peut-être aussi