Vous êtes sur la page 1sur 35

Les Statistiques Descriptives

© Mr. Soussi Noufail Outmane


Email: soussioutmane@gmail.com

Méthodes quantitatives

Travaux dirigés
2014
Distribution à un seul caractère
 Les tableaux statistiques
 Les paramètres de position
 Le mode
 Le médiane
 La moyenne
 Les paramètres de dispersion
 La variance et l’écart type
 L’étendu et le coefficient de variation
 Les paramètres de concentration
 La médiale
 La courbe de Lorenz
Exercice illustratif
1. Types de présentation des données
Numéro Taille Soit le caractère statistique : « la taille des étudiants »
1 158
2 177
3 181 Le tableau statistique: correspond à deux colonnes :
4 190 modalités et les fréquences (absolues et relatives)
5 163 auxquelles sont associées
6 158
Données Individuelles

7 165 modalité de X fréquence absolue fréquence relative fréquence relative


8 164
9 166 ni fi cumulée Fi
10 169 [150, 160[ 3 3/20 3/20
11 173
12 175 [160, 170[ 8 8/20 3/20+ 8/20= 11/20
13 174
[170, 180[ 5 5/20 16/20
14 180
15 164 [180, 190] 4 4/20 20/20 =1
16 166
Total 20 1
17 172
18 163 Données Groupées
19 188
20 150
2. Les représentations graphiques correspondantes

Cas des données individuellement observées (cas données non groupées)

La Taille (ni)
200
180
160
140
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Taille
2. Les représentations graphiques correspondantes

Cas des données groupées (cas données continues)

La Taille (ni)
9
8
7
6
5
4
3
2
1
0
[150, 160[ [160, 170[ [170, 180[ [180, 190]
3. Les Paramètres statistiques (paramètres de position)

Le Mode ( Mo )
Est la valeur la plus fréquente = Est la valeur dont la fréquence est la plus élevée.

La détermination du Mode :

Cas des données individuellement observées (cas discret)


On utilise la définition

Cas des données groupée (cas données continues)

A. on définit la classe modale comme la classe correspondant à la fréquence la plus


élevée ni.
B. En peut calculer le Mode par la formule suivante:

 x inf a
d1 d1=ni –ni-1

d1  d 2
Mo i
d2=ni –ni+1
Borne inférieure de la classe modale Amplitude de classe
3. Les Paramètres statistiques (paramètres de position)
Numéro Taille
Le Mode ( Mo ) 1 158
Cas des données individuellement observées 2 177
(cas données non groupées) 3 181
4 190
5 163
Dans ce cas nous avons une 6 158
distribution avec quatre modes : 7 165
8 164
1. 158 9 166
2. 163 10 169
3. 164 11 173
4. 166 12 175
13 174
14 180
15 164
16 166
17 172
18 163
19 188
20 150
3. Les Paramètres statistiques (paramètres de position)

Le Mode ( Mo )
Cas des données groupées
(cas données continues) modalité de X fréquence absolue fréquence relative fréquence relative
ni fi cumulée Fi
[150, 160[ 3 3/20 3/20
la classe modale est [160, 170[ [160, 170[ 8 8/20 3/20+ 8/20= 11/20
ou l’effectif est le plus
important [170, 180[ 5 5/20 16/20
[180, 190] 4 4/20 20/20 =1
Total 20 1

Mo = 160 + a(d1/(d1+d2))
Mo =160 + 10(8-3)/[(8-3)+(8-5)]
Mo = 166,25
Nb: On peur avoir plusieurs classes Modales
3. Les Paramètres statistiques (paramètres de position)

La Médiane ( Me )
Est l’observation placée au milieu d’une série classée par ordre croissant ou décroissant

La détermination du la Médiane :

Cas des données individuellement observées (cas non groupé)


(classement croissant ou décroissant de la série )

Si n est impair, Médiane = x(n+1)/2;


Exemple : 75 62 57 12 18 ⇔ Me =57

Si n est pair, Médiane = moyenne des deux valeurs « centrales »


Exemple: 12 25 32 44 52 69 ⇔ Intervalle Médian [32-44], On prend le centre
de cet intervalle

 ni
Cas des données groupée (cas données continues)

on repère le rang de la médiane: rang  n


On repère la classe de Me (trouver la classe ou appartient le iéme
individu , pour cela on classe les individus par ordre croissant, puis le
calcul par interpolation linéaire
3. Les Paramètres statistiques (paramètres de position)
Numéro taille trie croissant
La Médiane ( Me ) 1 150
Cas des données individuellement observées 2 158
(cas données non groupées) 3 158
4 163
Méthode : 5 163
1. TRI (classer les valeurs par ordre croissant) 6 164
7 164
2. Nous avons 20 observations (paire), on obtient 8 165
l’intervalle médiane {166,169} 9 166

166  169
m  167,5
10 166
11 169
2 12 172
13 173
14 174
15 175
16 177
17 180
18 181
19 188
20 190
3. Les Paramètres statistiques (paramètres de position)

La Médiane ( Me )
Cas des données groupées
(cas données continues) modalité de X fréquence absolue fréquence relative fréquence relative
Méthode 1: ni fi cumulée Fi
le graphique de la fonction de [150, 160[ 3 3/20 3/20
répartition [160, 170[ 8 8/20 3/20+ 8/20= 11/20
[170, 180[ 5 5/20 16/20
Méthode 2 : [180, 190] 4 4/20 20/20 =1
1. TRI (classer les valeurs par ordre Total 20 1
croissant) c.à.d. calcul de Fi
160 Me 170
2. On détermine la classe
médiane [160, 170[

3. On applique extrapolation

Me  160 10  3 7  10
linéaire
  Me   160  168,75
170  160 11  3 8
3/20 10/20 11/20
Numéro Taille
3. Les Paramètres statistiques (paramètres de position) 1 158
2 177
La Moyenne : la moyenne arithmétique ( X ) 3 181
158  177  ...  150
X
4 190
Cas des données individuellement observées 5 163
(cas données non groupées)
X  169,7
20 6 158
7 165
Cas des données groupées 8 164
(cas données continues) 9 166
10 169
11 173
modalité de X fréquence absolue fréquence relative fréquence relative
12 175
ni fi cumulée Fi
13 174
[150, 160[ 3 3/20 3/20
14 180
[160, 170[ 8 8/20 3/20+ 8/20= 11/20
15 164
[170, 180[ 5 5/20 16/20
16 166
[180, 190] 4 4/20 20/20 =1
17 172


Total 20 1
18 163

X  (n1 x1  n2 x2  ...  n20 x20 )


nx 1 19 188
i i
20 150

X  170
N N
3. Les Paramètres statistiques (paramètres de position)

La Moyenne : la moyenne géométrique ( G )


La moyenne géométrique est un instrument permettant de calculer des taux moyens, notamment
des taux moyens annuels. Son utilisation n’a un sens que si les valeurs ont un caractère multiplicatif

G  x  x1  x2  ....  xn
n
n n

i 1
i
Exemple :
Les prix de l'immobilier ancien ont augmente ces 10 dernières années de la façon suivante :
Variation annuelle En utilisant la moyenne arithmétique simple, on obtiendrait une évolution
Année en % moyenne de (13,8 + 12,7 + 12,8 + 11,2 + 7,7) / 5 = 55,1 / 10 = 5,51 %
1 9,2
2 12,7 mais ce résultat est faux compte tenu de la relation entretenue par les
3 8,8 taux d'une année sur l'autre.
4 7,7 L'utilisation de la moyenne géométrique permet de solutionner ce
5 3,9
problème :
6 1,7
7 0,9 G  10 9,2 12,7  8,8  7,7  3,9 1,7  0,9  2,2  2,2  4,7  3,3
G  10 1611964,46  4,18
8 2,2
9 4,7
10 3,3
3. Les Paramètres statistiques (paramètres de position)

La Moyenne : la moyenne harmonique ( H)


On utilise la moyenne harmonique lorsqu’on veut déterminer un rapport moyen dans des
domaines ou ils existent des liens de proportionnalité inverse.
H  

n n
  .... 
n 1 1 1 1 1
i 1
xi x1 x2 x3 xn
Exemple :
Dans un parc locatif prive, 3 logements ont respectivement un loyer surfacique de:
L1 = loyers surfacique Logement A : 7,49 Mdh/m2 pour 67 m2
L2 = loyers surfacique Logement B : 11,43 Mdh/m2 pour 28 m2
L3 = loyers surfacique Logement C : 6,18 Mdh/m2 pour 97 m2

La moyenne arithmétique des loyers donne: (7,49+11,43+6,18)/3=8,37 Mdh /m²


La relation d'inverse proportionnalité qui existe entre surface des logements et loyer surfacique nous
incite a utiliser la moyenne harmonique pour le calcul du loyer moyen. Pour cela il faut tenir compte du
fait que le logement C est 3 fois plus grand que le logement B

H    9,46

n 4
  
n 1 1 1 1 1
i 1
xi 7,49 11,43 6,18 25,1
3. Les Paramètres statistiques (paramètres de position)

La Moyenne : la moyenne quadratique (Q )


Une moyenne qui trouve des applications lorsque l'on a affaire a des phénomène présentant un
caractère sinusoïdal avec alternance de valeurs positives et de valeurs négatives. Elle est, de ce
fait, très utilisée en électricité

Q  
1 n 2
x
n i 1
Exemple :
Considérons les nombre suivants {-2, 5, -8, 9, -4 }
Nous pouvons en calculer la moyenne arithmétique avec l'inconvénient de voir se neutraliser les
valeurs positives et négatives et d'aboutir a un résultat nul sans que cela ne nous apprenne quoi que
ce soit. En effet,

Le calcul de la moyenne quadratique pour la même série donne 6,16


3. Les Paramètres statistiques (paramètres de position)

Relation entre les différentes moyennes

Moyenne Harmonique ≤ Moyenne Géométrique ≤ Moyenne Arithmétique ≤ Moyenne Quadratique


4. Les Paramètres de dispersion

La Variance

La variance est un indicateur de la dispersion d’une série par rapport à sa moyenne

Var ( x)   x² Paramètre de dispersion quadratique autours de la moyenne

Var ( x )     x x 
Formules associées n
² 1 ²
1. Cas discret:
i 1
x i
n


1 ² 
Var ( x )    
n
²

n 

   
x x
i 1
i

Var ( x)     xi  x  ni   xi  x  f i
2. Cas continu classé: ² 1 k ²
k
²

n i 1 i 1
x

Var ( x)    xi ni   x    xi f i   x
1 k ²  ²  k ²  ²

 n i 1   i 1 
4. Les Paramètres de dispersion
Numéro taille trie croissant
La Variance 1 150
2 158
Cas des données individuellement observées
3 158
(cas données non groupées)
4 163
5 163
6 164

 
Calcul de la variance 7 164

Var ( x)     xi  x
8 165
9 166
² 1 n ²
10 166
n i 1
x

Var ( x)    xi   x
11 169

1 n ² ²
12 172

 n i 1 
13 173
14 174

1 
15 175

Var ( x)   (158²  ...  150 ²   169,7 ²  99,11


16 177

 20 
17 180
18 181
19 188
20 190
4. Les Paramètres de dispersion

La Variance
Cas des données groupées
(cas données continues) modalité de X fréquence absolue fréquence relative fréquence relative
ni fi cumulée Fi
[150, 160[ 3 3/20 3/20
[160, 170[ 8 8/20 3/20+ 8/20= 11/20
[170, 180[ 5 5/20 16/20

   
[180, 190] 4 4/20 20/20 =1

Var ( x)   x   xi  x  ni   xi  x  f i
Calcul de la variance Total 20 1
k k
² 1 ² ²

n i 1 i 1

Var ( x)    xi ni   x    xi f i   x
1 k  ²  k  ²

 n i 1   i 1 
² ²

 3   4 
Var ( x)  155    ...  185    170  95
 20   20 
² ² ²
4. Les Paramètres de dispersion

L’écart-type

l’écart-type est égal à la racine carrée de la variance  x  Var (x)

Cas des données individuellement observées

 x  Var ( x) 
(cas données non groupées)

99,11  9,96

Cas des données groupées


(cas données continues)

 x  Var ( x)  95  9,75
4. Les Paramètres de dispersion

Le coefficient de variation

Limite de l’écart type :


Il est exprimé dans l’unité de la variable dont il mesure la dispersion des valeurs

D’où l’idée de calculer le coefficient de variation qui est égal à l’écart-type divisé par la
moyenne, c’est-à-dire :

x
Cv 
x
4. Les Paramètres de dispersion

Intervalle de variation (ou « étendue »)

Intervalle de variation de la série = valeur maximale – Valeur minimale

Maxx   Minx 
Formule associée
Cas des données individuellement observées
(cas données non groupées)

190 150  40
   
Exemple:

Cas des données groupées Max x c  Min x c


(cas données continues)

Exemple: 185 155  30


4. Les Paramètres de dispersion

L’écart-interquartile est la différence entre le troisième quartile et le premier quartile.


IIQ  Q3 - Q1
Les quartiles sont les trois valeurs qui partagent la population, dont les unités statistiques ont préalablement été
classées par ordre croissant de valeurs , en quatre sous populations de même taille: Q1, Q2=Médiane et Q3.
4. Les Paramètres de dispersion

L’écart-interquartile

F
1,2

0,8 0,8
Q3=0,75

0,6
0,55
Q2=0,50
0,4

Q1=0,25
0,2
0,15

0
150 160 170 180 190

Calcul de Q1 et de Q3: de la même manière de la médiane


Q1 a une valeur qui est comprise entre 160 et 170
4. Les Paramètres de Concentration

La médiale
Alors que la médiane s’applique aux valeurs de la variable (les «xi»), la médiale s’applique
aux valeurs de la variables multipliées par leurs effectifs respectifs (les « nixi»).
Cas des données groupées centre de fréquence fréquence
(cas données continues) modalité de X classe absolue relative
Xi ni fi niXi NiXi
calcul de la médiale [150, 160[ 155 3 0,15 465 465
Classe médiale [160, 170[ 165 8 0,4 1320 1785
[170, 180[ 175 5 0,25 875 2660
[180, 190] 185 4 0,2 740 3400
Total 20 1 3400

 i i
 n 

   ni 1 xi 1 
n x
i 1

M l  X iinf  ai  2   160  10 1700  465   166,92


   1785 
 
ni xi
 
 
4. Les Paramètres de Concentration

La Courbe de Concentration = Courbe de LORENZ

Cas des données groupées


(cas données continues) modalité de X Xi ni fi Fi niXi NiXi fiXi FiXi
[150, 160[ 155 3 0,15 0,15 465 465 0,14 0,14
[160, 170[ 165 8 0,4 0,55 1320 1785 0,39 0,53
[170, 180[ 175 5 0,25 0,8 875 2660 0,26 0,78
[180, 190] 185 4 0,2 1 740 3400 0,22 1
Total 20 1 3400

1,00

0,90

0,80

0,70

0,60

0,50

0,40

0,30

0,20

0,10

0,00
0 0,2 0,4 0,6 0,8 1
Distribution marginales et conditionnelles
 Le tableau de contingence
 Les distributions marginales
 Les distributions conditionnelles
Exercice illustratif
1. Types de présentation des données
Soient le caractère statistique : « la taille des étudiants »
Numéro Taille i Poids j
Et le caractère statistique : « le poids des étudiants »
1 158 55
2 177 80
Le tableau de contingence croise les modalités de deux
3 181 72
variables X et Y relatives à une même population. Les
4 190 77
modalités d’une variable sont présentées en ligne (X) et les
5 163 53 modalités de l’autre variable (Y) sont présentées en colonne
6 158 58
7 165 74 En Effectifs nij
le poids des étudiants
8 164 64 Modalités de Yj
[45, 55[ [55, 65[ [65, 80[ Total

la taille des étudiants


9 166 72 Modalités de Xi

10 169 74 [150, 160[ 1 2 0 3


11 173 64
[160, 170[ 2 3 3 8
12 175 72
13 174 74 [170, 180[ 0 2 3 5
14 180 64 [180, 190] 0 1 3 4
15 164 55
16 166 65 Total 3 8 9 nij = 20 =N

17 172 61
18 163 50
Calculer : n23, n32, n22, n42, n12
19 188 73
20 150 48
Exercice illustratif
2. Distributions Marginales : il y a deux distributions marginales

Distribution Marginale des Xi


En Effectifs ni. Et n.j
Modalités de Yj
Modalités de Xi [45, 55[ [55, 65[ [65, 80[ Total
[150, 160[ 1 2 0 n1.= 3
[160, 170[ 2 3 3 n2.= 8
[170, 180[ 0 2 3 n3.= 5
[180, 190] 0 1 3 n4.= 4
Total n.1= 3 n.2= 8 n.3= 9 20
En Pourcentage fi. Et f.j Distribution Marginale des Yj

Catégories du poids des étudiants Catégories de la taille des étudiants


Effectifs Pourcentage Effectifs Pourcentage
3 3/20 f.1 3 3/20 f1.

8 8/20 f.2 8 8/20 f2.


9 9/20 f.3 5 5/20 f 3.

20 1 4 4/20 f 4.

20 1

Calculer : n.3, n.2, n22, n4., n1.


Exercice illustratif
2. Distributions Conditionnelles: il y a sept (4+3) distributions Conditionnelles
En Effectifs nij:
1.Distribution par catégories de taille dont le poids est dans l’intervalle [55,65]
2.Distribution par catégories de poids dont la taille est dans l’intervalle [170, 180]

Distribution Conditionnelle des Xi /Yj=2


Modalités de Y
Modalités de X [45, 55[ [55, 65[ [65, 80[ Total
[150, 160[ 1 n12= 2 0 3
[160, 170[ 2 n22= 3 3 8
[170, 180[ n31= 0 n32= 2 n33 = 3 5
[180, 190] 0 n42= 1 3 4
Total 3 8 9 20
Distribution Conditionnelle des Yj /Xi=3
En Pourcentage fij
Catégories du poids des étudiants Catégories de la taille des étudiants
pour une taille comprise ente 170 et pour un poids compris entre 55 et 65
180 cm kg
Effectifs Pourcentage Effectifs Pourcentage
0 0 f31 2 2/8 f12

2 2/5 f32 3 3/8 f22

3 3/5 f33 2 2/8 f32


f42
Calculer : f23, f32, f22, f42, f12 5 1 1 1/8
8 1
Exercice illustratif
3.1 Les moyennes marginales
Relations

Moyenne marginale du poids Moyenne marginale de la taille

Catégories du poids des étudiants Catégories de la taille des étudiants


Modalités Yj Effectifs Pourcentage Modalités Xi Effectifs Pourcentage
[45, 55[ 3 3/20 [150, 160[ 3 3/20
[55, 65[ 8 8/20 [160, 170[ 8 8/20
[65, 80[ 9 9/20 [170, 180[ 5 5/20
20 1 [180, 190] 4 4/20

n n x
20 1
p

  f. j y j   f i. xi
k
yj
y x
j 1
.j
i 1
p i. i k

n.. j 1 n.. i 1

Calculer : y Calculer : x
Exercice illustratif
3.2 Les variances marginales
Relations

Moyenne marginale du poids Moyenne marginale de la taille

Catégories du poids des étudiants Catégories de la taille des étudiants


Modalités Yj Effectifs Pourcentage Modalités Xi Effectifs Pourcentage
[45, 55[ 3 3/20 [150, 160[ 3 3/20
[55, 65[ 8 8/20 [160, 170[ 8 8/20
[65, 80[ 9 9/20 [170, 180[ 5 5/20
20 1 [180, 190] 4 4/20

n n x
20 1
p k
2
y 2

var( y )   y2 var( x)   x2
j 1
.j j
i 1
i. i

n.. n..

Calculer : var(y ) Calculer : var(x)


Exercice illustratif
4.1 Les moyennes Conditionnelles
Relations

Moyenne Conditionnelle du poids pour i=3 Moyenne conditionnelle de la taille pour j=2
Catégories du poids des étudiants pour une taille comprise Catégories de la taille des étudiants pour un poids compris entre
ente 170 et 180 cm 55 et 65 kg
Modalités des Xi Effectifs Pourcentage
Modalités des Yj Effectifs Pourcentage
[150, 160[ 2 2/8
[45, 55[ 0 0
[160, 170[ 3 3/8
[55, 65[ 2 2/5
[170, 180[ 2 2/8
[65, 80[ 3 3/5
[180, 190] 1 1/8
5 1
8 1

y3 
 n 3j yj
x2 
 n i2 xi
n3. n.2

Calculer : y1 ; y 2 Calculer : x1 ;
y4 x3
Exercice illustratif
4.2 Les variances conditionnelles
Relations

Variance Conditionnelle du poids pour i=3 Variance conditionnelle de la taille pour j=2
Catégories du poids des étudiants pour une taille comprise Catégories de la taille des étudiants pour un poids compris entre
ente 170 et 180 cm 55 et 65 kg
Modalités des Xi Effectifs Pourcentage
Modalités des Yj Effectifs Pourcentage
[150, 160[ 2 2/8
[45, 55[ 0 0
[160, 170[ 3 3/8
[55, 65[ 2 2/5
[170, 180[ 2 2/8
[65, 80[ 3 3/5
[180, 190] 1 1/8

n
5 1

n
8 1
p k
2
y xi2
var( y3 )   y32 var( x2 )   x22
j 1
3j j
i 1
i2

n3. n.2

Calculer : var( y1 ); var( y2 ) Calculer : var( x1 ); var( x2 )


var( y3 ); var( y4 ) var( x3 )
La variance marginale est donc égale à la somme de la moyenne des variances conditionnelles
et de la variance des moyennes conditionnelles

Vous aimerez peut-être aussi