Vous êtes sur la page 1sur 13

STATISTIQUE DESCRIPTIVE

CHAPITRE 1 : GENERALITES
I. Définitions
• La statistique est la science qui étudie les chiffres.
• La population statistique est un ensemble étudié concernant un phénomène donné par la
statistique. Exemple : l'ensemble des étudiants de la 1ère SE.
• Un élément de l'ensemble étudié s'appelle unité statistique ou individu. Exemple :
l'ensemble des maliens l'unité statistique un malien.
• Chaque unité statistique peut être étudiée suivant un ou plusieurs caractères (qualitatif ou
quantitatif).
• Caractère qualitatif : les modalités du caractère ne sont pas mesurables. Exemple : sexe,
ethnie, religion, nationalité, race, couleur des cheveux.
• Caractère quantitatif ou variable statistique : les modalités du caractère sont mesurables
ou repérables exemple : le nombre d'enfant à charge, taille, âge, température …
• Variable statistique discrète : elle est discrète lorsque les valeurs sont isolées (des
nombres entiers) exemples : nombre d'enfants, nombre de parcelles.
• Variable statistique continue : elle est continue lorsque les valeurs sont comprises entre
deux valeurs distinctes (des nombres décimaux) exemple : taille, poids …
• Exemple : Parc - auto on peut s'intéresser.
A la couleur des voitures : caractère qualitatif
A la puissance des voitures : caractère quantitatif discret
A la marque des voitures : caractère qualitatif
II. Méthode d'observation
Méthode directe : nous nous adressons directement à la population statistique :
recensement exhaustif et enquête partielle
Méthode indirecte : on soumet à l'observation statistique les documents qui ont élaborés
dans un but autre que statistique : les registres d'Etat civil

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 2


CHAPITRE 2 : LES CARACTERISTIQUES D’UNE SERIE STATISTIQUE
I. Le mode ou le dominant (caractéristique de position)
C'est la valeur du caractère qui correspond à la plus grande fréquence. Dans le cas des
caractères continus, on a la classe "modale" mais on doit faire attention aux amplitudes de
classe. Si les classes sont d'amplitude inégales on prendra comme classe modale la classe
qui a la fréquence rectifiée la plus élevée.
II. La Médiane (caractéristique de position)
La médiane est la valeur du caractère qui correspond à l'unité statistique placée au milieu de
la population statistique.
Cas des variables statistiques discrètes :
• Si l'effectif total N est impair, N = 2K + 1, la médiane est la valeur du (K + 1) nième individu (à
partir des effectifs cumulés croissants).
Par exemple : N = 27 la médiane correspond au 14ième individu.
• Si l'effectif total est pair, N = 2K la médiane n'est pas une valeur du caractère mais elle vaut
x k + x k +1
Me’ =
2
Par exemple : N = 20 la médiane correspond au 10,5ième individu.

Cas des variables statistiques continues


La médiane est la valeur du caractère pour laquelle la courbe cumulative prend la valeur (1/2) :

La médiane : Me =

A partir des fréquences cumulées croissantes on détermine un encadrement de

½ : f(x i) < ½ < f(x i+1) et la classe médiane [x i, xi+1[ : x i < Mé < xi+1.
Exemple 5 : On donne la répartition des élèves suivants, le nombre de frères
Nombre de frères 1 2 3 4 5 Total
Effectifs 10 5 15 7 8 45

TAF :
1) Quelle est la nature de la variable statistique ?
2) Déterminer le mode et la médiane

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 3


Réponse 5
1) La variable statistique est discrète ;
2) Le mode = 3 frères (qui correspond à l'effectif le plus élevé)
La médiane : variable discrète N impaire
N = 45 = 2  22 + 1 (2K+1) K = 22
A partir de l'effectif cumulé croissant (K = 22) correspond à 3 frères
Médiane = 3 frères
Exemple 6 : On donne la répartition des élèves suivant le nombre de sœurs
Nombre de sœurs 1 2 3 4 5 6 7 Total
Effectifs 10 20 8 6 2 4 8 58
Effectifs cumulés 10 30 38 44 46 50 58 X

TAF: Calculer le mode et la médiane


Le Mode : 2 sœurs (correspondent à l'effectif le plus élevé)
La médiane : variables discrète N paires N = 2K = 2  29
x29 + x30 2 + 2
K = 29 Me’ = = = 2 sœurs
2 2
Exemple 7 : On donne la répartition des élèves suivant la taille en cm
Taille en cm 150-155 155-160 160-165 165-175 175-190
Effectif 17 10 18 20 15

TAF : Calculer le mode et la médiane (algébriquement)

III. Les moyennes (caractéristique de tendance centrale : position)


On appelle moyenne une résultante de toutes les valeurs observées qui, substituée à chacune
d'elles laissent la valeur globale du caractère inchangé
1. La moyenne arithmétique X
Soient les valeurs x1, x2, x3, …….., xn
x + x + x +  xn  xi
X = 1 2 3 =
n n
Exemple 9 : 3, 5, 7, 8, 9
3 + 5 +7 + 8 + 9 32
X= = = 6,4
5 5
Cas des tableaux statistiques
n x + n x + n x + nk x k
X = 1 1 2 2 3 3 =
ni xi
n n
2. La moyenne géométrique X G
Soient les valeurs x1, x2, x3, ….., xn

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 4


X G = n x1  x2  x3  xn
Cas de tableaux statistique
n n n n
X G = n x1 1  x2 2  x3 3  x k k
3. Moyenne harmonique X H
Soient les valeurs x1, x2, x3, … , xn

n n
XH= =
1 1 1 1 1
+ + ++
x1 x2 x3 xn  xi
5
Exemple 13 : 3, 5, 7, 8, 9 XH= = 5,48
1 1 1 1 1
+ + + +
3 5 7 8 9
3
Exemple 14 : a, b, c XH=
1 1 1
+ +
a b c
Cas de tableaux statistique
n n
XH= =
n1 n2 n3 n n
+
x1 x2 x3
+ + + k
xk  xii
Retenons :
1
Si Y = 1/X la moyenne harmonique de X : X =
H
Y
4. Moyenne quadratique X q
Soient les valeurs x1, x2, x3, …, xn

Exemple 15 : 3, 5, 7, 8, 9

Cas de tableaux statistique

V. La variance et l'écart type (mesure de dispersion)

L'écart type est la moyenne quadratique des écarts par rapports à la moyenne arithmétique.
Le carré de l'écart de type est la variance

V(X) =

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 5


La formule développée

Les moments (caractéristique de dispersion)

On appelle moment d'ordre r par rapport à la valeur "a" le nombre r pré-indicer "r" par a (amr)

tel que
En exposant a = 0 Moments non centrés d'ordre "r" mr.

si r=0

si r=1

si r=2
VI. L’étendue : (mesure de dispersion)
C’est l’écart entre la plus grande valeur et la plus petite valeur du caractère.
L’étendu est une mesure de dispersion qui est très facile à calculer. C’est pourquoi
elle est souvent utilisée en contrôle de fabrication. Elle présente cependant deux
désavantages :
• Elle dépend des valeurs extrêmes qui sont souvent douteuses ou
exceptionnelles ;
• Elle ne dépend pas des autres observations.

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 6


CHAPITRE 3 : DISTRIBUTION STATISTIQUE A DEUX VARIABLES X ET Y
Dans les chapitres qui ont précédé, les distributions statistiques étudiées portaient
sur un seul caractère, une seule variable, que l’on observait sur chacune des
unités statistiques composant la population. Or il est tout à fait possible de se
trouver d’une population telle qu’on puisse étudier deux caractères différents sur
une même unité statistique.
RAPPELS DE CALCULS :
la variance v(x) =  X
2

La moyenne arithmétique ; − (X )
2

L’écart type → la covariance


Exemple 1 :
Soit une population statistique ayant été étudiée à un double point de vue x et y :
Xi 8 3 5 4 0
yj 1 3 2 1 1
1/ Calculer le coefficient de corrélation linéaire entre X et Y.
2/ Donner l’équation de la droite de régression de Yen X (méthode des moindres carrés) ;
Réponse :
Xi 8 3 5 4 0 20
Yi 1 3 2 1 1 8
X² 64 9 25 16 0 114
Y² 1 9 4 1 1 16
X.Y 8 9 10 4 0 31

Cov( x, y )
1/ Le coefficient de corrélation R xy = = -0,2 / [2,608 * 0,8] = -0,096
 x y

= 31/5 – (20/5) x (8/5) = -0,2 ;

 X ² −   X 
2

 X
²=
n  n  = (114/5) – (20/5) ² = 6,8 et σx = 2,608
 

Y ² −  Y 
2

Y ² =
n  n  = (16/5) – (8 /5) ² = 0,64 et σy = 0,8
 
2/ la droite de régression :
Y = a + b X avec b = Cov (x,y) / V(x) = -0,0956 / 6,8 = -0,014
a = Y – bX = 1,6 – (-0,014) x 5 = 1,67
Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 7
Y = 1,67 - 0,014 X
Exemple 2 : soit le tableau suivant
Yj 1 2 3 4 5 Total
Xi
1 3 2 1 0 1 7
2 1 0 1 2 1 5
3 2 1 3 2 3 11
Total 6 3 5 4 5 23
1°) Calculer ; ; v(x) et v(y)
2°) Calculer Cov (x,y) et coefficient de corrélation r x y
Solution 2 :

Le distribution marginale de x La distribution marginale de y

xi ni ni xi ni xi2 yj nj Nj yj nj y 2j
1 7 7 7 1 6 6 6
2 5 10 20 2 3 6 12
2 11 33 99 3 5 15 45
total 23 50 126 4 4 16 64
5 5 25 125
Total 23 68 252
x = 50/23=2,17 y = 68/23=2,957
v(x) = 126/23 – (2,17)2=0,769 v(y) = 252/23 – (2,957)2 = 2,213
x = 0,877 x = 1,488
Cov (x , y) = E (x* y) – E(x) . E(y)
Retenons que E (x) = ; E (y) = soit l’espérance mathématique
A partir du tableau à double entrée (voir l’énoncé) calculons
Cov (x, y) = E (x*y) – E (x). E(y) = 6,826 - 2,17 x 2,957 =
0,409
N.B. La covariance peut être positive, négative ou nulle
Si Cov (x , y) = 0 alors x et y sont indépendantes
Si Cov (x , y) > 0 alors x et y varient dans le même sens
Si Cov (x , y) < 0 alors x et y ne varient pas dans le même sens.
* Le coefficient de corrélation

R XY
= Cov(x , y) /x.y = 0,409 / 0,887  1,488 = 0,314

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 8


N.B. –1 < r x y < 1
Si r x y est = 1 alors x et y sont fortement corrélées ;
Si r x y est = 0 alors x et y sont indépendantes.

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 9


CHAPITRE 4 : LES INDICES STATISTIQUES
1. Indices simples :
L’indice élémentaire d’une grandeur Gt par rapport à une grandeur Gk est noté I = Gt x100 .
t /k Gk
(base 100) ou I = Gt (base 1). Cet indice est dit simple ou élémentaire, car il ne porte que
t/k Gk
sur une seule grandeur.
L’indice peut être exprimé en base 100 ou base 1.
Par exemple : Le prix du mil passe de 250F à 300F de 2000 à 2001. L’indice de 2001 base
2000 peut être : 300/250 = 1,2 (base 1, an 2000) ou 300*100/250= 120 (base 100, an 2000).
Propriétés :
PP1 : l’indice n’est pas exprimé en pourcentage ;
PP2 : l’indice peut être calculé sur la base 100 ou sur la base 1 ;
PP3 : L’indice supérieur à 100 veut dire que la grandeur augmente par rapport à la période
base ;
PP4 : L’indice inférieur à 100 veut dire que la grandeur diminue par rapport à la période base ;
PP5 : le taux de variation = 100 – indice ; ce taux est exprimé en %.
PP6 : la réversibilité d’un indice : I t / k x I k /t =1 (base 1)
PP7 : Transférabilité d’un indice : I t / k = I p / k x I t / p (base 1)

Exemple1:
Calculer les indices base 1 (1990) ; base 1 (1993) ; base 1 (1995).
IV. Années 1990 1991 1992 1993 1994 1995 1996 1997
V. Exportation 70 80 60 100 120 110 150 200
Solution :
VI. Années 1990 1991 1992 1993 1994 1995 1996 1997
VII. Exportation 70 80 60 100 120 110 150 200
Indice des exportations base 90 1,00 1,14 0,86 1,43 1,71 1,57 2,14 2,86
Indice des X base 93 0,70 0,80 0,60 1,00 1,20 1,10 1,15 2,00
Indice des X base 95 0,64 0,73 0,55 0,91 1,09 1,00 1,36 1,92
Indice base 1 (1990) : 1991 : 80/70 = 1,14 ; 1992 : 60/70 = 0,86 ; 1993 : 100/70= 1,43 etc.
Indice base 1 (1993) : 1990 : 70/100 = 0,70 ; 1991 : 80/100= 0,80 ; 1992 : 60/100 =0,60 etc.

Exemple 2 : à partir d’indice de base 95, calculer les indices de base 96 puis les indices de
base 93 ( voir tableau)
Années 93 94 95 96 97 98 99 2000
Indice de base 95 0,944 0,967 1,00 1,024 1,057 1,093 1,110 1,142
Solution :
Années 93 94 95 96 97 98 99 2000
Indice de base 95 0,944 0,967 1,00 1,024 1,057 1,093 1,110 1,142
Calcul des 0,922 0,944 0,976 1,000 1,032 1,067 1,084 1,115
indices base 96
Calcul des 1,000 0,973 1,059 1,030 1,120 1,158 1,176 1,21

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 10


indices de base
93

Calcul des indices base 96 : on utilise la formule


I ti/tj =I ti/tk * Itk/tj =Iti/tk *

I97/96 = I97/95 * 1/I96/95 =(1,057)*( ) =1,032


I93/96=I93/95* 1/ I96/95= (0,944)*( ) =0,922

Conseil pratique: en cas de changement de base, on peut utiliser la même formule de l’indice
simple.
III.
Iti/tj =
Attention : Ne confondez pas l’indice et le taux de variation

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 11


IV. Taux de variation = indice – 100
Taux de variation = indice -100
Ex : le PIB en milliards de $
VIII. Année 90 91 92 93 94
PIB 57 88 50 40 90
Calculer l’indice PIB base 1990 ; et le taux de croissance du PIB.
Solution :
IX. Année 90 91 92 93 94
PIB 57 88 50 40 90
Indice PIB base 90 100 154 88 70 158
Taux de variation PIB - 54% -12% -30% 58%

Indice 91 base 90= 88* = 154

Taux de variation du PIB 91 base 90 = ( -1) *100 = 54%


Ou bien taux de variation 154-100 =54%
En d’autres termes
. Si l’indice est 80 (ou 0,80) le taux de variation est = -20% ou – 0,20
. Si l(indice est 120( ou 1,20) =le taux de variation est = +20% ou +0,20

Indices synthétiques indices composés :


L’indice est dit synthétique lorsqu’il porte sur l’évolution simultanée de plusieurs grandeurs.
Les formules sont :
Indice prix Indice quantités
Laspeyres Pt*Qk
IL.P = Pk*Qk  Pk *Qt
IL.Qt / k Pk *Qk
=

t/k

Paasche Pt*Qt IPQ =


Pt *Qt
IP.P = Pk*Qt
t /k t/k
Pt *Qk
Fisher Pt*Qt
I F
= IL.Q.x.IP.P =
Pk*Qk

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 12


Exemple: En utilisant les renseignements consignés dans le tableau suivant:
produits Année 2000 Année 2001 Année 2002
Prix Quantités Prix Quantités Prix Quantités
unitaire unitaire unitaire
A 10 30 14 25 12 24
B 20 25 26 25 25 27
C 50 15 60 30 62 32
Calculer :
- L’indice synthétique des prix (pondération Laspeyres) ; (2001 et 2002)
- L’indice synthétique des prix (pondération Paasche) ; (2001 et 2002)
- L’indice synthétique des quantités pondérées par les prix (pondérations Laspeyres) ; (2001
et 2002)
- L’indice synthétique des quantités pondérées par les prix (pondérations Paasche) ; (2001
et 2002)
NB : base 100 (2000).
Solution :
L’indice synthétique des prix (pondération Laspeyres) : de 2001, base 100 (2000)

=
P01*Q00
IL.P x100 =14x30+26x25+60x15 x100 =127
01/ 00
 P00*Q00 10x30+20x25+50x15
L’indice synthétique des prix (pondération Laspeyres) : de 2002 base 100 (2000)
P02*Q00 x30+25x25+62x15 x100 =124
IL.P02/00= P00*Q00 x100=12
10x30+20x25+50x15
L’indice synthétique des prix (pondération Paasche) : de 2001, base 100 (2000)
P01*Q01 x100=14x25+26x25+60x30 x100=124
IP.P01/ 00 P00*Q01
=
10x25+20x25+50x30
L’indice synthétique des prix (pondération Paasche) : de 2002 base 100 (2000)
P02*Q02 x24+25x27+62x32 x100 =123 ,8
IP.P02/ 00= P00*Q02 x10=12
10x24+20x27 +50x32
L’indice synthétique des quantités (pondération Laspeyres) : de 2001, base 100 (2000)
P00*Q01 x25+20x25+50x30 x100 =145
IL.P01/00= P00*Q00 x100=10
10x30+20x25+50x15
L’indice synthétique des quantités (pondération Paasche) : de 2001, base 100 (2000)
P01*Q01 x25+26x25+60x30 x100 =142 .
IP.P01/00= P01*Q00 x100=14
14x30+26x25+60x15

Mr. COULIBALY Abdou coulibalyabdou07@yahoo.fr +223 76 62 09 26 13

Vous aimerez peut-être aussi