Académique Documents
Professionnel Documents
Culture Documents
Faculté Pluridisciplinaire
FPN-Nador
Statistique descriptive
Professeur : B. GANBOURI
3
4 TABLE DES MATIÈRES
4 Taux et indices 67
4.1 Calcul du taux . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.1.1 Le taux d’évolution et coefficients multiplicateurs . . . 67
4.1.2 Évolutions successives . . . . . . . . . . . . . . . . . . 68
4.1.3 Taux d’évolution moyen . . . . . . . . . . . . . . . . . 68
4.1.4 Taux d’évolution d’un produit et d’un rapport . . . . . 68
4.2 Indices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.1 Indices élémentaires . . . . . . . . . . . . . . . . . . . . 69
4.2.2 Indices synthétiques . . . . . . . . . . . . . . . . . . . 71
Chapitre 1
Introduction générale à la
statistique
1.1 Définition
On appelle statistique l’ensemble des méthodes et techniques permettant
d’analyser (on dira plutot de traiter) des ensembles d’observations.
• Identifier le problème.
5
6 CHAPITRE 1. INTRODUCTION GÉNÉRALE À LA STATISTIQUE
On note que cette partie de la statistique n’est pas traitée dans ce cours.
salaire, âge....
2. Variable qualitative : est celle dont ses modalités ne sont pas numé-
riques ou bien, ne sont pas mesurables.
Soit X une variable observée sur les individus d’une population, (ou
échantillon), de taille n. Il est indispensable de pouvoir présenter symbo-
liquement la valeur de la variable X correspondant à chacun des n individus
étudiés.
1, 2, 3, ....., j − 1, j, j + 1....., n,
La notation xj−1 < xj se lit xj−1 précède xj et xj+1 > xj se lit xj+1 suit
xj .
x1 + x2 + x3 + ..... + xn ,
Pi=n
il est plus commode d’écrire i=1 xi , qui est par définition :
i=n
X
xi = x1 + x2 + x3 + ...... + xn .
i=1
10 CHAPITRE 1. INTRODUCTION GÉNÉRALE À LA STATISTIQUE
Propriétés
n
X n
X n
X
(xi + yi ) = xi + yi .
i=1 i=1 i=1
x1 × x2 × x3 × ..... × xn ,
Qn
il est plus commode d’écrire i=1 xi , qui est par définition :
n
Y
xi = x1 × x2 × x3 × ..... × xn .
i=1
Propriété
x1 , x2 , ......., xn .
1.3. NOTATIONS ET SYMBOLES 11
Une telle série est dite série ordonnée. Par exemple, la série ordonnée
de la série suivante :
0 1 1 0 3 4 0 4 2 4 3 2 2 0,
est :
0 0 0 0 1 1 2 2 2 3 3 4 4 4.
• Une série statistique relative à une seule variable est dite série statis-
tique simple.
Exemples
Exemple 1.1
Après une enquête réalisée auprès de 20 étudiants sur leurs ”mention” au
bac, on a obtenu les résultats suivants :
P P B AB AB AB TB P B AB
E P B B E P P AB AB B
P = 0, AB = 1, B = 2, T B = 3, E = 4.
• Population : 20 étudiants.
Exemple 1.2
Parmi tous les employée d’une entreprise, on interroge sept employés sur leur
sexe, leur âge et leur revenu mensuel net. La codification a été faite selon le
tableau suivant :
• Individu : un employé.
X: 1 1 2 2 2 1 2
Y : 43 34 38 53 29 31 40
Z : 4600 3785 3950 5200 3325 3890 4159
1.4 Exercices
Exercice 1.1
- Pour chacune des variables suivantes, préciser si elle est qualitative, quan-
titative discrète ou quantitative continue :
1.4. EXERCICES 13
Exercice 1.3
Proposer des exemples de variable quantitative transformée en variable
qualitative. Préciser les modalités de cette dernière.
14 CHAPITRE 1. INTRODUCTION GÉNÉRALE À LA STATISTIQUE
Chapitre 2
Statistique descriptive
univariée
Exemple 2.1
Le gérant d’un magasin vendant des ordinateurs a relevé le nombre d’or-
dinateurs vendus par jour. Son relevé a porté sur les ventes au cours des 50
jours de l’été. Le relevé des observations est listée ci-dessous :
7 13 8 10 6 12 10 8 6 10
6 14 7 15 9 11 12 11 12 5
14 10 8 10 14 12 8 5 7 13
12 16 11 6 10 10 12 12 15 14
5 14 9 6 13 11 10 11 12 15
15
16 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE
5 6 7 8 9 10 11 12 13 14 15 16
ou par : {xi ; i = 1, 2, ....., J}, avec J est le nombre total des valeurs
distinctes de la variable X, (ici, J = 12).
• Les effectifs peuvent être remplacés par des quantités appellées fré-
quences et qui sont exprimées par :fi = nni . Celles-ci, souvent expri-
mées en pourcentages en les multipliant par 100 : pi = 100 × fi .
3
Pour x1 ona n1 = 3, f1 = 50
= 0, 06
et p1 = 100 × f1 = 6%.
Pour x3 , on a :
j=3
X
N3 = nj = n1 + n2 + n3 = 3 + 5 + 3 = 11
j=1
j=3
X
F3 = fj = f1 + f2 + f3 = 0, 06 + 0, 1 + 0, 06 = 0, 22
j=1
xi ni Ni fi (%) Fi (%)
5 3 3 6 6
6 5 8 10 16
7 3 11 6 22
8 4 15 8 30
9 2 17 4 34
10 8 25 16 50
11 5 30 10 60
12 8 38 16 76
13 3 41 6 82
14 5 46 10 92
15 3 49 6 98
16 1 50 2 100
Total 50 - 100 -
x1 < x2 < x3 < ...... < xj−1 < xj < ..... < xJ
i=j
X
Fj = f1 + f2 + ... + fj = fi
i=1
On note que FJ = 1 et ∀i : 0 ≤ Fi ≤ 1
Tableau statistique :
c’est un tableau dans lequel on représente, de façon synthétique, les don-
née statistique relatives à la variable quantitative discrète étudiée : X. Il se
compose de :
• La troisème colonne comprte soit les effectifs cumulé, soit les fréquences
cumulées.
1) Diagramme en bâtons :
Effectif
8− • •
7−
6−
5− • • •
4− •
3− • • • •
2− •
1− •
. . . . . . . . . . . .
0 5 6 7 8 9 10 11 12 13 14 15 16
Age
FIG. 2.1 - Diagramme en bâtons relatif aux données de l’exemple 2.1
0, x < x1 ;
F (x) = F , xj ≤ x < xj+1 ;
j
1, xJ ≤ x.
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 21
Fréquences cumulées
1− • •
•
0.9−
•
0.8−
•
0.7−
0.6− •
0.5− •
0.4−
•
0.3− •
•
0.2−
•
0.1−
•
0 . . . . . . . . . . . .
5 6 7 8 9 10 11 12 13 14 15 16
Age
FIG. 2.2 - Diagramme cumulatif relatif aux données de l’exemple 2.1
Illustration
• Les différents points sont joints par des segments horizontaux puisque,
par définition, pour une variable discrète la fréquence cumulée reste
constante entre deux valeurs successives.
22 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE
Les quantiles les plus utulisés sont associés à certaines valeurs particu-
lières de α :
Méthode approximative
1. Le mode : est la valeur qui a le plus grand effectif (ou la plus grande
fréquence ) et il est dénoté par M0 .
M0 = x6 = 10 et M0 = x8 = 12.
12
1 X
x = ni xi
50 i=1
1
= (3 × 5 + 5 × 6 + 3 × 7 + 4 × 8 + 2 × 9 + 8 × 10
50
+5 × 11 + 8 × 12 + 3 × 13 + 5 × 14 + 3 × 15 + 1 × 16)
= 10.34
On voit que cette valeur, x = 10.34, n’existe pas dans la série statistique, cependant elle
demeure un indicateur de tendance centrale pour caractériser le centre de cette série.
Remarque : La moyenne arithmétique n’est pas nécessairement une
valeur possible.
Autres moyennes
Elles existent d’autres types de moyennes qui ont d’usage approprié
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 25
J
! n1
1
ni
= (xn1 1 × xn2 2 × ..... × xnJ J ) n .
Y
G= xi
i=1
J
! n1
xni i
Y
G = exp log
i=1
J
!!
1
xni i
Y
= exp log
n i=1
J
!
1X
= exp log(xni i )
n i=1
J
!
1X
= exp ni log(xi ) .
n i=1
n n
H = PJ ni = n1 n2 nJ
i=1 xi x1
+ x2
+ ..... + xJ
Remarque
Les moyennes dont on a indiqué les formules plus haut sont dite moyennes
pondérées ; cela signifie que chaque valeur xi de la variable est multipliée
(pondérée) par un coefficient, ici par l’effectif ni qui lui correspond.
On parle de moyennes simples quand on n’effectue pas de pondération. Au-
trement dit, lorsque toutes les valeurs xi ont le même effectif qui vaut 1.
Dans ce cas, On remplace tout les ni par 1 dans les formules précédentes
(ni = 1, ∀i = 1, ...n).
Par exemple, si 5 étudiants ont pour âge respectif 18, 19, 20, 21 et 22 ans,
leur âge moyen est donné par 18+19+20+21+22
5
= 20 ans.
Cette caractéristique donne une première idée sur la dispersion des ob-
servations.
28 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE
p √
L’écart-type : est σX = V ar(X) = 8.98 = 2.99.
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 29
16−
•
14−
12− M0 = x 1 = x
2
10− • •
8−
6−
4− • •
2− • •
• . . . . . . . •.
0 10 20 30 40 50 60 70 80
FIG. 2.3 - Cas d’une série symétrique
16−
•
14−
12− M0 < x 1 < x
2
10− • •
8−
6−
•
4− •
•
2− •
• . . . . . . . •.
0 10 20 30 40 50 60 70 80
FIG. 2.4 - Cas d’une série dissymétrique à droite
16−
•
14−
12− x < x 1 < M0
2
10− • •
8−
6−
•
4− •
• •
2−
• . . . . . . . •.
0 10 20 30 40 50 60 70 80
FIG. 2.5 - Cas d’une série dissymétrique à gauche
µ3
γ1 = 3
,
σX
1 Pi=J Pi=J
où, µ3 = n i=1 ni (xi − x)3 = i=1 fi (xi − x)3 .
x 3 + x 1 − 2x 1
4 4 2
CY =
x3 − x1
4 4
x − M0
CP =
σX
Pour la série statistique donnée dans l’Exemple 2.1, les différents coefficients
d’asymétrie sont :
µ3 9.98 ∼
γ1 = 3
= = 0.37
σX 2.993
3
4
+ 14 − 2 12 12 + 8 − 2 × 10
CY = 3 1 = =0
4
−4 12 − 8
10.34−12 ∼
(
x − M0 2.99 = −0.6, pour M0 = 12 ;
CP = = 10.34−8 ∼
σX 2.99 = 0.8, pour M0 = 8.
(Veuillez refaire les calculs et intérpreter les résultats).
2.1.8 Exercices
Exercice 2.1
Les notes obtenus par les étudiant d’une classe à un contrôle de mathé-
matique sont listées comme suit :
19 4 18 9 10 12 10 11 13 12
9 8 4 5 8 16 12 4 18 12
Exercice 2.2
Dans une petite localité, on a relevé de nombre de pièces par apparte-
ment :
Nombre de pièces 1 2 3 4 5 6 7
Nombre d’appartements1 48 72 96 64 39 25 3
Pour présenter les données listées ci-dessus, il n’est pas pratique de prévoir
une case par diamètre ! On regroupe les valeurs de cette variable en classes
d’amplitudes égales.
Nombre de classes : ici, on a n = 44.
• Selon la règle de Sturge : le nombre de classes est J = 1+3.3×log(44) ∼ =
6.42 ≈ 6 classes √
• Selon la règle de Yule : le nombre de classes est J = 2.5× 4 44 ∼= 6.43 ≈ 6
classes
Amplitude de classes : On a xmax = 2.84cm et xmin = 1.94cm, donc
xmax − xmin = 0.90cm. Ainsi , l’amplitude est 0.90 6
= 0.15.
Par suite, on peut regrouper les mésures de diamètres par classe d’ampli-
tude 0.15 et rangées par ordre croissant :
[1.94, 2.09[ [2.09, 2.24[ [2.24, 2.39[ [2.39, 2.54[ [2.54, 2.69[ [2.69, 2.84[,
qu’on les note respectivement par :
[bi−1 , bi [ ni Ni fi Fi
[1.94, 2.09[ 8 8 0.18 0.18
[2.09, 2.24[ 10 18 0.23 0.41
[2.24, 2.39[ 9 27 0.20 0.61
[2.39, 2.54[ 8 35 0.18 0.79
[2.54, 2.69[ 5 40 0.11 0.90
[2.69, 2.84[ 4 44 0.10 1.00
Total 44 - 1.00 -
f1 0.18
d1 = = = 1.20, d2 = 1.53, d3 = 1.33, d4 = 1.20, d5 = 0.73, d6 = 0.66
0.15 0.15
L’histogramme de fréquence de l’Exemple 2.2 est comme suit :
36 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE
Densité de fréquence
2−
1−
0 p p p p p p p
1.94 2.09 2.24 2.39 2.54 2.69 2.84
Diamètre en cm
FIG. 2.6 - L’histogramme de fréquence des données de l’Exemple 2.2
0, x < b0 ;
F (x) = Fj + dj (x − bj ), bj−1 ≤ x < bj ;
bJ ≤ x.
1,
2.2. CAS D’UNE VARIABLE QUANTITATIVE CONTINUE 37
1− •
0.9− •
0.8− •
0.7−
0.6− •
α M (α, xα )
0.5−
0.4− •
0.3−
0.2− •
0.1−
0 •p p p p p p p
1.94 2.09 2.24 xα 2.39 2.54 2.69 2.84
FIG. 2.7 - La courbe cumulative correspondante aux données de l’Exemple 2.2
Illustration
α − Fj−1 α − Fj−1
xα = bj−1 + aj × = bj−1 + aj × .
Fj − Fj−1 fj
1
2. La mediane : est le quartile d’ordre 2
défini au paragraphe précédent.
J J
1X X
x= n i ci = f i ci ,
n i=1 i=1
J
! n1
1
ni
= (cn1 1 × cn2 2 × ..... × cnJ J ) n ,
Y
G= ci
i=1
n n
H = PJ ni = n1 c2 nJ
i=1 ci c1
+ c2
+ ..... + cJ
Le calcul des moyennes des données de l’Exemple 2.2, nous donne les résultats :
6
X
x = f i ci
i=1
= 0.18 × 2.015 + 0.23 × 2.165 + 0.2 × 2.315 + 0.18 × 2.465
+ 0.11 × 2.615 + 0.1 × 2.765
≈ 2.33
v
u 6
uY n
44
√
44
G= t c i i = 2.0158 × 2.16510 × 2.3159 × 2.4658 × 2.6155 × 2.7654 ≈ 2.32
i=1
44 44
H = P6 ni = 8 10 9 8 5 4 ≈ 2.30
i=1 ci 2.015
+ 2.165
+ 2.315
+ 2.465 + 2.615
+ 2.765
40 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE
2. L’intarvalle interquartiles : IQ = x 3 − x 1 .
4 4
3. La varaince :
J J
1X
ni (ci − x)2 = fi (ci − x)2 .
X
V ar(X) =
n i=1 i=1
q
4. L’écart-type : σX = V ar(X).
• La varaince :
6
!
fi c2i − x2
X
V ar(X) =
i=1
= 0.18 × 2.0152 + 0.23 × 2.1652 + 0.2 × 2.3152 + 0.18 × 2.4652
+ 0.11 × 2.6152 + 0.1 × 2.7652 − 2.332
≈ 0.06
q √
• l’écart-type : σX = V ar(X) = 0.06 ≈ 0.77
2.3. CAS D’UNE VARAIBLE QUALITATIVE 41
12−
•
•
10−
8−
•
6−
•
4− • •
• •
2− •
•
0 p p p p p p p p p p p
2 4 6 8 10 12 14 16 18 120 22
FIG. 2.8 - Cas d’une série dissymétrique à gauche
Les coefficients de Yule et Pearson qui mésurent l’asymétrie d’une série conti-
nue ont les même expressions que dans le cas d’une variable discrète, mais
pour le coefficient de Fischer on doit remplacer dans la formule µ3 , les valeurs
xi par les centres de classes ci .
Est demandé à l’étudiant d’étudier la dissymétrie de la série donnée dans
l’Exemple 2.2.
1. le digramme en colonnes,
42 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE
2. le digramme en secteurs.
on va traiter ici le cas d’une variable qualitative ordinale et le cas d’une
variable qualitative nominale, dans les deux exemples suivants :
Exemple 2.3 ( cas d’une variable ordinale)
Une enquête réalisée auprès de 40 étudiants sur leur mention obtenu au
Bac. Les résultats sont coadifiés comme suit :
P P AB B B P AB AB P P
AB P AB B TB P AB TB P B
P AB TB E B E AB TB P E
P AB P B B P AB TB TB P
1. Tableau statistique
Mention au Bac ni Ni fi Fi
P 14 14 0.35 0.35
AB 10 24 0.25 0.60
B 7 31 0.175 0.775
TB 6 37 0.15 0.925
E 3 40 0.075 1.00
Total 40 - 1.00 -
2. Représentation graphique
Pour une variable qualitative ordinale (ou nominale), on a deux sortes
de représentations graphiques :
Effectifs
14−
12−
10−
8−
6−
4−
2−
0
P AB B TB E
FIG. 2.9 - Diagramme en colonnes dess effectifs
35%
AB 25%
7.5%
E
15%
17.5%
TB
B
FIG. 2.10 - Diagramme en secteurs dess fréquences
44 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE
M M D C C C C D C V
V C D D C C C M M M
1. Tableau statistique
Etat matrimonial ni fi
C 9 0.45
M 5 0.25
D 4 02
V 2 0.1
2. Représentation graphique
Effectifs
10−
8−
6−
4−
2−
0
C M D V
FIG. 2.11 - Diagramme en colonnes dess effectifs
45%
10%
25% V
M
20%
D
FIG. 2.12 - Diagramme en secteurs dess fréquences
46 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE
2.3.1 Exercices
Exercice 2.3
La série suivante représente le nombre de pièces non-conformes par jour,
dans une entreprise :
122 111 154 98 93 67 134 167 123 142 132 151 127 119 137 130 127 135 187
165 161 151 143 148 132 127 99 132 139 100 136 132 127 167 118 116 83 77.
1) Classer ces données dans des classes de même amplitude
2) Calculer la médiane et déterminer la classe modale
3) Calculer les moyennes arithmétique, géométrique, et harmonique
4) Etudier l’asymétrie de cette série
5) Calculer la variance, l’écart-type.
Exercice 2.4
Dans une usine fabriquant des composantes électroniques, le service d’étude
de qualité a procédé à la mesure de la durée de vie d’un lot de 40 pièces. On
notera X cette durée de vie mesuré en centaine d’heurs. Les résultats sont
regroupés dans le tableau suivant :
X ] 5 ; 9] ] 9 ; 11] ] 11 ; 19]
Effectifs 42 72 102
1) Tracer l’histogramme de cette distribution
2) Donner la fonction de répartition de cette variable statistique X et tracer
son graphe
3) Quelle est la classe modale
4) Calculer la médiane, l’âge moyen et l’écart type
5) Calculer le premier et le troisième quartile ainsi que l’intervalle interquar-
tile
Exercice 2.4
Une enquête portant sur les villes marocaines visitées par un groupe des
élèves d’une établissement scolaire sur nador, nous donne la répartition sui-
vante :
Ville Nombre d’élèves
Rabat 27
Tanger 38
Fes 52
Marrakech 15
Agadir 33
47
48 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE
1. Distributuion conjointe
Définition : On appelle série conjointe des effectifs de X et Y l’en-
semble des informations (xi , yj , nij ), pour i = 1, ..., J et j = 1, ..., K.
Tableau de contingence
3.1. DEUX VARIABLES QUANTITATIVES 49
HH
Y
H y1 y2 ... yj ... yK
X HH
H
x1 n11 n12 ... n1j ... n1K
x2 n21 n22 ... n2j ... n2K
... ...
xi ni1 ni2 ... nij ... niK
... ...
xJ nJ1 nJ2 ... nJj ... nJK
Remarque :
J X
X K
nij = n,
i=1 j=1
PJ PK
où la double somme i=1 j=1 s’exprime par :
J X
X K J
X J
X J
X J
X
nij = (ni1 + ni2 + ... + niK ) = ni1 + ni2 + ... + niK
i=1 j=1 i=1 i=1 i=1 i=1
HH Y
H
[4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6]
X H
HH
0 1 1 0 0 0
1 3 0 1 0 0
2 0 2 4 1 0
3 0 0 1 3 2
4 0 0 0 0 1
Par exemple, le chiffre 3 situé dans la deuxième colonne est l’effectif associé
au couple (0, [4, 4.72[). Il indique que trois salariés ayant 1 enfant et ayant en
même temps un salaire compris entre 4000Dh et 4720Dh.
50 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE
2. Distributuion marginale
On obtien la distribution marginale en ajoutant au tableau de contin-
gence les totaux en lignes et en colonnes, comme suit :
HH
Y
H y1 y2 ... yj ... yK Totaux
X HH
H
x1 n11 n12 ... n1j ... n1K n1•
x2 n21 n22 ... n2j ... n2K n2•
... ...
xi ni1 ni2 ... nij ... niK ni•
... ...
xJ nJ1 nJ2 ... nJj ... nJK nJ•
Totaux n•1 n•2 ... n•j ... n•K n
Illustration :
Remarque : on a :
K
X
n•j = n
j=1
HH Y
HH
[4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Totaux
X HH
0 n11 =1 n12 =1 n13 =0 n14 =0 n15 =0 n1• = 2
1 n21 =3 n22 =0 n23 =1 n24 =0 n25 =0 n2• = 4
2 n31 =0 n32 =2 n33 =4 n34 =1 n35 =0 n3• = 7
3 n41 =0 n42 =0 n43 =1 n44 =3 n45 =2 n4• = 6
4 n51 =0 n52 =0 n53 =0 n51 =0 n55 =1 n5• = 1
Totaux n•1 =4 n•2 =3 n•3 =6 n•4 =4 n•5 =3 20
X 0 1 2 3 4 Effectif total
Effectifs 2 4 7 6 1 20
Y [4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Effectif total
Effectifs 4 3 6 4 3 20
3. Distributuion conditionnelle
I On appelle distribution conditionnelle de Y pour X = xi , la
série statistique de la variable Y sachant que la variable X prend
la modalité xi et on la note par : Y/X=xi .
A la ligne i du tableau de contingence, on lit la distribution de la
variable Y sachant que X = xi .
52 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE
Y/X=3 [4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Effectif total
Effectifs 0 0 1 3 2 6
Dans le tablau suivant, on donne les fréquences des couples (xi , yj ) et les fréquences
marginales des modalités xi et yj correspondantes aux données de l’Exemple 3.1 :
HH Y
HH
[4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Totaux
X HH
0 f11 = 0.05 f12 = 0.05 f13 = 0 f14 = 0 f15 = 0 f1• = 0.10
1 f21 = 0.15 f22 = 0 f23 = 0.05 f24 = 0 f25 = 0 f2• = 0.20
2 f31 = 0 f32 = 0.10 f33 = 0.20 f34 = 0.05 f35 = 0 f3• = 0.35
3 f41 = 0 f42 = 0 f43 = 0.05 f44 = 0.15 f45 = 0.10 f4• = 0.30
4 f51 = 0 f52 = 0 f53 = 0 f54 = 0 f55 = 0.05 f5• = 0.05
Totaux f•1 = 0.20 f•2 = 0.15 f•3 = 0.30 f•4 = 0.20 f•5 = 0.15 1
Y/X=3 [4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Total
fréquences f1/X=3 = 0 f2/X=3 = 0 f3/X=3 = 16 f4/X=3 = 36 f5/X=3 = 26 1
q
Et σX/Y =y = V ar(X/Y =yj ).
j
q
Et σY/X=x = var(Y/X=xi ).
i
et : var(X)
√ = 0.1 × 02 + 0.2 × 12 + 0.35 × 22 + 0.3 × 33 + 0.05 × 43 − 22 = 1.1, et :
σX = 1.1 ∼ = 1.05.
y = 0.2 × 4.36 + 0.15 × 5.08 + 0.3 × 5.8 + 0.2 × 6.52 + 0.15 × 7.24 = 5.764
NB : On a utilisé ici, les centres de classes comme valeurs pour la variable continue Y .
56 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE
NB : On a utilisé ici, les centres de classes comme valeurs pour la variable continue Y .
Avec, ci sont les centres de classes de la variable Y . En excluant les valeurs nulles et les fréquences
nulles données dans le tableau 3.10, on aura :
cov(X, Y ) 0.828
r(X, Y ) = = ≈ 0.83.
σX σY 1.05 × 0.95
58 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE
Propriétés :
- Le coefficient de correlation est indépendant de l’échelle utilisée pour
les mesures et prend sa valeur dans l’intervalle [−1, 1].
- Le coefficient de correlation est symétrique : r(X, Y ) = r(Y, X).
- La correlation entre une série statistique et elle-même vaut nécessai-
rement 1, c’est-à-dire que r(X, X) = 1 et r(Y, Y ) = 1.
3. Liaison linéaire :
Pour la serie données dans l’exemple 3.1, on a r(X, Y ) = 0.83 est une valeur positive
plus proche de 1. On peut dire qu’il y a une dependance linéaire entre le nombre
d’enfants et le salaire mensuel. Autrement dit, plus le salarié a plus d’enfants plus
que son salair est elevé. dans la suite, on va mettre en evidence cette situation
graphiquement et numériquement.
7.24− • •
6.52− • •
5.8− • •
•
5.08− • •
•
4.36− •
p p p p
0 1 2 3 4
FIG. 3.1 - Nuage de points associé aux observations de l’Exemple 3.1
On notera que |yi − (axi + b)| représente, dans le nuage de points, la distance
verticale du point de coordonnées (xi , yi ) à la droite d’equation y = ax + b.
La minimisation de F en a et b fournit la solution unique suivante :
cov(X, Y )
a= ; b = y − ax
V ar(X)
60 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE
Propriétés :
- La droite d’équation y = ax + b est appelée droite de régression linéaire
de Y sur X ; elle passe par le barycentre du nuage des points, qui le point G
de coordonnées (x, y) et on la note par (DY /X ).
- Si r(X, Y ) > 0, alors a > 0 : la droite (DY /X ) est ascendante.
- Si r(X, Y ) < 0, alors b < 0 : la droite (DY /X ) est descendante.
Pour les observations données dans l’Exemple 3.1, on a vu que r(X, Y ) = 0.83 est
une valeur positive plus proche de 1. La régression linéaire de la variable Y sur la
variable X est donc réalisée et on a :
cov(X, Y ) 0.828
a= = ' 0.75 et b = y − ax = 5.764 − 0.75 × 2 ' 4.264
V ar(X) 1.1
(DY /X )
7.24− • •
6.52− • •
5.8− ◦• •
•
5.08− • •
•
4.36− •
p p p p
0 1 2 3 4
FIG. 3.2 - Droite de régression associée aux observations de l’Exemple 3.1
Remarque :
- Lorsque r(X, Y ) > 0, alors les deux variables ont tendance à varier dans le
même sens (comme le cas de l’Exemple 3.1).
- Lorsque r(X, Y ) < 0, alors les deux variables ont tendance à varier en sens
opposés.
3.2. UNE VARIABLE QUANTITATIVE ET UNE QUALITATIVE 61
C1 (X = x1 ) C2 (X = x2 ) .... Ck (X = xk ) .... CJ (X = xJ )
y11 , y21 , ..., yn1 1 y12 , y22 , ..., yn2 2 .... y1k , y2k , ..., ynk k .... y1J , y2J , ..., ynJ J
y1 y2 .... yk .... yJ
V ar(y1 ) V ar(y2 ) .... V ar(yk ) .... V ar(yJ )
Exemple 3.2
Dans un groupe de 15 étudiants, on s’interesse à leur notes obtenues à un
examen terminal et leur assiduités en cours. Les résultats sont données dans
le tableau suivant :
Etudiant No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Note sur 20 15 14 12 8 16 13 10 17 4 8 11 6 8 7 12
Assiduité A A A A A B B B B B C C C C C
C1 (X = A) C2 (X = B) C3 (X = C)
15, 14, 12, 8, 16 13, 10, 17, 4, 8 11, 6, 8, 7, 12
y1 = 13 y2 = 10.4 y3 = 8.8
V ar(y1 ) = 8 V ar(y2 ) = 19.44 V ar(y3 ) = 5.36
Illustration
La boîte représentante la variable Y pour une classe définie par la variable X
est la partie du graphique comprise entre les premier et troisième quartille de
Y . La mediane située à l’intérieur de la boîte est représentée par un trai hori-
zental. Dans les parties haute et basse de la boîte figurent des traits verticals
joignant le minimum au premier quartile (en bas) et le toisième quartile au
maximum (en haut).
3.2. UNE VARIABLE QUANTITATIVE ET UNE QUALITATIVE 63
Pour les données dans l’Exemple 3.2, les valeurs de la mediane, le premier quartile
et le troisième quartile pour chaque classe défine par X sont :
- Pour la classe C1 : la mediane est 14, le premier quartille est 12 et le troisième
quartile est 15.
- Pour la classe C2 : la mediane est 10, le premier quartille est 8 et le troisième
quartile est 13.
- Pour la classe C3 : la mediane est 8, le premier quartille est 7 et le troisième quartile
est 11.
Ainsi, le graphique en boîtes parallèles représenatant les données de l’Exemple 3.2
est le suivant :
120−
−
18−
−
16−
−
14−
−
12−
−
10−
−
8−
−
6−
−
4−
−
2−
−
p p p
0 C1 C2 C3
FIG. 3.3 - Boîtes parallèles associées aux observations de l’Exemple 3.2
Remarque :
Les boîtes parallèles de cet exemple sont positionnées différemment, donc
elles indiquent une liaison importante entre les notes obtenues et l’assiduité.
64 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE
-
3
1 X 1
s2R = nk V ar(yk ) = (5 × 8 + 5 × 19.44 + 5 × 5.36) ' 10.93
15 k=1 15
1 P3
- On vérifie bien que : y = 15 k=1 nk yk et V ar(Y ) = s2E + s2R .
2. Rapport de corrélation
C’est un indice de liaison entre les deux variables X et Y noté CY /X .
Il est défini par : v
u s2E
u
sE
CY /X = t =
V ar(Y ) σY
3.2. UNE VARIABLE QUANTITATIVE ET UNE QUALITATIVE 65
Propriétés :
- CY /X est compris entre 0 et 1.
- Plus que CY /X est grand, plus la liaison entre X et Y est forte.
Pour les données d l’Exemple 3.2, on a :
v s
s2E
u
u 3
CY /X = t = ' 0.46,
V ar(Y ) 13.93
un valeur qui est grande, ce qui implique qu’il y une liaison importante entre les
notes obtenues et l’assiduité. D’où le résultat déjà indiqué par les boîtes parallèles
(Fig 3.3).
66 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE
Chapitre 4
Taux et indices
67
68 CHAPITRE 4. TAUX ET INDICES
4.2 Indices
L’indice d’une grandeur est le rapport entre la valeur de cette grandeur au
cours d’une période courante et sa valeur au cours d’une période de base. Il
mesure la variation relative de la valeur entre la période de base et la période
courante. Souvent, on multiplie le rapport par 100 ; on dit : indice base 100.
2. réversibilité :
Si une grandeur V prend les valeurs V0 et Vt aux instants 0 et t alors
son indice est :
1002
I0t = .
It0
Exemple : Si un prix augmente de 20% de 2016 à 2018, que dire de
son évolution de 2018 à 2016 ?
Réponse : On a I20182016 = 120 et on cherche I20162018 .
1002
Alors, I20162018 = I2018 ' 83.33.
2016
Autrement dit, le prix a diminué de 16.76% de 2018 à 2016. .
V V1
V2
1
It = It × It × .
0 0 0
100
V1
!
V It 1
It = V2
0
× .
0
It 0
100
R
P Q
1 160 × 50
I2018 = I2018 × I2018 × = = 80.
2014 2014 2014
100 100
produits.
- L’indice de la valeur globale est :
2014 2018
Prix (Dh) Quantité Prix (Dh) Quantité
Produit 1 3.88 7 4.13 8
Produit 2 7.50 4 8.42 3
Produit 3 12.45 3 11.71 5
Les recettes ont donc augmenté de 23.64% de 2014 à 2018. Mais cette aug-
mentation est-elle due à une augmentation des prix ou des quantités ?
Pour pouvoir déterminer l’influence des prix ou des quantités, il faut définir
des scénarios permettant d’isoler soit les prix soit les quantités. C’est l’idée
des indices de Laspeyres et de Paasche :
72 CHAPITRE 4. TAUX ET INDICES
1. Indice de Laspeyres des prix : C’est un indice qui mesure des prix
des biens composant un panier entre deux dates 0 et t, en prenant
comme référence la valeur du panier au temps initial t = 0 et en sup-
posant que les quantités des biens du panier n’ont pas varié entre les
deux dates. Il est donné par la formule :
V
I20182014
LP20182014 LQ
20182014
P
P20182014
Q
P2018 2014
P
F20182014
Q
F20182014
123.64 103.90 122.50 100.90 119.58 102.14 121.03