Académique Documents
Professionnel Documents
Culture Documents
19/10/2017 1
SOMMAIRE
1. La statistique est une science qui consiste à collecter les données, les traiter ,
les analyser, les interpréter et les présenter .
Echantillon de taille n = 6
Caractères Modalités
- Prénom: Ali
- Taille en cm: 170
- Nombre d’enfants 1
Population de taille N = 30
3. Variable qualitative est une variable dont les modalités ne peuvent pas être
mesurées.
Exemple: Langues (Arabe, Anglais, Français,...)
On peut distinguer deux types de variables qualitatives:
3.1 Variable qualitative nominale est une variable dont les modalités ne sont pas
ordonnées.
Exemple: Catégorie socioprofessionnelle (Ingénieur ,Technicien , …)
3.2 Variable qualitative ordinale est une variable dont les modalités sont
ordonnées.
Exemple: Mention de bac (Très bien, Bien, Assez Bien,…)
4.Variable quantitative est une variable dont les modalités prennent des
valeurs numériques.
Exemple: le salaire mensuel d’un fonctionnaire
On peut distinguer deux types de variables quantitatives:
4.1 Variable quantitative discrète est une variable dont les modalités font
partie d’un ensemble fini .
Exemple: Le nombre d’enseignants de la faculté Ain Sebaa.
4.2 Variable quantitative continue est une variable dont les modalités
prennent des valeurs dans un intervalle.
Exemple: Poids des cartables des élèves
X: Ω a F
i → X (i ) = xi
où :
- i est un individu ou un élément de Ω
- X ( i ) ou est la valeur du caractère X pour l’individu i.
Caractère ou Variable
Quantitatif Qualitatif
1. L'effectif total (ou taille) d’une série statistique (série brute), noté N , est le
nombre d'individus qui composent cette série ou population.
Exemple : Au cours d’un semestre, on a observé 20 élèves d’une école dont les
notes sont données par le tableau suivant :
1 2 3 4 5 6 7 8 9 10
12 10 12 7 5 12 10 7 13 8
11 12 13 14 15 16 17 18 19 20
7 7 10 12 10 5 5 5 8 13
Exemple : Classant la série des 20 notes précédentes par ordre croissant, alors la
série ordonnée obtenue est: 5,5,5,5,7,7,7,7,8,8,10,10,10,10,12,12,12,12,13,13.
Remarque:
6
N = n1 + n2 + n3 + n4 + n5 + n6 = 4 + 4 + 2 + 4 + 4 + 2 = ∑ ni = 20
i =1
Exemple : Le nombre des élèves qui ont obtenu au plus la note 8 est :
3
N 3 = n1 + n2 + n3 = 4 + 4 + 2 = ∑ nk = 10
k =1
j =i
Exemple : Le nombre des élèves qui ont obtenu au moins la moyenne est :
6
N = n4 + n5 + n6 = 4 + 4 + 2 = ∑ nk = 10
d
4
k =3
Exemple :
4
La fréquence des élèves qui ont obtenu 5 est égale à : f1 = = 0, 2
20
2.2 Fréquence cumulée croissante est la proportion d’individus ayant des modalités
du caractère étudié inférieures ou égales à . On a :
i
N i n1 n2 ni
N i = n1 + n2 + ... + ni ⇒ = + + ... + ⇒ Fi = f1 + f 2 + ... + f i = ∑ f k
N N N N k =1
Exemple :
3
F3 = f1 + f 2 + f 3 = 0.2 + 0.2 + 0.1 = ∑ f k = 0.5
k =1
N id ni ni +1 nk k
N = ni + ni +1 + ... + nk ⇒
i
d
= + + ... + ⇒ Fi = f i + f i +1 + ... + f k = ∑ f j
d
N N N N j =i
Exemple :
6
F = f 3 + f 4 + f 5 + f 6 = 0.1 + 0.2 + 0.2 + 0.1 = ∑ f k = 0.6
3
d
k =3
xi ni Ni fi Fi
x1 n1 n1 f1 f1 n1 + n2 + …+nk f1 + f2 + …+fk
x2 n2 n1 + n2 f2 f1 + f2 n2 + …+nk f2 + …+fk
. . . . .
. . . . .
xk n1 + n2 + …+nk fk f1 + f2 + …+fk nk fk
{( x , n ) , ( x , n ) ,..., ( x , n )}
1 1 2 2 k k
{( x , f ) , ( x , f
1 1 2 2 ) ,..., ( xk , f k )}
Exemple :
Considérons une enquête effectuée sur 20 agriculteurs d’un petit village
concernant leurs avis par rapport à un produit agricole appelé GA.
Supposons que les informations obtenues dans cette enquête sont collectées dans
le tableau statistique suivant:
{x = M, x
1 2 = P, x3 = AB, x4 = B, x5 = TB}
Alors le tableau statistique de ce caractère est :
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
M B P TB AB M B AB TB P B M AB B TB P M P B M
i i
n
fi = i N i = n1 + n2 + ... + ni = ∑ nk Fi = f1 + f 2 + ... + f i = ∑ f k
N k =1 k =1
1 M 5 20 0,25 1
2 P 4 15 0,2 0,75
3 AB 3 11 0,15 0,55
4 B 5 8 0,25 0,4
5 TB 3 3 0,15 0,15
Total N = 20 20 1
k
ni k
fi = N = ni + ni +1 + ... + nk = ∑ n j
i
d
Fi = f i + f i +1 + ... + f k =
d
∑ fj
N j =i j =1
xi ni Ni fi Fi
M 5 5 0,25 0,25 20 1
P 4 9 0,2 0,45 15 0,75
AB 3 12 0,15 0,6 10 0,65
B 5 17 0,25 0,85 7 0,4
TB 3 20 0,15 1 3 0,15
Total 20 1
i k
N i = n1 + n 2 + ... + ni = ∑n k N = ni + ni +1 + ... + nk = ∑ n j
i
d
k =1 j =i
F i = f 1 + f 2 + ... + f i = ∑
i
fk
Fi = f i + f i +1 + ... + f k =
d
∑j =1
fj
k =1
Soit X un caractère qui désigne le nombre d’enfants par ménage pour les 20
hommes. Les 7 valeurs possibles de ce caractère sont:
{x = 0, x
1 2 = 1, x3 = 2, x4 = 3, x5 = 4, x6 = 5, x7 = 6}
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
5 2 1 4 1 3 5 4 6 3 1 4 2 0 5 0 4 1 2 4
i i
n
fi = i N i = n1 + n2 + ... + ni = ∑ nk Fi = f1 + f 2 + ... + f i = ∑ f k
N k =1 k =1
k
n k
fi = i N = ni + ni +1 + ... + nk = ∑ n j
i
d
Fi = f i + f i +1 + ... + f k =
d
∑ fj
N j =i j =1
xi ni Ni fi Fi
0 2 2 0,1 0,1 20 1
1 4 6 0,2 0,3 18 0,9
2 3 9 0,15 0,45 14 0,7
3 2 11 0,1 0,55 11 0,55
4 5 16 0,25 0,8 9 0,45
5 3 19 0,15 0,95 4 0,2
6 1 20 0,05 1 1 0,05
Total 20 1
i i
N i = n1 + n 2 + ... + ni = ∑n
k =1
k F i = f 1 + f 2 + ... + f i = ∑
k =1
fk
k k
N = ni + ni +1 + ... + nk = ∑ n j
i
d
Fi = f i + f i +1 + ... + f k =
d
∑ fj
j =i j =1
B- Variable continue
k = 1 + 3.22 log ( n )
Ainsi on a:
E = x max − x min : est l’étendue de la série statistique.
E
e= : est l’étendu de la classe
k
Alors:
e0 = x min e1 = x min + e ............. ek = x min + ke
Donc:
[1
e0 , e1 [
23
[1
e1 , e2 [
23 ............. [1
ek −1 , ek [
424 3
1ére classe 2 éme classe k éme classe
N° de classe Classes ni fi
1 n1 f1
2 n2 f2
. . . .
i ni fi
. . . .
k nk fk
Total - N 1
k = 1 + 3.22 log ( 20 ) ≈ 5
Alors:
e0 = 1.5 e1 =1.5+0.08 =1.58 e2 =1.5+ 2×0.08 =1.66
Donc :
[1
1.5,1.58[
424 3
[1424
1.58,1.66[
3
[1424
1.66,1.74[
3
1ére classe 2 éme classe 3éme classe
[1424
1.74,1.82[
3 [1
1.82,1.9 ]
424 3
4 éme classe 5 éme classe
N° de classe Classes ni fi
1 1 0.05
2 3 0.15
3 4 0.2
4 4 0.2
5 8 0.4
Total - 20 1
Soit X une variable qui désigne « Le Revenu» des agriculteurs qui est supposée
continue. On a:
Revenu X 1200 1500 2000 2500 3000 4000 5000 5300 6500
Effectif ni 1 3 2 3 3 3 1 2 2
Classes ( 102 ) ni Ni fi Fi
4 4 20 0,2 0,2 1
8 12 16 0,4 0,6 0,8
6 18 8 0,3 0,9 0,4
2 20 2 0,1 1 0,1
Total 20 1
Modalité xi ni fi
M 5 0,25 90
P 4 0,2 72
AB 3 0,15 54
B 4 0,25 90
TB 3 0,15 54
Modalité xi ni fi
0 2 0,1
1 4 0,2
2 3 0,15
3 2 0,1
4 5 0,25
5 3 0,15
6 1 0,05
Modalité xi ni fi Fi
0 2 0,1 0,1
1 4 0,2 0,3
2 3 0,15 0,45
3 2 0,1 0,55
4 5 0,25 0,8
5 3 0,15 0,95
6 1 0,05 1
Classes Amplitude ni fi
20 4 0,2
20 8 0,4
20 6 0,3
20 2 0,1
Lorsque les amplitudes sont inégales, il faut effectuer une correction des
effectifs (ou fréquences) d’une classe d’effectif ni et d’amplitude ai .
ni
L’ effectif corrigé, noté nci , est: nci =
ai
fi
La fréquence corrigée (ou densité de fréquence ) ,notée di , est : d i =
ai
La hauteur de chaque rectangle de l’histogramme est proportionnelle
à effectif corrigé (fréquence corrigée ). Si en regroupant les deux dernières
classes, alors on obtient:
Classes Amplitude fi di
20 0,2 0,01
20 0,4 0,02
40 0,4 0,01
B. Polygone de fréquences
Ce diagramme est formé en joignant ,par des segments de droites, les milieux
des sommets de chaque rectangle de l’histogramme.
Ainsi, il doit commencer par 0 et se terminer par 0.
Classes ni fi
4 0,2
8 0,4
6 0,3
2 0,1
C. Diagramme cumulatif
Ce diagramme est formé en joignant les points de coordonnées (xi , Fi ) pour
chaque classe [xi-1 , xi[ où Fi est la fréquence cumulée de cette classe.
Classes ni fi Fi
4 0,2 0,2
8 0,4 0,6
6 0,3 0,9
2 0,1 1
1. La moyenne arithmétique
La moyenne arithmétique simple , notée x , d’une série statistique est donnée par :
x1 + x2 + .... + xn 1 n
x= = ∑ xi
n n i =1
Exemple :
Soit la série statistique {10, 25, 20,25}, alors :
10 + 25 + 20 + 25
x= = 20
4
où ci =
xi+1 + xi
2
désigne le centre de la classe [xi , xi +1 ]
Modalité xi ni xi ni fi xi fi
0 2 0 0,1 0
1 4 4 0,2 0,8
2 3 6 0,15 0,45
3 2 6 0,1 0,2
4 5 20 0,25 1,25
5 3 15 0,15 0,45
6 1 6 0,05 0,05
Total 20 57 1 2,85
7
∑nx i i 7
57
Alors : x= i =1
n
= ∑
i =1
f i xi =
20
= 2.85
Classes ci ni ci ni fi c i fi
10 4 40 0,2 2
30 8 240 0,4 12
50 6 300 0,3 15
70 2 140 0,1 7
Total 20 1 36
∑nc i i 4
720
x= i =1
n
= ∑
i =1
f i ci =
20
= 36
k
G= n
x × ... × x
n1
1
nk
k
où n = ∑ ni
i =1
n1 nk n
1
1 k ni
log ( G ) = log x1 × ... × xk = log ∏ xi
n i =1
1 k
( ) 1 k k
= ∑ log xi = ∑ ni log ( xi ) = ∑ f i log ( xi )
ni
n i =1 n i =1 i =1
Modalité xi ni ni Log(xi)
1 2 0
3 1 0,47
4 2 1,2
5 3 1,39
Total 8 0,38
k
1 1
H= k
= k
où n = ∑ ni
1 1 fi
∑ i n
n i =1 xi
∑
i =1 xi
i =1
Modalité xi ni
1 2 2
1 1
3 1 0,33 H= =
1 k ni k
fi
4 2 0,5 ∑
n i =1 xi
∑
i =1 xi
5 3 0,6
Total 8 3,43
k
1 k k
n = ∑ ni
Q= ∑
n i =1
ni xi2 = ∑fx
i =1
2
i i
où
i =1
Modalité xi ni
1 2 2
1 k k
3 1 9 Q= ∑
n i =1
ni xi2 = ∑fx
i =1
2
i i
4 2 32
5 3 75
Total 8 118
Q=
1
8
( 2 × 12 + 1 × 32 + 2 × 4 2 + 3 × 52 )
1
Q= ( 2 + 9 + 32 + 75 ) = 3.84
8
La moyenne harmonique est plus sensible aux plus petites valeurs de la série
qu’aux plus grandes.
H <G< x <Q
Détermination du mode
M0 = x1 +
k1
(x2 − x1 )
k1 + k2
de la classe précédente de la CM .
k2 = 8- 6 = 2 : la différence entre la fréquence (ou l’effectif) de la
classe modale et de la classe suivante de la CM.
Donc :
4
M 0 = 20 + ( 40 − 20 ) ≈ 33, 33
4+2
Donc :
M0 = 9+
1,1
(11 − 9 ) = 9, 2
1,1 + 10
Détermination de la médiane:
- Cas d’une série brute:
Soit une série de n observations ordonnées par ordre croissant: x1 , ..., x n
Exemple 1 : 16 12 1 9 17 19 18 10 3 7 2 11 15 14
e = x max − x min
Exemples :
2. Ecart interquantile
Quartiles :
Ils partagent une série statistique en 4 groupes égaux, chacun
représentant 25% des observations.
Déciles :
Ils partagent une série statistique en 10 groupes égaux, chacun
représentant 10% des observations.
Centiles :
Ils partagent une série statistique en 100 groupes égaux, chacun
représentant 1% des observations.
- Le premier quartile, noté Q1, d’une série statistique est la plus petite valeur
telle qu’au moins 25% des valeurs sont inférieures ou égales à Q1.
- Le deuxième quartile d’une série statistique c’est la médiane (Q2)
- Le troisième quartile , noté Q3, d’une série statistique est la plus petite valeur
telle qu’au moins 75% des valeurs sont inférieures ou égales à Q3.
17 13 7 27 29 12 19 14 16 1 18 4 8 21 20 11
1 4 7 8 11 12 13 14 16 17 18 19 20 21 27 29
16
Le premier quartile est le k éme = = 4 éme rang , c’est-à-dire Q1 = 8
4
16
Le troisième quartile est le 3 × k éme
= 3 × = 3 × 4 = 12 éme rang ,
4
c’est-à-dire Q3 = 19
Exemple: considérons les valeurs rangées par ordre croissant comme suit:
3 4 5 6 7 8 9 10 12 13 15 16 17 19 21 22 23 24 25 27 28 29 39
n n
On a n = 2 3 ⇒ k = = 5 .7 5 et 3× = 1 7 .2 5
4 4
Donc :
rang , c’est-à-dire Q3 = 24
ème
Le troisième quartile est le 18
Q1 Q3
F0 ≤ 0.25< F1 F2 ≤ 0.75< F3
0,75
0,5
0,25
1. Variance
Elle mesure la dispersion des valeurs autour de la moyenne. Plus les valeurs
sont regroupées autour de la moyenne, plus la variance est petite. Plus elles
sont dispersées, plus la variance est grande.
{
La variance, notée V(X), d’une variable statistique de distribution ( xi , ni )1≤ i ≤ k }
est donnée par:
1 k 1 k
V ( X ) = ∑ ni ( xi − x ) = ∑ ni xi2 − x 2
2
n i =1 n i =1
2. Ecart-type
σX = V (X )
Remarque:
- Pour une variable statistique continue, les xi désignent les centres des classes.
- Dans le cas d’une série brute, la variance de cette série est égale à :
1 k 1 k 2
V ( X ) = ∑ ( xi − x ) = ∑ xi − x 2
2
n i =1 n i =1
1 k 11 + 14 + 24 + 8 + 32 + 9 + 10 + 17
x = ∑ xi = = 15, 625
n i =1 8
(11 − 15, 625 ) + (14 − 15, 625 ) + ... + (17 − 15, 625 ) ≈ 62, 225
2 2 2
1 k
V ( X ) = ∑ ( xi − x ) =
2
n i =1 8
ou
(11) + (14 ) + ... + (17 )
2 2 2
k
1
V ( X ) = ∑ xi − x = − (15, 625 ) ≈ 62, 225
2 2 2
n i =1 8
Revenus ci ni ci ni (ci )2 ni 1 n
V (X ) = ∑nc i
2
−c2
10 4 40 400 n i =1
σ X = V ( x) = 324 = 18
σX
CV =
x
Me = Mo = X
Mesures de l’asymétrie
Xmin Q1 Me Q2 Xmax
Soit X une variable continue dont les valeurs sont regroupées en k classes
comme suit: Classes Centre xi Effectif ni
x1 n1
x2 n2
. . .
xk nk
mi
mi = ni xi qi =
m
k k
où m = ∑ mi = ∑ ni xi désigne la masse totale de X.
i =1 i =1
i M
M i = ∑ nk xk Qi = k
i
k =1
∑
j =1
njxj
Remarques :
i) On a , 0 ≤ Qi ≤ 1 pour tout i
ii) On a Qi = Q ( ei )
mi
mi = ni xi qi =
m
i
M
M i = ∑ nk xk Qi = k
i
k =1
∑
j =1
njxj
Remarque: Q ( M I ) = 0.5
Détermination de la médiale
Revoir cette
courbe en utilisant
les couples (Fi,Qi)
Revenus ci ni fi Fi mi qi Qi
10 4 0,2 0,2 40 0,056 0,056
30 8 0,4 0,6 240 0,333 0,389 Revoir cette
50 6 0,3 0,9 300 0,417 0,805 courbe en utilisant
les couples (Fi,Qi)
70 2 0,1 1 140 0,195 1
Total n = 20 1 m = 720
0<G<1;
Revenus ci ni fi mi qi Qi Si = Qi-1+Qi fi Si
10 4 0,2 40 0,056 0,056 0,056 0,0112
30 8 0,4 240 0,333 0,389 0,056 + 0,389 = 0,445 0,178
50 6 0,3 300 0,417 0,805 0,389 + 0,805 = 1,194 0,3582
70 2 0,1 140 0,195 1 0,805 + 1 =1,805 0,1805
Total n = 20 1 m = 720 3,5 0,7279
k
G = 1 − ∑ fi Si G = 1 − 0.7279 = 0.2721
i =1
X 3 4 5
Marge de X ni • 45 35 20
Y P AB B TB
Marge de Y n• j 45 25 20 10
x1 , x2 , . . . , xm et y1, y2, . . . , yk
Les données de ces deux variables peuvent être regroupées dans un tableau dit
tableau de contingence.
X\Y y1 y2 … yk Marge de X ni •
x1 n11 n12 … n1k n1•
x2 n21 n22 … n2k n2 •
… … … … … …
xm nm1 nm2 … nmk nm•
Marge de Y n• j n•1 n•2 … n• k N
k
ni• = ∑ nip correspond au nombre d’individus ayant les modalités xi où
p =1
i = 1,…,m.
m
n• j = ∑ n pj correspond au nombre d’individus ayant les modalités yj où
p =1
j = 1,…,k.
k m k n m n
N = ∑ n• j = ∑ ni • = ∑ ∑ nkj = ∑ ∑ nik correspond à l’effectif total.
j =1 i =1 j =1 k =1 i =1 k =1
ni•
f i• =
n
n j•
f• j =
n
ni•
X\Y y1 y2 … yk i• =
Marge de fX fi•
n
x1 f11 f12 … f1k f1•
x2 f21 f22 … f2k f 2•
… … … … …
xm fm1 fm2 … fmk f m•
Marge de Y f• j f•1 f•2 … f• k 1
nij n n j•
f ij = fi• = i• f• j =
n n n
Exemple :
Variable X Variable Y
Moyenne marginale de X Moyenne marginale de Y
1 m m
1 k k
x = ∑ ni • xi = ∑ f i• xi y = ∑ n• j y j = ∑ f • j y j
n i =1 i =1 n j =1 j=1
1 m 1 k
σ = ∑ ni • xi − x
2
σ = ∑ n• j y j − y
2 2 2 2 2
X Y
n i =1 n j =1
1 m 1
x = ∑ ni • xi = × 1280 = 12.8
n i =1 100
1 m 1
σ = ∑ ni• xi2 − x = × 20525 − (12.8 ) = 205.25 − 163.84 = 41.41
2 2 2
X
n i =1 100
Soient:
X une variable qui varie en parcourant toutes les classes
[0,5[ 2 0,12
[5,10[ 4 0,23
[10,15[ 2 0,12
[15,20[ 4 0,23
[20,25[ 5 0,3
n•1 17 1
[15,20[ 4 4 2 1 1 12
[20,25[ 5 2 1 10 2 20
Marge de Y n• j 17 25 15 33 10 N = 100
Fréquence
conditionnelle de 0.055 0.277 0.138 0.416 0.111 1
X\Y n3•
La distribution conditionnelle de X
[0,5[ 2
sachant [10,15[ est une série univariée [5,10[ 5
obtenue par l’élimination de toutes les [10,15[ 5
m
1 162.5
x /[10 ,15] = x/3 =
n•3
∑
i =1
ci ni 3 =
15
= 10.83
1 m 2193.75
σ =σ = ∑ − ( /3 ) = − ( ) = 34.7
2 2 2 2 2
/ [10,15] /3 n x
ij i x 10.83
n•3 i =1 15
∑ n ( x −x ) ∑n ( y − y/ i )
m k
1 2 1 2
σ 2
X/j = ij i /j σ 2
Y /i = ij j
n• j i =1 ni• i =1
∑∑ n ( x − x ) ( y − y)
m k
1
Cov ( X , Y ) = ij i j
N i =1 j =1
m k
1
=
N
∑∑ n x y
i =1 j =1
ij i j −x×y
= xy − x × y
Remarque:
Dans le cas des séries quantitatives non-groupées, on a n ij = 1
1280 1220
x= = 12.8 et y= = 12.2
100 100
17168 20525
V (Y ) = − (12.2 ) = 7.84 et V (X ) = − (12.8 ) = 56.41
2 2
100 100
Case N°1:
Centre de X x1
Effectif marginaux n1 j de [0,5[ 2 4 2 5 1 2,5
Centre de Y y j 2,5 7,5 12,5 17,5 22,5
( n11 y1 + n12 y2 + n13 y3 + n14 y4 + n15 y5 ) × x1 = ( 2 × 2.5 + 4 × 7.5 + 2 ×12.5 + 5 ×17.5 + 1× 22.5) × 2.5 = 425
Case N°2:
Centre de X x2
Effectif marginaux n2 j de [5,10[ 4 5 5 2 2 7,5
Centre de Y yj 2,5 7,5 12,5 17,5 22,5
( n11 y1 + n12 y2 + n13 y3 + n14 y4 + n15 y5 ) × x1 = ( 4 × 2.5 + 5 × 7.5 + 5 ×12.5 + 2 ×17.5 + 2 × 22.5) × 7.5 = 1425
( n11 y1 + n12 y2 + n13 y3 + n14 y4 + n15 y5 ) × x1 = ( 2 × 2.5 + 10 × 7.5 + 5 ×12.5 + 15 ×17.5 + 4 × 22.5) ×12.5 = 6187.5
Case N°4:
Centre de X x4
Effectif marginaux n4 j de [15,20[ 4 4 2 1 1 17,5
Centre de Y yj 2,5 7,5 12,5 17,5 22,5
( n11 y1 + n12 y2 + n13 y3 + n14 y4 + n15 y5 ) × x1 = ( 4 × 2.5 + 4 × 7.5 + 2 ×12.5 + 1×17.5 + 1× 22.5) ×17.5 = 1837.5
( n11 y1 + n12 y2 + n13 y3 + n14 y4 + n15 y5 ) × x1 = ( 5 × 2.5 + 2 × 7.5 + 1×12.5 + 10 ×17.5 + 2 × 22.5) × 22.5 = 5850
m k
1
Cov ( X , Y ) = ∑∑ n x y ij i j −x×y
N i =1 j =1
1
= ( 425 + 1425 + 6187.5 + 1837.5 + 5850 ) − 12.2 ×12.8
100
= 157.25 − 156.16 = 1.09
Cov ( X , Y )
R=
σ XσY
R 2 désigne le coefficient de détermination de X et Y
Remarques importante :
On a toujours −1 ≤ R ≤ 1 ⇒ 0 ≤ R2 ≤ 1.
La covariance dépend des unités ce qui est difficile à interpréter .
La corrélation ne dépend pas des unités.
1280 1220
x= = 12.8 et y= = 12.2
100 100
17168 20525
V (X ) = − (12.8 ) = 7.84 et V (Y ) = − (12.2 ) = 56.41
2 2
100 100
Cov ( X , Y ) = 1.09
Cov ( X , Y ) 1.09
R= = = 0.051
σ XσY 2.8 × 7.51
Considérons la série statistique constituée de n couples des valeurs prises par les
deux variables pour chaque individu : ( x1 , y1 ) ,..., ( xi , yi ) ,..., ( xn , yn )
L’objectif de la régression linéaire est d’étudier la relation qui peut exister entre
X et Y en cherchant la fonction f telle que: Y = f ( X )
L’ajustement linéaire se base sur le choix de la droite qui passe le plus proche de
tous les points du nuage. Cette droite est appelée droite de régression linéaire de
Y en X, noté DY / X , et son équation est donnée par: y = a + bx
où a et b représentent les paramètres de cette droite.
n n
2
Minimiser ( E ) = ∑ ei = ∑ ( yi − a − bxi )
2
i =1 i =1
Cov ( X , Y ) a = y − bx
b= et
V (Y )
Cov ( X , Y )
r ( X ,Y ) =
σ XσY
On a: -1 ≤ r ≤ +1
Pus la valeur absolue de r est proche de 1 plus la liaison entre X et Y est forte.
Pus la valeur absolue de r est proche de 0 plus la liaison entre X et Y est faible
57 654
C ov ( X , Y ) = − (10.5 × 9,5 ) = 9.25
63
On a : x= = 10.5 , y= = 9,5 et
6 6 6
1 n 2 731 1 n 2 585
V ( X ) = ∑ xi − ( x ) = − (10.5 ) = 11.58 V (Y ) = ∑ yi − ( y ) = − ( 9.5 ) = 7.25
2 2 2 2
et
n i =1 6 n i =1 6
Un indice peut être élémentaire (un seul article comme le prix d’un produit)
ou synthétique (plusieurs articles comme indices de capitalisation MASI
et MADEX…)
Pour une bonne interprétation des valeurs prises par cet indice, on utilise
souvent l’indice base 100 qui s’exprime comme suit:
x1
I1/0 ( X ) = ×100
x0
Exemple:
Nombre de touristes arrivés au Tanger (en milliers) est:
Exemple :
Soit le tableau des prix des articles entre 2014 et 2015 :
A1 35 45
A2 15 20
A3 50 65
La variation relative de l’indice entre t1 et t2 , étant donné deux indices base 100
année en t0, d’une même grandeur est donnée par:
I t2 / t0 − I t1 / t0
I t2 / t1 = ×100
I t2 / t0
Exemple:
Le prix d‘un article dans un pays est égal à 100 et a augmenté de 1.5% entre 2010
et 2012; et de 2.5% entre 2010 et 2015.
I15/10 − I12/10
On a I12/10 = 101.5 et I15/10 = 102.5 alors: I15/12 = ×100 = 0.98
I15/10
Circularité ou Transférabilité
Les indices élémentaires sont transférables ou circulaires, si pour tout t1 et t2 on a :
Exemple :
Soit X le prix d’un produit par période: X13 = 200; X14 = 240; X15 = 280.
240 280
Alors on a: I14/13 = × 100 = 120 et I15/14 = × 100 = 167
200 240
1 1
I15/13 = I15/14 × I14/13 × = 167 ×120 × = 140%
100 100
Réversibles
Les indices élémentaires sont réversibles si pour tout t1 et t2 on a :
L’ Enchaînement
Les indices élémentaires sont enchaînables si on a :
Propriétés (Produit)
Soit A et B deux grandeurs, le produit de A et B est:
I t / 0 ( A) × I t / 0 (B )
Pour les indices base 100: I t / 0 ( A × B ) =
100
Propriétés (Quotient)
Soit A et B deux grandeurs, le quotient de A et B est :
I t / 0 ( A)
Pour les indices base 1 : I t / 0 ( A / B ) =
I t / 0 (B )
I t / 0 ( A)
Pour les indices base 100: I t / 0 ( A / B ) = × 100
I t / 0 (B )
1 2 k
Soit X une grandeur composée de k variables X , X ,..., X
Indice de Laspeyres
k k
xtj
Lt /0 = ∑ α I j j
0 t /0 = ∑ α j × 100
0
j
j =1 j =1 x0
où
k
∑α
j =1
0
j
=1 et est calculé à l’année de base
Indice de Paasche
1 100
Pt /0 = =
k
α 0j k
x0j
∑I
j =1
j ∑
j =1
α j
x1
0
j
t /0
où
k
∑ 0 = 1 et
α j
j =1
est calculé à la date courante t
Indice de Fisher
Remarques:
j j j j
p q p
Soient 0 et 0 (respectivement t et qt ) le prix et la quantité de l’article j
consommé à l’année de base 0 (respectivement l’année courante t).
j =1 p0
k
p0j q0j ∑p q t
j
0
j
comme α =
0
j
k Lt /0 ( p ) = i =1
k
× 100
∑p q
i =1
j j
0 0 ∑p q j j
0 0
i =1
Remarque:
p0j q0j est la valeur de l’article j consommé à l’année de base 0.
100
Pt /0 ( p ) = k
ptj
∑
j =1
α j
0
j
p0
p0j q0j
∑ t qt
p j j
comme α =
0
j
alors Pt /0 ( p ) = i =1
k
× 100
k
∑p q 0
j
0
j
∑ 0 qt
p j j
i =1
i =1
Dans ce cas les prix sont constants et les quantités sont variables :
k
k
q j ∑p q j j
Lt /0 ( q ) = ∑ α 0j tj × 100
0 t
Lt /0 ( q ) = i =1
k
×100
j =1 q0 ∑p q
i =1
j j
0 0
100 ∑p q t
j
t
j
Pt /0 ( p ) = Pt /0 ( p ) = × 100
i =1
k
k
q j
∑p q j j
∑ α 0j
t 0
0 i =1
j
j =1 q
t
∑ t qt
p j j
Lt /0 ( q ) =
Dépenses Totales à la date t
i =1
k
× 100 =
Dépenses Totales à la date 0
∑ 0 q0
p j j
i =1
Soit d = p x q alors Lt /0 = Pt /0 = Dt /0
On a aussi :
Lt /0 ( p ) × Pt /0 ( q ) Lt /0 ( q ) × Pt /0 ( p )
Dt /0 = =
100 100
Ft /0 ( p ) × Ft /0 ( q )
Dt /0 =
100
L’indice boursier est un indice synthétique qui reflète la tendance générale des
actifs financiers dans la bourse. Il est calculé quotidiennement et correspond
à la moyenne pondérée des cours de ces actifs.
Dans la pratique, le calcul des indices boursiers se fait seulement pour les
sociétés les plus fortes en terme de capitalisation mobilières