Académique Documents
Professionnel Documents
Culture Documents
METION GESTION
FOAD GESTION
Mention : Gestion
Parcours : Fondamentaux en Sciences de Gestion
Niveau : L1
Semestre : S1
Unité d’Enseignement : UE2
Elément Constitutif :
STATISTIQUES
Elément : n°1
Concepteurs :
RAKOTONASY Solonjaka Hiarintsoa HERMIAH RAKOTONDRANJA Solo Arsène
Maître de Conférences Enseignant-chercheur
Université d’Antananarivo Université d’Antananarivo
Avertissement :
CHAP 0. INTRODUCTION
Ce cours est destiné à vous faire acquérir les notions essentielles de la statistique descriptive, c'est-à-dire à
vous apprendre comment décrire de façon claire et concise l'information apportée par des observations
nombreuses et variées sur un phénomène donné.
Il s'agit de trier ces données, les décrire, les résumer sous forme de tableaux, de graphiques, et sous forme
d'un petit nombre de paramètres-clés (moyenne, médiane par exemple).
Exemples :
(1) Lorsqu’on note par semaine pour une entreprise le chiffre d’affaires par semaine, le nombre de
commande, le nombre de nouveau client.
(2) Pour étudier les risques cardiovasculaires de ses patients, un médecin peut remplir pour chacun
d’eux une fiche notant un certain nombre de caractéristiques.
La STATISTIQUE (ou données statistiques) est un ensemble de mesures ou d’observation concernant l’état
ou l’évolution d’un phénomène)
Le résumé des données est l’ensemble des indicateurs résultant des calculs utilisant les informations de la
présentation.
0.2.1. Sommation
Soit (a1, a2, …, an) une suite de n nombres.
𝑖=𝑛 𝑛
∑ 𝑎𝑖 = ∑ 𝑎𝑖 = 𝑎1 + 𝑎2 + ⋯ + 𝑎𝑛
𝑖=1 𝑖=1
𝑞
∑ 𝑎𝑖 = 𝑎𝑝 + 𝑎𝑝+1 + ⋯ + 𝑎𝑞−1 + 𝑎𝑞
𝑖=𝑝
𝑞
∏ 𝑎𝑖 = 𝑎𝑝 × 𝑎𝑝+1 × ⋯ × 𝑎𝑞
𝑖=𝑝
Interdictions : Photocopie et reproduction Réf : foadgestion-degs/tanà/2024/L1/S1/UE2/STAT/1
2
RAKOTONASY Solonjaka, HERMIAH RAKOTONDRANJA STATISTIQUES FOAD GESTION: 2024
Exemples :
i 1 2 3 4 5 6 7 8 9 10
ai 10 13 19 4 14 4 16 3 1 9
∑ 𝑎𝑖 = 𝑎1 + 𝑎2 + 𝑎3 + 𝑎4 = 10 + 13 + 19 + 4 = 46
𝑖=1
10
∑ 𝑎𝑖 = 𝑎8 + 𝑎9 + 𝑎10 = 3 + 1 + 9 = 13
𝑖=8
7
∏ 𝑎𝑖 = 𝑎3 𝑎4 𝑎5 𝑎6 𝑎7 = 19 × 4 × 14 × 4 × 16 = 68096
𝑖=3
Propriétés
𝑝
∑ 𝑎𝑖 = 𝑎𝑝
𝑖=𝑝
𝑞 𝑘 𝑞
∑ 𝑎𝑖 = ∑ 𝑎𝑖 + ∑ 𝑎𝑖
𝑖=𝑝 𝑖=𝑝 𝑖=𝑘+1
𝑝
∏ 𝑎𝑖 = 𝑎𝑝
𝑖=𝑝
𝑛 𝑘 𝑛
∏ 𝑎𝑖 = ∏ 𝑎𝑖 × ∏ 𝑎𝑖
𝑖=𝑝 𝑖=𝑝 𝑖=𝑘+1
Exemples :
5
∏ 𝑎𝑖 = 𝑎5 = 14
𝑖=5
7 5 7
∑ 𝑎𝑖 = ∑ 𝑎𝑖 + ∑ 𝑎𝑖 = 37 + 20 = 57
𝑖=3 𝑖=3 𝑖=6
0.2.2. Proportionnalité
Soient a= (a1, a2, …, an) et b = (b1, b2, …, bn) deux suites de n nombres.
i 1 2 … n-1 n
ai a1 a2 … an-1 an
bi b1 b2 … bn-1 bn
𝑎1 𝑎2 𝑎𝑛
On dit que a et b sont proportionnelles si = =⋯= =𝑐
𝑏1 𝑏2 𝑏𝑛
On a : 𝑎𝑞 𝑏𝑝 = 𝑏𝑞 𝑎𝑝
Propriétés :
𝑎1 𝑎2 𝑎1 + 𝑎2 𝑎1 − 𝑎2
= = =
𝑏1 𝑏2 𝑏1 + 𝑏2 𝑏1 − 𝑏2
Exemple :
a2+a1 a2-a1
ai 15 45 60 30
bi 32 96 128 64
b2+b1 b2-b1
15 45
=
32 96
15 × 96 = 32 × 45
15 15 + 45 15 − 45
= =
32 32 + 96 32 − 96
a → f(a)
x → y
b → f(b)
Alors on a :
𝑦 − 𝑓(𝑎) 𝑓(𝑏) − 𝑦 𝑓(𝑏) − 𝑓(𝑎)
= =
𝑥−𝑎 𝑏−𝑥 𝑏−𝑎
Exemple : Approximation de √2 par interpolation linéaire
1 → 1
2 → y
4 → 2
𝑦−1 2−1
=
2−1 4−1
(y-1)(4-1) = (2-1)(2-1)
3y-3=1
4
y=
3
y≈1,33
N = n1 + n2 + … + nk
k
N = ni
i =1
ni
Le quotient ni/N est la fréquence relative fi de la mesure xi du caractère : f i =
N
Tableau 1
xi ni
x1 n1
x2 n2
⋮ ⋮
xk-1 nk-1
xk nk
k
TOTAL N = ni
i =1
Tableau 2
xi ni
Hommes 66500
Femmes 42583
Total 109083
a 2
b 3
c 5
d 1
e 5
f 2
Total 18
Tableau 3
Modalités Effectif
Total 18
Tableau 4
Nombre
Effectif Fréquence Fréquence cumulée Fréquence cumulée
d'enfants à
ni fi croissante Fci décroissante Fdi
charge xi
0 4 0,05 0,05 1
6 1 0,0125 1 0,0125
TOTAUX 80 1
Tableau 5
Fc1 = f1
Fci = Fci-1+ fi
Fdk = fk
Fdi = Fdi+1+ fi
Exemple : Répartition des Salaires des fonctionnaires gagnant entre 100000 et 300000 Ariary.
Salaire Effectif
Total 95140
Tableau 6
ai = | ei+1 – ei |
𝑛𝑖
ℎ𝑖 =
𝑎𝑖
Effectifs cumulés
Croissant
nc1 = n1
nci = nci-1+ ni
Décroissant
ndk = nk
ndi = ndi+1+ ni
Tableau
Graphique circulaire :
L'aire d'unrectangle est proportionnelle à l'effectif qu’il représente. La base est proportionnelle à
l'étendue.
Polygone cumulatif :
un polygone dont les sommets sont les points de coordonnées (e1,0) et (ei+1,nci),
i = 1..k-1.
HISTOGRAMME : Tableau 7
Tableau 8
Histogramme : tableau 8
Exemple : Enquête effectuée sur 20 employés d'une entreprise sur le salaire en ariary et le nombre
d'enfants à charge
Le 1er élément d’un couple est le salaire d'un individu et le second le nombre d'enfants à charge
135000 1 135000 1
240000 2 225000 2
Y
0 1 2 3 4
X
[100;150[ 2 2 3 1 0 8
[150. 200[ 0 3 1 0 0 4
[200 ; 250[ 1 1 3 0 0 5
[250 ; 300] 0 0 1 1 1 3
3 6 8 2 1 20
Y
y1 ... yj ... yq
X
n. 1 ... n. j ... n. q N
Effectif marginal de yj :
𝑖=𝑘
𝑛.𝑗 = ∑ 𝑛𝑖𝑗
𝑖=1
Effectif marginal de xi :
𝑗=𝑞
𝑛𝑖. = ∑ 𝑛𝑖𝑗
𝑗=1
Effectif total :
𝑗=𝑞
𝑁 = ∑ 𝑛.𝑗
𝑗=1
𝑖=𝑘
𝑁 = ∑ 𝑛𝑖.
𝑖=1
𝑁 = ∑ (∑ 𝑛𝑖𝑗 ) = ∑ (∑ 𝑛𝑖𝑗 )
𝑖=1 𝑗=1 𝑗=1 𝑖=1
Les fréquences :
𝑛𝑖.
𝑓𝑖. = 𝑁
Fréquence marginale de xi
𝑛.𝑗
𝑓.𝑗 = 𝑁
Fréquence marginale de yj
𝑛𝑖𝑗
𝑓𝑖𝑗 = Fréquence partielle de (xi, yj)
𝑁
EXERCICES :
EXERCICE 1 : RÉPARTITION DES IMMATRICULATIONS SELON LE GENRE DE VÉHICULES AU COURS DU
PREMIER TRIMESTRE 2017 (EN %)
EXERCICE 2 :
Le tableau suivant représente la répartition des clients d’un cybercafé selon les montants de leur connexion
en une journée :
Montant en Ar Nombre
[300 ; 500[ 25
[500 ; 1000[ 39
[1000 ; 1500[ 32
[1500 ; 2000[ 24
[2000 ; 3000] 8
Une série statistique qui n'a qu'un seul mode est dite unimodale
Une série statistique qui a exactement deux modes est dite bimodale.
1.1.1.2. La médiane
La médiane est la valeur qui partage la série statistique en deux parties de même effectif
Notation : Me.
Variable discrète
EXEMPLE 1 : Répartition des nombres de permissions d'absence octroyées aux employés
d'un service (Effectif total impair)
xi ni
1 4
2 1
3 2
4 2 Me = 2
9
xi ni 2+ 3
1 4 Me= = 2,5
2 1 2
3 3
4 2
10
Variable continue
𝑁 95140
On calcule la moitié de l’effectif total : 2 = 2
= 47570
On l’encadre par des effectifs cumulés consécutifs : 24616 ≤ 47570 ≤ 61356, puis la médiane
par les extrémités respectives : 125 ≤ Me ≤ 150
125 → 24616
Me → 47570
150 → 61356
Alors on a :
𝑀𝑒 − 125 150 − 125
=
47570 − 24616 61356 − 24616
150 − 125
𝑀𝑒 = 125 + (47570 − 24616)
61356 − 24616
Me = 140,619
En général, si :
alors :
𝑁
ep+1 ≤ 2
≤ ep+2 , et :
ep+1 → ncp
𝑁
Me →
2
ep+2 → ncp+1
mx ou𝑥̅ ou mA ou m
i= k
∑ ni . x i i= k
∑ ni . x i x= ∑ ni . x
i= 1 i= k i= k
x= i= k
i x= ∑ f i . x i
x= i= 1
∑ ni N i= 1 N i= 1
i= 1
EXEMPLE : Répartition des nombres de permissions d'absence octroyées aux employés d'un service
xi ni nixi
1 4 4
2 1 2
3 3 9
4 2 8
TOTAL 10 23
23
x= = 2,3
10
EXEMPLE : Répartition des nombres de permissions d'absence octroyées aux employés d'un service
xi ni fi fixi
1 4 0,4 0,4
2 1 0,1 0,2
3 3 0,3 0,9
4 2 0,2 0,8
TOTAL 10 1 2,3
i= k
x= ∑ f i . x i x= 2,3
i= 1
Variable continue
Exemple : Groupement des classes de salaires en milliers d'Ariary
Salaire ni ki niki
95140 14693850
∑ki=1 ni k i
m=
∑ki=1 ni
14693850
m= = 154,445
95140
𝑁 = ∑ 𝑛𝑖
𝑖=1
𝒎𝑮 = 𝑵√𝒙𝟏 𝒏𝟏 . 𝒙𝟐 𝒏𝟐 . ⋯ . 𝒙𝒌 𝒏𝒌
𝟏
𝒎𝑮 = (𝒙𝟏 𝒏𝟏 . 𝒙𝟐 𝒏𝟐 . ⋯ . 𝒙𝒌 𝒏𝒌 )𝑵
1.1.1.3.3. La moyenne harmonique :
La moyenne harmonique des valeurs xi d'une série statistique est notée : mH
k
ni n1 n 2 n
1
i =1 x i x
+
x2
++ k
xk
= = 1
mH k
n1 + + n k
n
i =1
i
n x i
2
i
n1x i2 + + nk x k2
mQ = i =1
=
k
n1 + + nk
n i =1
i
1.1.1.3.5. Propriétés
Calcul :
Si on a une variable statistique Z telle que Z = aX + b, et si z et x sont les moyennes
arithmétiques respectives de Z et de X alors on a :
z = ax + b
Inégalités
mH ≤ mG ≤ mA ≤ mQ
LES PARAMETRES DE DISPERSION
1.1.1.4. Étendue
L’étendue d’une série statistique est l’écart entre ses valeurs extrêmes.
xi ni
1 4
2 2
3 5
4 2
13
Salaire ni
95140
Variables discrètes
La série statistique étant partagée en 2 séries de même effectif par la médiane, la médiane de
la première série est le 1er quartile Q ; la médiane de la deuxième série est le 3è quartile Q
1 3
Variables continues
Exemple : Salaire des fonctionnaires en milliers d’Ariary
Salaire ni fi fci
[100 ; 125[ 24616 0,259 0,259
Total 1,000
Q1 → 0,25
125 → 0,259
Q2 → 0,50
150 → 0,643
Q3 → 0,75
175 → 0,782
Notation : 2 ou Vx
𝑘 𝑘
∑𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑚)2
2
𝜎 = = ∑ 𝑓𝑖 (𝑥𝑖 − 𝑚)2
∑𝑘𝑖=1 𝑛𝑖
𝑖=1
EXEMPLE : Répartition des nombres de permissions d'absence octroyées aux employés d'un service
xi ni nixi ni(xi-m)²
1 4 4 6,76
2 1 2 0,09
3 3 9 1,47
4 2 8 5,78
TOTAL 10 23 14,1
23
𝑚 = 𝑥̅ = = 2,3
10
∑4𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑚)2
𝑉𝑋 =
∑4𝑖=1 𝑛𝑖
14,1
𝑉𝑋 =
10
𝑉𝑋 = 1,41
𝜎 = √𝑉𝑋
𝜎 = √1,41
𝜎 = 1,19
Autres formules de calcul de la variance
𝑘 𝑘
∑𝑖=1 𝑛𝑖 𝑥𝑖2
2
𝜎 = − 𝑚 = ∑ 𝑓𝑖 𝑥𝑖2 − 𝑚2
2
∑𝑘𝑖=1 𝑛𝑖
𝑖=1
𝜎
𝑐𝑣 =
𝑚
Il sert à comparer les dispersions de deux ou plusieurs échantillons.
𝑚𝑐𝑖 = ∑ 𝑚𝑗 = 𝑚1 + 𝑚2 + ⋯ + 𝑚𝑖
𝑗=1
𝑀 = ∑ 𝑚𝑖 = 𝑚1 + 𝑚2 + ⋯ + 𝑚𝑘
𝑖=1
𝑚𝑐𝑖
𝑞𝑖 =
𝑀
k étant le nombres d’observations
Exemple : Salaire de 50 employés d'une entreprise en milliers d’Ariary
Salaire ni fi fci xi mi = nixi mci qi
50 9500
fci qi
0,1 0,066
0,3 0,237
0,7 0,632
0,84 0,788
0,94 0,913
1 1
TOTAL 50 0,449
1.1.2.3. Médiale
La médiale est la valeur qui partage la série des valeurs (en statistique) en deux parties qui «
accumulent » la même quantité du bien (50 % de la quantité totale).
Médiale → 0,50
200 → 0,632
EXERCICES
EXERCICE 1
Les recettes moyennes journalières en milliers d’ariary des bus d’une coopérative reliant deux lieux M et N
par deux trajets A et B, pendant 40 jours sont données par les 2 tableaux suivants :
Trajet A
Nombre de jours 6 12 14 8
Trajet B
Nombre de jours 6 12 14 8
EXERCICE 2
« En statistique descriptive, un décile est chacune des 9 valeurs qui divisent un jeu de données, triées selon
une relation d'ordre, en 10 parts égales, de sorte que chaque partie représente 1/10 de l'échantillon de
population. » (http://fr.wikipedia.org/wiki/Décile).
Notons D1 = 100, D2 =110, D3 = 130, D4 =135, D5 = 145, D6 = 150, D7 = 170, D8 = 200, D9 = 250 les déciles des
salaires mensuels des ouvriers d’une entreprise en milliers d’ariary. Le tableau suivant présente la
répartition de ses salaires.
Intervalle <D1 [D1 ;D2[ [D2 ;D3[ [D3 ;D4[ [D4 ;D5[ [D5 ;D6[ [D6 ;D7[ [D7 ;D8[ [D8 ;D9[ >D9
Salaire
95 107 125 132 140 147 162 190 220 275
moyen
3. Calculer la médiane.
EXERCICE 3
La répartition en pourcentage des employés d’une PME selon le montant de leur salaire annuel net (en
milliers d’ariary), était :
Hommes Femmes
Salaire % Salaire %
140-200 13 150-200 20
200-225 20 200-220 25
225-250 30 220-240 30
250-270 15 240-260 10
270-300 10 260-280 8
300-400 8 280-310 4
400-600 4 310-400 3
EXERCICE 4
Une étude marketing menée à l’échelle européenne de la consommation du nouveau savon BLUP un
samedi matin à la sortie de deux supermarchés différents, l’un situé en France (supermarché 1) et l’autre
en Grande-Bretagne (supermarché 2) a donné lieu à la publication d’un rapport dans lequel on trouve le
tableau suivant :
Y
0 1 2 3 4 Total
X
[100;150[ 2 2 3 1 0 8
[150. 200[ 0 3 1 0 0 4
[200 ; 250[ 1 1 3 0 0 5
[250 ; 300] 0 0 1 1 1 3
Total 3 6 8 2 1 20
On a la distribution marginale de X
∑𝑘𝑖=1 𝑛𝑖 . 𝑐𝑖
𝑥̿ = 𝑘
∑𝑖=1 𝑛𝑖 .
3650
𝑥̿ =
20
𝑥̿ = 182,5
La variance marginale de X est notée σx2 :
∑𝑘𝑖=1 𝑛𝑖 . 𝑐𝑖 2
𝜎𝑋2 = − 𝑥̿ 2
∑𝑘𝑖=1 𝑛𝑖 .
727500
𝜎𝑋2 = − 182,52
20
𝜎𝑋2 = 3068,75
On a la distribution marginale de Y
0 3 0 0
1 6 6 6
2 8 16 32
3 2 6 18
4 1 4 16
TOTAL 20 32 72
∑𝑞𝑗=1 𝑛.𝑗 𝑦𝑗
𝑦̿ =
∑𝑞𝑗=1 𝑛.𝑗
32
𝑦̿ =
20
𝑦̿ = 1,6
∑𝑞𝑗=1 𝑛.𝑗 𝑦𝑗 2
𝜎𝑌2 = − 𝑦̿ 2
∑𝑞𝑗=1 𝑛.𝑗
72
𝜎𝑌2 = − 1,62
20
𝜎𝑌2 = 1,04
1.2.2. Moyennes et variances conditionnelles
Distribution conditionnelle :
∑𝑘𝑖=1 𝑛𝑖,3 𝑐𝑖
𝑥3 =
̅̅̅
∑𝑘𝑖=1 𝑛𝑖,3
Interdictions : Photocopie et reproduction Réf : foadgestion-degs/tanà/2024/L1/S1/UE2/STAT/1
31
RAKOTONASY Solonjaka, HERMIAH RAKOTONDRANJA STATISTIQUES FOAD GESTION: 2024
1500
𝑥3 =
̅̅̅
8
𝑥3 = 187,5
̅̅̅
En général, la moyenne conditionnelle 𝑥̅𝑗 de X pour Y=yj est :
∑𝑘𝑖=1 𝑛𝑖𝑗 𝑐𝑖 2 2
∑𝑘𝑖=1 𝑛𝑖𝑗 𝑐𝑖 2
𝑉(𝑋𝑗 ) = − 𝑥̅𝑗 = − 𝑥̅𝑗 2
∑𝑘𝑖=1 𝑛𝑖𝑗 𝑛.𝑗
∑𝑘𝑖=1 𝑛𝑖,3 𝑐𝑖 2
𝑉(𝑋3 ) = 𝑥3 2
− ̅̅̅
∑𝑘𝑖=1 𝑛𝑖,3
305000
𝑉(𝑋2 ) = − 187,52
8
𝑉(𝑋2 ) = 2968,75
V(Y) : la variance expliquée par la régression en X (ou encore variance inter-groupes),variance des
moyennes conditionnelles :
∑𝑘𝑖=1 𝑛𝑖 . 𝑦̅𝑖 2
𝑉(𝑌̅) = − 𝑦̿ 2
∑𝑘𝑖=1 𝑛𝑖 .
∑ n . j V ( X /Y = y j)
j= 1
m(V ( X /Y ))= q
∑ n. j
j= 1
La variance résiduelle (ou encore variance intra-groupes) de Y, moyenne des variances conditionnelles :
∑ n i . V (Y / X = xi )
i= 1
m(V (Y / X ))= k
∑ ni .
i=1
1.2.5. Covariance
La covariance de deux variables X et Y est notée : CovX,Y.
∑ ∑ ni j ( xi − x )( y j− y)
i= 1 j= 1
Cov X ,Y = k q
∑ ∑ ni j
i=1 j= 1
∑
i= 1
( x i− x)( y i− y)
Cov X ,Y = , n étant le nombre d'observations
n
Calcul pratique de la covariance :
Pour une distribution groupée, on a :
k q
∑ ∑ ni j x i y j
i= 1 j= 1
Cov X ,Y = k q
−xy
∑ ∑ ni j
i= 1 j = 1
∑ xi yi
Cov X ,Y = i= 1
− x y , n étant le nombre d'observations
n
Remarque : le point de coordonnées G(x,y) est appelé point moyen de la nuage des points
1.2.6. Corrélation
1.2.6.1. Définition
Deux variables X et Y sont dites indépendantes si les variations des deux caractères n'ont aucun lien entre
elles.
Deux variables X et Y sont dites en liaison fonctionnelle si les deux caractères sont liés par une fonction.
Deux variables X et Y sont en corrélation si les deux caractères sont en dépendance sans être liés par une
fonction.
Notation : e2X|Y
V (X)
e 2X / Y =
σ2 y
Lorsqu’il n’y a pas de liaison statistique entre X et Y, il est nul.
1.2.6.3.1. Définition
Le coefficient de corrélation de X avec Y, noté rX,Y, est le quotient de la covariance par le radical du produit
des variances de X et de Y :
𝑟
𝐶𝑜𝑣(𝑋, 𝑌) 𝐶𝑜𝑣(𝑋, 𝑌)
𝑟𝑋,𝑌 = =
√𝑉(𝑋)𝑉(𝑌) 𝜎𝑋 𝜎𝑌
1.2.6.3.2. Propriétés
− − 1≤ r X ,Y ≤ 1
− La corrélation est d'autant plus serrée que | rX,Y | est plus voisine de 1.
− Le signe du coefficient de corrélation indique le sens de corrélation : s'il est négatif alors la
corrélation est négative sinon la corrélation est positive
1.2.6.4. Exemple :
Exemple : Enquête effectuée sur 20 employés d'une entreprise sur le salaire et le nombre d'enfants à
charge
6550 σ 2x =
1420000
− 204,68752
x= 32
32
x= 204,6875 σ 2x = 2478,027
Moyenne totale ou marginale de Y : La variance marginale de Y est notée σy2
5
5
∑ n. j y j ∑ n. j y j2
j= 1
y= 5 σy =
2 j= 1
−y
2
∑ n. j
5
j=1 ∑ n. j
j= 1
72
y= 210
32 σ y 2= − 2,252
32
y= 2,25
Interdictions : Photocopie et reproduction Réf : foadgestion-degs/tanà/2024/L1/S1/UE2/STAT/1
36
RAKOTONASY Solonjaka, HERMIAH RAKOTONDRANJA STATISTIQUES FOAD GESTION: 2024
σ y 2= 1,5
Covariance de X et Y : Le coefficient de corrélation de X avec Y :
4 5
Cov X , Y
∑ ∑ ni j x i y j r X ,Y =
Cov X ,Y =
i= 1 j= 1
4 5
−xy √σ 2
X
2
σY
∑ ∑ ni j 36,328125
i= 1 j = 1
r X ,Y =
Cov X ,Y =
15900
32
− 204,6875× 1,5 √2478,027× 1,5
Cov X ,Y = 36,328125
r X ,Y = 0,596
1.2.7. REGRESSION
1.2.7.1. Définition
On appelle régression de Y en X l'ajustement de la liaison entre X et Y par une relation Y = af(X) + b + e(X) où
f est une fonction d'une variable réelle fixée, a et b sont des réels à déterminer et e une fonction.
On note ŷi = af(xi) + b
1.2.7.3. Ajustement
Si n est pair (n=2k), on partage la nuage des points en deux sous-nuages de k points
Si n est impair (n=2k+1), on partage la nuage des points en deux sous-nuages de k points et de k+1 points.
Interdictions : Photocopie et reproduction Réf : foadgestion-degs/tanà/2024/L1/S1/UE2/STAT/1
37
RAKOTONASY Solonjaka, HERMIAH RAKOTONDRANJA STATISTIQUES FOAD GESTION: 2024
On note G1(p1,q1) et G2G1(p2,q2) les points moyens respectifs de ces sous-nuages. La droite (G1G2) est
appelée droite de régression de MAYER.
q 2− q 1
a=
p 2− p 1
b= q1− a.p 1 avec
k k
1 1
p1 = ∑ x i et q1 = ∑ y i
k i=1 k i= 1
n n
1 1
p2 =
n− k
∑ xi et q 2=
n− k
∑ yi
i= k + 1 i= k + 1
G appartient à (G1G2)
xi yi ŷi ŷi – yi (ŷi – yi)2
140 15 15,431 0,431 0,1860
150 15 16,331 1,331 1,7722
150 20 16,331 -3,669 13,4597
170 20 18,131 -1,869 3,4922
175 15 18,581 3,581 12,8254
175 20 18,581 -1,419 2,0129
175 20 18,581 -1,419 2,0129
180 16 19,031 3,031 9,1885
185 15 19,481 4,481 20,0816
200 20 20,831 0,831 0,6910
225 30 23,081 -6,919 47,8691
230 20 23,531 3,531 12,4697
250 25 25,331 0,331 0,1097
250 25 25,331 0,331 0,1097
275 30 27,581 -2,419 5,8504
300 30 29,831 -0,169 0,0285
3230 336 336 0,0000 132,1594
201,875 21 16,519921875
Sous-nuage 1 1315 141 164,375 17,625
Sous-nuage 2 1915 195 239,375 24,375
0,090 2,831
Exemple : Enquête sur les salaires et les dépenses en transport des employés d'une société (en milliers
d'Ariary)
8 8
1 1
p1 = ∑ x i et q 1= ∑ y i
8 i= 1 8 i= 1
1315 141
p1 = = 164,375 et q1 = = 17,625
8 8
16 16
1 1
p2= ∑ x i et q 2= ∑ y i
8 i= 9 8 i=9
1915 195
p2 = = 239,375 et q 2= = 24,375
8 8
q 2− q 1 24,375− 17,625
a= = = 0,090
p 2− p 1 239,375− 164,375
b= 17,625− 0,090× 164,375= 2,831
L'équation de la droite de MAYER est : y = 0,090x + 2,831
Cov X , Y
a= 2
σX
b= y − a x
xi yi xiyi xi 2
yi2 ŷi ŷi – yi (ŷi – yi)2 (ŷi – y)2 (yi – y)2
140 15 2100 19600 225 15,011 0,011 0,0001 35,8681 36
150 15 2250 22500 225 15,979 0,979 0,9583 25,2113 36
150 20 3000 22500 400 15,979 -4,021 16,1691 25,2113 1
170 20 3400 28900 400 17,915 -2,085 4,3482 9,51872 1
175 15 2625 30625 225 18,399 3,399 11,5513 6,76667 36
175 20 3500 30625 400 18,399 -1,601 2,5641 6,76667 1
175 20 3500 30625 400 18,399 -1,601 2,5641 6,76667 1
180 16 2880 32400 256 18,883 2,883 8,3098 4,48306 25
185 15 2775 34225 225 19,367 4,367 19,0675 2,66788 36
200 20 4000 40000 400 20,819 0,819 0,6700 0,03294 1
225 30 6750 50625 900 23,238 -6,762 45,7204 5,01005 81
230 20 4600 52900 400 23,722 3,722 13,8553 7,41077 1
250 25 6250 62500 625 25,658 0,658 0,4331 21,698 16
250 25 6250 62500 625 25,658 0,658 0,4331 21,698 16
275 30 8250 75625 900 28,078 -1,922 3,6944 50,0968 81
300 30 9000 90000 900 30,498 0,498 0,2477 90,2065 81
3230 336 71130 686150 7506 336 0,0000 130,5866 319,413 450,000
201,875 21 4445,625 42884,375 469,125
206,250 2130,859 28,125 0,70981
46,161 5,303
0,843
0,097 1,460
16 16
1 7506
1
x= ∑ x i=
3230
= 201,875 σ 2y = ∑
16 i= 1
y i 2− y 2=
16
− (21)2= 28,125
16 i= 1 16
16
1 71130
Cov X ,Y = ∑ x i y i− x y=
16
1 336 − 201,875× 21= 206,250
y= ∑
16 j = 1
y j=
16
= 21 16 i = 1 16
16 Cov X , Y 206,250
1 2 686150 = = = 0,843
σ = ∑ xi − x =
2 2 2 r
− (201,875) = 2130,859
√σ X σY √
X ,Y 2 2
x
16 i = 1 16 2130,859× 28,125
Cov X , Y 206,250
a= = = 0,097
σ2x 2130,859 et b= y − a x= 21− 0,090× 201,875= 1,460
On appelle variation expliquée par le modèle, notée SCreg la somme des carrés des écarts des valeurs
prédites à la moyenne.
𝑛
On appelle variation inexpliquée par le modèle, notée SCres la somme des carrés des résidusou la somme
des carrés résiduelle.
𝑛
2
𝑆𝐶𝑟𝑒𝑠 = ∑(𝑦𝑖 − 𝑦̂)
𝑖
𝑖=1
Théorème :
Remarques :
Pour l'exemple :
2 319,413
R= = 0,710
450
Cela signifie que 71% de la variance de y est expliquée par la corrélation : la corrélation est moins bonne
EXERCICES
EXERCICE 1
Une banque veut étudier les relations entre l’âge, le revenu, le patrimoine et les emprunts dans sa clientèle
particuliers. On se limite ici à 10 clients tirés au hasard dans le fichier :
EXERCICE 2
Le tableau suivant représente les chiffres d’affaire et les dépenses publicitaires d’une entreprise en millions
d’ariary
i 1 2 3 4 5 6
EXERCICE 3
Au cours des huit dernières années, le nombre de demandes d’inscription dans une mention
d’une faculté est représenté dans le tableau suivant :
Rang de l'année ti 1 2 3 4 5 6 7 8
EXERCICE 4
(Dans tout cet exercice, les résultats concernant la population seront arrondis au million).
1. Représenter graphiquement le nuage de points ( xi ; yi ) dans le plan muni d’un repère orthonormal
d’unités graphiques 2 sur l’axe des abscisses et 1 cm pour 100 millions sur l’axe des ordonnées.
2. Le modèle étudié dans cette question sera appelée « droite de Mayer ».
(a) G1 désigne le point moyen des trois premiers points du nuage et G2 celui des deux derniers
points. Déterminer les coordonnées de G1 et de G2.
(b) Déterminer l’équation réduite de (G1G2) sous la forme y = ax + b.
(c) Tracer la droite (G1G2) sur le graphique précédent.
(d) En utilisant cet ajustement, calculer la population de l’Inde que l’on pouvait prévoir pour 2001.
3. (a) À l’aide de la calculatrice, déterminer un ajustement affine de y en x par la méthode des moindres
5. Les résultats obtenus en 2001 ont révélé que la population comptait 1027 millions d’habitants.
Déterminer une estimation de la population en 2011 en choisissant le modèle qui semble le plus
approprié. Justifier ce choix.
On peut la présenter par une série double ((ti, yi)) où ti+1 – ti est constant, par une série simple (yi) où
l’indice représente le temps avec pour unité (s, min, heure, jour, semaine, mois, trimestre, année, ...).
Dans la représentation graphique le temps ou l'indice est porté en abscisse et le caractère Y en ordonnée.
Exemple : Nombre de voyageurs transportés mensuellement par une Coopérative de Transports au cours
de cinq années consécutives.
On a le graphique suivant :
Années
Mois Janv ier Fév rier Mars Av ril Mai Juin Juillet Août Sept Oct nov . Dec.
1 880 780 550 830 980 950 1040 960 880 1000 890 910
2 900 770 580 720 990 970 1050 1000 900 1020 920 950
3 930 800 590 820 1040 1040 1100 1000 960 1020 910 940
4 920 830 580 850 970 1010 1060 1060 960 1050 930 990
5 960 860 590 850 1070 1030 1120 1080 970 1090 980 1000
465 26640 9455 24204000 418140 1365 28740 64355 28003000 1312560
Σti Σyi Σti2 Σyi2 Σtiyi
1830 55380 73810 52207000 1730700 30,5 923 1230 870117 28845
299,9 18187,67 693,5
a= 2,3123
b= 852,47
60
1 1830
Moyenne de T : t= 60 ∑ t i = 60 = 30,5
i= 1
60
1 55380
Moyenne de Y : y = 60 ∑ y i = 60 = 923
i= 1
60
1 73810
Variance de T : σt = 60 ∑ t i − t = 60 − 30,5 = 299,9
2 2 2 2
i= 1
60
1 52207000
Variance de Y : σ = 60 ∑ y i − y =
2 2 2
y − (1230)2= 18187,67
i= 1 60
60
1 1730700
Covariance de T et de Y : Cov (T ,Y )= 60 ∑ t i y i − t y = 60
− 30,5× 923= 693,5
i= 1
Cov (T ,Y ) 693,5
a= = = 2,3123
σ 2t 299,9
b= y − a t= 923− 2,3123× 30,5= 852,47
L'équation du Trend est y = 2,3123t + 852,47
( x + …+ x i− 1 + x i + x i+ 1 + …+ x i + k ) ∑
j= − k
xi + j
m p , i = i− k =
p p
On appelle moyenne mobile centrée de longueur paire p = 2 k à l’instant ti la
valeur moyenne mp,i des observations xi-k, xi-k+1, …, xi, xi+1, …, xi+k , la première et la dernière étant pondérées
par 0.5 :
x i− k x i + k x i− k k x
( + x i− k+ 1+ …+ x i − 1 + x i + x i+ 1+ …+ x i+ k− 1+ ) + ∑ x i+ j + i+ k
2 2 2 j =− k 2
m p, i = =
p p
Tendance par la méthode des moyennes mobiles
ti yi m p, i ti yi m p, i
1 880 31 1100 928,8
2 780 32 1000 929,6
3 550 33 960 930,4
4 830 34 1020 931,3
5 980 35 910 929,6
6 950 36 940 925,4
7 1040 888,33 37 920 922,5
8 960 888,75 38 830 923,3
9 880 889,58 39 580 925,8
10 1000 886,25 40 850 927,1
11 890 882,08 41 970 929,2
12 910 883,33 42 1010 932,1
13 900 884,58 43 1060 935,8
14 770 886,67 44 1060 938,8
15 580 889,17 45 960 940,4
16 720 890,83 46 1050 940,8
17 990 892,92 47 930 945
18 970 895,83 48 990 950
19 1050 898,75 49 960 953,3
20 1000 901,25 50 860 956,7
21 900 902,92 51 590 957,9
22 1020 907,5 52 850 960
23 920 913,75 53 1070 963,8
24 950 918,75 54 1030 966,3
25 930 923,75 55 1120
26 800 925,83 56 1080
27 590 928,33 57 970
28 820 930,83 58 1090
29 1040 930,42 59 980
30 1040 929,58 60 1000
2.3.1.1. La désaisonnalisation
La désaisonnalisation d'une série chronologique consiste à corriger cette série pour enlever les disparités
périodiques provenant des variations saisonnières. Cette correction se fait le plus souvent par l’utilisation
de coefficients saisonniers.
Si = yi – ŷi
Pour i = 1 … T0, on a :
N− 1
∑
j= 0
S i+ jT0
C i=
N
T0
∑ Ci
i=1
ρ=
T0
60
Pour notre exemple, N= 12 = 5
4
∑
j =0
S1+ 12j
S 1+ S 13+ S 25+ S37+ S 49
C1 = =
5 5
12
∑
i =1
Ci
C1 + C 2+ ⋯+ C12
ρ= =
12 12
2.3.1.3. La série corrigée des variations saisonnières : modèle additif
La série corrigée des variations saisonnières est notée {(ti,y*i)} avec : y*i = yi – C'i
ti yi ŷi Si Ci y*i εi
1 880 854,787 25,213 2,695 877,305 22,518
2 780 857,099 -77,099 -1,109 781,109 -75,990
3 550 859,412 -309,412 -14,913 564,913 -294,499
4 830 861,724 -31,724 -18,439 848,439 -13,285
5 980 864,036 115,964 -4,187 984,187 120,151
6 950 866,348 83,652 8,398 941,602 75,253
7 1040 868,661 171,339 10,150 1029,850 161,189
8 960 870,973 89,027 11,624 948,376 77,403
9 880 873,285 6,715 5,042 874,958 1,672
10 1000 875,598 124,402 4,294 995,706 120,108
11 890 877,910 12,090 6,046 883,954 6,044
12 910 880,222 29,778 0,575 909,425 29,202
13 900 882,535 17,465 2,695 897,305 14,770
14 770 884,847 -114,847 -1,109 771,109 -113,738
15 580 887,159 -307,159 -14,913 594,913 -292,247
16 720 889,472 -169,472 -18,439 738,439 -151,033
17 990 891,784 98,216 -4,187 994,187 102,403
18 970 894,096 75,904 8,398 961,602 67,506
19 1050 896,408 153,592 10,150 1039,850 143,442
20 1000 898,721 101,279 11,624 988,376 89,655
21 900 901,033 -1,033 5,042 894,958 -6,075
22 1020 903,345 116,655 4,294 1015,706 112,361
23 920 905,658 14,342 6,046 913,954 8,296
24 950 907,970 42,030 0,575 949,425 41,455
25 930 910,282 19,718 2,695 927,305 17,023
26 800 912,595 -112,595 -1,109 801,109 -111,486
27 590 914,907 -324,907 -14,913 604,913 -309,994
28 820 917,219 -97,219 -18,439 838,439 -78,781
29 1040 919,532 120,468 -4,187 1044,187 124,655
30 1040 921,844 118,156 8,398 1031,602 109,758
31 1100 924,156 175,844 10,150 1089,850 165,694
32 1000 926,468 73,532 11,624 988,376 61,908
33 960 928,781 31,219 5,042 954,958 26,177
34 1020 931,093 88,907 4,294 1015,706 84,613
35 910 933,405 -23,405 6,046 903,954 -29,451
36 940 935,718 4,282 0,575 939,425 3,707
37 920 938,030 -18,030 2,695 917,305 -20,725
38 830 940,342 -110,342 -1,109 831,109 -109,234
39 580 942,655 -362,655 -14,913 594,913 -347,742
40 850 944,967 -94,967 -18,439 868,439 -76,528
41 970 947,279 22,721 -4,187 974,187 26,908
42 1010 949,592 60,408 8,398 1001,602 52,010
43 1060 951,904 108,096 10,150 1049,850 97,946
44 1060 954,216 105,784 11,624 1048,376 94,160
45 960 956,528 3,472 5,042 954,958 -1,571
46 1050 958,841 91,159 4,294 1045,706 86,865
47 930 961,153 -31,153 6,046 923,954 -37,199
48 990 963,465 26,535 0,575 989,425 25,959
49 960 965,778 -5,778 2,695 957,305 -8,473
50 860 968,090 -108,090 -1,109 861,109 -106,981
51 590 970,402 -380,402 -14,913 604,913 -365,490
52 850 972,715 -122,715 -18,439 868,439 -104,276
53 1070 975,027 94,973 -4,187 1074,187 99,160
54 1030 977,339 52,661 8,398 1021,602 44,263
55 1120 979,652 140,348 10,150 1109,850 130,198
56 1080 981,964 98,036 11,624 1068,376 86,412
57 970 984,276 -14,276 5,042 964,958 -19,319
58 1090 986,588 103,412 4,294 1085,706 99,117
59 980 988,901 -8,901 6,046 973,954 -14,947
60 1000 991,213 8,787 0,575 999,425 8,211
Σti Σyi Σŷi ΣSi ΣCi Σy*i Σεi
1830 55380 55380,000 0 0 55329,1093 -50,891
2,312 852,475
Si = yi /ŷi
Pour i = 1 … T0, on a :
N− 1
∑
j= 0
Si + jT0
Ci =
N
On appelle coefficient correcteur, noté ρ, la moyenne des Ci :
T0
∑ Ci
i =1
ρ=
T0
On a le coefficient saisonnier corrigé : C'i = Ci - ρ
y*i = yi /C'i
EXERCICES
Exercice 1 :
Numéro du jour
1 2 3 4
Plage horaire
0h-6h 1394 2093 2343 2839
6h-12h 2469 2824 3026 3841
12h-18h 1665 2116 2779 3009
18h-24h 2588 2934 3561 3579
Exercice 2 :
ti 1 2 3 4 5 6 7 8 9 10
yi 58 40 31 15 18 15 9 9 10 8
Exercice 3
Le tableau suivant donne le chiffre d’affaires (CA) y d’une entreprise (en milliers d’euros) selon le mois
de l’année x :
Année 1 Année 2
xi J F M A M J J A S O N D J F M A
yi 106 107 119 121 117 121 130 143 146 146 145 155 161 173 189 194
xc
I c /r = × 100
xr
L'indice de X à la date de référence est appelé base. Ici la base est égale à 100.
Remarque : Si
xc
I c /r =
xr
alors la base est égale à 1.
L'indice du nombre de voiture de la coopérative en 2010 avec base 100 en 2006 est
90
I 2010/2006 = × 100= 140,625
64
Il y a une croissance de 140,625 – 100 = 40,525% de voiture au sein de la coopérative.
xi
I i/ j = × 100
xj
Exemple : Répartition des voitures de moins de 5 places dans les ex-provinces.
L'indice élémentaire permet de mesurer la variation d'une seule grandeur entre deux instants ou deux
situations.
Interdictions : Photocopie et reproduction Réf : foadgestion-degs/tanà/2023/L1/S1/UE2/STAT/1
56
RAKOTONASY Solonjaka, HERMIAH RAKOTONDRANJA STATISTIQUES FOAD GESTION: 2023
3.2.1. Données
Soit un tableau représentant des n biens avec leurs prix et leurs quantités en k périodes
Période t1 t2 ... tk
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
3.2.3. Exemple
Répartition des apprenants d'un centre de formation selon leur niveau et frais de la formation
Période 2007 2009
Niveau frais en Ar Nombre frais en Ar Nombre
1 200000 30 300000 25
2 250000 20 350000 20
3 300000 15 400000 16
3
V 1= ∑ p i ,1⋅ q i ,1
i =1
V 1= 200000× 30+ 25000× 20+ 300000× 15
V 1= 15500000 Ar
3.2.4. Indices synthétiques de LASPEYRES
Notation : Lj/1(P)
n
∑ p i , j⋅ q i ,1
i= 1
L j /1 ( P)= n
× 100
∑ p i ,1⋅ q i ,1
i= 1
Exemple : Répartition des apprenants d’un centre de formation selon leur niveau et frais de la formation
∑ p i ,2⋅ qi ,1
i= 1
L2/ 1 (P )= 3
× 100
∑ p i ,1⋅ qi ,1
i= 1
Notation : Lj/1(Q)
n
∑ p i ,1⋅ q i , j
i= 1
L j /1 (Q)= n
× 100
∑ p i ,1⋅ q i ,1
i= 1
L'indice de LASPEYRES des prix entre 2007 et 2009, pour l'exemple précédent :
3
∑ p i ,1⋅ q i ,2
i= 1
L2/ 1 (Q)= 3
× 100
∑ p i ,1⋅ q i ,1
i= 1
Notation : πj/1(P)
n
∑ pi , j⋅ q i , j
i= 1
Π j/ 1 (P )= n
× 100
∑ p i ,1⋅ q i , j
i= 1
L'indice de PAASCHE des prix entre 2007 et 2009, pour l'exemple précédent :
3
∑ pi ,2⋅ q i ,2
i= 1
Π 2/ 1 (P )= 3
× 100
∑ pi ,1⋅ q i ,2
i= 1
∏1/2(P)= 141,22
Notation : πj/1(Q)
n
∑ p i , j⋅ q i , j
i= 1
Π j/ 1 (Q)= n
× 100
∑ p i , j⋅ q i ,1
i= 1
𝐹𝑗/𝑖 = √𝐿𝑗 𝑖 . 𝜋𝑗 𝑖
/ /
EXERCICES
EXERCICE 1
Le tableau suivant représente, en Ariary, le prix moyen mensuel de riz sur un marché local :
JANV FEV MARS AVR MAI JUIN JUIL AOÛT SEPT OCT NOV DÉC
1470 1490 1540 1510 1490 1480 1430 1410 1390 1390 1390 1450
L’indice de prix moyen au mois de référence est 100 et l’indice de prix moyen au mois de d’août est
95,27. On donnera les résultats à 10-2 près.
EXERCICE 2
Une agence vend deux formules de séjours, dénommées respectivement A et B. Ces formules
diffèrent entre elles selon que le matériel est ou non loué sur place par le client.
Les prix unitaires de ces formules ainsi que les quantités demandées de chacune d’entre elles au
cours des cinq dernières années sont repris au tableau 2 suivant :
Tableau : Prix unitaires et ventes des formules A et B (5 dernières années)
Formule B Formule A
Année Prix unitaire Quantité Prix unitaire Quantité
(€) vendue (€) vendue
1 434,25 253 548,75 317
2 450,00 218 556,25 358
3 462,50 263 572,50 372
4 466,25 247 565,75 381
5 477,25 275 583,00 403
calculer, pour les trois dernières années :l’indice synthétique de prix de Laspeyres (base : année 3 =
100) du prix d’un séjour, combinant les prix et quantités demandées des formules A et B.
SOMMAIRE