Vous êtes sur la page 1sur 18

Chapitre II : Les distributions statistiques à deux caractères

1. Distributions statistiques à deux variables

1.1 Notions
Le chapitre précédent a été l’objet de l’étude des séries statistiques faisant intervenir les valeurs
d’un seul caractère. Or, de nombreux problèmes statistiques nécessitent l’étude simultanée de
plusieurs caractères, en particulier une liaison de deux variables, comme :
- Consommation et dépense nationale brute,
- Importat41ion et produit national brut,
- taux de croissance de la productivité et de la production,
- l’âge et le poids, la taille et le poids de chaque individu etc.
La série statistique est une suite de n couples pour les deux variables
(𝑥, 𝑦) = {(𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), … , (𝑥𝑖 , 𝑦𝑖 ), … , (𝑥𝑛 , 𝑦𝑛 )}
Chacune des deux variables peut être, soit quantitative, soit qualitative
 Si x et y sont deux variables quantitatives, alors chacune des deux variables prend comme
valeurs des modalités quantitatives.
 x et y sont deux variables qualitatives, alors chacune des deux variables prend des modalités
qualitatives.

1.2. Tableau de distribution conjointe


Le couple (x, y) est une variable conjointe, si les modalités conjointes dont l'effectif nul sont
éliminées.
Soient x et y deux variables de modalités respectives, 𝑥1 , 𝑥2 , … , 𝑥𝑖 , … , 𝑥𝐼 et 𝑦1 , 𝑦2 , … , 𝑦𝑗 , . . , 𝑦𝐽 ; et
d’effectifs respectifs 𝑛𝑖. 𝑒𝑡 𝑛.𝑗
 𝑛𝑖. et 𝑛.𝑗 représentent respectivement les nombres de fois que les modalités
𝑥𝑖 𝑒𝑡 𝑦𝑗 apparaissent ;
 𝑛𝑖𝑗 représente le nombre de fois que les modalités 𝑥𝑖 et 𝑦𝑗 apparaissent ensemble, c'est-à-
dire l’effectif de l’intersection de la ieme ligne et de la jeme colonne.
On a les relations
𝐼

∑ 𝑛𝑖𝑗 = 𝑛.𝑗 , 𝑝𝑜𝑢𝑟 𝑡𝑜𝑢𝑡 𝑗 = 1, … , 𝐽


𝑖=1
𝐽

∑ 𝑛𝑖𝑗 = 𝑛𝑖. , 𝑝𝑜𝑢𝑟 𝑡𝑜𝑢𝑡 𝑖 = 1, … , 𝐼


𝑗=1
𝐼 𝐽 𝐼 𝐽

∑ 𝑛𝑖. = ∑ 𝑛.𝑗 = ∑ ∑ 𝑛𝑖𝑗 = 𝑛 𝑜𝑢 𝑛.. 𝑜𝑢 𝑁


{ 𝑖=1 𝑗=1 𝑖=1 𝑗=1

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 1


Ces données observées peuvent être regroupées sous la forme d’un tableau de contingence

𝑦1 … 𝑦𝑗 … 𝑦𝐽 Total
𝑥1 𝑛11 … 𝑛1𝑗 … 𝑛1𝐽 𝒏𝟏.
⋮ ⋮ … ⋮ … ⋮ ⋮
𝑥𝑖 𝑛𝑖1 … 𝑛𝑖𝑗 … 𝑛𝑖𝐽 𝒏𝒊.
⋮ ⋮ … ⋮ … ⋮ ⋮
𝑥𝐼 𝑛𝐼1 … 𝑛𝐼𝑗 … 𝑛𝐼𝐽 𝒏𝑰.
Total 𝒏.𝟏 … 𝒏.𝒋 … 𝒏.𝑱 N

De même le tableau de fréquences conjointes peut s’obtenir en divisant tous les effectifs par la
taille de l’échantillon.
𝑛𝑖𝑗
𝑓𝑖𝑗 = 𝑗 = 1, … , 𝐽, 𝑖 = 1, … , 𝐼
𝑛
𝑛 𝑛.𝑗 𝐽
𝑓𝑖. = 𝑖. , ∑𝐼𝑖=1 𝑓𝑖. = 1 et 𝑓.𝑗 = , ∑𝑗=1 𝑓.𝑗 = 1
𝑛 𝑛
𝐼 𝐽 𝐼 𝐽

∑ 𝑓𝑖. = ∑ 𝑓.𝑗 = ∑ ∑ 𝑓𝑖𝑗 = 1 𝑜𝑢 100%


𝑖=1 𝑗=1 𝑖=1 𝑗=1

1.3 Distributions marginales


Les distributions marginales de x et de y sont :

X Effectifs Y Effectifs
𝑥1 𝒏𝟏. 𝑦1 𝒏.𝟏
⋮ ⋮ ⋮ ⋮
𝑥𝑖 𝒏𝒊. 𝑦𝑗 𝒏.𝒋
⋮ ⋮ ⋮ ⋮
𝑥𝐼 𝒏𝑰. 𝑦𝐽 𝒏.𝑱
Total N Total N

Exemple:

On a observé sur une période de 100 jours le nombre de ventes quotidiennes de deux produits X
et Y. Les résultats sont donnés dans le tableau suivant

Y (j) 0 1 2 3 Total
X(i)
0 0 2 13 20 35
1 3 2 4 8 17
2 14 4 0 0 18
3 20 10 0 0 30
Total 37 18 17 28 100

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 2


Déterminons
3 3 3

∑ 𝑛𝑖. = 100, ∑ 𝑛.𝑗 = 100 , ∑ 𝑛𝑖1 = 18


𝑖=0 𝑗=0 𝑖=0
∑3𝑖=2 𝑛𝑖3 = 𝑛23 + 𝑛33 = 0, ∑2𝑗=1 𝑛2𝑗 = 𝑛21 + 𝑛22 = 4 + 0 = 4 , ∑3𝑗=0 𝑛0𝑗 = 35

Exercice (A domicile)

On dispose un tableau suivant qui fournit pour une année X, le chiffre d’affaires, exprimé en
milliers de francs, d’une entreprise Diarra et Frères, chiffre d’affaires ventilé par article et par
trimestre. Chacun des chiffres d’affaires trimestriels est facilement repéré par l’indice de la ligne
et l’indice de la colonne sur lesquelles il porte.

Trimestres (indice j colonnes)


Articles (indice i lignes) J=1 J=2 J=3 J=4
A (i=1) 480 610 300 700
B (i=2) 250 280 110 430
C (i=3) 1050 1120 880 1200
D (i=4) 660 720 500 810
E (i=5) 130 170 90 180

Ainsi 𝑥𝑖2 = 720 correspond aux ventes portant sur l’article D au cours du deuxième trimestre.
Déterminer
1) Chiffre d’affaires total du 2e trimestre c'est-à-dire ∑5𝑖=1 𝑥𝑖2
2) Chiffre d’affaires portant sur l’article D, pour toute l’année, c-à-dire ∑4𝑗=1 𝑥4𝑗
3) Chiffre d’affaires portant sur les articles B et C, pour l’année, c'est-à-dire ∑3𝑖=2 ∑4𝑗=1 𝑥𝑖𝑗
4) Chiffre d’affaires pour les articles D et E, pour 3 e et 4e trimestres, c'est-à-dire ∑5𝑖=4 ∑4𝑗=3 𝑥𝑖𝑗
5) Chiffre d’affaires total de l’année ∑5𝑖=1 ∑4𝑗=1 𝑥𝑖𝑗 𝑜𝑢 ∑4𝑗=1 ∑5𝑖=1 𝑥𝑖𝑗

1. 4 Distribution conditionnelle

Soit 𝑍 = {(𝑥𝑖 , 𝑦𝑗 , 𝐶𝑖𝑗 , 𝑛𝑖𝑗 }, 𝑖𝜖[1, 𝑝], 𝑗𝜖[1, 𝑞] une variable statistique à deux dimensions, de
variables marginales.
𝑥 = {(𝑥𝑖 , 𝐶𝑖 , 𝑛𝑖 )}, 𝑖𝜖 [1, 𝑝] 𝑒𝑡 𝑦 = {(𝑥𝑗 , 𝐶𝑗 , 𝑛𝑗 )}, 𝑗𝜖 [1, 𝑞 ],
∑𝑖=1 ∑𝑗=1 𝑛𝑖𝑗 = 𝑛 𝑛𝑖. = ∑𝑗 𝑛𝑖𝑗 𝑒𝑡 𝑛.𝑗 = ∑𝑝𝑖 𝑛𝑖𝑗
𝑝 𝑞 𝑞

x et y sont des variables statistiques qualitatives, quantitatives (discrètes ou continues). Pour une
variable continue, les valeurs sont celles des moyennes des classes (centre de classes sous
l'hypothèse de répartition uniforme des valeurs à l'intérieur d'une classe).
𝑍 ⁄𝑦 = 𝑦𝑗 = {(𝑥𝑖 , 𝐶𝑖 , 𝑛𝑖 )}, 𝑖𝜖[1, 𝑝] 𝑒𝑡
𝑍⁄𝑥 = 𝑥𝑖 = {(𝑥𝑗 , 𝐶𝑗 , 𝑛𝑗 )}, 𝑗𝜖 [1, 𝑞 ]
Elles sont respectivement des variables conditionnelles de x et de y.

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 3


Remarque.

 Si x et y sont deux variables quantitatives et jouent des rôles symétriques, il est intéressant
d'étudier les variables conditionnelles des deux types.
 Si l'une des variables est qualitative et l'autre quantitative, alors seul le conditionnement
par la variable qualitative présente un intérêt.

Exemple

Afin d’étudier les liens entre les résultats en statistiques et en mathématiques d’un groupe de TD
de 25 étudiants, on a classé ces étudiants en 3 catégories : Faible (-1) ; Moyen (0) et Fort (+1)
La variable X est la partie Statistiques et Y celle de Mathématiques. On obtient le tableau suivant
Y X -1 0 +1 Total
-1 6 2 0 8
0 2 5 5 12
+1 0 3 2 5
Total 8 10 7 25

Donner les significations respectives des nombres 3 ; 10 ; 5 et 25.

2. Etude de la liaison de deux variables


2.1 Cas de deux (2) caractères qualitatifs
2.1.1 Notion de profil
On parle de profils c.-à-d. fréquences conditionnelles que l'on oppose aux fréquences marginales
lues dans la dernière ligne (colonne) du tableau. Le tableau de contingence s’interprète toujours en
comparant des fréquences en lignes ou des fréquences en colonnes (appelés aussi profils lignes et
profils colonnes).
 Les profils lignes sont définis par
(𝑖) 𝑛𝑖𝑗 𝑓𝑖𝑗 𝑛𝑖𝑗
𝑓𝑗 = = , avec 𝑓𝑖𝑗 = 𝑗 = 1, … , 𝐽, 𝑖 = 1, … , 𝐼
𝑛𝑖. 𝑓𝑖. 𝑛
 Les profils colonnes sont définis par
(𝑗) 𝑛𝑖𝑗 𝑓𝑖𝑗 𝑛𝑖𝑗
𝑓𝑖 = = , avec 𝑓𝑖𝑗 = 𝑗 = 1, … , 𝐽, 𝑖 = 1, … , 𝐼
𝑛.𝑗 𝑓.𝑗 𝑛
2.1.2 Indépendance de deux caractères et liaison fonctionnelle

On cherche souvent une interaction entre des lignes et des colonnes, un lien entre les variables.
Pour mettre en évidence ce lien,
On construit un tableau d’effectifs théoriques qui représente la situation où les variables ne sont
pas liées (indépendance statistique).
∗ 𝑛𝑖. 𝑛.𝑗
Ces effectifs théoriques sont construits de la manière suivante : 𝑛𝑖𝑗 = 𝑛

Les effectifs observés 𝒏𝒊𝒋 ont les mêmes marges que les effectifs théoriques 𝑛𝑖𝑗 . Enfin, les écarts
à l’indépendance sont définis par

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 4



𝑒𝑖𝑗 = 𝑛𝑖𝑗 − 𝑛𝑖𝑗
La dépendance du tableau se mesure au moyen du khi-carré défini par
∗ 2
(𝑛𝑖𝑗−𝑛𝑖𝑗 ) 𝑒2
2
𝜒𝑜𝑏𝑠 = ∑𝐽𝑗=1 ∑𝐼𝑖=1 ∗ = ∑𝐽𝑗=1 ∑𝐼𝑖=1 𝑛𝑖𝑗∗
𝑛𝑖𝑗 𝑖𝑗

Le khi-carré peut être normalisé pour ne plus dépendre du nombre d’observations n par le phi-
2
𝜒𝑜𝑏𝑠
deux 𝜙 2 lequel est définit par : 𝜙 2 = 𝑛
2
Il est possible de montrer que 𝜙 ≤ min(𝐼 − 1, 𝐽 − 1)

2.1.3 Etude de liaison entre deux caractères qualitatifs

Le V de cramer et le T de Tschuprow sont deux coefficients très utilisés, compris entre 0 et 1, sont
d'autant plus grands que la liaison entre les deux variables considérées est forte. Ce qui facilite leur
interprétation. Toutefois, on notera que T et C sont rarement supérieurs à 0,5 dans la pratique ;
sont donc difficiles à interpréter dans l'absolu. Ils sont plus utiles lorsqu'on recherche, dans une
liste de variables qualitatives, celle qui est la plus liée à une autre variable qualitative.

Le V de Cramer est définit par


𝜙2 𝑜𝑏𝑠 𝜒2
𝑉 = √min (𝐼−1,𝐽−1) = √𝑛×min (𝐼−1,𝐽−1) ∈ ]0, 1[
Il ne dépend ni de la taille de l’échantillon ni de la taille du tableau.
 Si V ≈ 0, les deux variables sont indépendantes ;
 Si V = 1, il existe une relation fonctionnelle entre les variables, ce qui signifie que chaque ligne
et chaque colonne du tableau de contingence ne contiennent qu’un seul effectif différent de 0
(il faut que le tableau ait le même nombre de lignes que de colonnes).

Le T de Tschuprow est une autre normalisation du χ2 à l'aide de l'effectif total n et des degrés de
liberté. On peut traduire ce coefficient comme un pourcentage d’information expliquée par la
liaison (équivalent au coefficient de détermination avec des variables quantitatives). Sa
formulation est la suivante :
𝑜𝑏𝑠 𝜒2
𝑇 = √𝑛√(I−1)( 𝐽−1)
L'intervalle de définition du Test 0 à
𝑛 min (𝐼−1,𝐽−1)
𝑇𝑚𝑎𝑥 = √max(𝐼−1,𝐽−1)

Exemple d’application
On s’intéresse à une éventuelle relation entre le sexe de 200 personnes et leur état matrimonial de
modalités (célibataire, marié(e) et divorcé(e)), comme le montre le tableau des effectifs de
contingence ci-dessous.

Célibataire Marié(e) Divorcé(e) Total


Homme 20 50 10 80

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 5


Femme 40 60 20 120
Total 60 110 30 200

Les Tableaux ci-dessous représentent respectivement le tableau des profils lignes et le tableau des
profils colonnes.

Tableau des profils lignes

Célibataire Marié (e) Divorcé (e) Total


Homme 0,25 0,625 0,125 1
(25%) (62,5%) (12,5%) (100%)
Femme 0,33 0,5 0,17 1
(33%) (50%) (17%) (100%)
Total 0,3 0,55 0,15 1
(30%) (55%) (15%) (100%)

Tableau des profils colonnes

Célibataire Marié (e) Divorcé (e) Total


Homme 0,33 0,45 0,33 0,40
(33%) (45%) (33%) (40%)
Femme 0,67 0,55 0,67 0,60
(67%) (55%) (67%) (60%)
Total 1 1 1 1
(100%) (100%) (100%) (100%)

𝒏𝒊. 𝒏.𝒋
Tableau des effectifs théoriques 𝒏∗𝒊𝒋 = 𝒏
Célibataire Marié (e) Divorcé (e) Total
Homme 24 44 12 80
Femme 36 66 18 120
Total 60 110 30 200

Tableau des écarts à l’indépendance 𝑒𝑖𝑗 = 𝑛𝑖𝑗 − 𝑛𝑖𝑗
Célibataire Marié (e) Divorcé (e) Total
Homme -4 6 -2 0
Femme 4 -6 2 0
Total 0 0 0 0

2 ∗ 2
𝑒𝑖𝑗 (𝑛𝑖𝑗−𝑛𝑖𝑗 )
Tableau des ∗
𝑛𝑖𝑗
= ∗
𝑛𝑖𝑗
Célibataire Marié(e) Divorcé(e) Total

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 6


Homme 0,67 0,82 0,33 1,82
Femme 0,44 0,55 0,22 1,21
Total 1,11 1,37 0,55 3,03

La dépendance du tableau se mesure au moyen du khi-carré défini par


2 2
𝐽 𝑒𝑖𝑗 𝑒𝑖𝑗
2
𝜒𝑜𝑏𝑠 == ∑𝑗=1 ∑𝐼𝑖=1 𝑛∗ = ∑3𝑗=1 ∑2𝑖=1 𝑛∗ = (0,67 + 0,44) + (0,82 + 0,55) + (0,33 + 0,22) = 𝟑, 𝟎𝟑
𝑖𝑗 𝑖𝑗
Le khi-carré peut être normalisé pour ne plus dépendre du nombre d’observations n par le phi-
deux 𝜙 2 lequel est définit par :
2
𝜒𝑜𝑏𝑠 3,03
𝜙2 = = = 0,01515
𝑛 200
Il est possible de montrer que
𝜙 2 ≤ min(𝐼 − 1, 𝐽 − 1)
𝜙 2 ≤ min(𝐼 − 1, 𝐽 − 1) = min(2 − 1, 3 − 1) = 1
Le V de Cramer est
𝜙2 0,01515 0,01515 𝜒2
𝑜𝑏𝑠 3,03
𝑉 = √min(𝐼−1,𝐽−1) = √min(1,2) = √ 1
= 0,123 ou 𝑉 = √𝑛×min(𝐼−1,𝐽−1) = √ 200 = 0,123 ≈ 0,
On peut conclure que la dépendance entre les deux variables est très faible.
𝜒2 3,03
𝑇 = √200𝑜𝑏𝑠 = √200 = 0,104 (soit 10% d’information expliquée)
1×2
√ √2
4 min (1,2) 4 1
et 𝑇𝑚𝑎𝑥 = √max(1,2) = √2 = 0,84

2.2 Cas d’une variable quantitative et une variable qualitative


2.2.1 Notations et caractéristiques conditionnelles

Bien que les variables qualitative et quantitative ne jouent pas un rôle symétrique, on peut étudier
l'influence d'une variable qualitative (par exemple le sexe) sur une variable quantitative (par
exemple le salaire).
Soit X une variable qualitative à 𝑟 modalités notées 𝑥1 , 𝑥2 , ⋯ , 𝑥𝑙 , ⋯ 𝑥𝑟 et Y une variable
quantitative de moyenne 𝑦̅ et de variance𝑆𝑌2 .
Si on note 𝐶𝑙 l'ensemble des individus de l'échantillon ayant présenté la modalité 𝑥𝑙 de X,
𝑛1 , 𝑛2 , ⋯ , 𝑛𝑟 les effectifs des différentes classes avec 𝑛 = ∑𝑟1 𝑛𝑙 (nombre total d’individus
observés). Nous noterons alors 𝑦̅𝑙 comme moyenne partielle et 𝑆𝑙2 variance partielle.
1 1
𝑦̅𝑙 = ∑ 𝑦𝑖 𝑒𝑡 𝑆𝑙2 = ∑(𝑦𝑖 − 𝑦̅𝑙 )2
𝑛𝑙 𝑛𝑙
𝑖∈𝐶𝑙
Les caractéristiques globales en fonction de leurs valeurs partielles sont les suivantes :
𝑟
1
𝑦̅ = ∑ 𝑛𝑙 𝑦̅𝑙
𝑛
𝑙=1
𝑟 𝑟
1 1
𝑆𝑌2 = ∑ 𝑛𝑙 (𝑦̅𝑙 − 𝑦̅)2 + ∑ 𝑛𝑙 𝑆𝑙2 = 𝑆𝐸2 + 𝑆𝑅2
𝑛 𝑛
𝑙=1 𝑙=1

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 7


𝑆𝐸2 𝑒𝑠𝑡 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑒𝑥𝑝𝑙𝑖𝑞𝑢é𝑒, variance inter − classes, ou entre les classes
{ 2
𝑆𝑅 𝑒𝑠𝑡 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑟𝑒𝑠𝑖𝑑𝑢𝑒𝑙𝑙𝑒, variance intra − classes, ou à l′interieur des classes
Plus 𝑆𝐸 est grande par rapport à 𝑆𝑅2 , plus les deux variables X et Y sont liées.
2

2.2.2 Indépendance de deux caractères et liaison fonctionnelle

Le rapport de corrélation est la part de variations de Y expliquée par X dans la variation totale de
Y. Il s'agit d'un indice de liaison entre les deux variables X et Y
𝑆𝐸2
𝐶𝑌/𝑋 =√ 2
𝑆𝑌
X et Y n’étant pas de même nature, 𝐶𝑌/𝑋 n’est pas symétrique et vérifie 0 ≤ 𝐶𝑌/𝑋 ≤ 1
- Si 𝐶𝑌/𝑋 = 0, la connaissance de X ne donne aucune information sur Y. X n’a aucune
influence sur Y. Donc il n’y a de liaison entre les deux variables.
- Si 𝐶𝑌/𝑋 = 1, la connaissance de X est suffisante pour connaître, d’où liaison totale entre
X et Y. Y est liée fonctionnellement à X.
- Plus 𝐶𝑌/𝑋 est grand, plus la liaison entre X et Y est forte.
- Lorsque X et Y sont indépendants 𝑎𝑙𝑜𝑟𝑠 𝐶𝑌/𝑋 = 0.

2.3 Cas de deux variables quantitatives


2.3.1 Notion d’ajustement

Si, pour chacun des n individus de la population, on note xi et yi les valeurs prises par les deux
caractères 𝑥 𝑒𝑡 𝑦, c'est-à-dire (𝑥, 𝑦) = {(𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), … , (𝑥𝑖 , 𝑦𝑖 ), … , (𝑥𝑛 , 𝑦𝑛 )}, on peut alors
présenter la série statistique sous la forme d’un tableau :

caractère 𝑥 𝑥1 𝑥2 𝑥3 ⋯ 𝑥𝑛
caractère 𝑦 𝑦1 𝑦2 𝑥3 ⋯ 𝑦𝑛

Dans un repère orthogonal, l’ensemble des points 𝑀𝑖 de coordonnées (𝑥𝑖 , 𝑦𝑖 ) constitue le nuage
de points associé à la série statistique à 𝑥 𝑒𝑡 𝑦 ; dont le point moyen d’un nuage de points est le
point G de coordonnées (𝑥̅ ; 𝑦̅).

Effectuer un ajustement d’un nuage de points consiste à trouver une fonction dont la courbe
représentative « approche » le nuage.
On peut utiliser trois méthodes dans ce chapitre telles que :
- L’ajustement affine, dont la courbe cherchée est une droite d’équation 𝑦 = 𝑎𝑥 + 𝑏
Pour que l’ajustement affine soit le meilleur possible, il faut que la droite d’ajustement passe par
le point moyen G du nuage de points.
- La méthode graphique, consiste à tracer la droite 𝑦 = 𝑎𝑥 + 𝑏 s'ajustant le mieux possible
sur le nuage de points.
Si 𝐴(𝑥𝐴 , 𝑦𝐴 ) 𝑒𝑡 𝐵(𝑥𝐵 , 𝑦𝐵 ) sont deux points de la droite, alors l’équation de la droite est
𝑦−𝑦 𝑦 −𝑦
donnée par : 𝑥−𝑥𝐵 = 𝑥𝐵 −𝑥𝐴
𝐵 𝐵 𝐴

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 8


- La méthode des moindres carrés, consiste à trouver la droite d’équation 𝑦 = 𝑎𝑥 + 𝑏 qui
minimise la somme des carrés des écarts entre les valeurs 𝑦𝑖 observées et les valeurs 𝑎𝑥𝑖 +
𝑏 données par la droite.
- La méthode de Mayer, consiste à partager le nuage en deux ensembles de points d’égal
effectif (ou à peu près, si le nombre de points est impair). Si 𝐺1 et 𝐺2 sont les points moyens
respectifs, la droite (𝐺1 , 𝐺2 ) est une droite d’ajustement.
𝐺1 (𝑋̅1 , 𝑌̅1 ) 𝐺2 (𝑋̅2 , 𝑌̅2 ) et un point quelconque M(x, y)
𝑌̅2 − 𝑌̅1 𝑌̅2 − 𝑦
= 𝑜𝑢 det(𝑀𝐺 ⃗⃗⃗⃗⃗⃗⃗⃗2 , ⃗⃗⃗⃗⃗⃗⃗⃗⃗
𝐺1 𝐺2 ) = 0
𝑋̅2 − 𝑋̅1 𝑋̅2 − 𝑥
2.3.2 Analyse des relations sur les données individuelles

2.3.2.1 Cas de relations linéaire

a. L’étude graphique du nuage de points représentants les deux variables x et y d’intérêts


permet de mettre en évidence un certain lien entre les variables.

Une relation linéaire est une tendance dans les données modélisables par une ligne droite de
forme 𝑦 = 𝑎𝑥 + 𝑏, de relation positive ou négative.

a. Une relation linéaire positive b. Une relation linéaire négative

Exemple :
Une compagnie aérienne peut estimer l'impact du prix du carburant sur le coût des vols. Cette
tendance décrit une relation linéaire entre le coût du carburant et le coût du vol.

2.3.2.2 Cas de relations non linéaires

Dans certains cas, l'ajustement à une fonction linéaire n'est pas adéquat : un ajustement des données
à une fonction non linéaire doit être envisagé. Les cas que nous considérerons sont ceux où on peut
se ramener par une simple transformation à un ajustement affine. Par exemple

Fonction Transformations Forme linéaire après transformations


Y  a b X u X Y= a + bu

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 9


Y  a  b ln X u = lnX Y = a + bu
Y  aebX v = lnY v = lna + bx
Y  aX b v = lnY, u = lnX v = lna + bu
X 1 1
Y  v ,u 
aX  b Y X v = a + bu
b
1
Y  ae X v  ln Y , u 
X v = lna + bu
1 1
Y v  , u  e X
a  be X Y v = a +bu

2.3.2.3 Caractéristiques marginales et conditionnelles

2.3.2.3.1. Caractéristiques marginales

Dans cette distribution statistique, chaque couple est composé de deux valeurs numériques x et y,
on peut calculer respectivement :
 tous les paramètres tels que les moyennes, les variances, écart-types
1 𝑝 1 𝑝
𝑥̅ = 𝑛 ∑𝑖=1 𝑛𝑖 𝑥𝑖 , 𝑆𝑥2 = 𝑛 ∑𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )2 𝑒𝑡 𝜎𝑥 = √𝑆𝑥2
1 𝑞 𝑞 1
𝑦̅ = 𝑛 ∑𝑗=1 𝑛𝑗 𝑦𝑗 𝑆𝑦2 = 𝑛 ∑𝑗=1 𝑛𝑗 (𝑦𝑗 − 𝑦̅)2 𝑒𝑡 𝜎𝑦 = √𝑆𝑦2
 tous les paramètres marginaux tels que les moyennes, les variances, écart-types
Moyennes, variances, écart-types marginaux de x
1 𝑝 𝑝
𝑥̅ 𝑚 = 𝑛 ∑𝑖=1 𝑛𝑖. 𝑥𝑖 = ∑𝑖=1 𝑓𝑖. 𝑥𝑖 ,

𝑆𝑚2 (𝑥 ) = 1 ∑𝑝 𝑛 (𝑥 − 𝑥̅ )2 = ∑𝑝 𝑓 (𝑥 − 𝑥̅ )2
̅̅̅̅ 𝑒𝑡 𝜎𝑚 (𝑥) = √̅̅̅̅
𝑆𝑚2 (𝑥 )
𝑛 𝑖=1 𝑖. 𝑖 𝑚 𝑖=1 𝑖. 𝑖 𝑚
𝑝 𝑝
𝐴𝑣𝑒𝑐 𝑛 = ∑𝑖=1 𝑛𝑖. 𝑒𝑡 ∑𝑖=1 𝑓𝑖. = 1
Moyennes, variances, écart-types marginaux de y
1 𝑞 𝑞
𝑦̅𝑚 = 𝑛 ∑𝑗=1 𝑛.𝑗 𝑦𝑗 = ∑𝑗=1 𝑓.𝑗 𝑦𝑗 ,
2 2
𝑆𝑚2 (𝑦) = 1 ∑𝑞 𝑛 (𝑦 − 𝑦
̅̅̅̅ ̅ ) = ∑𝑞𝑗=1 𝑓.𝑗 (𝑦𝑗 − 𝑦̅𝑚 ) 𝑒𝑡 𝜎𝑚 (𝑦) = √̅̅̅̅
𝑆𝑚2 (𝑦 )
𝑛 𝑖=1 .𝑗 𝑗 𝑚
𝑞 𝑞
𝐴𝑣𝑒𝑐 𝑛 = ∑𝑗=1 𝑛.𝑗 𝑒𝑡 ∑𝑗=1 𝑓.𝑗 = 1
2.3.2.3.2 Caractéristiques conditionnelles

Soit 𝑍 = {(𝑥𝑖 , 𝑦𝑗 , 𝐶𝑖𝑗 , 𝑛𝑖𝑗 }, 𝑖𝜖[1, 𝑝], 𝑗𝜖[1, 𝑞] une variable statistique quantitative à deux
dimensions, de variables marginales.

𝑥 = {(𝑥𝑖 , 𝐶𝑖 , 𝑛𝑖 )}, 𝑖𝜖[1, 𝑝] 𝑒𝑡 𝑦 = {(𝑥𝑗 , 𝐶𝑗 , 𝑛𝑗 )}, 𝑗𝜖 [1, 𝑞 ],

∑𝑝𝑖=1 ∑𝑞𝑗=1 𝑛𝑖𝑗 = 𝑛 𝑞


𝑛𝑖. = ∑𝑗 𝑛𝑖𝑗
𝑝
𝑒𝑡 𝑛.𝑗 = ∑𝑖 𝑛𝑖𝑗

x et y sont des variables statistiques quantitatives, discrètes ou continues. Pour une variable
continue, les valeurs sont celles des moyennes des classes (centre de classes sous l'hypothèse de
répartition uniforme des valeurs à l'intérieur d'une classe).

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 10


𝑍 ⁄𝑦 = 𝑦𝑗 = {(𝑥𝑖 , 𝐶𝑖 , 𝑛𝑖 )}, 𝑖𝜖[1, 𝑝] 𝑒𝑡
𝑍⁄𝑥 = 𝑥𝑖 = {(𝑥𝑗 , 𝐶𝑗 , 𝑛𝑗 )}, 𝑗𝜖 [1, 𝑞 ]

Elles sont respectivement des variables conditionnelles. Par conséquent les moyennes et variances
conditionnelles de Z sont respectivement les moyennes et variances de ses variables
conditionnelles :
̅̅̅̅̅̅̅̅̅̅̅̅ 1 𝑝
𝑍⁄𝑦 = 𝑦𝑗 = 𝑛 ∑𝑖=1 𝑛𝑖𝑗 𝑥𝑖 = 𝑥̅𝑗
.𝑗
𝑀𝑜𝑦𝑒𝑛𝑛𝑒𝑠 𝑐𝑜𝑛𝑑𝑖𝑡𝑖𝑜𝑛𝑛𝑒𝑙𝑙𝑒𝑠 { 1 𝑞
̅̅̅̅̅̅̅̅̅̅̅̅
𝑍⁄𝑥 = 𝑥𝑖 = 𝑛 ∑𝑖=1 𝑛𝑖𝑗 𝑦𝑗 = 𝑦̅𝑖
𝑖.
𝑥̅𝑗 est la moyenne conditionnelle de x selon y si 𝑦 = 𝑦𝑗
𝑦̅𝑖 est la moyenne conditionnelle de y selon x si 𝑥 = 𝑥𝑖
1 𝑝
𝑆𝑗2 (𝑥 ) = ∑𝑖=1 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̅𝑗 )2
𝑛.𝑗
𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒𝑠 𝑐𝑜𝑛𝑑𝑖𝑡𝑖𝑜𝑛𝑛𝑒𝑙𝑙𝑒𝑠 { 1 𝑞
𝑆𝑖2 (𝑦) = 𝑛 ∑𝑗=1 𝑛𝑖𝑗 (𝑦𝑗 − 𝑦̅𝑖 )2
𝑖.
C'est-à-dire
1 𝑝 2 1 𝑝 1 𝑝 2
𝑆 2 (𝑍⁄𝑦 = 𝑦𝑗 ) = ∑𝑖=1 𝑛𝑖𝑗 (𝑥𝑖 − ̅̅̅̅̅̅̅̅̅̅̅̅
𝑍⁄𝑦 = 𝑦𝑗 ) = [∑𝑖=1 𝑛𝑖𝑗 𝑥𝑖2 − (∑𝑖=1 𝑛𝑖𝑗 𝑥𝑖 ) ] = 𝑆𝑗2 (𝑥)
𝑛.𝑗 𝑛.𝑗 𝑛.𝑗
{ 2
1 𝑞 1 𝑞 1 𝑞
𝑆 2 (𝑍⁄𝑥 = 𝑥𝑖 ) = 𝑛 ∑𝑗=1 𝑛𝑖𝑗 (𝑦𝑗 − ̅̅̅̅̅̅̅̅̅̅̅̅
𝑍⁄𝑥 = 𝑥𝑖 )2 = 𝑛 [∑𝑗=1 𝑛𝑖𝑗 𝑦𝑗2 − 𝑛 (∑𝑗=1 𝑛𝑖𝑗 𝑦𝑗 ) ] = 𝑆𝑖2 (𝑦)
𝑖. 𝑖. 𝑖.

𝑆𝑗2 (𝑥) est la variance conditionnelle de x selon y si 𝑦 = 𝑦𝑗


𝑆𝑖2 (𝑦) est la variance conditionnelle de y selon x si 𝑥 = 𝑥𝑖

Exercice (A domicile)
Distribution statistique de 29 salariés d’une entreprise selon leur âge (X) et leur salaire mensuel en
milliers de francs (Y), comme l’indique le tableau ci-dessous

X Y [4, 7[ [7,10[ [10,13[ [13,16[ [16,19[ Total


[10,20[ 1 0 0 0 0 1
[20,30[ 1 3 1 1 0 6
[30,40[ 1 1 0 2 0 4
[40,50[ 1 0 4 2 4 11
[50,60[ 0 1 0 3 2 6
[60,70[ 0 0 0 1 0 1
Total 4 5 5 9 6 29

1) En se servant des distributions marginales de X et de Y, calculer les moyennes et variances


marginales des deux caractères X et Y.
2) Calculer la moyenne et la variance de X si le salaire est compris entre 7000 et 10000 francs.
3) Calculer la moyenne et la variance de Y si l’âge est compris entre 20 et 30 ans.

4. Relations entre les moyennes

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 11


La moyenne marginale est égale à la moyenne conditionnelle, pondérée par les effectifs marginaux
𝑝 𝑝 𝑞 𝑞 𝑝 𝑞
1 1 1 1
𝑥̅ 𝑚 = ∑ 𝑛𝑖. 𝑥𝑖 = ∑ ∑ 𝑛𝑖𝑗 𝑥𝑖 = ∑ ∑ 𝑛𝑖𝑗 𝑥𝑖 = ∑ 𝑛.𝑗 𝑥̅𝑗
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑗=1 𝑗=1 𝑖=1 𝑗=1
𝑝 𝑞 𝑝 𝑝 𝑞 𝑝
1 1 1 1
𝑦̅𝑚 = ∑ 𝑛.𝑗 𝑦𝑗 = ∑ ∑ 𝑛𝑖𝑗 𝑦𝑗 = ∑ ∑ 𝑛𝑖𝑗 𝑦𝑗 = ∑ 𝑛𝑖. 𝑦̅𝑖
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑗=1 𝑖=1 𝑖=1 𝑗=1 𝑖=1
5. Relations entre les variances

La variance marginale est égale la somme de la variance des moyennes conditionnelles et la


moyenne des variances conditionnelles pondérées par les effectifs marginaux.
𝑞
1
𝑆 2 (𝑥̅𝑗 ) = ∑ 𝑛.𝑗 (𝑥̅𝑗 − 𝑥̅ 𝑚 )2
𝑛
𝑗=1
𝑝
1
𝑆 2 (𝑦̅𝑖 ) = ∑ 𝑛𝑖. (𝑦̅𝑖 − 𝑦̅𝑚 )2
{ 𝑛
𝑖=1
La moyenne des variances conditionnelles pondérée par les effectifs marginaux s’écrit :
̅̅̅̅̅̅̅ 1 𝑞
𝑆𝑗2 (𝑥) = 𝑛 ∑𝑗 𝑛.𝑗 𝑆𝑗2 (𝑥)
{ 1 𝑝
̅̅̅̅̅̅̅̅
𝑆𝑖2 (𝑦) = 𝑛 ∑𝑖 𝑛𝑖. 𝑆𝑖2 (𝑦)
Donc la variance marginale de chaque caractère est :
𝑆 2 (𝑥 ) = ̅̅̅̅̅̅̅
𝑆𝑗2 (𝑥) + 𝑆 2 (𝑥̅𝑗 )
{ 2
𝑆 (𝑦) = ̅̅̅̅̅̅̅̅
𝑆𝑖2 (𝑦) + 𝑆 2 (𝑦̅𝑖 )
Démonstration de la variance marginale d’une variable 𝑥
𝑝 𝑞 𝑝 𝑞 𝑝 𝑞
1 1 1
𝑆 2 (𝑥 ) = ∑ ∑ 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̅ )2 = ∑ ∑ 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̅ 𝑖 )2 + ∑ ∑ 𝑛𝑖𝑗 (𝑥̅ 𝑖 − 𝑥̅ )2
𝑛 𝑛 𝑛
𝑖=1 𝑗=1 𝑖=1 𝑗=1 𝑖=1 𝑗=1
𝑞 𝑞
1 1
𝐴𝑙𝑜𝑟𝑠 𝑆 2 (𝑥 ) = ∑ 𝑛.𝑗 𝑆𝑗2 (𝑥 ) + ∑ 𝑛.𝑗 (𝑥̅ 𝑖 − 𝑥̅ )2 = ̅̅̅̅̅̅̅
𝑆𝑗2 (𝑥) + 𝑆 2 (𝑥̅𝑗 )
𝑛 𝑛
𝑗=1 𝑗=1
De même, la variance marginale de 𝑦 est donnée par la formule :
𝑝 𝑝
1 1 2
𝑆 2 (𝑦) = ∑ 𝑛𝑖. 𝑆𝑖2 (𝑦) + ∑ 𝑛𝑖. (𝑦̅𝑗 − 𝑦̅) = ̅̅̅̅̅̅̅̅
𝑆𝑖2 (𝑦) + 𝑆 2 (𝑦̅𝑖 )
𝑛 𝑛
𝑖=1 𝑖=1
V (variances) = variance intra-population + variance inter-population
(within) (between)
La valeur de la variance inter-population influence directement la courbe de la régression.

2.3.2.4 Coefficient de corrélation linéaire et de détermination

4.1 Covariance
La covariance est définie comme suit lorsque 𝑖 = 𝑗:

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 12


𝑛 𝑛
1 1
𝐶𝑜𝑣(𝑥, 𝑦) = 𝑆𝑥𝑦 = ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) = ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ 𝑦̅
𝑛 𝑛
𝑖=1 𝑖=1
 Si 𝑆𝑥𝑦 > 0, la relation entre x et y est croissante
 Si 𝑆𝑥𝑦 < 0, la relation entre x et y est décroissante
 Si 𝑆𝑥𝑦 ≈ 0, il n’ya de relation ni d’association entre x et y. Dans ce cas, une variable n’a
pas d’influence sur l’autre, et vice-versa.
Sinon, pour une variable statistique quantitative Z a deux dimensions, de variables marginales x et
y, on définit la covariance de x et y par l'expression :
𝑝 𝑞
𝐶𝑜𝑣(𝑥, 𝑦) = ∑𝑖=1 ∑𝑗=1 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̅ )(𝑦𝑗 − 𝑦̅) = 𝑥𝑦̅̅̅ − 𝑥̅ 𝑦̅
En particulier
𝑝 𝑞
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑𝑖=1 ∑𝑗=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑗 − 𝑦̅) = 𝑥𝑦̅̅̅ − 𝑥̅ 𝑦̅

𝐶𝑜𝑣(𝑥, 𝑥 ) = ̅̅̅
𝑥 2 − 𝑥̅ 2 𝑒𝑡 𝐶𝑜𝑣 (𝑦, 𝑦) = ̅̅̅
𝑦 2 − 𝑦̅ 2
Propriétés
 𝑐𝑜𝑣(𝑥, 𝑦) = 𝑐𝑜𝑣(𝑦, 𝑥)
 𝑝𝑜𝑢𝑟 𝑎, 𝑏, 𝑐, 𝑑 𝜖ℝ, 𝐶𝑜𝑣 (𝑎𝑥 + 𝑏, 𝑐𝑦 + 𝑑 ) = 𝑎𝑐𝐶𝑜𝑣(𝑥, 𝑦)
 Si 𝑥 𝑒𝑡 𝑦 sont indépendants, alors 𝑐𝑜𝑣(𝑥, 𝑦) = 0, mais la réciproque est fausse, car la
covariance peut être nulle sans que les variables soient indépendantes. lorsque 𝑖 ≠ 𝑗

4.2 Coefficient de corrélation et le coefficient de détermination

Le coefficient de corrélation et le coefficient de détermination sont définis respectivement par :


𝑆 𝑐𝑜𝑣(𝑥,𝑦)
𝑟𝑥𝑦 = 𝑆 𝑥𝑦 = 𝑆𝑆
𝑆𝑥 𝑦 𝑥 𝑦
2
2 𝑆𝑥𝑦 (𝑐𝑜𝑣(𝑥,𝑦)2
𝑒𝑡 𝑟𝑥𝑦 = 𝑆2𝑆2 =
𝑥 𝑦 𝑆𝑥2 𝑆𝑦2
𝑟𝑥𝑦 peut se calculer par la formule :
∑𝑛𝑖=1 𝑥𝑖 ∑𝑛𝑖=1 𝑦𝑖
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 −
𝑟𝑥𝑦 = 𝑛
∑𝑛 2 ∑𝑛 2
√[∑𝑛𝑖=1 𝑥𝑖2 − ( 𝑖=1 𝑥𝑖 ) ][∑𝑛𝑖=1 𝑦𝑖2 − ( 𝑖=1 𝑦𝑖 ) ]
𝑛 𝑛
Remarques
 Le coefficient de détermination joue pour la régression linéaire de y en x, le même rôle que
le rapport de corrélation pour la régression de y en x.
 −1 ≤ 𝑟𝑥𝑦 ≤ 1 𝑒𝑡 2
0 ≤ 𝑟𝑥𝑦 ≤1
 𝑆𝑖 𝑟𝑥𝑦 = 1, 𝑎𝑙𝑜𝑟𝑠 il y a une relation fonctionnelle linéaire entre x et y.
2

 𝑟𝑥𝑦 = ±1 x et y sont liées par une relation linéaire,


 Plus 𝑟𝑥𝑦 est proche de 1 ou de –1, plus la corrélation linéaire est forte.
 Si 𝑟𝑥𝑦 > 0, les points sont alignés le long d’une droite croissante ;
 Si 𝑟𝑥𝑦 < 0, les points sont alignés le long d’une droite décroissante ;
 Si x et y sont indépendants, alors 𝑟𝑥𝑦 = 0. Mais la réciproque est fausse.
 Si 𝑟𝑥𝑦 = 0 ou proche de zéro, n'exclut pas l'existence d'une relation autre que linéaire ; cela
veut dire que la connaissance de x ne donne aucune information sur y. Dans ce cas, les

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 13


droites de régression sont parallèles aux axes. On ne peut pas en conclure leur
indépendance.

4. 3. Valeurs ajustées, Résidus et somme des carrés

Les valeurs ajustées sont les ‘prédictions’ des 𝑦𝑖 réalisées au moyen de la variable 𝑥𝑖 et de la droite
de régression de y en x. Les valeurs ajustées sont obtenues au moyen de la droite de régression.
𝑦𝑖∗ = 𝑎 + 𝑏𝑥𝑖
1 1
Et 𝑦̅ ∗ = 𝑛 ∑𝑛𝑖=1(𝑎 + 𝑏𝑥𝑖 ) = 𝑎 + 𝑏 𝑛 ∑𝑛𝑖=1 𝑥𝑖 = 𝑎 + 𝑏𝑥̅ = 𝑦̅

Par conséquent les couples(𝑥̅ , 𝑦̅) 𝑒𝑡 (𝑥̅ , 𝑦̅ ∗ ) appartiennent à la droite de la régression.


Comme 𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 + 𝜀𝑖 alors
Les résidus sont les différences entre les valeurs observées et les valeurs ajustées de la variable
dépendante, représentent la partie inexpliquée des 𝑦𝑖 par la droite de régression
εi = yi − yi∗
𝑛 𝑛
1 1
𝐿𝑎 𝑚𝑜𝑦𝑒𝑛𝑛𝑒 𝜀̅ = ∑ 𝜀𝑖 = ∑(𝑦𝑖 − 𝑦𝑖∗ ) = 𝑦̅ − 𝑦̅ = 0
𝑛 𝑛
𝑖= 𝑖=1
On appelle somme des carrés totale la quantité

𝑆𝑐
⏟ 𝑡𝑜𝑡𝑎𝑙𝑒 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 = ∑𝑛 ∗
⏟𝑖=1(𝑦𝑖 − 𝑦̅)2 + ∑𝑛 2
⏟𝑖=1 𝜀𝑖
𝑆𝑜𝑚𝑚𝑒 𝑑𝑒𝑠 𝑐𝑎𝑟𝑟𝑒𝑠 𝑆𝑜𝑚𝑚𝑒 𝑑𝑒𝑠 𝑐𝑎𝑟𝑟𝑒𝑠 𝑠𝑜𝑚𝑚𝑒 𝑑𝑒𝑠 𝑐𝑎𝑟𝑟𝑒𝑠
𝑡𝑜𝑡𝑎𝑙𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑠𝑖𝑜𝑛 𝑑𝑒𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑠

2.3.2.5 Courbes de régressions

Les couples (𝑥𝑖 , 𝑦𝑖 ) peuvent être proches :

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 14


b. D’une droite affine 𝑦 = 𝑎𝑥 + 𝑏, de relation positive ou négative

1
b. Hyperbole de la forme 𝑦 = 𝑎𝑥+𝑏 c. Courbe de fonction puissance : 𝑦 = 𝑏𝑥 𝑎

d. Courbe d’une exponentielle 𝑦 = 𝑏𝑎 𝑥 e. Courbe logarithmique de la forme 𝑦 = 𝑎𝑙𝑛𝑥 + 𝑏

2.3.2.6 Droite de régression

6.1 Régression

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 15


Dans le domaine de la régression, la connaissance d'une modalité de la variable X peut nous
apporter une information supplémentaire sur les modalités de la variable y. Dans un tel cas, on
dit que x est la variable explicative et y la variable expliquée.

Intérêt : expliquer ou / et prévoir y a partir de x.

La droite de régression est la droite qui ajuste au mieux un nuage de points au sens des moindres
carrés. Si on considère que la variable X est explicative ou indépendante et que la variable Y est
dépendante. L’équation d’une droite est :
𝑦 = 𝑎 + 𝑏𝑥 ou encore 𝑦𝑖 = 𝑎 + 𝑏𝑥𝑖 + 𝜀𝑖
Si les coefficients a et b étaient connus, on pourrait calculer les résidus, définis par:
𝜀𝑖 = 𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖
Le résidu 𝜀𝑖 est l’erreur que l’on commet en utilisant la droite de régression pour prédire 𝑦𝑖 à partir
de 𝑥𝑖 . Les résidus peuvent être positifs ou négatifs.

6.2 Méthodes des moindres carrés

La courbe de régression de 𝑦 𝑒𝑛 𝑥 joint les points de coordonnées (𝑥𝑖 , 𝑦̅𝑖 )𝑝𝑜𝑢𝑟 𝑖 ∈ [1, 𝑝]. Pour
déterminer la valeur des coefficients a et b on utilise le principe des moindres carrés qui consiste
à chercher la droite qui minimise la somme des carrés des résidus:
𝑀(𝑎, 𝑏) = ∑𝑛𝑖=1 𝜀𝑖2 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )2
On utilise alors la dérivation partielle de la fonction M en (a, b) :
𝑛
𝜕𝑀(𝑎, 𝑏)
= − ∑ 2(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 ) = 0
𝜕𝑎
𝑖=1
𝑛
𝜕𝑀(𝑎, 𝑏)
= − ∑ 2(𝑦𝑖 − 𝑎 − 𝑏𝑥𝑖 )𝑥𝑖 = 0
{ 𝜕𝑏
𝑖=1
𝑛 𝑛 𝑛
1 1 𝑏
∑ 𝑦𝑖 − ∑ 𝑎 − ∑ 𝑥𝑖 = 0 𝑦̅ − 𝑎 − 𝑏𝑥̅ = 0
𝑛 𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1
𝑛 𝑛 𝑛 → {1 𝑏
1 𝑎 𝑏 ∑ 𝑥𝑖 𝑦𝑖 − 𝑎𝑥̅ − ∑ 𝑥𝑖2 = 0
∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 − ∑ 𝑥𝑖2 = 0 𝑛 𝑛
𝑖=1 𝑖=1
{𝑛 𝑖=1 𝑛
𝑖=1
𝑛
𝑖=1
𝑎 = 𝑦̅ − 𝑏𝑥̅
𝑛 𝑛
{1 𝑏
∑ 𝑥𝑖 𝑦𝑖 − (𝑦̅ − 𝑏𝑥̅ )𝑥̅ − ∑ 𝑥𝑖2 = 0
𝑛 𝑛
𝑖=1 𝑖=1
𝑎 = 𝑦̅ − 𝑏𝑥̅
{1 𝑏
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑥̅ 𝑦̅ + 𝑏𝑥̅ 2 − ∑𝑛𝑖=1 𝑥𝑖2 = 0
𝑛 𝑛
𝑎 = 𝑦̅ − 𝑏𝑥̅
{1 1
∑𝑛 𝑥 𝑦 − 𝑥̅ 𝑦̅ − 𝑏( ∑𝑛𝑖=1 𝑥𝑖2 − 𝑥̅ 2 ) = 0
𝑛 𝑖=1 𝑖 𝑖 𝑛
𝑎 = 𝑦̅ − 𝑏𝑥̅ 𝑎 = 𝑦̅ − 𝑏𝑥̅
{ ↔ { 𝑆
𝑆𝑥𝑦 − 𝑏𝑆𝑥2 = 0 𝑏 = 𝑆𝑥𝑦2
𝑥

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 16


𝑆𝑥𝑦
𝑏= (𝑙𝑎 𝑝𝑒𝑛𝑡𝑒 𝑜𝑢 𝑐𝑜𝑒𝑓𝑓𝑖𝑐𝑖𝑒𝑛𝑡 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑠𝑖𝑜𝑛 𝑑𝑒 𝑦 𝑒𝑛 𝑥)
𝑆𝑥2
Par conséquent, la droite de régression est donc
𝑦 = 𝑎 + 𝑏𝑥 = 𝑦̅ − 𝑏𝑥̅ + 𝑏𝑥 = 𝑦̅ + 𝑏(𝑥 − 𝑥̅ )
𝑦 = 𝑦̅ + 𝑏(𝑥 − 𝑥̅ )
Ce qui peut s’écrire aussi
𝑆
𝑦 − 𝑦̅ = 𝑏(𝑥 − 𝑥̅ ) = 𝑆𝑥𝑦2 (𝑥 − 𝑥̅ )
𝑥
La relation 𝑦̅ = 𝑎 + 𝑏𝑥̅ montre que la droite ajustée par la méthode des moindres carrés ordinaires
passe par ce point moyen(𝑥, ̅ 𝑦̅).
Si X est une variable discrète, la courbe de régression est une succession de points (𝑥𝑖 , 𝑦̅𝑖 ).
Si X est une variable continue, la courbe de régression sera formée de segments de droite joignant
les points (𝑥𝑖 , 𝑦̅𝑖 ), où les xi représentent les centres des classes.

Remarque :
 La droite de régression de 𝑦 en 𝑥 est différente la droite de régression de 𝑥 en 𝑦 .
𝑆𝑥𝑦
𝐷𝑌/𝑋 : 𝑦 = 𝑎 + 𝑏𝑥 𝑎𝑣𝑒𝑐 𝑏 = 2 𝑒𝑡 𝑎 = 𝑦̅ − 𝑏𝑥̅
𝑆𝑥
𝑆𝑥𝑦
𝐷𝑋/𝑌 : 𝑥 = 𝑎′ + 𝑏′ 𝑦 𝑎𝑣𝑒𝑐 𝑏′ = 2 𝑒𝑡 𝑎′ = 𝑥̅ − 𝑏′ 𝑦̅
{ 𝑆𝑦
 Lorsque la covariance est non nulle, les deux droites de la régression sont confondues,
𝑐𝑜𝑣(𝑥, 𝑦) 𝜎𝑦2 𝑐𝑜𝑣 2 (𝑥, 𝑦)
= → =1
𝜎𝑥2 𝑐𝑜𝑣(𝑥, 𝑦) 𝜎𝑥2 𝜎𝑦2
2.3.2.7 Relation entre variance et coefficient de détermination
 La variance marginale peut alors être définie par :
𝑛
𝑆𝑇 1
𝑆𝑦2 = = ∑(𝑦𝑖 − 𝑦̅)2
𝑛 𝑛
𝑖=1
 La variance de la régression est la variance des valeurs ajustées
𝑛
1
𝑆𝑦2∗ = ∑(𝑦𝑖∗ − 𝑦̅)2
𝑛
𝑖=1
 La variance résiduelle est la variance des résidus
𝑛
1
𝑆𝜖2 = ∑ 𝜀𝑖2
𝑛
𝑖=1
 La variance de la régression peut s’écrire en fonction de coefficient de détermination
𝑛 𝑛 2 2 𝑛
2 2
1 1 𝑆𝑥𝑦 𝑆𝑥𝑦 1 𝑆𝑥𝑦 𝑆𝑥
𝑆𝑦2∗ ∗
= ∑(𝑦𝑖 − 𝑦̅) = ∑ {𝑦̅ + 2 (𝑥𝑖 − 𝑥̅ ) − 𝑦̅} = 4 ∑(𝑥𝑖 − 𝑥̅ )2 =
2
4
= 𝑆𝑦2 𝑟𝑥𝑦
2
𝑛 𝑛 𝑆𝑥 𝑆𝑥 𝑛 𝑆𝑥
𝑖=1 𝑖=1 𝑖=1
𝑆𝑦2∗ = 𝑆𝑦2 𝑟𝑥𝑦
2

 La variance résiduelle peut s’écrire en fonction de coefficient de détermination

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 17


𝑛
1
𝑆𝜖2 = ∑ 𝜀𝑖2 = (1 − 𝑟𝑥𝑦
2 )𝑆 2
𝑦
𝑛
𝑖=1
La variance marginale est aussi la somme de la variance de la régression et la variance résiduelle
𝑆𝑦2 = 𝑆𝑦2∗ + 𝑆𝜀2
Plus la variance résiduelle est faible et moins le nuage de points est dispersé autour du prédicateur,
donc meilleur est le prédicateur.

Exercice (A domicile)

Considérons un échantillon de 10 fonctionnaires (ayant entre 40 et 50 ans) d’un ministère. Soit X


le nombre d’années de service et Y le nombre de jours d’absence pour raison de maladie (au cours
de l’année précédente) détermine pour chaque personne appartenant ` à cet échantillon.

𝑥𝑖 2 14 16 8 13 20 24 7 5 11
𝑦𝑖 3 13 17 12 10 8 20 7 2 8

1. Représentez le nuage de points.


2. Calculez le coefficient de corrélation entre X et Y. Puis donner une interprétation de ce
coefficient.
3. Déterminez l’équation de la droite de régression de Y en fonction de X.
4. Calculez la variance résiduelle et le coefficient de détermination.
5. Etablissez, sur base de ce modèle, le nombre de jours d’absence pour un fonctionnaire ayant 22
ans de service.

FACULTE DES SCIENCES ECONOMIQUES ET DE GESTION (FSEG) / Bamako/ Mali Page 18

Vous aimerez peut-être aussi