Vous êtes sur la page 1sur 11

STATISTIQUE ET MATHÉMATIQUES FINANCIÈRES

Fascicule de Statistique #3 :
Ajustements linéaires

Année académique 2022-2023


Le contenu théorique et les exercices proposés dans ce fascicule sont repris du manuel co-
rédigé par A. Gilbert et C. Malcorps., Notions de Statistique, Ed. E. Havrenne, Edition 2017.
Nous entamons ici l’étude des données liées (= statistique évolutive), c’est-à-dire l’étude
des couples de nombres (xi, yi) qui présentent une certaine liaison.

L’objectif est d’étudier l’éventuelle relation linéaire qui peut exister entre deux variables, x
et y.
x est appelée variable explicative
y est appelée la variable expliquée

Deux techniques d’ajustements linéaires vont être abordées.

 Ajustements graphiques
 Ajustements par les moindres carrés

Toutes deux permettent la détermination de l’équation d’une droite de type y = ax + b


passant au mieux par les couples observés (xi, yi).

L’exemple que nous allons utiliser pour travailler les techniques d’ajustements linéaires est
celui du nombre de vols commis dans 7 succursales d’une chaine de magasins de taille
semblable en fonction du nombre d’agents de sécurité :

Nombre de vols Nombre d’agents de sécurité


3 30
4 28
2 35
8 13
10 10
7 15
5 25

L’objectif est de trouver l’équation de la droite y = ax + b qui décrit au mieux la relation entre
xi et yi. a et b sont des constantes.

Dans cet exemple, la variable explicative est le nombre d’agents de sécurité, et la variable
expliquée est le nombre de vols commis.

1. Ajustement graphique

1) Reporter les couples de points du tableau sur un graphique. La variable explicative se


place sur l’axe des abscisses, tandis que la variable expliquée se place sur l’axe des
ordonnées.
2) Tracer « à la main » la droite qui passe au mieux à travers le nuage de points.
Intuitivement, la meilleure droite est celle qui minimise les écarts entre les différents
points du nuage et la droite elle-même.

UE Statistique et Mathématiques Financières 1 1C / 2022-2023


3) Choisir 2 couples de points au hasard sur la droite (x1, y1) et (x2, y2). Il est plus facile
de choisir ces deux couples aux extrémités de la droite.
Sur le graphique ci-dessus, les deux points choisis aux extrémités ont les coordonnées
suivantes : 𝑥 = 0; 𝑦 = 39; 𝑥 = 12; 𝑦 = 1

4) Calculer l’équation y = ax + b, à l’aide de la formule suivante :


𝑦 −𝑦
𝑦−𝑦 = (𝑥 − 𝑥 )
𝑥 −𝑥

1 − 39
𝑦 − 39 = (𝑥 − 0)
12 − 0

𝑦 = −3.17𝑥 + 39 où a = -3.17 et b = 39

On obtient donc de manière manuelle une équation qui décrit la relation qu’il existe entre
les deux variables, le nombre de vols et le nombre d’agents de sécurité.

Grâce à cette droite, on peut répondre à de nombreuses questions, telles que :


- Quel serait le nombre de vols s’il y avait 6, 9 ou 11 agents de sécurité ?
- Quel devrait être le nombre d’agents de sécurité à prévoir si l’on souhaite n’avoir
que 1 vol dans le magasin ?

L’ajustement graphique est une technique « manuelle », elle ne permet pas d’obtenir une
équation identique chez tout le monde. Les différentes équations obtenues seront
similaires, mais probablement pas identiques.

UE Statistique et Mathématiques Financières 2 1C / 2022-2023


2. Ajustement par les Moindres carrés

Comme pour l’ajustement graphique, nous recherchons l’équation d’une droite


d’ajustement. Mais cette fois, nous allons remplacer l’a priori visuel par une méthode
analytique pour calculer, de façon rationnelle et non plus subjective, l’équation de la droite
qui passe « au mieux » par le nuage de points. Cette méthode analytique remplit une double
condition :

- La condition de Mayer qui exige que les n écarts observés se compensent les uns les
autres. Cela revient à exiger que la droite d’ajustement passe par le point moyen
(𝑥̅ , 𝑦).
𝑥̅ est la moyenne de toutes les valeurs prises par la variable x
_ 1
𝑥= 𝑥
𝑛
𝑦 est la moyenne de toutes les valeurs prises par la variable y.
_ 1
𝑦= 𝑦
𝑛
Or, il y a une infinité de droites qui passent par un point.

- La condition des Moindres Carrés qui exige que la somme des carrés des n écarts soit
rendue minimum

2.1 Ajustement par le biais du tableau des Moindres Carrés

Nous ne rentrerons pas dans les détails mathématiques ici.

Lorsque les 2 conditions sont réunies, on obtient les formules suivantes pour l’obtention des
constantes a et b :

∑ 𝑋 𝑌
𝑎= 𝑎𝑣𝑒𝑐 𝑋 = 𝑥 − 𝑥 𝑒𝑡 𝑌 = 𝑦 − 𝑦
∑ 𝑋

𝑏 = 𝑦 − 𝑎𝑥̅

L’application de ces formules à notre exemple donne le tableau suivant :

UE Statistique et Mathématiques Financières 3 1C / 2022-2023


xi yi Xi Yi XiYi X2
3 30 -2,57 7,71 -19,81 6,60
4 28 -1,57 5,71 -8,96 2,46
2 35 -3,57 12,71 -45,37 12,74
8 13 2,43 -9,29 -22,57 5,90
10 10 4,43 -12,29 -54,44 19,62
7 15 1,43 -7,29 -10,42 2,04
5 25 -0,57 2,71 1,54 0,32
Σ = 39 Σ = 156
Σ = -163,11 Σ = 49,68
𝑥̅ = 5,57 𝑦 = 22,29

Il permet ensuite de trouver les valeurs des constantes a et b :

−163,11
𝑎= = 3,28
49,68

𝑏 = 22,29 + (3,28 ∗ 5,57) = 40,56

La droite d’ajustement a donc pour équation :

y = -3,28 x + 40,56

Il est intéressant de comparer cette dernière équation avec celle obtenue par la méthode
graphique. Elles diffèrent certes, mais ne sont pas fondamentalement différentes.

Voici quelques remarques sur l’interprétation des valeurs des constances.


a = -3,28
A chaque augmentation d’un agent de sécurité supplémentaire, on observe une
diminution de 3,28 vols.
Cette valeur correspond à la pente de la droite sur le graphique.
b = 40,56
Lorsqu’il n’y a aucun agent de sécurité (x = 0), on constate, 40,56 vols.

2.2 Ajustement par le biais de la calculatrice

L’utilisation du menu Statistique de votre calculatrice permet d’obtenir l’équation de la


droite de manière très rapide. Il suffit d’encoder les valeurs la variable explicative x et les
valeurs de la variable expliquée y, et de choisir l’option Calcul de la Régression. Cette
manipulation est légèrement différente d’une calculatrice à l’autre.

a = -3,28
b = 40,56
r = -0,99

UE Statistique et Mathématiques Financières 4 1C / 2022-2023


2.3 Corrélation

La corrélation entre deux variables est la mesure de l’intensité de la relation entre ces deux
variables. Le coefficient de corrélation quantifie la force de la relation linéaire entre deux
variables. Le coefficient de corrélation, noté r, est une valeur comprise entre -1 et 1.

– Si r = 1 => corrélation parfaite


– Si r = -1 => corrélation inverse parfaite
– Si r = 0 => corrélation nulle (les 2 variables sont indépendants
ou la relation entre elles est non linéaire)

- Les valeurs positives de r indiquent une corrélation positive : lorsque les valeurs
d'une variable augmentent, les valeurs de l'autre variable augmentent également. Et
inversement.
- Les valeurs négatives de r indiquent une corrélation négative : lorsque les valeurs
d'une variable augmentent, les valeurs de l'autre variable diminuent. Et
inversement.
- Les valeurs 1 et -1 représentent chacune les corrélations « parfaites », positive et
négative respectivement. Deux variables présentant une corrélation parfaite
évoluent ensemble à une vitesse fixe. On dit que la relation est linéaire ; reportés
dans un nuage de points, tous les points des données peuvent être reliés par une
ligne droite.

r n’implique pas toujours une relation de causalité. Par exemple, les ventes de glaces et les
ventes de lunettes de soleil (la corrélation entre les deux ne provient pas du fait que les

UE Statistique et Mathématiques Financières 5 1C / 2022-2023


crèmes glacées font mal aux yeux…). Il faut donc toujours rester prudent et réaliste dans
l’interprétation du coefficient de corrélation.

Dans notre exemple, le coefficient de corrélation r = 0,99. Cela signifie donc que la relation
entre les deux variables est très forte. Lorsque la variable explicative augmente, la variable
expliquée augmente également. On est très proche des valeurs données par la droite
d’ajustement linéaire.

UE Statistique et Mathématiques Financières 6 1C / 2022-2023


Exercice 1
Voici le chiffre d’affaires réalisé par une société en fonction de différents niveaux de budgets
de communication (données en millions d’euros).

CA Budget communication
220 35
295 60
190 20
210 30
240 35
240 45
270 50

Voici également les répartitions des différents budgets en publicité, relations publiques et
promotion.

Budget relations
CA Budget publicité Budget promotion
publiques
220 15 5 15
295 40 7 13
190 10 5 5
210 20 5 5
240 25 5 5
240 25 5 15
270 27 7 16

1) Réalisez l’ajustement linéaire par méthode graphique pour les couples de données :
chiffre d’affaires et budgets de communication. Calculez l’équation de la droite
d’ajustement.
2) Réalisez l’ajustement linéaire par la méthode des moindres carrés et calculez la
corrélation pour les couples de données suivantes :
- CA / budget communication
- CA / budget publicité
- CA / budget relations publiques
- CA / budget promotion
3) Représentez graphiquement les ajustements réalisés en 2 (CA en ordonnée).
4) Commentez l’ensemble des résultats.

UE Statistique et Mathématiques Financières 7 1C / 2022-2023


Exercice 2
L’entreprise TECHNO a réalisé une forte croissance ces dernières années. Voici un relevé de
son chiffre d’affaires et du nombre d’employés dans l’entreprise à différents stades de son
développement :

Nombre d’employés Chiffre d’affaires


10 112.500 €
12 127.500 €
14 131.200 €
16 137.300 €
18 140.500 €
20 141.900 €
25 146.350 €

1) Représentez graphiquement ces points.


2) A l’aide de votre calculatrice, donnez l’équation de la droite d’ajustement linéaire
selon la méthode des moindres carrés. Représentez cette droite sur le graphique
réalisé en 1) et interprétez la pente.
3) Estimez :
 Le chiffre d’affaires de l’entreprise s’il y avait 30 employés
 A partir de quel nombre d’employés devrait-on dépasser le chiffre
d’affaires de 200.000 € ?
4) Calculez la corrélation et interprétez. Cela correspond-il à ce que vous observez
graphiquement ?

Exercice 3
Un hypermarché dispose de 20 caisses. Le tableau ci-dessous donne le temps moyen
d'attente à une caisse en fonction du nombre de caisses ouvertes :

Nombre de caisses ouvertes 3 4 5 6 8 10 12 15

Temps moyen d’attente (en minutes) 16 14,2 11 9,6 7,9 6 4,7 4

1) Représentez le nuage de points correspondant à cette série statistique.


2) Déterminez l’équation de la droite par la méthode des moindres carrés et tracez la
droite D sur ce même graphique (marquez les points utilisés pour tracer D)

UE Statistique et Mathématiques Financières 8 1C / 2022-2023


3) Calculez le coefficient de corrélation linéaire r et interprétez-le.
4) Estimez le nombre de caisses à ouvrir pour que le temps moyen d'attente à une
caisse soit de 7 minutes.
5) Calculez le temps moyen d'attente à la caisse lorsque 14 caisses sont ouvertes.

Exercice 4
Le tableau suivant donne, pour un échantillon de 10 garçons de 18 ans prélevé dans la
population d’une école secondaire, les tailles respectives (exprimées en cm), aux âges de 2
ans et de 20 ans.

Taille à 2 ans Taille à 20 ans


(cm) (cm)
82,0 163,9
82,4 165,2
83,0 166,3
84,0 169,6
86,0 172,0
87,0 174,9
88,6 177,6
90,0 179,8
92,5 186,2
93,0 187,0

1) Réalisez l’ajustement linéaire par la méthode des moindres carrés


2) Calculez le coefficient de corrélation entre la taille à 2 ans et celle à 20 ans. Que
pouvez- vous conclure ?
3) Si la taille à 2 ans est de 85,5 cm, quelle est l’estimation de la taille à 20 ans ?
4) Quelle taille un garçon de 20 ans mesurant 180 cm pouvait-il avoir à 2 ans ?

UE Statistique et Mathématiques Financières 9 1C / 2022-2023

Vous aimerez peut-être aussi