Académique Documents
Professionnel Documents
Culture Documents
Fascicule de Statistique #3 :
Ajustements linéaires
L’objectif est d’étudier l’éventuelle relation linéaire qui peut exister entre deux variables, x
et y.
x est appelée variable explicative
y est appelée la variable expliquée
Ajustements graphiques
Ajustements par les moindres carrés
L’exemple que nous allons utiliser pour travailler les techniques d’ajustements linéaires est
celui du nombre de vols commis dans 7 succursales d’une chaine de magasins de taille
semblable en fonction du nombre d’agents de sécurité :
L’objectif est de trouver l’équation de la droite y = ax + b qui décrit au mieux la relation entre
xi et yi. a et b sont des constantes.
Dans cet exemple, la variable explicative est le nombre d’agents de sécurité, et la variable
expliquée est le nombre de vols commis.
1. Ajustement graphique
1 − 39
𝑦 − 39 = (𝑥 − 0)
12 − 0
𝑦 = −3.17𝑥 + 39 où a = -3.17 et b = 39
On obtient donc de manière manuelle une équation qui décrit la relation qu’il existe entre
les deux variables, le nombre de vols et le nombre d’agents de sécurité.
L’ajustement graphique est une technique « manuelle », elle ne permet pas d’obtenir une
équation identique chez tout le monde. Les différentes équations obtenues seront
similaires, mais probablement pas identiques.
- La condition de Mayer qui exige que les n écarts observés se compensent les uns les
autres. Cela revient à exiger que la droite d’ajustement passe par le point moyen
(𝑥̅ , 𝑦).
𝑥̅ est la moyenne de toutes les valeurs prises par la variable x
_ 1
𝑥= 𝑥
𝑛
𝑦 est la moyenne de toutes les valeurs prises par la variable y.
_ 1
𝑦= 𝑦
𝑛
Or, il y a une infinité de droites qui passent par un point.
- La condition des Moindres Carrés qui exige que la somme des carrés des n écarts soit
rendue minimum
Lorsque les 2 conditions sont réunies, on obtient les formules suivantes pour l’obtention des
constantes a et b :
∑ 𝑋 𝑌
𝑎= 𝑎𝑣𝑒𝑐 𝑋 = 𝑥 − 𝑥 𝑒𝑡 𝑌 = 𝑦 − 𝑦
∑ 𝑋
𝑏 = 𝑦 − 𝑎𝑥̅
−163,11
𝑎= = 3,28
49,68
y = -3,28 x + 40,56
Il est intéressant de comparer cette dernière équation avec celle obtenue par la méthode
graphique. Elles diffèrent certes, mais ne sont pas fondamentalement différentes.
a = -3,28
b = 40,56
r = -0,99
La corrélation entre deux variables est la mesure de l’intensité de la relation entre ces deux
variables. Le coefficient de corrélation quantifie la force de la relation linéaire entre deux
variables. Le coefficient de corrélation, noté r, est une valeur comprise entre -1 et 1.
- Les valeurs positives de r indiquent une corrélation positive : lorsque les valeurs
d'une variable augmentent, les valeurs de l'autre variable augmentent également. Et
inversement.
- Les valeurs négatives de r indiquent une corrélation négative : lorsque les valeurs
d'une variable augmentent, les valeurs de l'autre variable diminuent. Et
inversement.
- Les valeurs 1 et -1 représentent chacune les corrélations « parfaites », positive et
négative respectivement. Deux variables présentant une corrélation parfaite
évoluent ensemble à une vitesse fixe. On dit que la relation est linéaire ; reportés
dans un nuage de points, tous les points des données peuvent être reliés par une
ligne droite.
r n’implique pas toujours une relation de causalité. Par exemple, les ventes de glaces et les
ventes de lunettes de soleil (la corrélation entre les deux ne provient pas du fait que les
Dans notre exemple, le coefficient de corrélation r = 0,99. Cela signifie donc que la relation
entre les deux variables est très forte. Lorsque la variable explicative augmente, la variable
expliquée augmente également. On est très proche des valeurs données par la droite
d’ajustement linéaire.
CA Budget communication
220 35
295 60
190 20
210 30
240 35
240 45
270 50
Voici également les répartitions des différents budgets en publicité, relations publiques et
promotion.
Budget relations
CA Budget publicité Budget promotion
publiques
220 15 5 15
295 40 7 13
190 10 5 5
210 20 5 5
240 25 5 5
240 25 5 15
270 27 7 16
1) Réalisez l’ajustement linéaire par méthode graphique pour les couples de données :
chiffre d’affaires et budgets de communication. Calculez l’équation de la droite
d’ajustement.
2) Réalisez l’ajustement linéaire par la méthode des moindres carrés et calculez la
corrélation pour les couples de données suivantes :
- CA / budget communication
- CA / budget publicité
- CA / budget relations publiques
- CA / budget promotion
3) Représentez graphiquement les ajustements réalisés en 2 (CA en ordonnée).
4) Commentez l’ensemble des résultats.
Exercice 3
Un hypermarché dispose de 20 caisses. Le tableau ci-dessous donne le temps moyen
d'attente à une caisse en fonction du nombre de caisses ouvertes :
Exercice 4
Le tableau suivant donne, pour un échantillon de 10 garçons de 18 ans prélevé dans la
population d’une école secondaire, les tailles respectives (exprimées en cm), aux âges de 2
ans et de 20 ans.