Académique Documents
Professionnel Documents
Culture Documents
Ali BERRICHI,
ali.berrichi@univ-boumerdes.dz, ali.berrichi@gmail.com
Département d’informatique, Faculté des Sciences, UMBBoumerdes.
Chapitre 3.
La régression linéaire simple
Ali BERRICHI, Département d’informatique, Faculté des Sciences, UMBBoumerdes, ali.berrichi@univ-boumerdes.dz, ali.berrichi@gmail.com
2
La régression linéaire : Introduction
• Régression linéaire : méthode prédictive
• Les données
x1 x2 … xi … xp Y
1
2
.
i xij
.
n
?
5
R.L.Simple
Observations:
le nuage de points est
approximativement
assimilable à une droite
appelée droite de
régression.
Hypothèses :
7
Le problème ?
- Estimer les paramètres 0 et 1à partir de l’échantillon, donc,
- déterminer la droite qui ajuste au mieux les données.
- Les paramètres de cette droite ˆ0 et ˆ1 sont alors les
estimations de 0 et 1 .
L’estimation de la droite de régression est donc :
Yˆ ˆ0 ˆ1. X Ou bien : Yˆi ˆ0 ˆ1. X i , i 1,.., n.
-Les Yˆi sont appelés les valeurs estimées. Elles nous permettent:
- d’estimer les quantités inobservables : i Yi 0 1. X
par les quantités observables: ei Yˆi ˆ0 ˆ1. X
ei Yi Yˆi résidus
8
2. La méthode des moindres carrés
La meilleure droite ? ??
?
Yˆ ˆ0 ˆ1. Xˆ
Yi
Yˆi
ei Yi Yˆ
Xi
10
2. La méthode des moindres carrés
- La valeur globale de ces écarts est mesurée par la somme des carrés
des différences entre les valeurs observées et les valeurs estimées.
11
Les paramètres optimaux de la droite de régression
sont donc :
1
x .Y nx.Y
i i
Cov( X , Y )
x x
2
i
Var ( X )
12
- Exemple de la force de vente
Interprétation :
1. En l’absence de visite (X = 0), le montant des commandes d’un
département s’élèverait à 19000.
2. Chacun visite d’un représentant amène une masse de commandes
supplémentaires d’environ 21200 Da.
13
.
3. Qualité de la représentation (de la régression)
Plusieurs tests : deux questions
1. Dans quelle mesure le phénomène est-il bien représenté par la droite qui vient d’être
définie ?
2. Dans quelle mesure peut-on faire confiance aux valeurs des coefficients et au modèle ?
PROPRIETE :
16
R=0,
3. Qualité de la représentation (de la régression)
Remarque importante:
Une valeur de R faible en terme absolu caractérise une
absence de relation linéaire entre X et Y, mais pas
nécessairement l’absence de liaison entre les variables.
R=0,
R=0,
17