Académique Documents
Professionnel Documents
Culture Documents
Ali BERRICHI,
aberrichi@umbb.dz, ali.berrichi@gmail.com
Département d’informatique, Faculté des Sciences, UMBBoumerdes.
Présentation
1. Le programme
2. Quelques Références et sites web
- Data Mining et Statistique Décisionnelle, Éditions Technip,
2005, 3ème édition 2010.
- Data Mining: Concepts and Techniques, Jiawei Han
Micheline Kamber, 2006.
•http://www-users.cs.umn.edu/~kumar/
•http://www.lifl.fr/~talbi/Cours-Data-Mining.pdf
•http://www.kdnuggets.com/
•http://data.mining.free.fr/
[2]
Chapitre 3.
La régression linéaire simple
(Suite)
Ali BERRICHI, Département d’informatique, Faculté des Sciences, UMBBoumerdes, aberrichi@umbb.dz, ali.berrichi@gmail.com
3
.
2. Qualité de la représentation (de la régression)
Plusieurs tests : deux questions
1. Dans quelle mesure le phénomène est-il bien représenté par la droite qui vient d’être
définie ?
2. Dans quelle mesure peut-on faire confiance aux valeurs des coefficients et au modèle ?
PROPRIETE :
6
R=0,
2. Qualité de la représentation (de la régression)
Remarque importante:
Une valeur de R faible en terme absolu caractérise une
absence de relation linéaire entre X et Y, mais pas
nécessairement l’absence de liaison entre les variables.
R=0,
R=0,
7
2. Qualité de la représentation (de la régression)
:
2.2 Aspects inférentiels de la régression simple
b) Distribution des estimateurs des moindres carrés et
Rappelons que :
8
2.2 Aspects inférentiels de la régression simple
E ( ˆ1 ) 1
: ˆ ) 2
Var (
1
2
Xi X
E ( ˆ0 ) 0
:
ˆ . X i
2 2
Var ( 0 ) 2
n. X i X
9
2.2 Aspects inférentiels de la régression simple
.
c) Estimation de l’écart-type du terme résiduel
. Si les vraies valeurs de 0 et 1 sont connues alors la meilleure
estimation de 2 est:
10
2.2 Aspects inférentiels de la régression simple
.
c) Intervalle de confiance de 0 et 1
L’écart-type de ˆ1 est estimé par :
2
X i X
ˆ ˆ
S ( 1 )
iX X 2
2
ˆ X
Et celui de 0 . i
2 par:
n.X i X
2
Xi X2
S 0 ˆ .
1
ˆ .
n. X i X Xi X
2 2
n.
11
2.2 Aspects inférentiels de la régression simple
.
- L’intervalle de confiance de ˆ1 au niveau 1 est donné par :
Pour l’exemple, on a :
12
2.2 Aspects inférentiels de la régression simple
.
- L’intervalle de confiance de ˆ0 au niveau 1 est donné par :
Pour l’exemple, on a :
IC ( 0 ) 15,87 22,12
Interprétation : Il y a ainsi 99% de chances que la vraie valeur de ˆ0
(de notre exemple) soit comprise dans l’intervalle :
IC ( 0 ) 15,87 22,12
13
2.2 Aspects inférentiels de la régression simple
.
2.12*20+19=61400
Mais,
- Le modèle a été construit à partir d’un échantillon .
- et il existe un certain aléa sur les relations entre X et Y.
- Donc : La prévision de Y doit s’accompagner d’un intervalle de
confiance.
14
2.2 Aspects inférentiels de la régression simple
.
Pour X 20 et 0.01 :
16
3. Ajustements non linéaires
.
a) La fonction exponentielle:
Fréquemment utilisée dans l’analyse de l’évolution d’une
variable Y dans le temps X.
f(x)
a>1
0<a<1
17
3. Ajustements non linéaires
a) La fonction exponentielle:
-Le calcul des paramètres k et a nécessite les étapes suivantes :
, avec
18
,
3. Ajustements non linéaires