Académique Documents
Professionnel Documents
Culture Documents
R.Jahidi
Dfinition
Prvision:Estimationdelvolutionfuture dunevariablelaquelleonsintresse d i bl l ll i t Sebasesurdesdonnesdelentreprise,deses partenaires,desconsommateurs,etde plusieursorganismesquidiffusent l information linformation
R.Jahidi
Utilit
Permetderduirelincertitudepourprendre desdcisionsetplanifier:
gestiondelaproduction,investissements, recrutements,.. , laborationdebudgets commandesdematirespremires p gestiondescommandesdesclients
R.Jahidi
Techniques
Techniquescausales Techniquesextrapolatives
R.Jahidi
Techniquescausales
Dveloppentunerelationdecauseeffetentrela variableexpliqueretlesautresvariables Adaptespourlaprvisionmoyenlongterme (MLT) Rgression:trouverlalignequipouselemieuxles l l l l observationspasses(Sommedescartsaucarr minimale).Leprolongementdelalignepermetla minimale) Leprolongementdelalignepermetla prvision.
R.Jahidi
Techniquesextrapolatives
Observationssuruneseulevariable Lepassestutilispourprvoirlefuturcourt terme(CT) t (CT) Lesobservationspassessontdcomposes enunniveaumoyen,unfacteursaisonnieret unfacteuralatoire
R.Jahidi
Niveaudeprcision?
Lutilitpremiredelaprvision:rductionde l incertitude lincertitude Lescotsdelaprvisionsdpendentdu niveaudeprcisionrecherch,etdoncdes d h h d d techniquesutilises,desdonnesutilises,de lexpertisedesanalystes,.. Lesbnficesapportsparlaprcision doiventdpasserlescots
R.Jahidi
Choixdunetechniquede q prvision
Disponibilitdesdonneshistoriques Varitdesdonnes:suruneseulevariableouplusieurs, longueurdelasrie,.. Cotsdelamthode Complexitetdegrdematrise Tempsdisponiblepourfournirlesprvisions d bl f l Objectifsdelaprvision Typedeprvision:courttermeoumoyenlongterme T d i i tt l t
R.Jahidi
RGRESSIONSIMPLE
R.Jahidi
Rgression simple
Nousallonsmaintenantvoircomment prdireunevariablecontinuepartird une prdireunevariablecontinuepartird'une autre. Nousallonsgalementvoircommentnous N ll l t i t pouvonsmodlisercetterelationlinaire, c'estdirecommentreprsenterlemieux possiblelarelationlinaireentredeux variableslaidedunequation mathmatique. q
R.Jahidi
10
Lesquestionsauxquellesrpondlamodlisation delarelationlinaireressemblentsouvent celles ci: ll i Decombienlesventesdunecompagniepeuvent augmenterlorsquelebudgetdepublicitest doubl? Decombienletauxdecholestrolaugmente t ilen Decombienletauxdecholestrolaugmentetilen fonctiondelaugmentationdupourcentagede gras? Lenombredheuresdtudeestilassociau rendementscolaire?
R.Jahidi
11
R.Jahidi
12
1.Lesdonnes 1 Lesdonnes
Y=Variableexpliquer numrique ( (oudpendante) p ) X=Variableexplicative numrique (ouindpendante)
1 M i M n
X x1 M xi M xn
Y y1 M yi M yn
Letableaudesdonnes
R.Jahidi
13
Ladroitedesmoindrescarrs
y = ax + b
valeur observe valeur prdite
Oncherche
a et b
minimisant
y1
erreur ei
y1
ei2
i =1
x1
R.Jahidi
14
Lasolution
a=
( x x )( y
i =1 i n i =1 i
y)
2
( x x)
b = y ax
R.Jahidi
15
Lebutd'unmodleestd'expliquerlemieuxpossible lavariabilitdelavariabledpendante(y)l'aidede lavariablesindpendantes(x). lavariablesindpendantes(x) Ilesttrsimportantdecomprendrequepourtre valable,unmodleavecprdicteurdoitexpliquer , p p q significativementplusdevariancequ'unmodle sansprdicteur!Sinon,onestencoremieuxavec seulementlamoyenne.Lapremirechosefaire seulementlamoyenne Lapremirechosefaire dansl'interprtationdesrsultatsseradoncde vrifiersilemodledergressionavecprdicteur (notrevariablex)serasignificativementplus ( t i bl ) i ifi ti t l intressantqu'unmodlesansprdicteur(la moyennedey). y y)
R.Jahidi
16
dumodle dergression:R2
Formule de dcomposition
( y i y) = ( y i y) + ei
2 2
Sommedes carrstotale (SCT) Sommedes carrsexplique (SCM)
R.Jahidi
17
Qualitdelargression
Interprtationgomtriquedela dcompositionensommedecarrs
ThormedePythagore
y y = y y + y y
R.Jahidi
18
Qualitdelargression
Lerapport
( yi y)2 = ( yi y)2
R2
19
Qualitdelargression
LeR2 ajustsecalculeenfonctionduR2 : Iltraduitlafoislaqualitdelajustement(liaison entreY et X)etlacomplexitdumodle.
n 1 R = 1 (1 R 2 ) n2
2 a
R.Jahidi
20
0 R2 1 R2 = 1
Y
3)
R2 = 0 * * * * * * * * * * * *
X
R.Jahidi
21
100
80
60
40
20
0 -20 -10 0 10 20
Rsq = 0.0000
R.Jahidi
22
4.valuationdelajustementdela
droitedergressionauxdonnes:R
R.Jahidi
23
Lecoefficientdecorrlation
R=
( x i x )( yi y) 2 2 ( x i x ) ( y i y)
sertvrifierlaqualitdelajustementdela droitedergressionaveclesdonnes
) R 2 R = signe(a
R.Jahidi
24
LacorrlationRmesurelaforceet lesensdelaliaisonlinaireentreXetY l d l li i li i t X tY
* * * * * *
* * * ** *
X
* *
X
a>0 R>0
a<0 R<0
R.Jahidi
25
Rglededcision
OnrejetteH0 aurisque =0.05 desetrompersi
Test:
H0 : =0 H1 : 0
2 n
(Bonneapproximationpourn>20)
R.Jahidi
26
Y = aX + b +
o a et b sontlesparamtres et estunbruitalatoire reprsentantletermederreur. t tl t d
R.Jahidi
27
Lemodlegnraldergression simple
Lestermesdelquation
yi = b + axi + i
28
Lemodlegnraldergression simple
Leshypothsesdumodle yp
E(i)=0 pourtouti V(i)=2 pourtouti (homoscdasticit deserreurs) ) Cov(i , i )=0pourtoutij i suituneloinormale N(0 ) N(0, linaritdelarelation
R.Jahidi
29
6.Estimationdea,bet
Estimationdeaetb:
a = estimation de a b = estimation de b
Estimationde :
1 n 2 2 = ei = estimation de 2 n 2 i =1 = 2 = estimation de
R.Jahidi
30
R.Jahidi
31
7.Qualitdelargression 7 Qualitdelargression
LetestdeFisher(testANOVA)
Ilpermetderpondrelaquestion:laliaisonglobale entreY et X estellesignificative?
Hypothses
H0:la variable X nexplique pas la variable Y . H1:la H1 la variable X explique la variable Y .
R.Jahidi
32
Qualitdelargression
Statistiqueutilise
SCR MSR F= = 1 MSE SCE n2
R.Jahidi
33
Niveaudesignification
Pluspetitevaleurde conduisantaurejetdeH0
LoideFsousH0
Niveaudesignification Ni ea designification
F1(1,n2)
Fobserv
34
Qualitdelargression
R2 ettestdeFisher
F bon, R mauvais
F bon, R bon
R.Jahidi
35
Qualitdelargression
LetestdeStudent
Ilpermetderpondrelaquestionsuivante: lapportdelavariableX estilsignificatif?
Hypothses H pothses
H0:a =0
OnpeutsupprimerlavariableX
H1:a 0
IlfautconserverlavariableX
R.Jahidi
36
Qualitdelargression
Statistiqueutilise
a , t = s a s a : cart - type de a =
i
(x
x )
R.Jahidi
37
Niveaudesignification
Pluspetitevaleurde conduisantaurejetdeH0
LoidetsousH0
NS/2
/2 /
NS/2
|t|
|t|
t1/2(n2)
38
8.Analysedesrsidus 8 Analysedesrsidus
Normalit
Testsdenormalit
Homoscdasticit
Lavariancedesrsidusnestpasstable.
Indpendancedesrsidus p
TestdeDurbinWatson
Dtectiondesvaleursatypiques
R.Jahidi
39
Analysedesrsidus
Modle:Y=b+aX+ M dl Y b X avec N( ) N(0,)
Loide
ei > 2
1.96 6 ou Rsidu standardis
1.96
ei >2
40
R.Jahidi
Utilisation du graphe des rsiduels vs p g p prdits p pour le diagnostic Linarit, Normalit, Homoscdasticit (LNH)
LNH
Rsidue els Rsiduel ls 0
Nonnormal
Prdits
Prdits
Rsid duels
Prdits
R.Jahidi Nonlinaire
Htroscdasticit
41
9. Prvision de Y
Modle : Y = aX + b + , avec N(0, ) x= E(Y | X = x) = ax + b ( ) Problme 1 : Calculer une estimation et un intervalle de confiance au niveau de confiance 95 % de la moyenne x de Y lorsque X est fix x. Soit y une future valeur de Y pour X fix x. Problme 2 : Calculer une prvision et un intervalle contenant 95 % des futures valeurs de Y lorsque X est fix x.
R.Jahidi
42
Rsultatpourx R lt t
Estimationdex =E(Y|X=x):
x = ax + b
Intervalledeconfiancedex auniveau95%:
1 (x ) ( x) 2 + n y t 0.975 (n 2) n (x i x) 2
i =1
Formuleapproche:
y2 n
R.Jahidi
43
Rsultatpoury
Prvisiondeypourxfix:
y = ax + b
Intervalledeprvisiondey95%pourxfix:
1 ( x x )2 y t0.975 (n 2) 1 + + n n ( xi x ) 2
i =1
Formuleapproche:
y 2
Remarque : une observation i est mal reconstitue par le modle si yi nappartient pas son propre i t i ti t intervalle de prvision. ll d i i
R.Jahidi
44
LARGRESSIONMULTIPLE
R.Jahidi
45
Quandutiliserlargression multiple
Pourestimerlarelationentreunevariable p ( ) p dpendante(Y )etplusieursvariables indpendantes(X1, X2, ) Exemples
Expliquerleprixdunappartementparla superficie,lesprestations,lemplacement, p , p , p , Expliquerlaconsommationdesvhiculesparle prix,lacylindre,lapuissanceetlepoids.
R.Jahidi
46
1.Lesdonnes 1 L d
Y =Variableexpliquer bl l
numrique (oudpendante)
1
M M
Xk Y xk1 y1 xki yi
X1,,Xk
=Variablesexplicatives numriquesoubinaires q (ouindpendantes)
xkn yn
Letableaudesdonnes
R.Jahidi
47
Y = 0 + 1 X 1 + 2 X 2 + ... k X k +
o0, 1, 2, . . . , k sontlesparamtres et estunbruit alatoirereprsentantletermederreur.
R.Jahidi
48
Lemodlelinairedergression multiple
Leshypothsesdumodle yp
LesvariablesXi sontalatoires E(i)=0 pourtouti ) 0 V(i)=2 pourtouti (homoscdasticit deserreurs) Cov(i , i )=0pourtoutij Levecteuralatoire suituneloinormalen dimensionsN(0, 2In) ( ,
R.Jahidi
49
Lemodlelinairedergression multiple
Lestermesdelquation
ime observation de Y
Influence de I fl d la variable Xk
3.Lesproblmes
A)Estimationdescoefficientsdergression 0,1,,k. yp B)Estimationdelcarttype duterme rsidueli. C)Analysedesrsidus D)MesurerlaforcedelaliaisonentreYetles variablesX1,,Xk : R R2 X R,R E)LaliaisonglobaleentreYetX1,,Xk estellesignificative? ll i ifi i ?
R.Jahidi
51
Lesproblmes(suite)
F)LapportmarginaldechaquevariableXj (enplus p g desautres)lexplicationdeYestilsignificatif? G)Slectionautomatiquesdes bonnes variablesXj. H)Intervalledeprvision95%dey. I) Intervalledeconfiance95%deE(Y).
R.Jahidi
52
4.Estimationdescoefficientsde rgressionj
Notations: yi =valeurobserve
y i = 0 + 1x1i + L + k x ki
=valeurcalcule = prvisiondeyi
ei = yi yi =erreur
n
Mthodedesmoindrescarrs: Mth d d i d
Onrecherche minimisant.i e2 0 , 1 ,L, k
i =1
R.Jahidi
53
Interprtationgomtrique
Illustrationducask=2.
yi :observation
0
i = y i yi
yi = 0 + 1 X 1i + 2 X 2i
(X1i, X2i) X2
X1
R.Jahidi
54
Donnes:
x1 x2 . . . x k y . . . . . . . .
0, 1, 2, . . . , k
Equation estime
0 , 1 , 2 ,..., k
0 , 1, 2, . . . , k
R.Jahidi
Estimateurs de
Y = 0 + 1 X 1 + 2 X 2 + ... + k X k
55
Interprtationdescoefficientsdergression estims
LestimedeY i d f t l L ti d Y variedunfacteurgal j lorsqueXj augmenteduneunit,lesautres variablestantmaintenuesconstantes. Lordonnelorigine
0
j Lapente (j0)
56
5.Estimationdelcarttype d 5 E ti ti d l t t du termersiduel
Estimationde2 :
2 =
i =1
ei2
n k 1
Estimationde E ti ti d :
= 2
57
R.Jahidi
6.Analysedesrsidus
Modle:Y= M dl Y 0 +1X1++jXj ++kXk + avec N(0,) ( , )
Loide
ei > 2
1.96 6 ou Rsidu standardis
1.96
ei >2
58
R.Jahidi
( y i y) = ( y i y) + ei
2 2
Sommedes carrstotale Sommedes carrsexplique
Sommedes carrsrsiduelle
( yi y)2 B) R2 = ( yi y)2
C) R=
R = cor ( y, y)
R.Jahidi
59
8.LaliaisonglobaleentreYetX1,,Xk estellesignificative?
Modle:Y= M dl Y 0 +1X1++kXk + Test: H0 :1==k =0(Y=0 + nedpendpasdesX) H1 :Aumoinsunj 0(Y dpenddaumoinsunX) dpendd aumoinsunX) Statistiqueutilise:
( yi y ) 2 / k
60
Niveaudesignification
Pluspetitevaleurde conduisantaurejetdeH0
LoideFsousH0
Niveaudesignification Ni ea designification
F1(k,nk1) k k
Fobserv
61
tj =
j sj
2 1 o s j = cart-type( j ) = 1 R 2 (X j ;autres X) (x ji x j ) 2
i
DcisionderejeterH0 aurisque desetromper: RejetdeH0 si|tj | t1/2 (nk1) FractileduneloideStudent act e d u e o de Stude t
R.Jahidi
62
Niveaudesignification
Pluspetitevaleurde conduisantaurejetdeH0
Loidetj sousH0
NS/2
/2 /
NS/2
|tj|
|tj|
t1/2(nk1) k
63
Mesuredelamulticolinarit: TolranceetVIF
Tolrance(Xj)=1 R2(Xj ;AutresX) Ilestprfrabledobserverunetolrance l f bl d b l suprieure0.33. VIF=VarianceInflationFactor =1/Tolrance IlestprfrabledobserverunVIF infrieur3.
R.Jahidi
64
Lamulticolinarit
S(X1,,Xk)estlasommedescarrsexpliqueparles variablesX1,,Xk. 1)Fpartiel
Fj =
t2 j
2 j s2 j
65
10.Slectiondesvariables 10 Slectiondesvariables
Rgressionpaspasdescendante(Backward) Onpartdumodlecomplet. Onpartdumodlecomplet AchaquetapeonenlvelavariableXj ayant lapportmarginalleplusfaible: |tj|minimumouNS(tj)maximum conditionquecetapportsoitnonsignificatif (NS(tj) 0.1=valeurpardfautdeSPSS).
R.Jahidi
66
11.Intervalledeconfiance deE(Y)
Modle:
Yi =0 +1x1i ++kxki +i
Formulesimplifie:
yi 2 n
R.Jahidi
67
12.Intervalledeprvision deyi
Modle:
Yi =0 +1x1i ++kxki +i yi =futurevaleurdeYi
yi = 0 + 1x1i + L + k x ki = prvision de y i
Intervalledeprvisiondeyi auniveau0.95
Formulesimplifie:
yi 2
R.Jahidi
68
DCOMPOSITIONDUNESRIE CHRONOLOGIQUE
R.Jahidi
69
1. Lesdonnes
IndicedelaProductionIndustrielledelaFrance(1963 1982)
Anne 63 64 65 66 67 68 69 70 . . . 82 Trimestre 1 68 77 76 81 84 89 95 100 Trimestre 2 74 79 79 84 85 77 99 104 Trimestre 3 64 65 67 71 72 78 82 87 Trimestre 4 78 79 83 87 90 99 103 110
137
136
111
140
R.Jahidi
70
VisualisationdelasrieIPI
80
60
160
140
120
100
IPI
40
Date
2 82 19 1 1 Q 198 0 1 0 Q 198 1 9 Q 197 8 1 8 Q 197 1 7 Q 197 6 1 6 Q 197 5 1 5 Q 197 1 4 Q 197 3 1 3 Q 197 1 2 Q 197 1 1 1 Q 197 1 0 Q 197 9 1 9 Q 196 8 1 8 Q 196 1 7 Q 196 6 1 6 Q 196 1 5 Q 196 4 1 4 Q 196 1 3 Q 196 1
R.Jahidi
71
2. Lemodlemultiplicatif
DcompositiondelasrieobserveXt entroiscomposantes:
Xt =Tt St Rt
o TendanceTt =Courbelissepassantaumilieudesdonnes, g gommantalasetsaisonnalit SaisonnalitSt =Composantetraduisantunepriodicit RsiduRt =Composantealatoire
R.Jahidi
72
3. 3 Calculdelacomposante saisonnireSi
Oncalculelesmoyennesmobilesdordres
0.5 X t k + K + X t 1 + X t + X t +1 + K + 0.5 X t + k Zt = si s = 2k s X t k + K + X t 1 + X t + X t +1 + K + X t + k Zt = si s = 2k + 1 s
R.Jahidi
73
Calculdelacomposantesaisonnire Si On calcule les coefficients saisonniers SRt=Xt/Zt On calcule les facteurs saisonniers provisoires Si comme la moyenne des SRt p pour chaque trimestre q Les composantes Si sont obtenus par normalisation des facteurs Si Si = 4 Si / S1 + S2+ S3+ S4
R.Jahidi
74
R.Jahidi
75
5 5.EstimationfinaleTt delatendance
Moyennemobiledelasriecorrigedes variationssaisonniresYt :
Tt = Y t 2 + 2 Y t 1 + 3 Y t + 2 Y t +1 + Y t + 2 9
pourt=3n2 Surlesbords: T2 =(Y1+Y2+Y3)/3;T1 =T2 [(T2+T3) (Y1+Y2)]/2 ) Tn1 =(Yn2+Yn1+Yn)/3;Tn =Tn1 +[(Yn1+Yn) (Tn2+Tn1)]/2
R.Jahidi
76
6.CalculdesrsidusR 6 CalculdesrsidusRt
DeXt =Tt St Rt ondduit:
Xt Rt = Tt S t
R.Jahidi
77
7.Prvision Formuledeprvision: p
X t = Tt St
o:
Tt =extrapolationdelatendance
St =Coefficientsaisonnier
R.Jahidi
78
R.Jahidi
79
1. Diffrentstypesdesries chronologiques
COURS D'UNE ACTION
PAS DE TENDANCE, PAS DE SAISONNALITE
1500 12000
1400
11000
1300
10000
1200
9000
COURS
CA
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1100
8000 1 3 5 7 9 11 13 15 17 19 21 23 25
Sequence number
Sequence number
TENDANCEETSAISONNALITE
R.Jahidi
80
2.Lesmthodesdeprvisionparlissage exponentiel
R.Jahidi
81
3.
Lissageexponentielsimple
JOUR 1 2 3 4 5 6
1500
Exemple:Coursduneaction
COURS 1293 1209 1205 1273 1220 1290 JOUR 7 8 9 10 11 COURS JOUR COURS 1243 12 1343 1203 13 1364 1390 14 1330 1360 15 1377 16 1353 1332
1400
1300
1200
C COURS
1100 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
JOUR
R.Jahidi
82
Formulesdeprvisionetdelissage
Prvision de Yt+h ralise linstant t
Yt (h) = St
o : Yt (h ) = prvision d Yt + h i i de
St
Formule de lissage
St =Yt +(1)St1
o : -
=constantedelissage(0 1)
S0 =valeurinitiale(Y1 ou=valeurchoisieparSPSS) Y
R.Jahidi
83
CalculdelavaleurlisseSt
St = Yt + (1 ) j Yt j + (1 ) t S0
j=1 t 1
84
PrvisiondeYt
Surlhistorique(t=1T):
Yt = = = Prvision de Yt ralise en t - 1 Moyenne estime de la srie en t - 1 S t -1
Surlefutur:
YT (h) = = = Prvision de YT + h ralise en T Moyenne estime de la srie en T ST
85
Intervalledeprvisionlhorizonhau niveau95%
Donnesobserves:Y1,,YT PrvisiondeYT+h :
YT (h ) = ST
Intervalledeprvision95%deYT+h :
YT (h ) 1.96 1 + (h - 1) 2
o
1 T = (Yt Yt ) 2 T 1 t =1
R.Jahidi
86
4.
LamthodedeHolt
Trimestre 1 1972 1973 1974 1975 1976 1977 1978
12000
11000
10000
9000
CA A
8000 1 3 5 7 9 11 13 15 17 19 21 23 25
Trimestre
R.Jahidi
87
LamthodedeHolt
Hypothses:Srieavectendance,sanssaisonnalit Formuledeprvision:Alinstantt,lhorizonh Formuledeprvision Alinstantt lhorizonh
Prvision localement oca e e t linaire
Yt (h ) = St + h Tt
Prvision deYt+h Niveaude Pentede latendance latendance
Formulesdelissage g
88
LamthodedeHolt
ChoixdesvaleursinitialesdeT0 etS0 dansSPSS
T0 = YT Y1 T 1
S0 = Y1 0.5T0
Choixdesconstantesdelissage et
Yt = St -1 + Tt 1 = prvision de Yt
Yt - Yt = erreur d prvision de i i
On recherche et minimisant
(Yt Yt ) 2
R.Jahidi
89
5.
LamthodedeWinters
IndicedelaProductionIndustrielledelaFrance(1963 1982)
Anne 63 64 65 66 67 68 69 70 . . . 82 Trimestre 1 68 77 76 81 84 89 95 100 Trimestre 2 74 79 79 84 85 77 99 104 Trimestre 3 64 65 67 71 72 78 82 87 Trimestre 4 78 79 83 87 90 99 103 110
137
136
111
140
R.Jahidi
90
LamthodedeWinters
Hypothses:Srieavectendanceetsaisonnalitdordres Formuledeprvision:Alinstantt,lhorizonh
Yt (h ) = (St + h Tt ) I t + h s
Prvision deYt+h Pentede Niveaude latendance latendance Coefficient saisonnier
Prvisionlocalement linaire
*
Coefficientsaisonnier
Formulesdelissage
St = (
Yt ) + (1 - ) (St -1 + Tt 1 ) I t -s
Tt = (St S t 1 ) + (1 - ) Tt 1
It = (
Yt ) + (1 - ) I t -s St
R.Jahidi
91
LamthodedeWinters
ChoixdesvaleursinitialesT0 ,S0
T0 = Yk Y1 (k 1) s , o k est le nombre d' annes compltes
s S0 = Y1 ( ) T0 2
92
LamthodedeWinters
Choixdesconstantesdelissage, et
Yt - Yt = erreur de prvision
On recherche , , minimisant
(Yt Yt ) 2
R.Jahidi
93