Académique Documents
Professionnel Documents
Culture Documents
20
30
50
60
80
90
0,5
0,7
0,8
1,0
1,1
1,3
1,4
(m2)
ncasrile
medii lunare
1,6
1,8
2,1
(mil. u. m.)
Se cere:
a) s se specifice modelul econometric ce descrie legtura dintre cele dou variabile;
b) s se estimeze parametrii modelului i s se calculeze valorile teoretice ale variabilei
endogene;
c) s se verifice ipotezele de fundamentare a metodei celor mai mici ptrate;
d) s se verifice semnificaiile estimatorilor i verosimilitatea modelului;
e) tiind c un antreprenor poate s cumpere o suprafa comercial de 130 m2, s se
estimeze ncasrile medii lunare ale acestuia.
Rezolvare:
a) Pe baza datelor problemei se poate construi un model econometric unifactorial de
forma:
y = f (x ) + u
unde:
y
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
x
0
20
30
50
60
80
90
100
110
120
150
yi=b0+b1+ei
y i = a + bxi
unde:
( )
10
10
i =1
i =1
2
F a , b = min ( y i y i ) = min y i a bxi
()
F b$ = 0 a$ x i + b$ x i2 = y i x i
Tabelul 2.
Nr.
Suprafaa ncasri
medii
crt. comercial
lunare
(m2)
(mil.lei)
x i2
xi yi
y i = 0,2409 +( x x ) 2 u i = yi y i
i
+ 0,0122xi
ui2
yi y
20
0,5
400
10
0,4852
3721
0,0148
0,0002
-0,73
30
0,7
900
21
0,6073
2601
0,0927
0,0086
-0,53
50
0,8
2500
40
0,8515
961
-0,0515
0,0026
-0,43
60
1,0
3600
60
0,9736
441
0,0264
0,0007
-0,23
80
1,1
6400
88
1,2178
-0,1178
0,0139
-0,13
90
1,3
8100
117
1,3399
81
-0,0399
0,0016
0,07
100
1,4
10000
140
1,4620
361
-0,0620
0,0038
0,17
110
1,6
12100
176
1,5841
841
0,0159
0,0003
0,37
120
1,8
14400
216
1,7062
1521
0,0938
0,0088
0,57
10
150
2,1
22500
315
2,0725
4761
0,0275
0,0008
0,87
Total
810
12,3
80900 1183
12,3
15290
0,0413
Tabelul 2. (continuare)
( yi y ) 2
xi x
ui
ui ( x i x )
ui 1
10
11
12
13
14
0,5329
-61
0,0148
-0,9056
( ui
ui 1 )
(xi
x )( y i y )
ui21
u i u i 1
15
16
17
18
44,53
0,2809
-51
0,0927
-4,7298
0,0148
0,0061
0,0002 0,0014
27,03
0,1849
-31 -0,0515
1,5956
0,0927
0,0208
0,0086 -0,0048
13,33
0,0529
-21
0,0264
-0,5549
-0,0515
0,0061
0,0026 -0,0014
4,83
0,0169
-1
-0,1178
0,1178
0,0264
0,0208
0,0007 -0,0031
0,13
0,0049
-0,0399
-0,3591
-0,1178
0,0061
0,0139 0,0047
0,63
0,0289
19
-0,0620
-1,1780
-0,0399
0,0005
0,0016 0,0025
3,23
0,1369
29
0,0159
0,4609
-0,0620
0,0061
0,0038 -0,0010
10,73
0,3249
39
0,0938
3,6577
0,0159
0,0061
0,0003 0,0015
22,23
0,7569
69
0,0275
1,8954
0,0938
0,0044
0,0088 0,0026
60,03
2,321
0,0148
0,0000
0,0768
0,0405 0,0024
186,7
Estimarea parametrului b$ :
n
b =
y
y x
x
x
i
n
xi
i
2
i
10 12.3
810 1183
11830 9963
1867
=
=
=
= 0,0122
10
810
809000 656100 152900
810 80900
1
xi =
na$ + b$ x i = y i * a$ + b$
n
n
y
n
$
a$ = y bx
810
= 81
n
10
a = 1,23 0,0122 * 81 = 0,2409
y
12
,
3
i=
y=
= 1,23
n
10
x=
s u
(y
=
2
y i )
n k 1
0,0413
= 0,0052
10 2
su = 0,005245 = 0,0724
1
1
x2
812
s a2 = s u2 +
=
0
,
0052
*
+
= 0,0027
2
n ( xi x )
10 15290
(vezi tabelul 2, coloana 6)
s a = 0,0027 = 0,0523
sb2 = s u2
(x
x)
0,0052
= 0,0000003
15290
sb = 0,0000003 = 0,0006
n urma acestor calcule, modelul econometric se poate scrie:
y i = 0,2409 + 0,0122 xi ;
(0,0523) (0,0006)
su = 0,0718
Regression Statistics
Multiple R
Raportul de
corelaie (R)
( y
y)
y)
i =1
n
R y,x =
(y
0,9911
= 1
i =1
2
x
2
0
2
u
2
0
V
V
=1
=
V
V
(y
y)
i =1
n
(y
0,9822
Rc2 = 1
nk
1 R2
n 1
0,9800
Standard Error
Abaterea medie
ptratic a
erorilor n
eantion
i =1
n
2
y i )
i =1
Adjusted R
Square
Valoarea ajustat
a coeficientului
de determinare
(y
n
R2 =
i =1
R Square
Coeficientul
(gradul ) de
determinare
(y
su =
2
u
V
=
n2
(y
y i )
i =1
n2
0,0718
Observations
=n
Numrul
observaiilor (n)
10
ANOVA
Sursa de
variaie
df
Nr.
gradelor
de
libertate
SS
Suma
ptratelor
(Msura
variaiei)
MS
Media
ptratel
or
(Dispers
ii
Significanc
eF
Prag de
semnif.
corectat
e)
Regressio
n (variaia
Vx2 = ( yi y)
=k
datorat
regresiei)
2,279
7
Residual
Vu2 = ( yi yi )
Total
(variaia
total)
V02 = ( yi y)
2,321
0
Coefficients
Coef
.
Intercept
Standard
Error
= s u2
Abatere t Stat
a medie
xi
0,0122
< 95%
Upper
95%
0,120
4
a [a t0, 05;8 sa ]
0,3614
0,010
9
b b t 0;05;8 s b
0,0136
0,001
7
s b
0,0006
Lower
99,0%
a [a + t0, 05;8 sa ]
0,0656
0,0103
<99%
>99%
Upper
99,0%
a [a t0,01;8 sa ]
b b t0;01;8 sb
0,000 <0,005
0
t cb
21,0187
>95%
b b + t 0;05;8 s b
<0,005
t c a
4,6111
0,0523
Prag de
semnif.
Pvalue
sa
0,2409
Lowe
r 95%
<0,005
441,785
7
patratic
(Termen
liber)
0,0000
0,005
2
=n1
Variable
0,041
3
Fc
2,279
7
=nk1
(variaia
rezidual)
= s y2/ x
0,4163
0,0142
a [a + t0, 01;8 sa ]
b b + t 0;01;8 s b
RESIDUAL OUTPUT
Predicted Y
Residuals
y i = a + bxi
u i = yi y i
0,4852
0,0148
0,6073
0,0927
0,8515
-0,0515
0,9736
0,0264
1,2178
-0,1178
1,3399
-0,0399
1,4620
-0,0620
1,5841
0,0159
1,7062
0,0938
10
2,0725
0,0275
Observation
Interpretarea indicatorilor:
Intercept este termenul liber, deci coeficientul a = 0,2409 . Termenul liber este punctul
n care variabila explicativ (factorial) este egal cu 0. Deci ncasrile medii lunare, dac
suprafaa comercial este egal cu 0, sunt egale cu 0,2409 mil u. m.
Coeficientul b = 0,0122 , ceea ce nsemn c, la creterea suprafeei comerciale cu un m2,
ncasrile medii lunare vor crete cu 0,0122 mil. u. m.
R= 0,9911 arat c ntre suprafaa comercial i ncasrile medii lunare exist o legtur
puternic, semnificativ;
R2 =0,9822 arat c aproximativ 98,22% din variaia ncasrilor medii lunare este
explicat de suprafaa comercial a acestora.
Abaterea medie ptratic a erorilor, su = 0,0718. n cazul n care valoarea acestui
indicator este egal cu zero nseamn c toate punctele sunt situate pe dreapta de
regresie.
xi ( x 3 x )
y i ( y 3 y )
x =
y =
(x
x)
(y
y)
15290
= 1529 = 39,1024
10
2,321
= 0,2321 = 0,4818
10
xi ( 36,3072;198,3072)
yi ( y 3 y ) y 3 y < yi < y + 3 y 1,23 3 * 0,4818 < yi < 1,23 + 3 * 0,4818
yi ( 0,2154;2,6754)
Deoarece valorile acestor variabile aparin intervalelor xi ( 36,3072;198,3072) i
0.14
y
0.12
0.1
0.08
0.06
0.04
0.02
0
-0.02
20
30
50
60
80
90
100
110
120
x 150
-0.04
-0.06
-0.08
-0.1
-0.12
-0.14
Figura 2
0.5
0.7
0.8
1.1
1.3
1.4
1.6
1.8
2.1
-0.04
-0.06
-0.08
-0.1
-0.12
-0.14
Figura 3
( u$
d=
u$ i 1 )
i=2
n
u$
2
i
i =1
i compararea acestei mrimi d cu dou valori teoretice d 1 i d 2 , preluate din tabela DurbinWatson (vezi anexa nr. 1) n funcie de un prag de semnificaie , arbitrar ales, de numrul
variabilelor exogene ( k ) i de valorile observate ( n, n 15) .
Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o anumit
regul, care const n:
- dac 0 < d < d 1 autocorelare pozitiv;
- dac d 1 d d 2 indecizie, recomandndu-se acceptarea autocorelrii pozitive;
(u
d=
u i 1 )
i =2
10
=
2
i
0,0768
= 1,86
0,0413
i =1
u u
i
r1 =
i=2
n
i 1
2
i 1
i =2
(u$i u$i 1 )
d=
i =2
n
u$
i =1
=
2
i
u$i2
i =2
n
u$
i =1
+
2
i
i =2
n
u$
i =1
u$
i=2
n
u$
i =1
2
i
=1
2
i
u$i21
2 u$i u$i 1
2
i
i =2
n
u$
i =1
2
i
u$
2
i 1
u$ i2
i=2
i =1
u$
i=2
n
2
i 1
=1
u$
2
i
i =1
n
u$ u$
i
i =2
n
u$
i 1
= r1
2
i 1
i =2
d = 1 + 1 2r1 r1 = 1
d
2
tiind c:
r1 = 0 independenta
d = 2
indecizie
u u
i
r1 =
i =2
10
i 1
=
2
i 1
0,0024
= 0,059
0,0405
i =2
P( u$i t su$ ) = 1 .
Pe baza acestei relaii, n funcie de diferite praguri de semnificaie , din tabela
distribuiei normale se vor prelua valorile corespunztoare ale lui t .
Lucrnd cu un prag de semnificaie = 0,05 , din tabela distribuiei Student ( n < 30) se
preia valoarea variabilei, cu un numr de grade de libertate v = n 2 = 10 2 = 8, t0.05;8 = 2,306 ,
iar pentru un prag de semnificaie = 0,01 , avem t 0.01;8 = 3.355 . Cu ajutorul acestor date,
verificarea ipotezei de normalitate se poate face pe baza urmtorului grafic (figura 4): pe axa Ox
se vor reprezenta valorile ajustate ale variabilei y ( y i - vezi tabelul 2, coloana 5), iar pe axa Oy se
vor trece valorile variabilei reziduale ( u i - vezi tabelul 2, coloana 7).
Se observ c valorile empirice ale variabilei reziduale se nscriu n banda construit, cu
un prag de semnificaie = 0,05 . Ca atare, ipoteza de normalitate a variabilei reziduale poate fi
acceptat cu acest prag de semnificaie.
t 0 , 05 * s u
u
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
-0.020.498
Y
0.618
0.858
0.978
1.218
1.338
1.458
1.578
1.698
2.058
-0.04
-0.06
-0.08
-0.1
-0.12
+ t 0,05 * s u
-0.14
-0.16
Figura 4
> t ;
b$
sb$
> t
tiind
(vezi
punctul
b)
al
problemei)
a = 0,2409; s a = 0,0523
t b =
a
s a
b
sb
0,2409
= 4,6611 > t 0.01;8 = 3,355
0,0523
0,0122
= 21,0187 > t 0.01;8 = 3,355
0,0006
Pe baza calculelor de mai sus se observ faptul c ambii estimatori sunt semnificativ
diferii de zero, pentru un prag de semnificaie = 0,01 , fapt confirmat i de pragul de
semnificaie, P-value, corespunztor celor doi parametri, care este 0,0017<0,01 i, respectiv
0,0000<0,01.
Intervalul de ncredere pentru parametrul a este:
ry / x =
cov( y, x )
x y
(y
y )( xi x )
n x y
186,7
186,7
=
= 0,9911
10 * 39,1024 * 0,4818 188,4
- se calculeaz testul t:
tr =
Deoarece
r r n2
0,9911 8
=
=
= 21,0187
2
sr
1 r
1 0,99112
t r = 21,0187 > t ;n k 1 = t 0, 01; 8 = 3,355
coeficientul
de
corelaie
este
Msura
Nr. grade
Dispersii
variaie
variaiei
de
libertate
corectate
Variana
10
2
V = ( y i y )
2
x
i =1
dintre
k =1
= 2,2797
V x2
k
= 2,2797
sY2 / X =
Valoarea testului F
Fc
Fc =
sY2 / X
su2
= 441,7857
grupe
Variana
rezidual
Variana
total
10
Vu2 = ( y i Yi )
i =1
10
Vu2
n k 1
= 0,0052
s u2 =
n k 1= 8
= 0,0413
F ; v1 ;v2
V02 = ( yi y )
i =1
= 2,321
n 1= 9
V x2
Vu2
=
= 1 2 =
V02
V0
Ry / x
2,2797
= 0,9911
2,321
Se poate demonstra c, n cazul unei legturi liniare, raportul de corelaie este egal cu
coeficientul de corelaie liniar.
y i = a + b * xi + u y = a + b * x ; Yi = a + b * xi
10
( y
y)
i =1
10
R=
(y
y)
(a + bx
(y
=
2
a bx )
y)
b (x x )
(y y)
i =1
(x
(y
= b$
x)
i
i
y)
= b$ x = ry / x
y
na + b xi = y i
2
a xi + b xi = y i xi
b =
2
x
(x
=
i
2
i
x)
n xi2 ( xi )
(x
=
(x
n y i xi xi y i
2
i
2 xi x + x 2
xi2
n
+ x*y =
2
i
2
i
b =
(x y
i
x*y
x2
2x
n
i
y x
x )( y i y )
n
2x + x =
cov( y, x ) =
y x
n
xi
xi2
y
y x
x
x
n
xi
x
n
+ x2 =
x*y
x2
xi y x y i + x * y )
n
x y
x y
i
x y
i
x*y
cov( y , x)
b$ =
2
ry / x =
cov( y, x )
x y
cov( y, x ) x x
= b
= Ry / x
2
Fc = (n 2 )
Fc = 8 *
R2
, R fiind semnificativ dac Fc F ;v1 ;v2 .
1 R2
0,9822
= 8 * 55,1798 = 441,7857 > F0.01;1;8 = 11,3
0,0178
y i = 0,2409 + 0,0122 xi ;
(0,0523) (0,0006)
R = 0 , 9911
d = 1,86
su = 0,0718
care descrie corect dependena dintre cele dou variabile, acesta explicnd 98,22% din variaia
total a variabilei dependente, adic variaia cifrei de afaceri se datoreaz n proporie de 98,22%
suprafeei comerciale a magazinului.
Vx2
Vu2
*
100
+
* 100
V02
V02
1
( x x )2
sY / x =130 = s u2 1 + +
n ( x x )2
i
15290
= 0,0808
Estimarea cifrei de afaceri, care se poate obine dac suprafaa va fi de 130 m2 pe baza
unui interval de ncredere se calculeaz cu relaia:
A fost folosit pentru estimarea parametrilor urmtorul model, ale crui rezultate sunt prezentate
mai jos:
Q = + P+ .
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.913173052
R Square
0.833885023
Adjusted R Square
0.813120651
Standard Error
10.73509502
Observations
10
ANOVA
df
SS
Regression
Residual
Total
Coefficients
Intercept
Pret vanzare (mii $)
MS
4628.0619 . .
.
5550
Standard Error
-29.32363674
20.687667
0.068972606
0.0108839
2. Pentru a decide n ce zon s fie amplast un magazin de casete video, managerul unei
firme de comercializare i nchiriere de casete video realizeaz un studiu. Astfel, el
consider c succesul afacerii este cuantificat prin profitul anual brut obinut (sute euro).
Principalul factor de influen considerat pentru succesul acestei afaceri este venitul
mediu al locuitorilor de pe o raz de un kilometru (zeci euro). Sunt selectate aleator 5
supermarket-uri i sunt nregistrate valorile celor 2 variabile.
11
15
12
21
25
20
Observaie!
Aplicaia se rezolv pe baza rezultatelor din tabelele output ului obinut n
urma prelucrrii cu EXCEL a datelor
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,913173
R Square
0,833885
Adjusted R
Square
0,813121
Standard Error
142,1289
Observations
10
Vechime
Mean
100
Standard Deviation
24.83277
Smple Variance
616.6667
ANOVA
df
Regression
SS
1
Residual
..
Total
Vechime
811245
F
.
161605
972850
Standard
Error
Coefficients
Intercept
MS
665,991
t Stat
3,397844
66
43
57
32
18
20
15
18
12
a) Reprezentai grafic datele i determinai modelul liniar de regresie dintre cele dou
variabile;
b) Msurai intensitatea legturii dintre cele dou variabile folosind coeficientul de corelaie
i testai semnificaia acestuia, pentru un nivel de semnificaie de 5%;