Vous êtes sur la page 1sur 25

UNITATEA DE NVARE 4

Modelul liniar unifactorial


Exemplu
Se cunosc urmtoarele date privind ncasrile medii lunare i suprafaa comercial a 10
societi comerciale avnd acelai profil de activitate:
Tabelul 1.
Suprafaa
comercial

20

30

50

60

80

90

100 110 120 150

0,5

0,7

0,8

1,0

1,1

1,3

1,4

(m2)
ncasrile
medii lunare

1,6

1,8

2,1

(mil. u. m.)

Se cere:
a) s se specifice modelul econometric ce descrie legtura dintre cele dou variabile;
b) s se estimeze parametrii modelului i s se calculeze valorile teoretice ale variabilei
endogene;
c) s se verifice ipotezele de fundamentare a metodei celor mai mici ptrate;
d) s se verifice semnificaiile estimatorilor i verosimilitatea modelului;
e) tiind c un antreprenor poate s cumpere o suprafa comercial de 130 m2, s se
estimeze ncasrile medii lunare ale acestuia.
Rezolvare:
a) Pe baza datelor problemei se poate construi un model econometric unifactorial de
forma:
y = f (x ) + u

unde:

y - valorile reale ale variabilelor dependente;


x - valorile reale ale variabilelor independente;
u - variabila rezidual, reprezentnd influenele celorlali factori ai variabilei y,
nespecificai n model, considerai factori ntmpltori, cu influene nesemnificative asupra
variabilei y.
Analiza datelor din tabel, n raport cu procesul economic descris conduce la urmtoarea
specificare a variabilelor:
y - ncasrile medii lunare, reprezentnd variabila rezultativ, ale crei valori depind de o
mulime de factori - suprafaa comercial, amplasarea magazinului, reclama societii respective
etc;
x - suprafaa comercial, factorul considerat prin ipoteza de lucru cu influena cea mai
puternic asupra variabilei y.
Specificarea unui model econometric presupune, de asemenea, alegerea unei funcii
matematice ( f ( x)) cu ajutorul creia poate fi descris legtura dintre cele variabile. n cazul
unui model unifactorial, procedeul cel mai des folosit l constituie reprezentarea grafic a celor
dou iruri de valori cu ajutorul corelogramei.

y
2
1.8
1.6
1.4
1.2
1
0.8
0.6
0.4
0.2
x

0
20

30

50

60

80

90

100

110

120

150

Figura 1. Legtura dintre ncasrile medii lunare i suprafaa


comercial

Din grafic se poate observa c distribuia punctelor empirice ( x i , y i ) poate fi aproximat


cu o dreapt. Ca atare, modelul econometric care descrie legtura dintre cele dou variabile se
transform ntr-un model liniar unifactorial y = a + bx + u , a i b reprezentnd parametrii
modelului, b 0 , panta dreptei fiind pozitiv deoarece legtura dintre cele dou variabile este
liniar.
b) Deoarece parametrii modelului sunt necunoscui, valorile acestora se pot estima cu
ajutorul mai multor metode, n mod curent fiind folosit ns metoda celor mai mici ptrate
(M.C.M.M.P.). Utilizarea acestei metode pornete de la urmtoarea relaie:
y i = a + bxi + ui

yi=b0+b1+ei

y i = a + bxi
unde:

y i = reprezint valorile teoretice ale variabilei y obinute numai n funcie de


valorile factorului esenial x i valorile estimatorilor parametrilor a i b, respectiv a$ i b$ ;

u i = y i y i = (a a ) + b b xi = estimaiile valorilor variabilei reziduale.


n mod concret, M.C.M.M.P. const n a minimiza funcia

( )

10

10

i =1

i =1

2
F a , b = min ( y i y i ) = min y i a bxi

Condiia de minim a acestei funcii rezult din:


F ( a$ ) = 0 na$ + b$ x i = y i

()

F b$ = 0 a$ x i + b$ x i2 = y i x i

Tabelul 2.
Nr.

Suprafaa ncasri
medii
crt. comercial
lunare
(m2)
(mil.lei)

x i2

xi yi

y i = 0,2409 +( x x ) 2 u i = yi y i
i
+ 0,0122xi

ui2

yi y

20

0,5

400

10

0,4852

3721

0,0148

0,0002

-0,73

30

0,7

900

21

0,6073

2601

0,0927

0,0086

-0,53

50

0,8

2500

40

0,8515

961

-0,0515

0,0026

-0,43

60

1,0

3600

60

0,9736

441

0,0264

0,0007

-0,23

80

1,1

6400

88

1,2178

-0,1178

0,0139

-0,13

90

1,3

8100

117

1,3399

81

-0,0399

0,0016

0,07

100

1,4

10000

140

1,4620

361

-0,0620

0,0038

0,17

110

1,6

12100

176

1,5841

841

0,0159

0,0003

0,37

120

1,8

14400

216

1,7062

1521

0,0938

0,0088

0,57

10

150

2,1

22500

315

2,0725

4761

0,0275

0,0008

0,87

Total

810

12,3

80900 1183

12,3

15290

0,0413

Tabelul 2. (continuare)

( yi y ) 2

xi x

ui

ui ( x i x )

ui 1

10

11

12

13

14

0,5329

-61

0,0148

-0,9056

( ui

ui 1 )

(xi

x )( y i y )

ui21

u i u i 1

15

16

17

18

44,53

0,2809

-51

0,0927

-4,7298

0,0148

0,0061

0,0002 0,0014

27,03

0,1849

-31 -0,0515

1,5956

0,0927

0,0208

0,0086 -0,0048

13,33

0,0529

-21

0,0264

-0,5549

-0,0515

0,0061

0,0026 -0,0014

4,83

0,0169

-1

-0,1178

0,1178

0,0264

0,0208

0,0007 -0,0031

0,13

0,0049

-0,0399

-0,3591

-0,1178

0,0061

0,0139 0,0047

0,63

0,0289

19

-0,0620

-1,1780

-0,0399

0,0005

0,0016 0,0025

3,23

0,1369

29

0,0159

0,4609

-0,0620

0,0061

0,0038 -0,0010

10,73

0,3249

39

0,0938

3,6577

0,0159

0,0061

0,0003 0,0015

22,23

0,7569

69

0,0275

1,8954

0,0938

0,0044

0,0088 0,0026

60,03

2,321

0,0148

0,0000

0,0768

0,0405 0,0024

186,7

Estimarea parametrului b$ :

n
b =

y
y x
x
x
i

n
xi

i
2
i

10 12.3
810 1183
11830 9963
1867
=
=
=
= 0,0122
10
810
809000 656100 152900
810 80900

(vezi calcule tabelul nr. 2.1.2., coloanele 1, 2, 3, 4).


Estimarea parametrului a$ :

1
xi =
na$ + b$ x i = y i * a$ + b$
n
n

y
n

$
a$ = y bx

810
= 81

n
10
a = 1,23 0,0122 * 81 = 0,2409
y
12
,
3
i=

y=
= 1,23
n
10

x=

Dispunnd de estimaiile parametrilor se pot calcula valorile teoretice (estimate) ale


variabilei endogene, Yi , cu ajutorul relaiei:

y i = 0,2409 + 0,0122 xi (vezi tabelul 2, coloana 5).


Valorile variabilei reziduale vor rezulta din urmtoarea relaie:

u i = yi y i (vezi tabelul 2, coloana 13).


Pe baza acestor valori se pot calcula abaterea medie ptratic a variabilei reziduale su i
abaterile medii ptratice ale celor doi estimatori, s a i sb :
2

s u

(y
=

2
y i )

n k 1

0,0413
= 0,0052
10 2

(vezi tabelul 2, coloana 8)


unde:
k - numrul estimatorilor;

su = 0,005245 = 0,0724
1

1
x2
812
s a2 = s u2 +
=
0
,
0052
*
+

= 0,0027
2
n ( xi x )
10 15290
(vezi tabelul 2, coloana 6)

s a = 0,0027 = 0,0523
sb2 = s u2

(x

x)

0,0052
= 0,0000003
15290

sb = 0,0000003 = 0,0006
n urma acestor calcule, modelul econometric se poate scrie:

y i = 0,2409 + 0,0122 xi ;
(0,0523) (0,0006)

su = 0,0718

n urma folosirii programului EXCEL s-au obinut urmtoarele rezultate:


SUMMARY OUTPUT
Semnif. ind.

Regression Statistics

Multiple R
Raportul de
corelaie (R)

( y

y)

y)

i =1
n

R y,x =

(y

0,9911

= 1

i =1

2
x
2
0

2
u
2
0

V
V
=1
=
V
V

(y

y)

i =1
n

(y

0,9822
Rc2 = 1

nk
1 R2
n 1

0,9800

Standard Error
Abaterea medie
ptratic a
erorilor n
eantion

i =1
n

2
y i )

i =1

Adjusted R
Square
Valoarea ajustat
a coeficientului
de determinare

(y
n

R2 =

i =1

R Square
Coeficientul
(gradul ) de
determinare

(y

su =

2
u

V
=
n2

(y

y i )

i =1

n2

0,0718

Observations

=n

Numrul
observaiilor (n)

10

ANOVA
Sursa de
variaie

df

Nr.
gradelor
de
libertate

SS

Suma
ptratelor
(Msura
variaiei)

MS

Media
ptratel
or
(Dispers
ii

Significanc
eF

Prag de
semnif.

corectat
e)

Regressio
n (variaia

Vx2 = ( yi y)

=k

datorat
regresiei)

2,279
7

Residual

Vu2 = ( yi yi )

Total
(variaia
total)

V02 = ( yi y)

2,321
0

Coefficients

Coef
.

Intercept

Standard
Error

= s u2

Abatere t Stat
a medie

xi

0,0122

< 95%

Upper
95%

0,120
4

a [a t0, 05;8 sa ]

0,3614

0,010
9

b b t 0;05;8 s b

0,0136

0,001
7

s b

0,0006

Lower
99,0%

a [a + t0, 05;8 sa ]

0,0656

0,0103

<99%

>99%

Upper
99,0%

a [a t0,01;8 sa ]

b b t0;01;8 sb

0,000 <0,005
0

t cb

21,0187

>95%

b b + t 0;05;8 s b

<0,005

t c a

4,6111

0,0523

Prag de
semnif.

Pvalue

sa

0,2409

Lowe
r 95%

<0,005

441,785
7

patratic

(Termen
liber)

0,0000

0,005
2

=n1

Variable

0,041
3

Fc

2,279
7

=nk1

(variaia
rezidual)

= s y2/ x

0,4163
0,0142

a [a + t0, 01;8 sa ]

b b + t 0;01;8 s b

RESIDUAL OUTPUT
Predicted Y

Residuals

y i = a + bxi

u i = yi y i

0,4852

0,0148

0,6073

0,0927

0,8515

-0,0515

0,9736

0,0264

1,2178

-0,1178

1,3399

-0,0399

1,4620

-0,0620

1,5841

0,0159

1,7062

0,0938

10

2,0725

0,0275

Observation

Interpretarea indicatorilor:

Intercept este termenul liber, deci coeficientul a = 0,2409 . Termenul liber este punctul
n care variabila explicativ (factorial) este egal cu 0. Deci ncasrile medii lunare, dac
suprafaa comercial este egal cu 0, sunt egale cu 0,2409 mil u. m.
Coeficientul b = 0,0122 , ceea ce nsemn c, la creterea suprafeei comerciale cu un m2,
ncasrile medii lunare vor crete cu 0,0122 mil. u. m.

R= 0,9911 arat c ntre suprafaa comercial i ncasrile medii lunare exist o legtur
puternic, semnificativ;
R2 =0,9822 arat c aproximativ 98,22% din variaia ncasrilor medii lunare este
explicat de suprafaa comercial a acestora.
Abaterea medie ptratic a erorilor, su = 0,0718. n cazul n care valoarea acestui
indicator este egal cu zero nseamn c toate punctele sunt situate pe dreapta de
regresie.

c) Estimatorii obinui cu ajutorul M.C.M.M.P. sunt estimatori de maxim verosimilitate


dac pot fi acceptate urmtoarele ipoteze:
c1) Variabilele observate nu sunt afectate de erori de msur.
Aceast condiie se poate verifica cu regula celor trei sigma, regul care const n
verificarea urmtoarelor relaii:

xi ( x 3 x )
y i ( y 3 y )

Pe baza datelor din tabelul 2., coloanele 6, 10, se obin:

x =

y =

(x

x)

(y

y)

15290
= 1529 = 39,1024
10

2,321
= 0,2321 = 0,4818
10

xi ( x 3 x ) x 3 x < xi < x + 3 x 81 3 * 39,1024 < xi < 81 + 3 * 39,1024

xi ( 36,3072;198,3072)
yi ( y 3 y ) y 3 y < yi < y + 3 y 1,23 3 * 0,4818 < yi < 1,23 + 3 * 0,4818

yi ( 0,2154;2,6754)
Deoarece valorile acestor variabile aparin intervalelor xi ( 36,3072;198,3072) i

yi ( 0,2154;2,6754) , ipoteza de mai sus poate fi acceptat fr rezerve.


c2) Variabila aleatoare (rezidual) u este de medie nul M (u ) = 0 , iar dispersia ei s u2 este
constant i independent de X - ipoteza de homoscedasticitate, pe baza creia se poate admite c
legtura dintre Y i X este relativ stabil.
Acceptarea ipotezei se poate face prin intermediul mai multor procedee:
c2.1.) Procedeul grafic - care const n construirea corelogramei privind valorile variabilei
factoriale x i ale variabilei reziduale u (vezi Figura 2).

0.14
y
0.12
0.1
0.08
0.06
0.04
0.02
0
-0.02

20

30

50

60

80

90

100

110

120

x 150

-0.04
-0.06
-0.08
-0.1
-0.12
-0.14

Figura 2

Deoarece graficul punctelor empirice prezint o distribuie oscilant, se poate accepta


ipoteza c cele dou variabile sunt independente i nu corelate.
c2.2.) Procedeul dispersiilor variabilei reziduale
Acest procedeu se poate aplica numai atunci cnd se dispune de serii lungi de date. n
acest caz, seria valorilor variabilei reziduale se mparte n dou sau mai multe grupe, pentru
fiecare grup calculndu-se dispersiile respective. Dac se acce
pt c dispersiile acestor grupe nu difer semnificativ - se utilizeaz testul Fisher-Snedecor,
atunci se poate accepta ipoteza de homoscedasticitate; n cazul contrar, indicnd
heteroscedasticitatea, se procedeaz la eliminarea acestui fenomen cu ajutorul metodei regresiei
ponderate. n cazul de fa, datorit numrului mic de valori (date), nu se recomand utilizarea
acestui procedeu, deoarece nu s-ar obine rezultate concludente.
c2.3.) Acceptarea sau respingerea ipotezei de homoscedasticitate cu ajutorul analizei
variaiei (vezi punctul d)).
c3) Valorile variabilei reziduale ( u$ i ) sunt independente, respectiv nu exist fenomenul de
autocorelare.
Acceptarea sau respingerea acestei condiii se poate face cu:

c3.1.) Procedeul grafic - corelograma ntre valorile variabilei dependente ( y ) i valorile


variabilei reziduale ( u$ i ) (vezi Figura 3).
0.14
u
0.12
0.1
0.08
0.06
0.04
0.02
0
-0.02

0.5

0.7

0.8

1.1

1.3

1.4

1.6

1.8

2.1

-0.04
-0.06
-0.08
-0.1
-0.12
-0.14

Figura 3

Ca i n graficul precedent, distribuia punctelor empirice fiind oscilant, se poate accepta


ipoteza de independen a erorilor.
c3.2.) Testul Durbin-Watson const n calcularea termenului empiric:
n

( u$
d=

u$ i 1 )

i=2
n

u$

2
i

i =1

i compararea acestei mrimi d cu dou valori teoretice d 1 i d 2 , preluate din tabela DurbinWatson (vezi anexa nr. 1) n funcie de un prag de semnificaie , arbitrar ales, de numrul
variabilelor exogene ( k ) i de valorile observate ( n, n 15) .
Acceptarea sau respingerea ipotezei de independen a erorilor se bazeaz pe o anumit
regul, care const n:
- dac 0 < d < d 1 autocorelare pozitiv;
- dac d 1 d d 2 indecizie, recomandndu-se acceptarea autocorelrii pozitive;

- dac d 2 < d < 4 d 2 erorile sunt independente;


- dac 4 d 2 d 4 d 1 indecizie, recomandndu-se acceptarea autocorelrii
negative;
- dac 4 d 1 < d < 4 autocorelare negativ.
Pe baza datelor problemei, valoarea empiric a variabilei Durbin-Watson este:
10

(u
d=

u i 1 )

i =2
10

=
2
i

0,0768
= 1,86
0,0413

i =1

Lucrnd cu un prag de semnificaie = 0,01 , numrul variabilelor exogene fiind k = 1 ,


iar numrul observaiilor n = 10 , din tabela distribuiei Durbin-Watson se citesc valorile (pentru
cazul n = 15 ) d1 = 0,81 i d 2 = 107 .
Deoarece d 2 = 1,07 < d = 1,82 < 4 d 2 = 2,93 , se poate accepta ipoteza de independen
a valorilor variabilei reziduale.
c3.3.) Coeficientul de autocorelaie de ordinul 1
n

u u
i

r1 =

i=2
n

i 1

2
i 1

i =2

Se poate demonstra c, dac n , ntre variabila Durbin-Watson i coeficientul de


autocorelaie de ordinul 1 exist urmtoarea relaie:
n

(u$i u$i 1 )
d=

i =2
n

u$
i =1

=
2
i

u$i2

i =2
n

u$
i =1

+
2
i

i =2
n

u$
i =1

Dar, pentru n , se poate accepta c:


n

u$
i=2
n

u$
i =1

2
i

=1
2
i

u$i21

2 u$i u$i 1

2
i

i =2
n

u$
i =1

2
i

u$

2
i 1

u$ i2

i=2

i =1

u$
i=2
n

2
i 1

=1

u$

2
i

i =1
n

u$ u$
i

i =2
n

u$

i 1

= r1
2
i 1

i =2

d = 1 + 1 2r1 r1 = 1

d
2

tiind c:

1 autocorelare strict negativa


4
indecizie

r1 = 0 independenta
d = 2
indecizie

1 autocorelare strict pozitiva


0

Calculul coeficientului de autocorelaie de ordinul 1:


10

u u
i

r1 =

i =2
10

i 1

=
2
i 1

0,0024
= 0,059
0,0405

i =2

Deoarece r1 = 0,059 0 , i acest indicator arat c ipoteza de independen a valorilor


variabilei reziduale poate fi acceptat.
c4) Verificarea ipotezei de normalitate a valorilor variabilei reziduale
Se tie c, dac erorile urmeaz legea normal de medie zero i de abatere medie ptratic
su$ (consecina ipotezelor c1, c2, c3), atunci are loc relaia:

P( u$i t su$ ) = 1 .
Pe baza acestei relaii, n funcie de diferite praguri de semnificaie , din tabela
distribuiei normale se vor prelua valorile corespunztoare ale lui t .

Lucrnd cu un prag de semnificaie = 0,05 , din tabela distribuiei Student ( n < 30) se
preia valoarea variabilei, cu un numr de grade de libertate v = n 2 = 10 2 = 8, t0.05;8 = 2,306 ,
iar pentru un prag de semnificaie = 0,01 , avem t 0.01;8 = 3.355 . Cu ajutorul acestor date,
verificarea ipotezei de normalitate se poate face pe baza urmtorului grafic (figura 4): pe axa Ox
se vor reprezenta valorile ajustate ale variabilei y ( y i - vezi tabelul 2, coloana 5), iar pe axa Oy se
vor trece valorile variabilei reziduale ( u i - vezi tabelul 2, coloana 7).
Se observ c valorile empirice ale variabilei reziduale se nscriu n banda construit, cu
un prag de semnificaie = 0,05 . Ca atare, ipoteza de normalitate a variabilei reziduale poate fi
acceptat cu acest prag de semnificaie.

t 0 , 05 * s u

u
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
-0.020.498

Y
0.618

0.858

0.978

1.218

1.338

1.458

1.578

1.698

2.058

-0.04
-0.06
-0.08
-0.1
-0.12

+ t 0,05 * s u

-0.14
-0.16

Figura 4

d) Verificarea semnificaiei estimatorilor i a verosimilitii modelului


d1) Verificarea semnificaiei estimatorilor
Estimatorii sunt semnificativ diferii de zero, cu un prag de semnificaie , dac se
verific urmtoarele relaii:
a$
sa$

> t ;

b$
sb$

> t

tiind

(vezi

punctul

b)

al

problemei)

a = 0,2409; s a = 0,0523

b = 0,0122; sb = 0,0006 i lucrnd cu un prag de semnificaie = 0,05 , din tabela distribuiei


Student se preia valoarea t0.05;8 = 2,306 , iar pentru = 0,01 se preia valoarea t0.01;8 = 3,355 .
t a =

t b =

a
s a

b
sb

0,2409
= 4,6611 > t 0.01;8 = 3,355
0,0523

0,0122
= 21,0187 > t 0.01;8 = 3,355
0,0006

Pe baza calculelor de mai sus se observ faptul c ambii estimatori sunt semnificativ
diferii de zero, pentru un prag de semnificaie = 0,01 , fapt confirmat i de pragul de
semnificaie, P-value, corespunztor celor doi parametri, care este 0,0017<0,01 i, respectiv
0,0000<0,01.
Intervalul de ncredere pentru parametrul a este:

a [a t 0,01;8 s a ] a [0,2409 3,355 0,0523] = [0,0656; 0,4163]


Intervalul de ncredere pentru parametrul b este:

b b t 0;01;8 s b b [0,0122 3,355 * 0,0006] = [0,0103; 0,0142]

d2) Verificarea verosimilitii modelului


Pentru a accepta ipoteza de liniaritate se calculeaz coeficientul de corelaie liniar:

ry / x =

cov( y, x )

x y

(y

y )( xi x )

n x y

186,7
186,7
=
= 0,9911
10 * 39,1024 * 0,4818 188,4

Coeficientul de corelaie liniar fiind definit n intervalul [ 1;1] , rezult c valoarea


obinut de 0,9911 indic o puternic corelaie liniar ntre cele dou variabile.
Verificarea semnificaiei coeficientului de corelaie:
- se stabilete ipoteza nul: H0: r = 0;
- se stabilete ipoteza alternativ: H1: r 0.

- se calculeaz testul t:

tr =
Deoarece

r r n2
0,9911 8
=
=
= 21,0187
2
sr
1 r
1 0,99112
t r = 21,0187 > t ;n k 1 = t 0, 01; 8 = 3,355

coeficientul

de

corelaie

este

semnificativ diferit de zero, pentru un prag de semnificaie =0,01.


Verificarea verosimilitii modelului se face cu ajutorul analizei dispersionale (analiza
variaiei).
Tabelul 3
Sursa de

Msura

Nr. grade

Dispersii

variaie

variaiei

de
libertate

corectate

Variana

10

2
V = ( y i y )
2
x

i =1

dintre

k =1

= 2,2797

V x2
k
= 2,2797
sY2 / X =

Valoarea testului F
Fc

Fc =

sY2 / X
su2

= 441,7857

grupe

Variana
rezidual

Variana
total

10

Vu2 = ( y i Yi )

i =1

10

F0, 05;1;8 = 5,32


F0, 01;1;8 = 11,3

Vu2
n k 1
= 0,0052

s u2 =

n k 1= 8

= 0,0413

F ; v1 ;v2

V02 = ( yi y )
i =1

= 2,321

n 1= 9

Testul Fisher-Snedecor indic faptul c rezultatele obinute sunt semnificative. cu un prag


de semnificaie de 1%. Fc = 434,52 > F0.01;1;8 = 11,3 , iar Significance F (pragul de semnificatie)
este 0,0000 (valoare mai mic de 0,01), respectiv modelul de regresie construit este valid i poate
fi utilizat pentru analiza dependenei dintre cele dou variabile.
Pe baza datelor din tabel se poate calcula raportul de corelaie dintre cele dou variabile:

V x2
Vu2
=
= 1 2 =
V02
V0

Ry / x

2,2797
= 0,9911
2,321

Se poate demonstra c, n cazul unei legturi liniare, raportul de corelaie este egal cu
coeficientul de corelaie liniar.

y i = a + b * xi + u y = a + b * x ; Yi = a + b * xi
10

( y

y)

i =1
10

R=

(y

y)

(a + bx
(y

=
2

a bx )

y)

b (x x )
(y y)

i =1

(x
(y

= b$

x)

i
i

y)

= b$ x = ry / x
y

na + b xi = y i

2
a xi + b xi = y i xi

b =

2
x

(x
=

i
2
i

x)

n xi2 ( xi )

(x
=

(x

n y i xi xi y i

2
i

2 xi x + x 2

xi2
n

+ x*y =

2
i

2
i

b =

(x y
i

x*y
x2

2x

n
i

y x

x )( y i y )
n

2x + x =

cov( y, x ) =

y x

n
xi

xi2

y
y x
x
x

n
xi

x
n

+ x2 =

x*y

x2

xi y x y i + x * y )
n

x y

y*x x*y + x*y =

x y
i

x y
i

x*y

cov( y , x)
b$ =
2

ry / x =

cov( y, x )

x y

cov( y, x ) x x

= b
= Ry / x
2

Verificarea semnificaiei raportului de corelaie se face cu ajutorul testului FisherSnedecor:

Fc = (n 2 )
Fc = 8 *

R2
, R fiind semnificativ dac Fc F ;v1 ;v2 .
1 R2

0,9822
= 8 * 55,1798 = 441,7857 > F0.01;1;8 = 11,3
0,0178

Deoarece raportul de corelaie este semnificativ diferit de zero, cu un prag de semnificaie


= 0.01 , rezult modelul econometric:

y i = 0,2409 + 0,0122 xi ;
(0,0523) (0,0006)

R = 0 , 9911

d = 1,86

su = 0,0718
care descrie corect dependena dintre cele dou variabile, acesta explicnd 98,22% din variaia
total a variabilei dependente, adic variaia cifrei de afaceri se datoreaz n proporie de 98,22%
suprafeei comerciale a magazinului.

V02 = Vx2 + Vu2 100 =

Vx2
Vu2
*
100
+
* 100
V02
V02

e) Dac un antreprenor va dispune de o suprafa comercial de 130 m2 ( x = 130) , n


medie, ncasrile lunare vor fi egale cu:

Y/ x =130 = a + bx = 0,2409 + 0,0122 * 130 = 1,8283 1,83 mil.lei


Pe baza ipotezei formulate la punctele precedente, cifra de afaceri y urmeaz o distribuie
normal (sau distribuia Student, dac n 30 ), de medie Y i de abatere medie ptratic sY ,
L( y) = N (Y , sY ) .

Pentru x = 130 Y = 1,83

1
( x x )2
sY / x =130 = s u2 1 + +
n ( x x )2
i

= 0,0052 * 1 + 1 + (130 81)


10

15290

= 0,0808

Estimarea cifrei de afaceri, care se poate obine dac suprafaa va fi de 130 m2 pe baza
unui interval de ncredere se calculeaz cu relaia:

P(Y/ x =130 t sY / x =130 y / x =130 Y/ x =130 + t sY / x =130 ) = 1


Pentru = 0,01 i v = n k 1 = 8 , din tabela distribuiei Student se preia valoarea
variabilei t ;v = t 0.01;8 = 3,355 .
Deci, cu un prag de semnificaie de 0,01 sau cu o probabilitate egal cu 0,99, cifra de
afaceri pe care o va putea realiza ntreprinztorul va fi cuprins n intervalul:

P( y / x=130 [1,83 3,355 * 0,0808]) = 1 0,01 = 0,99


P( y / x =130 [1,64;2,01]) = 0,99
Aplicaii propuse spre rezolvare
1. n scopul evalurii impactului pe care variaia preului unui produs l are asupra variaiei
cantitilor vndute din acel produs a fost selectat un eantion reprezentativ de 10 de
magazine, n care s-au urmrit valorile urmtoarelor variabile:
-

Q cantitatea vndut din produsul respectiv (kg)

P preul produsului (RON)

A fost folosit pentru estimarea parametrilor urmtorul model, ale crui rezultate sunt prezentate
mai jos:
Q = + P+ .

SUMMARY OUTPUT

Regression Statistics
Multiple R

0.913173052

R Square

0.833885023

Adjusted R Square

0.813120651

Standard Error

10.73509502

Observations

10

ANOVA
df

SS

Regression

Residual

Total

Coefficients
Intercept
Pret vanzare (mii $)

MS

4628.0619 . .
.
5550

Standard Error

-29.32363674

20.687667

0.068972606

0.0108839

a. Testati validitatea modelului de regresie, pentru un nivel de semnificaie de 5%;


b. Testati, interpretai i determinai intervalele de ncredere pentru coeficienii modelului.

2. Pentru a decide n ce zon s fie amplast un magazin de casete video, managerul unei
firme de comercializare i nchiriere de casete video realizeaz un studiu. Astfel, el
consider c succesul afacerii este cuantificat prin profitul anual brut obinut (sute euro).
Principalul factor de influen considerat pentru succesul acestei afaceri este venitul
mediu al locuitorilor de pe o raz de un kilometru (zeci euro). Sunt selectate aleator 5
supermarket-uri i sunt nregistrate valorile celor 2 variabile.

Profit (mii euro)

11

15

Venit (sute euro)

12

21

25

20

Observaie!
Aplicaia se rezolv pe baza rezultatelor din tabelele output ului obinut n
urma prelucrrii cu EXCEL a datelor

a) Estimai parametrii ecuaiei de regresie, n ipoteza unei dependene liniare.


b) Testai validitatea modelului de regresie, pentru un nivel de semnificaie de 5%;
c) Msurai intensitatea legturii dintre cele dou variabile, folosind un indicator adecvat i
testai semnificaia acestuia, pentru un nivel de ncredere de 95% .
3. O firm ce organizeaz licitaii pentru vnzarea unor antichiti dorete s determine
relaia dintre preul (mii euro) obinut pentru articolele licitate i vechimea (ani) a obiectelor. n
urma prelucrrii cu EXCEL a datelor culese de la un eantion aleatoriu de 10 licitaii, s-au
obinut rezultatele:

SUMMARY OUTPUT
Regression Statistics
Multiple R

0,913173

R Square

0,833885

Adjusted R
Square

0,813121

Standard Error

142,1289

Observations

10

Vechime

Mean

100

Standard Deviation

24.83277

Smple Variance

616.6667

ANOVA
df
Regression

SS
1

Residual

..

Total

Vechime

811245

F
.

161605
972850

Standard
Error
Coefficients
Intercept

MS

665,991

t Stat

3,397844

12,09009 1,907813 ...

In ipoteza unui model de regresie liniar, se cere:


a) s se testeze semnificaia modelului, pentru un nivel de semnificaie de 5%;
b) s se determine intervalele de ncredere pentru parametrii modelului i s se comenteze
rezultatele obinute.
4. Managerul unei companii de asigurri dorete s afle dac contactarea potenialilor
clieni prin telefon are influen asupra vnzrilor. Pentru aceasta, au fost selectai aleator 5
ageni de asigurri, de la care s-au nregistrat numrul sptmnal al convorbirilor telefonice (X)
i numrul polielor de asigurare ncheiate ntr-o sptmn (Y):
Nr. de convorbiri telefonice

66

43

57

32

18

Nr. polielor de asigurare

20

15

18

12

a) Reprezentai grafic datele i determinai modelul liniar de regresie dintre cele dou
variabile;
b) Msurai intensitatea legturii dintre cele dou variabile folosind coeficientul de corelaie
i testai semnificaia acestuia, pentru un nivel de semnificaie de 5%;

c) Efectuai o previzionare punctual i pe interval de ncredere a numrului de polie de


asigurare ncheiate, dac ntr-o sptmn s-au efectuat 50 de convorbiri telefonice.

Vous aimerez peut-être aussi