Vous êtes sur la page 1sur 20

8

Korelacija
i
linearna regresija

8.1 Korelacija
Ako želimo da ispitamo da li postoji zavisnost izmed̄u dva (ili više) obeležja, tada govo-
rimo o utvrd̄ivanju postojanja korelacije izmed̄u tih obeležja.

Jedna od mera povezanosti dva obeležja jeste Pearson-ov koeficijent, u oznaci rxy , defin-
isan kao
sxy
rxy = ,
sx sy
pri čemu je P
xi yi
sxy = − x̄ȳ kovarijansa;
n
P 2
xi
s2x = − x̄2 varijansa prvog obeležja;
n
P 2
yi
s2y = − ȳ 2 varijansa drugog obeležja;
n
P
xi
x̄ = sredina prvog obeležja;
n
P
yi
ȳ = sredina drugog obeležja;
n
xi vrednosti prvog obeležja;
yi vrednosti drugog obeležja i
n veličina uzorka.

87
88 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA

Pozitivan koeficijent rxy ukazuje na to da postoji tendencija u smislu da, kako rastu
vrednosti promenljive xi , tako rastu i njima odgovarajuće vrednosti promenljive yi . Neg-
ativan koeficijent rxy ukazuje, obrnuto, da, ako vrednosti xi rastu, da onda postoji ten-
dencija da njima odgovarajuće vrednosti yi opadaju ili obratno, ako vrednosti xi opadaju
da vrednosti yi rastu. Što je tendencija veća, u ma kom od pravaca, to je apsolutna
vrednost koeficijenta korelacije bliža 1, pa je i linearna veza jača, u nekom od pravaca
- pozitivnom ili negativnom.
Napomenimo da se Pearson-ov koeficijent koristi samo u slučaju linearne korelacije. Ako
su podaci takvi da med̄u njima postoji neka nelinearna veza, tada je moguće da vrednost
Pearson-ovog koeficijenta bude bliska nuli, što nas može navesti na pogrešan zaključak
da korelacije (zavisnosti) nema.
Ako Pearson-ov koeficijent koristimo kao alat za donošenje odluka, uobičajeno je sledeće
statističko zaključivanje:

Interval kojem pripada vrednost |r| Interpretacija


[0.00,0.40) slaba korelacija
[0.40,0.75) umerena korelacija
[0.75,0.85) dobra korelacija
[0.85,1.00] odlična korelacija

Kvadrat Pearson-ovog koeficijenta korelacije naziva se koeficijent determinacije, u no-


2
taciji rxy . Ova veličina je pokazatelj koliko su promene jedne promenljive prouzrokovane
promenama druge promenljive, i konvencija je da se izražava u procentima.
8.1. KORELACIJA 89

Zadatak 8.1 Prikupljeni su podaci o prosečnom dohotku po članu domaćinstva i


potrošnji benzina za nekoliko slučajno izabranih domaćinstava u jednom gradu i
prezentovani tabelom u nastavku:

doh./čl. domaćinstva (10000 RSD) 2 3 3 4 5 5 6 7 8 10


potrošnja benzina (10l) 4 3 5 6 7 8 9 12 10 14

Prikazati podatke u vidu dijagrama rasturanja, a zatim odrediti koeficijent korelacije


i koeficijent determinacije.

Rešenje

15

10
potrošnja

2 4 6 8 10 12
dohodak

i xi yi x2i yi2 xi yi Statistike za obeležje x

1 2 4 4 16 8 x̄ 5.3000
2 3 3 9 9 9 s2x 5.6100
3 3 5 9 25 15 sx 2.3685
4 4 6 16 36 24 Statistike za obeležje y
5 5 7 25 49 35
ȳ 7.8000
6 5 8 25 64 40
s2y 11.1600
7 6 9 36 81 54
sy 3.3407
8 7 12 49 144 84
9 8 10 64 100 80 sxy 7.5600
10 10 14 100 196 140 rxy 0.96
P
53 78 337 720 489 2
rxy 91.29%
90 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA

Zadatak 8.2 Ispituje se težina suve materije paradajza uzgajanog na tlu sa ra-
zličitom količinom Ca. Podaci su dati u tabeli:

Ca u tlu (mg/cm3 ) 12 13 15 17 18 19 21 22 23 25
tež. suve mat. (g) 2, 9 3, 1 4, 7 4, 5 4, 7 5, 3 6, 1 6, 5 6, 2 6, 8

Nacrtati dijagram rasturanja i ispitati korelaciju izmed̄u sadržaja Ca u tlu i težine


suve materije u plodu paradajza.

Rešenje

6
težina suve mat.

12 14 16 18 20 22 24 26
količina Ca

i xi yi x2i yi2 xi yi Statistike za obeležje x

1 12 2.9 144 8.41 34.8 x̄ 18.5000


2 13 3.1 169 9.61 40.3 s2x 16.8500
3 15 4.7 225 22.09 70.5 sx 4.1049
4 17 4.5 289 20.25 76.5 Statistike za obeležje y
5 18 4.7 324 22.09 84.6
ȳ 5.0800
6 19 5.3 361 28.09 100.7
s2y 1.6616
7 21 6.1 441 37.21 128.1
sy 1.2890
8 22 6.5 484 42.25 143
9 23 6.2 529 38.44 142.6 sxy 5.1300
10 25 6.8 625 46.24 170 rxy 0.97
P
185 50.8 3591 274.68 991.1 2
rxy 94.00 %
8.1. KORELACIJA 91

Zadatak 8.3 U popularnom ženskom časopisu objavljuje se članak o tome koliko je


devojakama važna visina muškarca. Za jedan od pokazatelja izabrana je korelacija
izmed̄u visine momka i visine devojke u nekoliko slučajno izabranih parova:

visina momka (m) 1, 76 1, 75 1, 74 1, 86 1, 77 1, 83 1, 97 1, 75


visina devojke (m) 1, 71 1, 67 1, 77 1, 69 1, 69 1, 78 1, 83 1, 64

Nacrtati dijagram rasturanja, odrediti koeficijent korelacije izmed̄u visine momka i


visine devojke i koeficijent determinacije. Kakve je rezultate o vezi izmed̄u visine
devojke i visine momka objavio časopis?

Rešenje

1.85

1.8
visina devojke

1.75

1.7

1.65

1.75 1.8 1.85 1.9 1.95 2


visina momka

Statistike za obeležje x
i xi yi x2i yi2 xi yi x̄ 1.8038
1 1.76 1.71 3.0976 2.9241 3.0096 s2x 0.0055
2 1.75 1.67 3.0625 2.7889 2.9225 sx 0.0745
3 1.74 1.77 3.0276 3.1329 3.0798 Statistike za obeležje y
4 1.86 1.69 3.4596 2.8561 3.1434
ȳ 1.7225
5 1.77 1.69 3.1329 2.8561 2.9913
s2y 0.0036
6 1.83 1.78 3.3489 3.1684 3.2574
sy 0.0602
7 1.97 1.83 3.8809 3.3489 3.6051
8 1.75 1.64 3.0625 2.6896 2.87 sxy 0.0029
rxy 0.65
P
14.43 13.78 26.0725 23.765 24.8791
2
rxy 42.70 %
92 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA

Zadatak 8.4 Pri proizvodnji multivitaminskog soka pretpostavlja se da brzina fer-


mentacije zavisi od količine dodatog šećera. Na slučajnom uzorku dobijeni su podaci:

kol. dod. šeć. (kg) 1, 0 2, 2 2, 7 4, 0 4, 9 5, 6 6, 5 7, 3 8, 8 9, 8


vr. ferm. (dana) 24 18 17 15 14 10 8 7 5 4

Nacrtati dijagram rasturanja i ispitati korelaciju izmed̄u količine dodatog šećera i


brzine fermentacije.

Rešenje
25

20
vreme ferm.

15

10

2 4 6 8 10 12
količina šećera

i xi yi x2i yi2 xi yi Statistike za obeležje x

1 1 24 1 576 24 x̄ 5.2800
2 2.2 18 4.84 324 39.6 s2x 7.4736
3 2.7 17 7.29 289 45.9 sx 2.7338
4 4 15 16 225 60 Statistike za obeležje y
5 4.9 14 24.01 196 68.6
ȳ 12.2000
6 5.6 10 31.36 100 56
s2y 37.5600
7 6.5 8 42.25 64 52
sy 6.1286
8 7.3 7 53.29 49 51.1
9 8.8 5 77.44 25 44 sxy -16.3760
10 9.8 4 96.04 16 39.2 rxy -0.98
P
52.8 122 353.52 1864 480.4 2
rxy 95.53 %
8.1. KORELACIJA 93

Zadatak 8.5 U popularnom muškom časopisu objavljuje se članak o tome kako nivo
fizičkih aktivnosti utiče na radnu sposobnost. Za jedan od pokazatelja izabrana je
korelacija izmed̄u broja sati fizičkog vežbanja dnevno i efikasnosti na poslu, izraženoj
kroz vreme potrebno da se obave radni zadaci. Podaci prikupljeni na slučajnom
uzorku od nekoliko muškaraca dobi 30-35 godina dati su u tabeli:

fizičke aktivnosti (h) 1 2 2 3 3 2 4 4


efikasnost (h) 6 5, 5 5 5 4, 5 6 4 3, 5

Nacrtati dijagram rasturanja, odrediti koficijent korelacije izmed̄u broja sati fizičkog
vežbanja i efikasnosti na poslu i koeficijent determinacije. Kakve je rezultate o vezi
izmed̄u broja sati fizičkog vežbanja i efikasnosti na poslu objavio časopis?

Rešenje

6
efikasnost

1 2 3 4 5
fizička aktivnost

Statistike za obeležje x
i xi yi x2i yi2 xi yi x̄ 2.6250
1 1 6 1 36 6 s2x 0.9844
2 2 5.5 4 30.25 11 sx 0.9922
3 2 5 4 25 10 Statistike za obeležje y
4 3 5 9 25 15
ȳ 4.9375
5 3 4.5 9 20.25 13.5
s2y 0.7148
6 2 6 4 36 12
sy 0.8455
7 4 4 16 16 16
8 4 3.5 16 12.25 14 sxy -0.7734
rxy -0.92
P
21 39.5 63 200.75 97.5
2
rxy 85.01 %
94 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA
8.2 Linearna regresija
Ako izmed̄u posmatranih obeležja postoji neka vrsta zavisnosti, postavlja se pitanje kakva
je ta povezanost, odnosno može li se, i u kom obliku, uspostaviti veza na matematički
način. Tada govorimo o regresiji, a na ovom mestu pažnju posvećujemo specijalnom i
najjednostavnijem pojavnom obliku iste, odnosno linearnoj regresiji. Za slučaj kada pos-
matramo dve promenljive, u zavisnosti od toga koju promenljivu proglasimo nezavisnom,
dobijamo dve regresione prave.

Prva regresiona prava ima jednačinu

ŷ = ax + b,
gde je
sxy
a= , b = ȳ − ax̄.
s2x
Druga regresiona prava ima jednačinu

x̂ = cy + d,
gde je
sxy
c= , d = x̄ − cȳ.
s2y
8.2. LINEARNA REGRESIJA 95

Zadatak 8.6 Prikupljeni su podaci o prosečnom dohotku po članu domaćinstva i


potrošnji benzina za nekoliko slučajno izabranih domaćinstava u jednom gradu i dati
su sledećom tabelom:
doh./ čl. dom. (10000 RSD) 2 3 3 4 5 5 6 6 8 10
potrošnja benzina (10l) 4 3 5 6 7 8 9 12 10 14

Odrediti prvu regresionu pravu i prikazati je na dijagramu rasturanja. Zatim, odrediti


očekivanu potrošnju benzina domaćinstva čiji članovi u proseku primaju 55000 RSD.

Rešenje

15 78
. 65
0
+
6 x
.347
1
10 =
y
potrošnja

2 4 6 8 10 12
dohodak

Statistike za obeležje x Statistike za obeležje y


x̄ 5.3000 ȳ 7.8000
s2x 5.6100 s2y 11.1600
sx 2.3685 sy 3.3407

Kovarijansa Koeficijent korelacije


sxy 7.5600 rxy 0.96

Koeficijenti prve reg. prave Prognoza


a 1.3476 x 5.5
b 0.6578 ŷ 8.0695

Dakle, očekuje se potrošnja od oko 80 litara benzina.


96 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA

Zadatak 8.7 Ispituje se težina suve materije paradajza uzgajanog na tlu sa ra-
zličitom količinom kalcijuma. Podaci su dati u tabeli:

Ca u tlu (mg/cm3 ) 12 13 15 17 18 19 21 22 23 25
tež. suve mat. (g) 2, 9 3, 1 4, 7 4, 5 4, 7 5, 3 6, 1 6, 5 6, 2 6, 8

Odrediti neophodan sadržaj kalcijuma u zemljištu na kome se očekuje plod paradajza


čija će težina suve materije biti 5 grama.

Rešenje

Statistike za obeležje x Statistike za obeležje y


x̄ 18.5000 ȳ 5.0800
s2x 16.8500 s2y 1.6616
sx 4.1049 sy 1.2890

Kovarijansa
sxy 5.1300

Koeficijenti druge reg. prave Prognoza


c 3.0874 y 5
d 2.8161 x̂ 18.2530

U zemljištu je neophodno da bude 18,25 mg/cm3 Ca, kako bi očekivani plod paradajza
dao suvu materiju težine 5 g.
Zadatak 8.8 U popularnom ženskom časopisu objavljuje se članak o tome koliko je
devojakama važna visina muškarca. Nekoliko slučajno izabranih parova je anketirano
i dobijeni su sledeći rezultati:

visina momka (m) 1, 76 1, 75 1, 74 1, 86 1, 77 1, 83 1, 97 1, 75


visina devojke (m) 1, 71 1, 67 1, 77 1, 69 1, 69 1, 78 1, 83 1, 64

Kakve je rezultate o očekivanoj visini momka prosečne devojke visoke 175cm objavio
časopis?

Rešenje

Statistike za obeležje x Statistike za obeležje y


x̄ 1.8038 ȳ 1.7225
s2x 0.0055 s2y 0.0036
sx 0.0745 sy 0.0602
8.2. LINEARNA REGRESIJA 97

Kovarijansa
sxy 0.0029

Koeficijenti druge reg. prave Prognoza


c 0.8092 y 1.75
d 0.4100 x̂ 1.8260

Očekivana visina momka čija je devojka visoka 175cm je 183cm.

Zadatak 8.9 Pri proizvodnji multivitaminskog soka pretpostavlja se da brzina fer-


mentacije zavisi od količine dodatog šećera. Na slučajnom uzorku dobijeni su podaci:

kol. dod. šeć. (kg) 1, 0 2, 2 2, 7 4, 0 4, 9 5, 6 6, 5 7, 3 8, 8 9, 8


vr. ferm. (dana) 24 18 17 15 14 10 8 7 5 4

Odrediti prvu regresionu pravu i prikazati je na dijagramu rasturanja. Zatim, odrediti


očekivano vreme fermentacije soka u koji je dodato 5kg šećera.

Rešenje

25
y
=

20 2.
191
2x
+
vreme ferm.

23
15 . 76
9

10

2 4 6 8 10 12
količina šećera
98 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA

Statistike za obeležje x Statistike za obeležje y


x̄ 5.2800 ȳ 12.2000
s2x 7.4736 s2y 37.5600
sx 2.7338 sy 6.1286

Kovarijansa
sxy -16.3760

Koeficijenti prve reg. prave Prognoza


a -2.1912 x 5
b 23.7694 ŷ 12.8135

Očekivano vreme fermentacije soka u koji je dodato 5kg šećera iznosi približno 13 dana.

Zadatak 8.10 U popularnom muškom časopisu objavljuje se članak o tome kako


nivo fizičkih aktivnosti utiče na radnu sposobnost. Za jedan od pokazatelja iz-
abrana je korelacija izmed̄u broja sati fizičkog vežbanja dnevno i efikasnosti na
poslu, izraženoj kroz vreme potrebno da se obave radni zadaci. Podaci prikupljeni
na slučajnom uzorku od nekoliko muškaraca dobi 30-35 godina dati su u tabeli:

fizičke aktivnosti (h) 1 2 2 3 3 2 4 4


efikasnost (h) 6 5, 5 5 5 4, 5 6 4 3, 5

Kakve je rezultate objavio časopis o tome kolika je očekivana efikasnost muškarca


koji ne radi fizičke vežbe i o tome koliko treba vežbati da očekivana efikasnost iznosi
4h?

Rešenje

Statistike za obeležje x Statistike za obeležje y


x̄ 2.6250 ȳ 4.9375
s2x 0.9844 s2y 0.7148
sx 0.9922 sy 0.8455

Kovarijansa
sxy -0.7734
8.2. LINEARNA REGRESIJA 99

Koeficijenti prve reg. prave Prognoza


a -0.7857 x 0
b 7.0000 ŷ 7.0000

Očekivano vreme za obavljanje radnih zadataka prosečnog muškarca koji ne vežba iznosi
7 dana.

Koeficijenti druge reg. prave Prognoza


c -1.0820 y 4
d 7.9672 x̂ 3.6393

Očekivan broj sati fizičkog vežbanja potrebnog da prosečan muškarac obavi radne zadatke
za 4 sata iznosi oko tri i po sata.

Zadatak 8.11 U jednom preduzeću, tokom 6 meseci, ispituje se veza izmed̄u broja
kišnih dana u mesecu i broja izostanaka sa posla. Podaci su sledeći:

broj kišnih dana u mesecu 16 11 10 8 7 2


broj izostanaka u mesecu 17 13 13 11 10 5

Ispitati korelaciju izmed̄u broja kišnih dana u mesecu i broja izostanaka sa posla.
Na osnovu ovog uzorka pomoću linearne regresije odrediti očekivani broj izostanaka
sa posla ako je čitav mesec sunčan. Nacrtati dijagram rasturanja i prvu regresionu
pravu.

Rešenje

Statistike za obeležje x Statistike za obeležje y


x̄ 9.0000 ȳ 11.5000
s2x 18.0000 s2y 13.2500
sx 4.2426 sy 3.6401

Kovarijansa Koeficijent korelacije Koeficijent determinacije


2
sxy 15.3333 rxy 0.99 rxy 98.58%

Koeficijenti prve reg. prave Prognoza


a 0.8519 x 0
b 3.8333 ŷ 3.8333
100 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA

Tokom meseca sa svim sunčanim danima očekivani broj izostanaka je pribiližno jedan.
20

33
15 3.8
+
1 9x
5
izostanci

0.8
10 y=

5 10 15 20
kišni dani

Zadatak 8.12 U popularnom muškom časopisu objavljuje se članak o tome koliko


dnevna količina unetih zasićenih masti utiče na kondiciju. Za jedan od pokazatelja
izabrana je korelacija izmed̄u dnevne količine unetih zasićenih masti u gramima i
vremena potrebnog ispitaniku da sprintom pretrči 100m u sekundama. Dobijeni su
sledeći rezultati:
količina zasićenih masti (g) 50 55 60 65 70 75 80
vreme (s) 12, 5 12, 9 13 14 14, 8 15 15

Odrediti dobijenu korelaciju, a zatim na osnovu ovog uzorka pomoću linearne re-
gresije odrediti očekivano prolazno vreme ispitanika, ako je dnevna količina unetih
zasićenih masti 100g. Koliko je potrebno da ispitanik dnevno unese zasićenih masti
da bi trčao 100m za 10s?

Rešenje

Statistike za obeležje x Statistike za obeležje y


x̄ 65 ȳ 13.8857
s2x 100 s2y 1.0012
sx 10 sy 1.0006

Kovarijansa Koeficijent korelacije Koeficijent determinacije


2
sxy 9.6429 rxy 0.96 rxy 92.16 %
8.3. ZADACI ZA SAMOSTALNI RAD 101

Koeficijenti prve reg. prave Prognoza


a 0.0964 x 100
b 7.6179 ŷ 17.2607

Ako je dnevna količina unetih zasićenih masti 100g, tada je prolazno vreme ispitanika
oko 17s.
Koeficijenti druge reg. prave Prognoza
c 9.6311 y 10
d -68.7342 x̂ 27.5764

Neophodno je da ispitanik dnevno unese oko 27g zasićenih masti da bi trčao 100m za
10s.

8.3 Zadaci za samostalni rad


Zadatak 8.13 Pretpostavlja se da postoji veza izmed̄u uspeha koji student ostvari
na testu i rezultata njegove aktivnosti na časovima. Za očekivati je da studenti koji
pokazuju dobre rezultate tokom vremena (kroz testove itd.) ostvare dobar rezultat i
na standardizovanom testu (pri čemu je max. broj bodova koji student može ostvariti
na istom 100). Nastavnik je odlučio da ispita ovu pretpostavku. On, na kraju školske
godine, računa koeficijent korelacije izmed̄u uspeha na testu i raspoloživih proseka
ocena svakog studenta, ne obraćajući pri tome pažnju na uspeh učenika sve dok ne
unese i njihove proseke ocena. Podaci do kojih je došao dati su u sledećoj tabeli.

test 98 94 88 77 59 63 84 75 72 62
prosek 3.6 3.1 4.0 3.0 3.0 2.2 1.7 2.6 2.9 1.6

(a) Odrediti koeficijent korelacije.

(b) Tumačiti rezultat iz (a) sa stanovišta pretpostavke o postojanju veze izmed̄u


proseka ocena i uspeha na završnom testu.
(c) Koji procenat odstupanja je objašnjen postojanjem veze izmed̄u promenljivih i
šta ta razlika znači sa statističkog stanovišta?

(d) Dati prognozu proseka ocena studenta koji je na standardizovanom testu ostvario
93 poena. Koja je prognoza proseka u slučaju da student ostvari redom 74,
odnosno 88 poena?
102 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA

Zadatak 8.14 Istraživač je, usled porasta broja Internet provajdera, odlučio da
ispita da li postoji veza izmed̄u cene usluge provajdera (zaokružene na dole), i stepena
zadovoljstva kupaca pruženom uslugom (na skali od 1 do 10, pri čemu 1 predstavlja
totalno nezadovoljstvo, a 10 apsolutno zadovoljstvo klijenta). Podaci su prikupljeni
i predstavljeni u tabeli.

cena 11 18 17 15 9 5 12 19 22 25
zadovoljstvo 6 8 10 4 9 6 3 5 2 10

(a) Odrediti koeficijent korelacije.


(b) Tumačiti rezultat iz (a) sa stanovišta pretpostavke o postojanju veze izmed̄u
mesečne cene usluge i zadovoljstva potrošača.

(c) Koji procenat odstupanja je objašnjen postojanjem veze izmed̄u promenljivih i


šta ta razlika znači sa statističkog stanovišta?

Zadatak 8.15 Pretpostavlja se da fluktuacije nivoa norepinefrina (NE) prate fluk-


tuacije bipolarnog afektivnog poremećaja (manično - depresivne bolesti). Stoga, nivo
NE tokom stanja depresije opada, dok je tokom maničnih stanja nivo NE u porastu.
Naučnici su, sa namerom da ispitaju pomenutu vezu, izmerili, u mokraći pacijenta sa
poremećajem i oscilacijama raspoloženja, nivoe NE mereći koncentraciju 3-metoksi-
4-hidroksifenilglikol metabolita (MHPG u mikrogramima na svaka 24 sata). Poznato
je da je povišeni nivo MHPG u vezi sa ubrzanim metabolizmom NE u centralnom
nervnom sistemu. Stepeni depresije su takod̄e zabeleženi, s tim da nizak nivo MHPG
rezultuje pojačanjem depresije, a da povišeni nivo istog dovodi do izrazite depresije.
Dobijeni podaci su prikazani u tabeli.

MHPG 980 1209 1403 1950 1814 1280 1073 1066 880 776
rasp. 22 26 8 10 5 19 26 12 23 28

(a) Odrediti koeficijent korelacije.


(b) Tumačiti rezultat iz (a) sa stanovišta pretpostavke o postojanju veze izmed̄u nivoa
MHPG i raspoloženja pacijenta.
(c) Koji procenat odstupanja je objašnjen postojanjem veze izmed̄u promenljivih i
šta ta razlika znači sa statističkog stanovišta?
(d) Dati prognozu raspoloženja pacijenta kojem je izmeren MHPG na nivou od 1100.
Koja je prognoza u slučaju kada je MHPG redom 950, odnosno 700?
8.3. ZADACI ZA SAMOSTALNI RAD 103

Zadatak 8.16 Posmatra se telesna masa deteta spram njegovih godina života. Po-
daci su prikazani u tabeli.

godine 2 3 5 7 8
masa 14 20 32 42 44

(a) Odrediti jednačinu regresione prave koja opisuje zavisnost godina života od telesne
mase.
(b) Na osnovu datih podataka, dati prognozu telesne mase šestogodišnjaka.

Zadatak 8.17 Zna se da je broj posetilaca šoping centra (u stotinama) u funkcional-


noj zavisnosti od udaljenosti objekta od centra populacije (u km). Neka su podaci
dati tabelom.
broj kupaca (x) 8 7 6 4 2 1
udaljenost (y) 15 19 25 23 34 40

(a) Odrediti koeficijent linearne korelacije.


(b) Ako je šoping centar udaljen 2 km od centra populacije, koliki je očekivani broj
posetilaca?

(c) Na kojoj udaljenosti bi trebali da budu šoping centar i centar populacije da bi


šoping centar privukao 500 kupaca?

Zadatak 8.18 Ocene petoro studenata iz matematike i hemije date su tabelarno:

matematika 6 6 8 9 10
hemija 6 7 8 8 10

Odrediti jednačine prve i druge regresione prave i odrediti očekivanu ocenu iz hemije
za studenta čija je ocena iz matematike 7.

Zadatak 8.19 Neka je koeficijent korelacije za posmatrani skup podataka rxy =


−0.9, pri čemu su sredine obeležja redom x̄ = 1 i ȳ = 2. Poznato je da je jedna
od sledećih jednačina pravih upravo ona koja odgovara jednačini druge regresione
prave. Odrediti koja je to od ponud̄enih jednačina.
(a) y = −x + 2, (c) 2x + y = 4,
(b) 3x − y = 1, (d) y = x + 1.
104 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA

Zadatak 8.20 Visine (u cm) i telesne mase (u kg) 10 igrača košarkaškog tima su:

visina (x) 186 189 190 192 193 193 198 201 203 205
masa (y) 85 85 86 90 87 91 93 103 100 101

(a) Odrediti jednačinu prve regresione prave, kao i koeficijent korelacije.

(b) Dati prognozu očekivane mase igrača visine 208 cm.

Zadatak 8.21 Neka je dat tabelarni prikaz zavisnosti broja radnih sati provedenih
u fabrici (x), i jedinica proizvoda (y). Na osnovu datih podataka odrediti jednačinu
prve regresione prave, koeficijent linearne korelacije i odrediti tip korelacije.

x 80 79 83 84 78 60 82 85 79 84 80 62
y 300 302 315 330 300 250 300 340 315 330 310 240

Zadatak 8.22 Rezultati ispitivanja o broju sati provedenih u snu i onih provedenih
gledajući televiziju, koje je obuhvatilo 50 ispitanika, prikazani su u tabeli.

h u snu (x) 6 7 8 9 10
h ispred televizije (y) 4 3 3 2 1
apsolutne frekvencije (fi ) 3 16 20 10 1

(a) Izračunati koeficijent korelacije.


(b) Odrediti jednačinu prve regresione prave.
(c) Dati prognozu očekivanog broja sati koje osoba provede gledajući televiziju, ako
u snu provede 8 sati.

Zadatak 8.23 U sklopu evaluacije rada i sposobnosti zaposlenih, svaki od 6 službenika


odradio je test sposobnosti, sa namerom da se, na osnovu rezultata testa, utvrdi
veza izmed̄u uspeha na testu (x) i ostvarene prodaje u prvom mesecu angažmana
službenika (u stotinama dolara) (y). Podaci su objedinjeni i dati tabelarno:

uspeh na testu (x) 25 42 33 54 29 36


ostvarena prodaja (y) 42 72 50 90 45 48

(a) Izračunati koeficijent korelacije i dati tumačenje rezultata.


(b) Odrediti jednačinu prve regresione prave i dati prognozu očekivane prodaje onog
službenika koji na testu osvoji 47 poena.
8.3. ZADACI ZA SAMOSTALNI RAD 105

Zadatak 8.24 Rezultati istraživanja redakcije auto magazina u vezi sa povezanošću


brzine automobila i potrošnje goriva prikazani su sledećom tabelom.

brzina 44 51 48 60 66 61
potrošnja goriva 22 26 21 28 33 32

Nacrtati dijagram rasipanja na osnovu priloženih podataka i odrediti koeficijent ko-


relacije.

Zadatak 8.25 Dati odgovore na sledeća pitanja:

1. Koja su ponud̄ena tvrd̄enja netačna?


(a) Koeficijent korelacije uzima vrednosti izmed̄u -1 i 1.
(b) Koeficijent korelacije je kvadrat koeficijenta determinacije.

2. Koeficijent determinacije je
(a) uvek nenegativan.
(b) kvadrat koeficijenta korelacije.
3. Dat je koeficijent korelacije koji iznosi −0.60. To znači da

(a) je koeficijent determinacije 0.36.


(b) su obeležja u obrnutoj vezi.
(c) su oba obeležja jednaka 0.
(d) su obeležja u direktnoj vezi.

4. Koje su od sledećih ponud̄enih korelacija jače od −0.54?


(a) 0.67
(b) 0.45
(c) 0.0
(d) -0.45
5. Jednačina regresione prave se koristi za
(a) merenje povezanosti dve promenljive.
(b) procenu vrednosti zavisne na osnovu vrednosti nezavisne promenljive.
(c) procenu vrednosti nezavisne na osnovu vrednosti zavisne promenljive.
(d) procenu koeficijenta korelacije.
106 GLAVA 8. KORELACIJA I LINEARNA REGRESIJA

6. Neka je data regresiona prava svojom jednačinom y = 35 + 6x. Vrednost 35


sugeriše da

(a) regresiona prava seče y-osu u vrednosti 35.


(b) je koeficijent korelacije upravo 35.
(c) je koeficijent determinacije baš 35.
(d) je veza opisana ovom regresionom pravom direktna.