Vous êtes sur la page 1sur 15

DODATAK 1.

METODE PROCJENJIVANJA
Metoda pomonih momenata
Definirali smo pomone momente populacije:
k-ti pomoni moment populacije: mk = x k p ( x ) = E ( X k )
xD

Moemo definirati k-ti pomoni moment uzorka: mku =

1 n k
xi
n i =1

Metoda momenata sastoji se u izjednaavanju k-tog momenta uzorka s k-tim


momentom populacije.
To smo malo prije i napravili kad smo izjednaili = x .
Primjer:
Ako imamo uzorak iz populacije za koju pretpostavljamo da je raspodijeljena prema openitoj

x 1e x /
, ( x 0) (8. predavanje), elimo procijeniti
( )
parametre i . Znademo da je E ( X ) = i E ( X 2 ) = 2 ( + 1) .

gama raspodjeli f ( x; , ) =

Procjenjitelji parametara i su

X2
(1 / n ) X i2 X 2
(1 / n ) X i2 X 2
X

Procjenjitelj najvjerojatnije vrijednosti


Neka sluajne varijable X1, X2,.Xn imaju zdruenu raspodjelu vjerojatnosti ili
funkciju gustoe vjerojatnosti danu s
f ( x1 , x 2 ,K x n ;1 ,2 ,...,m ) ,
gdje su parametri 1 ,2 ,...,m nepoznati. Ako su xi-ovi opaene vrijednosti uzorka,
onda je f funkcija parametara 1 ,2 ,...,m . Procjena najvjerojatnijih vrijednosti tih
parametara , ,..., je ona za koju vrijedi
1

f ( x1 , x 2 ,K xn ;1 ,2 ,...,m ) f ( x1 , x2 ,K xn ;1 ,2 ,...,m ) za sve 1 ,2 ,...,m .


Ako xi-ove zamijenimo Xi-ovima dobivamo procjenjitelje najvjerojatnijih
vrijednosti.

125

Primjer:
Na 7. predavanju traili smo najvjerojatniju vrijednost mjerene fizikalne veliine. Tada je
zdruena funkcija vjerojatnosti za n mjerenja bila:

f ( x1 , x 2 , K xn ; , ) =
2

1
2

( x1 )2 + ( x2 )2 +L+ ( xn )2
2 2

Traili smo maksimum te funkcije tako da smo derivirali njezin logaritam i dobili smo princip
najmanjih kvadrata. Ovaj procjenjitelj za je nepristran. Meutim, procjenjitelj
najvjerojatnije vrijednosti varijance je
2

(X
=

X)

, to je pristrani procjenjitelj.

Svojstva procjenjitelja najvjerojatnije vrijednosti


Procjenjitelj najvjerojatnije vrijednosti ima dva vrlo poeljna svojstva:
1. Invarijantnost na matematike operacije.
Procjenjitelj najvjerojatnije vrijednosti funkcije parametara jednak je funkciji
procjenjitelja najvjerojatnijih vrijednosti tih parametara, tj. h( X ) = h ( X ) .
Sjetimo se da to svojstvo nema oekivanje.
2. Za uzorak s velikim n, procjenjitelj najvjerojatnije vrijednosti je gotovo nepristran.
elimo pokazati da je E [h( X )] h (E ( X )) :
E(X ) =
Funkciju h( X ) razvijmo u Taylorov red:
h ( X ) = h ( ) + ( X )

dh
dX

2
1
( X )2 d h2
2
dX

dh
E [h ( X )] = E [h ( )] + E ( X )
dX
1 2 d 2h
= h ( ) + 0 +
2
dX 2

126

+ L h ( )

+L

1
d 2h
2
+ E (X )
2
dX 2

(za male )

+L

DODATAK 2. Odreivanje pravca regresije od oka


1 n
1 n
i
x
y
=
i
yi i ucrtamo toku ( x , y ) :
n i =1
n i =1

Najprije pronaemo vrijednosti x =

Kroz tu toku povuemo pravac za koji


nam se ini da najbolje prolazi kroz
podatke te oitamo nagib a i odsjeak
na ordinati b.

Ako je rasipanje veliko, najprije nacrtamo toku ( x , y ) . Zatim podijelimo podatke na


dvije skupine lijevo i desno od ( x , y ) . Izraunamo

1
1
xi
yL =

yi
nL x <x
nL x <x
i
i
i ucrtamo toke ( x L , y L ) i ( x D , y D ) :
xL =

xD =

1
xi
nD x >x
i

yD =

1
yi
nD x >x
i

900
800

Zatim povuemo pravac koji najbolje


prolazi kroz te tri toke:

700
600

900

400

800

300

700

200

600

100

500

0
5

10

15

20

25

30

35

40

500

400
300
200
100
0
5

10

15

20

25

30

35

40

127

DODATAK 3.

TESTIRANJE DOBROTE PRILAGODBE


Zamislimo da imamo pokus koji nam kao rezultat daje niz opaenih frekvencija.
Moemo pretpostaviti da neka teorijska raspodjela dobro opisuje opaenu raspodjelu
frekvencija. Da bismo tu pretpostavku (hipotezu) provjerili, primjenjujemo jedan od
statistikih testova prilagodbe. Najee se upotrebljava 2-test. Najprije emo se
podsjetiti to znamo o 2-raspodjeli:

2 raspodjela i tablice
Def:
Neka je N. Kontinuirana sluajna varijabla X ima 2 raspodjelu s parametrom
ako je njezina funkcija gustoe vjerojatnosti dana s
x / 2 1e x / 2
, x0
/2

2
(
/
2
)

f ( x; ) = 2 ( x ) =

0
, x<0

Parametar zove se broj stupnjeva slobode varijable X.

0,6

0,5

=2

0,4

=5

0,3

=10
=20

0,2

0,1

0
0

10

12

14

16

18

20

Vjerojatnost da varijabla X poprimi vrijednost veu od neke odreene vrijednosti


2 , dana je povrinom ispod repa krivulje:

P X > , =
2

( x )dx
2

2 ,

128

Indeks oznaava iznos te vjerojatnosti. Ako X poprimi vrijednost veu od 2 , ,


kaemo da je u kritinom podruju.

0,3

0,2

0,1

0,0
0

,3

10

Obino unaprijed odredimo koliku vjerojatnost elimo pa na osnovu toga


odreujemo kritinu vrijednost 2 , .
Te vjerojatnosti je teko izraunati pa se sluimo tablicama.
U testiranju hipoteza najee nas zanimaju vjerojatnosti:
P X > 02,05, = 0,05

)
(
P (X > 02,01, ) = 0,01

Za =3, vrijednosti su:

02.05, = 7,82

0,3

02.01, = 11,34

0,3

0,2

0,2

0,1

0,1

0,0
0

10

2
0.05,3

0,0
15

10 2
0.01,3

15

129

130

2-test
Razmotrimo pokus koji daje n opaenih frekvencija fi. elimo li provjeriti hipotezu da
ta opaanja slijede neku teorijsku raspodjelu, najprije izraunamo oekivane teorijske
vrijednosti fti. Opaene frekvencije, naravno, odstupaju od teorijskih, a mi elimo
donijeti odluku moemo li ta odstupanja pripisati sluaju. Nul-hipoteza je: "Opaanja
slijede teorijsku raspodjelu".

Definiramo statistiku:
n

( f i f ti )2

i =1

f ti

2
=
op

Postoji teorem (K. Pearson) koji kae:


2
priblino je raspodijeljena prema 2 raspodjeli sa stupnjem slobode
Statistika op
koji ovisi o broju opaanja (ili razreda) i o broju postavljenih ogranienja.

Broj stupnjeva slobode


Parametar definiran je kao:
2
= broj nezavisnih varijabli ukljuenih u izraun op

Nalazimo ga na sljedei nain:


= broj razreda broj ogranienja
Napomene:
Uzimanjem 2 raspodjele, diskretnu raspodjelu aproksimiramo kontinuiranom. Ta
aproksimacija ne vrijedi ako je oekivana frekvencija manja od 5. Taj problem
prevladavamo grupiranjem nekoliko razreda male frekvencije u jedan razred
dovoljno velike frekvencije.

2
Ako je vrijednost op
vrlo mala, mudro je upitati se nisu li opaeni rezultati
namjeteni.

Dobrota prilagodbe

Binomna raspodjela, p je poznat


Primjer:
Bacamo etiri novia 160 puta. Ako su novii poteni, oekujemo bimomnu
raspodjelu X~Bin(4,1/2). Opaene su frekvencije:
x
f(x)

0
5

1
35

2
67

3
41

4
12

Total
160

Provjeri s 5% signifikantnosti jesu li novii poteni!


131

Rjeenje: H0: Novii su poteni, tj. p=1/2


Teorijska raspodjela je binomna.
Imamo jedno ogranienje: fi=fti=160
Dakle, =5-1=4

x
0
1
2
3
4
zbroj

fi
5
35
67
41
12
160

(fi-fti)2/fti
2,5
0,625
0,817
0,025
0,4
4,367

fti
10
40
60
40
10
160

70

f
fteor

60

50

40

30

20

10

0
0

Za 4 stupnja slobode i 5% signifikantnosti, kritina vrijednost (iz tablica) je


02.05,4 = 9,49
2
Izraunata vrijednost op
= 4,37 ne pada u kritino podruje (vidi sliku). Stoga
hipotezu H0 zadravamo.
0,30
0,25
0,20
0,15

0,10
0,05

0,00
0

132

4,375

0.05,4 10

15

20

Primjeri testova dobrote prilagodbe.

Pravokutna raspodjela
Kockica se baca 120 puta i dobivaju se rezultati:
x
f(x)

1
14

2
16

3
24

4
22

5
24

6
20

Total
120

Provjeri s 5% signifikantnosti je li kocka potena!


Rjeenje: H0: Kocka je potena
Teorijska raspodjela je pravokutna: fti=20
Imamo jedno ogranienje: fi=fti=120
Dakle, =6-1=5
x
1
2
3
4
5
6
zbroj

fi
14
16
24
22
24
20
120

(fi-fti)2/fti
1,8
0,8
0,8
0,2
0,8
0
4,2

fti
20
20
20
20
20
20
120

Za 5 stupnjeva slobode i 5% signifikantnosti, kritina vrijednost (iz tablica) je

02.05,5 = 11,07
2
Izraunata vrijednost op
= 4,2 ne pada u kritino podruje (vidi sliku). Stoga
hipotezu H0 zadravamo.
0,30
0,25
0,20
0,15

0,10
0,05

0,00
0

4,2 5

2
10
0.05,5

15

20

Binomna raspodjela, p je nepoznat


Primjer s etvrtog predavanja:
Imamo velik broj proizvoda i uzimamo sluajni uzorak od n = 20 komada. Pokus
ponavljamo N = 100 puta. Zanima nas kolika je vjerojatnost karta (neispravnog
proizvoda) i da li je raspodjela binomna. Opaene su frekvencije:
133

x
f(x)

0
14

1
25

2
27

3
23

4
7

5
3

6
1

Total
100

Provjeri s 5% signifikantnosti je li raspodjela binomna!


x
Rjeenje: H0: Raspodjela je binomna; p = .
n
Izraunali smo na etvrtom predavanju x = 1,97 ; p = 0,0985
Imamo dva ogranienja: fi=fti=N=100 i np = x
Razredi 5 i 6 su premali pa grupiramo u jedan razred x 4.
Dakle, imamo pet razreda i dva ogranienja pa je =5-2=3
x
0
1
2
3
4
zbroj

fi
14
25
27
23
11
100

(fi-fti)2/fti
1/13
4/27
1/28
16/19
4/13
1,41

fti
13
27
28
19
13
100

30

f
fteor

28
26
24
22
20
18

16
14
12
10
8
6
4
2
0
0

Za 3 stupnja slobode i 5% signifikantnosti, kritina vrijednost (iz tablica) je


02.05,3 = 7.82
2
= 1.41 ne pada u kritino podruje (vidi sliku). Stoga
Izraunata vrijednost op
hipotezu H0 zadravamo.

134

0,30
0,25
0,20
0,15

0,10
0,05

0,00

0 1,41

2
0.05,3 10

15

20

Poissonova raspodjela

Biljeen je broj poziva u privatni stan u jednom danu u periodu od N = 150 dana.
Opaene su frekvencije:
X
f(x)

0
51

1
54

2
36

3
6

4
3

Total
150

Provjeri s 5% signifikantnosti je li raspodjela Poissonova!


Rjeenje: H0: Raspodjela je Poissonova; = x .
Izraunali smo na petom predavanju x = 1,04 ; = 1,04
Imamo dva ogranienja: fi=fti=N=150 i = x
Razred 4 je premalen pa grupiramo u jedan razred x 3.
Dakle, imamo etiri razreda i dva ogranienja pa je =4-2=2
x
0
1
2
3
zbroj

fi
51
54
36
9
150

fti
53
55
29
13
150

(fi-fti)2/fti
4/53
1/55
49/29
16/13
3,01

135

60

broj poziva
fteor (=1.04)

55
50
45
40

f(x)

35
30
25
20
15
10
5
0
0

Za 2 stupnja slobode i 5% signifikantnosti, kritina vrijednost (iz tablica) je


02.05,2 = 5.99
2
= 3.01 ne pada u kritino podruje (vidi sliku). Stoga
Izraunata vrijednost op
hipotezu H0 zadravamo.

0,50
0,45
0,40
0,35
0,30
0,25
2

0,20
0,15
0,10
0,05

0,00
0

136

3,0

2
5
0.05,2

10

15

20

Normalna raspodjela, i poznati


Primjer:
Dugogodinje statistike pokazuju da je visina studenata na nekom sveuilitu
normalno raspodijeljena s oekivanjem = 173 cm i standardnom devijacijom = 7
cm. Iz jedne generacije studenata na tom sveuilitu izdvojeno je 100 studenata,
mjerene su njihove visine i svrstane u razrede. Opaene su frekvencije:
x
f(x)

154-160
5

160-166
17

166-172
38

172-178
25

178-184
9

184-190
6

Total
100

Provjeri s 5% signifikantnosti je li raspodjela normalna s s oekivanjem = 173 cm i


standardnom devijacijom = 7 cm !
Rjeenje: H0: Raspodjela je Gaussova s oekivanjem = 173 cm i standardnom
devijacijom = 7 cm.
50
45
40

broj studenata

35
30
25
20
15
10
5
0
142

148

154

160

166

172

178

184

190

196

visina

Imamo jedno ogranienje: fi=fti=N=100


Uvodimo standardnu normalnu sluajnu varijablu zi =

. Za te

vrijednosti zi odreujemo iz tablica funkciju raspodjele F(z) i vjerojatnosti


razreda f(z):

razred i
154-160
160-166
166-172
172-178
178-184
184-190
zbroj

fi
5
17
38
25
9
6
100

zi
z<-1,86
-1,86<z<-1
-1<z<-0,14
-0,14<z<0,71
0,71<z<1,57
z>1,57

F(z)
0,0314
0,1587
0,4443
0,7611
0,9418
1

f(z)
0,0314
0,1273
0,2856
0,3168
0,1807
0,0582
1

fti
3
13
28
32
18
6
100

(fi-fti)2/fti
2,25
3,57
1,53
4,5
0
11,85

Dakle, imamo pet razreda i jedno ogranienje pa je =5-1=4

137

Za 4 stupnja slobode i 5% signifikantnosti, kritina vrijednost (iz tablica) je


02.05,4 = 9.49 .
2
= 11.85 pada u kritino podruje (vidi sliku). Stoga
Izraunata vrijednost op

hipotezu H0 odbacujemo.
0,30
0,25
0,20
0,15

0,10
0,05

11.85

0,00
0

10

15

20

0.05,4

Normalna raspodjela, i nepoznati


Isti primjer:
Odbacili smo hipotezu o oekivanju i standardnoj devijaciji, ali i dalje vjerujemo da je
raspodjela normalna.
Provjeri s 5% signifikantnosti je li raspodjela normalna!
Rjeenje: H0: Raspodjela je Gaussova s oekivanjem = x uzorka i standardnom
devijacijom = uzorka .
Izraunamo:
1
x uzorka = f i xi = 171cm
N

uzorka =

1
N

f i (xi xuzorka )2 = 7,1 cm

50
45
40

broj studenata

35
30
25
20
15
10
5
0
142

148

154

160

166

172

178

184

190

196

visina

razred i
154-160
160-166

138

fi
5
17

zi
z<-1,55
-1,55<z<-0,70

F(z)
0,0606
0,2420

f(z)
0,060
0,181

fti
6
18

(fi-fti)2/fti
0,167
0,056

166-172
172-178
178-184
184-190
zbroj

38
25
9
6
100

-0,70<z<0,14
0,14<z<0,99
0,99<z<1,83
z>1,83

0,5557
0,8389
0,9664
1

0,314
0,283
0,128
0,033
1

32
28
13
3
100

1,125
0,321
0,063
1,732

Dakle, imamo pet razreda i tri ogranienja: N = 100


= x uzorka
= uzorka .
pa je =5-3=2
Za 2 stupnja slobode i 5% signifikantnosti, kritina vrijednost (iz tablica) je
02.05,2 = 5,99 .
2
= 1,73 ne pada u kritino podruje (vidi sliku). Stoga
Izraunata vrijednost op
hipotezu H0 zadravamo.
0,50
0,45
0,40
0,35
0,30
0,25
2

0,20
0,15
0,10
0,05

0,00
0

1,73

10

15

20

0.05,2

139

Vous aimerez peut-être aussi