Académique Documents
Professionnel Documents
Culture Documents
DISTRIBUSI LIMIT
7.1 PENDAHULUAN
Di bab 6 telah dibahas metode umum untuk mendapatkan fungsi sebuah distribusi dari
(
). Pada beberapa kejadian, pdf dari
variabel acak yaitu
dapat dicari
dengan mudah. Namun terdapat kejadian yang tidak mudah untuk diselesaikan. Beberapa di
antaranya, untuk mendapatkan hasil pendekatan dengan n bernilai besar. Hasil tersebut
didasarkan pada dugaan konvergensi dari distribusi limit.
7.2 BARISAN DARI PEUBAH ACAK
Perhatikan suatu barisan peubah acak Y1,Y2, yang berkaitan dengan barisan CDF nya
yaitu G1(y), G2 (y), untuk setiap n=1,2,
( )
[
]
(7.2.1)
DEFINISI 7.2.1
Jika Yn~Gn(y), untuk setiap n=1,2, dan jika untuk beberapa CDF G(y) yaitu,
( )
( )
(7.2.2)
untuk semua nilai y dimana G(y) kontinu, pada barisan Y1,Y2.. dikatakan konvergen dalam
distribusi Y~G(y), dan dinyatakan dengan Yn d
Y ,CDF G(Y) disebut : Distribusi
terbatas dari Yn.
Contoh 7.2.1
Diberikan X1,X2,Xn sampel acak dari sebuah distribusi uniform Xi~UNIF(0,1) , dan
Yn:Xn:n merupakan order statistik terbesar, dengan CDF= ( )
, untuk
Dapatkan distribusi limit dari Yn=Xn:n.
Penyelesaian:
PDF distribusi Uniform :
Xi~UNIF(0,1) ( )
CDF distribusi Uniform : ( )
( )
Yn= Xn:n adalah order statistik terbesar,dan untuk mencari CDF dari Yn yaitu sebagai berikut:
( )
[
]
[ ( )]
( )
(7.2.3)
Sehingga didapatkan,
Gn(y)={
Untuk
merupakan fungsi konstan dengan masing-masing 0 dan 1.
Distribusi limit dari Yn yaitu :
( )
( )
Jadi,
G(y) = {
(7.2.4)
Gambar 7.1 : Grafik dari CDF Gn(y) dengan limit degenerate CDF G(y)
DEFINISI 7.2.2
Fungsi G(y) adalah CDF dari suatu distribusi degenerate pada nilai y=c, diperoleh
G(y) = {
(7.2.5)
Dengan kata lain, G(y) adalah CDF dari sebuah distribusi diskrit yang mempunyai peluang
sama dengan 1 di nilai y=c dan 0 untuk yang lain.
Contoh 7.2.2
Diberikan X1,X2,Xn adalah sebuah sampel acak dari distribusi eksponensial, Xi~EXP(),
dan Yn=X1:n adalah order statistik terkecil. Tentukan distribusi limit untuk Yn .
Penyelesaian :
PDF distribusi Eksponensial:
X~EXP() ( )
CDF distribusi Eksponensial:
( )
( )
(7.2.6)
( )
dan 0 untuk y yang lain. Kita mempunyai ( )
jika y>0 karena dalam
kejadian ini
. Jadi, limitnya 0 jika y<0 dan 1 jika y>0, yang mana distribusi
degenerate pada nilai y=0. Pembentukan nilai limit di y=0 adalah 0, artinya bahwa fungsi
limit tidak hanya diskontinu di y=0 tetapi juga tidak kontinu di bagian kanan y=0, yang mana
telah menjadi syarat sebuah CDF.
DEFINISI 7.2.3
Sebuah barisan peubah acak Y1,Y2,dikatakan konvergen stokastik ke konstanta c jika
mempunyai distribusi limit yang degenerate pada y=c.
Tambahan: Berikut adalah persamaan limit yang sering di gunakan dalam menyelesaikan
soal distribusi limit yaitu
(
(
(limit natural)
( )
(7.2.7)
( )
jika
(7.2.8)
Contoh 7.2.3
Diberikan X1,X2,Xn adalah sebuah sampel acak dari distribusi pareto, Xi~PAR(1,1), dan
Yn=nX1:n order statistik terkecil . Dapatkan distribusi limit dari Yn.
Penyelesaian :
( )
( )
( )
( )
(
(
)
)
Misalkan :
]
[
( )]
[
( )
) ]
(7.2.9)
Dengan menggunakan limit natural pada persamaan 7.2.4, kita peroleh distribusi limit
sebagai berikut:
( )
( )
(
( )
dan 0 untuk yang lain, yang merupakan CDF dari distribusi eksponensial, EXP(1). Ini jika
diilustrasikan di dalam gambar 7.2, yang mana menunjukkan grafik dari G(y) dan Gn(Y)
untuk n=1,2, dan 5
Gambar 7.2 : Grafik dari CDF Gn(y) dengan distribusi limit G(y)
Contoh 7.2.4
Untuk sampel acak dari contoh sebelumnya 7.2.3, tetapi dengan Yn=Xn:n yang mana
merupakan order statistik terbesar. Dapatkan distribusi limit dari Yn.
Penyelesaian:
CDF dari contoh 7.2.3 yaitu :
( )
CDF dari Yn adalah :
( )
[
[ ( )]
[
( )
]
]
(7.2.10)
( )
Contoh 7.2.5
Pada contoh sebelumnya yaitu contoh 7.2.3 dengan
( )
( )
[
[ ( )]
( )
Distribusi limitnya yaitu :
( )
(7.2.11)
( )
[
( )
Contoh 7.2.6
Dari sebuah sampel acak pada contoh 7.2.2 dengan
statistik terbesar. Dapatkan distribusi limit dari Yn.
Penyelesaian :
CDF dari contoh 7.2.2 yaitu :
( )
CDF dari Yn adalah:
( )
[
[ ( )]
( )
adalah order
[
(
[
( )
(7.2.12)
( )
[
( )
(
)
Sekarang menghitung ketelitian saat melimitkan CDF dengan pendekatan Gn(y) untuk n yang
besar. Misalkan waktu bertahan dalam bulan untuk beberapa tipe dari komponen variabel
acak X~EXP(1) dan misalkan 10 komponen yang independen tersebut terhubung dengan
sistem parallel. Waktu kegagalan dari sistem adalah T=X10:10, dan CDFnya
( ) (
)
Untuk pendekatan ini digunakan distribusi limit CDF:
( )
[
]
[
]
(
)
(
)
(
)
(
)
Misalkan t yang digunakan pada saat t=1,2,5 dan 7 bulan , maka pendekatan peluangnya
diperoleh sebagai berikut:
t:
1
2
5
7
0.010
0.234
0.935
0.9909
( )
0.025
0.258
0.935
0.9909
(
)
Jadi , nilai pendekatan meningkat ketika n bertambah.
Contoh 7.2.7
Diberikan sebuah sampel mean dari sampel acak yang berdistribusi normal
( )
), dan
( )
[
[
( )
dan 1 jika
(7.2.13)
karena,
( )
( )
jika
Contoh 7.3.1
Diberikan X1, ..., Xn adalah sampel acak dari distribusi Bernoulli,
( ) dan
. Jika
untuk
dengan
untuk
. Dapatkan distribusi
limit dari Yn.
Penyelesaian :
PDF distribusi Bernoulli :
( ) ( )
MGF distribusi Bernoulli :
( )
)
(
(7.3.1)
( ).
Contoh 7.3.2
Hukum Bernoulli untuk Nilai yang Besar
Misalkan terdapat tetap dan mengingat barisan dari proporsi sampel,
.
. Dapatkan
[ (
)
( )
(7.3.3)
( )
untuk
(7.3.4)
untuk
Contoh 7.3.3
Mengingat barisan variabel yang terstandarisasi:
(7.3.5)
distribusi Limitnya.
Penyelesaian:
Dengan menggunakan deret ekspansi dari contoh sebelumnya,
)]
( )
[
[(
)(
( )
[
Dimana ( )
( )
. Dapatkan
)]
untuk
(7.3.6)
. Jadi,
(7.3.7)
TEOREMA 7.3.2
Teorema Limit Pusat
Jika
adalah sampel acak dari distribusi dengan mean dan variansi
limit distribusi dari
, lalu
(7.3.8)
) untuk
Contoh 7.3.4
Diberikan
adalah sampel acak dari distribusi uniform,
) dan
Xi~UNIF(0,1) ( )
CDF distribusi Uniform :
( )
( )
dan
( )
didapat perkiraan
(
)
(
( )
Sebagai contoh, jika
, kemudian dengan perkiraan
Perkiraan ini sangat dekat, sering digunakan untuk mensimulasikan nomor acak normal
standar pada aplikasi komputer.
7.4 PENDEKATAN UNTUK DISTRIBUSI BINOMIAL
Contoh 7.3.1 sampai 7.3.3 menunjukkan macam-macam distribusi limit yang tergantung
pada barisan dari variabel binomial dan diasumsikan sifat dari p dengan
.
Contoh 7.3.1 ditunjukkan untuk variabel binomial Yn ~ BIN (n,p) jika n besar dan p
kecil, maka dapat didekati dengan Yn ~ POI(n,p). Pembahasan ini ditunjukkan dengan cara
lain dalam contoh 3.2.9 pada Bab 3 yaitu:
Contoh 3.2.9:
Misalkan 1% dari produksi transistor sebuah perusahaan adalah cacat. Sebuah model baru
komputer membutuhkan 100 transistor dan 100 transistor tersebut diseleksi acak dari
perakitan perusahaan. Diperoleh 3 transistor cacat dalam pengacakan tersebut, maka
peluangnya diperoleh transistor cacat
(
(
( )
)(
) (
Contoh 7.3.3 , dengan p dan barisan baku yang sesuai digunakan untuk distribusi normal
standart, maka menggunakan sebuah pendekatan normal. Dalam kenyataannya, hal tersebut
digunakan untuk nilai n yang besar dan memiliki nilai p maka didekati dengan Yn
~N(np,npq). Pendekatan ini bekerja paling baik ketika nilai p=0,5 karena distribusi binomial
simetri ketika p=0,5. Ketepatan ini tergantung pada aplikasinya. Pedoman digunakan untuk
distribusi normal standart ketika
dan
, tetapi tetap memerlukan ketelitian.
Contoh 7.4.1 :
Peluang seorang pemain basket melakukan sebuah penembakan adalah p = 0,5. Jika pemain
melakukan 20 penembakan, berapa peluang pemain melakukan penembakan paling sedikit 9
kali?
Penyelesaian :
Yn~BIN(n,p)
n = 20
p = 0,5
q = 0,5
np = nq = 10 5 sehingga dipendekatan Yn ~N(np,npq)
Penyelesaian :
P [Y209] = 1 - P[Y208]
=1
= 1 - ( - 0,89 )
= 0,8133
10
Karena distribusi binomial merupakan distribusi distribusi diskrit dan distribusi normal
merupakan distribusi kontinu, pendekatannya dapat diperbaiki dengan membuat sebuah
koreksi kontinuitas.
Kenyataannya, masing-masing distribusi binomial , (
),
mempunyai hasil yang sama dengan luas sebuah persegi panjang dengan tinggi (
) dan
selang [
] sebagai dasarnya, karena panjang dasarnya 1. Daerah persegi
panjang tersebut dapat dipendekatan dengan daerah dibawah PDF dari
(
), yang
berhubungan dengan distribusi normal dengan mean dan varians
(
). Hal tersebut
ditunjukkan untuk n=20, p=0.5 dan y=7 dalam gambar 7.3, dimana probabilitasnya adalah
(
)(
) (
)
)
yang lebih mendekati nilai yang sebenarnya tanpa koreksi kontinuitas. Keadaan ini
ditunjukkan dalam gambar 7.4.
(
)
Umumnya, jika
adalah bilangan bulat , maka
11
(7.4.1)
Koreksi kontinuitas juga berguna untuk distribusi diskrit yang dapat dipendekatan
dengan distribusi normal.
Gambar 7.4 pendekatan normal untuk distribusi binomial
Contoh 7.4.2
Misalkan
diketahui bahwa
= 0,982
)= (
12
Z~N(0.1).
Hal tersebut tidak sesuai untuk distribusi dengan sampel mean sebagai pendekatan
dari N(, 2/n) untuk n yang besar.berikut ini contoh dari dugaan yang lebih umum.
DEFINISI 7.5.1
Jika
adalah barisan variabel acak, serta
untuk
asimptotik
dan
konstan, maka
(7.5.1)
, dan dikatakan
mempunyai distribusi normal asimptotik dengan mean
dan variansi asimptotik
Contoh 7.5.1
Berdasarkan sampel acak dalam contoh 4.6.3 yang menunjukkan n=40 daya tahan sebuah
peralatan elektrik, Xi~EXP(100). Dengan teorema limit pusat ,
Mempunyai distribusi normal asimptotik dengan mean =100 dan varians c2/n=(100)2/40=250.
7.5.1 DISTRIBUSI ASIMTOTIK DARI ORDER STATISTIK PUSAT
Dalam subbab 7.1 ditunjukkan beberapa contoh yang menggunakan order statistik
ekstri,misalkan yang terbesar atau yang terkecil, dengan distribusi limit yang tidak normal.
Dalam keadaan lain, mungkin untuk menunjukkan pusat order statistikyang normal
asimptotik.
Teorema 7.5.1
Misalkan
adalah sampel acak dari sebuah distribusi kontinu dengan pdf ( ) yang
kontinu dan tidak nol pada persentil ke- ,
, untuk
. Jika
(dengan
tertentu), maka barisan order statistik ke- ,
, adalah normal asimptotik dengan
mean
dan variansi , dimana
(
[ (
)]
(7.5.2)
Contoh 7.5.2
Misalkan
adalah sampel acak dari distribusi eksponensial,
( )
(
dan ( )
. Untuk n ganjil,
adalah median dari sampel. Jika
, maka mediannya
( )
maka
= 0.5
(
13
( ), sehingga
) , sehingga
Dan
[ (
)]
Dengan demikian,
asimptotik
dan variansi
Contoh 7.5.3
Misalkan X1,., Xn adalah sebuah sampel acak dari distribusi uniform, Xi ~ UNIF (0,1),
sehingga PDF nya :
( )
CDF nya :
( )
( )
( )
( )
( )
| = x-0 = x ; 0<x<1
Diasumsikan bahwa n adalah bilangan ganjil dan k=(n+1)/2, sehingga Yk=Xk:n adalah
order statistik pusat atau median sampel. Persamaan 6.5.3 yaitu
( )
[ ( )] [
( )]
( )]
(
) (
)
menjelaskan pdf dari Yk yang memiliki bentuk khusus karena k-1=n-k=(n-1)/2 dalam contoh
ini. Maka, PDF nya adalah
( )
{[
[ (
)]
(7.5.3)
]}
transformasi invers
( )
(
{[
)
(
]}
| |
)
, yang memiliki
(
dan jacobian J=1/ . hasil PDFnya adalah
(7.5.4)
1, maka
Dan hal ini menunjukkan nilai konstan pada (7.5.4) yang mendekati 1/
14
dengan n
c.
Contoh 7.6.1:
Contoh 7.3.2 terbukti, sehingga disebut hukum Bernoulli Law of Large Numbers
(LLN) dengan pendekatan MGF. Itu juga dapat diuji dengan teorema sebelumnya dan
dengan pertidaksamaan Chebychev. Secara khusus, mean dan varians dari pn adalah
E (pn) = p dan Var (pn) = pq/n , jadi
P[ | pn p | < ] 1 pq/ 2n
[|
| ]
1
pq/ 2n
1-0
1
[|
| ]
Maka , untuk setiap > 0, maka
Pendekatan yang sama juga bisa digunakan untuk membuktikan hasil yang lebih umum,
biasanya disebut sebagai Law of Large Numbers (LLN).
Teorema 7.6.2
Jika X1, X2, . . . , Xn adalah contoh acak dari distribusi dengan mean () berhingga dan
varians (2), maka barisan dari sampel mean konvergen dengan peluang ke :
Bukti : Dari E( ) =
Var ( )=
, dengan demikian
[|
(7.6.3)
Sehingga,
[|
Jadi,
[|
15
Teorema 7.6.3
(
Z~N(0,1), maka
Contoh 7.6.2 :
Diketahui bahwa dalam contoh 7.5.2 dan 7.5.3 bahwa median sampel Xk:n adalah normal
asimptotik dengan mean asimptotik x0.5 .Sehingga dalam teorema diperoleh bahwa Xk:n
x0.5 dengan n dan k/n 0.5.
Maka sesuai teorema 7.5.1 jika k/n
p, maka order statistik konvergen stokastik terkecil
pada persentil ke p adalah Xk:n
xp
jika
TEOREMA 7.7.1
Untuk barisan variabel acak, jika
maka
melimitkan distribusi berarti menurunkan distribusi
untuk mendefinisikan konvergensi stokastik.
TEOREMA 7.7.2
Jika
( )
BUKTI
Karena ( ) kontinu di , hal tersebut berarti untuk setiap
|
|
( )|
berakibat | ( )
. Hal ini berakibat
dan
[| ( )
ada, dimana
( )|
]
[|
|
] karena ( )
( ) sebagaimana
. Tetapi karena
, hal itu
[| ( )
( )|
]
[|
|
berarti untuk setiap
berlaku
]
. Limit pada ruas kanan tidak mungkin melebihi 1, maka harus sama dengan 1, dan
( )
( ).
16
TEOREMA 7.7.3
Jika
dan
dan
dan
).
1.
2.
3.
untuk
4.
5.
jk [
utk semua
jk [
utk semua .
CONTOH 7.7.1
(
).
Misal
Diketahui
Maka (
.
(
dan
1.
2.
untuk
3.
Untuk kejadian khusus,
bisa jadi barisan luar biasa seperti
CONTOH 7.7.2
Dari sampel acak berukuran
( )
)
(
Juga diketahui jika (
menjadi
)
(
), diketahui
) (
)]
(7.7.2)
TEOREMA 7.7.5
Jika
, maka untuk setiap fungsi kontin ( )u berlaku
( ) tidak bergantung pada .
17
( )
( ), dengan asumsi
TEOREMA 7.7.6
Jika (
( )
maka
) dan jika
[ ( ) ( )]
( )|
|
BUKTI
( )](
)
( ) jika
Didefinisikan ( ) [ ( )
, dan misal
Hal tersebut berarti ( ) kontinu di dengan ( )
, dan dengan demikian
( )
( )
Selanjutnya,
( )
( ).
[ ( ) ( )]
( )|
|
) [
( )
( )
)]
( )] ( )
Dari teorema 7.7.3 didapat [ ( )
, dan hasilnya didapat dari teorema
7.7.4.
Berdasarkan pemahaman awal dari distribusi normal asimptotik, dapat disimpulkan untuk
(
) maka
bernilai besar, jika
[ ( )]
( )
{ ( )
}
Contoh 7.7.3
Teorema Limit Pusat menyebutkan bahwa mean dari sampel terdistribusi normal asimptotik,
(
)
yang bernilai besar,
Diketahui dari teorema 7.7.6 bahwa fungsi yang dapat diturunkan dari juga terdistribusi
normal asimptotik. Sebagai contoh, jika ( ) , maka ( )
, dan diperkirakan
( )
[
]
seperti X1:n, X2:n, dan Xn:n distandarisasi sehingga tidak mendegenerasikan pembatasan
distribusi, pembatasan distribusi ini bukan termasuk distribusi normal. Contohnya dari
pembatasan distribusi seperti yang diberikan sebelumnya. Itu dapat ditunjukkan bahwa tanpa
mendegenerasikan pembatasan distribusi dari variable ekstrim harus termasuk ke dalam satu
dari 3 kemungkinan tipe dari distribusi. Sehingga 3 tipe dari distribusi ini berguna saat
mempelajari rataan melalui Terorema Limit Pusat.
18
TEOREMA 7.8.1
Jika limit dari barisan CDF adalah CDF kontinu, ( )
(
dan bn yaitu
(7.8.1)
dan
TEOREMA 7.8.2
Jika limit dari barisan CDF adalah CDF kontinu, dan jika
(
)
( ) untuk semua n > 0 dan semua Real y,
(
Kemudian
(
dan
dengan n .
G(y) yaitu:
(
Y ~ G(y)
(7.8.2)
Jika Xn:n memiliki distribusi terbatas dengan tipe G , itu berarti bahwa pembatasan
distribusi dengan standar variable Yn adalah tidak menurunkan distribusi G(y). Mengingat
bahwa distribusi yang tepat dari Xn:n diberilan oleh
( ) [ ( )]
(7.8.3)
(
)
)]
[ (
(7.8.4)
Sehingga , pembatasan distribusi dari Xn:n (atau lebih tepatnya Yn) adalah diberikan oleh
( )
)]
( )
[ (
(7.8.5)
Sehingga, persamaan 7.8.5 menyediakan pendekatan langsung untuk menentukan nilai
limit distribusi ekstrim (tertinggi), jika barisan {an} dan {bn} dapat ditentukan bahwa hasilnya
adalah limit yang didegenerasikan.
Mengingat dari contoh 7.2.6 bahwa jika X~EXP(1), kemudian dengan an= 1 dan bn = ln n.
Sehingga,
dan ( )
( )
[ (
[[
( )
)]
]]
[[
( )
(
]]
)
19
(7.8.6)
(7.8.7)
Teorema 7.8.3
Jika
(7.8.8)
(7.8.9)
(7.8.10)
TEOREMA 7.8.4
(
[ (
)]
[
( )
(
,
(7.8.11)
)]
( )
(7.8.12)
Diberikan CDF F(x) yang mungkin dapat menggunakan teorema 7.8.4 untuk menyelesaikan
an dan bn pada F(x) untuk setiap 3 tipe pembatasan distribusi. Sehingga, jika tipe limit untuk
F(x) diketahui, kemudian an dan bn dapat di hitung. Jika tipe tidak diketahui, maka an dan bn
tetap dapat dihitung untuk setiap jenis dan kemudian diterapkan untuk melihat tipe hasilnya.
Satu sifat dari CDF yang digunakan dalam mengekspresikan konstanta standar yaitu
Karakteristik Nilai Terbesar
DEFINISI 7.8.1
Karakteristik nilai terbesar, Un, dari CDF F(x) di definisikan oleh persamaan
[
( )]
(7.8.13)
Untuk sampel acak dengan ukuran n dari F(x), jumlah yang diharapkan dari pengamatan yang
akan melebihi Un adalah 1. Peluang bahwa sebuah pengamatan akan melebihi Un adalah
[
]
( )
dan jumlah yang diharapkan untuk pengamatan n independen adalah
[
( )]
Teorema 7.8.5
Diberikan X~F(x), dan asumsikan bahwa
1. Jika F(x) adalah kontinu dan naik tegas, kemudian distribusi limit dari Yn adalah tipe
Eksponensial jika dan hanya jika
[
(
)]
, -<y<
(7.8.14)
20
, k > 0, > 0
(7.8.15)
dimana
)
)
,k>0
{ | ( )
(7.8.16)
}, batas atas dari x. Juga bn = x0 dan an = x0 Un.
]
= [
=1- (
)
Pembatasan distribusi dari Wn disebut H(w) kemudian diberikan dengan
( )
( )
(
)
(
21
TEOREMA 7.8.6
Jika
(
)
mempunyai pembatasan distribusi H(w), kemudian H(w) harus
mengikuti salah satu dari tiga nilai distribusi tertinggi.
1. Tipe I ( untuk minimum) (tipe eksponensial)
Dalam keadaan ini
didefinisikan oleh
(
Dan ,
( )
( )
( )
(
)
(
),
(
)
Jika dan hanya jika
2. Tipe II (untuk minimum) (tipe Cauchy)
Dakam keadaan ini
( )
( )
( )
[ (
dan
) ,
>0
, y>0
=-
Dan
( )
( )
( )
),
>0
)
)
RANGKUMAN
Tujuan dari bab ini adalah untuk membahas dugaan dalam kekonvergenan sebuah
distribusi, distribusi limit, dan kekonvergenan dalam probabilitas. Konsep ini sangat penting
untuk dipelajari melalui sifat-sifat asimptotik dari barisan variabel acak dan distribusnya.
The Law of large Number (LLN) dan Teorema Limit Pusat (CLT) berhubungan dengan
sifat limit dari fungsi tertentu sebuah rataan sampel yang berarti ukuran sampel mendekati tak
hingga. Khususnya, LLN menyatakan bahwa barisan dari rataan sampel bersifat konvergen
stokastik pada rataan populasi suatu kondisi tertentu. Tipe kekonvergenan ini ekuivalen
dengan kekonvergenan pada peluang kasus ini, karena limitnya bernilai konstan. Sedangkan,
CLT menyatakan bahwa mengubah yang sesuai dengan bentuk barisan dari rataan sampel
adalah distribusi limit normal. Teorema ini memiliki dampak teoritis yang penting pada
22
peluang dan statistik, dan juga memberikan pendekatan pada banyak situasi . Contohnya,
CLT memberikan pendekatan yang bagus untuk distribusi binomial.
SOAL-SOAL LATIHAN
1. Diberikan sebuah sampel acak dengan ukuran n dari sebuah distribusi dengan CDF
( )
yaitu :
]
( )]
)]
( )
Jadi didapatkan,
( )
( )
( )
( )
( )
( )
Jadi didapatkan distribusi limit dari
( ) yaitu ( )
23
c. Dengan
Sehingga CDF dari
( )
yaitu :
( )]
[
(
maka
)]
( )
( )
Jadi didapatkan distribusi limit dari
( )
2.
(
a.
b.
( ) adalah
Diberikan sebuah sampel acak berukuran n dari sebuah distribusi dengan CDF
) (
) , untuk semua x bilangan real.
Dengan order statistik terbesar Xn:n, apakah mempunyai distribusi limit?
Dengan
, apakah mempunyai distribusi limit? Jika iya, tunjukkan!
Penyelesaian :
)
a. PDF : ( ) (
Dengan order statistik terbesar Yn=Xn:n , dan CDF ( )
Sehingga CDF untuk Yn=Xn:n yaitu :
( )
[ ( )]
[(
(
) ]
)
24
( )
( )
(
Jadi
b. Dengan
Sehingga CDF dari
( )
yaitu :
[ ( )]
(
[(
[(
) ]
) ]
))
( )
(
))
))
yaitu
))
3. Diberikan sampel acak dengan ukuran n dari sebuah distribusi dengan CDF
( )
dan ( )
25
yaitu :
]
( )]
)]
( )
( ) yaitu ( )
[ ( )]
[
( )
[
Jadi
c. Dengan
Sehingga CDF untuk
( )
yaitu :
]
[ ( )]
[
) ]
[
[
]
]
26
)
]
( )
(
)
]
Jadi didapatkan ,
( )
{
(
)
CDF dari Xi~EXP(1) , (
(a) P[Y>110] =1-P[Y 110]
= 1- [
= 1- [ ]
=1-0,8413 = 0,1587
(b) P[
]=
[
)
[ ( )]
= [ ( )]
[ ]
= [ ]
=0.9772-0.8413 = 0.1359
15. Diketahui pdf,
27
( )
Tentukan:
(a) Jika
[
(b) Jika
]
merupakan nilai terkecil dari n, maka tunjukkan bahwa
dimana
(c) Jika
merupakan nilai terbesar dari n, maka tunjukkan bahwa
dimana
)
(d) Temukan distribusi terbatas dari (
(e) Temukan distribusi normal asimptotik dari median,
, dimana
terbatas.
(f) Tentukan
dari (e) yang merupakan stokastik konvergen?
(g) Tentukan distribusi terbatas dari
Penyelesaian:
( )
( )
( )
(a)
( )
]
[
28
dengan
(b)
( )]
( ) ]
( )
( )
Jadi,
( ( ))
(c)
[|
[|
[ |( ( ))
( ( ))
[|
Jadi,
(d)
(
( )
)
[
[(
]
(
[ (
) ]
[(
(e)
( )
(
) ]
( )
(
(
29
[ (
)]
[ (
)]
(
)
(
(
Jadi
)
)
dan
(f)
Dari (e) diketahui bahwa
(g)
( )
]
[
]
[
[ (
]]
)]]
) ]
30
. Sehingga
)]
(
.
]
Penyelesaian:
(a) ( )
(b)
stokastik konvergen ke [
Karena
maka
(
(
(c)
[
( )
)
)
17.
( ) stokastik konvergen ke [
).
Penyelesaian:
31
( ( ) )
) )
).
[
[
]
]
[
[
(
)]
)]
Jadi,
( )
)
)
32
( )
]
(
[( )
[
[
Sehingga didapat ;
]
( )
[
[
]
]
, dimana
terbatas
[ (
Jadi
dengan
)]
normal asimptotik dengan asimptotik mean
[ (
)]
(b) Jika (
dan
sehingga
maka
, dimana
dengan
varians dengan
[ (
)]
.
merupakan
33
BAB VIII
STATISTIK DAN DISTRIBUSI SAMPLING
8.1 PENGANTAR
Pada Bab 4 telah diterangkan tentang sampel acak. fungsi distribusi empiris digunakan
untuk memberikan alasan mean sampel dan varians sampel sebagai perkiraan intuitif mean
dan varians dari populasi distributi. Tujuan dari bab ini adalah untuk memperkenalkan
konsep statistik, yang meliputi sampel mean dan varians sampel sebagai kasus khusus, dan
untuk mendapatkan sifat statistik tertentu yang memainkan peran penting dalam bab-bab
selanjutnya
8.2 STATISTIK
Terdapat himpunan teramati dari variabel acak,
Sebagai contoh, terdapat
variabel yang merupakan sampel acak berukuran
DEFENISI 8.2.1
Jika terdapat fungsi dari variabel acak,
parameter yang tidak diketahui, maka disebut statistik
, =
, atau
. Tentunya perhitungan
Jika terdapat
yang merupakan sampel acak dari suatu populasi dengan pdf
Mean sampel dalam statistik diberikan dengan fungsi
34
dengan
dan
Dan
Contoh 8.2.2
Terdapat variabel acak
distribusi Binomial,
dengan
dengan
dan
merupakan
maka,
Sehingga didapat,
Contoh 8.2.3
Terdapat fungsi
berikut :
Maka didapat:
35
Teorema 8.2.2
Jika
dengan
, maka didapat :
Pembuktian:
Pembuktian :
36
dan varians
maka
Jika
, maka
Teorema 8.3.3
Jika
, maka
Pembuktian:
Ini merupakan distribusi Chi-Square dengan derajat kebebassan 2.CDF Gamma juga dapat
dinyatakan dalam bentuk notasi Chi-Square. Jika
Square dengan derajat bebas v], maka :
Teorema 8.3.4
Jika
Pembuktian:
37
dan jika
[CDF Chi-
Pembuktian:
maka :
Teorema 8.3.6
dan suku-suku
2.
maka :
adalah independen
3.
Pembuktian :
1) Dengan menambah dan mengurangkan x dengan hubungan :
38
Maka :
dan
dan suku-suku
independen, karena
.
Terbukti bahwa dan suku-suku
Karena
terbukti
independen.
2) Perhatikan bahwa
adalah independen
, Maka berdasarkan bukti diatas
39
Maka :
untuk = 3 dan =2
; n=20 ; = 101 ;
untuk menggunakan
dalam bentuk pasti dari prosedur statistik yang berkaitan dengan
mean ketika
tidak diketahui.
40
Teorema 8.3.3
Jika
distribusi dari
dan
Pembuktian :
Hasil dari Z dan V bisa dibuktikan dengan cara :
Terdapat transformasi ,
Jacobiannya yaitu
, dengan
Pembuktian :
Pada saat 2r yaitu :
dimana
memberikan hasil.
dan
41
Seperti yang dijelaskan di awal, satu aplikasi dari distribusi t akan muncul ketika
terdapat sampling dari distribusi normal, seperti yang diilustrasikan pada teorema ini.
Teorema 8.3.5
Jika
, maka
Pembuktian :
Dari teorema 8.4.1 didapat
, maka
dan
adalah independen.
DISTRIBUSI SNEDECORS F
Teorema 8.3.6
Jika
42
dan
dari
Teorema 8.3.7
Jika
, maka
Pembuktian :
Terdapat
dan
dan
).
Jadi diperoleh ,
sehingga didapatkan ,
Contoh 8.3.7:
dan
Jika
didapatkan
dan
maka
43
dan
, sehingga
dan
Jika
dan
, maka
DISTRIBUSI BETA
Sebuah variabel F dapat ditransformasikan ke distribusi beta. Jika
memiliki variable acak seperti berikut
mempunyai pdf
dimana
dan
Persentil keyaitu :
dan
.
di tulis sebagai berikut;
dari distribusi beta dapat ditulis dengan bentuk persentil dari distribusi
Jika
dan
adalah bilangan bulat positif, maka diintegralkan secara berurutan
dengan bagian utama untuk hubungan antara CDF dari distribusi beta dan distribusi binomial.
Jika
dan
, maka
Distribusi beta muncul dalam hubungan dengan distribusi dari statistik order. Untuk
44
dimana
maka didapat
dan
merupakan order terbesar ke-k dari variabel acak
dapat ditulis dengan bentuk CDF beta, karena
Contoh 8.3.8
Diketahui
Dimana
dan
dan
dan
45
umum dan melengkapinya dengan model dua-parameter fleksibel untuk berbagai tipe dari
variabel yang terletak antara 0 dan 1.
8.4 PENDEKATAN SAMPEL BESAR
Distribusi sampling yang telah dibahas pada awal bab memiliki pendekatan yang dapat
digunakan untuk penerapan ukuran sampel yang besar.
Teorema 8.4.1
Jika
, maka
Dimana,
Pembuktian :
merupakan distribusi penjumlahan,
maka diperolah
Contoh 8.4.1
Diketahui
dengan
dan
dimana
independen dan
dari
;
Maka,
Atau pendekatannya,
Jika
dan
diperoleh sebagai berikut,
, maka
dan pendekatannya
46
didapat
sehingga didapat
Jadi dapat disimpulkan bahwa distribusi Students t mempunyai batas standart distribusi
normal yang dapat ditulis sebagai berikut:
SOAL-SOAL LATIHAN
1.
)
; n=20 ; = 101 ;
Berapa waktu yang dibutuhkan suatu komponen dengan distribusi Gamma dengan = 3
dan =2. Dimana komponen tersebut dapat bertahan 90%. Sedemikian hingga [
]
.
Penyelesaian :
[
Dengan demikian :
( )
Maka :
47
( )
untuk = 3 dan =2
(
3.
( )(
( ). Tentukan c sehingga
Penyelesaian :
( )
[
]
( )
Jadi, didapat
maka
4. Terdapat
merupakan sampel acak dari distribusi normal,
(
) dan
merupakan mean sample dan varians sampel. Gunakan tabel dari Appendix C
(
untuk menentukan [
Penyelesaian :
(
( )]
48
5.
Bandingkan pendekatan The Wilson-Hilferty (persamaan 8.5.2) dengan nilai pada tabel
( )
( )
untuk
Penyelesaian :
Pendekatan The Wilson-Hilfery
(
(
6.
)
(
(
)
( ) berkorespondensi
Penyelesaian :
(
Teorema 3.3.2
(
( )
Dimana
7.
dan
[
)]
Seorang analisis keuangan mengambil suatu sampel sebesar 10% 300 laporan keuangan
dan mendapatkan bahwa rata-rata keuntungan Rp. 148,50 dengan standart deviasi Rp.
35,75. Jika rata-rata keuntungan populasi Rp. 138,00 , berapakah probabilitas bahwa
keuntungan yang diperoleh dan diambil secara random Rp. 148,50 atau lebih dan
tentukan jumlahnya?
Penyelesaian :
49
Dengan demikian,
(
)
Jumlahnya
( (
( (
(
)(
8.
)=
))
))
Sebuah perusahaan ingin mengestimasi rata-rata waktu yang dibutuhkan oleh sebuah
mesin untuk memproduksi suatu kertas. Diambil secara random 36 rim kertas, waktu
rata-rata yang dibutuhkan untuk memproduksi 1 rim adalah 1,5 menit. Jika diasumsikan
standart deviasi populasi 0,30 menit, Tentukan estimasi interval rata-rata dengan tingkat
konfidensi 95 persen
Penyelesaian :
(
)
9.
Seorang investor pada saat ini memegang saham kelompok aneka industri yang terdiri
dari industri mesin dan alat berat, otomotif, tekstil, dan garmen. Pengamatan selama 2
bulan terakhir menunjukkan bahwa 44% probabilitas harga saham kelompok ini
meningkat. Investor lain ternyata memegang saham kelompok perdagangan dengan
probabilitas harga saham meningkat sebesar 67%. Apabila investor memiliki 100 lot
untuk saham aneka industri dan 200 lot untuk saham perdagangan, berapa probabilitas
beda presentasi harga saham kelompok perdagangan meningkat 10% lebih besar
dibandingkan dengan kenaikan harga saham kelompok aneka industri ?
Penyelesaian :
Perdagangan :
Aneka industri :
Beda proporsi atau selisih proporsi
Standar deviasi dari selisih proporsi adalah :
50
=
(
=
Nilai
diperoleh dengan
(
)
(
Jadi
)
)
(
)
(
)
. Jadi selisih harga
saham meningkat lebih dari 10% adalah 98,46% Hal ini menunjukkan bahwa ada
perbedaan yang cukup besar antara kenaikan harga saham kelompok aneka industri dan
perdagangan.
10. Sebuah bank Danamon di pasar bursa terus mengalami fluktuasi. Harga saham pernah
turun mencapai 1200 dan naik mencapai 1600. Selama pengamatan 60 hari harga saham
bank Danamon rata-rata mencapai 1400 dengan standar deviasi 98. Berapa peluang bank
Danamon turun di bawah 1350 dan berapa peluang harganya meningkat di atas 1500 ?
Penyelesaian :
Z=
51
BAB IX
ESTIMASI TITIK
9.1. Pendahuluan
Pada bab ini akan diasumsikan bahwa distribusi dari suatu populasi dapat
direpresentasikan oleh anggota dari suatu pdf keluarga, (
) berparameter . Pada
beberapa kasus, parameternya akan menjadi nilai vektor dan akan digunakan untuk
mendapatkannya.
Dimisalkan sebagai parameter populasi dan adalah himpunan semua nilai yang
mungkin. Jika adalah vektor maka akan menjadi himpunan bagian dari ruang Euclidean
pada dimensi yang sama dan dimensi akan berkaitan dengan nilai parameter lain yang
tidak diketahui. Diasumsikan bahwa (X1, X2, , Xn) adalah sampel acak dari (
) dan
() adalah suatu fungsi dari .
Definisi 9.1.1
Suatu statistik T =(X1, X2, , Xn) digunakan untuk mengestimasi nilai () disebut estimator
() dan nilai amatan statistik t = (x1, x2, , xn) disebut estimasi ().
Jelas bahwa ini termasuk kasus untuk mengestimasi nilai parameternya sendiri, misalkan
()=. Pada definisi 9.1.1, digunakan tiga simbol yang berbeda, huruf (T) menotasikan
statistik yang digunakan sebagai estimator, huruf (t) merupakan nilai amatan atau
estimasinya, huruf() fungsi yg diaplikasikan pada sampel acak. Selain itu pada bab ini juga
akan menggunakan notasi circumflex (yang biasa dibaca topi) sebagai parameter.
Parameter digunakan untuk membedakan antara nilai parameter yang lain dengan
estimatornya.
9.2 Beberapa Metode Estimasi
Metode Momen
Mean sampel( ), yang dijelaskan di Bab 8 bahwa digunakan sebagai estimator dari
mean populasi . Pendekatan umum yang menghasilkan estimator diketahui sebagai Metode
Estimator Momen (MMEs).
Misalkan pdf populasi (
) tergantung pada satu atau lebih parameter
.
dirumuskan :
(
)
( )
(9.2.1)
Definisi 9.2.1
Jika
adalah sampel acak dari (
oleh
),
(9.2.2)
Seperti yang telah dibahas pada bab 2, momen pertama sebanding dengan rata-rata
, yang berarti bahwa momen pertama dari sampel akan sama dengan sampel rata-rata.
Misalkan kasus sederhana yang parameternya tidak diketahui, dikatakan = . =
52
adalah
untuk
mengestimasi =
()
digunakan
untuk
dan
Metode Likelihood
Metode Likelihood adalah suatu metode yang mengarah pada sifat-sifat estimator yang
diinginkan, terutama untuk sampel besar, yaitu dengan menggunakan nilai dalam parameter
yang berhubungan dengan kemungkinan terbesar untuk data pengamatan sebagai perkiraan
dari parameter yang tak dketahui.
Definisi 9.2.2
Fungsi Likelihood Pdf bersama dari n variabel
yang dinilai dengan
,
mengatakan bahwa (
) tertunjuk sebagai fungsi Likelihood. Untuk
yang tetap, fungsi kemungkinannya adalah sebuah fungsi dari dan sering ditulis dengan
( ).
Jika
merepresentasikan sebuah sampel acak dari (
), maka :
( )
(
)
(
)
(9.2.4)
Definisi 9.2.3
(
)
Estimator MaksimumLikelihood.Misalkan ( )
, adalah pdf
), nilai dalam di mana ( )
bersama dari
. Untuk data pengamatan, (
maksimum maka disebut Estimator MaksimumLikelihood(MLE) dari . Yaitu, adalah
nilai dari yang memenuhi :
)
(
)
(
(9.2.5)
Dalam penerapan fungsi likelihood, ( ) merepresentasikan pdf bersama dari sampel acak,
walaupun kemungkinan maksimumnya juga dapat dipakai dalam kasus lain seperti dalam
order statistik. Jika
adalah selang terbuka, dan ( ) dapat diturunkan dan dimisalkan
maksimum pada , maka MLE akan menjadi solusi dari persamaan :
( )
(9.2.6)
Teorema 9.2.1
Sifat Invarian Jika adalah MLE dari
53
Contoh 9.2.7
Misalkan sampel acak dari distribusi eksponensial,
sampel berukuran n adalah
( )
Dengan demikian,
( )
( )
(
)
Jika kita ingin mengestimasi ( )
, maka kita tahu dari Teorema 9.2.1
( ( )
( )) adalah
( ( )
), maka MLE
( )) untuk
Estimator dengan banyak parameter akan tidak sama seperti estimator tunggal ketika
parameter yang lain diketahui.
Contoh 9.2.11
Misalkan sampel acak dari distribusi dengan dua parameter tidak diketahui,
(
).
Pdf populasinya adalah
(
( )
( )
dimana
adalah minimum dari
. Kemungkinannya dimaksimalkan dengan
mengikuti dengan mengambil
. Untuk memaksimalkan secara relative ke , bisa
diturunkan ( ) dengan mengikuti , dan menangani persamaan
( )
(
)
dengan hasilnya
)
)
54
diberikan oleh
seperti pada Teorema 9.2.2.
Jika T adalah estimator unbiased dari (), berdasarkan pertidaksamaan chebychev bahwa
[ ( )
( )
]
( )
(9.3.3)
Untuk semua
. ini menunjukkan bahwa untuk estimator unbiased, satu dengan varians
yang lebih kecil akan cenderung lebih terkonsentrasi dan dengan demikian mungkin lebih
baik.
Uniformly Minimum Variance Unbiased Estimators (UMVUE)
Definisi 9.3.2
Diberikan
55
Contoh 9.3.4
Misalkan sampel acak dari sebuah distribusi eksponen,
( )
)=
ln (
) = ln
ln (
)=
ln
(
[
)]
[(
( ) karena
)
)
Teorema 9.3.1
Jika sebuah estimasi yang unbiaseduntuk () ada, variansi yang memenuhi CRLB,maka
hanya sebuah fungsi linear() yang dapat dipakai sebagaiestimasiunbiased variannya
memenuhi hubungan CRLB.
Definisi 9.3.3
Efisiensi. Suatu efisiensi relatif dari estimatorunbias T untuk () diberikan oleh
(
(9.3.7)
( )
)
Suatu estimator unbias T* untuk() dapat dikatakan efisien jika (
untuk semua
estimator unbias T dari (), dan semua . Efisiensi dari suatu estimatorunbias T untuk
() diberikan dengan :
( )
(
)
(9.3.8)
*
Jika T adalah suatu estimator efisien untuk()
Definisi 9.3.4
Jika T adalah sebuah estimatoruntuk (), maka bias adalah
b(T) = E(T) - ()
(9.3.9)
(9.3.10)
Teorema 9.3.2
Jika T adalah taksiran dari (), maka
MSE(T) = Var(T) + [b(T)]2
(9.3.11)
56
Bukti :
( )
[
[
[
( )]
( )
( )
( )]
( )]
[ ( )
( )]
[ ( )
( )] [ ( )
( )]
( ) [ ( )]
Kesalahan hasil kali rata-rata (MSE) adalah sebuah standar yang dapat beralasan dengan
memperhatikan antara varians dan estimaunbiased.
9.4 Sifat-sifat untuk Sampel Besar
Definisi 9.4.1
Konsistensi Sederhana
Misalkan { } suatu barisan estimator ( ) ,estimator dikatakan estimator konsisten untuk
( )jika setiap
( )|
[|
]
, untuk setiap
(9.4.1)
Definisi 9.4.2
Konsistensi MSE
Jika { } merupakan suatu barisan estimator ( ), dapat dinamakan mean squared error
konsisten dimana
[
( )]
, untuk setiap
(9.4.2)
Definisi 9.4.3
Asimtotik Unbiased
Suatu barisan { } merupakan asimtotik unbiased ( ) jika
( )
( ), untuk semua
(9.4.3)
Teorema 9.4.1
Suatu barisan { } merupakan konsisten MSE jika dan hanya jika unbiased asimtotik dan
( )
Bukti :
Berhubungan dengan teorema 9.3.2
( )
( ) [ ( )
( )]
Karena keduanya menunjukkan bagian kanan tidak negatif,
( )
( ).
langsung
dan ( )
57
( )
secara tidak
Contoh 9.4.1:
Pada contoh 9.3.2, misalkan perbandingan terbalik dari mean sampel, dengan
merupakan estimator ( )
, pada catatan sebelumnya
(
persamaan 8.3.6 diperoleh ( )
sehingga ( )
](
( )
dan
( )
) dan
karena
[(
). Dari
],
Teorema 9.4.2
Jika suatu barisan { } merupakan
sederhana
Bukti :
Dari ketidaksamaan Markov,
[|
( )|
]
( )
dan
sehingga
mendekati 1 karena
( )
Teorema 9.4.3
Jika { } adalah konsisten sederhana dari ( ) dan jika ( )yaitu nilai kontinu lain ( ),
maka ( ) adalah konsisten sederhana dari ( ( ))
Definisi 9.4.4
Asymptotic Efficiency
{ } dan { } merupakan dua asimtotik unbiased barisan estimator ( ). Maka asimtotik
relative efisien (are) diperoleh dari
(
(9.4.4)
(
)
urutan { } merupakan asymptotic efficiency jika
untuk semua urutan
asimtotik unbiased { } lain, dan semua
. asymptotic efficiency dari urutan asimtotik
( )
(
) jika { } asymptotic efficiency.
unbiased{ } diperoleh dari
Contoh 9.4.3:
Dari contoh 9.4.1 terdapat
( ), urutan
ditunjukkan asimtotik objektif untuk
( )
. Varian adalah
[(
[
Karena
[(
[ (
)]
]
)
)]
58
( )
) (
Didapat MLE
(
(
) (
)
)
Sehingga
[
)]
[ (
)]
( )
)]
saat
(9.5.1)
( ).
(9.5.2)
59
Definisi 9.5.2
Risk Function
Risk Function didefinisikan menjadi
[ (
( )
)]
(9.5.3)
Jika suatu parameter atau fungsi dari parameter akan diestimasi, dapat dipilih loss function
yang bergantung dengan masalah tersebut, dan ketika mencoba untuk menemukan estimator,
risk function dari keduanya adalah kecil untuk semua nilai parameter kemungkinan.
Definisi 9.5.3
Admissible Estimator
Sebuah estimator lebih baik daripada estimator jika dan hanya jika :
( )
( ) untuk semua
, dan
( )
( ) untuk terakhir
Sebuah estimator T merupakan Admissible estimator jika dan hanya jika tidak ada estimator
yang lebih baik.
Definisi 9.5.4
Minimax Estimator
Suatu estimator
( )
(9.5.4)
( )
( )
(
(
| ) ( )
| ) ( )
( )
(9.5.7)
) dinamakan kepadatan
(9.5.8)
60
Teorema 9.5.1
merupakan sampel acak ( | ) maka Estimator bayes adalah estimator yang
Jika
)]
Teorema 9.5.2
Estimator Bayes T dari ( ) di bawah fungsi kuadrat error kerugian,
(
( )]
(9.5.10)
[ (
)]
( )
( )
(9.5.11)
Contoh 9.5.4:
Misalkan sampel acak berukuran n dari distribusi Bernoulli
Contoh 9.5.4
Berdasarkan sample acak berukuran n dari distribusi bernaulli
( | )
(
)
Dan
( ). Persamaan kepadatan posteriornya
(
)
(
)
|
)
(
Untuk menunjukkannya menggunakan notasi distribusi beta. Variabel acak Y dari distribusi
(
)
beta dengan parameter a dan b,
)
(
)
Pdfnya (
(
) dimana 0 < y < 1 dan y yang lain 0, dengan
(
)
( ) ( ) (
). ( )
(
).
Untuk menunjukkan distribusi posterior,
(
( )
) (
(9.5.12)
).
(
)]
[(
( )
adalah
)
)
(
(
)
)
Teorema 9.5.3
Estimator Bayes dari
(
(9.5.14)
|
( )
61
Teorema 9.5.4
( )
maka T* estimator
minimax
Bukti :
Misalkan
( ), tapi karena
( ) konstanta atas ,
( )
[ ( )]
[ ( )]
Untuk setiap T karena T* estimator bayes. Rata-rata dari suatu variable tidak lebih besar dari
nilai maximum variable itu sendiri.
( ) dan
( )
( )
Jadi [ ( )]
Dimana T* adalah estimator minimax.
Contoh 9.5.6 :
Berhubungan dengan distribusi prior dan posterior dalam contoh 9.5.4, disini kita mencari
bobot kuadrat error kerugian,
(
( )
)
(
(9.5.15)
)
|
[ (
)]
)
(
) (
( ) (
Dengan ( )
(
Yang mana mean
[ (
(
(
(
) (
)
)] minimal saat integral yang terakhir minimal. Integral ini
)
mean dari
(
(
.
.
( )
Dimana
dan
estimator
bayes
adalah
Resikonya
[
]
(
)
( )
(
)
(
)
SOAL-SOAL LATIHAN
1.
62
dengan
]
( )
( )
adalah
) dengan
) adalah
( )
( )
b.
Persamaan a = b
63
4.
) adalah
( )
3. ( )
= =
2.
( )
p=
E(x) =
5.
Penyelesaian :
1.
( )
2.
3. ( )
( )
( )
( )
( )
6.
64
) dengan
3. (1) = (2)
Var (x) =
-(
MME dari
(
)
7. Misalkan sampel acak dari distribusi eksponensial,
untuk sampel berukuran n adalah
( ). Fungsi kemungkinan
( )
Dengan demikian,
( )
( )
(
)
mengestimasi ( )
, maka kita tahu dari Teorema 9.2.1 bahwa
MLE-nya adalah ( )
(
) (
Didapat MLE
(
(
) (
(
Sehingga
65
)
)
)]
[ (
)]
)]
( )
(
)
9. Diberikan populasi berdistribusi normal dengan mean tidak diketahui, namun variance
Interval parameter tepat adalah = (-, ), karena pada umumnya nilai tengah
(mean) dari distribusi normal, - < < . Dengan keinginan untuk menaksir 95%
bagian, dalam distribusi N(,9). Contoh berikut ini dalam sebuah fungsi dari parameter,
karena ( )
. diikuti dengan T= + 4.95 adalah estimator
obyektif dari ( ), karena E(T) = E( + 4.95) = E( ) + 4.95 = + 4.95, dengan tidak
memperdulikan nilai dari .
10. Dari contoh sebelumnya terdapat
( ), urutan
ditunjukkan asimtotik
objektif untuk
[
[ (
)]
( )
. Varian adalah
]Karena
[(
[
[(
66
]
)
BAB X
KECUKUPAN DAN KELENGKAPAN
10.1 PENDAHULUAN
Pada Bab 9 dibahas mengenai penentuan estimasi titik dengan menggunakan sampel
acak untuk mengestimasi parameter yang tidak diketahui pada populasi. Pada beberapa kasus,
hal itu mungkin dapat ditunjukkan bahwa suatu bagian statistik atau himpunan dari statistik
terdiri atas informasi pada sampel tentang parameter. Hal tersebut menjadi alasan
pembatasan statistik ketika mengestimasi atau untuk melakukan inferensi tentang parameter.
Jadi informasi dalam suatu sampel
akan digunakan untuk melakukan inferensi
tentang parameter.
Pada umumnya istilah dari kecukupan meliputi reduksi suatu himpunan data atau
ringkasan data dari statistik dengan tidak ada informasi yang diketahui dari parameter. Suatu
statistik dinyatakan sebagai suatu sufficient/kecukupan statistik untuk suatu parameter
jika distribusi bersyarat dari statistik yang lain diberikan nilai dengan tidak diketahui .
Dengan kata lain, nilai awal dari suatu statistik kecukupan diketahui, nilai amatannya dari
statistik yang lain termuat informasi yang lain tentang parameter.
Contoh Soal 10.1.1
Sebuah koin dilempar sebanyak kali dan hasil kejadian diamati untuk setiap lemparannya.
Serta dimodelkan dalam sebuah sampel acak
masing-masing berdistribusi
Bernoulli. Dimisalkan tidak diketahui kondisi koin seluruhnya. Tentukan estimasi
(
) Hal itu terlihat merupakan jumlah keseluruhan muka yang muncul yaitu
,
memberikan banyak informasi tentang nilai
sebagai hasil
sebenarnya.
Penyelesaian:
(
)
(
) dengan
(
) sehingga pdf marginal
Diketahui bahwa
(
( )
Jika
maka kejadiaannya [
ekuivalen,dan
|
] dan [
[
]
[
)
(
( )
]
(
)
(
( )
Jika
misalkan
{(
|
( )
maka pdfnya 0. Pada kasus lain, hal itu tidak melibatkan . Selanjutnya
(
)
untuk
statistik
lain
dan
didefinisikan
) (
)
} Pdf bersyarat dari
diberikan
yaitu:
[
67
68
pdfnya dari
|
) diberikan
(
{
(
)
Contoh 10.2.1
Andaikan sampel acak dari suatu distribusi eksponensial,
untuk
Penyelesaian:
Pdf tunggal
( )
( ). Tentukan estimasi
maka
)
) sehingga pdfnya,
( )
(
)
(
S berdistribusi Gamma,
(
Jika s=
( )
( )
( )
69
(
)
Sehingga menjadi (
Atau
)
(
)
(
( ) ( )
) (
) ( )
. Hal ini
jika dan
) dengan
) tidak
Contoh 10.2.2
Berdasarkan sampel acak
pada contoh 10.1.1, dengan
(
). Sebagai contoh
misalkan
sebagai statistik kecukupan dan secara langsung dengan pdf bersyarat
untuk yang diberikan
. Digunakan kriteria faktorisasi untuk menyederhanakan sampel
acak tersebut
(
)
(
)
(
)
(
) (
)
)
Untuk
dan pada kasus ini, didefinisikan (
jika semua
atau 1, dan 0 untuk yang lain. Hal tersebut dinotasikan proporsi sampel,
juga
statistik kecukupan untuk Pada umumnya, jika suatu statistik dikatakan kecukupan untuk
maka fungsi satu-satu dari juga kecukupan untuk
Contoh 10.2.3
Andaikan sampel acak berdistribusi uniform,
(
) dengan
diketahui. Gunakan kriteria faktorisasi untuk menyederhanakan sampel acak tersebut!
Penyelesaian:
Pdf bersama untuk
adalah
(
Hal tersebut akan lebih mudah jika dituliskan dalam orde statistik minimum
maksimum
dari
.
Sehingga (
yang artinya bahwa (
tidak
)
)
) (
70
).
dan
Dengan
jika
jika
dan 0 untuk yang lainnya. Hal tersebut dari bentuk kriteria faktorisasi bahwa order
statistik terbesar
statistik kecukupan untuk
Definisi 10.2.3
Jika
adalah suatu himpunan, maka fungsi indikator dari
didefinisikan sebagai
( )
( )
)(
)(
)(
( )
)(
persamaan (10.2.3)
) dan (
Contoh 10.2.4
Diberikan suatu sampel acak dari suatu distribusi normal,
tidak diketahui.
Penyelesaian:
Pdf bersama dari distribusi normal diberikan oleh
(
)(
)
misalkan
dan
dan
dan
) ]
) dengan
[
(
(
)
)
Dan (
Maka dengan kriteria faktorisasi,
(
)
statistik kecukupan bersama untuk
[
(
Karena (
dan dengan
) maka
) sehingga bahwa
(
Karena
, dinotasikan dengan
,
)]
dan
(
adalah
) , merupakan
71
Bukti:
Dari kriteria faktorisasi,
( ,,
)
) ( ,, )
(10.2.3)
yang merupakan nilai fungsi maksimum likelihood yang bergantung pada s,
MLE tunggal maka menyatakan fungsi dari s.
( )
(
Contoh 10.3.1
Diberikan
diskrit dengan pdf
indikator
(
)(
) dan
Jika ( )
( )( )
( )( )
dilihat dengan kriteria faktorisasi
( )
)(
( )
( )(
) maka
( )(
( ) kecukupan untuk
, dapat
) menghasilkan MLE,
)(
) dan (
( )(
( ) Jika
( )
) menghasilkan MLE,
( )
ini sesuai dengan estimasi maksimum (
) untuk menetapkan setiap .
bukan fungsi S karena ( )
( )
( )
, ( )
( )
( ), ( )
sehingga ( )
( )( )
( )
)(
Teorema 10.3.2
Jika S kecukupan untuk
Bukti:
Fungsi ( , , ) pada kriteria faktorisasi tidak bergantung pada , sehingga persamaan
9.5.8 Posterior density
| ) ( )
(
| ( )
| ) ( ) ( )
(
(
(
) ( )
) ( ) ( )
(
)
,,
)
), maka
72
)
}, disebut lengkap jika [ ( )]
dengan probabilitas 1 untuk semua
.
Terkadang ditunjukkan dengan tidak adanya estimator unbias nontrivial dari nol.
Maksudnya 2 fungsi berbeda dari T tidak dapat memiliki nilai ekspektasi yang sama. Sebagai
contoh :
[ ( )]
( )
dan
[ ( )]
( ), maka
[ ( )
( )]
( )
( )
( )
( )
dengan probabilitas 1, jika keluarga pdf lengkap. Untuk keadaan ini estimator unbias tunggal.
73
( ) (
Karena
maka ( )
( ),
, agar
[ ( )]
( )
. Dengan kelengkapan,
fungsi tunggal
( )
74
( )
( )
Definisi 10.4.2
Kelas Eksponensial.
Suatu pdf dikatakan Regular Exponential Class (REC) jika dapat dinyatakan
dalam bentuk
(
)
( ) ( )
( ) ( )]
[
(10.4.1)
Dan nol untuk yang lain, dimana
(
) vektor dari parameter tidak
diketahui-k, jika parameter ruang dalam bentuk
{ |
}
(
dan
), dan jika memenuhi:
1. Himpunan
{
(
)
} tidak bergantung pada
2. Fungsi ( ) nontrivial, independen, kontinu dari
3a. Untuk variabel acak kontinu, turunan
( ) tidak bergantung secara
linear pada atas
3b. Untuk variabel acak diskrit, ( ) nontrivial pada atas , dan tidak
ada fungsi linear yang lain.
Contoh 10.4.2
Suatu distribusi Bernoulli,
)
(
)
(
( )
[
[
]}
( )
Teorema 10.4.2
Jika
,,
) maka
( )
( )
Contoh 10.4.3
( ). Untuk sampel acak n, ( )
Pada contoh 10.4.2,
Coba (
)
)]
[ (
( )
( )
75
dan
. Maka UMVUE dengan
[ (
)]
[ (
( )
)]
[ (
)]
[ (
)]
[ (
[ (
) (
[
UMVUE dari (
(
(
)(
)]
) adalah (
( )]
( )
)
)(
)]
(
(
[ ( )
(
) dimana
Contoh 10.4.4
(
), maka
Jika
(
]
]
Teorema 10.4.4
Jika CRLB ada, maka ada suatu estimator CRLB untuk beberapa ( ) jika dan
hanya jika pdf anggota REC. Selanjutnya, estimator CRLB dari ( ) menjadi
( ), dimana merupakan MLE dari .
Definisi 10.4.3
Suatu pdf dikatakan anggota Range-Dependent Exponential Class
(RDEC)(
) jika memenuhi kondisi 2 dan 3a atau 3b dari definisi
10.4.2 untuk
dan jika dalam bentuk
(
)
( ) ( )
(
) ( )]
[
(10.4.2)
dimana
{ | (
)
(
)} dan
76
Contoh 10.4.5
Diberikan pdf (
( )
, fungsi turun untuk
( )
, fungsi naik untuk
dari teorema 10.4.5 didapat
[ (
)(
[
(
)
(
)]
)] adalah statistik kecukupan tunggal untuk .
Teorema 10.4.6
Diberikan , ,
sampel acak dari anggota RDEC
1. Jika
dan batas bawah konstan, ( )
, maka
dan
.
( )
Jika batas atas konstan,
, maka
dan
( )
adalah kecukupan bersama untuk dan
.
2. Keadaan satu parameter, jika ( ) tidak bergantung pada maka
kecukupan untuk , dan jika ( ) tidak bergantung pada
maka
kecukupan untuk .
77
Contoh 10.4.6
Distribusi eksponensial dengan 2 parameter,
(
(
( )
( )
( )
( )
;
(
Jika , ,
sampel acak
dari teorema 10.4.6 bahwa
dan adalah statistik kecukupan untuk (
bukan fungsi parameter, jadi
tidak terlibat.
Jika diketahui,
, maka
(
( )
( )
).
( )
;
;
kecukupan untuk .
Konsisten dengan hasil sebelumnya, dimana didapat estimator
dari estimator atas statistik lain seperti .
atas
Teorema 10.4.7
Basu.
Andaikan
, ,
mempunyai pdf bersama ( , ,
);
.
Dimisalkan =( , , ) dimana , ,
adalah kecukupan bersama
untuk , dan statistik lain. Jika distribusi tidak memuat , maka dan
stokastik independen.
Bukti :
) dan ( | ) adalah pdf dari
Untuk keadaan diskrit, dinotasikan ( ) (
bersyarat terhadap
. Nilai ekspektasi relative terhadap distribusi .
[ ( )
( | )]
( )
( )
( | ) (
, , dan pdf
(
)
( )
( )
( ) yang meannya
78
dan
adalah stokastik
Contoh 10.4.9
Diberikan sampel acak berukuran n dari distribusi Normal,
(
dan
(
(
ke persamaan diatas
(
(
) dan MLE,
(
(
)
)
dan .
1. Diberikan
bahwa
10.2.1)
Penyelesaian :
79
Diketahui bahwa
(
maka diperoleh
Jika
maka
)
(
Sedangkan 0 untuk yang lainnya. Karena pdf tersebut tidak bergantung pada
maka menurut
( )
2. Diberikan sebuah sampel acak berukuran berdistribusi geometrik,
dan (
adalah statistik
3. Diberikan
adalah sampel acak berdistribusi Gamma,
Tunjukkan bahwa
adalah statistik kecukupan untuk .
a. Dengan menggunakan persamaan 10.2.1
b. Dengan menggunakan kriteria faktorisasi
Penyelesaian :
a. Pdf dari distribusi Gamma yaitu : ( )
Sedangkan pdf bersama untuk distribusi Gamma yaitu :
Diketahui bahwa
(
maka diperoleh
Jika
maka
)
(
)
(
80
Sedangkan 0 untuk yang lainnya. Karena pdf tersebut tidak bergantung pada
maka menurut
dan (
Ketika
berikut :
)(
)(
dan (
Karena dapat dinyatakan dalam bentuk faktorisasi maka adalah statistik kecukupan untuk
(
(
)
| dan (
81
(
Karena dapat dinyatakan dalam bentuk faktorisasi maka
) adalah statistik
kecukupan untuk
5. Pada contoh soal no 2 di atas, tentukan estimator dari
bandingkan dengan MLE pada p.
Penyelesaian :
Untuk distribusi geometrik, pdf diberikan oleh
(
)
(
) {
dengan
Fungsi Likelihoodnya
( )
( (
( )
dengan
) (
(
)
(
)
(
)
(
)
( )
)
)
yaitu
( )
dengan
diketahui,
[ ( ) ]
[ ( ) ]
[ ( ) ]
[ (
[ (
(
) ]
[
[
) ]
82
dan
)
Dan (
Maka dengan kriteria faktorisasi,
statistik kecukupan untuk .
merupakan
Dan (
Maka dengan kriteria faktorisasi,
statistik kecukupan tunggal untuk . Dan hanya terjadi jika n=1
merupakan
[ ( ) ]
Karena [ (
) ]
7. Misalkan
Tunjukkan
Penyelesaian:
Distribusi eksponensial dengan 2 parameter,
(
(
( )
( )
( )
( )
).
;
(
Jika , ,
sampel acak
dari teorema 10.4.6 bahwa
dan
( )
bukan fungsi parameter, jadi
8. Misalkan
sampel acak dari Distribusi Beta,
kecukupan bersama untuk
.
).
). Cari statistik
Penyelesaian:
(
)
( ) ( )
Untuk sampel acak ,
(
83
);
Penyelesaian:
( ).
Untuk sampel acak n, ( )
untuk .
a. UMVUE dari Var( )
(
Menggunakan (
)
dan
)]
[ (
( )
( )
)]
[ (
( ) [ ( )
( )]
)]
[ (
(
( )
(
)
)]
[ (
[ (
[ (
[ (
)]
) (
[
) adalah (
b. UMVUE dari
Menggunakan (
)]
[ (
( )
)]
( ) [ ( )
)]
(
( )
)]
)]
)(
[ (
) (
)]
(
(
(
(
(
(
84
)
)(
]
[
( )
( )]
(
)]
[ (
[ (
adalah
)(
) dimana
[ (
UMVUE dari
(
)(
)]
UMVUE dari (
[ (
[ (
)]
( );
Penyelesaian:
pdf
sehingga fungsi ( )
[ ( )]
( ) (
Karena
maka ( )
, agar [ ( )]
( )
. Dengan kelengkapan,
fungsi tunggal
( )
85
( )
( )
BAB XI
ESTIMASI INTERVAL
11.1 PENDAHULUAN
Masalah estimasi titik telah dibahas dalam Bab 9. Selanjutnya, Pada bab ini akan
dijelaskan mengenai estimasi interval, bagaimana mendapatkan nilai sebenarnya dari estimasi
yang diharapkan. Beberapa informasi pada pertanyaan ini disediakan dengan mengetahui
varians atau MSE estimator. Pendekatan lain akan mempertimbangkan perkiraan interval,
bahwa sebuah interval tersebut akan berisi nilai parameter yang sebenarnya.
---------------------------------------------------------------------------------------------------------------Contoh 11.1.1
Pada contoh 4.6.3, daya tahan hidup yang diamati (dalam bulan) dari 40 sampel lampu
yang diberikan dalam tabel sebagai berikut,
0.15
2.37
2.90
7.39
7.99
12.05
15.17
17.56
22.40
34.84
35.39
36.38
39.52
41.07
46.50
50.52
52.54
58.91
58.93
66.71
71.48
71.84
77.66
79.31
80.90
90.87
91.22
96.35
108.92
112.26
122.71
126.87
127.05
137.96
167.59
183.53
282.49
335.33
341.19
409.97
Tabel 11.1.1
Diasumsikan bahwa data suatu sampel acak berukuran 40 dan berdistribusi eksponensial,
( ), dimana adalah mean (rata-rata). Pada contoh 9.3.4 ditemukan sampel mean
adalah UMVUE dari . Untuk data yang telah diberikan, estimasi dari adalah
bulan. Meskipun diketahui bahwa estimasi ini berdasar pada sebuah estimator sifat yang
optimal, sebuah estimasi titik sendiri tidak memberikan informasi yang akurat. Penyelesaian
dari masalah ini yakni dengan memperoleh interval yang batas atas dan batas bawah yang
mencakup nilai parameter
yang sebenarnya diantara yang lainnya dengan probabilitas
mendekati 1.
]=(1 )100%
[
[
]
,
[
]
---------------------------------------------------------------------------------------------------------------Pada umumnya, sebuah interval dengan batas atas dan batas bawah acak disebut interval
86
baik atau tidaknya berisi . Namun faktanya bahwa probabilitas dari interval acak 0.95
menegaskan 95 % kepercayaan bahwa
.
Dalam bab ini juga akan membahas definisi interval kepercayaan dan mendiskusikan
tentang metode umum untuk menurunkan interval kepercayaan
11.2 INTERVAL KEPERCAYAAN
)
Misal
pdf bersama (
, dimana adalah sebuah interval.
( )
) dan
) . Jika
( ) adalah statistik, dengan
l(
u(
) dan
sebuah data percobaan
diberikan, maka dapat diamati nilai l (
).
u(
Definisi 11.2.1
Interval Kepercayaan. Sebuah interval ( l (
interval kepercayaan untuk
[l(
Dimana
) , u(
) ) dinamakan 100
jika
)
)]
u(
. Nilai pengamatan l (
) dan u(
(11.2.1)
) masing-masing
87
Definisi 11.2.2
l(
(11.2.2)
2. 2. Jika
u(
[
maka u( )
u(
)]
(11.2.3)
Ini mungkin tidak selalu jelas bagaimana memperoleh limit kepercayaan yang memenuhi
Definisi 11.2.1 maupun 11.2.2. Jika sebuah kecukupan tunggal statistik ada, maka satu
kemungkinan untuk menemukan limit kepercayaan yakni fungsi . Disisi lain, statistik yang
lainnya yakni MSE, mungkin diberikan.
---------------------------------------------------------------------------------------------------------------Contoh 11.2.1 :
( ) dan
Ambil sampel acak yang berukuran n dari distribusi eksponensial,
diharapkan dapat diperoleh batas bawah satu arah
limit kepercayaan untuk .
Tentukan interval kepercayaan dengan parameter !
Penyelesaian:
( ). Telah
Diketahui bahwa adalah kecukupan untuk
dan juga
dijelaskan di bab 8, persentil ke- , ( ) dapat dilihat di tabel 4 (Appendix C). Dengan
demikian,
[
(
(
)]
]
limit kepercayaan diberikan oleh
(11.2.4)
(11.2.5)
Perhatikan bahwa dalam kasus batas atas, harus digunakan nilai ketika membaca tabel 4.
Contoh, jika batas atas 90 % limit kepercayaan diperoleh dari
. Untuk
( )
sampel ukuran
, persentil yang diperlukan yakni
, sehingga batas
atas limit kepercayaan yakni u( )
.
Anggaplah bahwa diinginkan
limit kepercayaan untuk . Jika dipilih nilai
dan
seperti
, maka
88
)]
)]
(11.2.6)
---------------------------------------------------------------------------------------------------------------Pada umumnya, untuk penentuan tingkat kepercayaan, kita ingin menggunakan metode
yang akan menghasilkan interval dengan mengoptimalkan sifat seperti panjang minimal.
Sebenarnya, panjang,
, sesuai dengan interval acak pada umumnya akan menjadi
variabel acak, jadi standar seperti Panjang Ekspektasi Minimum akan lebih tepat. Untuk
beberapa masalah, equal tailed choice
dan
akan disediakan panjang ekspektasi
maksimum, tetapi tidak untuk yang lain. Contohnya, interval (11.2.6) contoh sebelumnya
tidak memiliki sifat (lihat latihan 26).
Contoh 11.2.2
Diberikan sampel acak dari distribusi normal.
(
), dimana
diasumsikan
[
[
Bahwa
diberikan oleh
)
maka
[
[
[
]
]
)
---------------------------------------------------------------------------------------------------------------Perhatikan permasalahan ini tidak dapat diterima jika
tidak diketahui, karena limit
kepercayaan tergantung pada parameter yang tidak diketahui dan tidak dapat dihitung.
Dengan sedikit modifikasi diperoleh interval kepercayaan untuk dan adalah parameter
yang sulit diketahui. Kesulitan utama dalam menentukan interval yang muncul di kasus
89
multiparameter adalah dimana parameter yang sulit diketahui ada. Untuk permasalahan ini
aka nada di bagian selanjutnya.
Di kasus multiparameter mungkin diinginkan daerah kepercayaan bersama bahwa
berlaku juga untuk semua parameter secara serentak. Daerah kepercayaan untuk parameter
tunggal, di kasus satu dimensi, akan ada beberapa keadaan selain dari interval. Pada
umumnya, jika
, maka daerah lainnya
(
) di
adalah 100
daerah
kepercayaan jika probabilitas bahwa (
) mengandung nilai sebenarnya .
11.3 METODE KUANTITAS PIVOT
Misalkan
dengan pdf bersama (
) dan dengan harapan untuk
mendapatkan batas kepercayaan dimana parameter parameter lain juga ada.
Definisi 11.3.1 (Kuantitas Pivot)
Jika Q = (
) adalah peubah acak dari suatu fungsi dengan peubah
dan
, maka Q dikatakan kuantitas pivot jika distribusinya tidak bergantung dan parameter
yang lain.
---------------------------------------------------------------------------------------------------------------Contoh 11.3.1
Dalam contoh 11.2.1, terdapat peubah acak yang berdistribusi chi square dan
kuantitas pivot Q =
2. Jika
90
) untuk
dan
Untuk pengertian parameter lokasi dan parameter skala telah dibahas di subbab 3.4
hal.124 pustaka utama dan tentang MLE telah dibahas pada subbab 9.4 hal.316 pustaka
utama tentang sifat sifat asimtotik.
Teorema 11.3.2
Diberikan
)=
) dan
dan
adalah kuantitas pivot, maka tentukan interval kepercayaan untuk setiap parameter dengan
mempertimbangkan parameter lainnya!
Penyelesaian :
Seperti yang telah dibahas pada bab 9, MLE akan sesuai untuk menyatakan hasil dari
bentuk estimasi unbias
(
) dengan mengambil kemudahan dari bentuk
distribusi yang berkaitan dengan
(
), yang telah diketahui berikut.
), maka distribusi t
Jika
dinotasikan dengan sampel acak dari (
(11.3.3)
Jika
(11.3.4)
(
) adalah persentil ke (
), maka
]=
adalah
(11.3.5)
(
dan
91
) dan
[
[(
]] =
)
adalah
(11.3.6)
)=
( )
dimana
dan
(11.3.7)
(
). Hubungan antara parameter parameternya adalah
, dengan demikian
(11.3.8)
dan
(11.3.9)
adalah kuantitas pivot dari
---------------------------------------------------------------------------------------------------------------Jika
(
) dan jika (
) adalah CDF dari , dari teorema 6.3.3 hal.201
)
pustaka utama, tentang probabilitas transformasi integral , maka (
( ) dan
(
)
( ) Untuk sampel acak
maka juga bisa didekati dengan
distribusi Chi-Square
(
)
( )
(11.3.10)
sehingga
[
(11.3.11)
92
)]
(
)
( ), maka bisa didekati
Jika (
) fungsi monoton, maka 1
dengan
(
))
(
( )
(11.3.12)
---------------------------------------------------------------------------------------------------------------Contoh 11.3.4
Diberikan sebuah sampel acak dari distribusi Pareto
PAR( ) . Tentukan interval
kepercayaan dari 100(
)% !
Penyelesaian :
)= 1 (
CDF (
) ,x>0
gunakan persamaan
(
(
(
))
( (
))
)) =
(
(
)
), sehingga
(
)
(
)
---------------------------------------------------------------------------------------------------------------11.3.1 PENDEKATAN INTERVAL KEPERCAYAAN
Diberikan
adalah sampel acak dengan pdf (
). Berdasarkan penjelasan di
bab 9, MLE normal asimtotik dalam suatu kondisi.
Contoh 11.3.5
Diberikan sampel acak berdistribusi Bernoulli,
interval kepercayaannya !
Penyelesaian :
MLE dari p adalah =
). Tentukan pendekatan
), namun tidak ada kuantitas pivot untuk p, dengan teorema limit pusat
(
BIN(
(11.3.13)
untuk sampel berukuran n, mencari interval kepercayaan
[
(11.3.14)
Pendekatan ini dapat ditingkatkan dengan menggunakan koreksi secara kontinu, yang
dibahas pada bab 7, namun di sini tidak ditekankan. Batas untuk suatu pendekatan 100
93
(
)
merupakan interval kepercayaan (
menyelesaikan penyelesaian dari adalah
(11.3.15)
dan penyelesaian dari
adalah
(11.3.16)
secara umum
(11.3.17)
saat
yang telah ditunjukkan pada contoh 7.7.2 hal.249 pustaka utama, maka untuk
sampel yang berukuran , hasil pendekatannya
(11.3.18)
dengan nilai pendekatan interval kepercayaannya
(
)
(11.3.19)
---------------------------------------------------------------------------------------------------------------Contoh 11.3.6
Diberikan sampel acak berukuran n dari distribusi Poisson
( ) . Tentukan
pendekatan interval kepercayaannya !
Penyelesaian :
( ) , dengan Teorema Limit Pusat
(11.3.20)
dan
dan
4.
5.
untuk
6.
untuk kejadian khusus,
maka
( )
saat
(11.3.21)
( )
----------------------------------------------------------------------------------------------------------------
94
dengan
!
menurut statistik S =
Penyelesaian :
dengan
, tidak ada statistik kecukupan tunggal, tapi
dan
adalah kecukupan
bersama terhadap . Hal ini diinginkan untuk mendapatkan interval kepercayaan sebesar 90%
untuk menurut statistik S =
. CDF dari S adalah
95
Grafik 11.1
dengan
( )
dan
(
)
( )
Grafik 11.1 terdiri atas parameter ( ) dan ( ) ,dengan n = 10.
Umumnya jika ( ) dan ( ) keduanya naik, maka titk akhir dari suatu interval
kepercayaan dapat diputuskan dengan meperhatikan
sebagai penyelesaian untuk batas
bawah
yaitu ( )
dan untuk batas atas
yaitu ( )
. Pernyataan bahwa
(
) adalah interval kepercayaan dari 100(
) digambarkan dalam grafik berikut .
Grafik 11.2
96
Teorema 11.4.1
Diberikan statistik S adalah kontinu dengan CDF (
) dan diberikan
( ) dan
( ) adalah
(11.4.2)
fungsi dengan ( ( ) ; )
(11.4.3)
dan ( ( ) ; )
terhadap
dan jika
, dimana 0 <
( ) dan
<1. Misalkan
beralasan :
(11.4.5)
,dengan
,dengan
( )
3. Jika
)
<1, maka (
dan 0 <
untuk parameter
---------------------------------------------------------------------------------------------------------------Contoh 11.4.2
Misalkan sampel acak berdistribusi eksponensial
( ) dan S =
adalah
kecukupan bersama dengan , tentukan ( ) dan ( ) !
Penyelesaian :
Diketahui
( ) dan S =
adalah cukup bersama dengan . Karena S =
), sehingga
( )
), sehingga
( )
( )
( )
( ).
)
merupakan batas atas satu
( )
( )
97
Teorema 11.4.2
Diberikan statistik S adalah kontinu dengan CDF (
dari S. Jika (
,dengan (11.4.6)
penyelesaian
(11.4.7)
,dengan penyelesaian
3. Jika
untuk
dan 0 <
<1, maka (
Definisi 11.4.1
Suatu pengamatan terhadap interval kepercayaan (L, U) disebut konservatif 100 (1- )%
interval kepercayaan untuk jika interval acak cocok memuat nilai yang benar dari dengan
probabilitas paling sedikit 1-
Teorema11.4.3
Misalkan S adalah suatu statistik dengan CDF G (s; ) dan misalkan h1 () dan h2 () merupakan
fungsi dari G(h1(); ) = 1 dan P[S < h2 (); ] = 1- 2
(11.4.8)
(11.4.9)
Suatu batas atas satu arah konservatif 100(1-1)% adalah batas kepercayaan, yang
merupakan suatu penyelesaian dari h2 (U) = s, atau G(s; U) = 1
2. Jika h1 () dan h2 () adalah fungsi turun, maka batas bawah satu arah konservatif
100(1-2)% yang merupakan penyelesaian dari h1(L)=s, atau G(s;L) = 1.
Suatu batas atas satu arah konservatif 100(1-2)% adalah batas kepercayaan, yang
merupakan penyelesaian dari h2 (U) = s, atau = U seperti P[S<s; U] = 1-2
3. Dalam kasus lain, jika = 1 2 dan 0 << 1, maka (L, U) adalah suatu interval (11.4.10)
kepercayaan 100(1-)% yang konservatif untuk .
Suatu tingkat kepercayaan kemungkinan tidak diterima jika S adalah fungsi diskrit,
namun tingkat kepercayaan pada dasarnya menyatakan suatu ukuran seberapa besar data
98
tersebut dapat dipercaya. Tentunya ini memerlukan kondisi dalam pertidaksamaan tegas
berikut :
P[S < h2 (); ] = 1- 2;
P[S < s; L] = 1- 2 ;
P[S<s; U] = 1- 2
Tentu saja, jika S adalah fungsi kontinu, maka P[S < s; L] = G(s;) dan dari aplikasi
teorema sebelumnya didapatkan tingkat kepercayaan yang eksak.
Untuk mendapatkan kasus dari distribusi diskrit, G(s;), dimana hi=() adalah fungsi
naik dan G(s;) adalah fungsi turun dari . Ambil S nilai diskrit s1, s2, dan ambil nilai
parameter 1,2, dengan G(si; i) = . Jika diamati bahwa S=si , maka ambil U=i sebagai
batas atas 100(1-)% dari batas kepercayaan. Tingkat kepercayaan akan menjadi lebih dari
1- untuk nilai tengah dari . Jika i-1<<i
maka interval kepercayaannya akan
mengandung jika nilai yang diamati dari S itu si, dengan probabilitas:
P [S si | i-1< <i] = 1- G(si-1 ; )
1- G (si-1 ; i-1)
=1
Dengan cara yang sama, anggap G (si ; ) = 1- dan L = i-1. Jika S = si, maka L adalah
penyelesaian dari G(si-1 ; L) = 1- . Sekarang pertimbangkan nilai dari i-1 < < i . Nilai ini
akan menjadi interval kepercayaan jika S
dengan probabilitas
P [S si | i-1< <i] = G (si; )
G (si; i) = 1
---------------------------------------------------------------------------------------------------------------Contoh 11.4.4
Dalam contoh 11.3.5, dua pendekatan ditampilkan untuk memperoleh pendekatan
interval kepercayaan untuk parameter binomial p, berdasarkan sampel pendekatan yang
besar. Dapatkan suatu batas konservatif (1 ) 100% batas kepercayaan untuk p dan
Diketahui bahwa
adalah statistik kecukupan dan S~BIN(n,p). Tidak akan
ditemui pernyataan eksplisit untuk h1(p) dan h2(p) dalam contoh ini, tapi perhatikan bahwa
G(s;p)=B(s;n,p) adalah fungsi naik dari p. Dengan demikian, untuk mencari nilai s,
penyelesaian dari:
(
( )
adalah suatu batas atas satu arah yang konservatif dan penyelesaian dari:
(
( )
99
)
maka interval
dengan cara yang sama, suatu konservatif bawah konservatif (1 2)100% batas kepercayaan
untuk adalah penyelesaian dari
1 2 G(s 1; L) = 1 H (2n L; 2s)
sehingga 2n L =
) dan
(
Dimana
2/
dan tidak
Ini menunujukkan bahwa metode ini, secara umum dapat digunakan dengan parameter
untuk menentukan batas kepercayaan pada , dengan 1, 2 parameter lain yang tidak
diketahui. Tentu saja jika diketahui, maka kuantitas pivot (
) dan
dapat
digunakan untuk menentukan interval kepercayaan untuk 1 dan 2. Teorema 11.3.2 juga
digunakan dalam situasi ini, karena 1 dan 2 adalah parameter skala lokasi ketika
diketahui. Hal tersebut tidak boleh diabaikan dalam menghadapi persoalan bagaimana
mendapatkan batas kepercayaan untuk 1 dan 2 ketika tidak diketahui
Teorema11.4.5
Misalkan X1,,Xn adalah sampel acak berukuran n dari distribusi dengan CDF (
Dimana 1 dan 2 adalah parameter skala posisi dan menunjukkan bahwa MLE dan ada.
Jika t adalah nilai pasti, maka F(t; ) adalah sebuah statistik yang distribusinya bergantung
pada t, 1 dan 2 dalam CDF F(t; 1; 2)
Berdasarkan kasus dimana F(x; 1; 2) = F0-1 [F(t; 1; 2)] dengan F0(z) adalah fungsi
satu-satu pada. Dimisalkan: c = (t-1)/ 2 = Fo-1[F(t; 1; 2)]
yang bergantung pada t, 1 dan 2 dalam CDF F(t; 1; 2) , ini mengikuti bentuk
F(t;
. 1, 2) = Fo[(t- 1)/ 2]
= Fo[c(2/ 2) - ( 1 - 1)/ 2]
yang merupakan sebuah fungsi dari c dan kuantitas pivot ( 1 - 1)/ 2 dan 2/ 2, sehingga
distribusi bergantung pada F(t; 1, 2) tapi tidak pada setiap parameter lain yang tidak
diketahui
---------------------------------------------------------------------------------------------------------------Contoh 11.4.6
Pertimbangkan kuantitas R(t) = P[X > t] = 1 F(t; 1,2)
Dapatkan batas bawah batas kepercayaan (1 )100% !
Penyelesaian :
R(t) = P[X > t] = 1 F(t; 1,2)
Hal ini adalah kuantitas yang penting dalam suatu aplikasi dimana X menunjukkan waktu
kegagalan atau waktu hidup sebuah percobaan. Dalam suatu aplikasi hal ini disebut fungsi
tahan uji, terkadang juga disebut fungsi bertahan. Hal ini mengikuti teorema sebelumnya
tentang distribusi tahan uji dari MLE. ( )
( ) yang bergantung hanya pada
R(t).
Untuk beberapa contoh spesifik, ambil sebuah sampel acak berukuran n dari dua
parameter yang berdistribusi eksponensial, Xi ~EXP(, ). MLE-nya adalah
dan
()
[( )
[ (
) ]
Jika Y = ( ) maka dapat ditunjukkan bahwa CDF, G(y; R(t)) naik di R(t) untuk setiap y.
Dengan demikian, berdasarkan teorema 11.4.2, batas bawah satu arah untuk batas
( )
[ (
) ]
101
( ( )
( ))
Untuk
(11.5.1)
)]
(11.5.2)
)100%
))
(11.5.3)
---------------------------------------------------------------------------------------------------------------Contoh 11.5.1
Sampel acak dengan ukuran n1= 16 dan n2=21 dengan estimasi
dan
dan 90% interval kepercayaan diinginkan. Tentukan interval kepercayaan 90% untuk
!
102
Penyelesaian :
(
(
)
(
)
didapat
(
)
=0,429. Hal
tersebut menunjukkan bahwa (0.143, 0.733) adalah 90% interval kepercayaan untuk
.
Karena intervalnya tidak memuat nilai 1, dapat disimpulkan bahwa
dan dua populasi tersebut memiliki variansi yang berbeda. Karena tingkat kepercayaannya
90%, jika hanya 10% hasil akhirnya, maka dalam rata-rata akan salah.
11.5.3 PROSEDUR UNTUK MEANS
Jika variansi,
dan
, diketahui, maka jumlah pivot untuk persamaan
hal mudah. Karena
adalah
(11.5.4)
(11.5.5)
Dengan Z, pernyataan P[-z1-/2 < Z < z1-2]=1 dapat diselesaikan dengan mudah untuk
menghitung batas kepercayaan (1 )100%, yaitu
Jika
(11.5.6)
diasumsikan sebagai suatu varians gabungan
maka
(
(11.5.7)
(
(11.5.8)
(
bebas dari
(11.5.9)
dan
), dengan
)100% untuk
)
(11.5.10)
diberikan
(11.5.11)
----------------------------------------------------------------------------------------------------------------
103
Contoh 11.5.2
Sampel acak dengan ukuran n1 = 16 dan n2 =21 berestimasi
dan
.Dapatkan suatu interval kepercayaan 90% untuk rasio dua varians yang
bertujuan memeriksa asumsi persamaan varians dengan menggunakan prosedur untuk mean!
Penyelesaian :
Interval kepercayaan 90% untuk
adalah (0,358 , 1,83). Dengan demikian, tidak
ada bukti kuat bahwa suatu varians tidak sama dan akan diasumsikan bahwa
.
Estimasi variansnya adalah
(
)
(
)
(
)(
) (
)(
= 0, 109
(11.5.12)
Persamaan ini digunakan untuk sampel besar.
Adapun untuk sampel kecil dari distribusi normal, distribusi dari variabel acak dalam
persamaan di atas bergantung pada
dan
, tapi pendekatan yang baik dalam sampel kecil
digunakan distribusi-t dengan persamaan berikut
( )
(11.5.13)
dimana derajat kebebasannya adalah
(
(11.5.14)
[(
) (
)] [(
) (
)]
104
Misalkan
(11.5.15)
dan
(
(
(11.5.16)
Berdasarkan hasil di Bab 6 bahwa
(
(11.5.17)
dengan demikian interval kepercayaan (1 ) 100% untuk
mempunyai batas :
(
(11.5.18)
dimana dan sD diketahui.
Perhatikan bahwa metode ini valid jika sampelnya bebas, karena pada kasus ini
(
) bagaimanapun, derajat kebebabasan dalam sampel berpasangan
adalah n 1, sedangkan dalam kasus sampel bebas dengan
diperoleh suatu t statistik
dengan derajat kebebasan 2n 2. Oleh karena keefektifan ukuran sampel adalah dua kali dari
sampel bebas maka metode sampel berpasangan kurang baik digunakan. Bagaimanapun, jika
ada alasan ada suatu sampel yang berpasangan dan pasangannya memiliki korelasi yang
tinggi, maka
lebih kecil dari
dan ini dapat merugikan
keefektivan ukuran sampel.
Hal yang menarik untuk dicatat bahwa jika dua sampel bebas memiiliki ukuran yang
sama dengan variansi yang berbeda, maka prosedur sampel berpasangan masih dapat
digunakan untuk menentukan suatu t statistik dengan syarat perbedaan hasil interval akan
cenderung menjadi lebih luas daripada saat menaksir variabel seperti persamaan 11.5.13.
)
(
(11.5.19)
Ini jelas bahwa pendekatan batas kepercayaan untuk sampel besar dengan parameter
dapat digunakan dalam suatu ketentuan seperti kasus dalam sebuah sampel, dengan
105
(11.5.20)
( )
| ) ( )
| ) ( )
(11.6.1)
Prior density ( ) dapat digunakan sebagai suatu kemungkinan inisial yang spesifik dari
suatu distribusi untuk nilai yang sesuai dan pada kaitannya | ( ) akan direpresentasikan
sebagai distribusi yang sesuai dengan variabel acak yang diamati. Untuk tingkat
,
interval kepercayaan Bayes untuk yang diberikan oleh (L, U), dengan L dan U adalah
batas untuk
( )
(11.6.2)
Jika adalah variabel acak yang benar, maka interval Bayes akan biasa saat dinyatakan
sebagai Interpretasi Peluang. Tentu saja, dalam banyak kasus, hasil yang benar hanya untuk
menunjukkan bahwa model yang diasumsikan benar. Jika ( ) adalah representasi dari
tingkat kepercayaan terhadap nilai , maka mungkin interval (L, U) juga direpresentasikan
dalam tingkat kepercayaan juga.
---------------------------------------------------------------------------------------------------------------Contoh 11.6.1
Pada Contoh 9.5.5, dimisalkan bahwa Xi ~ POI () dan ~ GAM(, ). Tentukan
Interval kepercayaan Bayes untuk jika diberikan oleh batas bawah dan batas atas
(L, U) !
Penyelesaian :
Distribusi posterior dari ~ GAM(, ), didapatkan persamaan
)
|
[(
]
(11.6.3)
yang menunjukkan bahwa
106
[ (
)]
(11.6.4)
dan P[ 2 / 2(v) < 2(n+1/)x< 1-/22 (v)] = 1
(11.6.5)
dengan
(
), maka
100(1- )% interval kepercayaan Bayes untuk diberikan oleh batas bawah dan batas atas
(L, U) dimana batas bawah L = 2 / 2(v) / 2(n+1/) dan batas atas U = 1-/22 (v)/ 2(n+1/).
RINGKASAN
Tujuan penting dari bab ini adalah untuk memperkenalkan konsep sebuah estimasi
interval atau interval kepercayaan. Suatu estimator titik sendiri tidak memberikan keakuratan
nilai. Suatu estimator interval memberikan penyelesaian yang mungkin untuk masalah ini.
Konsep ini melibatkan suatu interval yang titik akhirnya statistik dan termasuk nilai yang
benar dari parameter antara batas-batasnya dengan probabilitas tinggi. Probabilitas ini cocok
untuk tingkat kepercayaan dari estimator interval. Biasanya, instilah interval kepercayaan
(atau estimasi interval) memiliki arti pengamatan interval yang dihitung dari data.
Terdapat dua metode dasar untuk membangun interval kepercayaan. Metode yang
pertama, yang berguna di beberapa aplikasi dimana terdapat parameter yang tidak diketahui.
Meliputi dari dugaan kuantitas pivot. Jumlah ini digunakan untuk menemukan variable acak
yang berupa fungsi dari perhitungan variable acak dan parameter kepentingan, namun tidak
untuk parameter lain yang tidak diketahui. Hal ini juga dibutuhkan bahwa distribusi dari
kuantitas pivot adalah bebas dari parameter yang tidak diketahui. Dalam kasus ini, parameter
lokasi skala, kuantitas pivot dapat dinyatakan dalam bentuk MLE jika ada. Pendekatan
kuantitas pivot untuk sampel besar dapat dasarkan pada hasil dari distribusi normal asimtotik
dalam beberapa kasus.
Metode lain, yang disebut metode umum, tidak memerlukan eksistensi dari kuantitas
pivot, tapi metode umum mempunyai kerugian yaitu tidak bisa digunakan saat parameter lain
menjadi kendala ada. Metode ini dapat digunakan dengan statistik, yang distribusinya dapat
ditunjukkan dalam bentuk parameter. Parameter mempunyai fungsi yang disebut dengan
persentil dan batas dari interval kepercayaan didapatkan dengan menyelesaikan persamaan
yang jelas memerlukan persentil dan statistik dari nilai yang diestimasi. Interval dari estimasi
itu sendiri didapat dengan kedua metode yang bisa diinterpertasikan dalam bentuk frekuensi
relatif dengan nilai parameter yang benar dan mencakup suatu interval, sehingga
berhubungan atau korespondensi dengan peluang, pada akhirnya interval dari estimasi akan
mencakup nilai yang benar. Bentuk suatu interval yang lain dapat didekati dengan
pendekatan Bayes. Pendekatan ini menyediakan langkah yang sesuai dalam menggunakan
informasi yang diketahui.
107
SOAL-SOAL LATIHAN
,
interval kepercayaan,
maka
( )
)]
( )]
)
u(
u( )
c. Untuk interval kepercayaan yang diberikan oleh ekspresi (11.2.7), memperoleh rumus
ukuran sampel wajib menghasilkan panjang spesifik dari sebuah interval. Jika
, maka apa ukuran sampel yang dibutuhkan untuk mencapai
interval
kepercayaan dengan panjang 2 ?
Penyelesaian :
Ekspresi (11.2.7) yakni
(
108
Untuk
interval kepercayaan,
maka
(
(
)
)
(
(
(
)( )
)
)
)
dan
dengan
.
Penyelesaian :
,
Untuk
,
,
interval kepercayaan,
jika
maka
(
[
[
[
(
(
)
)]
)]
[
(
)(
109
maka
]
(
)
(
)(
]
)
(
)
( )
3.Misal
sampel acak dari distribusi eksponensial
a. Jika
dengan
, tentukan batas bawah satu arah 95 % limit
kepercayaan untuk
Penyelesaian :
Untuk
interval kepercayaan dengan
( )
[
]
l( )
)(
)
( (
)
(
))
)(
( (
)
(
Untuk (
))
kepercayaan adalah
4.Data berikut adalah waktu (per jam) gangguan peralatan AC di bagian pesawat terbang:
Asumsikan bahwa data adalah nilai yang diamati dari sampel acak berdistribusi
( )
exponensial
a. Tentukan 90 % interval kepercayaan untuk rata-rata waktu gangguan,
Penyelesaian :
Dari data yang diberikan, dapat diperoleh
110
Untuk
interval kepercayaan,
( )
[
[
[ (
)(
( (
)
(
(
maka
( )]
)(
)
)]
))
)
( (
))]
)]
[
]
Sehingga diperoleh interval kepercayaan untuk
(
)
(
)
b. Tentukan batas bawah satu arah
limit kepercayaan untuk 10th persentil dari
distribusi waktu gangguan.
Penyelesaian :
Untuk
interval kepercayaan dengan 10th persentil maka
( )
[
]
l( )
)(
( (
)
(
))
6. Misal X1,, Xn adalah sampel acak dari distribusi Eksponensial dua parameter,
Xi~EXP(,).
a. Asumsikan diketahui = 150, tentukan kuantitas pivot untuk parameter berdasarkan
statistic kecukupan.
b. dengan menggunakan data pada Latihan 5, tentukan batas bawah 95% interval kepercayaan
untuk .
Penyelesaian:
(
a. Pdf: f(x; , ) =
= 150 sehingga f (x; ) =
Xi~EXP(,).
(
111
(
(
Jadi,
=P[
=P[
)
(
)]
= P [578,117<]
7. Andaikan
a. Tunjukkan bahwa Q =
),
[ ( ) ]
d. Dapatkan batas atas limit kepercayaan untuk persentil ke-p dari distribusi ini
Penyelesaian :
Diketahui :
adalah contoh acak
distribusi Weibull
(
).
pdf : (
maka (
untuk (
) =
2) =
( )
( )
2) =
( )
112
)]
u( )
Q=
Q=
(
(
) (telah ditunjukkan)
sehingga Q =
seperti
)]
dengan demikian,
[
)]
)
]
113
dan
[ ( ) ]
)
[ ( ) ])
(
(
[ ( ) ])
[ ( ) ])
[ ( ) ] adalah
[ ( ) ])
), maka
dengan daerah
[
[
[
]
]
9. Gunakan pendekatan pada contoh 11.3.4 jika diberikan sampel acak dari distribusi Pareto
PAR( ) dengan mengambil data dari contoh 4.6.2 yang diberikan sebagai berikut
0,85 1,08 0,35 3,28 1,24 2,58 0,02 0,13 0,22 0,52
0,02 0,13 0,22 0,35 0,52 0,85 1,08 1,24 2,58 3,28
Dapatkan interval kepercayaan 95% terhadap !
114
Penyelesaian
Diketahui
PAR( )
pdf :
( )
CDF (
)= 1 (
dengan
)
,x>0
gunakan persamaan
(
))
))
( (
)) =
0,85
(
1,24
2,58
1,08
0,35
3,28
0,02
0,13
0,22
0,52
) 0,615 0,732
0,3
sehingga dengan distribusi chi-square interval kepercayan dari dari dengan daerah
0,95 adalah
= [
5,943
] =
berdasarkan tabel distribusi chi square diperoleh interval kepercayaan 95% terhadap adalah
= (0,81;2,88)
11. Andaikan adalah proporsi orang Amerika Serikat yang berambut merah.
Dalam suatu sampel berukuran 40, ditemukan 5 orang berambut merah
Dapatkan pendekatan 90% dari interval kepercayaan terhadap
115
Penyelesaian
Diketahui
sehingga
(koefisien kepercayaan)
diperoleh
(
)
Jadi pendekatan 90% dari interval kepercayaan terhadap
adalah (
12. Terdapat 45 pekerja pemintalan tekstil yang dipilih secara acak untuk mempelajari tingkat
kecelakaan kerja yang terjadi. Angka kecelakaan tiap pekerja diasumsikan berdistribusi
poisson dengan mean , sedangkan nilai rata rata kecelakaan tiap pekerja adalah
a. Dapatkan pendekatan dari batas bawah sebesar 90% terhadap limit kepercayaan untuk
menggunakan persamaan 11.3.20
b. Gunakan perintah pada soal a, jika diselesaikan dengan persamaan 11.3.21
116
Penyelesaian
Diketahui : n = 45 ,
sehingga
(koefisien kepercayaan)
( )
Jadi
(
)
b. Dengan persamaan 11.3.21
( )
( )
(
117
Jadi
19. Diberikan sampel acak independen dari dua distribusi normal, Xi~N (
(
).
i = 1,,
kepercayaan
j=1,,
. Jika diasumsikan
100 (1 )% untuk
dan
) dan
Penyelesaian
Diketahui : Ada dua sampel acak independen berdistribusi normal
Xi~N (
),
(
).
i = 1,,
j=1,,
dan
diketahui
dan
diketahui
<
) <
) <
118
berdasarkan statistik
)<
((
((
),
))
didapatkan
Misal :
(
c 2 =
t = c 2
jika dan adalah MLE dari
F0 = ( )
F0 = (
F0 = (
)
)
Yang mana adalah fungsi dari c dan kuantitas pivot untuk dan untuk 2 yang bergantung
pada F(t; ,2) = P(X t)
119
BAB XII
UJI HIPOTESIS
12.1 PENDAHULUAN
Dalam kegiatan ilmiah, banyak perhatian yang ditujukan untuk menjawab pertanyaan
tentang kevalidan teori atau hipotesis tentang fenomena fisik. Apakah obat yang baru
efektif?. Biasanya, informasi tentang fenomena tersebut hanya dapat diperoleh dengan
menunjukkan percobaan yang hasilnya mempunyai beberapa langkah dalam menarik
hipotesis. Syarat uji hipotesis akan mengacu pada proses mencoba untuk memutuskan benar
atau salah hipotesis tersebut berdasarkan bukti eksperimen.
Misalnya, diduga bahwa suatu hipotesis tertentu, mungkin sebuah teori yang diterima,
adalah salah, dan dilakukan percobaan. Hasil yang tidak konsisten dengan hipotesis akan
meragukan kevalidannya. Misalnya, hipotesis yang akan diuji dapat menentukan bahwa suatu
konstanta fisika memiliki nilai . Pada umumnya pengukuran eksperimen berdasarkan pada
kesalahan acak, dengan demikian keputusan tentang benar atau salah dari hipotesis,
berdasarkan pada bukti eksperimen, juga berdasarkan pada kesalahan. Tidak akan mungkin
untuk menghindari kesalahan keputusan, tetapi akan mungkin untuk membuat uji kesalahan
tersebut jarang terjadi.
contoh 12.1.1 menggambarkan konsep uji hipotesis
Sebuah teori mengemukakan bahwa hasil dari suatu reaksi kimia berdistribusi normal ,
(
). Percobaan sebelumnya menunjukkan bahwa
jika mineral tertentu tidak
diberikan, dan
jika mineral diberikan. Percobaan akan mengambil dari sampel acak
berukuran . Dalam dasar dari sampel tersebut, akan coba diputuskan mana kasus yang
benar. Hal ini ingin di uji menggunakan hipotesis nol
dengan
hipotesis alternatif
Definisi 12.1.1
(
), hipotesis statistik adalah pernyataan tentang distribusi . Jika hipotesis
Jika
), maka disebut sebagai hipotesis sederhana,
tersebut ditetapkan dengan lengkap (
dengan kata lain disebut komposit.
Sebuah hipotesis statistik subset dari ruang parameter. Tujuan dari Uji akan memutuskan
apakah nilai sebenarnya dari parameter. Demikian, hipotesis nol subset
dari dan
{ } dan { },
hipotesis alternatif, . Dalam kasus hipotesis sederhana,
dimana
. Kebanyakan percobaan atau penelitian hipotesis mempunyai beberapa
tujuan yang salah satu harapannya untuk mendukung hipotesis alternatif dengan bukti
statistik. Pada contoh 12.1.1, jika ada bukti kuat bahwa mineral diberikan, maka
dimungkinkan akan menghabiskan sejumlah besar uang untuk memulai pertambangan, jadi
kasus ini diselesaikan dengan hipotesis alternatif. Sekarang harus mempertimbangkan data
sampel, dan memutuskan berdasarkan data apakah ada bukti kecukupan Statistik untuk
menolak
, mendukung alternatif
atau tidak ada bukti yang cukup. Caranya adalah
120
dengan membagi ruang sampel menjadi dua daerah, "daerah kritis" atau " daerah penolakan"
, dan daerah penerimaan
. Jika data sampel yang diamati jatuh pada , maka akan
menolak
dan jika tidak jatuh pada , maka menerima .
Definisi 12.1.2
daerah kritis untuk uji hipotesis adalah himpunan bagian dari ruang sampel yang sesuai
untuk menolak hipotesis nol
Pada contoh , adalah statistik kecukupan untuk , menyatakan daerah kritis secara
langsung dengan syarat variabel tunggal , sebagai uji statistik. Karena
, bukti
{(
)
}, untuk
langsung untuk daerah kritis pada masalah ini diberikan
beberapa konstan c. Akan menolak
jika
, dan akan menerima
jika
.
Terdapat dua kemungkinan kesalahan yaitu akan menolak
ketika
benar, atau menolak
ketika
salah. Kesalahan-kesalahan itu adalah:
1. Kesalahan tipe I : menolak kebenaran
2. Kesalahan tipe II : menerima
padahal
salah.
Diharapkan untuk memilih statistik uji dan daerah kritis agar dua tipe kesalahan di atas
memiliki peluang kecil, ada dua peluang yaitu:
]
[ ]
1. [
]
[ ]
2. [
,
Gambar 12.1. Peluang kesalahan tipe I dan tipe II
Definisi 12.1.3
[ ]
Untuk hipotesis nol ( ) sederhana, peluang untuk menolak kebenaran
,
sebagai tingkat kepercayaan dari sebuah Uji. Untuk hipotesis nol( ) komposit, ukuran
dari Uji (atau ukuran dari daerah kritis) adalah peluang maksimum untuk menolak
ketika
benar (nilai terbesar dari parameter dibawah ).
121
Pada
sederhana tingkat kepercayaan juga merupakan ukuran Uji.
Pendekatan standar digunakan untuk menunjuk atau memilih tipe kesalahan, misalkan
memilih antara
atau
, yang akan digunakan sebagai nilai kepercayaan dari
Uji, kemudian nilai ini digunakan untuk menentukan daerah kritis. Diantara semua daerah
kritis akan dipilih satu yang paling kecil [ ].
Secara umum, diharapkan melakukan Uji terhadap
dengan
(dimana
) pada tingkat kepercayaan dengan [ ]
. Uji berdasarkan pada statistic uji
(12.1.1)
Ekuivalen dengan menggunakan , jadi dapat ditunjukkan dengan tepat uji untuk menolak
jika
, dimana
merupakan nilai perhitungan dari , dengan batasan
,
[
]
, dan mempunyai daerah kritis sebesar . Peluang dari kesalahan tipe II
untuk alternative adalah
[
[
[
sehingga
[
Sampel berukuran
(12.1.2)
Diberikan
)
(
(
)
(
(
)
(
(12.1.4)
) (
Definisi 12.1.4
Fungsi kuasa, ( ), dari Uji
parameter adalah .
122
Gambar 12.2. Hubungan fungsi kuasa dengan peluang kesalahan tipe II.
12.2 Hipotesis Komposit
(
), dengan
Diketahui
diketahui, diharapkan uji
dengan
alternative komposit
. Pada contoh sebelumnya bahwa daerah kritis diletakkan
di arah kanan untuk alternatif yang lain
, tetapi nilai dari nilai kritis c tidak
bergantung pada nilai
. Jadi, jelas bahwa uji alternatif sederhana juga benar untuk
alternatif komposit ini. Uji tingkat kepercayaan akan menolak
jika
(12.2.1)
| ]
Sehingga
( )
(12.2.2)
( )
Untuk
, ada
dilakukan uji
(12.2.1) dipenuhi. Berikut merupakan uji
menolak
untuk
adalah ( )
123
( )
[
]. Andaikan
. Akan menolak
jika pertidaksamaan
untuk hipotesis nol komposit. Peluang
( )
( )
, dengan
demikian
( )
pada
, maka
Gambar 12.3 uji perbandingan fungsi kuasa saat dua ukuran sampel berbeda.
Dari gambar 12.3, lebih jelas mengapa kegagalan menolak
seharusnya tidak
ditafsirkan sebagai penerimaan
. Pada kenyataannya, dapat ditemukan suatu nilai
alternatif kecukupan untuk
, sehingga uji kuasanya, (), tidak berubah-ubah untuk .
Pada khususnya ini tidak akan menjadi menjadi masalah yang serius jika dapat menentukan
daerah yang diabaikan, yang mana merupakan subset alternatif untuk uji kuasa kecil. Dengan
kata lain, tidak terlalu penting mendapatkan nilai yang cocok untuk
. Pada contoh, tidak
terlalu diperhatikan tentang penolakan
saat berada pada interval yang kecil, misalkan
(
), dapat diambil sebagai daerah yang diabaikan. Saat , ukuran sample dapat
ditentukan dari persamaan (12.1.4) yang akan memberikan nilai kuasa ( )
. Jadi,
untuk nilai alternatif yang berada di luar daerah yang diabaikan, suatu uji dapat dibangun
hingga mencapai atau melebihi perbandingan kesalahan yang sudah ditentukan untuk kedua
tipe kesalahan.
NILAI-P
Tidak ada perjanjian tentang bagaimana yang kecil digunakan untuk menolak
sebagai bukti yang kuat dalam mendukung
. Percobaan 1 akan mempertimbangkan =
0.05, sementara percobaan 2 menggunakan = 0.01. Jadi, ada kemungkinan untuk menolak
percobaan 1 saat percobaan 2 diterima. Uji nilai-p, didefinisikan sebagai ukuran terkecil
yang dapat menolak , berdasarkan nilai yang diamati dari uji statistik.
Contoh 12.2.1
Berdasarkan pada ukuran sample
dari distribusi normal,
(
), ingin uji
|
dengan
. diketahui
. Nilai-p adalah [
]
(
)
. Karena
, Uji akan
ditolak saat
0.05 dan diterima saat
0.01.
124
Untuk uji
, akan menolak
jika
(12.2.3)
Jadi, daerah kritis dari sekarang diambil dari arah kiri distribusi uji stastistik. Uji hipotesis
tersebut adalah uji satu arah. Uji dengan daerah kritis dari bentuk (12.2.1) disebut uji satu
arah batas atas dan bentuk (12.2.3) disebut uji satu arah batas bawah.
Tipe lainnya adalah uji alternatif dua arah. Akan uji
dengan alternatif
. Jika memilih arah kanan dari daerah kritis, maka akan mempunyai kuasa bagus untuk
menolak
saat
, tapi kuasanya akan lemah saat
. Sama halnya jika dipilih
arah kiri dari daerah kritis, maka kuasanya akan bagus jika
, tapi kuasanya akan
lemah jika
. cara yang baik adalah menggunkan uji dua arah dari daerah kritis dan
menolak
jika
(12.2.4)
Dalam kasus ini masuk akal untuk menggunakan uji equal-tailed (masingmasing arah berukuran ) karena pertimbangan simetri. Fungsi kuasa untuk uji dua-arah
adalah
( )
[
| ]
Diberikan
( )
(12.2.5)
Jika
, maka seperti pada gambar 12.4 , peluang normal fungsi kuasa di atas akan
mendekati nol. Sama halnya, jika
, maka satu yang tidak akan diharapkan untuk
menolak
dengan mendapatkan besar, dan peluang normal akan mendekati nol. Rumus
ukuran sample untuk uji dua arah
diberikan oleh persamaan (12.1.4) dengan
.
(12.2.6)
125
Jadi, nilai
berada dalam daerah penerimaan ( daerah yang tidak ditolak)
dengan selang kepercayaan (1-) 100% untuk .
12.3. Uji Hipotesis untuk Distribusi Normal
Uji Rata Rata ( Diketahui)
Teorema 12.3.1
Andaikan bahwa
adalah sampel acak teramati dari
dan diberikan uji statitik sebaai berikut
) dengan
diketahui,
(12.3.1)
dengan
,
(12.3.2)
(12.3.3)
)
(
dengan
dengan kuasa
(12.3.4)
)
(
(12.3.5)
(12.3.6)
126
, menolak
, menolak
untuk menguji
.
, menolak
dengan
;v=(n-1)
( )| ]
sehingga
( )
( )],
(12.3.7)
) ,
( ) dan
dimana
,
dan
saling bebas,
(
(
)
( ). Variabel acak dalam persamaan (12.3.7) mempunyai distribusi
noncentral t dengan derajat kebebasan dan parameter noncentrality . Menggunakan
distribusi t - Students ketika
.
Contoh 12.3.1
Dengan tingkat kepercayaan
, akan diuji
dengan
untuk
distribusi normal, (
) dengan
tidak diketahui, diinginkan mempunyai kuasa 0,99
jika nilai
sebenarnya adalah dua standar deviasi lebih besar dari
. Tentukan besar
sampel!
Pada soal telah diketahui
( )=
untuk
|
|
. Dari Tabel 8 (Lampiran C), didapat
.
Uji Untuk Variansi
Uji hipotesis
dengan
berdasar pada uji statistik
(
)
(12.3.8)
(
) saat
benar. Nilai teramati dari variansi sampel, , relatif besar dari
yang dapat mendukung . Disarankan memilih arah kanan dari distribusi
sebagai daerah
kritis untuk setiap Uji. Uji ini berguna untuk memutuskan ketika populasi berukuran besar.
Untuk hipotesis null komposit menggunakan hipotesis berbentuk
.
( ) adalah CDF dari ( ).
Teorema 12.3.3
), dan diberikan uji statistik;
Diberikan
adalah sampel acak dari (
(
)
(12.3.9)
Ada 3 kemungkinan menolak H0, yakni:
1. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
(
). Fungsi kuasa untuk uji ini adalah
jika
( )
[( )
(
)
]
(12.3.10)
2. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
(
). Fungsi kuasa untuk uji ini adalah
jika
( )
[( ) (
)
]
(12.3.11)
3. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
(
) atau
(
).
jika
127
Bukti
Mendapatkan fungsi kuasa untuk kemungkinan nomor 1
( )
(
)| ]
= [
)
( )
(
)| ]
= [(
[( )
(
)
]
=
( )
[
(
)
]
(
)
, karena ( ) bertambah, ukuran
daerah kritis adalah .
Sebagai latihan, sangat tepat menggunakan uji dua arah untuk mendapatkan fungsi kuasa
bagian 3, tapi untuk nilai
dan
yang berbeda, dengan
.
Terdapat kemungkinan mendapatkan ukuran sampel untuk uji ini. Sebagai contoh, untuk uji
bagian 1, ingin didapat ( )
untuk
. Hal ini membutuhkan nilai
sehingga
( )
(
)
(
)
(12.3.12)
Persamaan ini tidak dapat diselesaikan secara eksplisit untuk , tetapi aturan iterasi
berdasarkan percentile pada Tabel 4 (Lampiran C) dapat digunakan untuk mencari nilai
khusus , , dan . Hal ini juga diinginkan untuk mendapat rumus pendekatan yang
memberikan
secara eksplisit sebagai fungsi dari nilai
. Seperti pendekatan yang
berdasarkan pada pendekatan normal ( )
, dimana telah diberikan di bab 8.
Jika pendekatan jumlah sampel ini digunakan uji dua arah dari persamaan (12.3.12), maka hal
ini mungkin untuk mendapat pendekatan
(
(12.3.13)
Contoh 12.3.2
Ingin uji
dengan
,
untuk
dan kuasa
adalah benar. Berdasarkan pendekatan (12.3.13) dengan
,
, dan ( )
didapat
. Jika dihitung kedua arah persamaan
Kemungkinkan untuk uji hipotesis variansi dari dua distribusi normal, andaikan
, digunakan uji statistik F sebagai berikut:
(12.3.14)
(
dimana
Teorema 12.3.4
Andaikan
(
) dan (
) jika
benar.
dan
adalah nilai teramati sampel acak saling bebas dari
), berturut-turut, dan diberikan uji statistikya sebaga berikut:
(12.3.15)
Ada 3 kemungkinan menolak H0, yakni:
128
(
).
menolak
jika
(
).
menolak
jika
(
) atau menolak
menolak
jika
jika
).
Jika variansi tidak diketahui tapi bernilai sama, maka uji hipotesis rata-rata
dapat dicari menggunakan distribusi t. Diberikan oleh
,
,
,
(
(12.3.16)
dimana
Teorema 12.3.5
Andaikan
dan
adalah nilai sampel acak saling bebas dari dua populasi
) dan (
), dimana
yang berdistribusi normal, masing-masing (
.
Berikut ini ada 3 kemungkinan untuk menolak H0, yakni:
1. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
jika
(
).
2. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
jika
(
).
3. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
jika
(
). atau
(
).
Fungsi kuasa untuk uji ini menggunakan distribusi noncentral t. Hal ini mungkin untuk
menentukan sampel yang besarnya sama
untuk uji
satu arah dengan kuasa
|
| . Untuk uji dua arah,
menggunakan Tabel 8 (Lampiran C) dengan
besarnya adalah .
variansi yang berbeda, pendekatan uji dapat dilakukan berdasarkan pendekatan statistik t
Welch yang diberikan oleh persamaan (11.5.13).
Uji Sampel Berpasangan t
) (
), yang saling bebas
Diasumsikan data berpasangan dari populasi bivariate, (
(
), dengan
( )
( )
dan selisihnya
berdistribusi normal,
. Satu kemungkinan yang pasti untuk kasus ini adalah jika pasangan tersebut sampel
acak dari populasi normal bivariate. Jika pasangannya saling bebas dan masing-masing
mempunyai distribusi normal bivariate yang sama, maka selisihnya adalah normal saling
bebas dengan rata-rata
. Oleh karena itu, uji berdasarkan variabel T dari persamaan
(11.5.17) digunakan untuk selisih
dari
dengan
tidak diketahui.
Teorema 12.3.6
)
(
) nilai dari
Diketahui (
pasangan variable acak saling bebas,
(
)
(
), dan selisihnya
berdistribusi normal, dengan rata-rata
129
dan variansi
sampel dari selisih
. Diberikan
, untuk
dan
(12.3.17)
dengan
dengan
dengan
).
(
).
Teorema 12.4.1
Diberikan
(
), untuk n ada 3 kemungkinan untuk menolak H0, yakni:
1. Dengan tingkat kepercayaan untuk menguji
dengan
, menolak
jika
Ketika
, didapat
(
)
untuk menguji
, menolak
untuk menguji
, menolak
( )
(
)
130
, menolak
(
Konsep dari uji hipotesisdapat dijelaskan dengan model berikut. Jika kasus pertama adalah
uji
ditolak jika s yang diamati kecil dan tidak mungkin () saat
. jadi daerah kritis mempunyai ukuran .
)
Pada kasus 2 jika menjadi nilai yg diuji maka (
, ujinya akan mempunyai
tingkat kepercayaan ; sebaliknya, disebut konservatif.
(
)
Untuk uji hipotesisdari dua populasi,andaikan X
(
), X dan Y
.
independen.
MLEnya
adalah
,
(
)(
). Jika
maka
( )
(
) (
)
Dengan tingkat kepercayaan untuk menguji
menolak
dengan
akan
.
Ada
Dengan menggunakan hasil pada latihan 18 bab 8 ada kemungkinan untuk uji chi-square
percentil. H0 bagian 1 ditolak jika 2n
(2s) dan H0 bagian 2 ditolak jika
2n
(2s+2).
12.6 UJI KUASA
Diberikan
mempunyai pdf
korespondensi untuk C adalah
( )
[(
131
Definisi 12.6.1
Uji dari
dengan
yang didasarkan pada daerah kritis C* dikatakan
sebagai uji kuasa dengan tingkat kepercayaan jika
( )
1.
, dan
( ) untuk sembarang daerah kritis C dari ukuran [ ( )
]
2.
( )
Daerah kritis, C*, disebut uji kuasa dengan tingkat kepercayaan .
Teorema berikut ini menunjukkan bagaimana mendapatkan
hipotesissederhana.
Teorema 12.6.1 Lemma Neyman-Paerson
Misalkan
mempunyai pdf (
(
uji
BUKTI :
Untuk membuktikan, ambil notasi vektor,
adalah sebuah kejadian dimensi ke-n, diberikan
| ]
dari
uji
). Diberikan
(
(
)
)
dan
)| (
)
}
C* = {(
dimana k adalah konstanta, sehingga
[(
)
| ]
Maka C* adalah uji kuasa dengan tingkat kepercayaan untuk menguji
kuasa
) dan
dengan
). Jika A
Untuk kasus kontinu. Untuk diskrit caranya sama, dengan mengganti integral. Akan
digabungkan komplemen dari himpunan C oleh . Dengan catatan bahwa jika A adalah
subset dari C*, maka
[
| ]
[
| ]
karena
[
| ]
[
| ]
Perhatikan bahwa dari sembarang daerah kritis C didapatkan
)dan
)
(
) (
(
) (
Selanjutnya,
( )
[
| ]
[
dan
( )
[
| ]
[
Dan selisihnya adalah
| ]
( )
( )
[
[
132
| ]
| ]
| ]
Kombinasi persamaan
( )
Dengan
dan
( )
| ]
| ]
| ]
| ]
| ]
| ]
dan
didapat
( )
( )
| ]
| ]
sehingga
( )
( )
dengan
| ]
( ){ [
| ]}
( )
( )[
( )]
( )
( )
( )
Jika C adalah daerah kritis dari , maka
, maka sisi kanan
( )
( )
dari pertidaksamaan adalah 0, selanjutnya
Filsafat umum dari Neyman-Pearson untuk uji hipotesis adalah mengambil nilai sampel ke
dalam daerah kritis. Faktanya, lemma Neyman-Pearson menyatakan bahwa kriteria untuk
memilih nilai sampel berdasarkan pada besarnya rasio dari fungsi likelihood dari
dan .
Contoh 12.6.1
( ). Akan menguji
Diketahui sample acak berukuran n dari distribusi eksponensial
dengan
dimana
.
Lemma Neyman-Pearson menyatakan menolak
jika
(
)
(
)
(
)
)
]
dimana k adalah [ (
, batas bawah
.Sehingga
[ (
| ]
((
)| ]
jadi,
[
dimana
((
karena (
= {(
(
| ]
)/(
| ]
pada kasus ini. Sehingga, uji kuasa daerah kritis mempunyai bentuk C*
)|
}. Perhatikan bahwa batas bawah
,dipunyai
), jadi bahwa
( )
akan memberi daerah kritis pada tingkat
jika
dengan
jika
).
dengan
, maka uji
( ). Perbedaan antara
133
| ]
| ] menjadi [
| ] jika
Selanjutnya,
).
ekuivalensi terhadap
(
untuk konstanta
. Karena
{(
)|
bentuk
, akan menolak
jika
kuasa dari tingkat kepercayaan
, dipunyai
Contoh 12.6.3
Dapatkan uji kuasa dari
(
). Didapatkan :
dengan
( )
( )
sehingga
(
(
)
}
)
atau
[
Karena
(
(
)
]
)
jika
. Sekarang
[
|
]
(
)
jadi, untuk nilai integral i = 1, ., n, uji kuasa dari tingkat kepercayaan , menolak
jika
. Untuk menentukan tingkat kepercayaan , uji akan memilih konservasi seperti
pembahasan di awal.
Contoh12.6.4
( ).
Diberikan sample acak berukuran n, akan diuji
( ) dengan
Didapatkan :
134
(
(
)
)
Jadi,
ditolak jika
. Dari teorema limit dapat digunakan untuk
( )
mendapatkan pendekatan nilai kritis. Diketahui jika
( ),maka
( )
, dan
jika
(
)
sedangkan
:
- o, dimana o subset dari . A adalah daerah kritis , disebut
keseragaman kuasa (UMP) dengan tingkat kepercayaan jika :
( )
dan
() ()
Untuk semua
- o dan semua daerah kritis C dengan tingkat kepercayaan .
Hal itu menunjukkan
didefinisikan uji UMP untuk tingkat kepercayaan jika mempunyai
nilai , dan jika untuk semua nilai parameter , mempunyai nilai maksimum kuasa relative
untuk semua daerah kritis dari tingkat kepercayaan
Contoh 12.7.1
Diberikan sampel acak dengan ukuran n dari distribusi eksponensial, ~ EXP ().
Seperti pada contoh 12.6.1 bahwa uji kuasa dengan tingkat kepercayaan H0 : = 0 dengan
: = 1 ketika 0 >1 untuk menolak H0 jika 2n / 0 = 2 / 1
(2n). karena tidak
bergantung pada nilai particular dari 1 , tetapi kenyataanya bahwa 1> 0 itu menunjukkan
bahwa uji UMP dari H0 : = 0 dengan H : > 0.
Catatan juga bahwa fungsi kuasa untuk uji ini bisa di ekspresikan dengan syarat CDF chi
square, H(c;v) dengan v = 2n.
() = 1 H [(0 / )
(2n) ; 2n]
bernilai (0 / )[2 / 0] = 2 / 0 ~ X2 (2n) ketika bernilai benar . karena () adalah
fungsi naik dari , max () = ( 0) = disebut uji UMP dengan tingkat kepercayaan
untuk hipotesis komposit H0: 0 dengan H: > 0
135
dengan H: <
0,
menolak H0 jika 2n / 0
Definisi 12.7.2
Pdf bersama f(x; ) dikatakan mempunyai monoton likelihood ratio (MLR) pada statistik
)
T=t(X) jika terdapat dua atau lebih nilai dari parameter
,rasio nya (
(
) bergantung pada x melalui fungsi t(x), dan rasio ini bukan penurunan fungsi dari
t(x).
Contoh 12.7.2
Diberikan sample acak ukuran n dari distribusi eksponensial, Xi EXP( ).
(
)=(1/ )n exp (-
) dan
(
)
( )
[ (
) ]
(
)
Dimana sample acak ini tidak bergantung pada fungsi t(x)= jika
Sehingga f(x; )
mempunyai penyelesaian MLR dalam statistik T=
MLR juga berlaku pada statistik ,
karena merupakan peningkatan fungsi dari T. MLR bisa digunakan dalam pengujian UMP.
Teorema 12.7.1
Jika pdf bersama f(x; ) mempunyai rasio monoton likehood T = t(X), maka uji UMP dengan
ukuran untuk H0 : dengan H : > 0 , menolak H0 jika t(X) k dimana P[t(X)k 0]
=
Untuk menguji H0 : 0 dengan
: < 0 juga bisa diselesaikan dengan pendekatan MLR
tetapi tidak sesuai dengan teorema 12.7.1.
Contoh 12.7.3
Di berikan sampel acak dengan ukuran n dari dua parameter distribusi eksponensial
( ). Pdf bersama :
~
[ (
)]
( ){
Jika
1 < 2, maka
(
)
{
[ (
]
(
)
Fungsi diatas tidak bisa berlaku untuk
, tetapi tidak menjadi masalah, sebab
P[
] = 0 ketika merupakan nilai benar dari . Selanjutnya rasio bukan fungsi naik
dari
dan MLRnya
. Menurut teorema 12.7.1 uji UMP dengan tingkat
kepercayaan untuk menguji
dengan
menolak
jika
[
[ (
)]. Didapat
dimana
| ]
(
)
Teorema 12.7.2
Diberikan ,, mempunyai pdf bersama :
F(x;) = c ()h(x)exp[q()t(x)]
Dimana q() adalah fungsi naik dari
136
)=
:
:
( )..pdf bersama
untuk semua
=
(
) exp [(ln ) ]
diketahui q( ) = ln ( ) dan t() = . Uji UMP dengan tingkat kepercayaan untuk H0 :
: < 0 akan menolak H0 jika T = k dimana P[T k]= .
0 dengan
Karena T ~ POI (n ) , harus mendapatkan
(
)((
)t/t! =
Terdapat masalah diskrit, tetapi uji yang di jelaskan pada theorem 12.7.2 ini merupakan uji
UMP untuk nilai-nilai tertentu yang dapat dicapai.
UJI UNBIASED
Disebutkan sebelumnya bahwa dalam beberapa kasus pengujian UMP mungkin tidak ada,
khususnya untuk alternatif dua sisi, mungkin ada pengujian UMP antara kelas terbatas yaitu
pengujian "unbiased"
DEFINISI 12.7.3
Pengujian dari Ho : o dengan
DEFINISI 12.7.3
Pengujian dari Ho : o sedangkan H :
min () max ()
-o
( )
Dengan kata lain kemungkinan Ho ditolak bernilai salah ketika minimum dan kemungkinan
Ho ditolak bernilai benar ketika maksimum.
137
Contoh 12.7.5
).
sampel acak dengan ukuran n dari distribusi normal dengan mean nol,
~ (
Diinginkan untuk menguji Ho=
=
dengan,
:
berdasarkan statistic uji
=
. Ho diketahui bahwa ~ (n).jadi untuk uji dua arah daerah kritis sama dengan
bagian 3 dari theorem 12.3.3, akan menolak Ho jika
(n). dengan kata lain, sampel
dengan ukuran n = 2 dan tingkat kepercayan
untuk uji ini diberikan dalam gambar 12.5
138
( )
Dimana menunjukkan MLE biasa dari , dan menunjukkan MLE dengan batasan bahwa
H0 benar.
Menurut definisi di atas, dapat dikatakan bahwa dan didapatkan dari memaksimalkan
f(x;) terhadap dan 0. Uji GLR ini digunakan untuk menolak H0 jika ( ) k, dimana k
dipilih untuk melengkapi tingkat kepercayaan .
Contoh 12.8.1
Misalkan Xi N(, 2), dimana 2 diketahui, akan dilakukan uji untuk hipotesis:
H0 : 0
: 0
MLE biasa (tanpa batasan) adalah
( )
=
(
[
(
(
)
)
]
]
]
= [ ( )
( ) dikatakan menolak H0 jika ( ) k, ekuivalen dengan
Z2
=[
Dimana Z ( ) dan Z2
Z2
( )atau Z
Contoh 12.8.2
Akan dilakukan pengujian hipotesis H0 : 0 dengan
: 0.
Uji GLR pada contoh ini didapatkan dari penurunan uji UMP satu arah yang didasarkan pada
nilai z. Diberikan MLE dengan =[0,)
Karena tingkat kepercayaan pada uji ini cukup kecil untuk menolak H0 dengan nilai yang
besar, ditentukan daerah kritis dari statistik GLR untuk
)
[ (
]
( ) {
139
dan (x)
: 0 dengan
;
< 0.5) menolak H0 jika
Sehingga
[ (
]
Dapat disimpulkan bahwa keduanya memiliki penyelesaian yang sama untuk pengujian
sederhana terhadap H0 : 0 dan
: 0. Daerah kritis yang sama juga memberikan
tingkat kepercayaan untuk hipotesis null komposit H0 : 0 karena
(
)( ),
( )
untuk <0.
Terkadang diinginkan untuk melakukan pengujian terhadap hipotesis dengan satu parameter
yang tidak diketahui karena adanya parameter bermasalah yang tidak diketahui.
Contoh 12.8.3
Misalkan Xi N(, 2), dimana 2 diketahui, akan dilakukan uji untuk hipotesis H0 : 0
dengan : 0. Hal ini tidak menunjukkan hipotesa null sederhana karena distribusi ini
tidak ditetapkan sepenuhnya dibawah H0. Populasi yang digunakan dua dimensi,
(
) (
) {(
)|
} D] dan H0 : 0
merupakan penyingkatan notasi dari H0 : (,) 0 dimana
) {(
{ } (
)|
}.
Himpunan di atas digambarkan pada gambar di bawah ini:
140
didapatkan
, MLEnya
dan
dan
sehingga,
(
)
( )
(
)
=
=
)
(
(
[
(
[
) ]
) ]
=( )
maka dari itu
(
( )
(
(
)
)
)
(
(
)
)
= 1 +(
(
)
( )
)
dengan ( )
(
(
)
)
(
(
) (
) pada daerah 0, statistik GLRnya
(
(
(
) (
) (
)
)
141
pada daerah
dan
) (
) (
) (
) (
Kecuali untuk koefisien binomial, statistik GLR ini tidak akan digunakan pada saat
pengerjaan soal yang sederhana, namun bisa didapatkan dengan perhitungan yang sederhana.
) digunakan untuk p di bawah H0, sehingga tingkat kepercayaan dan daerah
Distribusi (
kritis yang tepat tidak bisa ditentukan. Distribusi chi-square pada kasus ini sangat berguna
untuk ukuran sampel yang besar. Hipotesis H0 menunjukkan pembatasan satu dimensi pada
ruang populasi karena hal itu menunjukkan H0:=p2-p1 = 0 ; jadi r=1 seperti pada contoh
12.8.2 dan pendekatan untuk tingkat kepercayaan :
(
)
( )
(
)
dan H0 ditolak jika
( )
UJI SAMPEL-k
Pendekatan GLR sangat membantu dalam penurunan uji yang melibatkan sampel-sampel
dari dua atau lebih distribusi normal. Sampel acak independen bisa didapatkan dari k
distribusi normal. Untuk setiap j=1,k, akan ditunjukkan arti dari sampel individu j dan
variansi sampel dengan
=
dan
=(
=....
=(
(nj-1)
dengan
exp [
exp [
:
)2]
)
)-
Ln L = - ln (2
Teorema 12.8.1:
Untuk k populasi normal dengan variansi N(
untuk Ho, dimana
=...=
,
ditolak jika:
:
( ) (
)
Dimana
dan
GLR
Teorema 12.8.2:
Misalkan
M=M(
142
]-
Dan diketahui
c = 1+
dimana N =
( ) ; dengan perkiraan
dan
M/c
(
) jika
Untuk nilai kritis vj terkecil didapatkan dari Tabel 31 dan Tabel 32 dari Pearson dan Hartley
(1958).
Untuk sampel normal, (nj 1)sj/ (
) dan jika diketahui wj = sj/ dalam M,
kemudian
akan dibatalkan jika nilainya sama; M(nj 1,sj) mungkin digunakan sebagai uji
sehingga
)(
(
( | )(
)
( )
( )
(
( )
)( )
(
) (
( )(
)
(
)
)
143
jika
Teorema 12.9.1
Diberikan X=(
),
(
( )(
) ( )
( )
( )]
( )
( )
Jika
adalah kecukupan bersama
untuk
untuk dan pdf ( | ) ( ) tidak tergantung pada k , sehingga
Ada 2 kemungkinan untuk menolak H0
1. Dengan tingkat kepercayaan untuk menguji
dengan
menolak H0 jika ( )
( ) dimana [(
( )| )]
dengan
2. Dengan tingkat kepercayaan untuk menguji
dengan
menolak H0 jika ( )
( ) dimana [(
( )| )]
dengan
Contoh 12.9.2:
(
( )
( )
) ( )
[ ( ) (
) ( )]
Dimana h(x) = 1 untuk
dan 0 untuk yang lain
sesuai teorema maka S= ( ) dan T = maka distribusi T tidak bergantung pada k.
Tingkat kepercayaan tidak bergantung atau bersyarat jika [(
( )| )]
maka
[
{ [(
( )]
( )| )]}
( )
12.10. UJI SEKUENSIAL
Sampel ukuran n dapat didekati dengan Neyman-Pearson untuk mengkontruksi Dengan
tingkat kepercayaan
yang besar pada hipotesis sederhana.Seperti pada penghitungan
sampel ukuran n dengan kesalahan tipe II yang biasa dikatakan
Contoh 12.10.1
Gaya (dalam pounds) dapat menyebabkan beberapa tipe bagian keramik mobil menjadi
rusak dengan mean dan standard deviasi =40. Bagian yang asli diketahui memiliki
ketahanan dari rusak dengan tekanan sebesar 100 pounds. Pabrik mengklaim bahwa suku
cadang lebih baik dari pada yang asli karena dapat menahan tekanan hingga 120 pounds.
Untuk mendemonstrasikan klaim tersebut, suatu uji dilakukan dimana ketahanan diukur pada
suatu sample sebanyak n dari suku cadang dengan variabel x1, , xn. berdasarkan pada hasil
data, pabrik suku cadang memilih untuk menggunakan ukuran =0.05 untuk menguji
hipotesis H0 : 100 dan Ha : >100.
Berdasarkan pada teorema 12.7.1 bahwa uji UMP dari nilai untuk H0 : 0 dan
: >0
akan menolak H0 jika
untuk nilai c yang tepat. Selain itu, menurut teorema 12.3.1 yang
144
untuk m= 1,2,
Wilayah kritis yang disimbolkan C dari hasil uji sekuensial adalah gabungan dari himpunan
disjoint sebagai berikut:
)|
(
)
{(
(
)
}
untuk n= 1,2,
Dengan kata lain jika untuk beberapa n, titik (
) ada didalam Cn maka H0 ditolak
untuk sampel ukuran n. Disisi lain, H0 diterima jika titik di atas diterima di suatu daerah,
katakan A, yang merupakan gabungan dari himpunan disjoint An yaitu:
)|
(
)
{(
(
)
}
Menurut uji Neyman Pearson untuk sampel ukuran n ,konstanta k diturunkan sehingga
ukuran dari uji penentuan Hal ini diperlukan untuk mencari konstanta k0 dan k1 sehingga
SPRT akan dapat ditentukan nilai dan untuk peluang berdasarkan kesalahan tipe I dan
tipe II yaitu:
[(
| )]
( )
Dan
[(
Dimana
( )
( )
| )]
( )
145
Dan
( )
Dimana dan merupakan pendekatan dari k0 dan k1. Berdasarkan pada N< dengan
peluang 1 dan n(
) k0 untuk (
) ada didalam Cn, sehingga
[(
| )]
( )
( )
[(
Dengan /(1-)
| )]
(
)
)k1 untuk (
k0 , karena n(
[(
| )]
( )
( )
( )
( ) [
]
( | )
146
( | )
( | )
( )
( | )
(
( )
[(
| )]
( )
yang merupakan nilai kesalahan yang timbul akibat
( )
( )
Contoh 12.10.2
Berdasarkan pada contoh 12.10.1. Diketahui mean dan standard deviasi =40. Akan
dilakukan uji untuk menguji hipotesis null sederhana hipotesis H0 : =100 dan hipotesis
alternatif
: =120 dengan =0.05 dan =0.10.
Sehingga pendekatan nilai kritis untuk SPRT adalah nilai
0.05/(1-0.10)=0.056 dan
= (1-0.05)/0.10=9.5. dengan kata lain, uji tersebut dapat menolak H0 pada n 0.056 dan
menerima H0 pada n 9.5 atau dapat digunakan uji berdasarkan jumlah data dengan pdf
bersama: (
) ], didapatkan:
(
)
(
)
)]
)]
(
) ]
(( )| )
( )
)]
)]
)(
untuk
dan
( |
]
(
)
) [ (
) ]
[
(
) [ ( ) ]
Untuk SPRT, banyaknya sample yang diharapkan secara berurutan adalah 16 dan 19 dengan
syarat H0 dan
, dibandingkan dengan jumlah sample n=34 menurut pertimbangan uji
Neyman-Pearson untuk contoh 12.10.1.
147
RINGKASAN
Pada Bab ini dijelaskan mengenai uji hipotesa dimana ditujukan untuk menguji benar
(
), hipotesa statistik
atau salahnya hipotesa statistik dari suaru percobaan. Jika
adalah pernyataan tentang distribusi . Jika hipotesa tersebut ditetapkan dengan lengkap
(
), maka disebut sebagai hipotesa sederhana, dengan kata lain disebut komposit.
Kesalahan dalam menolak maupun menerima H0 di bedakan menjadi dua, yakni: Kesalahan
tipe I yaitu kesalahan yang terjadi pada saat menolak kebenaran
, sedangkan Kesalahan
tipe II adalah kesalahan yang terjadi pada saat menerima
padahal
salah.
Jika suatu uji ditulis dalam bentuk himpunan data dengan memiliki ukuran sebanyak n
dan daerah kritis (daerah penolakan) merupakan subset dari n-dimensi ruang Euclidean, maka
H0 ditolak pada saat n-dimensi data vector berada di dalam daerah kritis.
Fungsi kuasa memberikan peluang menolak H0 (hipotesa null) yang salah untuk
(hipotesa
alternatif) dengan nilai yang berbeda. Misalkan pada lemma Neyman-Pearson, pada uji ini
terdapatkemungkinan untuk mendapatkan uji kuasa terbesar untuk penentuan ukuran sampel,
namun ada beberapa kasus yang harus menggunakan uji UMP untuk menyelesaikannya.
Uji UMP tak selalu dapat memperoleh hasil, oleh karena itu uji GLR digunakan untuk
mendapatkan hasil yang tepat. Contohnya, pendekatan bisa dilakukan pada beberapa kasus
untuk mendapatkan uji hipotesis dengan parameter yang bermasalah dan juga keadaan
dengan penyelesaian dua-arah. Pada suatu permasalahan, ada kemungkinan untuk
mendapatkan uji UMP unbias (UMPU) yang juga dapat digunakan untuk mendapatkan
parameter yang bermasalah dan juga hipotesa alternatif dengan penyelesaian dua arah.
SOAL-SOAL LATIHAN
1
Andaikan Xo , X1 , ... , X16 sampel acak berukuran n=16 dari distribusi normal XiN(,1).
Akan diuji Ho : = 20 dengan tingkat kepercayaan = 0,05 berdasarkan rata-rata sampel
,
a. Tentukan daerah kritis pada A: {| - < } dan B {| b < }
b. Cari peluang dari kesalahan tipe II, =P[TII], untuk setiap daerah kritis pada soal (a)
untuk
Penyelesaian:
a. Tentukan daerah kritis A: {| - < } dan B {| b < }
P[
=P[
] =P[
)]
Sehingga,
) = 1.65
(
(
= 0.4125
148
= 20 0.4125
= 19.5875
untuk tingkat kepercayaan = 0,05:
= P [b < ] ,
0.05
= P [b < ]
0.05
= P [(
0.05
= P [z
0.05
= P[
0.05
=1P[
0.95
= P [z < 4 (b 20)]
4 (b20)
P[ b]
)]
(
)]
= 1.65
b20
= 0.4125
= 20 + 0.4125
= 20.4125
=[
>
= P [ z > -5.65 ]
= 1 P [z < -5.65]
=10
=1
Untuk B { | b < } ; b: 20.4125 , Ho : : 21
= P[TI]
=[
<
= P [z < -2.35]
= 0.009
149
2. Sebuah kotak yang berisi empat kelereng, dengan warna putih sebanyak dan warna
hitam sebanyak 4-. Akan diuji
dengan hipotesis alternatif
. Ambil
dua kelereng dengan pengembalian dan menolak H0 jika kedua kelereng yang terambil
berwarna sama.
a) Hitung peluang dari kesalahan tipe 1 (P[TI])
b) Hitung peluang dari kesalahan tipe 2 (P[TII])
Penyelesaian:
a) Dari kotak yang beisi 4 kelereng diambil 2 kelereng dengan pengembalian sehingga
peluang terambilnya kelereng putih pada setiap pengambilan adalah
(
dengan
[
Sehingga
) dimana
dan
( )( ) (
Jadi :
P[TI]
dan
(
|
(
)
|
( )(
)
) (
= 0,8021
(
b) P[TII]
=
( )(
) (
)
)
150
) dan = 11 dan
a. Asumsikan bahwa
= 4, akan diuji H0 :
dengan Ha :
, dengan tingkat
kepercayaan
.
b. Berapa besar = P[TII] jika =105?
c. Berapa banyak sampel yang di butuhkan untuk mendapatkan nilai =10,5?
d. Ujilah hipotesis dari (a) jika
tidak diketahui.
e. Ujilah H0 :
dengan Ha :
dengan tingkat kepercayaan =0,01
f. Berapa sampel yang diperlukan untuk uji pada (e) agar 90% H0 ditolak dengan nilai
=18?
Penyelesaian:
a. Zn =
=
=
= -2,237
Z1-
= 20,99
Z0 < Z1-
= 2,33
sehingga
-2,237<2,33
Z0>-Z1-
Jadi H0 diterima.
b.
= P[TII] , =105
= P[ menolak H0| H0 benar]
0,01= P[ < | ]
0,01= P[
0,01= P[
0,01= P[
]
]
-2,32=
-1,038= c-12
c = 10,96
=P[TII]
= P[menerima H0| H0 salah]
]
=P[
= 1-P[
= 1-P[
]
]
151
= 1-P[
= 1-P[
= 1-0,8485
= 0,1515
c. = 0,9 , =10,5
= 1.
= 0,1
n=
)
(
)
(
)
(
=
= 23,2937 = 24
d. t0 =
= -1,119
-t1-d(n-1) = -t0,99(19)
= -2,359
10> t1-d (n-1)
-1,119>-2,539 , H0 diterima.
e.
V0 =
=
(
(
=
)
= 33,778
(
) , artinya H0 diterima.
f. 1. = 0,9
= 0,1
n =1+2[
]
)
152
= 18,191
V0
)
)
=1+2[
=1+2[
=1+2[
]
= 1+2[
= 1+2[23,9]
= 1+48
= 49
4. Andaikan koin bias yang telah didiskusikan di contoh 9.2.5, dimana probabilitas dari
kepala, p, diketahui 0.20 ,0.30, atau 0.80. Koin dilempar berulang kali dan diberikan X
jumlah lemparan untuk menentukan kepala pertama. Dilakukan pengujian pada
akan menolak
jika
dan tidak menolak yang lain. Tentukan:
a) Berapa probabilitas dari kesalahan tipe I, [ ]?
b) Berapa probabilitas dari kesalahan tipe II, untuk setiap dua nilai lainnya dari p?
}. Tentukan
c) Untuk menguji
, andaikan daerah kritis berbentuk {
[ ] untuk setiap nilai lain dari p.
Penyelesaian
a)
b)
= [
= [
= [
=
]
]
)
(
(
)(
]
= [
=1- [
= 1 0,9932
= 0,0068
= [ ]
= [
= [
|
=
)
)(
153
= [
= 0,999 1
= [ ]
= [
= [
|
c)
|
]
)
(
)(
= [
= 0,999
]
1
dari
Sehingga
ditolak
)
b. (
(
Sehingga
c. ( )
ditolak
(
154
(
)(
(
(
d.
-value
) (
)(
(
)
) (
)(
) (
)(
(
)
)(
) (
) (
)(
) (
)(
) (
)
(
)(
8.
) (
)(
) (
)(
) (
)(
(
)
) (
)(
) (
)(
(
)
)(
) (
) (
)
)
Andaikan jumlah cacat dari sebuah kawat panjang adalah t meter yang berdistribusi poisson
X
( ) dan salah satu kecacatan ditemukan pada 100 meter dari sebuah kawat.
a) Uji
dengan
dengan tingkat kepercayaan 0,01, oleh mean dari
teorema 12.5.1
b) Berapa p. valuenya?
c) Andaikan jumlah dari dua cacat yang ditemukan pada kawat adalah 100 meter. Uji
lawan
pada tingkat kepercayaan = 0.0103
d) Cari kuasa dari uji yang ada pada soal c. jika = 0.01
Penyelesaian :
( )
a) s = 1
Uji statistik :
; = 0,01
; t = 100
768
(
b)
nilai p
155
Nilai p = 0,04042768
c) s = 2
; t = 200
; = 0,05
Uji statistik :
(
)
(
(
d)
)
)
, dan
) untuk
. Diberikan
) untuk
melawan
untuk menguji
pada tingkat
melawan
melawan
pada tingkat
.
e. Gunakan Tabel 7 (Lampiran C) untuk menemukan pangkat dari pengujian ini jika
.
Penyelesaian
a.
156
<
(
<
(
(
)
)
(
))
)
)
<
(
<
c.
Dari 11.5.17
=
157
))
=
(
) =
=
=
( )
( )
Artinya
d.
ditolak
=
=
=
(
) =
)
)
=
=
(
Artinya
diterima
e. Jika
(
Jadi
11. Andaikan sebuah distribusi dengan pdf f(x;) = x-1 untuk 0<x<1 dan 0 untuk yang lain.
a ) Tentukan Most Powerful (MP) bila n = 1 ; H0 :
b ) Hitung power test dari a untuk
Penyelesaian
a)
( )
158
( )
( )
; H1 :
dan
Untuk n = 1 didapatkan :
(
( )
[ (
b) [
12.
Penyelesaian:
(
(
Andaikan
(
)
) =
159
dengan
) =
) =
=
Dimana
adalah
Sehingga [
[ (
[ (
| ]
29. Diberikan
(
sampel
, untuk
dengan
acak
dari
sebuah
dengan
( )
)=
adalah harga
memaksimalkan
( )
Sehingga
maksimum terjadi jika paling kecil sehingga
(
( )
( )
( )
Jadi, GLRnya :
( )
distribusi
)
(
( )
| ]
pengujian
:
Penyelesaian :
Dicari MLG:
(
]= [
[ (
160
yang
( )
( )
( )
( )
161
BAB XIII
TABEL KONTINGENSI DAN KEBAIKAN SUAI
13.1 PENDAHULUAN
Sebagian besar model yang dibahas pada bab sebelumnya telah ditunjukkan dengan
pdf (
) yang diketahui sebagai bentuk suatu fungsi. Bahkan, sebagian besar metode
statistik telah dibahas dalam bab sebelumnya, seperti estimasi maksimum, yang diturunkan
relatif menjadi model ini. Dalam banyak situasi, tidak mungkin mengidentifikasi dengan
mudah model mana yang akan digunakan, sehingga metode statistik secara umum untuk
menguji kebaikan dan sesuaian model statistik yang relatif dalam bentuk sebuah data, sangat
diperlukan, yaitu dengan menggunakan tabel kontingensi.
13.2 KEJADIAN BINOMIAL UNTUK SATU SAMPEL
Pertama perhatikan jenis percobaan Bernoulli dengan menghasilkan dua
kemungkinan, yaitu A1 dan A2 dengan P(A1) = dan P(A2) = = 1
. Sampel acak dari
percobaan dengan
dan
menunjukkan jumlah hasil jenis tipe dan
masing-masing. Kemudian akan diuji Hipotesis
dengan
dari
(
) situasi ini
jumlah yang diharapkan dengan
dan
digambarkan dalam tabel 13.1.
Sebelumnya telah dibahas pengujian sampel binomial dan juga uji aproksimasi
berdasarkan pendekatan normal terhadap binomial tersebut. Uji aproksimasi juga dapat
dinyatakan dalam bentuk distribusi chi-square dan bentuk ini dapat digeneralisasi untuk
persoalan lebih dari dua jenis kemungkinan hasil dan lebih dari satu sampel.
Distribusi chi-square dari uji statistik didekati oleh distribusi normal yang
didistribusikan sebagai ( ) dan dapat dinyatakan sebagai berikut:
(
)
(
)
(
)
(
)
(
)
(
[(
)
(
)]
(13.2.1)
adalah menolak
jika
( ).
Statistik
mencerminkan jumlah selisih antara hasil pengamatan dan hasil yang
diharapkan dalam
. Dalam bentuk ini, perbedaan di kedua sel dikuadratkan, tetapi
perbedaannya bergantung linear karena (
)
dan jumlah derajat kebebasan
adalah jumlah sel dikurangi satu.
162
Tabel 13.1
Nilai hasil yang diharapkan dan diamati untuk percobaan Binomial
Kemungkinan Hasil
Total
Probabilitas
1
Hasil Ekspetasi
N
=
=
Hasil Pengamatan
N
Harus diingat bahwa pendekatan chi-square dapat ditingkatkan dalam hal ini dengan
memperkenalkan koreksi untuk diskontinuitas. Dengan demikian, hasil akan lebih akurat
diperoleh dengan menggunakan statistik
(|
(13.2.2)
Uji statistik dengan chi-square umumnya dapat dilakukan dengan dua cara, yaitu
dapat diperpanjang untuk diterapkan ke masalah multinomial dengan jenis hasil dan dapat
digenerasisasi untuk masalah r-sampel binomial, untuk selanjutnya akan dipertimbangkan
masalah r-sampel binomial pertama.
,
merupakan
(
)
( )
13.3.1
adalah menolak
jika
( ).
Contoh 13.3.1
Karakteristik tertentu diyakini terdapat dalam 20% dari populasi. Sampel acak dengan ukuran
50, 100 dan 50 diuji dari masing-masing dari tiga jenis yang berbeda, dengan hasil yang
diamati ditunjukkan dalam tabel 13.2.
Diharapkan jumlah hasil di bawah
kemudian
( )
( )
( )
dan
Sisanya
dapat diperoleh
dengan pengurangan dan ditampilkan dalam Tabel 13.3.
163
Tabel 13.2
Hasil Pengamatan Untuk 3 Sampel Uji Binomial
Hasil Pengamatan
Hadir
Absen
Total
Jenis 1
20
30
50
Jenis 2
25
75
100
Jenis 3
15
35
50
Tabel 13.3
Hasil Ekspetasi Untuk 3 Sampel Uji Binomial
Hasil Pengamatan
Hadir
Absen
Total
Jenis 1
10
40
50
Jenis 2
20
80
100
Jenis 3
10
40
50
didapatkan
= 17.18
Karena
( )
didapat menolak
pada kondisi
Dan
), dimana
(13.3.2)
Distribusi limit dari uji statistik ini dapat ditampilkan menjadi chi-square dengan derajat
kebebasan r-1, sehingga sebuah pengujian pendekatan berukuran adalah menolak
jika:
164
(13.3.3)
Pada umumnya dalam kasus ini, satu derajat kebebasan dihilangkan untuk setiap estimasi
parameter yang tidak diketahui. Sebenarnya hal ini sama untuk sampel normal, dimana
( )
Tabel 13.4
Tabel Pengamatan Dari r-sampel Binomial
Sampel
1
2
:
:
Total
:
:
:
:
:
:
r
(
165
Karena
kondisi
( )
Tabel 13.5
Hipotesis yang diamati dan
sama.
Hadir
Jenis 1
20(15)
Jenis 2
25(30)
Jenis 3
15(15)
Total
60
Total
50
100
50
200
( )
13.4.1
Ada kemungkinan untuk menunjukkan bahwa limit distribusi dari uji statistik dengan
adalah
(
) dan secara konsisten menyatakan bahwa perkiraan jumlah derajat
kebebasan dapat diperoleh dalam kondisi ini. Persamaan (13.2.1) menggambarkan bahwa
satu derajat kebebasan adalah tepat untuk kasus binomial dengan
. Demikian juga
untuk menentukan ukuran sampel,dengan (
) nilai yang diamati.
166
Contoh 13.4.1
Sebuah dadu dilempar 60 kali dan untuk mengujinya, diketahui bahwa
1,,6. Dari H0 hasil yang diharapkan yaitu
=10, maka :
= 6.0 <
, dimana j =
( )
1
Pengamatan 8
Harapan
10
2
11
10
3
5
10
4
5
6
12 15 9
10 10 10
Tabel 13.6
60
60
( )
, maka
( )
dari
, dan jelas
bahwa persamaan (13.3.1) dapat dinyatakan dalam bentuk ini. Perhitungan untuk masingmasing ,
(
dan
dari
167
( (
))
Permasalahan yang sering terjadi menguji apakah populasi multinomial adalah sama tanpa
menentukan nilai dari
. Sehingga, kita dapatkan
untuk
Harus mengestimasi
parameter
karena
= 1. Dari
MLE dari
sebanyak
Dimana
) ~
((
)(
))
)(
), dan
13.5.2
Contoh 13.5.1
Pada contoh 13.3.1, diketahui bahwa karakteristik dapat terjadi pada tiga tingkatan yang
berbeda yaitu absen, sedang, atau tinggi. Pada tabel 13.7, harapan untuk menguji
(
(
)
)
(
(
168
)
)
( )
Sedang
Absen
Contoh 1
Contoh 2
Contoh 3
1
1
Tabel 13.7
S1
S2
S3
Total
Tinggi
10(6)
4(12)
10(6)
24
Total
50
100
50
200
Kolom
2
Baris 1
Baris 2
Baris 3
1
Tabel 13.9
Perhatikan bahwa jumlah peluang bersama dalam hal ini ditambah 1, sedangkan
dalam tabel 13.7 peluang diperkirakan sesuai dengan peluang bersyarat, dan masing-masing
baris ditambah 1.
169
. Andaikan
dan
Misal
menunjukkan jumlah dari hasil, = , = , dan dari
jumlah hasil yang diharapkan untuk gagal dalam kotak (
) diestimasi menjadi :
( )( ) =
Perhatikan bahwa mengurangi nilai yang sama, yang didapatkan dari uji persamaan
proporsi dengan sampel banyak. Sehingga, statistik chi-squared untuk mengukur kesesuaian
antara hasil pengamatan
dan jumlah yang diharapkan dari
, dapat diperoleh.
Demikian juga, hasil perkiraan asimtotik menunjukkan bahwa :
= (
)/
((
)(
))
(
(
)
)
(
(
)
)
(
)
)
(
( )
Meningkat
8(9)
10(12)
Dukungan
Sama
12(10.5)
17(14)
170
Menurun
10(10.5)
13(14)
30
40
Independen
12(9)
30
6(10.5)
35
Tabel 13.10
12(10.5)
35
30
100
sehingga didapatkan
. Sekarang
( ).
dimana
Pada beberapa kasus mungkin terdapat pilihan yang alami untuk bagian cell atau data
dikelompokkan untuk memulainya dinyatakan dengan cell buatan yang mungkin dipilih.
Sebagai prinsip umum, banyak cell yang mungkin seharusnya digunakan untuk
meningkatkan nilai dari derajat kebebasan, dengan
atau uji statistic untuk chi square
cukup akurat.
Contoh 13.7.1
Diketahui X menunjukkan waktu perbaikan komponen pesawat terbang. Diuji pada
model Poisson dengan rata rata 3 hari dalam perbaikan komponen pesawat terbang. Pada
percobaan ini terdapat 40 komponen, dengan hasil ditunjukkan pada tabel 13.11. Pada
keadaan yang sama, beberapa komponen bisa diperbaiki dengan tafsiran 0 hari.
( )sehingga diperoleh
( )
[
]
( )
( )
,
, dan seterusnya. Nilai dugaan diberikan oleh
ditunjukkan oleh
( )
,
. Pada tabel
( )
171
>7
10
Peluang
0,050
0,149
0,224
0,224
0,168
0,101
0,050
0,034
Nilai dugaan
2,00
5,96
8,96
8,96
6,72
4,04
2,00
1,39
(Hari)
Pengamatan
7,96
7,40
untuk mengestimasi
kemudian distribusi limit dari
adalah chi square dengan
derajat kebebasan c-1-k, dimana c adalah nomer dari cell dan k adalah jumlah dari estimasi
parameter. Sehingga didapat
Dimana
Dalam banyak kasus, estimasi MLE didasarkan pada pengelompokan data model multinomial
yang tidak mudah untuk dilaksanakan dan dipraktekkan yang didasarkan pada MLE yang
biasanya pada data yang tidak dikelompokkan
172
Jika MLE yang didasarkan pada orservasi individu yang digunakan, kemudian nilai
dari derajat kebebasan lebih baik dari c-1-k, tetapi distribusi limit dibatasi antara distribusi
chi square dengan c-1 dan c-1-k derajat kebebasan. Kebijakan disini adalah akan
menggunakan c-k-1 sebagai derajat kebebasan jika k merupakan estimasi parameter dari
banyak prosedure ML. pendekatan yang lebih konservatif akan terikat pada P-value pada
pengujian menggunakan c-1-k dan c-1 derajat kebebasan jika MLE tidak didasari langsung
pada pengelompokan data.
Contoh 13.7.2
Perhatikan kembali data yang dibeerikan oleh contoh 13.7.1 dan sekarang dianggap bahwa
harapan pada percobaan
( ). MLE dari adalah rata rata dari 40 kali perbaikan,
dengan
[ ( )
( )
( )
( )]
(
Pengamatan
10
13
Peluang
0,121
0,173
0,211
0,192
0,303
Nilai dugaan
4,84
6,92
8,44
7,68
12,12
Waktu Perbaikan
(Hari)
Didapatkan
(
( )
Jadi sebuah model Poisson dapat memungkinkan untuk data ini, meskipun sebuah model
Poisson dengan =3 ditemukan tidak kebaikkan dengan baik. Dengan nilai derajat kebebasan
disini adalah 3, karena satu parameter telah diestimasi
173
( )
) didistribusikan
r
1
(F (
12n i 1
i:n
i 0.5 2
)
n
dimana
Contoh 13.8.1
Diberikan 25 sistem kegagalan yang terjadi pada 100 hari periode dan menghitung berapa
kali kegagalan menggunakan distribusi Uniform,
pengamatan sebagai berikut:
174
( )
, dengan 25
5.2
13.6
14.5
14.6
20.5
38.5
42.0
44.5
46.7
48.5
50.3
56.4
62.9
64.
67.1
71.6
79.2
82.6
83.1
85.5
90.8
92.7
95.5
95.6
61.7
Didapatkan
Karena
diinginkan.
Jika sebuah proses Poisson diamati pada waktu t, maka diberikan nilai dugaan, kesuksesan
untuk menghitung berapa kali kegagalan adalah mengkondiikan distribusi dengan variable
diseragamkan.
Jika data dibawah direpresentasikan kesuksesan untuk menghitung berapa kali kegagalan dari
sebuah proses Poisson, maka waktu diantara kegagalan adalah variable dari independent
exponensial. Waktu antara peengamatan satu dengan yang lain:
5.2
8.4
0.9
0.1
5.9
17.9
3.6
2.5
1.2
1.8
1.8
6.1
1.2
1.2
3.0
3.5
7.6
3.4
0.5
2.4
5.3
1.9
2.8
0.1
5.3
Digunakan statistic CM untuk menguji data tersebut secara exponensial. Tunjukkan bahwa
( ). Didapat
(
Karena
( (
175
Sekarang kita melakukan sebuah test dimana waktu perbedaan didalam contoh sebelumnya
dengan distribusi exponensial, EXP(). Pada kasus ini,
dan
Karena (
)
, dikatakan tidak dapat menolak H0 dengan =0,10
D max(i / n F (
i
D max( F (
i
i:n
i:n
))
) (i 1) / n))
D max( D , D )
V D D
carets akan ditambahkan jika parameter yang tidak diketahui harus diestimasi
Contoh 13.8.3.
Perhatikan kembali contoh 13.8.2 menggunakan uji statistic Kolmogorov. Sebuah bagian dari
)
)
EDF (
dan estimasi CDF (
dapat ditunjukkan pada
gambar 13.1. Nilai D dapat ditunjukkan pada order statistic ke lima
176
KESIMPULAN
Tujuan kita di bab ini adalah untuk memperkenalkan beberapa tes yang didesain baik
untuk menentukan apakah distribusi hipotesis memberikan model yang memadai atau untuk
menentukan. apakah variabel acak independen.
Tes chi-kuadrat didasarkan pada ukuran relatif dari perbedaan antara frekuensi yang
diamati dan frekuensi teoritik diprediksi oleh model. mereka memiliki adventages menjadi
cukup sederhana dan juga memiliki pendekatandistribusi chi-kuadrat.
SOAL-SOAL LATIHAN
1. Pada sebuah permainan baseball terdapat 300 pemukul, untuk sesi pertama ada 100
pukulan mendapatkan 20 pukulan. Gunakan persamaan (13.2.1) untuk menguji
terhadap
dengan
sebagai tingkat kepercayaan. Apa yang bisa dilakukan
untuk pengujian satu arah?
Jawab:
= 3.33+1.3 = 4.63
Menurut Tabel:
( )
( )
( )
adalah menolak
karena
( ).
2. Koin dilempar 20 kali dan didapatkan 7 kepala. Percobaan ini unbiased dengan
sebagai tingkat kepercayaan. Gunakan persamaan (13.2.1) dan (13.2.2).
Jawab:
177
= 1.8
( )
( )
( )
adalah menerima
( ).
karena
(|
( )
( )
(|
(|
( )
adalah menerima
karena
3. Diberikan contoh 13.3.1 yang akan ditunjukkan dengan data sebagai berikut:
Tabel Pengamatan:
Jenis 1
Jenis 2
Jenis 3
(a) Uji
(b) Uji
(c) Uji
Hasil Pengamatan
Hadir
Absen
10
40
50
50
30
20
Total
50
100
50
dengan
dengan
.
dengan
Jawab:
(a)
Tabel Ekspetasi:
Jenis 1
Hasil Pengamatan
Hadir
Absen
12.5
37.5
Total
50
178
( ).
Jenis 2
Jenis 3
50
25
50
25
)
(
100
50
Menurut Tabel:
( )
Sebuah pendekatan pengujian berukuran
adalah menerima
( )
karena
(b)
Tabel Ekspetasi:
Hasil Pengamatan
Hadir
Absen
25
25
50
50
25
25
Jenis 1
Jenis 2
Jenis 3
)
(
Total
50
100
50
)
(
Menurut Tabel:
( )
Sebuah pendekatan pengujian berukuran
(c)
adalah menolak
(
)
(
)
(
)
Tabel Ekspetasi:
179
karena
( )
Hasil Pengamatan
Hadir
Absen
22.5
47.5
45
55
22.5
47.5
Jenis 1
Jenis 2
Jenis 3
)
(
Total
50
100
50
Menurut Tabel:
( )
Sebuah pendekatan pengujian berukuran
adalah menolak
karena
( )
5. Dalam masalah genetic, terjadi perbedaan warna yaitu coklat, putih, dan spot. Peluang
yang terjadi pada warna coklat , warna putih , dan warna spot .
a. Uji hipotesis dengan taraf nyata = 0.1 dengan 40 kali percobaan
Penyelesaian :
( )
Coklat
5
10
Pengamatan
Harapan
( )
( )
Putih
15
10
Spot
20
20
Total
40
40
=5>
( )
( )
Jadi, H0 ditolak
b. Uji hipotesis dengan taraf nyata
adalah 1/9, 4/9,4/9
Penyelesaian :
180
( )
( )
Coklat
5
40/9
Pengamatan
Harapan
=
(
( )
Putih
15
160/9
Spot
20
160/9
Total
40
40
( )
= 0.78 <
( )
6. Sampel dari 36 kartu dengan pengembalian dari tumpukan 52 kartu dengan komposisi
sebagai berikut :
Spades
6
Hearts
8
Diamonds
9
Clubs
13
( )
( )
( )
Spades
6
54/13
Pengamatan
Harapan
=
(
Hearts
8
72/13
Diamonds
9
81/13
( )
= 4.9 <
181
( )
Clubs
13
9
11. Sampel dari 400 orang yang setuju mendukung keseimbangan anggaran belanja dan
mereka yang setuju mendukung pengetahuan umum dapat dilihat dalam tabel berikut :
Pendukung keseimbangan anggaran belanja
Strong
Undecided
Weak
100
80
20
60
50
15
20
50
5
Pengetahuan umum
Strong
Undecided
Weak
,
)
= 17.89 >
,
(
(
)
)
Total
100(90)
60(56.25)
20(33.75)
180
200
125
75
400
=
)
Pengetahuan
umum
Strong
Undecided
Weak
80(90)
50(56.25)
50(33.75)
180
20(20)
15(12.5)
5(7.5)
40
( )
( )
Jadi, Ho ditolak
8. Sebuah balok terdapat 5 kelereng hitam dan 10 kelereng putih. Pemain A dan Pemain B
mengambil 3 kelereng dari balok dan mencatat berapa kali kelereng hitam terambil. Pemain
A dan Pemain B mempunyai 100 kali kesempatan pengambilan dengan hasil sebagai berikut:
0
1
2
3
Pemain A
25
40
25
10
182
Pemain B
40
40
15
5
Gunakan persamaan 13.5.2 untuk menguji hipotesis bahwa 2 populasi multinomial adalah
sama dengan
Penyelesaian:
Persamaan 13.5.2
((
)(
))
Dengan
, dan seterusnya
0
25 (32,5)
40 (32,5)
65
)
1
40 (40)
40 (40)
80
(
)
2
25 (20)
15 (20)
40
3
10 (7,5)
5 (7,5)
15
100
100
200
Sedangkan
((
Karena
)(
))
((
)(
))
( )
9. Sebuah survey telah disebarkan sebagai distribusi pada penyewaan peternakan dalam
suatu periode waktu di Audobon County, Iowa, dengan persamaan 3 perbedaan level
kesuburan tanah. Dibawah ini adalah hasil survey yang dikutib dari Snedecor (1956,
halaman 225):
Soil
Owned
Rented
Mixed
I
36
67
49
152
II
31
60
49
140
III
58
87
80
225
Uji Hipotesis daari populasi multinomial untuk 3 perbedaan level kesuburan tanah dengan
Penyelesaian :
Pada soal ini, digunakan subbab 13.6
Dengan
, dan seterusnya
Rented
67 (62,9)
183
Mixed
49 (52,3)
152
II
III
31 (33,8)
58 (54,4)
125
60 (57,9)
87 (93,1)
214
((
49 (48,2)
80 (77,5)
178
)(
140
225
))
Sedangkan
((
)(
))
)(
((
))
( )
, dan seterusnya
Aliran Listrik
30 (33,6)
30 (26,4)
60
Lainnya
60 (56)
40 (44)
100
)
((
140
110
250
)(
))
Sedangkan
((
Karena
)(
))
((
)(
))
( )
184
DAFTAR PUSTAKA
Bain, Lee J, 1992, Introduction to Probability and Mathematical Statistics Second Edition,
Duxbury Press, California.
185