Académique Documents
Professionnel Documents
Culture Documents
Edisi E-Book
Oleh
Prof. Dr.Phil. I Gusti Putu Sudiarta,M.Si
Jurusan Pendidikan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Pendidikan Ganesha
Februari, 2013
Kata Pengantar
Puji syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa atas terbitnya buku ajar "Statistika Matematis II" ini. Buku ini merupakan lanjutan dari buku "Statistika Matematis I" dan menyajikan pengetahuan dasar yang dibutuhkan baik untuk mempelajari statistika secara matematis dan penerapannya dalam pemecahan masalah sehari-hari. Buku ajar ini ditujukan bagi mahasiswa jurusan (pendidikan) matematika khususnya, tapi dapat juga dijadikan referensi bagi mahasiswa lainnya atau masyarakat pada umumnya, terutama yang tertarik untuk mengetahui atau mendalami ilmu statistika serta pembahasannya secara matematis. Materi buku ajar ini bersumber dari beberapa buku terkenal seperti (1) Dudewicz E.J.; Mishra,S.N.(1988) Modern Mathematical Statistics,(2) Roussas G.G.(1973) A First Course in Mathematical Statistics, dan (3) Walpole, Ronald.E.; Myers, Raymond H.; Myers, Sharon L.; Ye, Keying (2002) Probability and Statistics for Engineers and Scientists, serta bukubuku lainnya seperti yang tercantun dalam daftar pustaka. Buku ini terdiri dari 5 Bab, yang secara garis besar menyajikan statistik induktif dengan pembahasan matematis, yang meliputi (1) distribusi pendekatan suatu distribusi variabel random, (2) konvergensi variabel random, (3) estimasi titik, (4) estimasi interval, serta (5) hipotesis statistik. Untuk membantu pemahaman yang lebih baik, ada beberapa hal yang harus diperhatikan dalam menggunakan buku ajar ini sbb: (1) pada setiap awal bab, diberikan standar kompetensi dan indikator hasil belajar, yang diharapkan dapat membantu pembaca memusatkan perhatian atau lebih berkonsentrasi pada hal-hal yang dianggap penting; (2) pada setiap i
akhir bab juga disajikan rangkuman, soal-soal dengan pembahasannya, dan soal-soal latihan dalam jumlah yang memadai, sehingga pembaca memiliki kesempatan untuk melakukan latihan secara mandiri dan mengevalusi sendiri hasil belajarnya. Buku ini merupakan edisi e-book tahun 2013 dari Buku Ajar Statistika Matematis II yang disusun sejak tahun 2005,dan diterbitkan tahun 2008 dengan ISBN 978-602-8310-02-4. Sejak tahun 2005 buku ini telah digunakan dalam perkuliahan di Universitas Pendidikan Ganesha dan mengalami beberapa kali revisi baik berdasarkan saran-saran mahasiswa peserta kuliah, maupun dosen sejawat yang telah dengan seksama menelaah buku ini. Untuk semua dukungan tersebut penulis sampaikan terimakasih yang setinggi-tingginya. Namun demikian, penulis menyadari bahwa pada terbitan ini, tentu masih ada hal-hal yang perlu untuk disempurnakan. Untuk itu penulis sangat terbuka terhadap saran, kritik dan koreksi, baik dari teman sejawat, mahasiswa, pencinta matematika, maupun masyarakat pembaca umumnya. Akhirnya penulis berharap, semoga buku ajar ini dapat memberikan manfaat yang sebesar-besarnya.
ii
ISBN 978-602-8310-02-4
Daftar Isi
Kata Pengantar 1 Distribusi Pendekatan 1.1 1.2 1.3 Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . . Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . . Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 1.3.2 Konsep Dasar Distribusi Pendekatan . . . . . . . . . Menentukan Distribusi Pendekatan . . . . . . . . . . 1.3.2.1 1.3.2.2 1.3.2.3 1.4 1.5 2 Melalui Fungsi Distribusi . . . . . . . . . . . Melalui Fungsi Pembangkit Momen . . . . Melalui Teorema Limit Pusat . . . . . . . . . . . . . . . . . . . . . . . . . . . . i 1 1 1 2 2 2 2 8 12 20 23 27 27 27 28 28 29
Soal-Soal Latihan . . . . . . . . . . . . . . . . . . . . . . . . .
Konvergensi Variabel Random 2.1 2.2 2.3 Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . . Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . . Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 2.3.2 Konsep Dasar Variabel Random . . . . . . . . . . . . Barisan Variabel Random . . . . . . . . . . . . . . . . iii
2.3.3
Jenis-Jenis Konvergensi Variabel Random . . . . . . . 2.3.3.1 2.3.3.2 Konvergen dalam Distribusi . . . . . . . . . Konvergen dalam Probabilitas . . . . . . . .
30 30 35 38 43 48 53 53 53 54 54 54 57 61 62 64 65 67 69 70 72 73 81 82 84 89
Soal-Soal Latihan . . . . . . . . . . . . . . . . . . . . . . . . .
Estimasi Titik 3.1 3.2 3.3 Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . . Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . . Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Prinsip Reduksi Data . . . . . . . . . . . . . . . . . . . 3.3.1.1 3.3.1.2 3.3.2 Azas Kecukupan . . . . . . . . . . . . . . .
Estimasi Titik . . . . . . . . . . . . . . . . . . . . . . . 3.3.2.1 3.3.2.2 3.3.2.3 3.3.2.4 Estimator Tak Bias . . . . . . . . . . . . . . . Estimator Konsisten . . . . . . . . . . . . . . Estimator Esien . . . . . . . . . . . . . . . . Estimator Bayes . . . . . . . . . . . . . . . .
3.3.3
Metode Evaluasi Estimator Titik . . . . . . . . . . . . 3.3.3.1 3.3.3.2 3.3.3.3 Galat Kwadrat Rata-Rata . . . . . . . . . . . Estimator Terbaik . . . . . . . . . . . . . . . Teorema Batas Bawah Cramer-Rao . . . . .
3.3.4
Metode Estimasi Titik . . . . . . . . . . . . . . . . . . 3.3.4.1 3.3.4.2 Metode Momen . . . . . . . . . . . . . . . . Metode Maksimum Likelihood . . . . . . .
3.4 3.5
117
Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . . 117 Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . . 117 Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 4.3.1 4.3.2 Konsep Dasar Estimasi Interval . . . . . . . . . . . . . 118 Metode Menentukan Estimasi Interval . . . . . . . . . 121 4.3.2.1 4.3.2.2 4.3.3 4.3.4 Inversi Uji Statistik . . . . . . . . . . . . . . 121 Besaran Pivot . . . . . . . . . . . . . . . . . 122
Metode Evaluasi Estimasi Interval . . . . . . . . . . . 125 Estimasi Interval Kepercayaan Khusus . . . . . . . . 128 4.3.4.1 4.3.4.2 4.3.4.3 4.3.4.4 Interval Kepercayaan untuk Mean . . . . . . 128 Interval Kepercayaan untuk Perbedaan Mean130 Interval Kepercayaan untuk Variansi . . . . 131 Interval Kepercayaan untuk Rasio Dua Variansi . . . . . . . . . . . . . . . . . . . . . . 132 . . . . . . . . . . . . . . . . . . . 134
4.4 4.5 5
Standar Kompetensi . . . . . . . . . . . . . . . . . . . . . . . 139 Indikator Hasil Belajar . . . . . . . . . . . . . . . . . . . . . . 139 Uraian Materi . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 5.3.1 5.3.2 5.3.3 Konsep Dasar Uji Hipotesis . . . . . . . . . . . . . . . 140 Uji Rasio Likelihood . . . . . . . . . . . . . . . . . . . 141 Metode Uji Evaluasi Hipotesis . . . . . . . . . . . . . 144 5.3.3.1 Probabilitas Kesalahan dan Fungsi Kekuatan Uji . . . . . . . . . . . . . . . . . . . . . . 145 v ISBN 978-602-8310-02-4
Uji Paling Kuat (Most Powerfull Test) . . . . . 149 Teorema Neyman-Pearson . . . . . . . . . . 151 Teorema Karlin-Rubin . . . . . . . . . . . . 153
Daftar Pustaka
vi
ISBN 978-602-8310-02-4
Memahami konsep dasar distribusi pendekatatan suatu barisan variabel random, dan mampu menerapkannya, baik dalam pemecaham masalah matematika, ilmu lain maupun dalam kehidupan sehari-hari
1.2
1. Menjelaskan konsep dasar distribusi pendekatatan suatu variabel atau fungsi variabel random 2. Menentukan distribusi pendekatan suatu barisan atau fungsi variabel random dengan menggunakan fungsi distribusi. 3. Menentukan distribusi pendekatan suatu barisan atau fungsi variabel random dengan menggunakan fungsi pembangkit momen, 4. Menentukan distribusi pendekatan suatu barisan atau fungsi variabel random dengan menggunakan dalil limit pusat, 5. Memecahkan masalah yang berkaitan dengan distribusi pendekatan
1.3
1.3.1
Uraian Materi
Konsep Dasar Distribusi Pendekatan
Pada kuliah Statistika Matematis I, telah dibahas distribusi variabel random maupun distribusi fungsi variabel random secara eksak. Sering dijumpai sebuah variabel random yang distribusinya bergantung pada bilangan nulat positif n atau mungkin juga sebuah statistik, yang merupakan fungsi dari variabel random yang distribusinya juga bergantung pada bilangan positif n. Kadang-kadang ada masalah dalam mengitung distribusi peluang variabel random, karena sulit menentukan fungsi kepadatan peluangnya. Oleh karena itu dalam bab ini akan dibahas cara menentukan distribusi variabel random melalui pendekatan, apabila n cukup besar.
1.3.2
Ada tiga cara dalam menentukan distribusi pendekatan tersebut yaitu melalui fungsi distribusi, fungsi pembangkit momen, dan teorema limit pusat. Ketiga cara tersebut akan dibahas secara satu persatu.
1.3.2.1
Masalah : Jika X adalah rerata dari sampel acak X1 , X2 , ..., Xn yang berasal dari distribusi dengan fungsi kepadatan peluang berbentuk: f (x) = 1; 0 < x < 1 0; lainnya
Hitung P( X < 0, 5). Kita menghadapai masalah dalam menghitung nilai ini, karena ternyata distribusi dari X , dan fungsi pembangkit momen dari X bergantung pada n, sehingga nilai dari P( X < 0, 5) tidak dapat dihitung dengan cara langsung.
Bab 1. Distribusi Pendekatan
ISBN 978-602-8310-02-4
Pembahasan Distribusi dari X harus kita selesaikan lebih dahulu. Karena variabel random X berasal dari distribusi seragam pada (0, 1), untuk menentukan distribusi dari X akan digunakan teknik fungsi pembangkit momen. Sebelumnya kita akan menentukan dahulu fungsi pembangkit momen dari X . Fungsi pembangkit momen dari X adalah: Mx (t) = E(etx )
1 tx 0 e .1 dx 1 1 tx e t x =0 e t 1 ; t =0 t
= = =
Untuk t = 0 digunakan dalil LHospital Limt0 Mx (t) = Limt0 t t 1 = Limt0 e t Jadi Mx (t) =
e t 1 t ;
( e t 1)
1;
t=0 t=0
Dari sini dapat dilihat bahwa fungsi pembangkit momen dari X bergantung pada n, distribusi dari X juga bergantung pada n. Jadi kita tidak dapat menentukan fungsi kepadatan peluang dari X , sehingga tidak dapat pula menghitung peluang untuk harga tertentu. Oleh karena itu, berikut ini akan dijelaskan suatu cara pendekatan untuk menentukan distribusi dari sebuah variabel random bergantung pada bilangan bulat positif n. Sebagai kesepakatan dalam hal ini, fungsi distribusi akan dituis sebagai Fn dan fungsi kepadatan peluangnya ditulis sebagai f n . Apabila kita membahas barisan fungsi distribusi, maka kita harus menuliskan indeks n pada variabel randomnya. Misalkan penulisan:
x
Fn X
Bab 1. Distribusi Pendekatan
1/n. 2
eny
2/2
dy
ISBN 978-602-8310-02-4
merupakan fungsi distribusi dari rerata X yang dihitung dari sampel acak berukuran n dan berasal dari distribusi N (0, 1). De f inisi Misalkan Fn (y) adalah fungsi distribusi dari variabel random Yn yang bergantung pada bilangan bulat positif n. Jika F (y)adalah fungsi distribusi dan Limt0 Fn (y) = F (y) untuk setiap nilai y yang mengakibatkan F (y) kontinu, maka variabel random Yn dikatakan mempunyai distribusi pendekatan dengan fungsi distribusi F (y). Contoh : Misalkan Yn menunjukkan statistik urutan ke-n dari sampel acak X1 , X2 , ..., Xn yang berdistribusi dengan fungsi kepadatan peluang berbentuk: f (x) = =
1
Apakah Yn mempunyai distribusi pendekatan ? Jawab: Fungsi kepadatan peluang dari Yn adalah: gn (y) = n( F (y))n1 f (y) ; a < y < b = 1 ; Lainnya dengan : F (y) = F (y) = Jadi f ( x ) dx = F (y) = 1
y n 1 1 y 0 y 1 0 dx
; 0<y< ; Lainnya
dt = 0 4 ISBN 978-602-8310-02-4
y 1 n n t 0
y n
= =
Jadi :
ntn1 0 n dt +
y 0 gn ( t ) dt <0 0 0 dt
Fn (y) = = =
0
y n
limn Fn (y) =
F (y) =
Karena Limn0 Fn (y) = F (y) pada masing-masing nilai y yang menyebabkan F (y) kontinu, menurut denisi, variabel random Yn mempunyai distribusi pendekatan dengan fungsi distribusi F (y). Berikut ini akan diberikan sebuah contoh tenang sebuah variabel random yang mempunyai distribusi pendekatan degenerate. Contoh Misalkan X mempunyai fungsi distribusi berbentuk:
x
1/n. 2
eny
2/2
dy
ISBN 978-602-8310-02-4
Limn Fn ( x ) = 0 ; x < 0 1 ; x=0 = 2 = 1 ; x>0 Sekarang ambil fungsi distribusi dari X adalah : F(x) = 0 ; x < 0 = 1 ; x0 Ternyata Limn Fn ( x ) = F ( x ) untuk setiap nilai kontinu dari F ( x ). Dalam hal ini, Limn Fn (0) = F (0), tetapi F ( x )tidak kontinu di x = 0. Dengan demikian variabel random X n mempunyai distribusi pendekatan dengan fungsi distribusi F ( x). Distribusi pendekatannya adalah degenerate. Contoh Misalkan Yn menunjukkan statistik urutan ke-n dari sampel acak X1 , X2 , ..., Xn yang berdistribusi seragam pada (0, ), > 0. Jika Zn = n( Yn ),maka apakah Zn mempunyai distribusi pendekatan? Jawab: Fungsi kepadatan peluang dari X adalah: f (x) = =
1
0 6
Kita akan menentukan fungsi kepadatan peluang dari Zn dengan menggunakaan teknik transformasi variabel random. Hubungan antara nilai yn dengan nilai Yn dengan nilai zn dari Zn diberikan sbb: Zn = n( yn ) inversnya : yn = Jacobiannya : J= dyn 1 = dzn n dyn 1 = dzn n Zn n
| J| =
Fungsi kepadatan peluang dari Zn adalah: hn (z) = = Fungsi distribusi dari Zn adalah 1. Untuk z < 0, Kn (z) =
z 0 1 n
hn (t) dt =
z 1 0 n
<0 0 0
dt = 0
t n 1 dt n
Kn ( z ) =
=
Kn ( z ) = 4. Untuk z n
Bab 1. Distribusi Pendekatan
z n 1 n 1 (n) 0 n y 1 n n y z n n 1 1 nz
dy
ISBN 978-602-8310-02-4
Kn ( z ) =
=
Jadi :
n z 0 hn ( t ) dt + n hn ( t ) z n 1 t n 1 dt + n 0 0 n n
dt dt = 1
Kn ( z ) = 0 = 1 1 Kn ( z ) = 1
z n
; z0 ; 0 z < n ; z n
Limn Kn (z) = 0 ; z0 = 1 ez/ ; 0 < z < Sekarang ambil fungsi distribusi dari Z: K (z) = 0 ; z<0 z / = 1e ; z0 merupakan fungsi ditribusi yang kontinu dimana-mana, serta Limn Kn (z) = K (z)untuk semua nilai. Jadi Zn mempunyai pendekatan dengan fungsi distribusi K (z). Dalam hal ini, distribusi pendekatannya tidak degenerate. Penentuan distribusi pendekatan dengan menggunakan fungsi distribusi bisa dinyatakan sebagai konvergen dalam distribusi yang akan dibahas lebih lanjut pada Bab II.
1.3.2.2
Selain menggunakan fungsi distribusi, penentuan disribusi pendekatan dapat dilakukan melalui fungsi pembangkit momen. Berikut ini diberikan sebuah teorema yang dikemukakan oleh Curtiss sebagai modikasi dari teorema Levy dan Cramer yang menjelaskan bagaimana fungsi pembangkit momen dapat digunakan dalam menentukan distribusi secara pendekatan. Teorema
Bab 1. Distribusi Pendekatan
ISBN 978-602-8310-02-4
Misalkan variabel random Yn mempunyai fungsi distribusi Fn (y) dan fungsi pembangkit momennya M (t; n) ada untuk h < t < h, h > 0 dan setiap n. Jika ada fungsi disribusi F (y) dengan funsgi pembangkit momennya M(t) untuk |t| h1 < h sedemikian hingga Limn M (t; n) = M (t), maka Yn dikatakan mempunyai distribusi pendekatan dengan fungsi distribusi F ( y ). Contoh Misalkan Yn adalah variabel random berdistribusi binomial dengan parameter n dan p. Jika rerata dari Yn adalah sama untuk setiap n, yaitu = np, sehingga p = n dengan adalah konstanta, maka apakah ada distribusi pendekatan dari Yn ? Jawab : Fungsi kepadatan peluang dari Yn adalah n yn pyn (1 p)nyn ; yn = 0, 1, 2, ..., n 0 ; lainnya
F (yn ) =
Kemudiankita akan menentukan fungsi pembangkit momen dari Yn . Fungsi pembangkit momen dari yn adalah: M ( t; n ) =
tyn = n y n =0 e
E(etyn ) n p y n (1 p ) n y n yn
= n y n =0 = = =
( e t 1) n n
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari t distribusi poison dengan rerata dan M(t) = e(e 1) . Dengan demikian Yn dikatakan mempunyai distribusi pendekatan dengan distribusi penekatannya adalah Poisson dengan rerata . Contoh : Misalkan variabel random Zn berdistribusi chi-kuadrat dengan derajat ke( Zn n) bebasan = n. Jika variabel random Yn = , maka tentukan distribusi 2n pendekatan dari Yn dengan menggunakan fungsi pembangkit momen. Jawab : Fungsi kepadatan peluang dari Zn adalah
f (zn ) =
(n/2)1 Zn /2 1 zn e 2n/2 .( n ) 2
Zn > 0
; lainnya
MZn (t) =
E(etzn )
(n/2)1 Zn /2 tzn 1 zn e dzn 0 e 2n/2 .( n ) 2 (n/2)1 Zn /2 1 e dzn 0 2n/2 .( n ) zn 2
= =
MZn (t) =
2n/2 . n 2
= = =
Bab 1. Distribusi Pendekatan
(n/2)1 u 1 e du n/2 0 u 2n/2 .( n 1/2 ) t (( ) ) 2 1 n n/2 2 1/2 ) t 2n/2 .( n (( ) ) 2 (1 2t)n/2 ; t < 1/2
( )
u (1/2)t
(n/2)1
du eu ((1/2 )t)
10
ISBN 978-602-8310-02-4
Fungsi pembangkit momen dari Yn adalah: M ( t; n ) = MYn (t) = E(etYn ) E exp t etn/
2 .E etZn / 2 . M
n )( n /2)
= = =
(Z n n) 2n tZ e n/ 2
t Zn ( 2n )
= e(t =
Apabila et
2/n) diuraikan
et
1 2 t
n/2
2n
2 t 2/n)n/2 ne
e Sehingga:
t 2/n)
= 1+t
1 + t 6
2 n
+ ...
M ( t; n ) = t
2 n
1+t 1+t
2 n
+
2 n
1 2 1 2
t t
2 n 2 n
+
2
1 6 1 6
t t
2 n 2 n
+ ...
3
n/2
+
2 n 2 n
+ ...
n/2
2 n
= =
1 3 2 2 2 2 )+ 1 1 t2 ( n 2t (n) + 6t (n)
3 2 1 2t (n)
+ ...
t2 n
n/2
3 2 1 3t (n)
+ ...
n/2
t2 n
3 2 1 3t (n)
2 n
+ ...
n/2
2 n
M ( t; n )
= Limn 1 =
t2 n
3 2 1 3t (n) t2 n
+ ...
Limn 1 e2
t2
n/2
Limn M(t; n) =
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari disBab 1. Distribusi Pendekatan
11
ISBN 978-602-8310-02-4
n tribusi normal standar, yaitu M(t) = e 2 . Jadi variabel random Yn = 2n mempunyai distribusi pendekatan berbentuk distribusi normal standar. Apabila sebuah variabel random mempunyai disribusi pendekatan maka kita dapat menggunakan distribusi pendekatan itu sebagai distribusi yang sebenarnya. Misalnya dari hasil contoh di atas, kita dapat menggunakan distribusi Poisson sebagai pendekatan dari distribusi Binomial untuk n besar dan p kecil. Kemudian kita bisa menghitung peluang dari variabel random yang berdistribusi binomial dengan menggunakan distribusi poisson.
( Z n)
Contoh Misalnya variabel random Y berdistribusi binomial dengan n = 50 dan p = 0, 04. Hitung P(Y 1) dengan dua cara, yaitu cara eksak dan cara pendekatan. Jawab : 1. Cara eksak Dalam hal ini, kita menyelesaikannya dengan menggunakan disribusi binomial. P (Y 1 ) = P (Y = 0 ) + P (Y = 1 ) 50 50 = (0, 04)0 (0, 96)50 + (0, 04)1 (0, 96)49 0 0 = 0, 1299 + 0, 2706 P (Y 1 ) = 0, 4005 2. Cara pendekatan Dalam hal ini, kita menyelesaikannya dengan menggunakan distrbusi poisson. = np = 50.0, 04 = 2 P (Y 1 ) = P (Y = 0 ) + P (Y = 1 )
e2 20 0!
=
1.3.2.3
e2 21 1!
= 3.e2 = 0, 4060
12
ISBN 978-602-8310-02-4
1. Teorema limit pusat yang pertama kali dikemukakan oleh Laplace pada tahun 1812 dan pembuktiannya yang lebih teliti dijelakan oleh Liapounoff pada tahun 1901. Teorema Jika Xi , I = 1, 2, 3, ..., n adalah n buah variabel random yang saling bebas sedemikian hingga E( Xi ) = i dan Var ( Xi ) = i2 maka variabel random Sn = X1 + X2 + ... + Xn secara pendekatan berdistribusi n n 2 N (; 2 ) dengan = i =1 i dan Var ( Xi ) = i =1 i 2. Teorema limit pusat berikut ini dikemukakan oleh De-Moiures dan Laplace pada tahun 1833 Teorema Jika Xi = 1 ; dengan peluang p 0 ; dengan peluang q = 1 p
maka distribusi dari variabel random Sn = X1 + X2 + ... + Xn dengan Xi saling bebas dan berdistribusi identik, secara pendekatan akan berdistribusi N (np; npq) untuk n . Bukti : Fungsi pembangkin momen dari Xi adalah: M xi ( t ) = E etxi txi = 1 x i =0 e f ( x i ) = e t (1) . p + e t (0) . q = pet + q Fungsi pembangkit momen dari Sn adalah: Ms n ( t ) = E etsn E et(X1 +X2 +...+Xn )
= E etX1 +tX2 +...+tXn = etX1 + etX2 + ... + E etXn = Mx1 (t) + Mx2 (t) + ... + Mxn (t) = ( pet + q).( pet + q)...( pet + q) Ms n ( t ) = ( pet + q)n
Bab 1. Distribusi Pendekatan
13
ISBN 978-602-8310-02-4
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari distribusi binomial dengan parameter n dan p. Jadi E(Sn ) = Sn E(Sn ) Sn np = npq
Var (Sn )
Fungsi pembangkit momen dari Z adalah: Mz ( t ) = E etZ E exp t etnp/ etnp/ etp/
npq npq Sn np npq
= = = = = =
. Ms n
npq npq
pet/
npq
+q
npq
n n
etq/ p 1+
+ q.etp/
+q 1 =
p+t t Mz ( t ) =
tq t2 q2 t3 q3 npq + 2npq + 6npq npq + ... n tq t2 q2 t3 q3 + + + .. npq 2npq 6npq npq pq t2 q t3 q2 n + 2n + 6np npq + ... + q n pq t2 q t3 q2 + + + ... n 2n 6np npq n t3 ( q p ) t2 1 + 2n + 6npq + ...
t2 t3 ( q p ) 1+ + + ... 2n 6 npq t2 1+ 2n
n
= Limn
Limn Mz (t) = et
2 /2
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari Sn np distribusi normal standar. Jadi Z = npq berdistribusi N (0; 1). Dengan menggunakan teknik fungsi pembangkit momen dapat ditunjukkan Sn berdistribusi N (np; npq) 3. Berikut ini akan dijelaskan dalil limit pusat untuk n buah variabel random yang berdistribusi identik (pembuktiannya dilakukan oleh Lindeberg dan Levy)
Bab 1. Distribusi Pendekatan
14
ISBN 978-602-8310-02-4
Teorema : Jika X1 + X2 + ... + Xn adalah n buah variabel random yang bebas dan berdistribusi identik dengan: E( Xi ) = ; Var ( Xi ) = 2 ; i = 1, 2, ..., n
maka variabel random Sn = X1 + X2 + ... + Xn secara pendekatan berdistribusi normal dengan rerata = n dan variansi 2 = n2
Bukti : Misalkan M1 (t) menunjukkan fungsi pembangkit momen dari ( Xi 1 ) dan M(t) menunjukkan fungsi pembangkit momen S dari Z = n . Karena 1 dan 2 dari ( Xi 1 ) diberikan dengan:
1 = E ( Xi 1 ) = E ( Xi ) 1 = 1 1 = 0 2 = E( Xi 1 )2 = i2
Sn ( X1 + X2 + ... + Xn ) =
15
ISBN 978-602-8310-02-4
(i ) = = = = (ii ) = = = =
= Jadi
E(Sn ) = E( X1 + X2 + ... + Xn ) E( X1 ) + E( X2 ) + ... + E( Xn ) 1 + 1 + ... + 1 E ( Sn ) = n 1 Var (Sn ) Var( X1 + X2 + ... + Xn ) Var( X1 ) + Var( X2 ) + ... + Var( Xn )
2 + 2 + ... + 2 ) 1 1 1 1 n
n x = 0 ( Xi 1 )
i
= E e 1 = E e 1
= E e 1
( x1 1 )
e 1
( x2 1 )
....e 1
( x n 1 )
= M x1 1
1 n
. M x2 1
1 n
.... Mxn 1
1 n
16
ISBN 978-602-8310-02-4
Mz ( t ) = M x 1 1
1 n
2 2 1
1 t = 1+ 2 1 n
1 t + 6 1 n
n
n 2 1
+ ...
t3 t2 + ... + = 1+ 2n 61 n n
t2 2n
+ 6 tnn + ...
1
=
Limn Mz (t) =
Limn 1 + et
2 /2
t2 2n
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari S n distribusi normal standar. Jadi Z = n1 n 1 berdistribusi N (0; 1). 4. Teorema: Jika X1 + X2 + ... + Xn menunjukkan sampel acak distribusi yang mempunyai rerata dan varians 2 , maka variabel random: n x i = 1 ( Xi 1 ) Yn = 1 n akan berdistribusi N (0; 1) Bukti : Tentukan fungsi pembangkit momen dari Yn , kemudian kita akan menguraikan e oleh: M ( t; n ) = 1+t 1+
t
X1 n
X1 n
t2 2
X1 2 n
t3 6n
X1 3 n
+ ...
n
= =
+ ...
17
ISBN 978-602-8310-02-4
berdistribusi
5. Teorema: Jika X1 , X2 , ..., Xn menunjukkan sampel acak dari distribusi yang mempunyai rerata dan varians 2 , maka variabel random x Yn = /n akan berdistribusi normal standar. Bukti : Fungsi pembangkit momen dari Yn adalah: MYn (t)
= = = = = =
e /
t n
M (t; n) = E(etyn ) E e E e / e / e /
t n t n
t /n
t n
.e /
tx
E e
t n
[ X1 + X2 +...+ Xn ]
t
E e
t n
X1
.e
X2 X2
...e
Xn
t
E e
X1
.E e . M x2 M x1
Xn
= e /
M ( t; n )
t . n
M x1
t 1 n
e /
t n
t 1 n 1 n t
t 1 n
ln M(t; n) =
t / n
+ n.ln Mx1
t 1 n t
1 n
+1 6 3
1 n
+ ...
2 3
t + n.ln Mx1 1 + 1 +1 2 2 n
1
1 n
+1 6 3
1 n
+ ...
Kita akan menguraikan ln (1 + x )dengan perluasan deret Maclaurin, yaitu: 1 2 3 ln (1 + x ) = x 2 x +1 3 x ...; | x | < 1
t 1 Disini X = 1 +2 2 1 n Sehingga: 1 n t 2
+1 6 3
1 n
+ ...
18
ISBN 978-602-8310-02-4
ln M(t; n) =
t n
+n
1 2
t +1 1 2 2 n
1
1 n 2
+1 6 3
1 n 1 n t t
1 n 3
+ ...
2
1 1
1
1 2 2
1 n 1 n t 2
1 6 3
+ ...
3
+ ...
=
dengan:
1 3
1 n
1 2 2
1 6 3
+ ...
t+
2 2 2
2 1 + 2 2 t +
3 6 3 n
+ 212 t3 + .. n
1 = 2 1 = 2 = 2
3 6 3 n
1 2 ln M (t; n) = 0 + 2 t +
( 1 ) 3 3 21 3 n + 233 n t + ...
1 2 2t
3 6 3 n
( 1 ) 3 3 21 3 n + 233 n t + ...
Ternyata bentuk di atas merupakan fungsi pembangkit momen dari x distribusi normal standar, sehingga : Yn = /n berdistribusi N (0; 1). Untuk menerapkan teorma limit pusat dalam menyelesaikan soal, seringkali diperlukan untuk mengubahnya lebih dulu dalam bentuk lain, yaitu: Jika X1 , X2 , ..., Xn adalah n buah variabel random yang saling bebas dan berdistribusi identik dengan rerata 1 dan variansi 2 yang besarnya berhingga dan S1 = X1 + X2 + ... + Xn ; maka: Limn P a
Sn n 1 1 n
b 1 a 2
e x
2 /n
dx
Limn P a
atau Limn P a
X 1 1 n
b = (b) (b)
Jika kita memperhatikan ketiga bentuk di atas, maka untuk menghitung peluang dari variabel random yang mempunyai harga tertentu
Bab 1. Distribusi Pendekatan
19
ISBN 978-602-8310-02-4
dengan menggunakan teorema limit pusat, dapat diselesaikan dengan bantuan tabel distribusi normal standar.
1.4
1. Misalkan X adalah rerata dari sampel acak berukuran 75 dari distribusi dengan fungsi kepadatan peluang berbentuk: f (x) = 1 ; 0 < x < 1 = 0; lainnya Hitung P(0, 45 < X < 0, 55) Jawab : Kita akan menghitung dahulu E( X ) dan Var ( X ). 2
= E( X ) = = E( X 2 ) =
1 0 1 0
= x2 dx =
xdx
1 3
1 2 1 3 1 12
1 4 =
0,450,5
1 (75)(12)
<
X 1 1 n
<
0,550,5
1 (75)(12)
2. Misalkan X1 , X2 , ..., Xn menunjukkan sebuah sampel acak dari distribusi b(1, p). Jika n = 100, p = 1/2, dan Y = X1 + X2 + ... + Xn ; maka hitung P(Y = 48, 49, 50, 51, 52) Jawab : Karena X berdistribusi Bernouli, maka:
(i ) E ( X ) = p
Bab 1. Distribusi Pendekatan
20
ISBN 978-602-8310-02-4
(ii )Var ( X ) = p(1 p) Dengan menggunakan teknik fungsi pembangkit momen, maka Y dapat ditunjukkan berdistribusi b(n; p). Akibatnya: (i ) E(Y ) = n. p = 100.1/2 = 50 (ii )Var (Y ) = np(1 p) = 100.1/2(1 1/2) = 25 Karena kita melakukan perubahan dari variabel random diskrit ke kontinu, maka kita harus menggunakan faktor koreksi, yaitu dengan menambah dan megurangi 0, 5. Sehingga:
P(Y = 48, 49, 50, 51, 52) = P
47,550 5 Y E (Y ) Var (Y ) 52,550 5
= P(0, 50 < Z < 0, 50) P(Y = 48, 49, 50, 51, 52) = 0, 381 Kemudian kita akan menghtiung hasi eksak dengan menggunakan disribusi binomial.
P(Y = 48, 49, 50, 51, 52) = P(Y = 48) + P(Y = 49) + P(Y = 50) + P(Y = 51) + P(Y = 52) P(Y = 48) = P(Y = 49) = P(Y = 50) = P(Y = 51) = P(Y = 52) = 100 48 100 49 100 50 100 51 100 52
1 2 1 2 1 2 1 2 1 2 100
100
100
100
100
Sehingga: P(Y = 48, 49, 50, 51, 52) = 0, 0375 + 0, 0780 + 0, 0796+ 0, 0780 + 0, 0735 P(Y = 48, 49, 50, 51, 52) = 0, 3826 Apabila kita membandingkan hasil pendekatan dengan hasil eksak, maka akan terdapat perbedaan sebesar 0, 0016.
Bab 1. Distribusi Pendekatan
21
ISBN 978-602-8310-02-4
3. Misalkan X1 , X2 , ..., Xn adalah n buah variabel random yang masingmasing berdistribusi (1). Jika Sn = X1 + X2 + ... + Xn dan n = 100 , maka tentukan nilai a sedemikian hingga P(Sn < a) = 0, 95 Jawab : Dengan menggunakan teknik fungsi pembangkit momen, maka Sn akan berdistribusi (n). Akibatnya (a) E(Sn ) = n = 100 (b) Var (Sn ) = 2n = 200 Sehingga: P(Sn < a) = 0, 95
Sn E ( Sn )
a 100 P Z = 0, 95 200 Dari tabel Distribusi Normal diperoleh: a 100 = 1, 645 200
Kemudian kita akan menghitung peluang di atas secara eksak dengan menggunakan tabel Distribusi Chi-Kuadrat. Karena P(Sn < a) = 0, 95; dengan menggunakan tabel Distribusi Chi-Kuadrat dengan derajat kebebasan n = 100 diperoleh hasil: a = 124, 342. Apabila
Bab 1. Distribusi Pendekatan
22
ISBN 978-602-8310-02-4
kita membandingkan hasil pendekatan degan hasil eksak maka akan terdapat perbedaan sebesar 1, 078.
1.5
Soal-Soal Latihan
1. Misalkan X n menunjukkan rerata dari sampel acak berukuran N (; 2 ). Tentukan distribusi pendekatan dari X n 2. Misalkan Y1 menunjukkan statistik urutan pertama dari sampel acak berukuran n yang berasal dari distribusi dengan fungsi kepadatan peluang berbentuk: f ( x ) = e( x ) ; < x < = 0 ; lainnya Jika Zn = n(Y1 ), maka tentukan distribusi pendekatan dari Zn 3. Misalkan X1 , X2 , ..., Xn merupakan sebuah sampel acak berukuran n dari distribusi yang mempunyai fungsi kepadatan peluang berbentuk: f (x) =
e x x 1 ()
=
Jika X n = berlaku:
1 n
n( X n ) N (0, 1) ( X n )1/2
dalam distribusi. 4. Jika variabel random acak Zn berdistribusi Poisson dengan parameter = n, maka perlihatkan bahwa distribusi pendekatan dari vari abel random acak Yn = ( Zn n)/ n adalah distribuai normal dengan rerata 0 dan variansi 1
Bab 1. Distribusi Pendekatan
23
ISBN 978-602-8310-02-4
5. Misalkan Xn menunjukkan rerata dari sampel acak berukuran n dari distribusi Poisson dengan parameter = 1. Perlihatkan bahwa fungsi pembangkit momen dari:
Yn =
n ( Xn ) / =
n ( Xn 1)
6. Untuk soal nomer 5, selidiki distribusi pendekatan dari Yn untuk n . Petunjuk: Uraikan et/ n dengan menggunakan perluasan deret maclaurin 7. Misalkan Xn menunjukkan rerata dari sampel acak berukuran n dari distribusi dengan fungsi kepadatan peluang berbentuk f ( x ) = e x ; x > 0 = 0 ; lainnya (a) Perlihatkan bahwa fungsi pembangkit momen dari: n( Xn 1) sama dengan m(t,n) Yn = t/n n n t / (t n)e ]0 ; t < n [e (b) Tentukan distribusi dari Yn untuk n 8. Misalkan Xn menunjukkan rerata dari sampel acak berukuran 15 dari distribusi dengan fungsi kepadatan peluang berbentuk: f ( x ) = 3 x2 ; 0 < x < 1 = 0 ; lainnya
4 Hitung secara pendekatan P( 3 5 < X < 5) 2 menunjukkan variansi dari sampel acak berukuran n 9. Misalkan Sn nS2 dari distribusi N (, 2 ) Buktikan bahwa nn 1 konvergen stokastik ke - 2
24
ISBN 978-602-8310-02-4
10. Misalkan X1 , X2 , ..., X10 adalah barisan peubah acak yang saling bebas dan berdistribusi identik dengan rerata dan variansi. Perlihatkan bahwa: p 6 (b) n(n+1)( n i . Xi p 2n +1) i =1 (a)
2 n i . Xi n ( n +1) i =1
25
ISBN 978-602-8310-02-4
26
ISBN 978-602-8310-02-4
Memahami konsep dasar konvergensi barisan variabel random dan mampu menerapkan dalam penentuan distribusi pendekatan khususnya, dan dalam pemecahan masalah matematika, ilmu lain dan dalam kehidupan sehari-hari pada umumnya.
2.2
1. Menjelaskan konsep dasar konvergensi stokasitik barisan variabel random 2. Menganalisis jenis-jenis konvergensi stokastik barisan variabel random 3. Menurunkan teorema-teorema dan sifat-sifat konvergensi barisan variabel random, seperti konvergen dalam distribusi, konvergen dalam probabilitas, konvergen dalam kwadrat rataan,dan lain-lain. 4. Menggunakan teorema dan sifat-sifat konvergensi barisan variabel random untuk menentukan distribusi pendekatan suatu variabel random 27
2.3
2.3.1
Uraian Materi
Konsep Dasar Variabel Random
Sebelum membahas tentang konvergensi barisan variabel random, kita paparkan dulu konsep variabel random, konsep fungsi, kejadian-kejadian yang dihasilkan dari variabel random, dan beberapa contoh-contoh konkret tentang variabel random. Bagi pembaca yang cukup familiar dengan konsep varibel random, dipersilakan untuk melewatinya, dan langsung menuju, ke sub bab, tentang konsep konvergensi barisan variabel random. Random Variable sering diterjemahkan menjadi variabel random atau peubah acak. Untuk selanjunya demi alasan konsistensi akan digunakan istilah variabel random. Secara intutif, variabel random dapat dipandang sebagai bilangan x ( )yang dihubungkan dengan suatu kejadian dari suatu percobaan random. Bilangan ini, misalnya dapat berupa angka kemenangan dalam permainan judi, angka voltage dari naik-turunnya tegangan listrik, angka lama hidup suatu bola lampu, atau sembarang bilangan hasil pengamatan pada percobaan random1 . Denisi Diberikan ruang probabilitas (, A, P), dengan , A, P masing-masing menyatakan ruang sampel, ruang kejadian dan probabilitas. Variabel random X didenisikan sebagai fungsi dari (domain) ke bilangan real. Ditulis: X : R
Jadi variabel random merupakan fungsi dengan domain berupa ruang sampel dan kodomain bilangan real.
percobaan random digunakan untuk menggambarkan proses atau prosedur yang hasilnya tak dapat diprediksi secara pasti. Misalnya percobaan melantunkan sebuah mata uang. Hasilnya umumnya dinyatakan sebagai data, misalnya dinyatakan sebagai {Angka,Gambar} atau mungkin sebagai {0,1}. Jadi data tersebut dapat berupa data numerik (bilangan) maupun katagorik.
1 Istilah
28
ISBN 978-602-8310-02-4
2.3.2
Masalah fundamental dalam teori kemungkinan adalah bagaimana menentukan konvergensi (sifat asimptotik) dari variabel random. Kita mulai dengan mencermati masalah sederhana berikut. Misalkan akan diukur panjang suatu benda, katakanlah panjangnya m(dalam hal ini dapat dipandang sebagai parameter yang tak diketahui). Mengingat pengukuran bersifat tidak akurat, maka hasil pengukuran panjang benda tersebut dapat dinyatakan dengan variabel random berikut.
x = m+v dengan v merupakan galat (kesalahan). Jika tak ada kesalahan sistematik yang disengaja, maka v juga merupakan variabel random dengan rataan 0 atau E(v) = 0. Jika deviasi dari v relatif kecil dibandingkan m, maka x() dari pengukuran tersebut cukup baik untuk m. Dalam konteks ini, dapat dikatakan bahwa rataan dari random variabel x adalah m dan variannya 2 . Hal ini dapat dinyatakan dalam bentuk pertidaksamaan Tchebycheff sbb: 2 (2.1) P(| x m| < ) > 1 2 Jika varian x relatif kecil dibanding atau maka probabilitas | x m| < akan menuju 1,atau P(| x m| < ) 1. Hal ini berarti bahwa suatu hasil pengamatan terhadap panjang benda m tersebut hampir pasti (almost certainly) terletak antara m dan m + . Akibatnya parameter m terletak antara x() dan x() + . Untuk meningkatkan keakuratan hasil pengukuran terhadap m tersebut dapat dilakukan dengan mengulang pengukuran tersebut, misalnya n kali. Hasil-hasil pengukuran tersebut dapat dinyatakan dalam bentuk ba = risan variabel random Xn = (x1 , x2 , ..., xn ), dengan rata-rata sampel x n i =1 ( x1 + x2 + ... + xn ), juga merupakan variabel random dengan rata2 2 rata m dan varian n.m2 maka nilai n . Jika n cukup besar sehingga ( ) merupakan estimasi yang baik untuk parameter (yang tak diketahui) x
Bab 2. Konvergensi Variabel Random
29
ISBN 978-602-8310-02-4
m. Contoh: Masih berkaitan dengan masalah di atas, tentukanlah probabilitas bahwa x terletak antara 0, 9.m dan 1, 1.m, jika diestimasi dengan variabel random 2 x dan dengan mengasumsikan n cukup besar sedemikian sehingga m.2n = 104 . Jawab: Dengan menggunakan ketidaksamaan Tchebycheff didapat:
< 1.1.m) = P(0, 1.m < x m < 0, 1.m) P(0, 9.m < x 2 m| < 0, 1.m > 1 2 , dengan = 0, 1.m P(|x 104 .m2 m | < = 1 2 P(|x 10 n.m2 1 = 1 100n Dari hasil ini didapat, misalnya untuk n = 10,maka probabilitas x terletak antara 0, 9.m dan 1, 1.m adalah 0,999 Untuk selanjutnya masalah konvergensi variabel random dapat dirumuskan sebagai berikut. Misalkan X1 , X2 , ... Xn barisan variabel random dengan distribusi bersama yang terletak pada ruang sampel yang sama dan X variabel random yang lain yang juga terletak pada ruang sampel . Selanjutnya masalah dapat dirumuskan menjadi: Bagaimana jenis dan sifat konvergensi dari barisan variabel random Xn tersebut?.
2.3.3
2.3.3.1 Denisi
Misalnya X1 , X2 , ..., Xn adalah barisan variabel random yang didenisikan atas ruang sampel yang sama S. Jika Fn ( x ) fungsi distribusi dari variabel
Bab 2. Konvergensi Variabel Random
30
ISBN 978-602-8310-02-4
random Xn , kita katakan Xn konvergen ke X dalam distribusi dan ditulis Xn X jika ada fungsi distribusi dari X sehingga
n d
lim Fn ( x ) = F ( x )
(2.2)
untuk setiap titik x dimana F(x) kontinu. Xn konvergen ke X dalam distribusi juga dikatakan Xn mempunyai limit distribusi dengan fungsi distribusi F ( x ). Teorema Kekontinuan Levy : Misal Yn variabel random dengan fungsi distribusi Fn (y) dan Mn (y) ada untuk t . Jika F (y) fungsi distribusi yang bersesuaian dengan M(t) sehingga Mn (t) M(t) maka Yn Y . Catatan : Limn {1 + b/n + (n)/n}cn = ebc , jika (n) = 0 Teorema Limit Pusat Jika X1 , X2 , ..., Xn (, 2 ), > 0 maka Yn = Y N (0, 1) Bukti Dalam pembuktian berikut, diasumsikan fpm dari x ada. Misal fpm dari X dan X adalah M(t) dan m(t) maka m(t) = E(et(X ) ) = et M(t) juga ada. Karena m(t) merupakan f pm dari X maka m(0) = 1, m (0) = E( X ) = 0, m (0) = E( X )2 = 2 . Menurut teorema Taylor, ada bilangan antara 0 dan t sehingga m(t) = m(0)+ m (0)t+ m ()t2 /2 = 1 + m ()t2 /2. Di ruas kanan ditambah dan dikurangkan dengan 2 t2 /2 maka m(t) = 1 + 2 t2 /2 +
Bab 2. Konvergensi Variabel Random
d
(2.3)
n( X n )/ Y , dimana
m ( ) 2 t2 . 2 ISBN 978-602-8310-02-4
31
i =1
Xi n
/ n
= =
Menurut di atas diperoleh: m dengan 0 < <
t
= 1+
m ( ) 2 t2 t2 + 2n 2n 2
(2.7)
Mn ( t ) =
(2.8)
32
f ( x )dx
FYn (yn ) =
f ( x )dx +
0 0dx + yn
= =
Untuk yn ,
FYn (yn ) =
f ( x )dx +
f ( x )dx +
yn 0
f ( x )dx
n
=
Jadi
yn 0 yn 1 dx + 0 dx + 0
0dx
=1
FYn (yn ) = = =
0
yn n
; yn < 0 ; 0 yn < yn n ;
Limn FYn (yn ) = 0 ; yn < 0 = 1 ; yn Karena didapat Limn FYn (yn ) = F (z), dengan F (z) adalah fungsi distribusi dari Z. Jadi Yn d Z
Bab 2. Konvergensi Variabel Random
33
ISBN 978-602-8310-02-4
Jelaslah bahwa lim Fn ( x ) = 0 = F ( x ) , karena F ( x ) = 0, X bukan n fungsi distribungsi maka Xn tidak konvergen dalam distribusi. Contoh Diketahui fungsi distribusi dari variabel random x n sbb:
x
Fn ( x ) =
enw
2/2
dw
(2.10)
nw, sehingga
nx
2 1 ev /2 dv 2
Fn ( x ) = dan
(2.11)
<0 0, x 1 Fn ( x ) = =0 2, x 1, x>0
F(x) =
0, x < 0 1, x < 0
(2.12)
lim Fn ( x ) = F ( x )
(2.13)
Jadi variabel random x n mempunyai limit distribusi dengan fungsi distribusi F ( x ) atau x n x.
Bab 2. Konvergensi Variabel Random
d
34
ISBN 978-602-8310-02-4
diperoleh lim f n ( x ) = 0, untuk setiap x. Karena f ( x ) = 0 bukan n merupakan fkp, maka f n ( x ) tidak konvergen ke suatu fkp. Tetapi Fn ( x ) = dan
n
0; x < 2 + 1; x 2 +
1 n 1 n
(2.14)
lim Fn ( x ) = F ( x ) =
0; x < 2 1; x 2
(2.15)
d
Karena lim Fn ( x ) = F ( x ) di setiap titik kontinu dari F ( x ) maka xn n x. Ini berarti limit distribusi tidak dapat ditentukan oleh fkp.
2.3.3.2
Misalkan Fn (y) menunjukkan fungsi distribusi dari variabel random Yn yang distribusinya bergantung pada n bilangan bulat positif. Jika c sebuah konstanta yang tidak bergantung pasa n, maka Yn dikatakan konvergen stokastik ke-c jika dan hanya jika untuk setiap > 0 berlaku: Limn P [|Yn c| < ] = 1 Konvergen stokastik ke parameternya atau ke suatu konstanta, sering dinyatakan sebagai konvergen dalam peluang. De f inisi Misalkan Z1 , Z2 , ..., Zn adalah barisan variabel random yang didenisikan atas ruang sampel S. Misalkan pula Z adalah variabel random lain yang didenisikan atas ruang sampel S. Kita katakan Zn konvergen ke-Z dalam
Bab 2. Konvergensi Variabel Random
35
ISBN 978-602-8310-02-4
peluang (ditulis Zn Z), jika untuk setiap > 0 berlaku: Limn P [| Zn Z | ] = 0 Karena P {| Zn Z | } + P {| Zn Z | < } = 1 maka P {| Zn Z | } 0 P {| Zn Z | < } 1 (2.17) (2.16)
Penyelesaian masalah konvergen dalam peluang digunakan ketidaksamaan Chebysev, yaitu: P [| X x | k x ] atau P [| X x | < k x ] 1 1 k2 1 k2
Berikut ini adalah langkah-langkah untuk penentuan konvergen stokastik, sbb: 1. Gunakan ketidaksamaan Chebyshev seperti yang dirumuskan di atas 2. Tentukan rerata dan variansi dari statistiknya. 3. Substitusikan nilai rerata dan variansi tersebut ke dalam ketidaksamaan Chebyshev 4. Lakukan modikasi terhadap nilai di dalam harga mutlaknya, sedemikian hingga nilai tersebut sesuai dengan yang diharapkan. 5. Misalkan k x = dengan x sudah disubstitusikan dan diperoleh nilai k. Kemudian tentukan nilai k2 . 6. Beri limit untuk n pada kedua ruasnya.
Bab 2. Konvergensi Variabel Random
36
ISBN 978-602-8310-02-4
Contoh Misalkan X1 , X2 , ..., Xn adalah sebuah sampel acak dari distribusi eksponensial dengan fungsi kepadatan peluang berbentuk:
1 x / e ; x>0 f (x) = Perlihatkan bahwa x konvergen stokastik = 0 ; lainnya ke-.
[ X1 + X2 + ... + Xn ] , maka
E
1 n 1 n
(i )
E (x) E (x)
= = =
[ X1 + X2 + ... + Xn ]
[ E ( X1 ) + E ( X2 ) + ... + E ( Xn )] 1 n ( + ... + ) =
Var
1 n
(ii ) Var ( x ) =
[ X1 + X2 + ... + Xn ]
1 X k 2 k n
= =
n 2 n 2
Dengan demikian X konvergen stokastik ke-. Contoh Misalkan barisan variabel random ( X1 , X2 , ..., Xn ) (, 2 ). Tunp jukkan apakah Xn ?
Bab 2. Konvergensi Variabel Random
37
ISBN 978-602-8310-02-4
P {| Xn | } = P | Xn | k / n
(2.18)
dengan k = n/. Dengan menggunakan ketaksamaan Chebyshev diperoleh (2.19) P | Xn | k / n 1/k2 = 2 /(n2 )
P {| Xn | } 0; jika 2 nit dan n Karena > 0; P {| Xn | } 0 maka Xn Catatan Syarat lim P(|Yn c| < ) = 1 sering digunakan sebagai den nisi konvergen dalam probabilitas dan orang mengatakan bahwa Yn konvergen ke c dalam probabilitas. Tipe konvergen yang terkuat diberikan oleh P( lim Yn = c) = 1. Dalam kasus ini kita katakan Yn n konvergen ke c dengan probabilitas 1. Sehubungan dengan ini, mean sampel X n konvergen dengan probabilitas 1 ke mean dari suatu distribusi. Hal ini disebut hukum kuat dari bilangan besar
p
(2.20)
2.3.4
Berikut ini adalah beberapa sifat-sifat penting konvergensi variabel random, yang sering digunakan dalam menentukan distribusi pendekatan. 1. Misalkan Fn (u) menunjukkan fungsi distribusi dari variabel random Un yang distribusinya bergantung pada bilangan bulat positif n. Jika n Un konvergen stokastik ke-c (c = 0), maka U c konvergen stokastik ke-1. 2. Misalkan Fn (u) menunjukkan fungsi distribusi dari variabel random Un yang distribusinya bergantung pada bilangan bulat positif n. Kemudian Un konvergen stokastik ke-c, c > 0) dan P(Un < 0) = 0untuk setiap n. Dalam hal ini, Un konvergen stokastik ke- c.
Bab 2. Konvergensi Variabel Random
38
ISBN 978-602-8310-02-4
3. Jika variabel random Un dan Vn konvergen stokastik masing-masing ke konstanta c dan d, maka: (a) variabel random Un Vn konvergen stokastik ke konstanta cd (b) variabel random gan d = 0
Un Vn
Contoh Misalkan variabel random Yn berdistribusi b(n, p), dengan 0 < p < Y np 1. Jika Un = n ,maka:
np(1 p)
4. Perlihatkan bahwa 1
Penyelesaian : Fungsi pembangkit momen dari Yn adalah: MYn (t) = ((1 p) + pet )n 1. Fungsi pembangkit momen dari Un adalah: M ( t; n ) = MUn (t) = E etUn E e e e
t t
= = = = = = =
Bab 2. Konvergensi Variabel Random
Y np t n
np 1 p np 1 p
E e
t
np 1 p
MYn
(1 p) + pe
np 1 p
t np(1 p) t
n n
np(1 p) np 1 p
(1 p ) e
t n
+ pe
p n (1 p )
t t np(1 p) n
(1 p ) e (1 p ) e
39
+ pe
ttp
np(1 p) 1 p np
p n (1 p )
+ pe
ISBN 978-602-8310-02-4
dan pe
1 p np
menggunakan
(i ) e x = 1 x + (ii )
Jadi: M ( t; n ) = ex = 1 x +
x2 2 x2 2
x3 6 x3 6
+ ...dengan x = t + ...dengan x = t
p n (1 p ) 1 p np
(1 p ) 1 t
p
1t pt
p t3 p p t2 + 2n (1 + ... n (1 p ) p ) 6n (1 p ) n (1 p ) n 1 p t2 (1 p ) t3 (1 p ) 1 p 1 + t np + 2np + 6np + ... np p p t2 p t3 p + 2n(1 p) 6n(1 p) n(1 p) + ... p+ n (1 p ) 2 2 t3 p2 p p + 2nt(1p ... + p+ n (1 p ) p ) 6n (1 p ) n (1 p ) n 1 p t2 (1 p ) t3 (1 p ) 1 p pt np + 2n + 6n + ... np
suku-suku
yang
mengandung
(i )
pt
p n (1 p )
p n (1 p )
+ pt
1 p np
= (ii ) (iii )
2 2 t2 p t2 (1 p ) 2nt(1p 2n 2n (1 p ) p) + p t3 p2 t3 p 6n(1 p) n(1 p) + 6n(1 p) n(1p p)
= + =
Sehingga: M ( t; n ) = 1 t (1 2 p ) 1+
t2 2n p n (1 p )
t2 2n
t3 (2 p 1) 6n np(1 p) t3 (2 p 1) 6n np(1 p)
+ ...
n
t (1 2 p )
p n (1 p )
+ ...
40
ISBN 978-602-8310-02-4
Limn M (t; n) =
= Limn 1 +
t2 2n
t (1 2 p )
t2
p n (1 p )
2
t3 (2 p 1) 6n np(1 p)
+ ...
t = Limn 1 + 2 n
Limn M(t; n) = e 2 Ternyata bentuk di atas merupakan fungsi pembangkit momen dari disribusi normal standar. Jadi distribusi pendekatan dari Un adalah N (0; 1) 2. konvergen stokastik ke- p Untuk menyelesaikannya akan digunakan ketidaksamaan Chebyshev, yaitu: P [|Yn Yn | < k Yn ] 1 Karena Yn berdistribusi b(n; p), maka: Yn = np 2 Y = np(1 p) n atau Yn = np(1 p) Jadi: P |Yn np| < k P P Misalkan: = k Sehingga: Yn p (1 p ) p < 1 n n 2 n Yn p n np(1 p) 1 1 k2 1 k2 1 k2
Yn n
<k
np(1 p) 1 np(1 p) 1
n 2 1 p
Yn p <k n
p (1 p ) n
1 k2
dan k2 =
P Limn P
Jadi
Yn n
Yn konvergen stokastik ke-1 3. Variabel random np Untuk menyelesaikannya akan digunakan ketidaksamaan Chebyshev, yaitu:
1 k2 1 k2 1 k2
np(1 p) 1
<k <k
np(1 p) 1 1 p np
P Misalkan : = k Sehingga :
1 k2
dan k2 =
np2 1 p
P Limn P Jadi
Yn n konvergen
Yn 1 np Yn 1 np
< 1
1 p np2 1 p =1 np2
< Limn 1
stokastik ke-1
n 4. Variabel random 1 Y n konvergen stokastik ke-(1 p ) Untuk menyelesaikannya akan digunakan ketidaksamaan Chebyshev, yaitu
1 k2 1 k2 1 k2
np(1 p) 1
<k
42
np(1 p) 1
ISBN 978-602-8310-02-4
Yn p np
<k
p (1 p ) n
1 k2 1 k2 1 k2
Yn +11 p np 1
<k
p (1 p ) n p (1 p ) n
Yn (1 p ) < k np
p (1 p ) dan k2 n
n 2 p (1 p )
1 1
Yn p (1 p ) (1 p ) < 1 np n 2
Limn P Jadi 1
Yn np
2.4
f (x) =
(2.21)
Misalkan dibentuk variabel random Yn = max( X1 , X2 , ...,Xn ), Tunw d jukkan apakah Fn F, dan Yn Y untuk suatu variabel random Y! Jawab:
Bab 2. Konvergensi Variabel Random
43
ISBN 978-602-8310-02-4
Karena f ( x ) = 1 untuk 0 < x < maka per denisi fungsi distribusi variabel random X didapat sbb: FX ( x ) = P( X x )
x
=
0
1 x dt = , 0 < x <
(2.22)
Mengingat Yn adalah maksimum dari barisan variabel random X1 , X2 , ... Xn yang i.i.d, maka fungsi distribusi variabel random Yn didapat dengan sbb:
FYn (y) =
(2.23)
0, 0 < y < 1, y
= FY (y)
dengan FY (y) merupakan suatu fungsi distribusi. Jadi dapat disimpulkan bahwa: FYn w FY (y) dan Yn d Y , dimana Y adalah variabel random dengan distribusi FY (y).
Bab 2. Konvergensi Variabel Random
44
ISBN 978-602-8310-02-4
2. Diketahui {Yn } barisan variabel random dengan fungsi massa peluang (fmp). P {Yn = n} = 1; n = 1, 2, ... Selidiki apakah Yn konvergen dalam distribusi ke suatu variabel random? Jawab : Perhatikan bahwa, Mn (t) = E(etYn ) = etn P(Yn = n) = etn . Sehingga jika n diperoleh 0; t > 0 Mn ( t ) n M ( t ) = 1; t = 0 ; t < 0 Karena ada t sehingga M (t) = , maka M(t) bukan fpm. Misal Fn (y) fungsi distribusi yang berkaitan dengan Yn , maka 0; y < n 1; y n
Fn (y) =
Jadi Fn (y) F (y) = 1, y dengan F (y) bukan fungsi distribusi sehingga Yn tidak konvergen ke suatu fungsi distribusi. 3. Diketahui Xn dengan fmp P { Xn = 1} = 1/n, P { Xn = 0} = 1 1/n. Tunjukkan bahwa Xn X Jawab : Perhatikan bahwa, Mn (t) = 1/net + (1 1/n) ada t . Mn (t) 1. Jadi M(t) = 1 adalah fpm dari variabel random x yang degenerate di x = 0. Menurut teorema di atas maka Xn X 4. Diketahui Yn B(n, p) maka = np dan p = /n. Apakah Yn Y ?
d d d
Jawab
Bab 2. Konvergensi Variabel Random
45
ISBN 978-602-8310-02-4
Mn (t) = E(etYn )
= = = =
Yn =0 n Yn =0 t
etYn n Yn
(1 p)nYn
pe + (1 p) 1+ ( e t 1) n
Jadi Mn (t) (et 1) ; t. Karena ada distribusi poisson dengan mean mempunyai fpm (et 1) maka menurut teorema di atas Yn Y . 5. Diketahui Zn 2 (n). maka fpm dari Zn adalah(1 2t)n/2 ; t < 1/2. Mean dan variansi dari Zn adalah n dan 2n. Tentukan li mit distribusi dari Yn = ( Zn n)/ 2n Jawab : fpm dari Yn = E(etyn ) = tn/ 2n e[t((Zn n)/
2n
2n
2n ) ]
(2.29) (2.30)
= e = e =
E(etzn /
)
n/2
[(t
e
t
t 2/n) n 2 ] 12
; t < ( 2n)/2
;t < n 2
(2.31) (2.32)
2 t 2 e n n
n/2
Menurut teorema Taylor ada bilangan (n) antara 0 dan t 2/n sehingga
et
= 1+t
2 + 1/2(t n 46
2 2 ) + 1/6e(n) (t n
2 3 ) n
(2.33)
ISBN 978-602-8310-02-4
= (1
t2 (n) n/2 + ) n n
(2.34)
(n) = akibatnya
(2.35)
; t
(2.36)
Jadi Yn Y dengan Y N (0, 1) 6. Diketahui X = mean sampel random berukuran 75 dari distribusi dengan fkp 1; 0 < x < 1 f (x) = (2.37) 0; yang lain Hitung P 0, 45 < X < 0, 55 Jawab E( X ) = 1/2 dan E( X 2 ) = 1/3 maka = 1/2 dan 2 = 1/12. P 0, 45 < X < 0, 55 = P( n(0, 45 )/ < n( X )/ < n(0, 55 )/ = 0, 866. 7. Jika
Karena kedua suku diruas kanan mendekati 0 untuk n , maka diperoleh > 0 P {| Xn + Yn ( a + b)| } 0. Jadi Xn + Yn ( a + b)|
2 gunakan
ketaksamaan segitiga
47
ISBN 978-602-8310-02-4
8. Diketahui Yn B(n, p), 0 < p < 1. Tentukan limit distribusi dari Yn np n(Yn /n)(1 Yn /n) Jawab : Perhatikan bahwa, menurut TLP Un =
p
Yn np np(1 p)
p
N (0, 1)
p
(2.38)
1/2
(2.39)
N (0, 1)
(2.40)
2 mean dan variabel sampel random yang ber9. Diketahui X n dan Sn ukuran n dari distribusi N (, 2 ), 2 > 0. Tentukan limit distribusi dari Wn = X n /Sn .
Jawab :
2 berturut-turut konvergen dalam Telah dibuktikan bahwa X n dan Sn probabilitas ke dan 2 . Menurut teorema, Sn konvergen dalam probabilitas ke dan menurut teorema 1, Sn / konvergen ke 1. Menurut teorema variabel random Wn = X n /Sn mempunyai limit disp tribusi yang sama dengan X n . Jadi Wn .
2.5
Soal-Soal Latihan
48
ISBN 978-602-8310-02-4
(a) Xn konvergen ke X dalam distribusi (ditulis Xn X (b) Xn konvergen ke X dalam probabilitas (ditulis Xn X ) 2. Misalkan x n mean sampel random yang berukuran n dari distribusi N (, 2 ). Tentukan limit distribusi dari x n 3. Misalkan Y1 statistik terurut pertama dari sampel random yang berukuran n dari distribusi yang mempunyai f.k.p f ( x ) = e( x ) , < x < dan bernilai 0 untuk x yang lain. Jika Zn = n(Y1 ), tentukan limit distribusi dari Zn . 4. Diketahui f.k.p dari Yn adalah f n (y) = 1; y = n 0; y = n (2.41)
p
Perlihatkan bahwa Yn tidak mempunyai limit distribusi. 5. Diketahui X1 , X2 , ..., Xn sampel random yang berukuran n dari distribusi N (, 2 ) dengan > 0. Perlihatkan bahwa Zn = mempunyai limit distribusi.
i =1 n
Xi tidak
6. Diketahui Xn G (n, ), dengan bukan fungsi dari n. Tentukan limit distribusi dari Yn = Xn /n 7. Diketahui Zn 2 (n) dan Wn = Zn /n2 . Tentukan limit distribusi dari Wn . 8. Buktikan teorema kekontinuan Levy; Misal Yn variabel random dengan fungsi distribusi Fn (y) dan Mn (t) ada untuk t . Jika F (y) fungsi distribusi ysng bersesuaian dengan M(t) sedemikian sehingga Mn (t) M(t) maka Yn Y 9. Buktikan teorema limit pusat berikut: Jika X1 , ..., Xn (, 2 ), > 0 d maka Yn = n( X n )/ Y dimana Y N (0, 1). 10. Diketahui variabel random Yn mempunyai distribusi B(n, p).
Bab 2. Konvergensi Variabel Random
d
49
ISBN 978-602-8310-02-4
(a) Buktikan bahwa Yn /n konvergen dalam probabilitas ke p. (Hal ini merupakan suatu bentuk hukum lemah dari bilangan besar). (b) Buktikan bahwa1 Yn /n konvergen dalam probabilitas ke 1 p
2 variansi sampel yang berukuran n dari distribusi 11. Misalkan Sn 2 / ( n 1) konvergen dalam probabiN (, 2 ). Buktikan bahwa nSn litas ke 2 .
12. Diketahui Wn variabel random dengan mean dan varians nbp dengan p > 0, dan b konstanta (bukan fungsi dari n). Buktikan bahwa Wn konvergen dalam probabilitas ke . (petunjuk gunakan ketaksamaan Chebyshev). 13. Misalkan Yn menyatakan statistik terurut ke-n dari sampel random berukuran n dari distribusi uniform pada interval (0, ). Buktikan bahwa Zn = Yn konvergen dalam probabilitas ke . 14. Diketahui X n G (, 1). Buktikan bahwa limit distribusi )/ X n adalah N (0, 1)
n( X n
15. Misal Y1 , ..., Yn dan X1 , ..., Xn dua sampel random yang independen dengan mean 1 dan 2 dan variansi bersama 2 . Tentukan limit distribusi dari (Y n X n ) ( 1 2 ) (2.42) 2 n (Petunjuk : misalkan Z n =
i =1
Zi /n dengan Zi = Yi - Xi
16. Diketahui Xn berdistribusi gamma dengan parameter = n dan , dengan bukan fungsi dari n. Jika Yn = Xn /n, tentukan limit distribusi dari Yn . 17. Diketahui Zn berdistribusi 2 (n) dan Wn = Zn /n2 . Tentukan limit distribusi dari Wn . 18. Misalkan Z berdistribusi 2 (50). Tentukan P(40 < x < 60)
Bab 2. Konvergensi Variabel Random
50
ISBN 978-602-8310-02-4
19. Misalkan P = 0, 95 probabilitas bahwa seorang laki-laki dalam suatu grup hidup paling sedikit 5 tahun. Jika kita observasi 60 orang lakilaki dan jika diasumsikan independen, tentukan probabilitas bahwa paling sedikit 56 dari mereka hidup 5 tahun atau lebih. 20. Diketahui variabel random Zn mempunyai distribusi poisson dengan parameter = n. Perlihatkan bahwa limit distribusi dari vari abel random Yn = ( Zn n)/ n N (0, 1) 21. Diketahui X n mean dari sampel random berukuran n dari distribusi poisson dengan parameter = 1.
(a) Buktikan bahwa fungsi pembangit moment dari Yn = n( X n )/ = n( X n 1) adalah exp t n + n(et/ n 1)
(b) Ekspansikan et/ n kedalam deret Maclaurin, kemudian tentukan limit distribusi dari Yn 22. Diketahui X mean sampel random berukuran 100 dari distribusi 2 (50). Hitunglah P(49 < X < 51) 23. Diketahui Y B(72, 1/3). Hitung P(22 Y 28) 24. Diketahui X adalah mean sampel random berukuran 15 dari dis3 x2 ; 0 < x < 1 tribusi yang mempunyai fkp f ( x ) = Tentukan 0, yang lain P(3/5 < X < 4/5) 25. Diketahui Y B(n; 0, 55). Tentukan nilai n terkecil sehingga P(Y /n > 1/2) 0, 95.
51
ISBN 978-602-8310-02-4
52
ISBN 978-602-8310-02-4
Memahami konsep dasar estimasi titik dan mampu menerapkannya, baik dalam pemecahan masalah matematika, ilmu lain maupun dalam kehidupan sehari-hari
3.2
Setelah mengerjakan bab ini mahasiswa diharapkan dapat: 1. Menjelaskan azas reduksi data dalam distribusi sampling 2. Menganalisis apakah suatu statistik merupakan statistik cukup 3. Menjelaskan prinsip dasar estimasi titik 4. Menentukan sifat-sifat estimator titik 5. Menggunakan ketaksamaan Cramer-Rao untuk menentukan estimator dengan varian minimum uniform (UMVUE) 6. Menentukan estimator suatu parameter dengan metode momen 53
3.3
3.3.1
Uraian Materi
Prinsip Reduksi Data
Seperti dijelaskan pada bab sebelumnya, informasi dalam sampel x1 , ..., xn akan digunakan untuk melakukan inferensi tentang parameter . Namun pada umumnya data-data yang terobservasi dari sampel x1, x2 , ..., xn adalah daftar bilangan yang sulit untuk diinterpretasikan secara lengkap. Dengan kata lain, interpretasi data secara realistik biasanya dilakukan dengan prinsip reduksi. Masalahnya adalah seberapa jauh reduksi itu valid, sehingga tetap menghasilkan inferensi yang akurat terhadap nilai parameter-parameter populasi. Misalnya fungsi terukur T ( x ) adalah statistik yang mendenisikan bentuk reduksi data, artinya dalam melakukan inferensi yang digunakan hanya T ( x ), bukan keseluruhan sampel terobservasi x. Dua data sampel x dan y akan diperlakukan sama asalkan T ( x ) = T (y).
3.3.1.1
Azas Kecukupan
Azas kecukupan (the sufciency principle) menyatakan bahwa statistik cukup (A suffcient statistic) untuk parameter adalah statistik yang bisa menyerap sejumlah informasi tentang yang termuat dalam sampel. Setiap informasi tambahan dalam sampel, di samping harga statistik cukup, tidak memuat informasi tambahan tentang . Pertimbangan-pertimbangan di atas akan membawa pada teknik reduksi data yang dikenal sebagai azas kecukupan. De f inisi
Bab 3. Estimasi Titik
54
ISBN 978-602-8310-02-4
T ( x ) adalah statistik cukup untuk , jika setiap inferensi tentang hanya tergantung pada sampel x, yaitu hanya melalui harga T ( x ). Artinya jika x dan y adalah dua titik sampel sedemikian hingga T ( x ) = T (y), maka inferensi tentang harus sama, tidak tergantung apakah X = x atau Y = y yang terobservasi.
Teorema Bila f ( x | ) adalah densitas dari x dan q(t | ) adalah densitas dari T ( x ), maka T ( x ) adalah statistik cukup untuk jhj untuk setiap x dalam ruang sampel, rasio f ( x | )/q( T ( x ) | ) tidak tergantung pada . Catatan : P ( X = x | T ( X ) = t( x )) = P ( X = x dan T ( x ) = t( x )) P ( T ( x ) = t( x )) P ( X = x dan T ( x ) = t( x )) = P ( T ( x ) = t( x )) (3.1)
= =
P ( X = x ) P ( T ( X ) = t( x ) f (x | ) q( T ( x ))
Contoh
Misalkan Xi , ..., Xn adalah variabel random i.i.d berdistribusi Bernoulli dengan parameter , 0 < < 1. Akan ditunjukkan bahwa T ( X ) = Xi + ... + Xn adalah statistik cukup untuk . Perhatikan bahwa T ( X ) merupakan jumlah harga-harga Xi sedemikian sehingga T ( X ) mempunyai ditribusi Binomial (n, ), sehingga:
Bab 3. Estimasi Titik
55
ISBN 978-602-8310-02-4
xi )
n i
(3.2)
xi n
( 1 ) (1 x i )
t (1 ) n t t (1- ) nt
, ( xi = xi )
= = =
t (1 ) n t
n
1
n
1 xi
n
Karena rasio di atas tidak tergantung pada , maka T ( x )adalah statistik cukup untuk .
statistik cukup untuk . Tunjukkan bahwa mean sampel, T ( x )= X + xn = x1 +... adalah statistik cukup untuk . n
f (x
(3.3)
i =1
56
ISBN 978-602-8310-02-4
f (x | ) = q( T ( x ) | )
( 2 2 )
n/2
= n
1/2
(2 )
exp(
i =1
yang tidak tergantung pada . Dengan menggunakan teorema sebelumnya, maka mean sampel adalah statistik cukup untuk . Dengan menggunakan denisi, pertama-tama kita harus menduga mana statistik T ( x ) yang merupakan statistik cukup, kemudian menentukan densitas dari T ( x ) dan menyelidiki apakah rasio densitas x dan densitas T ( x ) tidak memuat . Cara tersebut memang kurang praktis.
3.3.1.2
Misalkan f ( x | ) adalah densitas bersama dari sampel X . T ( X )adalah statistik cukup untuk jhj terdapat fungsi g(t| ) dan h( x ) sedemikian hingga untuk semua titik sampel x dan semua parameter berlaku;
f ( x | ) = g ( T ( x )| ) h( x )) Bukti :
(3.5)
Misalkan T ( X ) adalah statistik cukup. Pilih g (t( )) = P0 ( T ( x ) = t) dan h( x ) = P ( X = x | T ( X ) = T ( x )) . Karena T ( X ) statistik cukup, maka distribusi probabilitas yang mendenisikan h( x ) tidak tergantung pada . Jadi, pemilihan h( x )dan g((t( x )) dapat dibenarkan dan untuk pemilihan ini di dapat
Bab 3. Estimasi Titik
57
ISBN 978-602-8310-02-4
f ( x | ) = P ( X x )
(3.6)
= P0 ( X = x dan T ( X ) = T ( x )) = P0 ( T ( X ) = T ( x )) P ( X = x | T ( X ) = T ( x )) = g ( T ( x )| ) h( x )
Sekarang andaikan faktorisasi di atas berlaku. Misalkan q(t| ) adalah densitas dari T ( x ). Untuk menunjukkan bahwa T ( X ) merupakan statistik cukup, kita selidiki rasio f ( x | ) /q ( T ( x )| ) Denisikan
A T ( x ) = { Y : T (Y ) = T ( x ) } maka
(3.7)
(3.8)
= =
Karena rasio ini tidak tergantung pada , maka T ( X ) adalah statistik cukup untuk . Contoh Untuk distribusi normal dalam contoh di atas, dapat dilihat bahwa densitas dapat difaktorkan sebagai:
Bab 3. Estimasi Titik
58
ISBN 978-602-8310-02-4
f ( x | ) = (2 2 )n/2 exp
i =1
exp n( x )2 /2 2 (3.9)
h( x ) = (2 2 )n/2 exp
i =1
(3.10)
dan bentuk ini tidak tergantung pada parameter . Faktorisasi di atas yang memuat tergantung pada sampel x hanya melalui T ( X ) = X . Sehingga didapat g(t | ) = exp n(t )2 /2 2 dan perhatikan bahwa f ( x | ) = h( x ) g ( T ( x ) | ) (3.12) (3.11)
Jadi, dengan menggunakan teorema Faktorisasi; T ( X ) = x adalah statistik cukup untuk . Dalam contoh-contoh di atas, statistik cukup adalah suatu fungsi berharga real dari sampel. Semua informasi tentang dalam sampel disarikan dalm satu bilangan T ( X ). Kadang-kadang informasi tidak dapat disarikan dalam satu bilangan dan sebagai penggantinya diperlukan beberapa bilangan. Untuk keadaan ini, statistik cukup berupa vektor, katakanlah T (X ) =
merupakan vektor, katakanlah = (1 , ..., s ); biasanya r = s, walaupun tidak selalu teorema faktorisasi juga dapat digunakan untuk menentukan statistik cukup bernilai vektor. Contoh
Bab 3. Estimasi Titik
59
ISBN 978-602-8310-02-4
Andaikan kembali bahwa x1 , x2 , ..., xn . adalah i.i.d N (, ) tetapi 2 tidak seperti contoh di muka. Misalkan dan kedua-duanya tidak diketahui, sehingga vektor parameter adalah = (, 2 ). Sekarang, bila menggunakan Teorema Faktorisasi, setiap bagian densitas yang tergantung pada dan 2 harus dimasukkan dalam fungsi g. Terlihat bahwa densitas tergantung pada sampel x hanya melalui T1 ( x ) = X dan
(3.13)
T2 ( x ) = s2
(3.14)
( x i X )2 / ( n 1)
g ( t | ) = g ( t1 , t2 | , 2 )
(3.15)
(3.16)
T(X) =
T 1 ( X ), T 2 ( X )
= ( X , S2 )
(3.17)
adalah statistik cukup untuk (, 2 ) dalam distribusi normal. Untuk keluarga eksponensial, dengan menggunakan Teorema Faktorisasi, penentuan statistik cukup sangat mudah untuk dilakukan.
Bab 3. Estimasi Titik
60
ISBN 978-602-8310-02-4
Contoh Misalkan x1 , x2 , ..., xn . adalah i.i.d dengan densitas f ( x | ). Andaikan f ( x | ) adalah keluarga eksponensial dengan densitas
i =1
Wi ( ) ti ( x )
(3.18)
T(X) =
i =1
t ( X j )...
1
i =1
t (Xj )
k
(3.19)
3.3.2
Estimasi Titik
Kuantitas-kuantitas pada populasi, seperti mean () atau varian (2 ) yang umumnya tak diketahui. Kuantitas tersebut disebut dengan parameter populasi. Karakteristik (distribusi) suatu populasi tergantung pada parameter-parameter ini. Misalnya, distribusi Exponensial P() tergatung pada parameter , distribusi Normal N (, 2 ) tergantung pada 2 parameter mean dan variansi 2 dan distribusi Binomial B(n, p) tergantung pada 2 parameter banyak percobaan n dan peluang sukses dala tiap percobaan p. Secara umum lambang digunakan sebagai lambang parameter populasi, sehingga distribusinya dapat tulis f ( x; ); . Dalam hal ini himpunan disebut ruang parameter dan { f ( x; ); } disebut keluarga parametrik. Jika pada populasi digunakan istilah parameter, maka pada sampel digunakan istilah statistik. Statistik didenisikan sebagai kuantitas-kuantitas 2 masing-masing merupakan statispada sampel. Contohnya; Xn dan Sn tik atau kuantitas (mean dan varian) dari sampel yang berukuran n yang mungkin diambil dari populasi berdistribusi f ( x; ) dengan tidak diketahui.
Bab 3. Estimasi Titik
61
ISBN 978-602-8310-02-4
Dalam contoh ini, untuk mengestimasi parameter , diambil sampel random X1 , ..., Xn . Fungsi T = T ( X1 , ..., Xn ) disebut statistik. Statistik T yang digunakan untuk mengestimasi disebut estimator dari dan ditulis . Estimator adalah suatu variabel random yang mempunyai fungsi probabilitas tertentu yang disebut distribusi sampling. Contoh Misal X1 , ..., Xn sampel random yang diambil dari populasi b(1, p) dengan 1 n p tidak diketahui. Maka X = n i=1 Xi adalah estimator untup p. Estimator yang lain misalnya T = 1/3, T = X1 , dan T = ( X1 + X2 )/2. Perlu diperhatikan bahwa beberapa statistik dapat digunakan sebagai estimator terhadap suatu parameter. Dari sini mucul masalah: Statistik mana yang paling baik, atau misalnya statistik mana yang tak bias, esien, dan konsisten? Ada beberapa jenis estimator penting berdasarkan sifat-sifatnya yang akan dibahas pada bagian ini, yaitu estimator tak bias, estimator konsisten, estimator essien, dan estimator minimum 3.3.2.1 De f inisi Suatu statistik disebut estimator tak bias untuk , jika E( ) = , untuk setiap . Jika E( ) = , maka disebut estimator bias. Contoh Jika X berdistribusi B(n, ), tunjukkan bahwa X /n adalah estimator tak bias untuk ! Jawab Karena E( X ) = n , maka E( X /n) = 1/nE( X ) = 1/n.n = . Jadi = X /n adalah estimator tak bias untuk
Bab 3. Estimasi Titik
62
ISBN 978-602-8310-02-4
Contoh Jika S2 =
1 n 1
i =1
E ( S2 ) = E
1 n ( Xi X ) 2 n 1 i =1
(3.20)
2
= = =
1 E n1 1 n1 1 n1
i =1
( Xi ) ( X )
i =1 n
( Xi )2 nE( X )2 = 2
i =1
2 n. 2 / n
2 = S2 adalah estimator tak bias untuk 2 Jadi Contoh Misal X1 , ..., Xn berdistribusi i.i.d uniform U (0, ). Kita ingin menentukan estimator untuk dengan statistik maksimum. Jadi T = maks( X1 , ..., Xn ) = Xmax = . Terlebih dahulu kita tentukan distribusi dari T. 1 U (0, ) f ( x, ) = ; 0 < x < (3.21)
(3.22)
(3.23)
63
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book Karena identik maka G (t) = [ F (t)]n dengan G (.) dan F (.) berturut-turut fungsi distribusi dari T dan X . Jadi g(t) = dG (t) = n [ F (t)]n1 . f (t) dt (3.24)
(3.25)
E( T ) =
0 0
(3.26)
Karena E( T ) = maka T adalah estimator bias. Tetapi jika dipilih 1 T1 = n+ n Xmax maka T1 adalah estimator tak bias untuk , sebab E ( T1 ) = n +1 n n n +1 =
3.3.2.2
Estimator Konsisten
Sejauh ini estimator yang dibicarakan hanya untuk sampel berhingga. Sebaliknya konsistensi adalah sifat asimptotis, yaitu menggambarkan sifat estimator bila ukuran sampel menjadi tak hingga. Konsistensi adalah sifat dari barisan estimator bukan dari estimator tunggal. Barisan estimator Tn = Tn ( X1 , ..., Xn ) disebut estimator konsisten dari jika untuk setiap > 0 P {| Tn | } 0 (3.27)
Denisi di atas menyatakan bahwa estimator konsisten pasti juga konverBab 3. Estimasi Titik
64
ISBN 978-602-8310-02-4
maka E( Tn )2 0 adalah syarat cukup suatu estimator konsisten. Akibat denisi tadi, bila estimator dari yang memenuhi 1. Tn estimator tak bias 2. Var ( Tn ) 0 maka Tn adalah estimator konsisten Contoh Diketahui X1 , ..., Xn berdistribusi i.i.d N ( , 1). Perlihatkan bahwa X n adalah barisan estimator konsisten. Bukti 1. E( X n ) = 1/n.n = . Jadi X n estimator tak bias untuk 2. Var ( X n ) = 1/n 0. Menurut akibat denisi di depan, maka X n estimator konsisten. 3.3.2.3 Estimator Esien
Berikut ini kita akan membandingkan dua estimator berdasarkan variansi dari estimator tersebut. De f inisi Misalkan 1 dan 2 dua estimator tak bias untuk parameter . Estimator 1 dikatakan lebih esien daripada 2 jika Var (1 ) < Var (2 )
Bab 3. Estimasi Titik
65
Contoh
1 Perhatikan kembali contoh T1 = n+ n Xmax maka T1 adalah estimator tak bias untuk . Dengan transformasi variabel diperoleh distribusi T1
(3.30)
2 E( T1 ) =
(3.31)
(3.32)
Kita dapat mencari estimator tak bias yang lain dengan menggunakan statistik minimum, namakan W = Xmin . Distribusi W sbb: g(w) = dan
n w (1 ) n 1 ; 0 < w <
(3.33)
E(w) =
n w w (1 )n1 dw = n+1
(3.34)
Jika dipilih T2 = (n + 1) Xmin sebagai estimator untuk maka T2 adalah estimator tak bias untuk . Sehingga diperoleh distribusi T2 g ( t2 ) = n t2 (1 ) n 1 ; 0 < t 2 < ( n + 1 ) ( n + 1) ( n + 1) 66 (3.35)
ISBN 978-602-8310-02-4
dan
2 E( T2 )
2( n + 1) 2 = n+2
(3.36)
2( n + 1) 2 n 2 2 = n+2 n+2
2 n ( n +2)
(3.37)
<
n 2 n +2
3.3.2.4
Estimator Bayes
Pendekatan Bayesian dalam statistik secara fundamental berbeda dengan pendekatan klasik seperti yang telah kita bicarakan di muka. Meskipun demikian, beberapa aspek dari pendekatan Bayesian dapat berguna pada beberapa pendekatan statistik yang lain. Sebelum masuk pada metode pencarian estimator Bayes, kita bicarakan dahulu pendekatan Bayesian pada statistika. Dalam pendekatan klasik, parameter adalah kuantitas atau besaran tetap yang tidak diketahui. Sampel random x1 , ..., xn diambil dari populasi berindeks dan berdasarkan harga-harga terobservasi dalam sampel, didapat pengetahuan tentang . Dalam pendekatan Bayesian, dipandang sebagai besaran yang variasinya digambarkan dengan distribusi probabilitas (disebut distribusi prior). Ini adalah distribusi subyektif berdasarkan pada keyakinan seseorang dan dirumuskan sebelum data diambil. Kemudian sampel diambil dari populasi berindeks dan distribusi prior disesuaikan dengan informasi sampel ini. Prior yang telah disesuaikan disebut distribusi posterior. Penyesuaian ini dilakukan dengan menggunakan aturan Bayes, karena itu dinamakan statistik Bayesian. Bila distribusi prior dinyatakan dengan ( ) dan distribusi sampling dengan f ( x | ), maka distribusi posterior, yaitu distribusi bersyarat diberikan x adalah
Bab 3. Estimasi Titik
67
ISBN 978-602-8310-02-4
( | x ) =
f (x | ) ( ) m( x )
(3.38)
Perhatikan bahwa f ( x, ) = f ( x | ) ( ) dimana m(x) adalah distribusi marginal dari x yaitu m( x ) = f ( x | ) ( )d Jadi distribusi posterior adalah distribusi bersyarat, yaitu bersyarat terhadap observasi sampel. Sekarang distribusi posterior digunakan untuk memberi pernyataan tentang , yang dipandang sebagai besaran random. Sebagai contoh, mean distribusi posterior dapat digunakan sebagai titik estimator dari . Contoh Misalkan X1 , ..., Xn adalah distribusi Bernoulli (1, p), maka Y = Xi adalah Binomial (n, p). Kita andaikan bahwa distribusi prior dari p adalah Beta (, ). Distribusi bersama dari Y dan p adalah n y n y pY (1 p)nY ][ P ( + ) 1 p (1 p ) 1 ] P() P( )
f (Y , p ) = [
(3.39)
P ( + ) Y + 1 p ( 1 p ) n Y + 1 P() P( )
f (Y ) =
f (Y , p)dp =
n y
Sehingga ( p | Y ) =
f (Y , p ) f (Y )
p Y + 1 ( 1 p ) n Y + 1
Yang merupakan distribusi Beta (Y + , n y + ). Estimator alami untuk p adalah mean dari distribusi posterior, dan ini memberikan estimator Bayes untuk p adalah p = =
Y + + +n
Bila kita mengestimasi parameter Binomial, kita tidak perlu memiliki distribusi prior dari keluarga beta. Tetapi, terdapat keuntungan dalam meBab 3. Estimasi Titik
68
ISBN 978-602-8310-02-4
milih keluarga beta, paling tidak kita mempunyai closed-form dari estimator. Secara umum, untuk sembarang distribusi sampling terdapat keluarga distribusi prior alami yang disebut keluarga konjugat. De f inisi Misalkan F adalah kelas densitas f ( x | ). Kelas dari distribusi prior disebut keluarga konjugat untuk F, bila distribusi posterior berada dalam kelas untuk semua f F,semua prior dalam , dan semua x . Contoh Jika X N ( , 2 ) dan misalkan distribusi prior dari X adalah N (, 2 ). Distribusi posterior dari juga normal dengan mean dan variansi 2 2 x + 2 + 2 2 + 2 2 2 2 + 2
= E( | x ) =
(3.41)
Var ( x | ) =
(3.42)
3.3.3
Metode-metode yang dibicarakan dalam bab sebelumnya telah memberikan gambaran teknik yang masuk akal dalam menentukan estimator titik untuk suatu parameter. Karena kita biasanya dapat menerapkan lebih dari satu metode dalam suatu persoalan tertentu, maka kita dihadapkan pada persoalan memilih diantaranya. Memang metode yang berbeda bisa menghasilkan estimator yang sama (jika demikian, maka tugas kita sangat mudah), tetapi pada umumnya metode yang berbeda juga akan menghasilkan estimator yang berbeda. Dalam bab ini akan diperkenalkan konsep dasar untuk mengevaluasi estimator dan menyelidiki kelakuan beberapa estimator terhadap kriteria ini.
Bab 3. Estimasi Titik
69
ISBN 978-602-8310-02-4
3.3.3.1
Ukuran kualitas estimator yang paling umum adalah galat kuadrat ratarata atau Mean Square Error (MSE). MSE merupakan jumlah Variansi dan Biasnya De f inisi Galat kuadrat rata-rata ( MSE) dari estimator T ( x ) terhadap parameter _ 2 adalah fungsi yang didenisikan dengan E ( T ( x ) ) . Dengan mudah dapat kita lihat bahwa: E ( T ( x ) ) = VarT ( x ) + ( Bias( T ( x ))2 dengan Bias T ( x ) = E T ( x ) . Jadi MSE mempunyai dua komponen, variansi yang menguji variabelitas (precision) estimator dan bias mengukur (accuracy) dari estimator. Jadi untuk estimator tak bias kita mempunyai MSE = E ( T ( x ) )2 = _ Var T ( x ) . Contoh Misalkan X1 , ..., Xn adalah i, i, d N (, 2 ). X dan S2 kedua-duanya adalah _ estimator tak bias untuk dan 2 , karena E( X ) = dan E(S2 ) = 2 . MSE dari kedua estimator adalah E( X )2 = Var ( X ) =
_ _ _ _ _ _ 2 _
(3.43)
2 n
(3.44)
2 4 n1 Banyak estimator tak bias yang masuk akal jika dilihat dari MSE-nya. Namun perlu ditekankan bahwa pengontrolan bias tidak otomatis pengontrolan MSE. Pada khususnya sering terjadi timbal balik antara varansi dan bias, sedemikian hingga sedikit kenaikan bias dapat ditukarkan dengan penurunan yang lebih besar pada variansi, yang hasilnya adalah perbaikan pada MSE. E(s2 2 )2 = VarS2 =
Bab 3. Estimasi Titik
70
ISBN 978-602-8310-02-4
( x i x )2 =
2
n1 2 s n
n 1 2 n s 2
sehingga adalah estimator yang bias untuk 2 . Variansi dapat dihitung sebagai
2
Var = Var (
n1 2 2n 1 4 2( n 1) 4 2 2 + ( ) = ( ) n n2 n2
2 2n 1 4 ) < ( ) 4 = E ( s2 2 )2 . n1 n2
2
Yang menunjukkan bahwa mempunyai MSE yang lebih kecil dari S2 . Jadi dengan mengadakan timbal balik antara variansi dan bias, MSE dapat diperbaiki. Catatan Hasil di atas tidak berarti bahwa S2 tidak dapat dijadikan sebagai estima2
tor dari 2 . Hal di atas hanya mengatakan bahwa secara rata-rata lebih dekat ke 2 dibandingkan dengan bila MSE digunakan sebagai ukuran kebaikan. Pada umumnya, karena MSE adalah fungsi dari parameter, maka tidak ada estimator terbaik untuk . Yang sering kita lihat adalah MSE dari dua estimator saling berpotongan, yang berarti kebaikan dari
Bab 3. Estimasi Titik
71
ISBN 978-602-8310-02-4
estimator hanya bersifat lokal. Salah satu cara untuk mengatasi tidak adanya estimator terbaik adalah melalui pembatasan kelas estimator. Salah satu pembatasan yang kita bicarakan adalah melalui kelas tak bias. Misalkan kita ingin mengestimasi g( ). Dalam hal ini kita hanya membatasi kelas estimator. CT = { T : ET = g( )} Untuk setiap T1 , T2 CT , Bias T1 =Bias T2 sehingga MSE( T1 ) MSE( T2 ) = VarT1 VarT2 . Ini berarti bahwa, dalam kelas CT , perbandingan MSE sama dengan perbandingan Variansi.
3.3.3.2
Estimator Terbaik
Tujuan dari bagian ini adalah menyelidiki metode penentuan estimator tak bias terbaik yang akan denisikan kemudian. Estimator terbaik menurut pandangan klasik adalah estimator dengan variansi minimum dalam kelas (himpunan) estimator tak bias untuk parameter tersebut. Sifat esiensi estimator hanya membandingkan dua estimator tak bias, akibatnya estimator yang lebih esien belum tentu merupakan estimator terbaik. De f inisi Misalkan T merupakan estimator tak bias untuk g( ) atau E( T ) = g( ). Jika untuk setiap estimator T yang memenuhi E( T ) = g( ) berlaku Var ( T ) Var ( T ) untuk setiap maka T disebut estimator tak bias terbaik (memiliki variansi minimum). Karena itu estimator terbaik ini disebut dengan dengan estimator tak bias yang memiliki variansi minimum seragam atau uniformly minimum variance unbiased estimator disingkat UMVUE. Menentukan estimator tak bias terbaik (bila ada) bukan pekerjaan yang mudah karena berbagai alasan dan salah satunya adalah sebagai berikut.
Bab 3. Estimasi Titik
72
ISBN 978-602-8310-02-4
Contoh Misalkan X1 , X2 ..., Xn adalah iid Poisson(). Jika x dan s2 masing-masing _ adalah mean dan variansinya maka dengan mudah dapat dicari: E( X ) = dan E(S2 ) = yang kedua-duanya merupakan estimator tak bias untuk _ . Di sini kita tak cukup membandingkan Var ( X ) dan Var (S2 ) saja. Ka_ _ rena untuk setiap konstanta a berlaku T ( X ,S2 ) = aX +(1 a)S2 adalah estimator tak bias untuk . Jadi dalam hal ini ada tak terhingga estimator tak bias. Contoh ini menunjukkan bahwa untuk menentukan UMVUE diperlukan penanganan yang menyeluruh. Salah satunya adalah dengan menentukan batas-bawah variansi estimator yang mungkin. Batas bawah variansi ini dikenal dengan nama batas bawah Cramer-Rao atau Cramer-Rao lower bound disingkat CRLB sbb: Misalkan dalam melakukan estimasi g( ) dari densitas f ( x | ) kita dapat menentukan batas bawah, variansi dari setiap estimator tak bias, katakanlah B( ). Bila kemudian kita dapat menemukan estimator tak bias T sedemikian hinggaVar ( T ) = B( ) maka berarti kita mendapatkan UMVUE estimator. 3.3.3.3 Teorema Batas Bawah Cramer-Rao
_
Misalkan X1 Xn , ..., Xn adalah sampel dengan densitas f ( x | ) dan misal_ _ kan T ( X ) = T ( X1 , ..., Xn ) adalah sebarang estimator dengan E( T ( X )) terdeferensialkan dalam . Andaikan densitas bersama f ( x | ) = f ( x1 , ..., xn | ) menentukan: d d ... h( x ) f ( x | )d x =
_ _ _ _ _
...
h( x )
_ _ f ( x | )d x
(3.45)
Var ( T ( x )) E
Bab 3. Estimasi Titik
_ log f ( x | ) 2
(3.46)
73
ISBN 978-602-8310-02-4
Bukti Bukti teorema ini sederhana tetapi cantik, dan merupakan pemakaian yang cerdik dari ketaksamaan Cauchy-Schwarz. Untuk sebarang dua variabel random X dan Y berlaku
(3.47)
Bila kita menyusun kembali 3.47, kita akan mendapatkan batas bawah dari variansi X ,
VarX
[Covar( X , Y )] Var Y
_
Kelebihan teorema ini terletak pada pemilihan X dengan estimator T ( X ) _ log f ( x | ) dan Y sama dengan besaran: Pertama-tama kita harga harap: log f ( x | )
_
log f ( x | ) . f ( x | ) _
_
= E
f (x| )
_
(si f at log)
...
f ( x | ) _
f (x| )
_
f ( x | )d x (de f inisi )
...
_ f (x| ) _ d x (coret f ( x | ))
d d
...
f ( x | )d x (si f at3.1)
d 1 d
=0
Bab 3. Estimasi Titik
74
ISBN 978-602-8310-02-4
Karena itu
log f ( x | ) Cov T ( X ).
_
log f ( x | ) = E T ( X ).
_
(3.48)
_ f ( x | ) _
_
= E T(X)
f (x| )
_ _
=
d d
...
f (x| ) dx
_ _
...
T ( X ) f ( x | )d x
=
Juga, karena E
log f ( x | )
_
d E( T ( X ) d
= 0 didapat
_
log f ( x | )
=E
log f ( x | )
(3.49)
Var T ( X ) E qed1 .
2 _ d ET ( ) X d
_ log f ( x | ) 2
Untuk kasus sampel independen perhitungan batas bawah menjadi lebih sederhana. Perhitungan dalam penyebut menjadi perhitungan variabel random univariat, seperti yang ditunjukkan dalam corollary berikut ini.
1 terbukti
75
ISBN 978-602-8310-02-4
Akibat Cramer - Rao Misalkan X1 , ..., Xn adalah iid dengan densitas f(x | ), misalkan T ( X ) = _ T ( x1 , ..., xn ) sembarang estimator dari g( ) dengan E( T ( X )) fungsi yang _ terdeferensialkan. Bila densitas bersama f(x | ) = f ( xi | ) memenuhi (3.1), maka
2 _ d ) ET ( X d _ _
_ log f ( x | ) 2
(3.50)
= nE
log f ( x | )
=E
log f ( xi | )
2
=E
log f ( xi | )
=E
log f ( xi | )
+E
log f ( xi | ) log f ( xi | )
log f ( xi | ) log f ( xi | )
=E
log f ( xi | )
log f ( x j | )
=0
76
ISBN 978-602-8310-02-4
Karena itu
log f ( xi | )
= nE
log f ( xi | )
log f ( xi | )
Terminologi ini mencerminkan kenyataan bahwa informasi Fisher adalah balikan dari variansi estimator tak bias terbaik dari . Dengan informasi Fisher menjadi makin besar, variansi estimator tak bias terbaik menjadi makin kecil. Ini berarti makin banyaknya informasi tentang . Untuk sembarang fungsi terdeferensialkan g( ) sekarang kita mempunyai _ _ batas bawah pada variansi sebaran estimator T ( X ) yang memenuhi ET ( X ) _ = g( ). Batas bawah tergantung pada g( ) dan f ( x | ) dan independen dari estimator yang sedang diselidiki. Karena itu T ( X ) adalah batas bawah _ seragam dari variansi, dan setiap estimator yang memenuhi ET ( X )= g( ) dan mencapai batas bawah ini adalah estimator tak bias terbaik dari g( ). Lemma Bila f ( x | ) memenuhi
_
log f ( x | )
log f ( x | )
f ( x | ) dx (3.51)
E Contoh
= nE
(3.52)
Misalnya diberikan variabel random Poisson. Dalam hal ini g() = . Sehingga g1 () = 1. Karena Poisson adalah keluarga eksponensial, maka lemma berlaku. Karena itu
Bab 3. Estimasi Titik
77
ISBN 978-602-8310-02-4
n log f ( xi | )
= nE
2 log f ( x | ) 2
(3.53)
= nE
e x log x!
= nE
2 ( + x log log x !) 2
= nE(
x ) 2
= n.
n n 1 E ( x ) = 2 . = 2
_ _
Karena itu untuk sebarang estimator tak bias T ( X ) harus berlaku VarT ( X ) n batas bawah C-R Karena Var X
_ n
Sangat penting untuk diingat bahwa kunci dalam Teorema Cramer-Rao adalah kemampuan untuk mendiferensialkan di bawah tanda integral yang dengan sendirinya agak terbatas penerapannya. Seperti telah kita ketahui densitas dalam kelas eksponensial akanmemenuhi persyaratan ini, tetapi secara umum andaian tersebut harus dilihat kebenaraannya. Contoh Misalkan X1 , ..., Xn adalah iid dengan densitas f ( x | ) = 1/ dan 0 < x < . Karena
log f ( x | )
= 1/ , maka E
_ log f ( x | ) 2
= 1/ 2
Teorema Cramer-Rao mengindikasikan bahwa bila T adalah sebarang esti2 mator tak bias dari , maka Var ( T ) n Akan dicari estimator yang tak bias dan variansinya lebih kecil. Sebagai dugaan pertama pandang statistik cukup Y = Maks( X1 , ..., Xn ). Densitas dari Y adalah
Bab 3. Estimasi Titik
78
ISBN 978-602-8310-02-4
dy =
n n +1
2 n ( n +2) 2 n.
Ini menunjukkan bahwa Teorema Cramer-Rao tidak dapat diterapkan pada densitas ini. Untuk menunjukkan ini, gunakan aturan Leibnitz.
d 1 d 1 0 h ( x ) f ( x | ) dx = d 0 h ( x ) dx = d ( 0 h ( x )) dx 1 ( ) dx = h( ) + 0 h( x ) x|) = 0 h( x ) f ( dx. h() Kecuali = 0 untuk semua . Karena itu, Teorema Cramer-Rao d d
tidak
berlaku. Kelemahan metode pencarian UMVUE ini, walaupun Teorema CramerRao dapat diterapkan adalah tidak ada jaminannya bahwa batas bawahnya cukup tajam, atau dengan perkataan lain harga batas bawah CramerRao lebih kecil dari variansi sebaran estimator tak bias. Bila f ( x | ) adalah keluarga eksponensial parameter satu regular maka hal ini akan tidak terjadi yaitu bila estimator tak bias dari g( ) ada, maka pasti akan ada estimator tak bias yang mencapai batas bawah Cramer-Rao. Tetapi, dalam kasuskasus lain, batas ini bisa tidak tercapai. Contoh Misalkan X1 , ..., Xn adalah iidN (, 2 ), dan pandang estimator 2 dalam hal tidak diketahui. densitas normal memenuhi andaian Teorema Cramer-Rao, sehingga 2 log ( 2 )2
Bab 3. Estimasi Titik
x 2 1 1 2( ) e (22 )1/2
1 ( x )2 6 2 4 ISBN 978-602-8310-02-4
79
dan 2 log f ( x |, 2 ) 2 2 ( ) 1 ( x )2 6 2 4 1 2 4
2 4 n
= E
Jadi, setiap estimator tak bias T dari 2 harus memenuhi Var ( T ) Kita telah mengetahui bahwa Var (S2 ) = CRLB
2 4 n 1 .
Dalam contoh di atas sebenarnya kita mempunyai pertanyaan yang belum terjawab, yaitu apakah ada estimator dari 2 yang lebih baik dari S2 atau CRLB tak bisa dicapai? Syarat pencapaian CRLB sebenarnya cukup sederhana. Hal ini mengingat bahwa terjadi dari pemakaian ketaksamaan Cauchy-Schwarz, sehingga syarat pencapaian batas bawah tersebut adalah syarat kesamaan dalam ketaksamaan Cauchy Schwarz. Perhatikan juga bahwa corollary di bawah merupakan alat berguna karena secara implisit memberikan cara pada kita untuk mendapatkan estimator tak bias terbaik. Akibat Misalkan X1 , ..., Xn adalah iid f ( x | ) memenuhi syarat-syarat Teorema Cramer-Rao. Misalkan L( | x )= i=1 f ( xi | ) menyatakan fungsi like_ lihood. Bila T ( X ) = T ( X1 , ..., Xn ). adalah sembarang estimator tak bias _ dari g( ), maka T ( X ) mencapai Cramer-Rao Lower Bound jhj log L( | x ) a( )[ T ( X ) g( )] =
_ _ _ n
Cov
n T ( X ), log f ( xi | )) i =1 _
VarT ( X )Var
80
n log f ( xi | )) i =1
ISBN 978-602-8310-02-4
log i=1 f ( xi | )
= 0 dan
menggunakan hasil teorema yang mengatakan bahwa korelasi T dan log i=1 f ( xi | ) harus 1
_ n n
log i=1 f ( xi | ).
L , | x = Karena itu
1
n/2 (22 )
1 2
( Xi ) 2
2
n log L ( , 2 | x ) = 2 2 4
( Xi ) 2 2 n
Jadi dengan mengambil (2 ) = 2n menunjukkan bahwa estimator tak bisa 4 2 terbaik dari 2 adalah ( Xi ) /n, yang dapat dihitung bila diketahui. Bila tak diketahui, CRLB tidak dapat dicapai Akibat Jika adalah estimator tak bias untuk dan Var ( ) = maka adalah UMVUE 1 n.E [( ln f ( x )/ )2 ] (3.54)
3.3.4
Pada prinsipnya ada 2 metode estimasi titik yang paling sering dugunakan yaitu metode momen atau Moment Method of Estimation (MME) dan Maximum Likelihood Method of Estimation (MLE) yang akan diuraikan pada bagian berikut ini.
Bab 3. Estimasi Titik
81
ISBN 978-602-8310-02-4
3.3.4.1
Metode Momen
Metode momen yang diciptakan oleh Karl Pearson pada tahun 1800 adalah metode tertua dalam menentukan estimator titik. Misalkan x1 , x2 , ..., xn adalah sampel dari populasi dengan densitas f ( x | 1 , ..., k ). Estimator metode momen didapat dengan menyamakan k momen sampel pertama pada k momen sampel populasi, dan menyelesaikan sistem persamaan simultan yang dihasilkan.
Denisi
Misalkan X1 , ..., Xn adalah sampel random populasi yang i.i.d dengan distribusi f ( x /1 , ..., k ). Estimator metode momen adalah solusi dari persamaan r = mr (r = 1, 2, ..., k ). Dalam hal ini r = E( X r ) adalah momen populasi ke-r dan mr = 1/n Xir adalah momen sampel ke-r,
i =1 n
m1
1 = n 1 n . . . 1 = n
i =1 n i =1
(3.55)
m2 =
mr
i =1
Xik , k = EXr
j (1 , ...r ). Estimator metode momen (1 , ..., k ) dari (1 , ..., r ) dalam bentuk (m1, ..., mr ), di mana:
Bab 3. Estimasi Titik
82
ISBN 978-602-8310-02-4
(3.56)
= 2 + 2 . Di sini
Misalkan X1 , ..., Xn adalah i.i.d Binomial (k, p), yaitu, P ( Xi = x | p ) = k x p x (1 p)k x , x = 0, 1, ...k.
(3.57)
Di sini diandaikan bahwa k dan p kedua-duanya tidak diketahui. Dengan menyamakan dua momen sampel pertama dan momen populasi didapat sistem persamaan
(3.58) (3.59)
k=
X
Bab 3. Estimasi Titik
1 n
( Xi X 83
dan p =
(3.60)
)2
k ISBN 978-602-8310-02-4
3.3.4.2
Metode maksimum likelihood adalah metode yang paling populer dalam menghasilkan estimator yang ditemukan oleh R.A Fisher. Definisi Misalkan X1 , ... Xn adalah i.i.d sampel dari populasi dengan densitas f ( x | 1 , ..., k ). Fungsi likelihood didenisikan sebagai: L( | X ) = L(1 , ..., k | X1 , ...Xn ) = f ( xi | 1 , ..., k )
_ _ _
(3.61)
Untuk setiap titik sampel x, misalkan ( x ) adalah harga parameter di _ _ _ mana L( | X ) sebagai fungsi dengan menganggap x konstan mencapai _ maksimumnya. Estimasi maksimum likelihood (MLE) dari berdasarkan _ _ _ sampel x adalah (x ). Perhatikan bahwa dari konstruksinya, jelajah dari MLE berimpit dengan jelajah dari parameter. Secara intuitif, MLE adalah estimator yang masuk akal, karena MLE adalah titik parameter dengan sampel terobservasi paling mungkin terjadi. Meskipun demikian perhatikan juga sensitivitas perubahan data. Bila fungsi likelihood terdeferensialkan (dalam Estimator) maka calon MLE yang mungkin adalah harga-harga (1 , ..., k ) sedemikian hingga dL ( | x ) = 0, i = 1, 2, ..., k d i
_
(3.62)
Perhatikan bahwa 3.62 hanyalah syarat perlu untuk terjadinya maksimum. Contoh Misalkan X1 , ..., Xn adalah i.i.d L ( | X ) = i =1
Bab 3. Estimasi Titik
_
n
1 2 1 1 2 ( x i )2 1 2 ( xi ) e e = (2 )1/2 (2 )n/2
84
ISBN 978-602-8310-02-4
Persamaan _ =x .
dL ( | x ) d i _
Karena itu x adalah calon MLE untuk membuktikan bahwa x benar-benar maksimum global, harus ditunjukkan bahwa d2 L ( | x ) _< 0 | = x d 2 Catatan Untuk setiap bilangan a berlaku
_
(3.64)
i =1 _
( x i a )2
i =1
( x i x )2
(3.65)
kesamaan berlaku bhb a = x . Ini berati bahwa untuk setiap berlaku _ 2 _ _ _ 1 1 2 e 2 ( xi ) e 2 ( xi x) dengan kesamaan bhb = x. Karena itu x adalah MLE. Dalam banyak kasus, di mana deferensiasi digunakan. Kita akan lebih mu_ _ dah bekerja pada logaritma alam dari L( | x ) yaitu logL( | x ). Dikenal _ sebagai log likelihood dari pada L( | x ) nya sendiri. Hal ini dimungkinkan _ karena fungsi log naik tegas pada (0, ), yang berarti bahwa L( | x ) dan _ log L( | x ) mempunyai ekstrem yang sama. Contoh Misalkan x1 , ..., xn adalah i.i.d Bernoulli ( p). Maka fungsi likelihood adalah L ( p | x ) = i =1 p x i (1 p )1 x i = p y (1 p ) n y
_ n
(3.66)
di mana y = xi . Walaupun fungsi ini untuk diambil derivatifnya, namun akan lebih mudah mengambil derivatif likelihoodnya. LogL( p | x ) = y log p + (n y) log(1 p).
Bab 3. Estimasi Titik
_
(3.67)
85
ISBN 978-602-8310-02-4
Bila 0 < y < n, mendeferensialkan Log L( p | x ) dan menyamakannya dengan nol memberikan hasil p = y/n. selanjutnya dengan mudah dapat dibuktikan bahwa y/n adalah maksimum global. Untuk y = 0 atau y = n, maka LogL( p | x ) = {n log p, bila y=n
_ _ n log(1 p), bila y=0
(3.68)
Dalam keadaan bagaimanapun Log L( p | x ) fungsi monoton dari p, dan mudah dilihat bahwa p = y/n. Hal penting yang perlu diperhatikan dalam mendapatkan MLE, adalah jelajah ruang parameter. Contoh: 1. Misalkan x1 , ..., xn adalah i.i.d 0. N ( , 1), tetapi diketahui bahwa
(a) Bila tidak ada batasan pada , kita telah mengetahui bahwa x _ adalah MLE dari . Tetapi bila x < 0, maka harga tersebut berada di luar ruang parameter. (b) Bila x < 0, maka L( | x ) fungsi turun dari untuk 0 dan mencapai maksimum untuk = 0. Karena itu, = x bila x 0 dan = 0 bila x < 0. 2. Misalkan x1 , ..., xn adalah iid dengan distribusi seragam pada (0, ).
i L( | x ) = { n untuk maks x
0 untuk <maks x
(3.69)
Maka = maks xi . 3. MLE belum tentu tunggal. Misalkan x1 , ..., xn adalah i, i, d dengan distribusi seragam pada ( 1 1 2 , + 2 ).
Bab 3. Estimasi Titik
86
ISBN 978-602-8310-02-4
f ( x | ) = {0
1 ( 1 2 x + 2 ). yang lain
(3.70)
L ( | x ) = {0
1 2
(3.71)
1 2
dan min xi +
1 2
adalah MLE.
Barangkali salah satu sifat yang paling berguna dari MLE adalah sifat invariannya. Misalkan dalam hal ini kita tertarik pada estimasi g( ) dengan g( ) fungsi satu-satu. Sifat invarian mengatakan bahwa kalau adalah MLE dari maka g( ) juga MLE dari g( ). Misalkan = g( ). Maka g1 ( ) = . Selanjutnya
L ( | x ) =
i =1 f ( x i | g 1 ( )
_
(3.72) (3.73)
= L g 1 ( ) | x
dan Sup L ( | x ) = Sup L g1 ( ) | x = Sup L( | x )
_ _ _ _
(3.74)
Jadi, maksimum dari L ( | x ) dicapai pada = g( ) = g( ), yang menunjukkan bahwa MLE dari g( ) adalah g( ). Bila = (1 , ..., k ) multidimensi, maka persoalan menentukan MLE adalah persoalan memaksimumkan fungsi beberapa variabel. Bila fungsi likelihood terdiferensialkan, maka menyamakan turunanturunan parsial pertama sama dengan nol memberikan syarat perlu terjadinya ekstrim. Tetapi, dalam kasus multidimensi, penggunaan turunan kedua untuk menguji maksimum adalah pekerjaan yang membosankan, dan untuk menghindarinya metode lain bisa dicoba.
Bab 3. Estimasi Titik
_
87
ISBN 978-602-8310-02-4
(2 2 )
n 2
e 2 ( xi )
/ 2
(3.75)
i =1
( x i )2 / 2
(3.76)
i =1
( xi )
dan
_ n 1 log L( , 2 | x ) = 2 + 4 2 2 2
i =1
( xi )
Dengan menyamakan kedua turunan parsial tersebut dengan nol didapat penyelesaian:
n = x dan 2 = n1 i=1 ( xi )2 untuk membuktikan bahwa penyelesaian ini adalah maksimum global, pertama-tama perhatikanlah: _
(2 2 )
n 2
/ 2
(2 2 )
n 2
e 2 ( xi )
/ 2
Sekarang persoalannya menjadi persoalan satu dimensi dan _ 2 1 2 ( 2 ) 2 exp 1 2 ( xi x ) / mencapai global maksimum pada 2 = n1 ( xi x )2 . Jadi kesimpulannya x, n1 ( xi x ) adalah MLE.
Bab 3. Estimasi Titik
_ _ _
88
ISBN 978-602-8310-02-4
3.4
1. Jika x1, x2 , ...xr variabel random independen berdistribusi Poisson P(i ); dengan i = ai , diketahui ( ai > adiketahui), tunjukkan T ( x ) = xi adalah statistik cukup untuk Penyelesaian: Xi P( ai ), berarti fungsi pembangkit momen dari Xi adalah: M x i ( t ) = e a i ( e 1) dan fungsi padat peluangnya adalah:
t
f ( xi | ) =
( a i ) xi e ai ; xi = 0, 1, 2, .. xi
MT ( x ) ( t ) = M x i ( t ) = ir=1 Mxi (t) : karena xi independen. t t = ir=1 e ai (e 1) = e ( e 1) a i Jadi: T ( x ) = xi berdistribusi P( ai )dengan fungsi padat peluang:
= = = =
Bab 3. Estimasi Titik
r a xi ai xi i =1 i e r xi ! i =1 t e ai t ( ai ) t ! r a xi ai xi i =1 i e t! ir=1 xi ! e ai t ( ai ) t r a xi i =1 t! t r x ! ( ai ) i =1 i xi a t! r i ( a i ) t i =1 x i !
( ai ) e
t!
Terlihat bahwa hasil terakhir ini tidak bergantung pada parameter . Dengan demikian disimpulkan T ( x ) = r i =1 xi adalah statistik cukup untuk 2. Misalkan f fungsi integrabel yang positif terdenisi pada (0, ), dan misalkan P ( x ) adalah fungsi kepadatan peluang pada (0, )dengan denisi: C ( ) f ( x ) ; 0<x<0 0 ; otherwise
P ( x ) =
Jika x1 , x2 , ...xn variabel random iid dengan densitas P , tunjukkan x(n) adalah statistik cukup untuk Penyelesaian Misalkan: Z = x(n) = maximum xi ;1 i n, maka: P( Z z) = P( x1 z, x2 z, ..., xn z) F (z) ={ P( x z)}n , sebab xi idd n z f (z) = 0 P ( x )dx n n z z = 0 c( ) f ( x )dx = [c( )]n 0 f ( x )dx P (z) = F (z) = [c( )]n Karena Xi iid maka:
n n n P ( x ) = in =1 P ( xi ) = i =1 c ( ) f ( x ) = [ c ( )] { f ( x ) }
d dz
z 0
f ( x )dx
(3.77)
(3.78)
= =
Ternyata rasio ini independen dari , berarti dapat disimpulkan Z= X(n) adalah statistik. cukup untuk parameter . 3. Misalkan x1 , x2 , ...xn variabel random iid dengan N , 2 ; > 0, Tentukan himpunan dari statistik cukup minimal
Bab 3. Estimasi Titik
90
ISBN 978-602-8310-02-4
Penyelesaian:
Fungsi padat peluang bersama dari xi adalah: n 2 1 ( x r )2 e 2 f (x | ) = 22 dengan 2 dan yi adalah : n 2 1 ( y )2 e 2 f y | = 22 Rasio dari kedua persamaan ini adalah: n 2 1 ( x r )2 e 2 (22 ) f ( x ,v | ) = f ( u,v | ) n 2 1 ( y )2
= =
1
e 2 (22 ) 2 2 1 x + 21 ( ) ( y r ) e 2
2 2 x + 2 2 + 1 2
e 2 ( x
( y2 2 y + 2 )
= e = =
2 2 21 ( x y )+
2 2 2 2 y+ 2 x 2 2 2 2 e 2 2 2 2
1 1 1 2 2 e 2 ( x y ) + x y 1 1 2 2 e 2 ( x y ) + ( x y )
Jelas rasio ini independen dari = 2 x = ydan x2 , y2 . Dengan demikian T ( x ) = x, x2 adalah himpunan statistik cukup minimal untuk = 2
4. Misalkan x1 , x2 , ...xn variabel random independen berdistribusi U ( a, + b), dengan a,b>o diketahui dan = IR.
Penyelesaian:
(a) x
U ( a, + b) , berarti f ( x | ) 91
1 b+ a
dengan
ISBN 978-602-8310-02-4
= = = = = = = =
1 ( + b ) ( a )2 2( b + a ) 1 2 + 2 b + b2 2 + 2 a a2 2( b + a ) 1 2 b + 2 a + b2 + a 2( b + a ) 1 2 ( b + a ) + b2 a2 2( b + a ) 1 {2 ( b + a ) + ( b + a ) ( b a ) } 2( b + a ) a + b 2
1 n Persamaan metode memennya adalah: n i =1 x i = x = + b a 2 , sehingga, momen estimator untuk parameter adalah a = x + b 2
= = = = = = = = =
1 3( b + a )
1 ( + b) 3( b + a ) 3 + 3 2 b + 3 b2 + b3 1 3( b + a ) 1 3( b + a )
+b 1 a x. b+ a dx +b 1 1 3 x b+ a 3 a 3
( a )3 3 3 2 a + 3 a3 + a2
3 2 b + 3 2 a + 3 b2 3 a2 + b3 + a3 3 b + a + b2 3 a2 + b3 + a3 2 ( b2 a2 ) ( b3 + a3 ) 2 (b+ a) + + 3( b + a ) (b+ a) (b+ a) (b+ a)(b2 ab+ a2 ) (b a)(b+ a) 2 + + 3( b + a ) (b+ a) 2 ab + a2 b ( ) 2 + (b a) + 3 92 ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book Selanjutnya, dihitung variansi estimator , yaitu V
= V = E
ba x 2 x
=E
ba x 2
ba E x 2
= =
1 n 1 n
2 + (b a) +
b2 ab + a2 3
+ (b a) +
( b a )2 4
b2 ab + a2 (b a)2 3 4
1 n
1 n
1 n
4b + 2ab + a2 12
1 ( a + b )2 ( a + b )2 = 12n 12n 5. Jika x1 , x2 , ...xn variabel independen berdistribusi U ( , )dengan =(0, ) apakah metode momen memberikan suatu estimator untuk ? Penyelesaian: X U ( , ), berarti f ( x | ) = 21 ; x 1 E ( x ) = f ( x | ) dx = 2 xdx Jadi: 1 1 2 = x = 41 2 ( )2 2 2
93
ISBN 978-602-8310-02-4
Statistika Matematis II/ Edisi E-book maka = 0atau = 0, dengan demiian metode momen tidak memberikan suatu estimator untuk . 6. Jika x1 , x2 , ...xn variabel random iid berdistribusi binomial negatif dengan parameter (0, 1) r Tunjukkan bahwa : r+ x adalah MLE untuk Penyelesaian: Xi = binomial negatif, berarti :
f (x | ) =
r+x1 x
Fungsi likehoodnya adalah: r+x1 n x nr i =1 i 1 L ( x | ) = in ( ) =1 x r+x1 nr n x = in ( 1 ) i =1 i =1 x Logaritma fungsi likehood adalah: r+x1 n n x logL ( x | ) = log i=1 nr (1 ) i=1 i x r+x1 n n x log (1 ) = i=1 log + nr log + i =1 i x
d d
[logL ( x | )] =
nr
n x i =1 i
nr
n x i =1 i (1 )
= 0atau
n x nr 1 i =1 i = 0 nr 1 in=1 xi = 0 (1 )
94
ISBN 978-602-8310-02-4
7. Jika x1 , x2 , ...xn variabel random iid berdistribusi exponensial negatif dengan parameter (0, ), Tunjukkan bahwa 1 x adalah MLE bagi parameter . Penyelesaian: Xi exponensial negatif, berarti fungsi kepadatan peluangnya adalah: f ( x | ) = e x ; > 0; x > 0 0 ; x 0; > 0
x = Logaritma fungsi likehood adalah: L ( x | ) = in =1 e n e x
d d
[logL ( x | )] =
in=1 xi ;
d d
[logL ( x | )] = n2 < 0
1 x
8. Misalkan x1 , x2 , ...xn variabel random iid dengan p.d.f f (.; 1 , 2 ) ( x 1 ) yang diberikan oleh: f ( x; 1 , 2 ) = 12 exp ; x > 1 dimana 2 = (1 , 2 ) = Rx (0, ). Tentukan MLE dari 1 dan2 . Penyelesaian: Fungsi padat peluang x1 adalah:
Bab 3. Estimasi Titik
95
ISBN 978-602-8310-02-4
f ( x | 1 , 2 ) =
1 ( x 1 ) ; x > 1 exp 2 2
( x 1 ) 2 n exp 2
1 1 n n exp i =1 ( x 2 2 1 n 2 i =1 ( x 1 )
1 )
n Karena dd 1 [ logl ( | x )] = 2 ,maka metode pendiferensialan tidak dapt digunakan untuk memperoleh MLE dari 1 , oleh sebab itu digunakan cara berikut. Telah diketahui bahwa xi > 1 ; i , jadi L ( | x ) = n n ( x ) akan mencapai maksimum apabila 2 exp 12 i 1 =1
1 )minimum, ini hanya dicapai apabila 1 = x(i) . Jadi parameter 1 adalah 1 = x(i) .
Selanjutnya,
d d 1
1 n 2 i =1 ( x 1
[logl ( | x )] = n2 +
n ( x ) i 1 =1 2 2
+ in=1 ( x
n x n i 1 =1 i n nx nx(1) n
1 ) = 0 =
n (x ) i 1 = =1 n
atau
n x nx i (1) =1 i n
n x n i =1 i
nnx(1) n
= = x x (1) = x x benar-benar maksiUntuk membuktikan bahwa 2 (1) mum global, harus ditunjukkan:
d [logL ( | x )]2 = < 0; sebagai berikut 2 d 1
96
ISBN 978-602-8310-02-4
d d 1
[logL ( | x )]2 = =
2
n
2 2
= = = = = =
1
n (x ) n 2 2 i 1 =1
2 2
x x (1)
n x x(1) 2 xi + 2nx(1)
3
x x (1)
nx nx(1) 2 xi + 2nx(1)
1
3
( x x (1) )
1
nx 2nx + nx(1)
3
( x x (1) )
nx + nx(1)
n
x x (1)
Karena n > 0dan x x(1) > 0, maka dd = 1 [ logL ( | x )]2 =2 n 3 < 0. ( x x (1) ) Dengan demikian disimpulkan bahwa MLE untuk parameter = xx 2 adalah: 2 (1) 9. Jika y1 , y2 , ...y variabel random iid berdidstribusi Poisson dengan mean dan distribusi Prior adalah gamma dengan parameter , ( | , ) = Pertanyaan: (a) tentukan distribusi posterior dari ; posterior mean dan variansinya. (b) Myatakan posterior mean, sebagai rata-rata tertimbang dari MLE dan prior mean (c) Tentukan behaviour dari posterior mean dengan membuat variasi dan n, serta MLE dan prior mean tetap. Penyelesaian: yi P ( ) , berarti densitas dari y adalah f (y | ) = 0, 1, 2...
Bab 3. Estimasi Titik
y e y! ; y
1 e ; > 0 r ()
97
ISBN 978-602-8310-02-4
distri-
(y | ) = Dihitung dulu:
0
f y | . ( y | , )
0
f y | ( y | , ) d
(3.79)
f y | ( y | , ) d =
= = = =
Substitusi 2 ke 1 diperoleh: a |y
0 0 0 0 0
1 yi e n yi ! . r ( ) e 1 yi e n yi ! . r ( ) e 1 yi e n yi ! . r ( ) e 1 yi e n . e yi ! r () 1 yi e n yi ! . r ( ) e
(3.80)
= =
Atau distribusi Posterior diatas dapat juga dihitung dengan cara sebagai berikut: |y k1 Karena: k1 ki
0
f y | ( )
1 e yi . y! r () y + 1 n i e (n+ )
k.
en
(3.81)
yi +1 eu d , maka :
(n + )
yi +
yi +1 eu du = 1
98
ISBN 978-602-8310-02-4
( n + ) yi + r ( yi + ) = 1 k 1 = r ( yi + ) ( n + ) yi +
ki 4 ke 3 diperoleh: |y =
(3.82)
( n + ) y i + y i + 1 ( n + ) e r ( yi + )
= = = = =
E ( | y) = E 2 | y
( n + ) yi + yi + ( n + ) .e d 0 r ( yi + ) . y+ ( n + ) yi + u . .eu . (ndu n + 0 + ) r ( yi + ) y+ u 1 u e du r (yi +)(n+ ) 0 r ( y i + +1) ( n + )r ( yi + ) (yi +)(yi +1) (n+ )(yi +1) ( yi + ) (n+ )
= = = = =
= = =
b. Dinyatakan Posterior mean, sebagai rata-rata tertimbang dari MLE dan prior mean. Estimator maksimum likehood dari adalah: Fungsi likehood dari y: L ( | y) = in =1 f ( y i | ) =
Bab 3. Estimasi Titik
yi e n in =1 y i !
99
ISBN 978-602-8310-02-4
logL ( | y)
yi d n, syarat perlu adanya maksimum d { logL ( | y ) } = d d { logL ( | y ) } = 0, sehingga persamaan likehoodnya adalah: yi n = 0 yi = n = 0. Jadi calon MLE dari adalah: 2 y y = n i = y karena dd 2 {logL ( | y)}] = = i < 0, maka y MLE dari parameter adalah = n i = y.
= = = = = =
yi + , (n+ )
MLE
dari : = n i = y Prior mean dari : E ( ) = . Jadi Posterior dapat dinyatakan seabgai rata-rta tertimbang dari MLE dan Prior mean, sebagai berikut: yi + yi = a n + b (n+ ) n yi + nb = (n + ) a yi + a yi +nb yi + = n+ n (n + ) nb atau ini dapat disajikan sebagai: n = (n + ) a dan n = (n + ) n atau a= Sehingga diperoleh:
Bab 3. Estimasi Titik
n dan b = (n + ) (n + )
100
ISBN 978-602-8310-02-4
n yi + = (n + ) (n + )
yi n
( ) (n + )
(3.83)
Dari persamaan * dapat diamati bahwa. (i) Jika n besar dengan tetap, maka Posteriormean sama dengan MLE dari , yaitu E ( | y) = limn
yi n + n+ n+ n ( yi (1) n + (0) ( ) yi n
= = =
(ii). Jika besar dengan n tetap, maka posterior mean sama dengan mean prior dari , yaitu E ( | y) = limn
yi n + n+ n+ n ( y (0) n i + (1) ( )
= = =
E ( )
= = = =
n.
n+ y n. n i + n + . n.y + 1 n+ E( . ) n (y) + n+ E( n + ) E( )
yi n +
( )
Dari persamaan terakhir ini dapat dilihat bahwa (i). Jika n besar dan tetap, maka Posterior mean sama dengan MLE dari , yaitu: E ( | y) = limn n n + E ( )
(y) +
( ) n + E ( )
=y
(ii). Jika besar dan n tetap, maka posterior mean sama dengan
Bab 3. Estimasi Titik
101
ISBN 978-602-8310-02-4
(y) +
E ( )
n+ E( )
( )
= =
10. Misalkan y1 , y2 , ...yn variabel random iid berdistribusi Poisson dengan mean , dan distribusi prior adalah Gamma dengan parameter , ( | , ) = 1 e r ()
Pertanyaan: tentukan estimator Bayes dari untuk fungsi-fungsi kerugian berikut, (i). L ( a, ) = ( a, )2 (ii). L ( a, ) = ( a, )12 (iii). L ( a, ) = ( a )4 (iv). L ( a, ) =| a | 11. Diketahui:x1 , x2 , ...xn variabel random iid berdistribusi B (l , ) , = (0, 1). Tunjukkan x adalah UMVU estimator untuk . Penyelesaian: Xi B (l , )maka densitas dari Xi adalah: f ( xi | ) = xi (1 )1 xi ; xi = 0, 1; i = 1, 2, ..., n Densitas bersama dari xi adalah: f ( x | B) = in =1 f ( x i | ) = xi (1 ) n xi = xi (1 ) n (1 ) xi
= =
(1 ) n
xi
102
ISBN 978-602-8310-02-4
kup untuk parameter Sekarang ditunjukkan T ( x ) = xi adalah statistik cukup dan lengkap xi B (1, ),Mgfnya adalah Mx (t) = (1 ) + et Mgf dari T ( x ) = xi adalah: MT ( x) (t) = M xi (t) = { Mx (t)}n , karena xi iid = (1 ) + et ini adalah Mgf dari distribusi Binomial (n, ). Jadi diperoleh: xi B (1, ) T ( x ) = xi B (n, ) Sehingga: densitas dari T ( x ) = xi adalah f ( xi | ) = n t t (1 )nt ; dengan t = xi , dan t = 0, 1, 2, ..., n n t t (1 )nt adalah
t (1 ) n t n t n t t (1 ) t
1
= (1 ) n n t =0 g ( t ) = : 0 < < 1.
Karena (1 )n n t =0 g ( t ) n t
(1 ) n n t =0 g ( t )
0 maka n t =0 g ( t )
1 ,
n t
yt = 0; dengan y =
n , karet na polinomial berniali nol y, maka setiap koesien harus = 0. n Karena = 0, berarti g (t) = 0, dengan t = 0, 1, 2, ..., n. t Dengan demikian, T ( x ) = xi adalah statistik cukup dan lengnomial derajat n dalam y. Koesien yt adalah g (t)
Bab 3. Estimasi Titik
103
ISBN 978-602-8310-02-4
kap.
n n n Selanjutnya, E [ T ( x )] = i =1 { x i } = i =1 E ( x i ) = i =1 = n Sekarang, misalkan:
(T ) =
E [ ( T )] = E
n T = i = x, maka n n
xi n
1 n 1 i =1 E ( x i ) = . n n n
T n
= xadalah
12. Misalkan x1 , x2 , ..., xn variabel random berdistribusi gamma dengan diketahui dan = = (0, )tidak diketahui. Tentukan, bahwa UMVUE dari adalah: 1 n x n j =1 j Dan tentukan variannya, serta batas cramer-Rao. Penyelesaian: Xi Gamma (, = ),maka densitas dari xi adalah: u ( x1 , x2 , ..., xn ) = f ( Xi | = ) = 1 xi1 e xi r ()
= =
1 n x 1 n x 1 e j =1 i [r ()]n n i =1 i 1 1 n in n e j =1 x i =1 x i n n [r ()]
n x adalah statistik Berdasarkan teorema faktorisasi, berarti T ( x ) = 1 i cukup untuk = . n x sebagai berikut. Ditentukan distribusi dari T ( x ) = 1 i Diketahui bahwa: Xi G (, =)maka, Mgf dari distribusi ibi adalah: Mxi (t) = (1 t ) .
104
ISBN 978-602-8310-02-4
MT ( x ) ( t ) =
n x (T ) M 1 i
= = =
[ Mxi (t)]n
(1 t ) (1 t ) n
Bentuk terakhir ini menyatakan T ( x ) = xi G (n, =) Sehingga densitas dari T ( x ) = xi adalah: f ( xi = t | = ) = 1 t n 1 e t n r (n)
;t > 0
(3.84)
u 0
dt dt
1 r (n) n
g ( t ) t n 1 e t
1 r (n) n
> 0,jadi
g (t)
1 t n 1 e t r (n ) n
dt
(3.85)
Karena persamaan * merupakan transformasi Laplace dari fungsi g (t) tn1 , maka menurut sifat tranformasi ini, haruslah: g (t) tn1 = 0. Dengan demikian statistik T ( x ) = xi adalah statistik cukup dn lengkap. n Ex E ( T ( x )) = E ( xi ) = i i =1 Dihitung n n = i = T 1 n Misalkan ( T ) = n = n j=1 x j = U ( x1 , x2 , .., xn ) Maka:
karena xi iid
105
ISBN 978-602-8310-02-4
E { ( T )} = E {U ( x1 , x2 , .., xn )}
= = = =
1 n x j 1 n n j =1 x j 1 n n
Ternyata ( T ) = U ( x1 , x2 , .., xn ) = n1 n j x j adalah estimator tidak bias bagi Dengan demikian, U ( x1 , x2 , .., xn ) = ( T ) = n1 n j x j adalah UMVU estimator untuk Selanjutnya duhitung variansi dari U ( x1 , x2 , .., xn ) = n1 n j x j yaitu: Var (U ( x1 , x2 , .., xn )) = Var
1 n x j
= = = =
1 Var x j n2 2 1 2 n2 2 1 n 2 n2 2 2 n
; x > 0log f ( x | )
d [log f ( x | )] d
106
ISBN 978-602-8310-02-4
d [log f ( x | )] d
2 2 1 3 E ( x ) + 4 E x2 2 2 2 1 = 2 3 + 4 2 + 2 2 2 2 = 2 3 + 2+ 2 = 2
Karena distribusi gamma memenuhi Teorema Cramer-Rao maka untuk sembarang estimator tak bias untuk , sebut saja w = h ( x ), berlaku: 1 Var (w) 2 d nE{ d [log f ( x | )]} 1 = n
=
2
2 n
Jadi batas Crame-Rao adalah n . Terlihat bahwa varians dari estimator tak bias 1 n U ( x1 , x2 , .., xn ) = n j=1 x j sama dengan batas Cramer-Rao, yai-
13. Misalkan x1 , x2 , .., xn variabel random iid, dengan E ( xi ) = ; E | xi |2 < ,dan Var ( x ) = 2 .
107
ISBN 978-602-8310-02-4
Penyelesaian: T ( x1 , x2 , .., xn ) =
2 n ix 2( n +1) i i 2 { x1 + 2x2 + 3x3 + .. + nxn } 2( n +1) 2 E { x1 + 2x2 + 3x3 + .. + nxn } 2( n +1) 2 2( n +1)
= = = = = = =
{ E ( x1 ) + 2E ( x2 ) + 3E ( x3 ) + .. + nE ( xn )}
2 { + 2 + 3 + ... + n} 2( n +1) 2 {1 + 2 + 3 + ... + n} 2( n +1) 2 1 2 n ( n + 1) 2( n +1)
Jadi T ( x1 , x2 , .., xn )adalah estimator tak bias untuk . Dengan kata lain bias T ( x1 , x2 , .., xn ) = E ( T ( x1 , x2 , .., xn )) = = 0. Jadi : limn {bias T ( x1 , x2 , .., xn )} = 0 (3.86)
2 0 ix 2( n +1) i i
(3.87)
Dari 1 dan 2,
Bab 3. Estimasi Titik
14. Misalkan X1 , ..., Xn sampel random dari populasi N (, 2 ). Tunjukkanlah bahwa X adalah UMVUE untuk Bukti E( X ) = 1/n.n = . Jadi X estimator tak bias untuk . Var ( X ) = 2 /n. Sekarang akan dicari batas bawah Cramer-Rao f (x) =
1 2 2 1 e 2 ( x ) ; < x < 1/2 (2 )
(3.88)
ln f ( x ) = ln (2 )1/2
1 ( x )2 2 2
(3.89)
ln f ( x ) 1 = 2 ( x ) Sehingga E ln f ( x )
2
(3.90)
1 E 2 1
( x )
1 1 .1 = 2 2
(3.91)
2 n
(3.92)
Karena X estimator tak bias untuk dan Var ( X ) = n sama dengan batas bawah Cramer-Rao maka menurut akibat teorema Cramer-Rao X adalah UMVUE 15. Misalkan X1 , ..., Xn i.i.d N ( , 1). Tunjukkan bahwa barisan estimator n = Xi . adalah konsisten. X n Jawab:
Bab 3. Estimasi Titik
109
ISBN 978-602-8310-02-4
2 n ( 1 )1/2 e1/2 t dt n 2
= P( n < z <
Karena itu Xn adalah barisan estimator konsisten untuk . Secara umum perhitungan mendetail seperti di atas tidak perlu dilakukan untuk membuktikan konsistensi. Ingat untuk suatu estimator n | ) Tn ketaksamaan Chebychev mengatakan bahwa P(| X 2 E( Tn ) sehingga limit E(Tn )2 = 0 adalah syarat cukup agar sua2 tu barisan T n konsisten. selanjutnya kita dapat menulis
2 + E T )2 = E( T ET 2 )2 + ( ET )2 E( Tn )2 = E(Tn ETn n n n n
= VarTn + [ Bias Tn ]2 16. Diketahui X1 , ..., Xn adalah i.i.d N (, 2 ). Tentukan estimator untuk dan 2 dengan MME. Jawab: Disini kita punya,
i =1
Xir , m1
= X , 1 = dan 2 = 2 + 2 . Solusi
n
17. Diketahui X1 , ..., Xn sampel random dari N ( , 1), < < . Tentukan MLE untuk Jawab: f ( x / ) = (2 )1/2 e1/2( x ) L ( / x ) = i =1 f ( x i / )
n
2
(3.93)
(3.94)
n
(3.95) (3.96)
110
ISBN 978-602-8310-02-4
Persamaan
d ln L( / x ) d
= 0 menghasilkan
Perhatikan bahwa .
d2 ln L( / x ) d 3
i =1
(Xi ) = 0 atau = X.
18. Diketahui X1 , ..., Xn sampel random dari f ( x; ) = Tentukan MLE untuk Jawab: Fungsi likelihoodnya, L( ; x1 , ..., xn ) = 1n ; 0 < xi merupakan fungsi dari yang monoton turun. Disini kita tidak dapat menentukan ELM denga turunan. Perhatikan bahwa, xi i sehingga max( xi ). Ini berarti, L maksimum dicapai pada statistik terurut ke-n yaitu max ( xi ). Jadi = max( xi ) adalah MLE untuk
1 ;
(3.97)
3.5
Soal-Soal Latihan
1. Misalkan x1 , x2 , ...xm ; y1 , y2 , ...yn variabel random independen masing-masing berdistribusi N (, 2 ) dan N ( , 2 ). Tentukan statistik cukup untuk ketiga kasus berikut: a) , , , sembarang dengan < , <, , > 0 b) = dan , , adalah sembarang c) = dan , , adalah sembarang 2. Diketahui distribusi uniform f ( x : ) = 1 ,0 x dan bernilai nol untuk x yang lain. Buktikan bahwa 2X estimator takbias untuk . 3. Diketahui 1 dan 2 adalah dua estimator takbias untuk dari dua eksperimen yang independent. Buktikan bahwa = c1 1 + c2 2 dengan c1 + c2 = 1 juga estimator tak bias untuk .
Bab 3. Estimasi Titik
111
ISBN 978-602-8310-02-4
4. Diberikan sampel random yang berukuran n dari populasi yang mempunyai mean (diketahui) dan variansi 2 . Perlihatkan bahwa varians sampel S2 = 2
1 n i =1
5. Perlihatkan bahwa jika estimator tak bias untuk dan Var ( ) tidak sama dengan 0, maka 2 bukan estimator tak bias untuk 2 . 6. Jika estimator dari dan bias estimator ini diberikan oleh b = E( ) . Perlihatkan bahwa E ( )2 = Var ( ) + b2 7. Perlihatkan, jika estimator konsisten untuk maka k (k = 0) estimator konsisten untuk k 8. Diketahui X1 , ..., Xn berdistribusi identik dan independen dengan n X E( Xi ) = dan E(| Xi |2 ) < . tunjukkan bahwa T = n(n2 +1) i =1 i adalah estimator konsisten untuk . 9. Misalkan X1 , ..., Xn sampel dari U (0, ). Perlihatkan bahwa T =
n
10. Jika X1 , ..., Xn i.i.d N ( , 2 ). Buktikan (n 1)/2 [(n 1)/2] s/ [(n/2)] estimator tak bias un( n 1) S2 berdistribusi 2 tuk . Petunjuk: gunakan (n1) dengan 2 S2 =
1 n 1 i =1
( Xi X ) 2
var (2 ) . var (1 )
2 + X3 Tentukan esiensi estimator = X1 +2X terhadap X jika 4 X1, X2 dan X3 sampel random dari N (, 2 )
12. Apakah estimator pada soal no.10 konsisten? 13. Diketahui X1 , ..., Xn sampel random yang berdistribusi identik dan independen N (, ); > 0. Tentukan estimator tak bias dan konsisten untuk 2 .
Bab 3. Estimasi Titik
112
ISBN 978-602-8310-02-4
x n
15. Diketahui X1 , ..., Xn sampel random i.i.d Gama(, ); diketahui dan 0 < < . tentukan UMVUE untuk 16. Diketahui X1 , ..., Xn sampel random i.i.d Binomial (1, p); p (0, 1). Tentukan UMVUE untuk p. 17. Diketahui: x1 , x2 , ...xn variabel random iid berdistribusi exponensial negative, dengan parameter = (0, ). Gunakan teorema untuk menemukan UMVU Estimator dari parameter . 18. Misalkan x variabel random berdistribusi binomial negatif dengan parameternya = (, 1) .Tentukan UMVU estimator dari g ( ) = 1 dan cari variansnya. 19. Diketahui: x1 , x2 , ...xn variabel random iid berdistribusi exponensial negative, dengan parameter = (0, ). Gunakan teorema untuk menemukan UMVU Estimator dari parameter . 20. Misalkan x variabel random berdistribusi binomial negatif dengan parameternya = (, 1) .Tentukan UMVU estimator dari g ( ) = 1 dan cari variansinya. 21. Jika x1 , ..., xn nilai-nilai sampel random yang berukuran n dari populasi dengan distribusi f ( x; ) =
2( x ) ;0 2
Tentukan estimator untuk dengan metode momen 22. Diketahui X1 , ..., Xn berdistribusi identik dan independen (i.i.d) dengan distribusi seperti berikut : (a) f ( x; ) = x 1 ; 0 < x < 1, 0 < < , dan nol untuk x yang lain
Bab 3. Estimasi Titik
113
ISBN 978-602-8310-02-4
(b) f ( x; ) = (1/ ) exp [ x / ] , 0 < x < , 0 < < , dan nol untuk x yang lain (c) f ( x; ) = exp [( x )] , 0 < x , < < , dan nol untuk x yang lain. Dalam setiap kasus diatas, tentukan estimator untuk dengan metode likelihood maksimum 23. Misalkan x1 , x2 variabel random dengan fungsi padat peluang f (.; )yang diberikan oleh: 2 ( x ) I(0, ) ( x ) ; = (0, ) Tentukan estimator momen untuk . f (x | ) = 24. Tentukan estimator momen untuk dan , jika x1 , x2 , ...xn variabel random iid berdistribusi Beta dengan parameter dan . 25. Diketahui X1 , ..., Xn berdistribusi identik dan independen poisson (). Tentukan estimator untuk dengan metode momen dan likelihood maksimum. 26. Diketahui X1 , ..., Xn berdistribusi identik dan independen dengan distribusi f ( x; ) = ( + 1) x ;0 < x < 1 dan nol untuk x yang lain. Tentukan estimator untuk dengan metode momen dan likelihood maksimum. 27. Diketahui X1 , ..., Xn berdistribusi identik dan independen gama (, ). Tentukan dan dengan metode momen dan likelihood maksimum. 28. Diketahui sampel random berukuran n dari populasi normal dengan mean diketahui, tentukan estimator untuk dengan metode likelihood maksimum 29. Diketahui Sampel random berukuran n dari populsi yang mempunyai distribusi f ( x; ) = e( x ) untuk x > dan nol untuk x yang lain. Tentukan estimator untuk dengan metode likelihood maksimum.
Bab 3. Estimasi Titik
114
ISBN 978-602-8310-02-4
30. Dalam banyak kasus, sepertipada distribusi binomial, Poisson, Normal dan sebagainya terjadi bahwa MLE mean yang diestimasi adalah mean sampel. Namun kasus ini tidak perlu selalu terjadi seperti pada kasus berikut. Misalkan x1 , x2 , ...xn variabel random independen dengan distribusi N ( , ) : (0, ). Tunjukkan bahwa: MLE dari parameter adalah: = 1 2 4 n 2 x 1 + i n =1 j
2
115
ISBN 978-602-8310-02-4
116
ISBN 978-602-8310-02-4
Memahami konsep dasar estimasi interval dan mampu menerapkan baik dalam pemecahan masalam matematika, ilmu lain, maupun dalam kehidupan sehari-hari.
4.2
Setelah mengerjakan bab ini Anda diharapkan dapat: 1. Menjelaskan konsep dasar estimasi interval suatu parameter populasi 2. Menentukan interval kepercayaan mean bila variansinya diketahui. 3. Menentukan interval kepercayaan mean bila variansinya tidak diketahui 4. Menentukan interval kepercayaan beda dua mean 5. Menentukan interval kepercayaan untuk varians 6. Menentukan interval kepercayaan untuk rasio dua varians 117
4.3
4.3.1
Uraian Materi
Konsep Dasar Estimasi Interval
Sejauh ini telah dibicarakan estimasi titik untuk parameter populasi , di mana inferensinya adalah pendugaan harga tunggal terhadap . Estimator titik mempunyai kelemahan prinsip yaitu tidak memberikan informasi tentang ketepatan atau keakuratannya. Misalnya, = X adalah estimator terbaik untuk dari N (, 2 ). Jika sampel random yang berukuran n diambil, dan diperoleh X = 3, 5. Apakah dapat diyakini bahwa sudah sangat dekat dengan 3, 5 itu ? Untuk mengatasi kelemahan ini, diperkenalkan tipe estimasi lain yaitu estimasi interval. Dalam estimasi interval, atau secara lebih umum disebut juga estimasi himpunan yang dijadikan masa_ lah utama adalah pernyataan bahwa c dengan c dan c = c( x ). _ _ Ini merupakan himpunan yang ditentukan oleh X = x yang terobservasi. Bila berharga real, maka estimator himpunan c adalah interval. De f inisi Estimasi interval untuk parameter adalah pasangan fungsi L( x1 , ..., xn ) _ _ dan U (x1 , ..., xn ) dan sampel yang memenuhi L( X ) U ( X )untuk se_ _ _ _ _ mua x . Bila X = x terobservasi, dibuat inverensi L( X ) U ( X ). Interval random [L(X ),U (X )] disebut estimator interval. Seperti denisi _ _ terdahulu,[ L( X ), U ( X )] untuk estimator interval berdasar sampel ran_ _ _ dom X = ( x1 , ..., xn ) dan [ L( X ), U ( X )] harga terealisasi dari interval. Meskipun kasus mayoritas yang dibicarakan adalah harga-harga berhingga untuk Ldan U , kadang-kadang kita juga tertarik pada estimasi interval sa_ tu sisi. Sebagai contoh, bila L( x ) = , maka kita mempunyai selang satu sisi (, U ( x )). Dengan cara yang sama kita dapat mengambil U ( x ) = _ dan mempunyai interval satu sisi [ L( x ), ]. De f inisi Estimasi inteval untuk parameter adalah interval yang berbentuk L( X _ _ _ ) < < U ( X ) dengan L( X )dan U ( X ) adalah suatu kuantitas yang tak
Bab 4. Estimasi Interval
_ _ _
118
ISBN 978-602-8310-02-4
tergantung pada nilai dan distribusi sampling dari . Dengan kata lain, _ _ berdasarkan distribusi sampling kita pilih L( X )dan U ( X ) sehingga P( L( X ) < < U ( X )) = 1 dengan 0 < < 1
_ _ _ _
(4.1)
Interval L( X ) < < U ( X ) disebut interval kepercayaan (1 )100% _ _ dan (1 ) disebut koesien kepercayaan. L( X )dan U ( X ) berturut-turut disebut limit kepercayaan bawah dan limit kepercayaan atas. Misalnya = 0, 05 memberikan koesien kepercayaan 0, 95 dan interval kepercayaan 95%. Perhatikan bahwa yang lain bisa dipilih berdasarkan pertimbangan-pertimbangan statistik. Idealnya, dipilih sedemikian sehingga panjang interval kepercayaan terpendek, tetapi cakupan probabilitas (1 ) mendekati nilai 1 (kepastian) Contoh Untuk sampel X1 , X2 , X3 , X4 dan N (, 1), estimator interval dari adalah _ _ [ x 1, x +1]. Ini berarti kita menyatakan bahwa berada dalam interval _ = ) = 0. Tetapi dengan estiini. Bila kita mengestimasi dengan x, P( x mator interval, kita mempunyai probabilitas positif untuk benar. Probabi_ _ litas bahwa tercakup oleh interval [ x 1, x +1]dapat dihitung sebagai P [ [ x 1, x +1]] = P( x 1 x +1)
_ _ _ _
= P ( 1 x 1) = P ( 2
x 1/4
_
2)
119
ISBN 978-602-8310-02-4
Untuk estimator interval [ L( x ), U ( x )]dari parameter cakupan probabi_ _ _ litas dari [ L( x ), U ( x )] adalah probabilitas bahwa interval random. [ L( x _ ), U ( x )] mencakup parameter . Dalam notasi ini dinyatakan dengan _ _ _ _ P ( [ L( x ), U ( x )| ]) atau P ( [ L( x ), U ( x )| ]). De f inisi Estimator interval [ L( x ), U ( x )] untuk parameter , koesien keperca_ _ yaan dari [ L( x ), U ( x )]adalah inmum probabilitas cakupan atau inf _ _ P ([ L ( x ), U ( x )]). Ada beberapa hal yang perlu diperhatikan dari denisi tersebut. 1. Sangat penting untuk di ingat bahwa interval adalah besaran random, bukan parameter. Akibatnya, bila kita menulis pernya_ _ taan probabilitas seperti P ( [ L( x ), U ( x )| ]), pernyataan probabilitas tersebut menunjuk ke x bukan . Dengan perkataan lain, _ _ pikirkan P ( [ L( x ), U ( x )| ]) yang seperti pernyataan tentang random , sebagai sesuatu yang secara aljabar ekivalen dengan _ _ P ([ L( x ) , U ( x ) ) yaitu pernyataan tentang variabel random _ X . Estimator interval, bersama dengan ukuran kepercayaan, (biasanya koesien kepercayaan) dikenal dengan nama interval kepercayaan. Interval kepercayaan dengan koesien kepercayaan sama dengan (1 ) disebut (1 ) interval kepercayaan. 2. Hal penting lain berhubungan dengan cakupan probabilitas dan koesien kepercayaan. Karena kita tidak mengetahui harga sebenarnya dari , kita hanya dapat menjamin probabilitas cakupannya sama dengan inmum koesien kepercayaan. Dalam beberapa kasus hal ini tidak menjadi soal karena cakupan probabilitas merupakan fungsi konstan dari . Tetapi, dalam kasus yang lain cakupan probabilitas merupakan fungsi dari .
_ _
Contoh
Bab 4. Estimasi Interval
120
ISBN 978-602-8310-02-4
Jika X1 , ..., Xn adalah sampel random populasi seragam (0, ) dan misalkan Y = maks{ X , ..., Xn }, jika ingin mencari estimator interval untuk . Pandang dua calon estimator: [ aY , bY ], 1 a < b dan [Y + c, Y + d], 0 c < d dengan a, b, c, dan d konstanta. (Perhatikan bahwa perlu lebih besar dari Y ). Untuk interval pertama didapat: P ( [ aY , bY ]) = P ( aY bY )
1 b 1 b y 1 a 1 a
= P = P
T
1 b
; (T = )
1 a
Jadi, P
1 a 1 b
1 n n ntn1 dt = ( 1 a) (b)
Cakupan probabilitas interval pertama independen dengan harga . Jadi 1 n n (1 a ) ( b ) adalah koesien kepercayaan dari interval. Untuk interval lain, untuk d, perhitungan sejenis menghasilkan: P ( [Y + c, Y + d]) = P (Y + c Y + d])
d c
= P 1 =
c 1
T 1
1 d
ntn1 dt
c n n = (1 ) (1 d )
4.3.2
Ada dua metode untuk menentukan estimator interval yaitu dengan inversi uji hipotesis statistik dan menggunakan besaran pivot. 4.3.2.1 Inversi Uji Statistik
Ada hubungan antara estimasi interval dan uji hipotesis. Secara umum dapat dinyatakan bahwa setiap interval kepercayaan berkorespondensi dengan uji hipotesis dan sebaliknya. Jadi dari uji hipotesis dapat diturunkan
Bab 4. Estimasi Interval
121
ISBN 978-602-8310-02-4
estimasi interval. Namun karena uji hipotesis baru akan dibahas pada Bab V, maka pembahasan tentang hal ini disajikan pada Bab V Sub Bab mulai halaman ... 4.3.2.2 Besaran Pivot
Metode yang paling bagus dalam mengkonstruksikan himpunan estimator dan menghitung cakupan probabilitas adalah penggunaan besaran pivot. Penggunaan besaran pivot (pivotal quantity) untuk mengkonstruksi himpunan kepercayaan disebut pivotal inverence. De f inisi Variabel random Q( X , ) = Q( x1 , ..., xn , ) disebut besaran pivot bila dis_ tribusi dari Q( X , ) independen (tak mengandung) parameter populasi. _ _ _ Dengan kata lain: Jika X F ( x | ) maka Q( X , ) mempunyai distribusi yang sama untuk semua harga . Fungsi Q( X , ) biasanya secara eksplisit memuat parameter dan statistik, _ tetapi untuk sembarang himpunan A, P Q( X , ) A tidak dapat tergantung pada . Cara mengkonstruksikan himpunan kepercayaan dari pivot tergantung pada kemampuan mendapatkan pivot dan himpunan A sede_ mikian hingga himpunan { : Q( X , ) A} adalah himpunan estmatator (interval kepercayaan) dari . Contoh Dalam kasus lokasi dan skala terdapat banyak besaran pivot. Di sini akan ditunjukkan beberapa. Misalkan x1 , ..., xn adalah sampel random densitas _ ( dalam tabel ) dan misalkan x dan s adalah mean sampel dan deviasi standar.
_ _
Untuk membuktikan bahwa besaran-besaran di atas merupakan pivot, dapat ditunjukkan bahwa densitasnya independen dari parameter.
Bab 4. Estimasi Interval
122
ISBN 978-602-8310-02-4
Table 4.1: Besaran Pivot Bentuk Densitas Jenis Densitas Besaran Pivot _ x f ( x ) lokasi _ x x 1 skala f () _
1
f(
x- )
lokasi/skala
Contoh Jika x1 , ..., xn sampel random dari populasi N (, 2 ), maka statistik t = _ x- adalah pivot, karena distribusi statistik t tidak tergantung pada pas/ n rameter dan 2 . Contoh Misalkan x1 , ..., xn iid eksponensial (). Maka T = xi adalah statistik cukup untuk dan T Gamma(n, ). Dalam pd f gamma t dan muncul t dan kenyataannya bentuk pd f : bersama-sama sebagai Gamma(n, ) = ( P(n)n )1 tn1 e
t
T 2 Jika Q( T , ) = 2 maka Q( T , ) gamma n, ( ) = gamma(n, 2) 2T yang tidak tergantung pada . Besaran Q( T , ) = adalah pivot dengan gamma(n, 2) atau distribusi 2 .
Kadang-kadang kita dapat melihat bentuk pd f untuk melihat apakah ada t terlihat dalam pd f dan ia besaran pivot. Dalam contoh di atas, besaran_ x- menjadi pivot. Dalam pd f normal, besaran terlihat dan besaran ini juga merupakan pivot. Secara umum, misalkan pd f statistik T , f (t, ) dapat dinya Q ( t, ) takan dalam bentuk f (t, ) = g ( Q(t, )) | t | untuk suatu fungsi g dan fungsi monoton Q (dalam t untuk setiap ). Maka Q(t, ) merupakan pivot. Begitu mendapat pivot, selanjutnya bagaimana menggunakannya untuk _ membangun himpunan kepercayaan?. Bila Q( x, ) merupakan pivot, maBab 4. Estimasi Interval
123
ISBN 978-602-8310-02-4
ka untuk harga tertentu dapat ditemukan bilangan-bilangan adan b yang tidak tergantung pada dan memenuhi:
P ( a Q(t, ) b) 1 Maka untuk setiap 0 , A(0 ) = { x : a Q( x, 0 ) b}adalah daerah penerimaan untuk uji taraf dari H0 : = 0 . Hal ini memberikan hasil bahwa himpunan kepercayaan (1 ) untuk adalah: C ( x ) = { 0 : a Q ( x , 0 ) b }
_ _ _ _
Contoh Dalam contoh di muka telah didapatkan interval kepercayaan untuk dari pd f eksponensial dengan menginversikan LRT taraf dari H0 : = 0 vs H1 : = 0 . Sekarang kita juga melihat bila kita mempunyai sampel 2 . X1 , ..., Xn kita dapat mendenisikan T = Xi dan Q( T , ) = 2T X2 n Bila kita memilih konstantq a dan b sedemikian hingga memenuhi P( a 2 b ) = 1 , maka X2 n P ( a
2T
b) = P ( a Q( T , ) b)
2 b) = P ( a X2 n
= 1
Dengan menginversikan himpunan: A() = {t : a 2T b}
memberikan C (t) = { : 2bt 2at } yang merupakan interval keper2T cayaan (1 ). Bila n = , interval kepercayaan 95% adalah { : 34,17 2T 9,59 }. Untuk persoalan lokasi dengan kondisi variansi tidak diketahui pun pembangunan dan perhitungan interval pivot relatif mudah.
Bab 4. Estimasi Interval
124
ISBN 978-602-8310-02-4
Contoh Jika X1 , ..., Xn iid N (, 2 ) maka / n adalah pivot. Bila 2 diketahui, kita dapat menggunakan pivot ini untuk menghitung interval kepercayaan untuk . Untuk sebarang konstanta a
( x )
_
( x ) a) = P( a Z a) P( a / n
Sehingga interval kepercayaan adalah { : x a x +a }. n n _ _
( x ) . s/ n
mempunyai distribusi
( x ) a ) = P ( a Z a ). P( a / n
Jadi untuk tertentu bila kita mengambil a = tn1, , kita mendapatkan 2 bahwa interval kepercayaan (1 ) adalah
_ _ s s x +tn1, } { : x tn1, 2 2 n n
4.3.3
Dalam estimasi interval dua besaran dibandingkan satu dengan lainnya melalui ukuran dan kemampuan akurasi cakupannya. Tentu saja yang diinginkan adalah suatu interval yang mempunyai ukuran (panjang) yang kecil dan cakupan probabilitas besar. Cakupan probabilitas dari interval kepercayaan pada umumnya merupakan fungsi parameter. Karena itu, ukuran yang paling banyak digunakan adalah kelakuan koesien kepercayaan, yaitu inmum cakupan probabilitas ukuran dan probabilitas cakupan. Permasalahan dapat dirumuskan sbb: diberikan probabilitas cakupan tertentu, carilah interval kepercayaan terpendek.
Bab 4. Estimasi Interval
125
ISBN 978-602-8310-02-4
Table 4.3: Panjang interval kepercayaan a b 1, 34 2, 33 1, 44 1, 96 1, 65 1, 65 Probabilitas b-a P(z < a) = 0, 09; P(z > b) = 0, 01 3, 67 P(z < a) = 0, 075; P(z > b) = 0, 025 3, 40 P(z < a) = 0, 05; P(z > b) = 0, 05 3, 30
Contoh Misalkan X1 , ..., Xn iid N (, 2 )dengan diketahui. Telah kita ketahui _ x- bahwa Z = / n adalah besaran pivot dengan distribusi normal baku dan setiap anggota yang memenuhi P( a Z b) = 1 akan memberikan interval kepercayaan (1 )
_ _ { : x b x a } n n
Masalahnya menjadi: Berapa nilai a dan b yang terbaik ?, Dengan kata lain; Berapa nilai a dan b yang akan meminimumkan panjang interval kepercayaan dengan tetap mempertahankan cakupan (1 - )?. Perhatikan (b a) bahwa panjang interval kepercayaan sama dengan n . Karena faktor adalah bagian dari setiap panjang interval, ia dapat diabaikan dan pern bandingan panjang hanya bisa berdasarkan pada harga b a. Sehingga masalah sekarang menjadi; mencari pasangan bilangan a dan b yang memenuhi P( a < z < b) = 1 dan meminimumkan (b a). Biasanya diambil a = z z dan b = z tanpa menyebutkan apa yang 2 2 membuat optomal. Jika diambil 1 = 0, 90 maka setiap pasangan bilangan berikut memberikan interval 90%.
Pengalaman numerik ini menyarankan bahwa pemilihan a = 1, 65 dan b = 1, 65 memberikan interval kepercayaan terbaik. Perlu dicatat bahwa
Bab 4. Estimasi Interval
126
ISBN 978-602-8310-02-4
strategi untuk membagi interval dua sama besar (simetris) terbukti optimal dalam contoh di atas, tapi tidak selalu demikian. Untuk kasus di atas disebabkan oleh kenyataan bahwa tinggi dari pd f -nya adalah sama di z 2 . dan z 2 Teorema Unimodal Misalkan f ( x ) pd f yang unimodal. Bila interval [ a, b] memenuhi 1.
b a
f ( x )dx = 1
2. f ( a) = f (b) > 0dan 3. a x b, dengan x modus f ( x ). maka [ a, b]adalah interval kepercayaan yang terpendek di antara intervalinterval yang memenuhi kreteria nomer 1. Bukti Misalkan [ a1 , b1 ] adalah sebarang interval dengan b1 a1 < b a. Akan ditunjukkan bahwa ini mengakibatkan a1 f ( x )dx < 1 . Hasil ini akan dibuktikan hanya untuk a1 < a. Untuk kasus a < a1 dapat dibuktikan secara analog. Juga dua kasus yang perlu diperhatikan adalah b1 a dan b1 > a. Bila b1 a maka a1 b1 a x dan
b1 1 1 a1 f ( x ) dx f ( b )( b b a f ( x ) dx = 1 b1
a1 )
f ( a1 )(b1 a1 ) <
f ( a)(b a)
Bila b1 > a maka a1 a b1 < b, karena bila b1 lebih besar atau sama dengan b, maka b1 a1 lebih besar atau sama dengan b a. Dalam keadaan ini, dapat ditulis:
b1 a1
f ( x )dx =
a a1
b a
f ( x )dx + [
b b1
a a1
f ( x )dx
b b1
f ( x )dx ]
= 1+[
f ( x )dx
dan teorema terbukti bila dapat ditunjukkan bahwa pernyataan dalam kurung negatif. Sekarang, dengan menggunakan unimodalitas f , urutan a1 a b1 b, dan didapat:
a a1
b b1
f ( x )dx f (b)(b b1 )
Jadi
a a1
f ( x )dx
b b1
= f ( a ) ( a a1 ) ( b b1 ) = f ( a ) ( b1 a1 ) ( b a )
bernilai negatif. q.e.d Contoh Untuk interval kepercayaan normal berdasarkan pivot s / n , kita mengetahui bahwa interval kepercayaan (1 ) yang mempunyai panjang terpendek mempunyai bentuk
s s x b x a mempunyai a = tn1, dan b = tn1, . Panjang n n 2 2 interval merupakan fungsi S, dengan bentuk umum: Panjang(s) = (b s a) . n _ _ x-
_
Selanjutnya, jika dipandang kriteria harga harapan panjang (s) dan menginginkan untuk mendapatkan interval (1 ) untuk meminimumkan.
S S = (b a)C (n) . E (panjang (S) ) = (b a) E n n
Maka Teorema di depan berlaku dan pemilihan a = tn1, dan b = tn1, 2 2 memberikan interval kepercayaan yang optimal.
4.3.4
4.3.4.1
1. Interval untuk mean , dengan variansi 2 diketahui. Misalnya X variabel random yang berdistribusi N (, 2 ), dengan tidak diketahui.
Bab 4. Estimasi Interval
128
ISBN 978-602-8310-02-4
Jika X adalah nilai mean sampel dari populasi normal dengan mean dan variansi 2 (diketahui). Tunjukkan interval kepercayaan (1 )100% untuk diberikan oleh: X z/2 . < < X + z/2 . n n Penjelasan: (4.2)
X N ( , 2 ) X N ( , 2 / n ) Z =
X N (0, 1) / n
(4.3)
Perhatikan bahwa P (z/2 < z < z/2 ) = 1 dengan z/2 adalah kuantitas sehingga P( Z > z/2 ) = /2 Karena itu P z/2 < atau P( X z/2 . < < X + z/2 . ) = 1 n n Jadi interval kepercayaan (1 )100% untuk adalah: X z/2 . < < X + z/2 . n n (4.6) (4.5) X < z/2 / n
= 1
(4.4)
Untuk sampel besar (n 30) dapat digunakan TLP, sehingga inteval kepercayaan 4.6berlaku juga untuk variabel random sembarang (bukan distribusi tidak normal). 2. Interval untuk mean , dengan variansi 2 tidak diketahui. Jika x adalah nilai mean sampel dari populasi normal dengan mean dan variansi 2 tidak diketahui, maka interval kepercayaan (1 )100% untuk adalah: X t/2,n1 .
Bab 4. Estimasi Interval
(4.7)
ISBN 978-602-8310-02-4
Penjelasan: Karena variansinya 2 tidak diketahui maka dapat diganti dengan variansi sampel: 1 n 2 S = ( Xi X ) 2 (4.8) n i =1 sebagai estimator untuk 2 . Sebab jika xi berdistribusi N (, 2 ) maka n( x )/ berdistribusi t(n1) . nS2 /2 berdistribusi 2 dan ( n 1)
4.3.4.2
Sering kali lebih memungkinkan untuk melakukan estimasi interval untuk selisih parameter populasi 1 2 daripada untuk masing-masing. Misalkan X1 , X2, ..., Xn dan Y1 , Y2, ..., Ym dua sampel random dari dua populasi yang independen N (1 , 2 ) dan N (2 , 2 ); > 0 tidak diketahui. Masalah yang dihadapi sekarang, bagaimana inferensi interval untuk parameter perbedaan mean yaitu 1 2 ? Interval untuk mean 1 2 dengan variansi 2 > 0 tidak diketahui. Jika X dan Y berturut-turut mean sampel berukuran n dan m yang saling independen dari populasi N (1 , 2 ) dan populasi N (2 , 2 ) ;2 > 0 tidak diketahui, maka interval kepercayaan (1 )100% adalah: X Y aR < 1 2 < X Y + aR dengan a = t(/2;n+m2) dan R = Penjelasan:
2 dan S2 . Perhatikan bahwa Variansi sampelnya berturut-turut S1 2
2 1 (1/n + 1/m) (n+ m 2)
(4.9)
(nS2 +nS2
Xi (i = 1, 2, ..., n) N (1 , 2 ) X N (1 , 2 /n)
Bab 4. Estimasi Interval
(4.10)
130
ISBN 978-602-8310-02-4
(4.11)
T =
X Y ( 1 2 ) 2 2 : (nS1 + mS2 )/2 (n + m 2 1/2 (4.13) 2 / n + 2 / m X Y ( 1 2 ) = t ( n + m 2) (4.14) 2 + mS2 nS1 2 (1/n + 1/m n+m2
Interval kepercayaan (1 )100% adalah P( a < T < a) = 1 ; dengan a = t/2;n+m2 dan P( X Y aR < 1 2 < X Y + aR) = 1 dengan R= (4.15)
(1/n + 1/m
(4.16)
Jadi interval kepercayaan (1 )100% untuk perbedaan mean adalah X Y aR < 1 2 < X Y + aR X Y aR < 1 2 < X Y + aR (4.17)
4.3.4.3
Setelah di drpan dibahas interval kepercayaan untuk mean , maka kini dibahas interval kepercayaan untuk variansi 2 .
Bab 4. Estimasi Interval
131
ISBN 978-602-8310-02-4
Interval untuk variansi 2 dengan mean yang tidak diketahui. Jika X1 , X2, ..., Xn sampel random dari distribusi N (, 2 ) dengan tidak diketahui maka interval kepercayaan (1 )100% untuk 2 adalah: ns2 2 (1/2,n1) Penjelasan: Dengan menggunakan metode likelihood maksimum diperoleh 2 = S2 = 1/n ( Xi X )2 dan variabel random nS2 /2 berdistribusi 2 (n1) karena itu,
i =1 2 2 2 P ( 2 (/2,n1) < nS / < (1/2,n1) = 1 n
< 2 <
ns2 2 (/2;n1)
(4.18)
(4.19)
atau P
ns2 2 (1/2,n1)
< 2 <
ns2 2 (/2;n1)
= 1
(4.20)
< 2 <
ns2 2 (/2;n1)
(4.21)
Jika X1 , X2, ..., Xn dan Y1 , Y2, ..., Yn dua sampel random yang saling independen dari populasi N (1 , 2 ) dan populasi N (2 , 2 ) dengan 1 dan 2 tidak 2 / 2 adalah diketahui, maka interval kepercayaan (1 )100% untuk 2 1
2 / ( m 1) 2 2 / ( m 1) mS2 2 mS2 < < F (1/2;n1;m1) 2 / ( n 1) 2 2 / ( n 1) F(1/2;m1;n1) nS1 1 nS1 (4.22)
Penjelasan:
Bab 4. Estimasi Interval
132
ISBN 978-602-8310-02-4
(4.23)
dan 2 =
2 X , 2
2 S2
= 1/n (Yi Y )2
i =1
(4.24)
(4.25)
= 1
(4.26)
atau P F(/2;n1;(m1)
2 2 / ( m 1) 2 / ( m 1) 2 mS2 mS2 < < F = 1 (1/2;n1;(m1) 2 / ( n 1) 2 2 / ( n 1) nS1 1 nS1 (4.27)
atau
2 2 / ( m 1) 2 / ( m 1) mS2 2 mS2 < < F = 1 ( 1 /2; n 1; m 1 ) 2 / ( n 1) 2 2 / ( n 1) F(1/2;m1;n1) nS1 1 nS1 (4.28) 2 2 Jadi interval kepercayaan (1 )100% untuk 2 /1 adalah
133
ISBN 978-602-8310-02-4
4.4
1. Tentukan interval kepercayaan 95 % untuk mean dari N (, 9) dengan sampel berukuran 100 dan x = 5 Jawab:
(1 )100% = 95% (1 ) = 0, 95
Berdasarkan tabel Z, untuk (1 ) = 0, 95 diperoleh z/2 = 1, 96. = 1, 96.3/10 = 0, 588 Untuk 2 = 9 dan n = 100 diperoleh z/2 . n Menurut teorema 8, interval kepercayaan 95% untuk adalah X < < X + z/2 . 5 0, 588 < < 5 + 0, 588 z/2 . n n 4, 412 < < 5, 588 2. Diketahui X1 , X2, ..., X10 sampel random dari N (, 2 ) ; dan 2 keduanya tidak diketahui. Misalnya dari hasil eksperimen diperoleh x = 3, 22 dan s = 1, 05. Tentukan interval kepercayaan 90% untuk . Jawab: Berdasarkan Tabel t, diperoleh t(0,05;9) = 1, 833. Interval kepercayaan 90% untuk adalah 3, 22 2, 833.1, 05/3 < < 3, 22 + 1, 833.1, 05/3 2, 56095 < < 3, 87905 3. Diketahui dua sampel random yang independen yang masingmasing berukuran 10 dan 7 yang diambil dari dua populasi berdistribusi N (1 , 2 ) dan N (2 , 2 ). Misalkan x = 4, 2, y = 3, 4, dan 2 = 32, tentukan interval kepercayaan 90% untuk . S2 2 1 Jawab:
R=
(1/n + 1/m
(1/10 + 1/7)
134
ISBN 978-602-8310-02-4
Dari tabel t diperoleh a = t(0,05;15) = 1, 753. Sehingga menurut teorema 11, diperoleh 0, 8 1, 753.3, 4 < 1 2 < 0, 8 + 1, 753.3, 4 5, 16 < 1 2 < 6, 76 (4.31) Jadi interval kepercayaan 90% untuk 1 2 adalah
5, 16 < 1 2 < 6, 76
(4.32)
4. Jika dari data yang diobservasi dari populasi normal diperoleh s = 2, 2 dan n 16. Tentukan interval kepercayaan 98% untuk 2 ! Jawab:
2 Dari tabel 2 diperoleh 2 ( 0,01;15) = 5, 23 dan ( 0,99;15) = 30, 6 sehingga diperoleh
16(2, 2)2 16(2, 2)2 < 2 < 2, 53 < 2 < 14, 81 30, 6 5, 23
(4.33)
5. Misalkan dua sampel random yang berukuran 10 dan 5 diambil dari dua populasi yang independet yaitu N (1 , 2 ) dan populasi 2 = 20, 0 dan N (2 , 2 ). Dari hasil observasi tersebut diperoleh S1
2 = 35, 6. Tentukan interval kepercayaan 95% untuk S2 mean populasi tidak diketahui.
2 2 2 1
bila kedua
Jawab: Dalam hal ini, 1 /2 = 0, 975, n = 10 dan m = 5. Berdasarkan tabel F, diperoleh F(0,975;9;4) = 8, 90 dan F(0,975;4;9) = 4, 72 sehingga menurut teorema 12 2 1 5(35, 6)/4 5(35, 6)/4 < 2 < (8, 90) 2 4, 72 10(20, 0)/9 10(20, 0)/9 1 atau 0, 4 <
Bab 4. Estimasi Interval
2 2 < 17, 8 2 1
(4.34)
135
adalah 0, 4 <
< 17, 8
4.5
Soal-Soal Latihan
1. Diketahui nilai observasi mean x dari sampel random yang berukuran 20 dari distribusi n(, 80) adalah 81, 2. Tentukan 95% interval kepercayaan untuk 2. Misalkan x mean dari sampel random yang berukuran n dari distribusi n(, 9). Tentukan n sehingga P( x 1 < < x + 1) = 0, 90 3. Diketahui sampel random yang berukuran 17 dari distribusi normal N (, 2 ) diperoleh x = 4, 7 dan s2 = 5, 76. Tentukan 90 % interval kepercayaan untuk . 4. Jika X1 , X2, ..., X9 sampel random berukuran 9 dari distribusi N (, 2 ) (a) Jika diketahui, tentukan peluang 95% interval kepercayaan untuk jika interval ini didasarkan pada variabel random 9( x ) / (b) Jika tidak diketahui, tentukan nilai harapan dari panjang 95% interval kepercayaan untuk jika interval didasarkan pada va riabel random 8( x )/S 5. Diketahui Y berdistribusi Binomial (n, p). Tentukan interval kepercayaan (1 )100% untuk p. (petunjuk : pertimbangkan Y /n sebagai estimator untuk p; dengan Y banyak sukses dalan n percobaan 6. Dari soal no 9berapakah n terkecil yang menjamin (dengan probabilitas 1 ) bahwa y/n terletak dalam jarak d dari p 7. Misalkan Y berdistribusi b(300, p). Jika nilai observasi dari Y adalah y = 75, tentukan interval kepercayaan 95% untuk p
Bab 4. Estimasi Interval
136
ISBN 978-602-8310-02-4
8. Diketahui dua sampel random yang masing-masing berukuran 10 yang dari dua distribusi normal independen N (1 , 2 ) dan N (2 , 2 ) 2 = 8, 64, y = 5, 6, S2 = 7, 88. dari observasi diketahui x = 4, 8, S1 2 Tentukan inteval kepercayaan 95% untuk 1 2 . 9. Tentukan interval kepercayaan untuk perbedaan 1 2 antara dua mean dari dua distribusi normal yang independen jika kedua variansinya diketahui (tidak perlu sama) 10. Diketahui dua variabel random X dan Y yang bebas secara probabilitas dengan distrubusi binomial yang mempunyai parameter n1 = n2 = 100, dan berurut p1 dan p2 . Dari observasi diperoleh x = 50 dan y = 40.Tentukan interval kepercayaan 95% untuk p1 p2 11. Diketahui X dan Y mean dari dua sampel random yang masingmasing berukuran n dari distribusi N (1 , 2 ) dan N (2 , 2 ); dengan diketahui. Tentukan n sehingga P( X Y /5 < 1 2 < X Y + /5) = 0, 90 (4.36)
12. Seperti teorema 10, tentukan interval kepercayaan (1 )100% untuk 2 bila diketahui 13. Jika 8, 6; 7, 9; 8, 3; 6, 4; 8, 4; 9, 8; 7, 2; 7, 8; 7, 5 adalah nilai yang diobservasi dari sampel random yang berukuran 9 dari N (8, 2 ). Tentukan interval kepercayaan 90% untuk 2 14. Dari hasil observasi suatu sampel random yang berukuran 15 dari distribusi N (, 2 ) diperoleh x = 3, 2 dan s2 = 4, 24 . Tentukan interval kepercayaan 95% untuk 2 15. Diketahui dua sampel random independent yang berukuran n = 16 dan m = 10 diambil dari populasi independent N (1 , 2 ) dan 2 N (2 , 2 ) . Misal x = 3, 6 dan s2 1 = 4, 14 dan Y = 13, 6 dan s2 = 7, 26. Tentukan interval kepercayaan 90% untuk 2 2 bila kedua mean pupo1 lasi tidak diketahui.
Bab 4. Estimasi Interval
2
137
ISBN 978-602-8310-02-4
16. Seperti teorema 11, tentukan interval kepercayaan (1 )100% bila kedua mean pupulasi diketahui.
2 dan S2 notasi variansi sapel random yang beru17. Misalkan S1 2 kuran n dan m dari dua distribusi independen N (1 , 2 ) dan N (2 , 2 ).Tentukan interval kepercayaan (1 )100% untuk 2
18. Misalkan X1 , X2, ..., Xn sampel random yang berikuran 6 dari distrinusi Gamma(1 ); > 0 tidak diketahui. Tentukan interval kepercayaan (1 )100% untuk . Petunjuk : Pertimbangkan distribusi dari2 Xi /
i =1 6
19. Diketahui Y4 = order statistik ke -4 dari sampel random berukuran 4 dari disttribusi uniform (0, ). Tentukan a dan b. Dengan 0 < a < b 1 sehingga P( a < Y4 < b ) = 0, 95. Kemudian tentukan interval keperayaan 95% untuk .
138
ISBN 978-602-8310-02-4
Memahami konsep dasar uji hipotesis statistik dan mampu menerapkannya baik dalam pemecahan masalah matematika, ilmu lain, maupun dalam kehidupan sehari-hari
5.2
Setelah mengerjakan bab ini Anda diharapkan dapat: 1. Menjelaskan konsep dasar hipotesis dan hipotesis statistik 2. Menganalisis uji hipotesis berdasarkan uji ratio likelihood 3. Menjelaskan tipe kesalahan suatu uji hipotesis statistik 4. Membedakan antara hipotesis sederhana dengan hipotesis gabungan 5. Menentukan daerah kritis suatu uji hipotesis 6. Menentukan fungsi kekuatan uji hipotesis 139
7. Menggunakan teorema Neyman-Pearson untuk menentukan daerah kritik terbaik 8. Menentukan uji paling kuat seragam dari suatu uji hipotesis 9. Menentukan uji hipotesis dengan menggunakan uji rasio likelihood
5.3
5.3.1
Uraian Materi
Konsep Dasar Uji Hipotesis
Sejauh ini telah dibahas inferensi titik dan interval. Sekarang diperkenalkan metode inferensi yang lain yaitu uji hipotesis Secara umum dapat didenisikan bahwa Hipotesa adalah pernyataan tentang parameter populasi. Hal ini dapat berupa pernyataan bahwa 1 = 2 vs 1 = 2 dan lain-lain. Sedangkan Hipotesis Statistik adalah pernyataan tentang distribusi dari satu atau lebih sampel random yang diambil dari populasi. Tujuan dari uji hopotesis statistik adalah untuk memutuskan berdasarkan sampel, mana dari dua hopetesis (yang saling asing) yang benar. Dua hipotesis yang saling asing itu biasa disebut hipotesis nol ( H0 ) dan hipotesis alteratif ( H1 ). Misal H0 : g( x ) N (10, 2 ) H1 : g( x ) N (, 2 ), = 10 Untuk mempermudah kedua hipotesis statistik ini cukup ditulis sbb: H0 : = 10 vs H1 : = 10 De f inisi Dua buah peryataan (hipotesa) yang saling asing dalam persoalan uji hipotesa disebut hipotesa nol dan hipotesa alternatif. Masing-masing dinyatakan dengan H0 dan H1 . Bila menyatakan parameter populasi, format umum dari hipotesa nol dan alternatif adalah:
Bab 5. Hipotesis Statistik
(5.1) (5.2)
140
ISBN 978-602-8310-02-4
c H0 : 0 danH1 : 0 c adalah dengan 0 suatu himpunan bagian dari ruang parameter dan 0 c = = ; < < . komplemennya dimana 0 0 { }
Dalam uji hipotesa sesudah mengobservasi sampel, harus ditentukan apakah menerima H0 yang berarti menolak H1 atau menerima H1 yang berarti menolak H0 . De f inisi Himpunan bagian ruang sampel dimana H0 ditolak disebut daerah penolakan atau daerah kritis. Komplemen daerah penolakan disebut daerah penerimaan. Jika rentang H1 seluruhnya terletak pada satu sisi dari nilai H0 , alternatif itu dikatakan satu sisi. Jika H1 memuat semua nilai parameter kecuali satu nilai H0 maka alternatif itu disebut dua sisi. Jika pernyataan suatu hipotesis berkaitan hanya dengan satu distribusi maka disebut hipotesis tunggal (sederhana), sedangkan jika berkaitan lebih dari satu distribusi dinamakan hipotesis majemuk (gabungan). Sebagai contoh: H0 : 10 vs H1 : > 10 merupakan hipotesis majemuk. Jika H0 diganti dengan = 10 maka diperoleh hipotesis tunggal.
5.3.2
Metode rasio likelihood atau likelihood ratio test (LRT) dalam uji hipotesis berhubungan dengan estimator likelihood maksimum dan uji tersebut secara luas dapat diterapkan. Ingat bila x1 , ..., xn adalah sampel random dari populasi dengan densitas f ( x | ) ( bisa berupa vektor), fungsi likelihood didenisikan sebagai L( | x1 , ..., xn ) = f ( x | ) =
_ n i =1
f ( xi | )
Misalkan dinyatakan ruang parameter. Uji rasio likelihood didenisikan sebagai berikut.
Bab 5. Hipotesis Statistik
141
ISBN 978-602-8310-02-4
De f inisi
c Uji statistik rasio likelihood (LRT ) untuk uji H0 : 0 vsH1 : 0 adalah
) o L( | x n ) = Sup ( x ) L( | x Uji rasio likelihood adalah uji sedemikian hingga daerah penolakan mem_ _ punyai bentuk:{ x : ( x ) C }dengan C sembarang bilangan yang memenuhi 0 C 1. Contoh Misalkan x1 , ..., xn adalah sampel random dari populasi N ( , 1). Pandang uji hipotesa H0 : = 0 vsH1 : = 0 . Di sini 0 adalah bilangan tertentu. _ Karena H0 hanya menentukan satu bilangan, maka pembilang dari ( x ) _ adalah L(0 | x ). MLE dari untuk ruang parameter tanpa kendala adalah _ _ _ mean sampel x. Jadi penyebut dari ( x ) adalah L( x | x ). Sehingga statistik LRT adalah
Sup
= exp
_
( xi 0 )2 + ( xi x )2 /2
( x i 0 )2 = ( x i x )2 + n ( x i 0 )2
Jadi, statistik LRT adalah ( x ) = exp n( xi 0 )2 /2
Bab 5. Hipotesis Statistik
_
(5.3)
142
ISBN 978-602-8310-02-4
LRT adalah uji yang menolak H0 untuk harga-harga ( x ) kecil. Dengan menggunakan 5.3 didapat daerah penolakan:
_ _
{ x : ( x ) C } = { x : | x 0 |
2 log c
2 log c } n
< . Jadi LRT adalah uji yang dimana 0 < c < 1,dan 0 < n menolak H0 bila mean sampel berbeda dengan 0 melebihi harga tertentu yang ditetapkan.
Bila T ( x ) statistik cukup antara dengan densitas g(t| ), maka dapat dipikirkan untuk mengkonstruksikan LRT berdasar pada T dan fungsi like_ lihoodnya L ( |t) = g(t| ) sebagai pengganti sampel x dan fungsi likeli_ hoodnya L( | x ). Misalkan (t) menyatakan uji statistik rasio likelihood _ berdasar T . Hal ini masuk akal karena semua informasi tentang dari x _ termuat dalam T ( x ). Teorema Bila T ( x ) statistik cukup untuk , sedangkan (t) dan (t) masing_ _ masing adalah statistik LRT berdasar T dan x maka T ( x ), dimana _ _ ( x )untuk setiap x dalam ruang sampel. Bukti Dengan teorema faktorisasi, densitas dari x dapat ditulis sebagai f ( x | ) = _ g ( T ( x | ) h( x ) dengan g(t| ) adalah densitas dan h( x ) tidak tergantung pada . Jadi, ) Supo L( | x Supo g( T ( x )| ) h( x ) n ) = _ _ ( x = ) Sup L( | x Sup ( g( T ( x )| ) h( x ) | ) Supo f ( x | ) Sup f ( x ) | ) Supo g( T ( x ) | ) Sup g( T ( x 143 ISBN 978-602-8310-02-4
_ _ _ _ _
=
Bab 5. Hipotesis Statistik
= T ( x )
Contoh Misalkan X1 , ..., Xn adalah sampel random dari N (, 2 ); H0 : 0 vs H1 : 0 . 2 adalah parameter pengganggu. Statistik LRT adalah ) { , 2 : 0 , 2 > 0} maks L(, 2 | x ) maks L(, 2 | x ) { , 2 : 0 , 2 > 0} maks L(, 2 | x 2 | x , ) maks L(
) = ( x
) = ( x
2
dimana dan , adalah MLE dari dan 2 . Selanjutnya, bila 0 , maksimum kendala sama dengan maksimum tanpa kendala, sedang untuk > 0 , maksimum kendala adalah L(0 , 2 | x ). Jadi 1; jika 0 _ 2 _ ( x ) = L ( 0 , | x ) ; jika > 0 2 _
L(, |x) _
5.3.3
Untuk prosedur uji hipotesa ( x ), fungsi uji adalah fungsi pada ruang _ _ sampel dengan nilai 1 bila x dalam daerah penolakan, dan nilai 0 bila x dalam daerah penerimaan.
Bab 5. Hipotesis Statistik
144
ISBN 978-602-8310-02-4
Table 5.1: Kesalahan dalam Uji Hipotesis Keputusan Menerima H0 Menolak H0 Keputusan Benar Kesalahan Tipe I Kesalahan Tipe II Keputusan Benar
Hipotesis Benar
H0 H1
Dalam memutuskan untuk menerima atau menolak hipotesa nol dievaluasi dan dibandingkan melalui probabilitasnya membuat kesalahan. Sekarang dibicarakan bagaimana probabilitas membuat kesalahan tersebut dapat dikontrol.
5.3.3.1
c dapat terjadi salah satu dari Dalam uji hipotesis H0 : 0 vs H1 : 0 dua jenis kesalahan, yaitu kesalahan tipe I () dan kesalahan I I ( ), sbb:
1. Jika 0 tetapi uji hipotesis menolak H0 , maka uji telah membuat kesalahan tipe I .
c tetapi uji menerima H , maka uji telah membuat kesa2. Jika 0 0 lahan tipe I I .
Misalkan C daerah kritis (penolakan) untuk suatu uji hipotesis, maka untuk 0 uji membuat kesalahan bila X C, sehingga probabilitas kesalahan tipe I adalah P( X C ). Untuk 0 c probabilitas kesalahan tipe II adalah P( X C c ). Karena P( X C c ) = 1 P( X C ) maka P( X C ) merupakan fungsi memuat semua informasi tentang uji dengan daerah kritis C. Selanjutnya didapat:
Bab 5. Hipotesis Statistik
145
ISBN 978-602-8310-02-4
P( X C ) =
De f inisi Fungsi kuasa (power function) dari uji hipotesis dengan daerah penolakan C adalah fungsi dari yang didenisikan K ( ) = P( X C ) (5.4)
Nilai fungsi kuasa di suatu titik parameter disebut kekuatan uji dititik tersebut. Fungsi kuasa yang ideal adalah bernilai nol untuk 0 dan berc . Namun bentuk ideal ini tidak dapat dicapai. Uji nilai satu untuk 0 hipotesis baik bila fungsi kuasa memiliki nilai:
c dan 1. mendekati nilai 1 untuk 0
2. mendekati 0 bila 0 De f inisi Tingkat signikansi dari uji (atau ukuran dari daerah kritis C) adalah supremum dari fungsi kekuatan uji kalau hipotesis nol besar. Berdasarkan denisi ini, tingkat signikansi uji yang ditulis merupakan probabilitas kesalahan tipe I. Jadi tingkat signikansi uji merupakan: P(kesalahantipeI ) = P(menolakH0 | H0 benar ) = Contoh Uji hipotesis H0 : p = 1/2vsH1 : p > 1/2; dengan p parameter distribusi binomial. Jika sampel berukuran 18 dan H0 ditolak untuk x 13.
Bab 5. Hipotesis Statistik
146
ISBN 978-602-8310-02-4
Dipertimbangkan tingkat signikansi uji atau kekuatan uji bila H0 benar sbb: P(menolak H0 | H0 benar ) = P( X 13| p = 1/2) (5.5)
x =13
18
18 (1/2) x (1 1/2)18x = 0, 05 x
Jadi tingkat signinkansi uji atau kekuatan uji di p = 1/2 adalah 0, 05 Contoh Misalkan Xn Binomial (5, ). Pandang uji H0 : < Fungsi kuasa untuk uji ini adalah: 1 ( ) = P ( x R ) = P ( x = 5) = 5 Grak 1 ( )dapat kita lihat dalam gambar di bawah. Dalam menyelidiki fungsi kuasa ini, walaupun probabilitas kesalahan tipe I dapat diterima sebagai kecil 1 1 5 ) = 0, 0312 untuk semua 2 , namun probabilitas ke 1 ( ) ( 2 salahan tipe II terlalu tinggi 1 ( ) terlalu kecil untuk semua >
1 2 1 2
vs H1 : >
1 2.
1 5 Probabilitas kesalahan tipe II kurang dari 1 2 hanya jika > ( 2 ) = 0, 87. Untuk mendapatkan probabilitas kesalahan tipe II yang lebih kecil, dapat dipertimbangkan menggunakan uji yang menolak H0 bila x = 3, 4, atau5 .
2 ( ) =
5 3
P( x = 3, 4, 5) 5 3 (1 )2 + 4
4 (1 )1 +
5 5
5 (1 )0 .
Grak dari 2 ( ) juga diperlihatkan dalam gambar di atas. Dalam gambar tersebut terlihat bahwa uji kedua mempunyai probabilitas kesalahan tipe
Bab 5. Hipotesis Statistik
147
ISBN 978-602-8310-02-4
II lebih kecil dalam kasus 2 ( ) lebih besar untuk > 1 2 . Tetapi probabilitas kesalahan tipe I lebih besar untuk uji kedua; 2 ( ) lebih besar untuk 1 2 . Bila harus memilih diantara kedua tes tersebut, pertimbangannya adalah mana struktur kesalahan yang digambarkan oleh 1 ( ) atau 2 ( ) yang lebih diterima. Contoh Misalkan X1 , ..., Xn adalah sampel random dari populasi N ( , 2 ), dan 2 diketahui. LRT untuk H0 : 0 vsH1 : > 0 adalah uji yang menolak ) (x H0 bila /0 > c. Fungsi kuasa uji ini adalah n ( ) = P
x 0 / n
_
>c =P
x 0 / n
> c+
0 / n
= P Z > c+
0 / n
dengan Zvariabel random normal baku. Untuk naik dari sampai , dapat dilihat bahwa probabilitas normal ini naik dari nilai 0 ke 1. Karena itu ( ) fungsi naik dari dengan lim ( ) = 0,lim ( ) = 0, dan ( ) = bilaP( Z > c) = Contoh Misalkan disyaratkan bahwa kesalahan tipe I maksimum 0, 1 dan kesalahan tipe II maksimum 0,2 untuk 0 + . Hendak ditunjukkan bagaimana memilih c dan n, untuk mencapai persyaratan di atas menggunakan ) (x > c. Seperti disebutkan di muka uji yang menolak H0 : 0 bila /0 n fungsi kuasa uji sedemikian adalah: 0 / n
( ) = P Z > c +
Karena ( ) fungsi naik, maka persyaratannya dipenuhi bila ( ) = 0, 1 dan ( + ) = 0, 8 Dengan memilih c = 1, 28, kita mendapatkan (0 ) = P( Z > 1, 2) = 0, 1 (sebenarnya 0,1003 dari tabel) dan tidak tergantung n. Sekarang ingin dipilih n sedemikian hingga ( + ) = P( Z > 1, 28 n) = 0, 8.
Bab 5. Hipotesis Statistik
148
ISBN 978-602-8310-02-4
Tetapi dari tabel P( Z > 0, 84) = 0, 8, sehingga dengan mengambil 1, 28 n = 0, 84 dan menyelesaikan untuk n didapat n = 4, 49. Jadi dengan mengambil c = 1, 28 dan n= 5 persyaratan di atas dipenuhi.
5.3.3.2
Seperti yang telah dipaparkan di depan, uji hipotesis berusaha untuk mengontrol baik kesalahan tipe I yaitu paling besar sama dengan untuk semua 0 . Demikian juga dengan probabilitas kesalahan tipe II, c. yaitu mempunyai fungsi kuasa yang besar untuk 0 De f inisi
c . Uji daMisalkan C adalah kelas uji untuk H0 : 0 vsH1 : 0 lam kelas C dengan fungsi kuasa ( ), disebut uji uniformly most powerfull c dan setiap 1 ( ) yaitu (UMP) kelas C bila ( ) 1 ( ) untuk setiap 0 fungsi kuasa dari uji dalam kelas C .
De f inisi Daerah kritik C adalah daerah kritik paling kuat seragan ukuran untuk uji hipotesis H0 lawan hipotesis alternatif H1 jika himpunan C adalah daerah kritik terbaik ukuran untuk uji H0 lawan hipotesis sederhana H1 . Suatu uji yang didenisikan pada daerah kritik ini disebut uji paling kuat seragam dengan tingkat signikansi dari uji hipotesis sederhana H0 lawan hipotesis gabungan alternatif H1 . Uji paling kuat seragam tidak selalu ada, tetapi kalau ada teorema Neyman Person dapat digunakan untuk mencarinya. Contoh Misalkan X1, X2 , ..., Xn sampel random dari distribusi n(0, ) dengan varian tidak diketahui. Akan diperlihatkan bahwa ada uji paling kuat seragam dengan tingkat signikansi untuk uji hipotesis sederhana
Bab 5. Hipotesis Statistik
149
ISBN 978-602-8310-02-4
H0 : = dengan adalah bilangan bulat posistif lawan hipotesis gabungan alternatif H1 : > .Ruang parameter = ; . Fungsi kepadatan peluang bersama dari X1, X2 , ..., Xn adalah L( ; x1 , x2 , ..., xn ) = 1 2
n/2 2 xi exp 2
(5.6)
Misalkan bilangan yang lebih besar dari , k bilangan posisif dan C himpunan titik-titik dengan
(5.7)
exp
i =1
xi2
(5.8)
i =1
xi2
n ln 2
ln k = c
(5.9)
Himpunan C=
( x1 , x2 , ..., xn ) :
i =1
xi2 c
(5.10)
adalah daerah kritik terbaik untuk uji hipotesis sederhana H0 : 0 = lawan hipotesis sederhana = . Sekarang tinggal menentukan c sehingga daerah kritik ini mempunyai ukuran seperti yang diinginkan. Jika H0 benar variabel random
i =1
xi2 /
=P
Bab 5. Hipotesis Statistik
i =1
xi2 /
150
c/ ; H0
c/
( x1 , x2 , ..., xn ) :
xi2 c
tuk uji H0 : = lawan hipotesis = . Selain itu, untuk setiap bilangan yang lebih besar dari maka argumen otomatis terpenuhi. Jika adalah bilangan lain yang lebih besar dari maka C =
( x1 , x2 , ..., xn ) :
i =1
xi2 c
uji H0 : = lawan hipotesis = . Oleh karena itu, menurut denisi diatas maka C =
( x1 , x2 , ..., xn ) :
i =1
xi2 c
paling kuat seragam ukuran untuk uji H0 : = lawan H1 : > . Jika x1 , x2 , ..., xn nilai eksperimen dari X1, X2 , ..., Xn maka H0 : = ditolak ditingkat signikansi dan H1 : > diterima jika
i =1
xi2 c.
5.3.3.3
Teorema Neyman-Pearson
Misalkan H0 : = 0 vs H1 : = 1 dengan densitas yang bersesuaian dengan i adalah f ( x |i ), i = 0, 1. Dengan menggunakan uji dengan daerah penolakan C yang memenuhi kedua hal berikut: x C, jika f ( x |1 ) > k f ( x |0 ) (5.12)
(5.13)
1. Syarat cukup setiap uji yang memenuhi 5.12 dan5.13 adalah uji UMP taraf 2. Syarat perlu, jika terdapat uji yang memenuhi kedua kondisi di atas dengan k > 0 maka setiap uji UMP taraf adalah uji dengan ukurBab 5. Hipotesis Statistik
151
ISBN 978-602-8310-02-4
an , kecuali mungkin pada himpunan A yang memenuhi P0 ( X A) = 0. AkibatTeorema ) adalah Misalkan kondisi teorema Neyman-Person berlaku, dan jika T ( X statistik cukup untuk dan g(t| ) adalah densitas T bersesuaian dengan i , i = 0, 1. Maka setiap uji berdasar T dengan daerah penolakan S (himpunan bagian dari ruang sampel T ) adalah uji UMP taraf bila dipenuhi kedua hal berikut: 1. t Sbilag(t|1 ) > kg(t| ) 2. t Sc bilag(t|1 ) < kg(t|0 ) untuk suatu k 0, dengan = P0 ( X S). Bukti uji berdasar T mempunyai daerah penolakan C ={ x : Dalam sampel asal X _ T ( x ) S} . Dengan teorema faktorisasi densitas dapat ditulis sebagai _ _ _ _ f ( x |i ) = g ( T ( x )|i ) h( x ), i = 0, 1, untuk suatu fungsi tak negatif h( x ). Dengan mengalikan ketaksamaan pada nomer 1 di depan dengan fungsi tak negatif ini, didapat C memenuhi x Cbila f ( x |i ) = g ( T ( x )|i ) h( x ) > kg ( T ( x )|0 ) h( x ) = k f ( x |0 ). dan x C c bila f ( x |i ) = g ( T ( x )|i ) h( x ) < kg ( T ( x )|0 ) h( x ) = k f ( x |0 ). Juga dari pernyataan nomer 2 didapat: P0 ( X R) = P0 (( T ( x ) S) = . Jadi dengan syarat cukup dari Lemma Neyman-Pearson, Uji berdasar T adalah uji UMP taraf .q.e.d. Contoh
Bab 5. Hipotesis Statistik
_ _ _ _ _ _ _ _ _ _ _ _ _ _
152
ISBN 978-602-8310-02-4
Misalkan x binomial (2, ). Uji H0 : = 1/2vsH1 : = 3/4. Dengan menghitung rasio densitas didapat: f (0 | = 3 4)
3 3 ) ) 1 f (2 | = 4 3 f (1 | = 4 9 = = = ; ; 1 1 1 4 f (2 | = 2 ) 4 f (1 | = 2 ) 4 f (0 | = 2 )
3 Dengan memilih 4 < k < 9 4 , maka Lemma Neyman-Pearson mengatakan bahwa uji yang menolak H0 bila x = 1 atau 2 adalah uji UMP taraf 3 3 = p( x = 1atau2, = 1/2) = 4 . Dengan memilih k < 1 4 atau k > 4 menghasilkan UMP taraf = 1atau = 0. 3 Perhatikan bila k = 4 , maka kita harus menolak H0 untuk titik sampel x = 2 dan menerima H0 untuk x = 0 dan untuk x = 1 tak menentu. Tetapi 1 bila kita menerima H0 untuk x = 1 kita mendapatkan uji UMP taraf = 4 supremium di atas. Bila kita menolak H0 untuk x = 1 kita mendapatkan uji UMP taraf = 3 4 seperti di atas.
De f inisi Hipotesa yang menyatakan bahwa parameter univariat besar, sebagai contoh H : 0 , atau kecil, sebagai contoh H : < 0 disebut hipotesa satu sisi. Sedangkan Hipotesa yang menyatakan bahwa parameter bisa besar atau kecil, sebagai contoh, H : = 0 disebut hipotesa dua sisi. Banyak persoalan yang mempunyai uji UMP taraf berhubungan dengan uji hipotesa satu sisi dan densitas yang mempunyai sifat monotone Likelihood ratio.
5.3.3.4
Teorema Karlin-Rubin
Pandang uji hipotesa H0 : 0 vsH1 : > 0 . Misalkan T adalah statistik cukup untuk dan keluarga densitas { g(t| ) : } dari T mempunyai sifat MLR (monotone likelihood ratio). Maka untuk t0 uji yang menolak H0 bhb T > t0 adalah uji UMP taraf , dengan = P0 ( T > t0 ). Bukti
Bab 5. Hipotesis Statistik
153
ISBN 978-602-8310-02-4
Karena densitas T mempunyai sifat MLR, fungsi kuasa ( ) = P0 ( T > t0 ) tidak turun. Sehingga Sup 0 ( ) = (0 ) = dan ini adalah uji taraf . Dengan menggunakan bagian (b) dan (c) akibat teorema Neyman-Person, dan didapat: k1 = in f t g(t| 1 ) g ( t | 0 )
dengan = {t|t > t0 }dan g(t| 1 ) > 0 atau g(t|0 ) > 0 Jadi menurut akibat teorema Neyman-Person di depan uji adalah UMP taraf . q.e.d. 5.3.3.5 Daerah Kritik Terbaik
Misal C subset dari ruang sampel. C disebut daerah kritik terbaik berukuran untuk uji hipotesis sederhana H0 : = lawan H1 : = jika untuk setiap subset A dari ruang sampel dengan P [( X1, X2 , ..., Xn ) A; H0 ] = berlaku 1. P [( X1, X2 , ..., Xn ) C; H0 ] = 2. P [( X1, X2 , ..., Xn ) C; H1 ] P [( X1, X2 , ..., Xn ) A; H1 ] Cara lain yang dapat digunakan menentukan daerah kritik terbaik adalah dengan menggunakan teorea Neyman-Pearson. Teorema Neyman-Pearson Misalkan X1, X2 , ..., Xn sampel random dari distribusi yang mempunyai f.k.p f ( x; ). Selanjutnya f.k.p bersama dari X1, X2 , ..., Xn adalah L( ; x1 , x2 , ..., xn ) = f ( x1 ; ) f ( x2 ; )... f ( xn ; ) (5.14)
Misalkan dan nilai tertentu dari yang berbeda sehingga = { ; = , } dan misalkan k bilangan posistif. Jika C subset dari ruang sampel sedemikian sehingga
Bab 5. Hipotesis Statistik
154
ISBN 978-602-8310-02-4
1. 2.
L( ;x1 ,x2 ,...,xn ) L( ;x1 ,x2 ,...,xn ) L( ;x1 ,x2 ,...,xn ) L( ;x1 ,x2 ,...,xn )
3. = P [( X1, X2 , ..., Xn ) C; H0 ] Maka C adalah daerah kritik terbaik berukuran untuk uji hipotesis sederhana H0 : = lawan hipotesis sederhana alternatif H1 : = Satu hal yang ditegaskan oleh teorema ini adalah bahwa jika C himpunan dari semua titik-titik ( x1 , x2 , ..., xn ) yang memenuhi L( ; x1 , x2 , ..., xn ) k; k > 0 L( ; x1 , x2 , ..., xn ) (5.15)
maka sesuai dengan teorema, C merupakan daerah kritik terbaik. ketidaksamaanini sering dinyatakan dalam bentuk (dengan c1 dan c2 suatu konstanta) u1 ( x1 , x2 , ..., xn ; , ) c1 (5.16) atau u2 ( x1 , x2 , ..., xn ; , ) c2 (5.17)
Pandang bentuk u1 c1 . Karena dan suatu konstanta, u1 ( x1 , x2 , ..., xn ; , ) suatu statistik dan jika f.k.p dari statistik ini dapat ditentukan kalau H0 benar maka tingkat signikansi dari uji H0 lawan H1 dapat ditentukan dari distribusi ini. Contoh Diketahui X1, X2 , ..., Xn sampel random dari distribusi yang mempunyai f.k.p 1 1 exp( ( x )2 ); < x < (5.18) f ( x; ) = 2 2 Akan diuji hipotesis sederhana H0 : = = 0 lawan hipotesis alternatif H1 : = = 1. Perhatikan bahwa
(1/ 2 )n ( xi2 )/2 L( ; x1 , x2 , ..., xn ) = L( ; x1 , x2 , ..., xn ) (1/ 2 )n exp [(( xi 1)2 )/2]
Bab 5. Hipotesis Statistik
(5.19)
155
ISBN 978-602-8310-02-4
uji di = = 1
P( x c1 ; H1 ) =
c1
2 1/n
exp(
( x 1)2 dx 2(1/n)
(5.20)
Untuk contoh di depan, jika n = 25 dan jika = 0, 05 maka dari tabel = 0, 329. Kekuatan dari uji ini dari H0 lawan H1 ditemukan c1 = 1,645 25 adalah 0, 05 kalau H0 benar dan
0,329
3,355
1 2
ew
2 /2
dw = 0, 999,jika H1 benar.
5.4
1. Misalkan hipotesis yang diuji adalah parameter bernoulli p, yakni H0 : p = 1/5 lawan H1 : p = 1/5 Misalkan pula dilakukan percobaan n = 60000 dengan hasil x = 12489. Dengan menggunakan kriterium daerah kritis 0, 05, hitunglah x yang memenuhi P( X X | H0 benar) = 0, 05 Pembahasan : Untuk lebih memudahkan perhitungan, kita gunakan teorema limit pusat, sehingga P( X X | H0 benar) = P
x 60000(1/5) dengan
x 60000(1/5) 60000(1/5)(4/5)
X 60000(1/5 60000(1/5)(4/5)
60000(1/5)(4/5)
1, 64) = 0, 05 (dari tabel z), maka X dapat dihitung dari persamaan 1, 64 = X 12000 9600
Diperoleh X = 12161. Karena dari data eksperimen kita peroleh x = 12489 > 12161, maka kita simpulkan H0 ditolak. 2. Diketahui variabel random X dengan f.k.p, f ( x; ) = 1 x / e .
Uji hipotesis H0 : = 2 vs H1 : = 4. Dengan menggunakan sampel random X1 dan X2 berukuran 2, diputuskan menolak H0 bila C = {( x1 , x2 ); 9, 5 x1 + x2 < } . Tentukan fungsi kekuatan uji dan tingkat signikani uji. Pembahasan :
K ( ) = P { ( x1 , x2 ) C } Jika H0 benar, = 2 maka fkp bersama dari X1 dan X2 adalah f ( x1 ; 2) f ( x2 ; 2) = 1/4e( x1 + x2 )/2 ; 0 < x1 < , 0 < x2 <
= 1
Jika H1 benar, = 4, f.k.p bersama dari X1 dan X2 adalah f ( x1 ; 4) f ( x2 ; 4) = 1/16e( x1 + x2 )/4 ; 0 < x1 < , 0 < x2 <
157
ISBN 978-602-8310-02-4
Sehingga
9,5 9,5 x2
P [( x1 , x2 ) C ] = 1
Jadi, kekuatan uji 0, 05 untuk = 2 dan 0, 31 untuk = 4. Karena tingkat signikansi adalah kekuatan uji bila H0 benar, maka tingkat signikansi tes ini adalah 0, 05. Cara lain, dengan menggunakan tabel 2 (2). Misalkan x1 + x2 = Y maka Y berdistribusi 2 (4). Kekuatan uji kalau H0 benar diberikan oleh P(Y 9, 5) = 1 P(Y 9, 5) = 1 0, 95 = 0, 05 Kalau H1 benar, variabel random X /2 berdistribusi 2 (2) sehingga variabel random Z = ( x1 + x2 )/2 berdistribusi 2 (4). Kekuatan uji bila H1 benar adalah
P( x1 + x2 9, 5) = P( Z 4, 75) =
4,75
1/4zez/2 dz = 0, 31
(a) Uji adalah uji taraf (b) Terdapat 0 0 sedemikian hingga P0 ( T S) = (c) Misalkan g(t| ) menyatakan densitas dari T . Untuk 0 yang sac terdapat k1 0 ma seperti dalam (b) dan untuk setiap 1 0 sedemikian hingga t Sbilag(t| 1 ) > k1 g(t|0 )dant Sc bilag(t| 1 ) < k1 g(t|0 ) Tunjukkan uji ini adalah uji UMP taraf dari H0 versus H1 . Pembahasan :
Bab 5. Hipotesis Statistik
158
ISBN 978-602-8310-02-4
Misalkan ( ) adalah fungsi kuasa dari uji dengan daerah penolakan c . Pandang uji H 1 : = vsH 1 : = 1 , menurut S. Tetapkan 1 0 0 0 1 akibat teorema Neyman-Person dan (a), (b), dan (c) mengakibatkan 1, ( 1 ) ( 1 ) dengan ( ) fungsi kuasa untuk taraf lain dari H0 yaitu setiap uji yang memenuhi ( ) . Tetapi, setiap uji tanpa dari H0 memenuhi (0 ) sup ( ) . Jadi ( 1 ) ( 1 ) untuk setiap uji taraf dari H0 . Karena 1 sebarang maka soal terbukti.
4. Jika X1, X2 , ..., Xn sampel random dari distribusi n( , 1) dengan mean tidak diketahui. Perlihatkan bahwa tidak ada uji paling kuat seragam dari hipotesis sederhana H0 : = dimana tertentu lawan hipotesis gabungan alternatif H1 : = . Ruang sampelnya = { ; < < } . Pembahasan : Misalkan suatu bilangan yang tidak sama dengan dan k bilangan positif. Perhatikan bahwa
(5.21)
i =1
xi + 2
( )2 ( )2
(5.22)
i =1
xi
n ( )2 ( )2 ln k 2
(5.23)
i =1
xi
n + 2
ln k jika > ( )
(5.24)
159
ISBN 978-602-8310-02-4
dan ekivalen ke
i =1
xi
n + 2
ln k jika < ( )
(5.25)
Kedua ini mendinisikan daerah kritik terbaik untuk uji H0 : 0 = lawan H1 : = bila > dan < . Akan tetapi daerah kritik terbaik uji hipotesis sederhana lawan hipotesis sederhana alternatif = + 1 tidak seperti daerah kritik terbaik daerah kritik terbaik H0 : = lawan hipotesis sederhana alternatif = 1. Jadi dalam kasus ini tidak ada uji paling kuat seragam. 5. Tentukan daerah kritik dari uji rasio likelihood untuk uji hipotesis nol H0 : = 0 lawan H1 : = 0 yang didasarkan sampel random berukuran n dari populasi normal dengan varians 2 diketahui. Pembahasan : Karena = {0 } maka L( ) = L(0 ). Karena = maka dengan menggunakan metode likelihood maksimum diperoleh = x sehingga L( ) = dan L() = sehingga = exp Daerah kritiknya adalah exp atau n ( x 0 )2 k 2 2 2 2 ln k n ISBN 978-602-8310-02-4 1 2 1 2
n
1 n exp 2 ( xi 0 )2 2 i =1 1 n ( x i x )2 22 i =1
exp
n ( x 0 )2 2 2
( x 0 )2
Bab 5. Hipotesis Statistik
160
atau
| x 0 |
(22 ln k) /n
dengan k akan ditentukan sehingga ukuran daerah kritik adalah . Jadi daerah kritiknya adalah x : | x 0 |
(22 ln k) /n
6. Diketahui X variabel random dengan distribusi n(1 , 2 ) dan misalkan ruang parameter = {(1 , 2 ); < 1 < , 0 < 2 < } . Hipotesis gabungan H0 : 1 = 0, 2 > 0 dan hipotesis gabungan alternatif H1 : 1 = 0. Himpunan = {(1 , 2 ); 1 = 0, 0 < 2 < } adalah subset dari dan H0 : (1 , 2 ) . Tentukan uji H0 lawan H1 . Pembahasan : Misalkan X1, X2 , ..., Xn sampel random yang berukuran n > 1 dari distribusi ini. Distribusi bersama dari X1, X2 , ..., Xn disetiap titik dalam adalah L(1, 2 ; x1 , x2 , ..., xn ) = 1 22
n/2
( x i 1 ) exp 22
= L()
Distribusi bersama dari X1, X2 , ..., Xn disetiap titik dalam adalah L(0, 2 ; x1 , x2 , ..., xn ) = 1 22
n/2
exp
( xi ) = L( ) 22
161
ISBN 978-602-8310-02-4
1 n ( x i )2 n i =1
Dengan cara analog (dengan metode likelihood maksimum) diperoleh 1 = x dan 2 = sehingga L() = Karena itu, = ( x i x )2 2 ( xi ) ne1 2 (( xi x )2 /n)
n/2 n/2 i =1
( x i x )2 / n
( x i x )2 k2/n 2 ( xi )
7. Misalkan x1 , x2 , x3 random variabel independen berdistribusi B (1, P). Uji hipotesis H0 : P = 0, 25 dengan tingkat signikasi berdasarkan LR Test Statistic dan dapatkan distribusinya!
162
ISBN 978-602-8310-02-4
i3=1 P ( xi = xi ) L (P | x) = = P x1 (1 P )1 x1 . P x2 (1 P )1 x2 . P x3 (1 P )1 x3 = P x1 + x2 + x3 (1 P )3 x1 . x2 . x3
P i =1 x i ( 1 P ) 3 i =1 x i
3 3
3 x
d.logL( P| x ) dp
= = = = = =
0 P (x)
3 1 3 i =1 x P + 3 i =1 xi . 1. p 3 (1 P ) 3 i =1 x P ( 3 i =1 x i ) P (1 P ) 3 i =1 x i 3
x
3 x i 3 3 x i i =1 (0,75) i =1 3 3 x i i =1 xi x x (0,75) 1 3 i 3 3 3 3 i =1 x i i =1 x i
Sup P 0 L( P| x ) Sup P L( P| x )
(0,25)
3(0,25) 3 i =1 x i
3(0,75) 3 3 i =1 x i
( x )adalah fungsi ........... dari 3 i =1 x i Daerah kritik untuk uji ini adalah < C0 atau 0, 75 3 i =1 x i
3 i =1 x i
2, 25 3 3 i =1 x i
3 3 i =1 x i
< C0
Dibawah H0 3 i =1 xi B (3, P = 0, 25) maka daerah kritik uji ini adalah berbentuk pasangan.
Bab 5. Hipotesis Statistik
163
ISBN 978-602-8310-02-4
dan xi > C0 xi < C0 dan C dapat ditung berdasarkan tingkat signikasi Dimana C0 0 yang ditentukan dan distribusi binomial n 3 dan p 0, 25 maka hubungan: P 3 i =1 xi < C0 2 dan P 3 2 i =1 xi > C0
Jadi distribusi yang digunakan dalam uji ini adalah distribusi Binomial dengan trial = 3 dan Probabilitas sukses p = 0, 25. Sedangkan untuk n besar dapat digunakan pendekatan 2logyang 2 . berdistribusi Asimtotik X( 1) 8. Misalkan X1 , X2 , ...., X30 (n = 30) barisan variabel random berdistribusi Gamma dengan = 10 dan tidak diketahui. Kontruksikanlah MP test dari hipotesis H0 : = 2 vs H1 : = 3, pada level signikasi 0, 05. Pembahasan : (a) Diketahui Xi G (, ) maka densitas dari Xi adalah: f ( Xi | ) =
1 x 1 e x i r () ; x i
Dengan ruang parameter: 0 = {(, ) | = 10; = 2} = {(, ) | = 10; = 3 > 0 = 2} (b) Densitas bersama dari xi pada 0 adalah f0 (x | 0 ) =
1 r (10)210 30 9 2 i =1 x i i30 =1 x e
30 1
164
ISBN 978-602-8310-02-4
R ( Z, 0 , 1 ) =
= = =
1 r (10)310
30
2 3
300
30 i =1 x i
> Log C 300 Log 2 3 = Log C 300 (Log 2 Log 3) = Log C 300 (0, 3010 0, 4771) = Log C + 52, 83 > 6 (Log C + 52, 83) = C0
= 0, 05 dengan Y = xi
9. Misalkan X1 , X2 , ...., X30 (n = 30) variabel random independen berdistribusi N , 2 dengan tidak diketahui dan diketahui. Tunjukkan sampel size ndapat ditentukan, sehingga uji hipotesis H0 : = 0 vs hipotesis H1 : = 1dapat dilakukan bila nilai-nilai dan telah ditentukan sebelumnya. Berapakah nilai numeris dari n, jika = 0, 05, = 0, 9, dan = 1? Pembahasan
Bab 5. Hipotesis Statistik
165
ISBN 978-602-8310-02-4
(a) Xi G , 2 maka densitas dari Xi adalah: e 2 2 i ;- < x < f ( Xi | ) = 22 Dengan ruang parameter: 0 = , 2 | = 0; > 0 = , 2 | < < ; > 0, = 1 (b) Densitas bersama dari xi pada 0 adalah: f 0 ( x | = 0) = 22
n 2
1 n x2 2 2 i =1 i
1 2
( X )2
1 n ( x 1)2 2 2 i =1 i
= = e =
n x2 1 n 12 i =1 i 2 2 i =1 2
(5.26)
1 n x2 n 2 2 i =1 i 2
.e 2
>
C
n
1 n x 2 i =1 i
> e 2
(5.27)
n + LogC 2 n 2 2 + LogC
2 n LogC
= C0 X > C0
(Z) =
(5.28)
166
ISBN 978-602-8310-02-4
E0 [ ( Z )] =
P0 ( x > C0 ) = 1 P0 ( x C0 ) = 0, 05 = 1 0, 05 P0 ( x C0 ) = 0, 95
Atau: P0
x 0 x x
P0 Z
C0 0x x C0 0x 1 n
= 0, 95 = 0, 95 = 0, 95
P0 Z C0 n
(g) Dengan menggunakan tabel distribusi normal starndard diperoleh: P0 ( Z 1, 645) = 0, 95 sehingga didapat
C0 n = 1, 645
Karena = 0, 9dan berdasarkan di atas diperoleh:
(5.29)
P1 Z
C0 0x x C0 0x 1 n
= = =
0, 1 0, 1 0, 1
P1 Z C0 n
P1 Z C0 n = 0, 1
Sehingga diperoleh:
n (C0 1) = 1, 28
(5.30)
167
ISBN 978-602-8310-02-4
C0 n n = 1, 28 1, 64 n = 1, 28 n = 1, 64 +1, 28 = 2, 92
Atau n = (2, 92)2 = 8, 53 9
Jadi nilai n yang ditanyakan adalah sekitar 9. Jika niali n = 9 disubstitusikan ke (3) diperoleh C0 = 0, 55 sehingga MP Testnya adalah: (Z) = 1;Jika X > 0, 55 1 n x denganX = i n =1 i 0; Jika X 0, 55
10. Misalkan x1 , x2 , ..., x30 variabel random independen berdistribusi N , 2 . Jika x = 3, 2, kontruksilah MP test dari hipotesis H0 : = 3; 2 = 4vs hipotesis alternatif H1 : = 3, 5; 2 = 4pada level signikasi = 0, 01 Penyelesaian Xi N , 2 densitas dari Xi adalah f Xi | , 2 = 22 e 2 2 Dengan ruang parameter: 0 = = 3; 2 = 4 = < < ; 2 > 0, = 1 c = = 3, 5; 2 = 4 0
1 2
1
( x i )2
168
ISBN 978-602-8310-02-4
f 1 x | , 2
= =
(8 )50 e
100 2 7 100 2 1 8 i =1 xi + 8 i =1 xi 153,125 1 100 x2 + 6 100 x2 112,5 (8 )50 e 8 i=1 i 8 i=1 i 100 2 1 8 i =1 xi 40,62,5
(5.31)
>C
dengan C suatu konstanta tertentu. Bentuk (1) diatas dapat ditulis sabagai: e 8 i=1 xi > e40,62,5 .C
100 2 1
(5.32)
8 i =1 i Jadi diperoleh: 100 > 325 + 100 LogC = C0 Sehingga MP tes dari uji hipotesis diatas berbentuk,
(Z) =
= N i ,
4 100
: 1 = 0, 1
169
ISBN 978-602-8310-02-4
E0 [ ( Z )] =
P0 ( x > C0 ) 1 P0 X C0 P0 X C0
= P0 ( x > C0 ) = 0, 01 = 1 0, 01 = 0, 99
C0 0X X
= 0, 99 = 0, 99 dengan = X = 0, 99 = 0, 99
2 4 = , 0 = 3 100 10
P0 Z
C0 3 X C0 3 2 10
P0 ( Z 5C0 15)
Dengan menggunkan tabel distribusi normal standard diperoleh P0 ( Z 2, 33) = 0, 99, sehingga diperoleh: 5C0 15 = 2, 33 5C0 = C0 = 17, 33 = 3, 466
17,33 5
Jadi MP test dari uji hipotesis diatas adalah: (Z) = 1;Jika X > 3, 466 0; Jika X 3, 466
Dengan kata lain: Karena X = 3, 2 < C0 = 3, 466maka H0 tidak ditolak pada tingkat signikasi = 0, 01
11. Misalkan X variabel random yang densitasnya uniform (0, 1)disimbolkan dengan f 0 atau berdistribusi triangular pada interval [0, 1]disimbolkan dengan , dimana f 1 berbentuk: 4x ; 0x< 1 2 1 f1 = 4 4x ; 2 x 1 0 ; otherwise yang didasarkan pada observasi tungal X. Konstruksilah MP test daBab 5. Hipotesis Statistik
170
ISBN 978-602-8310-02-4
Penyelesaian:
Diuji hipotesis H0 : f 0 ( x ) = 1 I[0,1] ( x ) vs H1 : f 1 ( x ) Bentuk: = {0 , 1 }dengan f ( x | 0 ) = f 0 ( x ); 0 x 1dan f ( x | 1 ) = f 1 ( x ); 0 x 1 X (0, 1)maka densitas dari X adalah: f ( x | 0 ) = f 0 ( x ) = 1 ;0 x 1 10
Disini: f ( x | 0 ) = f 0 ( x )dan f ( x | 1 ) = f 1 ( x )karena observasi didasarkan pada observasi tunggal pada X. Rasio Likehoodnya adalah: 4x ; 0x< 1 2 f1 (x) f ( x | 1 ) 1 = = f1 (x) = 4 4x ; 2 x 1 f ( x | 0 ) f0 (x) 0 ; otherwise f1 (x) > C 4x > C atau 4 4x > C x > C 4 atau x < 1 1/4C Dengan C suatu konstanta tertentu. sebut,C 4 = C0 dan 1 1/4Cmaka MP tes dari uji hipotesis tersebut akan terbentuk: Jadi (Z) = 1;Jika X > C 4 = C0 atau x < 1 1/4C = C0 0; Jika X C0 dan x C0
171
ISBN 978-602-8310-02-4
dx + 1
= 0, 05 = 0, 05 = 0, 05 = 0, 05 = 0, 05 = 0, 05
= 2 0, 05 = 1, 95 C = 2 (1, 95) = 3, 9 Jika harga c=3,9 ini disubstitusikan masing-masing ke c diperoleh C0 = 3,9 C0 = 4 4 = 0, 975dan c C0 = 1 4 = 1 0, 975 = 0, 025. Jadi diperoleh harga C0 = 0, 975 dan C0 = 0, 025. Sehingga MP tes dari uji hipotesis tersebut adalah:
atau 1 ; Jika x x (x) = 0 ; Jika x x
Dengan kata lain: H0 (Hipotesa nol) ditolak jika x > 0, 975atau x < 0, 025 dan H0 diterima pada 0, 025 x 0, 975. Seperti yang diilustrasikan gambar berikut: 12. Misalkan x1 , x2 , ..., xn variabel random iid dengan densitas (pdf) f 0 atau f 1 , diman f 0 berdistribusi P(1) dan f 1 berdistriubusi geometris dengan P = 1 2 . Tentukan MP tes dari hipotesis H0 : f = f 0 vs H1 : f = f 1 pada level signikansi = 0, 05 Penyelesaian:
Bab 5. Hipotesis Statistik
172
ISBN 978-602-8310-02-4
Diuju hipotesis
H0 : f = f 0 ( x ) = H1 : f = f 0 ( x ) =
1 2 x 1
VS
1 2 e 1 x ! dan
x 1
.1 2 =
1 2
Bentuk = {0 , 1 }dengan f ( x | 0 ) = f 0 ( x ) = f ( x | 1 ) = f 1 ( x ) = .1 2 Densitas bersama dari Xi untuk 0 adalah: en f ( x | 0 ) = n i =1 x i ! dan densitas bersama dari xi untuk 1 adalah: f ( x | 1 ) =
n x n i n =1 i 1 1 2 2 n x i n n i = 1 1 1 . 1 . 2 2 2 n x i =1 i 1 2
= =
Rasio Likehoodnya adalah:
R ( Z, f 0 , f 1 ) =
f ( x | 1 ) f ( x | 0 )
= =
en n xi ! i =1 n 1 i =1 x i in x ! i 2 =1
(1 2)
n xi i =1
en
dengan C suatu konstanta tertentu. Atau bentuk diatas dapat ditulis sebagai: in =1 x i ! 1 i =1 x i 2
n
> C .e n
(5.33)
n x logx + n x log1 log2 i } > logC n i =1 i i =1 i { n n i=1 xi logxi + i=1 xi {0 0, 3010} > logC n n x logx 0, 3010n x i > logC n i =1 i i =1 i
173
ISBN 978-602-8310-02-4
13. Mislakan x1 , x2 , ...., xn variabel random iid dengan densitas (pdf) sebagai berikut: (i). f (x | ) = 1 x x e I(0,) ( x ) ; = (0, ) diketahui > 0 (ii). f ( x | ) = r () r r+x1 x
Tunjukkan densitas bersama dari (i) dan (ii) mempunyai sifat MLR (Monotone Likehood Ratio) dalam V ( x1 , x2 , ..., xn ). Penyelesaian: (i). Densitas bersama dari xi adalah: n n x 1 i =1 i in e f ( x | ) = r( =1 x i ) Keluarga distribusi ini adalah keluarga distribusi eksponensial, sebab keluarga tersebut dapat ditulis ke dalam bentuk: f ( x | ) = C ( ) e Q( ) T ( x ) h ( x ) dengan: C ( ) = T (x) =
n r () n x i =1 i
(5.34)
; Q ( ) =
1 ; h ( x ) = in =1 x i
Jelas Q ( ) = decreasing pada (0, ), sebab Q ( ) = 1 < 0. Jadi berdasarkan proposisi 1 halaman 277 dari Roussas, keluarga ekpon x. nensial diatas memiliki sifat MLR dalam v ( x ) = T ( x ) = i =1 i (ii). Densitas bersama dari xi adalah: f (x | ) = nr
n r+x1 ( 1 ) i =1 x i x r+x1 n ei=1 xi Log (1 ) x
= nr
14. X Bin ( , n) . Misalkan ( x )adalah uji UMP untuk H0 : 0 vs H1 : > 0 . Untuk n=6;0 = 0, 25 dan = 0, 05; 0, 1 dan 0, 2.
Bab 5. Hipotesis Statistik
174
ISBN 978-602-8310-02-4
Tentukan uji bersama-sama dengan ( ) fungsi kuasa untuk 0 = 0, 3; 0 = 0, 4. Penyelesaian: x Bin ( , n), maka densitas dari x adalah: f (x | ) = n x 6 x x (1 n x ) 0, 25x (1 0, 25)6 x 6 x 0, 25x 0, 75x
= =
Densitas bersama dari x adalah: f ( x | ) = in =1 6 0, 25 x 0, 7536 x x 6 x i 6 0,25 0, 7536 0,75 xi 6 x i 6 0, 7536 1 3 x 1 6 6 0, 7536 e xi log( 3 ) xi
= i6=1 =
i6=1
= i6=1
= 0, 7536
s xi
h ( x ) = i6=1 Log
6 xi
1 3
T (x) =
dan Q ( ) =
Jadi bentuk UMP tes diatas adalah: jika x > c 1 n =1 (x) = jika x = c ; dengan i =1 xi = X Bin 0 bagi yang lain Sekarang dilihat untuk H0 : < 0, 3vsH1 : > 0, 3untuk
Bab 5. Hipotesis Statistik
175
ISBN 978-602-8310-02-4
= 0, 05 E0 [ ( x )] = P0 ( x > c) + P0 ( x = c) = 0, 05 1 P0 ( x c) + P0 ( x = c) = 0, 05 P0 ( x c) P0 ( x = c) = 0, 95
Dengan menggunakan tabel binomial untuk n = 6; 0 =0,3 diperoleh: untuk c = 4 diperoleh P0,3 ( x c) = 0, 9868 P0,3 ( x = 4) = P0,3 ( x 4) P0,3 ( x 3) Jadi: = 0, 9868 0, 9192 = 0, 0676 Sehingga diperoleh: 0, 9868 (0, 0676) = 0, 95 (0, 0676) = 0, 0368 = 0, 5444 Jadi UMP tes diatas menjadi: 1 jika x > 4 (x) = 0, 54444 ; jika x = 4 0 bagi yang lain Dengan kata lain: H0 ditolak apabila x > 4 H0 ditolak dengan kendala 0,54444 Jika x = 4 Power of the test di 0,7 adalah: (0, 7) = P0,7 ( x > 4) + 0, 54444 P0,7 ( x = 4) = P0,3 ( x 1) + 0, 54444 P0,3 ( x = 24) = 0, 3936 + (0, 54444) [ P0,3 ( x 2) P0,3 ( x 1)] = 0, 3936 + (0, 54444) . (0, 7208 0, 3936) = 0, 3936 + 0, 1781 = 0, 5717 Dengan fungsi kuasa di 0,3 ( ) = P 6 x
1
( x > 4) + 0, 544 P
= 6 x =4
x (1 )6 x + 0, 544
( x > 4) 6 4 (1 )2 x
176
ISBN 978-602-8310-02-4
(5.35)
Dengan menggunakan tabel binomial untuk n=6; 0 = 0, 3untuk c = 3 diperoleh P0 ( x c) = 0, 9192. Jadi: P0 ( x = 3) = P0 ( x = 3) P0 ( x 2) = 0, 9192 0, 7208 = 0, 1994 Sehingga, jika nilai-nilai ini disubstitusikan ke * diperoleh: 0, 9192 (0, 1994) = 0, 9 0,91920,9 = 0, 0962 = 0,1994 Sehingga UMP tes untuk hipotesa ini adalah: 1 ; jika x > 3 (x) = 0, 0962 jika x = 3 0 bagi yang lain Dengan kata lain: H0 ditolak apabila x > 3 H0 ditolak dengan probabilitas 0,0962 jika x = 3 Power of the tes di 0,7 adalah: (0, 7) = P0,7 ( x > 3) + 0, 0962 P0,7 ( x = 3) = P0,3 ( x 2) + 0, 0962 P0,3 ( x = 3) = 0, 7208 + 0, 0962 [ P0,3 ( x 3) P0,3 ( x 2)] = 0, 7208 + 0, 0962 [0, 9192 0, 7208] = 0, 7399 Fungsi 0, 0962 kuasa: 6 x3 ( ) 3 (1 )3
6 x
x (1 )6 x +
177
ISBN 978-602-8310-02-4
E0 ( x ) = P0 ( x > c) + P0 ( x = c) = 0, 2 = 1 P0 ( x c) + P0 ( x = c) = 0, 2 P0 ( x c) P0 ( x = c) = 0, 8
(5.36)
Dengan tabel distrbusi binomial untuk n = 6 dan 0 = 0, 3diperoleh: untuk c = 3, maka P0,3 ( x c) = 0, 9192. Jadi: P0,3 ( x = 3) = P0,3 ( x = 3) P0,3 ( x 2) = 0, 9192 0, 7208 = 0, 1994 Harga-harga ini disubstitusikan ke * diperoleh 0,9192-0,1994 = 0,8 0,8 = 0, 6132 = 0,9192 0,1994 Sehingga UMP test untuk hipotesa ini adalah: 1 ; jika x> 3 (x) = 0, 6132 ; jika x= 3 0 ; bagi yang lain Dengan kata lain: H0 ditolak jika x > 3 H0 ditolak jika x = 3dengan probabilitas 0,6132. Power of the tes di 0,7 adalah: (0, 7) = P0,7 ( x > 3) + 0, 6132 P0,7 ( x = 3) = P0,3 ( x 2) + 0, 6132 P0,3 ( x = 3) = 0, 7208 + 0, 0962 [ P0,3 ( x 3) P0,3 ( x 2)] = 0, 7208 + 0, 6132.0, 1852 = 0, 8344 H0 : 0, 4 VS H1 : > 0, 4, dengan = 0, 05.
178
ISBN 978-602-8310-02-4
Dengan tabel distribusi binomial untuk n = 6; 0 = 0, 4 diperoleh untuk c = 4, maka P0,4 ( x 4) = 0, 9590. Jadi P0,4 ( x = 4) = 0, 1382. Substitusikan nilai-nilai ini * diperoleh: 0, 9590 0, 1382 = 0, 95 = 0.0651 Sehingga UMP tes untuk hipotesa ini adalah: 1 ; jika x> c=4 (x) = 0, 0651 ; jika x= 4 0 ; bagi yang lain Power of the tes di 0,6 adalah: (0, 6) = P0,6 ( x > 4) + 0, 0651 P0,6 ( x = 4) = P0,4 ( x 1) + 0, 0651 P0,4 ( x = 2) = 0, 2333 + 0, 0651.0, 3110 = 0, 2535 Untuk = 0, 1 P0,4 ( x > c) + P0,4 ( x = c) E0 ( x ) = = 0, 1 = 1 P0,4 ( x c) + P0,4 ( x = c) = 0, 1 (5.38) P0,4 ( x c) P0,4 ( x = c) = 0, 9 Dengan tabel distribusi binomial untuk n = 6; 0 = 0, 4 diperoleh untuk c = 4, maka P0,4 ( x 4) = 0, 9590. Jadi P0,4 ( x = 4) = 0, 1382. Substitusikan nilai-nilai ke ** diperoleh: 0, 9590 .0, 1382 = 0, 9 = 0, 4269. Sehingga UMP tes untuk hipotesa ini adalah: 1 ; jika x> 4 (x) = 0, 4269 ; jika x= 4 0 ; bagi yang lain Power of the tes di 0,6 adalah:
179
ISBN 978-602-8310-02-4
(0, 6) = P0,6 ( x > 4) + 0, 4269 P0,6 ( x = 4) = P0,4 ( x 1) + 0, 4269 P0,4 ( x = 2) = 0, 2333 + 0, 4269.0, 3110 = 0, 3660 Untuk = 0, 2: E0 ( x ) = P0,4 ( x > c) + P0,4 ( x = c) = 0, 2 = 1 P0,4 ( x c) + P0,4 ( x = c) = 0, 2 (5.39) P0,4 ( x c) P0,4 ( x = c) = 0, 8 Dari tabel distribusi binomial pada n = 6; 0 = 0, 4 diperoleh untuk c = 3, maka P0,4 ( x 3) = 0, 8208. Jadi P0,4 ( x = 4) = 0, 2765. Substitusikan nilai-nilai ke *** diperoleh: 0, 8208 .0, 2765 = 0, 8 = 0, 0752. Sehingga UMP tes untuk hipotesa ini adalah: 1 ; jika x> 3 (x) = 0, 0752 ; jika x= 3 0 ; bagi yang lain Power of the tes di 0,6 adalah: (0, 6) = P0,6 ( x > 3) + 0, 0752 P0,6 ( x = 3) = P0,4 ( x 2) + 0, 0752 P0,4 ( x = 3) = 0, 5443 + 0, 0752.0, 2765 = 0, 5651 15. Misalkan x1 , x2 , ...., xn variabel random berdistribusi eksponensial dengan parameter lokasi dan densitas f ( x | ) = exp { ( x )} x < . Tentukan UMP tes untuk H0 : 30 VS H1 : 0 Penyelesaian: f ( xi | ) = e ( xi ) ; x < ISBN 978-602-8310-02-4
f ( x | ) = e( xi ) I( ,) x(i) 180
en I( ,) x(i) serta h ( x ) = e xi , maka T ( x ) = x(i) adalah statistik cukup bagi . Selanjutnya ditunjukkan keluarga f ( x | )mempunyai sifat MLR (Monotone Likehood Ratio) dalam T ( x ) = x(i) , yaitu ratio likehood dari f ( | x )untuk 1 < 2 adalah: f ( 2 | x ) = e(2 1 ) I( ,) x(i) yang merupakan fungsi tidak turun f ( 1 | x ) dalam x(i) , berarti { f ; }ini memiliki sifat MLR. Jadi MP tes uji diatas adalah: (x) = 1 ; jika x (i ) > C 0 ; bagi yang lain
C dihitung dari densitas x(i) , seabgai berikut: Misalkan Y = x(i) = xmin P (Y = y ) = = = P ( xmin y) 1 P ( xmin > y) 1 {1 P ( x y ) } n 1 1 1+e e 1 1 en eny 1 e(y )
= 1 1 = = = =
f y (y) = Jadi:
d dy d dy
n Y x e e dx y n 1 + e e x | n x
{ P (Y = y ) }
1 en eny
1 n ny ne e n.e n ( y )
= = =
; y <
Sehingga:
181
ISBN 978-602-8310-02-4
P (Y > c ) =
= = =
Log
n2 e n 0
=
3
= =
enc
nc
1 n Log
=
n2
Atau nc
n2 n
16. Misalkan x1 , x2 , ..., x30 random variabel independen berdistribusi G ( = 10, ), tidak diketahui. Konstruksikanlah MP tes untuk uji hipotesa H0 : = 2VS H1 : = 3dengan = 0, 05. Penyelesaian: xi
1 T(10)
x 9 e xi 10 i
= =
9 i30 =1 x i e
1 x 3 i
30
Log f ( x| =2)
f ( x | =3)
= =
>k
30 i =1 xi > 6 k 30 Log
2 3
=c
Selanjutnya dibawah H0 akan dicari distribusi dari 30 i =1 x i 10 xi G ( = 10, = 2) Mxi (t) = (1 2t)
Bab 5. Hipotesis Statistik
182
ISBN 978-602-8310-02-4
M30 xi (t) =
= =
30
(1 2t)300
= (1 2t ) 2 2 . Ini adalah MGF dari x( 600) Dengan demikian H0 akan ditolak apabila 30 i =1 x i > c Dimana c dapat dihitung berdasarkan tingkat signikansi 2 , memenuhi: = 0, 05 dan distribusi x( 600)
P 30 i =1 x i > c 1 P 30 i =1 x i c P 30 i =1 x i c
= 0, 05 atau = 0, 05 atau = 0, 95
2 Berdasarkan tabel distribusi x( didapat c 61, 656 600) Untuk menguji H0 : = 2 VS H1 : = 3dengan tingkat signikansi = 0, 05, H0 akan ditolak jika: 30 i =1 xi > 61, 656
17. Soal Buku Roussas no 4 halaman 313. Misalkan x1 , x2 , ...., xn random variabel berdistribusi N , 2 dengan tidak diketahui dan diketahui. Ingin dilakukan uji hipotesa H0 : = 0 VS H1 : = 1Untuk = 0, 05, = 0, 9, dan = 1. Tentukan ukuran dari sampel n. Penyelesaian: xi N , 2 f ( xi | ) = 22 e 2 2 i diketahui Uji hipotesis H0 : = 0 VS H1 : = 1. Berdasarkan Leuma Neymman-Pearson di dapat:
f ( x | =1) f ( x | =0)
1 2
( x )2
= = = =
(22 )
e
2
2 1n 2 12 n ( x i 1 ) e 2
2 1 n 1n 2 2 2 ( x i 0 ) e (22 ) 2 2 x + n x 12 ( x i i i)
1 ( n 2 x i ) 2 2
e 183
n 2 2
.e 2
xi
ISBN 978-602-8310-02-4
n xi
=c
Untuk = 0, 05, = 0, 9 dan = 1, dibawah H0 xi N (n.0, n.1) = N (n, 0)dan di bawah H1 xi N (n.1, n.1) = N (n, n) . 0, 05 P ( x c)
= P ( xi > c ) = P ( x > c) = 0, 95 = = =
0, 95 0, 95 0, 95 (5.40)
x 0 n
c n
P Z
c n
c n
0, 1
= =
x n n
c n n
P Z
c n
c n = 1, 28 n
Persamaan 1 disubstitusikan pada 2 didapat
(5.41)
n = n =
c n
+ 1, 28 = 1, 64 + 1, 28
2, 92
n = (2, 92)2 9
Jadi ukuran sampel adalah n = 9. 18. Misalkan x1 , x2 , ...., x100 variabel independen berdistribusi N , 2 .Jika x = 3, 2, Konstruksikan MP tes untuk hipotesis
Bab 5. Hipotesis Statistik
184
ISBN 978-602-8310-02-4
H0 : = 3, 2 = 4 VS H1 : = 3, 5, 2 = 4pada tingkat signikansi = 0, 01. Penyelesaian: akan dikonxi N , 2 f ( xi | ) = 22 e 2 2 i 2 struksikan uji MP untuk: H0 : = 3, = 4 VS H1 : = 3, 5, 2 = 4. Lueman Neymaman-Pearson memberikan:
f ( x |=3,5) f ( x | =3)
1 2
( x )2
= = e = =
(2 (4))50 .e
e 8 [ x+325] e
325 x 8 + 8 325 x 8 + 8
> k yaitu:
325 > Logk 8 x > 8 Logk + 325 8 x c > 100 100 x > c
= c = c
(5.42)
Dimana c dapat dihtung berdasarkan tingkat = 0, 01dan dsitribusi N = 3, 2 = 2 (dibawah H0 ), yang memenuhi hubungan: = 0, 01 = 0, 99 = P ( x > c ) P ( x > c ) P ( x c )
x 3 2 10
0, 99 = P 0, 99 = 0, 99 =
P Z
c 3 2 10 c 3 2 10 c 3 2 10
= 2, 33 c = c =
2 10
185
ISBN 978-602-8310-02-4
19. Misal x sampel random berdistribusi U(0,1) sebut f 0 atau berdistribusi dengan p.d.f segitiga pada [0, 1]sebut f 1 , yaitu:
1 4x ; 0x< 2 f1 = 4 4x ; 1 2 x 1 0 ; yang lain
Berdasarkan satu observasi x, konstruksikan MP tes untuk hipotesis H0 : f = f 0 VS H1 : f = f 1 dengan tingkat signikansi = 0, 05. Penyelesaian: H0 : f = f 0 VS H1 : f = f 1 Lueman Neymaman-Pearson memberikan: 1 ; 0x< 2 4x f (x| f1 ) = 4 4x ; 1 2 x 1 f (x| f1 ) 0 ; yang lain Terlihat bahwa ratio ini untuk 0 x 1 2 fungsi memotong naik 1 dan pada 2 x 1merupakan fungsi dari x yang memotong turun. Dengan demikian H0 akan ditolak jika: 4x < C1 atau 4x 4 > cC2 Yang ekivalen dengan:
x < C1 atau x > C2 dan C dapat dihitung berdasarkan tingkat signikansi Dengan C1 2 = 0, 05dan distribusi uniform yang memenuhi: P ( x < C1 )=
= =
0,05 2 0,05 2
H0 ditolak jika: x < 0, 025atau x > 0, 975 20. Misalkan x1 , x2 , ...., xn random variabel iid berdistribusi dengan p.d.f 1 f 0 atau f 1 , dengan f 0 adalah P (1)dan f 1 adalah geometrik P = 2 . Dapatkan MP test untuk hipotesis H0 : f = f 0 VS H1 : f = f 1 untuk tingkat signikansi = 0, 05. Penyelesaian: f 0 = P (1) f ( x i | 0 ) =
e! xi ! , x i
= 0, 1, 2...
xi
f (x | f1 ) = f (x | f0 )
1 in 1 xi ! . n = >k 2 e .2i=1n xi n x > c yang ekivalen dengan i =1 i n dibawah H0 , i=1 xi P (n)sehingga c dapat dihitung berdasarkan tingkat signikansi = 0, 05dan distribusi P (n)yang memenuhi: P ( xi > c ) n x c P i =1 i t n c t=0 n .te!
= 0, 05 = 0, 95 = 0, 95
6. Soal Roussas no 9 halaman 314 Misalkanx1 , x2 , ...., xn random variabel dengan p.d.f diberikan dibawah ini. Pada setiap kasus. Perlihatkan bahwa p.d.f bersama dari x adalah MLR dalam V = V ( x1 , x2 , ...., xn ). x a. f ( x; ) = T x 1 e x . I(0,) ( x ) ; (0, ) ; > 0 diketahui ()
Bab 5. Hipotesis Statistik
187
ISBN 978-602-8310-02-4
b. f ( x; ) = v
= =
dengan berdasarkan pada proposisi 1, hal. 277 (Roussas) dan dengan mengambil: Q ( ) = Log danV ( x1 , x2 , ...., xn ) = xQ ( )adalah fungsi turunan monoton dalam...........sebab. 1 < 0, untuk (0, )dengan demikiQ ( ) = 1 an keluarga { g (t; ) , = 0}adalah keluarga MLR dalam n x V = V ( x ) = i =1 i v+x1 b. f ( x; ) = v (1 ) x . I A ( x ) x A = {0, 1, 2, ...} , = (0, 1) f ( x; ) = nr in =1 r + xi 1 1 xi xi r + xi 1 n nr ei=1 xlog(1e) xi
= in =1
Dengan berdasarkan pada proposisi 1. Buku Rossas halaman 277 dan dengan mengambil : Q ( ) = Log (1 ) V (x) = x Maka Q ( )adalah fungsi monoton turunan sebab: Q ( ) = =
Bab 5. Hipotesis Statistik
1 1
1 1
188
sehingga keluarga distribusi { g (t, ) , (0, )}adalah keluarga MLR dalam V ( x ) = V ( x ) 21. Misalkan x1 , x2 , ...., xn sampel random dari distribusi exponensial dengan parameter lokasi dan densitas f ( x | ) = e( x ) , x < . Tentukan UMP test untuk H0 : 0 , H1 : 1 . Penyelesaian: x i f ( x i | ) = e ( xi ) ( xi ) = e xi + n f ( x | ) = in =1 e Akan ditentukan UMP test untuk H0 : 0 , H1 : 1 . Keluarga distribusi { g (t, ) , }adalah keluarga MLR, sebab untuk > 1 f ( x | ) e xi + n = x i + n 1 f ( x | ) , = 1 e n ( 1 ) = en I( ,) ( x(i) ) Ratio ini adalah fungsi monoton naik dalam x(i) Min ( x1 , x2 , ...., xn )
1
Selanjutnya T ( x ) = x(i) = Min ( x1 , x2 , ...., xn )adalah statistik cukup untuk sebab: f ( x | ) = e xi + n , < x i < ; < x (i ) x ( n ) <
e x ene I( ,) x(i)
Bersarkan teorema faktorisasi didapat: T ( x ) = x(i) = Min ( x1 , x2 , ...., xn ) Adalah statistik cukup untuk Selanjutnya berdasarkan teorema Karlin-Rubin dapat dikonstruksi UMP test untuk hipotesis: H0 : 0 , H1 : 0 Kaerna keluarga distribusi { g (t, ) , }adalah MLR dari T ( x ) = x(i) dan T ( x )adalah statistik cukup untuk , maka
Bab 5. Hipotesis Statistik
189
ISBN 978-602-8310-02-4
berdasarkan teorema Karlin-Rubin terdapat c0 yang menolak H0 bhb T > c0 merupakan UMP taraf dengan : = P0 ( T > c0 ) Dengan kata lain, untuk H0 : 0 , H1 : 0 terdapat uji UMP taraf , yang menolak H0 jika x(i) > c0 dengan c0 dapat ditentukan berdasarkan tingkat signikansi yang diberikan dan distribusi dari x(i) yang memenuhi P0 ( T > c0 ) = karena: 1 F (t) =
[ P ( x > t)]n
n ( x ) e dx t n e t .e
=
F (t) f (t)
= = = = =
1 en ent F (t)
en(t ) ;t n en ent n
1 n ( t 0 ) e dt = n
22. Jika x B (n, ), misalkan ( x ) adalah uji UMP untuk H0 : 0 VS H1 : > 0 . Untuk n = 6 , 0 = 0, 25, dan = 0, 05 ; 0, 01 ; 0, 02. Tentukan uji bersama-sama dengan ( ) fungsi kuasa untuk 0 = 0, 3 , 0 = 0, 25 , dan 0 = 0, 5. Penyelesaian: x B ( n, ) f ( x | ) = n x x (1 )n x , x = 0, 1, 2... H0 :
=
Log
f ( x | ) f ( x | 1 )
= = x
190
ISBN 978-602-8310-02-4
f ( x | ) f ( x | 1 )
> Log k
LogknLog Log
1 1 1 0 1 1 1 0
( 1 ) Log ( 0 )
Untuk n = 6, 0 = 0, 25, = 0, 05
) + P ( x = c ) = P ( x > c0 0 ) + P ( x = c ) = 1 P ( x c0 0 P ( x c0 ) P ( x = c0 ) = 1 (5.43) Dari tabel Binomial (n = 6, 0 = 0, 25)didapat: ) = P0,25 ( x c0 0, 9624 ) = P P0,25 ( x = c0 0,25 ( x c0 ) P0,25 ( x c0 1) = Untuk c0 = P0,25 ( x 3) P0,25 ( x 2) = 0, 9624 0, 8306 = 0, 1318 Persamaan 1 menjadi:
191
ISBN 978-602-8310-02-4
P0,25 ( x 4) = 0, 9954 P0,25 ( x = 4) = P0,25 ( x 4) P0,25 ( x 3) = 0, 9954 0, 9624 = 0, 033 Persamaan 1 menjadi: 0, 9954 (0, 033) = 0, 99 = 0, 164 Untuk n = 6, 0 = 0, 25, = 0, 02 =4 Dari tabel B (n = 6, 0 = 0, 25, = 0, 012)didapat c0 P0,25 ( x 4) = 0, 9954 dan P0,25 ( x = 4) = 0, 033 Persamaan 1 menjadi: 0, 9954 (0, 033) = 0, 98 = 0, 467 Selanjutnya akan dihitung uji kuasanya: ( ) = E ( ( x )) ) + P ( x = c ) ( ) = P1 ( x > c0 1 0 (5.44)
= 3 dan = 0.094 Untuk 1 = 0, 3, c0 Persamaan 2 menjadi: 0,3 ( ) = 1 P ( x = 0) P ( x = 1) P ( x = 2) + . P ( x = 3) = 1 0, 1176 0, 3025 0, 3341 + 0, 094. (0, 1852) = 0, 273 = 4 dan = 0, 164 Untuk 1 = 0, 3 , c0 Persamaan 2 menjadi: 0,3 ( ) = P ( x = 5) + P ( x = 6) + 0, 164 ( P ( x = 4)) = 0, 0102 + 0, 0007 + 0, 164. (0, 0595) = 0, 0206 = 4 dan = 0, 467 Untuk 1 = 0, 3 , c0 0,3 ( ) = P ( x = 5) + P ( x = 6) + 0, 467 ( P ( x = 4)) = 0, 0102 + 0, 0007 + 0, 467. (0, 0595) = 0, 0387
192
ISBN 978-602-8310-02-4
= 3 dan = 0, 094 Untuk 1 = 0, 4 , c0 0,4 ( ) = P ( x = 4) + P ( x = 5) + P ( x = 6) + P ( x = 3) = 0, 1382 + 0, 0369 + 0, 0041 + 0, 094. (0, 2765) = 0, 205 = 4 dan = 0, 164 Untuk 1 = 0, 4, c0 0,4 ( ) = P ( x = 5) + P ( x = 6) + P ( x = 4) = 0, 0369 + 0, 0041 + 0, 164. (0, 1382) = 0, 064 = 4 dan = 0, 467 Untuk 1 = 0, 4 , c0 0,3 ( ) = P ( x = 5) + P ( x = 6) + P ( x = 4) = 0, 0369 + 0, 0041 + 0, 467. (0, 1382) = 0, 106 = 3 dan = 0, 094 Untuk 1 = 0, 5 , c0 0,5 ( ) = P ( x > 3) + P ( x = 3) = 1 P ( x 2) + P ( x = 3) = 1 0, 3437 + 0, 094 (0, 3125) = 0, 686 = 4 dan = 0, 164 Untuk 1 = 0, 5 , c0 0,5 ( ) = P ( x > 4) + P ( x = 4) = 1 P ( x 3) + P ( x = 4) = 1 0, 6562 + 0, 164 (0, 2344) = 0, 382 = 4 dan = 0, 467 Untuk 1 = 0, 5 , c0 0,5 ( ) = 1 P ( x 3) + P ( x = 4) = 1 0, 6562 + 0, 164 + 0, 467 (0, 2344) = 0, 453
5.5
Soal-Soal Latihan
1. Misalkan X mempunyai f.k.p berbentuk f ( x; ) = x 1 ; 0 < x < 1 dan 0 untuk x yang lain, dengan { ; = 1, 2} . untuk uji hipotesis
Bab 5. Hipotesis Statistik
193
ISBN 978-602-8310-02-4
sederhana H0 : = 2, gunakan sampel random X1 , X2 dan didenisikan daerah kritis C = {(( x1 , x2 ); 3/4 x1 x2 } .Tentukan fungsi kekuatan dari uji. 2. DiketahuiX berdistribusi binomial dengan parameter n = 10 dan p { p; p = 1/4, 1/2} Hipotesis H0 : p = 1/2 ditolak, dan hipotesis alternatif H1 : p = 1/4 diterima, jika nilai observasi X1 sampel random berukuran 1 lebih kecil atau sama dengan 3. Tentukan fungsi kekuatan dari uji. 3. Diketahui X1 , X2 sampel random berukuran n = 2 dari distribusi x / , 0 < x < dan 0 untuk yang mempunyai f.k.p f ( x, ) = 1 e yang lain. Kita tolak H0 : = 2 dan terima H1 : = 1 jika nilai observasi dari X1 , X2 katakan X1 , X2 sedemikian sehingga f ( x1 ; 2) f ( x2 ; 2) 1 f ( x1 ; 1) f ( x2 ; 1) 2 (5.45)
Jika ruang parameter = { ; = 1, 2} , tentukan tingkat signikansi dari uji dan kekuatan uji kalau H0 salah. 4. Diasumsikan ketahanan dari suatu ban dan mill, katakan X , berdistribusi normal dengan mean dan standar deviasi 5000. Berdasarkan pengalaman masa lalu diketahui bahwa = 30.000. Perusahaan mengklaim membuat ban dengan proses baru dengan mean > 30.000, dan misalkan = 35.000. Untuk mengecek ini kita uji H0 : 30.000, lawan H1 : > 30000. Kita observasi n nilai yang independen dai X, misalnya x1 , x2 , ..., xn dan kita tolak H0 (terima H1 ) jika dan hanya jika x c. Tentukan n dan c sehingga fungsi kekuatan K ( ) dari uji mempunyai nilai K (30.000) = 0, 01 dan K (35.000) = 0, 98. 5. Misalkan X mempunyai distribusi Poisson dengan mean . Dipertimbangkan hipotesis sederhana H0 : = 1/2. dan hipotesis gabungan alternatif H1 : < 1/2. Misalkan = { ; 0 < 1/2} Misalkan X1, X2 , ..., X12 sampel random yang berukuran 12 dari disBab 5. Hipotesis Statistik
194
ISBN 978-602-8310-02-4
ribusi ini. Kita tolak H0 jika dan hanya jika nilai observasi dari Y = X1 + X2 + ... + X12 2. Jika K ( ) adalah fungsi kekuatan uji, 1 1 1 1 tentukan kekuatan dari K ( 1 2 ), K ( 3 ), K ( 4 ), K ( 6 ) dan K ( 12 ). Sket grak dari K ( ). Berapakah tingkat signikasnsi dari uji? 6. Dalam contoh 4 diatas , misalkan H0 : = = 0 dan H1 : = = 1. Perlihatkan bahwa uji terbaik dari H0 lawan H1 dapat menggunakan statistik x dan jika n = 25 dan = 0, 05 maka kekuatan uji adalah 0, 999 kalau H1 benar.
x / ; 0 < 7. Misalkan variabel random x mempunyai f.k.p f ( x; ) = 1 e x < dan 0 untuk x yang lain. Pertimbangkan hipotesis sederhana H0 : = = 2 dan alternatif H1 : = = 4. jika x1 , x2 sampel random yang berukuran 2 dari distribusi ini . Perlihatkan bahwa uji terbaik dari H0 lawan H1 dapat menggunakan statistik x1 + x2 .
9. Misalkan X1, X2 , ..., X10 sampel random berukuran 10 dari distribusi normal n(0, 2 ). Tentukan daerah kritik terbaik ukuran = 0, 05 untuk uji H0 : 2 = 1 lawan H1 : 2 = 2. Apakah ini merupakan daerah kritik terbaik ukuran 0,05 untuk uji H0 : 2 = 1 lawan H1 : 2 = 4? lawan H1 : 2 = 1? 10. Jika X1, X2 , ..., Xn adalah sampel random dari distribusi yang mempunyai f.k.p dari bentuk f ( x; ) = x 1 ; 0 < x < 1 dan 0 untuk yang lain. Perlihatkan bahwa daerah kritik terbaik untuk uji H1 : = 1 lawan H1 : = 2 adalah C =
( x1 , x2 , ..., xn ) ; c i=1 xi
11. Misalkan X1, X2 , ..., X10 sampel random dari distribusi n(1 , 2 ). Tentukan uji terbaik dari hipotesis sederhana H0 : 1 = 1 = 0, 2 = 2 = 1 lawan hipotesis alternatif H1 : 1 = 1 = 1, 2 = 2 = 4 12. Misalkan X1, X2 , ..., Xn sampel random dari distribusi normal n( , 100). Perlihatkan bahwa C = {( x1 , x2 , ..., xn ); c x }adalah daerah kritik terbaik untuk uji H0 : = 75 lawan H1 : = 78 Tentukan
Bab 5. Hipotesis Statistik
195
ISBN 978-602-8310-02-4
13. Misalkan X1, X2 , ..., Xn sampel random dari distribusi yang mempunyai f.k.p f ( x; p) = p x (1 p)1 x ; x = 0, 1 dan 0 untuk x yang lain. Perlihatkan bahwa C =
( x1 , x2 , ..., xn );
i =1
xi c
adalah daerah
kritik terbaik untuk uji H0 : p = 1/2 lawan H1 : p = 1/3. Gunakan teorema limit pusat untuk menentukan n dan c sehingga P
i =1
xi c; H0
= 0, 10 dan P
i =1
xi c; H1
= 0, 80
(5.48)
14. Dua sampel random yang independen masing-masing berukuran n dari dua disribusi. Kita tolak H0 : = 0 dan terima H0 : > 0 jika dan hanya jika x y c. jika K ( ) adalah kekuatan fungsi dari uji ini tentukan n dan c sehingga K (0) = 0, 05 dan K (10) = 0, 09. 15. Dalam contoh 5 diatas, H0 : = dengan bilangan tertentu dan H1 : < , perlihatkan bahwa himpunan
( x1 , x2 , ..., xn ) :
i =1
xi2 c
(5.49)
adalah daerah kritik paling kuat seragam uji H0 lawan H1 . 16. Dalam contoh 6 , H0 : = dengan bilangan tertentu dan H1 : = , perlihatkan bahwa tidak ada uji paling kuat seragam untuk uji H0 lawan H1 . 17. Misalkan X1, X2 , ..., X25 sampel random berukuran 25 dari distribusi
Bab 5. Hipotesis Statistik
196
ISBN 978-602-8310-02-4
normal n( , 100). Tentukan daerah kritik paling kuat seragam dari ukuran = 0, 01 untuk uji H0 : = 75 lawan H1 : > 75 18. Misalkan X1, X2 , ..., Xn sampel random darid istribusi normal n( , 16). Tentukan sampel berukuran n dan uji paling kuat seragam dari H0 : = 25 lawan H1 : < 25 dengan kekuatan fungsi K ( ) sehingga K (25) = 0, 10 dan K (23) = 0, 90. 19. Diketahui suatu distribusi dengan f.k.p f ( x; ) = x (1 )1 x ; x = 0, 1 dan bernilai 0 untuk x yang lain. Misalkan H0 : = 1/20 dan H1 : > 1/20.Gunakan teorema limit pusat untuk menentukan sampel berukuran n dari sampel random sehingga uji paling kuat seragam dari H0 lawan H1 mempunyai fungsi kekuatan K ( ) dengan K (1/20) = 0, 05 dan K (1/10) = 0, 09 20. Dalam n percobaan binomial dengan parameter p akan diuji H0 : p = 1/2, lawan H1 : p = 1/2 Tunjukkan bahwa daerah kritik uji rasio likelihood adalah x ln x + (n x ) k dengan x menyatakan banyak sukses. 21. Dalam soal no 1, tunjukkan bahwa daerah kritiknya juga dapat ditulis x n 2 c, dengan c suatu konstanta yang tergantung pada ukuran daerah kritik. 22. Suatu sampel random yang berukuran n digunakan untuk menguji hipotesis nol dari populasi eksponensial dengan parameter sama dengan 0 lawan hipotesis alternatif tidak sama 0 . Tunjukkan daerah kritik uji rasio likelihood adalah xe x/0 k
Bab 5. Hipotesis Statistik
(5.50)
(5.51)
197
23. Suatu sampel random yang berukuran n dari populasi normal dengan mean dan varians tidak diketehui digunakan untuk uji hipotesis = 0 lawan alternatif = 0 . Perlihatkan bahwa nilai dari statistik rasio likelihood dapat ditulis = dengan t =
x 0 s/ n
t2 1+ n1
n/2
(5.53)
24. Dalam contoh 2 diatas, bila n = 10, dan misalkan diperoleh x = 0, 6 dan
i =1
(xi x)2 = 3, 6.
10
198
ISBN 978-602-8310-02-4
Daftar Pustaka
1. Billingsley, P. (1979) Probability and Measure, John Wiley & Sons,USA 2. Dudewicz E.J. & Mishra, S.N.(1988) Modern Mathematical Statistics,John Wiley & Sons, Inc. Singapore 3. Lehmann, E.L. (1983) Theory of Point Estimation, John Wiley & Sons, Inc. USA 4. Nar Herrhyanto (2003) Statistika Matematis Lanjutan, CVPustaka Karya, Bandung 5. Papoulis,A & Pillai S. Unnikrishna, (2002) Probability, Random Variables, And Stochastic Processes, Mc Graw Hill, Inc, Singapore 6. Rohatgi,V.K. (1976) An Introduction to Probability Theory and Mathematical Statistics, John Wiley & Sons, USA 7. Roussas G.G. (1973) A First Course in Mathematical Statistics, Addison-Wesley Publishing Company, Inc. USA 8. Subanar (1994) Suplemen Teori Peluang, Fakultas MIPA UGM, Yogyakarta 9. Walpole, Ronald.E. & Myers, Raymond H. & Myers, Sharon L.& Ye, Keying (2002) Probability and Statistics for Engineers & Scientists, Prentice Hall,Inc, USD 199
Daftar Pustaka
10. Walpole, Ronald.E. & Myers, Raymond H. (1986) Ilmu Peluang dan Statistika untuk Insinyur dan Ilmuan, Penerbit ITB, Bandung. 11. Beberapa e-book dan e-text, terutama dari portal MIT Open Course Ware (http://ocw.mit.edu/OcwWeb/Mathematics/index.htm)
200
ISBN 978-602-8310-02-4