Vous êtes sur la page 1sur 11

1

BAB I
PENDAHULUAN

1.1 Latar Belakang


Banyak penelitian ilmiah menghasilkan data longitudinal
dengan pengukuran ulang dijumlah titik waktu, dan data
peristiwa yang mempertimbangkan perubahan dari waktu ke
peristiwa, yaitu, kegagalan atau bertahan hidup , serta
informasi kovariat tambahan.Sebuah contoh adalah bahwa uji
klinis HIV, di mana biomarker seperti jumlah limfosit CD4 diukur
sesekali waktu dan untuk pengembangan menjadi AIDS atau
kematian juga dicatat, dengan kemungkinan awal DO atau
kegagalan. Hal ini penting dan diperlukan untuk menyelidiki pola
perubahan CD4, dan untuk menandai hubungan antara CD4 dan
waktu untuk pengembangan atau kematian ( Heagerty, 2006)
Data ini dapat digunakan untuk mengilustrasikan pendekatan
analisis data longitudinal.
Studi data longitudinal merupakan pengamatan yang dilakukan sebanyak n
subjek yang saling independen dengan setiap objek yang diamati secara berulang
dalam kurun waktu yang saling dependen dan pengamatan dalam subyek yang
sama. ( DQinggou, 2008 ).
Dalam ilmu statistika, teknik umum digunakan untuk menganalisis
hubungan antar

variabel-variabel

prediktor dengan variabel-variabel respon

adalah analisi regresi. Data longitudinal adalah pengamatan berulang pada unit
eksperimen, berbeda dengan data cross sectional yaitu data dari masingmasing
individu diamati dalam sekali waktu. Penelitian longitudinal memiliki cakupan
pengertian serta karakteristik seperti data dikumpulkan untuk setiap variabel pada
dua atau lebih periode waktu tertentu, subjek atau kasus yang dianalisis sama, atau
setidaknya dapat diperbandingkan, antara satu periode dengan periode berikutnya.
Ada beberapa keuntungan dari studi mengenai data longitudinal
dibandingkan dengan data cross section. Pertama, studi longitudinal lebih
powerful dari studi cross section untuk sejumlah subyek yang tetap. Dengan kata
lain, untuk memperoleh kekuatan uji statistik yang sama, studi longitudinal
membutuhkan subyek yang lebih sedikit. Kedua, dengan jumlah subyek yang
sama, hasil pengukuran error menghasilkan penaksir efek perlakuan yang lebih
efisien dari data cross section. Ketiga, data longitudinal mampu menyediakan
informasi tentang perubahan individu, sedangkan data cross section tidak. Studi
data longitudinal mampu membedakan keragaman respon yang disebabkan karena
pengukuran yang dilakukan berulangkali terhadap suatu subyek dengan
keragaman yang disebabkan oleh perbedaan antar subyek.
Dalam studi tentang data longitudinal, pada umumnya pengamatan
dilakukan terhadap n subyek yang saling independen, dimana setiap subyek
diamati secara berulang (repeated measurement) dalam kurun waktu berbeda.
Teknik peramalan yang dikembangkan dari berbagai disiplin ilmu dipilih untuk
berbagai maksud. Setiap teknik yang akan dipilih memiliki sifat tertentu dan
biyaya tersendiri yang harus dipertimbangkan. Dan pemodelan ini digunakan

untuk menjelaskan hubungan tak linier antar variabel dan beberapa prosedur
pengujian untuk mendeteksi adanya keterkaitan tak linier.
Dalam suatu estimasi model seharusnya konstan sehingga varians sama
(homogen) tetapi seringkali justru berubah-ubah, hal ini biasa terjadi pada data
cross section. Estimasi diartikan menaksir ciri-ciri terntentu dari populasi
(parameter) dengan nilai sampel.
Cara pengambilan kesimpulan tentang parameter berhubungan dengan
cara menaksir harga parameter. Jadi harga parameter sebenarnya tidak diketahui
akan diestimasi berdasar statistik sampel yang diambil dari populasi yang
bersangkutan.
Estimasi nilai parameter memiliki dua cara yaitu estimasi titik dan estimasi
selang. Estimasi titik dengan menyebut satu nilai sedangkan estimasi selang
adalah estimasi dengan menyebutkan daerah pembatasan dimana ditentukan batas
minimum dan maksimum suatu estimator.
Korelasi muncul ketika sejumlah data longitudinal dari objek yang sama
dianalisis. Berbagai metode metode dikembangkan untuk mengevaluasi efek dari
kovariat dari variabel responnya. Estimator fungsi koefisien yang tidak diketahui
diperoleh dengan metode kuadrat terkecil. Estimasi kuadrat terkecil paling pasti
memiliki beberapa sifat yang baik, khususnya ketika kesalahan acak mengikuti
distribusi normal. Namun, seperti yang diketahui dalam literatur ketahanan,
estimasi dan kesimpulan berdasarkan kuadrat sangat sensitif

terhadap outlier

dalam data. Regresi robu diperlukan untuk mengatasi adanya outlier tersebut.

1.2

Perumusan Masalah

Berdasarkan latar belakang di atas, permasalahan yang perlu ditelaah


dalam penelitian ini adalah bagaimana prsedur M-estimasi dengan weight least
square dapat memberi optimasi pada regresi tak linier untuk mengatasi adanya
outlier pada data longitudinal yang lebih baik dari metode kuadrat terkecil..

1.3

Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk mengkaji prsedur M-estimasi

dengan weight least square dapat memberi optimasi pada regresi tak linier untuk
mengatasi adanya outlier pada data longitudinal yang lebih baik dari metode
kuadrat terkecil..

1.4 Manfaat Penelitian


Manfaat yang diharapkan dari penelitian ini dapat memberikan wawasan
ilmu bagaiman M-estimasi dapat memberikan kontribusi yang lebih baik pada
regresi tak linier untuk data longitudinal yang tidak dapat dilakukan dengan least
square methode.

55

BAB 2
TINJAUAN PUSTAKA
2.1 Analisis Regresi

Analisis regresi merupakan salah satu analisis dalam statistika yang banyak digunakan
untuk mengetahui hubungan antara variabel-variabel prediktor dengan variabel respon.
Berdasarkan bentuk kurva atau pola hubungan antara variabel-variabel prediktor dengan
variabel respon, pendekatan model regresi diklasifikasikan menjadi tiga yaitu :
1. Regresi Parametrik
Regresi parametrik merupakan metode yang digunakan untuk mengetahui pola
hubungan antara variabel respon dan variabel prediktor, yang diketahui bentuk kurva
regresinya.
2. Regresi Nonparametrik
Pendekatan nonparametrik digunakan untuk mengestimasi kurva regresi karena model
tidak ditentukan bentuknya terlebih dahulu seperti pada regresi parametrik.
3. Regresi Semiparametrik
Regresi semiparametrik adalah gabungan antara regresi parametrik dan regresi
nonparametrik.

2.2 Regresi Non Linier

Pada umumnya, analisis regresi tak linier digunakan untuk mengestimasi parameter

yang belum diketahui dengan

prediktor

dan variabel respon Yi, Asumsikan

dengan Y 1 , , Y n mengikuti model regresi


Y i=f i ( )+ i , i = 1, 2, .. . , n

dengan f i

(2. 1)

fungsi merupakan kurva regresi dan i error random yang diasumsikan identik,

independen, dan berdistribusi normal dengan mean nol dan variansi


Untuk mengestimasi parameter

dan model regresi

2 ( Linke, 2016).

prosedur metode least square

pendekatan metode maximum likelihood yakni M-estimasi (Linke, 2016 )


Analisis regresi adalah salah satu metode yang digunakan untuk mendapatkan pola
hubungan antara prediktor dengan respon. Analisa regresi data longitudinal atau regresi data
panel adalah analisi regresi yang memperhatikan faktor time series pada data pengamatan
cross section yang dilakukan dalam beberapa periode merupakan pengembangan dari regresi
linier dengan metode-metode kuadrat terkecil tertimbang (weight least square method) yang
memiliki kekhususan dari segi jenis data dan tujuan analisisnya. Metode kuadrat terkecil
tidak akan stabil jika terdapat data outlier. Data terpencil dapat mendistorasi estimasi
parameter. M- estimasi digunakan untuk mengurangi
Pendekatan Scheike untuk M-estimator berasal estimator yang normal konsisten dan
asymptotic untuk parameter yang tidak diketahui dalam model regresi non linier untuk data
longitudinal dengan waktu pengukuran proses penghitungan. Dia menggunakan metode
weighted least Square. Standar metode least square tidak stabil jika ada outlier hadir dalam
data. Data terpencil memberikan efek sangat kuat dalam minimisasi parameter sehingga

diperkirakan terdistorsi. M-estimator mencoba untuk mengurangi efek dari outlier dengan
mengganti fungsi kuadrat dengan yang lain.

2.3 Data Longitudinal


Dalam studi tentang data longitudinal, pada umumnya pengamatan dilakukan
pengamatan dilakukan terhadap n subyek yang saling independen, dimana setiap suyek
diamati secara berulang ( repeated measurement ) dalam kurun waktu berbeda. Misalkan
t ij

menyatakan pengamatan pada waktu ke-j dari subyek ke-i dan


t ij , dan

variabel respon waktu

X ij

Y ij

menyatakan

adalah vektor kovariat atau prediktor pada waktu t ,

X
T
sehingga ( ij 1 , , X ijm) maka data longitudinal diberikan oleh ( Y ij , X ij , j = 1, ..., n
X ij =

ni

; i = 1, ... , dimana

menyatakan banyaknya pengukuran berulang pada individu ke-i ,

sehingga dapat dituliskan dalam model


Y ij = X Tij f i ()+ ij

dengan
i

f i ()

adalah fungsi regresi dengan parameter

( 2. 2)

yang belum diketahui, dan

error random yang diasumsikan identik, independen, berdistribusi normal dengan mean

2
nol dan varians

(Tang Qingguo & Cheng Longsheng, 2008).

2.4 M-Estimasi
Regresi robust adalah metode regresi yang digunakan ketika distribusi residual tidak
normal atau ada beberapa outlier yang mempengaruhi model. Metode ini merupakan alat
penting untuk menganalisa data yang dipengaruhi oleh outlier sehingga model yang kekar
terhadap pencilan. Ketika peneliti menyusun model regresi dan melakukan uji asumsi sering
ditemui bahwa asumsi regresi dilanggar, transformasi yang dilakukan tidak akan
menghilangkan atau melemahkan pengaruh dari pencilan yang akhirnya prediksi menjadi
bias. Dalam keadaan ini, regresi robust yang tahan terhadap pengaruh pencilan adalah metode
yang terbaik. Regresi robust digunakan untuk mendeteksi pencilan dan memberikan hasil
yang resisten terhadap adanya outlier.
Dalam regresi robust salah satu metode estimasi yang terkenal adalah estimasi-M.
Huruf M menunjukkan bahwa estimasi-M adalah estimasi tipe maksimum likelihood.
Estimasi-M memenuhi sifat sebagai estimator tak bias dan memiliki variansi minimum dalam
kumpulan estimator. Jadi estimator M emiliki variansi terkecil dibandingkan dengan variansi
estimator yang lain. ( Susanti, 2014 )
Estimator fungsi koefisien yang tidak diketahui diperoleh dengan metode kuadrat
terkecil. Estimasi kuadrat terkecil memiliki beberapa sifat yang baik, khususnya ketika
kesalahan acak mengikuti distribusi normal. Namun, seperti yang diketahui dalam literatur
ketahanan, estimasi dan kesimpulan berdasarkan kuadrat sangat sensitif terhadap outlier
dalam data. metode estimasi yang lebih kuat diperlukan. Dalam Penelitian, M-estimasi
digunakan untuk mendekati parameter koefisien yang tidak diketahui

. Dalam kondisi

yang tepat kami menetapkan tarif konvergensi global M-estimator dari

. Akan

mendistribusikan asymptotic dari M-estimator dan menggunakan hasil ini untuk


mengembangkan interval kepercayaan estimasi.

109

BAB 3
METODOLOGI PENELITIAN

Pada penulisan ini dilakukan studi literatur dengan menganalisa pendekatan Sceike
yang mejelaskan pendekatan M-Estimasi, dimana asumsi normal dari parameter yang belum
diketahui pada model regresi non linier untuk data longitudinal pada proses pengamatan yang
berulang di gunakan weigthed least square method. Least square method klasik tidak akan
stabil jika terdapat outlier pada data. M-estimator mencoba untuk mengurangi efek dari
outlier dengan mengganti fungsi kuadrat dengan bentuk yang lain ( orsakova, 2006 ).
Selanjutnya adalah menyajikan model yang lebih tepat dan asumsi yang diberikan.
Kemudian membukti konsistensi asumsi normalitas dari M-estimasi. Akhirnya sifat Mestimasi ditampilkan untuk kasus varians bersyarat diketahui.

10
11
0

BAB IV
JADWAL PELAKSANAAN

Penelitian ini dimulai dengan pengumpulan informasi tentang teori-teori dan literaturliteratur yang berkaitan dengan data longitudinal, estimasi, regresi non linier, pembuatan
proposal, penelusuran lebih lanjut mengenai literatur, kemudian seminar proposal, pembuatan
teori, dan diakhiri dengan seminar hasil dan sidang. Selanjutnya akan dilakukan publikasi
ilmiah untuk melengkapi persyaratan kelulusan. Tabel dibawah ini memberikan rencana kerja
yang akan dilakukan peneliti.

Tabel Rencana Kegiatan


Tahun 2016-2017
11
No Kegiatan
1

Penelusuran Literatur

Pembuatan Proposal

Seminar Proposal

Pembuatan Teori

Seminar

Publikasi Ilmiah

12

Vous aimerez peut-être aussi