Académique Documents
Professionnel Documents
Culture Documents
Disusun Oleh:
1. Iskandar
(A1C113014)
(A1C113063)
KATA PENGANTAR
Puji syukur kami panjatkan kepada Allah SWT yang telah melimpahkan karunia kepada
hambaNya, sehingga makalah yang berjudul Analisis Variabel Dummy (Variabel
terikat) ini dapat diselesaikan.
Dengan terselesaikannya makalah ini diharapkan makalah ini dapat memberi manfaat
kepada pembaca. Selain itu, tak lupa pula kami mengucapkan terima kasih kepada semua pihak
yang telah membantu dalam penyelesaian makalah ini.
Terima kasih sebesar-besarnya penulis ucapkan kepada Bapak Drs. H. Karim, M.Si. dan
Ibu Rizky Amalia, M.Pd. selaku dosen pengajar yang telah memberikan bimbingan dan arahan
dalam pengerjaan dan penyusunan bahan hingga dapat disajikan dalam karya tulis ini. Tidak lupa
ucapan terima kasih kepada pihak-pihak yang tidak bisa disebutkan satu per satu yang juga turut
membantu dalam proses penyusunan makalah ini.
Kami menyadari bahwa dalam pembuatan makalah ini masih banyak memiliki
kekurangan baik dari segi penulisan, isi dan lain sebagainya. Kami mengharapkan saran dan
kritik yang membangun demi kesempurnaan makalah ini. Atas perhatian semua pihak, kami
mengucapkan terima kasih.
Penulis
Daftar Isi
KATA PENGANTAR.......................................................................................................................i
Daftar Isi..........................................................................................................................................ii
BAB I...............................................................................................................................................1
PENDAHULUAN...........................................................................................................................1
A.
Latar Belakang.........................................................................................................................1
B.
Rumusan Masalah....................................................................................................................1
C.
Tujuan......................................................................................................................................1
BAB II.............................................................................................................................................2
PEMBAHASAN..............................................................................................................................2
A.
Kajian Teori.............................................................................................................................2
1.
Pemodelan Matematis...........................................................................................................3
2.
Model Logit..........................................................................................................................5
3.
Pengolahan Logit..................................................................................................................6
B.
Contoh Kasus...........................................................................................................................8
1.
Menilai keseluruhan model (overall model fit) dan menilai kelayakan model regresi
13
2
BAB III..........................................................................................................................................34
KESIMPULAN..............................................................................................................................34
Daftar Pustaka................................................................................................................................36
BAB I
PENDAHULUAN
A. Latar Belakang
Variabel dependent pada dasarnya tidak hanya dapat dipengaruhi
oleh variabel independent kuantitatif, tetapi juga dimungkinkan oleh
variabel kualitatif. (Catatan: sebenarnya variabel dependent juga dapat
berbentuk variabel kualitatif, tetapi hal tersebut akan kita bahas pada
tulisan yang lain). Lalu bagaimana cara kita memasukkan variabel
independent kualitatif tersebut (yang tidak berbentuk angka) ke dalam
model regresi kita?
Variabel
kualitatif
tersebut
harus
dikuantitatifkan
atributnya
B. Rumusan Masalah
1. Apa itu model regresi variabel dummy terikat?
2. Bagaimana menganalisis kasus model regresi variabel dummy terikat dengan SPSS?
C. Tujuan
1. Mengetahui apa itu model regresi variabel dummy terikat.
2. Dapat menganalisis kasus model regresi variabel dummy terikat dengan SPSS.
BAB II
PEMBAHASAN
A. Kajian Teori
Persamaan regresi baik sederhana maupun berganda yang telah dipelajari pada babbab lalu, hanya menunjukan hubungan antara variabel numerik baik variabel terikat maupun
variabel bebasnya. Padahal untuk mengungkapkan suseatu fenomena, tidak jarang
dibutuhkan variabel bukan numerik, yang salah satunya adalah variabel kategorik.
Dalam model regresi, variabel kategorik yang berharga nol atau satu bias disebut
dengan variabel dummy. Dalam aplikasinya, variabel dummy ini sangat bermanfaat untuk
mengkuantifikasi data kualitatif, seperti : jenis kelamin, status perkawinan, kualitas produk,
kepuasan pelayanan, dan sebagainya. Disamping itu, variabel dummy juga bermanfaat untuk
malihat model regresi yang berubah arah maupun terjasinya loncatan trend pada kurun
waktu yang berbeda, serta dapat juga dipergunakan untuk membuat model regresi yang
linier sebagian-sebagian.
Variabel dummy disebut juga variabel indicator, biner, kategorik, kualitatif, boneka,
atau variabel dikotomi. Suatu persamaan regresi dahat hanya menggunakan variabel
kategorik sebagai variabel bebas tetapi daoat pula disertai oleh variabel bebas lain yang
numeric. Regresi dengan variabel bebasnya hanya vriabel dummy atau yang sifatnya
kualitatif disebut model Analysis of Variance (ANOVA).
Misalkan : sebuah perusahaan parfum ingin melakukan marketing research, untuk
mengetahui segmen pasar pada berbagai macam jenis produknya. Segmen pasar yang
dimaksud diukur berdasarkan daerah tempat tinggal responden, yaitu kota atau desa,dan
harga berbagai macam produk. Atau dengan kata lain, akan dilihat hubungan antara daerah
tempat tinggal responden dengan harga yang dipilih. Untuk kepentingan tersebu, perusahaan
mengadakan observasi di beberapa daerah untuk mengumpulkan data. Setelah data
terkumpul, maka digunakan model regresi untuk menghasilkan hasil penilitian.
Sebagai ilustrasi analisis regresi variabel dummy terikat, model ini muncul pada
kasus-kasus seperti berikut : Misalkan ingin mempelajari partisipasi wanita dewasa apda
2
angkatan kerja sebagai fungsi rata-rata upah, pendapatan suami, umur, banyaknya anak usia
sekolah, dan lain-lain. Variabel terikatnya partisipasi angkatan kerja wanita.
Model ini juga dipakai untuk menganalisis apakah buruh/pekerja menjadi anggota
dari serikat pekerja atau tidak. Variabel terikatnya berupa keikutsertaan seseorang dalam
suatu serikat.
Selain itu juga dapat mengamati hubungan antara pernah tidaknya melakukan
perjalanan luar negeri dan faktor ynag mempengaruhinya seperti pendapatan, jenis
pekerjaan, dll. Variabel terikatnya pernah tidaknya melakukan perjalanan keluar negeri.
Biasanya suatu variabel terikat diasumsikan dengan 1 dan 0 untuk tidak. Dari
contoh-contoh diatas ada satu hal yang menarik yaitu variabel terikatnya merupakan suatu
jawaban YA atau TIDAK atau berupa Variabel Dikotomi.
1. Pemodelan Matematis
Perhatikan kembali model regresi sederhana yang telah kita analsis:
Y i= 1 + 2 X i +ui
X
pendapatan
perjalanan keluar negeri. Dengan dasar inilah model tersebut disebut Model Probabilitas
Linier.
Linear Probability Model (LPM) merupakan metode regresi yang umum digunakan
sebelum logit dan probit model dikembangkan. LPM bekerja dengan dasar bahwa variabel
respon Y, yang merupakan probabilita terjadinya sesuatu, mengikuti Bernoulli probability
distribution dimana:
Sumber: wcr.sonoma.edu
Gambar diatas menunjukkan bahwa garis dari Linear Probability Model (LPM) sangat
minim menjelaskan atau mempresentasikan dari variabel dependent yang diskrit. Oleh
karena itu, karena LPM bekerja berdasarkan metode OLS biasa maka timbul permasalahan
yang telah diungkapkan sebelumnya: non-normality of the disturbance, heteroscedastis,
tidak terpenuhinya ekspektasi nilai Y antara satu sampai dengan nol, dan tidak dapat
digunakannya R sebagai pengukur Goodness of Fit. Kebutuhan akan model probabilita
yang menghasilkan Y yang terletak antara interval satu sampai dengan nol dengan
hubungan antara Pt dengan Xt yang tidak linear menyebabkan logit model dikembangkan.
2. Model Logit
Model Linear Probability Model memiliki masalah, tidak dapatnya memberikan hasil
nilai Y yang terletak pada interval 1 dan 0, padahal niai probabilitas mengharuskan kisaran
nilainya diantara 1 dan 0. dikarenakan mereka menggunakan OLS atau regresi linear dalam
melakukan estimasinya, atau dengan persamaan sebagai berikut:
Dimana Zi = 1 + 2Xi.
Persamaan diatas lebih dikenal sebagai logistic distribution function. Persyaratan yang
diminta sebelumnya, yaitu model probabilita yang menghasilkan Y antara interval satu
sampai dengan nol dengan hubungan antara Pt dengan Xt yang tidak linear, dapat
terpenuhi. Hal ini disebabkan, saat Z berkisar antara - sampai dengan , Pi berkisar
antara 0 dan 1 sehingga Pi tidak berhubungan linear dengan Z. Meskipun begitu masih
terdapat masalah estimasi karena P tidak hanya tidak linier pada X tetapi juga ke .
Namun, seperti dapat ditunjukkan pada persamaan berikut, masalah estimasi tersebut dapat
diatasi. Setelah itu kita perlu menentukan persamaan kejadian gagal, dengan merujuk
kepada Bernoulli probability distribution. Maka kita akan mendapatkan persamaan seperti
dibawah ini:
Setelah kita memiliki persamaan kejadian sukses dan persamaan kejadian gagal, maka
kita dapat pula membuat Odds Ratio yang merupakan peluang sukses dibagi dengan
peluang gagal, dengan rumus matematika seperti dibawah.
Untuk mendapatkan nilai z yang sudah linier maka kita perlu melakukan treatment
tambahan setelah melakukan odd ratio dimana dengan mengalikan persamaan diatas
dengan Logaritma Natural dengan tujuan membuat persamaan menjadi linear, sehingga
bentuk persamaan akan menjadi seperti dibawah ini:
Logaritma Natural atau ln dari odds ratio tidak hanya bersifat linear pada X tetapi juga
bersifat linear terhadap parameter. Persamaan tersebut yang kemudian dikenal sebagai
model logit. Kelebihan dari model logit tersebut adalah:
Saat P berpindah dari 0 ke 1, logit L akan berpindah dari - ke .Oleh karena itu,
meskipun probabilita terletak antara 0 hingga 1, logit sendiri tidak terbatasi. Dan
meski L linear terhadap X, probabilitanya sendiri tidak.
L (logit) yang bernilai positif menandakan bahwa meningkatnya nilai regresor akan
menyebabkan meningkatnya odds dari regresan yang setara dengan 1. Sebaliknya, L
(logit) yang bernilai negative menandakan bahwa menurunnya odds dari regresan yang
setara dengan 1akan menyebabkan meningkatnya nilai dari X.
Model logit yang diberikan pada persamaan lima dapat diinterpretasikan sebagai
berikut: slope 2 merupakan pengukur perubahan nilai L karena perubahan nilai X,
sementara Intercept 1 merupakan nilai dari log-odds apabila nilai suatu slope nol.
Logit model juga mengasumsikan bahwa log sebuah odds ratio berhubungan linier
terhadap Xi atau nilai sebuah slope.
3. Pengolahan Logit
Dalam binary regressand model, kita menggunakan pseudo R2, yang mirip dengan
R2, untuk mengukur goodness of fit. Program Stata secara otomatis menyediakan
pengukuran tersebut, yaitu McFadden R2, yang ditulis dengan Pseudo R2.
Mirip dengan F test pada model regresi linear adalah likelihood ratio (LR) statistik.
LR statistik mengikuti ditribusi 2 dengan derajat kebebasan (degree of freedom)
sama dengan jumlah variabel bebas
menggunakan
regresi
berganda
dummy
adalah
Kuantitatif
dan
variabel
Independentnya
skala
B. Contoh Kasus
Berikut akan diberikan contoh kasus beserta penjelasannya:
7
Misalkan kita ingin memprediksikan pengaruh Uang saku, jenis kelamin, dan
penghasilan orang tua terhadap kemungkinan seorang anak menabung
No
1
Y
0
X1
15000
X2
1
X3
1
16000
10000
14000
5000
5000
20000
10000
6000
10
7000
11
10000
12
10000
13
6000
14
10000
15
6000
16
7000
17
19000
18
5000
19
5000
20
8000
Keterangan :
y={ 0 tidak suka menabung
1 suka menabung
X 1=uang saku anak
X 2={0 perempuan
1lakilaki
X 3={0 penghasilan orang tuakurang dari3000000
1 penghasilan orang tua lebih dari3000000
10
11
N
Included in Analysis
Missing Cases
Total
Unselected Cases
Total
Percent
20
100.0
.0
20
100.0
.0
20
100.0
Internal Value
suka menabung
12
Tabel diatas menunjukkan kode variabel terikat, yang dalam hal ini
adalah 0 untuk siswa tidak suka menabung dan 1 untuk siswa suka menabung.
c. Uji signifikansi omnibus terhadap model
Omnibus Tests of Model Coefficients
Chi-square
Step 1
df
Sig.
Step
14.106
.003
Block
14.106
.003
Model
14.106
.003
Step
1
-2 Log likelihood
13.620
Nagelkerke R
Square
Square
.506
.675
Cox & Snell R Square merupakan ukuran yang mencoba meniru ukuran
R2 pada multiple regression yang didasarkan pada teknik estimasi likelihood
dengan nilai maksimum kurang dari 1 sehingga sulit diinterpretasikan. Dilihat
dari Tabel tersebut, nilai Cox & Snell R Square adalah 0,506.
13
Chi-square
9.878
df
Sig.
8
.274
Hosmer and Lemeshow Test menguji hipotesis nol bahwa data empiris
cocok atau sesuai dengan model (tidak ada perbedaan antara model dengan data
sehingga model dapat dikatakan fit).
Dasar pengambilan keputusannya adalah dengan memperhatikan nilai
signifikansi dari Chi Square terhadap kriteria pengujian = 0.1 pada Hosmer and
Lemeshow Test yaitu:
S.E.
Wald
df
Sig.
Exp(B)
X1
.001
.000
4.186
.041
1.001
X2
-4.548
2.283
3.969
.046
.011
X3
-4.747
2.399
3.914
.048
.009
-.815
1.775
.211
.646
.443
Constant
pendapatan orang tua mereka sama. Artinya laki-laki memiliki peluang lebih
tinggi memiliki prilaku suka menabung daripada perempuan.
Nilai Exp(B) variabel independen pendapatan orang tua sebesar 0,009,
maka peluang siswa yang memiliki pendapatan orang tua lebih dari atau sama
dengan 3 juta memiliki prilaku suka menabung sebesar 0,009. Dapat diartikan
bahwa peluang siswa yang memiliki pendapatan orang tua lebih dari atau sama
dengan 3 juta memiliki prilaku suka menabung adalah 0,009 kali jika
dibandingkan siswa yang pendapatan orang tuanya kurang dari 3 juta, jika uang
saku dan jenis kelamin sama.
Untuk menguji faktor mana yang berpengaruh nyata siswa yang memiliki
prilaku suka menabung tersebut, dapat menggunakan uji signifikansi dari
parameter koefisien secara parsial dengan statistik uji Wald, yang serupa dengan
statistik uji t atau uji Z dalam regresi linear biasa, yaitu dengan membagi
koefisien terhadap standar error masing-masing koefisien. Dengan uji t (Uji
Wald) dan pvalue-nya (dengan menggunakan kriteria pengujian = 10%) terlihat
bahwa X3 berpengarh nyata (karena memiliki p-value dibawah 10%) siswa yang
memiliki prilaku suka menabung. Variabel independen uang saku dan jenis
kelamin juga signifikan pada = 10%, sehingga model regresi ini layak
digunakan untuk memprediksi variabel siswa yang memiliki prilaku suka
menabung.
f. Penafsiran dan prediksi
Persamaan model regresi binary logistic tersebut adalah:
p
ln
=0,815+0,001 X 14,548 X 24,747 X 3
1 p
ln
( 1p p )=9,185
16
( 1p p )=e
9,185
p=
e9,185
9,185
e +1
p=
9749,78
=0,99989744=99,98
9750,78
siswa yang ber jenis kelamin perempuan, pendapatan orang tua kurang dari 3 juta
dan uang saku siswa 10.000 maka siswa meliliki peluang sebesar 99,98
untuk memiliki prilaku suka menabung.
( )
p
ln (
=0,815+104,747=4.438
1 p )
( 1p p )=e
4.438
p=
e4.438
e 4.438 + 1
p=
84,6055612
85,6055612
p=0,98831852=98,83
Karena menghasilkan probabilitas
yang berjenis kelamin perempuan, dan pendapatan orang tua lebih dari atau sama
dengan 3 juta dan uang saku siswa 10.000 maka siswa memiliki peluang sebesar
98,83 untuk memiliki prilaku suka menabung.
3. Apabila jenis kelamin berkode 1 ( laki-laki), dan pendapatan orang tua berkode 0
( pendapatan orang tua kurang 3 juta),missal uang saku siswa 5.000, maka
peluang siswa suka menabung sebesar :
17
ln
( 1p p )=0,815+54,548=0,363
( 1p p )=e
ln
0,363
0,363
p=
p=
0,363
+1
0,69558643
1,69558643
p=0,41023354=41,02
Karena menghasilkan probabilitas 41,02 , maka dapat disimpulkan bahwa
siswa yang berjenis kelamin laki-laki, dan pendapatan orang tua lebih dari atau
sama dengan 3 juta dan uang saku siswa 5.000 maka siswa memiliki peluang
sebesar 41,02 untuk memiliki prilaku suka menabung.
4. Apabila jenis kelamin berkode 1 ( laki-laki), dan pendapatan orang tua berkode 1
( pendapatan orang tua lenih dari atau sama dengan 3 juta),missal uang saku
siswa 15.000, maka peluang siswa suka menabung sebesar :
4,89
p=
e4,89
e 4,89 +1
p=
132,953574
133,953574
p=0,99253472=99,25
Karena menghasilkan probabilitas 99,25 , maka dapat disimpulkan bahwa
siswa yang berjenis kelamin laki-laki, dan pendapatan orang tua lebih dari atau
18
sama dengan 3 juta dan uang saku siswa 15.000 maka siswa memiliki peluang
sebesar 99,25 untuk memiliki prilaku suka menabung
Latihan Soal
Dalam sebuah survei, ingin diprediksi pengaruh umur, jenis
kelamindan kegemukan terhadap kemungkinan seseorang mengidap penyakit
diabetes. Berdasarkan hasil survei terhadap 50 responden, didapatkan datanya
dalam tabel sebagai berikut:
No
Diabetes
Umur
Jenis Kelamin
Kegemukan
.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
(Y)
0
0
1
1
1
0
1
0
1
1
1
0
0
1
1
0
1
1
1
1
1
1
1
1
1
1
1
(X1)
38
39
48
52
46
40
50
37
42
44
42
36
41
44
47
43
53
82
61
66
55
63
60
58
56
49
47
(X2)
0
1
1
1
1
0
1
1
0
1
1
0
1
0
1
0
1
1
0
1
0
1
1
1
1
0
1
(X3)
0
0
1
1
1
0
1
0
1
1
1
0
0
0
1
0
1
1
1
1
1
1
1
1
1
1
1
19
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
1
0
0
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
1
1
1
47
43
42
57
56
52
69
70
46
50
44
48
50
49
47
51
55
50
49
52
63
60
49
0
1
0
1
1
0
1
1
0
1
0
1
1
1
1
0
1
0
1
1
1
0
1
Terikat/Bebas
Terikat
X1
X2
X3
Bebas
Dummy
0
1
0
1
0
1
Definisi Operasional
tidak terkena diabetes
Terkena diabetes
Umur dalam tahun
Laki-Laki
Perempuan
Tidak mengalami kegemukan
Mengalami Kegemukan
20
1
0
0
1
1
1
1
1
0
1
0
1
1
1
0
1
1
1
0
1
1
1
1
Tabel 2
1. Analisis Data
a. Langkah-LangkahAnalisis Data Menggunakan Spss
1. Input data diatas ke SPSS
21
22
5. Klik Options, kemudian beri tanda () pada Classification plots, HosmerLemeshow goodness-of-fit, Correlation of estimates, dan Iteration of History.
Selanjutnya klik Continue.
6. Klik Ok, akan keluar hasil output SPSS untuk Model Regresi Binary Logistic.
23
24
Tabel ini menunjukkan nilai Chi Square (2) dari model regresi.
Sebagaimana halnya model regresi linear dengan metode Ordinary Least
Square (OLS), kita juga dapat melakukan pengujian arti penting model secara
keseluruhan. Jika metode OLS menggunakan uji F, maka pada model logit
menggunakan uji G. Statistik G ini menyebar menurut sebaran Chi Square
(2). Karenanya dalam pengujiannya, nilai G dapat dibandingkan dengan nilai
2 tabel pada tertentu dan derajat bebas (df) = k-1 (kriteria pengujian dan
cara pengujian persis sama dengan uji F pada metode regresi OLS). Tetapi,
kita juga bisa melihat nilai p-value dari nilai G ini yang biasanya ditampilkan
oleh sofware-software statistik, termasuk SPSS. Dari tabel diatas, didapatkan
nilai 2 sebesar 47,268 dengan p-value sebesar 0,000. Karena nilai tersebut
signifikan atau jauh di bawah = 10%, maka dapat disimpulkan bahwa model
regresi logistik secara keseluruhan dapat menjelaskan kemungkinan seseorang
dapat menderita diabetes.
4. Menilai Keseluruhan Model (Overall Model Fit) dan Menilai Kelayakan Model
Regresi
25
Pada tabel Model Summary, Cox & Snell R Square merupakan ukuran
yang mencoba meniru ukuran R2 pada multiple regression yang didasarkan
pada teknik estimasi likelihood dengan nilai maksimum kurang dari 1 sehingga
sulit diinterpretasikan. Dilihat dari Tabel 5, nilai Cox & Snell R Square adalah
0,611.
Nagelkerke R Square merupakan modifikasi dari koefisien Cox & Snell
R Square untuk memastikan bahwa nilainya bervariasi dari 0 sampai 1.
Kisaran nilai Nagelkerke R Square adalah 0 hingga 1. Semakin nilai
Nagelkerke R Square mendekati angka 1, maka semakin kuat variabel bebas
memprediksi variabel terikat. Hal ini dilakukan dengan cara membagi nilai
Cox & Snell R Square dengan nilai maksimumnya. Oleh karena itu, nilai
Nagelkerke R Square dapat diinterpretasikan seperti nilai R2 pada multiple
regression. Dilihat dari output SPSS, nilai Nagelkerke R Square adalah 0,967.
Ini berarti variabilitas variabel dependen yang dapat dijelaskan oleh
variabilitas variabel independen sebesar 0,967 %.
Hipotesis untuk menilai model fit adalah:
H0 = Model yang dihipotesakan fit dengan data.
HA = Model yang dihipotesakan tidak fit dengan data.
Dari hipotesis ini jelas bahwa kita tidak akan menolak H 0 agar supaya
model fit dengan data.
Dalam data ini digunakan hipotesisnya sebagai berikut:
H0=
H1=
Tabel Hosmer and Lemeshow Test menguji hipotesis nol bahwa data
empiris cocok atau sesuai dengan model (tidak ada perbedaan antara model
dengan data sehingga model dapat dikatakan fit.
Dasar pengambilan keputusannya adalah dengan memperhatikan nilai
signifikansi dari Chi Square terhadap kriteria pengujian = 0.1 padaHosmer
and Lemeshow Test yaitu:
27
peluang umur sebesar 1 (karena Exp(B) > 1 maka dibulatkan menjadi 1) dapat
diartikan bahwa seseorang yang berumur lebih tua satu tahun, peluang
menderita diabetes adalah 1,031 kali dibandingkan seseorang yang berumur
lebih muda (satu tahun), jika dalam keluarga merupakan keturunan diabetes
dan jenis kelamin mereka sama. Artinya orang yang lebih tua memiliki
peluang yang lebih tinggi menjadi penderita diabetes. Dalam konteks umur ini
(yang merupakan variabel dengan skala rasio), hati-hati menginterpretasikan
nilai perbedaan peluangnya. Jika perbedaan umur lebih dari 1 tahun, misalnya
10 tahun, maka oddsratio-nya akan menjadi 0,31, yang diperoleh dari
perhitungan exp (10 x 0,031). Artinya peluang seseorang menjadi penderita
diabetes berumur lebih tua 10 tahun adalah 0,31 kali dibandingkan yang lebih
muda (10 tahun) darinya.
Nilai Exp(B) variabel independen jenis kelamin (jenis kelamin dimana
1 = wanita dan 0 = pria) sebesar 2,702, maka peluang jenis kelamin sebesar
2,702. Dapat diartikan bahwa peluang wanita menderita diabetes adalah 2,702
kali dibandingkan pria, jika umur dan gen keturunan mereka sama. Artinya
wanita
memiliki
peluang
lebih
tinggi
menjadi
penderita
diabetes
dibandingkan pria.
Nilai Exp(B) variabel independen kegemukan sebesar 11,115, maka
peluang orang yang kegemukan sebesar sebesar 11,115. dapat diartikan bahwa
peluang seseorang yang kegemukanadalah sebesar 11,115 kali dibandingkan
seseorang yang tidak kegemukan, jika umur dan jenis kelaminnya sama.
28
Dimana:
Y = Penderita Diabetes
X 1 = Umur
X 2 = Jenis Kelamin
X 1 = Kegemukan
p = Peluang menderita diabetes
1-p= Peluang tidak menderita diabetes
a. Nilai konstanta sebesar -2,264 berarti pada saat umur berkode 0, jenis
kelamin berkode 0, kegemukan berkode 0, maka peluang seseorang
menderita diabetes sebesar:
29
ln
( 1p p )=2,264
p
=e2,264
1p
p=
e2,264
=0,0941487=9,4141
1+e2,264
( )
p
ln (
=1,179
1 p )
p
=e1,179
1p
p=
e1,179
=0,2352320465=23,52
1+e1,179
ln
( 1p p )=2,264+0,031 ( 51)
30
ln
( 1p p )=0,683
p
=e0,683
1p
p=
e0,683
=0,3355=33,55
1+e0,683
Karena menghasilkan probabilitas 33,55% maka pada umur 51
ln
( 1p p )=0,34
p
0,34
=e
1p
034
p=
e
p
=0,4158=41,58
0,34
1+e
Karena menghasilkan probabilitas 41,58% maka pada umur 30
31
ln
p=
e
p
=0,8877=88,77
2,068
1+e
Karena menghasilkan probabilitas 88,77% maka seorang wanita
pada umur 30 tahun dan seorang dengan keturunan penderita diabetes bisa
diprediksi peluang seseorang tersebut menderita diabetes sebesar 88,77%.
e. Apabila jenis kelamin berkode 0 (Laki-Laki), kegemukan berkode (1)
maka probabilitas seseorang menderita diabetes adalah sebagai berikut:
ln
( 1p p )=2,264+0,031 X +2,408 X
1
e1,074
=0,7454=74,54
1+e 1,074
Karena menghasilkan probabilitas 74,54% maka seorang pria pada
BAB III
KESIMPULAN
Variabel dummy disebut juga variabel indicator, biner, kategorik, kualitatif, boneka,
atau variabel dikotomi. Suatu persamaan regresi dahat hanya menggunakan variabel
kategorik sebagai variabel bebas tetapi daoat pula disertai oleh variabel bebas lain yang
numeric. Regresi dengan variabel bebasnya hanya vriabel dummy atau yang sifatnya
kualitatif disebut model Analysis of Variance (ANOVA).
Pengkodean data kategorikal memerlukan pengkategorian eksklusif. Artinya satu
subjek/sampel adalah masuk dalam satu kategori, tidak boleh dua kategori. Sampel A
misalnya, tidak boleh masuk ke dalam kategori laki-laki dan perempua. Si B tidak boleh
masuk ke dalam kategori PNS dan wiraswasta meskipun kedua profesi tersebut dijalaninya.
Aturan ini berlaku variabel dummy. Sebuah variabel dengan kategori sebanyak k akan
membutuhkan seperangkat k 1 variabel dummy untuk menjangkau semua informasi yang
terkandung didalamnya. Jadi misalnya saya memiliki variabel tingkat pendidikan dari SD
hingga PT (4 kategori) maka jumlah variabel kategori yang sama buat ada 3 kategori.
Menggunakan pola koding biner (0,1), variabel dummy selalu vaiables berbentuk dikotomi.
Semua responden yang menjadi anggota kategori yang diberi kode 1 sedangkan
responden tidak dalam kategori tersebut dikode dari 0. Dengan cara seperti ini maka setiap
responden akan memiliki kode 1 pada kategori yang sesuai dengannya dan kode 0 pada
kategori yang tidak sesuai dengannya. Kode biner dapat dianggap sebagai mirip ke saklar
listrik: kode A 1 sinyal bahwa kategori yang diberikan adalah on untuk responden
(misalnya, dia adalah anggota dari kelompok tertentu, atau karakteristik tertentu hadir ),
karena bukan anggota, variabel dummy yang menunjukkan kategori yang diaktifkan off
(yaitu, karakteristik ini tidak ada).
33
Dalam contoh kasus, ingin diprediksi pengaruh durasi belajar, bimbingan belajar, dan
jenis kelamin siswa terhadap peningkatan prestasi belajar siswa terhadap 20 responden.
Didapatkan hasil sebagai berikut:
Persamaan model regresi binary logistic dari kasus tersebut adalah:
ln
Dimana:
Y = Penderita Diabetes
X 1 = Umur
X 2 = Jenis Kelamin
X 1 = Kegemukan
p = Peluang menderita diabetes
1-p= Peluang tidak menderita diabetes
Dari kasus tersebut dapat diambil kesimpulan bahwa dapat diprediksi peluang
seorang wanita gemuk adalah lebih tinggi untuk menderita diabetes.
34
35
Daftar Pustaka
Gujarati, Damudar N. & Dawn C. P. 2012. Dasar-Dasar Ekonometrika. Jakarta: Salemba Empat.
36