Vous êtes sur la page 1sur 27

REGRESI LOGISTIK BINER DAN PENERAPANNYA

DALAM BIDANG KESEHATAN


(Studi Kasus Faktor-Faktor Yang Mempengaruhi Hasil Diagnosa Penyakit
Kanker Payudara Jinak di New Haven, New York, Amerika Serikat)
MAKALAH
Diajukan untuk memenuhi salah satu tugas mata kuliah Analisis Regresi Terapan

Disusun Oleh :
Pratiwi Sudiro

(12611004)

Sofi Khoirunnisak

(13611018)

Conita

(13611091)

Andriani Septiyani

(13611166)

JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2015

BAB I
PENDAHULUAN

1.1 Latar Belakang


Kanker payudara adalah suatu penyakit dimana terjadi pertumbuhan
berlebihan atau perkembangan tidak terkontrol dari sel-sel jaringan payudara.
Kanker payudara merupakan jenis kanker yang sering ditemukan oleh
kebanyakan wanita. Menurut WHO pada tahun 2005 dilaporkan sebanyak
506.000 wanita meninggal disebabkan oleh kanker payudara.
Di Amerika Serikat, lebih dari 450.000 wanita orang meninggal dunia
setiap tahun karena penyakit kanker payudara. Sekitar 70-90% dari penyakit
kanker tersebut berkaitan dengan lingkungan dan gaya hidup (life style).
Kurang Iebih 30% dari kematian tersebut karena rokok. Faktor-faktor
keturunan (genetik), radiasi, polusi dan eksposur lainnya memberikan
kontribusi 45.000-90.000 kematian. Dari seluruh penyakit kanker yang
disebabkan faktor lingkungan, sekitar 40-60% berhubungan dengan faktor
gizi. Dalam tahun 1984, 22% dari seluruh kematian di Amerika Serikat,
disebabkan karena kanker diantaranya juga adalah kanker payudara. Dan
965.000 kasus baru yang didiagnosis menderita kanker, 483.000 di antaranya
meninggal dunia. Diperkirakan 60-70% kanker disebabkan karena faktor
lingkungan, terutama makanan dan rokok.
Dari berbagai kesulitan yang ada pada kanker payudara mensimulasikan
penderita kanker payudara sehingga bisa diketahui karakteristik penderita
kanker payudara. Analisis regresi logistik digunakan untuk analisis data
respon kategorik (nominal/ ordinal) dengan variabel-variabel bebas kontinu
dan kategorik. Perbedaan nilai probabilitas pada setiap kelas akan
menghasilkan nilai odds rasio. Nilai odds rasio dapat menginformasikan
besarnya pengaruh salah satu variabel bebas terhadap terjadinya perubahan
kelas. Dalam penelitian ini adalah penderita dan non penderita kanker
payudara.

Karena banyaknya wanita yang menderita penyakit kanker payudara di


New Haven, Amerika Serikat, maka dalam makalah ini kami tertarik untuk
mengetahui apa saja faktor-faktor yang mempengaruhi timbulnya penyakit
kanker payudara jinak. Oleh sebab itu, dalam makalah ini kami mengambil
judul Regresi logistic biner dan penerapannya dalam bidang kesehatan (studi
kasus : Faktor-faktor yang mempengaruhi timbulnya penyakit kanker
payudara jinak di New Haven, Amerika Serikat).
1.2 Rumusan Masalah
Dari latar belakang diatas maka permasalahan yang ada dalam penelitian
ini adalah :
1. Bagaimana hasil dari analisis Logistic Biner untuk mengetahui diagnose
penyakit kanker payudara jinak setelah dilakukan penelitian terhadap 178
responden memeriksa epidemiologi fibrokistik penyakit payudara?
2. Berdasarkan model regresi logistic variabel-variabel apa saja yang
berpengaruh terhadap faktor-faktor yang mempengaruhi timbulnya
penyakit kanker payudara jinak?
1.3 Tujuan Penulisan
Adapun tujuan dari penelitian yang ingin dicapai adalah :
1. Mengetahui hasil diagnose penyakit kanker payudara jinak setelah
dilakukan

penelitian

terhadap

178

responden

yang

memeriksa

epidemiologi fibrokistik pada payudara.


2. Mengetahui variabel-variabel yang berpengaruh terhadap faktor-fkctor
timbulnya penyakit kanker payudara jinak.

BAB II
TINJAUAN PUSTAKA

2.1 Pengertian Kanker


Kanker merupakan kumpulan sel abnormal yang terbentuk oleh sel-sel
yang tumbuh secara terus-menerus, tidak terbatas, tidak terkoordinasi dengan
jaringan sekitarnya dan tidak berfungsi fisiologis. Kanker terjadi karena
timbul dan berkembangbiaknya jaringan sekitarnya (infiltratif) sambil
merusaknya (dekstrutif), dapat menyebar kebagian lain tubuh, dan umumnya
fatal jika dibiarkan. Sel-sel kanker akan berkembang dengan cepat, tidak
terkendali, dan terus membelah diri, selanjutnya menyusup ke jaringan di
sekitarnya (invasive) dan terus menyebar melalui jaringan ikat, darah, dan
menyerang organ-organ penting serta saraf tulang belakang. Dalam keadaan
normal, sel hanya akan membelah diri jika ada penggantian sel-sel yang telah
mati dan rusak. Sebaliknya, sel kanker akan membelah terus meskipun tubuh
tidak memerlukannya, sehingga akan terjadi penumpukan sel baru.
Penumpukan sel tersebut mendesak dan merusak jaringan normal, sehingga
mengganggu organ yang ditempatinya Pertumbuhan sel-sel kanker akan
menyebabkan jaringan menjadi besar dan disebut sebagai tumor. Tumor
merupakan istilah yang dipakai untuk semua bentuk pembengkakan atau
benjolan dalam tubuh. Sel-sel kanker yang tumbuh cepat dan menyebar
melalui pembuluh darah dan pembuluh getah bening. Penjalarannya
kejaringan lain disebut sebagai metastasis. Kanker mempunyai karakteristik
yang berbeda-beda.
2.2 Pengertian Kanker Payudara
Kanker payudara adalah tumor ganas yang meyerang jaringan payudara,
jaringan payudara terdiri dari kelenjar susu (kelenjar pembuat air susu)
saluran kelenjar (saluran air susu) dan jaringan penunjang payudara. Kanker
payudara merupakan penyakit yang dapat menyebabkan kematian pada
wanita,kanker payudara terjadi karena adanya kerusakan pada gen yang
mengatur pertumbuhan dan diferensiasi sehingga sel itu tumbuh dan

berkembang biak tanpa dapat dikendalikan. Sel-sel kanker payudara ini dapat
menyebar melalui aliran darah ke seluruh tubuh.
2.3 Faktor-faktor resiko Kanker payudara Jinak
Ada beberapa faktor resiko yang erat kaitannya dengan terjadinya kanker
payudara, yaitu :
1. Umur
Meningkatnya resiko kanker payudara sejalan dengan bertambahnya umur.
Wanita yang paling sering terkena kanker payudara adalah mereka yang
umurnya yang memasuki usia 30-40 tahunan, meskipun demikian tidak
berarti wanita dibawah usia tersebut tidak mungkin terkena kanker
payudara, hanya kejadiannya lebih rendah dibandingkan dengan wanita
yang mempunyai umur 30 sampai 40 tahun keatas.
2. Usia menarche dini (pertama kali menstruasi)
Bila haid pertama datang sebelum usia 12 tahun, maka wanita akan
mengalami sirkulasi hormon estrogen sepanjang hidupnya lebih lama.
Hormon estrogen dapat merangsang pertumbuhan duktus dalam kelenjar
payudara. Keterpajanan lebih lama dari hormon estrogen dapat
menimbulkan perubahan sel-sel duktus dari kelenjar payudara. Perubahan
tersebut dapat berupa hipertropi dan proliferasi yang abnormal sehingga
akhirnya dapat berubah menjadi kanker.Menarche kurang dari 12 tahun
mempunyai risiko 1,7-3,4 kali lebih tinggi daripada wanita dengan
menarche datang pada usia normal yaitu lebih dari 12 tahun.
3. Usia terakhir kali Menopouse
Wanita yang mengalami masa menopausenya terlambat lebih dari 55
tahun,risikonya 2,5 hingga 5 kali lebih tinggi dari pada wanita yang masa
menopausenya kurang dari 55 tahun.Penelitian Azamris di Rumah Sakit
Dr.M.Djamil Padang tahun 1998-2000 Faktor menopause didapatkan
memiliki risiko 1,89 kali (CI 1,71- 2,06). Hal ini menunjukkan bahwa
kanker payudara lebih sering mengenai wanita usia menopause.
4. Berat badan Subyek pada saat wawancara apakah mengalami
obesitas atau kegemukan.

Orang dewasa yang memiliki berat badan berlebihan (obesitas) berisiko


terhadap kanker payudara. Risiko ini disebabkan oleh lemak yang
berebihan dalam darah meningkatkan kadar estrogen dalam darah,
sehingga akan meningkatkan pertumbuhan sel-sel kanker.Menurut laporan
Nagi dan Lee moffit yang dikutip oleh Luwia ( 2004) menunjukan bahwa
perempuan yang mengalami peningkatan berat badan pada usia 30 tahun,
dan yang lemak tubuhnya lebih banyak berada ditubuh bagian atas, tidak
hanya memiliki risiko lebih besar untuk terkena kanker payudara, tetapi
juga memiliki risiko yang lebih besar untuk meninggal akibat kanker itu.
5. Pemeriksaan Umum Medis
Wanita yang pernah memeriksakan diri mereka untuk mengetahui
tumor jinak payudara secara dini dan rutin risikonya 2,5 kali lebih lebih kecil
daripada wanita yang tidak pernah memeriksakan diri mereka untuk
mengetahui tumor jinak payudara. Hasil diagnose yang akurat sangat
diperlukan guna memperkecil terjadinya area perluasan kanker.
2.4 Pengertian Logistik
Regresi logistik adalah bagian dari analisis regresi yang digunakan
ketika variabel dependen (respon) merupakan variabel dikotomi. Variabel
dikotomi biasanya hanya terdiri atas dua nilai, yang mewakili kemunculan
atau tidak adanya suatu kejadian yang biasanya diberi angka 0 atau 1.Tidak
seperti regresi linier biasa, regresi logistik tidak mengasumsikan hubungan
antara

variabel

independen

dan

dependen

secara

linier. Regresi

logistik merupakan regresi non linier dimana model yang ditentukan akan
mengikuti pola kurva seperti gambar di bawah ini.

Gambar 1.1 Kurva Resgresi Logistik Biner

Model yang digunakan pada regresi logistik adalah


Log (P / 1 p) = 0 + 1X1 + 2X2 + . + kXk
Dimana p adalah kemungkinan bahwa Y = 1, dan X1, X2, X3 adalah variabel
independen, dan b adalah koefisien regresi.
Regresi logistik akan membentuk variabel prediktor/respon (log (p/(1p)) yang merupakan kombinasi linier dari variabel independen. Nilai variabel
prediktor ini kemudian ditransformasikan menjadi probabilitas dengan
fungsi logit.
Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan
nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai
probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu
kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan
sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi
prediktor diartikan sebagai jumlah relatif dimana peluang hasil meningkat
(rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel
prediktor meningkat sebesar 1 unit.
2.5 Pengertian Regresi Biner
Analisis regresi logistik digunakan untuk menjelaskan hubungan
antara variabel respon yang berupa data dikotomik/biner dengan variabel
bebas yang berupa data berskala interval dan atau kategorik (Hosmer dan
Lemeshow, 1989). Variabel yang dikotomi/biner adalah variabel yang hanya
mempunyai dua kategori saja, yaitu kategori yang menyatakan kejadian
sukses (Y=1) dan kategori yang menyatakan kejadian gagal (Y=0).
Model regresi logistik biner merupakan salah satu model regresi
logistik yang digunakan untuk menganalisa hubungan antara satu variabel
respon dan beberapa variabel prediktor, dengan variabel responnya berupa
data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah
karakteristik dan bernilai 0 untuk menyatakan ketidakberadaan sebuah

karakteristik. Model regresi logistik biner dengan satu variabel respon dapat
dikembangkan menjadi model regresi logistik biner dengan menggunakan
dua variabel respon, dimana model ini disebut model regresi logistik biner
bivariat.
2.6 Asumsi-asumsi dalam regresi logistik
1. Tidak mengasumsikan hubungan linier antar variabel dependen dan
independent
2. Variabel dependen harus bersifat dikotomi (2 variabel)
3. Variabel independent tidak harus memiliki keragaman yang sama antar
kelompok variabel
4. Kategori dalam variabel independent harus terpisah satu sama lain atau
bersifat eksklusif
5. Sampel yang diperlukan dalam jumlah relatif besar, minimum
dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor
(bebas).
2.7 Penduga Parameter
Metode untuk mengestimasi parameter-parameter yang tidak diketahui
dalam model regresi logistik ada 3 yaitu:
1. Metode kemungkinan maksimum (Maximum Likelihood Method)
2. Metode kuadrat terkecil tertimbang noniterasi (Noniterative Weight
Least Square Method)
3. Analisis fungsi diskriminan (Discriminant Fuction Analysis).
Metode maksimum Likelihood merupakan metode kuadrat terkecil
tertimbang dengan beberapa proses iterasi, sedangkan metode noniterative
weight least square method hanya menggunakan satu kali iterasi. kedua
metode ini asymptoticaly equivalent, artinya jika ukuran sampel besar
keduanya akan menghasilkan estimator yang identik. Penggunaan fungsi
diskriminan mensyaratkan variabel penjelas yang kuantitatif berdistribusi
normal. Oleh karena itu, penduga dari fungsi diskriminan akan over

estimate bila

variabel

penjelas

tidak

berdistribusi

normal.

Dari ketiga metode di atas, metode yang banyak digunakan adalah


metode maksimum likelihood dengan alasan lebih praktis (Nachrowi dan
Usman, 2002). Metode maksimum likelihoood ini menduga parameter
dengan nilai yang memaksimumkan fungsi likelihood (likelihood function).
2.8 Pengertian Odds Ratio
Odds ratio merupakan ukuran risiko atau kecenderungan untuk
mengalami kejadian sukses antara satu kategori dengan kategori lainnya,
didefinisikan sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio
ini menyatakan risiko atau kecenderungan pengaruh observasi dengan xj = 1
adalah berapa kali lipat jika dibandingkan dengan observasi dengan xj = 0.
Untuk variabel bebas yang berskala kontinyu maka interpretasi dari koefisien
j pada model regresi logistik adalah setiap kenaikan c unit pada variabel
bebas akan menyebabkan risiko terjadinya Y = 1, adalah exp(c.j) kali lebih
besar. Odds ratio dilambangkan dengan , didefinisikan sebagai perbandingan
dua nilai odds xj = 1 dan xj = 0. Dengan Rumus :

BAB III
PEMBAHASAN, SUMBER DATA DAN MODEL ANALISIS

3.1 Jenis dan Sumber Data


Jenis data yang digunakan dalam penelitian ini berupa data sekunder
yang diambil dari data yang berisi informasi dari 1 - 3 rancangan yang cocok
mempelajari faktor risiko yang terkait dengan penyakit payudara jinak. Data

ini terdiri dari subset dari penelitian besar di mana data asli berasal dari
rumah sakit berdasarkan studi kasus-kontrol yang dirancang untuk memeriksa
epidemiologi fibrokistik penyakit payudara. Data yang disediakan pada 50
perempuan yang didiagnosis memiliki penyakit payudara jinak dan 128 usia
cocok kontrol, dengan tiga kontrol perkasus. Pencocokan didasarkan pada
usia subjek pada saat wawancara. Kasus termasuk wanita dengan diagnosis
biopsi dikonfirmasi fibrokistik penyakit payudara diidentifikasi melalui dua
rumah sakit di New Haven, Connecticut. Kontrol dipilih dari antara pasien
dirawat di bedah umum, ortopedi, atau Otolaryngologic layanan di dua rumah
sakit yang sama. Terlatih pewawancara diberikan kuesioner terstruktur
standar untuk mengumpulkan informasi dari masing-masing subjek [lihat
Pastides et. al. (1983) dan Pastides, et al. (1985)].
Tabel 2.1 Data keterangan pasien kanker payudara jinak
NO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

USSW
39
39
39
39
38
38
38
38
38
38
38
38
38
38
38
38
38
38
38
38
38
38
37

DA
1
0
0
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
1
0
0
0
0

PUM
1
2
2
1
2
2
1
1
2
1
1
1
1
2
1
1
2
1
1
2
2
1
1

UPKH
23
16
20
21
20
19
23
22
20
19
18
24
26
23
25
21
20
16
24
19
21
25
20

UPKM
13
11
12
11
15
11
13
15
14
13
13
14
13
14
16
17
12
14
12
12
10
8
11

JK
5
3
3
3
2
5
2
2
2
2
2
3
1
4
2
2
2
6
3
2
3
1
2

SBB
118
175
135
125
183
218
192
125
123
140
160
150
130
140
130
150
148
138
116
145
195
180
135

UTKM
39
39
39
40
38
38
37
38
38
37
38
38
38
38
38
38
38
38
39
35
35
38
37

24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67

37
37
36
36
36
35
35
36
35
35
36
36
36
35
35
35
34
35
34
34
33
32
33
33
33
33
33
32
32
32
32
31
30
31
31
68
68
68
64
64
64
63
63
62

0
0
0
0
0
1
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
1
0
0
1
0
0

1
2
1
2
2
1
2
1
2
2
1
2
1
2
1
1
2
1
1
2
2
2
1
1
1
2
1
1
1
2
1
1
1
2
2
1
1
2
2
1
1
1
2
1

18
22
20
17
23
23
21
22
24
21
26
22
33
18
19
21
25
27
20
25
21
24
25
28
21
20
21
30
25
20
23
30
21
23
24
22
34
19
30
26
25
21
24
26

10
13
12
10
12
14
11
14
11
12
13
12
16
13
11
12
10
13
11
16
11
12
12
14
12
13
13
13
11
9
16
14
14
11
13
12
14
12
14
11
10
15
11
15

3
2
2
3
2
3
3
4
2
2
2
3
1
2
3
2
1
4
3
1
1
2
2
5
2
2
1
1
2
2
2
0
3
2
3
3
3
7
3
5
2
5
3
2

155
120
191
185
119
129
170
110
155
105
115
120
150
110
170
145
170
140
240
100
160
155
132
110
145
155
110
129
131
218
115
110
130
97
120
130
150
145
135
205
127
120
144
170

37
38
36
37
37
36
34
36
35
29
36
36
36
35
36
36
34
35
34
35
33
32
33
33
29
29
33
32
32
26
32
30
30
31
31
50
53
46
53
42
50
52
50
39

68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111

62
62
61
61
61
61
61
62
62
61
61
62
61
61
61
61
61
61
60
60
60
60
58
58
58
55
55
55
55
55
55
52
52
52
52
52
52
52
51
51
51
51
49
49

0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
1
0
0
1
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0

2
1
1
2
2
1
1
2
2
2
1
1
2
1
2
1
1
1
1
2
2
1
1
2
1
1
2
1
1
1
1
1
2
2
1
2
2
1
2
2
1
1
2
2

32
22
28
26
28
27
22
30
25
26
26
33
25
29
21
18
22
23
28
25
24
33
20
25
24
30
30
24
24
16
26
28
20
25
23
21
23
20
24
24
22
24
25
24

12
12
14
13
15
14
16
11
15
13
17
11
13
13
15
13
17
15
17
11
13
15
12
16
10
16
13
14
14
12
15
12
14
13
14
12
11
11
16
12
13
13
12
13

2
3
3
1
3
2
4
1
4
3
2
1
3
2
3
5
2
3
2
2
2
3
5
3
0
2
2
6
4
3
4
2
6
3
3
3
2
5
5
4
2
5
2
3

134
155
125
140
120
134
150
117
147
124
129
170
153
130
145
140
155
116
115
175
179
119
153
185
140
126
193
116
140
175
155
113
110
190
114
126
159
170
156
161
150
115
235
145

53
39
53
50
41
45
56
36
52
52
34
54
50
55
53
56
55
43
51
42
50
47
53
55
25
44
50
47
52
47
50
45
40
48
50
43
42
42
52
50
45
51
44
44

112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155

49
48
48
48
47
47
47
47
47
47
47
47
46
46
46
46
46
46
46
46
45
45
45
45
45
45
45
45
45
45
45
45
45
45
45
44
44
44
44
44
44
44
43
43

0
1
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
1
0
0
0
1
0

1
1
2
2
1
2
1
1
1
2
1
1
2
2
1
1
1
2
1
1
1
1
2
1
2
1
1
1
2
2
1
1
2
1
2
1
1
1
1
2
1
2
1
1

25
22
22
19
26
20
24
22
19
23
23
21
27
19
26
15
27
23
22
17
33
25
20
22
23
20
30
18
22
30
22
25
23
23
23
25
27
27
24
22
23
18
27
31

13
11
11
11
14
12
14
13
12
15
13
12
15
11
13
13
12
12
11
13
14
13
11
11
11
12
12
15
17
13
10
16
12
13
12
12
13
14
15
15
12
17
15
12

3
3
1
0
4
5
2
3
1
3
2
5
11
3
7
1
4
4
6
3
2
1
1
3
2
1
3
4
2
2
5
4
3
3
4
3
3
1
1
1
5
7
2
1

123
145
155
190
120
110
148
120
132
115
125
120
155
170
180
179
137
107
144
189
80
142
150
154
150
102
110
101
109
210
198
124
133
120
165
130
240
125
130
105
123
180
130
104

49
48
48
29
47
47
45
45
47
29
47
39
46
45
46
40
46
46
46
39
45
38
45
46
45
28
45
45
40
40
33
45
45
46
35
44
45
44
44
44
33
44
43
43

156
43
0
157
43
0
158
27
0
159
28
0
160
28
0
161
53
1
162
53
0
163
53
0
164
56
1
165
56
0
166
56
0
167
56
0
168
41
1
169
41
0
170
41
0
171
41
0
172
41
1
173
41
0
174
40
0
175
41
0
176
41
1
177
41
0
178
39
1
(Sumber : Appendix 5 of

1
1
2
2
1
1
1
1
1
2
1
2
1
1
2
1
1
1
1
2
1
2
1
Hosmer,

14
20
22
20
23
29
28
26
21
27
26
25
25
20
21
22
40
21
21
26
34
30
23
D.W. and

12
2
158
14
6
160
12
1
127
11
2
145
16
2
127
12
4
132
11
3
140
11
1
130
17
6
130
11
4
265
13
4
195
12
2
125
16
3
105
13
4
161
14
5
135
12
4
185
15
1
115
16
3
140
12
4
145
14
3
195
13
2
138
12
2
129
13
5
118
Lemeshow, S. (1989) Applied

Logistic Regression, John Wiley and Sons, New York. )

3.2 Operasional Variabel


3.2.1 Variabel terkait :
Diagnosa Akhir (DA)
3.2.2 Variabel bebas :
a. Usia Subjek saat wawancara (USSW)
b. Pemeriksaan umum medis (PUM)
c. Usia pertama kali hamil (UPKH)
d. Usia pertama kali menstruasi (UPKM)
e. Jumlah Kelahiran / Anak (JK)
f. Berat badan subjek (SBB)
g. Usia terakhir kali menstruasi (UTKM)
3.3 Metode Penelitian

21
39
27
27
29
50
49
49
47
42
50
47
27
31
36
41
41
41
40
41
42
41
39

Metode penelitian yang digunakan yakni dengan analisis inferensial


menggunakan model multivariat. Analisis dilakukan menggunakan perangkat
lunak komuter SPSS 16.0.
3.4 Definisi metode
Analisis inferensial dilakukan dengan membuat sebuah model multivariat
menggunakan metode regresi logistok biner. Dari model ini akan diketahui
signifikasi dari tiap-tiap variabel independen yang secara bersama-sama
mempengaruhi variabel dependen ketika dimasukkan ke dalam model.
Regresi logistik biner sendiri merupakan salah satu contoh dari model regresi
logistik atau biasa disebut model logit.
Model logit adalah model regresi non-linear yang menghasilkan sebuah
persamaan dimana variabel dependen bersifat kategorikal. Berdasarkan jenis
variabel dependennya, regresi logistik dapat dibedakan menjadi 2, yaitu :
Binary Logistic Regression ( Regresi Logistik Biner ) dan Multinomial
Logistic Regression ( Regresi Logistik Multinomial ). Regresi logistik biner
digunakan ketika hanya ada 2 kemungkinan variabel respon (Y), misalnya
membeli dan tidak membeli. Sedangkan Regresi Logistik Multinomial
digunakan ketika pada veriabel respon (Y) terdapat lebih dari 2 kategorisasi.
Penelitian mengenai diagnosa penyakit kanker payudara jinak hanya memiliki
2 kemungkinan variabel dependen Y, yaitu terdiagnosa atau tidak terdiagnosa
hasil tersebut, sehingga model yang digunakan adalah regresi logistik biner.
Dua kategori kemungkinan variabel dependen diwakili oleh angka 0 dan 1.
Angka yang dihasilkan mewakilkan suatu kategori tertentu yang dihasilkan
dari perhitungan probabilitas terjadinya kategori tersebut. Bentuk dasar
probabilitas dalam model logit dapat dijelaskan pada tabel berikut :
Tabel 3.2 Probailitas dalam model logit
Yi
0
1

Probabilitas
1 Pi
Pi

Total

3.5 Prosedur Analisis Regresi


1) Identifikasi Model

Gambar 3.1 Output Variable in the Equation


Dengan studi kasus yang telah dipaparkan, maka didapatkan model
sebagai berikut :
a. Model regresi
Y
= -7,061- 0,048 X1 1,286 X2 + 0,071 X3 + 0,409 X4 - 0,25
X5 + 0,111 X6
b. Model logit

(Y) =

eY
Y
1+ e
exp7,0610,048 x 11,286 x2 +0,071 x3 +0,409 x 40,025 x 5+0,11 x 6
7,0610,048 x 11,286 x 2+0,071 x 3+0,409 x4 0,025 x5 +0,11 x 6
1+exp

Dimana:
X1

: Usia subjek saat diwawancara

X2

: Pemeriksaan umum medis

X3

: Usia pertama kali hamil

X4

Usia pertama kali menstruasi

X5

Jumlah Anak

X6

Usia terakhir menstruasi

2) Model Summary

Gambar 3.2 Output Model Summary


Cox & Snell R Square merupaan ukuran yang mencoba meniru
kuran R Square pada multiple regression yang didasarkan pada teknik
estimasi likelihood dengan nilai maksimum kurang dari 1 sehingga
sulit untuk diinterpretasikan. Oleh karena it, Nagelkerke R Square
yang merupakan modifikasi dari Cox & Snell di mana nilainya
bervariasi dari 0-1, akan lebih mudah untuk diinterpretasikan
sebagaimana interpretasi atas R Square pada multiple regression atau
Pseudo R-Square dalam multinomial logistic regression.
Nagelkerke R Square pada tabel diatas menunjukkan nilai sebesar
0,365 atau 36,5 %. Hal ini berarti, variabilitas variabel dependen dapat
dijelaskan oleh variabilitas variabel-variabel independen sebesar 36,5
%. Artinya, seluruh variabel independen mempengaruhi variabel
dependen secara serentask pada kisaran 36,5 %, sedangkan 63,5 %
lainya dipengaruhi atau dijelaskan oleh variabel-variabel yang tidak
dimasukkan dalam penelitian ini. Namun nilai ini hanya pendekatan
saja karena pada regresi logistik koefisien determinasi tidak dapat
dihitung seperti regresi linier, sehingga yang perlu lebih diperhatikan
adalah seberapa banyak kita dapat memprediksi dengan benar yang
tercermin dari nilai Classification Table.

Gambar 3.3 Output Classification Table


Dari tabel diatas didapatkan penjelasan mengenai variabel
dependen. Dari hasil tersebut didapatkan bahwa hasil diagnosa 178
orang wanita yang melakukan pemeriksaan medis dan dinyatakan
positif mengidap penyakit kanker payudara sebanyak 25 orang dan
yang dinyatakan negattif mengidap penyakit kanker payudara
sebanyak 153 orang. Tapi pada kenyataanya dari 178 wanita yang
melakukan pemeriksaan medis dan dinyatakan positif mengidap
kanker payudara sebanyak 40 orang dan yang dinyatakan negatif
sebanyak 138 orang. jadi, model regresi logistik yang digunakan cukup
baik karena mampu menebak dengan benar 79,2 % kondisi yang
terjadi.
3) Uji Kecocokan Model ( Goodness of fit )

Gambar 3.4 Output Omnimbus Test


Berdasarkan tabel diatas, untuk mendapatkan model yang layak
digunakan dilakukan uji hipotesis dalam anova yaitu digunakan uji
Overall. Berikut analisisnya :
a) Hipotesis
H0 : 1 = 2 = ... p = 0 ( Model layak digunakan / tidak ada
pengaruh variabel bebas terhadap variabel terikat )

H1 : ada 1 0, dimana i = 1,2,..., p (Model layak digunakan / ada


pengaruh variabel bebas terhadap variabel terikat )
b) Tingkat Signifikansi (tingkat risiko)
Tingkat signifikansinya ( ) = 5% 0.05, dengan begitu
tingkat kepercayaan (Confidence Interval) yang digunakan
praktikan adalah 95%.
c) Daerah kritis
Tolak H 0 jika:
P-Value
Chi-Square > Chi- Square tabel
d) Statistika Uji
Model : P-Value (0.000) (0.05)
e) Keputusan
Tolak H 0
f) Kesimpulan
Dengan menggunakan
H 0 , artinya ada

sebesar 5%, maka keputusannya tolak

yang tidak sama dengan 0 (Model layak

digunakan / ada pengaruh variabel bebas terhadap variabel terikat).


4) Uji Parsial

Gambar 3.5 Output Variable in the Equation


Hasil output gambar diatas menampilkan uji t yang digunakan
untuk menguji parameter secara parsial, dengan kata lain untuk
mengetahui apakah variabel independen (x) berpengaruh secra
signifikan (nyata) terhadap variabel dependen.
Berikut merupakan hipotesis untuk uji parsial dari model yng didapat :
Gambar 3.3 Hipotesis Uji Parsial

Model

Tingkat

Hipotesis

Statistik Keputusa
Uji
Sig.

tidak signifikan)

0,013 < jika

H1 : 0 0 (konstanta

signifikan)
H0 : 1 = 0 (koefisien = 0,05

Sig.

regresi

0,191 > H0 jika Sig. regresi

usia

saat

USSW

XUSSW

tidak

signifikan)

PUM

<
= Gagal tolak koefisien
>

subjek

regresi

tidak

Xkinerja

signifikan)
H0 : 2 = 0 (koefisien = 0,05

Sig.

regresi

0,013 < jika Sig. < regresi

XPUM

tidak

= Tolak

signifikan
H0 koefisien
pemerikaan

H1 : 2 0 (koefisien

umum medis

regresi

signifikan

XPUM

signifikan)
H0 : 3 = 0 (koefisien = 0,05

Sig.

regresi

0,187>

H0 jika Sig. regresi Usia

>

XUPKH

tidak

= Gagal tolak koefisien


pertama kali

H1 : 3 0 (koefisien

hamil

regresi

signifikan

XUPKH

signifikan)
H0 : 4 = 0 (koefisien = 0,05

Sig.

regresi XUPKM

0,001 < jika Sig. < regresi

tidak

signifikan)

SBB

Sig. signifikan

diwawancara

signifikan)

UPKM

H0 konstanta

H1 : 1 0 (koefisien

signifikan)

UPKH

n
= Tolak

Kesimpulan

Sig.
Constant H0 : 0 = 0 (konstanta = 0,05

= Tolak

tidak

H0 koefisien
usia

pertama kali

H1 : 4 0 (koefisien

menstruasi

regresi

signifikan

XUPKM

signifikan)
H0 : 5 = 0 (koefisien = 0,05

Sig.

regresi

0,016 < jika Sig. < regresi

XSBB

signifikan)

tidak

= Tolak

H0 koefisien
subjek berat

UTKM

H1 : 5 0 (koefisien

badan

regresi

signifikan

XSBB

signifikan)
H0 : 6 = 0 (koefisien = 0,05

Sig.

regresi XUTKM tidak

0,031 < jika Sig. < regresi

signifikan)

= Tolak

H0 koefisien
usia

terakhir kali

H1 : 6 0 (koefisien

menstruasi

regresi

signifikan

XUTKM

signifikan)
5) Parameter Model
Uji parameter model dengan data (uji hosmer and lemeshow), uji
ini untuk mengukur apakah probabilitas yang diprediksi sesuai dengan
probabilitas yang diobservasi. Namun uji ini dapat dilakukan ketika
sudah dapat dipastikan bahwa model yang diperoleh refresentatif
dengan menggunakan Tabel 3.6 berikut.

Gambar 3.6 Output Hosmer and Lemeshow Test


a) Hipotesis
H 0= model sesuai dengan data atau tidak ada perbedaan
antara model dengan data sehingga dapat dikatakan fit
H 1= model tidak sesuai dengan data atau ada perbedaan
antara model dengan data sehingga dapat dikatakan fit
( peluang data asli dengan peluang data prediksi sama atau
sesuai )
b) Tingkat signifikansi : : 0,05
c) Daerah Kritis
p-value <, maka tolak
d) Statistik uji

H0

p-value =0.024
e) Keputusan
p-value (0.024)< (0,05) maka tolak

H0

f) Kesimpulan
karena nilai p-value signifikan maka probabilitas yang
diprediksi tidak sesuai dengan probabilitas yang diobservasi.
Dari serangkaian uji yang telah dilakukan, dapat diinterpretasikan
model yang diperoleh sebagai berikut.
1. Exp ( 1 = 0,953
Artinya setiap pertambahan usia subjek saat diwawancara sebesar 1
satuan akan meningkatkan peluang wanita tidak mengidap peyakit
kanker payudara jinak sebesar 0,953 kali, dengan nilai variabel lain
tetap. Atau dengan kata lain semakin bertambah usia wanita maka akan
semakin mempunyai kecenderungan untuk tidak mengidap penyakit
kanker payudara jinak.
2. Exp ( 2 = 0,276
Artinya setiap wanita yang melakukan pemeriksaan umum medis akan
didiagnosa mengidap penyakit kanker payudara jinak sebesar 0,276 kali
dari pada yang tidak melakukan pemeriksaan medis.
3. Exp. 3 = 1.073
Artinya setiap pertambahan usia pertama kali hamil sebesar 1 satuan
akan meningkatkan peluang wanita tidak mengidap peyakit kanker
payudara jinak sebesar 1,073 kali, dengan nilai variabel lain tetap. Atau
dengan kata lain semakin bertambah usia wanita untuk pertama kali
hamil maka akan semakin mempunyai kecenderungan untuk tidak
mengidap penyakit kanker payudara jinak.
4. Exp. 4 = 1,505
Artinya setiap pertambahan usia pertama kali menstruasi sebesar 1
satuan akan meningkatkan peluang wanita tidak mengidap peyakit
kanker payudara jinak sebesar 1,073 kali, dengan nilai variabel lain
tetap. Atau dengan kata lain semakin bertambah usia wanita untuk
pertama kali menstruasi maka akan semakin mempunyai kecenderungan
untuk tidak mengidap penyakit kanker payudara jinak.

5. Exp. 5 = 0,975
Artinya setiap pertambahan berat badan wanita sebesar 1 satuan akan
meningkatkan peluang wanita tidak mengidap peyakit kanker payudara
jinak sebesar 0,975 kali, dengan nilai variabel lain tetap. Atau dengan
kata lain semakin bertambah berat badan wanita maka akan semakin
mempunyai kecenderungan untuk tidak mengidap penyakit kanker
payudara jinak.
6. Exp. 6 = 1,118
Artinya setiap pertambahan usia wanita untuk menopouse sebesar 1
satuan meningkatkan kelipatan seorang wanita sebesar 1,118 kali untuk
tidak mengidap penyakit kanker payudara jinak.
Dari persamaan regresi logistik yang diperoleh, maka kami mengambil
sebuah contoh pada salah satu seorang pasien yang telah terdiagnosa positif
mengidap penyakit kanker payudara jinak dengan usia pada saat wawancara 36
tahun, dengan usia pertama kali hamil pada saat 25 tahun, pertama kali menstruasi
pada saat 17 tahun serta usia terakhir kali menstruasi atau menopouse pada saat
usia 38 tahun. Pasien telah melakukan pemeriksaan medis di sebuah rumah sakit
di New Haven dan diketahui berat badan pasien tersebut sebesar 118 pound. Maka
carilah peluang wanita tersebut terdiagnosa penyakit kanker payudara jinak.
Sehingga peluang terdiagnosa wanita tersebut mengidap penyakit kanker
payudara adalah sebagai berikut :
Y

= -7,061- 0,048 X1 1,286 X2 + 0,071 X3 + 0,409 X4 - 0,25 X5 + 0,111


X6
= -7,061- 0,048 (36) 1,286 (1)+ 0,071 (25)+ 0,409 (17) - 0,25 (118) +
0,111 (38)
= -0,11

(Y) =

eY
1+ eY

= 0,4722

Dari contoh permasalahan diatas, maka dapat diambil kesimpulan bahwa


pasien tersebut menderita penyakit kanker payudara jinak dengan peluang
terjangkitnya sebesar 0,4722.

BAB IV
PENUTUP
3.1 Kesimpulan

Dari pembahasan yang ada pada bab-bab sebelumnya, kami bertujuan


menggunakan analisis regresi logistik biner dalam makalah ini untuk
mengetahui apa saja faktor-faktor yang mempengaruhi timbulnya penyakit
kanker payudara jinak karena banyaknya wanita yang menderita penyakit
kanker payudara di New Haven, Amerika Serikat. Oleh sebab itu, dalam
makalah ini kami mengambil judul Regresi logistic biner dan penerapannya
dalam bidang kesehatan (studi kasus : Faktor-faktor yang mempengaruhi
timbulnya penyakit kanker payudara jinak di New Haven, Amerika Serikat).
Ada beberapa faktor resiko yang erat kaitannya dengan terjadinya kanker
payudara dalam makalah ini, antara lain yaitu umur, usia menarche dini
(pertama kali menstruasi), usia terakhir kali menopouse, berat badan subyek
pada saat wawancara apakah mengalami obesitas atau kegemukan dan
pemeriksaan umum medis.
Regresi logistik adalah bagian dari analisis regresi yang digunakan ketika
variabel dependen (respon) merupakan variabel dikotomi. Sedangkan
Variabel yang dikotomi/biner adalah variabel yang hanya mempunyai dua
kategori saja, yaitu kategori yang menyatakan kejadian sukses (Y=1) dan
kategori yang menyatakan kejadian gagal (Y=0).
Dalam kasus ini setelah dilakukan analisis regresi logistik biner,
didapatkan model regresinya adalah Y = -7,061- 0,048 X1 1,286 X2 + 0,071
X3 + 0,409 X4 - 0,25 X5 + 0,111 X6 dan model logitnya adalah ( Y )

eY
1+ eY
=
exp7,0610,048 x 11,286 x2 +0,071 x3 +0,409 x 40,025 x 5+0,11 x 6
1+exp7,0610,048 x 11,286 x 2+0,071 x 3+0,409 x4 0,025 x5 +0,11 x 6

Nilai Nagelkerke R

Square yang didapatkan adalah sebesar 0,365 atau 36,5 % yang berarti
seluruh variabel independen mempengaruhi variabel dependen secara

serentask pada kisaran 36,5 %, sedangkan 63,5 % lainya dipengaruhi atau


dijelaskan oleh variabel-variabel yang tidak dimasukkan dalam penelitian ini.
Dari analisis yang dilakukan, terdapat 178 orang wanita yang melakukan
pemeriksaan medis dan dinyatakan positif mengidap penyakit kanker
payudara sebanyak 25 orang dan yang dinyatakan negattif mengidap penyakit
kanker payudara sebanyak 153 orang. Tapi pada kenyataanya dari 178 wanita
yang melakukan pemeriksaan medis dan dinyatakan positif mengidap kanker
payudara sebanyak 40 orang dan yang dinyatakan negatif sebanyak 138
orang. jadi, model regresi logistik yang digunakan cukup baik karena mampu
menebak dengan benar 79,2 % kondisi yang terjadi. Dari keseluruhan model
yang didapatkan, terbukti bahwa modelnya layak untuk digunakan.
4.2 Saran
1. Dalam kasus ini, para wanita diharapkan mengerti dan mengetahui factorfaktor apa saja yang dapat menimbulkan penyakit kanker payudara
sehingga dapat melakukan pencegahan dini yang faktornya dapat dilihat
setelah dilakukan analisis regresi logistik biner.
2. Dari model yang didapat, diharapkan para wanita sadar akan pentingnya
memelihara kesehatan organ tubuh.
3. Untuk pengetahuan, diharapkan peneliti lain dapat mengembangkan
aplikasi regresi logistik biner di bidang lainnya, selain dalam bidang
kesehatan.

DAFTAR PUSTAKA

Setiawan,

Nasrul.

2013.

Konsep

Regresi

Biner/Dikotomi.

http://statistikceria.blogspot.com/2013/01/konsep-regresi-logistik-binerdikotomi.html
Ariyoso.

2009.

Regresi

Logistik.

http://statistik4life.blogspot.com/2009/12/regresi-logistik.html
Armhest,

University

Massachusetts.

2004.

Benign

Breast

Disease.

http://www.umass.edu/statdata/statdata/stat-logistic.html.
Amerika Serikat: University Massachusetts of Armhest.

Akbar,

Nur.

2013.

Makalah

Kanker

Jinak

Payudara.

http://akbarnurnhijranahstikesandinipersada.blogspot.com/.
Finit, Maria. 2013. Makalah Patologi dan Patofisiologi Kanker Payudara.
https://www.academia.edu/5746613/MAKALAH. Makassar.
Hanafi, Darmawan. 2012. Kanker Payudara. http://watowaihory.blogspot.com/.
Kupang.

Vous aimerez peut-être aussi