Analisis Data Kategorik

KASUS
Penggunaan regresi logistik untuk memprediksi pengaruh pekerjaan pelanggar, jenis

kendaraan pelanggar, usia pelanggar, hari pelanggaran dan waktu pelanggaran terhadap
tingkat pelanggaran lalu lintas.
Variable responnya adalah tingkat pelanggaran lalu lintas yang dikategorikan menjadi dua
tingkatan yaitu :
Y = 0, pelanggaran ringan
Y = 1, pelanggaran tidak ringan
Variabel Prediktornya
a)Jenis kelamin (X1) , dengan kategori :
0. Pria
1.wanita
b) Pekerjaan pelanggar (X2), dengan kategori :
0. Bekerja (PNS/ Wiraswasta/Swasta, pengemudi)
1. Tidak Bekerja (Mahasiswa, Pelajar)
b) Kendaraan pelanggar (X3), dengan kategori :
0. Roda dua
1. Roda empat
c). Usia (X4)
e) Hari Pelanggaran (X5), dengan kategori :
0. Hari kerja (Senin sampai dengan Jumat).
1. Hari libur (Sabtu sampai dengan Minggu).
e) Waktu pelanggaran (X6), dengan kategori
0. 00.00-12.00
1. 12.00-24.00
Berdasarkan hasil survai terhadap 50 responden, didapatkan datanya sebagai berikut:
No
X1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
X2
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
X3
0
1
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
0
X4
1
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
X5
22
18
31
23
21
24
28
3
16
15
34
23
32
22
24
25
17
35
X6
1
1
1
0
1
0
1
0
1
1
0
0
1
0
1
0
1
0
Y
1
1
0
0
0
0
0
0
1
0
0
0
0
0
1
1
1
0
0
1
0
1
1
0
0
1
1
0
1
1
0
1
0
1
0
1
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
Prosedur Praktikum
0
0
0
1
1
0
0
0
1
0
1
0
1
0
0
0
0
1
0
0
1
0
0
0
0
1
0
0
0
0
0
1
0
1
1
0
0
0
0
1
0
1
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
1
0
32
23
22
18
19
34
26
43
17
23
16
24
18
25
22
32
21
17
33
21
17
23
23
34
34
19
21
35
34
32
21
24
0
1
0
1
1
1
0
0
1
1
1
0
1
0
0
1
0
1
0
1
1
0
1
0
1
1
0
0
1
1
1
0
0
0
0
1
0
1
0
0
1
1
0
0
1
0
0
0
0
0
1
0
0
0
0
1
0
1
1
0
0
0
0
0
0
1
1
0
1
0
1
1
0
1
1
1
0
1
1
1
1
0
1
0
1
1
1
1
1
0
1
1
1
0
0
1
Pengolahan data dilakukan melalui tahapan-tahapan berikut:

1. Buka program SPSS. Input data pekerjaan pelanggar, jenis kendaraan pelanggar, usia
pelanggar, hari pelanggaran dan waktu pelanggaran pada SPSS dengan format
seperti di bawah ini.
2.
Setelah data diinput, pilih Analyze Regression Binary logistic seperti berikut:
3.
Setelah muncul kotak dialog logistic regression, masukkan variabel dependen

purchase ke kolom Dependent, dan kelima variabel independen ke dalam kolom
covariates, lalu pilih button categorical untuk memasukkan variabel kategorik yaitu
X1 , X2 , X3, X4, X5 ,X6 klik continue:
4. Setelah itu pilih option, checklist classification plot dan Hosmerlemeshow goodness of fit, correlation of estimates , Iteration history
serta Cl for exp(B) : 95%kemudian continue:
5. Kemudian pada method pilih enter, kemudian klik OK:
Output dan Interpretasi
Pada kasus ini digunakan analisis regresi logistik karena variabel dependen (tingkat
pelanggaran lalu lintas) menggunakan variabel dummy yaitu 0 (pelanggaran ringan) dan 1
(pelanggaran tidak ringan). Jumlah data yang dipergunakan adalah sebanyak 50.
Case Processing Summary
Unweighted Casesa
Percent
Selected Cases Included in Analysis

Missing Cases
Total
Unselected Cases
Total
50
100.0
.0
50
100.0
.0
50
100.0
a. If weight is in effect, see classification table for the total

number of cases.
Output Case Processing Summary menghilangkan variabel yang tidak diperhitungkan dalam
model.
Categorical Variables Codings
Parameter
coding
Frequency
X6
X2
X3
X5
X1
(1)
35
1.000
15
.000
37
1.000
13
.000
35
1.000
15
.000
22
1.000
28
.000
45
1.000
.000
Output tersebut memberikan informasi tentang variabel dependen yang memiliki 2 kategori
yaitu 0 untuk pelanggaran ringan dan 1 untuk pelanggalan tidak ringan, serta tentang variabel
kategorik yaitu:
1.
Jenis kelamin (X1) dengan kategori : 0 (Pria) sebanyak 45 orang dan 1 (wanita)
sebanyak 5 orang
2. Pekerjaan pelanggar (X2), dengan kategori :0 ( Bekerja PNS/ Wiraswasta/Swasta,
pengemudi) sebanyak 37 orang dan 1 [Tidak Bekerja (Mahasiswa, Pelajar)] sebanyak
13 orang.
3. Kendaraan pelanggar (X3), dengan kategori : 0 (Roda dua) sebanyak 35 dan 1 ( Roda
empat) sebanyak 15,
4. Hari Pelanggaran (X5), dengan kategori : 0 [Hari kerja (Senin sampai dengan Jumat)]
sebanyak 22 dan 1 [Hari libur (Sabtu sampai dengan Minggu)] sebanyak 28.
5. Waktu Pelanggaran (X6) dengan kategori : 0 (00.00-12.00) sebanyak 35 dan 1 (12.0024.00) sebanyak 15
Menilai kelayakan model regresi (goodness of fit)
Block 0: Beginning Block

Iteration Historya,b,c
-2 Log
Iteration
likelihood
Coefficients
Constant
Step 0 1
65.345
.560
65.342
.575
65.342
.575
a. Constant is included in the model.

b. Initial -2 Log Likelihood: 65,342
c. Estimation terminated at iteration number
3 because parameter estimates changed by
less than ,001.
Nilai log likelihood tanpa varibel yaitu : -2 Log likelihood = 65,342
log likelihood=
65,342
2
= -32,671
Jadi nilai log likelihood tanpa variabel = -32,671.

Hipotesis:
H0 : Tidak ada perbedaan yang signifikan antara model dengan konstanta saja dengan
data.
H1: Terdapat perbedaan yang signifikan antara model dengan konstanta saja dengan
data.
Taraf signifikansi : = 0,05
X2
Kriteria keputusan : H0 ditolak jika -2 log likelihood >
(49;0,05)
Nilai -2 Log Likelihood pada Beginning Block adalah sebesar 65,342 pada iterasi ke-3. Nilai
tersebut merupakan nilai Chi Square yang dibandingkan dengan nilai Chi Square pada tabel
dengan df sebesar N 1 = 50 1 = 49 pada taraf signifikansi 0,05 yaitu sebesar 67,5048.
X2
Karena -2 log likelihood=65,342 <
(49;0,05) =67,5048 , H0 diterima
Kesimpulan : Tidak terdapat perbedaan yang signifikan antara model dengan konstanta
saja dengan data.
Hal ini menunjukkan bahwa model dengan konstanta saja telah fit.
Categorical Variables Codings

Parameter
coding
Frequency
X6
X2
X3
X5
X1
(1)
35
1.000
15
.000
37
1.000
13
.000
35
1.000
15
.000
22
1.000
28
.000
45
1.000
.000
Output classification table diatas menjelaskan bahwa persentase variabel yang diprediksi
sebesar 64 persen adalah baik.
Variables in the Equation
B
Step 0
Constant
S.E.
.575
.295
Wald
3.814
df
Sig.
1
.051
Exp(B)
1.778
Hipotesis
H0 : 0= 0 (tidak ada pengaruh)
H1: 0 0 (ada pengaruh)
Taraf signifikansi: =0,05
Uji statistik : dengan uji Wald
Daerah penolakan : H0 ditolak jika ujiW2 (Wald) > 2(1; 0,05 ) atau P_value < =0,05
Dengan nilai p-value=0,051 > =0,05
0,575
B
2
W= [ S . E ] = 0,295 ]2 = 3,79919 atau bisa juga langsung dilihat pada output nilai uji
Wald =3,814 dan nilai 2(1, 0,05 ) =3,84146

Karena p-value=0,051 > =0,05 dan nilai uji Wald =3,814 < 2(1, 0,05 ) =3,84146 maka H0
diterima.
Kesimpulan :
0= 0 (tidak ada pengaruh)
berarti konstanta tidak berpengaruh
terhadap model.
Selanjutnya, pengujian fit atau tidaknya model dengan data dilakukan dengan memasukkan
variabel bebas sebanyak 6 buah sehingga mempunyai df sebesar 49 - 6 - 1 = 42 dan
mempunyai nilai chi square tabel sebesar 55,7585 pada signifikansi 0,05. Sedangkan nilai -2
Log Likelihood dengan memasukkan variabel bebas adalah sebagai berikut:
Block 1: Method = Enter

Iteration Historya,b,c,d
Coefficients
Iteration
Step 1
-2 Log likelihood
Constant
X1(1)
X2(1)
X3(1)
X4
X5(1)
X6(1)
51.385
-.303
-.404
.166
.274
-.012
1.847
.573
50.257
-.251
-.494
.285
.397
-.023
2.403
.740
50.205
-.213
-.504
.334
.430
-.028
2.554
.772
50.205
-.209
-.504
.338
.432
-.028
2.564
.774
50.205
-.209
-.504
.338
.432
-.028
2.564
.774
a. Method: Enter
b. Constant is included in the model.
c. Initial -2 Log Likelihood: 65,342
d. Estimation terminated at iteration number 5 because parameter estimates changed by less than ,001.
Nilai log likelihood dengan varibel yaitu : -2 Log likelihood = 50,205
log likelihood=
50,205
2
= -25,1025
Jadi nilai log likelihood dengan variabel = -32,671.

Hipotesis:
H0 : Tidak ada perbedaan yang signifikan antara model dengan variabel bebas dengan
data.
H1: Terdapat perbedaan yang signifikan antara model dengan variabel bebas dengan
data.
Taraf signifikansi : = 0,05
X2
Kriteria keputusan : H0 ditolak jika -2 log likelihood >
(42;0,05)
X2
Dari output terlihat bahwa nilai -2 Log Likelihood pada iterasi ke-5=50,205 dan nilai
(42;0,05)= 58,12404
X2
Karenan -2 log likelihood=50,205 >
(42;0,05)= 58,12404 maka H0 diterima,
Kesimpulan : model dengan memasukkan variabel bebas adalah fit dengan data. Hal ini
menunjukkan bahwa model layak untuk dipergunakan.
Jika ingin melihat selisih dari kedua nilai -2 loglikelihood di atas yaitu antara Blok 0 dengan
Blok 1, maka dilakukan dengan mengurangkan nilainya yaitu 65,342-50,205 =15,137.
Hasil tersebut juga dilihat dalam output SPSS berikut :

Omnibus Tests of Model Coefficients
Chi-square
Step 1
Df
Sig.
Step
15.137
.019
Block
15.137
.019
Model
15.137
.019
Uji rasio likelihood (uji Overall test)

Uji rasio kemungkinan (likelihood ratio test) yang digunakan untuk menguji peranan
variabel penjelas di dalam model secara bersama-sama.
Hipotesis:
H0 : 1 = 2 = 3 = 4 = 5= 6 = 0
H1: ada minimal 1 i 0, untuk i=1,2,3,4,5,6
Taraf signifikansi : =0,05
Daerah Penolakan : H0 ditolak jika G >
X2
(6;0,05)=12,59159 atau p-value < =0,05
Dengan perhitungan manual sebagai berikut :

likelihood without var
likelihood with var

G 2[log likelihood without var log likelihood with var]
G 2 log
G=-2 [-32,671-(-25,1025)]
G=-2[-7,5685]
G=15,137
Dari perhitungan manual diatas, didapatkan nilai G =15,137, hasil tersebut juga dapat dilihat
dalam output Omnibus Tests of Model Coefficients.
X2
Karena G=15,137 >
(6;0,05)=12,59159 dan Dari output diperoleh nilai sig = 0.019 <
=0,05maka H0 ditolak
Kesimpulan: ada minimal 1 i 0 ini berarti yang menunjukkan bahwa penambahan variabel
bebas memberikan pengaruh nyata terhadap model, atau dengan kata lain model dinyatakan
fit.
Lebih lanjut, untuk melihat apakah data empiris cocok dengan model (tidak ada perbedaan
antara model dengan data) dilakukan dengan melihat nilai Hosmer and Lemeshow Test.
Hosmer dan Lemeshow Test
Hosmer dan Lemeshow Test adalah untuk melihat apakah data empiris cocok atau tidak
dengan model atau dengan kata lain diharapkan tidak ada perbedaan antara data empiris
dengan model.
Hipotesis:
H0 : model yang dipostulatkan layak ( tidak ada perbedaan antara data empiris dengan
model)
H1: model yang dipostulatkan tidak layak ( ada perbedaan antara data empiris dengan
model)
Kriteria Keputusan : H0 diterima (Model akan dinyatakan layak) jika
X2
X2
p-value >= 0,05 atau
hitung <
(8;0,05)
Hosmer and Lemeshow Test
Step
1
Chi-square
Df
5.153
Sig.
8
.741
Perhitungan:
Nilai Chi Square tabel untuk df 8 pada taraf signifikansi 0,05 adalah sebesar 15,5073.Pada
output diatas, memperlihatkan nilai Chi Square hitung=5,153 dan Nilai p-value=0,741.
X2
X2
Sehingga
hitung= 5,153 <
(8;0,05)=15,5073 dan p-value=0,741 >= 0,05 maka H0
diterima.
Kesimpulan: model yang dipostulatkan layak ( tidak ada perbedaan antara data empiris
dengan model) dengan kata lain model dapat diterima dan pengujian hipotesis dapat
dilakukan.
Untuk melihat kemampuan variabel bebas dalam menjelaskan varians tingkat pelanggaran
lalu lintas, digunakan nilai Cox dan Snell R Square dan Nagelkerke R Square sebagai berikut:
Model Summary
Step
1
-2 Log likelihood
50.205a
Cox & Snell R
Nagelkerke R
Square
Square
.261
.358
a. Estimation terminated at iteration number 5 because

parameter estimates changed by less than ,001.
Nilai Nagelkerke R Square sebesar 0,358 yang lebih besar dari pada nilai Cox dan Snell R
Square yang besarnya 0,261, yang menunjukkan bahwa kemampuan keenam variabel bebas
dalam menjelaskan variabel tingkat pelanggaran lalu lintas adalah sebesar 35,8% dan terdapat
64,2% faktor lain yang menjelaskan variabel tingkat pelanggaran lalu lintas.
Untuk melihat ketepatan model yang dibentuk dilihat dengan Klasifikasi tabel sebagai
berikut:
Classification Tablea
Predicted
Y
Observed
Step 1
Percentage
1
Correct
13
72.2
24
75.0
Overall Percentage
74.0
a. The cut value is ,500
Sampel yang melakukan pelanggaran lalu lintas ringan (0) adalah sebanyak 18 orang. Hasil
prediksi model pada Tabel di atas adalah 13 orang melalakukan pelanggaran lalu lintas ringan
(0) dan 5 orang melakukan pelanggaran lalu lintas tidak ringan (1). Berarti terdapat 3 prediksi
yang salah atau 13 prediksi yang tepat sehingga prediksi yang benar adalah sebanyak 13/18 =
72,2%. Sedangkan untuk orang yang melakukan pelanggaran tidak ringan, dari 34 sampel
hanya 8 orang yang diprediksi tidak sesuai oleh model penelitian sehingga kebenaran model
untuk orang yang melakukan pelanggaran lalu lintas tidak ringan adalah sebesar 24/34 =
75%. Dengan demikian tabel di atas memberikan nilai overall percentage sebesar
(13+24)/50= 74% yang berarti ketepatan model penelitian ini adalah sebesar 74%.
Pengujian Hipotesis
Setelah diperoleh model yang fit terhadap data, maka langkah selanjutnya adalah dilakukan
uji hipotesis. Pengujian hipotesis dilakukan untuk menjawab pertanyaan kasus ini. Berikut
adalah hasil pengujian hipotesis dalam kasus ini:

95% C.I.for EXP(B)
B
Step 1a
S.E.
Wald
df
Sig.
Exp(B)
Lower
Upper
X1(1)
-.504
1.122
.202
.653
.604
.067
5.444
X2(1)
.338
1.264
.071
.789
1.402
.118
16.684
X3(1)
.432
.951
.206
.650
1.540
.239
9.938
X4
-.028
.075
.142
.706
.972
.840
1.126
X5(1)
2.564
.896
8.191
.004
12.990
2.244
75.203
X6(1)
.774
.762
1.030
.310
2.168
.487
9.658
-.209
1.576
.018
.894
.811
Constant
a. Variable(s) entered on step 1: X1, X2, X3, X4, X5, X6.
Jika dilihat dari koefisiennya (B) maka tampak bahwa koefisien X5 (Hari Pelanggaran)
adalah positif yang berarti bahwa semakin tinggi X5 (Hari Pelanggaran) berarti semakin
tinggi pula kemungkinan melakukan pelanggaran lalu lintas. Sedangkan X1(jenis kelamin
pelanggar) mempunyai koefisien negatif yang menunjukkan bahwa semakin tinggi X1(jenis
kelamin pelanggar)maka semakin rendah kemungkinan orang melakukan pelanggaran lalu
lintas.
Uji Parsial
Pada output Variabel in the equation, memperlihatkan uji parsial masing-masing variabel.
Hipotesis :
H0 : i= 0 (tidak ada pengaruh)
H1: i 0 (ada pengaruh) dengan i=1,2,3,4,5,6
Taraf signifikansi: =0,05
Uji statistik : dengan uji Wald
Daerah penolakan : H0 ditolak jika ujiW2 (Wald) > 2(df, ) atau P_value < =0,05
Dilihat signifikansi dari masing-masing variabel independent,
o X1 (jenis kelamin)
dengan nilai p-value=0,653 > =0,05 dan nilai uji Wald =0,202 < 2(1, 0,05 ) =3,84146
maka H0 diterima, kesimpulan :
1= 0 (tidak ada pengaruh)
berarti X1 (jenis
kelamin) tidak ada pengaruh terhadap model.
o X2 (Pekerjaan pelanggar)
X2 (Pekerjaan pelanggar) berarti tidak ada
pengaruh terhadap model.
o X3 (Kendaraan pelanggar)
1= 0 (tidak ada pengaruh) X3 (Kendaraan
pelanggar) berarti tidak ada pengaruh terhadap model.
o X4 (usia)
1= 0 (tidak ada pengaruh) X4 (usia) berarti tidak
ada pengaruh terhadap model.
o X5(Hari Pelanggaran)
dengan nilai p-value=0,004< =0,05 dan nilai uji Wald =8,891 > 2(1, 0,05 ) =3,84146
maka H0 ditolak, kesimpulan : i 0 (ada pengaruh) X5(Hari Pelanggaran) berarti
ada pengaruh terhadap model.
o X6(Waktu pelanggaran)
dengan nilai p-value=0,310 > =0,05 dan nilai uji Wald =1,030< 2(1, 0,05 ) =3,84146
1= 0 (tidak ada pengaruh) berarti X6 (Waktu
pelanggaran) tidak ada pengaruh terhadap model.
Ternyata dari masing-masing p-value dan nilai uji Waldnya dapat disimpulkan bahwa X1
(jenis kelamin), X2 (Pekerjaan pelanggar), X3 (Kendaraan pelanggar), X4 (usia) , X6(Waktu
pelanggaran) tidak ada pengaruh terhadap model sehingga perlu dikeluarkan dari model.
Dan untuk p-value dan nilai uji wald X5(Hari Pelanggaran) ada pengaruh terhadap
model, sehingga diinterpretasikan bahwa variabel X5(Hari Pelanggaran) mempunyai
pengaruh yang signifikan terhadap pelanggaran lalu lintas tidak ringan.
Oleh karena uji overall benar akan diperoleh nilai yang terbaik dengan
meminimalkan beberapa parameter, langkah logis selanjutnya adalah untuk
mencocokan
model
yang hanya
berisi
variabel
yang
signifikan,
dan
membandingkannya dengan model yang berisi semua variabel. P-value lebih besar dari
0,05 maka dapat disimpulkan bahwa model yang telah dikeluarkan variabel independen
yang tidak signifikannya merupakan model yang terbaik.
Hasil Uji Untuk Variabel Yang Signifikan
Dengan hanya memasukkan variabel X5 (Hari Pelanggaran) sebagai variabel bebasnya, dan
Y (tingkat pelanggaran lalu lintas) sebagai variabel dependennya.
Diperoleh output sebagai berikut :
Block 1: Method = Enter
Iteration Historya,b,c,d
Coefficients
-2 Log
Iteration
Step 1
likelihood
Constant
X5(1)
52.615
-.286
1.922
51.683
-.288
2.452
51.647
-.288
2.583
51.647
-.288
2.590
51.647
-.288
2.590
a. Method: Enter
b. Constant is included in the model.
c. Initial -2 Log Likelihood: 65,342
d. Estimation terminated at iteration number 5 because
parameter estimates changed by less than ,001.
Omnibus Tests of Model Coefficients

Chi-square
Step 1 Step
Df
Sig.
13.695
.000
Block
13.695
.000
Model
13.695
.000
Model Summary
Step
-2 Log
Cox & Snell
likelihood
R Square
51.647a
1
a.
Nagelkerke R Square
.240
.329
Estimation terminated at iteration number 5 because parameter estimates changed by less than ,001.
95% C.I.for EXP(B)
B
Sep 1a
S.E.
Wald
Df
Sig.
Exp(B)
X5(1)
2.590
.834
9.642
.002
13.333
Constant
-.288
.382
.568
.451
.750
a. Variable(s) entered on step 1: X5.
G(X)penduga =-0,288+2590X5
Lower
2.600
Upper
68.388
Nilai log likelihood without var (hanya dengan variabel X5) = -2 Log likelihood = 51,647
log likelihood=
51,647
2
= -25,8235

Hasil Uji Untuk Semua Variabel
95% C.I.for EXP(B)
B
Step 1a
S.E.
Wald
Df
Sig.
Exp(B)
Lower
X1(1)
-.504
1.122
.202
.653
.604
.067
5.444
X2(1)
.338
1.264
.071
.789
1.402
.118
16.684
X3(1)
.432
.951
.206
.650
1.540
.239
9.938
X4
-.028
.075
.142
.706
.972
.840
1.126
X5(1)
2.564
.896
8.191
.004
12.990
2.244
75.203
X6(1)
.774
.762
1.030
.310
2.168
.487
9.658
-.209
1.576
.018
.894
.811
Constant
a. Variable(s) entered on step 1: X1, X2, X3, X4, X5, X6.
G(x) penduga = -0,209 -504X1+0,338X2+0,432X3-0,28X4+2,564X5+0,774X6

Output variabel in the Equation, Kolom Exp(B) menunjukkan nilai odds ratio yang
dihasilkan. Nilai odds ratio yang mendekati 1,0 mengindikasikan bahwa variabel independen
tidak mempengaruhi variabel dependen. Dan jika nilai odds rationya melewati 1,0 maka
dapat disimpulkan bahwa tidak ada pengaruh antara variabel independen dan variabel
dependen.
X1 (Jenis kelamin) nilai odds ratio=0,604
diperoleh dari exp (-0,504) = (-0,504) =0,604109=0,604, orang yang jenis kelaminnya
wanita berpeluang 0,604 kali lebih lebih besar melakukan pelanggaran lalu lintas
dibandingkan yang berjenis kelamin lali-laki.
Upper
X2(pekerjaan pelanggar) nilai odds ratio=1,402,

diperoleh dari exp (0,338) = (0,338) =1,40214050341=1,402 berarti melewati 1 sehingga
X2(pekerjaan pelanggar) tidak mempengaruhi tingkat pelanggaran lalu lintas. Orang
yang tidak bekerja (mahasiswa/pelajar) berpeluang 1,402 kali lebih besar melakukan
pelanggaran lalu lintas dibandingkan yang bekerja (PNS/ Wiraswasta/Swasta,
pengemudi)
X3(kendaraan pelanggar) nilai odds ratio=1,540,
X3(kendaraan pelanggar) tidak mempengaruhi tingkat pelanggaran lalu lintas. Orang
yang jenis kendaraanya roda empat berpeluang 1,504 kali lebih besar melakukan
pelanggaran lalu lintas dibandingkan yang memakai roda dua.
X4(usia pelanggar) nilai odds ratio=0,972,

diperoleh dari exp (-0,028) = (-0,028) =0,9723883=0,972 berarti mendekati 1 sehingga
X4(usia pelanggar) tidak mempengaruhi tingkat pelanggaran lalu lintas. Orang yang
berumur lebih tua satu tahun peluang melakukan pelanggaran lalu lintas adalah 0,972
kali dibandingkan orang yang umurnya lebih muda (satu tahun), jika jenis kelamin,
pekerjaan pelanggar, kendaraan pelanggar, hari pelanggaran, dan waktu pelanggaran
mereka sama. Artinya orang yang lebih tua memiliki peluang yang lebih rendah dalam
melakukan pelanggaran.
X5(hari pelanggaran) nilai odds ratio=12,990,
X5(hari pelanggaran) tidak mempengaruhi tingkat pelanggaran lalu lintas. Orang
berpeluang melakukan pelanggaran lalu lintas pada hari libur 12,990 kali lebih besar
dibandingkan pada hari kerja.
X6(waktu pelanggaran) nilai odds ratio=2,168,
X6(waktu pelanggaran) tidak mempengaruhi tingkat pelanggaran lalu lintas. Orang
berpeluang melakukan pelanggaran lalu lintas pada waktu 12.00 -24.00 , 2,168 kali
lebih besar dibandingkan pada waktu 00.00-12.00
Untuk memperoleh model yang terbaik, dibandingkan model dengan enam variabel (full) dan
model dengan satu variabel saja.
Hipotesis:
H0: model reduce( koefisien X1(jenis kelamin),X2(pekerjaan pelanggar),X3(jenis
kendaraan pelanggar),X4(usia pelanggar),X6 (waktu pelanggaran)=0)
H1:model full (koefisien X1(jenis kelamin),X2(pekerjaan pelanggar),X3(jenis
kendaraan pelanggar),X4(usia pelanggar),X5(waktu pelanggaran),X6 (waktu
pelanggaran)0 )
likelihood with var

G ' 2[log likelihood without var log likelihood with var]
G ' 2 log
Statistik uji :
Daerah penolakan: H0 ditolak jika G> X2(6;0,05)=12,59159 atau p-value<0,05
Perhitungan :
Nilai log likelihood without var (hanya dengan variabel X5) = -2 Log likelihood = 51,647
51,647
2
log likelihood=
= -25,8235
Nilai log likelihood dengan varibel yaitu : -2 Log likelihood = 50,205
log likelihood=
Jadi nilai log likelihood tanpa variabel = -25,1025
50,205
2
= -25,1025
likelihood with var

G ' 2[log likelihood without var log likelihood with var]
G ' 2 log
G =-2[-25,8235-(-25,1025)]
=-2[-0,721]
=1,442
Karena 1,442 < 12,59159 maka H0 diterima
Kesimpulan : Model tanpa variabel X1(jenis kelamin),X2(pekerjaan pelanggar),X3(jenis
kendaraan pelanggar),X4(usia pelanggar),dan X6 (waktu pelanggaran) lebih baik.
Step number: 1
Observed Groups and Predicted Probabilities
+
|
1
F
1
R
1
E
1
Q
1 1
U
1 1
E
1 1
8 +
|
|
|
|
|
6 +
+
|
|
|
|
|
|
4 +
+
N
1 1
C
1 11
Y
1 11
|
0
1
|
|
0
1
|
|
0
1
|
2 +
1
0
1 11 0 1
1
1 11
+
|
1
0
1 11 0 1
1
1 11
|
|
0 0 01 0 0 0 0 01 0 01 101
0
111 1 01011
|
|
0 0 01 0 0 0 0 01 0 01 101
0
111 1 01011
|
Predicted ---------+---------+---------+---------+---------+--------+---------+---------+---------+---------Prob:
0
,1
,2
,3
,4
,5
,6
,7
,8
,9
1
Group:
000000000000000000000000000000000000000000000000001111111111111111111111111
1111111111111111111111111
Predicted Probability is of Membership for 1
The Cut Value is ,50
Symbols: 0 - 0
1 - 1
Each Symbol Represents ,5 Cases.
Output classplot diatas menunjukkan prediksi pada regresi logistik. Sumbu X menunjukkan
probabilitas yang diprediksi, sedangkan sumbu Y menunjukkan jumlah kasus yang diamati.
Daftar Pustaka
Hosmer, D.W., and Lemenshow. (2000). Applied Logistic Regression. John Wiley
Sons. USA
http://www.konsultanstatistik.com/2009/03/simulasi-regresi-logistik.html
http://febrianhadi.wordpress.com
and

Analisis Data Kategorik

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Analisis Data Kategorik

Transféré par

Droits d'auteur :

Formats disponibles

KASUS

Penggunaan regresi logistik untuk memprediksi pengaruh pekerjaan pelanggar, jenis

Pengolahan data dilakukan melalui tahapan-tahapan berikut:

Setelah muncul kotak dialog logistic regression, masukkan variabel dependen

5. Kemudian pada method pilih enter, kemudian klik OK:

Output dan Interpretasi

Selected Cases Included in Analysis

a. If weight is in effect, see classification table for the total

Block 0: Beginning Block

a. Constant is included in the model.

Nilai log likelihood tanpa varibel yaitu : -2 Log likelihood = 65,342

Jadi nilai log likelihood tanpa variabel = -32,671.

Categorical Variables Codings

Wald =3,814 dan nilai 2(1, 0,05 ) =3,84146

Block 1: Method = Enter

Nilai log likelihood dengan varibel yaitu : -2 Log likelihood = 50,205

Jadi nilai log likelihood dengan variabel = -32,671.

Hasil tersebut juga dilihat dalam output SPSS berikut :

Uji rasio likelihood (uji Overall test)

(6;0,05)=12,59159 atau p-value < =0,05

Dengan perhitungan manual sebagai berikut :

likelihood with var

Cox & Snell R

a. Estimation terminated at iteration number 5 because

a. The cut value is ,500

Variables in the Equation

a. Variable(s) entered on step 1: X1, X2, X3, X4, X5, X6.

Block 1: Method = Enter

Omnibus Tests of Model Coefficients

Cox & Snell

a. Variable(s) entered on step 1: X5.

Jadi nilai log likelihood tanpa variabel = -25,8235.

a. Variable(s) entered on step 1: X1, X2, X3, X4, X5, X6.

G(x) penduga = -0,209 -504X1+0,338X2+0,432X3-0,28X4+2,564X5+0,774X6

X2(pekerjaan pelanggar) nilai odds ratio=1,402,

X4(usia pelanggar) nilai odds ratio=0,972,

likelihood with var

likelihood without var

likelihood with var

Vous aimerez peut-être aussi