Académique Documents
Professionnel Documents
Culture Documents
X1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
X2
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
X3
0
1
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
0
X4
1
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
X5
22
18
31
23
21
24
28
3
16
15
34
23
32
22
24
25
17
35
X6
1
1
1
0
1
0
1
0
1
1
0
0
1
0
1
0
1
0
Y
1
1
0
0
0
0
0
0
1
0
0
0
0
0
1
1
1
0
0
1
0
1
1
0
0
1
1
0
1
1
0
1
0
1
0
1
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
Prosedur Praktikum
0
0
0
1
1
0
0
0
1
0
1
0
1
0
0
0
0
1
0
0
1
0
0
0
0
1
0
0
0
0
0
1
0
1
1
0
0
0
0
1
0
1
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
1
0
32
23
22
18
19
34
26
43
17
23
16
24
18
25
22
32
21
17
33
21
17
23
23
34
34
19
21
35
34
32
21
24
0
1
0
1
1
1
0
0
1
1
1
0
1
0
0
1
0
1
0
1
1
0
1
0
1
1
0
0
1
1
1
0
0
0
0
1
0
1
0
0
1
1
0
0
1
0
0
0
0
0
1
0
0
0
0
1
0
1
1
0
0
0
0
0
0
1
1
0
1
0
1
1
0
1
1
1
0
1
1
1
1
0
1
0
1
1
1
1
1
0
1
1
1
0
0
1
2.
Setelah data diinput, pilih Analyze Regression Binary logistic seperti berikut:
3.
4. Setelah itu pilih option, checklist classification plot dan Hosmerlemeshow goodness of fit, correlation of estimates , Iteration history
serta Cl for exp(B) : 95%kemudian continue:
Pada kasus ini digunakan analisis regresi logistik karena variabel dependen (tingkat
pelanggaran lalu lintas) menggunakan variabel dummy yaitu 0 (pelanggaran ringan) dan 1
(pelanggaran tidak ringan). Jumlah data yang dipergunakan adalah sebanyak 50.
Case Processing Summary
Unweighted Casesa
Percent
50
100.0
.0
50
100.0
.0
50
100.0
Output Case Processing Summary menghilangkan variabel yang tidak diperhitungkan dalam
model.
Categorical Variables Codings
Parameter
coding
Frequency
X6
X2
X3
X5
X1
(1)
35
1.000
15
.000
37
1.000
13
.000
35
1.000
15
.000
22
1.000
28
.000
45
1.000
.000
Output tersebut memberikan informasi tentang variabel dependen yang memiliki 2 kategori
yaitu 0 untuk pelanggaran ringan dan 1 untuk pelanggalan tidak ringan, serta tentang variabel
kategorik yaitu:
1.
Jenis kelamin (X1) dengan kategori : 0 (Pria) sebanyak 45 orang dan 1 (wanita)
sebanyak 5 orang
2. Pekerjaan pelanggar (X2), dengan kategori :0 ( Bekerja PNS/ Wiraswasta/Swasta,
pengemudi) sebanyak 37 orang dan 1 [Tidak Bekerja (Mahasiswa, Pelajar)] sebanyak
13 orang.
3. Kendaraan pelanggar (X3), dengan kategori : 0 (Roda dua) sebanyak 35 dan 1 ( Roda
empat) sebanyak 15,
4. Hari Pelanggaran (X5), dengan kategori : 0 [Hari kerja (Senin sampai dengan Jumat)]
sebanyak 22 dan 1 [Hari libur (Sabtu sampai dengan Minggu)] sebanyak 28.
5. Waktu Pelanggaran (X6) dengan kategori : 0 (00.00-12.00) sebanyak 35 dan 1 (12.0024.00) sebanyak 15
Menilai kelayakan model regresi (goodness of fit)
likelihood
Coefficients
Constant
Step 0 1
65.345
.560
65.342
.575
65.342
.575
log likelihood=
65,342
2
= -32,671
X2
X3
X5
X1
(1)
35
1.000
15
.000
37
1.000
13
.000
35
1.000
15
.000
22
1.000
28
.000
45
1.000
.000
Output classification table diatas menjelaskan bahwa persentase variabel yang diprediksi
sebesar 64 persen adalah baik.
Variables in the Equation
B
Step 0
Constant
S.E.
.575
.295
Wald
3.814
df
Sig.
1
.051
Exp(B)
1.778
Hipotesis
H0 : 0= 0 (tidak ada pengaruh)
H1: 0 0 (ada pengaruh)
Taraf signifikansi: =0,05
Uji statistik : dengan uji Wald
Daerah penolakan : H0 ditolak jika ujiW2 (Wald) > 2(1; 0,05 ) atau P_value < =0,05
Dengan nilai p-value=0,051 > =0,05
0,575
B
2
W= [ S . E ] = 0,295 ]2 = 3,79919 atau bisa juga langsung dilihat pada output nilai uji
Selanjutnya, pengujian fit atau tidaknya model dengan data dilakukan dengan memasukkan
variabel bebas sebanyak 6 buah sehingga mempunyai df sebesar 49 - 6 - 1 = 42 dan
mempunyai nilai chi square tabel sebesar 55,7585 pada signifikansi 0,05. Sedangkan nilai -2
Log Likelihood dengan memasukkan variabel bebas adalah sebagai berikut:
-2 Log likelihood
Constant
X1(1)
X2(1)
X3(1)
X4
X5(1)
X6(1)
51.385
-.303
-.404
.166
.274
-.012
1.847
.573
50.257
-.251
-.494
.285
.397
-.023
2.403
.740
50.205
-.213
-.504
.334
.430
-.028
2.554
.772
50.205
-.209
-.504
.338
.432
-.028
2.564
.774
50.205
-.209
-.504
.338
.432
-.028
2.564
.774
a. Method: Enter
b. Constant is included in the model.
c. Initial -2 Log Likelihood: 65,342
d. Estimation terminated at iteration number 5 because parameter estimates changed by less than ,001.
log likelihood=
50,205
2
= -25,1025
Dari output terlihat bahwa nilai -2 Log Likelihood pada iterasi ke-5=50,205 dan nilai
(42;0,05)= 58,12404
X2
Karenan -2 log likelihood=50,205 >
(42;0,05)= 58,12404 maka H0 diterima,
Kesimpulan : model dengan memasukkan variabel bebas adalah fit dengan data. Hal ini
menunjukkan bahwa model layak untuk dipergunakan.
Jika ingin melihat selisih dari kedua nilai -2 loglikelihood di atas yaitu antara Blok 0 dengan
Blok 1, maka dilakukan dengan mengurangkan nilainya yaitu 65,342-50,205 =15,137.
Df
Sig.
Step
15.137
.019
Block
15.137
.019
Model
15.137
.019
X2
G=-2 [-32,671-(-25,1025)]
G=-2[-7,5685]
G=15,137
Dari perhitungan manual diatas, didapatkan nilai G =15,137, hasil tersebut juga dapat dilihat
dalam output Omnibus Tests of Model Coefficients.
X2
Karena G=15,137 >
(6;0,05)=12,59159 dan Dari output diperoleh nilai sig = 0.019 <
=0,05maka H0 ditolak
Kesimpulan: ada minimal 1 i 0 ini berarti yang menunjukkan bahwa penambahan variabel
bebas memberikan pengaruh nyata terhadap model, atau dengan kata lain model dinyatakan
fit.
Lebih lanjut, untuk melihat apakah data empiris cocok dengan model (tidak ada perbedaan
antara model dengan data) dilakukan dengan melihat nilai Hosmer and Lemeshow Test.
Hosmer dan Lemeshow Test
Hosmer dan Lemeshow Test adalah untuk melihat apakah data empiris cocok atau tidak
dengan model atau dengan kata lain diharapkan tidak ada perbedaan antara data empiris
dengan model.
Hipotesis:
H0 : model yang dipostulatkan layak ( tidak ada perbedaan antara data empiris dengan
model)
H1: model yang dipostulatkan tidak layak ( ada perbedaan antara data empiris dengan
model)
Taraf signifikansi : =0,05
Kriteria Keputusan : H0 diterima (Model akan dinyatakan layak) jika
X2
X2
p-value >= 0,05 atau
hitung <
(8;0,05)
Hosmer and Lemeshow Test
Step
1
Chi-square
Df
5.153
Sig.
8
.741
Perhitungan:
Nilai Chi Square tabel untuk df 8 pada taraf signifikansi 0,05 adalah sebesar 15,5073.Pada
output diatas, memperlihatkan nilai Chi Square hitung=5,153 dan Nilai p-value=0,741.
X2
X2
Sehingga
hitung= 5,153 <
(8;0,05)=15,5073 dan p-value=0,741 >= 0,05 maka H0
diterima.
Kesimpulan: model yang dipostulatkan layak ( tidak ada perbedaan antara data empiris
dengan model) dengan kata lain model dapat diterima dan pengujian hipotesis dapat
dilakukan.
Untuk melihat kemampuan variabel bebas dalam menjelaskan varians tingkat pelanggaran
lalu lintas, digunakan nilai Cox dan Snell R Square dan Nagelkerke R Square sebagai berikut:
Model Summary
Step
1
-2 Log likelihood
50.205a
Nagelkerke R
Square
Square
.261
.358
Nilai Nagelkerke R Square sebesar 0,358 yang lebih besar dari pada nilai Cox dan Snell R
Square yang besarnya 0,261, yang menunjukkan bahwa kemampuan keenam variabel bebas
dalam menjelaskan variabel tingkat pelanggaran lalu lintas adalah sebesar 35,8% dan terdapat
64,2% faktor lain yang menjelaskan variabel tingkat pelanggaran lalu lintas.
Untuk melihat ketepatan model yang dibentuk dilihat dengan Klasifikasi tabel sebagai
berikut:
Classification Tablea
Predicted
Y
Observed
Step 1
Percentage
1
Correct
13
72.2
24
75.0
Overall Percentage
74.0
Sampel yang melakukan pelanggaran lalu lintas ringan (0) adalah sebanyak 18 orang. Hasil
prediksi model pada Tabel di atas adalah 13 orang melalakukan pelanggaran lalu lintas ringan
(0) dan 5 orang melakukan pelanggaran lalu lintas tidak ringan (1). Berarti terdapat 3 prediksi
yang salah atau 13 prediksi yang tepat sehingga prediksi yang benar adalah sebanyak 13/18 =
72,2%. Sedangkan untuk orang yang melakukan pelanggaran tidak ringan, dari 34 sampel
hanya 8 orang yang diprediksi tidak sesuai oleh model penelitian sehingga kebenaran model
untuk orang yang melakukan pelanggaran lalu lintas tidak ringan adalah sebesar 24/34 =
75%. Dengan demikian tabel di atas memberikan nilai overall percentage sebesar
(13+24)/50= 74% yang berarti ketepatan model penelitian ini adalah sebesar 74%.
Pengujian Hipotesis
Setelah diperoleh model yang fit terhadap data, maka langkah selanjutnya adalah dilakukan
uji hipotesis. Pengujian hipotesis dilakukan untuk menjawab pertanyaan kasus ini. Berikut
adalah hasil pengujian hipotesis dalam kasus ini:
S.E.
Wald
df
Sig.
Exp(B)
Lower
Upper
X1(1)
-.504
1.122
.202
.653
.604
.067
5.444
X2(1)
.338
1.264
.071
.789
1.402
.118
16.684
X3(1)
.432
.951
.206
.650
1.540
.239
9.938
X4
-.028
.075
.142
.706
.972
.840
1.126
X5(1)
2.564
.896
8.191
.004
12.990
2.244
75.203
X6(1)
.774
.762
1.030
.310
2.168
.487
9.658
-.209
1.576
.018
.894
.811
Constant
Jika dilihat dari koefisiennya (B) maka tampak bahwa koefisien X5 (Hari Pelanggaran)
adalah positif yang berarti bahwa semakin tinggi X5 (Hari Pelanggaran) berarti semakin
tinggi pula kemungkinan melakukan pelanggaran lalu lintas. Sedangkan X1(jenis kelamin
pelanggar) mempunyai koefisien negatif yang menunjukkan bahwa semakin tinggi X1(jenis
kelamin pelanggar)maka semakin rendah kemungkinan orang melakukan pelanggaran lalu
lintas.
Uji Parsial
Pada output Variabel in the equation, memperlihatkan uji parsial masing-masing variabel.
Hipotesis :
H0 : i= 0 (tidak ada pengaruh)
H1: i 0 (ada pengaruh) dengan i=1,2,3,4,5,6
Taraf signifikansi: =0,05
Uji statistik : dengan uji Wald
Daerah penolakan : H0 ditolak jika ujiW2 (Wald) > 2(df, ) atau P_value < =0,05
Dilihat signifikansi dari masing-masing variabel independent,
o X1 (jenis kelamin)
dengan nilai p-value=0,653 > =0,05 dan nilai uji Wald =0,202 < 2(1, 0,05 ) =3,84146
maka H0 diterima, kesimpulan :
1= 0 (tidak ada pengaruh)
berarti X1 (jenis
kelamin) tidak ada pengaruh terhadap model.
o X2 (Pekerjaan pelanggar)
dengan nilai p-value=0,789 > =0,05 dan nilai uji Wald =0,071 < 2(1, 0,05 ) =3,84146
maka H0 diterima, kesimpulan :
X2 (Pekerjaan pelanggar) berarti tidak ada
pengaruh terhadap model.
o X3 (Kendaraan pelanggar)
dengan nilai p-value=0,650 > =0,05 dan nilai uji Wald =0,206 < 2(1, 0,05 ) =3,84146
maka H0 diterima, kesimpulan :
1= 0 (tidak ada pengaruh) X3 (Kendaraan
pelanggar) berarti tidak ada pengaruh terhadap model.
o X4 (usia)
dengan nilai p-value=0,706 > =0,05 dan nilai uji Wald =0,075 < 2(1, 0,05 ) =3,84146
maka H0 diterima, kesimpulan :
1= 0 (tidak ada pengaruh) X4 (usia) berarti tidak
ada pengaruh terhadap model.
o X5(Hari Pelanggaran)
dengan nilai p-value=0,004< =0,05 dan nilai uji Wald =8,891 > 2(1, 0,05 ) =3,84146
maka H0 ditolak, kesimpulan : i 0 (ada pengaruh) X5(Hari Pelanggaran) berarti
ada pengaruh terhadap model.
o X6(Waktu pelanggaran)
dengan nilai p-value=0,310 > =0,05 dan nilai uji Wald =1,030< 2(1, 0,05 ) =3,84146
maka H0 diterima, kesimpulan :
1= 0 (tidak ada pengaruh) berarti X6 (Waktu
pelanggaran) tidak ada pengaruh terhadap model.
Ternyata dari masing-masing p-value dan nilai uji Waldnya dapat disimpulkan bahwa X1
(jenis kelamin), X2 (Pekerjaan pelanggar), X3 (Kendaraan pelanggar), X4 (usia) , X6(Waktu
pelanggaran) tidak ada pengaruh terhadap model sehingga perlu dikeluarkan dari model.
Dan untuk p-value dan nilai uji wald X5(Hari Pelanggaran) ada pengaruh terhadap
model, sehingga diinterpretasikan bahwa variabel X5(Hari Pelanggaran) mempunyai
pengaruh yang signifikan terhadap pelanggaran lalu lintas tidak ringan.
Oleh karena uji overall benar akan diperoleh nilai yang terbaik dengan
meminimalkan beberapa parameter, langkah logis selanjutnya adalah untuk
mencocokan
model
yang hanya
berisi
variabel
yang
signifikan,
dan
membandingkannya dengan model yang berisi semua variabel. P-value lebih besar dari
0,05 maka dapat disimpulkan bahwa model yang telah dikeluarkan variabel independen
yang tidak signifikannya merupakan model yang terbaik.
Hasil Uji Untuk Variabel Yang Signifikan
Dengan hanya memasukkan variabel X5 (Hari Pelanggaran) sebagai variabel bebasnya, dan
Y (tingkat pelanggaran lalu lintas) sebagai variabel dependennya.
Diperoleh output sebagai berikut :
Iteration Historya,b,c,d
Coefficients
-2 Log
Iteration
Step 1
likelihood
Constant
X5(1)
52.615
-.286
1.922
51.683
-.288
2.452
51.647
-.288
2.583
51.647
-.288
2.590
51.647
-.288
2.590
a. Method: Enter
b. Constant is included in the model.
c. Initial -2 Log Likelihood: 65,342
d. Estimation terminated at iteration number 5 because
parameter estimates changed by less than ,001.
Df
Sig.
13.695
.000
Block
13.695
.000
Model
13.695
.000
Model Summary
Step
-2 Log
likelihood
R Square
51.647a
1
a.
Nagelkerke R Square
.240
.329
Estimation terminated at iteration number 5 because parameter estimates changed by less than ,001.
Variables in the Equation
95% C.I.for EXP(B)
B
Sep 1a
S.E.
Wald
Df
Sig.
Exp(B)
X5(1)
2.590
.834
9.642
.002
13.333
Constant
-.288
.382
.568
.451
.750
G(X)penduga =-0,288+2590X5
Lower
2.600
Upper
68.388
Nilai log likelihood without var (hanya dengan variabel X5) = -2 Log likelihood = 51,647
log likelihood=
51,647
2
= -25,8235
S.E.
Wald
Df
Sig.
Exp(B)
Lower
X1(1)
-.504
1.122
.202
.653
.604
.067
5.444
X2(1)
.338
1.264
.071
.789
1.402
.118
16.684
X3(1)
.432
.951
.206
.650
1.540
.239
9.938
X4
-.028
.075
.142
.706
.972
.840
1.126
X5(1)
2.564
.896
8.191
.004
12.990
2.244
75.203
X6(1)
.774
.762
1.030
.310
2.168
.487
9.658
-.209
1.576
.018
.894
.811
Constant
Upper
Untuk memperoleh model yang terbaik, dibandingkan model dengan enam variabel (full) dan
model dengan satu variabel saja.
Hipotesis:
H0: model reduce( koefisien X1(jenis kelamin),X2(pekerjaan pelanggar),X3(jenis
kendaraan pelanggar),X4(usia pelanggar),X6 (waktu pelanggaran)=0)
H1:model full (koefisien X1(jenis kelamin),X2(pekerjaan pelanggar),X3(jenis
kendaraan pelanggar),X4(usia pelanggar),X5(waktu pelanggaran),X6 (waktu
pelanggaran)0 )
Taraf signifikansi : =0,05
likelihood without var
Statistik uji :
Daerah penolakan: H0 ditolak jika G> X2(6;0,05)=12,59159 atau p-value<0,05
Perhitungan :
Nilai log likelihood without var (hanya dengan variabel X5) = -2 Log likelihood = 51,647
51,647
2
log likelihood=
= -25,8235
Jadi nilai log likelihood tanpa variabel = -25,7735.
Nilai log likelihood dengan varibel yaitu : -2 Log likelihood = 50,205
log likelihood=
Jadi nilai log likelihood tanpa variabel = -25,1025
50,205
2
= -25,1025
G =-2[-25,8235-(-25,1025)]
=-2[-0,721]
=1,442
Karena 1,442 < 12,59159 maka H0 diterima
Kesimpulan : Model tanpa variabel X1(jenis kelamin),X2(pekerjaan pelanggar),X3(jenis
kendaraan pelanggar),X4(usia pelanggar),dan X6 (waktu pelanggaran) lebih baik.
Step number: 1
Observed Groups and Predicted Probabilities
+
|
1
F
1
R
1
E
1
Q
1 1
U
1 1
E
1 1
8 +
|
|
|
|
|
6 +
+
|
|
|
|
|
|
4 +
+
N
1 1
C
1 11
Y
1 11
|
0
1
|
|
0
1
|
|
0
1
|
2 +
1
0
1 11 0 1
1
1 11
+
|
1
0
1 11 0 1
1
1 11
|
|
0 0 01 0 0 0 0 01 0 01 101
0
111 1 01011
|
|
0 0 01 0 0 0 0 01 0 01 101
0
111 1 01011
|
Predicted ---------+---------+---------+---------+---------+--------+---------+---------+---------+---------Prob:
0
,1
,2
,3
,4
,5
,6
,7
,8
,9
1
Group:
000000000000000000000000000000000000000000000000001111111111111111111111111
1111111111111111111111111
Predicted Probability is of Membership for 1
The Cut Value is ,50
Symbols: 0 - 0
1 - 1
Each Symbol Represents ,5 Cases.
Output classplot diatas menunjukkan prediksi pada regresi logistik. Sumbu X menunjukkan
probabilitas yang diprediksi, sedangkan sumbu Y menunjukkan jumlah kasus yang diamati.
Daftar Pustaka
Hosmer, D.W., and Lemenshow. (2000). Applied Logistic Regression. John Wiley
Sons. USA
http://www.konsultanstatistik.com/2009/03/simulasi-regresi-logistik.html
http://febrianhadi.wordpress.com
and