Académique Documents
Professionnel Documents
Culture Documents
Analisis Diskriminan
Disusun oleh:
S851608010
A. Pendahuluan
Pada analisis variansi multivariat, dikaji perbedaan antarkelompok pada
variabel terikat yang ditentukan. Jika memang ada perbedaan, pertanyaan yang
muncul kemudian adalah bagaimanakah berdasarkan variabel-variabel tersebut,
suatu objek dapat dikelompokkan kepada suatu kelompok tertentu.
Analisis diskriminan adalah metode statistika yang digunakan untuk
mengelompokkan atau mengklasifikasikan satu atau lebih objek ke dalam suatu
kelompok berdasarkan beberapa variabel tertentu sedemikian rupa sehingga setiap
objek menjadi anggota dari salah satu kelompok dan tidak ada objek yang menjadi
anggota lebih dari satu kelompok.
Analisis diskriminan adalah salah satu teknik analisis multivariat yang bisa
digunakan pada bentuk metode dependensi (hubungan antar variabel dimana
sudah dapat dibedakan mana variabel respon dan mana variabel penjelas). Metode
dependensi diklasifikasikan berdasarkan pada jumlah variabel terikat (dependent
variable) dan skala pengukurannya. Jika variabel terikat (dependent variabel)
hanya satu dan pengukurannya bersifat non metrik maka teknik analisisnya
menggunakan analisis diskriminan.
Analisis diskriminan dilakukan dengan pembentukan suatu kombinasi linear
dari variabel-variabel, sehingga skor komposit dari setiap objek yang terlibat
menjadi petunjuk pada kelompok mana suatu objek menjadi anggota. Apabila
banyaknya kelompok yang dilibatkan lebih dari dua buah, maka pada umumnya
diperlukan lebih dari satu fungsi komposit untuk mengadakan pengelompokkan
atau klasifikasi.
Perlu diperhatikan bahwa jika pada analisis variansi multivariat, variabel-
variabel yang dibicarakan menjadi variabel terikat, maka pada analisis
diskriminan, variabel-variabel tersebut menjadi variabel bebas atau variabel
peramal.
Berikut ini beberapa contoh kasus yang dapat diselesaikan dengan
menggunakan analisis diskriminan:
Seorang analisis keuangan ingin mengetahui variabel-variabel atau faktor-
faktor apa saja yang membedakan antara perusahaan sehat dan perusahaan
yang mengalami kebangkrutan. Analis keuangan tersebut juga ingin
mengetahui apakah mungkin menggunakan faktor-faktor yang telah
teridentifikasi tadi sebagai bentuk indek yang mampu membedakan kedua
perusahaan sehat dan bangkrut. Indek tersebut kemudian digunakan untuk
meramalkan kemungkinan perusahaan akan bangkrut dikemudian hari.
Seorang dokter tertarik ingin menentukan faktor-faktor apa saja yang secara
signifikan dapat membedakan antara pasien yang pernah terserang penyakit
jantung dan pasien yang tidak pernah terserang penyakit jantung. Dokter
tersebut kemudian ingin menggunakan faktor-faktor yang telah teridentifikasi
untuk meramalkan apakah seseorang pasien akan terserang penyakit jantung di
masa yang akan datang.
1 1 6 6 4 8
2 2 3 7 5 6
3 3 4 8 6 7
4 5 4
5 2 5
Jika diambil = 0,05 carilah fungsi diskriminasi dan ujilah signifikansinya.
Jawab:
Pertama kita harus mencari SSCP untuk kelompok I dan SSCP kelompok II.
Untuk kelompok I berikut ini adalah komputasinya:
X 2
SS1 X12 1 43 169 9.2
n1 5
X 2
SS2 X 22 2 102 484 5.2
n1 5
X1 X2
SS12 X1X2
(13)( 22 )
n1
54 5
3.2
9.2 3.2
W1
3.2 5.2
Dengan cara yang sama, SSCP untuk kelompok II adalah:
X1 2 225
SS1 X n1 77
1
2
2.0
3
X 2
SS 2 X 22 n1 2 149
441
2.0
3
X1 X
SS12 X 1 X 2 n1 2 104
(15)( 21)
1.0
3
2.0 1.0
W2
1.0 2.0
13 22
Rerata variabel pada kelompok I adalah 11 = = 2.6 dan 21 = = 4.4
5 5
15 21
Rerata variabel pada kelompok I adalah 12 = 3 = 5 dan 22 = 3 = 7
2.6 5.0 2 .4
Sehingga diperoleh X1 X2 2 .6
4.4 7.0
Nilai b dihitung sebagai berikut:
= ( )
2.6790
b=[ ]
3.7292
Karena F0,05;2,5 = 5.79 yang berarti bahwa Fobs DK, maka H0 ditolak, yang
berarti fungsi diskriminan Y = -2.6790X1 - 3.7292X2 signifikan.
Contoh 2:
2. Diketahui seperti pada Contoh 1.
a. Jika suatu objek mempunyai nilai X1 = 2 dan X2 = 6, menjadi anggota
kelompok I atau kelompok II objek tersebut?
b. Jika suatu objek mempunyai nilai X1 = 5 dan X2 = 5, menjadi anggota
kelompok I atau kelompok II objek tersebut?
Jawab.
Karena fungsi diskriminan Y = -2.6790X1 + (-3.7292)X2 signifikan, maka fungsi
tersebut dapat dipakai sebagai petunjuk untuk mengelompokkan suatu objek
apakah termasuk kepada kelompok I atau kelompok II. Perhatikanlah bahwa
berdasarkan fungsi diskriminan tersebut dapat dicari
1 = (2.6790)(2.6) + (3.7292)(4.4) = 23.374.
Y1 +
Y2 (23.374) + (39.499)
Y= = = 31.4365
2 2
Seperti telah disinggung di depan, jika terdapat lebih dari dua kelompok,
maka pada umumnya terdapat lebih dari satu fungsi diskriminan . Jika semua
fungsi diskriminannya signifikan, makaa fungsi-fungsi diskriminan tersebut dapat
dipakai sebagai petunjuk untuk melakukan pengelompokkan. Sebaliknya, jika ada
fungsi diskriminan yang tidak signifikan, maka tidak dapat dilakukan
pengelompokkan dengan menggunakan fungsi-fungsi tersebut.
Fungsi diskriminan yang dicari berbebtuk:
= + + +
dengan = [ ] adalah vektor eigen terstandar dari
+
= { 1 } ln{(1 + 1 )(1 + 2 ) . (1 + )}
2
p+k
= {N 1 } {ln(1 + 1 ) + ln(1 + 2 ) + + ln(1 + r )}
2
r
p+k
= {N 1 } ln(1 + m )
2
m=1
maka berlaku :
1 1 1
= ( )( )( )
1 + 1 1 + 2 1 +
1
= (1 + 1 )(1 + 2 ) (1 + )
1
Sehingga ln = = ln{(1 + 1 )(1 + 2 ) (1 + )}
= ln(1 + )
=1
Komponen ke-m dari statistik V di atas, yang berbentuk berikut, juga berdistribusi
chi kuadrat.
+
= { 1 } ln(1 + )
2
Perhatikan bahwa 1 2
Untuk menguji signifikansi fungsi-fungsi diskriminan yang diperoleh, digunakan
statistik uji berikut.
Tabel 4. Statistik Uji untuk Menguji Fungsi Diskriminan
Fungsi diskriminan Statistik Uji Derajat Kebebasan
Fungsi diskriminan pertama V p(k-1)
Fungsi diskriminan kedua V V1 (p 1)(k 2)
Fungsi diskriminan ketiga V V1 V2 (p 2)(k 3)
.... ..... ....
Catatan : Statistik uji V, V V1, V V2, dan seterusnya berdistribusi chi-kuadrat.
Contoh 3:
3. Dari populasi diambil tiga sampel yang masing-masing berukuran 5. Sampel
pertama diambil dari populasi siswa-siswa SMK, sampel kedua diambil dari
populasi siswa-siwa SMA IPA. Ketiga kelompok diuji kemampuan
matematikanya yang terdiri dari dua ujian yaitu ujian pemahaman konsep dan
ujian keterampilan komputasi. Datanya adalah sebagai berikut.
Tabel 5. Data Hipotetik mengenai Pemahaman Konsep dan Keterampilan
Komputasi pada Anak SMK, SMA IPS dan SMA IPA
SMK SMA IPS SMA IPA
NS Konsep Kompu- NS Konsep Kompu- NS Konsep Kompu-
(X1) tasi(X2) (X1) tasi(X2) (X1) tasi(X2)
1 3 7 6 4 5 11 5 5
2 4 7 7 4 6 12 6 5
3 5 8 8 5 7 13 6 6
4 5 9 9 6 7 14 7 7
5 6 10 10 6 8 15 7 8
Jika diambil =0,05, carilah fungsi diskriminannya dan ujilah signifikansinya.
Jawab:
Untuk data pada kelompok I atau SMK diperoleh:
( X )2
SS1 X12 n1 111 235 111 105.8 5.2
2
( X )2
SS2 X 22 n 2 343 415 343 336.2 6.8
2
5.2 5.4
W1
5.4 6.8
Untuk data pada kelompok II atau SMA IPS diperoleh:
( X )2
SS1 X12 n1 129 255 129 125 4.0
2
( X )2
SS2 X 22 n 2 223 335 223 217.8 5.2
2
4.0 4.0
W2
4.0 5.2
( X )2
SS1 X12 1 195 31 195 192.5 2.8
2
n 5
( X )2
SS2 X 22 n 2 199 315 199 192.2 6.8
2
2.8 3.8
W3
3.8 6.8
Diperoleh:
W= W1 W2 W3
X1 23 25 31 79 ;
X2 41 33 31 105 ;
( X )2
SS1 X12 n1 435 79
2
15
435 416.07 18.93
( X )2
SS2 X 22 n 2 765 105
2
15
765 735 30.00
18.93 6.00
T=
6.00 30.00
Sehingga diperoleh
18.93 6.00 12.0 13.2 6.93 7.20
= =[ ][ ]=[ ]
6.00 3.00 13.2 18.8 7.20 11.20
Nilai eigen dari W-1B dihitung sebagai berikut:
1 18.8 13.2 0.366 0.257
1 = [ ]=[ ]
51.36 13.2 12 0.257 0.234
0.366 0.257 6.93 7.20 4.387 5.514
= [ ][ ] = [ ]
0.257 0.234 7.20 11.20 3.466 4.471
| | =
4.387 5.514
| |=
3.466 4.471
(4.3787 )(4.471 ) 3.466(5.514) = 0
2 8.858 + 0.503 = 0
(8.858) (8.858)2 (4)(1)(0.503)
1.2 =
(2)(1)
8.858 76.452164
=
2
8.858 8.744
=
2
8.858 + 8.744 8.858 8.744
1 = = 8.801 2 = = 0.057
2 2
Setelah diperoleh nilai eigen, dicari vektor eigen terstandar yang bersesuaian
dengan nilai-nilai eige tersebut.
Untuk 1 = 8.801, diperoleh:
4.387 8.801 5.514
| | | | =
3.466 4.471 8.801
4.414 5.514
| || | =
3.466 4.330
4.414a1 + (5.514a2 ) = 0
5.514
a1 = a = 1.249a2
4.414 2
Untuk memperoleh vektor eigen terstandar, dilakukan hal berikut:
12 + 22 = 1
(1.249a2 )2 + a22 = 1
1.560001a22 + a22 = 1
2.560001a22 = 1
1
a22 = = 0.39062
2.560001
2 = 0.625
1 = (1.249)(0.625) = 0.781
Dari nilai-nilai eigen terstandar tersebut, fungsi diskriminan pertama dari
percobaan di atas adalah Y1 = 0.781X1 + 0.625X2 .
Untuk 1 = 0.057, diperoleh:
4.387 0.057 5.514
| | | | =
3.466 4.471 0.057
4.330 5.514
| || | =
3.466 4.414
4.330a1 + (5.514a2 ) = 0
5.514
a1 = a = 1.273a2
4.330 2
Untuk memperoleh vektor eigen terstandar, dilakukan hal berikut:
a21 + a22 = 1
(1.273a2 )2 + a22 = 1
1.620529a22 + a22 = 1
2.620529a22 = 1
1
a22 = = 0.38160
2.620529
a2 = 0.618
1 = (1.273)(0.618) = 0.787
Dari nilai-nilai eigen terstandar tersebut, fungsi diskriminan pertama dari
percobaan di atas adalah Y2 = 0.787X1 + 0.618X2 .
Uji Signifikansi Fungsi Diskriminan Pertama
Untuk menguji signifikansi fungsi diskriminan pertama Y1 = 0.781X1 +
0.625X2 , dilakukan sebagai berikut.
p+k
V = {N 1 } ln(1 + m )
2
2+3
= {15 1 } {ln(1 + 8.801) + ln(1 + 0.057)}
2
= {11.5}{ln9.801 + ln1.057}
= (11.5)(2.282 + 0.055)
= (11.5)(2.337)
= 26.878
Derajat kebebasan yang sesuai adalah p(k-1)=(2)(2)=4 dan berdasarkan tabel
2
diperoleh 0,05;4 = 9.488 sehingga . Kesimpulannya : H0 ditolak: yang
berarti fungsi diskriminan pertama Y1 = 0.781X1 + 0.625X2 signifikan.
Uji Signifikansi Fungsi Diskriminan Kedua
Untuk menguji signifikansi fungsi diskriminan pertama Y1 = 0.787X1 + 0.618X2 ,
dilakukan sebagai berikut.
p+k
V = {N 1 } ln(1 + m )
2
2+3
= {15 1 } ln(1 + 8.801)
2
= {11.5}{ln9.801}
= (11.5)(2.282)
= 26.243
1 = 26.878 26.243 = 0.635
Derajat kebebasan yang sesuai adalah (p-1)(k-2)=(1)(1)=1 dan berdasarkan tabel
2
diperoleh 0,05;1 = 3.841 sehingga 1 . Kesimpulannya : H0 diterima:
yang berarti fungsi diskriminan pertama Y2 = 0.787X1 + 0.618X2 tidak
signifikan.
Tidak signifikannya fungsi kedua menandakan bahwa ketiga kelompok
tersebut tidak semua nya sepasang-pasang berbeda secara signifikan pada
variabel-variabel peramalnya. Ini juga berarti bahwa fungsi fungsi diskriminan
yang ditemukan tersebut tidak dapat dipakai untuk mengelompokkan suatu objek.
5. Pilih menu classification, dan aktifkan menu Casewise Results, dan semua
pilihan dalam Plot. Kemuadian klik Continue.
Kemudian setelah selesai klik OK, maka akan muncul output yang akan
dijelaskan satu persatu berikut ini
Output Analisis Diskriminan
Output 1
Group Statistics
Valid N (listwise)
Output 2
Tests of Equality of Group Means
Function
Motivasi 1.280
Kerajinan .249
(Constant) -5.034
Unstandardized coefficients
Test of
Function(s) Wilks' Lambda Chi-square Df Sig.
Nilai Wilks Lambda sebesar 0,537 dengan nilai signifikan 0,005 yang
berarti ada perbedaan yang signifikan antara kelompok siswa mandiri dan siswa
non mandiri.
Output 5
Eigenvalues
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
Output 6
Standardized Canonical Discriminant Function Coefficients
Function
Motivasi .958
Kerajinan .178
Output 7
Structure Matrix
Function
Motivasi .984
Kerajinan .317
Output 8