Vous êtes sur la page 1sur 35

STATISTIKA MULTIVARIAT

ANALISIS DISKRIMINAN

DISUSUN OLEH:
ANNISA SHABRINA

041614153006

ATIKAH AYU ARUM

041614153013

ZULIFAH IZZATIN NISA

041614153018

UNIVERSITAS AIRLANGGA
MAGISTER SAINS MANAJEMEN
2017

A. Pengertian
Analisis Diskriminan adalah salah satu teknik analisis statistika dependensi yang
memiliki kegunaan untuk mengklasifikasikan objek beberapa grup. Pengelompokan dengan
analisis diskriminan ini terjadi karena ada pengaruh satu atau lebih variabel lain yang
merupakan variabel independen. Kombinasi linier dari variabel-variabel ini akan membentuk
suatu fungsi diskriminan. Analisis diskriminan bergantung dari data variabel independen.
Perbedaannya analisis diskriminan dan regresi linier berganda adalah analisis diskriminan
digunakan apabila variabel dependennya kategoris (menggunakan skala ordinal maupun
nominal) dan variabel independennya menggunakan skala metrik (interval dan rasio),
sedangkan regresi berganda pada variabel dependennya harus metrik dan variabel
independennya, dapat metrik maupun nonmetrik.
Dalam banyak kasus, variabel dependen terdiri dari dua grup atau klasifikasi,
misalnya, laki-laki dibandingkan perempuan atau tinggi dibandingkan rendah. Dalam kasus
lain, lebih dari dua grup terlibat seperti rendah, sedang dan klasifikasi tinggi. Analisis
diskriminan mampu menangani baik dua grup atau beberapa grup. Ketika melibatkan dua
klasifikasi maka teknik ini disebut sebagai analisis diskriminan dua grup. Ketika melibatkan
tiga atau lebih klasifikasi diidentifikasi, teknik ini disebut multiple diskriminan analisis
(MDA).
Model Analisis Diskriminan
Model analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu
kombinasi linier dari berbagai variabel independen yaitu :

dimana :
Zjk

= skor diskriminan fungsi j untuk obyek k

= intersep

Wi

= bobot diskriminan untuk variable independen i

Xik

= variabel independent i untuk obyek k

Yang diestimasi adalah koefisien W, sehingga nilai Z setiap grup sedapat mungkin
berbeda. Ini terjadi pada saat rasio jumlah kuadrat antargrup (between group sum of squares)
terhadap jumlah kuadrat dalam grup (within-group sum of square) untuk skor diskriminan
mencapai maksimum. Berdasarkan nilai Z itulah keanggotaan dapat diprediksi.
2

Analisis diskriminan merupakan teknik statistik yang sesuai untuk menguji hipotesis
dimana rata rata grup dari dua atau lebih grup variabel independen adalah sama. Dengan
mencari rata rata skor diskriminan untuk semua individu dalam grup tertentu, akan
diperoleh rata rata grup yang disebut dengan centroid. Centroid ini menunjukkan lokasi
sejenis dari anggota di dalam suatu grup dan merupakan perbandingan centroid grup yang
menunjukkan seberapa jauh terpisah dari grup terkait dengan fungsi diskriminannya.
Tes signifikansi statistik dari fungsi diskriminan adalah ukuran umum dari jarak antar
grup centroid. Hal ini dihitung dengan membandingkan distribusi skor diskriminan untuk
grup. Jika tingkat tumpang tindih dalam distribusinya kecil maka fungsi diskriminan akan
memisahkan grup dengan baik, jika tingkat tumpang tindihnya besar maka fungsi
diskriminatornya kurang baik antara grup - grup. Dua distribusi skor diskriminan yang
ditunjukkan pada Gambar 1 menggambarkan konsep ini. Diagram atas mewakili distribusi
skor diskriminan untuk fungsi yang memisahkan menunjukkan tumpang tindih yang minimal
(daerah yang diarsir) antara grup. Diagram bawahnya menunjukkan distribusi skor
diskriminan pada fungsi diskriminan yang merupakan discriminator yang relatif tidak baik
antara grup A dan B. Daerah yang diarsir tumpang tindih mewakili contoh di mana
mengklasifikasikan objek dari grup A ke grup B, dan sebaliknya.
Jika variabel dependen terdiri dari lebih dari dua grup, analisis akan menghitung lebih
dari satu fungsi diskriminan. Berdasar fakta hal itu akan menghitung fungsi NG - 1, di mana
NG adalah jumlah grup. Tiap fungsi diskriminan akan menghitung diskriminan skor Z secara
terpisah. Dalam kasus variabel dependen tiga grup, setiap objek (perusahaan, responden, dll)
akan memiliki nilai yang terpisah untuk fungsi diskriminan satu dan dua, yang
memungkinkan objek yang akan diplot kedalam dua dimensi, dengan masing-masing dimensi
mewakili fungsi diskriminan. Dengan demikian, anaIisis diskriminan tidak terbatas pada
variat tunggal, seperti regresi berganda, tapi menciptakan beberapa variat mewakili dimensi
diskriminasi antara grup-grup.

Gambar 1 : Representasi univariat Skor Diskriminan Z

Aplikasi dan interpretasi dari analisis diskriminan sama seperti dalam analisis regresi.
Artinya, fungsi diskriminan adalah kombinasi linear (variat) dari pengukuran metrik untuk
dua atau lebih variabel independen dan digunakan untuk menggambarkan atau memprediksi
variabel dependen tunggal. Perbedaan utamanya adalah bahwa analisis diskriminan cocok
untuk masalah penelitian dimana variabel dependen berjenis kategorikal (nominal atau
nonmetric), sedangkan regresi digunakan ketika variabel dependen adalah metrik. Seperti
yang dibahas sebelumnya, regresi logistik adalah varian dari regresi dengan banyak kesamaan
kecuali untuk jenis variabel dependen. Analisis diskriminan juga dapat dibandingkan dengan
membalik nilai multivariat analysis of varians (MANOVA). Dalam analisis diskriminan, yang
variable dependen tunggalnya berjenis kategori, dan variable independennya metrik.
Sebaliknya, MANOVA melibatkan variabel dependen berbentuk metrik dan independen
variables berbentuk kategori.
B. Contoh Hipotesis dari Analisis Diskriminan
Analisis diskriminan berlaku untuk setiap pertanyaan penelitian dengan tujuan
memahami anggota grup yaitu apakah grup terdiri dari individu (misalnya, pelanggan vs yang
bukan pelanggan), perusahaan misalnya, menguntungkan vs tidak menguntungkan), produk
(misalnya, berhasil vs tidak berhasil), atau benda lainnya yang dapat dievaluasi pada
4

serangkaian variabel independen. Untuk menggambarkan dasar analisis diskriminan, kita


memeriksa dua pengaturan penelitian yang melibatkan dua grup (pembeli vs bukan pembeli)
dan tiga grup lainnya (tingkat perilaku berpindah / switching).
Contoh Analisis Diskriminan Dua Grup : Pembeli vs Non Pembeli
Diberikan contoh : KitchenAid ingin menentukan apakah salah satu dari
pengembangan produk baru mereka yaitu food mixer akan sukses secara komersial. Dalam
melaksanakan penelitian, KitchenAid tertarik dalam mengidentifikasi (jika mungkin)
konsumen akan membeli produk baru dibandingkan dengan mereka yang non pembeli, dalam
terminologi statistik, KitchenAid ingin meminimalkan jumlah kesalahan itu dalam membuat
prediksi konsumen manayang akan membeli food mixer dan yang tidak membeli. Untuk
membantu mengidentifikasi calon pembeli, KitchenAid merancang skala penilaian pada tiga
karakteristik yaitu daya tahan, kinerja, dan gaya yang akan digunakan oleh konsumen
dalam mengevaluasi produk baru. KitchenAid berharap bahwa kombinasi tertimbang antara
ketiganya akan lebih baik dalam memprediksi kemungkinan pembelian konsumen daripada
mengandalkan setiap skala sebagai ukuran terpisah.
Tujuan utama dari analisis diskriminan adalah untuk mengembangkan kombinasi
tertimbang dari tiga skala untuk memprediksi kemungkinan bahwa konsumen akan membeli
produk. Selain menentukan apakah konsumen yang cenderung untuk membeli produk baru
dapat dibedakan dari mereka yang tidak membeli. KitchenAid juga ingin mengetahui
karakteristik produk barunya yang berguna dalam membedakan pembeli dari non pembeli.
Hal ini diartikan sebagai evaluasi dari tiga karakteristik dari produk baru mana yang
terbaik untuk memisahkan pembeli dari non pembeli? Misalnya, jika respon akan membeli"
selalu dikaitkan dengan rating daya tahan tinggi dan respon tidak akan membeli" selalu
dikaitkan dengan rating daya tahan rendah, KitchenAid bisa menyimpulkan bahwa
karakteristik daya tahan membedakan pembeli dari non pembeli. Sebaliknya, jika KitchenAid
menemukan bahwa banyak orang dengan rating tinggi pada gaya / style mengatakan bahwa
mereka akan membeli food mixer dibanding orang-orang yang mengatakan mereka tidak
akanmembeli maka gaya adalah karakteristik pembeda yang buruk antara pembeli dan non
pembeli.

Mengidentifikasi Variabel Diskriminan


5

Untuk mengidentifikasi variabel yang mungkin berguna dalam membedakan antara


grup (yaitu, pembeli versus non pembeli), penekanan diarahkan pada perbedaan grup
daripada pengukuran dengan korelasi yang digunakan dalam regresi berganda. Tabel 1
menunjukkan peringkat dari mixer baru pada tiga karakteristik ini (pada harga yang
ditentukan) oleh panel 10 calon pembeli. Dalam rating food mixer, setiap anggota panel
secara implisit membandingkannya dengan produk yang sudah ada di pasaran. Setelah
produk dievaluasi maka evaluator diminta untuk menyatakan niat mereka untuk membeli
(akan membeli atau tidak akan membeli). Lima orang menyatakan bahwa mereka akan
membeli mixer baru dan lima mengatakan mereka tidak akan membeli.
Tabel 1. Hasil Survei KitchenAid pada Evaluasi Produk Konsumen Baru

Tabel 1 diidentifikasi beberapa variabel diskriminatif potensial. Pertama, perbedaan


substansial memisahkan peringkat rata-rata XI (daya tahan) untuk grup akan membeli dan
grup tidak akan membeli (7,4 vs 3,2) lalu, daya tahan muncul untuk membedakan dengan
baik antara kedua grup dan cenderung menjadi karakteristik penting untuk potensi pembeli.
Sebaliknya karakteristik gaya (X3) memiliki perbedaan yang jauh lebih kecil dari 0,2 antara
nilai rata-rata (4,0-3,8 = 0,2) untuk grup akan membeli dan grup tidak akan membeli. Oleh
karena itu kita menilai karakteristik ini menjadi kurang diskriminatif dalam hal keputusan
6

pembelian. Kita harus menguji distribusi skor untuk masing-masing grup. Standar
penyimpangan besar dengan tidak ada atau kedua grup mungkin memberi perbedaan antara
rata - rata tidak signifikan dan tidak penting dalam membedakan antar grup.
Karena kita hanya memiliki 10 responden di dua grup dan tiga variabel independen,
kami juga dapat melihat data secara grafis untuk menentukan analisis diskriminan apa yang
ingin dicapai.Gambar 2 menunjukkan 10 responden pada masing-masing tiga variabel. Grup
akan membeli" diwakili oleh lingkaran dan grup "tidak akan membeli" oleh kotak. nomor
identifikasi responden berada di dalam bentuk.
Gambar 2. Hasil dari Perwakilan 10 Responden

a)

X1 (Daya Tahan) memiliki perbedaan substansial dalam nilai rata-rata, memungkinkan


kita untuk membedakan antar grup yang menggunakan hanya variabel ini secara
sempurna. Jika menetapkan nilai 5,5 sebagai titik cutoff untuk membedakan antara dua
grup, maka kita akan salah mengambil keputusan untuk responden 5, pada grup yang
akan membeli (responden 5, memiliki poin hanya 4). Variabelini menggambarkan
kekuatan diskriminatif memiliki perbedaan besar dalam rata - rata untuk dua grup dan
kurangnya tumpang tindih antara distribusi dari dua grup.

b) X2 (Kinerja) memberikan perbedaan antara dua grup yang kurang jelas. Namun, variabel
ini memberikan diskriminasi tinggi untuk responden 5, yang membuat kita salah
mengklasifikasi jika kita hanya menggunakan X1. Selain itu, responden yang akan
membuat kesalahan klasifikasi menggunakan X2akan terpisahkan dengan jelas dari X1.
Dengan demikian, menggunakan X1 dan X2 mungkin cukup efektif dalam kombinasi
c)

untuk memprediksi anggota grup.


X3 (Gaya) menunjukkan sedikit perbedaan antara grup. Jadi, dengan membentuk sebuah
variatdarihanya X1dan X2, dan menghilangkan X3, fungsi diskriminan dapat
dibentukuntuk memaksimalkan terpisahnya grup pada skor diskriminan

Menghitung Fungsi Diskriminan


Dengan teridentifikasinya tigavariabel diskriminan potensial. Perhatian beralih
terhadap penyelidikan kemungkinan menggunakan variabel diskriminan dalam kombinasi
untuk meningkatkan kekuatan diskriminan dari beberapa variabel individu. Untuk tujuan ini,
variat dapat dibentuk dengan dua atau lebih variabel untuk bertindak bersamadalam
mendiskriminasi didalam grup. Tabel 2 berisi hasiltiga formulasi berbeda dari fungsi
diskriminan, masing masing mewakili kombinasi yang berbeda dari tiga variabel
independen.
Tabel 2. Fungsi Diskriminan

Fungsi diskriminan pertama mengandung hanya X1, menyamakan nilai X1 ke skor Z


diskriminan (juga menyatakan bobot 1,0 untuk X 1 dan bobot nol untuk semua variable
8

lainnya. Seperti telah ditunjukkan sebelumnya, menggunakan hanya X1 sebagai


diskriminator terbaik menghasilkan kesalahan klasifikasi untuk subyek 5 sebagaimana
ditunjukkan dalam tabel 2. Saat 4 dari 5 subyek dalam grup 1 (semua kecuali subyek 5)
dan 5 dari 5 subyek di grup 2 diklasifikasikan dengan benar (yaitu terletak pada diagonal
matrik klasifikasi). Persentase klasifikasi yang benar mencapai 90% (9 dari 10 subyek).
Karena X2 memberikan diskriminasi untuk subyek 5, kita dapat membentuk fungsi
diskriminan kedua dengan mengkombinasikan secara sama baik X1 dan X2 (yaitu
menyatakan bobot 1,0 untuk X1 dan X2 serta bobot nol untuk X3) untuk menggunakan
tiap power diskriminator unik variabel. Dengan menggunakan skor pemisah 11 dengan
fungsi diskriminan baru ini akan mencapai klasifikasi yang sempurna dari dua grup. Jadi
kombinasi X1 dan X2 dapat memprediksi dengan lebih baik anggota grup daripada
menggunakannya secara terpisah.
Fungsi diskriminan ketiga pada Tabel 2 menunjukkan fungsi diskriminan yang diestimasi
secara nyata (Z = -4,53 + 0,476X 1 + 0,359X2). Berdasarkan skor pemisah = 0 fungsi
ketiga ini mencapai tingkat klasifikasi yang 100% benar dengan pemisahan maksimum
yang mungkin diantara grup.
Dengan contoh ini, analisis diskriminan mengidentifikasi variabel mana dengan
perbedaan paling besar diantara grup dan menghasilkan koefisien diskriminan yang
memberi bobot tiap variabel untuk merefleksikan perbedaan.
Contoh Tiga Grup Analisis Diskriminan : Keinginan Berpindah
Ilustrasi penggunaan analisis diskriminan tiga grup dipakai penelitian yang dilakukan
HBAT atas kemungkinan pelanggan pesaing berpindah pemasok. Pretest skala kecil meliputi
wawancara dengan 15 pelanggan dari pesaing utama. Dalam wawancara pelanggan
ditanyakan kemungkinan berpindah pemasok dari 3 kategori skala yaitu yakin berpindah,
belum memutuskan dan yakin tidak berpindah.Pelanggan ditugaskan ke grup 1, 2
dan 3 secara berurutan tergantung tanggapan mereka. Pelanggan merating pesaing pada 2
karakteristik yaitu harga kompetitif (X1) dan tingkat pelayanan (X2). Tujuan penelitian
menentukan apakah rating pelanggan pada pesaing dapat memprediksi kemungkinan mereka
berpindah pemasok.

Identifikasi Variabel Diskriminan

Dengan 3 kategori variabel dependen, analisis diskriminan dapat memprediksi dua


fungsi diskriminan masing masing mewakili dimensi diskriminan yang berbeda. Tabel 3
mengandung hasil survey dari 15 pelanggan yaitu masing masing 5 di tiap kategori
dependen variabel. Seperti yang sudah dilakukan di contoh dua-grup sebelumnya, kita dapat
melihat rata rata skor untuk tiap grup untuk menemukan satu variable diskriminan yang
baik diantara semua grup. Untuk X1 kita lihat perbedaan rata rata yang besar dibandingkan
grup 1 dan 2 atau 3 (2,0 vs 4,6 atau 3,8).X1 mungkin mendiskriminasi dengan baik antara
grup 1 dan grup 2 atau 3 namun menjadi kurang efektif dalam mendiskriminasi antara grup 2
dan 3. Untuk X2 kita lihat perbedaan antara grup 1 dan 2 sangat kecil (2,0 vs 2,2) sedangkan
perbedaan besar terjadi antara grup 3 dan grup 1 atau 2 (6,2 vs 2,0 atau 2,2). Jadi X1
membedakan grup 1 dari grup 2 dan 3 sedangkan X2 membedakan grup 3 dari grup 1 dan 2.
Hasilnya kita lihat X1 dan X2 memberikan dimensi diskriminasi yang berbeda antar grup.
Tabel 3. Hasil Survei HBAT Keinginan Berpindah oleh Konsumen Potensial

E. Menghitung Dua Fungsi Diskriminan

10

Dengan teridentifikasinya variabel diskriminan potensial maka tahap selanjutnya


mengkombinasikan ke dalam fungsi diskriminan yang akan menggunakan power diskriminan
untuk membedakan antara grup. Untuk mengilustrasikan dimensi ini secara grafis, gambar 4
melukiskan 3 grup pada masing masing variable independen secara terpisah. Dengan
melihat anggota grup pada tiap variable dapat kita temukan tidak ada variable diskriminan
yang baikdiantara semua grup. Namun jika kita membentuk dua fungsi diskriminan
sederhana menggunakan bobot sederhana 0 atau 1, hasilnya menjadi lebih jelas. Secara
matematis dapat ditulis sebagai berikut :
Fungsi Diskriminan 1 = 1,0(X1) + 0,0(X2)
Fungsi Diskriminan 2 = 0,0(X1) + 1,0(X2)
Persamaan ini menunjukkan secara sederhana bagaimana prosedur analisis
diskriminan memprediksi bobot untuk memaksimalkan diskriminasi. Dengan dua fungsi kita
dapat menghitung dua skor diskriminan untuk tiap responden.. Gambar 4 juga mengandung
plot tiap responden dalam representasi dua dimensi. Pemisahan antar grup kini menjadi lebih
jelas dan tiap grup dapat dengan mudah dibedakan.
Gambar 4. Hasil Grafis Variabel Diskriminan Potensial untuk Analisis Diskriminan
Tiga Grup

11

F. Proses Keputusan untuk Analisis Diskriminan


Tahap 1 : Tujuan Analisis Diskriminan
Tujuan Analisis diskriminan adalah sebagai berikut :
1. Menentukan apakah perbedaan yang terjadi antara profil skor rata rata pada suatu
2.

perangkat variable untuk dua atau lebih grup a priori signifikan secara statistik.
Menentukan manakah variabel independen yang paling memberi perbedaan dalam profil

3.

skor rata rata pada dua atau lebih grup.


Membangun jumlah dan komposisi dari dimensi diskriminasi antara grup yang dibentuk

4.

dari seperangkat variabel independen


Membangun prosedur untuk mengklasifikasikan objek (individu, perusahaan, produk,
dll) ke dalam grup menurut dasar skornya pada seperangkat variabel independen.

Gambar 5. Tahap 1 - 3 Keputusan Analisis Diskriminan

12

Analisis diskriminan berguna saat peneliti tertarik dalam memahami perbedaan grup
atau mengklasifikasikan objek dengan benar pada grup atau kelasnya. Diskriminan analisis
dapat dianggap sebagai tipe analisis profil atau teknik prediksi analitik. Teknik ini yang
paling cocok pada kondisi dengan variabel independen tunggal dan beberapa variabel
independen skala metrik.
Sebagai analisis profil, analisis diskriminan bertujuan menilai perbedaan antar grup pada
set variabel independen. Pada diskriminan analisis untuk memahami perbedaan grup,
variabel individu berperan dalam mendefinisikan kombinasi pada variabel ini yang
merepresentasikan dimensi dari diskriminan antar grup. Dimensi ini adalah sebuah efek
kolektif dari beberapa variabel yang bekerja sama untuk membedakan antar grup.
Penggunaan metode estimasi sekuensial digunakan untuk mengidentifikasi sub-set
variabel dengan kemampuan discriminator yang paling baik.
Sebagai tujuan klasifikasi, analisis diskriminan menyediakan dasar klasifikasi dimana
sampel tidak hanya digunakan untuk mengestimasi fungsi diskriminan tetapi juga untuk
mengestimasi beberapa observasi lainnya yang bernilai untuk semua variabel

13

independen. Hal ini berarti bahwa analisis diskriminan dapat digunakan untuk
mengklasifikasi observasi lain ke grup yang terdefinisi.
Tahap 2 : Desain Penelitian untuk Analisis Diskriminan
Memilih Variabel Dependen dan Independen
Untuk melakukan analisis diskriminan pada awalnya peneliti harus menentukan mana
variabel yang menjadi independen dan mana yang menjadi dependen. Ingat bahwa bahwa
variabel dependen harus berbentuk nonmetrik dan variabel independen variabel
berbentuk metrik.
Variabel Dependen
Peneliti pertama kali harus fokus pada variabel dependen. Jumlah grup variabel dependen
(kategori) dapat dua atau lebih dan dua grup ini harus mutually exclusive dan exhaustive.
Artinya, masing-masing observasi ditempatkan hanya pada satu grup. Dalam beberapa kasus,
variabel independen dapat terdiri dari dua grup (dikotomik) atau beberapa grup
(multikotomik).
Memilih variabel dependen yang :
a. Paling baik dalam mewakili perbedaan grup
b. Mendefinisikan grup yang berbeda secara substansial
c. Meminimalkan jumlah kategori
Berapa banyak kategori pada variabel dependen?
Secara teori, analisis diskriminan dapat menangani jumlah kategori yang tak terbatas dari
variabel dependen. Namun secara praktek, peneliti tetap harus memilih variabel dependen
dan jumlah kategori berdasar pertimbangan berikut :
(1) Kategori variabel dependen harus berbeda dan unik pada variabel independen yang telah
dipilih. Analisis diskriminan mengasumsikan tiap grup seharusnya memiliki profil unik
pada variabel independen yang dipakai dan juga mengembangkan fungsi diskriminan
untuk memisahkan grup berdasar variabel ini secara maksimal.
(2) Peneliti juga seharusnya mengusahakan semua hal harus sama dengan jumlah kategori
pada variabel dependen yang lebih kecil dibanding yang lebih besar. Terlihat lebih logis
untuk memperluas jumlah kategori untuk mencari lebih banyak dalam mengelompokkan
yang unik, namun memperluas jumlah kategori membuat kegiatan profiling dan tugas
mengelompokkan analisis diskriminan menjadi lebih kompleks.
14

Hal ini berarti bahwa, peneliti harus menyeimbangkan keinginan untuk memperluas
kategori dengan meningkatkan keunikan dibanding meningkatkan keefektifan pada jumlah
kategori yang lebih kecil. Pemilihan variabel dependen seharusnya dilakukan dengan kategori
yang memiliki perbedaan maksimum di antara semua grup sambil mempertahankan
dukungan konsep dan relevansi manajerial.
Konversi Variabel Metrik
Kita mungkin memiliki variabel dependen yang merupakan pengukuran ordinal
atau interval yang ingin kita gunakan sebagai variabel dependen kategoris. Dalam kasus
tersebut, kita harus membuat variabel kategoris, dan dua pendekatan yang paling umum
digunakan. Pendekatan yang paling umum adalah untuk membangun kategori dengan
menggunakan skala metrik.
Seringnya, pendekatan akan menciptakan dua, tiga, atau empat kategori. Ketika tiga
atau lebih kategori diciptakan, kemungkinan timbul pemeriksaan hanya pada kelompok
ekstrim dalam analisis diskriminan dua kelompok. Dalam mengkonversi variabel metrik
menjadi nonmetric yaitu dengan mempertimbangkan penggunaan kelompok ekstrim untuk
memaksimalkan perbedaan kelompok. Pendekatan polar extremes membandingkan hanya
dua kelompok ekstrim dan termasuk kelompok menengah dari analisis diskriminan.
Pendekatan ini dapat digunakan setiap saat peneliti yang ingin meneliti hanya
kelompok ekstrim. Namun, peneliti juga mungkin ingin mencoba pendekatan ini ketika hasil
dari analisis regresi tidak sebaik yang diharapkan. Pendekatan polar extremes dengan analisis
diskriminan dapat mengungkapkan perbedaan yang tidak begitu menonjol pada analisis
regresi di keseluruhan data. Oleh karena itu, memanipulasi data secara alami akan
memerlukan peringatan dalam menginterpretasi suatu temuan.
Variabel Independen
Variabel independen biasanya dipilih dalam dua cara. Pendekatan pertama dengan
mengidentifikasi variabel baik dari penelitian sebelumnya atau dari model teoritis yang
merupakan dasar yang mendasari pertanyaan penelitian. Pendekatan kedua adalah intuisimemanfaatkan pengetahuan peneliti dan secara intuitif memilih variabel yang tidak ada
penelitian sebelumnya atau teori ada tapi itu secara logis mungkin terkait dengan
memprediksi kelompok untuk variabel dependen. Variabel independen yang paling cocok
adalah yang berbeda di seluruh paling sedikit 2 grup dari variabel dependen sehingga dapat
menunjukkan keunikan dibandingkan lainnya.
15

Sampel
Sampel terlalu kecil akan memiliki terlalu banyak samplingerror, sedangkan jika
sampel terlalu besar maka akan membuat perbedaan yang signifikan secara statistik yang tak
jarang tidak relevan dengan kondisi manajerial.
Ukuran sampel harus cukup besar untuk:

Memiliki setidaknya 20 pengamatantiap variabel prediktor dengan minimum ukuran


grup terkecil dari kategori harus melebihi jumlah variabel independen.

Memaksimalkan jumlah pengamatan per variabel, dengan rasio minimal lima


pengamatan per variabel independen

Memiliki setidaknya 100 total sampel untuk membaginya menjadi dua grup

Memiliki sampel yang cukup besar untuk embaginya menjadi estimasi dan holdout
sampel, setiap pertemuan persyaratan di atas
Variasi yang lebar pada ukuran grup akan mempengaruhi estimasi dari fungsi

diskriminan dan klasifikasi pengamatan. Validasi analisis diskriminan membagi sampel


menjadi dua subsampel dimana yang satu digunakan untuk estimasi fungsi diskriminan dan
lainnya digunakan untuk tujuan validasi.
Membuat Sub-Sampel
Pembagian total sampel dari responden secara acak ke dalam dua subsample antara lain :
a. Sampel analisis

: digunakan untuk mengembangkan fungsi diskriminan

b. Sampel Holdout

: digunakan untuk menguji fungsi diskriminan

Metode untuk memvalidasinya adalah dengan split-sample validation atau cross-validation


Hal yang harus dilakukan jika sampel terlalu kecil
Pertama, peneliti dapat mengembangkan fungsi pada seluruh sampel kemudian
menggunakannya untuk mengklasifikasikan grup yang sama yang digunakan pada perluasan
fungsi. Kedua, dengan melakukan sebuah tipe dari prosedur holdout pada fungsi diskriminan
yang diestimasikan secara berulang pada sampel, tiap waktu hold out sebuah perbedaan
pengamatan sehingga tidak perlu membaginya menjadi subsampel.
Tahap 3: Asumsi Analisis Diskriminan

16

Analisis diskriminan didasarkan pada sejumlah asumsi. Asumsi ini berhubungan


dengan baik proses statistik yang terlibat dalam estimasi dan klasifikasi prosedur dasar dan
isu-isu yang mempengaruhi interpretasi hasil. Asumsi kunci untuk mendapatkan fungsi
diskriminan adalah normalitas multivariat dari variabel independen dan dispersi yang tidak
diketahui (tetapi sama) dan struktur kovarian (matriks) untuk grup yang didefinisikan oleh
variabel dependen.
Jika asumsi dilanggar dan potensi untuk mengulang tidak dimungkinkan, peneliti
dapat mempertimbangkan metode alternative, seperti regresi logistik misalnya.

Mengidentifikasi pelanggaran asumsi


Isu dispersi yang sama dari variabel independen (setara matriks kovarians) mirip
dengan homoskedastisitas antara variabel individu. Tes yang paling umum adalah Tes
Boxs M. Tes ini menilai signifikansi perbedaan dalam matriks antara kelompok.
Mengingat sensitivitas uji Boxs M, bagaimanapun, dengan ukuran matriks kovarians
dan jumlah kelompok dalam analisis, peneliti harus menggunakan tingkat yang sangat
konservatif dari perbedaan yang signifikan (misalnya, 0,1 daripada 0,5) ketika menilai
apakah perbedaan yang hadir atau tidak.

Dampak terhadap estimasi


Data tidak memenuhi asumsi normalitas multivariat dapat menyebabkan masalah
dalam estimasi fungsi diskriminan. Pengulangan dimungkinkan melalui transformasi
data untuk mengurangi kesenjangan antara matriks kovarians. Jika pengukuran
dependen adalah biner maka regresi logistik seharusnya lebih memungkinkan untuk
digunakan.

Dampak terhadap klasifikasi

Jika ukuran sampel kecil dan matriks kovarians tidak sama, maka signifikansi statistik
dari proses estimasi terpengaruh. Semakin besar kemungkinan kasusal adalah dari
kovarianyang tidak setara antara kelompok dari ukuran sampel yang memadai,
dimana pengamatan overclassified ke dalam kelompok dengan matriks kovarians
yang lebih besar. Efek ini dapat diminimalkan dengan meningkatkan ukuran
sampel dan juga dengan menggunakan kelompok matriks kovarians khusus
untuk tujuan klasifikasi. Namun, hal ini dapat mengakibatkan cross-validation dari
hasil diskriminan.

Multikolinearitas antar variabel independen yang masih dalam batas toleransi


menandakan bahwa dua atau lebih variabel independen berkorelasi dengan tinggi,
17

satu variabel dapat sangat menjelaskan dan memprediksi variabel lainnya, sehingga
hal itu dapat menambah sedikit kekuatan penjelas di seluruh set. Multikolinearitas
antara variabel independen nyata dapat mengurangi perkiraan dampak variabel
independen dalam fungsi diskriminan yang berasal, terutama jika proses estimasi
bertahap digunakan. Asumsi implisit dari teknik multivariat bahwa semua hubungan
adalah linear. Hubungan nonlinear tidak dapat direfleksikan dalam fungsi
diskriminan, jika tidak maka transformasi variabel spesifik dibuat untuk
merepresentasikan efek nonlinear.
Gambar 6. Tahap 4-6 Keputusan Analisis Diskriminan

Tahap 4: Estimasi Model Diskriminan dan Menilai Overall Fit


Dengan fungsi yang diestimasikan, keseluruhan model fit dapat dinilai dengan
berbagai cara. Salah satunya diskriminan Z scoresyang dapat dihitung untuk tiap objek yang
menyediakan suatu pengukuran diskriminasi antar grup.
Memilih metode estimasi

18

Menentukan metode estimasi untuk membuat fungsi diskriminan dengan menyeimbangkan


kebutuhan untuk kontrol proses estimasi dibanding keinginan untuk parsimony pada fungsi
diskriminan. Pada prinsipnya terdapat dua metode dasar untuk membuat fungsi diskriminan
yaitu :
1. Simultaneous estimation
Semua variabel independen dimasukkan secara bersama-sama kemudian dilakukan
proses diskriminan. Metode ini cocok ketika (untuk alasan teoritis) peneliti ingin untuk
memasukkan semua variabel independen dalam analisis.
2. Stepwise estimation
Variabel independen dimasukkan satu per satu kedalam model diskriminan. Pada proses
ini akan ada variabel yang tetap ada dalam model dan ada variabel yang dibuang dari
model. Metode ini berguna ketika peneliti ingin mempertimbangkan sejumlah variabel
independen yang besar secara relatif untuk inklusi dalam fungsi.
Signifikansi Statistik
Keseluruhan signifikansi
Dalam menilai signifikansi statistik dari model keseluruhan, kriteria perbedaan
statistik berlaku untuk kesimultanandibandingkan dengan prosedur estimasi bertahap. Dalam
kedua situasi, uji statistik berhubungan dengan kemampuan fungsi diskriminan untuk
mendapatkan diskriminan Zscoreyang berbeda secara signifikan antara kelompok.
1.

Simultaneous estimation

Ketika estimasi simultan digunakan, langkah-langkah dari Wilks lambda, jejak Hotelling, dan
kriteria Pillai semua mengevaluasi signifikansi statistik dari kekuatan diskriminatif dari
fungsi diskriminan.
2.

Stepwise Estimation

Jika metode stepwise digunakan untuk memperkirakan fungsi diskriminan, yang Mahalanobis
D2 dan langkah-langkah Rao s V adalah yang paling tepat. Kedua adalah ukuran jarak umum.
Signifikansi dari fungsi diskriminan individu
Peneliti tidak hanya menentukan apakah diskriminasi antar grup signifikan secara
statistik tetapi juga tiap fungsi diskriminan yang diestimasi juga signifikan secara statistik.
Dengan lebih dari dua kelompok, tidak membatasi analisis untuk fungsi diskriminan hanya
signifikan secara statistik, tapi mempertimbangkan jika fungsi tidak signifikan (dengan
tingkat signifikansi hingga 0.3) menambah kekuatan penjelas.
19

Menghitung skor Z diskriminan


Seperti dibahas sebelumnya, skor Z diskriminan dari fungsi diskriminan dapat
dihitung untuk setiap observasi dengan rumus berikut:
Zjk = a = W1 X1k + W2K2+ .. + WnXnk
Dimana :

Zjk

= diskriminan Z scoredari fungsi diskriminan juntuk objekk

= intersep

Wi

= koefisien diskriminan untuk variabel independeni

Xik

= variabel independen iuntuk objekk

Diskriminan Z score, variabel metrik, menyediakan sarana langsung membandingkan


pengamatan pada setiap fungsi. Pengamatan dengan Z score yang diasumsikan lebih sama
pada variabel merupakan fungsi ini dibandingkan dengan nilai yang berbeda. Fungsi
diskriminan dapat dinyatakan baik dengan bobot dan nilai-nilai yang distandarkan atau tidak
distandarkan. Versi standar lebih berguna untuk tujuan interpretasi, tapi versi yang tidak
standar lebih mudah untuk digunakan dalam menghitung diskriminan Z score.
Menilai kelompok akurasi prediksi keanggotaan
Mengingat bahwa variabel dependen adalah nonmetrik, tidak mungkin untuk
menggunakan ukuran seperti R2, seperti yang dilakukan di regresi berganda, untuk menilai
akurasi prediksi. Sebaliknya, setiap pengamatan harus dinilai apakah itu benar
diklasifikasikan atau tidak. Dalam melakukannya, beberapa pertimbangan utama harus
dilakukan adalah:
Alasan statistik dan praktis untuk mengembangkan matriks klasifikasi.
Klasifikasi kasus individual
Pembangunan matriks klasifikasi
Standar untuk menilai akurasi klasifikasi
Prosedur klasifikasi matriks memberikan perspektif tentang signifikansi praktis
daripada

signifikansi

statistik.

Dengan

analisis

diskriminan

berganda,

persentase

diklasifikasikan dengan benar, juga disebut rasio hit, mengungkapkan seberapa baik fungsi
diskriminan diklasifikasikan objek. Dengan ukuran sampel yang cukup besar dalam analisis
20

diskriminan, kita bisa memiliki perbedaan signifikan secara statistik antara dua (atau lebih)
kelompok dan belum benar mengklasifikasikan hanya 53 persen.
Mengklasifikasikan Pengamatan Individu
Perhitungan Skor pemotongan
Menggunakan fungsi diskriminan dianggap signifikan, kita dapat mengembangkan
matriks klasifikasi dengan menghitung skor pemotongan untuk setiap fungsi diskriminan.
Skor pemotongan adalah kriteria terhadap skor diskriminan setiap objek dibandingkan untuk
menentukan ke dalam kelompok yang objek harus diklasifikasikan.
Mengembangkan Fungsi Klasifikasi
Seperti disebutkan sebelumnya, menggunakan fungsi diskriminan adalah hanya salah
satu dari dua pendekatan yang mungkin untuk klasifikasi. Pendekatan kedua menggunakan
fungsi klasifikasi. Dalam metode ini klasifikasi, nilai-nilai pengamatan untuk variabel
independen yang dimasukkan dalam fungsi klasifikasi dan skor klasifikasi untuk masingmasing kelompok dihitung untuk observasi itu.
Menghitung skor pemotongan optimal
Pentingnya probabilitas sebelum dapat diilustrasikan dalam perhitungan skor
pemotongan yang optimal, yang memperhitungkan probabilitas sebelum melalui penggunaan
ukuran kelompok. Rumus dasar untuk menghitung skor pemotongan yang optimal antara dua
kelompok adalah:

Dengan ukuran kelompok yang tidak sama, skor pemotongan optimal untuk fungsi
diskriminan sekarang rata-rata tertimbang dari kelompokcentroid. Skor pemotongan
tertimbang terhadap kelompok yang lebih kecil, diharapkan membuat klasifikasi yang lebih
baik dari kelompok yang lebih besar.

21

Jika kelompok ditentukan untuk menjadi ukuran yang sama, maka skor pemotongan
optimum akan setengah jalan antara centroid dua kelompok dan menjadi hanya rata-rata dari
dua centroid:

Kedua rumus untuk menghitung skor pemotongan optimal menganggap bahwa distribusi
adalah normal dan struktur dispersi kelompok yang dikenal.
Konsep skor pemotongan optimal untuk kelompok yang sama dan tidak sama masingmasing diilustrasikan pada Gambar 7 dan 8. Hal ini jelas bahwa jika kelompok A jauh lebih
kecil dari kelompok B, skor pemotongan yang optimal akan lebih dekat dengan pusat massa
dari kelompok A daripada ke pusat massa dari kelompok B. Jika skor pemotongan
unweighted digunakan, tidak ada benda-benda di grup A akan kesalahan klasifikasi, tetapi
sebagian besar dari mereka dalam kelompok B akan kesalahan klasifikasi.
Gambar 7. Optimal Cutting Scores with Equal Sample Sizes

Costs of Misclassification

22

Dalam prakteknya, ketika menghitung skor pemotongan, tidak perlu untuk


memasukkan pengukuran variabel baku untuk setiap individu ke dalam fungsi diskriminan
dan untuk mendapatkan skor diskriminan untuk setiap orang untuk digunakan dalam
menghitung Za dan Zb. Program komputer akan memberikan skor diskriminan serta Za dan
Zb sebagai output biasa. Ketika peneliti memiliki centroid kelompok dan ukuran sampel, skor
pemotongan optimal diperoleh hanya dengan mengganti nilai-nilai ke dalam rumus yang
tepat.
Gambar 8. Optimal Cutting Scores with Unequal Sample Sizes

Membangun Klasifikasi Matriks


Untuk memvalidasi fungsi diskriminan melalui penggunaan matriks klasifikasi,
sampel harus secara acak dibagi menjadi dua kelompok. Salah satu kelompok (sampel
analisis) digunakan untuk menghitung fungsi diskriminan. Kelompok lain (ketidaksepakatan
atau sampel validasi) disimpan untuk digunakan dalam mengembangkan klasifikasi matriks.
Klasifikasi dari setiap observasi dapat dicapai melalui pendekatan yang dibahas pada
klasifikasi sebelumnya. Untuk pendekatan Fisher, observasi diklasifikasikan ke dalam
kelompok dengan skor terbesar dari fungsi klasifikasi. Bila menggunakan skor diskriminan
dan skor pemotongan optimal, prosedurnya adalah sebagai berikut:

Hasil dari prosedur klasifikasi disajikan dalam bentuk matriks, seperti yang
ditunjukkan pada Tabel 4. Entri pada diagonal matriks tersebut merupakan jumlah individu
23

yang diklasifikasikan dengan benar. Nomor dari diagonal mewakili klasifikasi yang salah.
Entri di bawah kolom berlabel "Actual Group Size" merupakan jumlah individu sebenarnya
di masing-masing pada dua kelompok. Entri di bagian bawah kolom merupakan jumlah
individu yang ditugaskan untuk kelompok dengan fungsi diskriminasi. Persentase
diklasifikasikan dengan benar untuk setiap kelompok ditampilkan di sisi kanan matrix, dan
persentase keseluruhan diklasifikasikan dengan benar, juga dikenal sebagai rasio hit,
ditampilkan di bagian bawah.
Tabel 4. Klasifikasi Matriks Analisis Diskrimina Dua Grup

Dalam contoh ini, jumlah orang yang ditugaskan untuk kelompok 1 adalah 22,
sedangkan 3 anggota kelompok 1 yang tidak benar ditugaskan untuk kelompok 2. Demikian
pula, jumlah klasifikasi yang benar untuk kelompok 2 adalah 20, dan jumlah tugas yang salah
ke grup 1 adalah 5. Jadi, persentase akurasi klasifikasi fungsi diskriminan untuk kelompok
yang sebenarnya 1 dan 2 adalah masing-masing 88 dan 80 persen. Akurasi klasifikasi
keseluruhan (rasio hit) adalah 84 persen.
Salah satu topik akhir mengenai prosedur klasifikasi adalah uji t yang tersedia untuk
menentukan tingkat signifikansi untuk akurasi klasifikasi. Rumus untuk analisis dua
kelompok (ukuran sampel yang sama) adalah

Dimana :

24

Formula ini dapat diadaptasi untuk digunakan dengan lebih kelompok dan ukuran sampel
yang tidak sama.
Menetapkan Standar Perbandingan untuk Ratio Hit
Seperti disebutkan sebelumnya, akurasi prediksi dari fungsi diskriminan diukur
dengan rasio hit yang diperoleh dari matriks klasifikasi. Peneliti mungkin bertanya, Apa yang
dianggap tingkat yang dapat diterima dari akurasi prediktif untuk fungsi diskriminan?
Misalnya, 60 persen tingkat yang dapat diterima, atau harus berharap untuk mendapatkan 80
sampai 90 persen akurasi prediksi? untuk menjawab pertanyaan ini, peneliti harus terlebih
dahulu menentukan persentase yang bisa diklasifikasikan dengan benar secara kebetulan
(tanpa bantuan fungsi diskriminan).
Standar Perbandingan Ratio Hit untuk Ukuran Equal Group. Ketika ukuran sampel dari
kelompok sama, penentuan klasifikasi kesempatan agak sederhana; diperoleh dengan
membagi 1 dengan jumlah kelompok. Rumusnya adalah:

Misalnya, untuk dua kelompok fungsi probabilitas kesempatan akan .50 ; untuk fungsi tiga
kelompok probabilitas kesempatan akan .33 ; dan seterusnya.

Standar Perbandingan Ratio Hit untuk Ukuran Grup yang Tidak Merata.
Penentuanklasifikasi kesempatan untuk situasi di mana ukuran kelompok tidak sama agak
lebih terlibat. Mari kita asumsikan bahwa kita memiliki sampel total 200 observasi dibagi
menjadi ketidaksepakatan dan analisis sampel dari 100 observasi. Dalam sampel
ketidaksepakatan, 75 mata pelajaran milik satu kelompok dan 25 yang lainnya. Kami akan
memeriksa cara yang mungkin di mana kita dapat membangun standar untuk perbandingan
dan apa yang mewakili masing-masing.
* Yang dimaksud dengan kriteria kesempatan maksimal, kita sewenang-wenang dapat
menetapkan semua mata pelajaran untuk kelompok terbesar. Kriteria kesempatan yang
maksimal sebaiknya digunakan ketika satu-satunya tujuan dari analisis diskriminan adalah
untuk memaksimalkan persentase diklasifikasikan dengan benar. Itu juga merupakan standar
yang paling konservatif karena akan menghasilkan standar tertinggi dari perbandingan.
25

Namun, kita hanya fokus pada memaksimalkan persentase yang diklasifikasikan. Biasanya
peneliti menggunakan analisis diskriminan untuk

mengidentifikasi anggota dari semua

kelompok. Dalam kasus dimana ukuran sampel yang tidak sama dan peneliti ingin
mengklasifikasikan anggota dari semua kelompok, fungsi diskriminan menentang peluang
dengan mengelompokkan subjek dalam kelompok yang lebih kecil.Kriteria kesempatan
maksimum tidak mengambil fakta ini.
Dalam contoh sederhana, dari sampel dengan dua kelompok (75 dan 25 orang), metode ini
akan digunakan untuk menetapkan 75 persen akurasi dari tiap klasifikasi, yang akan dicapai
dengan mengklasifikasikan orang ke dalam kelompok terbesar tanpa bantuan fungsi
diskriminan. Dapat disimpulkan bahwa memang fungsi diskriminan mencapai akurasi
klasifikasi yang lebih tinggi dari 75 persen, itu harus diabaikan karena belum membantu
untuk meningkatkan akurasi prediksi, kita bisa mencapai tanpa menggunakan analisis
diskriminan sama sekali.
Ketika ukuran kelompok tidak sama dan peneliti ingin mengidentifikasi anggota semua
kelompok, bukan hanya kelompok terbesar, kriteria kesempatan proporsional dianggap
pilihan yang paling tepat. Rumus untuk kriteria ini adalah :

Dimana :

Menggunakan ukuran kelompok dari contoh kita sebelumnya (75 dan 25), kita melihat bahwa
kriteria kesempatan proporsional akan 62,5 persen [0,75 2 + (1.0 -0.75)2 = 0,625]
dibandingkan dengan 75 persen. Oleh karena itu, dalam hal ini, akurasi prediksi yang
sebenarnya dari 75 persen mungkin dapat diterima karena berada di atas kriteria kesempatan
proporsional 62,5 persen.

Membandingkan Hit Ratio dengan Standard


Jika persentase klasifikasi yang benar secara signifikan lebih besar dari yang
diharapkan secara kebetulan, peneliti dapat melanjutkan dalam menafsirkan fungsi
diskriminan dan profil kelompok. Namun, jika akurasi klasifikasi tidak lebih besar daripada
yang bisa diharapkan secara kebetulan, perbedaan apapun yang muncul sedikit pantas atau

26

tidak ada interpretasi; yaitu, perbedaan profil skor tidak akan memberikan informasi yang
berarti untuk mengidentifikasi anggota kelompok.
Ketepatan klasifikasi harus setidaknya seperempat lebih besar dari yang dicapai
secara kebetulan.Misalnya, jika akurasi kesempatan adalah 50 persen, akurasi klasifikasi
harus 62,5 persen (62,5% = 1,25 x 50%). Jika akurasi kesempatan adalah 30 persen, akurasi
klasifikasi harus 37,5 persen (37,5% = 1,25 x 30%).
Kriteria ini hanya menyediakan perkiraan kasar dari tingkat akurasi prediksi. Kriteria
ini mudah digunakan untuk menerapkan dengan kelompok-kelompok dengan ukuran yang
sama. Dengan kelompok ukuran yang tidak sama, batas atas tercapai ketika model
kesempatan maksimum digunakan untuk menentukan akurasi kesempatan.Peneliti harus
mengevaluasi rasio hit masing-masing kelompok dan menilai apakah analisis diskriminan
memberikan tingkat yang memadai akurasi prediksi baik di tingkat keseluruhan sebagai
untuk setiap kelompok.
Statistik Berdasarkan Ukuran Klasifikasi Akurasi Relatif Sampai Kesempatan.
Presss Q Statisticadalah sebuah uji statistik untuk kekuatan diskriminatif dari
matriks klasifikasi bila dibandingkan dengan model peluang. Ukuran sederhana ini
membandingkan jumlah klasifikasi yang benar dengan total ukuran sampel dan jumlah
kelompok. Nilai dihitung kemudian dibandingkan dengan nilai kritis (nilai chi-square 1 untuk
derajat kebebasan pada tingkat kepercayaan yang diinginkan). Jika melebihi nilai kritis ini,
maka matriks klasifikasi dapat dianggap lebih baik dari statistik kesempatan. Q statistik
dihitung dengan rumus berikut :

Dimana :

Misalnya Tabel 4, Q statistik akan didasarkan pada sampel total N = 50, n = 42


observasi diklasifikasikan dengan benar, dan K = 2 kelompok. Statistik dihitung akan
menjadi:

Tes sederhana ini sensitif terhadap ukuran sampel; sampel besar lebih mungkin untuk
menunjukkan signifikansi dari ukuran sampel kecil dari tingkat klasifikasi yang sama.

27

Sebagai contoh, jika ukuran sampel meningkat menjadi 100 pada contoh dan tingkat
klasifikasi tetap pada 84 persen, Q statistik meningkat menjadi 46,24. Jika ukuran sampel
meningkat menjadi 200, namun tetap memiliki tingkat klasifikasi 84 persen, Q statistik
meningkatkan lagi menjadi 92,48. Tetapi jika ukuran sampel hanya 20 dan tingkat kesalahan
klasifikasi masih 84 persen (17 prediksi yang benar), Q statistik hanya akan 9,8. Dengan
demikian, memeriksa Q statistik dalam peningkatanukuran sampel akan meningkatkan Q
statistik bahkan untuk tingkat klasifikasi yang sama secara keseluruhan.
Diagnostik Casewise
Sasaranakhir menilai model fit adalah untuk menguji hasil prediksi atas dasar kasus
per kasus. Serupa dengan analisis residual regresi ganda, tujuannya adalah untuk memahami
(1) kesalahan klasifikasi dan (2) tidak mewakili anggota kelompok yang tersisa. Meskipun
matriks klasifikasi memberikan akurasi klasifikasi secara keseluruhan, itu tidak detail hasil
kasus individu. Bahkan jika kita dapat menunjukkan kasus-kasus yang benar dari salah
diklasifikasikan, kita masih membutuhkan ukuran kesamaan pengamatan terhadap sisa
kelompok.
Kesalahan klasifikasi KASUS INDIVIDU.
Dalam analisis diskriminan, masalah ini sederhana karena observasi merangkum baik benar
atau salah diklasifikasikan. Semua program komputer memberikan informasi yang
mengidentifikasi kasus yang mengalami kesalahan klasifikasi dan kelompok yang mereka
masukkan dalam kesalahan klasifikasi. peneliti dapat mengidentifikasi tidak hanya kasuskasus dengan kesalahan klasifikasi, tetapi representasi langsung dari jenis kesalahan
kesalahan klasifikasi.
Profil dari Variabel Independen.
Memeriksa kasus ini pada variabel independen dapat mengidentifikasi tren nonlinear
atau hubungan lain yang patut atau atribut yang menyebabkan kesalahan klasifikasi tersebut.
Beberapa teknik yang tepat khususnya dalam analisis diskriminan:
Sebuah representasi grafis dari pengamatan pada pendekatan yang paling sederhana dan
efektif untuk memeriksa karakteristik pengamatan, terutama pengamatan kesalahan
klasifikasi. Pendekatan yang paling umum adalah untuk plot pengamatan berdasarkan
skor Z diskriminan mereka dan menggambarkan tumpang tindih antara kelompokkelompok dan kasus kesalahan klasifikasi. Jika dua atau lebih fungsi yang
mempertahankan poin pemotongan yang optimal dapat digambarkan untuk memberikan
apa yang dikenal sebagai peta territori 1 menggambarkan daerah sesuai dengan masingmasing kelompok.
28

Merencanakan pengamatan individu bersama dengan centroid kelompok, seperti yang


dibahas sebelumnya, menunjukkan tidak hanya karakteristik kelompok umum
digambarkan dalam centroid, tetapi juga variasi dalam anggota kelompok.
Sebuah penilaian empiris langsung dari kesamaan pengamatan terhadap anggota
kelompok lainnya dapat dilakukan dengan mengevaluasi jarak Mahalanobis D2 observasi
ke centroid kelompok. Berdasarkan set variabel independen, pengamatan lebih dekat ke
pusat massa memiliki lebih kecil Mahalanobis D2 dan diasumsikan lebih mewakili
kelompok daripada mereka lebih jauh.
Ukuran empiris harus dikombinasikan dengan analisis grafis, namun, meskipun nilai
Mahalanobis D2 besar tidak menunjukkan pengamatan yang cukup berbeda dari centroid
kelompok, itu tidak selalu menunjukkan kesalahan klasifikasi. Misalnya, dalam situasi
dua kelompok, anggota kelompok A dapat memiliki besar jarak pada Mahalanobis D2,ini
menunjukkan kurang perwakilan kelompok. Namun, jika jarak yang jauh dari pusat
massa kelompok B, maka akan benar-benar meningkatkan kesempatan klasifikasi yang
benar, meskipun kurang perwakilan kelompok. Sebuah jarak yang lebih kecil yang
menempatkan sebuah pengamatan antara dua centroid mungkin akan memiliki
kemungkinan lebih rendah dari klasifikasi yang benar, meskipun itu lebih dekat ke pusat
massa kelompoknya daripada situasi sebelumnya.
Meskipun tidak ada analisis spesifik yang ditetapkan, seperti yang ditemukan dalam regresi
berganda, peneliti didorong untuk mengevaluasi ases kesalahan klasifikasi ini dari beberapa
perspektif dalam upaya untuk mengungkap fitur unik yang mereka pegang dibandingkan
dengan anggota kelompok mereka yang lain.
Tahap 5 : Interpretasi Hasil
Jika fungsi diskriminan signifikan secara statistik dan akurasi klasifikasi diterima,
peneliti harus fokus pada pembuatan penafsiran substantif temuan. Proses ini melibatkan
pada pemeriksaan fungsi diskriminan untuk menentukan kepentingan relatif dari masingmasing variabel independen antar kelompok. Tiga metode penentuan kepentingan relatif telah
diusulkan:
1. bobot diskriminan yang ter-standardized
2. beban diskriminan (korelasi struktural)
3. nilai F parsial
Bobot diskriminan
Pendekatan tradisional untuk menafsirkan fungsi diskriminan adalah dengan meneliti
tanda dan besarnya bobot diskriminan standar (juga disebut sebagai koefisien diskriminan),
masing-masing variabel ditugaskan dalam menghitung fungsi diskriminan. Ketika tanda
diabaikan, masing-masing berat menunjukkan kontribusi relatif dari variabel yang terkait
29

dengan fungsi itu. Variabel bebas dengan bobot yang relatif lebih besar lebih berkontribusi
untuk kekuatan diskriminatif dari fungsi daripada variabel dengan bobot yang lebih kecil.
Tanda hanya menunjukkan kontibusi variabel baik positif atau kontribusi negatif.
Penafsiran bobot diskriminan analog dengan penafsiran bobot beta dalam analisis
regresi dan karena itu tunduk pada kritik yang sama. Misalnya, berat badan kecil mungkin
menunjukkan dengan baik bahwa variabel yang sesuai adalah tidak relevan dalam
menentukan hubungan atau yang telah parsial dari hubungan karena tingginya tingkat
multikolinearitas. Masalah lain dengan penggunaan bobot diskriminan adalah bahwa mereka
tunduk pada ketidakstabilan yang cukup.
Beban diskriminan
Beban diskriminan disebut sebagai korelasi struktur, sering digunakan sebagai dasar
untuk interpretasi karena kekurangan dalam memanfaatkan bobot. Mengukur korelasi linear
sederhana antara masing-masing variabel independen dan fungsi diskriminan, loadings
diskriminan mencerminkan varians bahwa variabel independen berbagi dengan fungsi
diskriminan. Dalam hal itu mereka dapat ditafsirkan seperti beban faktor dalam menilai
kontribusi relatif dari masing-masing variabel independen untuk fungsi diskriminan.
Salah satu karakteristik unik dari beban adalah bahwa beban dapat dihitung untuk
semua variabel, apakah mereka digunakan dalam estimasi fungsi diskriminan atau tidak.
Aspek ini sangat berguna ketika prosedur estimasi bertahap digunakan dengan beberapa
variabel yang tidak termasuk dalam fungsi diskriminan. Beban diskriminan (seperti bobot)
mungkin akan dikenakan ketidakstabilan. Beban dianggap relatif lebih valid dari bobot
sebagai sarana intepreting kekuatan diskriminatif variabel independen karena sifat
korelasional mereka.
Nilai F parsial
Seperti yang dibahas sebelumnya, dua komputasi pendekatan-simultan dan bertahapdapat dimanfaatkan untuk menurunkan fungsi diskriminan. Ketika metode stepwise dipilih,
sarana tambahan menafsirkan kekuatan diskriminatif relatif dari variabel independen tersedia
melalui penggunaan nilai F parsial, itu dilakukan dengan memeriksa ukuran absolut dari
signifikansi nilai F dan peringkat mereka. Nilai F besar menunjukkan kekuatan diskriminatif
yang lebih besar. Dalam prakteknya, peringkat menggunakan pendekatan nilai F adalah sama
dengan peringkat yang diperoleh dari menggunakan bobot diskriminan, tetapi nilai-nilai F
menunjukkan tingkat terkait signifikansi untuk masing-masing variabel.
Interpretasi Dua atau Lebih Fungsi

30

ROTASI DARI FUNGSI DISKRIMINAN Setelah fungsi diskriminan dikembangkan,


mereka dapat diputar untuk mendistribusikan varians. Pada dasarnya, rotasi mempertahankan
struktur asli dan keandalan solusi diskriminan sementara membuat fungsi lebih mudah untuk
menafsirkan secara substantif. Dalam kebanyakan kasus, rotasi varimax digunakan sebagai
dasar untuk rotasi.
POTENSI INDEX Sebelumnya, kita bahas dengan menggunakan bobot standar atau
beban diskriminan sebagai ukuran kontribusi variabel untuk fungsi diskriminan ketika dua
atau lebih fungsi muncul. Namun, suatu ukuran gabungan atau ringkasan berguna dalam
menggambarkan kontribusi dari variabel di semua fungsi yang signifikan. Potensi Index
adalah ukuran relatif antara semua variabel dan merupakan indikasi dari kekuatan
diskriminatif ari masing-masing variabel ini [14], termasuk juga kontribusi dari variabel ke
fungsi diskriminan (diskriminan loading) dan kontribusi relatif dari fungsi untuk solusi secara
keseluruhan (ukuran relatif antara fungsi berdasarkan nilai eigen). hanya komposit jumlah
dari indeks potensi individu di semua fungsi diskriminan yang signifikan. Interpretasi dari
ukuran gabungan terbatas, namun, dengan kaki yang berguna hanya dalam menggambarkan
posisi relatif (seperti urutan peringkat) dari masing-masing variabel, dan biaya mutlak tidak
memiliki arti sebenarnya. Indeks potensi dihitung dengan proses dua langkah:
Langkah 1: Hitung nilai potensi dari setiap variabel untuk setiap fungsi signifikan. Pada
langkah pertama, kekuatan diskriminatif dari variabel, yang diwakili oleh nilai kuadrat
pemuatan diskriminan unrotated, adalah "tertimbang" oleh kontribusi relatif dari fungsi
diskriminan untuk solusi secara keseluruhan. Nilai eigen relating untuk masing-masing fungsi
diskriminan signifikan hanya dihitung sebagai:

Nilai potensi masing-masing variabel i pada fungsi j:

Langkah 2: Hitung indeks potensi komposit di semua fungsi yang signifikan. Setelah nilai
potensi telah dihitung untuk setiap fungsi, indeks potensi komposit untuk masing-masing
variabel dihitung sebagai:

31

Indeks potensi sekarang merupakan efek diskriminatif total variabel di semua fungsi
diskriminan signifikan. Hanya ukuran relatif, bagaimanapun, dan nilai mutlak memiliki
makna substantif. Contoh menghitung indeks potensi disediakan dalam contoh kelompok tiga
untuk analisis diskriminan.
Tampilan grafis dari Diskriminan Skor dan Beban
Untuk menggambarkan perbedaan kelompok pada variabel prediktor, peneliti dapat
menggunakan dua pendekatan yang berbeda untuk tampilan grafis, yaitu:
1. Teritorial Peta. Metode grafis yang paling umum adalah peta wilayah, di mana masingmasing pengamatan diplot dalam tampilan grafis berdasarkan skor fungsi Z diskriminan
dari pengamatan. Sebagai contoh, asumsikan bahwa analisis diskriminan tiga kelompok
memiliki dua signifikan fungsi diskriminan. Sebuah peta wilayah dibuat dengan memplot
nilai Z diskriminan setiap pengamatan untuk fungsi diskriminan pertama pada sumbu X
dan skor untuk fungsi diskriminan kedua pada sumbu Y.
Dengan demikian, territorial peta menyediakan beberapa perspektif tentang analisis:
Merencanakan anggota masing-masing kelompok dengan simbol yang berbeda
memungkinkan untuk penggambaran mudah dari kekhasan kelompok serta tumpang tindih
dengan kelompok lainnya.
Merencanakan centroid setiap kelompok dengan menyediakan sarana untuk menilai
setiap anggota kelompok relatif massa kelompoknya. Prosedur ini sangat berguna ketika
menilai apakah tindakan Mahalanobis D2 yang besar bisa menyebabkan kesalahan
klasifikasi.
Garis mewakili nilai pemotongan juga bisa diplot, yang menunjukkan batas-batas
epicting rentang skor diskriminan yang diprediksi dalam setiap kelompok. Anggota setiap
kelompok yang sakit ada di luar batas-batas kesalahan klasifikasi.
2. Vektor Plot diskriminan muat. Pendekatan grafis sederhana untuk menggambarkan beban
diskriminan adalah untuk merencanakan beban diputar atau unrotated sebenarnya pada
grafik. Pendekatan yang disukai akan merencanakan beban diputar. Mirip dengan
penggambaran grafis dari faktor loadings, metode ini menggambarkan sejauh mana masingmasing variabel berhubungan dengan masing-masing fungsi diskriminan.Bahkan lebih akurat
pendekatan, bagaimanapun, perencanaan beban serta vektor menggambarkan setiap bongkar
untuk kelompok massa. Sebuah vektor hanyalah garis lurus yang ditarik dari asalnya
(tengah) dari grafik untuk koordinat beban diskriminan variabel tertentu atau centroid
kelompok. Dengan representasi vektor membentang, panjang setiap vektor menjadi indikasi

32

kepentingan relatif dari setiap variabel dalam membedakan antara kelompok-kelompok.


Prosedur merencanakan hasil dalam tiga langkah:
1. Memilih variabel variabel. Semua variabel, baik yang termasuk dalam model signifikan
atau tidak, mungkin akan diplot sebagai vektor. Dengan cara ini, pentingnya variabel
collinear yang tidak disertakan, seperti dalam larutan bertahap, masih bisa digambarkan.
2. Peregangan vektor: beban diskriminan Setiap variabel yang membentang dengan
mengalikan pemuatan diskriminan (sebaiknya setelah rotasi) oleh nilai F univariat masingmasing. Kami mencatat bahwa vektor menunjuk ke arah kelompok memiliki rata-rata
tertinggi pada prediktor masing dan jauh dari dia kelompok memiliki skor terendah rata-rata.
3. Merencanakan centroid kelompok: The centroid kelompok juga membentang dalam
prosedur ini dengan mengalikannya dengan nilai F perkiraan yang terkait dengan masingmasing fungsi diskriminan. Jika beban yang membentang, centroid harus meregang juga
untuk plot mereka secara akurat pada grafik yang sama. Nilai-nilai F perkiraan untuk setiap
fungsi diskriminan diperoleh dengan rumus berikut:

Dimana :
Sebagai contoh, asumsikan bahwa sampel 50 pengamatan dibagi menjadi tiga kelompok.
Multiplier setiap eigen akan (50-3): (3 - 1) = 23,5
Ketika selesai, peneliti memiliki gambaran dari pengelompokan variabel pada setiap
fungsi diskriminan, besarnya pentingnya setiap variabel (diwakili oleh panjang setiap vektor),
dan profil masing-masing centroid kelompok (ditunjukkan oleh kedekatan vektor). Meskipun
prosedur ini harus dilakukan secara manual dalam kebanyakan kasus, ia menyediakan
gambaran lengkap dari kedua beban diskriminan dan centroid kelompok. Untuk rincian lebih
lanjut tentang prosedur ini, lihat Dillon dan Goldstein.
Tahap 6: Validasi Hasil
Tahap akhir dari analisis diskriminan melibatkan validasi hasil diskriminan untuk
memberikan jaminan bahwa hasil memiliki validitas eksternal maupun internal. Dengan
kecenderungan analisis diskriminan untuk mengembang rasio hit jika dievaluasi hanya pada
sampel analisis,. Selain memvalidasi rasio hit, peneliti harus menggunakan identifikasi
terhadap grup untuk memastikan bahwa cara kelompok merupakan indikator yang valid dari
model konseptual yang digunakan dalam memilih variabel independen.

33

Prosedur validasi
Validasi merupakan langkah penting dalam analisis diskriminan karena berkali-kali, terutama
dengan sampel yang lebih kecil, hasilnya bisa kurang tergeneralisasi (validitas eksternal).
Pendekatan yang paling umum untuk membangun validitas eksternal adalah penilaian rasio
hit. Validasi dapat terjadi baik dengan sampel terpisah (ketidaksepakatan sampel) atau
memanfaatkan prosedur yang berulang dalam memproses sampel estimasi.
Memanfaatkan Sampel
Validasi rasio hit sering dilakukan dengan menciptakan sampel ketidaksepakatan, juga
disebut sebagai sampel validasi. Tujuan dari menggunakan sampel ketidaksepakatan untuk
tujuan validasi adalah melihat seberapa baik fungsi diskriminan bekerja pada sampel
pengamatan yang tidak digunakan untuk menurunkan fungsi diskriminan. Proses ini
melibatkan pengembangan fungsi diskriminan dengan sampel analisis dan kemudian
menerapkannya pada ketidaksepakatan sampel.
Lintas Validasi
Pendekatan cross-validasi untuk menilai validitas eksternal dilakukan dengan beberapa subset
dari total sampel. Cross-validasi didasarkan pada prinsip "meninggalkan-satu-out".
Penggunaan yang paling umum dari metode ini adalah untuk memperkirakan k - 1.
Subsamples, menghilangkan satu pengamatan pada suatu waktu dari sampel kasus k. Fungsi
diskriminan dihitung untuk setiap sub-sampel dan kemudian kelompok aanggota prediksi
pengamatan dihilangkan dibuat dengan fungsi diskriminan diperkirakan pada kasus yang
tersisa. Setelah semua prediksi keanggotaan kelompok telah dibuat, satu per satu, matriks
klasifikasi dibangun dan rasio hit dihitung. Cross-validasi cukup sensitif terhadap ukuran
sampel yang kecil. Pedoman menyarankan bahwa itu digunakan hanya ketika ukuran
kelompok terkecil setidaknya tiga kali jumlah variabel prediksi, dan kebanyakan peneliti
menyarankan rasio 5: 1. Namun, cross-validasi mungkin merupakan satu-satunya pendekatan
validasi dalam kasus di mana sampel asli terlalu kecil untuk membagi ke dalam analisis dan
ketidaksepakatan sampel tapi masih melebihi batasan yang sudah dibahas.
Perbedaan Profil Grup
Teknik validasi lain adalah untuk profil kelompok pada variabel independen dalam
memastikan korespondensi mereka dengan basis konseptual yang digunakan pada formulasi
model. Setelah peneliti mengidentifikasi variabel independen yang membuat kontribusi
terbesar dalam membedakan antara kelompok, langkah berikutnya adalah membuat
karakteristik kelompok berdasarkan kelompok berarti. Profil ini memungkinkan peneliti
untuk memahami karakter masing-masing kelompok sesuai dengan variabel prediktor.
34

35

Vous aimerez peut-être aussi