Académique Documents
Professionnel Documents
Culture Documents
ANALISIS CLUSTER
Dosen Pengampu:
Disusun Oleh:
JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI MAULANA MALIK IBRAHIM
MALANG
2017
DAFTAR ISI
HALAMAN JUDUL
DAFTAR ISI .......................................................................................................... ii
BAB I PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang .............................................................................................. 1
1.2 Rumusan Masalah ......................................................................................... 1
1.3 Tujuan Penelitian .......................................................................................... 1
BAB II KAJIAN PUSTAKA ................................................................................ 2
2.1 Analisis Cluster ............................................................................................. 2
2.2 Tujuan Analisis Cluster ................................................................................. 3
2.3 Proses Analisis Cluster .................................................................................. 3
2.4 Asumsi pada Analisis Cluster ....................................................................... 5
2.5 Data Analisis Cluster..................................................................................... 5
BAB III METODE PENELITIAN ...................................................................... 7
3.1 Langkah-langkah Pengujian .......................................................................... 7
BAB IV PEMBAHASAN.................................................................................... 10
4.1 Interpretasi Hasil Output ............................................................................. 10
DAFTAR PUSTAKA .......................................................................................... 14
ii
BAB I
PENDAHULUAN
Pada ilmu statistika, apabila variabel yang digunakan lebih dari dua, maka
akan semakin rumit untuk melakukan analisis statistik. Salah satu metode yang
dapat mengatasi hal tersebut adalah analisis multivariat. Analisis multivariat
merupakan metode statistik yang memungkinkan melakukan penelitian terhadap
lebih dari dua variabel. Salah satu teknik analisis multivariat yang dapat
digunakan untuk memahami dan menjelaskan seperangkat variabel adalah analisis
cluster. Analisis cluster adalah salah satu tenik multivariat yang bertujuan
mengklasifikasi suatu objek-objek ke dalam suatu kelompok-kelompok yang
berbeda antara kelompok satu dengan yang lainnya. Objek-objek yang telah
diklasifikasikan dalam satu cluster merupakan objek-objek yang memiliki
kedekatan jarak relatif sama dengan objek lainnya (Narimawati, 2008).
Berdasarkan latar belakang di atas, maka analisis cluster ini perlu untuk
dipelajari dan dikaji baik secara teoritis maupun secara praktik agar penulis
maupun pembaca lebih memahami analisis cluster tersebut.
1.2 Rumusan Masalah
1
BAB II
KAJIAN PUSTAKA
berupa produk, benda, serta orang. Objek tersebut akan diklasifikasikan ke dalam
satu atau lebih cluster/kelompok sehingga objek-objek yang berada dalam satu
Analisis cluster mengklasifikasi objek sehingga setiap objek yang memiliki sifat
yang mirip atau paling dekat persamaannya akan mengelompok dalam satu cluster
atau kelompok yang sama. Maka cluster yang baik adalah cluster yang
mempunyai:
reduksi data, stratifikasi sampling, perediksi keadaan objek. Hasil dari analisis
cluster dipengaruhi oleh: objek yang diclusterkan, peubah yang diamati, ukuran
kemiripan (jarak yang dipakai), skala ukuran yang dipakai, serta metode
2
3
dalam satu atau lebih cluster (kelompok) sehingga objek-objek yang berada dalam
Setelah cluster terbentuk, entah dengan metode hirarki atau non-hirarki, langkah
selanjutnya adalah melakukan interprestasi terhadap cluster yang terbentuk, yang
pada intinya memberi nama spesifik untuk menggambarkan isi cluster. Misalnya,
kelompok konsumen yang memperhatikan lingkungan sekitar sebelum membeli
sebuah rumah bisa dinamai cluster lingkungan.
Melakukan validasi dan profiling cluster. Cluster yang terbentuk kemudian diuji
apakah hasil tersebut valid. Kemudian dilakukan proses profiling untuk
menjelaskan karakteristik setiap cluster berdasarkan profil tertentu (seperti usia
konsumen pembeli rumah, tingkat penghasilannya dan sebagainya). Analisis
cluster agak bersifat subjektif dalam penentuan penyelesaian cluster yang
optimal, sehingga peneliti seharusnya memberikan perhatian yang besar mengenai
validasi dan jaminan tingkat signifikansi pada penyelesaian akhir dari cluster.
Meskipun tidak ada metode untuk menjamin validitas dan tingkat signifikansi ,
4
Validasi termasuk usaha yang dilakukan oleh peneliti untuk menjamin bahwa
hasil cluster adalah representatif terhadap populasi secara umum, dan dengan
demikian dapat digeneralisasi untuk objek yang lain dan stabil untuk waktu
tertentu. Pendekatan langsung dalam hal ini adalah dengan analisis sample secara
terpisah kemudian membandingkan antara hasil cluster dengan perkiraan masing-
masing cluster. Pendekatan ini sering tidak praktis, karena adanya keterbatasan
waktu dan biaya atau ketidaktersediaan objek untuk perkalian analisis cluster.
Dalam hal ini pendekatan tyang biasa digunakan adalah dengan membagi sample
menjadi dua kelompok. Masing-masing dianalisis cluster secara terpisah,
kemudian hasinya dibandingkan.
untuk menjelaskan bagaimana mereka bisa berbeda secara relevan pada tiap
cluster. Meskipun secara teori tidak masuk akal (rasional) dalam perbedaan silang
cluster, akan tetapi hal ini diperlukan untuk memprediksi validasi taksiran,
Untuk melakukan proses analisis cluster ini, ada asumsi yang harus
terpenuhi, yaitu:
2. Multikolinieritas.
Apabila semua asumsi tersebut dipenuhi maka data layak untuk dianalisis
Berikut ini adalah data yang dipakai peneliti untuk dianalisis dengan
kabupaten/kota Jawa Timur, yang bersumber dari Badan Pusat Statistik (BPS)
Provinsi Jawa Timur. Unit observasi penelitian ini adalah 29 kabupaten dan 9 kota
X6: persentase Angka Partisipasi Sekolah (APS) kelompok usia 16-18 tahun.
X7: persentase Angka Partisipasi Kasar (APK) kelompok usia 16-18 tahun.
6
X8: persentase Angka Partisipasi Murni (APM) kelomok usia 16-18 tahun.
X9: persentase angka penduduk 10 tahun ke atas yang tidak pernah sekolah.
METODE PENELITIAN
Masukkan data pada Minitab kemudian pilih menu Stat pilih Multivariate
Klik variabel sehingga masuk pada kotak variables of distance matrix pilih
7
8
Kemudian pilih stat pilih multivariate pilih cluster variabels akan muncul
sebagai berikut:
PEMBAHASAN
Output 1
Metode ini digunakan untuk melihat jarak atau kesamaan antara pasangan-
pasangan objek dan kelompok yang dibentuk dari kesatuan individu dengan
setiap kelompok.
10
11
Sumenep.
Pasuruan.
Output 2
didasarkan pada rata-rata jarak jauh dari seluruh objek pada suatu cluster dengan
seluruh objek pada cluster lain. Dari tabel dendrogram di atas diperoleh 5
Sumenep
Output 3
Metode ini menghitung jarak antar dua kelompok yang terbentuk dengan
Sumenep.
14