Analisis Cluster

ANALISIS DATA
ANALISIS CLUSTER
Dosen Pengampu:
Farida Suharleni, S.Si, M.Si

Ria Dhea Layla N.K, S.Si, M.Si
Disusun Oleh:
Kamalia Rizki R (13610082)

Alvi Nur Z. M (13610091)
Nila Istighfarin (13610103)
JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI MAULANA MALIK IBRAHIM
MALANG
2017
DAFTAR ISI
HALAMAN JUDUL
DAFTAR ISI .......................................................................................................... ii
BAB I PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang .............................................................................................. 1
1.2 Rumusan Masalah ......................................................................................... 1
1.3 Tujuan Penelitian .......................................................................................... 1
BAB II KAJIAN PUSTAKA ................................................................................ 2
2.1 Analisis Cluster ............................................................................................. 2
2.2 Tujuan Analisis Cluster ................................................................................. 3
2.3 Proses Analisis Cluster .................................................................................. 3
2.4 Asumsi pada Analisis Cluster ....................................................................... 5
2.5 Data Analisis Cluster..................................................................................... 5
BAB III METODE PENELITIAN ...................................................................... 7
3.1 Langkah-langkah Pengujian .......................................................................... 7
BAB IV PEMBAHASAN.................................................................................... 10
4.1 Interpretasi Hasil Output ............................................................................. 10
DAFTAR PUSTAKA .......................................................................................... 14
ii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Pada ilmu statistika, apabila variabel yang digunakan lebih dari dua, maka
akan semakin rumit untuk melakukan analisis statistik. Salah satu metode yang
dapat mengatasi hal tersebut adalah analisis multivariat. Analisis multivariat
merupakan metode statistik yang memungkinkan melakukan penelitian terhadap
lebih dari dua variabel. Salah satu teknik analisis multivariat yang dapat
digunakan untuk memahami dan menjelaskan seperangkat variabel adalah analisis
cluster. Analisis cluster adalah salah satu tenik multivariat yang bertujuan
mengklasifikasi suatu objek-objek ke dalam suatu kelompok-kelompok yang
berbeda antara kelompok satu dengan yang lainnya. Objek-objek yang telah
diklasifikasikan dalam satu cluster merupakan objek-objek yang memiliki
kedekatan jarak relatif sama dengan objek lainnya (Narimawati, 2008).
Berdasarkan latar belakang di atas, maka analisis cluster ini perlu untuk
dipelajari dan dikaji baik secara teoritis maupun secara praktik agar penulis
maupun pembaca lebih memahami analisis cluster tersebut.
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas maka rumusan masalah yang diambil

dalam penelitian ini adalah:
1. Apa yang dimaksud analisis cluster?
2. Bagaimana langkah-langkah analisis cluster?
3. Bagaimana interpretasi hasil analisis cluster?
1.3 Tujuan Penelitian
Berdasarkan rumusan masalah di atas, maka tujuan penelitian ini adalah:

1. Mengetahui lebih dalam analisis cluster.
2. Mengetahui langkah-langkah analisis cluster.
3. Mengetahui interpretasi dari hasil analisis cluster.
1
BAB II
KAJIAN PUSTAKA
2.1 Analisis Cluster
Analisis cluster bertujuan untuk mengelompokkan objek-objek
berdasarkan kesamaan karakteristik diantara objek-objek tersebut. Objek bisa
berupa produk, benda, serta orang. Objek tersebut akan diklasifikasikan ke dalam
satu atau lebih cluster/kelompok sehingga objek-objek yang berada dalam satu
cluster akan memiliki kemiripan satu sama dengan lain.
Analisis cluster adalah teknik multivariat yang mempunyai tujuan utama
untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya.
Analisis cluster mengklasifikasi objek sehingga setiap objek yang memiliki sifat
yang mirip atau paling dekat persamaannya akan mengelompok dalam satu cluster
atau kelompok yang sama. Maka cluster yang baik adalah cluster yang
mempunyai:
a. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster.
b. Heterogenitas(perbedaan) yang tinggi antar satu denga cluster yang lain.
Beberapa manfaat analisis cluster adalah eksplorasi data berpeubah ganda,
reduksi data, stratifikasi sampling, perediksi keadaan objek. Hasil dari analisis
cluster dipengaruhi oleh: objek yang diclusterkan, peubah yang diamati, ukuran
kemiripan (jarak yang dipakai), skala ukuran yang dipakai, serta metode
pengclusteran yang digunakan.
2
3
2.2 Tujuan Analisis Cluster
Analisis cluster bertujuan mengelompokkan sejumlah n objek berdasarkan
p varians yang relative mempunyai kesamaan karakteristik di antara objek-objek
tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil
dibandingkan keragaman antar kelompok. Objek tersebut akan diklasifikasikan ke
dalam satu atau lebih cluster (kelompok) sehingga objek-objek yang berada dalam
satu cluster akan mempunyai satu kemiripan atau kesamaan karakter.
2.3 Proses Analisis Cluster
Interprestasi Analisis Cluster
Setelah cluster terbentuk, entah dengan metode hirarki atau non-hirarki, langkah
selanjutnya adalah melakukan interprestasi terhadap cluster yang terbentuk, yang
pada intinya memberi nama spesifik untuk menggambarkan isi cluster. Misalnya,
kelompok konsumen yang memperhatikan lingkungan sekitar sebelum membeli
sebuah rumah bisa dinamai cluster lingkungan.
Tahap validasi Cluster
Melakukan validasi dan profiling cluster. Cluster yang terbentuk kemudian diuji
apakah hasil tersebut valid. Kemudian dilakukan proses profiling untuk
menjelaskan karakteristik setiap cluster berdasarkan profil tertentu (seperti usia
konsumen pembeli rumah, tingkat penghasilannya dan sebagainya). Analisis
cluster agak bersifat subjektif dalam penentuan penyelesaian cluster yang
optimal, sehingga peneliti seharusnya memberikan perhatian yang besar mengenai
validasi dan jaminan tingkat signifikansi pada penyelesaian akhir dari cluster.
Meskipun tidak ada metode untuk menjamin validitas dan tingkat signifikansi ,
4
beberapa pendekatan telah dikemukakan untuk memberikan dasar bagi perkiraan

peneliti.
Validasi Hasil Cluster
Validasi termasuk usaha yang dilakukan oleh peneliti untuk menjamin bahwa
hasil cluster adalah representatif terhadap populasi secara umum, dan dengan
demikian dapat digeneralisasi untuk objek yang lain dan stabil untuk waktu
tertentu. Pendekatan langsung dalam hal ini adalah dengan analisis sample secara
terpisah kemudian membandingkan antara hasil cluster dengan perkiraan masing-
masing cluster. Pendekatan ini sering tidak praktis, karena adanya keterbatasan
waktu dan biaya atau ketidaktersediaan objek untuk perkalian analisis cluster.
Dalam hal ini pendekatan tyang biasa digunakan adalah dengan membagi sample
menjadi dua kelompok. Masing-masing dianalisis cluster secara terpisah,
kemudian hasinya dibandingkan.
Profiling Hasil Cluster

Tahap Profiling meliputi penggambaran karakteristik masing-masing cluster
untuk menjelaskan bagaimana mereka bisa berbeda secara relevan pada tiap
dimensi. Tipe ini meliputi penggunaan analisis diskriminan. Prosedur dimulai
setelah cluster ditentukan. Peneliti menggunakan data yang sebelumnya tidak
masuk dalam prosedur cluster untuk menggambarkan karakteristik masing-masing
cluster. Meskipun secara teori tidak masuk akal (rasional) dalam perbedaan silang
cluster, akan tetapi hal ini diperlukan untuk memprediksi validasi taksiran,
sehingga minimal penting secara praktek.

5
2.4 Asumsi pada Analisis Cluster
Untuk melakukan proses analisis cluster ini, ada asumsi yang harus
terpenuhi, yaitu:
1. Sampel yang diambil benar-benar dapat mewakili populasi yang ada
(representativeness of the sample).
2. Multikolinieritas.
Apabila semua asumsi tersebut dipenuhi maka data layak untuk dianalisis
menggunakan analisis diskriminan ini.
2.5 Data Analisis Cluster
Berikut ini adalah data yang dipakai peneliti untuk dianalisis dengan
menggunakan analisis cluster yang digunakan adalah indikator IPM di
kabupaten/kota Jawa Timur, yang bersumber dari Badan Pusat Statistik (BPS)
Provinsi Jawa Timur. Unit observasi penelitian ini adalah 29 kabupaten dan 9 kota
di Provinsi Jawa Timur, variabelnya antara lain: (lihat lampiran)
X1: persentase tingkat partisipasi angkatan kerja.
X2: persentase tingkat pengangguran terbuka.
X3: persentase angka kematian bayi.
X4: persentase angka harapan hidup.
X5: persentase angka keluhan kesehatan.
X6: persentase Angka Partisipasi Sekolah (APS) kelompok usia 16-18 tahun.
X7: persentase Angka Partisipasi Kasar (APK) kelompok usia 16-18 tahun.
6
X8: persentase Angka Partisipasi Murni (APM) kelomok usia 16-18 tahun.
X9: persentase angka penduduk 10 tahun ke atas yang tidak pernah sekolah.
X10: persentase angka buta huruf penduduk 10 tahun ke atas.
X11: persentase angka penduduk miskin
Sumber: Sirojuddin, Ahmad. 2016. Analisis Cluster pada Kabupaten/Kota di

Provinsi Jawa Timur berdasarkan Indeks Pembangunan Manusia. Skripsi Tidak
dipublikasikan. Malang: UIN Malang.
BAB III
METODE PENELITIAN
3.1 Langkah-langkah Pengujian
Langkah-langkah analisis cluster menggunakan Minitab
Masukkan data pada Minitab kemudian pilih menu Stat pilih Multivariate
pilih Cluster Observations
Klik variabel sehingga masuk pada kotak variables of distance matrix pilih
Lingkage Method dicoba satu-satu Average, centroid, dll. untuk distance
measure pilih Euclidean pilih OK.
7
8
Kemudian pilih stat pilih multivariate pilih cluster variabels akan muncul
sebagai berikut:
Klik Lingkage method sesuai yang dikehendaki, kemudian number of
cluster diisi kemudian OK

9
BAB IV
PEMBAHASAN
4.1 Interpretasi Hasil Output
Berikut setelah melalui prosedur pengolahan data dengan menggunakan
analisis cluster didapatlah hasil output sebagai berikut:
Output 1
Metode Complate Lingkage
Metode ini digunakan untuk melihat jarak atau kesamaan antara pasangan-
pasangan objek dan kelompok yang dibentuk dari kesatuan individu dengan
menggabungkan etangga terjauhnya. Banyaknya kelompok pada metode ini
sebanyak 4 kelompok berikut merupakan rincian anggota kabupaten/kota dari
setiap kelompok.
10
11
Kelompok 1: Kabupaten Pacitan, Ponorogo, Trenggalek, Blitar, Kediri,
Banyuwangi, Nganjuk, Bojonegoro, Tuban, Malang, Tulungagung, Kota Batu,
Malang, dan Surabaya.
Kelompok 2: Kabupaten Lumajang, Jember, Bangkalan, Pasuruan, dan Sampang.
Kelompok 3: Kabupaten Bondowoso, Probolinggo, Situbondo, Pamekasan, dan
Sumenep.
Kelompok 4: Kabupaten Sidoarjo, Gresik, Magetan, Mojokerto, Jombang, Ngawi,
Lamongan, Madiun, Kota Blitar, Mojokerto, Kediri, Madiun, Probolinggo,
Pasuruan.
Output 2
Metode Avarege Linkage
Average Linkage merupakan salah satu metode cluster Hirarki yang
didasarkan pada rata-rata jarak jauh dari seluruh objek pada suatu cluster dengan
seluruh objek pada cluster lain. Dari tabel dendrogram di atas diperoleh 5
kelompok hasil cluster menggunakan metode Average Linkage ini. Berikut
merupakan rincian anggota kabupaten/kota dari setiap kelompok:

12
Kelompok 1: Kabupaten Pacitan, Ponorogo, Blitar, Kediri, Malang, Banyuwangi,
Nganjuk, Bojonegoro, Tuban, Tulungagung, Mojokerto, Jombang, Ngawi,
Lamongan, Sidoarjo, Gresik, Magetan, Kota Batu, Malang, Surabaya,
Probolinggo, Blitar, Mojokerto, Kediri, Madiun, dan Pasuruan.
Kelompok 2: Kabupaten Madiun.
Kelompok 3: Kabupaten Trenggalek.
Kelompok 5: Kabupaten Bondowoso, Probolinngo, Situbondo, Pamekasan, dan
Sumenep
Output 3
Metode Wards Lingkage
Metode ini menghitung jarak antar dua kelompok yang terbentuk dengan
meminimumkan peningkatan kriteria Error Sum of Square (ESS). Jumlah
kelompok optimum yang terbentuk sebanyak 5 kelompok. Berikut merupakan
rincian anggota kabupaten/kota dari setiap kelompok.

13
Kelompok 1: Kabupaten Pacitan, Ponorogo, Nganjuk, Blitar, Kediri, Malang,
Banyuwangi, Bojonegoro, Tuban, dan Trenggalek.
Kelompok 3: Kabupaten Bondowoso, Probolinggo, Situbondo, Pamekasan, dan
Sumenep.
Kelompok 4: Kabupaten Tulungagung, Mojokerto, Jombang, Ngawi, Lamongan,
Kota Batu, Malang, Surabaya, Probolinggo, dan Pasuruan.
Kelompok 5: Kabupaten Sidoarjo, Gresik, Magetan, Madiun, Kota Kediri,
Madiun, Blitar, dan Mojokerto.

DAFTAR PUSTAKA
Narimawati, U. 2008. Metodologi Penelitian Kualitatif dan Kuantitatif, Teori dan

Aplikasi. Bandung: Agung Media.
Sirojuddin, Ahmad. 2016. Analisis Cluster pada Kabupaten/Kota di Provinsi

Jawa Timur berdasarkan Indeks Pembangunan Manusia. Skripsi Tidak
dipublikasikan. Malang: UIN Malang.
14

Analisis Cluster

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Analisis Cluster

Transféré par

Droits d'auteur :

Formats disponibles

ANALISIS DATA

Farida Suharleni, S.Si, M.Si

Kamalia Rizki R (13610082)

1.1 Latar Belakang

Berdasarkan latar belakang di atas maka rumusan masalah yang diambil

Berdasarkan rumusan masalah di atas, maka tujuan penelitian ini adalah:

2.1 Analisis Cluster

Analisis cluster bertujuan untuk mengelompokkan objek-objek

berdasarkan kesamaan karakteristik diantara objek-objek tersebut. Objek bisa

cluster akan memiliki kemiripan satu sama dengan lain.

Analisis cluster adalah teknik multivariat yang mempunyai tujuan utama

untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya.

a. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster.

b. Heterogenitas(perbedaan) yang tinggi antar satu denga cluster yang lain.

Beberapa manfaat analisis cluster adalah eksplorasi data berpeubah ganda,

pengclusteran yang digunakan.

2.2 Tujuan Analisis Cluster

Analisis cluster bertujuan mengelompokkan sejumlah n objek berdasarkan

p varians yang relative mempunyai kesamaan karakteristik di antara objek-objek

tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil

dibandingkan keragaman antar kelompok. Objek tersebut akan diklasifikasikan ke

satu cluster akan mempunyai satu kemiripan atau kesamaan karakter.

2.3 Proses Analisis Cluster

Interprestasi Analisis Cluster

Tahap validasi Cluster

beberapa pendekatan telah dikemukakan untuk memberikan dasar bagi perkiraan

Validasi Hasil Cluster

Profiling Hasil Cluster

dimensi. Tipe ini meliputi penggunaan analisis diskriminan. Prosedur dimulai

setelah cluster ditentukan. Peneliti menggunakan data yang sebelumnya tidak

masuk dalam prosedur cluster untuk menggambarkan karakteristik masing-masing

sehingga minimal penting secara praktek.

2.4 Asumsi pada Analisis Cluster

1. Sampel yang diambil benar-benar dapat mewakili populasi yang ada

(representativeness of the sample).

menggunakan analisis diskriminan ini.

2.5 Data Analisis Cluster

menggunakan analisis cluster yang digunakan adalah indikator IPM di

di Provinsi Jawa Timur, variabelnya antara lain: (lihat lampiran)

X1: persentase tingkat partisipasi angkatan kerja.

X2: persentase tingkat pengangguran terbuka.

X3: persentase angka kematian bayi.

X4: persentase angka harapan hidup.

X5: persentase angka keluhan kesehatan.

X10: persentase angka buta huruf penduduk 10 tahun ke atas.

X11: persentase angka penduduk miskin

Sumber: Sirojuddin, Ahmad. 2016. Analisis Cluster pada Kabupaten/Kota di

3.1 Langkah-langkah Pengujian

Langkah-langkah analisis cluster menggunakan Minitab

pilih Cluster Observations

Lingkage Method dicoba satu-satu Average, centroid, dll. untuk distance

measure pilih Euclidean pilih OK.

Klik Lingkage method sesuai yang dikehendaki, kemudian number of

cluster diisi kemudian OK

4.1 Interpretasi Hasil Output

Berikut setelah melalui prosedur pengolahan data dengan menggunakan

analisis cluster didapatlah hasil output sebagai berikut:

Metode Complate Lingkage

menggabungkan etangga terjauhnya. Banyaknya kelompok pada metode ini

sebanyak 4 kelompok berikut merupakan rincian anggota kabupaten/kota dari

Kelompok 1: Kabupaten Pacitan, Ponorogo, Trenggalek, Blitar, Kediri,

Banyuwangi, Nganjuk, Bojonegoro, Tuban, Malang, Tulungagung, Kota Batu,

Malang, dan Surabaya.

Kelompok 2: Kabupaten Lumajang, Jember, Bangkalan, Pasuruan, dan Sampang.