Vous êtes sur la page 1sur 16

ANALISIS DATA

ANALISIS CLUSTER

Dosen Pengampu:

Farida Suharleni, S.Si, M.Si


Ria Dhea Layla N.K, S.Si, M.Si

Disusun Oleh:

Kamalia Rizki R (13610082)


Alvi Nur Z. M (13610091)
Nila Istighfarin (13610103)

JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI MAULANA MALIK IBRAHIM
MALANG
2017
DAFTAR ISI

HALAMAN JUDUL
DAFTAR ISI .......................................................................................................... ii
BAB I PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang .............................................................................................. 1
1.2 Rumusan Masalah ......................................................................................... 1
1.3 Tujuan Penelitian .......................................................................................... 1
BAB II KAJIAN PUSTAKA ................................................................................ 2
2.1 Analisis Cluster ............................................................................................. 2
2.2 Tujuan Analisis Cluster ................................................................................. 3
2.3 Proses Analisis Cluster .................................................................................. 3
2.4 Asumsi pada Analisis Cluster ....................................................................... 5
2.5 Data Analisis Cluster..................................................................................... 5
BAB III METODE PENELITIAN ...................................................................... 7
3.1 Langkah-langkah Pengujian .......................................................................... 7
BAB IV PEMBAHASAN.................................................................................... 10
4.1 Interpretasi Hasil Output ............................................................................. 10
DAFTAR PUSTAKA .......................................................................................... 14

ii
BAB I

PENDAHULUAN

1.1 Latar Belakang

Pada ilmu statistika, apabila variabel yang digunakan lebih dari dua, maka
akan semakin rumit untuk melakukan analisis statistik. Salah satu metode yang
dapat mengatasi hal tersebut adalah analisis multivariat. Analisis multivariat
merupakan metode statistik yang memungkinkan melakukan penelitian terhadap
lebih dari dua variabel. Salah satu teknik analisis multivariat yang dapat
digunakan untuk memahami dan menjelaskan seperangkat variabel adalah analisis
cluster. Analisis cluster adalah salah satu tenik multivariat yang bertujuan
mengklasifikasi suatu objek-objek ke dalam suatu kelompok-kelompok yang
berbeda antara kelompok satu dengan yang lainnya. Objek-objek yang telah
diklasifikasikan dalam satu cluster merupakan objek-objek yang memiliki
kedekatan jarak relatif sama dengan objek lainnya (Narimawati, 2008).
Berdasarkan latar belakang di atas, maka analisis cluster ini perlu untuk
dipelajari dan dikaji baik secara teoritis maupun secara praktik agar penulis
maupun pembaca lebih memahami analisis cluster tersebut.
1.2 Rumusan Masalah

Berdasarkan latar belakang di atas maka rumusan masalah yang diambil


dalam penelitian ini adalah:
1. Apa yang dimaksud analisis cluster?
2. Bagaimana langkah-langkah analisis cluster?
3. Bagaimana interpretasi hasil analisis cluster?
1.3 Tujuan Penelitian

Berdasarkan rumusan masalah di atas, maka tujuan penelitian ini adalah:


1. Mengetahui lebih dalam analisis cluster.
2. Mengetahui langkah-langkah analisis cluster.
3. Mengetahui interpretasi dari hasil analisis cluster.

1
BAB II

KAJIAN PUSTAKA

2.1 Analisis Cluster

Analisis cluster bertujuan untuk mengelompokkan objek-objek

berdasarkan kesamaan karakteristik diantara objek-objek tersebut. Objek bisa

berupa produk, benda, serta orang. Objek tersebut akan diklasifikasikan ke dalam

satu atau lebih cluster/kelompok sehingga objek-objek yang berada dalam satu

cluster akan memiliki kemiripan satu sama dengan lain.

Analisis cluster adalah teknik multivariat yang mempunyai tujuan utama

untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya.

Analisis cluster mengklasifikasi objek sehingga setiap objek yang memiliki sifat

yang mirip atau paling dekat persamaannya akan mengelompok dalam satu cluster

atau kelompok yang sama. Maka cluster yang baik adalah cluster yang

mempunyai:

a. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster.

b. Heterogenitas(perbedaan) yang tinggi antar satu denga cluster yang lain.

Beberapa manfaat analisis cluster adalah eksplorasi data berpeubah ganda,

reduksi data, stratifikasi sampling, perediksi keadaan objek. Hasil dari analisis

cluster dipengaruhi oleh: objek yang diclusterkan, peubah yang diamati, ukuran

kemiripan (jarak yang dipakai), skala ukuran yang dipakai, serta metode

pengclusteran yang digunakan.

2
3

2.2 Tujuan Analisis Cluster

Analisis cluster bertujuan mengelompokkan sejumlah n objek berdasarkan

p varians yang relative mempunyai kesamaan karakteristik di antara objek-objek

tersebut, sehingga keragaman di dalam suatu kelompok tersebut lebih kecil

dibandingkan keragaman antar kelompok. Objek tersebut akan diklasifikasikan ke

dalam satu atau lebih cluster (kelompok) sehingga objek-objek yang berada dalam

satu cluster akan mempunyai satu kemiripan atau kesamaan karakter.

2.3 Proses Analisis Cluster

Interprestasi Analisis Cluster

Setelah cluster terbentuk, entah dengan metode hirarki atau non-hirarki, langkah
selanjutnya adalah melakukan interprestasi terhadap cluster yang terbentuk, yang
pada intinya memberi nama spesifik untuk menggambarkan isi cluster. Misalnya,
kelompok konsumen yang memperhatikan lingkungan sekitar sebelum membeli
sebuah rumah bisa dinamai cluster lingkungan.

Tahap validasi Cluster

Melakukan validasi dan profiling cluster. Cluster yang terbentuk kemudian diuji
apakah hasil tersebut valid. Kemudian dilakukan proses profiling untuk
menjelaskan karakteristik setiap cluster berdasarkan profil tertentu (seperti usia
konsumen pembeli rumah, tingkat penghasilannya dan sebagainya). Analisis
cluster agak bersifat subjektif dalam penentuan penyelesaian cluster yang
optimal, sehingga peneliti seharusnya memberikan perhatian yang besar mengenai
validasi dan jaminan tingkat signifikansi pada penyelesaian akhir dari cluster.
Meskipun tidak ada metode untuk menjamin validitas dan tingkat signifikansi ,
4

beberapa pendekatan telah dikemukakan untuk memberikan dasar bagi perkiraan


peneliti.

Validasi Hasil Cluster

Validasi termasuk usaha yang dilakukan oleh peneliti untuk menjamin bahwa
hasil cluster adalah representatif terhadap populasi secara umum, dan dengan
demikian dapat digeneralisasi untuk objek yang lain dan stabil untuk waktu
tertentu. Pendekatan langsung dalam hal ini adalah dengan analisis sample secara
terpisah kemudian membandingkan antara hasil cluster dengan perkiraan masing-
masing cluster. Pendekatan ini sering tidak praktis, karena adanya keterbatasan
waktu dan biaya atau ketidaktersediaan objek untuk perkalian analisis cluster.
Dalam hal ini pendekatan tyang biasa digunakan adalah dengan membagi sample
menjadi dua kelompok. Masing-masing dianalisis cluster secara terpisah,
kemudian hasinya dibandingkan.

Profiling Hasil Cluster


Tahap Profiling meliputi penggambaran karakteristik masing-masing cluster

untuk menjelaskan bagaimana mereka bisa berbeda secara relevan pada tiap

dimensi. Tipe ini meliputi penggunaan analisis diskriminan. Prosedur dimulai

setelah cluster ditentukan. Peneliti menggunakan data yang sebelumnya tidak

masuk dalam prosedur cluster untuk menggambarkan karakteristik masing-masing

cluster. Meskipun secara teori tidak masuk akal (rasional) dalam perbedaan silang

cluster, akan tetapi hal ini diperlukan untuk memprediksi validasi taksiran,

sehingga minimal penting secara praktek.


5

2.4 Asumsi pada Analisis Cluster

Untuk melakukan proses analisis cluster ini, ada asumsi yang harus

terpenuhi, yaitu:

1. Sampel yang diambil benar-benar dapat mewakili populasi yang ada

(representativeness of the sample).

2. Multikolinieritas.

Apabila semua asumsi tersebut dipenuhi maka data layak untuk dianalisis

menggunakan analisis diskriminan ini.

2.5 Data Analisis Cluster

Berikut ini adalah data yang dipakai peneliti untuk dianalisis dengan

menggunakan analisis cluster yang digunakan adalah indikator IPM di

kabupaten/kota Jawa Timur, yang bersumber dari Badan Pusat Statistik (BPS)

Provinsi Jawa Timur. Unit observasi penelitian ini adalah 29 kabupaten dan 9 kota

di Provinsi Jawa Timur, variabelnya antara lain: (lihat lampiran)

X1: persentase tingkat partisipasi angkatan kerja.

X2: persentase tingkat pengangguran terbuka.

X3: persentase angka kematian bayi.

X4: persentase angka harapan hidup.

X5: persentase angka keluhan kesehatan.

X6: persentase Angka Partisipasi Sekolah (APS) kelompok usia 16-18 tahun.

X7: persentase Angka Partisipasi Kasar (APK) kelompok usia 16-18 tahun.
6

X8: persentase Angka Partisipasi Murni (APM) kelomok usia 16-18 tahun.

X9: persentase angka penduduk 10 tahun ke atas yang tidak pernah sekolah.

X10: persentase angka buta huruf penduduk 10 tahun ke atas.

X11: persentase angka penduduk miskin

Sumber: Sirojuddin, Ahmad. 2016. Analisis Cluster pada Kabupaten/Kota di


Provinsi Jawa Timur berdasarkan Indeks Pembangunan Manusia. Skripsi Tidak
dipublikasikan. Malang: UIN Malang.
BAB III

METODE PENELITIAN

3.1 Langkah-langkah Pengujian

Langkah-langkah analisis cluster menggunakan Minitab

Masukkan data pada Minitab kemudian pilih menu Stat pilih Multivariate

pilih Cluster Observations

Klik variabel sehingga masuk pada kotak variables of distance matrix pilih

Lingkage Method dicoba satu-satu Average, centroid, dll. untuk distance

measure pilih Euclidean pilih OK.

7
8

Kemudian pilih stat pilih multivariate pilih cluster variabels akan muncul

sebagai berikut:

Klik Lingkage method sesuai yang dikehendaki, kemudian number of

cluster diisi kemudian OK


9
BAB IV

PEMBAHASAN

4.1 Interpretasi Hasil Output

Berikut setelah melalui prosedur pengolahan data dengan menggunakan

analisis cluster didapatlah hasil output sebagai berikut:

Output 1

Metode Complate Lingkage

Metode ini digunakan untuk melihat jarak atau kesamaan antara pasangan-

pasangan objek dan kelompok yang dibentuk dari kesatuan individu dengan

menggabungkan etangga terjauhnya. Banyaknya kelompok pada metode ini

sebanyak 4 kelompok berikut merupakan rincian anggota kabupaten/kota dari

setiap kelompok.

10
11

Kelompok 1: Kabupaten Pacitan, Ponorogo, Trenggalek, Blitar, Kediri,

Banyuwangi, Nganjuk, Bojonegoro, Tuban, Malang, Tulungagung, Kota Batu,

Malang, dan Surabaya.

Kelompok 2: Kabupaten Lumajang, Jember, Bangkalan, Pasuruan, dan Sampang.

Kelompok 3: Kabupaten Bondowoso, Probolinggo, Situbondo, Pamekasan, dan

Sumenep.

Kelompok 4: Kabupaten Sidoarjo, Gresik, Magetan, Mojokerto, Jombang, Ngawi,

Lamongan, Madiun, Kota Blitar, Mojokerto, Kediri, Madiun, Probolinggo,

Pasuruan.

Output 2

Metode Avarege Linkage

Average Linkage merupakan salah satu metode cluster Hirarki yang

didasarkan pada rata-rata jarak jauh dari seluruh objek pada suatu cluster dengan

seluruh objek pada cluster lain. Dari tabel dendrogram di atas diperoleh 5

kelompok hasil cluster menggunakan metode Average Linkage ini. Berikut

merupakan rincian anggota kabupaten/kota dari setiap kelompok:


12

Kelompok 1: Kabupaten Pacitan, Ponorogo, Blitar, Kediri, Malang, Banyuwangi,

Nganjuk, Bojonegoro, Tuban, Tulungagung, Mojokerto, Jombang, Ngawi,

Lamongan, Sidoarjo, Gresik, Magetan, Kota Batu, Malang, Surabaya,

Probolinggo, Blitar, Mojokerto, Kediri, Madiun, dan Pasuruan.

Kelompok 2: Kabupaten Madiun.

Kelompok 3: Kabupaten Trenggalek.

Kelompok 4: Kabupaten Lumajang, Jember, Bangkalan, Pasuruan, dan Sampang.

Kelompok 5: Kabupaten Bondowoso, Probolinngo, Situbondo, Pamekasan, dan

Sumenep

Output 3

Metode Wards Lingkage

Metode ini menghitung jarak antar dua kelompok yang terbentuk dengan

meminimumkan peningkatan kriteria Error Sum of Square (ESS). Jumlah

kelompok optimum yang terbentuk sebanyak 5 kelompok. Berikut merupakan

rincian anggota kabupaten/kota dari setiap kelompok.


13

Kelompok 1: Kabupaten Pacitan, Ponorogo, Nganjuk, Blitar, Kediri, Malang,

Banyuwangi, Bojonegoro, Tuban, dan Trenggalek.

Kelompok 2: Kabupaten Lumajang, Jember, Bangkalan, Pasuruan, dan Sampang.

Kelompok 3: Kabupaten Bondowoso, Probolinggo, Situbondo, Pamekasan, dan

Sumenep.

Kelompok 4: Kabupaten Tulungagung, Mojokerto, Jombang, Ngawi, Lamongan,

Kota Batu, Malang, Surabaya, Probolinggo, dan Pasuruan.

Kelompok 5: Kabupaten Sidoarjo, Gresik, Magetan, Madiun, Kota Kediri,

Madiun, Blitar, dan Mojokerto.


DAFTAR PUSTAKA

Narimawati, U. 2008. Metodologi Penelitian Kualitatif dan Kuantitatif, Teori dan


Aplikasi. Bandung: Agung Media.

Sirojuddin, Ahmad. 2016. Analisis Cluster pada Kabupaten/Kota di Provinsi


Jawa Timur berdasarkan Indeks Pembangunan Manusia. Skripsi Tidak
dipublikasikan. Malang: UIN Malang.

14

Vous aimerez peut-être aussi