Vous êtes sur la page 1sur 7

Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805

UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018

Analisis Sentimen Terhadap Opini Masyarakat Indonesia Mengenai Bukalapak


Wivadario WIlana1), Sandy Hanshe Hanasbey2), Meylan Ribka Awinero3), Jonathan Vorgorius
Adeputra Modouw4), Melkior N. N Sitokdana 5)

1)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
2)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
3)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
4)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
5)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
Jalan Diponegoro No.52-60, Salatiga, Sidorejo, Salatiga, Sidorejo, Kota Salatiga, Jawa Tengah 50711
Email : wivawilana@gmail.com 1), sandyhanshe@gmail.com2), awineromeylan@gmail.com 3),
pmodouw3@gmail.com4), melkior.sitokdana@staff.uksw.edu 5)

Abstrak merupakan pengguna aktif sosial media, dimana jumlah


tersebut dapat dikatakan tidak sedikit [3]. Aktifnya
Toko Online menjadi tempat yang sangat sering penggunaan sosial media menyebabkan banyaknya
digunakan untuk proses transaksi jual-beli dikarenakan individu yang memanfaatkan potensi transaksi secara
mudah dan cepat cara penggunaannya. Kepercayaan digital.
menjadi faktor pertama dalam proses ini karena tidak
ada titik temu untuk melakukan transaksi. Munculnya Berawal dari sosial media, banyak pedagang yang
Bukalapak di dalam dunia teknologi membuat para akhirnya ikut meramaikan platform tersebut untuk
penggunanya dapat melakukan transaksi dengan aman transaksi jual-beli. Tetapi seiring berjalannya waktu,
dan nyaman. Tetapi tidak hanya tanggapan positif yang terdapat banyak sekali kasus-kasus penipuan ataupun
muncul adapun tanggapan yang negatif dengan bentuk modus kejahatan lainnya pada platform tersebut
munculnya Bukalapak. Analisis Sentimen menjadi hal [4][5]. Hal tersebut menyebabkan pedagang yang
yang tepat untuk menganalisa sentimen-sentimen memanfaatkan potensi besar tersebut kehilangan
masyarakat terhadap Bukalapak. Metode klasifikasi kepercayaan dari para pelanggannya. Dampak integritas
yang digunakan adalah metode Naïve Bayes. Metode ini dan dampak kenyamanan menjadi dampak utama dari
digunakan untuk menghasilkan klasifikasi data dari kasus-kasus tersebut.
data-data sentimen yang sudah diolah. Hasil yang
dihasilkan dari metode Naïve Bayes digambarkan dalam Permasalahan tersebut tentunya menjadi potensi besar
bentuk grafik, yang dimana menjelaskan nilai bagi para technopreneurship untuk mengatasi masalah-
klasifikasinya. Tujuan dari penelitian ini adalah untuk masalah tersebut [5]. Akhirnya muncul salah satu pasar
mengetahui mayoritas opini masyarakat terhadap online besar di Indonesia yaitu Bukalapak. Bukalapak
Bukalapak. Terdapat 510 total data yang diolah dan merupakan tempat jual beli online yang aman dan
menghasilkan output yang bernilai netral dengan digunakan oleh masyarakat Indonesia.
probabilitas 50%, positif 37%, dan negatif 13%.
Hal ini menjadi hal yang positif di Indonesia, melihat
Kata kunci: Analisis Sentimen, Naïve Bayes, dari kasus-kasus sebelumnya, tentu Bukalapak menjadi
Bukalapak. solusi bagi para pedagang maupun pembeli untuk ber-
transaksi dengan aman dan mudah. Tetapi tentu suatu hal
positif masih memiliki kelemahan, sehingga
1. Pendahuluan
menciptakan beragam pendapat positif maupun negatif
Pada era globalisasi tidak dapat dipungkiri bahwa terhadap Bukalapak.
teknologi berkembang dengan sangat cepat [1]. Tidak
hanya perkembangannya yang cepat, tetapi Analisis Sentimen merupakan sebuah cabang penelitian
penggunaannya juga mulai digunakan secara global atau di domain Text Mining yang mulai booming pada awal
mendunia. Salah satu bentuk teknologi yang selalu tahun 2002-an [6]. Opini-opini masyarakat mengenai
menjadi sorotan utama masyarakat adalah Internet, Bukalapak dapat dianalisa nilainya menggunakan
dikarenakan banyaknya informasi yang dengan metode ini. Tidak hanya Analisis Sentimen, tetapi
mudah,cepat,nyaman,dan fleksibel untuk diakses [2]. metode klasifikasi yang sering digunakan adalah Naïve
Bayes. Untuk mengetahui nilai dari opini-opini tersebut,
Masyarakat Indonesia tentu tidak luput dari penggunaan metode Naïve Bayes mengklasifikannya menjadi tiga
internet. Dari 200 juta penduduk di Indonesia, 88 juta nilai yaitu positif,netral dan negative. Metode Naive
penduduk Indonesia merupakan pengguna aktif Internet, Bayes juga dinilai berpotensi baik dalam mengklasifikasi
fakta ini menyebabkan betapa besarnya potensi pasar dokumen dibandingkan metode pengklasifikasian yang
digital di Indonesia [3]. 79 juta penduduk Indonesia lain dalam hal akurasi dan efisiensi komputasi [7].

1
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018

Dengan demikian, tujuan utama dari artikel ini adalah P(C│F1…Fn)=P(C)P(F1…Fn∨C)/P(F1…Fn)


mengkaji persepsi masyarakat tentang bukalapak. (2)

Ruang lingkup penelitan ini adalah membangun sebuah Di mana Variabel C merepresentasikan kelas, sementara
tools yang digunakan untuk melakukan analisis sentimen variabel F1 ... Fn merepresentasikan karakteristik
terhadap opini masyarakat mengenai bukalapak. Tools petunjuk yang dibutuhkan untuk melakukan klasifikasi.
tersebut dibangun menggunakan bahasa pemrograman Maka rumus tersebut menjelaskan bahwa peluang
PHP dan MySql. Metode analisis yang digunakan adalah masuknya sampel karakteristik tertentu dalam kelas C
metode naive bayes. Sedangkan data yang diambil (Posterior) adalah peluang munculnya kelas C (sebelum
bersumber dari media-media diantaranya playstore masuknya sampel tersebut, seringkali disebut prior),
bukalapak, facebook, twitter, kompas dan detik. dikali dengan peluang kemunculan karakteristik-
karakteristik sampel pada kelas C (disebut juga
likelihood), dibagi dengan peluang kemunculan
2. Pembahasan
karakteristik-karakteristik sampel secara global (disebut
2.1. Sentimen Analisys juga evidence). Karena itu, rumus di atas dapat pula
ditulis secara sederhana sebagai berikut:
Sentiment analysis adalah studi komputasi mengenai
sikap, emosi, pendapat, penilaian, padangan dari Posterior=priorxlikelihood/evidence (3)
sekumpulan teks yang fokusnya adalah mengekstraksi,
Nilai Evidence selalu tetap untuk setiap kelas pada satu
mengindentifikasi atau menemukan karakteristik
sampel. Nilai dari posterior tersebut nantinya akan
sentimen dalam unit teks menggunakan metode
dibandingkan dengan nilai-nilai posterior kelas lainnya
NLP(Natural Language Processing), statistik atau
untuk menentukan ke kelas apa suatu sampel akan
machine learning [12]. Sentiment analysis merupakan
diklasifikasikan. Penjabaran lebih lanjut rumus Bayes
proses klasifikasi dokumen tekstual ke dalam beberapa
kelas seperti sentimen positif dan negatif serta besarnya tersebut dilakukan dengan menjabarkan (𝐶|𝐹1, … , 𝐹𝑛)
pengaruh dan manfaat dari sentimen analisis menggunakan aturan perkalian sebagai berikut:
menyebabkan penelitian ataupun aplikasi mengenai 𝑃(𝐶|𝐹1, … , 𝐹𝑛 = 𝑃(𝐶)𝑃(𝐹1, … , 𝐹𝑛|𝐶)
sentimet analysis [8], [12].
= 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2, … , 𝐹𝑛|𝐶, 𝐹1)
2.2. Naïve Bayes
= 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2|𝐶, 𝐹1 )𝑃(𝐹3, … , 𝐹𝑛|𝐶, 𝐹1,𝐹2
Naive Bayes merupakan sebuah pengklasifikasian
probabilistik sederhana yang menghitung sekumpulan = (𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2 |𝐶, 𝐹1 )𝑃(𝐹3|𝐶, 𝐹1,𝐹2)𝑃(𝐹4, … ,
probabilitas dengan menjumlahkan frekuensi dan 𝐹𝑛|𝐶, 𝐹1, 𝐹2, 𝐹3)
kombinasi nilai dari dataset yang diberikan [7]. = 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2 |𝐶, 𝐹1 )𝑃(𝐹3|𝐶, 𝐹1,𝐹2) … 𝑃(𝐹𝑛 |𝐶,
Algoritma mengunakan teorema Bayes dan 𝐹1, 𝐹2, 𝐹3, … , 𝐹𝑛−1 ) (4)
mengasumsikan semua atribut independen atau tidak
saling ketergantungan yang diberikan oleh nilai pada Dapat dilihat bahwa hasil penjabaran tersebut
variabel kelas[7], [13]. menyebabkan semakin banyak dan semakin
kompleksnya faktor - faktor syarat yang mempengaruhi
Persamaan dari teorema Bayes adalah [7], [14], [15]: nilai probabilitas, yang hampir mustahil untuk dianalisa
P(H│X)=(P(X│H).P(H))/P(X) (1) satu persatu. Akibatnya, perhitungan tersebut menjadi
sulit untuk dilakukan. Di sinilah digunakan asumsi
Keterangan: independensi yang sangat tinggi (naif), bahwa masing-
X: Data dengan class yang belum diketahui masing petunjuk (F1,F2...Fn) saling bebas (independen)
satu sama lain. Dengan asumsi tersebut, maka berlaku
H: Hipotesis data merupakan suatu class spesifik suatu kesamaan sebagai berikut:
P(H|X): Probabilitas hipotesis H berdasar kondisi X P(Fi│Fj)=P(Fi∩Fj)/P(Fj) =P(Fi)P(Fj)/P(Fj) =P(Fi)
(posteriori probabilitas) (5)
P(H): Probabilitas hipotesis H (prior probabilitas) Untuk i≠j, sehingga
P(X|H): Probabilitas X berdasarkan kondisi pada 𝑃(𝐹𝑖 |𝐶, 𝐹𝑗) = 𝑃(𝐹𝑖 |𝐶) (6)
hipotesis H
Persamaan di atas merupakan model dari teorema Naive
P(X) : Probabilitas X Bayes yang selanjutnya akan digunakan dalam proses
Untuk menjelaskan metode Naive Bayes, perlu diketahui klasifikasi. Untuk klasifikasi dengan data kontinyu
bahwa proses klasifikasi memerlukan sejumlah petunjuk digunakan rumus Densitas Gauss :
untuk menentukan kelas apa yang cocok bagi sampel
P(Xi=xi│Y=yj)=1/√2πσij e^((x_i-μ_ij )^2/(2σ^2
yang dianalisis tersebut. Karena itu, metode Naive Bayes
ij)) (7)
di atas disesuaikan sebagai berikut:
Keterangan:

2
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018

P: Peluang dan positif). Untuk bagian penyimpanan data setelah


penentuan skor (lampiran 3) dijelaskan sebagai berikut:
Xi: Atribut ke i
setelah proses penentuan skor, data yang sudah selesai
xi: Nilai atribut ke i diolah disimpan kedalam database. Skor, kategori dan
grafik data disimpan menjadi satu kesatuan data di dalam
Y: Kelas yang dicari
database.
yi: Sub kelas Y yang dicari
Dalam penerapannya, terdapat beberapa bagian dari
µ: mean, menyatakan rata – rata dari seluruh atribut tools yang ada. Antara lain: bagian input (lampiran 4),
bagian daftar opini (lampiran 5), grafik kalimat
σ: Deviasi standar, menyatakan varian dari seluruh (lampiran 6) dan summary (lampiran 7).
atribut.
Bagian input berfungsi untuk menginput setiap opini
2.3. Rancangan Sistem yang dikumpulkan dari setiap media yang digunakan.
Rancangan sistem yang dibangun diilustrasikan sebagai Bagian daftar opini, berisikan daftar opini yang telah di
berikut: inputkan dan hasil kategori dari masing-masing opini.
Terdapat 3 kategori yang membedakan hasil data yaitu
positif, netral, dan negatif. Positif berarti opini yang
diberikan mengandung kata-kata yang positif dan
berpandangan baik terhadap Bukalapak. Negatif berarti
opini yang diberikan mengandung kata-kata yang
negative dan berpandangan negative terhadap
Gambar 1. Rancangan Sistem. Bukalapak. Netral berarti opini yang diberikan
mengandung kata-kata yang netral dan berpandangan
Cakupan proses analisis yang dimaksud pada gambar 1
netral atau tidak mempengaruhi Bukalapak. Grafik
dijelaskan sebagai berikut: setiap pendapat yang
kalimat berisikan hasil skor untuk opini yang ada,
dikumpulkan dari media yang dipilih, akan dianalisis
sedangkan summary berisikan hasil rekapitulasi
pada tahap proses teks. Tahapan proses teks merupakan
keseluruhan opini yang ditampung kedalam tools.
proses analisis pendapat yang didasarkan pada daftar
Summary mencakup presentase setiap kategori dan
kata-kata dan icon negatif, netral dan positif. Terdapat
jumlah total berdasarkan masing-masing kategori.
2400 kata dan 40 icon negatif yang di simpan dalam
kamus. Dalam kamus netral, terdapat 8 icon dan 324 2.4. Hasil
kata yang bersifat netral. Sedangkan kamus positif,
terdapat 37 icon dan 1183 kata. Adapun hasil yang di dapat dari penelitian ini sebagai
berikut. Total dari seluruh data yang diinput adalah 510
Dari tahapan proses teks akan menghasilkan skor dan data. Hasil dari pengolahan data tersebut menghasilkan
kategori dari masing-masing opini yang diinputkan. Skor nilai netral lebih tinggi dari yang lainnya. Dengan
adalah nilai negatif, netral dan positif dari opini yang presentase sebagai berikut (lampiran 7):
dianalisis sedangkan kategori adalah pengelompokan
berdasarkan skor yang didapat. Pengelompokan yang Positif (Hijau) : 190/510 x100=37%
terjadi diuraikan dalam kondisi berikut: jika nilai positif Netral (Hitam) : 257/510 x100=50%
lebih tinggi dari netral dan negatif, maka opini tersebut
adalah positif; jika nilai negatif lebih besar dari netral Negatif (Biru) : 63/510 x100=13%
dan positif, maka opini tersebut adalah negatif; jika
tidak, maka opini tersebut adalah netral. 3. Kesimpulan Dan Saran

Berdasarkan tahapan skor yang ada, maka kode proses 3.1. Kesimpulan
skor (Lampiran 1) dapat dijelaskan sebagai berikut:
diawali dengan pencarian kata dan icon negatif yang Berdasarkan hasil penelitian yang telah dilakukan, dapat
terkandung dalam opini yang diinputkan (kode baris 2- disimpulkan bahwa analisis sentimen terhadap opini
6); menghitung skor berdasarkan masing-masing masyarakat dilakukan dengan metode Naïve Bayes.
kategori (kode baris 7); kemudian dilakukan pencocokan Metode Naïve Bayes digunakan karena lebih akurat
dari kata-kata yang terdapat dalam inputan opini dengan dalam klasifikasi data-data yang sudah diolah.
kamus yang ada (baris kode 10-21); dari hasil Probabilitas yang dihasilkan metode Naïve Bayes
pencocokan yang ada, dibentuk presentase untuk setiap dengan jelas menyatakan bahwa opini sentimen
kategori penilaian, dalam hal ini negatif, netral dan masyarakat terhadap Bukalapak bernilai netral. Nilai
positif (basri kode 22-30). probabilitas yang dihasilkan dari metode Naïve Bayes
adalah 37%(Positif), 50%(Netral), dan 13%(Negatif).
Sedangkan untuk penetuan skor (lampiran 2) dijelaskan
sebagai berikut: melakukan perhitungan skor untuk 3.2. Rancangan Sistem
inputan opini (baris kode 3); hasil perhitungan tersebut Saran untuk penelitian mengenai analisis sentimen ke
akan diklasifikasi kedalam kategori yang telah depan adalah melakukan analisis sentimen dengan
ditentukan (basris kode 4-5), diantaranya (negatif, netral

3
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018

metode yang berbeda untuk membedakan metode mana [10] G. A. Buntoro, “Analisis Sentimen Calon Gubernur DKI Jakarta
yang memberikan keakuratan terbaik dalam 2017 Di Twitter,” 32 Integer J. Maret, vol. 1, no. 2016, pp. 32–41,
menganalisis opini-opini sentimen terhadap suatu objek. 2017.
[11] M. Bilal, H. Israr, M. Shahid, and A. Khan, “Sentiment
classification of Roman-Urdu opinions using Naïve Bayesian,
Daftar Pustaka Decision Tree and KNN classification techniques,” J. King Saud
[1] Aingindra, “Artikel Perkembangan Teknologi Informasi.” Univ. - Comput. Inf. Sci., vol. 28, no. 3, pp. 330–344, 2016.
[Online]. Available: http://www.kliktekno.id/perkembangan- [12] I. K. E. Purnama, “Sentiment Analysis Berbasis Big Data,”
teknologi-informasi.html. [Accessed: 16-Nov-2017]. Rekayasa Teknol. Ind. dan Inf., pp. 142–149, 2014.
[2] Andr010, “Kemkominfo: Internet Jadi Referensi Utama [13] T. R. Patil, “Performance Analysis of Naive Bayes and J48
Mengakses Berita dan Informasi.” [Online]. Available: Classification Algorithm for Data Classification,” Int. J. Comput.
https://kominfo.go.id/index.php/content/detail/5421/Kemkominfo Sci. Appl. ISSN 0974-1011, vol. 6, no. 2, pp. 256–261, 2013.
%3A+Internet+Jadi+Referensi+Utama+Mengakses+Berita+dan+I [14] Bustami, “Penerapan Algoritma Naive Bayes,” J. Inform., vol. 8,
nformasi/0/berita_satker. [Accessed: 12-Nov-2017]. no. 1, pp. 884–898, 2014.
[3] A. Damar, “3 Fakta Mengejutkan Pengguna Internet di Indonesia,” [15] G. Feng, J. Guo, B.-Y. Jing, and T. Sun, “Feature subset selection
2016. [Online]. Available: using naive Bayes for text classification,” Pattern Recognit. Lett.,
http://tekno.liputan6.com/read/2435997/3-fakta-mengejutkan- vol. 65, pp. 109–115, 2015.
pengguna-internet-di-indonesia. [Accessed: 09-Nov-2017].
[4] C. Sur, “Kenali Modus Penipuan di Media Sosial dan Tips Biodata Penulis
Menangkalnya,” 2015. [Online]. Available:
Wivadario Wilan, Mahasiswa Fakultas Teknologi
http://surabaya.tribunnews.com/2015/06/03/kenali-metode-
penipuan-di-media-sosial-dan-tips-menangkalnya. [Accessed: 20-
Informasi, Universitas Kristen Satya Wacana, angkatan
Nov-2017]. 2015.
[5] Maxmanroe, “BukaLapak.com ~ Startup Bisnis yang Sandy Hanshe Hanasbey, Mahasiswa Fakultas
Mempelopori Keamanan Transaksi Online.” [Online]. Available: Teknologi Informasi, Universitas Kristen Satya Wacana,
https://www.maxmanroe.com/bukalapak-com-startup-yang- angkatan 2015.
mempelopori-keamanan-transaksi-online.html. [Accessed: 21- Meylan Ribka Awinero, Mahasiswa Fakultas Teknologi
Nov-2017]. Informasi, Universitas Kristen Satya Wacana, angkatan
[6] J. Prager, “Open-Domain Question–Answering,” Found. Trends® 2015.
Inf. Retr., vol. 1, no. 2, pp. 91–231, 2006. Jonathan Vorgorius Adeputra Modouw, Mahasiswa
[7] A. Saleh, “Implementasi Metode Klasifikasi Naïve Bayes dalam Fakultas Teknologi Informasi, Universitas Kristen Satya
Memprediksi Besarnya Penggunaan Listrik Rumah Tangga,” Citec
Wacana, angkatan 2015.
J., vol. 2, no. 3, pp. 207–217, 2015.
[8] N. Putranti and E. Winarko, “Analisis Sentimen Twitter untuk
Pak Melkior, memperoleh gelar Sarjana Komputer
Teks Berbahasa Indonesia dengan Maximum Entropy dan Support (S.Kom), Jurusan Teknik Informatika STMIK
Vector Machine,” Comput. Cybern. Syst., vol. 8, p. 1, 2014. AMIKOM Yogyakarta, lulus tahun 2006. Memperoleh
[9] K. Khan, B. Baharudin, A. Khan, and A. Ullah, “Mining opinion gelar Magister Komputer (M.Kom) Program Pasca
components from unstructured reviews: A review,” J. King Saud Sarjana Magister Teknik Informatika Universitas Gajah
Univ. - Comput. Inf. Sci., vol. 26, no. 3, pp. 258–275, 2014. Mada Yogyakarta, lulus tahun 2011.Saat ini menjadi
Dosen di STMIK AMIKOM Yogyakarta.

4
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018

Lampiran:

Lampiran 1. Code proses skor

Lampiran 2. Code proses kategori

Lampiran 3. Code proses penyimpanan

Lampiran 4. Form input kalimat

5
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018

Lampiran 5. Daftar opini

Lampiran 6. Grafik Kalimat

6
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018

Lampiran 7. Summary.

Vous aimerez peut-être aussi