Académique Documents
Professionnel Documents
Culture Documents
1)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
2)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
3)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
4)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
5)
Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana
Jalan Diponegoro No.52-60, Salatiga, Sidorejo, Salatiga, Sidorejo, Kota Salatiga, Jawa Tengah 50711
Email : wivawilana@gmail.com 1), sandyhanshe@gmail.com2), awineromeylan@gmail.com 3),
pmodouw3@gmail.com4), melkior.sitokdana@staff.uksw.edu 5)
1
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018
Ruang lingkup penelitan ini adalah membangun sebuah Di mana Variabel C merepresentasikan kelas, sementara
tools yang digunakan untuk melakukan analisis sentimen variabel F1 ... Fn merepresentasikan karakteristik
terhadap opini masyarakat mengenai bukalapak. Tools petunjuk yang dibutuhkan untuk melakukan klasifikasi.
tersebut dibangun menggunakan bahasa pemrograman Maka rumus tersebut menjelaskan bahwa peluang
PHP dan MySql. Metode analisis yang digunakan adalah masuknya sampel karakteristik tertentu dalam kelas C
metode naive bayes. Sedangkan data yang diambil (Posterior) adalah peluang munculnya kelas C (sebelum
bersumber dari media-media diantaranya playstore masuknya sampel tersebut, seringkali disebut prior),
bukalapak, facebook, twitter, kompas dan detik. dikali dengan peluang kemunculan karakteristik-
karakteristik sampel pada kelas C (disebut juga
likelihood), dibagi dengan peluang kemunculan
2. Pembahasan
karakteristik-karakteristik sampel secara global (disebut
2.1. Sentimen Analisys juga evidence). Karena itu, rumus di atas dapat pula
ditulis secara sederhana sebagai berikut:
Sentiment analysis adalah studi komputasi mengenai
sikap, emosi, pendapat, penilaian, padangan dari Posterior=priorxlikelihood/evidence (3)
sekumpulan teks yang fokusnya adalah mengekstraksi,
Nilai Evidence selalu tetap untuk setiap kelas pada satu
mengindentifikasi atau menemukan karakteristik
sampel. Nilai dari posterior tersebut nantinya akan
sentimen dalam unit teks menggunakan metode
dibandingkan dengan nilai-nilai posterior kelas lainnya
NLP(Natural Language Processing), statistik atau
untuk menentukan ke kelas apa suatu sampel akan
machine learning [12]. Sentiment analysis merupakan
diklasifikasikan. Penjabaran lebih lanjut rumus Bayes
proses klasifikasi dokumen tekstual ke dalam beberapa
kelas seperti sentimen positif dan negatif serta besarnya tersebut dilakukan dengan menjabarkan (𝐶|𝐹1, … , 𝐹𝑛)
pengaruh dan manfaat dari sentimen analisis menggunakan aturan perkalian sebagai berikut:
menyebabkan penelitian ataupun aplikasi mengenai 𝑃(𝐶|𝐹1, … , 𝐹𝑛 = 𝑃(𝐶)𝑃(𝐹1, … , 𝐹𝑛|𝐶)
sentimet analysis [8], [12].
= 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2, … , 𝐹𝑛|𝐶, 𝐹1)
2.2. Naïve Bayes
= 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2|𝐶, 𝐹1 )𝑃(𝐹3, … , 𝐹𝑛|𝐶, 𝐹1,𝐹2
Naive Bayes merupakan sebuah pengklasifikasian
probabilistik sederhana yang menghitung sekumpulan = (𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2 |𝐶, 𝐹1 )𝑃(𝐹3|𝐶, 𝐹1,𝐹2)𝑃(𝐹4, … ,
probabilitas dengan menjumlahkan frekuensi dan 𝐹𝑛|𝐶, 𝐹1, 𝐹2, 𝐹3)
kombinasi nilai dari dataset yang diberikan [7]. = 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2 |𝐶, 𝐹1 )𝑃(𝐹3|𝐶, 𝐹1,𝐹2) … 𝑃(𝐹𝑛 |𝐶,
Algoritma mengunakan teorema Bayes dan 𝐹1, 𝐹2, 𝐹3, … , 𝐹𝑛−1 ) (4)
mengasumsikan semua atribut independen atau tidak
saling ketergantungan yang diberikan oleh nilai pada Dapat dilihat bahwa hasil penjabaran tersebut
variabel kelas[7], [13]. menyebabkan semakin banyak dan semakin
kompleksnya faktor - faktor syarat yang mempengaruhi
Persamaan dari teorema Bayes adalah [7], [14], [15]: nilai probabilitas, yang hampir mustahil untuk dianalisa
P(H│X)=(P(X│H).P(H))/P(X) (1) satu persatu. Akibatnya, perhitungan tersebut menjadi
sulit untuk dilakukan. Di sinilah digunakan asumsi
Keterangan: independensi yang sangat tinggi (naif), bahwa masing-
X: Data dengan class yang belum diketahui masing petunjuk (F1,F2...Fn) saling bebas (independen)
satu sama lain. Dengan asumsi tersebut, maka berlaku
H: Hipotesis data merupakan suatu class spesifik suatu kesamaan sebagai berikut:
P(H|X): Probabilitas hipotesis H berdasar kondisi X P(Fi│Fj)=P(Fi∩Fj)/P(Fj) =P(Fi)P(Fj)/P(Fj) =P(Fi)
(posteriori probabilitas) (5)
P(H): Probabilitas hipotesis H (prior probabilitas) Untuk i≠j, sehingga
P(X|H): Probabilitas X berdasarkan kondisi pada 𝑃(𝐹𝑖 |𝐶, 𝐹𝑗) = 𝑃(𝐹𝑖 |𝐶) (6)
hipotesis H
Persamaan di atas merupakan model dari teorema Naive
P(X) : Probabilitas X Bayes yang selanjutnya akan digunakan dalam proses
Untuk menjelaskan metode Naive Bayes, perlu diketahui klasifikasi. Untuk klasifikasi dengan data kontinyu
bahwa proses klasifikasi memerlukan sejumlah petunjuk digunakan rumus Densitas Gauss :
untuk menentukan kelas apa yang cocok bagi sampel
P(Xi=xi│Y=yj)=1/√2πσij e^((x_i-μ_ij )^2/(2σ^2
yang dianalisis tersebut. Karena itu, metode Naive Bayes
ij)) (7)
di atas disesuaikan sebagai berikut:
Keterangan:
2
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018
Berdasarkan tahapan skor yang ada, maka kode proses 3.1. Kesimpulan
skor (Lampiran 1) dapat dijelaskan sebagai berikut:
diawali dengan pencarian kata dan icon negatif yang Berdasarkan hasil penelitian yang telah dilakukan, dapat
terkandung dalam opini yang diinputkan (kode baris 2- disimpulkan bahwa analisis sentimen terhadap opini
6); menghitung skor berdasarkan masing-masing masyarakat dilakukan dengan metode Naïve Bayes.
kategori (kode baris 7); kemudian dilakukan pencocokan Metode Naïve Bayes digunakan karena lebih akurat
dari kata-kata yang terdapat dalam inputan opini dengan dalam klasifikasi data-data yang sudah diolah.
kamus yang ada (baris kode 10-21); dari hasil Probabilitas yang dihasilkan metode Naïve Bayes
pencocokan yang ada, dibentuk presentase untuk setiap dengan jelas menyatakan bahwa opini sentimen
kategori penilaian, dalam hal ini negatif, netral dan masyarakat terhadap Bukalapak bernilai netral. Nilai
positif (basri kode 22-30). probabilitas yang dihasilkan dari metode Naïve Bayes
adalah 37%(Positif), 50%(Netral), dan 13%(Negatif).
Sedangkan untuk penetuan skor (lampiran 2) dijelaskan
sebagai berikut: melakukan perhitungan skor untuk 3.2. Rancangan Sistem
inputan opini (baris kode 3); hasil perhitungan tersebut Saran untuk penelitian mengenai analisis sentimen ke
akan diklasifikasi kedalam kategori yang telah depan adalah melakukan analisis sentimen dengan
ditentukan (basris kode 4-5), diantaranya (negatif, netral
3
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018
metode yang berbeda untuk membedakan metode mana [10] G. A. Buntoro, “Analisis Sentimen Calon Gubernur DKI Jakarta
yang memberikan keakuratan terbaik dalam 2017 Di Twitter,” 32 Integer J. Maret, vol. 1, no. 2016, pp. 32–41,
menganalisis opini-opini sentimen terhadap suatu objek. 2017.
[11] M. Bilal, H. Israr, M. Shahid, and A. Khan, “Sentiment
classification of Roman-Urdu opinions using Naïve Bayesian,
Daftar Pustaka Decision Tree and KNN classification techniques,” J. King Saud
[1] Aingindra, “Artikel Perkembangan Teknologi Informasi.” Univ. - Comput. Inf. Sci., vol. 28, no. 3, pp. 330–344, 2016.
[Online]. Available: http://www.kliktekno.id/perkembangan- [12] I. K. E. Purnama, “Sentiment Analysis Berbasis Big Data,”
teknologi-informasi.html. [Accessed: 16-Nov-2017]. Rekayasa Teknol. Ind. dan Inf., pp. 142–149, 2014.
[2] Andr010, “Kemkominfo: Internet Jadi Referensi Utama [13] T. R. Patil, “Performance Analysis of Naive Bayes and J48
Mengakses Berita dan Informasi.” [Online]. Available: Classification Algorithm for Data Classification,” Int. J. Comput.
https://kominfo.go.id/index.php/content/detail/5421/Kemkominfo Sci. Appl. ISSN 0974-1011, vol. 6, no. 2, pp. 256–261, 2013.
%3A+Internet+Jadi+Referensi+Utama+Mengakses+Berita+dan+I [14] Bustami, “Penerapan Algoritma Naive Bayes,” J. Inform., vol. 8,
nformasi/0/berita_satker. [Accessed: 12-Nov-2017]. no. 1, pp. 884–898, 2014.
[3] A. Damar, “3 Fakta Mengejutkan Pengguna Internet di Indonesia,” [15] G. Feng, J. Guo, B.-Y. Jing, and T. Sun, “Feature subset selection
2016. [Online]. Available: using naive Bayes for text classification,” Pattern Recognit. Lett.,
http://tekno.liputan6.com/read/2435997/3-fakta-mengejutkan- vol. 65, pp. 109–115, 2015.
pengguna-internet-di-indonesia. [Accessed: 09-Nov-2017].
[4] C. Sur, “Kenali Modus Penipuan di Media Sosial dan Tips Biodata Penulis
Menangkalnya,” 2015. [Online]. Available:
Wivadario Wilan, Mahasiswa Fakultas Teknologi
http://surabaya.tribunnews.com/2015/06/03/kenali-metode-
penipuan-di-media-sosial-dan-tips-menangkalnya. [Accessed: 20-
Informasi, Universitas Kristen Satya Wacana, angkatan
Nov-2017]. 2015.
[5] Maxmanroe, “BukaLapak.com ~ Startup Bisnis yang Sandy Hanshe Hanasbey, Mahasiswa Fakultas
Mempelopori Keamanan Transaksi Online.” [Online]. Available: Teknologi Informasi, Universitas Kristen Satya Wacana,
https://www.maxmanroe.com/bukalapak-com-startup-yang- angkatan 2015.
mempelopori-keamanan-transaksi-online.html. [Accessed: 21- Meylan Ribka Awinero, Mahasiswa Fakultas Teknologi
Nov-2017]. Informasi, Universitas Kristen Satya Wacana, angkatan
[6] J. Prager, “Open-Domain Question–Answering,” Found. Trends® 2015.
Inf. Retr., vol. 1, no. 2, pp. 91–231, 2006. Jonathan Vorgorius Adeputra Modouw, Mahasiswa
[7] A. Saleh, “Implementasi Metode Klasifikasi Naïve Bayes dalam Fakultas Teknologi Informasi, Universitas Kristen Satya
Memprediksi Besarnya Penggunaan Listrik Rumah Tangga,” Citec
Wacana, angkatan 2015.
J., vol. 2, no. 3, pp. 207–217, 2015.
[8] N. Putranti and E. Winarko, “Analisis Sentimen Twitter untuk
Pak Melkior, memperoleh gelar Sarjana Komputer
Teks Berbahasa Indonesia dengan Maximum Entropy dan Support (S.Kom), Jurusan Teknik Informatika STMIK
Vector Machine,” Comput. Cybern. Syst., vol. 8, p. 1, 2014. AMIKOM Yogyakarta, lulus tahun 2006. Memperoleh
[9] K. Khan, B. Baharudin, A. Khan, and A. Ullah, “Mining opinion gelar Magister Komputer (M.Kom) Program Pasca
components from unstructured reviews: A review,” J. King Saud Sarjana Magister Teknik Informatika Universitas Gajah
Univ. - Comput. Inf. Sci., vol. 26, no. 3, pp. 258–275, 2014. Mada Yogyakarta, lulus tahun 2011.Saat ini menjadi
Dosen di STMIK AMIKOM Yogyakarta.
4
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018
Lampiran:
5
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018
6
Seminar Nasional Teknologi Informasi dan Multimedia 2018 ISSN : 2302-3805
UNIVERSITAS AMIKOM Yogyakarta, 10 Februari 2018
Lampiran 7. Summary.