Penerapan Metode K-Nearest Neighbor Dan Decision Tree Untuk Analisis Sentimen( Studi Kasus Mario Dandi)
##plugins.themes.academic_pro.article.main##
Abstract
Media Sosial merupakan salah satu media komunikasi yang saat ini banyak digunakan oleh para pengguna internet, salah satunya adalah Twitter, sebuah situs yang menyediakan layanan mikroblog sehingga penggunanya dapat berbagi ide, pendapat atau sekedar kehidupan melalui postingan pendek yang disebut Tweets. Tweet pengguna Twitter sangatlah beragam, dari tweet tersebut terdapat data yang dapat diolah menjadi Analisis Sentimen sehingga dapat menjadi informasi yang bermanfaat bagi beberapa pihak. Penelitian ini bertujuan untuk membuat sistem analisis sentimen yang dapat menghasilkan data dan informasi berupa sentimen positif, sentimen negatif, sentimen netral. Metode yang digunakan untuk mengklasifikasikan sentimen adalah metode K-Nerest Neighbor dan Decision Tree. Masukan dari sistem ini berupa tweet dari masyarakat mengenai penganiayaan yang dilakukan oleh anak pegawai pajak mario dandi. Hasil dari sistem ini berupa visualisasi data untuk sentimen positif, sentimen negatif,dan sentimen netral.
Tahapan penelitian dalam melakukan analisis sentimen yakni Studi Literature, Crawling, Translate, Preprocessing, Labeling, Split Data, Supervised Learning, Evaluasion dengan menggunakan algoritma K-Nearest Neighbor dan Decission Tree. Hasil perhitungan algoritma K-Nearest Neighbor dan Decission Tree menggunakan 18.080 data komentar dari Twitter dengan #mariodandi, dengan hasil proses preprocessing sebanyak 2930 data dengan hasil 1.200 komentar negatif, 1.036 data komentar netral dan 687 data positif komentar. Untuk algoritma K-Nearest Neighbor menghasilkan tingkat akurasi sebesar 93,50% dan untuk algoritma Decission Tree menghasilkan tingkat akurasi sebesar 47,84%. Hasil akurasi algoritma K-Nearest Neighbor dalam data set ini tingkat akurasinya lebih baik dari Decesion tree.