TEMPLATE JURNAL IJCCS

Download Abstrak. Seiring perkembangan zaman, pertumbuhan teknologi informasi yang sangat pesat memberikan dampak positif bagi perusahaan yang berge...

0 downloads 472 Views 374KB Size
IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 ISSN: 1978-1520

1

Text Mining Untuk Analisa Sentiment Ekspedisi Jasa Pengiriman Barang Menggunakan Metode Naive Bayes Pada Aplikasi J&T Express 1,2

Azam Faiz Kamal1, Budi Widjajanto2 Sistem Informasi, Fakultas Ilmu Komputer, Universitas Dian Nuswantoro Jl. Nakula 5-11, Semarang 50131, 024-3517261 e-mail: [email protected],[email protected]

Abstrak Seiring perkembangan zaman, pertumbuhan teknologi informasi yang sangat pesat memberikan dampak positif bagi perusahaan yang bergerak dalam bidang industri, penjualan dan jasa. Pada akhirnya berujung pada meningkatnya kebutuhan jasa pengiriman barang (ekspedisi). J&T Express merupakan perusahaan ekspedisi terbesar di Indonesia karena memiliki akses yang sangat luas sehingga sangat memudahkan masyarakat untuk hal mengirim barang. Sentiment Analysis atau disebut juga opinion mining, merupakan bidang studi yang menganalisis opini, sentimen, evaluasi, penilaian, sikap dan emosi publik terhadap suatu entitas seperti produk, pelayanan, organisasi, individu, masalah, peristiwa, topik, dan atributnya.Salah satu metode yang akan digunakan dalam analisa sentimen penelitianini yaitu Naïve Bayes Classifier. Metode evaluasi yang digunakan adalah confusion matrix.Hasil proses klasifikasi menggunakan algoritma klasifikasi Naive Bayes terhadap 300 komentar menghasilkan tingkat akurasi sebesar 83%.

Kata kunci—klasifikasi, naive bayes, ekspedisi, analysis sentiment, confusion matrix

Abstract With the development of the times, the growth of information technology is very rapidly give a positive impact for companies engaged in industry, sales and services. In the end resulted in the increasing needs of freight forwarding services (expeditions). J & T Express is the largest expedition company in Indonesia because it has a very wide access so it is very easy for people to send goods. Sentiment Analysis, also called opinion mining, is a field of study that analyzes the opinions, sentiments, evaluations, judgments, attitudes and public emotions of an entity such as products, services, organizations, individuals, problems, events, topics, and attributes. One of the methods to be used in the analysis of this research sentiment is Naïve Bayes Classifier. The evaluation method used is confusion matrix. The results of the classification process using the Naive Bayes classification algorithm of 300 comments resulted in an accuracy of 83%. Keywords—classification, naive bayes, expedition, analysis sentiment, confusion matrix

Received June1st,2012; Revised June25th, 2012; Accepted July 10th, 2012

2



ISSN: 1978-1520

1. PENDAHULUAN Seiring perkembangan zaman, pertumbuhan teknologi informasi yang sangat pesat memberikan dampak positif bagi perusahaan yang bergerak dalam bidang industri, penjualan dan jasa.Berbagai macam produk dan jasa pun terus menerus mengalami peningkatan. Dengan adanya peningkatan banyak bisnis online yang kian bermuculan dan menjamur. Mengakibatkan transaksi online serta pengiriman barang online pun menjadi kian marak. Pada akhirnya berujung pada meningkatnya kebutuhan jasa pengiriman barang (ekspedisi). Jasa pengiriman barang (ekspedisi) yaitu sebuah perusahaan yang bergerak dalam bidang pengiriman barang yang saat ini tumbuh pesat dalam dunia bisnis.Perusahaan dalam bidang ini bersaing untuk memberikan pelayanan terbaik pada pelanggannya baik dalam hal ketepatan waktu sampai pada ketepatan barang pada tempat tujuan maupun sistem transaksi pengiriman barang yang berhubungan langsung dengan pelanggan. J&T Express merupakan perusahaan ekspedisi terbesar di Indonesia karena memiliki akses yang sangat luas sehingga sangat memudahkan masyarakat untuk hal mengirim barang. Dalam hal waktu, J&T Express konsisten dalam melakukan pengiriman barang dengan kecepatan yang telah teruji dan tepat waktu. Selain itu juga memiliki sistem monitoring yang sangat baik melalui situs www.jetexpress.co.id. Dikelola oleh tim manajemen J&T Express yang profesional sehingga memudahkan pelanggan untuk melakukan pengecekan paket kiriman. Saat ini media sosialmenjadi trend yang paling banyak dinikmati pengguna internet untuk berbagi informasi kepada masyarakat luas. Mereka dapat berbagi informasi menggunakan berbagai macam content seperti gambar, video, atau artikel di layanan media sosial. Mereka pun dapat mengekspresikan pendapat atau perasaannya melalui layanan media sosial, seperti twitter, facebook, Instagram dan sebagainya. Seiring berkembangnya waktu, pelanggan menjadi sering membicarakan akan layanan dari J&T Express. Pelanggan sering memberikan pendapat dan opininya melalui ulasan komentar pada aplikasi J&T yang disediakan googlePlaystore.Perusahaan J&T Express memiliki aplikasi di Google Playstore, untuk memberikan informasi tentang layanan maupun menampung komentar-komentar dari pelanggan. Opini yang diberikan pelanggan melalui komentar pada ulasan aplikasi J&T pun beragam. Sentiment Analysis, atau disebut juga opinion mining, merupakan bidang studi yang menganalisis opini, sentimen, evaluasi, penilaian, sikap dan emosi publik terhadap suatu entitas seperti produk, pelayanan, organisasi, individu, masalah, peristiwa, topik, danatributnya. Macam metode klasifikasi pada analisa sentimen adalah KNN (K-Nearest Neighbor), Neural Networks, NBC (Naïve Bayes Classifier), Decision Tree,dan SVM (Support Vector Machines). Salah satumetode yang akan digunakan dalam analisa sentimen penelitianini yaitu Naïve Bayes Classifier. Naïve Bayes Classifier adalah sebuah metode klasifikasi yang menggunakan perhitungan probabilitas.Naïve Bayes memiliki kesederhanaan dalam implementasi dan efisiensi kebutuhan sumberdaya komputasi di banding dengan metode lain. Naïve Bayes Classifier dapat melakukan kinerja dengan sangat baik pada klasifikasi teks, kesederhanaan, dan efisiensi terutama untuk berbagai aplikasi praktis seperti spam filtering atau klasifikasi artikel berita[1]. Banyaknya komentar-komentar yang ada di ulasanaplikasiJ&T Express pada Google Playstore. Membawaberbagaimacampengaruh yang besarbagipiak J&T EXPRESS karenameliputikomentar yang puasmaupuntidakpuas, makapenelitimembuatsuatusistemkerja IJCCS Vol. x, No. x, July201x : first_page–end_page

IJCCS

ISSN: 1978-1520

 3

yang terdiri dari perangkat lunak berbasis web untuk pengelompokan komentar pada ulasan komentar J&T Express pada Google Playstore yang diklasifikasi menjadi 3 kategoriyaitupuas, tidakpuas, dannetral. Kemudian dianalisa menggunakan metodeNaïve Bayes Classifier. Penyajian penelitian ini dalam bentuk aplikasi web dikarenakan masyarakat sering mengunjungi web saat mereka mengakses internet.Komentar dan ulasan aplikasi J&T Express dapat dimanfaatkan untuk menilaitingkat pelayanan dari J&T Express.Nilai pelayanan tersebut didapatkan dengan melihat komentar puas atau tidak puas dari opini pelanggan. 2. METODE PENELITIAN

1. 2. 3. 4. 5. 6. 7. 8.

Awal mula pengumpulan dokumen berupa komentar tanpa label pada ulasan aplikasi J&T Express di Google Playstorepada 3 bulan terakhir. Selanjutnya, komentar diberi label yaitu puas, netral, dan tidak puas secara manual berdasarkan pemahaman bahasa alami manusia. Dokumen berupa komentar tersebutakan mengalami tahapan Preprocessing (case folding, tokenization, stopwords, dan stemming). Hasil proses dari tahapan preprocessing ini akan disimpan pada database MySQLyang dapat diakses saat aplikasi analisa sentimen digunakan. Kemudian data yang disimpan di dalam database MySQL digunakan sebagai data training. Data training digunakan sebagai data testing. Data trainingakan digunakan untuk bahan pengklasifikasian Naïve Bayes Classifier kedalam katerogipuas, tidak puas dan netral. Evaluasi hasil klasifikasi terhadap data training menggunakan confussion matrix.

Title of manuscript is short and clear, implies research results (First Author)

4



ISSN: 1978-1520

A.

Preprocessing Preprocessing merupakanatahapan awaladalam mengolahadata input sebelumamemasuki proses tahapanautama dari metode Latent Semantic Analysis (LSA).Preprocessing text dilakukanauntuk tujuan penyeragaman dan kemudahan pembacaan serta proses LSA selanjutnya(Aji P., Baizal SSi. and Firdaus S.T., 2011). Preprocessing terdiri dari beberapa tahapan.Adapun tahapan preprocessingaberdasarkan, yaitu[10]: 1. Case folding merupakanatahapan yang mengubah semua hurufadalam dokumenamenjadi huruf kecil. Hanyahuruf ‗a‘ sampai dengan ‗z‘ yangaditerima. Karakteraselain huruf dihilangkanadan dianggap delimiter (pembatas). 2. Tokenizing / parsing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Selainitu, spasi digunakan untuk memisahkan antar kata tersebut. 3. Filtering adalah tahap mengambil kata – kata penting dari hasil tokenizing. Proses filtering dapat menggunakan algoritma stoplist (membuang kata yang kurang penting) atau wordlist (menyimpanakatapenting). Stoplist / stopwordadalah kata-kataa yang tidak deskriptif yang dapat dibuang dalam pendekatan bag-of-words. Contoh stop word adalah ―yang‖, ―dan‖, ―di‖, ―dari‖ dan lain – lain. 4. Stemming merupakan suatu proses yang terdapat dalam sistem IR yang mentransformasi kata-katayang terdapat dalam suatu dokumen ke kata-kata akarnya (root word) dengan menggunakan aturan-aturan tertentu. Stemming kebanyakan digunakanpa dateks berbahasa inggris dikarenakan teks berbahasa inggris memiliki struktur imbuhan yang tetapa dan mudah untuk di olah sementara stemming untuk proses bahasa Indonesia memiliki struktur imbuhan yang rumit / kompleks sehingga agak lebihasusah untukadiolah.

B.

Naive Bayes Salahasatu teknik pembelajaranayang digunakanadalam sentimen analisis adalah Naive Bayes Classifier (NBC). Naive Bayes Classifier merupakanasebuah pengklasifikasi probabilitas sederhana yang mengaplikasikan Teori Bayes denganasumsi ketidaktergantungan (independent) yang tinggi. Naive Bayes Classifier metodeayang sederhana, walaupunamerupakan metode sederhana tetapi memiliki performaadan akurasiayang tinggi[13]. Metode pengklasifikasian dengan menggunakan metode probabilitasadan statistik yangadikemukakan oleh ilmuwanInggrisThomas Bayes, yaitu memprediksi peluang di masaadepan berdasarkan pengalamanadi masa sebelumnya sehingga dikenal sebagai teori Bayes.Formulaaumum pada Teorema Bayes sebagai berikut: ( | ) ( ) (2.1) ( | ) ( ) Keterangan : P (C|E) : Probabilitas akhir bersyarat (conditional probability) suatu hipotesis C terjadijika diberikan bukti (evidence) E terjadi. P (E|C) : Probabilitas sebuah bukti E terjadi akan memengaruhi hipotesis C. P (C) : Probabilitas awal (priori) hipotesis C terjadi tanpa memandang bukti apapun. P (E) : Probabilitas awal (priori) bukti E terjadi tanpa memandang hipotesis/bukti yang lain.

IJCCS Vol. x, No. x, July201x : first_page–end_page

IJCCS

 5

ISSN: 1978-1520

Metode Naive Bayes Classifier merupakan penyederhaan dari algoritma Naive Bayes dan cocok digunakan dalam pengklasifikasian teks atau dokumen[14]. Persamaannya adalah : VMAP = avgmaxP(Vj | a1, a2, …,an)

(2.2)

Berdasarkan persamaan tersebut, maka rumus bayes dapat di tulis menjadi[15]: (2.3) ( | ) ( ) ( Karena kategori ( dapat ditulis sebagai berikut :

)

) merupakan bilangan konstanta, maka persamaanya (

|

) (

)

(2.4)

Dari persamaan diatas dapat disederhanakan menjadi : ∏ (

|

) (

(2.5)

)

Dimana untuk : Vj = Kategori opini dari j = 1, 2, 3, ..., n. Dimana dalam penelitian ini adalah kategori opinipuas, adalah kategori opini tidak puas, adalah kategori opini netral. ( | )= Probabilitas pada kategori . ( ) = Probabilitas dari . Untuk menghitung P(Vj) dan P(an|Vj) pada saat pelatihan dimana persamaanya sebagai berikut : | | (2.6) P(V ) = j

P(an|Vj) =

|

|

|

|

(2.7)

Dimana untuk : |docs| adalah frekuensi dokumen setiap kategori. |contoh| adalah jumlah dokumen yang ada. nkadalah jumlah frekuensi kemunculan setiap kata. nadalah jumlah frekuensi kemunculan dari setiap kategori. |kosakata |adalah jumlah semua kata dari semua kategori. C.

Confusion Matrix Confusion matrix adalahsuatumetode biasanyadigunakanuntukmelakukanperhitunganakurasi.

yang

Title of manuscript is short and clear, implies research results (First Author)



6

ISSN: 1978-1520

Akurasi =

x 100%

Keterangan: TP (True Puas) TTP(True TidakPuas) TN(True Netral)

(3.4)

= jumlah hasil klasifikasi bernilai puas pada sistem dan bernilai puas pada data training berlabel. = jumlah hasil klasifikasi bernilai tidak puas pada sistem dan bernilai tidak puas pada data training berlabel. = jumlah hasil klasifikasi bernilai netral pada sistem dan bernilai netralpada data training berlabel.

3.HASIL DAN PEMBAHASAN Berdasarkan data hasil klasifikasi terhadap data training menggunakan metode Naïve Bayes sebanyak 300 data komentar, diperoleh 249 data benardari 300 data yang digunakan. Maka dapat dihitung nilai akurasi sebagai berikut: Jumlah TP (True Puas)

=

88

Jumlah TTP (True TidakPuas)

=

117

Jumlah TN (True Netral)

=

44

Akurasi

=

x 100%

= =

x 100% x 100%

= 83%

IJCCS Vol. x, No. x, July201x : first_page–end_page

IJCCS

ISSN: 1978-1520

 7

4. KESIMPULAN Berdasarkan pengujian yang telah dilakukan pada bab sebelumnya, dapat disimpulkan bahwa dengan menggunakan metode Naive Bayes akurasi yang didapat sebesar 83%. Dari hasil akurasi tersebut maka membuktikan bahwa metode naive bayes layak digunakan sebagai salah satu metode dalam pengklasifikasian pada studi kasus didalam penelitian ini.

5. SARAN Pada penelitian ini faktor yang mempengaruhi adalah jumlah kosa kata dan jenis bahasa yang digunakan pada setiap komentar (tidak baku). Untuk penelitian selanjutnya dapat ditambahkan fitur untuk merubah kata yang tidak baku menjadi kata baku dan juga kosa kata yang digunakan dapat ditambahkan supaya beragam dan dapat mengenali berbagai macam kata atau bahasa sehingga dapat meningkatkan akurasi.

DAFTAR PUSTAKA [1] [2]

[3]

[4]

S. Kim, K. Han, H. Rim, and S. H. Myaeng, ―Some Effective Techniques for Naive Bayes Text Classification,‖ vol. 18, no. 11, pp. 1457–1466, 2006. F. G. J. Rupilele, D. Manongga, and W. H. Utomo, ―Sentiment analysis of national exam public policy with Naive Bayes Classifier method (NBC),‖ J. Theor. Appl. Inf. Technol., vol. 58, no. 1, pp. 157–165, 2013. L. Wikarsa and S. N. Thahir, ―A text mining application of emotion classifications of Twitter‘s users using Na??ve Bayes method,‖ Proceeding 2015 1st Int. Conf. Wirel. Telemat. ICWT 2015, 2016. P. Aliandu, ―Sentiment Analysis to Determine Accommodation, Shopping and Culinary Location on Foursquare in Kupang City,‖ Procedia Comput. Sci., vol. 72, pp. 300–305, Title of manuscript is short and clear, implies research results (First Author)

8

[5]

[6]

[7] [8] [9] [10]

[11] [12] [13] [14] [15]



ISSN: 1978-1520

2015. L. Dey, S. Chakraborty, A. Biswas, B. Bose, and S. Tiwari, ―Sentiment Analysis of Review Datasets Using Naïve Bayes‗ and K-NN Classifier,‖ Int. J. Inf. Eng. Electron. Bus., vol. 8, no. 4, pp. 54–62, 2016. M. Bilal, H. Israr, M. Shahid, and A. Khan, ―Sentiment classification of Roman-Urdu opinions using Naive Bayesian, Decision Tree and KNN classification techniques,‖ J. King Saud Univ. - Comput. Inf. Sci., vol. 28, no. 3, pp. 330–344, 2016. ―Pengaruh Produk, Harga, Personal Dan Bukti Fisik Terhadap Kepuasan Pelanggan (Studi Kasus Rumah Makan Sinjay Bangkalan),‖ pp. 7–38, 2009. Kandang Software, Mengungkap Rahasia Menghasilkan Dollar Dengan Aplikasi Android Tanpa Coding. . T. Mining, ―Media Masa Online Menggunakan Algoritma,‖ vol. 1, no. 1, pp. 1–7, 2015. A. Setiawan, I. F. Astuti, and A. H. Kridalaksana, ―Klasifikasi Dan Pencarian Buku Referensi Akademik Menggunakan Metode Naïve Bayes Classifier ( Nbc ) ( Studi Kasus : Perpustakaan Daerah Provinsi Kalimantan Timur ),‖ vol. 10, no. 1, 2015. K. Antara, A. C. Dan, N. Bayes, D. Iskandar, and Y. K. Suprapto, ―Perbandingan Akurasi Klasifikasi Tingkat,‖ vol. 2, no. 1, pp. 37–43, 2015. J. Ring, R. Utara, and C. Catur, ―Sinopsis Menggunakan Metode Naïve Bayes.‖ R. Agustina, ―Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 7 No 3 - 2015 - ijns.org,‖ vol. 7, no. 3, pp. 7–12, 2015. O. Online, ―Analisis Sentimen pada Jasa Ojek Online ... (Nugroho dkk.),‖ pp. 156–161, 2015. R. Raksanagara, ―Analisis Sentimen Jasa Ekspedisi Barang Menggunakan Metode Naive Bayes,‖ pp. 19–24, 2016.

IJCCS Vol. x, No. x, July201x : first_page–end_page