PENERAPAN TEXT MINING PADA SISTEM KLASIFIKASI EMAIL SPAM MENGGUNAKAN NAIVE BAYES

Authors

  • Ervita Kusuma Putri Program Studi Teknik Informatika, Fakultas Teknologi Industri, Universitas Ahmad Dahlan
  • Tedy Setiadi Program Studi Teknik Informatika, Fakultas Teknologi Industri, Universitas Ahmad Dahlan

DOI:

https://doi.org/10.12928/jstie.v2i3.2877

Abstract

Email atau Elektronik mail merupakan salah satu fasilitas internet yang murah dan mudah digunakan untuk melakukan transfer informasi atau penyebaran informasi berupa file (mail attachment) antar pengguna internet .Tetapi tidak semua pengguna memanfaatkan email dengan baik dan benar. pengguna yang kurang baik memanfaatkan email untuk menyebarkan informasi yang tidak baik seperti virus dan iklan suatu perusahaan atau mempromosikan produk bisnis tertentu. Email yang seperti itulah yang lebih dikenal dengan email spam. Email spam dikirim ke banyak orang tanpa melakukan ijin terlebih dahulu ke pemilik email yang dituju. Berdasarkan permasalahan tersebut, maka dibuat suatu penelitian untuk mengembangkan suatu aplikasi text mining yang mampu mengklasifikasi email.

 

Text mining merupakan proses menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen dan tujuannya adalah mencari kata-kata yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa keterhubungan antar dokumen. Proses dalam text mining meliputi proses tokenisasi, stemming dan filtering. Metode pengumpulan data dengan metode kepustakaan. Tahapan pengembangan aplikasi meliputi perancangan proses, perancangan tabel, implementasi dan pengujian sistem. pengujian sistem dengan black box test dan alpha test.

 

Dari penelitian yang dilakukan menghasilkan sebuah perangkat lunak penerapan text mining pada sistem klasifikasi email spam menggunakan metode naive bayes. Pada klasifikasi email dihitung nilai probabilitas berdasarkan kemunculan kata yang terdapat dalam data email. pengujian keakurasian sistem ditampilkan berupa grafik nilai keakurasian, false positif dan false negatif. Hasil uji coba menunjukkan bahwa aplikasi ini layak dan dapat digunakan dan memiliki nilai keakurasian sistem sebesar 89,6 %.

 

Kata Kunci : Text Mining, Klasifikasi, Email spam, Naive Bayes

References

Graham,Paul.2002. A Plan for Spam. (http://www.paulgraham.com/spam.html , Diakses: 3 november 2012).

Feldman, Ronen.,Sanger, James.2007.The Text Mining Handbook: Advanced Unstructure Data. New York : Cambridge University Press.

Rachli, Muhamad.2007. Email Filtering Menggunakan Naive Bayes.Tugas Akhir. Program Studi Teknik Elektro, Institut Teknologi Bandung, Bandung.

Anugroho, Prasetyo. 2010. Klasifikasi Email Spam Dengan Metode Naive Bayes Classifier Menggunakan Java Programming. Skripsi. Politeknik Elektro Negeri Surabaya, Institut Teknologi Sepuluh Nopember, Surabaya.

Han, Jiawei and M. Kamber. 2001. Data Mining: Concepts and Techniques. USA: Academic Press.

Pop,Ioan.2006. An approach of the Naive Bayes classifier for the document

classification.Jurnal. Volume 14, No.4,

http://www.emis.de/journals/GM/vol14nr4/pop/pop.pdf.

Downloads

Published

01-10-2014

Issue

Section

Articles