Text Mining Untuk Mengklasifikasi Judul Skripsi Menggunakan Metode TF IDF Dan Algoritma C4.5

Authors

  • Ansari Ansari Universitas Ahmad Dahlan
  • Tedy Setiadi Universitas Ahmad Dahlan
  • Lisna Zahrotun Universitas Ahmad Dahlan

DOI:

https://doi.org/10.12928/jstie.v6i2.15245

Keywords:

Text Mining, TF-IDF, Algoritma C4.5, Judul Skripsi

Abstract

Skripsi merupakan karya ilmiah mahasiswa yang disusun dalam rangka memenuhi sebagian syarat penyelesaian studi pada program strata satu (S-1). Langkah awal yang dilakukan mahasiswa dalam mendaftar skripsi adalah mendaftarkan judul skripsi kepada Koordinator TA. Setelah mahasiswa mendaftar maka langsung di tentukan pembimbing dan pengujinya, tetapi dalam hal ini Koordinator TA menemui kesulitan dalam memilah skripsi setiap mahasiswa sesuai dengan bidang minatnya karena sebagai acuan untuk menentukan pembimbing dan pengujinya. Dengan banyaknya mahasiswa yang mendaftarkan skripsi, maka terdapat data skripsi yang melimpah. Data dari judul skripsi bisa dimanfaatkan untuk pencarian pola klasifikasi. Pola tersebut nantinya bisa di terapkan kedalam program untuk memudahkan Koordinator TA dalam menentukan skripsi mahasiswa sesuai dengan bidang minatnya untuk penentuan pembimbing dan pengujinya. Proses-proses text mining seperti tokenizing, filtering, stemming, cleaning, pembobotan, klasifikasi untuk pembentukan pola, dan pengujian keakurasian. Pembobotan dilakukan dengan TF-IDF sedangkan klasifikasi menggunakan Algoritma C4.5, untuk pengujian keakurasian dilakukan dengan menggunakan confussion matrix. Dalam penelitian yang telah dilakukan membuktikan bahwa TFIDF dan Algoritma C4.5 dapat diterapkan untuk mengklasifikasikan judul skripsi. Data set sebanyak 142 dengan menggunakan 130 data training dan 12 data testing, tingkat akurasi yang didapat mencapai 92%.

Author Biographies

Ansari Ansari, Universitas Ahmad Dahlan

Teknik Informatika

Tedy Setiadi, Universitas Ahmad Dahlan

Teknik Informatika

Lisna Zahrotun, Universitas Ahmad Dahlan

Teknik Informatika

References

Laksono, K. (2014). Pedoman Penulisan Skripsi. Surabaya: Universitas Negeri Surabaya.

Tif.uad.ac.id. (2013). Peserta Tugas Akhir Ganjil 13-14. Universitas Ahmad Dahlan. Retrieved from tif.uad.ac.id

Meliana, N. (2008). Deteksi Kesesuaian Bidang Minat Terhadap Proposal Tugas Akhir Mahasiswa. UKDW.

Prayitno, D. (2012). Penerapan Naive Bayes Classifier dalam Pengklasifikasian Jurnal Tugas Akhir. Universitas Pendidikan Indonesia, 10–38.

Raymond J. Mooney. (2006). Machine Learning Text Categorization. Austin: University of Texas.

Paik, J. (2013). TF IDF Scheme For Efective Ranking and Development Information Retrieval. Dublin.

Quinlan, J. . (1996). Improved Use of Continous Attributes in C4.5. Artificial Inntelligence Research, 77–90.

Kao, A. (2007). Natural Language Processing and Text Mining. United States of America: Business Media.

Downloads

Published

01-07-2018

Issue

Section

Articles