Text Mining Untuk Mengklasifikasi Judul Skripsi Menggunakan Metode TF IDF Dan Algoritma C4.5

Ansari Ansari, Tedy Setiadi, Lisna Zahrotun

Abstract


Skripsi merupakan karya ilmiah mahasiswa yang disusun dalam rangka memenuhi sebagian syarat penyelesaian studi pada program strata satu (S-1). Langkah awal yang dilakukan mahasiswa dalam mendaftar skripsi adalah mendaftarkan judul skripsi kepada Koordinator TA. Setelah mahasiswa mendaftar maka langsung di tentukan pembimbing dan pengujinya, tetapi dalam hal ini Koordinator TA menemui kesulitan dalam memilah skripsi setiap mahasiswa sesuai dengan bidang minatnya karena sebagai acuan untuk menentukan pembimbing dan pengujinya. Dengan banyaknya mahasiswa yang mendaftarkan skripsi, maka terdapat data skripsi yang melimpah. Data dari judul skripsi bisa dimanfaatkan untuk pencarian pola klasifikasi. Pola tersebut nantinya bisa di terapkan kedalam program untuk memudahkan Koordinator TA dalam menentukan skripsi mahasiswa sesuai dengan bidang minatnya untuk penentuan pembimbing dan pengujinya. Proses-proses text mining seperti tokenizing, filtering, stemming, cleaning, pembobotan, klasifikasi untuk pembentukan pola, dan pengujian keakurasian. Pembobotan dilakukan dengan TF-IDF sedangkan klasifikasi menggunakan Algoritma C4.5, untuk pengujian keakurasian dilakukan dengan menggunakan confussion matrix. Dalam penelitian yang telah dilakukan membuktikan bahwa TFIDF dan Algoritma C4.5 dapat diterapkan untuk mengklasifikasikan judul skripsi. Data set sebanyak 142 dengan menggunakan 130 data training dan 12 data testing, tingkat akurasi yang didapat mencapai 92%.

Keywords


Text Mining; TF-IDF; Algoritma C4.5; Judul Skripsi

Full Text:

PDF

References


Laksono, K. (2014). Pedoman Penulisan Skripsi. Surabaya: Universitas Negeri Surabaya.

Tif.uad.ac.id. (2013). Peserta Tugas Akhir Ganjil 13-14. Universitas Ahmad Dahlan. Retrieved from tif.uad.ac.id

Meliana, N. (2008). Deteksi Kesesuaian Bidang Minat Terhadap Proposal Tugas Akhir Mahasiswa. UKDW.

Prayitno, D. (2012). Penerapan Naive Bayes Classifier dalam Pengklasifikasian Jurnal Tugas Akhir. Universitas Pendidikan Indonesia, 10–38.

Raymond J. Mooney. (2006). Machine Learning Text Categorization. Austin: University of Texas.

Paik, J. (2013). TF IDF Scheme For Efective Ranking and Development Information Retrieval. Dublin.

Quinlan, J. . (1996). Improved Use of Continous Attributes in C4.5. Artificial Inntelligence Research, 77–90.

Kao, A. (2007). Natural Language Processing and Text Mining. United States of America: Business Media.




DOI: http://dx.doi.org/10.12928/jstie.v6i2.15245

Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Ansari Ansari, Tedy Setiadi, Lisna Zahrotun

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.


Jurnal Sarjana Teknik Informatika
Organized by Informatics Department
Published by Universitas Ahmad Dahlan
Website: http://journal.uad.ac.id/index.php/JSTIF
Office: Industrial Technology Faculty, Kampus Utama UAD Jalan Ahmad Yani (Ringroad Selatan), Tamanan, Banguntapan, Bantul, Yogyakarta 55166, Indonesia
Email: herman.yuliansyah@tif.uad.ac.id || jurnalsarjana@tif.uad.ac.id


 

Creative Commons License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.