Text Mining Untuk Mengklasifikasi Judul Skripsi Menggunakan Metode TF IDF Dan Algoritma C4.5
DOI:
https://doi.org/10.12928/jstie.v6i2.15245Keywords:
Text Mining, TF-IDF, Algoritma C4.5, Judul SkripsiAbstract
Skripsi merupakan karya ilmiah mahasiswa yang disusun dalam rangka memenuhi sebagian syarat penyelesaian studi pada program strata satu (S-1). Langkah awal yang dilakukan mahasiswa dalam mendaftar skripsi adalah mendaftarkan judul skripsi kepada Koordinator TA. Setelah mahasiswa mendaftar maka langsung di tentukan pembimbing dan pengujinya, tetapi dalam hal ini Koordinator TA menemui kesulitan dalam memilah skripsi setiap mahasiswa sesuai dengan bidang minatnya karena sebagai acuan untuk menentukan pembimbing dan pengujinya. Dengan banyaknya mahasiswa yang mendaftarkan skripsi, maka terdapat data skripsi yang melimpah. Data dari judul skripsi bisa dimanfaatkan untuk pencarian pola klasifikasi. Pola tersebut nantinya bisa di terapkan kedalam program untuk memudahkan Koordinator TA dalam menentukan skripsi mahasiswa sesuai dengan bidang minatnya untuk penentuan pembimbing dan pengujinya. Proses-proses text mining seperti tokenizing, filtering, stemming, cleaning, pembobotan, klasifikasi untuk pembentukan pola, dan pengujian keakurasian. Pembobotan dilakukan dengan TF-IDF sedangkan klasifikasi menggunakan Algoritma C4.5, untuk pengujian keakurasian dilakukan dengan menggunakan confussion matrix. Dalam penelitian yang telah dilakukan membuktikan bahwa TFIDF dan Algoritma C4.5 dapat diterapkan untuk mengklasifikasikan judul skripsi. Data set sebanyak 142 dengan menggunakan 130 data training dan 12 data testing, tingkat akurasi yang didapat mencapai 92%.References
Laksono, K. (2014). Pedoman Penulisan Skripsi. Surabaya: Universitas Negeri Surabaya.
Tif.uad.ac.id. (2013). Peserta Tugas Akhir Ganjil 13-14. Universitas Ahmad Dahlan. Retrieved from tif.uad.ac.id
Meliana, N. (2008). Deteksi Kesesuaian Bidang Minat Terhadap Proposal Tugas Akhir Mahasiswa. UKDW.
Prayitno, D. (2012). Penerapan Naive Bayes Classifier dalam Pengklasifikasian Jurnal Tugas Akhir. Universitas Pendidikan Indonesia, 10–38.
Raymond J. Mooney. (2006). Machine Learning Text Categorization. Austin: University of Texas.
Paik, J. (2013). TF IDF Scheme For Efective Ranking and Development Information Retrieval. Dublin.
Quinlan, J. . (1996). Improved Use of Continous Attributes in C4.5. Artificial Inntelligence Research, 77–90.
Kao, A. (2007). Natural Language Processing and Text Mining. United States of America: Business Media.
Downloads
Published
Issue
Section
License
License and Copyright Agreement
In submitting the manuscript to the journal, the authors certify that:
- They are authorized by their co-authors to enter into these arrangements.
- The work described has not been formally published before, except in the form of an abstract or as part of a published lecture, review, thesis, or overlay journal. Please also carefully read Journal Posting Your Article Policy.
- The work is not under consideration for publication elsewhere.
- The work has been approved by all the author(s) and by the responsible authorities – tacitly or explicitly – of the institutes where the work has been carried out.
- They secure the right to reproduce any material that has already been published or copyrighted elsewhere.
- They agree to the following license and copyright agreement.
Copyright
Authors who publish with Jurnal Sarjana Teknik Informatika agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License (CC BY-SA 4.0) that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work.