Penerapan Text Mining Pengelompokkan Judul Kerja Praktek Menggunakan Metode K-Means Clustering dengan Cosine Similarity
DOI:
https://doi.org/10.12928/jstie.v6i3.15257Keywords:
Text Mining, K-Means Clustering, Cosine SimilarityAbstract
Kerja Praktek adalah kegiatan mahasiswa yang dilakukan di masyarakat maupun di perusahaan atau instansi untuk mengaplikasikan ilmu yang diperoleh dan melihat relevansinya di masyarakat maupun melalui jalur pengembangan diri dengan mendalami bidang ilmu tertentu dan aplikasinya. Dalam pelaksanaanya, tidak sedikit mahasiswa bingung menentukan sebuah instansi, perusahaan ataupun tempat lain untuk dijadikan tempat Kerja Praktek. Oleh karena itu, perlu adanya pengelompokkan Judul Kerja Praktek sehingga dapat menjadi salah satu referensi pengetahuan bagi mahasiswa untuk mengetahui pola kelompok judul kerja praktek yang ada. Dalam pengelompokkan tersebut, dapat menggunakan metode Text Mining K-Means Clustering dengan Cosine Similarity untuk dapat mengelompokkan judul kerja praktek. Penelitian ini dilakukan untuk mengkaji tentang algoritma K-Means Clustering dengan Cosine Similarity dan mengimplementasikan algoritma K-Means Clustering dengan Cosine Similarity dengan melakukan tahapan tokenizing, filtering dan stemming sehingga pada akhirnya akan didapatkan cluster-cluster judul kerja praktek. Data yang digunakan adalah data judul kerja praktek Teknik Informatika Universitas Ahmad Dahlan sebanyak 355 data. Hasil pengujian dilakukan uji purity sebanyak 5 kali percobaan, dengan mengkombinasikan parameter M yang berbeda-beda sebagai titik pusat cluster diperoleh nilai terbaik sebesar 0,85 dengan kombinasi M=6 yang artinya semakin mendekati 1 mengindikasikan bahwa semakin banyak dokumen yang berhasil dikelompokkan dengan benar.References
Kurniawan, B., Effendi, S., sitompul, O.S., 2012, Klasifikasi Konten Berita Dengan Metode Text Mining, Jurnal Dunia Teknologi Informasi, Vol.1, No. 1, Hal.14-19.
Alfina, T., Santosa, B., Barakbah, A.R., 2012, Analisa Perbandingan Metode Hierarchical Clustering, K-Means Dan Gabungan Keduanya Dalam Cluter Data (Studi Kasus : Problem Kerja Praktek Jurusan Teknik Industri Its), Jurnal Teknik ITS, vol.1, ISSN: 2301-9271, September 2012.
Imbar, R.V., Adelia., Ayub, M., Rehatta, A., 2014, Implementasi Cosine Similarity dan Algoritma Smith-Waterman untuk Mendeteksi Kemiripan Teks, Jurnal Informatika, Vol. 10, nomor 1, Juni 2014:31-42.
Prilianti, K.R., Wijaya, H., 2014, Aplikasi Text Mining Untuk Automasi Penentuan Tren Topik skripsi dengan Metode K-Means Clustering, Jurnal Cybermatika, Vol. 2, No. 1, juni 2014.
Han, J., Kamber, M., Pei, J., 2006, Data Mining: Concepts and Techniques. Morgan Kaufmann.
Prasetyo, E., 2014, Data Mining-Mengolah Data Menjadi Informasi Menggunakan Matlab. Yogyakarta.Andi.
Downloads
Published
Issue
Section
License
License and Copyright Agreement
In submitting the manuscript to the journal, the authors certify that:
- They are authorized by their co-authors to enter into these arrangements.
- The work described has not been formally published before, except in the form of an abstract or as part of a published lecture, review, thesis, or overlay journal. Please also carefully read Journal Posting Your Article Policy.
- The work is not under consideration for publication elsewhere.
- The work has been approved by all the author(s) and by the responsible authorities – tacitly or explicitly – of the institutes where the work has been carried out.
- They secure the right to reproduce any material that has already been published or copyrighted elsewhere.
- They agree to the following license and copyright agreement.
Copyright
Authors who publish with Jurnal Sarjana Teknik Informatika agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License (CC BY-SA 4.0) that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work.