Penerapan Text Mining Pengelompokkan Judul Kerja Praktek Menggunakan Metode K-Means Clustering dengan Cosine Similarity

Ika Kurnia Saputri, Tedy Setiadi, Lisna Zahrotun

Abstract


Kerja Praktek adalah kegiatan mahasiswa yang dilakukan di masyarakat maupun di perusahaan atau instansi untuk mengaplikasikan ilmu yang diperoleh dan melihat relevansinya di masyarakat maupun melalui jalur pengembangan diri dengan mendalami bidang ilmu tertentu dan aplikasinya. Dalam pelaksanaanya, tidak sedikit mahasiswa bingung menentukan sebuah instansi, perusahaan ataupun tempat lain untuk dijadikan tempat Kerja Praktek. Oleh karena itu, perlu adanya pengelompokkan Judul Kerja Praktek sehingga dapat menjadi salah satu referensi pengetahuan bagi mahasiswa untuk mengetahui pola kelompok judul kerja praktek yang ada. Dalam pengelompokkan tersebut, dapat menggunakan metode Text Mining K-Means Clustering dengan Cosine Similarity untuk dapat mengelompokkan judul kerja praktek. Penelitian ini dilakukan untuk mengkaji tentang algoritma K-Means Clustering dengan Cosine Similarity dan mengimplementasikan algoritma K-Means Clustering dengan Cosine Similarity dengan melakukan tahapan tokenizing, filtering dan stemming sehingga pada akhirnya akan didapatkan cluster-cluster judul kerja praktek. Data yang digunakan adalah data judul kerja praktek Teknik Informatika Universitas Ahmad Dahlan sebanyak 355 data. Hasil pengujian dilakukan uji purity sebanyak 5 kali percobaan, dengan mengkombinasikan parameter M yang berbeda-beda sebagai titik pusat cluster diperoleh nilai terbaik sebesar 0,85 dengan kombinasi M=6 yang artinya semakin mendekati 1 mengindikasikan bahwa semakin banyak dokumen yang berhasil dikelompokkan dengan benar.

Keywords


Text Mining; K-Means Clustering; Cosine Similarity

Full Text:

PDF

References


Kurniawan, B., Effendi, S., sitompul, O.S., 2012, Klasifikasi Konten Berita Dengan Metode Text Mining, Jurnal Dunia Teknologi Informasi, Vol.1, No. 1, Hal.14-19.

Alfina, T., Santosa, B., Barakbah, A.R., 2012, Analisa Perbandingan Metode Hierarchical Clustering, K-Means Dan Gabungan Keduanya Dalam Cluter Data (Studi Kasus : Problem Kerja Praktek Jurusan Teknik Industri Its), Jurnal Teknik ITS, vol.1, ISSN: 2301-9271, September 2012.

Imbar, R.V., Adelia., Ayub, M., Rehatta, A., 2014, Implementasi Cosine Similarity dan Algoritma Smith-Waterman untuk Mendeteksi Kemiripan Teks, Jurnal Informatika, Vol. 10, nomor 1, Juni 2014:31-42.

Prilianti, K.R., Wijaya, H., 2014, Aplikasi Text Mining Untuk Automasi Penentuan Tren Topik skripsi dengan Metode K-Means Clustering, Jurnal Cybermatika, Vol. 2, No. 1, juni 2014.

Han, J., Kamber, M., Pei, J., 2006, Data Mining: Concepts and Techniques. Morgan Kaufmann.

Prasetyo, E., 2014, Data Mining-Mengolah Data Menjadi Informasi Menggunakan Matlab. Yogyakarta.Andi.




DOI: http://dx.doi.org/10.12928/jstie.v6i3.15257

Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Ika Kurnia Saputri, Tedy Setiadi, Lisna Zahrotun

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.


Jurnal Sarjana Teknik Informatika
Organized by Informatics Department
Published by Universitas Ahmad Dahlan
Website: http://journal.uad.ac.id/index.php/JSTIF
Office: Industrial Technology Faculty, Kampus Utama UAD Jalan Ahmad Yani (Ringroad Selatan), Tamanan, Banguntapan, Bantul, Yogyakarta 55166, Indonesia
Email: herman.yuliansyah@tif.uad.ac.id || jurnalsarjana@tif.uad.ac.id


 

Creative Commons License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.