Penerapan Algoritma K-Means Untuk Pengelompokan Topik Dokumen Studi Kasus:Dokumen Abstrak Skripsi Jurusan Teknik Informatika ITATS

Rani Rotul Muhima, Intan Rizky Kurniana, Septiyawan Rosetya Wardhana, Maftahatul Hakimah

Abstract


Proses inventarisasi di perpustakaan jurusan Teknik Informatika ITATS masih belum optimal. Hal ini ditunjukkan dengan bahan pustaka khususnya laporan skripsi mahasiswa di e-library ITATS belum dikelompokkan berdasarkan topik. Pengelompokkan laporan skripsi di perpustakaan jurusan Teknik Informatika perlu dilakukan untuk membantu mahasiswa dalam mencari referensi atau sebagai pertimbangan dalam memilih topik skripsi. Metode yang digunakan pengelompokan dokumen abstrak skripsi ini adalah K-Means. Metode ini cukup sederhana tetapi dapat meminimilasir kemiripan antar kelompok dan memaksimalkan kimiripan dalam satu kelompok. Data yang digunakan pada penelitian adalah 182 data dokumen abstrak skripsi dengan format pdf. Sebelum proses pengelompokan dengan algoritma K-Means, dilakukan preprocessing data. Proses ini terdiri dari case folding, tokenization, filtering dan stemming.  Setelah tahap preprocessing data kemudian dilakukan pembobotan dengan Tf-Idf. Evaluasi hasil pengelompokan menggunakan metode elbow. Hasil penelitian menunjukan jumlah kelompok optimal pada k=3 dengan nilai SSE sebesar 41977,88.


Keywords


Pengelompokan dokumen; text mining; K-Means

Full Text:

PDF

References


“Undang Undang Republik Indonesia Nomor 43 Tahun 2007 Tentang Perpustakaan,” 2007. [Online]. Available: https://www.perpusnas.go.id/law-detail.php?lang=id&id=170920114322Ir9g6HhRuc. [Accessed: 29-Apr-2021].

Dinas Perpustakaan dan Kearsipan Kota Pekanbaru, “Proses Pengolahan Bahan Pustaka,” 2018. [Online]. Available: https://dispusip.pekanbaru.go.id/proses-pengolahan-bahan-pustaka/. [Accessed: 30-Apr-2021].

N. G. Yudiarta, M. Sudarma, and W. G. Ariastina, “Penerapan Metode Clustering Text Mining Untuk Pengelompokan Berita Pada Unstructured Textual Data,” Maj. Ilm. Teknol. Elektro, vol. 17, no. 3, p. 339, 2018.

F. Rahutomo, Z. Hanif Rachmat Adi, I. Fahrur Rozi, and P. Yoga Saputra, “Implementasi Text Mining Pada Website/Blog Di Internet Untuk Menilai Kinerja Suatu Organisasi,” INOVTEK Polbeng - Seri Inform., vol. 3, no. 2, p. 101, 2018.

L. Hakim, T. F. Kusumasari, and M. Lubis, “Text Mining of UU-ITE Implementation in Indonesia,” J. Phys. Conf. Ser., vol. 1007, no. 1, 2018.

W. Hardi, “Pengelompokan Topik Dokumen Berbasis Text Mining Dengan Algoritme K-Means : Studi Kasus Pada Dokumen Kedutaan Besar Australia Jakarta,” vol. 21, no. 1, pp. 67–76, 2019.

R. R. Muhima, M. Kurniawan, and O. T. Pambudi, “A LOF K - Means Clustering on Hotspot Data,” Int. J. Artif. Intell. Robot., vol. 2, no. 1, pp. 29–33, 2020.

P. Yugianus, H. S. Dachlan, and N. Hasanah, “Pengembangan Sistem Penelusuran katalog Perpustakaan Dengan metode Rocchio Relevance Feedback,” vol. 7, no. 1, pp. 47–52, 2013.

R. A. Asroni, “Penerapan Metode K-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Akademik Dengan Weka Interface Studi Kasus Pada Jurusan Teknik Informatika UMM Magelang,” Ilm. Semesta Tek., vol. 18, no. 1, pp. 76–82, 2015.

R. Nainggolan, R. Perangin-Angin, E. Simarmata, and A. F. Tarigan, “Improved the Performance of the K-Means Cluster Using the Sum of Squared Error (SSE) optimized by using the Elbow Method,” J. Phys. Conf. Ser., vol. 1361, no. 1, 2019.




DOI: https://doi.org/10.31284/p.snestik.2021.1824

Refbacks

  • There are currently no refbacks.


Copyright (c) 2021 Rani Rotul Muhima, Intan Rizky Kurniana, Septiyawan Rosetya Wardhana, Maftahatul Hakimah

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.