Temu Kembali Informasi Big Data Menggunakan K-Means Clustering

##plugins.themes.bootstrap3.article.main##

Imam Marzuki

Abstract

Saat ini manusia hidup selalu berhubungan dengan data, dimana data dibuat dan dikirimkan tiap detiknya di seluruh dunia. Hal ini menyebabkan data di jaringan bertambah secara massive (besarbesaran).
Oleh karena itu kebutuhan akan pengelolaan data tersebut semakin meningkat. Salah satu bagian yang penting dalam pengelolaan data adalah proses pencarian informasi yang diinginkan oleh pengguna atau biasa disebut dengan temu kembali informasi (information retrieval). Tujuan utama dari temu kembali informasi adalah menemukan kembali dokumen yang berisi informasi yang relevan dengan query yang di inputkan oleh pengguna. Sudah banyak metode yang diusulkan untuk temu kembali informasi. Namun dari sekian teknik masih menyisakan permasalahan terkait kecepatan dan akurasi pencarian. Pada tesis ini, penulis mengusulkan metode terbaik temu kembali informasi pada pencarian big data. Permasalahan muncul ketika melakukan proses pencarian informasi. Hal ini disebabkan big data didominasi oleh data tidak terstruktur. Data tidak terstruktur memiliki sifat sulit diorganisir. Oleh karena itu, diperlukan suatu teknik khusus untuk mengatasinya. Salah satu solusi untuk mengatasi permasalahan tersebut adalah dengan menambahkan klasterisasi dalam indexing informasi. Dalam penelitian ini digunakan metode klasterisasi menggunakan kmeans clustering. Berdasarkan hasil percobaan menggunakan k-means clustering didapatkan nilai rata-rata precision 0.8 nilai rata-rata recall 0.741, dan nilai rata-rata waktu komputasi 0.579 detik.


 

##plugins.themes.bootstrap3.article.details##

Section
Articles