PERBANDINGAN TEKNIK CLUSTERING ANTARA METODE K-MEANS,
K-MEDOIDS, DAN GSDMM PADA DATA TWEET VAKSINASI
INDONESIA
Fareez, Vauwez Sam El, Saing, Rofiqah Julia Nurlaila, and Haqi, Ainul
Jul 2021
Kegiatan vaksinasi merupakan salah satu langkah yang diambil
pemerintah untuk menekan angka laju penambahan pasien Covid-19.
Dengan adanya kegiatan vaksinasi tersebut tentunya mengundang
berbagai tanggapan dan pembahasan masyarakat utamanya di media
sosial mengenai kegiatan vaksinasi tersebut. Salah satu media
sosial yang banyak digunakan adalah twitter. Banyaknya tanggapan
dan topik pembahasan masyarakat mengenai kegiatan vaksinasi ini
merupakan peluang data yang dapat dilakukan penambangan. Salah satu
Teknik dalam melakukan penambangan data ini yaitu Teknik
clustering. Dalam melakukan clustering terdapat beberapa metode.
Diantaranya yang akan dilakukan dalam penelitan ini yaitu metode
K-means, K-medoids, dan GSDMM. Pada penelitian ini digunakan
sebanyak 10 cluster untuk diterapkan pada metode-metode tersebut.
Tujuan dan kontribusi utama dari penelitian ini adalah untuk
melakukan analisa dan perbandingan dari ketiga metode Clustering
yaitu K-means, K-medoids, dan GSDMM. Dari hasil labelling tiap
metode didapatkan kecenderungan pembahasan masyarakat mengenai
vaksinasi adalah/ tentang jenis vaksin. Selain itu, dilakukan pula
perbandingan tiap metodenya. Hasil perbandingan tiap metode
berdasarkan silhouette index, davies-bouldin dan waktu eksekusi
didapatkan metode k-means adalah sebagai metode terbaik.