Klasterisasi Berita Berbahasa Indonesia Menggunakan Model K-Means Dan Indobert Untuk Menentukan Berita Hoaks
Clustering Indonesian News Using K-Means and Indobert Models to Determine Hoax News
DOI:
https://doi.org/10.35891/explorit.v17i1.6502Keywords:
IndoBERT, K-Mean Clustering, Berita HoaxAbstract
Penyebaran berita hoaks di media digital, khususnya dalam konteks politik, semakin marak dan berdampak negatif terhadap persepsi publik serta stabilitas sosial. Penelitian ini bertujuan untuk menganalisis dan mengelompokkan berita politik berbahasa Indonesia menggunakan model IndoBERT sebagai representasi teks dan algoritma K-Means Clustering sebagai metode klasterisasi, guna membedakan berita hoaks dan fakta. IndoBERT digunakan untuk menghasilkan vektor representasi kata berbasis konteks yang lebih akurat dibanding metode konvensional seperti TF-IDF dan Word2Vec Vektor ini kemudian dikelompokkan menggunakan K-Means Clustering untuk membentuk klaster berdasarkan kemiripan semantik.
Hasil penelitian menunjukkan bahwa pendekatan ini berhasil memisahkan berita ke dalam dua klaster utama, yaitu hoaks dan fakta, dengan hasil evaluasi kuantitatif berupa nilai Silhouette Score sebesar 0,21. Validasi manual terhadap 200 sampel berita menunjukkan bahwa klaster yang terbentuk memiliki tingkat akurasi klasifikasi sebesar 88% untuk berita fakta dan 82% untuk berita hoaks. Temuan ini membuktikan bahwa kombinasi IndoBERT dan K-Means Clustering efektif digunakan sebagai alat bantu dalam identifikasi berita hoaks secara otomatis dan unsupervised. Penelitian ini juga merekomendasikan penggunaan dataset yang lebih luas dan penggabungan dengan pendekatan supervised untuk hasil yang lebih optimal.
Downloads
References
R. Yunanto, A. P. Purfini, and A. Prabuwisesa, “Survei Literatur: Deteksi Berita Palsu Menggunakan Pendekatan Deep Learning,†J. Manaj.
Inform., vol. 11, no. 2, pp. 118–130, 2021, doi: 10.34010/jamika.v11i2.5362.
2019) (EMCHA, WIDYAWAN, & ADJI, “Klasterisasi Berita Bahasa Indonesia Dengan Menggunakan K-Means Dan Word Embedding,†J. Teknol. Inf. dan Ilmu Komput., vol. 10, no. 3, pp. 641–652, 2019, doi: 10.25126/jtiik.20231026468.
D. Ramadanti et al., “Perspektif Masyarakat Terhadap Humas Dalam Penggunaan Media Sosial,†Al-Zayn J. Ilmu Sos. Huk., vol. 3, pp. 165– 171, 2025, doi: 10.61104/alz.v3i2.919.
1-9. et al., “Scholar (3),†Annals of Tourism Research, vol. 3, no. 1. pp. 1–2, 2015. [Online]. Available: http://www.sciencedirect.com/science/article/pii/S0160738315000444
A. L. Basuki et al., “ANALISIS SENTIMEN ULASAN APLIKASI AJAIB KRIPTO,†vol. 9, no. 4, pp. 1–9, 2025.
A. Kunaefi, Z. Abidin, and R. Kusumawati, “Klasifikasi berita hoaks bahasa indonesia menggunakan indobert,†vol. 10, no. 2, pp. 1706– 1714, 2025.
C. J. L. Tobing, I. G. N. L. Wijayakusuma, and L. P. Ida, “Perbandingan Kinerja IndoBERT dan MBERT untuk Deteksi Berita Hoaks Politik dalam Bahasa Indonesia,†vol. 14, no. 1, pp. 114–123, 2025.
I. M. S. Bimantara and I. M. Widiartha, “Optimization of K-Means Clustering Using Particle Swarm Optimization Algorithm for Grouping Traveler Reviews Data on Tripadvisor Sites,†J. Ilm. Kursor, vol. 12, no. 1, pp. 1–10, 2023.
C. Yuan and H. Yang, “Research on K-value selection method of K-means clustering algorithm,†J, vol. 2, no. 2, pp. 226–235, 2019.
R. R. Putra and C. Wadisman, “Implementasi Data Mining Pemilihan Pelanggan Potensial Menggunakan Algoritma K Means,†Intecoms, vol. 1, no. 1, pp. 72–77, 2018, doi: 10.31539/intecoms.v1i1.141.
F. Kamila, E. Prasetyo, and W. Roessali, “ANALISIS SIKAP KONSUMEN PADA PEMBELIAN BERAS DI KOTA SALATIGA,â€
Agrisocionomics J. Sos. Ekon. Pertan., vol. 3, p. 10, 2019, doi: 10.14710/agrisocionomics.v3i1.2980.
A. Onan, “A K-medoids based clustering scheme with an application to document clustering,†in 2017 international conference on computer science and engineering (UBMK), IEEE, 2017, pp. 354–359.
J. Devlin, M. W. Chang, K. Lee, and K. Toutanova, “BERT: Pre-training of deep bidirectional transformers for language understanding,†NAACL HLT 2019 - 2019 Conf. North Am. Chapter Assoc. Comput. Linguist. Hum. Lang. Technol. - Proc. Conf., vol. 1, no. Mlm, pp. 4171– 4186, 2019.
A. Ripa’i, F. Santoso, and F. Lazim, Deteksi Berita Hoax dengan Perbandingan Website Menggunakan Pendekatan Deep Learning Algoritma BERT, vol. 8, no. 3. 2024. doi: 10.33379/gtech.v8i3.4541.
H. Ulfatriyani, H. A. Nugroho, and I. Soesanti, “Implementing Term Frequency-Inverse Term Frequency at Tweets in Indonesian Fraud Crime Cases,†in 2020 3rd International Conference on Information and Communications Technology (ICOIACT), 2020, pp. 185–190. doi: 10.1109/ICOIACT50329.2020.9331996.
I. H. Witten, E. Frank, and M. A. Hall, “Chapter 4 - Algorithms: The Basic Methods,†in Data Mining: Practical Machine Learning Tools and Techniques (Third Edition), Third Edit., I. H. Witten, E. Frank, and M. A. Hall, Eds., in The Morgan Kaufmann Series in Data Management Systems. , Boston: Morgan Kaufmann, 2011, pp. 85–145. doi: https://doi.org/10.1016/B978-0-12-374856-0.00004-3.
G. Colab, “Google Colab IndoBERT.†2024.
H. Sulastri and A. I. Gufroni, “Penerapan Data Mining Dalam Pengelompokan Penderita Thalassaemia,†J. Nas. Teknol. dan Sist. Inf., vol. 3, no. 2, pp. 299–305, 2017, doi: 10.25077/teknosi.v3i2.2017.299-305.
Downloads
Published
Issue
Section
License

Jelajahi IT! dilisensikan di bawah Lisensi Internasional Creative Commons Attribution 4.0 .






