Klasterisasi  Berita Berbahasa Indonesia Menggunakan Model K-Means Dan Indobert Untuk Menentukan Berita Hoaks: Clustering Indonesian News Using K-Means and Indobert Models to Determine Hoax News

Kholis Amwari; Totok Chmaidy; Suhartono

doi:10.35891/explorit.v17i1.6502

Authors

Kholis Amwari Magister Informatika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Maulana Malik Ibrahim Malang
Totok Chmaidy Magister Informatika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Maulana Malik Ibrahim Malang
Suhartono Magister Informatika, Fakultas Sains dan Teknologi, Universitas Islam Negeri Maulana Malik Ibrahim Malang

DOI:

https://doi.org/10.35891/explorit.v17i1.6502

Keywords:

IndoBERT, K-Mean Clustering, Berita Hoax

Abstract

Penyebaran berita hoaks di media digital, khususnya dalam konteks politik, semakin marak dan berdampak negatif terhadap persepsi publik serta stabilitas sosial. Penelitian ini bertujuan untuk menganalisis dan mengelompokkan berita politik berbahasa Indonesia menggunakan model IndoBERT sebagai representasi teks dan algoritma K-Means Clustering sebagai metode klasterisasi, guna membedakan berita hoaks dan fakta. IndoBERT digunakan untuk menghasilkan vektor representasi kata berbasis konteks yang lebih akurat dibanding metode konvensional seperti TF-IDF dan Word2Vec Vektor ini kemudian dikelompokkan menggunakan K-Means Clustering untuk membentuk klaster berdasarkan kemiripan semantik.
Hasil penelitian menunjukkan bahwa pendekatan ini berhasil memisahkan berita ke dalam dua klaster utama, yaitu hoaks dan fakta, dengan hasil evaluasi kuantitatif berupa nilai Silhouette Score sebesar 0,21. Validasi manual terhadap 200 sampel berita menunjukkan bahwa klaster yang terbentuk memiliki tingkat akurasi klasifikasi sebesar 88% untuk berita fakta dan 82% untuk berita hoaks. Temuan ini membuktikan bahwa kombinasi IndoBERT dan K-Means Clustering efektif digunakan sebagai alat bantu dalam identifikasi berita hoaks secara otomatis dan unsupervised. Penelitian ini juga merekomendasikan penggunaan dataset yang lebih luas dan penggabungan dengan pendekatan supervised untuk hasil yang lebih optimal.

Downloads

Download data is not yet available.

References

R. Yunanto, A. P. Purfini, and A. Prabuwisesa, â€œSurvei Literatur: Deteksi Berita Palsu Menggunakan Pendekatan Deep Learning,â€ J. Manaj.

Inform., vol. 11, no. 2, pp. 118â€“130, 2021, doi: 10.34010/jamika.v11i2.5362.

2019) (EMCHA, WIDYAWAN, & ADJI, â€œKlasterisasi Berita Bahasa Indonesia Dengan Menggunakan K-Means Dan Word Embedding,â€ J. Teknol. Inf. dan Ilmu Komput., vol. 10, no. 3, pp. 641â€“652, 2019, doi: 10.25126/jtiik.20231026468.

D. Ramadanti et al., â€œPerspektif Masyarakat Terhadap Humas Dalam Penggunaan Media Sosial,â€ Al-Zayn J. Ilmu Sos. Huk., vol. 3, pp. 165â€“ 171, 2025, doi: 10.61104/alz.v3i2.919.

1-9. et al., â€œScholar (3),â€ Annals of Tourism Research, vol. 3, no. 1. pp. 1â€“2, 2015. [Online]. Available: http://www.sciencedirect.com/science/article/pii/S0160738315000444

A. L. Basuki et al., â€œANALISIS SENTIMEN ULASAN APLIKASI AJAIB KRIPTO,â€ vol. 9, no. 4, pp. 1â€“9, 2025.

A. Kunaefi, Z. Abidin, and R. Kusumawati, â€œKlasifikasi berita hoaks bahasa indonesia menggunakan indobert,â€ vol. 10, no. 2, pp. 1706â€“ 1714, 2025.

C. J. L. Tobing, I. G. N. L. Wijayakusuma, and L. P. Ida, â€œPerbandingan Kinerja IndoBERT dan MBERT untuk Deteksi Berita Hoaks Politik dalam Bahasa Indonesia,â€ vol. 14, no. 1, pp. 114â€“123, 2025.

I. M. S. Bimantara and I. M. Widiartha, â€œOptimization of K-Means Clustering Using Particle Swarm Optimization Algorithm for Grouping Traveler Reviews Data on Tripadvisor Sites,â€ J. Ilm. Kursor, vol. 12, no. 1, pp. 1â€“10, 2023.

C. Yuan and H. Yang, â€œResearch on K-value selection method of K-means clustering algorithm,â€ J, vol. 2, no. 2, pp. 226â€“235, 2019.

R. R. Putra and C. Wadisman, â€œImplementasi Data Mining Pemilihan Pelanggan Potensial Menggunakan Algoritma K Means,â€ Intecoms, vol. 1, no. 1, pp. 72â€“77, 2018, doi: 10.31539/intecoms.v1i1.141.

F. Kamila, E. Prasetyo, and W. Roessali, â€œANALISIS SIKAP KONSUMEN PADA PEMBELIAN BERAS DI KOTA SALATIGA,â€

Agrisocionomics J. Sos. Ekon. Pertan., vol. 3, p. 10, 2019, doi: 10.14710/agrisocionomics.v3i1.2980.

A. Onan, â€œA K-medoids based clustering scheme with an application to document clustering,â€ in 2017 international conference on computer science and engineering (UBMK), IEEE, 2017, pp. 354â€“359.

J. Devlin, M. W. Chang, K. Lee, and K. Toutanova, â€œBERT: Pre-training of deep bidirectional transformers for language understanding,â€ NAACL HLT 2019 - 2019 Conf. North Am. Chapter Assoc. Comput. Linguist. Hum. Lang. Technol. - Proc. Conf., vol. 1, no. Mlm, pp. 4171â€“ 4186, 2019.

A. Ripaâ€™i, F. Santoso, and F. Lazim, Deteksi Berita Hoax dengan Perbandingan Website Menggunakan Pendekatan Deep Learning Algoritma BERT, vol. 8, no. 3. 2024. doi: 10.33379/gtech.v8i3.4541.

H. Ulfatriyani, H. A. Nugroho, and I. Soesanti, â€œImplementing Term Frequency-Inverse Term Frequency at Tweets in Indonesian Fraud Crime Cases,â€ in 2020 3rd International Conference on Information and Communications Technology (ICOIACT), 2020, pp. 185â€“190. doi: 10.1109/ICOIACT50329.2020.9331996.

I. H. Witten, E. Frank, and M. A. Hall, â€œChapter 4 - Algorithms: The Basic Methods,â€ in Data Mining: Practical Machine Learning Tools and Techniques (Third Edition), Third Edit., I. H. Witten, E. Frank, and M. A. Hall, Eds., in The Morgan Kaufmann Series in Data Management Systems. , Boston: Morgan Kaufmann, 2011, pp. 85â€“145. doi: https://doi.org/10.1016/B978-0-12-374856-0.00004-3.

G. Colab, â€œGoogle Colab IndoBERT.â€ 2024.

H. Sulastri and A. I. Gufroni, â€œPenerapan Data Mining Dalam Pengelompokan Penderita Thalassaemia,â€ J. Nas. Teknol. dan Sist. Inf., vol. 3, no. 2, pp. 299â€“305, 2017, doi: 10.25077/teknosi.v3i2.2017.299-305.

Klasterisasi Berita Berbahasa Indonesia Menggunakan Model K-Means Dan Indobert Untuk Menentukan Berita Hoaks

Clustering Indonesian News Using K-Means and Indobert Models to Determine Hoax News

Authors

DOI:

Keywords:

Abstract

Downloads

References

Downloads

Published

Issue

Section

License

How to Cite

Browse

menu

referensi

pengunjung

plagiarism

template

callme

Cited by

customblock_temabaru

Latest publications

MAIN

ABOUT

Klasterisasi Berita Berbahasa Indonesia Menggunakan Model K-Means Dan Indobert Untuk Menentukan Berita Hoaks

Clustering Indonesian News Using K-Means and Indobert Models to Determine Hoax News

Authors

DOI:

Keywords:

Abstract

Downloads

References

Downloads

Published

Issue

Section

License

How to Cite

Browse

menu

referensi

pengunjung

plagiarism

template

callme

Cited by

customblock_temabaru

Call Paper

Sinta Rank

Article Template

About ExploreIT

Submission

Identifier

Tools

Live Chat

Visitor

Scholar Citation

Latest publications