Perbandingan TF-IDF dengan Count Vectorization Dalam Content-Based Filtering Rekomendasi Mobil Listrik
Main Article Content
Mobil listrik mulai menjadi pilihan beberapa tahun terakhir ini, karakternya yang lebih ramah lingkungan serta biaya pemeliharaan yang lebih rendah daripada mobil konvensional menjadi alasan utama konsumen lebih memilihnya. Seiring meningkatnya minat konsumen, perusahaan besar banyak yang mulai memproduksi mobil listrik dengan berbagai spesifikasi seperti kapasitas baterainya juga jarak tempuhnya. Hal tersebut membuat konsumen diberikan banyak pilihan dalam memilih mobil listrik yang sesuai preferensinya. Penelitian ini ditujukan untuk mempermudah konsumen dalam memilih mobil listrik yang sesuai dengan preferensinya. Metode yang digunakan adalah metode Content-Based Filtering dari sistem rekomendasi yang berfokus memberikan rekomendasi berdasarkan deskripsi barang serta hal yang disukai konsumen, dari sisi pembentukan modelnya, untuk melihat metode pemodelan yang menghasilkan akurasi lebih baik, peneliti membandingkan metode TF-IDF dengan Count Vectorization. Dimanfaatkan algoritma K-Nearest Neighbor dalam menguji akurasi dari model sistem rekomendasi mobil listrik yang terbentuk. Hasil dari penelitian ini menunjukkan bahwa sistem rekomendasi dapat digunakan untuk merekomendasikan mobil listrik terhadap konsumen. Dari sisi akurasi, model Content-Based Filtering yang dibentuk menggunakan TF-IDF menunjukkan akurasi yang lebih kecil yaitu sebesar 64% dibanding model yang memanfaatkan Count Vectorization yaitu sebesar 75%..
Dik A, Omer S, Boukhanouf R. Electric Vehicles: V2G for Rapid, Safe, and Green EV Penetration. Energies 2022;15. https://doi.org/10.3390/en15030803.
Team E. Indonesians Consider Buying Electric Vehicles in 5 Years: Survey. D-Insights 2022. https://dinsights.katadata.co.id/read/2022/03/02/indonesians-consider-buying-electric-vehicles-in-5-years-survey?__cf_chl_tk=sszJMTYnO8X6AzQUptnOEU9W1fo52ayIXDO_UMEPF1Q-1674389343-0-gaNycGzNCP0 (accessed September 4, 2023).
Anggela SH, Santoso LW, Andjarwirawan J. Sistem Rekomendasi Pembelian Laptop dengan K-Nearest Neighbor ( KNN ). J Infra 2022;10:254–60.
Mondi RH, Wijayanto A, Winarno. Recommendation System With Content-Based Filtering Method for Culinary Tourism in Mangan Application. ITSMART J Ilm Teknol Dan Inf 2019;8:65–72.
Wijaya AE, Alfian D. Sistem Rekomendasi Laptop Menggunakan Collaborative Filtering dan Content-Based Filtering. J Comput Bisnis 2018;12:11–27.
Nurfalah F, Asriyanik A, Pambudi A. Sistem Rekomendasi Event Online Menggunakan Metode Content Based Filtering. J Ilm Elektron DAN Komput 2022;15:271–9.
Pramesti DAPD, Santiyasa IW. Penerapan Metode Content-Based Filtering dalam Sistem Rekomendasi Video Game. JNATIA 2022;1:229–34.
Suryani L, Edy K. Pengembangan Aplikasi “Lost & Found” Berbasis Android Dengan Menggunakan Metode Term Frequency – Inverse Document Frequency (Tf-Idf) Dan Cosine Similarity. Electro Luceat 2020;6:190–204. https://doi.org/10.32531/jelekn.v6i2.232.
Pradana DS, Prajoko P, Hartawan GP. Perbandingan Algoritma Content-Based Filtering dan Collaborative Filtering dalam Rekomendasi Kegiatan Ekstrakurikuler Siswa. Progresif J Ilm Komput 2022;18:151. https://doi.org/10.35889/progresif.v18i2.854.
Sjarif NNA, Azmi NFM, Chuprat S, Sarkan HM, Yahya Y, Sam SM. SMS Spam Sessage Detection Using Term Fequency-Inverse Document Frequency and Random Forest Algorithm. Procedia Comput Sci 2019;161:509–15. https://doi.org/10.1016/j.procs.2019.11.150.
Wendland A, Zenere M, Niemann J. Introduction to Text Classification: Impact of Stemming and Comparing TF-IDF and Count Vectorization as Feature Extraction Technique. Springer 2021;28:289–300.
Putry NM, Sari BN. Komparasi Algoritma Knn Dan Naïve Bayes Untuk Klasifikasi Diagnosis Penyakit Diabetes Mellitus. EVOLUSI J Sains Dan Manaj 2022;10. https://doi.org/10.31294/evolusi.v10i1.12514.
Nikmatun IA, Waspada I. Implementasi Data Mining untuk Klasifikasi Masa Studi Mahasiswa Menggunakan Algoritma K-Nearest Neighbor. J SIMETRIS 2019;10:421–32.
Hidayatullah T, Wibisono S. Pembobotan Atribut Dengan Pairwise Comparison Pada Case Based Reasoning Deteksi Dini Penyakit Gigi Menggunakan KNN. Explore IT 2022;5:17–23.
Amaliah S, Nusrang M, Aswi A. Penerapan Metode Random Forest Untuk Klasifikasi Varian Minuman Kopi di Kedai Kopi Konijiwa Bantaeng. VARIANSI J Stat Its Appl Teach Res 2022;4:121–7. https://doi.org/10.35580/variansiunm31.
Martinez-Plumed F, Contreras-Ochando L, Ferri C, Hernandez-Orallo J, Kull M, Lachiche N, et al. CRISP-DM Twenty Years Later: From Data Mining Processes to Data Science Trajectories. IEEE Trans Knowl Data Eng 2021;33:3048–61. https://doi.org/10.1109/TKDE.2019.2962680.
Schröer C, Kruse F, Gómez JM. A systematic literature review on applying CRISP-DM process model. Procedia Comput Sci 2021;181:526–34. https://doi.org/10.1016/j.procs.2021.01.199.