RANCANG BANGUN SISTEM KLASIFIKASI JUDUL BERITA ONLINE BAHASA INDONESIA BERBASIS WEB MENGGUNAKAN ALGORITMA NAÏVE BAYES

Authors

  • Ana Mardiana STMIK IKMI CIREBON, INDONESIA, Indonesia
  • Willy Prihartono STMIK IKMI Cirebon, Indonesia

Abstract

Peningkatan konsumsi berita digital di Indonesia menyebabkan bertambahnya jumlah judul berita daring setiap hari. Judul berita umumnya bersifat singkat dan ambigu, sehingga menyulitkan proses pengelompokan manual berdasarkan kategori topik. Namun, hingga saat ini masih terbatas sistem klasifikasi otomatis yang efektif untuk judul berita pendek berbahasa Indonesia, khususnya bagi institusi media dan pengguna yang membutuhkan klasifikasi cepat. Penelitian ini bertujuan merancang dan membangun sistem klasifikasi judul berita online berbahasa Indonesia berbasis web menggunakan metode Term Frequency–Inverse Document Frequency (TF-IDF) sebagai pembobotan fitur dan algoritma Naïve Bayes sebagai metode klasifikasi. Dataset yang digunakan terdiri dari 1.737 judul berita yang dikumpulkan dari beberapa portal berita nasional. Selain klasifikasi kategori, penelitian ini menerapkan analisis sentimen sebagai pendekatan penyeimbangan data untuk mengatasi ketidakseimbangan distribusi kelas. Sistem dikembangkan menggunakan Python untuk pemodelan dan PHP–MySQL untuk implementasi web. Hasil pengujian menunjukkan bahwa model mencapai akurasi tinggi pada data pelatihan (93–98%), namun mengalami penurunan pada data pengujian (54–57%) akibat kecenderungan overfitting. Meskipun demikian, sistem mampu melakukan klasifikasi judul berita secara otomatis dan konsisten, serta dapat digunakan sebagai solusi awal pengelompokan berita sehingga dapat membantu institusi media dalam pengelolaan arsip berita serta menjadi dasar pengembangan sistem klasifikasi teks bahasa Indonesia yang lebih lanjut.

References

Fauzi, M. A. (2017). Indonesian news classification using naïve Bayes and two-phase feature selection. Indonesian Journal of Electrical Engineering and Computer Science (IJEECS). https://ijeecs.iaescore.com/index.php/IJEECS/article/download/9456/7915

Ionendri, N. A., Candra, F., & Rizal, A. (2025). News classification using natural language processing with TF-IDF and multinomial naïve Bayes. J. Appl. Comput. Sci. Technol., 6(1). https://doi.org/10.20961/itsmart.v6i1.11310

Nisa, N. B., Nanda, R. P., Kudadiri, Z. H., Alfahri, B. A., & Furqan, M. (2025). Klasifikasi berita detik.com terkait teknologi informasi menggunakan TF-IDF dan naïve Bayes. Jurnal Nasional Komputasi Dan Teknologi Informasi (JNKTI), 8(3). https://ojs.serambimekkah.ac.id/jnkti/article/download/9171/pdf

Rahman, A., Wiranto, W., & Doewes, A. (2017). Online news classification using multinomial naive Bayes. ITSMART: Jurnal Ilmiah Teknologi Dan Informasi, 6(1). https://doi.org/10.20961/itsmart.v6i1.11310

Santoso, H. A. (2020). Hoax classification and sentiment analysis of Indonesian news. TELKOMNIKA (J. Telekom. & Elektron.), 18(5). https://telkomnika.uad.ac.id/index.php/TELKOMNIKA/article/viewFile/14744/7887

Sudrajat, A., Wulandari, N., & Syafwan, E. (2022). Indonesian language hoax news classification based on naïve Bayes. Journal of Applied Intelligent System, 7(1). https://doi.org/10.33633/jais.v7i1.5985

Downloads

Published

2026-01-28

Citation Check