MODEL DETEKSI DINI DIABETES BERBASIS K-NEAREST NEIGHBOR DENGAN OPTIMASI PARAMETER DAN FEATURE SELECTION
Keywords:
Deteksi Dini Diabetes, K-Nearest Neighbors, Klasifikasi, Preprocessing, , Evaluasi ModelAbstract
Diabetes merupakan penyakit kronis yang dapat menyebabkan berbagai komplikasi serius jika tidak terdeteksi dan ditangani sejak dini. Deteksi dini diabetes menjadi hal yang krusial dalam upaya pencegahan dan pengelolaan penyakit ini. Penelitian ini bertujuan untuk meningkatkan kinerja model deteksi dini diabetes dengan menerapkan algoritma K-Nearest Neighbors (KNN). Algoritma ini dipilih karena kemampuannya dalam mengklasifikasikan data berdasarkan kedekatan jarak antar data yang memiliki karakteristik serupa. Dataset yang digunakan dalam penelitian ini diperoleh dari sumber terbuka dan terdiri dari beberapa fitur medis yang relevan untuk diagnosis diabetes. Proses penelitian ini mengikuti tahapan Knowledge Discovery in Databases (KDD), yang meliputi seleksi data, preprocessing, transformasi, data mining, dan evaluasi. Pada tahap preprocessing, dilakukan pembersihan data, normalisasi, serta penanganan data yang hilang untuk meningkatkan kualitas data sebelum proses klasifikasi. Model KNN yang diterapkan dievaluasi menggunakan metrik akurasi, presisi, dan recall. Hasil penelitian menunjukkan bahwa model yang dibangun memiliki tingkat akurasi sebesar 51,44%, dengan presisi untuk kelas positif sebesar 51,98% dan untuk kelas negatif sebesar 50,89%, serta nilai recall masing-masing sebesar 51,81% dan 51,07%. Nilai akurasi yang diperoleh menunjukkan bahwa model masih memiliki keterbatasan dalam membedakan antara pasien dengan dan tanpa diabetes secara akurat. Tingginya jumlah false positives dan false negatives mengindikasikan perlunya perbaikan dalam pemilihan parameter serta optimasi proses preprocessing data. Oleh karena itu, diperlukan strategi peningkatan seperti optimasi parameter K, seleksi fitur yang lebih baik, serta eksplorasi metode machine learning lainnya untuk meningkatkan performa model. Dengan optimalisasi lebih lanjut, diharapkan model deteksi dini diabetes ini dapat menjadi alat yang lebih efektif dalam mendukung keputusan medis dan pengelolaan penyakit diabetes secara dini.
References
International Diabetes Federation, IDF Diabetes Atlas, 10th ed. Brussels: IDF, 2021
Kementerian Kesehatan RI, “Laporan Riset Kesehatan Dasar (Riskesdas),” Jakarta, 2018.
T. Cover and P. Hart, “Nearest Neighbor Pattern Classification,” IEEE Trans. Inf. Theory, vol. 13, no. 1, pp. 21–27, 1967.
A. Prasetyo, et al., “Perbandingan Metode KNN dan MKNN untuk Deteksi Dini Diabetes Mellitus,” Jurnal Teknologi Informasi, vol. 12, no. 2, pp. 45–52, 2023.
M. Sari, “Optimasi Preprocessing Data untuk Klasifikasi Diabetes Menggunakan KNN,” Jurnal Ilmiah Informatika Kesehatan, vol. 5, no. 1, pp. 33–40, 2023.
L. Breiman, “Random Forests,” Mach. Learn., vol. 45, no. 1, pp. 5–32, 2001.
M. D. Rifai, “Penerapan Algoritma KNN untuk Meningkatkan Model Deteksi Dini Diabetes,” Tugas Akhir, STMIK IKMI Cirebon, 2025.
E. Fix and J. L. Hodges, “Discriminatory Analysis: Nonparametric Discrimination,” USA Air Force School of Aviation Medicine, 1951.
U. Fayyad, G. Piatetsky-Shapiro, and P. Smyth, “From Data Mining to Knowledge Discovery in Databases,” AI Magazine, vol. 17, no. 3, pp. 37–54, 1996.
J. Bergstra and Y. Bengio, “Random Search for Hyper-Parameter Optimization,” J. Mach. Learn. Res., vol. 13, pp. 281–305, 2012.
D. M. W. Powers, “Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation,” J. Mach. Learn. Technol., vol. 2, no. 1, pp. 37–63, 2011.
R. Kohavi, “A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection,” in Proc. 14th Int. Joint Conf. Artificial Intelligence, 1995, pp. 1137–1145.
Downloads
Published
Issue
Section
Citation Check
License
Copyright (c) 2025 Waskito Budi Utomo, Hendri Prabowo, Dwi Septiani Juandaputri

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.




