MITIGASI KETIDAKSEIMBANGAN KELAS EKSTREM PADA DETEKSI PENIPUAN KARTU KREDIT MENGGUNAKAN PENDEKATAN HYBRID OVERSAMPLING DAN ENSEMBLE LEARNING
Keywords:
penipuan kartu kredit, ketidakseimbangan kelas, SMOTE-ENN, Random Forest, Machine LearningAbstract
Ketidakseimbangan kelas yang ekstrem pada data transaksi kartu kredit menyebabkan model deteksi penipuan cenderung bias terhadap transaksi normal sehingga transaksi fraud sulit terdeteksi secara andal. Penelitian ini bertujuan memitigasi masalah tersebut dengan mengombinasikan teknik hybrid oversampling SMOTE-ENN dan algoritma ensemble Random Forest pada dataset penipuan kartu kredit berskala besar. Dataset publik kredit kartu yang digunakan memiliki proporsi kelas yang sangat timpang antara transaksi normal dan fraud. Pra-pemrosesan dilakukan melalui eksplorasi data, transformasi fitur, pembagian data secara stratified, dan penerapan SMOTE-ENN hanya pada data latih untuk menghindari data leakage. Model Random Forest kemudian dilatih pada data hasil resampling dan dievaluasi menggunakan metrik yang relevan untuk data tidak seimbang, yaitu precision, recall, F1-score, PR-based metrics, serta ROC-AUC. Hasil eksperimen menunjukkan bahwa kombinasi SMOTE-ENN dan Random Forest mampu mempertahankan kinerja sempurna pada kelas normal sekaligus meningkatkan kemampuan deteksi kelas fraud dengan nilai precision 0,79, recall 0,83, dan F1-score 0,81, disertai ROC-AUC yang sangat tinggi. Temuan ini mengindikasikan bahwa pendekatan hybrid oversampling dan ensemble learning efektif sebagai fondasi pengembangan pipeline deteksi penipuan kartu kredit yang lebih akurat dan siap diterapkan secara operasional.
References
A. Cherif, A. Badhib, H. Ammar, S. Alshehri, M. Kalkatawi, and A. Imine, “Credit card fraud detection in the era of disruptive technologies: A systematic review,” Journal of King Saud University–Computer and Information Sciences, vol. 35, no. 1, pp. 145–174, 2023, doi: 10.1016/j.jksuci.2022.11.008.
M. Alamri and M. Ykhlef, “Survey of Credit Card Anomaly and Fraud Detection Using Sampling Techniques,” Dec. 01, 2022, MDPI. doi: 10.3390/electronics11234003.
I. Mekterović, M. Karan, D. Pintar, and L. Brkić, “Credit card fraud detection in card-not-present transactions: Where to invest?,” Applied Sciences, vol. 11, no. 15, p. 6766, 2021, doi: 10.3390/app11156766.
J. Hancock, T. Khoshgoftaar, and J. Johnson, “Evaluating classifier performance with highly imbalanced Big Data,” J. Big Data, vol. 10, p. 42, 2023, doi: 10.1186/s40537-023-00724-5.
W. Chen, K. Yang, Z. Yu, Y. Shi, and C. Chen, “A survey on imbalanced learning: Latest research, applications and future directions,” Artif. Intell. Rev., 2024, doi: 10.1007/s10462-024-10759-6.
S. Arora, R. Rani, and N. K. Saxena, “A systematic review on detection and adaptation of concept drift in streaming data using machine learning techniques,” Wiley Interdiscip. Rev. Data Min. Knowl. Discov., 2024, doi: 10.1002/widm.1536.
D. Breskuvienė and G. Dzemyda, “Enhancing credit card fraud detection: Highly imbalanced data case,” J. Big Data, vol. 11, p. 182, 2024, doi: 10.1186/s40537-024-01059-5.
Downloads
Published
Issue
Section
Citation Check
License
Copyright (c) 2026 Zakaria ., Dian Ade Kurnia, Yudhistira Arie Wijaya, Rosidin .

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.




