MITIGASI KETIDAKSEIMBANGAN KELAS EKSTREM PADA DETEKSI PENIPUAN KARTU KREDIT MENGGUNAKAN PENDEKATAN HYBRID OVERSAMPLING DAN ENSEMBLE LEARNING

Authors

  • Zakaria . STMIK IKMI Cirebon, Indonesia
  • Dian Ade Kurnia STMIK IKMI Cirebon, Indonesia
  • Yudhistira Arie Wijaya STMIK IKMI Cirebon, Indonesia
  • Rosidin . STMIK IKMI Cirebon, Indonesia

Keywords:

penipuan kartu kredit, ketidakseimbangan kelas, SMOTE-ENN, Random Forest, Machine Learning

Abstract

Ketidakseimbangan kelas yang ekstrem pada data transaksi kartu kredit menyebabkan model deteksi penipuan cenderung bias terhadap transaksi normal sehingga transaksi fraud sulit terdeteksi secara andal. Penelitian ini bertujuan memitigasi masalah tersebut dengan mengombinasikan teknik hybrid oversampling SMOTE-ENN dan algoritma ensemble Random Forest pada dataset penipuan kartu kredit berskala besar. Dataset publik kredit kartu yang digunakan memiliki proporsi kelas yang sangat timpang antara transaksi normal dan fraud. Pra-pemrosesan dilakukan melalui eksplorasi data, transformasi fitur, pembagian data secara stratified, dan penerapan SMOTE-ENN hanya pada data latih untuk menghindari data leakage. Model Random Forest kemudian dilatih pada data hasil resampling dan dievaluasi menggunakan metrik yang relevan untuk data tidak seimbang, yaitu precision, recall, F1-score, PR-based metrics, serta ROC-AUC. Hasil eksperimen menunjukkan bahwa kombinasi SMOTE-ENN dan Random Forest mampu mempertahankan kinerja sempurna pada kelas normal sekaligus meningkatkan kemampuan deteksi kelas fraud dengan nilai precision 0,79, recall 0,83, dan F1-score 0,81, disertai ROC-AUC yang sangat tinggi. Temuan ini mengindikasikan bahwa pendekatan hybrid oversampling dan ensemble learning efektif sebagai fondasi pengembangan pipeline deteksi penipuan kartu kredit yang lebih akurat dan siap diterapkan secara operasional.

References

A. Cherif, A. Badhib, H. Ammar, S. Alshehri, M. Kalkatawi, and A. Imine, “Credit card fraud detection in the era of disruptive technologies: A systematic review,” Journal of King Saud University–Computer and Information Sciences, vol. 35, no. 1, pp. 145–174, 2023, doi: 10.1016/j.jksuci.2022.11.008.

M. Alamri and M. Ykhlef, “Survey of Credit Card Anomaly and Fraud Detection Using Sampling Techniques,” Dec. 01, 2022, MDPI. doi: 10.3390/electronics11234003.

I. Mekterović, M. Karan, D. Pintar, and L. Brkić, “Credit card fraud detection in card-not-present transactions: Where to invest?,” Applied Sciences, vol. 11, no. 15, p. 6766, 2021, doi: 10.3390/app11156766.

J. Hancock, T. Khoshgoftaar, and J. Johnson, “Evaluating classifier performance with highly imbalanced Big Data,” J. Big Data, vol. 10, p. 42, 2023, doi: 10.1186/s40537-023-00724-5.

W. Chen, K. Yang, Z. Yu, Y. Shi, and C. Chen, “A survey on imbalanced learning: Latest research, applications and future directions,” Artif. Intell. Rev., 2024, doi: 10.1007/s10462-024-10759-6.

S. Arora, R. Rani, and N. K. Saxena, “A systematic review on detection and adaptation of concept drift in streaming data using machine learning techniques,” Wiley Interdiscip. Rev. Data Min. Knowl. Discov., 2024, doi: 10.1002/widm.1536.

D. Breskuvienė and G. Dzemyda, “Enhancing credit card fraud detection: Highly imbalanced data case,” J. Big Data, vol. 11, p. 182, 2024, doi: 10.1186/s40537-024-01059-5.

Downloads

Published

2026-06-10

Citation Check