ANALISIS KLASIFIKASI TINGKAT KEMISKINAN MENGGUNAKAN ALGORITMA RANDOM FOREST PADA KABUPATEN KOTA DI INDONESIA

Authors

  • Anggy Setiawan STMIK IKMI Cirebon, Indonesia
  • Nana Nuarna STMIK IKMI Cirebon, Indonesia
  • Agus Bahtiar STMIK IKMI Cirebon, Indonesia
  • Faturrohman Faturrohman STMIK IKMI Cirebon, Indonesia

Keywords:

Tingkat kemiskinan, Klasifikasi data, Algoritma Random Forest, Indikator sosial ekonomi, Kabupaten/Kota Indonesia

Abstract

Kemiskinan merupakan fenomena multidimensi yang mencakup keterbatasan pendapatan, pendidikan, kesehatan, dan akses layanan dasar, serta memperlihatkan disparitas kuat antar kabupaten/kota di Indonesia. Penelitian ini bertujuan mengevaluasi efektivitas algoritma Random Forest untuk mengklasifikasikan tingkat kemiskinan multidimensi pada level kabupaten/kota menggunakan pendekatan supervised learning. Dataset sekunder diperoleh dari Kaggle dan memuat 514 entri indikator sosial-ekonomi dari seluruh wilayah Indonesia. Tahapan penelitian meliputi pengumpulan data, pembersihan dan standarisasi nilai, pemilihan fitur, pembagian data latih-uji, pelatihan model Random Forest, serta evaluasi performa menggunakan metrik akurasi, precision, Recall, F1-score, confusion matrix, dan Out-of-Bag (OOB). Hasil menunjukkan skor OOB sebesar 0,9854 dengan akurasi pengujian 98%. Model mampu mendeteksi kelas minoritas (miskin) secara sempurna tanpa false negative, sehingga mengurangi risiko exclusion error dalam penargetan bantuan. Analisis feature importance mengindikasikan variabel seperti akses sanitasi layak, rata-rata lama sekolah, dan pengeluaran per kapita sebagai kontributor dominan terhadap klasifikasi. Kesimpulannya, Random Forest terbukti sangat andal, stabil, dan adil untuk klasifikasi kemiskinan multidimensi pada data kabupaten/kota yang heterogen dan cenderung tidak seimbang. Temuan ini mendukung pengembangan kebijakan publik berbasis data, terutama untuk pemetaan wilayah prioritas dan penajaman sasaran program pengentasan kemiskinan. Integrasi model pembelajaran mesin dengan indikator pembangunan resmi berpotensi memperkuat akurasi perencanaan pembangunan daerah.

References

G. E. Halkos and P.-S. C. Aslanidis, “Causes and Measures of Poverty, Inequality, and Social Exclusion: A Review,” Economies, vol. 11, no. 4, p. 110, 2023, doi: 10.3390/economies11040110.

J. Cuesta, B. López Noval, and M. Niño Zarazúa, “Social exclusion concepts, measurement, and a global estimate,” PLOS ONE, vol. 19, no. 2, p. e0298085, 2024, doi: 10.1371/journal.pone.0298085.

J. C. Muñetón Santa and J. A. Manrique Ruiz, “Random Forest approaches for spatial-socioeconomic poverty estimation,” International Journal of Data Science, 2023.

Q. Li, S. Yu, D. Échevin, and M. Fan, “Is poverty predictable with machine learning? A study of DHS data from Kyrgyzstan,” Socio Economic Planning Sciences, vol. 81, p. 101195, 2022, doi: 10.1016/j.seps.2021.101195.

S. M. Satapathy, S. Mohanty, and R. Dash, “Household-level poverty prediction using machine learning models,” Expert Systems with Applications, 2023.

W. J. Browne, H. Goldstein, and J. Rasbash, “Random Forests for social and economic classification analysis,” SAGE Publications, 2021.

Q. Zheng, H. Li, and Y. Sun, “Nighttime light data for poverty targeting and policy intervention accuracy,” Remote Sensing of Environment, 2024.

B. Buttow, “Spatial data integration for poverty-targeting improvement: A policy-driven approach,” Journal of Development Analytics, 2025.

P. Corral Rodas, “Sub-national poverty mapping using machine learning approaches,” Development Policy Review, 2024.

Downloads

Published

2026-06-09

Citation Check