Analisis Komparatif Algoritma SVM, KKN, dan Naive Bayes pada Prediksi Diabetes Menggunakan Teknik SMOTE
Keywords:
diabetes, klasifikasi, machine learning, supervised learning, SMOTEAbstract
Ketidakseimbangan kelas (class imbalance) pada data medis menjadi tantangan signifikan dalam pengembangan model klasifikasi penyakit, khususnya diabetes. Ketidakseimbangan data menyebabkan model cenderung bias terhadap kelas mayoritas sehingga sensitivitas terhadap kelas minoritas menurun. Penelitian ini bertujuan untuk menerapkan teknik oversampling SMOTE (Synthetic Minority Over-sampling Technique) pada dataset indikator kesehatan diabetes BRFSS 2021, serta melakukan analisis komparatif terhadap tiga algoritma supervised learning, yaitu Support Vector Machine (SVM), K-Nearest Neighbors (KNN), dan Naive Bayes (NB). Tahapan penelitian mencakup pembersihan data, penyeimbangan kelas menggunakan SMOTE, normalisasi fitur, pelatihan model, serta evaluasi menggunakan akurasi. Hasil penelitian menunjukkan bahwa model KNN memberikan akurasi tertinggi sebesar 73,27%, diikuti SVM dengan akurasi 71,20% dan Naive Bayes sebesar 67,66%. Penerapan SMOTE meningkatkan proporsionalitas data dan memungkinkan model mempelajari pola kelas minoritas secara lebih efektif. Penelitian ini memberikan kontribusi terhadap pengembangan sistem pendeteksian dini diabetes berbasis machine learning.
