PENERAPAN SMOTE-NCL UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS PADA KLASIFIKASI PENYAKIT JANTUNG KORONER

  • Mariana Dewi Universitas Lambung Mangkurat
  • Triando Hamonangan Saragih
  • Rudy Herteno

Abstract

Penyakit jantung koroner (PJK) terjadi akibat penyumbatan atau penyempitan pada pembuluh darah jantung karena adanya endapan lemak dan kolesterol sehingga mengakibatkan suplai darah ke jantung menjadi terganggu. PJK masih merupakan masalah kesehatan yang penting dan berdampak secara sosioekonomi karena biaya obat-obatan yang cukup mahal dan lamanya waktu perawatan serta pengobatannya. Upaya pencegahan melalui deteksi dini dan upaya pengendaliannya sangat penting untuk dilakukan. Salah satu cara untuk mendeteksi penyakit jantung koroner dengan memanfaatkan teknologi komputasi, yaitu melakukan klasifikasi menggunakan algoritma tertentu. Pada penelitian ini dilakukan klasifikasi dengan menggunakan algoritma Support Vector Machine (SVM) serta penanganan ketidakseimbangan data menggunakan SMOTE dan SMOTE-NCL. Data yang digunakan dalam penelitian ini adalah data Coronary Heart Disease yang memiliki dua buah kelas, yaitu kelas 0 (negatif PJK) dan kelas 1 (positif PJK) dengan permasalahan data yang tidak seimbang. Penelitian ini dilakukan dengan membandingkan kinerja dari klasifikasi SVM tanpa dilakukan penyeimbangan data, klasifikasi SVM dengan penyeimbangan data SMOTE, dan kalsifikasi SVM dengan penyeimbangan data SMOTE-NCL. Hasil yang didapatkan dari penelitian ini adalah pada klasifikasi SVM dengan penyeimbangan data SMOTE-NCL menghasilkan kinerja terbaik jika dibandingkan dengan model klasifikasi lain dengan nilai akurasi sebesar 85,10%.

Downloads

Download data is not yet available.

References

Agustianto, K., & Destarianto, P. (2019). Imbalance Data Handling using Neighborhood Cleaning Rule (NCL) Sampling Method for Precision Student Modeling. Proceedings - 2019 International Conference on Computer Science, Information Technology, and Electrical Engineering, ICOMITEE 2019, 1, 86–89. https://doi.org/10.1109/ICOMITEE.2019.8921159
Buulolo, E. (2020). Data Mining untuk Perguruan Tinggi (1st ed.). Deepublish.
Choirunnisa, S., & Buliali, J. L. (2018). Hybrid method of undersampling and oversampling for handling imbalanced data. 2018 International Seminar on Research of Information Technology and Intelligent Systems, ISRITI 2018, November, 276–280. https://doi.org/10.1109/ISRITI.2018.8864335
Hairani, Saputro, K. E., & Fadli, S. (2020). K-means-SMOTE for handling class imbalance in the classification of diabetes with C4.5, SVM, and naive Bayes. Jurnal Teknologi Dan Sistem Komputer, 8(2), 89–93. https://doi.org/10.14710/jtsiskom.8.2.2020.89-93
Irmanda, H. N., & Astritama, R. (2021). Klasifikasi Jenis Pantun dengan Metode Support Vector Machines (SVM). JURNAL RESTI (Rekayasa Sistem Dan Teknologi Informasi)(Rekayasa Sistem Dan Teknologi Informasi, 4, 915–922.
Kasanah, A. N., Muladi, & Pujianto, U. (2019). Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN. JURNAL RESTI (Rekayasa Sistem Dan Teknologi Informasi), 3, 196–201.
Laurikkala, J. (2001). Improving Identification of Difficult Small Classes by Balancing Class Distribution. 63–66.
Mellor, A., Boukir, S., Haywood, A., & Jones, S. (2015). Exploring issues of training data imbalance and mislabelling on random forest performance for large area land cover classification using the ensemble margin. ISPRS Journal of Photogrammetry and Remote Sensing, 105, 155–168. https://doi.org/10.1016/j.isprsjprs.2015.03.014
Nurmasani, A., & Pristyanto, Y. (2021). Algoritme Stacking untuk Klasifikasi Penyakit Jantung pada Dataset Imbalanced Class. Jurnal Pseudocode, VIII, 21–26.
Octaviani, P. A., Wilandari, Y., & Ispriyanti, D. (2014). Penerapan Metode Klasifikasi Support Vector Machine (SVM) pada Data Akreditasi Sekolah Dasar (SD) di Kabupaten Magelang. Jurnal Gaussian, 3, 811–820.
Ramadhan, N. G., & Khoirunnisa, A. (2021). Klasifikasi Data Malaria Menggunakan Metode Support Vector Machine. Jurnal Media Informatika Budidarma, 5(4), 1580. https://doi.org/10.30865/mib.v5i4.3347
Siringoringo, R. (2018). Klasifikasi Data Tidak Seimbang menggunakan Algoritma SMOTE dan K-Nearest Neighbor. Journal Information System Development (ISD), 3, 44–49.
Sutoyo, E., & Fadlurrahman, M. A. (2020). Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network. Jurnal Edukasi Dan Penelitian Informatika, 6, 379–385.
Syukron, M., Santoso, R., & Widiharih, T. (2020). Perbandingan Metode SMOYE Random Forest dan Smote XGboost Untuk Klasifikasi Tingkat Penyakit Hepatitis C pada Imbalance Class Data. Jurnal Gaussian, 9, 227–236.
How to Cite
Mariana Dewi, Triando Hamonangan Saragih, & Rudy Herteno. (2023). PENERAPAN SMOTE-NCL UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS PADA KLASIFIKASI PENYAKIT JANTUNG KORONER . Jurnal Informatika Polinema, 10(1), 27-34. https://doi.org/10.33795/jip.v10i1.1394