PENERAPAN SMOTE-NCL UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS PADA KLASIFIKASI PENYAKIT JANTUNG KORONER
Abstract
Penyakit jantung koroner (PJK) terjadi akibat penyumbatan atau penyempitan pada pembuluh darah jantung karena adanya endapan lemak dan kolesterol sehingga mengakibatkan suplai darah ke jantung menjadi terganggu. PJK masih merupakan masalah kesehatan yang penting dan berdampak secara sosioekonomi karena biaya obat-obatan yang cukup mahal dan lamanya waktu perawatan serta pengobatannya. Upaya pencegahan melalui deteksi dini dan upaya pengendaliannya sangat penting untuk dilakukan. Salah satu cara untuk mendeteksi penyakit jantung koroner dengan memanfaatkan teknologi komputasi, yaitu melakukan klasifikasi menggunakan algoritma tertentu. Pada penelitian ini dilakukan klasifikasi dengan menggunakan algoritma Support Vector Machine (SVM) serta penanganan ketidakseimbangan data menggunakan SMOTE dan SMOTE-NCL. Data yang digunakan dalam penelitian ini adalah data Coronary Heart Disease yang memiliki dua buah kelas, yaitu kelas 0 (negatif PJK) dan kelas 1 (positif PJK) dengan permasalahan data yang tidak seimbang. Penelitian ini dilakukan dengan membandingkan kinerja dari klasifikasi SVM tanpa dilakukan penyeimbangan data, klasifikasi SVM dengan penyeimbangan data SMOTE, dan kalsifikasi SVM dengan penyeimbangan data SMOTE-NCL. Hasil yang didapatkan dari penelitian ini adalah pada klasifikasi SVM dengan penyeimbangan data SMOTE-NCL menghasilkan kinerja terbaik jika dibandingkan dengan model klasifikasi lain dengan nilai akurasi sebesar 85,10%.
Downloads
References
Buulolo, E. (2020). Data Mining untuk Perguruan Tinggi (1st ed.). Deepublish.
Choirunnisa, S., & Buliali, J. L. (2018). Hybrid method of undersampling and oversampling for handling imbalanced data. 2018 International Seminar on Research of Information Technology and Intelligent Systems, ISRITI 2018, November, 276–280. https://doi.org/10.1109/ISRITI.2018.8864335
Hairani, Saputro, K. E., & Fadli, S. (2020). K-means-SMOTE for handling class imbalance in the classification of diabetes with C4.5, SVM, and naive Bayes. Jurnal Teknologi Dan Sistem Komputer, 8(2), 89–93. https://doi.org/10.14710/jtsiskom.8.2.2020.89-93
Irmanda, H. N., & Astritama, R. (2021). Klasifikasi Jenis Pantun dengan Metode Support Vector Machines (SVM). JURNAL RESTI (Rekayasa Sistem Dan Teknologi Informasi)(Rekayasa Sistem Dan Teknologi Informasi, 4, 915–922.
Kasanah, A. N., Muladi, & Pujianto, U. (2019). Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN. JURNAL RESTI (Rekayasa Sistem Dan Teknologi Informasi), 3, 196–201.
Laurikkala, J. (2001). Improving Identification of Difficult Small Classes by Balancing Class Distribution. 63–66.
Mellor, A., Boukir, S., Haywood, A., & Jones, S. (2015). Exploring issues of training data imbalance and mislabelling on random forest performance for large area land cover classification using the ensemble margin. ISPRS Journal of Photogrammetry and Remote Sensing, 105, 155–168. https://doi.org/10.1016/j.isprsjprs.2015.03.014
Nurmasani, A., & Pristyanto, Y. (2021). Algoritme Stacking untuk Klasifikasi Penyakit Jantung pada Dataset Imbalanced Class. Jurnal Pseudocode, VIII, 21–26.
Octaviani, P. A., Wilandari, Y., & Ispriyanti, D. (2014). Penerapan Metode Klasifikasi Support Vector Machine (SVM) pada Data Akreditasi Sekolah Dasar (SD) di Kabupaten Magelang. Jurnal Gaussian, 3, 811–820.
Ramadhan, N. G., & Khoirunnisa, A. (2021). Klasifikasi Data Malaria Menggunakan Metode Support Vector Machine. Jurnal Media Informatika Budidarma, 5(4), 1580. https://doi.org/10.30865/mib.v5i4.3347
Siringoringo, R. (2018). Klasifikasi Data Tidak Seimbang menggunakan Algoritma SMOTE dan K-Nearest Neighbor. Journal Information System Development (ISD), 3, 44–49.
Sutoyo, E., & Fadlurrahman, M. A. (2020). Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network. Jurnal Edukasi Dan Penelitian Informatika, 6, 379–385.
Syukron, M., Santoso, R., & Widiharih, T. (2020). Perbandingan Metode SMOYE Random Forest dan Smote XGboost Untuk Klasifikasi Tingkat Penyakit Hepatitis C pada Imbalance Class Data. Jurnal Gaussian, 9, 227–236.
Copyright (c) 2023 Mariana Dewi, Triando Hamonangan Saragih, Rudy Herteno
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
Copyright for articles published in this journal is retained by the authors, with first publication rights granted to the journal. By virtue of their appearance in this open access journal, articles are free to use after initial publication under the International Creative Commons Attribution-NonCommercial 4.0 Creative Commons CC_BY_NC.