Klasifikasi Penderita Diabetes menggunakan Algoritma Machine Learning dan Z-Score

Penulis

  • Ichwanul Muslim Karo Karo Universitas Negeri Medan
  • Hendriyana Universitas Pendidikan Indonesia

DOI:

https://doi.org/10.54914/jtt.v8i2.564

Kata Kunci:

Diabetes, Decision Tree, Machine Learning, Naive Bayes, SVM, Z-Score

Abstrak

Diabetes merupakan salah satu penyakit mematikan dan kronis ditandai dengan peningkatan gula darah. Banyak komplikasi terjadi jika diabetes tidak diobati dan tidak teridentifikasi. Proses identifikasi umumnya dilakukan dengan kunjungan ke pusat diagnostik dan dokter konsultasi membuat pasien bosan. Pendekatan machine learning dapat memecahkan masalah identifikasi penyakit diabetes. Namun, rentang nilai variabel penentu penyakit diabetes yang tidak seimbang mempengaruhi kualitas hasil machine learning. Penelitian ini memprediksi kemungkinan diabetes pada pasien penderita diabetes dari 768 wanita Indian, dengan tiga algoritma klasifikasi machine learning dan metode normalisasi Z-Score. Adapun algoritma machine learning yang digunakan adalah Decision Tree, Support Vector Machine (SVM) dan Naive Bayes. Eksperimen dilakukan pada Pima Indians Diabetes Database (PIDD) yang bersumber dari UCI Machine Lerning Repository. Kinerja ketiga algoritma dievaluasi menggunakan dengan akurasi, Precision, F1, dan Recall berdasarkan confusion matrix.  SVM merupakan algoritma yang memiliki performansi  paling tinggi dibandingkan dengan algoritma Naive Bayes dan Decision Tree, dengan akurasi 80.73% dan F1 76 %. Metode Z-Score berkontribusi positif dalam meningkatkan akurasi model klasifikasi. Lebih lanjut, penelitian ini juga berhasil mendapat akurasi yang lebih tinggi dari penelitian sebelumnya.

Unduhan

Data unduhan belum tersedia.

Referensi

A. M. Argina, “Penerapan Metode Klasifikasi K-Nearest Neigbor pada Dataset Penderita Penyakit Diabetes,†Indonesian Journal of Data and Science, vol. 1, no. 2, 2020, doi: 10.33096/ijodas.v1i2.11.

D. Sisodia and D. S. Sisodia, “Prediction of Diabetes using Classification Algorithms,†in Procedia Computer Science, 2018, vol. 132. doi: 10.1016/j.procs.2018.05.122.

D. Tomar and S. Agarwal, “A survey on data mining approaches for healthcare,†International Journal of Bio-Science and Bio-Technology, vol. 5, no. 5, 2013, doi: 10.14257/ijbsbt.2013.5.5.25.

D. A. Agatsa, R. Rismala, and U. N. Wisesty, “Klasifikasi Pasien Pengidap Diabetes Metode Support Vector Machine,†e-Proceeding of Enginering, vol. 7, no. 1, 2020.

D. A. Nasution, H. H. Khotimah, and N. Chamidah, “Perbandingan Normalisasi Data untuk Klasifikasi Wine Menggunakan Algoritma K-NN,†Computer Engineering, Science and System Journal, vol. 4, no. 1, 2019, doi: 10.24114/cess.v4i1.11458.

H. Henderi, “Comparison of Min-Max normalization and Z-Score Normalization in the K-nearest neighbor (kNN) Algorithm to Test the Accuracy of Types of Breast Cancer,†IJIIS: International Journal of Informatics and Information Systems, vol. 4, no. 1, 2021, doi: 10.47738/ijiis.v4i1.73.

I. M. K. Karo, A. Khosuri, and R. Setiawan, “Effects of Distance Measurement Methods in K-Nearest Neighbor Algorithm to Select Indonesia Smart Card Recipient,†2021. doi: 10.1109/ICoDSA53588.2021.9617476.

B. Muhamad Akbar, A. T. Akbar, and R. Husaini, “Analisis Sentimen dan Emosi Vaksin Sinovac pada Twitter menggunakan Naïve Bayes dan Valence Shifter,†Jurnal Teknologi Terpadu, vol. 7, no. 2, pp. 83–92, 2021.

F. W. Townes, S. C. Hicks, M. J. Aryee, and R. A. Irizarry, “Feature selection and dimension reduction for single-cell RNA-Seq based on a multinomial model,†Genome Biol, vol. 20, no. 1, 2019, doi: 10.1186/s13059-019-1861-6.

A. Rana and R. Pandey, “A review of popular decision tree algorithms in data mining,†Asian Journal of Multidimensional Research, vol. 10, no. 10, 2021, doi: 10.5958/2278-4853.2021.00837.5.

I. M. K. Karo, M. Y. Fajari, N. U. Fadhilah, and W. Y. Wardani, “Benchmarking Naïve Bayes and ID3 Algorithm for Prediction Student Scholarship,†IOP Conf Ser Mater Sci Eng, vol. 1232, no. 1, p. 012002, Mar. 2022, doi: 10.1088/1757-899X/1232/1/012002.

I. M. Karo Karo, S. Nadia Amalia, dan Dian Septiana, P. Ilmu Komputer, and P. Matematika, “Klasifikasi Kebakaran Hutan Menggunakan Feature Selection dengan Algoritma K-NN, Naive Bayes dan ID3,†Journal of Software Engineering, Information and Communication Technology, vol. 3, no. 1, pp. 121–126, 2022.

I. M. Karo Karo, M. F. M. Fudzee, S. Kasim, and A. A. Ramli, “Sentiment Analysis in Karonese Tweet using Machine Learning,†Indonesian Journal of Electrical Engineering and Informatics, vol. 10, no. 1, pp. 219–231, Mar. 2022, doi: 10.52549/ijeei.v10i1.3565.

Unduhan

Diterbitkan

2022-12-14

Cara Mengutip

[1]
I. M. Karo Karo dan H. Hendriyana, “Klasifikasi Penderita Diabetes menggunakan Algoritma Machine Learning dan Z-Score”, j. teknologi terpadu, vol. 8, no. 2, hlm. 94–99, Des 2022.

Terbitan

Bagian

Artikel