Klasifikasi Penderita Diabetes menggunakan Algoritma Machine Learning dan Z-Score

Ichwanul Muslim Karo Karo; Hendriyana Hendriyana

doi:10.54914/jtt.v8i2.564

Penulis

Ichwanul Muslim Karo Karo Universitas Negeri Medan
Hendriyana Universitas Pendidikan Indonesia

DOI:

https://doi.org/10.54914/jtt.v8i2.564

Kata Kunci:

Diabetes, Decision Tree, Machine Learning, Naive Bayes, SVM, Z-Score

Abstrak

Diabetes merupakan salah satu penyakit mematikan dan kronis ditandai dengan peningkatan gula darah. Banyak komplikasi terjadi jika diabetes tidak diobati dan tidak teridentifikasi. Proses identifikasi umumnya dilakukan dengan kunjungan ke pusat diagnostik dan dokter konsultasi membuat pasien bosan. Pendekatan machine learning dapat memecahkan masalah identifikasi penyakit diabetes. Namun, rentang nilai variabel penentu penyakit diabetes yang tidak seimbang mempengaruhi kualitas hasil machine learning. Penelitian ini memprediksi kemungkinan diabetes pada pasien penderita diabetes dari 768 wanita Indian, dengan tiga algoritma klasifikasi machine learning dan metode normalisasi Z-Score. Adapun algoritma machine learning yang digunakan adalah Decision Tree, Support Vector Machine (SVM) dan Naive Bayes. Eksperimen dilakukan pada Pima Indians Diabetes Database (PIDD) yang bersumber dari UCI Machine Lerning Repository. Kinerja ketiga algoritma dievaluasi menggunakan dengan akurasi, Precision, F1, dan Recall berdasarkan confusion matrix.Â SVM merupakan algoritma yang memiliki performansiÂ paling tinggi dibandingkan dengan algoritma Naive Bayes dan Decision Tree, dengan akurasi 80.73% dan F1 76 %. Metode Z-Score berkontribusi positif dalam meningkatkan akurasi model klasifikasi. Lebih lanjut, penelitian ini juga berhasil mendapat akurasi yang lebih tinggi dari penelitian sebelumnya.

Unduhan

Data unduhan belum tersedia.

Referensi

A. M. Argina, â€œPenerapan Metode Klasifikasi K-Nearest Neigbor pada Dataset Penderita Penyakit Diabetes,â€ Indonesian Journal of Data and Science, vol. 1, no. 2, 2020, doi: 10.33096/ijodas.v1i2.11.

D. Sisodia and D. S. Sisodia, â€œPrediction of Diabetes using Classification Algorithms,â€ in Procedia Computer Science, 2018, vol. 132. doi: 10.1016/j.procs.2018.05.122.

D. Tomar and S. Agarwal, â€œA survey on data mining approaches for healthcare,â€ International Journal of Bio-Science and Bio-Technology, vol. 5, no. 5, 2013, doi: 10.14257/ijbsbt.2013.5.5.25.

D. A. Agatsa, R. Rismala, and U. N. Wisesty, â€œKlasifikasi Pasien Pengidap Diabetes Metode Support Vector Machine,â€ e-Proceeding of Enginering, vol. 7, no. 1, 2020.

D. A. Nasution, H. H. Khotimah, and N. Chamidah, â€œPerbandingan Normalisasi Data untuk Klasifikasi Wine Menggunakan Algoritma K-NN,â€ Computer Engineering, Science and System Journal, vol. 4, no. 1, 2019, doi: 10.24114/cess.v4i1.11458.

H. Henderi, â€œComparison of Min-Max normalization and Z-Score Normalization in the K-nearest neighbor (kNN) Algorithm to Test the Accuracy of Types of Breast Cancer,â€ IJIIS: International Journal of Informatics and Information Systems, vol. 4, no. 1, 2021, doi: 10.47738/ijiis.v4i1.73.

I. M. K. Karo, A. Khosuri, and R. Setiawan, â€œEffects of Distance Measurement Methods in K-Nearest Neighbor Algorithm to Select Indonesia Smart Card Recipient,â€ 2021. doi: 10.1109/ICoDSA53588.2021.9617476.

B. Muhamad Akbar, A. T. Akbar, and R. Husaini, â€œAnalisis Sentimen dan Emosi Vaksin Sinovac pada Twitter menggunakan NaiÌˆve Bayes dan Valence Shifter,â€ Jurnal Teknologi Terpadu, vol. 7, no. 2, pp. 83â€“92, 2021.

F. W. Townes, S. C. Hicks, M. J. Aryee, and R. A. Irizarry, â€œFeature selection and dimension reduction for single-cell RNA-Seq based on a multinomial model,â€ Genome Biol, vol. 20, no. 1, 2019, doi: 10.1186/s13059-019-1861-6.

A. Rana and R. Pandey, â€œA review of popular decision tree algorithms in data mining,â€ Asian Journal of Multidimensional Research, vol. 10, no. 10, 2021, doi: 10.5958/2278-4853.2021.00837.5.

I. M. K. Karo, M. Y. Fajari, N. U. Fadhilah, and W. Y. Wardani, â€œBenchmarking NaÃ¯ve Bayes and ID3 Algorithm for Prediction Student Scholarship,â€ IOP Conf Ser Mater Sci Eng, vol. 1232, no. 1, p. 012002, Mar. 2022, doi: 10.1088/1757-899X/1232/1/012002.

I. M. Karo Karo, S. Nadia Amalia, dan Dian Septiana, P. Ilmu Komputer, and P. Matematika, â€œKlasifikasi Kebakaran Hutan Menggunakan Feature Selection dengan Algoritma K-NN, Naive Bayes dan ID3,â€ Journal of Software Engineering, Information and Communication Technology, vol. 3, no. 1, pp. 121â€“126, 2022.

I. M. Karo Karo, M. F. M. Fudzee, S. Kasim, and A. A. Ramli, â€œSentiment Analysis in Karonese Tweet using Machine Learning,â€ Indonesian Journal of Electrical Engineering and Informatics, vol. 10, no. 1, pp. 219â€“231, Mar. 2022, doi: 10.52549/ijeei.v10i1.3565.