Deteksi PCOS pada Wanita Menggunakan Explanatory Data Analysis (EDA) dan Support Vector Machine (SVM)

Weny Mistarika Rahmawati, Renovita Edelani

Abstract

Polycistic Ovarium Syndrom (PCOS) merupakan gangguan hormonal yang terjadi pada Wanita usia produktif dan bisa mengakibatkan infertilitas. PCOS sendiri belum diketahui penyebab pastinya tetapi factor genetic dan pola hidup merupakan factor yang dapat memengaruhi seorang Wanita terkena PCOS. Penelitian ini bertujuan melakukan deteksi PCOS berdasarkan data yang terdiri dari umur, indeks masa tubuh, level testosterone serta jumlah folikel. Data awal yang didapat memiliki distribusi yang tidak baik atau bisa dikatakan tidak seimbang. Peneliti melakukan Explanatory Data Analysis (EDA) pada tahap awal dengan membuat scatterplot untuk mencari korelasi setiap fitur dengan kelas target. Hasilnya ada fitur keteraturan haid yang nilai kealpaannya sangat mempengaruhi deteksi PCOS sehingga dilakukan penghapusan data  pada nilai null pada fitur tersebut. Setelah itu dilakukan klasifikasi Support Vector Machine (SVM) untuk memisahkan kelas terdiagnosa PCOS atau tidak. Beberapa kernel SVM diujikan untuk mengetahui hasil terbaik yang bisa dihasilkan. Evaluasi dilakukan dengan menghitung akurasi, precision, recall dan f1-score pada confussion matrix yang terbentuk. Hasil dari penelitian menunjukkan bawa kernel polynomial memberikan hasil klasifikasi terbaik dengan akurasi sebesar 89,62%, precision 81,08%, recall 88,23% dan f1-score 84,5%. Penelitian ini mengonfirmasi bahwa kombinasi EDA dan SVM dapat digunakan sebagai pendekatan yang efektif dalam mendukung deteksi PCOS.

Full Text:

PDF

References

Alfian, G., Syafrudin, M., Fahrurrozi, I., Fitriyani, N. L., Atmaji, F. T. D., Widodo, T., Bahiyah, N., Benes, F., & Rhee, J. (2022). Predicting Breast Cancer from Risk Factors Using SVM and Extra-Trees-Based Feature Selection Method. Computers 2022, Vol. 11, Page 136, 11(9), 136. https://doi.org/10.3390/COMPUTERS11090136

Dhany, H. W., Sutarman, S., & Izhari, F. (2023). Exploratory Data Analysis (EDA) methods for healthcare classification. Journal of Intelligent Decision Support System (IDSS), 6(4), 209–215. https://doi.org/10.35335/IDSS.V6I4.165

Hidayat, W., Ardiansyah, M., & Setyanto, A. (2021). Pengaruh Algoritma ADASYN dan SMOTE terhadap Performa Support Vector Machine pada Ketidakseimbangan Dataset Airbnb. Edumatic: Jurnal Pendidikan Informatika, 5(1), 11–20. https://doi.org/10.29408/EDUMATIC.V5I1.3125

Kaur, R., Kumar, R., & Gupta, M. (2022). Food Image-based diet recommendation framework to overcome PCOS problem in women using deep convolutional neural network. Computers and Electrical Engineering, 103, 108298. https://doi.org/10.1016/J.COMPELECENG.2022.108298

Liantoni, F., Rozi, N. F., Indriyani, T., Rahmawati, W. M., & Hapsari, R. K. (2021). Gradient based ant spread modification on ant colony optimization method for retinal blood vessel edge detection. IOP Conference Series: Materials Science and Engineering, 1010(1), 012021. https://doi.org/10.1088/1757-899X/1010/1/012021

Lizneva, D., Suturina, L., Walker, W., Brakta, S., Gavrilova-Jordan, L., & Azziz, R. (2016). Criteria, prevalence, and phenotypes of polycystic ovary syndrome. Fertility and Sterility, 106(1), 6–15. https://doi.org/10.1016/J.FERTNSTERT.2016.05.003

Matharaarachchi, S., Domaratzki, M., & Muthukumarana, S. (2024). Enhancing SMOTE for imbalanced data with abnormal minority instances. Machine Learning with Applications, 18, 100597. https://doi.org/10.1016/J.MLWA.2024.100597

Mehta, V., Batra, N., Poonam, Goyal, S., Kaur, A., Dudekula, K. V., & Victor, G. J. (2024). Machine Learning based Exploratory Data Analysis (EDA) and Diagnosis of Chronic Kidney Disease (CKD). EAI Endorsed Transactions on Pervasive Health and Technology, 10(1), 1. https://doi.org/10.4108/EETPHT.10.5512

Nur Rizki, I., Lia Puspita, M., Prayoga, D., Qomarul Huda, M., & Syarif Hidayatullah Jakarta, U. (2024). IMPLEMENTASI EXPLORATORY DATA ANALYSIS UNTUK ANALISIS DAN VISUALISASI DATA PENDERITA STROKE KALIMANTAN SELATAN MENGGUNAKAN PLATFORM TABLEAU. Jurnal Informatika Dan Teknik Elektro Terapan, 12(1), 2830–7062. https://doi.org/10.23960/JITET.V12I1.3856

Pamuji, F. Y., & Putri, S. D. A. (2023). Komparasi metode SMOTE dan ADASYN untuk penanganan data tidak seimbang MultiClass. Jurnal Informatika Polinema, 9(3), 331–338. https://doi.org/10.33795/JIP.V9I3.1330

Pitaloka, N. T., & Kusnawi, K. (2023). PCOS DISEASE CLASSIFICATION USING FEATURE SELECTION RFECV AND EDA WITH KNN ALGORITHM METHOD. Jurnal Teknik Informatika (Jutif), 4(4), 693–701. https://doi.org/10.52436/1.JUTIF.2023.4.4.831

Subarkah, M. A., Rahmawati, W. M., Wardhana, S. R., Hapsari, R. K., Informatika, T., Adhi, T., & Surabaya, T. (2022). Analisis Sentimen Terhadap Video Ulasan Produk Menggunakan Metode Support Vector Machine Dengan Sequential Minimal Optimization. KERNEL: Jurnal Riset Inovasi Bidang Informatika Dan Pendidikan Informatika, 3(2), 17–24. https://doi.org/10.31284/J.KERNEL.2022.V3I2.4039

Teede, H. J., Misso, M. L., Costello, M. F., Dokras, A., Laven, J., Moran, L., Piltonen, T., Norman, R. J., Andersen, M., Azziz, R., Balen, A., Baye, E., Boyle, J., Brennan, L., Broekmans, F., Dabadghao, P., Devoto, L., Dewailly, D., Downes, L., … Yildiz, B. O. (2018). Recommendations from the international evidence-based guideline for the assessment and management of polycystic ovary syndrome. Human Reproduction, 33(9), 1602–1618. https://doi.org/10.1093/HUMREP/DEY256

Wahyuni, S. D., & Kusumodestoni, R. H. (2024). Optimalisasi Algoritma Support Vector Machine (SVM) Dalam Klasifikasi Kejadian Data Stunting. Bulletin of Information Technology (BIT), 5(2), 56–64. https://doi.org/10.47065/BIT.V5I2.1247

Wibowo, A. (2022). Analisa Dan Visualisasi Data Penjualan Menggunakan Exploratory Data Analysis Pada PT. Telkominfra. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi), 9(3), 2292–2304. https://doi.org/10.35957/jatisi.v9i3.2737

Wijaya, M. G., Pinaringgi, M. F., Zakiyyah, A. Y., & Meiliana. (2024). Comparative Analysis of Machine Learning Algorithms and Data Balancing Techniques for Credit Card Fraud Detection. Procedia Computer Science, 245(C), 677–688. https://doi.org/10.1016/J.PROCS.2024.10.294

Refbacks

  • There are currently no refbacks.