Implementasi Pandas Data frame sebagai Agregasi dan Tabulasi Penyajian Data Luaran Survei Kepuasan Pengguna Proses Pembelajaran dalam Pendidikan Tinggi

Isa Albanna, R Tri Hadi Laksono

Abstract

Pandas (Python Data Analysis) merupakan pustaka pengolahan data dengan domain pemrograman python. Pustaka tersebut memiliki fitur data frame yang dapat membantu dalam manajemen data berbasis tabel atau informasi larik (array). Agregasi data dengan sumber luaran kegiatan survei kepuasan pengguna proses pembelajaran dalam pendidikan tinggi memiliki perekaman data sekitar 8800 baris. Rekaman data tersebut tersaji dalam file comma-separated values dengan isi parameter adalah objek dan butir penilaian. Penelitian ini bertujuan untuk melakukan agregasi dan penyusunan data tak terstruktur menjadi untaian data tabular sehingga memudahkan dalam penyajian informasi. Penelitian ini terdapat dua metode secara umum yaitu pengelompokan rekaman data dan penyajian data dalam tabel pivot. Pegelompokan data dilakukan dengan melihat indeks pengelompokan dan matrik nilai survei. Data yang tak terstruktur akan menjadi data utuh dengan pengelompokan berdasarkan indeks. Proses kedua setelah tahap pengelompokan adalah penyajian data dalam tabel pivot. Proses pivot dilakukan dengan transformasi matrik berpasangan untuk menjaga konsistensi isi data. Proses komputasi digunakan untuk membantu penyusunan data yang bersifat ganda dalam data frame tak terstruktur. Proses konfigurasi informasi secara otomatis dilakukan secara mandiri dari source code yang telah dibuat dengan beberapa kekangan informasi. Hasil luaran informasi dari seluruh proses pengolahan data frame adalah tabel pivot yang berisikan informasi pasangan objek dan nilai survei. Objek survei yang merupakan ID dari pengajar akan dipasangkan dengan butir penilaian oleh responden, yang nantinya informasi tersebut digunakan sebagai bahan analisis kualitatif kepuasan pengguna. Validasi dilakukan dengan mencocokan hasil penyajian data pivot dengan sumber data. Akurasi komputasi memiliki nilai 92.4% yang terhitung dari 50 titik uji dari matrik data. Waktu komputasi dari proses pengelompokan hingga penyajian data adalah 3-4 detik dengan jumlah data adalah 8800 baris. Komparasi runtime komputasi memiliki efisiensi yang cukup tinggi dalam penyajian data survei jika dibandingkan dengan penyajian data secara manual menggunakan Microsoft office.

Keywords

Agregasi Data; Data frame; Data Pivot; Pandas-Python.

Full Text:

PDF

References

LAM-Teknik, “PANDUAN PENYUSUNAN LAPORAN KINERJA PROGRAM STUDI PANDUAN PENYUSUNAN LAPORAN KINERJA PROGRAM STUDI.” LEMBAGA AKREDITASI MANDIRI PROGRAM STUDI KETEKNIKAN, 2021.

L. Lathifah, E. Handoyo, and Y. A. A. Soetrisno, “SISTEM CRAWLING DATA INSTRUMEN AKREDITASI BERBASIS SELENIUM DAN PANDAS,” Transient J. Ilm. Tek. Elektro, vol. 10, no. 1, Art. no. 1, May 2021, doi: 10.14710/transient.v10i1.84-91.

S. Molin and K. Jee, Hands-On Data Analysis with Pandas - Second Edition, 2nd edition. Packt Publishing, 2021.

B. Paskhaver, Pandas in action. Shelter Island, NY: Manning Publications Co, 2021.

M. Wang, K. He, J. Chen, R. Du, B. Zhang, and Z. Li, “PANDA: Lightweight non-interactive privacy-preserving data aggregation for constrained devices,” Future Gener. Comput. Syst., vol. 131, pp. 28–42, Jun. 2022, doi: 10.1016/j.future.2022.01.007.

H. Patmawati and S. Santika, “Penggunaan Software Microsoft Excel sebagai Alternatif Pengolahan Data Statistika Penelitian Mahasiswa Tingkat Akhir,” PRISMA Pros. Semin. Nas. Mat., pp. 124–129, Feb. 2017.

D. Y. Chen, Pandas for everyone: Python data analysis. Boston: Addison-Wesley, 2018.

T. Chase, T. Mylläri, and A. Mylläri, “Visual Explorer of Multivariate Data,” Procedia Comput. Sci., vol. 150, pp. 416–424, 2019, doi: 10.1016/j.procs.2019.02.072.

F. Nelli, Python Data Analytics: With Pandas, NumPy, and Matplotlib, 2nd ed. 2018. Berkeley, CA: Apress : Imprint: Apress, 2018. doi: 10.1007/978-1-4842-3913-1.

Refbacks

  • There are currently no refbacks.