Perancangan Data Infrastrukur dengan Menerapkan Teknik Data Wrangling Studi Kasus: Data Users di Narasio Data

Wahyu Widyanto, Victoria Lucky Mahendra, Fa'iz Abiyyu Rizqullah Saputra, Rani Rotul Muhima

Abstract


Dalam era digital, jumlah data yang kompleks dan beragam terus meningkat dari berbagai sumber. Namun, perbedaan dalam format, skema, dan kualitas data dapat menyulitkan penggabungan, transformasi, dan analisis data. Salah satu tantangan utama adalah masalah kualitas data yang dapat mengakibatkan kesalahan dalam pengambilan keputusan. Oleh karena itu, penting untuk membersihkan data dengan baik agar penggabungan data menghasilkan hasil yang akurat. Teknik data wrangling dengan metode column mapping and merging diterapkan untuk mengatasi masalah penggabungan data dari dua sumber yang berbeda. Tahapan penelitian meliputi pendefinisian masalah dan studi kasus yang diberikan oleh tim produk PT. Berpikir Revolusioner Indonesia (Narasio Data), pengumpulan data file excel dan csv yang berasal dari kegiatan training dan event registration. File excel yang diolah sebanyak 38 file sedangkan file csv ada sebanyak 10 file. Hasil penelitian menunjukkan bahwa teknik data wrangling dengan metode column mapping and merging dapat membersihkan dan menggabungkan kolom serta isi dari data training dan event registration menjadi satu set data baru yang disebut sebagai set data users. Dengan demikian, informasi yang diperoleh dari berbagai sumber dapat digunakan kembali dan meningkatkan analisis data di masa mendatang.

Keywords


Cleaning data; column mapping; column merging; data wrangling

Full Text:

PDF

References


Binus University, “Sejarah dan Evolusi Big Data – Himpunan Mahasiswa Sistem Informasi,” Binus University, May 29, 2023. https://student-activity.binus.ac.id/himsisfo/2023/05/sejarah-dan-evolusi-big-data/ (accessed Jun. 12, 2023).

N. Putu, A. Widiari, M. Agus, D. Suarjaya, and D. Putra Githa, “Teknik Data Cleaning Menggunakan Snowflake untuk Studi Kasus Objek Pariwisata di Bali,” Jurnal Ilmiah Merpati (Menara Penelitian Akademika Teknologi Informasi), pp. 137–145, Jul. 2020, doi: 10.24843/JIM.2020.V08.I02.P07.

W. Swapnil and Y. Anil, “Big Data: Characteristics, Challenges and Data Mining,” Int J Comput Appl, pp. 975–8887.

H. Mueller and J. Freytag, “Problems , Methods , and Challenges in Comprehensive Data Cleansing,” 2005.

M. Haghighat, M. Abdel-Mottaleb, and W. Alhalabi, “Discriminant correlation analysis for feature level fusion with application to multimodal biometrics,” ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings, vol. 2016-May, pp. 1866–1870, May 2016, doi: 10.1109/ICASSP.2016.7472000.

I. Setiawan, A. Mutia Dawis, and P. Studi Sistem dan Teknologi Informasi Fakultas Sains Dan Teknologi, “DATA SCIENCE: PENDEKATAN DAN LANGKAH PRAKTIS DENGAN EXCEL,” Journal of Innovation And Future Technology (IFTECH), vol. 5, no. 1, pp. 11–22, Feb. 2023, doi: 10.47080/IFTECH.V5I1.2457.

F. Ridzuan and W. M. N. Wan Zainon, “A Review on Data Cleansing Methods for Big Data,” Procedia Comput Sci, vol. 161, pp. 731–738, Jan. 2019, doi: 10.1016/J.PROCS.2019.11.177.

F. Endel and H. Piringer, “Data Wrangling: Making data useful again,” IFAC-PapersOnLine, vol. 48, no. 1, pp. 111–112, Jan. 2015, doi: 10.1016/J.IFACOL.2015.05.197.

M. M. Patil and B. N. Hiremath, “A Systematic Study of Data Wrangling,” International Journal of Information Technology and Computer Science, vol. 10, no. 1, pp. 32–39, Jan. 2018, doi: 10.5815/IJITCS.2018.01.04.

S. Ghosh, K. Neha, and Y. Praveen Kumar, “Data wrangling using python,” International Journal of Recent Technology and Engineering, vol. 8, no. 2 Special Issue 11, pp. 3491–3495, Sep. 2019, doi: 10.35940/IJRTE.B1427.0982S1119.

R. Kitchin, The Data Revolution: Big Data, Open Data, Data Infrastructures Their Consequences. SAGE Publications Ltd, 2014. doi: 10.4135/9781473909472.

J. Gray, C. Gerlitz, and L. Bounegru, “Data infrastructure literacy,” Original Research Article, pp. 1–13, 2018, doi: 10.1177/2053951718786316.

T. C. Redman, “Data driven : profiting from your most important business asset,” p. 257, Accessed: Jun. 13, 2023. [Online]. Available: https://www.perlego.com/book/836939/data-driven-profiting-from-your-most-important-business-asset-pdf

J. Ha, M. Kambe, and J. Pe, Data Mining: Concepts and Techniques. Elsevier, 2011. doi: 10.1016/C2009-0-61819-5.

O. Azeroual, “Data Wrangling in Database Systems: Purging of Dirty Data,” Data 2020, Vol. 5, Page 50, vol. 5, no. 2, p. 50, Jun. 2020, doi: 10.3390/DATA5020050.


Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Wahyu Widyanto

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.