Deteksi Akun Palsu Media Sosial X (Twitter) Berbasis Machine Learning

Adisha Putri Az Zahra, Rimuljo Hendradi, Faried Effendy

Abstract


Pada awal tahun 2024, X menduduki peringkat keenam sebagai media sosial yang paling banyak digunakan di Indonesia. Jumlah pengguna yang terus meningkat ini dapat menimbulkan masalah seperti meningkatnya jumlah akun pengguna palsu pada media sosial X. Penelitian ini bertujuan untuk mengidentifikasi pola pada akun palsu serta pengembangan model klasifikasi deteksi akun palsu pada media sosial X. Tahapan pada penelitian ini meliputi proses pengumpulan data, data preprocessing, seleksi fitur, proses klasterisasi, tahap klasifikasi hingga evaluasi model. Dengan dataset sejumlah 8291 baris, nilai K optimal untuk proses clustering yakni K=4. Dari proses analisis klaster, cluster 1 menunjukkan kelompok akun dengan karakteristik akun palsu. Hal ini ditandai dengan usia akun yang tergolong masih muda hingga baru, sebanyak 99% akun masih menggunakan profil default, serta jumlah following yang jauh lebih banyak dari jumlah followers. Pengembangan model klasifikasi akan menggunakan dataset yang telah diberikan label setelah proses clustering. Cluster 1 akan dilabeli sebagai akun palsu serta cluster 0, 2 dan 3 diberi label sebagai akun asli. Dengan menggunakan tiga jenis algoritma yakni Random Forest, AdaBoost dan KNN serta empat skema pembagian dataset diperoleh recall, F1-Score dan akurasi tertinggi pada model Random Forest dengan persentase berturut-turut 99,35%, 98,71% dan 98,55%.

Keywords


Pembelajaran mesin; deteksi akun palsu; x (twitter); kmeans clustering; klasifikasi

Full Text:

PDF

References


C. M. Annur, “Ini Media Sosial Paling Banyak Digunakan di Indonesia Awal 2024,” databoks. [Online]. Available: https://databoks.katadata.co.id/datapublish/2024/03/01/ini-media-sosial-paling-banyak-digunakan-di-indonesia-awal-2024

S. Kemp, “Digital 2024: Indonesia,” datareportal. [Online]. Available: https://datareportal.com/reports/digital-2024-indonesia

E. Van Der Walt and J. Eloff, “Using Machine Learning to Detect Fake Identities: Bots vs Humans,” IEEE Access, vol. 6, pp. 6540–6549, 2018, doi: 10.1109/ACCESS.2018.2796018.

B. Erúahin, Ö. Aktaú, D. KÕlÕnç, and C. Akyol, “Twitter Fake Account Detection”.

J. Ezarfelix, N. Jeffrey, and N. Sari, “Systematic Literature Review: Instagram Fake Account Detection Based on Machine Learning:,” Eng. Math. Comput. Sci. EMACS J., vol. 4, no. 1, pp. 25–31, Feb. 2022, doi: 10.21512/emacsjournal.v4i1.8076.

Y. Elyusufi, Z. Elyusufi, and M. A. Kbir, “Social networks fake profiles detection based on account setting and activity,” in Proceedings of the 4th International Conference on Smart City Applications, Casablanca Morocco: ACM, Oct. 2019, pp. 1–5. doi: 10.1145/3368756.3369015.

M. Vyawahare and S. Govilkar, “Fake profile recognition using profanity and gender identification on online social networks,” Soc. Netw. Anal. Min., vol. 12, no. 1, p. 170, Dec. 2022, doi: 10.1007/s13278-022-00997-3.

K. S. Adewole, T. Han, W. Wu, H. Song, and A. K. Sangaiah, “Twitter spam account detection based on clustering and classification methods,” J. Supercomput., vol. 76, no. 7, pp. 4802–4837, Jul. 2020, doi: 10.1007/s11227-018-2641-x.

W. Dracewicz and M. Sepczuk, “Detecting Fake Accounts on Social Media Portals—The X Portal Case Study,” Electronics, vol. 13, no. 13, p. 2542, Jun. 2024, doi: 10.3390/electronics13132542.

N. G. Kerrysa and I. Q. Utami, “Fake account detection in social media using machine learning methods: literature review,” Bull. Electr. Eng. Inform., vol. 12, no. 6, pp. 3790–3797, Dec. 2023, doi: 10.11591/eei.v12i6.5334.

P. Wanda, “RunMax: fake profile classification using novel nonlinear activation in CNN,” Soc. Netw. Anal. Min., vol. 12, no. 1, p. 158, Dec. 2022, doi: 10.1007/s13278-022-00983-9.

M. Smruthi and N. Harini, “A Hybrid Scheme for Detecting Fake Accounts in Facebook,” Int. J. Recent Technol. Eng. IJRTE, vol. 7, no. 5S3, Feb. 2019.

F. S. Alsubaei, “Detection of Inappropriate Tweets Linked to Fake Accounts on Twitter,” Appl. Sci., vol. 13, no. 5, p. 3013, Feb. 2023, doi: 10.3390/app13053013.

M. Al Fatih Abil Fida, T. Ahmad, and M. Ntahobari, “Variance Threshold as Early Screening to Boruta Feature Selection for Intrusion Detection System,” in 2021 13th International Conference on Information & Communication Technology and System (ICTS), Surabaya, Indonesia: IEEE, Oct. 2021, pp. 46–50. doi: 10.1109/ICTS52701.2021.9608852.




DOI: https://doi.org/10.31284/p.snestik.2025.7343

Refbacks

  • There are currently no refbacks.


Copyright (c) 2025 Adisha Putri Az Zahra, Rimuljo Hendradi, Faried Effendy

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.