Klasifikasi Dataset Teks Pengaduan Masyarakat Terhadap Pemerintah di Sosial Media Menggunakan Logistic Regression

Mariana  Purba; Sri  Dianing Asri; Vina  Ayumi; Umniy  Salamah; Lemi  Iryani

doi:10.36085/jsai.v7i1.6447

Klasifikasi Dataset Teks Pengaduan Masyarakat Terhadap Pemerintah di Sosial Media Menggunakan Logistic Regression

Authors

Mariana Purba
Sri Dianing Asri
Vina Ayumi
Umniy Salamah
Lemi Iryani

DOI:

https://doi.org/10.36085/jsai.v7i1.6447

Abstract

Di era teknologi saat ini, salah satu media sosial yang banyak digunakan dalam berinteraksi dan memberikan opini, pengaduan masyarakat, serta saran adalah Twitter. Dalam bidang pemerintahan, tweet yang mengandung opini atau pengaduan masyarakat terhadap suatu layanan atau program organisasi dapat digunakan sebagai umpan balik untuk memperbaiki atau meningkatkan kualitas layanan. Penelitian ini berfokus pada klasifikasi tweet untuk membedakan tweet yang tergolong pengaduan masyarakat atau non-pengaduan masyarakat dengan menerapkan algoritma pemelajaran mesin yaitu logistic regression (LR). Tahap dari penelitian ini antara lain crawling dan labeling dataset, pre-processing, pemodelan menggunakan classifier logistic regression, serta evaluasi kinerja classifier. Tahapan dalam penelitian ini seperti preprocessing, klasifikasi dan evaluasi dilakukan menggunakan bahasa pemrograman Python dengan bantuan scikit-learn library. Berdasarkan hasil eksperimen, model penelitian dengan menggunakan fitur ekstraksi CountVectorizer mencapai kinerja yang lebih baik daripada TfidfVectorizer. Eksperimen dengan menggunakan ekstraksi fitur TfidfVectorizer mencapai akurasi 92% (F1 score: 0.9181, precision: 0.9191 recall: 0.9181, kappa: 0.8363) sedangkan menggunakan akurasi CountVectorizer mencapai 94% (F1 score: 0.9355, precision: 0.9406, recall: 0.9356, kappa: 0.8715).

Downloads

Full Paper

Published

2024-01-31

How to Cite

Purba, M. ., Dianing Asri, S. ., Ayumi, V. ., Salamah, U. ., & Iryani, L. . (2024). Klasifikasi Dataset Teks Pengaduan Masyarakat Terhadap Pemerintah di Sosial Media Menggunakan Logistic Regression. JSAI (Journal Scientific and Applied Informatics), 7(1), 78–83. https://doi.org/10.36085/jsai.v7i1.6447