Klasifikasi Dataset Teks Pengaduan Masyarakat Terhadap Pemerintah di Sosial Media Menggunakan Logistic Regression

Authors

  • Mariana Purba
  • Sri Dianing Asri
  • Vina Ayumi
  • Umniy Salamah
  • Lemi Iryani

DOI:

https://doi.org/10.36085/jsai.v7i1.6447

Abstract

Di era teknologi saat ini, salah satu media sosial yang banyak digunakan dalam berinteraksi dan memberikan opini, pengaduan masyarakat, serta saran adalah Twitter. Dalam bidang pemerintahan, tweet yang mengandung opini atau pengaduan masyarakat terhadap suatu layanan atau program organisasi dapat digunakan sebagai umpan balik untuk memperbaiki atau meningkatkan kualitas layanan. Penelitian ini berfokus pada klasifikasi tweet untuk membedakan tweet yang tergolong pengaduan masyarakat atau non-pengaduan masyarakat dengan menerapkan algoritma pemelajaran mesin yaitu logistic regression (LR). Tahap dari penelitian ini antara lain crawling dan labeling dataset, pre-processing, pemodelan menggunakan classifier logistic regression, serta evaluasi kinerja classifier. Tahapan dalam penelitian ini seperti preprocessing, klasifikasi dan evaluasi dilakukan menggunakan bahasa pemrograman Python dengan bantuan scikit-learn library. Berdasarkan hasil eksperimen, model penelitian dengan menggunakan fitur ekstraksi CountVectorizer mencapai kinerja yang lebih baik daripada TfidfVectorizer. Eksperimen dengan menggunakan ekstraksi fitur TfidfVectorizer mencapai akurasi 92% (F1 score: 0.9181, precision: 0.9191 recall: 0.9181, kappa: 0.8363) sedangkan menggunakan akurasi CountVectorizer mencapai 94% (F1 score: 0.9355, precision: 0.9406, recall: 0.9356, kappa: 0.8715).

Downloads

Published

2024-01-31

Issue

Section

Articles
Abstract viewed = 41 times