Pengaruh Tuning Parameter dan Cross Validation Pada Klasifikasi Teks Komplain Bahasa Indonesia Menggunakan Algoritma Support Vector Machine
DOI:
https://doi.org/10.36085/jsai.v6i3.6117Abstrak
Klasifikasi teks bertujuan untuk mengelompokkan data teks, misalnya, untuk menemukan beberapa informasi dari dataset teks dari media sosial yang berukuran besar sehingga dapat digunakan oleh pemilik data (data owner). Klasifikasi teks secara manual memakan waktu dan sulit sehingga beberapa peneliti mencoba untuk melakukan riset klasifikasi teks secara otomatis. Penelitian ini mencoba untuk mengklasifikasikan dataset teks Bahasa Indonesia dengan menggunakan algoritma SVM. Penelitian dilakukan dalam dua tahap, yaitu eksperimen pertama tanpa parameter cross validation dan tuning parameter, kemudian dilakukan eksperimen kedua dengan parameter cross validation dan tuning parameter. Eksperimen tanpa parameter cross validation dan tuning parameter untuk support vector machine (SVM) mendapatkan akurasi 89,47% dengan nilai precision dan recall masing-masing adalah 0,90 dan 0,89. Eksperimen kedua menggunakan cross validation dengan k-5 dan k-10 dan parameter tuning dengan C constant dan gamma value. Hasil cross validation dengan k-10 diperoleh akurasi terbaik dengan nilai 96,48% denganwaktu komputasi selama 40,118 detik. Selanjutnya, fungsi kernel pada parameter tuning yaitu sigmoid, linear dan radial basis function dianalisis dan didapatkan bahwa fungsi kernel sigmoid mencapai akurasi dan waktu komputasi terbaik
Unduhan
Diterbitkan
Terbitan
Bagian
Lisensi
Hak Cipta (c) 2023 Vina Ayumi, Desi Ramayanti, Handrie Noprisson, Anita Ratnasari, Umniy Salamah

Artikel ini berlisensi Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.