Klasifikasi Cerita Bahasa Indonesia menggunakan Metode Hybrid PSO-KNN (Modified Binary Particle Swarm Optimization dengan K-Nearest Neighbor)

Anita Rahayu, Naim Rochmawati

Abstract


Abstrak— Penentuan kategori suatu cerita merupakan hal yang penting agar cerita yang dibaca sesuai dengan keinginan pembaca. Selama ini proses penentuan kategori suatu cerita masih dilakukan secara manual sehingga perlu adanya pengklasifikasian kategori cerita secara otomatis. Metode klasifikasi atau kategorisasi teks merupakan proses yang secara otomatis meletakkan dokumen teks ke dalam suatu kategori berdasarkan isi dari teks tersebut. Pada penelitian ini peneliti mengusulkan sebuah metode hybrid PSO-KNN yaitu penggabungan metode Modified Binary Particle Swarm Optimization dengan K-Nearest Neighbor. Metode PSO-KNN akan mengatasi permasalahan pengklasifikasian teks sekaligus mengatasi kelemahan KNN yang menggunakan seluruh fitur saat proses pembentukan model (learning). PSO-KNN akan mengurangi dimensi dari dokumen dengan memilih token-token sebagai fitur yang paling baik namun isi yang dikandung dokumen tetap terjaga karena fitur yang dipilih sangat merepresentasikan dokumen tersebut. Penerapan metode PSO-KNN berhasil mengkategorikan 5 kategori cerita Bahasa Indonesia sebanyak 150 data dengan tingkat akurasi sebesar 53% dan total fitur optimal sebanyak 88 fitur. Berdasarkan hasil penelitian yang dilakukan dapat disimpulkan bahwa metode PSO-KNN berhasil melakukan pengklasifikasi kategori cerita pendek serta mengurangi fitur saat proses pembentukan model dan meningkatkan nilai akurasi.

Kata Kunci— Klasifikasi teks, cerita pendek, modified binary particle swarm optimization, k-nearest neighbor, loocv



Full Text: PDF

Refbacks

  • There are currently no refbacks.