KLASIFIKASI DOKUMEN BERITA BERBAHASA INDONESIA MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER (NBC) DAN K-MEANS CLUSTERING

Riani ., Amir Hamzah, Erna Kumalasari

Sari


Berita merupakan salah satu kebutuhan penting bagi masyarakat diberbagai belahan dunia.Melalui berita, masyarakat dapat mengetahui berbagai informasi yang sedang terjadi dimasyarakat saperti ekonomi, politik, kesehatan, kriminal, maupun bencana alam.Kebutuhan informasi yang meningkat setiap harinya membuat beberapa pihak instansi untuk dapat menyajikan berita secara cepat, tepat, terpercaya, dan akurat melalui media cetak maupun elektronik yang dapat dinikmati oleh pembaca berita. Meningkatnya jumlah berita yang didapat setiap harinya mengakibatkan penumpukan data yang besar berupa dokumen teks baik secara online maupuun offline. Sehingga menyulitkan dalam pencarian dan pengklasifikasian dokumen yang sesuai dengan kebutuhan.
Untuk mempermudah dalam pengklasifikasian dokuumen teks berita Berbahasa Indonesia salah satunya dengan menggunakan metode NBC dan K-Means Clustering. Dimana perhitungan NBC dilakukan tidak secara random, sedangkan perhitungan untuk K-Means Clustering dilakukan secara random, dalam penelitian ini perhitungan k-means clustering dilakukan 5x pada setiap dokumen sehingga hasil akurasinya kurang akurat jika dibandingkan dengan NBC
Hasil akurasi tertinggi yang diperoleh dari penelitian pengklasifikasian berita dengan metode nbc sebesar 50% dan rata-rata untuk keseluruhanya dari keempat dokumen sebesar 45.33%, sedangkan hasil akurasi tertinggi pengklasifikasian menggunakan metode k_means sebesar 100% dan hasil rata-rata keseluruhannya sebesar 53.26% dengan rincian dokumen_0 diperoleh hasil rata-rata sebesar 54%, dokumen 1 hasil rata-rata sebesar 60%, dokumen 2 hasil rata-rata keseluruhannya sebesar 42.56%, dan dokumen 3 hasil rata-rata keseluruhannya sebesar 52.48%.


Teks Lengkap:

PDF

Refbacks

  • Saat ini tidak ada refbacks.