PERINGKASAN TEKS MULTI-DOKUMEN BERDASARKAN METODE SENTENCE EXTRACTION DAN WORD SENSE DISAMBIGUATION

Khairiyyah Nur Aisyah, Syadza Anggraini, Agus Zainal Arifin

Abstract


Memahami makna utama yang terkandung dalam beberapa dokumen tentu tidak mudah dan membutuhkan waktu yang cukup lama. Menanggapi masalah tersebut, penelitian terkait peringkasan teks dokumen secara otomatis menjadi perhatian khusus dalam beberapa tahun terakhir. Penelitian ini mengusulkan metode peringkasan teks multi-dokumen yang dapat meningkatkan relevansi antar kalimat dengan menggunakan metode sentence extraction  dan word sense disambiguation. Metode sentence extraction yang digunakan didasarkan pada sentence distribution dan part of speech (POS) tagging. Berdasarkan pengujian peringkasan teks dengan metode yang diusulkan, nilai rata-rata ROUGE-1 adalah 0,712, 0,163, 0,247 pada recall, precision,  f-measure secara berurutan. Sedangkan hasil pengujian peringksan teks multi-dokumen tanpa menggunakan word sense disambiguation mendapatkan nilai rata-rata ROUGE-1 sebesar 0,685, 0,139, 0,216 pada recall, precision, f-measure secara berurutan. Hasil penelitian menunjukkan bahwa penggunaan metode sentence extraction dan word sense disambiguation pada peringkasan teks multi-dokumen dapat meningkatkan kualitas hasil peringkasan teks.

Refbacks

  • There are currently no refbacks.