Tóm tắt văn bản tiếng Việt

Tóm tắt văn bản (text summarization - TS) là một trong những bài toán quan trọng trong lĩnh vực xử lý ngôn ngữ tự nhiên, trong đó, mục tiêu là tóm tắt văn bản nguồn (source document) thành văn bản đích (target document) mà vẫn giữ được những thông tin chính và nội dung của văn bản nguồn. Bài toán tóm tắt văn bản có ứng dụng quan trọng trong nhiều bài toán khác, điển hình như hỏi đáp tự động (question answering), tóm tắt tin tức (news summarization), sinh tiêu đề (headline generation).