T5 CHO BÀI BÀI TOÁN ASPECT-BASED SENTIMENT ANLYSIS (ABSA) TRÊN DỮ LIỆU TIẾNG VIỆT

Authors

  • Đặng Bá Quí Qui Dang

DOI:

https://doi.org/10.5281/zenodo.14461013

Keywords:

Aspect-based sentiment analysis, SVM, BERT, T5

Abstract

Trong những năm gần đây với việc bùng nổ những đánh giá của người dùng trên Internet, việc phân tích cảm xúc của những bình luận dựa trên những khía cạnh đang trở thành một nhiệm vụ quan trọng trong lĩnh vực xử lý ngôn ngữ tự nhiên, cho phép hiểu rõ hơn về những cảm xúc được thể hiện đối với các khía cạnh cụ thể trong câu văn bản. Trong bài này chúng tôi sẽ trình bày một phương pháp tiếp cận bài toán Aspect-Based Sentiment Analysis (ABSA) bằng cách sử dụng mô hình T5 (Text-to-Text Transfer Transformer), một SOTA (state-of-the-art) framework có khả năng chuyển đổi các nhiệm vụ NLP khác nhau thành nhiệm vụ tạo văn bản. Cách tiếp cận của chúng tôi đơn giản hóa quy trình phức tạp của các mô hình ABSA truyền thống bằng cách tạo trực tiếp các cặp khía cạnh và cảm xúc trong một bước duy nhất, giảm thiểu nhu cầu cho các mô-đun truy xuất khía cạnh và phân loại cảm xúc riêng biệt. Chúng tôi thử nghiệm trên bộ dữ tiêu chuẩn của Vietnamese Language and Speech Processing (VLSP) dựa trên mô hình ViT5 đạt được F1-scores 84.04% trong nhiệm vụ Aspect Dection (AD) và 72.29% trong nhiệm vụ Aspect Polarity (AP) trên miền nhà hàng, 62.68% và 66.34% trên miền khách sạn.

Published

2024-12-14