XÂY DỰNG MÔ HÌNH PHÂN LỚP BÌNH LUẬN VỀ NHÀ HÀNG DỰA VÀO PHƯƠNG PHÁP HỌC MÁY

Tóm tắt

Học máy được biết đến là phương pháp phân lớp hiệu quả, trong đó hiệu quả của việc phân lớp khá phụ thuộc vào các đặc tính của đối tượng được trích chọn từ bộ dữ liệu. Với thực tế bùng nổ dữ liệu như hiện nay, đặc biệt là dữ liệu bình luận trên các website đánh giá trực tuyến, việc phân lớp gặp phải không ít thách thức. Tuy nhiên, việc phân lớp chính xác sẽ mang lại những ý nghĩa to lớn cho hoạt động tư vấn. Bài báo này nghiên cứu và xây dựng một mô hình phân lớp dựa trên học máy đối với dữ liệu là các bình luận về nhà hàng. Dữ liệu được thu thập từ các website đánh giá trực tuyến như Tripadvisor.com.vn và Foody.vn. Một kỹ thuật tiền xử lý các câu bình luận nhằm tăng ngữ nghĩa cũng được đề xuất. Thực nghiệm sử dụng 4 thuật toán học máy: Naive Bayes (NB), Support Vector Machines (SVM), Decision Tree (DT) và K-Nearest Neighbor (KNN). Kết quả cho thấy SVM cho kết quả phân lớp tốt nhất khi so sánh với NB, DT và KNN.

https://doi.org/10.26459/hueunijtt.v132i2A.7250
PDF
Creative Commons License

công trình này được cấp phép theo phép Creative Commons Ghi công 4.0 Giấy phép International .

Bản quyền (c) 2023 Array