TÌM KIẾM ẢNH ĐA ĐỐI TƯỢNG DỰA TRÊN MẠNG R-CNN VÀ CẤU TRÚC KD-TREE

Tóm tắt

Tìm kiếm ảnh đa đối tượng là một bài toán quan trọng trong lĩnh vực tra cứu ảnh do sự đa dạng và tính phức tạp của hình ảnh. Trong bài báo này, một phương pháp tìm kiếm ảnh đa đối tượng dựa trên mạng R-CNN và cấu trúc KD-Tree được đề xuất nhằm phát triển những ưu điểm của mạng R-CNN trong việc xác định và phân loại từng đối tượng riêng biệt trên ảnh, đồng thời kết hợp với cấu trúc KD-Tree trong việc lưu trữ hình ảnh đã mang lại hiệu suất truy vấn cao và thời gian tìm kiếm ổn định. Để giải quyết bài toán này, chúng tôi trích xuất và phân lớp các đối tượng trên tập dữ liệu hình ảnh bằng mô hình mạng R-CNN và lưu trữ trên cấu trúc KD-Tree. Từ đó, mỗi ảnh đầu vào được phân đoạn theo từng đối tượng, trích xuất vector đặc trưng và thực hiện tìm kiếm tập ảnh tương tự dựa trên cấu trúc KD-Tree. Trên cơ sở đó, một mô hình tìm kiếm ảnh dựa trên mạng R-CNN và cấu trúc KD-Tree được đề xuất. Để minh chứng cho tính đúng đắn của cơ sở lý thuyết đã đề xuất, thực nghiệm được xây dựng trên bộ ảnh COCO với hiệu suất tìm kiếm ảnh là 0,6898. Kết quả thực nghiệm được so sánh với các công trình khác cùng trên bộ dữ liệu; điều này minh chứng cho tính khả thi và hiệu quả của phương pháp đề xuất, đồng thời có thể ứng dụng cho các bộ ảnh đa đối tượng.

https://doi.org/10.26459/hueunijtt.v131i2A.6837
PDF
Creative Commons License

công trình này được cấp phép theo phép Creative Commons Ghi công 4.0 Giấy phép International .

Bản quyền (c) 2022 Array