PHÁT HIỆN MỘC KHUÔN MẶT 3D CHO HỆ THỐNG VIDEO THÔNG MINH
DOI:
https://doi.org/10.5281/Từ khóa:
Mạng nơ-ron tích chập, phát hiện mốc khuôn mặt, stacked hourglassTóm tắt
Phát hiện mốc khuôn mặt là một lĩnh vực nghiên cứu cơ bản trong thị giác máy tỉnh được áp dụng rộng rãi trong nhiều ứng dụng. Bài bảo này đề xuất một phương pháp phát hiện mốc khuôn mặt dựa trên mạng Stacked Hourglass, để thu được các điểm mốc chính xác trên khuôn mặt. Cụ thể hơn, bài bảo sử dụng mạng ResNet làm mạng xương sống thay vì chỉ một lớp tích chập kích cỡ 7x7. Ngoài ra, nó sửa đổi mô-đun Hourglass bằng cách sử dụng các lớp tích chập kích cỡ 1x1 trong các luồng nhảnh của mô-đun Hourglass để giảm kích cỡ mô hình và thời gian tính toán, thay vì các khổi Residual ban đầu. Kiến trúc được đề xuất cũng cải tiển bản đồ đặc trưng từ các mô- dun Hourglass sửa đổi với các đặc trưng có độ phân giải cao hơn hơn thông qua kết nối tắt để tạo ra kết quả chính xác hơn. Phương pháp được đề xuất có hiệu năng cao hơn các phương pháp khác trên các tập dữ liệu AFLW2000-3D và LS3D-W, các tập dữ liệu lớn nhất cho đến nay cho bài toản phát hiện mốc khuôn mặt 3D.