Bộ dữ liệu hình ảnh lai giữa thực tế và mô phỏng phục vụ thị giác máy trong robot

( 0 đánh giá )
Miễn phí

ADORESet gồm 30 danh mục vật thể thường gặp trong môi trường văn phòng hoặc trong nhà như laptop, chuột, ly, nồi, điện thoại, v.v. Mỗi danh mục có 2500 ảnh thực tế thu thập từ internet và 750 ảnh mô phỏng tạo bằng môi trường Gazebo. Tất cả ảnh đều được gán nhãn đầy đủ, có tọa độ hộp giới hạn (bounding box) và thông tin về vật thể kế cận (successor object) để hỗ trợ phân tích ngữ nghĩa. Tài liệu trình bày quy trình xây dựng bộ dữ liệu, công cụ gán nhãn ITUrk GUI, phân tích thống kê mối quan hệ giữa các vật thể, và đánh giá hiệu năng nhận dạng bằng các mô hình CNN hiện đại như VGGNet, Inception V3, ResNet và Xception. Kết quả cho thấy khi huấn luyện bằng cả ảnh thực và mô phỏng, độ chính xác nhận dạng đạt đến 95%, cao hơn nhiều so với huấn luyện đơn lẻ bằng một loại ảnh.