Một bộ dữ liệu hình ảnh lai nhằm thu hẹp khoảng cách giữa môi trường thực và mô phỏng trong robot học

( 0 đánh giá )
Miễn phí

ADORESet gồm 97,500 ảnh màu kích thước 300×300 px, chia đều cho 30 danh mục đối tượng như laptop, điện thoại, chuột, ly, nồi, đồng hồ, v.v.

  • Ảnh thực được thu thập từ 7 công cụ tìm kiếm hình ảnh với hơn 390 từ khóa, sau đó được lọc, gán nhãn, và chuẩn hóa bằng công cụ ITUrk GUI.
  • - Ảnh tổng hợp được tạo từ 5 mô hình CAD cho mỗi danh mục, sử dụng môi trường mô phỏng Gazebo với các biến số về ánh sáng và góc nhìn camera.
  • - Mỗi ảnh được gán nhãn bounding box và thông tin về các đối tượng kế cận để hỗ trợ học ngữ nghĩa.
  • - Các mô hình CNN được fine-tune trên các tổ hợp dữ liệu khác nhau (chỉ ảnh thực, chỉ ảnh mô phỏng, ảnh lai) để đánh giá độ chính xác, thời gian huấn luyện, và độ mất mát.
  • - Kết quả cho thấy mô hình huấn luyện với dữ liệu lai có độ chính xác cao nhất và khả năng tổng quát tốt nhất giữa môi trường thực và mô phỏng.