Nhận dạng thị giác cho robot hình người

( 0 đánh giá )
Miễn phí

BCE là phương pháp mã hóa tập trung vào độ thưa (sparsity), giúp tăng độ ổn định và giảm chi phí tính toán so với các phương pháp như Sparse Coding hay LLC.

  • MLCW là phương pháp phân nhóm có giám sát, sử dụng trọng số học từ các bộ phân loại trung gian để tăng độ phân biệt trong biểu diễn hình ảnh.
  • - Hệ thống được triển khai trên robot iCub, hỗ trợ hai chế độ học: Human Mode (người di chuyển vật thể) và Robot Mode (robot cầm vật thể).
  • - Ứng dụng gồm: học và nhận dạng đối tượng theo thời gian thực, và tương tác với đối tượng theo yêu cầu (chỉ, chạm, đẩy, cầm).
  • - Đánh giá trên các tập dữ liệu chuẩn (Caltech-256, PASCAL VOC 2007) và tập dữ liệu riêng cho iCub (iCubWorld 1.0 và iCubWorld Categorization).
  • - BCE + MLCW cho kết quả nhận dạng tốt nhất, vượt trội về độ chính xác và tốc độ xử lý.
  • - Hệ thống có thể huấn luyện nhanh, nhận dạng chính xác trong môi trường có nhiễu, ánh sáng thay đổi, và không cần thông tin độ sâu (depth).
  • - Tài liệu cũng cung cấp hướng dẫn thực hành cho cộng đồng robot: cách chọn tham số, tiền xử lý dữ liệu, học dictionary, chuẩn hóa, tăng dữ liệu, xử lý tập dữ liệu mất cân bằng.