Nhận dạng thị giác cho robot hình người

( 0 đánh giá )
Miễn phí

BCE là phương pháp mã hóa không dựa vào lỗi tái tạo mà tập trung vào độ tương đồng giữa đặc trưng đầu vào và các atom trong từ điển, chọn k atom gần nhất và gán trọng số theo độ tương đồng.

  • BCE cho kết quả ổn định hơn SC và LLC khi đặc trưng đầu vào bị dịch chuyển nhỏ, phù hợp với môi trường robot có chuyển động liên tục.
  • - MLCW sử dụng các bộ phân loại trung gian để gán trọng số cho các đặc trưng theo từng lớp, giúp tăng độ phân biệt khi phân nhóm đặc trưng.
  • - MLCW kết hợp phân nhóm không gian (SPR) và phân nhóm không gian đặc trưng (FSR), cho phép mô hình hóa cả vị trí và ngữ nghĩa của đặc trưng.
  • - Các phương pháp được đánh giá trên Caltech-256, PASCAL VOC 2007 và iCubWorld, cho thấy BCE + MLCW đạt độ chính xác cao nhất với chi phí tính toán thấp.
  • - BCE có độ phức tạp O(Md), không phụ thuộc vào kích thước từ điển, phù hợp với ứng dụng thời gian thực.
  • - MLCW có độ phức tạp O(MSd + Npd), thấp hơn các phương pháp phân nhóm đặc trưng khác như MWL.
  • - Các mẹo thực nghiệm: dùng SIFT đa tỉ lệ, chuẩn hóa power normalization, tăng dữ liệu bằng lật ảnh, xử lý tập dữ liệu mất cân bằng bằng SVM có trọng số.
  • - Hệ thống được triển khai trên iCub, hỗ trợ học đối tượng theo thời gian thực và tương tác bằng lời nói và cử chỉ.