Phương pháp bám đối tượng không trễ và bền vững cho ứng dụng robot

( 0 đánh giá )
Miễn phí

Hệ thống được thiết kế theo các khối:

  • Bộ dò đối tượng: dùng DPM-HOG phát hiện phần thân trên (torso) nhằm làm việc khi mục tiêu ở gần.
  • - Theo dõi đặc trưng: trích xuất và theo dõi các điểm góc Shi–Tomasi bằng KLT giữa các khung hình liên tiếp.
  • - Ước lượng biến đổi không trễ: chọn các đặc trưng nằm trong hộp bao phát hiện, dùng RANSAC tính phép biến đổi tỉ lệ–tịnh tiến để chiếu vị trí phát hiện từ khung cũ sang khung hiện tại.
  • - Quản lý phát hiện sai và che khuất:
  •    + Phát hiện sai: so sánh màu sắc (RGB, HSV), vị trí, diện tích và IoU giữa hộp bao hiện tại và trước đó; phân loại bằng SVM.
  •    + Che khuất ngắn: nhận dạng mất đặc trưng theo hướng chuyển động của vật che khuất qua phân tích độ dốc–tương quan–tỉ lệ mất điểm.
  •    + Che khuất dài: mô hình 2 trạng thái (che/không che) bằng HMM, đặc trưng từ thay đổi nội dung ảnh và số đặc trưng đi vào/ra hộp bao; ước lượng trạng thái bằng Viterbi.

Phương pháp được đánh giá trong bài toán robot bám người trong môi trường thực (trong nhà, ngoài trời, nền nhiễu, nhiều người, thay đổi sáng, che khuất), so sánh với các bộ dò/tracker khác (CT, TDK, KCF, Meanshift). Kết quả: biến đổi không trễ cải thiện tỉ lệ phát hiện và giảm phát hiện sai; kết hợp SVM+HMM giảm FP mạnh (tới ~73%) và phát hiện được ~79% che khuất dài. Phương pháp vẫn chạy ổn định khi dùng bộ dò chậm và có thể áp dụng cho các bài toán khác (bám mặt, bám xe) với kết quả vượt trội KCF về DR và FP. Triển khai trên robot dịch vụ Bender cho phép bám người mượt với tốc độ 23 fps trên 1 nhân CPU.