Định vị và xây dựng bản đồ đồng thời trong kỷ nguyên ngữ nghĩa: Một khảo sát

( 0 đánh giá )
Miễn phí

SLAM được chia thành hai hướng chính: lọc (EKF, Particle Filter) và tối ưu hóa (Graph SLAM, Bundle Adjustment). Các cảm biến phổ biến gồm camera đơn, stereo, RGB-D, LiDAR, sonar, IMU, GPS. Phân tích frontend gồm xử lý dữ liệu trực tiếp hoặc dựa trên đặc trưng, nhận dạng đối tượng bằng CNN, phân đoạn ngữ nghĩa. Backend gồm tối ưu hóa đồ thị pose, hiệu chỉnh chùm, sử dụng thư viện g2o, GTSAM, Ceres, iSAM2.

 

SLAM ngữ nghĩa tích hợp thông tin ngữ nghĩa vào bản đồ, cải thiện nhận dạng vòng lặp và khả năng suy luận. Bài viết phân loại hơn 50 thuật toán SLAM từ 2005–2017 theo tiêu chí: loại cảm biến, phương pháp, kiến trúc, thư viện, mật độ bản đồ, môi trường, khả năng mở rộng, đóng vòng, xử lý thời gian thực và ngữ nghĩa.

 

Các thách thức mở gồm xử lý môi trường động, đóng vòng sai lệch, nhận thức ngữ nghĩa, suy luận ngữ cảnh, học sâu và tích hợp đa cảm biến.