Tổng hợp tự động chính sách chọn hành động cho phương tiện không người lái trong môi trường đối kháng

( 0 đánh giá )
Miễn phí

Phương pháp tổng hợp chính sách sử dụng tiến hóa di truyền để tạo ra bộ điều khiển mặc định và các kế hoạch hành động đặc biệt nhằm xử lý các trạng thái thất bại. Các macro-action được phát triển để tránh các trạng thái thất bại bằng cách hành động từ các trạng thái ngoại lệ. Chính sách được biểu diễn dưới dạng cây quyết định với các lệnh điều hướng và điều khiển hệ thống. Hệ thống mô phỏng USV tích hợp cảm biến ảo, lập kế hoạch ngắn hạn và cơ chế tránh vật cản có thể điều chỉnh. Kết quả thực nghiệm cho thấy chính sách được tổng hợp tự động đạt hiệu suất cao hơn so với chính sách do con người viết tay, với thời gian trì hoãn trung bình 65 giây so với 53 giây. Phương pháp có tiềm năng ứng dụng rộng rãi trong các nhiệm vụ giám sát, truy đuổi và phòng thủ tự động.