Nén ảnh tối ưu theo tỷ lệ méo dạng thời gian thực với vùng quan tâm trên kiến trúc ARM cho ứng dụng robot dưới nước

( 0 đánh giá )
Miễn phí

Bối cảnh dự án MERBOTS: hỗ trợ khảo cổ dưới nước không dây bằng AUV/HROV, truyền ảnh nén tiến dần để chuyên gia giám sát. Nhu cầu: thích ứng với kênh băng thông thấp, trễ cao, mất gói, cho phép nhận trước bản xem nhanh, sau đó truyền tiếp phần chi tiết. 

Thuật toán DEBT (Depth Embedded Block Tree) áp dụng biến đổi wavelet rời rạc 2D (DWT) dạng lifting, xây dựng danh sách quét bit tối ưu tỷ lệ méo dạng từ thống kê hệ số, hỗ trợ ROI với hai phương thức: Map ROI (cần gửi bản đồ ROI) và Bitplane ROI (không gửi map, bitplane FG/BG tách nhau). ROI cho phép tăng chất lượng vùng ưu tiên, giảm bit nền, giữ kích thước tổng cố định.

Đóng góp kỹ thuật:

  • Paraline DWT: cài đặt song song, in-place, cache-friendly, đồng bộ luồng lock-free bằng CAS, đạt bão hòa băng thông bộ nhớ với số lõi tối thiểu, giảm MOPs xuống 2 (1 đọc/1 ghi) mỗi hệ số; vector hóa SIMD ARM; so sánh với các thuật toán cnaive, lnaive, pipeline.
  • - Tối ưu hóa cho ARM (Raspberry Pi ⅔): đo băng thông bộ nhớ, đánh giá thời gian chạy với 1–4 luồng, kiểm tra bão hòa trên nhiều loại DWT (ibior5x3, ibior13x7, icdf9x7, cdf9x7). 
  • - Tích hợp ROI: ví dụ trên ảnh Lena và ảnh dưới nước với chữ “GIRONA 500”, so sánh PSNR ở nhiều kích thước (250–4000 bytes) có/không ROI, cho thấy ROI cải thiện rõ chất lượng vùng quan tâm ở bitrate thấp.
  • - So sánh JPEG-2000: DEBT đạt PSNR cao hơn ở nén cực mạnh (ví dụ 179 bytes: +8,48 dB so với JPEG-2000), tốc độ nhanh hơn một bậc, linh hoạt kích thước gói (từ vài trăm byte/frame), phù hợp truyền qua modem âm thanh.
  • Hệ thống cảm biến: Raspberry Pi 3B + camera + modem âm thanh Evologics, giao diện người vận hành chọn ROI, chất lượng, kích thước gói. Ứng dụng: khảo sát, bảo tồn di sản dưới nước, điều khiển từ xa robot không dây.