Ước lượng độ sâu và tư thế có nhận thức ngữ cảnh cho định vị nội soi phế quản

( 0 đánh giá )
Miễn phí

Dữ liệu:

  + Video nội soi phế quản đơn mắt, độ phân giải 307×313, 30 fps.

  + CT ngực với độ phân giải voxel [0.4, 0.4, 0.5] mm.

  + Dữ liệu từ 3 bệnh nhân, 2 dùng để huấn luyện, 1 để kiểm thử.

 

  • Mô hình GAN có điều kiện:
  •   + Generator: mạng U-Net với khối ResNet 6 lớp.
  •   + Discriminator: mạng PatchGAN với đầu ra phân loại loại nhiễu ảnh.
  •   + Các hàm mất mát: adversarial loss, cycle consistency loss, conditional context loss, consecutive warping loss.
  • Phân loại nhiễu ảnh:
  •   + 7 loại nhiễu ảnh: mờ màu, bong bóng, phản xạ, sọc màu, mờ sương, bóng chồng, che khuất.
  •   + 26.22% khung hình có nhiễu ảnh, 9% bị che khuất hoàn toàn bị loại bỏ.
  • Đăng ký video-CT:
  •   + Bản đồ độ sâu từ video được đăng ký với bản đồ độ sâu từ CT bằng NCC.
  •   + Tối ưu hóa tư thế camera bằng phương pháp Powell.
  • Đánh giá:
  •   + So sánh với SFS, SFM, FCN có giám sát, CycleGAN.
  •   + Độ chính xác: PSNR = 34.15, SSIM = 0.92, NCC = 0.93, MI = 1.22.
  •   + Sai số định vị trung bình: 3.18 mm, tỷ lệ khung hình định vị thành công <5 mm: 84.5%, <10 mm: 97.8%.
  •   + Tốc độ xử lý: 50 fps cho ước lượng độ sâu, 0.35 fps cho đăng ký video-CT.
  • Kết luận:
  •   + Phương pháp có khả năng phục hồi cấu trúc phân nhánh phế quản ngay cả khi ảnh bị nhiễu.
  •   + Tăng độ chính xác và độ tin cậy của định vị nội soi trong môi trường lâm sàng.