Phân tích dữ liệu cảm biến sinh học bảo mật bằng tính toán phân tán trong hệ thống mHealth

( 0 đánh giá )
Miễn phí

Logistic regression được chọn vì phù hợp với bài toán phân loại nhị phân trong y tế (ví dụ: có bệnh/không bệnh).

  • Dữ liệu phân vùng ngang: mỗi người dùng có nhiều mẫu dữ liệu với cùng định dạng đặc trưng.
  • - Dữ liệu phân vùng dọc: mỗi người dùng chỉ có một phần đặc trưng, cần kết hợp để tạo mẫu đầy đủ.
  • - ADMM (Alternating Direction Method of Multipliers) được dùng để phân tách bài toán huấn luyện thành các bước cập nhật cục bộ và tổng hợp toàn cục.
  • - Giao thức mã hóa đồng hình cho phép cộng các giá trị đã mã hóa mà không cần giải mã từng phần.
  • - Mỗi người dùng chỉ gửi kết quả trung gian đã mã hóa lên máy chủ, không chia sẻ dữ liệu gốc.
  • - Đảm bảo tính riêng tư theo định nghĩa (ε, δ)-differential privacy.
  • - Thử nghiệm trên dữ liệu hoạt động thể chất (BodyMedia) và dữ liệu điện não đồ (BCI) cho thấy mô hình hội tụ nhanh (~40 vòng lặp), sai số thấp, và hiệu quả cao.
  • - So sánh với các phương pháp truyền thống: mô hình phân tán đạt độ chính xác tương đương mô hình tập trung, nhưng bảo mật hơn và tiết kiệm tài nguyên hơn.