Tổng quan hệ thống về các bộ dữ liệu cảm biến dùng trong nhận diện hoạt động con người (HAR)

( 0 đánh giá )
Miễn phí

Các bộ dữ liệu phổ biến nhất:

  + VanKasteren (11%)

  + CASAS (Kyoto, Aruba, Multiresident) (23%)

  + UCI HAR (6%)

  + Opportunity (5%)

  + mHealth (3%)

 

  • Phân loại hoạt động:
  •   + Hành động đơn lẻ (Single): 42.2%
  •   + Hoạt động xen kẽ (Interleaved): 20.3%
  •   + Nhiều người (Multi-occupancy): 15.5%
  • Loại cảm biến sử dụng:
  •   + Cảm biến môi trường (motion, door, temperature): 46.3%
  •   + Cảm biến đeo (accelerometer, gyroscope): 19.3%
  •   + Smartphone: 7.7%
  •   + Kết hợp nhiều loại: 26.7%
  • Kỹ thuật phân đoạn dữ liệu:
  •   + Sliding Window (60s, 128 mẫu, 2s): phổ biến nhất
  •   + Adaptive Windowing (AFMSI): đạt độ chính xác cao nhất (100% với Aruba)
  • Kỹ thuật biểu diễn đặc trưng:
  •   + Last-fired, Change-point, Raw signals, Z-score
  •   + Một số nghiên cứu sử dụng Stacked Autoencoder (SAE) để trích xuất đặc trưng tự động
  • Kỹ thuật chọn đặc trưng:
  •   + PCA, IG, Mutual Information, SAE, Statistical Features
  • Kỹ thuật cân bằng dữ liệu:
  •   + SMOTE, Instance Reassignment, Manual synthesis
  • Các thuật toán phân loại phổ biến:
  •   + Hidden Markov Model (HMM, HSMM, HHMM): 41.7%
  •   + Support Vector Machine (SVM): 17.4%
  •   + k-Nearest Neighbor (kNN): 15.8%
  •   + Naive Bayes (NB): 15.8%
  •   + Decision Tree (DT), Random Forest (RF), CRF, ANN
  • Độ chính xác cao nhất theo từng bộ dữ liệu:
  •   + VanKasteren: 96.7% (RNN – LSTM)
  •   + CASAS-Kyoto: 97.4% (ET-kNN + IG)
  •   + CASAS-Aruba: 100% (NB + AFMSI)
  •   + CASAS-Multiresident: 81.5% (NB)
  •   + UCI HAR: 92.6% (Multiple HMMs + MOT + kNN)
  •   + Opportunity: 99.9% (SAE + NMF)
  •   + mHealth: 97.2% (HCM + SLOSH + UOF)