Lightly trained support vector data description for novelty detection

( 0 đánh giá )
Miễn phí

SVDD truyền thống (C-SVDD): xây dựng hình cầu bao quanh dữ liệu, giải bài toán tối ưu hóa ở không gian dual → độ phức tạp cao (O(N³)).

  • F-SVDD: cải tiến bằng cách tìm pre-image của tâm hình cầu → giảm độ phức tạp kiểm tra xuống O(1).
  • - LT-SVDD (đề xuất):  
  •   + Tránh tính toán bội số Lagrange.  
  •   + Tối ưu hóa trực tiếp hàm mục tiêu nguyên thủy bằng SPSA.  
  •   + Giữ lại lợi ích của kernel trick (Gaussian kernel).
  • - Thuật toán LT-SVDD:  
  •   + Tìm pre-image của tâm hình cầu trong không gian đầu vào.  
  •   + Dùng SPSA để cập nhật tham số a và R.  
  •   + Kiểm tra điểm mới bằng điều kiện: 1 + p² - 2pK(xi, x) ≤ R².
  • - Thí nghiệm:  
  •   + Dữ liệu chuẩn từ UCI: Iris, Wine, Cancer, Hepatitis, Ecoli.  
  •   + Dữ liệu thực tế: Japanese, Australian, German credit datasets.  
  •   + So sánh với C-SVDD, F-SVDD và các mô hình như SVM, Logistic Regression, Neural Network, Random Forest, Boosting.
  • - Kết quả:  
  •   + LT-SVDD có độ chính xác tương đương hoặc cao hơn C-SVDD.  
  •   + Thời gian huấn luyện giảm đáng kể (ví dụ: từ 13.72s xuống 3.91s với German dataset).  
  •   + Đặc biệt hiệu quả với dữ liệu mất cân bằng như chấm điểm tín dụng.
  • - Hạn chế:  
  •   + Hình cầu quyết định trong không gian đầu vào có thể không phù hợp với mọi loại dữ liệu.  
  •   + Độ chính xác phụ thuộc vào chất lượng thuộc tính đầu vào.
  • - Hướng phát triển:  
  •   + Kết hợp với Kernel Fuzzy C-Means để tìm tâm cụm.  
  •   + Áp dụng chiến lược chia để trị như Core Vector Machine để xử lý dữ liệu lớn.