DDoS attack detection with feature engineering and machine learning: the framework and performance evaluation

( 0 đánh giá )
Miễn phí

Xây dựng khung chiến lược gồm hai phần: kỹ thuật chọn lọc đặc trưng và cải tiến học máy.

  • Loại bỏ 15 đặc trưng không phù hợp dựa trên kiến thức miền và xử lý dữ liệu (chuẩn hóa, mã hóa one-hot).
  • - Áp dụng ba phương pháp chọn lọc đặc trưng: loại bỏ ngược (p-value), kiểm định Chi2, và điểm thông tin (information gain).
  • - Tạo ra 4 tập dữ liệu: DS00_Full (22 đặc trưng), DS01_PVal (16), DS02_Chi2 (7), DS03_IG (7).
  • - Áp dụng 5 thuật toán: KNN, Naive Bayes, SVM, Random Forest, và Artificial Neural Network.
  • - Kết quả: KNN đạt độ chính xác cao nhất (93.51%) với tập DS03_IG, cho thấy có thể giảm 68% số đặc trưng mà chỉ ảnh hưởng 0.03% đến độ chính xác.
  • - SVM và ANN cũng đạt độ chính xác cao, đặc biệt với tập DS03_IG gồm toàn đặc trưng dạng liên tục.
  • - RF phù hợp hơn với tập dữ liệu có đặc trưng rời rạc.
  • - NB với GaussianNB hoạt động tốt, nhưng MultinomialNB không phù hợp với dữ liệu Chi2.
  • - Đánh giá bằng AUC và ROC để tránh nghịch lý độ chính xác.
  • - So sánh với các nghiên cứu trước cho thấy khung chiến lược này có độ tin cậy cao hơn nhờ xử lý vấn đề nội tại của dữ liệu như đa cộng tuyến và dư thừa.