Phát hiện sự kiện và xác định người lan truyền ảnh hưởng trong dòng dữ liệu mạng xã hội

( 0 đánh giá )
Miễn phí

TD-HITS sử dụng thuật toán HITS để lọc bài viết chất lượng cao và người dùng có ảnh hưởng, sau đó xác định số lượng chủ đề dựa trên giá trị độ uy tín và khoảng cách tối thiểu giữa các bài viết.

  • TS-LDA sử dụng mô hình LDA kết hợp với lấy mẫu Gibbs để phân cụm bài viết theo chủ đề, sau đó xác định người lan truyền ảnh hưởng dựa trên giá trị hub và đặc trưng địa phương trong mạng người dùng.
  • - Mô hình ba bước xác định người lan truyền ảnh hưởng gồm: đánh giá mức độ hoạt động (hub), đặc trưng địa phương (degree centrality), và kết hợp hai yếu tố để tính toán mức độ ảnh hưởng.
  • - Thử nghiệm trên dữ liệu Twitter cho thấy mô hình có độ chính xác cao trong phát hiện sự kiện và xác định người lan truyền ảnh hưởng, vượt trội hơn các phương pháp PLSA, LDA và EVE truyền thống.
  • - Mô hình có khả năng theo dõi xu hướng thay đổi số lượng phản hồi theo thời gian, giúp giám sát và kiểm soát sự kiện kịp thời.
  • - Kết quả cho thấy mô hình TS-LDA phát hiện được 7/8 sự kiện thực tế, thời gian xử lý nhanh hơn các mô hình khác, và xác định chính xác người dùng có ảnh hưởng cao nhất.