Dự đoán giới tính và độ tuổi khách hàng dựa trên dữ liệu điện thoại di động

( 0 đánh giá )
Miễn phí

Sử dụng dữ liệu CDR, CRM và thông tin hóa đơn từ nhà mạng SyriaTel để phân tích hành vi khách hàng.

  • Trích xuất hơn 220 đặc trưng từ 5 nguồn dữ liệu: CDR, dịch vụ khách hàng, hợp đồng, vị trí cell và dữ liệu mẫu đáng tin cậy.
  • - Áp dụng nhiều thuật toán học máy như XGBoost, Random Forest, SVM, Logistic Regression để huấn luyện và đánh giá mô hình.
  • - Mô hình dự đoán giới tính đạt độ chính xác 85.6% và độ tuổi đạt 65.5%, sử dụng tập dữ liệu 18.000 khách hàng.
  • - Các đặc trưng quan trọng gồm entropy cuộc gọi, số lượng liên hệ, loại dịch vụ đăng ký, thời gian hoạt động, vị trí địa lý.
  • - Hệ thống được triển khai trên nền tảng dữ liệu lớn Hadoop/Spark, tích hợp với ứng dụng web trực quan hóa dữ liệu