Mã hóa quy mô lớn trong môi trường Hadoop: Thách thức và giải pháp

( 0 đánh giá )
Miễn phí

Hadoop là nền tảng phổ biến để xử lý dữ liệu lớn nhưng tồn tại nhiều lỗ hổng bảo mật, đặc biệt trong truyền dữ liệu và lưu trữ. Bài viết trình bày các giải pháp hiện có như Kerberos, SASL và vùng mã hóa HDFS, đồng thời chỉ ra hạn chế của chúng trong xử lý dữ liệu. Khung Kuber được đề xuất nhằm cung cấp bảo mật ba chiều: xác thực người dùng, mã hóa dữ liệu khi truyền và khi lưu trữ. Kuber sử dụng ChaCha20 – một biến thể của Salsa20 – giúp mã hóa nhanh, tiết kiệm bộ nhớ và chống lại tấn công phân tích vi sai. Các thí nghiệm cho thấy tốc độ mã hóa cao nhất đạt được với kích thước bộ đệm 500 KB đến 1 MB. Kuber cho phép thực thi trực tiếp MapReduce trên dữ liệu đã mã hóa mà không cần giải mã toàn bộ, tăng hiệu suất và bảo mật. Mã nguồn và hướng dẫn sử dụng được công bố công khai trên GitHub.