Microsoft vừa giới thiệu chi tiết cách thức hãng xử lý các lỗi trong phần mềm cũng như dịch vụ đang cung cấp mỗi tháng. Bí quyết nằm ở việc áp dụng công nghệ máy học.
Scott Christiangen, Quản lý cấp cao về chương trình bảo mật tại Microsoft cho biết công ty theo dõi những lỗi và báo cáo trên mạng xã hội GitHub và kho lưu trữ AzueDevOps nhưng sẽ rất vất vả nếu làm công việc này theo cách đánh nhãn và ưu tiên thủ công.
Theo The Verge, Microsoft đang sử dụng lượng dữ liệu có được trong suốt 20 năm qua nhờ hơn 13 triệu chương trình, dịch vụ đang hoạt động bình thường và cả các loại lỗi được phát hiện để tạo ra hệ thống máy học có thể phân loại các lỗi bảo mật và không bảo mật hiệu quả tới 99%. Chương trình được thiết kế để hỗ trợ các lập trình viên xác định chính xác và ưu tiên các sự cố bảo mật nghiêm trọng cần xử lý.
“Mục tiêu của chúng tôi là xây dựng hệ thống máy học có thể phân loại lỗi nào thuộc dạng bảo mật hay không, trạng thái nghiêm trọng hay thông thường với mức độ chính xác gần nhất với đánh giá của chuyên gia bảo mật”, Scott lý giải. Micosoft nhập các lỗi được dán nhãn bảo mật/không bảo mật cho mô hình máy học để huấn luyện hệ thống và đảm bảo các dữ liệu không bị nhiễu (dữ liệu nhiễu là loại đã bị hỏng, bóp mép, có thể dẫn tới thiếu chính xác nếu sử dụng).
Hệ thống sau đó sẽ học cách phân loại lỗi bảo mật và áp dụng nhãn phân loại như cực kỳ nghiêm trọng, quan trọng, ít ảnh hưởng…
Nhiều chuyên gia bảo mật và nhà khoa học dữ liệu đã làm việc cùng nhau trong dự án của Microsoft để tạo ra mô hình trên, đảm bảo giám sát tronng quá trình hoạt động và lấy mẫu thử lỗi ngẫu nhiên để kiểm tra thủ công. Hệ thống cũng được “đào tạo lại” liên tục với các dữ liệu mới do chuyên gia của Microsoft kiểm định. Hiện tại, hệ thống xác định lỗi bảo mật đúng tới 99% và đánh giá dán nhãn mức độ nghiêm trọng chuẩn tới 97%.
Microsoft đang có ý định công bố mã nguồn phương pháp này lên GitHub, cho phép các công ty khác với dữ liệu tương tự có thể áp dụng vào hình mẫu như vậy.
Anh Quân