Lỗi DNS của AWS làm lộ điểm yếu lớn trong hạ tầng Internet
Sự cố DNS tại trung tâm dữ liệu AWS khiến hàng loạt dịch vụ lớn toàn cầu tê liệt, làm lộ điểm yếu hạ tầng Internet phụ thuộc vào ông lớn đám mây.
Từ Amazon, WhatsApp đến ChatGPT đều sập vì lỗi AWS, hé lộ lỗ hổng nghiêm trọng của hệ thống Internet toàn cầu và nguy cơ đứt mạch số hóa. Đồ họa: Cát Tiên
Một sự cố kỹ thuật tại trung tâm dữ liệu quan trọng của Amazon Web Services (AWS) ở khu vực US-EAST-1, bang Virginia (Mỹ), sáng thứ hai vừa qua (theo giờ địa phương) đã khiến nhiều vùng rộng lớn trên Internet tê liệt.
Từ nền tảng thương mại điện tử Amazon, hệ thống chuông cửa Ring, trợ lý ảo Alexa cho tới WhatsApp của Meta, ChatGPT của OpenAI, Venmo của PayPal và thậm chí cả một số trang web chính phủ Anh, đều đồng loạt gián đoạn trong nhiều giờ.
Theo thông tin từ AWS, nguyên nhân xuất phát từ lỗi phân giải DNS liên quan đến API DynamoDB, một dịch vụ cơ sở dữ liệu cốt lõi.
Hệ thống tên miền Domain Name System (DNS) đóng vai trò như danh bạ của Internet, dịch các địa chỉ web thân thiện sang dãy số IP cụ thể.
Khi DNS gặp sự cố, quá trình định tuyến này bị đứt gãy, trình duyệt web không thể tìm đúng người cần gọi điện.
AWS cho biết, sự cố bắt đầu lúc 3 giờ sáng (giờ miền Đông Mỹ) và đến 6 giờ 35 phút, công ty mới hoàn tất các biện pháp khắc phục.
Không có dấu hiệu nào cho thấy vụ việc bắt nguồn từ tấn công mạng hay chiếm quyền điều khiển DNS, nhưng sự kiện này đã gióng lên hồi chuông cảnh báo mới về tính dễ tổn thương của hạ tầng đám mây toàn cầu.
Ông Davi Ottenheimer - Phó Chủ tịch phụ trách vận hành và tuân thủ bảo mật của công ty Inrupt - nhận định: “Khi hệ thống không thể xác định chính xác máy chủ cần kết nối, các lỗi dây chuyền sẽ làm gián đoạn dịch vụ trên Internet. Sự cố của AWS là ví dụ điển hình về vấn đề khả dụng, nhưng sâu xa hơn, nó phản ánh lỗi về tính toàn vẹn dữ liệu”.
AWS, nền tảng đám mây chiếm gần 1/3 thị phần toàn cầu từng nhiều lần gặp sự cố tương tự, trong đó có vụ ngừng hoạt động nghiêm trọng năm 2023.
Dù các ông lớn như Amazon, Microsoft Azure hay Google Cloud đã giúp chuẩn hóa an ninh mạng và tối ưu hiệu suất, nhưng sự tập trung quyền lực vào vài trung tâm dữ liệu khổng lồ đồng nghĩa với việc toàn bộ Internet có thể ảnh hưởng chỉ vì một lỗi nhỏ.
Ông Ottenheimer nhận định, ngành công nghệ đang phụ thuộc quá nhiều vào một vài trung tâm dữ liệu lớn. Theo ông, chừng nào các doanh nghiệp chưa thực sự hiểu và bảo vệ được tính toàn vẹn của dữ liệu, thì việc khẳng định hệ thống luôn “hoạt động ổn định 99,999%” chỉ là ảo tưởng an toàn.