OpenAI thừa nhận trình duyệt AI dễ bị tấn công chèn lệnh
Theo OpenAI, các cuộc tấn công chèn lệnh là rủi ro chưa thể bị ngăn chặn trong thời gian ngắn đối với các trình duyệt AI (trí tuệ nhân tạo).

Trình duyệt Atlas của OpenAI có thể đối mặt với nhiều nguy cơ bị tấn công chèn lệnh. Ảnh: Cát Tiên
OpenAI đang nỗ lực tăng cường khả năng chống lại các cuộc tấn công mạng cho trình duyệt Atlas AI của mình. Tuy nhiên, họ cũng thừa nhận rằng các cuộc tấn công chèn lệnh (prompt injection), một loại tấn công thao túng các tác nhân AI để thực hiện các chỉ thị độc hại thường được ẩn giấu trong các trang web hoặc email, là một rủi ro sẽ không biến mất trong thời gian ngắn - điều này đặt ra câu hỏi về mức độ an toàn khi các tác nhân AI hoạt động trên mạng internet mở.
“Tấn công chèn mã độc, cũng giống như các vụ lừa đảo và kỹ thuật xã hội trên mạng, khó có thể được giải quyết hoàn toàn”, OpenAI viết trong một bài đăng trên blog mới đây, nêu chi tiết cách công ty đang tăng cường khả năng phòng thủ của Atlas để chống lại các cuộc tấn công không ngừng nghỉ. Công ty thừa nhận rằng “chế độ tác nhân” trong ChatGPT Atlas “mở rộng bề mặt đe dọa an ninh”.
Ngoài OpenAI, Trung tâm An ninh mạng Quốc gia Anh (NCSC) hồi đầu tháng này đã cảnh báo rằng các cuộc tấn công chèn mã dựa trên lời nhắc nhằm vào các ứng dụng trí tuệ nhân tạo tạo sinh “có thể sẽ không bao giờ được giảm thiểu hoàn toàn”, khiến các trang web có nguy cơ trở thành nạn nhân của các vụ rò rỉ dữ liệu.
Cơ quan chính phủ Anh khuyên các chuyên gia an ninh mạng nên giảm thiểu rủi ro và tác động của các cuộc tấn công chèn mã dựa trên lời nhắc, thay vì nghĩ rằng các cuộc tấn công có thể bị “ngăn chặn”.
Về phía OpenAI, công ty cho biết: “Chúng tôi xem việc tiêm mã tức thời là một thách thức an ninh AI dài hạn và chúng tôi sẽ cần liên tục tăng cường khả năng phòng thủ chống lại nó”.
Giải pháp của công ty cho nhiệm vụ bất khả thi này là gì? Một chu trình phản ứng nhanh, chủ động mà công ty cho rằng đang cho thấy những dấu hiệu khả quan ban đầu trong việc giúp phát hiện các chiến lược tấn công mới trong nội bộ trước khi chúng bị khai thác "trong thực tế".
OpenAI nhấn mạnh việc phòng chống tấn công tiêm mã độc tức thời rất khó khăn và hoàn toàn hiệu quả, nhưng họ đang dựa vào việc thử nghiệm trên quy mô lớn và chu kỳ vá lỗi nhanh hơn để tăng cường bảo mật hệ thống trước khi chúng xuất hiện trong các cuộc tấn công thực tế.
Người phát ngôn của OpenAI từ chối tiết lộ liệu bản cập nhật bảo mật của Atlas có dẫn đến việc giảm đáng kể số lần tấn công chèn mã độc thành công hay không, nhưng cho biết công ty đã hợp tác với các bên thứ ba để tăng cường khả năng chống lại các cuộc tấn công chèn mã độc nhanh chóng của Atlas từ trước khi ra mắt.







