Nhà khoa học AI của Meta cảnh báo bong bóng robot hình người đang phình to
Theo LeCun, phần lớn công ty chỉ chú trọng phần cứng, trong khi trí thông minh cần thiết để khiến robot hữu ích vẫn là bài toán chưa có lời giải.

Yann LeCun, nhà khoa học AI hàng đầu của Meta, cảnh báo ngành robot hình người đang rơi vào bong bóng đầu tư, thiếu đột phá về trí tuệ nhân tạo thực chất. Đồ họa: Hạo Thiên
Giữa làn sóng đầu tư ồ ạt vào lĩnh vực robot hình người, giáo sư Yann LeCun, người đoạt giải Turing 2018 và hiện là nhà khoa học AI hàng đầu tại Meta đã lên tiếng cảnh báo rằng ngành công nghiệp này đang rơi vào bong bóng kỳ vọng, tương tự cơn sốt AI tạo sinh.
Phát biểu tại Hội nghị chuyên đề về tác động của AI tạo sinh (MGAIC) do MIT tổ chức, LeCun cho biết, phần lớn các công ty khởi nghiệp đang tập trung vào thiết kế phần cứng thay vì giải quyết cốt lõi của vấn đề trí thông minh thực sự cho robot.
Ông LeCun nhấn mạnh rằng không một công ty nào hiện nay biết cách tạo ra robot đủ thông minh để hữu ích trong đời sống hàng ngày.
“Robot có thể được huấn luyện cho các nhiệm vụ cụ thể như sản xuất hay hậu cần, nhưng để trở thành robot gia đình thông minh, cần những đột phá căn bản trong kiến trúc AI”, LeCun nói.
Ông cũng cho rằng, bước tiến này phụ thuộc vào sự phát triển của mô hình thế giới (world model), hệ thống cho phép máy học hiểu, dự đoán và tương tác với thế giới vật lý giống con người.
Khái niệm mô hình thế giới đề cập đến khả năng của AI học từ dữ liệu cảm biến và video băng thông cao để dự đoán kết quả của hành động.
Ông lấy ví dụ từ công trình của mình với kiến trúc V-JEPA (Video Joint Embedding Predictive Architecture), là một dạng học tự giám sát giúp AI phát hiện khi điều gì đó bất khả thi xảy ra trong video.
Theo LeCun, đây là bước khởi đầu của nhận thức máy, mở đường cho robot có thể học mà không cần huấn luyện thủ công.
Nhận định của LeCun được nhiều chuyên gia ủng hộ. Andrej Karpathy, đồng sáng lập OpenAI, cũng cho rằng robot hiện nay không thể học liên tục và sẽ mất ít nhất một thập kỷ để đạt được trí tuệ nhân tạo tổng quát (AGI) đủ phục vụ đời sống.
LeCun khẳng định các mô hình ngôn ngữ lớn (LLM) hiện nay không thể vận hành robot hình người vì chỉ học từ văn bản, thiếu dữ liệu cảm giác thực tế.
“Một đứa trẻ bốn tuổi đã nhìn thấy lượng dữ liệu thị giác tương đương toàn bộ kho dữ liệu huấn luyện của LLM”, ông LeCun ví von.
Với hơn 40 năm nghiên cứu, LeCun được xem là một trong ba cha đẻ của học sâu cùng Geoffrey Hinton và Yoshua Bengio.
Ông tin rằng chỉ khi AI học được từ thế giới vật lý, thay vì chỉ đọc hiểu văn bản thì giấc mơ về robot thông minh thật sự mới trở thành hiện thực.







