Elon Musk cho rằng các mô hình đào tạo trí tuệ nhân tạo đã cạn kiệt nguồn dữ liệu do con người tạo ra và cần chuyển sang dữ liệu tổng hợp.
“Tất cả dữ liệu và kiến thức do con người tạo ra đang được tận dụng tối đa trong quá trình đào tạo AI. Việc này bắt đầu từ năm ngoái”, tỷ phú Elon Musk cho biết trong một cuộc phỏng vấn công bố ngày 9/1.
Ông tin rằng cách duy nhất để ngăn chặn tình trạng thiếu dữ liệu nguồn được sử dụng trong việc đào tạo các mô hình mới là chuyển sang sử dụng dữ liệu tổng hợp do chính AI tạo ra. “Quá trình này giống như viết một bài báo rồi chấm điểm và đánh giá bản thân để xây dựng kiến thức mới”, ông nói.
Các công ty công nghệ hàng đầu như Meta, Microsoft, Google và OpenAI đều sử dụng dữ liệu tổng hợp để cải thiện mô hình của mình.
Tuy nhiên, tỷ phú Mỹ cũng cảnh báo các mô hình AI vẫn có thể tạo ra “ảo giác” – thuật ngữ chỉ những kết quả đầu ra không chính xác hoặc vô nghĩa, dẫn đến nguy cơ chính AI tổng hợp thông tin sai lệch. Ông nói: “Ảo giác đặt ra nhiều thách thức trong việc sử dụng dữ liệu tổng hợp vì không thể biết liệu thứ mà AI đưa ra là ảo ảnh hay câu trả lời thực sự cho câu hỏi được đặt ra”.
Andrew Duncan, giám đốc trí tuệ nhân tạo tại Viện Alan Turing của Anh, cho biết bình luận của Musk có điểm tương đồng với một bài báo học thuật gần đây ước tính dữ liệu công khai về các mô hình trí tuệ nhân tạo có thể cạn kiệt vào năm 2026. Ông tin rằng việc phụ thuộc quá nhiều vào dữ liệu tổng hợp có thể dẫn đến nguy cơ “sụp đổ mô hình”, nghĩa là chất lượng đầu ra của AI sẽ giảm, độ lệch sẽ tăng lên và khả năng sáng tạo sẽ mất đi.
Dữ liệu chất lượng cao và quyền kiểm soát dữ liệu đã trở thành một trong những mặt trận pháp lý căng thẳng trong thời kỳ bùng nổ trí tuệ nhân tạo.
OpenAI cũng thừa nhận vào năm ngoái rằng sẽ không thể tạo ra các công cụ như ChatGPT nếu không có quyền truy cập vào dữ liệu có bản quyền. Trong khi đó, các ngành công nghiệp sáng tạo và nhà xuất bản đang yêu cầu thanh toán cho các tài liệu được sử dụng trong quá trình đào tạo AI.
(theo người giám hộ)