Một nhóm sinh viên Stanford bị cáo buộc sao chép trí tuệ nhân tạo của Trung Quốc

Một nhóm sinh viên Stanford bị cáo buộc sao chép trí tuệ nhân tạo của Trung Quốc

Các tác giả của Stanford thừa nhận rằng mô hình Llama 3-V của họ “rất giống” với MiniCPM của Trung Quốc và đã xóa nó khỏi nền tảng xuất bản.

Llama 3-V được phát hành vào ngày 29 tháng 5 và các tác giả cho biết nó đạt được hiệu suất tương tự như các mẫu AI hiện đại như GPT4-V, Gemini Ultra hay Claude Opus, nhưng với chi phí đầu tư dưới 500 USD . Ngay sau đó, Llama 3-V đã gây sốt và được chọn vào danh sách top 5 xu hướng AI của nền tảng AI nổi tiếng Hugging Face của Mỹ.

Tuy nhiên, nhiều người dùng cho rằng nhóm tác giả Mỹ đã đạo văn vì họ nhận ra những điểm tương đồng giữa Llama 3-V và MiniCPM-Llama3-V 2.5, một dự án nguồn mở được Đại học Thanh Hoa và công ty ModelBest của Trung Quốc phát hành vào tháng 2.

Vào ngày 2/6, ModelBest xác nhận Llama 3-V không chỉ tái tạo khả năng nhận dạng văn bản cổ mà còn giữ lại nhiều lỗi điển hình có trong MiniCPM-Llama3-V 2.5.

Ngày 4/6, hai trong số ba tác giả của mô hình ngôn ngữ Llama 3-V là sinh viên khoa học máy tính Siddharth Sharma và Aksh Garg của Đại học Stanford đã xác nhận cấu trúc của Llama 3-V tương tự như MiniCPM.

Cặp đôi này cho biết: “Chúng tôi xin lỗi các tác giả của miniCPM về những vấn đề phát sinh do chúng tôi không nghiên cứu và xem xét kỹ lưỡng sản phẩm”.





Biểu tượng trí tuệ nhân tạo bên ngoài Hội nghị trí tuệ nhân tạo thế giới WAIC ở Thượng Hải vào tháng 7 năm 2023. Ảnh: Reuters

Biểu tượng trí tuệ nhân tạo bên ngoài Hội nghị trí tuệ nhân tạo thế giới WAIC ở Thượng Hải vào tháng 7 năm 2023. hình ảnh: Reuters

Mặc dù họ đã đăng trực tiếp dự án Llama 3-V lên mạng nhưng cả hai đều cho biết người viết mã nguồn của mô hình này là Mustafa Aljadery, người có bằng cử nhân khoa học máy tính tại Đại học Nam California.

“Sau khi xem phản hồi, chúng tôi đã yêu cầu Mustafa cung cấp bằng chứng về tính nguyên bản của Llama 3-V và dữ liệu huấn luyện của nó, nhưng vẫn chưa nhận được phản hồi. Chúng tôi muốn đợi Mustafa giải thích nhưng đã quyết định lên tiếng trước,” Sharma nói.

Hai tác giả thông báo rằng họ đã xóa dữ liệu về Llama 3-V khỏi Internet và hứa sẽ cẩn thận hơn trong tương lai. Mustafa Aljadri vẫn chưa lên tiếng nhưng tài khoản mạng xã hội của anh đã được chuyển sang chế độ riêng tư và trang web riêng tư của anh đã bị xóa.

Đồng sáng lập ModelBest Liu Zhiyuan đánh giá hành vi của các nhóm sinh viên đang phá hủy tinh thần chia sẻ mã nguồn mở, bao gồm việc tuân thủ các quy định về mã nguồn mở và tôn trọng những thành tựu hiện có.

(dựa theo trung quốc hàng ngày)