Meta đã công bố một mô hình AI có tên Movie Gen chuyên tạo video và âm thanh từ văn bản, tuyên bố nó có thể cạnh tranh với Sora.
Vào ngày 4 tháng 10, Meta đã tung ra một video do Movie Gen sản xuất, trình chiếu những hình ảnh sống động về các loài động vật đang bơi lội và lướt sóng. AI còn có thể tạo nhạc nền, hiệu ứng âm thanh phù hợp với nội dung video, đồng thời sử dụng các công cụ chỉnh sửa video có sẵn.
Video của Movie Gen có thể dài tới 16 giây và âm thanh có thể dài tới 45 giây. Meta cũng công bố dữ liệu thử nghiệm mù cho thấy mô hình này hoạt động tương tự hoặc tốt hơn các sản phẩm của OpenAI, Runway, ElevenLabs và Kling.
Người phát ngôn của Meta cho biết, không giống như mô hình ngôn ngữ lớn Llama, công ty khó có thể phát hành công khai Movie Gen vì họ luôn đánh giá rủi ro của từng mô hình cụ thể trước khi đưa ra quyết định. Meta từ chối bình luận về những rủi ro của Movie Gen, nhưng nhấn mạnh rằng công ty đang làm việc trực tiếp với cộng đồng sáng tạo nội dung và ngành công nghiệp giải trí để thảo luận về các lựa chọn sử dụng trí tuệ nhân tạo này và cách tích hợp nó vào các sản phẩm của Meta vào năm tới.
Các tài liệu nghiên cứu do Meta xuất bản cho thấy Movie Gen được phát triển bằng cách sử dụng kết hợp các bộ dữ liệu công khai và dữ liệu có bản quyền.
(theo Reuters)