Nếu Sora được thương mại hóa, OpenAI có thể sẽ cần số lượng lớn chip H100 của Nvidia để chạy, với tổng chi phí lên tới hàng tỷ USD.
Sau ChatGPT, OpenAI đã thu hút nhiều sự chú ý nhờ AI tạo video dựa trên văn bản Sora. Công cụ này ra mắt vào tháng 2 và nhanh chóng lan truyền trên các nền tảng truyền thông xã hội, mặc dù nó chỉ được một số nghệ sĩ, nhà thiết kế và nhà làm phim thử nghiệm.
Mira Murati, Giám đốc Công nghệ của OpenAI cho biết bờ rìa Khả năng của Sora “đắt hơn nhiều” so với các công cụ AI hiện tại. Trong khi đó, công ty phân tích và quản lý tài sản Factorial Funds tin rằng OpenAI sẽ cần 4.200-10.500 GPU H100 trong vòng một tháng để đào tạo Sora. Khi thương mại hóa với số lượng người dùng lớn, hệ thống sẽ yêu cầu nhiều GPU hơn để đảm bảo không bị quá tải.
Factorial Funds ước tính rằng mỗi GPU H100 của model như Sora tạo ra trung bình 5 phút video mỗi giờ, tương đương 120 phút mỗi ngày. Trong khi đó, TikTok có 17 triệu phút video mỗi ngày và YouTube có 43 triệu phút. Giả sử 50% video TikTok và 15% video YouTube sẽ do Sora tạo ra, OpenAI phải yêu cầu 720.000 GPU H100 để đáp ứng nhu cầu hàng ngày của người dùng.
Trung bình, mỗi GPU H100 có giá 30.000 USD, điều đó có nghĩa là vào thời kỳ đỉnh cao, OpenAI có thể đã chi khoảng 21,6 tỷ USD để mua chip chạy hệ điều hành. Ngoài ra, hệ thống còn tiêu thụ 504.000.000 watt điện mỗi tháng.
OpenAI chưa tiết lộ thông số chi tiết liên quan đến Sora, bao gồm cả nguồn dữ liệu dùng để đào tạo AI. Mira Murati cho biết: “Tôi sẽ không đi sâu vào chi tiết về dữ liệu được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc công khai”, đồng thời cho biết thêm rằng cô không thể tiết lộ liệu Sora có sử dụng dữ liệu từ YouTube và Video trên Facebook hay Instagram hay không. Cô chỉ xác nhận rằng AI lấy nội dung từ Shutterstock – công ty có quan hệ đối tác với OpenAI.
hồi đáp tạp chí phố WallMurati cho biết Sora sẽ được ra mắt công chúng trong năm nay, “có thể trong vài tháng nữa”. Mặc dù chi phí đào tạo và vận hành rất tốn kém nhưng công ty tuyên bố sẽ cố gắng cung cấp trí tuệ nhân tạo có thể chuyển đổi văn bản thành hình ảnh với mức giá tương tự Dall-E.
Giang Ya