AI tạo video dựa trên văn bản tiếng Trung cạnh tranh với Sora

AI tạo video dựa trên văn bản tiếng Trung cạnh tranh với Sora

Kuaishou ra mắt mô hình video Klong AI và hàng loạt tính năng của nó đã giúp Sora của OpenAI thu hút sự chú ý.

Kuaishou, nền tảng chia sẻ video ngắn lớn thứ hai Trung Quốc, đã ra mắt AI tạo video dựa trên văn bản có tên Kling vào ngày 6 tháng 6, với nhiều tính năng vượt trội như cải thiện chất lượng chuyển động, bám sát mô tả nội dung và có thể tạo chuỗi khung hình khác nhau.

Kuaishou cho biết Kling có thể tạo video dài 2 phút ở độ phân giải 1080p và 30 khung hình mỗi giây chỉ bằng một mô tả, đồng thời mô phỏng chính xác các hiện tượng vật lý trong thế giới thực, đây là điều mà hầu hết hình ảnh trí tuệ nhân tạo chưa thể đạt được.

AI tạo video dựa trên văn bản tiếng Trung cạnh tranh với Sora

Video được Kling tạo dựa trên mô tả một dòng. băng hình: twitter/bdsqlsz

Ngoài hoạt hình, Kling có thể xây dựng khuôn mặt và cơ thể 3D để cải thiện chuyển động và biểu cảm của nhân vật trong video.

Một trong những điều ấn tượng về Kling là vẻ ngoài chân thực của nó. Một số video vẫn bị mờ, hiện tượng thường gặp ở hình ảnh do AI tạo ra, nhưng ở mức độ thấp hơn nhiều.

Không giống như Sora của OpenAI, người dùng đã có thể truy cập và sử dụng Kling. Tuy nhiên, vẫn chưa rõ liệu các mẫu AI hiện đại như Kling và Vidu có thể được phát hành bên ngoài Trung Quốc hay không.

Trước đó, vào giữa tháng 2, OpenAI đã ra mắt công cụ tạo video Sora. Nhiều người dùng hào hứng với Sora do sự nổi tiếng của công ty mẹ và khả năng “hiểu sâu ngôn ngữ” của người mẫu. Theo clip minh họa, người mẫu có thể tạo ra “những nhân vật có khả năng thể hiện cảm xúc sống động” tạp chí phân tích Ấn Độ. Tính xác thực của sản phẩm Sora cũng là chủ đề được thảo luận trên nhiều nhóm mạng xã hội. Một số người tin rằng công cụ AI này sẽ thực sự thay đổi cuộc chơi.

(dựa theo hướng dẫn của tom)