Robot của Tu AI Tech Unicorn được trang bị mô hình ngôn ngữ hình ảnh của OpenAI và có thể giao tiếp tự nhiên với con người.
Trong video do Hình AI phát hành vào ngày 13 tháng 3, robot hình người Hình 01 của công ty có thể trò chuyện liền mạch với con người. Công ty cho biết robot tích hợp mô hình ngôn ngữ hình ảnh (VLM) mới nhất do OpenAI phát triển và có thể giao tiếp thông qua tương tác giọng nói với giọng nói.
Đặc biệt, VLM sử dụng mô hình đa phương thức của OpenAI để hiểu hình ảnh và văn bản nhận được từ camera của robot dựa trên đoạn hội thoại bằng giọng nói trong thời gian thực. Dữ liệu này được bot phân tích để phản hồi lại cho người khác. Điều này khác với GPT-4, tập trung vào lời nhắc bằng văn bản.
Ngoài ra, robot còn sử dụng phương pháp “vận hành thủ công dựa trên việc học”. Hệ thống tiếp nhận và điều khiển cánh tay một cách trơn tru. Theo Hình AI, “Mạng xử lý hình ảnh thu được ở tần số 10 Hz và tạo ra chuyển động 24-DOF (tư thế cổ tay và góc khớp ngón tay) ở tần số 200 Hz”.
Các video demo cho thấy Hình 01 có thể tương tác với con người khá tự nhiên dù tốc độ phản hồi chưa đủ nhanh. thương nhân trong cuộc Robot hình người được trang bị trí tuệ nhân tạo từ các công ty hàng đầu như OpenAI là “sự kết hợp mạnh mẽ” nhưng “có thể vừa khiến con người ngạc nhiên vừa sợ hãi”.
Hình AI xác nhận nội dung trong video dựa trên quá trình học tập của hệ thống và không được điều khiển từ xa.
“Thật khó để xác minh những tuyên bố của Hình AI nếu không tận mắt nhìn thấy. Hoặc có thể công ty đã lặp lại hàng trăm lần để có được kết quả như vậy”. Radar công nghệ Bình luận. “Nhưng sẽ thật tuyệt vời nếu nó là sự thật 100%.”
Hình AI là một công ty khởi nghiệp mới được thành lập tại Hoa Kỳ vào năm 2022, nhưng với sự ra mắt và cải tiến liên tục của robot hình người Hình 01, nó đã gây ấn tượng với các nhà đầu tư và trở thành kỳ lân với mức định giá 2,6 tỷ USD. Robot dự kiến sẽ được giao nhiệm vụ trong các lĩnh vực như sản xuất, vận tải, hậu cần, kho bãi và bán lẻ đang gặp tình trạng thiếu lao động.