Kỹ sư phần mềm trí tuệ nhân tạo Devin có thể tự lập trình và làm việc độc lập khi được giao nhiệm vụ, giúp các kỹ sư con người giảm thiểu thời gian làm việc.
Ngày 13/3, Cognition Labs, một startup công nghệ trí tuệ nhân tạo của Mỹ, đã công bố kỹ sư phát triển phần mềm trí tuệ nhân tạo đầu tiên trên thế giới. “Devin là một đồng đội tài năng và không mệt mỏi, sẵn sàng làm việc cùng bạn hoặc tự mình thực hiện các nhiệm vụ để bạn đánh giá. Với Devin, các kỹ sư có thể tập trung vào những vấn đề thú vị hơn và nhóm kỹ thuật có thể làm việc hướng tới những mục tiêu đầy tham vọng hơn”, Cognition cho biết.
Đây là sản phẩm của một nhóm kỹ sư đang làm việc tại một số công ty lớn như Google DeepMind, Waymo, Scal AI, v.v., dẫn đầu bởi các kỹ sư như Scott Wu, Stevenhao và Walden Yan. Mặc dù Cognition Labs đã hoạt động được một thời gian nhưng nó thực sự đã ra mắt vào đầu năm nay và huy động được 21 triệu USD vốn tài trợ. Trong phần giới thiệu, họ tự mô tả mình là một “đội nhỏ nhưng tài năng” có người sáng lập đã giành được 10 huy chương vàng Olympic Tin học Quốc tế.
Trước Devin, trên thế giới cũng có những trợ lý AI hỗ trợ lập trình như Github Copilot hay ChatGPT và chatbot Google Bard. Tuy nhiên, Devin thì khác vì anh có thể xử lý toàn bộ quá trình phát triển từ đầu đến cuối.
Trong video giới thiệu, Giám đốc điều hành của Cognition Labs Scott Wu mô tả cách người dùng Devin có thể viết mã ban đầu, giám sát luồng lệnh, kiểm tra và sửa lỗi, thậm chí quản lý các dự án trên nền tảng như Upwork. Devin có thể tìm kiếm trực tuyến để tìm hiểu cách hoàn thành nhiệm vụ. Do đó, các kỹ sư sẽ có một nhân viên AI có đầy đủ năng lực làm việc trong dự án thay vì một trợ lý chỉ có thể đề xuất mã.
Để sử dụng, người dùng nhập các lệnh ngôn ngữ tự nhiên vào giao diện kiểu chatbot của Devin và các kỹ sư AI sẽ xử lý thêm. Nó sẽ phát triển một kế hoạch chi tiết để giải quyết vấn đề từng bước một.
Tiếp theo, Devin sẽ bắt đầu dự án bằng các công cụ dành cho nhà phát triển. Nó sẽ viết mã, sửa lỗi, kiểm tra và báo cáo tiến độ theo thời gian thực, cho phép người dùng theo dõi mọi thứ và cảnh giác với những tình huống bất ngờ. Nếu người dùng thấy lỗi, họ có thể vào giao diện trò chuyện và ra lệnh cho AI thực hiện thay đổi. Điều này giúp các nhóm kỹ thuật giao một số nhiệm vụ cho AI và tập trung vào các dự án sáng tạo hơn đòi hỏi trí thông minh của con người.
trong bài kiểm tra BloombergDevin có thể viết mã một trò chơi Pong cơ bản và tạo một trang web trong 20 phút.
Theo công bố của nhà phát triển, Devin đã giải quyết chính xác 13,86% vấn đề mà không cần hỗ trợ khi đánh giá trên benchmark SWE-Bench về giải quyết vấn đề trên GitHub. Hiệu suất của mô hình trước chỉ đạt 1,96% và có thể đạt tới 4,80% nếu được hỗ trợ.
Tuy nhiên, Devin vẫn chưa được phổ biến rộng rãi và chỉ dành cho một số ít người dùng đã đăng ký trước và được chọn lọc. Các nhà phát triển cho biết sản phẩm này chỉ là bước đầu tiên trong quá trình đào tạo kỹ sư trí tuệ nhân tạo.
“Chúng tôi đang phát triển các nhóm AI có khả năng vượt xa các công cụ AI ngày nay. Bằng cách giải quyết các vấn đề logic, chúng tôi có thể mở ra những khả năng mới trong nhiều lĩnh vực – mã chỉ là bước khởi đầu. Chúng tôi muốn giúp mọi người trên khắp thế giới biến ý tưởng của họ thành hiện thực “, Nhận thức giải thích.
Các sản phẩm của Cogniton Labs được coi là minh họa rõ nhất cho những tuyên bố trước đây của người sáng lập Nvidia, Huang Jensen. Tại một sự kiện vào tháng 2 năm ngoái, ông Huang đã khiến mọi người sốc khi khuyên giới trẻ không nên học lập trình.
Ông tin rằng nhân loại đang ở giai đoạn đầu của cuộc cách mạng trí tuệ nhân tạo và lập trình không còn là kỹ năng quan trọng nữa. Ông tin rằng AI đang ngày càng thực hiện công việc này tốt hơn nên mọi người nên tập trung vào những chuyên môn có giá trị hơn, chẳng hạn như sinh học, giáo dục, sản xuất hay nông nghiệp.
Thu Tao-Lưu Quý