Jan Leike, một nhà nghiên cứu AI hàng đầu, người đã từ chức khỏi OpenAI vào đầu tháng này trước khi công khai chỉ trích cách tiếp cận an toàn AI của công ty, đã cùng với đối thủ của OpenAI là Anthropic để lãnh đạo một nhóm “siêu liên kết” mới.
Trong một bài đăng trên X, Leike cho biết nhóm của anh ấy tại Anthropic sẽ tập trung vào các khía cạnh khác nhau của an toàn và bảo mật AI, đặc biệt là “giám sát có thể mở rộng”, “khái quát hóa từ yếu đến mạnh” và nghiên cứu căn chỉnh tự động.
Một nguồn tin quen thuộc với vấn đề này nói với TechCrunch rằng Leike sẽ báo cáo trực tiếp với Jared Kaplan, giám đốc khoa học của Anthropic và các nhà nghiên cứu của Anthropic hiện đang nghiên cứu khả năng giám sát có thể mở rộng – các kỹ thuật để kiểm soát hành vi của AI quy mô lớn theo những cách có thể dự đoán và mong muốn – sẽ chuyển sang báo cáo tới Leike khi nhóm của Leike thành lập.
Theo nhiều cách, nhóm của Leike có vẻ có sứ mệnh tương tự như nhóm Superalignment đã giải thể gần đây của OpenAI. Nhóm Superalignment do Leike đồng lãnh đạo có mục tiêu đầy tham vọng là giải quyết các thách thức kỹ thuật cốt lõi trong việc kiểm soát AI siêu thông minh trong bốn năm tới, nhưng thường bị cản trở bởi sự lãnh đạo của OpenAI.
Anthropic thường cố gắng khẳng định mình tập trung vào sự an toàn hơn OpenAI.
Giám đốc điều hành của Anthropic, Dario Amodei, từng là Phó Giám đốc nghiên cứu tại OpenAI và được cho là đã chia tay với OpenAI sau khi bất đồng về định hướng của công ty – cụ thể là trọng tâm thương mại ngày càng tăng của OpenAI. Amodei đã mang theo một số cựu nhân viên của OpenAI để ra mắt Anthropic, bao gồm cả Jack Clark, cựu lãnh đạo chính sách của OpenAI.