Mistral chỉ mới thành lập cách đây 9 tháng nhưng đã phát triển nhanh chóng và đạt mức định giá 2 tỷ USD nhờ mô hình trí tuệ nhân tạo có chi phí vận hành thấp.
Vào ngày này năm ngoái, Arthur Mensch, 31 tuổi, vẫn đang làm việc tại Google Deepmind. Tuy nhiên, ông hiện đang giữ chức vụ Giám đốc điều hành của Mistral AI, một công ty khởi nghiệp được coi là có tiềm năng phát triển ngang bằng với các công ty công nghệ hàng đầu ở Thung lũng Silicon.
Mensch lớn lên ở vùng ngoại ô phía tây Paris, nơi mẹ anh là giáo viên vật lý và cha anh điều hành một doanh nghiệp công nghệ nhỏ. Với mái tóc đen dày, mọi người cho rằng anh trông không giống một CEO công nghệ.
Sau khi theo học tại một số trường toán và cơ khí hàng đầu ở Pháp, Mensch đã hoàn thành luận án tiến sĩ vào năm 2018. Người cố vấn của anh nhận xét anh là một sinh viên luôn nhiệt tình tham gia và làm chủ các dự án ngay cả khi có rất ít kiến thức nền tảng.
“Tôi yêu những trải nghiệm mới,” Mensch nói tạp chí phố Wall. “Tôi nhanh chán.”
Mensch gia nhập bộ phận trí tuệ nhân tạo Google DeepMind vào cuối năm 2020. Hai năm sau, anh trở thành một trong những tác giả chính của bài báo mô hình AI Chinchilla được ca ngợi lúc bấy giờ.
Nhưng khi cuộc đua AI ngày càng nóng lên, Mensch cho biết ông cảm thấy thất vọng khi các phòng thí nghiệm AI tư nhân lớn đang bắt đầu hạn chế xuất bản các bài báo hoặc chia sẻ nghiên cứu về các mô hình ngôn ngữ lớn (LLM). Khi ChatGPT xuất hiện, có một cuộc cạnh tranh ngầm trong nội bộ Google và anh được chuyển sang một nhóm gồm 30 người thay vì 10.
Mensch nói: “Tôi nghĩ mình nên rời đi ngay bây giờ trước khi nó trở nên quá quan liêu đối với tôi. Tôi không muốn xây dựng một mô hình kỹ thuật mà mọi thứ đều không rõ ràng”.
Mensch dành nhiều thời gian để nghiên cứu cách làm cho hệ thống trí tuệ nhân tạo và máy học hiệu quả hơn. Năm ngoái, anh đã liên hệ với Timothée Lacroix, 32 tuổi và Guillaume Lample, 33 tuổi, khi đó đang làm việc tại Phòng thí nghiệm trí tuệ nhân tạo Meta ở Paris, để thành lập một công ty mới.
Mistral – được đặt tên theo những cơn gió mạnh bắt nguồn từ Pháp – ra đời, có văn phòng tại Paris. Khi thành lập công ty, ông không tin rằng quy mô lớn là cần thiết, ông cũng không tin rằng lĩnh vực công nghệ nhất thiết sẽ bị các công ty Mỹ thống trị.
Mensch nói: “Tôi luôn thắc mắc vì không có nhiều công ty công nghệ lớn ở châu Âu. Đây là cơ hội để chúng tôi trở thành một trong số họ”.
Mistral AI đã huy động được hơn 500 triệu USD tài trợ từ các nhà đầu tư như nhà đầu tư mạo hiểm nổi tiếng Andreessen Horowitz (a16z). Chưa đầy một năm sau khi thành lập, Mistral AI đã được định giá hơn 2 tỷ USD, trở thành một “kỳ lân”. Con số đầu tư đó chưa bằng số tiền hơn 10 tỷ USD mà Microsoft đã rót vào OpenAI hay các hệ thống AI mà Google hiện đang tự phát triển. Tuy nhiên, Mensch và những người đồng sáng lập đã thành lập Mistral AI một phần vì họ tin rằng phần lớn số tiền đang bị lãng phí.
Mensch nói: “Chúng tôi muốn trở thành công ty sử dụng vốn hiệu quả nhất trong lĩnh vực trí tuệ nhân tạo. Đó là lý do tại sao chúng tôi tồn tại”.
Vào ngày 26 tháng 2, Mistral đã ra mắt mô hình Mistral Large AI, “có khả năng trò chuyện và suy luận như con người” và có thể thực hiện nhiều tác vụ suy luận, tương đương với GPT-4 tiên tiến của OpenAI hoặc Gemini Ultra của Google. Hơn nữa, chi phí đào tạo của mô hình này chưa đến 22 triệu USD. Năm ngoái, Giám đốc điều hành OpenAI Sam Altma cho biết các mô hình AI của công ty có giá “hơn” 50-100 triệu USD.
dựa theo thương nhân trong cuộcKể từ khi thành lập cách đây hơn 5 tháng, Mistral đã thu hút được sự quan tâm từ các khách hàng doanh nghiệp và nhà đầu tư, trong đó có Microsoft. Vào ngày 26 tháng 2, Microsoft cho biết họ sẽ bổ sung mẫu máy mới của Mistral làm tùy chọn cho các nhà phát triển trên dịch vụ đám mây Azure của mình và nắm giữ cổ phần trong công ty. Mistral còn hợp tác và bán cổ phần cho một số công ty trong lĩnh vực AI như Nvidia hay Salesforce.
Đồng sáng lập Brave Software và CTO Brian Bondy cho biết công ty của ông sử dụng Mistral AI theo mặc định để hỗ trợ các chatbot trên trang web của mình. Bondy cho biết: “Chúng tôi nhận thấy Mistral AI cũng tốt như mô hình độc quyền, nhưng cách tiếp cận nguồn mở đã giúp Brave kiểm soát nhiều hơn đối với mô hình địa phương”.
Eric Boyd, phó chủ tịch nền tảng trí tuệ nhân tạo tại Microsoft, cho biết Mistral “cung cấp một thử nghiệm hấp dẫn về cách kỹ thuật thông minh có thể thúc đẩy các hệ thống trí tuệ nhân tạo”. Điều này có thể giúp các máy trí tuệ nhân tạo chạy với hiệu suất cao hơn và chi phí thấp hơn so với các mẫu hiện có trên thế giới.
Đối với Mensch và các đồng nghiệp của ông, việc phát hành các hệ thống AI dưới dạng nguồn mở cho bất kỳ ai sử dụng miễn phí là một nguyên tắc quan trọng. Đó cũng là một cách để thu hút sự chú ý của các nhà phát triển và khách hàng tiềm năng muốn kiểm soát trí tuệ nhân tạo nhiều hơn. Tuy nhiên, Mistral Large không phải là nguồn mở.
Mensch nói thêm: “Rõ ràng đó là sự cân bằng tinh tế giữa việc xây dựng mô hình kinh doanh và tuân thủ các giá trị nguồn mở của Mistral. Chúng tôi muốn phát minh ra những thứ mới, kiến trúc mới nhưng vẫn muốn có thứ gì đó bán được nhiều sản phẩm hơn cho khách hàng”.