Large 2 của Mistral là câu trả lời cho các mô hình mới nhất của Meta và OpenAI

Đối với các mô hình AI tiên tiến, khi trời mưa, thì mưa như trút nước. Mistral đã phát hành một mô hình chủ lực mới vào thứ Tư, Large 2, mà họ tuyên bố là ngang bằng với các mô hình tiên tiến mới nhất từ OpenAI và Meta về mặt tạo mã, toán học và lập luận.

Việc phát hành Mistral Large 2 diễn ra chỉ một ngày sau khi Meta tung ra mô hình nguồn mở mới nhất và tuyệt vời nhất của mình, Llama 3.1 405B. Mistral cho biết Large 2 nâng cao tiêu chuẩn về hiệu suất và chi phí cho các mô hình mở, hỗ trợ điều đó bằng một số điểm chuẩn.

Large 2 dường như vượt trội hơn Llama 3.1 405B về khả năng tạo mã và hiệu suất toán học, và thực hiện điều này chỉ với chưa đến một phần ba các tham số: chính xác là 123 tỷ.

Trong một thông cáo báo chí, Mistral cho biết một trong những trọng tâm chính của họ trong quá trình đào tạo là giảm thiểu các vấn đề ảo giác của mô hình. Công ty cho biết Large 2 đã được đào tạo để có thể nhận định rõ hơn trong các phản ứng của mình, thừa nhận khi nó không biết điều gì đó thay vì bịa ra điều gì đó có vẻ hợp lý.

Công ty khởi nghiệp AI có trụ sở tại Paris gần đây đã huy động được 640 triệu đô la trong vòng gọi vốn Series B, do General Catalyst dẫn đầu, với mức định giá 6 tỷ đô la. Mặc dù Mistral là một trong những công ty mới tham gia vào lĩnh vực trí tuệ nhân tạo, nhưng công ty này đang nhanh chóng đưa các mô hình AI lên hoặc gần với công nghệ tiên tiến nhất.

Tuy nhiên, điều quan trọng cần lưu ý là các mô hình của Mistral, giống như hầu hết các mô hình khác, không phải là mã nguồn mở theo nghĩa truyền thống — bất kỳ ứng dụng thương mại nào của mô hình đều cần có giấy phép trả phí. Và mặc dù nó mở hơn, chẳng hạn như GPT-4o, nhưng ít ai trên thế giới có đủ chuyên môn và cơ sở hạ tầng để triển khai một mô hình lớn như vậy. (Tất nhiên, điều đó còn đúng gấp đôi đối với 405 tỷ tham số của Llama.)

Một thứ còn thiếu trong Mistral Large 2 và không có trong bản phát hành Llama 3.1 của Meta ngày hôm qua là khả năng đa phương thức. OpenAI đang vượt xa đối thủ cạnh tranh về hệ thống AI đa phương thức, có khả năng xử lý hình ảnh và văn bản cùng lúc, một tính năng mà một số công ty khởi nghiệp ngày càng muốn xây dựng.

Mô hình có cửa sổ 128.000 token, nghĩa là Large 2 có thể tiếp nhận rất nhiều dữ liệu trong một lời nhắc duy nhất (128.000 token tương đương với một cuốn sách 300 trang). Mô hình mới của Mistral cũng bao gồm hỗ trợ đa ngôn ngữ được cải thiện. Large 2 hiểu tiếng Anh, tiếng Pháp, tiếng Đức, tiếng Tây Ban Nha, tiếng Ý, tiếng Bồ Đào Nha, tiếng Ả Rập, tiếng Hindi, tiếng Nga, tiếng Trung, tiếng Nhật và tiếng Hàn, cùng với 80 ngôn ngữ lập trình. Đáng chú ý, Mistral tuyên bố Large 2 cũng tạo ra các phản hồi ngắn gọn hơn so với các mô hình AI hàng đầu, vốn có xu hướng nói huyên thuyên.

Mistral Large 2 có thể sử dụng trên Google Vertex AI, Amazon Bedrock, Azure AI Studio và IBM watsonx.ai. Bạn cũng có thể sử dụng mô hình mới trên La Plateforme của Mistral dưới tên “mistral-large-2407” và dùng thử miễn phí trên đối thủ ChatGPT của công ty khởi nghiệp này là Le Chat.

Công Nghệ

Large 2 của Mistral là câu trả lời cho các mô hình mới nhất của Meta và OpenAI

Administrator