Thế giới Việt Nam đọc các tập tin hiểu biết

Thế giới Việt Nam đọc các tập tin hiểu biết

Mô hình AI Cati-VLM được phát triển bởi Viện Công nghệ CMC đứng thứ 12 trên thế giới trong cuộc thi Cuộc thi Đọc mạnh mẽ (RRC) năm 2025.

Cuộc thi RRC được tổ chức bởi Trung tâm Tầm nhìn Máy tính ở Aut Minhoma de Barcelona (Tây Ban Nha) với các trường đại học, tổ chức nghiên cứu và các công ty công nghệ toàn cầu. Cuộc thi nhằm mục đích thúc đẩy các giải pháp tầm nhìn máy tính ứng dụng để dịch, quản lý dữ liệu, thành phố thông minh và các tài liệu lịch sử xử lý.

Theo bảng xếp hạng RRC được phát hành vào tháng 6, mô hình AI về đọc và hiểu Viện Ứng dụng Công nghệ CMC (CMC ATI) xếp thứ 12 trong danh mục câu hỏi trả lời để trả lời các tài liệu hình ảnh (tài liệu trực quan.





RRC xếp hạng câu trả lời câu hỏi từ tài liệu hình ảnh.

RRC xếp hạng câu trả lời câu hỏi từ tài liệu hình ảnh.

Các đại diện của CMC cho biết CATI-VLM được xây dựng từ kho dữ liệu 5 TB và có thể phân tích và hiểu nội dung theo cách trực quan trong một tài liệu hình ảnh. Thay vì dừng nhận dạng ký tự, mô hình phân tích cấu trúc bố cục, tức là nhận dạng không văn bản của các hộp kiểm, biểu đồ, chữ ký, công thức … trong khi làm chủ các biểu thức như phông chữ hoặc vùng in đậm.

Cati-VLM có thể trả lời các câu hỏi được hỏi từ hình ảnh tài liệu, tương tự như TATGPT, mà không học trước từ một hình thức cụ thể. Trong xếp hạng RRC, CATI-VLM đạt được độ chính xác cao nhất trong dữ liệu tập 4/7, ngay cả với 3 tỷ tham số được sử dụng. Mô hình này vượt qua nhiều sản phẩm từ các công ty công nghệ lớn, chẳng hạn như GPT-4 Vision Turbo, kết hợp Amazon Swarttract OCR (34) hoặc Baidu (Lớp 22).





Tiến sĩ. Dang Minh Tuân, Giám đốc của CMC ATI. Ảnh: NVCC

Tiến sĩ. Dang Minh Tuân, Giám đốc của CMC ATI. hình ảnh: NVCC

Tiến sĩ đại diện từ nhóm nghiên cứu. Điều này chứng tỏ khả năng thành thạo công nghệ để giải quyết các vấn đề cụ thể trong Việt Nam và các lĩnh vực chuyên nghiệp. Kết quả đến từ trọng tâm của hiệu suất và độ chính xác tốt nhất của nhóm, không phải số lượng tham số. Cách tiếp cận này giúp mô hình vận hành hiệu quả trên cơ sở hạ tầng phù hợp cho các điều kiện của Việt Nam.

Ông Nguyễn Trung Chick, chủ tịch của CMC, cho biết đây là kết quả của hơn 10 năm đầu tư vào nghiên cứu và phát triển của nhóm, chứng minh chiến lược làm chủ công nghệ của Việt Nam và nhằm mục đích chinh phục thị trường toàn cầu. “Chúng tôi tin rằng tình báo Việt Nam hoàn toàn có khả năng chơi với những người khổng lồ công nghệ toàn cầu và tạo ra một vị trí đáng giá trên bản đồ công nghệ của thế giới”, ông nói.

Viện Ứng dụng Công nghệ CMC tuyên bố rằng CATI-VLM sẽ được áp dụng cho hệ sinh thái C.OPENAI với tư cách là trợ lý ảo để hỗ trợ xem xét các tài liệu pháp lý, số hóa tài liệu, hệ thống quản lý kiến ​​thức, hệ thống báo cáo tự động, hệ thống báo cáo tự động văn phòng thông minh và ứng dụng xử lý tài liệu.