Kỹ sư Trần Tuấn Minh và các cộng sự gặp rất nhiều khó khăn khi upload lên Galaxy AI, bao gồm việc nhập dữ liệu và các phương ngữ tiếng Việt đa dạng.
Vào ngày 18 tháng 1, Samsung đã công bố ra mắt dòng điện thoại di động Galaxy S24 với các tính năng trí tuệ nhân tạo tổng quát (GenAI) tại sự kiện Unpacked 2024 ở San Jose, Hoa Kỳ, trong đó bao gồm khả năng sử dụng trí tuệ nhân tạo để dịch trực tiếp. Cách đó nửa vòng trái đất, tại Hà Nội, Trần Tuấn Minh, trưởng nhóm nghiên cứu ngôn ngữ AI tại Samsung R&D Việt Nam (SRV), cùng các cộng sự cũng hồi hộp theo dõi sự kiện này, mong chờ công bố về cột mốc quan trọng này.
“Mọi người đều sốc khi danh sách 13 ngôn ngữ đầu tiên được tính năng dịch GenAI hỗ trợ trên Galaxy S24 được công bố, trong đó có tiếng Việt”, ông Tuấn Minh nói. “Điều này giúp người dùng Việt Nam tương tác với công nghệ mới nhất bằng ngôn ngữ mẹ đẻ của họ, tương tự như các ngôn ngữ phổ biến nhất trên thế giới.”
Loài
Nhóm của Trần Tuấn Minh sẽ tiếp quản dự án phát triển Galaxy AI tại Việt Nam bắt đầu từ tháng 10 năm 2023 và Galaxy S24 được ra mắt vào tháng 1, nghĩa là nhóm chỉ có 4 tháng để hoàn thành.Đồng thời, việc phát triển AI ngôn ngữ lớn thường mất ít nhất 6 tháng đến một năm
Nhóm dự án bao gồm 30 kỹ sư phát triển trực tiếp và 45 người thử nghiệm, tất cả đều là người Việt Nam. Họ liên tục bay qua bay lại giữa Việt Nam và các trung tâm R&D ở Hàn Quốc, Ấn Độ, trao đổi, xây dựng bộ dữ liệu với văn bản tương ứng để “dạy” AI nói và hiểu tiếng Việt.
Trên Galaxy AI, sự phát triển của tiếng Việt dựa trên ba trụ cột chính: nhận dạng giọng nói thành văn bản, dịch sang ngôn ngữ khác và chuyển đổi văn bản thành giọng nói. Ví dụ: với bản dịch thời gian thực trong cuộc gọi, người gọi sẽ nói ngôn ngữ mẹ đẻ của họ và bản dịch thời gian thực sẽ dịch sang ngôn ngữ của người nghe và trả lời bằng ngôn ngữ đó. Galaxy AI đảm bảo quá trình dịch thuật diễn ra gần như ngay lập tức, giúp cuộc trò chuyện không bị chậm trễ.
Thách thức lớn nhất là dữ liệu về việc “dạy” AI bằng tiếng Việt còn rất hạn chế so với tiếng Anh hay các ngôn ngữ phổ biến khác. Chất lượng đầu vào cũng chưa cao vì AI là lĩnh vực mới ở Việt Nam. Việc thiếu và chất lượng dữ liệu thô thấp ảnh hưởng trực tiếp đến độ chính xác của đầu ra AI. Vì vậy, trước khi bắt đầu, toàn bộ nhóm đã ngồi lại để phân tích dữ liệu hiện có và xác định những “ngách” cần cải thiện.
“Sau khi giải quyết phần đầu vào của học phần dịch thuật, chúng tôi tiếp tục khám phá ra một thách thức khác: đặc điểm phương ngữ, rất khác nhau ở mỗi vùng”, anh Tuấn Minh nói.
Điều xảy ra tiếp theo là cuộc sống thực tế của người Việt thay đổi rất nhiều so với kho dữ liệu hiện có. Ví dụ như tiếng lóng của thế hệ Z, những từ mới của cư dân mạng hay các tựa phim, người nổi tiếng, sự kiện quốc tế… Vì vậy, đội ngũ R&D phải liên tục cập nhật AI.
Đồng thời, kỹ sư kiểm tra phải hòa mình vào môi trường thực tế như quán cà phê, xe buýt, phố đi bộ… để đánh giá khả năng hoạt động của AI trong nhiều điều kiện thực tế khác nhau.
Các sản phẩm mới luôn trải qua các bước thử nghiệm quan trọng trên đường từ phòng thí nghiệm nghiên cứu đến tay người dùng cuối. “SRV là trung tâm lớn nhất chịu trách nhiệm thử nghiệm thiết bị mạng bên ngoài Hàn Quốc, nhưng chúng tôi gặp phải thách thức lớn vì các kỹ sư thử nghiệm lúc đó chưa biết nhiều về trí tuệ nhân tạo”, Tuấn Minh nhớ lại. “Sau khi các kỹ sư Hàn Quốc truyền đạt công nghệ và kinh nghiệm của mình, mọi người đều học hỏi trong khi làm việc và chạy đua với thời gian.”
Ông Choi Joo Ho, Tổng Giám đốc Cơ sở Samsung Việt Nam, cho biết các tính năng mới của Galaxy AI được hưởng lợi từ sự đóng góp to lớn của các kỹ sư Việt Nam, từ nỗ lực đưa tiếng Việt trở thành một trong những ngôn ngữ sớm nhất, đến nghiên cứu và chuyển giao công nghệ mới cho các kỹ sư tại Việt Nam. khu vực.