Tại Thử thách thành phố trí tuệ nhân tạo 2024, đội kỹ sư Việt Nam đã giành giải nhất cuộc thi phát hiện vật thể bằng camera góc siêu rộng.
Thử thách Thành phố AI được tổ chức trong khuôn khổ CVPR, hội nghị thường niên hàng đầu thế giới về thị giác máy tính và nhận dạng mẫu, cuộc thi năm nay tập trung vào việc sử dụng trí tuệ nhân tạo để nâng cao hiệu quả của các hoạt động vận tải, bán lẻ và kho bãi thông minh. .
Theo kết quả mới được ban tổ chức công bố, đội kỹ sư đến từ VNPT AI, Đại học Phenikaa và Đại học Giao thông đạt số điểm 64,06%, đứng cao nhất trong các đội và bỏ xa vị trí thứ hai (61,96%). "Các phương pháp tăng cường và tổng hợp dữ liệu để phát hiện các đối tượng trong ảnh camera mắt cá".
Ngoài các chủ đề quen thuộc như theo dõi đối tượng qua nhiều camera, phân tích và mô tả tình huống giao thông hay phát hiện hành vi của người lái xe mô tô không đội mũ bảo hiểm, phát hiện đối tượng thông qua camera mắt cá, tức là camera góc cực rộng, là một danh mục mới được bổ sung trong năm nay. . . Bài toán mới được đánh giá là rất phức tạp vì nó yêu cầu xử lý dữ liệu hình ảnh từ cảnh quay camera giao thông góc cực rộng, bao gồm ảnh toàn cảnh 180 độ và quan sát 360 độ.
Các đội được thử thách xác định các vật thể như xe buýt, xe máy, ô tô, người đi bộ và xe tải từ những hình ảnh bị méo, méo, nhỏ và mất cân bằng dữ liệu. Tổng cộng có 726 đội tham gia Thử thách Thành phố trí tuệ nhân tạo năm nay và có tổng cộng 403 đội đăng ký tham gia. Trong đó, kỹ sư Việt Nam đã giành được thứ hạng cao nhất.
Cách tiếp cận độc đáo của nhóm là phát triển phương pháp tăng cường dữ liệu mới bằng cách sử dụng VisDrone và Fisheye8K để làm phong phú thêm dữ liệu đào tạo. Sau đó, nhóm đã sử dụng nhiều mô hình phát hiện đối tượng tiên tiến được áp dụng cho các bộ dữ liệu này để cải thiện hơn nữa hiệu suất phát hiện đối tượng tổng thể.
Nhóm phát triển cho biết, vấn đề phát hiện vật thể bằng camera mắt cá tuy thách thức nhưng lại rất phù hợp vì camera góc siêu rộng được sử dụng rộng rãi trong hệ thống giao thông thông minh ở nhiều quốc gia. camera giúp giảm thiểu điểm mù và mở rộng tầm nhìn mà không cần tăng số lượng thiết bị.
Đại diện tập đoàn cho biết: “Vấn đề này là cơ hội để xích mích, đồng thời khẳng định vị thế của công nghệ Việt Nam trên bản đồ trí tuệ nhân tạo thế giới”.
Mô hình AI này cũng là một trong những mô hình được sử dụng để phát triển nền tảng nhận dạng hình ảnh VNPT SmartVision. Đây là nền tảng chuyên xử lý hình ảnh với 4 nhóm chức năng chính: giám sát giao thông, giám sát an ninh, số hóa văn bản, nhận dạng khuôn mặt và tìm kiếm. Giải pháp đã được triển khai tại Bình Phước, Cao Bằng, Hà Giang, Hà Nam, Tây Ninh, Bắc Giang, Ninh và các tỉnh thành khác.
Theo công bố của VNPT, tại TP Tân Yên, tỉnh Long An, Smart Vision đã được tích hợp vào hơn 120 camera giúp phát hiện vi phạm giao thông và giúp giảm 80% vi phạm trên địa bàn.
Lữ Quế