Một loạt các cải tiến lớn trên Google I/O 2025

Tại sự kiện Google I/O 2025, Google đã ra mắt và nâng cấp một loạt các ứng dụng về làm phim, tìm kiếm, gọi video và tích hợp AI vào điểm chung.

I/O 2025 là sự kiện lớn nhất của Google, được tổ chức tại trụ sở tại Mountain View, California, Hoa Kỳ từ ngày 20 đến 21 tháng 5.

Nâng cấp Song Tử

Phiên bản Gemini 2.5 đã từng được giới thiệu với “Mô hình AI thông minh nhất” và các biến thể flash của Gemini 2.5 Pro và 2.5 tiếp tục nâng cấp các tính năng để cải thiện bảo mật, minh bạch và chi phí rẻ. Trong số đó, Gemini 2.5 Pro có bản cập nhật lớn nhất, với các tính năng được suy nghĩ kỹ lưỡng.

Minh họa của Gemini 2.5 Pro. Ảnh: Hộp mạ crôm — Minh họa của Gemini 2.5 Pro. hình ảnh: *Mạ crôm unboxed*

Demis Hassabis của Deepmind Deepmind cho biết Deep Think đã sử dụng “một loạt các nghiên cứu hiện đại” để giúp mô hình “có thể xem xét nhiều giả định trước khi trả lời truy vấn”. Ưu điểm của nó là xử lý truy vấn phức tạp liên quan đến toán học và mã hóa. Các đại diện của Google cho biết mô hình đã nhận được điểm “ấn tượng” trong Thế vận hội Toán học Hoa Kỳ 2025. Tuy nhiên, Google muốn thêm thời gian đánh giá bảo mật nhiều hơn trước khi nó được công bố rộng rãi và nhận ý kiến từ các chuyên gia.

Gemini 2.5 Flash đã được tối ưu hóa cho tốc độ và hiệu quả. Các mô hình sử dụng mã thông báo nhỏ hơn (đơn vị dữ liệu nhỏ nhất cho các mô hình xử lý AI) là nhiều hơn, đạt điểm cao hơn về mặt lý thuyết, đa phương thức, mã hóa và các tiêu chuẩn dài hạn. Mô hình dự kiến có sẵn cho người dùng vào tháng Sáu.

Ngoài ra, Google đưa dự án Mariner vào API Gemini và Vertex AI. Dự án Mariner là một yếu tố AI tận dụng sức mạnh của Song Tử để duyệt các trang web và hoàn thành các tác vụ thay thế người dùng. Kiểm tra chức năng chuyển đổi văn bản thành giọng nói trên flash Gemini 2.5 Pro và Gemini 2.5 hiện có sẵn thông qua API Gemini, hỗ trợ hai giọng nói và 24 ngôn ngữ.

Ai đang tìm kiếm

Chế độ AI hoặc mô hình AI sẽ được Google triển khai trong tuần này và “trong những tháng tới” cho người dùng Hoa Kỳ và các trường khác. Tính năng mới cho phép tìm kiếm trực tuyến thông qua chatbots bằng các mô hình Gemini 2.5 và có kinh nghiệm “không bao giờ tìm thấy trên các công cụ tìm kiếm thông thường”. Ví dụ: người dùng tìm kiếm các câu hỏi trong một biểu mẫu trò chuyện thông qua các câu hỏi nhanh và sau đó tổng hợp chúng thành một bài viết thống nhất.

Ngoài ra, mô hình AI cũng tạo ra các biểu đồ cho các truy vấn như tài chính và thể thao hoặc yêu cầu các mô hình Google AI tổng hợp một vấn đề. Với Project Astra, tính năng tìm kiếm thời gian thực cho phép người dùng tương tác với các công cụ tìm kiếm bằng cách trò chuyện với các công cụ tìm kiếm hoặc hướng máy ảnh của họ đến bất cứ điều gì họ muốn tìm kiếm.

Mô hình AI cũng tăng khả năng mua sắm nhanh chóng. Người dùng chỉ cần tải lên hình ảnh và thử thử quần áo hoặc các mặt hàng thời trang họ muốn mua. Nếu bạn không quyết định mua nó vào thời điểm đó, Google đã cung cấp các tùy chọn thông báo khi được giảm giá và thậm chí quyết định liệu bạn có khả năng mua nó không.

Chế độ AI xuất hiện dưới dạng tab trên Google Search. Ảnh: Google — Chế độ AI xuất hiện dưới dạng tab trên Google Search. hình ảnh: *Google*

“Trước đây, tìm kiếm 'nếu có một số thông tin, tôi sẽ mang nó đến cho bạn'. Nhưng bây giờ, với sự giúp đỡ của khả năng lý thuyết của Song Tử, chúng tôi sẽ phân tích, chuyển đổi, chuyển đổi, chuyển đổi và liên quan đến thông tin và tổng hợp các điểm.

Có rất nhiều nâng cấp cho ảnh và video

Mô hình tạo hình ảnh từ văn bản Imagen 4 mới nhất có nâng cấp chất lượng cao hơn thế hệ thứ ba. Eli Imagen 4 kết hợp tốc độ và độ chính xác để tạo ra những hình ảnh đẹp, ông đã viết Eli Collins, phó chủ tịch của Google Deepmind Product. Mô hình tạo ra hình ảnh với sự rõ ràng đáng kinh ngạc trong các chi tiết nhỏ, chẳng hạn như sợi, nước và tóc động vật, cũng như hình ảnh với phong cách siêu thực và trừu tượng tuyệt vời.

Ảnh của con tắc kè được tạo ra bởi Imagen 4. Ảnh: Google — Ảnh của Geckos được tạo bởi Imagen 4. Ảnh: *Google*

Dựa trên một số mẫu được làm từ hình ảnh 4, Techradar Đánh giá các chi tiết ấn tượng và xác thực. Ví dụ, hình ảnh của cá voi nhảy ra khỏi nước và hình ảnh tắc kè hoa Tạo cảm giác giống như hình ảnh.

Mô hình mới cũng xử lý chính tả của phông chữ tốt hơn. Collins cho biết các tính năng mới giúp người dùng dễ dàng tạo thiệp chúc mừng, áp phích, truyện tranh. Trước đây, Chatgpt cũng có cùng chức năng, nhưng được bình luận là chính tả hoặc khó đọc. Người dùng có thể truy cập công cụ này thông qua Gemini, Stir, Vertex AI và Workspace.

Trong khi đó, mô hình tạo video của VEO 3 cũng cập nhật khả năng kết hợp âm thanh thành video, bao gồm cả ranh giới giữa các nhân vật hoặc âm thanh động vật. Theo CNBCĐây là một sự khác biệt quan trọng so với đối thủ, khi hầu hết các mô hình hiện chỉ tạo video không có video âm thanh hoặc âm nhạc.

Google cũng đã ra mắt ứng dụng phim AI Flow. Công cụ này được sử dụng để tạo một clip 8 giây bằng cách sử dụng Imagen và Gemini với đầu vào cho lời nhắc, hình ảnh hoặc video. Quá trình này cũng đi kèm với một tập hợp các công cụ xây dựng cho phép người dùng ghép video, điều chỉnh và tạo video AI dài và liền mạch.

Android XR và Aura Project Project Aura

Dự án Aura được coi là câu trả lời của Google. Nguyên mẫu sản phẩm được làm bởi XREAL, đi kèm với máy ảnh, micrô và loa, hỗ trợ chất lỏng trực tiếp, đường dây và truy vấn thông qua Gemini AI và một màn hình tùy chọn được thêm vào để xem các thông báo gắn vào ống kính.

Dự án Aura đang chạy Android XR. Ảnh: Google — Dự án Aura đang chạy Android XR. hình ảnh: *Google*

Google đã tiến hành một số trường hợp trong thế giới thực bằng cách sử dụng Project Aura, chẳng hạn như nhắn tin, duyệt mỗi hành trình, lên lịch các cuộc hẹn, dịch ngôn ngữ trực tiếp và chụp ảnh. Công ty cho biết họ đang gửi sản phẩm cho các đối tác có kinh nghiệm và chờ phản hồi.

Project Aura chạy hệ điều hành Android XR – Tham vọng của Google trong các mảng kính thông minh. Năm ngoái, nền tảng ra mắt với Qualcomm và Samsung hiện đang nâng cấp AI và AR để làm cho kính thông minh trở nên hữu ích hơn trong cuộc sống thực. Ngoài hai công ty này, công ty tìm kiếm của Hoa Kỳ đã bắt tay với nhiều đối tác khác để phát triển kính thông minh như Gentle Monster, Warby Parker, Xreal.

Các sản phẩm khác

Chrome nhận được “trợ lý AI” với các tính năng mô hình Song Tử mới nhất trên Chrome, Google AI Pro và Ultra Gói được đăng ký bắt đầu từ ngày 21 tháng 5 thay vì phiên bản miễn phí. Trong trình duyệt, Google đặt nó vào một nút Gemini chuyên dụng để giúp người dùng tóm tắt bất kỳ thông tin trang web nào và thậm chí điều hướng nếu mua sắm được cho phép.

Giám đốc điều hành PICHAI Chủ nhật của Google tại sự kiện Google I/O 2025 của Google. Ảnh: Edge — Giám đốc điều hành PICHAI Chủ nhật của Google tại sự kiện Google I/O 2025 của Google. Ảnh: *bờ rìa*

Cũng trên Chrome, Google sử dụng AI để phát hiện mật khẩu vi phạm. Khi bạn nhận thấy nguy cơ tấn công, AI có thể tự động “tạo mật khẩu mạnh” và cập nhật mật khẩu trên trang web được hỗ trợ bởi quản lý mật khẩu. Sau khi các mối đe dọa được ngăn chặn, thông báo được gửi cho người dùng để thay đổi mật khẩu của họ.

Trên Gmail, Google cũng đã thêm tính năng “chữ viết”. Nếu cũ thường ngừng gợi ý nội dung, tính năng mới sẽ nhận được thông tin từ lịch sử của hộp thư và kết hợp các ổ đĩa Google để tạo “kiểu người dùng tương tự nhất”.

Google Meet cũng thêm khả năng dịch giọng nói trực tiếp trong các cuộc gọi AI. Tính năng này rất hữu ích trong nhiều trường hợp, chẳng hạn như sống trong một gia đình bằng nhiều ngôn ngữ khác nhau hoặc trong một ngôi nhà được sử dụng bởi các công ty đa quốc gia, cho phép liên lạc và trò chuyện tương tự toàn cầu. Theo Google, dịch độ trễ rất thấp và các giải pháp khác không thể làm điều đó ngày hôm nay.

BaoLin Tổng hợp

Google trực tiếp thực hiện dịch giọng nói trên các cuộc gọi
Google đặt chatbot gemini lên xe hơi, TV, đồng hồ

Công Nghệ

Một loạt các cải tiến lớn trên Google I/O 2025

Administrator