Microsoft muốn biến Windows thành hệ điều hành AI, ra mắt PC Copilot+

Microsoft muốn biến Windows thành hệ điều hành AI, ra mắt PC Copilot+

Microsoft muốn đưa AI có tính sáng tạo lên hàng đầu trong Windows — và các PC chạy nó.

Tại một số bài phát biểu trong hội nghị nhà phát triển Build thường niên vào tuần này, công ty đã tiết lộ một dòng máy Windows mới có tên là Copilot+ PC, cùng với các tính năng tổng hợp được hỗ trợ bởi AI như Recall, giúp người dùng tìm thấy ứng dụng, tệp và nội dung khác mà họ đã có. đã xem trong quá khứ. Copilot, thương hiệu AI tổng hợp của Microsoft, sẽ sớm được tích hợp sâu hơn vào trải nghiệm Windows 11. Và các thiết bị Microsoft Surface mới đang chuẩn bị ra mắt.

Chúng tôi đã tổng hợp tất cả các thông báo quan trọng từ Thứ Hai và Thứ Ba tại đây.

Ứng dụng thể tích

Microsoft đang đưa Ứng dụng Windows Volumetric – về cơ bản là các ứng dụng VR tương tác, nhận biết về mặt không gian – vào tai nghe Meta Quest. Thông qua quan hệ đối tác với Meta, Microsoft cho biết họ sẽ cung cấp kết nối Windows 365 và PC cục bộ cho tai nghe Quest, cho phép các nhà phát triển mở rộng ứng dụng của họ sang không gian 3D.

Tín dụng hình ảnh: Microsoft

Trong bài phát biểu quan trọng hôm thứ Ba, Microsoft đã trình diễn chế độ xem 3D kỹ thuật số bùng nổ của bộ điều khiển Xbox từ góc nhìn của tai nghe Meta Quest 3 – một vật thể kỹ thuật số mà người đeo có thể thao tác bằng tay. Pavan Davuluri, CVP phụ trách Windows và thiết bị tại Microsoft, cho biết trong buổi demo: “Chúng tôi đang tăng cường hợp tác với Meta để biến Windows thành trải nghiệm hạng nhất trên các thiết bị Quest”.

Các nhà phát triển có thể đăng ký bản xem trước để nhận quyền truy cập vào API thể tích mới của Microsoft.

Phi công phụ + PC

Microsoft Copilot+ PC
Tín dụng hình ảnh: Microsoft

Copilot+ PC là tầm nhìn của Microsoft về phần cứng Windows hàng đầu, ưu tiên AI. Tất cả đều bao gồm các chip chuyên dụng được gọi là NPU để hỗ trợ trải nghiệm AI như Thu hồi. Và chúng có RAM tối thiểu 16GB, kết hợp với bộ lưu trữ SSD.

Những chiếc PC Copilot+ đầu tiên sẽ sử dụng chip Snapdragon X Elite và Plus của Qualcomm, được Microsoft tuyên bố mang lại thời lượng duyệt web lên tới 15 giờ và thời lượng pin xem video là 20 giờ. Các nhà sản xuất chip Intel và AMD cũng cam kết xây dựng bộ xử lý cho các thiết bị Copilot+ với sự hợp tác của nhiều nhà sản xuất, bao gồm Acer, Asus, Dell, HP, Lenovo và Samsung.

Copilot+ PC có giá khởi điểm 999 USD và một số đã có sẵn để đặt hàng trước ngay hôm nay.

Surface Pro và máy tính xách tay Surface

Các thiết bị Surface mới ra mắt của Microsoft, Surface Laptop và Surface Pro, tập trung vào hiệu suất và pin.

Máy tính xách tay Microsoft Surface
Tín dụng hình ảnh: Microsoft

Máy tính xách tay Surface mới nhất – có màn hình 13,8 hoặc 15 inch – đã được thiết kế lại với “đường nét hiện đại” và viền màn hình mỏng hơn. Công ty cho biết nó kéo dài tới 22 giờ cho một lần sạc và nhanh hơn tới 86% so với Surface Laptop 5. Nó cũng hỗ trợ Wi-Fi 7 và có bàn di chuột phản hồi xúc giác.

Microsoft Surface Pro
Tín dụng hình ảnh: Microsoft

Đối với Surface Pro mới, Microsoft cho biết nó nhanh hơn tới 90% so với Surface Pro thế hệ trước (Surface Pro 9) và nó có màn hình OLED mới với màn hình HDR, Wi-Fi 7 (và 5G tùy chọn) cùng một camera trước siêu rộng được nâng cấp. Ngoài ra, bàn phím có thể tháo rời của nó – đã được gia cố thêm bằng sợi carbon – hiện có phản hồi xúc giác.

Nhớ lại

Tính năng Thu hồi sắp ra mắt của Windows 11 có thể “ghi nhớ” các ứng dụng và nội dung mà người dùng đã truy cập trên PC của họ vài tuần hoặc thậm chí vài tháng trước, chẳng hạn như giúp họ tìm cuộc trò chuyện Discord nơi họ đang thảo luận về quần áo mà họ đang cân nhắc mua. Người dùng có thể sử dụng dòng thời gian của Recall để “cuộn lùi” để xem những gì họ đang làm trong thời gian gần đây và xem chi tiết các tệp như bản trình bày PowerPoint để hiển thị thông tin có thể liên quan đến tìm kiếm của họ.

Microsoft cho biết Recall có thể tạo ra các liên kết giữa màu sắc, hình ảnh, v.v. để cho phép người dùng tìm kiếm thực tế mọi thứ trên PC của họ bằng ngôn ngữ tự nhiên (không khác với công nghệ của Rewind khởi nghiệp); các nhà phát triển sẽ có thể cải thiện Thu hồi bằng cách thêm thông tin theo ngữ cảnh vào ứng dụng của họ. Và Microsoft tuyên bố tất cả dữ liệu người dùng liên quan đến Thu hồi đều được giữ riêng tư và trên thiết bị – và quan trọng là không được sử dụng để đào tạo các mô hình AI.

Thông tin thêm từ Microsoft: “Ảnh chụp nhanh là của bạn; chúng ở cục bộ trên PC của bạn. Bạn có thể xóa từng ảnh chụp nhanh riêng lẻ, điều chỉnh và xóa khoảng thời gian trong Cài đặt hoặc tạm dừng tại bất kỳ thời điểm nào ngay từ biểu tượng trên Khay hệ thống trên Thanh tác vụ của bạn. Bạn cũng có thể lọc các ứng dụng và trang web khỏi bị lưu.”

Chỉnh sửa hình ảnh và dịch trực tiếp

Hiện nay có nhiều AI trong Windows hơn bao giờ hết và một số trong số đó chỉ có trên PC Copilot+ mới.

Một tính năng mới có tên Siêu phân giải có thể khôi phục ảnh cũ bằng cách tự động nâng cấp chúng. Và Copilot hiện có thể phân tích hình ảnh để cung cấp cho người dùng ý tưởng về các tác phẩm sáng tạo. Thông qua tính năng có tên Cocreator, người dùng có thể tạo hình ảnh và yêu cầu mô hình AI làm theo những gì họ đang vẽ để thay đổi hoặc tạo kiểu lại cho hình ảnh.

Phụ đề trực tiếp với bản dịch trực tiếp
Tín dụng hình ảnh: Microsoft

Ở những nơi khác, Phụ đề trực tiếp với bản dịch trực tiếp sẽ dịch bất kỳ âm thanh nào truyền qua PC — cho dù từ YouTube hay tệp cục bộ — sang ngôn ngữ mà người dùng chọn. Bản dịch trực tiếp ban đầu sẽ hỗ trợ khoảng 40 ngôn ngữ, bao gồm tiếng Anh, tiếng Tây Ban Nha, tiếng Quan Thoại và tiếng Nga.

Một tính năng mới riêng biệt nhưng có liên quan trong Microsoft Edge cung cấp tính năng dịch video theo thời gian thực trên các trang như LinkedIn, YouTube, Coursera, Reuters, CNBC, Bloomberg, v.v. Dự kiến ​​sẽ có sẵn trong tương lai gần, tính năng này — hỗ trợ dịch tiếng Tây Ban Nha sang tiếng Anh và tiếng Anh sang tiếng Đức, tiếng Hindi, tiếng Ý, tiếng Nga và tiếng Tây Ban Nha — dịch trực tiếp nội dung nói thông qua cả lồng tiếng và phụ đề.

Nhóm Copilot và phần mở rộng

Team Copilot là bản mở rộng mới nhất của bộ công nghệ AI tổng hợp Copilot đang phát triển của Microsoft. Nó tích hợp với Teams, ứng dụng hội nghị truyền hình của công ty, để giúp quản lý chương trình cuộc họp và ghi chú mà bất kỳ ai trong cuộc họp đều có thể đồng tác giả. Và nó mở rộng đến Loop and Planner, nền tảng cộng tác và lập kế hoạch của Microsoft, để tạo và phân công nhiệm vụ, theo dõi thời hạn và thông báo cho các thành viên trong nhóm khi cần dữ liệu đầu vào của họ.

Microsoft muốn biến Windows thành hệ điều hành AI, ra mắt PC Copilot+
Tín dụng hình ảnh: GitHub/Microsoft

Trong tin tức có liên quan đến Copilot, Microsoft đã ra mắt Tiện ích mở rộng Copilot (ở dạng xem trước riêng tư), cho phép các nhà phát triển mở rộng công cụ tạo mã GitHub Copilot của GitHub bằng các ứng dụng và kỹ năng của bên thứ ba. Các đối tác ra mắt bao gồm DataStax, Docker và LambdaTest; các tiện ích mở rộng sẽ tồn tại trên GitHub Marketplace, nhưng các nhà phát triển cũng sẽ có thể tạo các tiện ích mở rộng riêng tư của riêng họ để tích hợp với các hệ thống và API nội bộ của họ.

Thời gian chạy phi công phụ của Windows

Thời gian chạy phi công phụ của Microsoft Windows
Tín dụng hình ảnh: Microsoft

Cung cấp sức mạnh cho các khả năng như Thu hồi và Siêu phân giải là Windows Copilot Runtime, một tập hợp gồm khoảng 40 mô hình AI tổng hợp tạo nên thứ mà Microsoft mô tả là “một lớp mới” của Windows. Song song với chỉ mục ngữ nghĩa, một hệ thống dựa trên vectơ cục bộ trên PC Copilot+ riêng lẻ, Windows Copilot Runtime cho phép các ứng dụng tổng hợp được hỗ trợ bởi AI — bao gồm cả ứng dụng của bên thứ ba — chạy mà không nhất thiết cần kết nối Internet.

“[The runtime] bao gồm các API AI sẵn sàng sử dụng như Hiệu ứng Studio, Bản dịch phụ đề trực tiếp, OCR, Thu hồi với hoạt động của người dùng và [more]sẽ có sẵn cho các nhà phát triển vào tháng 6,” Davuluri cho biết hôm thứ Ba.

Microsoft cho biết CapCut, trình chỉnh sửa video phổ biến của ByteDance, chủ sở hữu TikTok, sẽ sử dụng Windows Copilot Runtime và đi kèm với Thư viện Windows Copilot mới, một bộ API và công cụ phát triển AI, để tăng tốc các tính năng AI của nó. Và Meta sẽ thêm Hiệu ứng Studio nói trên vào WhatsApp để cung cấp các tính năng như làm mờ hậu cảnh và giao tiếp bằng mắt trong cuộc gọi điện video.

Trình tạo bot được nâng cấp

Azure AI Studio, bộ công cụ trong Dịch vụ Azure OpenAI của Microsoft cho phép khách hàng kết hợp mô hình AI và xây dựng một ứng dụng “suy luận” về dữ liệu đó, sẽ sớm cho phép các nhà phát triển tạo ứng dụng bằng cách sử dụng API suy luận trả tiền theo nhu cầu sử dụng – API thông qua đó các nhà phát triển có thể truy cập và tinh chỉnh các mô hình AI tổng quát được lưu trữ trên cơ sở hạ tầng Azure. Microsoft gọi đây là “mô hình dưới dạng dịch vụ” và sẽ bắt đầu với các mô hình từ Nixtla và Core42.

Trong bộ sản phẩm Copilot Studio liền kề, Microsoft đang tung ra các tác nhân Copilot, được công ty mô tả là các bot AI có thể “điều phối độc lập các nhiệm vụ phù hợp với các vai trò và chức năng cụ thể”. (Copilot Studio cung cấp các công cụ để kết nối Copilot cho Microsoft 365, “phi công phụ” được hỗ trợ bởi AI trong các ứng dụng như Excel và Word, với dữ liệu của bên thứ ba.) Tận dụng bộ nhớ và kiến ​​thức về ngữ cảnh, nhân viên Copilot có thể điều hướng nhiều loại quy trình công việc kinh doanh khác nhau, học hỏi từ phản hồi của người dùng và yêu cầu trợ giúp khi gặp tình huống không biết cách xử lý.

Bộ công cụ phát triển Snapdragon

Bộ công cụ phát triển Qualcomm
Tín dụng hình ảnh: Microsoft

Có một bộ công cụ phát triển mới của Qualcomm nhằm vào các nhà phát triển xây dựng ứng dụng cho PC Copilot+ đóng gói chip Arm

Bộ công cụ Snapdragon Dev Kit trị giá 899,99 USD dành cho Windows – có cùng chiều rộng, chiều cao và chiều dài với Mac Mini của Apple – chứa chip Snapdragon X Elite của Qualcomm kết hợp với 32GB RAM, 512GB dung lượng lưu trữ và nhiều I/O. Bộ công cụ Dev hỗ trợ Wi-Fi 7 và Bluetooth 5.4, đồng thời thông qua các cổng USB-C và HDMI khác nhau, nó có thể điều khiển tối đa ba màn hình 4K cùng một lúc.

Phi-3

Microsoft đã công bố một bổ sung cho dòng mô hình AI tổng quát Phi, Phi-3-vision, có thể thực hiện các nhiệm vụ phân tích trực quan và lý luận chung, chẳng hạn như trả lời các câu hỏi về biểu đồ và hình ảnh. Mô hình này có thể đọc cả văn bản và hình ảnh và đủ hiệu quả để chạy trên thiết bị di động.

Phi-3-vision có sẵn ở dạng xem trước, trong khi các phiên bản chỉ có văn bản đã được công bố trước đây của mẫu này — Phi-3-mini, Phi-3-small và Phi-3-medium — hiện đã có sẵn rộng rãi.

Hợp tác với Học viện Khan

Microsoft đang hợp tác với Khan Academy để trao quyền truy cập vào cơ sở hạ tầng điện toán đám mây, cho phép Khan Academy cung cấp cho các nhà giáo dục ở Hoa Kỳ quyền truy cập miễn phí vào các công cụ hỗ trợ AI của Khan Academy. Hai công ty cũng sẽ hợp tác để khám phá các cơ hội cải thiện ứng dụng AI cho việc dạy kèm toán thông qua AI sáng tạo, Microsoft cho biết hôm thứ Ba.

Chúng tôi đang tung ra bản tin AI! Đăng ký đây để bắt đầu nhận nó trong hộp thư đến của bạn vào ngày 5 tháng 6.