Theo kịp một ngành phát triển nhanh như AI là một yêu cầu cao. Vì vậy, cho đến khi AI có thể làm điều đó cho bạn, đây là tổng hợp hữu ích các câu chuyện gần đây trong thế giới học máy, cùng với các nghiên cứu và thử nghiệm đáng chú ý mà chúng tôi chưa đề cập riêng.
Nhân tiện, TechCrunch có kế hoạch sớm ra mắt bản tin AI. Giữ nguyên. Trong thời gian chờ đợi, chúng tôi đang tăng nhịp độ của chuyên mục AI bán thường xuyên, trước đây là hai lần một tháng (hoặc lâu hơn), lên hàng tuần – vì vậy hãy chú ý đến nhiều ấn bản hơn.
Tuần này về AI, OpenAI thông báo rằng họ đã đạt được thỏa thuận với News Corp, gã khổng lồ xuất bản mới, để đào tạo các mô hình AI tổng quát do OpenAI phát triển trên các bài báo từ các thương hiệu News Corp, bao gồm Tạp chí Phố Wall, Thời báo tài chính và MarketWatch. Thỏa thuận mà các công ty mô tả là “nhiều năm” và “lịch sử”, cũng trao cho OpenAI quyền hiển thị các tiêu đề của News Corp trong các ứng dụng như ChatGPT để trả lời một số câu hỏi nhất định – có lẽ là trong trường hợp câu trả lời được lấy nguồn một phần hoặc toàn bộ từ các ấn phẩm của News Corp.
Nghe có vẻ như một chiến thắng cho cả hai bên, phải không? News Corp nhận được tiền mặt cho nội dung của mình – theo báo cáo, là hơn 250 triệu USD – vào thời điểm mà triển vọng của ngành truyền thông thậm chí còn ảm đạm hơn bình thường. (AI sáng tạo không giúp ích được gì, có nguy cơ làm giảm đáng kể lưu lượng truy cập giới thiệu của các ấn phẩm.) Trong khi đó, OpenAI, công ty đang đấu tranh với các chủ sở hữu bản quyền trên một số mặt trận về tranh chấp sử dụng hợp lý, sẽ ít phải lo lắng hơn về một cuộc chiến tòa án tốn kém hơn.
Nhưng ma quỷ nằm ở chi tiết. Lưu ý rằng thỏa thuận của News Corp có ngày kết thúc – cũng như tất cả các thỏa thuận cấp phép nội dung của OpenAI.
Bản thân điều đó không phải là điều xấu đối với OpenAI. Việc cấp phép vĩnh viễn là điều hiếm thấy trên các phương tiện truyền thông, do động lực của tất cả các bên liên quan là luôn để ngỏ cánh cửa đàm phán lại thỏa thuận. Tuy nhiên, nó là hơi nghi ngờ trước những nhận xét gần đây của Giám đốc điều hành OpenAI Sam Altman về tầm quan trọng ngày càng giảm của dữ liệu đào tạo mô hình AI.
Trong lần xuất hiện trên podcast “All-In”, Altman nói rằng anh ấy “chắc chắn [doesn’t] nghĩ rằng sẽ có một cuộc chạy đua vũ trang [training] dữ liệu” bởi vì “khi các mô hình đủ thông minh, tại một thời điểm nào đó, nó không nên tập trung vào nhiều dữ liệu hơn – ít nhất là không dành cho việc đào tạo”. Ở một nơi khác, anh ấy nói với James O'Donnell của MIT Technology Review rằng anh ấy “lạc quan” rằng OpenAI – và/hoặc ngành công nghiệp AI rộng hơn – sẽ “tìm ra cách thoát khỏi [needing] ngày càng có nhiều dữ liệu đào tạo.”
Các mô hình vẫn chưa “thông minh” đến mức đó, khiến OpenAI được cho là đang thử nghiệm dữ liệu đào tạo tổng hợp và lùng sục khắp các trang web — và YouTube — để tìm các nguồn không phải trả tiền. Nhưng hãy giả sử một ngày nào đó họ đừng cần nhiều dữ liệu bổ sung để cải thiện nhảy vọt. Điều đó sẽ dẫn đến đâu cho các nhà xuất bản, đặc biệt là khi OpenAI đã xóa toàn bộ kho lưu trữ của họ?
Điểm tôi muốn nói là các nhà xuất bản – và các chủ sở hữu nội dung khác mà OpenAI hợp tác – dường như là đối tác ngắn hạn về sự thuận tiện, không hơn thế nữa. Thông qua các thỏa thuận cấp phép, OpenAI vô hiệu hóa một cách hiệu quả mối đe dọa pháp lý – ít nhất là cho đến khi tòa án xác định cách áp dụng sử dụng hợp lý trong bối cảnh đào tạo AI – và ăn mừng chiến thắng PR. Các nhà xuất bản nhận được nguồn vốn rất cần thiết. Và công việc về AI có thể gây tổn hại nghiêm trọng cho các nhà xuất bản đó vẫn tiếp tục.
Dưới đây là một số câu chuyện đáng chú ý khác về AI trong vài ngày qua:
- DJ AI của Spotify: Việc Spotify bổ sung tính năng AI DJ, giới thiệu các lựa chọn bài hát được cá nhân hóa cho người dùng, là bước đầu tiên của công ty hướng tới tương lai AI. Giờ đây, Spotify đang phát triển một phiên bản thay thế của DJ có thể nói được tiếng Tây Ban Nha, Sarah viết.
- Hội đồng AI của Meta: Meta hôm thứ Tư đã công bố thành lập một hội đồng cố vấn AI. Tuy nhiên, có một vấn đề lớn: nó chỉ có đàn ông da trắng trên đó. Điều đó có vẻ hơi điếc tai khi xem xét các nhóm bị gạt ra ngoài lề xã hội là những người có nhiều khả năng phải gánh chịu hậu quả nhất từ những thiếu sót của công nghệ AI.
- FCC đề xuất tiết lộ AI: Ủy ban Truyền thông Liên bang (FCC) đã đưa ra yêu cầu rằng nội dung do AI tạo ra phải được tiết lộ trong các quảng cáo chính trị – nhưng không bị cấm. Devin có toàn bộ câu chuyện.
- Trả lời các cuộc gọi bằng giọng nói của bạn: Truecaller, dịch vụ ID người gọi nổi tiếng, sẽ sớm cho phép khách hàng sử dụng trợ lý hỗ trợ AI để trả lời các cuộc gọi điện thoại trong sở hữu tiếng nói, nhờ vào mối quan hệ hợp tác mới được ký kết với Microsoft.
- Nhân đạo xem xét việc bán hàng: Humane, công ty đứng sau Ai Pin được quảng cáo rầm rộ nhưng đã đưa ra những đánh giá không mấy khả quan vào tháng trước, đang tìm kiếm người mua. Công ty được cho là đã định giá từ 750 triệu đến 1 tỷ USD và quá trình bán hàng đang ở giai đoạn đầu.
- TikTok chuyển sang AI sáng tạo: TikTok là công ty công nghệ mới nhất kết hợp AI tổng hợp vào hoạt động kinh doanh quảng cáo của mình, khi công ty đã thông báo vào thứ Ba rằng họ sẽ ra mắt bộ TikTok Symphony AI mới dành cho các thương hiệu. Báo cáo của Aisha cho biết các công cụ này sẽ giúp các nhà tiếp thị viết kịch bản, sản xuất video và nâng cao nội dung quảng cáo hiện tại của họ.
- Hội nghị thượng đỉnh AI Seoul: Tại hội nghị thượng đỉnh về an toàn AI ở Seoul, Hàn Quốc, các quan chức chính phủ và giám đốc điều hành ngành AI đã đồng ý áp dụng các biện pháp an toàn cơ bản trong lĩnh vực phát triển nhanh và thiết lập mạng lưới nghiên cứu an toàn quốc tế.
- Máy tính AI của Microsoft: Tại hai bài phát biểu trong hội nghị nhà phát triển Build hàng năm vào tuần này, Microsoft đã tiết lộ một dòng máy Windows (và máy tính xách tay Surface) mới có tên là Copilot+ PC, cùng với các tính năng tổng hợp được hỗ trợ bởi AI như Recall, giúp người dùng tìm ứng dụng, tệp và các tính năng khác. nội dung họ đã xem trước đây.
- Sự cố về giọng nói của OpenAI: OpenAI đang loại bỏ một trong những giọng nói trong tính năng chuyển văn bản thành giọng nói của ChatGPT. Người dùng nhận thấy giọng nói đó có tên Sky, giống một cách kỳ lạ với Scarlett Johansson (người từng đóng các nhân vật AI trước đây) – và bản thân Johansson đã đưa ra một tuyên bố nói rằng cô đã thuê cố vấn pháp lý để hỏi về giọng nói của Sky và biết chi tiết chính xác về cách nó được phát triển. .
- Luật lái xe tự động của Vương quốc Anh: Các quy định của Vương quốc Anh đối với ô tô tự hành hiện đã chính thức sau khi chúng nhận được sự đồng ý của hoàng gia, con dấu cao su cuối cùng mà bất kỳ luật nào cũng phải trải qua trước khi được đưa vào luật.
Học máy nhiều hơn
Một số nghiên cứu thú vị về AI liền kề dành cho bạn trong tuần này. Nhà nghiên cứu Shyan Gollakota của Đại học Prolific lại gây ấn tượng với một cặp tai nghe chống ồn mà bạn có thể nhắc chặn mọi thứ trừ người bạn muốn nghe. Khi đeo tai nghe, bạn nhấn nút trong khi nhìn vào người đó và nó sẽ lấy mẫu giọng nói phát ra từ hướng cụ thể đó, sử dụng nút đó để cung cấp năng lượng cho cơ chế loại trừ thính giác để lọc tiếng ồn xung quanh và các giọng nói khác.
Các nhà nghiên cứu, dẫn đầu bởi Gollakota và một số sinh viên tốt nghiệp, gọi hệ thống Thính giác Nói Mục tiêu và trình bày nó vào tuần trước tại một hội nghị ở Honolulu. Hữu ích như một công cụ trợ năng và một tùy chọn hàng ngày, đây chắc chắn là một tính năng mà bạn có thể thấy một trong những công ty công nghệ lớn đang sử dụng cho thế hệ lon cao cấp tiếp theo.
Các nhà hóa học tại EPFL rõ ràng cảm thấy mệt mỏi khi thực hiện 18 nhiệm vụ cụ thể, bởi vì họ đã đào tạo một mô hình có tên ChemCrow để thực hiện chúng. Không phải những công việc IRL như chuẩn độ và dùng pipet, mà là công việc lập kế hoạch như sàng lọc tài liệu và lập kế hoạch cho chuỗi phản ứng. Tất nhiên, ChemCrow không chỉ làm tất cả cho các nhà nghiên cứu mà còn hoạt động nhiều hơn như một giao diện ngôn ngữ tự nhiên cho toàn bộ tập hợp, sử dụng bất kỳ tùy chọn tìm kiếm hoặc tính toán nào nếu cần.
Tác giả chính của bài báo giới thiệu ChemCrow cho biết nó “tương tự như một chuyên gia về con người có quyền truy cập vào máy tính và cơ sở dữ liệu”, nói cách khác là một sinh viên mới tốt nghiệp, vì vậy hy vọng họ có thể làm việc gì đó quan trọng hơn hoặc bỏ qua những phần nhàm chán. Làm tôi nhớ tới Coscientist một chút. Về cái tên thì là “vì quạ được biết là sử dụng công cụ rất giỏi”. Đủ tốt!
Các nhà chế tạo robot của Disney Research đang nỗ lực làm cho các tác phẩm sáng tạo của họ chuyển động thực tế hơn mà không cần phải tạo hoạt ảnh bằng tay cho mọi khả năng chuyển động. Một bài báo mới mà họ sẽ trình bày tại SIGGRAPH vào tháng 7 cho thấy sự kết hợp giữa hoạt ảnh được tạo theo thủ tục với giao diện nghệ sĩ để điều chỉnh nó, tất cả đều hoạt động trên một robot hai chân thực tế (Groot).
Ý tưởng là bạn có thể để nghệ sĩ tạo ra một kiểu chuyển động – nảy, cứng, không ổn định – và các kỹ sư không cần phải thực hiện từng chi tiết, chỉ cần đảm bảo rằng nó nằm trong các thông số nhất định. Sau đó, nó có thể được thực hiện nhanh chóng, với hệ thống được đề xuất về cơ bản ứng biến các chuyển động chính xác. Mong đợi sẽ thấy điều này trong một vài năm nữa tại Disney World…