OpenAI ký thỏa thuận đào tạo AI trên dữ liệu Reddit

OpenAI ký thỏa thuận đào tạo AI trên dữ liệu Reddit

OpenAI đã đạt được thỏa thuận với Reddit để sử dụng dữ liệu của trang tin tức xã hội này để đào tạo các mô hình AI.

Trong một bài đăng trên blog trên trang quan hệ báo chí của OpenAI, công ty cho biết quan hệ đối tác với Reddit sẽ cung cấp cho họ quyền truy cập vào “nội dung độc đáo, có cấu trúc và theo thời gian thực” – ví dụ: các bài đăng và trả lời – từ Reddit, cho phép các công cụ và mô hình của nó “hiểu rõ hơn”. và giới thiệu” nội dung đó. Nội dung Reddit sẽ được tích hợp vào ChatGPT, AI đàm thoại phổ biến của OpenAI và các công ty sẽ hợp tác cùng nhau để mang đến “các tính năng hỗ trợ AI” mới chưa xác định cho cả người dùng và người kiểm duyệt Reddit.

OpenAI cũng sẽ trở thành đối tác quảng cáo của Reddit.

OpenAI viết trong bài đăng: “Reddit sẽ xây dựng trên nền tảng các mô hình AI của OpenAI để biến tầm nhìn mạnh mẽ của nó thành hiện thực. “Việc sử dụng LLM, ML và AI cho phép Reddit cải thiện trải nghiệm người dùng cho mọi người.”

OpenAI có một số thỏa thuận cấp phép tương tự với các nhà cung cấp nội dung, từ thư viện phương tiện chứng khoán đến nhà xuất bản tin tức. Nhưng góc độ bất thường của vấn đề này là Sam Altman, Giám đốc điều hành của OpenAI, có 8,7% cổ phần của Reddit, khiến ông trở thành cổ đông lớn thứ ba và từng là thành viên ban giám đốc của công ty.

Trong nỗ lực ngăn cản sự giám sát, OpenAI cho biết trong thông cáo báo chí của mình rằng, trong khi Altman vẫn là cổ đông của Reddit, mối quan hệ đối tác “được lãnh đạo bởi COO của OpenAI [Brad Lightcap]” và “được phê duyệt bởi [OpenAI’s] hội đồng quản trị độc lập.” (Tôi sẽ lưu ý ở đây rằng Altman là thành viên hội đồng quản trị của OpenAI; tuy nhiên, anh ấy đã tự rút lui vì quyết định này, một phát ngôn viên của OpenAI nói với TechCrunch.)

Reddit đã biến các thỏa thuận cấp phép dữ liệu ngày càng trở thành một phần trọng tâm trong chiến lược tăng trưởng của mình khi điều hướng thị trường với tư cách là một công ty đại chúng.

Trong bản cáo bạch IPO của mình, Reddit tiết lộ rằng họ có các thỏa thuận hợp đồng để cấp phép dữ liệu của mình cho khách hàng, bao gồm cả Google, trị giá tổng cộng hơn 200 triệu USD. Và, trong báo cáo thu nhập đầu tiên với tư cách là một công ty đại chúng, Reddit đã báo cáo doanh thu phi quảng cáo tăng 450% so với cùng kỳ năm trước, chủ yếu nhờ vào các thỏa thuận đó.

Cổ phiếu Reddit đã tăng 11% trong giao dịch mở rộng sau thông báo về thỏa thuận OpenAI.

“Điều nghịch lý mà tôi thấy là khi ngày càng có nhiều nội dung trên Internet được viết bằng máy, thì nội dung đến từ người thật sẽ ngày càng được đánh giá cao,” Giám đốc điều hành Reddit Steve Huffman cho biết trong cuộc gọi báo cáo thu nhập của công ty vào tháng 3. “Và chúng tôi đã có gần hai thập kỷ trò chuyện đích thực.”

Nền tảng của Reddit — có hơn 1 tỷ bài đăng và hơn 16 tỷ bình luận, những con số tăng lên mỗi ngày nhờ có hàng trăm triệu người dùng tích cực — là một mỏ vàng cho các công ty AI có tính sáng tạo, có mô hình học hỏi từ các ví dụ về nội dung, như văn bản. và hình ảnh để tạo ra nội dung mới, tương tự.

Nhưng công ty có thể phải đối mặt với sự phản đối từ những người dùng lo ngại về cách kiếm tiền từ dữ liệu của họ.

Bạn nên xem Stack Overflow, diễn đàn Hỏi & Đáp dành cho các nhà phát triển phần mềm, gần đây đã ký thỏa thuận với OpenAI để cung cấp dữ liệu cho hoạt động đào tạo mô hình của OpenAI. Để phản đối, một số người dùng đã xóa câu trả lời được xếp hạng cao nhất của họ cho các câu hỏi trên cộng đồng. Nhưng Stack Overflow đã khôi phục các bài đăng đã xóa và cấm những người dùng đó, cho rằng họ không tuân thủ các điều khoản dịch vụ của nó.

Reddit đã bày tỏ sự không hài lòng với một nỗ lực nhằm cung cấp cho người dùng Reddit quyền kiểm soát tốt hơn đối với dữ liệu của chính họ.

Vana, một công ty khởi nghiệp được xây dựng trên blockchain, đang cố gắng khởi chạy dữ liệu “DAO” (Tổ chức tự trị kỹ thuật số) để cho phép người dùng Reddit tổng hợp dữ liệu của họ và để họ cùng nhau quyết định cách sử dụng (hoặc bán) dữ liệu kết hợp đó. Reddit đã cấm subreddit của Vana dành riêng để thảo luận về DAO, trong một tuyên bố với TechCrunch và cáo buộc công ty “khai thác” các biện pháp kiểm soát xuất dữ liệu của mình.

Chúng tôi đang tung ra một bản tin AI! Đăng ký đây để bắt đầu nhận nó trong hộp thư đến của bạn vào ngày 5 tháng 6.