Vào thứ Năm, Reddit sẽ đưa ra một chính sách mới nhằm cân bằng mong muốn cấp phép nội dung của mình cho các công ty công nghệ lớn hơn, như Google, và bảo vệ quyền riêng tư của người dùng. “Chính sách nội dung công cộng” mới được công bố hiện sẽ tham gia chính sách nội dung và chính sách quyền riêng tư hiện có của Reddit để hướng dẫn cách các tổ chức thương mại và các đối tác khác truy cập và sử dụng dữ liệu của Reddit. Liên quan đến vấn đề này, công ty cũng đã công bố một subreddit dành riêng cho các nhà nghiên cứu làm việc với dữ liệu của Reddit.
Thông báo này được đưa ra ngay sau khi Reddit ra mắt thị trường chứng khoán, cho thấy công ty đang định vị mình để tăng doanh thu không chỉ từ quảng cáo chạy trên nền tảng và việc sử dụng API của các nhà phát triển mà còn từ kho dữ liệu của nó. Công ty trong bản cáo bạch IPO cho biết họ đã kiếm được 203 triệu USD thông qua các thỏa thuận cấp phép dữ liệu và kỳ vọng con số đó sẽ tăng theo thời gian.
Mặc dù Reddit trước đây không chặn quyền truy cập vào dữ liệu của mình cho mục đích đào tạo AI, nhưng nó đã thay đổi hướng đi vào năm ngoái. Giám đốc điều hành Reddit Steve Huffman nói với The New York Times rằng việc Reddit tiếp tục cung cấp miễn phí “tất cả giá trị đó cho một số công ty lớn nhất thế giới” là điều vô nghĩa, báo hiệu kế hoạch của công ty trong việc chuyển sang cấp phép dữ liệu. không gian.
Với những nỗ lực đó hiện đang được tiến hành tốt, Chính sách nội dung công khai mới sẽ khóa quyền truy cập vào dữ liệu của Reddit mà không có thỏa thuận. (Reddit cho biết họ không bổ sung các hạn chế mới mà chỉ công khai chính sách đã áp dụng nội bộ trong một thời gian.)
Reddit viết trên blog của mình: “Thật không may, chúng tôi thấy ngày càng nhiều thực thể thương mại sử dụng quyền truy cập trái phép hoặc lạm dụng quyền truy cập được ủy quyền để thu thập hàng loạt dữ liệu công khai, bao gồm cả nội dung công khai của Reddit”. “Tệ hơn nữa, những thực thể này cho rằng họ không bị giới hạn trong việc sử dụng dữ liệu đó và họ làm như vậy mà không quan tâm đến quyền hoặc quyền riêng tư của người dùng, bỏ qua các yêu cầu hợp lý về mặt pháp lý, an toàn và xóa bỏ của người dùng. Mặc dù chúng tôi sẽ tiếp tục nỗ lực chặn những kẻ xấu đã biết nhưng chúng tôi cần phải làm nhiều hơn để hạn chế quyền truy cập vào nội dung công khai của Reddit trên quy mô lớn đối với những kẻ đáng tin cậy đã đồng ý tuân thủ chính sách của chúng tôi. Nhưng chúng tôi cũng cần tiếp tục đảm bảo rằng người dùng, mod, nhà nghiên cứu và các tác nhân phi thương mại, có thiện chí khác có quyền truy cập.”
Nói cách khác, quyền truy cập vào dữ liệu Reddit để nghiên cứu và các nỗ lực phi thương mại khác sẽ tiếp tục, nhưng những thực thể muốn sử dụng dữ liệu của Reddit cho các mục đích khác – bao gồm cả đào tạo AI – sẽ phải trả tiền. Trong một hình ảnh được chia sẻ trên blog, Reddit nói rõ điều này, nói rằng các doanh nghiệp quan tâm đến việc sử dụng dữ liệu Reddit để “cung cấp năng lượng, tăng cường hoặc nâng cao sản phẩm của bạn cho bất kỳ mục đích thương mại nào” cần phải có hợp đồng.
Trong khi đó, các nhà quảng cáo được chuyển hướng đến API quảng cáo để quản lý chiến dịch và theo dõi hiệu suất của chúng.
Vì công ty về cơ bản chỉ là một trang web lớn, có thể được lập chỉ mục bởi các công cụ tìm kiếm nên chính sách mới này nhằm mục đích khóa nội dung Reddit khỏi mọi hoạt động thu thập trái phép đồng thời tôn trọng quyền của người dùng.
Chẳng hạn, Reddit nói rằng các đối tác của họ sẽ phải tải lên các quyết định của người dùng về việc xóa nội dung của họ. Vì vậy, nếu người dùng không muốn bài đăng cá nhân của mình trở thành nguồn cung cấp dữ liệu cho các công cụ AI trong tương lai, họ có thể chọn không tham gia. Chính sách mới cũng hạn chế các đối tác sử dụng nội dung của Reddit để nhận dạng cá nhân hoặc thông tin cá nhân của họ, bao gồm cả việc nhắm mục tiêu quảng cáo. Các đối tác cũng không được sử dụng nội dung Reddit để spam hoặc quấy rối người dùng hoặc để tiến hành “kiểm tra lý lịch, nhận dạng khuôn mặt, giám sát của chính phủ hoặc giúp cơ quan thực thi pháp luật thực hiện bất kỳ điều nào ở trên”.
Chính sách này còn hạn chế quyền truy cập vào phương tiện người lớn và làm rõ rằng Reddit sẽ không bán thông tin cá nhân của người dùng. Công ty cũng lưu ý rằng họ sẽ không bao giờ cấp phép cho các nội dung không công khai như tin nhắn riêng tư hoặc thông tin tài khoản không công khai, như email hoặc lịch sử duyệt web của người dùng, cùng những nội dung khác.
Để giúp các nhà nghiên cứu muốn sử dụng dữ liệu Reddit cho mục đích phi thương mại, công ty đã thành lập một subreddit mới, r/reddit4researchers. Công ty cho biết họ đang hợp tác với OpenMined để phát triển một chương trình hướng dẫn và phát triển sự hợp tác của các nhà nghiên cứu với Reddit.