Microsoft 'chặn kỹ sư tiết lộ công khai lỗi vẽ AI'

Microsoft 'chặn kỹ sư tiết lộ công khai lỗi vẽ AI'

Đội ngũ pháp lý của Microsoft bị cáo buộc không cho phép các kỹ sư tiết lộ mẫu Dall-E 3 có thể bị vượt qua để tạo ra những hình ảnh bạo lực, khiêu dâm.

Kỹ sư trưởng của Microsoft Sean Jones cho biết Dall-E 3 của OpenAI có lỗ hổng bảo mật cho phép người dùng ra lệnh cho AI tạo ra những bức ảnh khiêu dâm, tương tự như deepfake nhắm vào Taylor Swift. Tuy nhiên, ông khẳng định đội ngũ pháp lý của công ty đã ngăn cản ông cảnh báo công chúng về lỗ hổng này. Vì vậy, ông quyết định gửi thư tới Quốc hội Mỹ vào ngày 30/1.

Jones nói trong thư rằng Dall-E 3 nên bị loại khỏi mục đích sử dụng công cộng cho đến khi OpenAI khắc phục được sự cố. Anh đã phát hiện ra cách vượt qua lớp bảo vệ Dall-E 3 vào đầu tháng 12 năm 2023 và báo cáo lên cấp trên tại Microsoft. Người này yêu cầu anh thông báo cho OpenAI. Sau khi làm theo hướng dẫn, Jones đã công khai đăng tải thông điệp lên mạng xã hội LinkedIn, kêu gọi ban giám đốc OpenAI ngừng cung cấp Dall-E 3 với lý do Microsoft cũng là thành viên ban giám đốc công ty.





Tác phẩm được tạo bởi VentureBeat bằng Dall-E 3.

một tác phẩm của Nhịp đập doanh nhân Thực hiện với Dall-E 3.

Jones cũng đã thông báo cho Microsoft về bài đăng. Tuy nhiên, người quản lý trực tiếp cho biết bộ phận pháp lý của tập đoàn đã yêu cầu anh xóa thông tin ngay lập tức và sẽ sớm đưa ra lời giải thích. Anh ấy đã làm như vậy nhưng không nhận được phản hồi từ đội ngũ pháp lý và dù có liên hệ cũng không nhận được phản hồi.

Trong khi đó, người phát ngôn của OpenAI cho biết công ty đã ngay lập tức điều tra sau khi được thông báo và đánh giá rằng công nghệ của Jones không thể vượt qua hệ thống bảo vệ. Mô hình Dall-E 3 cơ bản lọc nội dung đồ họa khiêu dâm hoặc bạo lực từ dữ liệu huấn luyện và phân loại hình ảnh để mô hình AI không tạo ra hình ảnh có hại. Ngoài ra, OpenAI cho biết họ đã triển khai các biện pháp bảo vệ bổ sung cho ChatGPT và Dall-E, chẳng hạn như từ chối yêu cầu tạo nội dung về người nổi tiếng.

Về phía Microsoft, người phát ngôn khẳng định công ty sẽ giải quyết mọi lo ngại của nhân viên theo chính sách của mình và đánh giá cao nỗ lực của nhân viên trong việc nghiên cứu, thử nghiệm các công nghệ mới nhằm cải thiện bảo mật. Vì báo cáo của Shane Jones liên quan đến các sản phẩm OpenAI nên công ty đã khuyến khích anh thông báo cho các kênh của OpenAI. Ngoài ra, Microsoft cho biết họ đã thử nghiệm và xác nhận rằng công nghệ mà Jones báo cáo đã không vượt qua bộ lọc bảo mật của bất kỳ công cụ tạo hình ảnh trí tuệ nhân tạo nào của công ty.


Faide