Đồng sáng lập và Giám đốc điều hành AI của quy mô Alexandr Wang đã huy động đội quân hàng trăm nghìn người để gắn nhãn dữ liệu và đào tạo các mô hình AI.
Các nhóm của Scal AI sử dụng ngồi sau máy tính ở các thành phố trên khắp thế giới, làm việc suốt ngày đêm với những nhiệm vụ có phần yên tĩnh và phức tạp: tạo câu chuyện, gắn nhãn hình ảnh hoặc cung cấp cho chatbot văn bản họ cần để hiểu rõ hơn ngôn ngữ tự nhiên của con người. Nhiệm vụ của họ, được gọi chung là ghi nhãn dữ liệu, đa dạng đến mức họ thậm chí còn yêu cầu phải soạn thơ haiku hoặc làm quen với các ngôn ngữ thiểu số.
AI cần được đào tạo để nhận biết và phân biệt giữa các vật thể, chẳng hạn như túi giấy và người đi bộ. Vì vậy, các công ty AI cần tuyển dụng số lượng lớn nhân công để dán nhãn cho những thứ xuất hiện trong ảnh, video như ô tô, đèn giao thông, bánh mì… và trở thành nguồn dữ liệu đầu vào cho AI “học tập”.
Điều này đã tăng gấp ba lần doanh thu của Scal AI vào năm ngoái lên mức định giá 14 tỷ USD, trong khi giá trị tài sản ròng của Alexandr Wang ước tính là 1,7 tỷ USD. Nhà sáng lập 27 tuổi ví tầm quan trọng của Scal AI trong cuộc cách mạng AI cũng quan trọng như GPU do Nvidia phát triển.
Từ văn phòng rộng gần 17.000 foot vuông ở San Francisco, các nhà tuyển dụng của Scal AI liên tục đăng quảng cáo trên Reddit và LinkedIn, nhằm huy động nhiều người hơn để gắn nhãn dữ liệu và nhấn mạnh tính linh hoạt, khả thi của công việc từ xa. Một nhóm khác gửi các lô dữ liệu để giải thích cho những người mới đến cách họ được phân loại và họ được trả những gì.
Những người được tuyển dụng thường không biết họ đang làm việc cho Scal AI vì công việc được báo cáo thông qua các trang web Remotasks và Outlier. Các dự án được đặt mã số nên không biết đang tag khách hàng nào. AI quy mô thường sử dụng động vật làm tên mã, chẳng hạn như Ostrich của OpenAI, Bee của Apple hay Bulba của Google (tên của một Pokémon).
Quản lý một “đế chế” là rất khó khăn. Một số công nhân đã nghỉ việc kể tạp chí phố Wall Họ thất vọng vì lương thấp, làm việc chăm chỉ và chỉ có 8 đô la một giờ.
Mô hình trí tuệ nhân tạo quy mô
Năm 2017, Wang thành lập Remotasks, một công ty con tập trung tuyển dụng lao động giá rẻ ở nước ngoài. Ông đã thành lập các cơ sở ở Châu Phi và Châu Á để đào tạo những người dán nhãn dữ liệu.
Nhóm AI của quy mô cũng đã tham gia nhóm Làm việc từ xa của Philippines trên Facebook. Các bước thường là: Người tham dự đăng ký Outlier (một đơn vị của Thang đo AI); kiểm tra bài viết tự viết, chẳng hạn như “Giải thích việc hạ cánh lên mặt trăng cho một đứa trẻ 6 tuổi” nhận các tệp dữ liệu và sắp xếp chúng, dạy AI làm thế nào để viết bằng những thuật ngữ hữu ích để trò chuyện và cuối cùng nhận được tiền lương hàng ngày;
Khi có nhiều người tham gia hơn, công ty của Wang nhận được nhiều hợp đồng hơn. Họ đều là những “đại gia” công nghệ như Meta, OpenAI, Google… Theo tài liệu của nhà đầu tư, doanh thu hàng năm của Scal AI tăng vọt từ 227 triệu USD lên 680 triệu USD trong hai năm đầu tiên. Vào giữa năm nay, công ty đã mở văn phòng mới tại San Francisco sau khi huy động thành công 1 tỷ USD vốn tài trợ.
Tuy nhiên, nhiều người cho rằng họ đang làm việc quá sức. Trong thời kỳ đỉnh điểm của dịch bệnh vào năm 2022, Scal AI và các đối tác đã giành được hợp đồng trị giá khoảng 40 triệu USD. Hai cựu nhân viên cho biết cả nhóm đã kiệt sức đến mức sau đó công ty đã tài trợ cho những kỳ nghỉ có lương để giúp họ thư giãn.
“Vấp ngã” bởi mệnh lệnh của Meta
Theo các nhân viên cũ, Scal AI đã nhận được đơn đặt hàng từ Meta, tên mã Flamingo, vào đầu năm ngoái. Công ty của Mark Zuckerberg đã yêu cầu tạo ra 27.000 cặp câu hỏi và câu trả lời để giúp đào tạo các chatbot trí tuệ nhân tạo trên Instagram và Facebook.
Tuy nhiên, khi Meta nhận hàng, họ phát hiện ra “điều kỳ lạ” là tất cả các câu trả lời đều giống nhau, hoặc bắt đầu bằng những cụm từ như “Giống như mô hình ngôn ngữ AI…” Họ phát hiện ra rằng các nhà thầu đã sử dụng ChatGPT để viết phản hồi.
Ngay sau đó, Wang đã ban bố tình trạng khẩn cấp và “đền bù” cho Meta bằng một dự án khác mang tên Flamingo Revival. Bảng xếp hạng nội bộ cho thấy ai hoàn thành nhiều nhiệm vụ gắn thẻ nhất sẽ được nghỉ có lương.
Ông Wang cũng yêu cầu nhà thầu điều tra và phát hiện ra rằng phần lớn dữ liệu xấu được gửi từ Kenya. Theo người phát ngôn của Scal AI, công ty gần đây đã “trấn áp” hoạt động gian lận, hạ tỷ lệ gian lận xuống dưới 0,1% trong tháng 7. Đại diện của Meta xác nhận rằng công ty “có mối quan hệ chặt chẽ với Scal AI và mong muốn tiếp tục duy trì mối quan hệ đó trong tương lai”. “
Wang là người thường xuyên tham dự các sự kiện lớn, chẳng hạn như Met Gala ở New York hồi đầu năm nay, và sau đó tham dự một cuộc họp chỉ dành cho người được mời tại Allen & Co. Ở Thung lũng Mặt trời. “Không ai bay trên nhiều máy bay hơn, tham dự nhiều bữa tiệc hơn và đó có vẻ như là công việc toàn thời gian của bạn”, Giám đốc điều hành OpenAI Sam Altman nhận xét trong một bài báo tháng 2 của Wang trên X.
Ông Wang, sinh năm 1997, là cái tên quen thuộc ở Thung lũng Silicon. Năm 2021, Scal AI được định giá 7,3 tỷ USD, đưa ông trở thành tỷ phú tự thân trẻ nhất trong danh sách người giàu của Hoa Kỳ. Forbes.