Người mẫu AI yêu thích những con số vì nghĩ mình là người

Người mẫu AI yêu thích những con số vì nghĩ mình là người

Các mô hình AI luôn khiến chúng ta ngạc nhiên, không chỉ ở những gì chúng có thể làm mà còn ở những gì chúng không thể làm và tại sao. Một hành vi mới thú vị vừa hời hợt vừa tiết lộ về các hệ thống này: chúng chọn các số ngẫu nhiên như thể chúng là con người.

Nhưng trước tiên, điều đó có nghĩa là gì? Mọi người không thể chọn một số ngẫu nhiên sao? Và làm thế nào bạn có thể biết được ai đó đang làm điều đó thành công hay không? Đây thực sự là một hạn chế rất lâu đời và nổi tiếng mà con người chúng ta mắc phải: chúng ta suy nghĩ quá nhiều và hiểu sai về tính ngẫu nhiên.

Yêu cầu một người dự đoán mặt ngửa hoặc mặt ngửa cho 100 lần tung đồng xu và so sánh kết quả đó với 100 lần tung đồng xu thực tế – bạn hầu như luôn có thể phân biệt chúng vì, theo trực giác, các lần tung đồng xu thật Nhìn ít ngẫu nhiên hơn Ví dụ, thường sẽ có sáu hoặc bảy mặt ngửa hoặc mặt sấp liên tiếp, điều mà hầu như không có người dự đoán nào của con người đưa vào trong 100 mặt của họ.

Điều này cũng tương tự khi bạn yêu cầu ai đó chọn một số từ 0 đến 100. Mọi người hầu như không bao giờ chọn 1 hoặc 100. Bội số của 5 rất hiếm, cũng như những số có chữ số lặp lại như 66 và 99. Họ thường chọn những số tận cùng bằng 7, nói chung là từ giữa đâu đó.

Có vô số ví dụ về khả năng dự đoán này trong tâm lý học. Nhưng điều đó không làm cho việc AI bớt kỳ lạ hơn chút nào khi AI cũng làm điều tương tự.

Đúng vậy, một số kỹ sư tò mò tại Gramener đã thực hiện một thử nghiệm không chính thức nhưng vẫn hấp dẫn, trong đó họ chỉ yêu cầu một số chatbot LLM chính chọn ngẫu nhiên một số trong khoảng từ 0 đến 100.

Thưa quý độc giả, kết quả là không ngẫu nhiên.

Tín dụng hình ảnh: ngữ pháp

Cả ba mô hình được thử nghiệm đều có con số “yêu thích” sẽ luôn là câu trả lời của họ khi được đặt ở chế độ xác định nhất, nhưng xuất hiện thường xuyên nhất ngay cả ở “nhiệt độ” cao hơn, làm tăng tính biến thiên trong kết quả của chúng.

GPT-3.5 Turbo của OpenAI thực sự thích 47. Trước đây, nó thích 42 – một con số nổi tiếng, tất nhiên, bởi Douglas Adams trong The Hitchhiker's Guide to the Galaxy như câu trả lời cho cuộc sống, vũ trụ và mọi thứ.

Claude 3 Haiku của Anthropic chọn 42. Và Song Tử thích 72.

Thú vị hơn, cả ba mô hình đều thể hiện sự thiên vị giống con người trong những con số họ chọn, ngay cả ở nhiệt độ cao.

Tất cả đều có xu hướng tránh những con số thấp và cao; Claude chưa bao giờ vượt quá 87 hoặc dưới 27, và thậm chí đó cũng là những trường hợp ngoại lệ. Hai chữ số đã được tránh một cách cẩn thận: không có số 33, 55 hoặc 66, nhưng 77 xuất hiện (kết thúc bằng 7). Hầu như không có số tròn – mặc dù Song Tử đã từng làm vậy, ở nhiệt độ cao nhất, trở nên điên cuồng và chọn số 0.

Tại sao điều này nên được? AI không phải là con người! Tại sao họ lại quan tâm đến những gì “có vẻ” ngẫu nhiên? Cuối cùng họ đã đạt được ý thức chưa và đây là cách họ thể hiện điều đó?!

Không. Câu trả lời, như thường lệ với những trường hợp này, là chúng ta đang nhân cách hóa một bước đi quá xa. Những mô hình này không quan tâm đến điều gì là ngẫu nhiên và điều gì không. Họ không biết “ngẫu nhiên” là gì! Họ trả lời câu hỏi này giống như cách họ trả lời tất cả những câu hỏi còn lại: bằng cách xem dữ liệu đào tạo của họ và lặp lại những gì thường được viết nhất sau một câu hỏi giống như “chọn một số ngẫu nhiên”. Nó càng xuất hiện thường xuyên thì mô hình càng lặp lại thường xuyên.

Họ sẽ thấy con số 100 ở đâu trong dữ liệu đào tạo nếu hầu như không có ai phản hồi theo cách đó? Đối với tất cả những gì mô hình AI biết, 100 không phải là câu trả lời có thể chấp nhận được cho câu hỏi đó. Không có khả năng suy luận thực sự và không hiểu gì về các con số, nó chỉ có thể trả lời giống như con vẹt ngẫu nhiên.

Đó là một bài học khách quan về thói quen LLM và tính nhân văn mà chúng có thể thể hiện. Trong mọi tương tác với các hệ thống này, người ta phải nhớ rằng chúng đã được đào tạo để hành động theo cách mọi người làm, ngay cả khi đó không phải là mục đích. Đó là lý do tại sao việc giả danh rất khó tránh hoặc ngăn chặn.

Tôi đã viết trong tiêu đề rằng những người mẫu này “nghĩ rằng họ là con người”, nhưng điều đó hơi gây hiểu nhầm. Họ không nghĩ gì cả. Nhưng trong những phản ứng của họ, vào mọi lúc, họ bắt chước mọi người mà không cần phải biết hay suy nghĩ gì cả. Cho dù bạn yêu cầu nó về công thức món salad đậu xanh, lời khuyên đầu tư hay một con số ngẫu nhiên thì quy trình đều giống nhau. Các kết quả mang lại cảm giác giống con người vì chúng là con người, được rút ra trực tiếp từ nội dung do con người tạo ra và được phối lại — để thuận tiện cho bạn và tất nhiên là lợi ích cuối cùng của AI lớn.