Retell AI cho phép các công ty xây dựng 'đại lý giọng nói' để trả lời các cuộc gọi điện thoại

Retell AI cho phép các công ty xây dựng 'đại lý giọng nói' để trả lời các cuộc gọi điện thoại

Các trung tâm cuộc gọi đang áp dụng tự động hóa. Có tranh luận về việc liệu đó có phải là điều tốt hay không, nhưng nó đang xảy ra – và có thể đang tăng tốc.

Theo công ty nghiên cứu TechSci Research, thị trường toàn cầu cho AI của trung tâm liên lạc có thể tăng lên gần 3 tỷ USD vào năm 2028, từ mức 2,4 tỷ USD vào năm 2022. Trong khi đó, một cuộc khảo sát gần đây cho thấy khoảng một nửa số trung tâm liên lạc có kế hoạch áp dụng một số dạng AI trong năm sau.

Động lực khá rõ ràng: Các trung tâm cuộc gọi đang tìm cách giảm chi phí đồng thời mở rộng quy mô hoạt động của họ.

Doanh nhân Evie Wang nói với TechCrunch: “Các công ty có hoạt động trung tâm cuộc gọi lớn đang tìm cách mở rộng quy mô nhanh chóng mà không bị ràng buộc bởi các nhân viên trung tâm liên lạc của con người, rất dễ tiếp thu các giải pháp trợ lý giọng nói AI hiệu quả”. “Cách tiếp cận này không chỉ làm giảm chi phí chung mà còn giảm thời gian chờ đợi.”

Wang là một trong những người đồng sáng lập của Retell AI, công ty cung cấp nền tảng mà các công ty có thể sử dụng để tạo ra các “đại lý giọng nói” được hỗ trợ bởi AI để trả lời các cuộc gọi điện thoại của khách hàng và thực hiện các tác vụ cơ bản như lên lịch các cuộc hẹn. Nhân viên hỗ trợ của Retell được hỗ trợ bởi sự kết hợp của các mô hình ngôn ngữ lớn (LLM) được tinh chỉnh cho các trường hợp sử dụng dịch vụ khách hàng và mô hình giọng nói chuyển giọng nói thành văn bản do LLM tạo ra.

Khách hàng của Retell bao gồm một số nhà điều hành trung tâm liên lạc cũng như các doanh nghiệp vừa và nhỏ thường xuyên xử lý số lượng cuộc gọi lớn, như công ty telehealth Ro. Họ có thể xây dựng tác nhân thoại bằng cách sử dụng công cụ mã thấp của nền tảng hoặc họ có thể tải lên LLM tùy chỉnh (ví dụ: mô hình mở như Llama 3 của Meta) để điều chỉnh thêm trải nghiệm.

Wang cho biết: “Chúng tôi đầu tư rất nhiều vào trải nghiệm trò chuyện bằng giọng nói vì chúng tôi coi đó là khía cạnh quan trọng nhất của trải nghiệm trợ lý giọng nói AI”. “Chúng tôi không xem tác nhân giọng nói AI chỉ là đồ chơi mà người ta có thể tạo ra bằng một vài dòng lời nhắc mà là công cụ có thể mang lại giá trị đáng kể cho doanh nghiệp và thay thế các quy trình công việc phức tạp.”

Retell hoạt động đủ tốt trong thử nghiệm ngắn gọn của tôi, ít nhất là về mặt đối mặt với cuộc gọi.

Tôi đã sắp xếp một cuộc gọi với bot Retell bằng mẫu demo trên trang web của Retell. Robot hướng dẫn tôi quy trình lên lịch hẹn với một nha sĩ giả định, đặt các câu hỏi như ngày giờ ưa thích của tôi, số điện thoại, v.v.

Tôi không thể nói giọng nói tổng hợp của bot là giọng nói hay nhất mà tôi từng nghe xét về mặt hiện thực – chắc chắn không ngang bằng với API chuyển văn bản thành giọng nói của Eleven Labs hoặc OpenAI. Wang, để bảo vệ Retell, nói rằng nhóm chủ yếu tập trung vào việc giảm độ trễ và xử lý các trường hợp khó khăn, chẳng hạn như sự gián đoạn có thể xảy ra trong một cuộc trò chuyện.

Độ trễ thấp: Trong thử nghiệm của tôi, bot phản hồi khá nhiều mà không do dự với các câu trả lời và câu hỏi tiếp theo của tôi. Và nó bị mắc kẹt với kịch bản của nó. Cố gắng hết sức có thể, tôi không thể nhầm lẫn nó hoặc nhắc nó hành xử theo cách không nên làm. (Khi tôi hỏi bot về hồ sơ nha khoa của mình, nó nhất quyết yêu cầu tôi phải nói chuyện với người quản lý văn phòng.)

Vậy các nền tảng như Retell có phải là tương lai của các trung tâm cuộc gọi không?

Có lẽ. Đối với các nhiệm vụ cơ bản như lên lịch cuộc hẹn, tự động hóa rất có ý nghĩa, đó có thể là lý do tại sao cả các công ty khởi nghiệp và các công ty công nghệ lớn đều đưa ra các giải pháp cạnh tranh trực tiếp với Retell. (Xem Parloa, PolyAI, AI của Trung tâm liên hệ của Google Cloud, v.v.)

Đó là kết quả dễ dàng – và dường như tạo ra doanh thu -. Retell tuyên bố có hàng trăm khách hàng, tất cả đều trả tiền cho mỗi phút trò chuyện với nhân viên thoại. Retell đã huy động được tổng số vốn 4,53 triệu USD cho đến nay nhờ sự hỗ trợ của những người ủng hộ bao gồm Y Combinator (nơi công ty được ươm tạo).

Nhưng bồi thẩm đoàn không đưa ra các truy vấn phức tạp hơn, đặc biệt là do LLM có xu hướng bịa đặt sự thật và đi chệch hướng ngay cả khi đã áp dụng các biện pháp bảo vệ.

Khi tham vọng của Retell ngày càng tăng, tôi tò mò muốn biết công ty giải quyết nhiều thách thức kỹ thuật đã tồn tại lâu dài trong không gian như thế nào. Ít nhất, Wang có vẻ tin tưởng vào cách tiếp cận của Retell.

Wang cho biết: “Với sự ra đời của LLM và những đột phá gần đây trong việc tổng hợp giọng nói, AI đàm thoại đang trở nên đủ tốt để tạo ra những trường hợp sử dụng thực sự thú vị”. “Ví dụ: với độ trễ dưới một giây và khả năng làm gián đoạn AI, chúng tôi đã quan sát thấy người dùng nói những câu đầy đủ hơn và trò chuyện như họ nói với người khác. Chúng tôi đang cố gắng giúp các nhà phát triển dễ dàng xây dựng, thử nghiệm, triển khai và giám sát các tác nhân thoại AI, cuối cùng là giúp họ đạt được trạng thái sẵn sàng sản xuất.”