Pinecone, công ty khởi nghiệp cơ sở dữ liệu vector được thành lập bởi Edo Liberty, cựu giám đốc Phòng thí nghiệm AI của Amazon, từ lâu đã đi đầu trong việc giúp các doanh nghiệp tăng cường các mô hình ngôn ngữ lớn (LLM) bằng dữ liệu của riêng họ. Tuy nhiên, gần đây nhất, công ty đã tái cấu trúc hoàn toàn sản phẩm của mình để ra mắt Pinecone Serverless, giúp khách hàng không phải suy nghĩ về việc quản lý hoạt động triển khai và mở rộng quy mô của chúng. Ngày nay, Pinecone serverless đã ra mắt phiên bản beta và hiện đã có sẵn rộng rãi.
Liberty lưu ý rằng những khách hàng ban đầu của công ty hiện đang chuyển từ thử nghiệm AI sáng tạo sang muốn tung ra các sản phẩm AI của riêng họ. Công ty đã theo dõi các doanh nghiệp vật lộn với sự phức tạp của việc xây dựng các ứng dụng mới đồng thời tìm ra cách đưa chúng vào sản xuất một cách tốt nhất.
“Làn sóng tương tự đầu tiên của các ứng dụng cấp sản xuất đang tấn công thị trường hiện nay và trong vòng sáu đến chín tháng tới. Điều mà hơn 5.000 khách hàng của chúng tôi đã nói rõ ràng với chúng tôi là họ cần một công cụ chuyên dụng, tối ưu hóa, chuyên dụng cực kỳ hiệu quả trong việc thực hiện tìm kiếm vectơ, thực hiện RAG, trích xuất kiến thức và tạo ngữ cảnh cho các mô hình ngôn ngữ này. Điều họ thực sự muốn nói là: này, tôi cần quy mô, tôi cần hiệu suất và tôi cần chi phí sao cho tôi có thể suy luận về sản phẩm mà tôi đang xây dựng.”
Liberty nhấn mạnh rằng Pinecone đã dành rất nhiều thời gian để chuẩn bị sản phẩm sẵn sàng cho việc triển khai sản xuất — đồng thời làm cho sản phẩm có giá cả phải chăng hơn đáng kể. Công ty thực sự tin rằng những khách hàng sử dụng Pinecone serverless có thể giảm chi phí lên tới 50 lần, một phần là do nhóm đã thiết kế lại hệ thống để trở thành một dịch vụ nhiều người thuê giúp tách riêng bộ nhớ và tính toán. Cùng với đó, khách hàng của Pinecone chỉ trả tiền khi họ thực sự tiêu tốn thời gian của CPU, với việc công ty điều phối công suất ở phần phụ trợ.
“Bởi vì chúng tôi vận hành mọi thứ như một dịch vụ nên khả năng sắp xếp tất cả những điều đó giúp chúng tôi có thể tính phí mọi người theo chính xác những gì họ sử dụng — chứ không tính thêm gì nữa. Điều đó cực kỳ hiếm và cực kỳ khó thực hiện”, Liberty nói.
Trong buổi xem trước công khai, khách hàng của Pinecone cũng yêu cầu một số tính năng bổ sung. Một trong số đó là Điểm cuối riêng tư, sẽ ra mắt ở dạng bản xem trước công khai ngày hôm nay. Điều này cho phép doanh nghiệp tạo kết nối trực tiếp tới đám mây riêng ảo của họ trên Amazon thông qua AWS PrivateLink, không tiết lộ dữ liệu của họ trên Internet công cộng để đảm bảo dữ liệu luôn hoạt động tốt trong các chế độ quản trị và tuân thủ khác nhau mà công ty có thể phải tuân thủ. .
Một số công ty đã sử dụng Pinecone serverless bao gồm Gong, Help Scout, New Relic, Notion, TaskUS và You.com.
“Notion đang dẫn đầu cuộc cách mạng năng suất AI,” đồng sáng lập Notion và COO Akshay Kothari cho biết. “Việc ra mắt tính năng AI đầu tiên trên thị trường của chúng tôi đã được thực hiện nhờ Pinecone serverless. Công nghệ của họ cho phép AI Hỏi & Đáp của chúng tôi đưa ra câu trả lời tức thì cho hàng triệu người dùng, được lấy từ hàng tỷ tài liệu. Trên hết, việc chúng tôi chuyển sang kiến trúc mới nhất của họ đã cắt giảm 60% chi phí, thúc đẩy sứ mệnh của chúng tôi là làm cho công cụ phần mềm trở nên phổ biến.”