Tại Lyft, việc xử lý dữ liệu từ chương trình xe tự lái đã đặt ra nhiều thách thức do tính đa dạng và thiếu cấu trúc của dữ liệu. Các kỹ sư phải đối mặt với sự không ổn định và tốn thời gian trong quản lý hệ thống khi sử dụng nhiều công cụ open-source rời rạc. Từ đó, một công cụ xử lý dữ liệu nội bộ ra đời, không chỉ giải quyết vấn đề của Lyft mà còn mở đường cho Eventual, tạo ra bước ngoặt trong cách tiếp cận dữ liệu đa phương thức.
Những điểm chính
- Lyft gặp khó khăn xử lý dữ liệu đa phương thức như 3D scans, hình ảnh, âm thanh và văn bản trên nhiều công cụ rời rạc.
- Kỹ sư Lyft phát triển công cụ nội bộ tích hợp xử lý đa loại dữ liệu trong một nền tảng duy nhất.
- Nhu cầu giải pháp đồng nhất xử lý dữ liệu đa phương thức lớn hơn phạm vi Lyft, mở ra cơ hội thị trường rộng.
- Công cụ nội bộ Lyft trở thành nền tảng cho Eventual phát triển Daft, engine xử lý dữ liệu đa phương thức mã nguồn mở.
- Eventual tận dụng kinh nghiệm Lyft để tạo sản phẩm đáp ứng nhu cầu đa ngành, khẳng định vị thế dẫn đầu trong AI đa phương thức.
Lyft đối mặt với thách thức lớn trong việc xử lý khối lượng dữ liệu đa dạng và phi cấu trúc từ chương trình xe tự hành, bao gồm 3D scans, hình ảnh, văn bản và âm thanh. Không có công cụ nào hiện có có thể xử lý đồng thời nhiều loại dữ liệu này trong cùng một nền tảng, khiến các kỹ sư phải sử dụng nhiều công cụ mã nguồn mở rời rạc, dẫn đến sự không ổn định và tốn nhiều thời gian cho việc quản lý hạ tầng thay vì phát triển ứng dụng cốt lõi. Tình trạng này phổ biến trong ngành, ngay cả với những chuyên gia có kỹ năng cao, làm nổi bật nhu cầu cấp thiết về một giải pháp xử lý dữ liệu đa phương thức hiệu quả hơn.
Trước thực trạng đó, Sidhu và Chia tại Lyft đã phát triển một công cụ nội bộ nhằm xử lý đa phương thức dữ liệu, giúp tích hợp và phân tích dữ liệu 3D, hình ảnh, âm thanh và văn bản trong một nền tảng duy nhất. Kinh nghiệm phỏng vấn và khảo sát thị trường cho thấy nhu cầu tương tự tồn tại rộng rãi trong nhiều công ty, tạo tiền đề cho việc thành lập Eventual nhằm lấp đầy khoảng trống trong hạ tầng dữ liệu này. Được thiết kế như một engine xử lý dữ liệu mã nguồn mở, Python-native, Daft nhanh chóng trở thành công cụ ưu việt cho việc xử lý dữ liệu đa phương thức, đáp ứng hiệu quả các yêu cầu phức tạp từ nhiều lĩnh vực.
Eventual ra mắt phiên bản Daft đầu tiên vào năm 2022, trước cả khi ChatGPT bùng nổ và sự nhận thức về các vấn đề hạ tầng dữ liệu trở nên rõ ràng hơn. Sau đó, nhu cầu cho các ứng dụng đa phương thức tăng nhanh, với nhiều ngành công nghiệp như robotics, retail tech và healthcare áp dụng Daft để xử lý dữ liệu phức tạp. Các khách hàng lớn như Amazon, CloudKitchens và Together AI đã tin tưởng sử dụng sản phẩm này, góp phần thúc đẩy sự phát triển của Eventual.
Sự thành công này giúp Eventual huy động được tổng cộng 27,5 triệu đô la qua các vòng gọi vốn, tập trung nâng cao sản phẩm mã nguồn mở và phát triển giải pháp thương mại nhằm hỗ trợ khách hàng xây dựng các ứng dụng AI dựa trên dữ liệu đa phương thức. Daft không chỉ đáp ứng nhu cầu hiện tại mà còn phù hợp với xu hướng phát triển của ngành AI đa phương thức, dự kiến tăng trưởng mạnh trong những năm tới. Việc tạo ra một engine xử lý dữ liệu đa phương thức bản địa đã trở thành bước đi chiến lược, giúp Eventual dẫn đầu trong lĩnh vực này.