Lyft 的数据处理问题如何成为 Final 的基础
当EventualFounders Sammy Sidhu和Jay Chia在Lyft的自动驾驶汽车计划中担任软件工程师时,他们目睹了一个酿造的数据基础设施问题,这只会随着AI的兴起而变得更大。 自动驾驶汽车从3D扫描和照片到文本和音频产生大量的非结构化数据。 Lyft工程师没有一个工具可以同时理解和处理所有这些不同类型的数据,也可以在一个地方使用。 这剩下工程师在漫长的过程中拼凑开源工具,并具有可靠性问题。 “我们拥有所有这些出色的博士学位,整个行业中出色的人,从事自动驾驶汽车,但他们花费了大约80%的时间在基础设施上工作,而不是建立核心应用程序,”最终的首席执行官Sidhu在最近的一次采访中告诉TechCrunch。 “他们面临的大多数问题都是围绕数据基础设施。” sidhu和chia帮助了为LYFT构建内部多模式数据处理工具。 当西杜(Sidhu)着手向其他工作申请时,他发现面试官一直询问他可能会为他们的公司建立相同的数据解决方案,而最终的想法诞生了。 最终构建了一个名为DAFT的Python-native开源数据处理引擎,该引擎旨在快速跨文本到音频和视频等不同方式工作。 西杜说,目标是使daft变革SQL作为SQL的非结构化数据基础结构过去是表格数据集。 该公司成立于2022年初,即在Chatgpt释放前一年,并且在许多人意识到这一数据基础设施差距之前。 他们于2022年推出了DAFT的第一个开源版本,并正在准备在第三季度推出企业产品。 “ Chatgpt的爆炸,我们看到的只是许多其他人,他们正在构建具有不同类型的AI应用程序Sidhu说。“然后每个人都开始在其应用程序中使用图像,文档和视频之类的东西。 这就是我们看到的用法[大大增加]。” 虽然建筑物的最初想法源于自动驾驶汽车空间,但还有许多其他行业处理多模式的数据,包括机器人技术,零售技术和医疗保健。顾客。 最终最近在八个月内筹集了两轮资金。 首先是由CRV领导的750万美元种子回合。 最近,该公司筹集了由费利西斯(Felicis)领导的2000万美元的A系列赛,并从微软的M12和花旗参与其中。 这一轮将用于批量最终的开源产品,并创建一种商业产品,该产品将使客户可以通过此处理后的数据构建AI应用程序。 astasia myers,一个Felicis的普通合伙人告诉TechCrunch,她通过市场映射练习发现了最终,其中涉及寻找数据基础架构,这些数据基础架构将能够支持越来越多的多模式AI模型。 Myers说,最终是在该领域的第一个推动者(可能会变得更加拥挤)而脱颖而出,并且基于创始人亲自处理了这一数据处理问题的事实。 她补充说,最终也正在解决日益增长的问题。 根据管理咨询公司MarketsandSarkets的数据,预计多模式AI行业将在2023年和2028年之间以A35%的复合年增长率增长。 “在过去的20年中,年度数据生成增长了1,000倍,在过去的两年中,世界数据的90%是生成的,据IDC称,绝大多数数据是非结构化的,”迈尔斯说。 “ Daft适合围绕文本,图像,视频和声音构建生成AI的巨大宏观趋势。您需要一个多模式本地数据处理引擎。”