万亿级AI难题:Snowflake、Tableau与BlackRock为何公开其数据核心机密

责任编辑:cres

作者:Michael

2025-09-24 14:42:02

来源:企业网D1Net

原创

AI的最大绊脚石并非算法,而是数据定义混乱。Snowflake、Salesforce、dbt Labs等十多家科技巨头携手推出开放语义交换(OSI)计划,欲建立首个供应商中立的语义元数据标准。

Snowflake、Salesforce、dbt Labs以及另外十几家科技公司于周二宣布,将共同制定一项通用标准,用于定义企业数据并实现跨平台共享,以此解决企业高管口中AI面临的最根本瓶颈问题。

开放语义交换(Open Semantic Interchange,简称OSI)计划集结了原本竞争激烈的企业,这些企业一致认为,企业系统间数据定义不一致阻碍了AI的规模化应用。该计划得到了贝莱德(BlackRock)的支持,Alation、Atlan、Blue Yonder、Cube、Hex、Honeydew、Mistral AI、Omni、RelationalAI、Select Star、Sigma和ThoughtSpot等公司也参与其中。他们将共同制定首个供应商中立的语义元数据规范,这堪称是企业数据的“罗塞塔石碑”(Rosetta Stone,指破解关键难题的钥匙)。

“我们不是要锁住数据,而是要让数据更易获取、更有价值,”Snowflake产品执行副总裁Christian Kleinerman在接受采访时表示,“我们的客户在实现AI投资回报率时面临的最大障碍并非竞争对手,而是数据碎片化问题。”

销售与市场部门对“客户”定义不一,AI模型就会失效

该计划旨在解决自商业计算诞生以来就一直困扰企业的难题,而这一难题如今正威胁着AI的推广应用:每个软件系统对业务指标的定义都不尽相同。例如,零售商的销售平台可能将“活跃客户”定义为过去90天内购买过的客户,而其营销系统则将该术语定义为过去一个月内与内容有过互动的任何人。基于这两个系统训练的AI模型会得出不可靠的预测结果,进而破坏人们对AI生成洞察的信任。

“试想一下,企业训练AI模型来预测客户流失率等指标,”Kleinerman解释道,“当AI模型从这两个[定义不同的]系统中提取数据时,最终会得到相互矛盾的定义。这种不一致性降低了AI的准确性,也加大了其规模化应用的难度。”

这种语义混乱给企业造成了数百万美元的损失。数据和AI团队在AI项目启动前,要花费数周时间来协调相互矛盾的定义并重新格式化数据,这推高了运营成本,也延误了AI应用的上市时间。许多企业发现,AI作为生产力倍增器的潜力,被准备不一致数据所需的人工劳动所抵消。

Tableau与Snowflake搁置竞争,携手修复数据生态系统

此次合作打破了企业软件领域传统的竞争态势。Salesforce旗下直接与多家OSI参与方竞争的商业智能部门Tableau,与Snowflake共同牵头了这项计划。

“这项计划具有变革性,因为它并非由某一家公司主导标准制定,而是整个行业携手合作,”Tableau首席产品官Southard Jones在接受采访时表示,“AI的未来取决于信任,而信任始于一致、可靠的数据。”

Jones透露,Tableau将贡献其供应商中立语义层的蓝图,该蓝图基于数十年来开发商业智能工具的经验。“我们的工作一直致力于为数据赋予明确的业务含义,即以企业内所有人都能信任的方式定义指标、业务逻辑和上下文。借助OSI,我们将把这些知识编纂成一项开放标准。”

选择采取开放、协作的方式,这表明专有语义标准已宣告失败。Kleinerman指出:“其独特之处在于,它专注于基于SQL的分析模型,并纳入了AI特有的元数据,如自定义指令和同义词。”而现有的元数据标准,如资源描述框架(Resource Description Framework,简称RDF)和Web本体语言(Web Ontology Language,简称OWL),缺乏现代AI应用所需的编译引擎。

技术蓝图承诺与现有工具实现即时兼容

OSI针对的是语义层,即数据的业务含义,而不仅仅是其技术属性。该规范使用YAML文件定义,可与dbt的语义层等现有工具实现即时兼容。

“我们将几乎立即提供支持,”dbt Labs首席产品官Ryan Segar表示,“数据和分析工程师现在可以放心地开展工作,因为他们知道自己的工作成果可在整个数据生态系统中得到利用。重复工作和返工将成为过去。”

该标准纳入了AI特有的功能,如自然语言同义词和业务术语。“如今,AI模型常常被迫从原始元数据中推断关系,这可能导致误解和输出不准确,”ThoughtSpot产品管理高级副总裁Francois Lopitaux在接受采访时解释道,“通过提供一项通用、开放的标准,OSI将为智能体(包括我们自己的Spotter)提供一种共同语言,以理解业务上下文。”

大型企业因AI投资因数据不佳而停滞,迫切需求解决方案

企业对AI能力的需求推动了OSI计划的紧迫性。Snowflake报告称,在2026财年第二季度,近半数新客户选择该平台是为了获取AI能力,每周有超过6100家客户使用其AI产品。在AI相关需求的推动下,该公司5月份季度营收首次突破10亿美元。

目前,已成立了一个专门的合作伙伴工作组来制定首个OSI规范,不过高管们拒绝提供具体的时间表。“客户对OSI的初步反馈极为积极,”Kleinerman表示,许多企业都表示希望尽早采用该标准。

贝莱德看到了该标准在金融服务领域的即时应用前景。“阿拉丁(Aladdin)平台通过公共和私人市场的通用数据语言,统一了投资管理流程,”贝莱德全球阿拉丁数据主管Diwakar Goel表示,“我们很高兴能参与开放语义交换计划,帮助制定一项通用的、供应商中立的规范,这不仅将简化数据交换,还将加速AI和商业智能应用在整个金融行业的推广应用。”

标准化数据定义将加剧而非削弱竞争

该计划将改变软件公司的竞争方式。高管们认为,标准化将加剧竞争,将竞争焦点从数据定义转向用户体验和AI能力的创新。

“标准化并非同质化,而是一种催化剂,”Jones辩称,“就像标准电源插座一样:插座本身并非创新所在,而是你能插上什么。我们的重点是成为你能连接到数据上的最智能、最直观、最强大的‘电器’。”

Tableau计划加速开发Jones所谓的“智能分析智能体”(agentic analytics),即能够揭示上下文、突出机遇、提示风险并提出后续建议的AI代理,而不仅仅是报告数字。“语义定义将AI代理从静态工具转变为分析伙伴。”他表示。

ThoughtSpot的Lopitaux对此表示赞同:“虽然OSI将为语义层制定一个与供应商无关的行业标准,但我们仍将在产品创新、整个平台的用户体验以及提供前所未有的客户价值方面展开竞争。”

行业押注合作而非控制,以赢得未来

OSI的成功取决于能否维持供应商中立的治理模式,考虑到参与公司的市场地位和战略利益各不相同,这无疑是一项挑战。“OSI的核心在于没有任何一家供应商能够控制它,”Kleinerman强调,“每个成员都负责维护自己的映射和集成,其价值来自于共享框架,而非任何一家公司的实施方式。”

企业客户将从中获得最大收益:AI部署速度加快、准确性提高,以及消除手动数据协调成本。企业可以在保持现有语义模型投资的同时,采用最佳技术,而无需牺牲一致性。

“当语义无处不在、唾手可得时,它们‘存储’的位置就变得不那么重要了,”dbt Labs的Segar指出,“在任何地方构建,在任何地方利用。”

科技行业已认定,要实现AI的承诺,就必须做出不同寻常的牺牲:放弃对业务数据定义方式的专有控制。在AI领域投入巨资的公司得出结论:在一个行之有效的系统中占据一席之地,胜过控制一个千疮百孔的系统。

“我们鼓励并欢迎更多公司加入,”Kleinerman表示,“因为参与的视角越多,标准就越强大、越中立。”

企业网D1net(www.d1net.com):

国内头部to B IT门户,旗下运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个IT行业公众号(微信搜索D1net即可关注)。

版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。

AI

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号