数据治理做不对,AIGC落地就是“空中楼阁”

责任编辑:lijing

作者:赵立京

2025-06-16 17:17:50

来源:企业网D1Net

原创

数据治理是个宏大的话题,就像下水道工程,做了可能大家没太多直观感受。我的结论是“急用先行,以用促治”,只有业务因数据问题感到“痛”了,才会意识到数据的重要性,这样的治理才最具实际效果。

企业网D1net  由国内头部to B IT门户企业网D1net与信众智(CIO智力输出及社交平台)联合主办的2025全国CIO大会于近日在西安盛大闭幕。在一系列精彩的干货分享之后,以“AI落地有哪些坑?”为主题的大型圆桌讨论最后压轴出场。本文为圆桌讨论的第二部分—数据治理和AIGC落地之间的关系。

圆桌讨论由企业网D1net CEO范脡主持,参与讨论的嘉宾包括:

万华化学数智化部总经理徐建光

安东石油集团CIO兼AI研究院院长 许晓男

王老吉药业CIO、AI实验室主任 单露

海大集团流程与信息中心总监胡水平

中国医药工业研究总院信息部主任邹晓涛

瑞幸咖啡高级技术总监黄强元

公牛集团CIO 李胜彬

晨光稀土内控质量信息总监陈燕

红豆集团CIO 奚峰

红豆集团奚峰: 当下数字化时代,我认为数据治理必须做,它是企业数字化的基础。企业缺数据时,可引入外部数据,但得先做好数据清洗,按场景构建数据集。

当下,要利用好内外部资源,先做好手头事,也为未来做规划。企业数据分散成“孤岛”,虽难彻底消除,但要想办法打通,整合成数据集,后续才能挖掘分析数据,助力决策。

未来,数据不断积累,模型会更成熟,为企业带来更高效率、更准决策和更大发展空间。数据治理要一步步来,让数据成企业发展动力。

晨光稀土陈燕:我们公司因行业限制,业务只能私有化部署,每天产生 1.5 - 2T 的业务数据。AI 还没有兴起时,我们虽然有数据中台等,但因为没有 AI 应用需求,缺乏危机感,所以没意识到数据治理的重要性。我认为数据需要从源头把控,推动标准化填写,避免影响后续运用。如今,如何解决数据管理问题、找到更好办法和工具,成了我们的困惑,希望能向同行取经。

目前我司数据治理已提上日程,我们开始行动并接触专家、第三方。

公牛集团李胜彬:AI没有兴起时,基础数据(主数据)治理很关键,目的是统一标准。物料等各类主数据和技术数据都得标准化,这是 IT 集成的基础,不然系统建不起来。

2017 - 2018 年兴起的数据中台属于应用数据,核心是业务指标即 KPI,体现在从集团到各层级的报表上,统一报表口径也是数据治理。很多人报表乱,就是数据没治理好。

数据治理并非做所有事都非得先做,但要是想在特定领域推进工作,比如搭建知识库这类涉及数据库的工作,相关数据治理肯定得跟上。

瑞幸咖啡黄强元:数据治理对 AI 应用效果最大化十分必要,其重要性不言而喻。不过,数据治理是否为前提条件,还得看具体场景,大致可分为两类。

第一类场景中,数据治理是必要条件。在零售业务里,像自动用户运营或活动运营场景,构建 AI 模型时,用户的消费习惯、画像、操作行为以及产品信息等数据至关重要。数据质量越高,模型效果就越好。同样,门店订货、选址等环节也高度依赖高质量数据。

但也有另一类场景,数据治理并非必选前提。比如,我们周一在小程序和 APP 上线了数字人,能为用户推荐商品、聊天,甚至协助完成订单交易全链路。在这个场景里,不需要大量数据治理,只要与流程相关的数据准确即可。类似地,数字人面试、招聘和导购等场景,对数据治理或大量数据治理的需求也不一定是必要前提。

中国医药工业研究总院邹晓涛:数据治理不仅是 AI 应用前提,更是企业数字化重要基础。

以旗下药厂为例,药厂有多条生产线。之前上线 ERP 系统,但因按无限产能设计,数据多用于财务,无法反馈实际生产。引入类似 APS 自动排产系统后,才发现之前数据治理问题多,排产与物料需求不符,经营部门得重新标定数据,可见数据治理需在使用中不断完善,此时的数据才准确。

在研发端的靶点选择上,我们和下属信息中心合作,已建成全国最全儿科药数据大典,并上报了工信部。药物早研方面,我们以项目形式建立数据体系,通过实验室电子实验记录本,让五大中心和 7 个 PI 按照一定规则和要求填写数据。不过,这项工作推进艰难,科学家们个性较强,难以强制要求,只能借助各中心负责人和 PI 协商,逐步实现数据标准化。目前,我们正在一两个中心进行试点,先推行电子实验记录本,对这部分数据进行标准化处理。

海大集团胡水平:数据治理是个宏大的话题,就像下水道工程,做了可能大家没太多直观感受。我的结论是“急用先行,以用促治”,只有业务因数据问题感到“痛”了,才会意识到数据的重要性,这样的治理才最具实际效果。

今年我们通过一系列举措,让业务一把手深刻感受到数据的价值,并借此建立相关机制。在数据责任方面,我们明确“谁录数谁负责”,让业务管理者认识到数据管理本就是业务分内之事。

在这个过程中,IT 部门也有其职责。对于数据,非结构化数据首先要实现“在线”,我们借助某个平台,将所有知识和文档归类,形成知识库,每个责任单元都要在线管理,不能再各自为政。这一工作首先落实到业务单位和责任人。

对于结构化数据,我们通过项目使用数据来倒逼数据治理。梳理清楚数据后,让业务管理者能及时查看数据,及时发现问题并推动解决。

王老吉药业单露:数据天然有缺陷,它是长期积累形成的,像我们公司有近 200 年历史数据,用当下标准衡量,历史数据瑕疵多很正常。

数据要不要治理?我认为可以先存着,等有需要时再治理。即先存储数据,出现对企业运营重要的应用场景时,再治理该场景所需数据。

数据治理方式多样:数据积累时严格收集要求;清洗规范现有数据;采购所需数据;必要时加工数据。所以,数据治理要围绕业务场景,以此驱动采取不同治理方式。

安东石油许晓男:从 AI 实验和经营管理实践看,数据对 AI 极为关键。去年我们上线 chat BI,它以问答形式让领导快速从海量报表找关键数据,上线一年使用量和准确率都高,为数据治理打好了基础。

但生产数据治理曾是短板,我们日产数据近 2T,前期缺乏有效治理。AI 时代到来,业务建设预算必须包含数据相关内容,立项预算要“以用促变”。

另外,应用建设前可提前规划,明确数据资产目录、管理体系及各类数据规则,即便数据未产生,也要按管理体系初步治理,避免应用建成后因数据混乱而影响使用。

万华化学徐建光:我认为在数据质量不佳、治理未完善时,也要坚定推进 AI 应用,借助其反向提升数据质量,以下有两个案例。

做材料大模型时,我们整理了大量产品知识。各事业部负责人原以为自家对产品归纳完善,可看到知识库后大感意外,这促使他们完善数据。

在研发场景中,不同课题组数据情况不同,有的需要外部文献数据,有的自身实验数据不规范。各课题组需求各异,通过 AI 应用牵引,我们能找准数据治理关键点,推动数据质量提升和整体数据治理工作。

第三个话题--算力自建还是租用

安东石油许晓男:判断项目用自持还是租用资源,需综合考量。先看项目性质与需求,若项目是长期投资且过了试错期,自持资源更稳;若项目具实验性、临时性或处于推理训练阶段,需求灵活,则租用资源更佳。

此外,资金来源影响投入方式,信息安全要求也至关重要。数据安全要求高的项目,自持在管控上有优势;要求宽松的,租用成本和灵活性更佳。综合多方面因素,才能合理决策。

海大集团胡水平:企业选资源自建还是租赁,可从三方面考量:

一是预算,预算不足就别想自建,租赁更实际。

二是信息安全要求,不同业务需求不同,决策时要考虑。

三是业务性质,若业务创新、临时或尝试阶段,租赁快捷高效;若业务稳定、需长期保密或运营,自建更合适。综合考虑,做出合理决策。

企业网D1net 范脡:如今,AI成了众人热议的焦点。不谈AI,仿佛都跟不上潮流,无论甲方乙方皆是如此。

今天我们探讨AI领域的“坑”,目的是帮大家避开陷阱,充分享受AIGC带来的美好世界。实际上,AI存在不少有价值的应用场景。比如:风电入网价格在不同时段有差异。以往发电入网比较随意,现在借助AI能精准计算何时进多少电效益最高,效果立竿见影。

再比如供应链行业,早期调度依赖人工的经验,后来有了数据支撑,优化效果显著提升。而有了AIGC,优化效率进一步提高,效益显著。

关于AI应用,没有标准答案。今天我们展开探讨,就是希望能为大家提供有益的探索思路,让大家少走弯路,少交学费。

关于企业网D1net(www.d1net.com):

国内头部to B IT门户,同时在运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个IT行业公众号(微信搜索D1net即可关注)。

大中型CIO活动预告(详情请联系D1net相关同事):

2025年央国企CIO及数科公司高管年会(夏) 8月9日 北京

2025汽车业数字化大会 9月12日 华东

2025制造业数字化大会 9月13日 华东

2025全国甲方IT选型大会 11月14日-15日 华东

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号