数据治理实战案例分享

责任编辑:cres

2019-12-09 19:35:57

来源:企业网D1Net

原创

中石化石化盈科数据部总经理蔡春久在2019能源行业CIO沙龙上的演讲。

2019年12月7日,由企业网D1Net、信众智CIO智力共享平台和中国企业数字化联盟联合主办的2019能源行业CIO沙龙于北京成功召开。工信部产业发展中心、中石油、中石化、中海油、国家电网、国家能源、中燃集团等单位的信息化领导及腾讯云、博云、MAXHUB、时速云等优秀的解决方案提供商出席了本次沙龙。
 
以下是现场速记。
 
中石化石化盈科数据部总经理蔡春久
 
蔡春久:各位专家、各位领导大家好,我用一个小时时间分享五个案例,我演讲题目是基于云物移大智链数据资产五个案例的分享。
 
我们做信息化有十多年了,数据是一门科学,数据是生产要素。过去十多年当中,我们在数据治理和数据资产领域关注程度是不够的,以工匠精神做数据,需要用工匠精神做好,所以要精于工、匠于心、品于行,用工匠精神才能把工作做好。
 
讲之前我简要介绍自己我是石化盈科对外服务的数据负责人,我前10年在ERP领域做,近十年一直在数据治理、数据仓库领域做服务。我主要介绍一下我在三个协会的情况,跟大家介绍一下。
 
第一个,国际数据协会,DAMA全球有10000多人非盈利机构,主要在数据管理领域。
 
第二,在中国信通院大数据协会里写了白皮书、国标。
 
第三,中电标协里做了一些工作。
 
在过去的十年当中,我是08年加入到石化盈科的,在中石化负责大概几年的数据治理的大的项目。从14年到现在大概做了80多家能源行业的企业,有三分之一的央企我参与项目建设,这里和我们相关的有南方电网、中国核工业等类似这样电力能源相关的企业。
 
这里80多个案例当中,其中有70%做过数据治理,做得不太好,我去接盘。其中有50%以上做过两次做得不太好,我过去接盘的,这里可见数据治理不好做,真的需要工匠精神才能做好。这是我做的客户情况。
 
因为我在国家层面也做了一些白皮书、国标相关。
 
《工业大数据白皮书》今年4月份发布出来的,是国内顶级数据专家共同写的白皮书。去年4月发布的《主数据管理实践白皮书》从1.0发布到4.0,下周发布《数据标准管理白皮书》,这是国内很多专家花一两年时间形成的,可以做参考。2012年和北京燃气合作,我们形成行业标准。这里有新奥燃气等,在物资编码做得蛮好的。
 
我们组织国内大概有30多个专家正在编写《工业企业大数据治理实践指南》,这本书明年4月份会发布出来,这是我本人在这个领域做的工作。
 
今天下午主要讲三方面内容:
 
第一,对数据资产管理的理解。这里主要是我们现在遇到的挑战,大型央企遇到的挑战和现状。
 
第二,标杆企业数据中台与数据资产实践案例分享。
 
某石化集团数据资产管理实践案例分享
 
某能源集团数据标准框架体系设计案例
 
某新电力集团数据资产绘画项目案例
 
某燃气集团数据中台平台建设案例
 
某电网平台的案例
 
第三,数据资产规划相关建议。
 
我们企业在数字运用、在平台、用应用方面遇到很多挑战,最大问题是多头填报、数据共享、数据服务、数据资产评估等方面都存在挑战。
 
第一方面,应用层面。用户无法想象大数据能带来什么,无法提出准确的需求,错失很作良机。报表比较死板,不能很好的即兴、即时展现。
 
第二方面,数据层面。表现严重是数据孤岛比较多,看不见拿不到,无法在线应用。
 
第三方面,平台层面。老平台无法支持新应用,工具困乏。我们处理海量数据,需要进一步去加强。我们数据安全和隐私方面需要进一步提升。
 
在数据管理领域面临四个困难:
 
第一,数据孤岛比较多,有数不能用。这里面主要体现三个方面,不愿意共享、不敢共享、不能共享。
 
第二,数据质量不高,有数不好用。缺乏统一的数据治理体系,数据采集、存储、处理等环节可能不科学、不规范,老四数据错误、异常、确实等。
 
第三,融合应用困难,有数不会用。
 
第四,治理体系缺失,有数不善用。
 
这是我们总结目前国内很多大的企业在数据管理领域面临的一些难点。
 
我们前两周十九届四中全会这里面提了非常重要的字,数据是我们重要的生产要素,跟我们的资本、土地、知识、技术一样,这个报告里就几千字,这里加两个字加了数据,这是非常明显的风向标。
 
第二,数据必须要保护和开放共享的原则。我们现在数据对收集、采集、滥用方面存在很大问题。
 
第三,数据是作为无形资产列入会计目录,评估资产价值,投资转让、融资贷款等,这个已经是无形资产。
 
第四,数据作为生产要素在市场上流通,如何评估数据价值,如何评估数据成本,尤其我们个人数据和隐私方面也要不受到侵害,这是十九届四中全会这里谈到的数据,这里四次谈到数据,81次谈到治理,有国家治理、城市治理、企业治理。
 
另外再看看今年3月12日国资委发布的文,明确提到要推进数据资产的管理。这里有条件的企业成立独立的部门来管我们的数据。另外我们去年18年数据管理领域各个部委、各个协会,尤其像去年发布了国标DCMM数据管理深度评估模型,现在各个行业都在做。去年在金融行业,这里面发布了银行金融行业数据治理指引,在保险银行、证券引起轩然大波,金融行业是充分利用、高中季度行业,但是与指引有非常大的差距要走,包括卫健委、工业互联网。
 
去年我们成立了数据管理应用协会,这里面有华为、阿里包括石化盈科,在里面做四个峰会,在信通院发布了白皮书。
 
刚才从习主席到整个国资委到行业协会都纷纷的对数据资产、数据治理非常重视。
 
这里我们介绍什么是数据治理,什么是数据管理?前20年数据治理这个名词还在,主要做内部风控,防止一些财务做假帐,防止一些数据泄密等。第二个满足外部监管的要求像一些上市公司必须要符合法规,这是前20年狭义的数据治理。
 
现在的数据治理是广义的包含数据管理。这里又谈一个新的名词数据资产,我们在数据资产白皮书里是这样定义的,企业拥有由企业控制的,数据资产是能够给企业带来价值利益的。我们可以这样来理解,广义的数据治理可以约等于数据资产,因为数据治理有狭义和广义的,不同场合说治理有点混淆,所以说我们现在很多企业把数据资产进行管理。
 
数据资产在百度百科包括有数据资产、财务资产、房地产、实物资产。
 
数据资产的特征无形、数据资产不可替代、数据资产不可消耗(可复制、共享)、数据资产不会贬值。
 
我们有数据管理、数据资源管理、数据资产管理,在过去20年中有非常深刻的变化。数据管理从IT角度来看,主要充分有效的发挥数据作用的。
 
第二,数据资源管理,去寻找手段,以有效的控制数据资源及并提升数据资源的利用率。
 
数据资产管理是全新的资产形态,并能够以资产管理的标准和要求来加强相关体制和手段,从经济角度、满足对资产运营的各类管理要求。
 
关键变革包括基本认知的升级、管理领域的拓展、主体层次的提升。
 
我们看看数据资产里面发展有三个脉络,这里在通用框架里,我们在几十年都有ISO9000,包括全面的质量管理,这里都有数据管理。我们在单一领域体系像ISO8000有数据质量管理体系,我们在数据管理本身领域内,我们也有完整的理论,第一个是我们刚才建设的DMBOK数据知识管理体系,这是数据管理领域从业者的圣经,大家一定要仔细研究DMBOK2.0,另外是我们去年发布的国标。
 
我们在行业里有非常强的指导性,第一个是数据资产白皮书4.0,第二个是工业企业数据治理实践指南,第三个是金融行业实践框架,第四个是互联网行业实践框架。
 
首先介绍一下DMBOK2.0数据管理知识框架体系解读。这里是非常完整的,全球1万多个数据管理人员贡献了这本知识体系,这里面在DMBOK2.0里面,我们最近正在翻译,应该是在明年2月份DMBOK会正式发布中文版,这个有个DMBOK1.0在08年已经出版的。
 
这本书里增加了集成共享、数据陈述评估等,它缺乏实际案例,它作为案例可以参考但是不能照搬。
 
第二个介绍无的是DCMM数据管理评估模型。我们数据治理定义主要是治理架构流程,包括数据架构、数据标准、数据质量等各个行业在惯标。
 
第三个是《数据资产管理实践白皮书4.0》,包括数据资产管理是什么、制约数据价值释放的原因是什么数据资产管理等。
 
这里是8+5,这个指示体系有数据标准、数据模型、主数据、数据质量、数据安全、数据共享,数据资产管理保障措施里包括战略规划、组织架构、制度体系、审计机制、培训宣贯。这里最有价值的是数据价值,另外数据开放共享。
 
在这三个理论框架体系总结一下,这里面一致的是把数据作为智能活动有标准、质量,源数据、主数据这是一项活动智能,需要有人去管的。
 
第二个,这两个DMBOK2.0和DCMM都有数据战略,所以我们对应企业有没有数据战略。
 
第三个,白皮书里有工具做支撑,对应某数据资产里大概有10多个工具怎么管我们数据资产。
 
另外这三个框架体系里都有组织架构,我们很多工业企业里都没有实体组织。不同点这里谈到数据资产目录,因为我们企业数据很多,怎么快速找到这些数据?
 
第二个,除了数据管理以外,我们还有数据运营,包括数据需求、数据服务水平、数据交换共享等等,这是针对三个理论框架体系最后的总结结论给大家分享了。刚才简要说了数据资产相关的政策解读包括相关框架的介绍。
 
下面这个是我五个案例,是我亲自参与的,我把每个项目做一个简单的点评。中国石化在数字管理领域做20年了,从2000年实施ERP的时候刚开始做主数据项目建设,现在我们做大数据服务平台。
 
这里面首先标准先行,另外是标准大概有内部做数据治理70个团队在石化盈科。业务有四大平台:经营管理层、生产层面、客户层面、生产层面,我们把数据做成共享服务、数据智能。
 
数据治理从2000年开始最注重主数据和数据指标,我们大概有550多项主数据梳理出来,有1000多万代码库,1万多个指标项目,常年有70人左右做内部的工作。这个主数据包括数据指标,保证我们几百个业务数据系统一致性、唯一性、准确性。
 
数据仓库建立比较早,05年开始做,我们一直坚持在ICP BW以及BO上面在做着,负责经营管理层面数仓建设。
 
另外我们在客户层面主要跟阿里在合作,做电商。
 
我们在生产营运平台,这里是生产层面总部有大的展示平台,下面油田都有自己的ODPS,这是我们做的不错的,帮助中石化体制增效方面发挥了非常重要的作用。
 
我们再有几个比较重要的项目点评,第一个从16年开始大概几十个人,在中石化内部做中石化大数据战略规划,改了几十版,这里主要是做大数据战略发展规划,包括平台、数据治理、应用做了两个三年,一个十年规划。这里做七横七纵两统一,七个纵向、三链四域。每三年我们到底做哪些事情,一定是业务部门深度参与进来来做大数据,我们这两年正在做大数据服务平台,大数据服务平台是以前基础上在我们传统的结构化数据再加上自己开发的很多开源非结构化大数据管理起来。
 
发展原则是:需求导向、创新驱动、吸收借鉴、专业主导。
 
我们总的目标主要是构建中石化大数据平台,包括清管理、生产层面是我们的全面感知,包括优化、协同、科学决策。客户服务层面、资产层面运营。把中石化企业系统数据包括政府相关数据、合作伙伴数据、国内公用数据、国外数据汇聚大数据平台。我们有4万人用这个公用系统。后面按照采、聚统一将大数据采到统一数据平台里,治理数据在整个过程中从源头治理,后面在大的数据平台里做治理,我们各个用户用数据,后面是保证业务安全。
 
这是我们做的数仓大屏,可以全面直观集成企业各个层面的数据,为领导支撑服务保驾护航。
 
利用科大讯飞我们做了很多平台,我们各级管理人员在手机上能够看到数据,能够听懂人话理解人意,实现傻瓜式的平台。这是一个应用场景,我们把数据跟语音结合起来,把这个指标全部固化在系统里,说一句话,外面的业务人员、领导都能看到相关的情况。把数据真正变成产品、服务,为各级管理人员来用。大家愿意去用这个信息,这是简单给的例子。
 
这里把数据做成6种服务:包括数据订阅/分发服务、数据查询/申请服务,数据调用API服务、主数据公共数据资源池、数据资源服务、主数据即时服务。
 
最后我们看看数据治理的方案和目标,第一个我们要一套技术平台,我们一个数据治理平台,一套数据标准,统一数据研发、规范包括标准、资产管理,另外一套组织架构,我们总部一套人马来做。从业务方好用、敢用,从数据研发、治理与运维是过程管控,数据获取,源头数据非常标准,这样我们在大数据平台里没有那么费劲,我们本身就是一体化来做的。另外我们也构建了一整套数据管控制度流程体系。
 
另外我们打造绿树工程,培养1000个数据工程师,我们有大量的培训来做。前面比较快速的介绍了中石化在过去20年当中我们做的一些工作。
 
下面我们介绍能源集团数据标准框架体系设计案例。坦率来讲,国家能源是神华和国电合并来的,他们是两套体系。以前遇到很大的问题,最后尤其是在十二五期间做了很多成果,在十三五一直动不了,一直想做大数据,后面发现这个必须要从标准入手开始做,这里项目目标主要是通过做整个标准的融合,目标主要为了集团管控、产业协同、专业化运营、节约共享方面来做。
 
这里面必须要站集团层面,这里是组织范围涉及到总部,包括数据全口径、战略层项目管理层,标准范围除了指标范围以外,交易数据、主数据、实时数据标准,它是两个大集团很难去弄。
 
后面通过项目已经持续一年多,但我们石化盈科派了四个专家顾问带着他们神华信息40、50个人来做。
 
后面我分享我们的成果,这是我们项目做的总体设计思路。
 
首先做了数据架构的梳理,这里面也做了领先实现研究,主要对标中国石化,后面主要是根据数据对象做了一些研究,规划设计了四面墙,后面实现了标准清单也做了具体的在电力、北大做了具体的非常细的标准。
 
它把这个数据分为五类:指标数据、交易数据、主数据、通用基础数据、生产数据,这面是数据周期传输,上面是智能架构,后面是这里面因为它后面下来这里面数据标准管控有组织、流程、评估、考核,相当于四面墙。
 
数据全生命周期包括交易数据标准技术数据标准从采集、传输、存储、应用、共享和交换做了很多数据标准。
 
我们看一看主数据,主数据他们做了很多年了,做的力度不够,只满足ERP、MEMS其他方面都不够,规划总部通用主数据标准,另外按照产业板块八个产业里,板块专有主数据源,这里还有指标:产业、经营管理、分公司、央企、国资委考核指标体系做了完整梳理,这是经营层面的指标。另外按照行业也进行了梳理,最后我们构建两个体系、两个平台、一个服务。我们规划了数据治理平台,以前主数据、源数据、数据资产目录干很多年,发现没有用起来。数据治理平台目的主要保证数据质量和安全,我们规划了大概有12个工具,里面最核心的就是有数据加工与服务、主数据、数据模型之数据标准等。
 
这是它的中台,现在正在做,我们打造中台。后面也是采用传统工具、大数据工具把数据做成资产对外提供服务,这是我们帮着做的两体系、两平台、一服务架构。这过程中最核心的回到源头来看数据治理最为重要,数据中台的工具好搭建,花钱买过来,这里最核心还是数据治理,数据治理在信息化整个过程中处在牛鼻子的位置,一方面保证业务系统源头的一致性、唯一性、准确性,同时数据中台指标、安全,所以在信息化架构中处在非常重要、核心的位置。
 
这里面我们规划了一体化数据治理平台,除主数据、指标、质量、安全包括模型。这里数据资产比较新,我们都在摸索着,包括其对应的源数据是支持指标数据交换服务,后面是一体化数据治理和服务平台。前面介绍了国家能源,这两年我们一直帮它做项目主要的成果。
 
下面是中广核,我们刚启动一个多月的项目。基本上是有四五个系统,后面系统孤岛也蛮多,以前也做了相应工作,发现做得不够,这里孤岛也特别多,缺乏统一的管理体系,数据的机制不够健全,没有抓住制度流程,也没有统一数据资产管理,数据资产没有开发利用,没有利用起来,散落各个部门,本来今年有大的项目想一起做,领导非常想做这件事情,但发现信息部门做这个事情没底,先做对标咨询做这个事儿。
 
目标主要是全面盘点数据资产、建立数据体系标准和队伍、保障数据安全合规、不断提升数据质量、提高数据获取效率、持续挖掘数据价值。这里面新能源板块,后面数据是全数据,另外它的系统是所有系统来做全面的梳理。
 
这个项目我们刚开始做的时候发现,刚开始要做12大报告,发现报告写完没用,最后我们总结出来第一个最重要的数据是要做做数据管理培训,做洗脑工作,做对标工作,这个是第一步做数据文化普及,不急着做这个事儿,意识不够。后面是明年计划做数据中台、数据平台。
 
前面是里依据包括DAMA,后面找对标主要对标中石化,后面到十三五规划,后面顶层架构设计它的战略、组织构建包括架构设计,另外资产核心域包括主数据、数据模型标准包括主措施,后面包括报告,后面做了验证,这是整个项目的实施论。
 
在这个咨询项目中80%时间第一步做培训,培养数据土壤,大家对这个真的很陌生,提高员工对数据资产管理基础知识认知,加强员工的数据管理价值,培养数据资产管理核心人才。我们在三个月内组织6方面课程,19次62课时。这是中广核项目的大概情况。
 
后面是北京燃气,我们做得比较早,这里面做到整个数据资产中台顶层规划,我们从12年、13年每年大概有很多项目在这里面做着,发现做得不够,以往只关注信息系统,为了物资系统,为了某个系统来做系统,发现没有站到数据角度去做,它主要打造北京燃气智能、运营、分析平台。
 
这里同样的第一个以前的系统欠深度融合,也是搭建几十个系统,缺乏深度融合,所以它要将生产和安全各个系统相关的数据集中抽取,建立数据标准管理体系,实现数据统一管理,这是第一个要做的。
 
第二要打造数据共享服务平台,以前存在尽管独立系统是用得非常好,而且也非常漂亮,要打造数据共享服务平台。
 
第三,开发智慧应用模型。
 
第四,建立数据治理体系。
 
通过数据治理体系,培养企业员工数字资产意识,建立共享应用机制,包括管控体制等等,这是项目主要要解决的问题。
 
总体目标一个平台两套体系三项能力、四类模型五大特征。这里是例子,北京燃气在北京市实现燃气行业数据集中采集、分布、协同,这是我们预期的效果。
 
另外数据要完全的采集,全面的共享,把数据做全程、全局,完成数据采集,实现构建化转型,按需进行数据共享。
 
我们实现数据深度分析、透视,动态各个行业分析情况,后面是基层人员,通过日常维护、统一查询查到日常的情况。这是北京燃气做的数据中台规划报告,我们帮它做了落地。
 
后面介绍一下南方电网,南方电网在数据治理体系做了很多年了,这是他们最近分享的材料,我刚好是他们大数据中心外部专家。它是这样评价的,前期数据资产管理工作开展存在挑战,建设有余、见效不足。
 
第一数据资产管理驱动力识别不够,业务价值有待显性化,怎么评估价值。
 
第二个是规划设计点状开展,这里面非常重视规划,协同衔接不够,体系化程度有待提升。
 
第三,落地实践深度不一,对实际业务和信息化工作支撑有限。
 
第四,数据管控模式制约着数据资产管理工作在省地两级的实践。
 
数据资产管理框架分两部分,包括组织管理、技术支撑,这是它的业务数字化战略,这是它公司转型升级的,所以数据资产充分在它的整个转型升级处的核心的位置。
 
这里面做得比较好的,它做到了数据的全生命周期管理,全生命周期的管理与监控,全流程记录的追本溯源,全景模式的资产可视化。
 
它也做了一些数据工具,以前叫数据资产中心,这里叫数据管理平台,支持后面的业务。
 
它去年做了整个数据资产的规划,在未来四年当中大概要投6个多亿做数据资产,它投资领域也比较多。这是简要的把南方电网的数据资产做了案例跟大家分享。
 
后面的建议,数据治理比较难做,这里有四个方面:
 
第一,我们要做好顶层规划设计工作,把数据资产规划好。包括组织架构、应用机制、标准相关。
 
第二,要健全治理体系把数据资产管理好。包括做好数据资产管理、做好数据分级、分类、数据共享管理。
 
第三,加强安全管控,把数据资产保护好。我们现在要用户授权,最小够用原则,全程防护,这里在采集、存储、实用环节要做。
 
第四,要强化科技赋能,把数据资产应用好,在算力、算法、存储、网络方面,要应用好。
 
这里面我们现在谈中台非常多,我们面临着双模式。传统的像财务、物资管理等等这些东西用的ICP软件,这部分很难用中台马上把它替换下来,中台主要是在一些探索创新业务模式里,像一些新的快速响应业务,变化比较快的可以做试点,所以未来三到五年当中我感觉到这两种是并存、双模式存在的。老业务、老系统以我们为主,新业务、新系统采用新的技术、架构和建设模式。
 
另外我们看看大数据治理,我们有很多坑,并不是我们想象当中一帆风顺,有很多坑需要我们填,包括数据标准、数据质量、数据整合,我们在这个过程中是非常艰难的,要有足够的信心、足够的时间、足够的费用去做这个工作。
 
这个工作不能说太多时间,一年两年看不到效果,大处规划、重点实施,分布提升,我们想目标优势,迭代要快,每个项目六个月要做完,起步要小,让高管领导看到数据治理效果。
 
首先要有数据资产战略、目标、规划(三到五年),机制包括组织、制度、流程,另外本身数据治理、数据资产管理领域有些数据域管理。
 
这里面需要六个导向,包括需求导向、价值导向、问题导向、能力导向、创新导向、结果导向。从最终结果导向我们的数据治理情况。
 
我们数据管理目标三个结合:大数据治理技术跟传统业务深度融合、长远目标与短期目标相结合原则,我们要全局着眼、局部入手、重点突出、痛点着眼,痒点入手、标准、工具与运维保障相结合。
 
我们要坚持四个坚持、五个避免:
 
第一坚持统筹规划、分布演进、局部执行,一定要顶层规划、避免贪大求全、要做小而精,实现速赢。
 
第二坚持业务部门牵头、信息部门统筹管理,咨询公司作技术支撑。做这个东西满足合规、审计要求。
 
第三坚持标准先行、急用先建、滚动发展。业务创新方面有所建树,这样高管领导会非常重视,不断加大资金投入。
 
第四坚持标准贯标和内部数据人才培养。
 
五个避免:
 
第一避免贪大求全,要做小而精、实现速赢。避免数据部门、信息部门唱独角戏,避免数据流程管理过长避免为了做标准而标准,避免单一工具,按照业务场景去做。
 
面向大数据平台要机制落实、标准建设、数据系统建设。所以数据治理是项长期而复杂的工作,需要有专业和专职的团队进行管理和服务,才能保障数据治理能够取得比较长效的效果。
 
后面我们看从愿景来看,我们在数据管理是两大平台,第一是中台或者大数据服务平台,下面是我们的各种数据(内部、外部),这里主要是数据中台,再加上数据资产平台定义两方面,将来未来一个帐号、密码能看到跟我们所有相关的数据。
 
今天时间也快到了,这里面跟大家推荐一个公众号,这是我团队做的公众号。
 
五句话结论:
 
数据是企业的核心生产要素、数据是沟通协作的基础、数据是驱动优化创新动力源泉、数据助推业务增长,占领市场、数据是核心资产,发挥价值。
 
今天时间原因,我就讲这么多,谢谢大家!

链接已复制,快去分享吧

企业网版权所有©2010-2024 京ICP备09108050号-6京公网安备 11010502049343号