当前位置:CIO频道新闻中心 → 正文

大数据趋势及探索

责任编辑:cres |来源:企业网D1Net  2019-01-12 16:00:13 原创文章 企业网D1Net

2019年北京部委央企及大型企业CIO年会于1月12日在北京开启。大会邀请了约150位来自北京部委、央企和知名企业的信息高管出席,围绕“数字化转型的实践落地”,共同探讨数字经济下政府部门和大型企业在政府职能转变及企业业务变革方面的全新机遇,为企业数字化转型出谋划策。
 
以下是现场速记。


中国移动大数据总架构师 段云峰
 
段云峰:首先做一个自我介绍,本人从1983年开始做计算机,算起来大概是15年的IT背景,15年的DT背景,再加上3年左右的AI背景,所以跟大家做个分享。今天的内容可能会相对的活泼一些,无虚一些,之前给大家讲的更多是务实的,今天跟大家更多的分享大数据的趋势和未来发展的方向。
 
今天分享的主要是三块内容,第一,数联网相关的内容。从2001年开始做数据仓库,这是2001年写的两本书。后来发现这些内容当时有点早,但是现在看好多企业才出现怎么和互联网大数据怎么结合。今天讲的大部分都是这本书里的,,现在提的大数据系统,这个都是单点的概念。中国移动将来和腾讯怎么去连大数据系统,这个过程中我们现在的套路都是点对点,小接口,我们干了很多年。但是将来能不能模仿互联网的模式来去实现数据之间通过一个标准的接口协议来进行直接的互联互通等等,可能会带来一些挑战。这本书叫《国之重器》,这个在谷歌做的大数据方面的演讲。这是我写的规范,摞起来比我高,今天让大家感受一下目前的趋势。
 
第一、数联网——大数据如何互联。第二,大数据资产管理。第三,人工智能,大概从这三个方向跟大家做介绍。
 
为什么现在会冒出大数据?当年是手写书,印刷术一四九几年在德国产生了印刷术,所以使形式产生了很大的变化,有一个说法,因为印刷术的出现导致西方科技革命的发生。现在这种模式大家丢知道了,我们说的大数据是个美女都要拍,90后吃饭之前先拍照再动筷,背后产生了大量的数据,这是数据记载的一些模式变化。最大的变化:第一,数据越来越大,手机已经成为了收集数据最大的“器官”,像人的肢体一样,像我再讲,大家在拿手机拍,以前低头记笔记,模式发生了很大的变化,而且是随时随地记录一切,咱们年龄相对偏大一些,我在校园里曾经看小女生一路拿着自拍杆走,我也不知道她是不是在做直播。还有几种丰富的维度,衣食住行等等。现在最大的一个变成可能就是5G,5G之后可能会带来万物互联,我现在只对人了解,未来可能了解你们家的冰箱、空调、彩电还有车,所有的数据都收集起来,所以未来的世界想象力会更大。还有更加深刻的驱动力,这句话是军方的说法“计算力决定胜利”。美军现在打仗,大概在打阿富汗的时候,24小时各种数据收集大概53TB,所以不是我们原来的那种概念。现在计算力,包括企业而言也是一样。人工智能开始进入新的历程,可能有很多颠覆性的变化,这就开启了第四次技术革命。英国成为日不落帝国一个重要的,当时只有6000万人,靠的就是科技第一次工业革命带来的变化,希望中国能够抓住这次机会。
 
切入正题,第一个是数联网。我做的案例,在运营商去年的数据是200PB,腾讯的量很大。但是有一点,大家强调的都是单点,很像当年做互联网。后来通过互联网,所有的PC机连起来了,所有的信息完成了交互,但是数据也同样面临这个问题,比如中国移动和工商银行,这两者数据现在都是衔接口,将来我希望通过一个数联网,通过一个标准的接口,标准的协议公开,谁需要就把数据拿过来,而且有一点,数据自带语义,这是数联网能够带来的一个变化,实际上很大的一个挑战是共享经济,现在可能很多人都会问隐私的问题。通俗的说法,在现在这个时代有隐私吗?隐私是奢侈品,(N)是做宽带、做视频的,(N)开展什么业务?可以在这儿看电影,付我30美金,从8点到10点间不记录看了什么电影,这是现在的方法。现在是什么特点?隐私奢侈品。数据带来各种各样的交换需求。这个小伙子把自己的隐私数据在网上卖了1000多美金,这都是几年前案例。别人在卖你数据的时候可能不花钱,将来的模式是你跟一个运营商合作,卖完数据以后签个协议三七开等等,有很多种可能。
 
这是一个场景的案例,买一辆车之前要把所有的参数搞明白了,不同的是每一辆车的参数都要自己收集。举个例子,北汽的一辆车真实的参数,不是工信部公布的油耗数据,那个可信度基本没有。要告诉我实际情况的数据,这样对我选择这款车可能会提供一个真正理性的依据。拿到所有网友实际的油耗,在公路上的油耗、爬坡上的油耗、山路上的油耗等等,这些数据有了以后干吗?只信数据不信广告,这个可能都是数联网的基础,能不能把这些数据拿过来而且完全彼此的沟通。数联网第一个最重要的一点是打开彼此的数据库,现在所有的企业都把数据作为私有财产,如果公开先考虑的是多少钱,这可能是在互联网当年没有的套路。互联网当年都是愿意把数据分享出来,这是完全两套体系,但是将来可能会有颠覆性的变化。数联网的关键应用怎么数联,怎么保证关键隐私,这个可以和区块链结合起来,可以做授权,而且可以确定这个数据是你给我的授权,这样在技术上就有手段了,而且大家也不用担心太多。我个人的判断是,只要你有足够的商业模式,没问题,中国人从来隐私都是舶来品,你给我钱可以把隐私卖给你,小老百姓没有那么大的隐私,这是我看到的。还有故联网所需要的价格,核心的一点,对于老百姓而言数联网上有可能是一个新的模式——盈利模式。我把数据给你,卖完以后三七开,刚才那个小伙子三个月的数据卖给了1000美金。5G里面还有边缘计算,这个东西对于数联网都是意义重大的,这是我们看到的一个基本的概念。
 
数联网与互联网的关系。数联网是解决数据的互联互通,互联网都是TCIP,很顶层的,有这样的差别。
 
这是带来的一些变化,从工业文明到数据文明。我们能不能通过数联网让数据更加开放、透明,能够看到更多的数据,这可能是我们现在即将面临的挑战,会带来很多新的产业机会。这里面说点通俗的,包括新的浏览器,包括新的商业模式,还有人工智能的一些变化,可能会构建相对很完整的产业链,商业会更加透明。什么意思?原来汽车是看广告,一个明星出来做宣传,将来不用看广告了,有数据对比,你想要什么样的给你什么样的,把产品给你做到极致,要活下来只能靠产品不能靠忽悠,这是数联网即将带来的商业模式。互联网只解决了信息的互通,原来通过电视台做广告,现在通过互联网做广告,但是数联网之后这一切将颠覆。
 
之后我们说层次的变化,书里面都有详细的介绍,我就不给大家展开了,有点偏技术。举个例子,将来的浏览器应该是什么样的?我看很多人做IT的历史很长,1995年的时候登互联网靠英特网,废半天进才能看,未来的场景是当时有一个网警公司,通过APP协议一下出来一个网页,搞得我们焕然一新,互联网才有今天。未来数据互通以后怎么通过一个数据浏览器能够看到工商银行的数据,这就是数联网的浏览器,这里面将会产生可能比网警更大的市场,这可能是一个机会。很多颠覆性的东西都将产生,这是我们看到的。这里面确实有很多的机会。数联网的生态圈。包括设备制造商、标准数据标准企业等等都会带来巨大的机会。数联网是什么世界?美国最担心的就是中国的数据,现在中国的数据量是很夸张的,美国为什么担忧人工智能,主要是因为这波人工智能就是基于大数据的,已经积累了海量的数据,但这波海量的数据是彼此割裂的,我们如何把它们互联互通,这是我们要考虑的。
 
下面是一个大数据资产,这也是站在实际的运营角度。比如说最大的运营商,IT系统有2000多个,怎么去把这些IT系统整合起来,而且不同的指标怎么去整合起来,我们花了大量的精力。这是我们说的数据质量管理的情况。我当时读书的时候做数据仓库项目的时候,(英伦)在书上说60%的工作量将来在数据质量上,当时将信将疑,现在做了这十五年下来负责任的告诉各位,未来真的是要60%的精力在数据质量上,而且没法儿取巧。我在硅谷讲课的一个兄弟问我,数据质量有没有捷径可走,我直接回答说没有,因为文档加起来有上千亿,还是蛮辛苦的,这是现在希望能够用人工智能的方法参与到数据质量的监控、集合这样的过程,这里面涉及到指标库,怎么进行深度学习设计指标库,现在希望通过深度学习预测找它的值,判断它是正常波动还是异常波动,这是相关的流程。左边是数据,右边是深度学习的平台,这个过程怎么去监控它的指标异常,这个指标是要AI学习,而不是人。原来很土的办法,到10%就告警,那么多的指标,一个省的指标上千个,怎么可能靠人来去监控,没法儿做,所以最后土办法是10%就报警,但是有很多合规的方法去搞定,大家不要觉得这是一个技术问题,这是一个管理,因为涉及到很多人的奖金,这个事情是很复杂的。这个预测的过程要算它的值,最后用各种各样的算法,这里不给大家开了。三个算法的训练,找到一个合适的波动值,找出质量波动的区间。
 
这里有一个小案例给大家看一下。这是一个数据资产的案例。可以看到数据有哪些,数据从哪儿来到哪儿去,这个视频的情况大家感受一下,我能看出数据的来龙去脉,看出表格有多少,每个数据层大概是多少,收集的血缘关系、影响分析等等。这样的话,一个省数据表大概上万,通过这样一种形式、手段才能看出数据的来龙去脉。哪块出了问题通过前面能看到,这个是对内做了什么样的应用,对外做了什么样的应用,每个应用什么样的情况,这样大数据的价值就容易跟领导汇报,这个是把数据处理过程全部显现化,有故障马上就知道在哪里,让领导知道钱花在哪儿了,这个模式还是很重要的。
 
下面是人工智能。人工智能比大家想的速度要快。这里稍微给大家拓宽一下,我们做企业做了很多年,可能思路更加聚焦在企业的需求上,我们看目前AI发展到什么程度,首先看音乐能力。这个是微软小冰AI自己创作自己演唱的歌,现在AI的进展比我们想象的快。比如AI指挥音乐,怎么去指挥交响乐,让大家感受一下,用这种方式指挥音乐。我们看到的变化比我们想象的要夸张。再给大家看一个好玩的,现在打劫的方式都发生变化了,都要用上AI,感受一下现在AI技术的变化。如果这种打劫的变化发生了以后,你到哪儿去判去,你都不知道谁在后面操作。
 
阿尔法狗下棋就不说了。关键的是AlphaGo Zero,,自我对弈490万盘旗,结果是什么?干掉了10个版本,或者是(科杰)的版本,他已经是目前最高的水平了。对我们这个圈子最害怕的是,意味着不再站在人类的技术之上了,AlphaGo学习了人类所有的技术,在那个基础上再做,才能下过人。Zero的恐怖之处根本就没有看过人类的一盘旗帜,第二天、第三天就可以把李世石干掉,这件事意味着很多内容都不需要,AI自己可以产生数据,这个给大家稍微带一下。人生苦段,Python当歌,我这个圈子里的朋友孩子2岁在上海学Python编程,不再学说话了。谁认识左边的字?这是失传已久的西夏的文字,当年西夏被灭国留下的西夏文字,现在用AI来翻译西夏文,西夏现在没人能认识这字是什么意思,这就是变化。这是AI的绘画,这是我们看到的艺术创作。这是两张图我给混成了一张图,艺术创作的模式。有意思的是,这张图能看出来有什么特点吗?先拍一张照片,要什么样的分分钟产生几万张图片或者美术作品,所以画家同学将来会受到很大的冲击。这是IBM Watson的机器人,根据电影做了一个广告片,这是我现在看到的变化。这个是更有意思的,看一下语音合成到什么程度了,这个是奥巴马的讲话合成的。同学们感受到AI的威慑力了吧,不能得罪搞AI的人,否则第二天网上出现反党反社会的言论,你怎么证明自己没说,你的声音、你的嘴形,很多颠覆性的东西都在出现,这些变化比我们原来想象的要快。
 
未来的电影都将重构,未来拍李小龙的《猛龙过江》,范总去演,想做谁做谁,怎么样自嗨怎么来,电影都将颠覆。日本的一个公司正在做。
 
AI还能干4什么?可以给一幅画一,干嘛,想着城市的灯守着我,咬破了冷静的思想,你的眼睛里山东,无人知道的地方,会写现代诗了。这是清华的“九歌”。2016年之后北京高考已经不用人判卷了。日本的一本小说,电脑写小说的哪一天,首先追求寻找自我的快乐放弃了对人类的服务——《计算机写小说的那一天》。未来AI能不能产生金庸,各位现在觉得不可能,我的感觉没问题,因为1983年我学电脑的时候打死都没想到计算机能有今天。科大讯飞是做翻译的,我去年7月份做日本,日本我是一去不回,当然得不能安静,翻译现在做到了八级。这是用AI参加高考,能够被80%的日本大学录取,前年AI已经通过了全国的执业医生考试。这是高晓松说的,作为自幼学棋,崇拜国手的业余旗手,看了Master50:0横扫中日韩顶尖高手的对局,难过极了。为所有的大国伤心,路已经走完了。多少代大师上下求索,求道求术,全被破解。因为高晓松没有看到音乐和诗歌,我给你们看了,刚才给大家开拓一下思路,能不能拿AI给我们写PPT,各位没有共鸣吗?诗和远方都能搞定,何况PPT呢?我们之前做过,因为有些PPT是可以的,只是变了一些数,稍微做了一些图像调整,很有意思,降低了人力。
 
这是中国移动做的尝试,AI平台是一个什么样子的。平台相关的算法、组件、应用稍微给大家看一下,所有做AI的大概都是这个套路。目前咱们的能力只能在底下和上面,为啥?中间GPU全是美国人的,中国现在很牛的分析化数据。数据量比美国人少,起码不少。做AI里面主要是和数学相关。
 
给大家介绍一个自己做的小产品,叫AI荷尔蒙,实际上就是人脸识别,但是用了一个谷歌眼镜。买了一个类谷歌眼镜,大概3000块钱,是一个山寨版的安卓手机,进了一类厅以后的人脸识别,这是我们感受到的。人脸识别有几个可能,一种是店厅用人脸,进来就能识别你是谁,还包括社区,未来卖一个社区怎么卖,比如卖奔驰、宝马,现在哪儿哪儿都是传单,未来应该戴一个眼镜,一看朱总比较有钱,马上要换车了,这个时候马上发传单营销,人脸识别未来的想象空间很大,当然背后的能力是数据标签能力,有没有足够多的数据。大家不要小看这个眼镜,现在的眼镜比较土,但是5G之后这个眼镜不是梦。未来没有结婚的帅哥想找老婆的时候马路上看到一个美女先人脸识别,再算一下匹配度,关键人家得单身,一看95%的匹配度,美女马上发一个信号“约吗?”,帅哥再过去搭讪,有5G以后这些都不是梦,让大家感受一下变化。我戴了谷歌眼镜以后可以识别你是谁,这些都可以做到。
 
AI实际的应用还是这个,第四次技术革命的前夜,大家不要小看,周围圈子里有接触到习主席的,第一,对AI还是颇有了解的;第二,中央确实想赌AI,就像当年英国赌工业革命一样。国家往里面砸钱。中国现在在AI的进展很快。这张图是法国大革时候,叫“技术引领人民”,现在叫技术引领人民。我相信这一点。当年英国打遍天下靠的是科技,这些颠覆性的变化会让我们所有人都要面对。然刚开始的时候很慢,刚有火热的时候在欧洲、英国有一个特点,很多人骑着马虐火车,因为火车只有40公里的时速,给技术以时间,给新技术以时间,互联网刚出来的时候,我可是全程见证了。现在谁还质疑互联网,这是我看到的很多变化。
 
这是大润发黄总说的,“胜了所有对手,却输给了时代”。什么意思?方向技术更重要,大家想过吗,当年马云做销售的时候,很多人觉得他是忽悠的居多,但是看一下你们身边的90后还有人去实体店买东西吗?人工智能带给我们的一些挑战,基于大数据的人工智能带给我们的挑战,可能谁都没法避免。过去三十年我见证了信息领域的巨变,未来三十年只能比三十年更加剧烈,在座的各位没有一个能躲开。你有可能是被干掉的,也有可能是干别人的,我希望大家都去学习AI干别人。算法改变人生。谢谢大家!

关键字:CIO 数字化转型

原创文章 企业网D1Net

大数据趋势及探索 扫一扫
分享本文到朋友圈

关于我们联系我们版权声明友情链接广告服务会员服务投稿中心招贤纳士

企业网版权所有©2010-2019 京ICP备09108050号-6

^