人工智能技术在企业应用及经验

责任编辑:cres

2019-07-27 17:36:45

来源:企业网D1Net

原创

中国移动IT公司 聂胜在北京部委央企及大型企业CIO大会上发表演讲。

2019年7月27日,由企业网D1Net和信众智及包括国药集团雷万云博士等多位大型企业CIO联合发起的中国企业数字化联盟正式成立,同期北京部委央企及大型企业CIO大会在北京盛大开幕。本次大会邀请部委、央企以及各大中型知名企业信息高管出席,聚焦政企数字化转型难点,探寻当代政企在数字化转型道路上的挑战和解决之道。
 
以下为现场速记。
 

中国移动IT公司 聂胜
 
 
聂胜:大家好,我来自中国移动IT公司的聂胜。刚才主持人也说了,段博士摔骨折了现在在医院,他是我的直属领导,他安排我给大家做这个演讲。
 
今天我要演讲的主题是“人工智能在企业中的应用及经验”。主要是受讲一下我们自己在用人工智能技术解决我们自身企业中的问题和一些AI的应用。
 
前面嘉宾讲的面比较广,我今天主题只在人工智能这一块。像中国移动很早就开始做大数据,也很早开始布局人工智能。中国移动总部现在提出“5G+AICDE”,5G+A(AI),I指的是物联网,C指的是云计算,D是大数据,E是边缘计算。我今天主要会讲到人工智能这一块,而且特别是要讲人工智能怎么在我们企业中落地应用。
 
前面有个前沿,我们讲现在随着大数据和人工智能的崛起,云计算、物联网都进入到我们的生活,再加上现在5G时代,5G元年已经开启,中国移动在今年年底会部署5万个基站,在全国50个城市落地5G,2020年底会实现县级以上所有城市的5G商用覆盖。
 
我们现在正在处在信息化和智能化所交集的时代,IOT、人工智能、区块链、大数据时代即将会成为开启真正智能时代重要的动因。
 
大家听了很多人工智能、大数据、云计算、物联网概念,但是我不知道大家能不能捋得清这个概念?我在这里简单阐述他们之间的关系,让大家更清楚人工智能到底是做什么的,因为大家听了很多云计算、大数据、物联网,但是你很难捋清楚他们每个是干什么的,好像相似但他们之间又有区别。
 
我们举了一个例子,物联网是人的眼睛、耳朵、鼻子这些所有触觉,而大数据是这些触觉收集到的数据进行汇集和存储,人工智能作为人的大脑来控制所有的这些信息,云计算是在大脑的指挥下对这个大数据进行一个处理和运行,并得到一些应用。这就是指这几个概念之间的关系。
 
今天主题会分三个部分:
 
第一,人工智能简介。
 
第二,人工智能的应用。
 
第三,中移信息AI实践。
 
重要讲第三部分,我们在AI方面的实践和应用。
 
人工智能简介,概念大家简单看一下就好了。我只想说人工智能是对人的意识、思维和信息处理过程的模拟,而人工智能并不是人的智能,但是它是像人一样进行思考的一项智能,它有可能会在以后超过人的智能。
 
人工智能有三种级别,弱人工智能擅长单个领域的智能,强人工智能级别,还有超人工智能级别,强人工智能级别是人类级别的人工智能,到机器人这一块,能够像人一样思考的智能机器人,而超人工智能在所有领域能够自学习,超越人脑。我们现在还处在弱人工智能时代,我们用人工智能的技术去解决的都是一些单方面的、很领域性的问题,我们需要不断发展,现在处在人工智能高速发展的时代,但是我们要认识到我们现在处在弱人工智能的时代。
 
人工智能发展的三次热潮,第一次热潮是指在1956年人工智能第一次诞生的时候,第二次热潮是出现专家系统那一块的东西,主要是在1980年和1987年时间出现过第二次热潮,之后经历很长时间的低估,第三次热潮是AI爆发阶段—深度运算包括数据收集这块都发展非常快,最具典型的是阿尔法狗战胜了人类,全民都在探讨人工智能。
 
人工智能三大基石是什么?人工智能为什么现在在崛起?最重要的是数据基础。数据基础是我们讲到数字化转型就要涉及到企业要收集好自己所有的数据,我们谈到数据是我们的宝藏,数据是我们驱动力,所以说数据是一个基础。
 
在数据之上,需要对我们的云平台包括大数据平台、云计算平台,你需要有计算能力对这些数据包括存储也好、计算也好,有了这个基础之后我们才会去谈到怎么去应用这个数据,怎么让这个数据在企业里创造价值,我们就会引入到算法引擎这一块,人工智能包括机器学习、机器学习再包括的是深度学习这一块,其实我们很多人工智能的应用都是机器学习方面的应用。我们说的那些神经网络也是属于机器学习的一部分,算法和引擎能让我们快速的处理那些采用无监督学习算法对大量特征数据集进行训练,从而得到有效的规则和推理知识。
 
人工智能应用,我简单说一下。人工智能里包括了什么东西?大家都说人工智能,但其实人工智能有一个很重要的研究领域,人工智能到底研究些什么东西?我们不能用人工智能一个词把所有都包括了,它其实是很大的概念,它里面有很多研究方向,它属于计算机科学的分支,它包括了哪些?机器人是一块,语音识别、图像识别、自然语言处理、自动驾驶和专家系统等,专家系统指的是我们说的很火的知识图谱,包括特别在跟机器人做闲聊的时候,与机器人对话的时候会用到专家系统,用知识图谱构建我们自己单领域的专业知识,我后面自己做了语音对话机器人,里面就会考虑到可以加入专家系统去构建自己领域的知识,让机器人在回答的时候,它就可以很有针对性回答你提出的问题
 
这也是人工智能的领域,这是指在行业和各个方向上的应用。
 
AI+交通,比如自动驾驶方面的应用,这个我都简单过一下。
 
AI+智慧城市,像在杭州他们部署了人工智能中枢,对杭州萧山的交通做了一个AI+智慧城市,相当于帮它做交通管制,能够提高车辆的通行速率。
 
AI+金融,在交融这一块主要是做风险防控。
 
AI+保险,淘宝里有运费险都是几毛钱、一块钱,五毛钱保费就10块钱的保额,它在人工智能、大数据助力下发展特别快,它算出风险值,利用AI算它的风险评估,它就觉得这个是确实能够给保险公司带来收益的。
 
第三部分,是今天的重点,讲一下我们在AI方面的研究实践。
 
我为什么直接讲到AI?在做AI研究之前,你必须得像前面说的,咱们必须得有一定的数据积累,必须要有你自己的大数据平台、云计算平台,我是在这个基础之上,我们在大数据平台,我们现在是在呼和浩特和哈尔滨有两个大的机房中心,里面有12000台的CPU服务器,我们是今年年底预计会达到2.5万台,基本上是在整个全国来讲公司里都是非常大的,跟BAT不相上下。
 
我们机房里存在的数据是中国移动从各个省公司收上来的数据,目前平台数据量基本每天有500个TB,目前的存储量是60个PB,往上乘20到ZB级了。我们数据量非常大,我们今年已经采购了160台的GPU服务器,准备构建我们自己的AI开放平台,类似于百度的开放平台、科大讯飞的开放平台,我们想在上面构建我们整个中国移动的AI开放平台,我们主要给中国移动各个专业公司、子公司、省市公司提供AI能力的开放能力。目前这个平台属于正在建设过程中。
 
我是来自大数据平台部,我们大数据平台部和应用部主要在这上面做整个集群的运维,应用部和我们会在整个数据上面做业务应用,我是专门负责AI这一块的,我是AI工程师,我们在探索的AI研究,一个是智慧营业厅,一个是智能运维、智慧运维,还有智能集合,后面主要是围绕这三个方面来讲一下我们现在正在做的AI方面的实践。
 
这个指的是AI赋能的全国流程,从数据接入、数据处理到数据分析到特定处理、模型训练,怎么从数据接入一直到推出AI应用,我们会在底层做AI集群资源,在中间建设一个AI能力层,我现在负责的是AI能力层的建设,在上面会构建各种各样的应用,在应用的时候可以去调用这些能力,通过API接口形式调用AI能力。
 
因为中国移动下面还有研究院还有杭州、苏州、北京总部研究院等一起合作在做这方面的东西。
 
这个是智慧营业厅的例子,我们现在智慧营业厅面临好几个痛点,营销重点不突出,个性化营销指导不足,大家如果没什么事儿肯定也不会去营业厅。
 
我们在金融街那边做了一个智慧营业厅,准备打造潮智准轻,潮是指产品要潮流化,它要有一些智能的设备,把人脸识别还有智能导购、游戏互动、商品售卖这些智能设备都加进去,准是指我们会给里面的用户,后面会讲到有一个用户画像,怎么去做精准营销,轻相当于大家能智能化办理各种流程。
 
这里讲一个我们在参与的案例,因为我们主要是帮他做人脸识别那一块,我们有高清摄象头,人脸是指你经过营业厅时我们会有两个模型,一个是常客底库,现在基本上N做到最大的估计也就一两万,我们现在N要做到10万、20万,现在很多公司基本做不到这一点,我们考虑到很多方案,也是跟很多公司进行探讨,我们是有个N做成两万的VIP常客底库,还有一个是10万的底库,两万的底库是在一个摄象头端,10万的底库在云端,他访问的时候会更慢一些。
 
首先用户只要进到营业厅,我们能先识别他的人脸,识别完之后我们会做全量的人脸库里做匹配,如果匹配出来之后,我们再返回它的信息、名字还有他的电话号码,我们通过手机地址做精准匹配,匹配以后要在其他系统里返回他的电话号码和用户标签,因为我们每个用户构建了差不多有3000个左右的标签。再把最终结果给到业务人员,业务人员再做相关的业务办理也好,会有精准营销,类似于这样的案例。
 
这个是我们智能稽核产品,AIRITA,它能处理图片、文本和语音,这上面就跟我们的办公很有关系,像OCR识别,车票识别、发票识别以及证件识别主要是这几个,做OCR识别。图像的识别会涉及到刚才前面讲的人脸识别的东西。
 
还有语音这一块,语音这一块相对做的不是说特别好,但是也在做。还有声文识别,还有做录音,录音之后做离线的翻译转译。
 
另外做知识图谱,我在4月份的时候我们做了一个医药的图谱,中医和西医相结合,你只要问所有相关疾病方面的知识,它都能够返回相应结果给你。后面数据智能部分做数据分析、智能推荐。
 
还有一部分是做合同。我们做批量合同识别把它识别成文本,提供在线提交API时会做稽核服务,如果把它去验证你提交的金额是否复合要求,它会做这样的认证,这就是在线稽核。我们后面已经有一些合作伙伴一起在做智能语音客服那一块的东西。这个是智能稽核的产品。
 
还有一个是我们前段时间正在做的智能运维,主要做机房监控。在机房监控这一块,我们去做人员轨迹的跟踪以及做物品识别还有危险动作的识别,为机房提供安全可靠的保障。人脸轨迹的跟踪,我们这里有视频。
 
我们做AI研究,我们很多时候都会去采用开源的东西来做,我们都是自主研发做开源的东西。这个是我做的,我能够去模拟识别,因为当时没找到机房里很多人的照片,就用了我们楼下监控大厅拍的人的视频去给他做人的识别,给他画出他的轨迹。
 
我们要做成的目标在机房里,他在走动时我们在机房设置禁区,如果没有权限的人员是不能进入这个区域。在进机房之前我们要做人脸比对,你是否有权限进机房,之后进行人脸跟踪,你是否能够进入这个区域。
 
算法的问题不讲那么细了。
 
后面还有我们会做物品的识别。这里边也是视频,中间这个视频会有一个人走进机房,我们会识别他是一个人,他手里拿的是什么东西,是拿的手机还是什么设备。
 
第一个视频是我们拿办公区的识别,有椅子、植物、杯子、电脑、鲜花类似这样的识别出来。另一个是做垂直识别,如果一个人进入机房之后,他移落什么东西,我们会给他做一个预警提示。
 
还有危险动作的识别,这一块我们要做人体关键点的检测,我们这里也是一个视频,一个人从这里走过来,我们就把它所有的动作给他抽象化出来,变成就跟火柴棒一样,抽象出形体动作,把他的动作识别出来,我们后面要做的是危险动作,我们要去训练他有没有在机房有一些揣机房门或者出现摔倒或者出现危险的动作检测。
 
接下来是自制语音闲聊对话机器人,这里有一分钟的演示。
 
这个是我花了差不多3天的时间自己搭建出来的,能够做闲聊的机器人。因为做一个机器人,后面涉及到的东西非常得多,我刚才说了,我们都是采用开源的东西去做,比如这里语音最重要的有两部分,比如我说的话,他要把我说的话翻译成文字,再把我的文字输入到语料库,匹配我到底要给他回复什么,大家看这个机器人非常智能,语料处不是我做的,我用的是图灵机器人开源的机器人语料库,我又调了开源的API去帮我把我说的话翻译成文本,把这两个结合起来就变成我能够实时对话的语音机器人。
 
当时段博士给了我一个课题让我研究一下语音,我用一个礼拜的时间看了语音方面的知识,去搭建的这么一个语音机器人,差不多花了三四天的时间,有这么一个能够实时对话的效果。
 
我为什么会说到语音机器人?很多时候,我们北京、深圳、广州三个地方办公,我们同事做了一个文档管理系统,他希望到时输入一个语音就能帮我把相关文档查出来,这是一个场景。
 
另外一个场景我需要把图灵机器人语料库替换掉,比如换成我4月份做的医药方面的知识库,我把医药方面的知识替换成这个机器人的语料处,我到时直接说,比如糖尿病应该吃什么?现在我想通过语音,和他对话的方式实现出来。这个是我们自己在研究的一个小玩意儿。
 
最后要讲一下,段博士让我来给大家传达一下,AI易用离我们企业来说并不遥远,我们要认识到AI可以在企业里落地。前面我们不能说AI,比如说我想落地一个OCR图像识别,我想落地一个像机房监控,这么一小部分、一小部分堆积起来,让我们认识到我们真正的能够把AI技术能够运用到企业里,解决企业的实际问题。
 
另外,做AI之前前面要加强数字化建设,智能时代最基础的就是一个数字化建设,在这个数字化建设之上你需要积累你的数据,你需要构建你的云计算平台,你需要培养你的AI人才,做一个人才储备。
 
另外我们要注重一下企业自研能力和开源工具代码的运用能力。开源对我们程序员来说,开源是世界上最好的东西,它能够让你天马行空,让你去实现你想要的东西。
 
另外一个在企业里要鼓励在岗革新和创新,包括在中国移动内部我们也是非常的鼓励在岗革新,每年会拿很多钱鼓励在岗革新和创新应用,希望通过这样的措施,能够让人工智能真正的在我们的企业里落地、开花。谢谢大家!

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号