当前位置:呼叫中心/联络中心行业动态 → 正文

中国电信:云呼叫和全媒体交互中心

责任编辑:王松林 |来源:企业网D1Net  2015-05-25 11:08:37 本文摘自:企业网D1Net

主持人:运营商,尤其是中国电信,在国内政企市场是当之无愧的老大。拜BAT所赐,老大也不闲着,中国电信政企部门一直在探索着通道以外的新型的模式。

接下来我们将请出中国电信上海研究院杨震博士为我们带来自然语音处理技术在语言大数据分析中的应用,大家掌声欢迎!

杨震:非常开心,非常高兴有机会参加这次大会,感谢会议主持人给我安排了一个比较好的时间位置。我代表中国电信说一下电信在自然语言处理领域和语音大数据分析领域做了什么。


中国电信上海研究院 杨博士

我今天给大家汇报的是三个主要方面。第一、时代背景及呼叫中心大数据需求分析。第二、整个技术架构和研究思路。第三、中国电信在这方面的工作积累。

大家可以看到,语音大数据这件事情,其实它现在是提起来了,但是本质上它对内部的基础研究一直在做,而且它是属于互联网发展起来的。我们看到,比如有两个,有一个就是搜索引擎,我个人感觉这和语音大数据比较类似,尤其是驱动技术比较类似。搜索引擎出现之后,整个互联网才真正的蓬勃发展起来。现在进入产业互联网爆发的时期,这个时期现在大家谈了很多概念,很多技术,也有很多应用在做这个事。但是迄今为止没有看到一个很有突破性,或者很有震撼力的应用出来。通过我们电信的研究和业界的一些资深的专家,或者一些有研究积累的机构进行分析来看,就是语音大数据这件事,对语音的处理这件事,可能是今后十年,或者今后二十年影响企业形态和生态的一个主要的技术。

为什么这么看呢?头几年有几个技术热点,这几个技术热点随着现在的发展越来越被人们认识。第一、云计算,解决了计算资源的调度问题。以前我们做学生的时候,PC机处理性能很有限,现在我能通过云计算技术把很多的服务器集成在一起,处理大规模的问题。

第二、大数据。它提供了一种技术思路和方法,解决了处理大规模数据集的问题。而云计算、大数据,其实刚才我们说到了,搜索引擎的出现,它对互联网还是以整体信息处理这样一个研究的思路。

第三、再加上物联网解决的各类应用系统通信问题,我们今后的发展可以对海量的数据进行处理,按照企业的应用模型,把所有的问题解决出来。

最后一个最关键的技术就是人工智能技术,我们说的最多的语音识别,包括科大讯飞的技术,其实它都是人工智能技术一个基本的体验和应用。我们外面看有人机交互、智能控制等等这些东西。而它的基本内涵的理论研究,说实话基本有几十年的历程,而只是在现在有云计算、大数据和物联网的基础上,能够达到一个很好的应用。

最核心的两个技术就是自然语言处理技术,自然语言处理技术包括云识别,还有包括一个语音理解。语音识别是声音到字的转换,云理解是转化成字,它本身这个学术界大概研究了五六十年,而它作为信息的三种最基本载体其中两样,图像、声音进行文字的处理。而这个处理的目的是干吗?搜索引擎的目的其实就是为了决策,企业用自然语言处理技术也是为了决策,我用信息,怎么获得这个信息,这个信息从哪来,这个信息对我有什么用。

互联网、移动互联网和社会化媒体的出现,刚才大会主持人也说到了,微信出现了之后,它搭建了一个很好的信息流动平台,这个流动平台上面,唱戏的就是信息怎么应用,能改变你信息的交互方式,能使决策信息更准确,而且通过这个信息的流动,带来一个新的模式,比如做广告也好,或者参与决策过程中,或者参与付费也好等等。

从这个图我们能看出来,为什么我们干语音大数据这件事?它从跟Google的对比和搜索引擎的对比其实很像。传统的互联网出现之后,一开始是门户网站,大家什么都有,用户上去找。其次是雅虎分类目录,因为门户网站上的网,网站太多了,我就得有一个分类目录出来,之后通过分类目录达到我的应用的网站。之后搜索引擎出现了,因为分类目录需要人工整理,怎么整理这么多海量的信息,人类是不能穷尽的,而且网站互联网信息在变。

所以我们看下来,搜索引擎的出现之后,才真正的把互联网的产业,互联网的发展推到一个极致,它就是处理一个海量的信息。而我们做语音大数据是怎么想的呢?我们中国电信怎么想?第一、所有的文字和声音信息,企业,我们呼叫中心也好,或者企业的视频网站也好,它首先本企业的信息和外网是互联的,其次所有真正的应用,语音和语义的应用是跟业务相关的,这个业务相关的理解只有企业才能理解,早期的互联网门户网站,进入那个网站才知道,而我如果有一个办法把这些信息连在一块,或者使信息流动起来,同行业之间的信息有一定交互关系,而且基于一些分类统计,或者大数据计算的方法,能够把所有的信息让它有价值和有向的流动,我就能产生一个新的价值,这就是我们电信考虑这个语音大数据的事。

前面是一个铺垫,看电信语音大数据,我在电信领域做了几年的研究,我要服务电信的业务,服务电信的收入。我们做技术研究和电信相关的业务怎么结合?现在就是企业的营销和运营问题。因为现在邮件也好,微博也好,微信也好,数据也好,产生的数据量是相当大的。而且企业不同的OA系统产生的信息量也很大,作为一个企业,每个具体的执行者无法融合这么多信息,他有需求,但是不知道哪块满足这些需求,完成这些东西。所以,我们要通过语音大数据,或者大数据分析解决企业的营销和运营这个问题,这是一个基本的出发点。

具体着手,就是呼叫中心这个事。说到呼叫中心,中国电信做呼叫中心可以说是中国历史上最悠久的。在上海,大家从电信博物馆可以看到,老的上海的查号的,就是现在的114,那时候114的接线员都是坐黄包车去上班的,是最有学问的,最有价值体现的,或者最有身份的一些女性,因为她要掌握技能,还要懂外语。

随着信息技术的发展,呼叫中心一代一代的发展起来,它通过一个传统的呼叫中心,以语音为主,就是打电话进来,查一个什么东西,后面有数据库。之后结合方式,IP这种,视频的东西,能起到一个作用。最后到今天大家看到联络中心,各种都有,包括E-Mail、微信、微博、短信、易信等等,都能接到呼叫中心上来,而且我都能表达我的诉求,腾讯的QQ也可以。之后后面有各种信息处理系统,对声音和文字的处理系统。

我要做两件事,第一、使我处理效率更高,用户来投诉,或者来解决的时候,有一个更好的解决方案。另一件事,使我前面接到的信息主要的热点能及时的反馈到后面的生产和服务系统里。所以,从这件事来看,中国电信做这个事,第一、服务资深企业,第二、中国电信有外包呼叫中心业务,我们对整个呼叫中心的建议和经验积累可以服务各个企业。中国电信是做通信运营商,它立足出发点是服务整个中国企业把信息技术应用好,使企业降低通信成本、节约劳动成本,提升生产效率。

呼叫中心引入新技术干嘛?第一、告诉我有什么功能,知道产品怎么升级。之后,对企业的增量价值来看,我能有什么商机。后面会介绍,呼叫中心、大数据到底价值在那里,前面就是有什么商机。第三、人力成本的竞争,现在中国人力成本越来越贵,中国电信坐席成本越来越贵的,还有最新的,向移动互联网、互联网转型,通过各种接入手段带来的信息,使信息流动更好的来动。

其实传统的大数据特别大,它的种类形态很多,而且产生的速度很快,这几点跟呼叫中心大数据都比较类似。拿Google为例,每天会处理很多信息,或者更大的数据资源,流动的信息,它会很容易抓取,因为它有一个数据处理架构,它的信息演变出来就是现在的大数据跟云计算。但是,呼叫中心大数据其实有一个基本的特点,跟传统大数据是不太一样。它的数据价值含量其实很高。大家可以想一想,打114,或者各个企业的客服,他肯定是带着一定的问题才去打电话,每一通通话都有实际的价值在里面,互联网的信息和企业大数据的信息不一样,它的价值很高。能够很实际的提升企业的服务效率,如果很有效的挖掘出来,也很实际的找到企业产品的一些弱点。所以,这个事是驱动我们中国电信做这个事的一个主要的出发点。它的应用方向,第一、找到新商机。第二、节约人力成本,其实最次的,把许多数据结构化出来,用语音识别和语音理解技术,形成一种自动的人工的问答系统,其实大数据一个基本的处理特点,处理目标是把非结构化的信息变成结构化的统一表达和存储的一个方式或者应用。

从呼叫中心大数据能获得什么?客户诉求、意见建议、市场活动、客户情绪、竞争对手、服务质量提升和坐席技能。我们画这个块,是我们上海电信研究院和集团公司现在主要做的一个事,其他就是客户诉求,还有客户情绪分析,还有竞争对手,是我们在研究下一步主要要做的事情。因为我们中国电信想提供一个普性的,对大数据处理的平台,然后把一些信息技术集成起来,给企业客户进行应用。

稍微具体一点,语音大数据头几年在做什么?首先,以质检这个事为例,因为服务质量肯定要提升。传统是有质检员的,会派50个质检员,质检员每天要听电话。我去上海问他,一个质检员一天最多听多少通电话?一天最多听十几到二十通,因为打客服系统的人多了,可能要打一个小时投诉。质检员听这个电话,要对坐席服务进行评价,哪句话该说,哪句话不该说,所以要反复听,所以这个效率又低了。有一些质量不好的电话,质检员没有听到就过去了,但是如果听到了,要给坐席进行反馈,这个事不应该这么说,我要扣你钱,即便这么做,大概只能做到1%,可能1%都不到,由于我们有上千个坐席。

怎么针对这个事进行解决呢?主要用两个技术,一个是语音识别,一个是语音理解。语音识别,其实也不是很神秘,上个世纪五六十年代就开始做这个事,其实语音识别这个事,背后还有很多的特征技术,包括情感、声音、图片,进行检测等等这些技术,都是对整个的自然语言的发音的一个升学特征进行提取和分析。

但是,为什么还有语义理解呢?如果文本转写每个字都不错,是用还是不用呢?这是第一点。比如我们有另外的项目,做IPTV智能控制,我要看中央一套,一个字都不错,给IPTV播放平台,他也办不了事,我要播控指令才能干这个事,这个就是语音理解干的事。语音理解还要干什么事呢?行业特征分析,因为不同行业的专有名词专有特征,有不同企业的专有名词,专业特征,也是不一样的,只有企业内部的人都知道。我们做呼叫中心语音大数据分析和语音理解技术。

现在看通过声学特征信号听取,和语义分析技术到底能干几件事。从技术最成熟的角度看,第一、语音转文本,把语音转变为准确的文字。第二、关键词检出。关键词检出其实它更基于两种,一种转文本,另外一种相当于本身就用这个关键词去检,在语音模式和声音模式上,就检100个,或者200个关键词。第三、情绪检测,其实正常的服务质量,语音如果有一些异常的情况下,音调和语速会变快,比如音调突然升高,语速一分钟说多少个字,我说话字数就是比较快,一分钟超过240个字,一般人说话,200-220个字之间,尤其坐席,经过培训,控制的字数和语速更有一定的控制力。所以,怎么分析情绪也是一个。第四、静音检测,由于有的时候该说话,有的时候不该说话。第五、语速检测。第六、话者分离,对存储的数据基本都不成一块,就是怎么能把坐席和打电话的话分开,它是通过声文识别的技术,声文识别也是我们下一步要主要研究的,一个是用户认证,还有多语种识别。

后面有案例介绍到中国电信在整个语音识别都做了什么。这就是我们做客服质监产品功能产品的一个示图,就是我能干什么事?所有的这些事是底下的技术一点点堆起来的,并不是我拿过来就用,就是我要切入到某一个行业中的时候,肯定需要一些新的东西完善我后面的搜索引擎。否则它要解决几个事,一个事是录音格式,声音格式,还有识别结果,同音字,同音词,这些怎么去转换的事。

这个是市场机会,其实它也有很多的市场机会。其实现在整个是“互联网+”,还有“一带一路”,还有企业转型,其他所有企业,所有产品都牵扯到一个服务的事。像腾讯、微信和微博,这样的互联网企业也要客服用户的投诉。在网站上遇到什么问题,你怎么给我介绍。生产具体产品的企业,肯定要解决用户投诉的,质量有问题肯定要找个地方来说。所以,市场机会其实还是蛮大的。中国电信提供整个的一个解决方案,包括基础架构。

这是我们现在在做的一个产品,拿出来给各方面汇报的。成单录音分析,电话外呼的那种,提高成单率。热点追踪,比如上海的12345,有一年一些热点事情突然出现,用户打到12345这个电话里来,接电话的都是坐席,叫个体的行为,其实他接到用户投诉的一件事情。另外一个中心也接到这个事情,但是他们俩之间不互相通话,领导怎么知道这个通话率的识别很高,就用这个热点追踪,下面是整个对外呼系统的一个作用,比如首次通话的解决率等等。

说了那么多,其实这个事,中国电信说的很好,到底自己做了什么?因为我是上海研究院的,来电信十来年了,一直做自然语言处理相关的技术。早期的搜索引擎,大家知道114,是我们做的,之后还有一些国家“863项目”,这是第一个应用成果。它项目来源就是国家“863项目”,它服务于世博会,是我们这个项目组参与的。用到电信里是IVR智能语音交互,就是一个小规模的语音识别项目,打电话进来,语音提问的方式找电信的语音营业厅、网点和找他的每天工作时间和他坐的交通,这是我们2010年之后做的。2010年之前,世博会962010中英日法自动语音交互,这个也是我们上海电信我们这个技术团队做的。这个是情绪感测,这是我们内部的项目,就是怎么分析坐席在通话过程中的异常情绪,系统也是在跑,坐席的语音材料,先看哪些是正常的,看现在来的语音是不是正常,发现其实前面我们说的语音建模的事,如果建的好,大概有20%的提升,就是能发现他的情绪电话。

自动转听这个事,在中国电信里大概有三个,第一大家如果是中国电信的手机,现在不是中国电信手机也可以做到,就发118、114这个短信号,查一些目标航班。现在大家说百度也好,但是我们做这个项目的时候是在2010年,那时候百度他们没有,中国电信一直做的最早的就是118和114,结合自助语音的时候,我们技术研究都是走的很早的,而且上线,也被别人引用了,但是对于它技术本身的应用可能稍微落后一点,这就是短信的语义理解,我花费也好,办套餐也好,跟业务相关的,我们有一个自然语言处理这个能力,这个平台现在在上海,上海电信跟指令码对应起来,而且还有一些上下文交互的逻辑,也放在这里了。

热点分析技术,语音识别之后的文字,进行语音特征收集,怎么跟业务相匹配,出了这些东西。我们2010年主要是微博这块的信息全做掉了,我们上海电信内部也看整个网上的信息,看跟中国电信相关的进行分析。

多媒体客服交互技术,解决视频也好,语音也好,E-mail也好,各种媒体交互手段跟呼叫中心进行语音通信的问题,这个我们技术验证也做过了,这个也都做的很早,大概2011-2012年之间,应该更早。

我们电信的网络平台应用常用是采用生态链,在整个国内呼叫中心是做的最好的,而且我们各个地方有很好的集成公司实施这个东西,集成公司本身是在中国电信内部的118也好,114号,我们自己已经练了很久了,应用的需求,开发,或者怎么应用,跟我们研究院已经互动的很好。它是在我们内部用好了之后,才给大家用。所以,我们自己就是这个小白鼠,试好之后,再给大家用。

这个是我们对于整个呼叫中心全媒体概念的一个定义,它解决各种易信、微信、微博各种语音信息识别和处理的问题,之后找到用户关心的和用户未来可能会关心的东西,为用户提供更好的服务,产品模式。

863的项目全称是多语言识别,项目是应用示范,2012年上海市科技进步一等奖。2015年获得上海市技术发明三等奖,在客户,呼叫中心,或者全媒体呼叫中心这个领域,或者业务联络中心这个领域,一句话只有几十个字,几十个字表达一个特定的概念,这个事是2015年参加的这个大会。还有2010年的三等奖,最早给结构化写文本的那个搜索引擎进行推广,这些都是中国电信自己来开发和应用的。2008年是二等奖,整个呼叫中心的二等奖,呼叫中心各种技术集成的一个二等奖,在上海市。下面有上海市的优秀发明选拔赛的奖励,我们这个授权和社会专利大概十来项,论文也十来篇,团队专利和论文写的还不算多,因为我们大部分是实践,开发,标准现在是在做国家的标准。这是我们电信已有的一些项目的情况。MTV也好,车联网也好等等,我们这个团队做的这些项目。这个是中国电信在呼叫中心服务行业认可度的一些获奖。

总结一下,语音大数据,语音识别,语音理解,云计算和社会化媒体五个方面要结合在一起来运用。谢谢大家!

x 中国电信:云呼叫和全媒体交互中心 扫一扫
分享本文到朋友圈
当前位置:呼叫中心/联络中心行业动态 → 正文

中国电信:云呼叫和全媒体交互中心

责任编辑:王松林 |来源:企业网D1Net  2015-05-25 11:08:37 本文摘自:企业网D1Net

主持人:运营商,尤其是中国电信,在国内政企市场是当之无愧的老大。拜BAT所赐,老大也不闲着,中国电信政企部门一直在探索着通道以外的新型的模式。

接下来我们将请出中国电信上海研究院杨震博士为我们带来自然语音处理技术在语言大数据分析中的应用,大家掌声欢迎!

杨震:非常开心,非常高兴有机会参加这次大会,感谢会议主持人给我安排了一个比较好的时间位置。我代表中国电信说一下电信在自然语言处理领域和语音大数据分析领域做了什么。


中国电信上海研究院 杨博士

我今天给大家汇报的是三个主要方面。第一、时代背景及呼叫中心大数据需求分析。第二、整个技术架构和研究思路。第三、中国电信在这方面的工作积累。

大家可以看到,语音大数据这件事情,其实它现在是提起来了,但是本质上它对内部的基础研究一直在做,而且它是属于互联网发展起来的。我们看到,比如有两个,有一个就是搜索引擎,我个人感觉这和语音大数据比较类似,尤其是驱动技术比较类似。搜索引擎出现之后,整个互联网才真正的蓬勃发展起来。现在进入产业互联网爆发的时期,这个时期现在大家谈了很多概念,很多技术,也有很多应用在做这个事。但是迄今为止没有看到一个很有突破性,或者很有震撼力的应用出来。通过我们电信的研究和业界的一些资深的专家,或者一些有研究积累的机构进行分析来看,就是语音大数据这件事,对语音的处理这件事,可能是今后十年,或者今后二十年影响企业形态和生态的一个主要的技术。

为什么这么看呢?头几年有几个技术热点,这几个技术热点随着现在的发展越来越被人们认识。第一、云计算,解决了计算资源的调度问题。以前我们做学生的时候,PC机处理性能很有限,现在我能通过云计算技术把很多的服务器集成在一起,处理大规模的问题。

第二、大数据。它提供了一种技术思路和方法,解决了处理大规模数据集的问题。而云计算、大数据,其实刚才我们说到了,搜索引擎的出现,它对互联网还是以整体信息处理这样一个研究的思路。

第三、再加上物联网解决的各类应用系统通信问题,我们今后的发展可以对海量的数据进行处理,按照企业的应用模型,把所有的问题解决出来。

最后一个最关键的技术就是人工智能技术,我们说的最多的语音识别,包括科大讯飞的技术,其实它都是人工智能技术一个基本的体验和应用。我们外面看有人机交互、智能控制等等这些东西。而它的基本内涵的理论研究,说实话基本有几十年的历程,而只是在现在有云计算、大数据和物联网的基础上,能够达到一个很好的应用。

最核心的两个技术就是自然语言处理技术,自然语言处理技术包括云识别,还有包括一个语音理解。语音识别是声音到字的转换,云理解是转化成字,它本身这个学术界大概研究了五六十年,而它作为信息的三种最基本载体其中两样,图像、声音进行文字的处理。而这个处理的目的是干吗?搜索引擎的目的其实就是为了决策,企业用自然语言处理技术也是为了决策,我用信息,怎么获得这个信息,这个信息从哪来,这个信息对我有什么用。

互联网、移动互联网和社会化媒体的出现,刚才大会主持人也说到了,微信出现了之后,它搭建了一个很好的信息流动平台,这个流动平台上面,唱戏的就是信息怎么应用,能改变你信息的交互方式,能使决策信息更准确,而且通过这个信息的流动,带来一个新的模式,比如做广告也好,或者参与决策过程中,或者参与付费也好等等。

从这个图我们能看出来,为什么我们干语音大数据这件事?它从跟Google的对比和搜索引擎的对比其实很像。传统的互联网出现之后,一开始是门户网站,大家什么都有,用户上去找。其次是雅虎分类目录,因为门户网站上的网,网站太多了,我就得有一个分类目录出来,之后通过分类目录达到我的应用的网站。之后搜索引擎出现了,因为分类目录需要人工整理,怎么整理这么多海量的信息,人类是不能穷尽的,而且网站互联网信息在变。

所以我们看下来,搜索引擎的出现之后,才真正的把互联网的产业,互联网的发展推到一个极致,它就是处理一个海量的信息。而我们做语音大数据是怎么想的呢?我们中国电信怎么想?第一、所有的文字和声音信息,企业,我们呼叫中心也好,或者企业的视频网站也好,它首先本企业的信息和外网是互联的,其次所有真正的应用,语音和语义的应用是跟业务相关的,这个业务相关的理解只有企业才能理解,早期的互联网门户网站,进入那个网站才知道,而我如果有一个办法把这些信息连在一块,或者使信息流动起来,同行业之间的信息有一定交互关系,而且基于一些分类统计,或者大数据计算的方法,能够把所有的信息让它有价值和有向的流动,我就能产生一个新的价值,这就是我们电信考虑这个语音大数据的事。

前面是一个铺垫,看电信语音大数据,我在电信领域做了几年的研究,我要服务电信的业务,服务电信的收入。我们做技术研究和电信相关的业务怎么结合?现在就是企业的营销和运营问题。因为现在邮件也好,微博也好,微信也好,数据也好,产生的数据量是相当大的。而且企业不同的OA系统产生的信息量也很大,作为一个企业,每个具体的执行者无法融合这么多信息,他有需求,但是不知道哪块满足这些需求,完成这些东西。所以,我们要通过语音大数据,或者大数据分析解决企业的营销和运营这个问题,这是一个基本的出发点。

具体着手,就是呼叫中心这个事。说到呼叫中心,中国电信做呼叫中心可以说是中国历史上最悠久的。在上海,大家从电信博物馆可以看到,老的上海的查号的,就是现在的114,那时候114的接线员都是坐黄包车去上班的,是最有学问的,最有价值体现的,或者最有身份的一些女性,因为她要掌握技能,还要懂外语。

随着信息技术的发展,呼叫中心一代一代的发展起来,它通过一个传统的呼叫中心,以语音为主,就是打电话进来,查一个什么东西,后面有数据库。之后结合方式,IP这种,视频的东西,能起到一个作用。最后到今天大家看到联络中心,各种都有,包括E-Mail、微信、微博、短信、易信等等,都能接到呼叫中心上来,而且我都能表达我的诉求,腾讯的QQ也可以。之后后面有各种信息处理系统,对声音和文字的处理系统。

我要做两件事,第一、使我处理效率更高,用户来投诉,或者来解决的时候,有一个更好的解决方案。另一件事,使我前面接到的信息主要的热点能及时的反馈到后面的生产和服务系统里。所以,从这件事来看,中国电信做这个事,第一、服务资深企业,第二、中国电信有外包呼叫中心业务,我们对整个呼叫中心的建议和经验积累可以服务各个企业。中国电信是做通信运营商,它立足出发点是服务整个中国企业把信息技术应用好,使企业降低通信成本、节约劳动成本,提升生产效率。

呼叫中心引入新技术干嘛?第一、告诉我有什么功能,知道产品怎么升级。之后,对企业的增量价值来看,我能有什么商机。后面会介绍,呼叫中心、大数据到底价值在那里,前面就是有什么商机。第三、人力成本的竞争,现在中国人力成本越来越贵,中国电信坐席成本越来越贵的,还有最新的,向移动互联网、互联网转型,通过各种接入手段带来的信息,使信息流动更好的来动。

其实传统的大数据特别大,它的种类形态很多,而且产生的速度很快,这几点跟呼叫中心大数据都比较类似。拿Google为例,每天会处理很多信息,或者更大的数据资源,流动的信息,它会很容易抓取,因为它有一个数据处理架构,它的信息演变出来就是现在的大数据跟云计算。但是,呼叫中心大数据其实有一个基本的特点,跟传统大数据是不太一样。它的数据价值含量其实很高。大家可以想一想,打114,或者各个企业的客服,他肯定是带着一定的问题才去打电话,每一通通话都有实际的价值在里面,互联网的信息和企业大数据的信息不一样,它的价值很高。能够很实际的提升企业的服务效率,如果很有效的挖掘出来,也很实际的找到企业产品的一些弱点。所以,这个事是驱动我们中国电信做这个事的一个主要的出发点。它的应用方向,第一、找到新商机。第二、节约人力成本,其实最次的,把许多数据结构化出来,用语音识别和语音理解技术,形成一种自动的人工的问答系统,其实大数据一个基本的处理特点,处理目标是把非结构化的信息变成结构化的统一表达和存储的一个方式或者应用。

从呼叫中心大数据能获得什么?客户诉求、意见建议、市场活动、客户情绪、竞争对手、服务质量提升和坐席技能。我们画这个块,是我们上海电信研究院和集团公司现在主要做的一个事,其他就是客户诉求,还有客户情绪分析,还有竞争对手,是我们在研究下一步主要要做的事情。因为我们中国电信想提供一个普性的,对大数据处理的平台,然后把一些信息技术集成起来,给企业客户进行应用。

稍微具体一点,语音大数据头几年在做什么?首先,以质检这个事为例,因为服务质量肯定要提升。传统是有质检员的,会派50个质检员,质检员每天要听电话。我去上海问他,一个质检员一天最多听多少通电话?一天最多听十几到二十通,因为打客服系统的人多了,可能要打一个小时投诉。质检员听这个电话,要对坐席服务进行评价,哪句话该说,哪句话不该说,所以要反复听,所以这个效率又低了。有一些质量不好的电话,质检员没有听到就过去了,但是如果听到了,要给坐席进行反馈,这个事不应该这么说,我要扣你钱,即便这么做,大概只能做到1%,可能1%都不到,由于我们有上千个坐席。

怎么针对这个事进行解决呢?主要用两个技术,一个是语音识别,一个是语音理解。语音识别,其实也不是很神秘,上个世纪五六十年代就开始做这个事,其实语音识别这个事,背后还有很多的特征技术,包括情感、声音、图片,进行检测等等这些技术,都是对整个的自然语言的发音的一个升学特征进行提取和分析。

但是,为什么还有语义理解呢?如果文本转写每个字都不错,是用还是不用呢?这是第一点。比如我们有另外的项目,做IPTV智能控制,我要看中央一套,一个字都不错,给IPTV播放平台,他也办不了事,我要播控指令才能干这个事,这个就是语音理解干的事。语音理解还要干什么事呢?行业特征分析,因为不同行业的专有名词专有特征,有不同企业的专有名词,专业特征,也是不一样的,只有企业内部的人都知道。我们做呼叫中心语音大数据分析和语音理解技术。

现在看通过声学特征信号听取,和语义分析技术到底能干几件事。从技术最成熟的角度看,第一、语音转文本,把语音转变为准确的文字。第二、关键词检出。关键词检出其实它更基于两种,一种转文本,另外一种相当于本身就用这个关键词去检,在语音模式和声音模式上,就检100个,或者200个关键词。第三、情绪检测,其实正常的服务质量,语音如果有一些异常的情况下,音调和语速会变快,比如音调突然升高,语速一分钟说多少个字,我说话字数就是比较快,一分钟超过240个字,一般人说话,200-220个字之间,尤其坐席,经过培训,控制的字数和语速更有一定的控制力。所以,怎么分析情绪也是一个。第四、静音检测,由于有的时候该说话,有的时候不该说话。第五、语速检测。第六、话者分离,对存储的数据基本都不成一块,就是怎么能把坐席和打电话的话分开,它是通过声文识别的技术,声文识别也是我们下一步要主要研究的,一个是用户认证,还有多语种识别。

后面有案例介绍到中国电信在整个语音识别都做了什么。这就是我们做客服质监产品功能产品的一个示图,就是我能干什么事?所有的这些事是底下的技术一点点堆起来的,并不是我拿过来就用,就是我要切入到某一个行业中的时候,肯定需要一些新的东西完善我后面的搜索引擎。否则它要解决几个事,一个事是录音格式,声音格式,还有识别结果,同音字,同音词,这些怎么去转换的事。

这个是市场机会,其实它也有很多的市场机会。其实现在整个是“互联网+”,还有“一带一路”,还有企业转型,其他所有企业,所有产品都牵扯到一个服务的事。像腾讯、微信和微博,这样的互联网企业也要客服用户的投诉。在网站上遇到什么问题,你怎么给我介绍。生产具体产品的企业,肯定要解决用户投诉的,质量有问题肯定要找个地方来说。所以,市场机会其实还是蛮大的。中国电信提供整个的一个解决方案,包括基础架构。

这是我们现在在做的一个产品,拿出来给各方面汇报的。成单录音分析,电话外呼的那种,提高成单率。热点追踪,比如上海的12345,有一年一些热点事情突然出现,用户打到12345这个电话里来,接电话的都是坐席,叫个体的行为,其实他接到用户投诉的一件事情。另外一个中心也接到这个事情,但是他们俩之间不互相通话,领导怎么知道这个通话率的识别很高,就用这个热点追踪,下面是整个对外呼系统的一个作用,比如首次通话的解决率等等。

说了那么多,其实这个事,中国电信说的很好,到底自己做了什么?因为我是上海研究院的,来电信十来年了,一直做自然语言处理相关的技术。早期的搜索引擎,大家知道114,是我们做的,之后还有一些国家“863项目”,这是第一个应用成果。它项目来源就是国家“863项目”,它服务于世博会,是我们这个项目组参与的。用到电信里是IVR智能语音交互,就是一个小规模的语音识别项目,打电话进来,语音提问的方式找电信的语音营业厅、网点和找他的每天工作时间和他坐的交通,这是我们2010年之后做的。2010年之前,世博会962010中英日法自动语音交互,这个也是我们上海电信我们这个技术团队做的。这个是情绪感测,这是我们内部的项目,就是怎么分析坐席在通话过程中的异常情绪,系统也是在跑,坐席的语音材料,先看哪些是正常的,看现在来的语音是不是正常,发现其实前面我们说的语音建模的事,如果建的好,大概有20%的提升,就是能发现他的情绪电话。

自动转听这个事,在中国电信里大概有三个,第一大家如果是中国电信的手机,现在不是中国电信手机也可以做到,就发118、114这个短信号,查一些目标航班。现在大家说百度也好,但是我们做这个项目的时候是在2010年,那时候百度他们没有,中国电信一直做的最早的就是118和114,结合自助语音的时候,我们技术研究都是走的很早的,而且上线,也被别人引用了,但是对于它技术本身的应用可能稍微落后一点,这就是短信的语义理解,我花费也好,办套餐也好,跟业务相关的,我们有一个自然语言处理这个能力,这个平台现在在上海,上海电信跟指令码对应起来,而且还有一些上下文交互的逻辑,也放在这里了。

热点分析技术,语音识别之后的文字,进行语音特征收集,怎么跟业务相匹配,出了这些东西。我们2010年主要是微博这块的信息全做掉了,我们上海电信内部也看整个网上的信息,看跟中国电信相关的进行分析。

多媒体客服交互技术,解决视频也好,语音也好,E-mail也好,各种媒体交互手段跟呼叫中心进行语音通信的问题,这个我们技术验证也做过了,这个也都做的很早,大概2011-2012年之间,应该更早。

我们电信的网络平台应用常用是采用生态链,在整个国内呼叫中心是做的最好的,而且我们各个地方有很好的集成公司实施这个东西,集成公司本身是在中国电信内部的118也好,114号,我们自己已经练了很久了,应用的需求,开发,或者怎么应用,跟我们研究院已经互动的很好。它是在我们内部用好了之后,才给大家用。所以,我们自己就是这个小白鼠,试好之后,再给大家用。

这个是我们对于整个呼叫中心全媒体概念的一个定义,它解决各种易信、微信、微博各种语音信息识别和处理的问题,之后找到用户关心的和用户未来可能会关心的东西,为用户提供更好的服务,产品模式。

863的项目全称是多语言识别,项目是应用示范,2012年上海市科技进步一等奖。2015年获得上海市技术发明三等奖,在客户,呼叫中心,或者全媒体呼叫中心这个领域,或者业务联络中心这个领域,一句话只有几十个字,几十个字表达一个特定的概念,这个事是2015年参加的这个大会。还有2010年的三等奖,最早给结构化写文本的那个搜索引擎进行推广,这些都是中国电信自己来开发和应用的。2008年是二等奖,整个呼叫中心的二等奖,呼叫中心各种技术集成的一个二等奖,在上海市。下面有上海市的优秀发明选拔赛的奖励,我们这个授权和社会专利大概十来项,论文也十来篇,团队专利和论文写的还不算多,因为我们大部分是实践,开发,标准现在是在做国家的标准。这是我们电信已有的一些项目的情况。MTV也好,车联网也好等等,我们这个团队做的这些项目。这个是中国电信在呼叫中心服务行业认可度的一些获奖。

总结一下,语音大数据,语音识别,语音理解,云计算和社会化媒体五个方面要结合在一起来运用。谢谢大家!

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^