当前位置:CIO新闻中心 → 正文

互联网+用户体验可度量智能监控平台

责任编辑:cres |来源:企业网D1Net  2016-04-25 16:35:21 原创文章 企业网D1Net

2016年4月23日,由企业网D1Net举办的青岛制造业春季沙龙在青岛隆重举行,制造业的大咖云集,干货纷呈,围绕制造业的IT规划、实施落地及应用,CTO/CIO碰撞思想和观点,交流经验教训和心得。

主持人:下面有请听云北区技术总监李虎的演讲,他演讲的题目是互联网+用户体验可度量智能监控平台。
 

听云北区技术总监 李虎

李虎:大家下午好,我看大家其实是有些困了,所以争取和大家说一些不一样的东西,PPT可能也是比较传统的,我尽量讲一些新的东西,我今天演讲的题目是《互联网+用户体验可度量智能监控平台》,大家看标题可能有点绕,不要消耗太多的脑细胞。我希望给IT运营、运维带来一些新的思路。

这是我们讲的一些趋势,其实大家应该知道,现在互联网以及我们的移动手机就像忽如一夜春风来,说起来就起来了,大家有没有关注过一个数据,现在移动终端的智能手机和平板电脑大概在国内有多少量?大家可以猜一猜,截止到2015年底,我看过国内一个移动互联网的数据分析机构的报告,是8.99亿,大家知道微信的月活跃用户是多少吗?是5.99亿,其实不仅仅是现在的社交,包括我们的生活以及游戏、视频、工作,其实我觉得作为现在的管理者其实更多的应该是我们在关注企业的各种各样的应用,他们也会随着互联网的浪潮逐步地兴起,因为大环境是这样的,他们也会去驱动我们去做这些方面的建设和投入,我觉得现在其实是这样的,以前我们可能知道九十年代我们访问互联网是干什么,可能家里有一台PC机,当时访问的有新浪、网易、TOM,我们就是看看新闻,后来有邮箱,开始有一点点办公的需求,后来有视频、游戏等发展,无论是应用还是架构都发生了非常大的变化。

这个是我专门做的一张图片,其实在以前还没有这么多的东西,以前就是PC机通过互联网的网络传输到了外部服务器,可能以前是比如我们经常学习的时候,接触的是微软,这是外部服务器,后来随着应用的发展,我们开始有了一些中间件,会让我们的业务可以更复杂,再后来我们有数据库,当然还有我们经常用的东西,这些是随着业务的发展逐步变化的。

现在随着移动手机的增多, IT架构呈爆炸式增长,比如现在有了CDN,还有很火的大数据,刚才也讲到了企业如何运用大数据,当然还有云计算,阿里、腾讯、华为都在做云计算,互联网给我们带来了便捷,但是给IT也带来了很多的困扰,这就是IT需要考虑的问题,以前我们说做IT,我们是做什么样的IT?其实所有的工作是围绕着数据中心在做运维,我们的运营都是围绕着数据中心,其实,互联网一直在变化,但是有一个东西一直没有变,就是用户体系,华为提出以用户为中心,互联网提出比较初始的方案,吊丝经济,这就是用户体验第一,用户为王,我们如何把用户体验的思维贯穿到运用里面,我们公司就是希望改变原有的运维模式,希望给运营、运维带来的是,让我们的运维、研发、运营团队能够走出数据中心,能够真真正正地关注用户端的使用体验到底是怎么样的,其实体现在国际机构进行合作的时候,Gartner大家都听说过,国内,Gartner是和我们唯一一家合作的伙伴,我们一起做了一个定义,这五项是作为用户体验最直观的标准的数据,其中第一项就是最终用户体验监控,这个其实是改版,其实是希望IT由原来的面向数据中心,面向自己内部的工作方法能够走出来,面向用户端,大家可能会问,数据中心不弄了吗?不是的,是以前由数据中心倒推外面的人好还是不好,我们就是反过来,我们看用户端使用的好不好,然后倒推数据中心怎么建设,以前我们总是提IT驱动,现在是业务驱动,以前我们的IT是支撑中心,我们现在希望IT是什么呢?是利润中心、赚钱的部门。所以其实也是对我们IT地位的提升。

其中,我们去看用户体验提升是怎么做的,表现在用户端,其实我们的业务形态可能是一个APP,也可能是一个微信公众号,但是更多的可能其实对于我们的企业来说是外部界面,PC打开,其实还是处在转的过程当中,以后可能没有PC了,但是现在我们的核心系统,比如财务,还有业务系统还是通过PC,这些业务性能我们首先要做的事情是什么?我们先把用户体验获取到,获取到之后,我们希望通过全国获取各种各样的数据得到非常大的加权的均值,也就是说我们会给咱们提供一个行业指标,然后我们和行业指标对比,在什么行业是什么应用,处在什么样的等级是好的,应该怎么去优化,优化到什么程度是最好的,这个是用户端,当然用户端之后还有传输,可能是一个PC,我们用户端发起请求之后进入网络传输,我们现在用的最常见的就是CDN比较多,还有云数据中心,还有就是进入后端,假设我们看用户端的时候,发现用户端没有问题,其实我们不用看后端,如果我们发现用户端确实很卡的时候,我们就要分析传输,下一步还要分析后端,业务逻辑以及数据库的查询,首先我们从用户端入手作为一个时间的切片,把APP、PC端每一个环节发起请求的时间、建立连接,到收包、首屏做了一个定义,用户体验最主要的感受就是首屏,用户最直观的感受是首屏以及还有往后整体页面的下载,我们做了切片,我们会切到后面,可以切到业务逻辑代码,是什么样的情况,以及业务代码在数据库的时候又是什么样的情况,我们为什么要提用户体验呢?其实用户体验代表什么东西?我不知道大家有没有关注过用户留存率,但是我们内部可能会说,我的系统就是内部用,你爱用不用,你今天签到、报财务,你不用就报不了,当然这个是一种,你其实一样也要考虑,因为当他发现外部系统都很快,用你的系统都很慢,你的形象也发生很大的影响,当然我们提互联网的时候,我们提用户留存率,叫获客成本,现在很多公司在做互联网+推广的时候,会关注获客成本,这个是什么意思?这个会影响到公司的利润,会影响到推广费用是不是有效,为什么我刚才说IT是原来的支撑部门转变成业务部门、利润部门,其实就是在这个地方,提高用户的留存率、用户体验,给我们公司带来的利润。

我们公司做这个东西,其实以前可能大家没有听过听云这家公司,其实我们公司从2007年成立,以前我们是做互联网,互联网最应该关注用户体验,为什么互联网关注用户体验?假设有一天你在淘宝买一个东西,他卡住了,你首先做的是去京东看一看,如果价格一样,你还会在淘宝买吗?所以无论是在购物、游戏,体验不好就会走,现在我们逐步的也是在做企业市场,因为企业的应用越来越复杂,一个是越来越复杂,第二就是用的人越来越多,我们逐步的再去把我们的互联网公司能够接受的思维面向用户端倒推看数据中心的模式推给大家,因为运维本身是很复杂的事情,为了把东西做得简单,我们做了四点,一个是用户体验评分体系,第二是网络时间切片,第三是后台应用逻辑拓扑,第四就是应用过程和每段代码的时间偏移量。

看一下用户体验评分,我们的业务形态,在我们的用户端先说最重要的就是PC访问业务系统,能不能登上去,是不是有人反馈电脑重启才能登上去,还有就是打开的时间,比如操作一个APP,是不是有卡顿,是不是有白屏,有没有菊花转来转去,叫车的时候叫不上去可能就转易到等等,这个就是APP端用户体验,还有就是现在很多的微信公众号就是我们自己做的HTML5界面,比如我们看朋友圈,有人分享的文章很快就可以打开,有人分享就打不开,有没有考虑公司好不容易找到自己的公司的朋友转发,其他人打不开就关了,有没有考虑到这种问题?我们做的是用户体验评分,这有什么意义?我们首先做的事情就是量化,量化完之后干什么?我们全国APP这块有六个亿的嵌码量,我们可以得到均值,比如响应时间是多少,崩溃率是多少,表现在PC端也是一样,京东做什么事情?每天问我们,我们全国建了大约30万的会员体系,我们天天在帮助京东分析它的网站打开速度怎么样,淘宝的打开速度怎么样,天猫的打开速度怎么样,京东天天分析这些东西,我们一天24小时京东分析得比较细,500多个城市,我们每半个小时发起一次请求,如果京东比别人慢了,别人就不去那里。比如我还没有互联网业务,有互联网业务也没有那么重要,但是大家有没有想一个问题,有一部分集团当你做IT建设发展规划方向发展的时候,是不是需要一些数据的支撑,比如你想不想了解竞争对手、友商性能如何,是不是比别人弱,是不是有赶上的空间,这是用户体验评分体系,我们把它量化,有行业的标准去协助你做优化调整,第二就是网络时间切片,这是什么意思?当我们知道了我们的用户体验,现在是好还好,不好了之后,要干什么?对问题进行处理,这个时候我们是从用户视角开始帮助你分析一整套监控流程,到什么环节出问题,以前可能是需要很多的经验,很多的方面去分析,大家做运维的时候,说过一个笑话,最怕老板和老板的朋友,不知道大家有没有听过这个笑话,我觉得肯定会有人遇到过,突然有老板打电话说这个系统不行,我在河北一个电视台他们做了一个视频直播,所有的监控都非常好,但是还是很紧张,总是有领导说,我打不开,然后他们就很头大,为什么?所有的监控都是正常的,视频直播也是正常的,但是老板总是说打不开,他们很郁闷,最后找到我们,给分析到河北11个地市所有的运营商,联通、移动、电信的系统怎么样,让我们做一个分析,实际上是有某一个区域的移动用户确实打不开,怎么办?其实这个问题是可以解决的,电视台给移动打了电话一下子就解决了,一检查路游是有问题的。这个就是切片,我们会告诉你什么环节出问题了,当然我们的业务系统大部分的问题集中在什么地方?集中在内部数据中心,网络层可能没有那么多问题,我们到数据中心业务逻辑或者是框架本身就有问题,这个时候我们应该怎么处理?大家看这个图,画得很复杂,刚才也看到我们这边儿有一个也很复杂的图,就是定单,不知道咱们有没有人可以说清楚我们内部逻辑怎么调用的,比如一个用户单子来了,是怎么样的流转流程?可能都说不清楚,运维三板斧是什么?就是重启、重装、换设备,有没有发现换了之后还是没有解决掉,其实这是很尴尬的,申请了费用,我们的某一个系统慢,但是加了之后还是不行,因为没有正面面对问题,为什么隔5天重启一次,政府现在没有那么着急,他们就是这种情况,我说你们应该快速的把问题处理掉,他们说没有关系,5天重启一次,为什么要做脚本,如果不做,只能撑三天左右,这个系统肯定会死,要手动重启,其实可以换一种思路,为什么需要重启、重装换设备,因为我们没有了解架构,不了解系统之间是怎么运作的。很多时候的问题是内部有问题的,解决不了,所以要重启、扩容,有没有其他的办法?

我们的系统越来越复杂的时候,有定单、客服、CRM,但是一出问题就搞不清楚问题出在什么地方,最后发现内部有问题解决不了就是重启,这个就是让我们了解应用、架构,以前我们去了解网络,其实似曾相识,网络拓扑图肯定有,现在一看CRM有问题,就解决它好了。

然后看应用过程和每段代码的时间偏移量,我们可以把应用的过程和代码展示出来,比如假设发现是CRM系统有问题,黄色已经标出来了,进一步检查就可以得出CRM的哪段代码有问题,这段代码是不是数据库的问题,我们全部展示出来,这样的话,可能又会有一个疑问,展示出来有什么用呢?这个系统又不是我开发的,是我买的,有什么用呢?其实这样至少让你清楚问题出在什么环节,不会盲目地做IT的规划和建设,导致之后发现还是不行,至少可以发现问题出在什么地方。

首先改变思路,从用户端开始,然后我们做时间切片,希望让我们能够快速地把问题处理掉,降低问题的留存率,增加访问体验。我们看上面的图,一个是中医,一个是西医,可能我们传统的运维、运营更是像是中医,我们系统出问题了,叫一堆厂商来,或者是一堆部门的人过来,比如什么业务部门系统卡了,把防火墙、加密、开发的叫来,把服务器、虚拟化都叫来,他们会干什么?要解决问题,但是大家有没有发现问题,每个公司第一件做的事情是什么?有的不太讲技巧,这不是我们的问题,有的讲技巧说会论证很长时间这不是我们的问题,等说完不是我们的问题,又说虽然不是我们的问题,但是我们也会协助你们去解决,到最后其实大家这个问题解决下来很慢,一个很复杂的问题,我觉得我们作为领导,肯定深有感触,像政府部门的大系统,一个月能解决就很不错了,那种处理日程下来,你依赖的是什么?希望公司给你派牛的架构师,或者是很牛的老员工过来,因为他有经验。

但是现在呢?我们应该换一种思路,什么思路呢?我们要去借助右边这个,遇到小的问题,比如感冒发烧中医西医都很好,比如感冒颗粒中医也可以治,但是遇到肿瘤,还会去吃中药吗,肯定不会了,当你遇到大的问题,重要的事情,还是希望借助专业的,可量化、可视的工具去帮助我们去分析问题、解决问题,这才是目前我们在面对互联网+,面对90后这种小伙伴们访问业务系统的时候,它的一种严苛的要求下做的事情,就是快速地把问题解决掉,而不像以前一个系统挂一个周无所谓,为什么?因为运内系统不重要,现在做信息化,很多的系统一分钟都不能断,第一个要从前端到后端都要做快速地展示和定位、解决问题。

我们看现在的处理流程,我们在做运营的时候,是一般运维处理的流程,事件报告流程,就是我们会接到投诉,如果是简单的问题简单处理,大家想一个问题,用滴滴打车的时候,卡了会去投诉吗?或者是用爱奇艺视频的时候会投诉吗?不会,可能有其他的选择,我们作为一个企业,在做这种互联网尝试的时候,如果接到一个投诉,后端可能是一千人都有问题,第二,你知道怎么去解决了吗?当你清楚的时候,其实已经晚了,我们就通过这种快速切片的方式,从用户端监控的方式可以让你快速地能够在用户还没有投诉,我们希望在用户还没有投诉的时候,能够让你知道这个问题,其实我们内部系统肯定有人投诉,我知道政府很典型,每天早上9点有20人打不开,这会有什么后果?政府部门9点的时候打不开,这200人是营业厅柜台里面的人,他们的后果就是后面一排人在排着队,这就是公众对IT建设的不信任和置疑,当然我们大多数是面向自己的使用者,他们也是一样的,我们的使用者在使用的时候,会说现在所有的业务都很正常,就我们内部使用很烂,不会公开地说,但是也有这样的置疑,我们为什么不随着互联网把系统做得更好?

这个是我们提供听云的模式,我们在极力地避免我们在卖什么产品,我们是平台+服务,我们是整套的体系,从前端到后端做量化、切片、定位,同时我们还希望提供服务,为什么服务比较重要?也是我们比较想去告诉大家的事情,其实我们自己的公司一定也有IT,我们的IT可以解决80%的问题都不是问题,还有20%的问题,值不值得自己找很专业的专家作为专职员工呢?我觉得可以选用品牌、服务去解决比较疑难的问题,我觉得这种专业的公司有什么好处呢?没有吃过猪肉但是见过猪跑,其实我们一直在说,其实我们做互联网做了很长的时候,可能对互联网优化更专注一些,我们可能更多的知道京东、阿里等其他的公司架构是什么样的,遇到的问题应该怎么解决。

我再回头说一下我们希望给用户提供什么东西,第一,快慢数字化,我们希望以前我们在表达系统的时候,我们的速度有提升了,我们把形容词变成数字,我们的响应时间是多少秒,通过迭代现在的时间是多少秒,然后我们量化,然后供应我们参考。第二就是希望把访问的业务流程做一个切片,让你可以快速地知道什么环节出问题,可以快速地解决,从用户端的用户开始一直到后面代码的逻辑,一直到代码级的定位。第三就是希望我们提供的是一个平台+服务,这样可以让我们第一个不用改变我们原有的IT架构还可以提供更好的IT支撑,目标就是能够希望在用户投诉前发现问题,第二个就是这种平台+服务的方式可以降低我们的IT运营的成本,能够提高我们IT运营的效率,这是我整体总结出来的一些观点,谢谢大家。

关键字:互联网智能监控

原创文章 企业网D1Net

x 互联网+用户体验可度量智能监控平台 扫一扫
分享本文到朋友圈
当前位置:CIO新闻中心 → 正文

互联网+用户体验可度量智能监控平台

责任编辑:cres |来源:企业网D1Net  2016-04-25 16:35:21 原创文章 企业网D1Net

2016年4月23日,由企业网D1Net举办的青岛制造业春季沙龙在青岛隆重举行,制造业的大咖云集,干货纷呈,围绕制造业的IT规划、实施落地及应用,CTO/CIO碰撞思想和观点,交流经验教训和心得。

主持人:下面有请听云北区技术总监李虎的演讲,他演讲的题目是互联网+用户体验可度量智能监控平台。
 

听云北区技术总监 李虎

李虎:大家下午好,我看大家其实是有些困了,所以争取和大家说一些不一样的东西,PPT可能也是比较传统的,我尽量讲一些新的东西,我今天演讲的题目是《互联网+用户体验可度量智能监控平台》,大家看标题可能有点绕,不要消耗太多的脑细胞。我希望给IT运营、运维带来一些新的思路。

这是我们讲的一些趋势,其实大家应该知道,现在互联网以及我们的移动手机就像忽如一夜春风来,说起来就起来了,大家有没有关注过一个数据,现在移动终端的智能手机和平板电脑大概在国内有多少量?大家可以猜一猜,截止到2015年底,我看过国内一个移动互联网的数据分析机构的报告,是8.99亿,大家知道微信的月活跃用户是多少吗?是5.99亿,其实不仅仅是现在的社交,包括我们的生活以及游戏、视频、工作,其实我觉得作为现在的管理者其实更多的应该是我们在关注企业的各种各样的应用,他们也会随着互联网的浪潮逐步地兴起,因为大环境是这样的,他们也会去驱动我们去做这些方面的建设和投入,我觉得现在其实是这样的,以前我们可能知道九十年代我们访问互联网是干什么,可能家里有一台PC机,当时访问的有新浪、网易、TOM,我们就是看看新闻,后来有邮箱,开始有一点点办公的需求,后来有视频、游戏等发展,无论是应用还是架构都发生了非常大的变化。

这个是我专门做的一张图片,其实在以前还没有这么多的东西,以前就是PC机通过互联网的网络传输到了外部服务器,可能以前是比如我们经常学习的时候,接触的是微软,这是外部服务器,后来随着应用的发展,我们开始有了一些中间件,会让我们的业务可以更复杂,再后来我们有数据库,当然还有我们经常用的东西,这些是随着业务的发展逐步变化的。

现在随着移动手机的增多, IT架构呈爆炸式增长,比如现在有了CDN,还有很火的大数据,刚才也讲到了企业如何运用大数据,当然还有云计算,阿里、腾讯、华为都在做云计算,互联网给我们带来了便捷,但是给IT也带来了很多的困扰,这就是IT需要考虑的问题,以前我们说做IT,我们是做什么样的IT?其实所有的工作是围绕着数据中心在做运维,我们的运营都是围绕着数据中心,其实,互联网一直在变化,但是有一个东西一直没有变,就是用户体系,华为提出以用户为中心,互联网提出比较初始的方案,吊丝经济,这就是用户体验第一,用户为王,我们如何把用户体验的思维贯穿到运用里面,我们公司就是希望改变原有的运维模式,希望给运营、运维带来的是,让我们的运维、研发、运营团队能够走出数据中心,能够真真正正地关注用户端的使用体验到底是怎么样的,其实体现在国际机构进行合作的时候,Gartner大家都听说过,国内,Gartner是和我们唯一一家合作的伙伴,我们一起做了一个定义,这五项是作为用户体验最直观的标准的数据,其中第一项就是最终用户体验监控,这个其实是改版,其实是希望IT由原来的面向数据中心,面向自己内部的工作方法能够走出来,面向用户端,大家可能会问,数据中心不弄了吗?不是的,是以前由数据中心倒推外面的人好还是不好,我们就是反过来,我们看用户端使用的好不好,然后倒推数据中心怎么建设,以前我们总是提IT驱动,现在是业务驱动,以前我们的IT是支撑中心,我们现在希望IT是什么呢?是利润中心、赚钱的部门。所以其实也是对我们IT地位的提升。

其中,我们去看用户体验提升是怎么做的,表现在用户端,其实我们的业务形态可能是一个APP,也可能是一个微信公众号,但是更多的可能其实对于我们的企业来说是外部界面,PC打开,其实还是处在转的过程当中,以后可能没有PC了,但是现在我们的核心系统,比如财务,还有业务系统还是通过PC,这些业务性能我们首先要做的事情是什么?我们先把用户体验获取到,获取到之后,我们希望通过全国获取各种各样的数据得到非常大的加权的均值,也就是说我们会给咱们提供一个行业指标,然后我们和行业指标对比,在什么行业是什么应用,处在什么样的等级是好的,应该怎么去优化,优化到什么程度是最好的,这个是用户端,当然用户端之后还有传输,可能是一个PC,我们用户端发起请求之后进入网络传输,我们现在用的最常见的就是CDN比较多,还有云数据中心,还有就是进入后端,假设我们看用户端的时候,发现用户端没有问题,其实我们不用看后端,如果我们发现用户端确实很卡的时候,我们就要分析传输,下一步还要分析后端,业务逻辑以及数据库的查询,首先我们从用户端入手作为一个时间的切片,把APP、PC端每一个环节发起请求的时间、建立连接,到收包、首屏做了一个定义,用户体验最主要的感受就是首屏,用户最直观的感受是首屏以及还有往后整体页面的下载,我们做了切片,我们会切到后面,可以切到业务逻辑代码,是什么样的情况,以及业务代码在数据库的时候又是什么样的情况,我们为什么要提用户体验呢?其实用户体验代表什么东西?我不知道大家有没有关注过用户留存率,但是我们内部可能会说,我的系统就是内部用,你爱用不用,你今天签到、报财务,你不用就报不了,当然这个是一种,你其实一样也要考虑,因为当他发现外部系统都很快,用你的系统都很慢,你的形象也发生很大的影响,当然我们提互联网的时候,我们提用户留存率,叫获客成本,现在很多公司在做互联网+推广的时候,会关注获客成本,这个是什么意思?这个会影响到公司的利润,会影响到推广费用是不是有效,为什么我刚才说IT是原来的支撑部门转变成业务部门、利润部门,其实就是在这个地方,提高用户的留存率、用户体验,给我们公司带来的利润。

我们公司做这个东西,其实以前可能大家没有听过听云这家公司,其实我们公司从2007年成立,以前我们是做互联网,互联网最应该关注用户体验,为什么互联网关注用户体验?假设有一天你在淘宝买一个东西,他卡住了,你首先做的是去京东看一看,如果价格一样,你还会在淘宝买吗?所以无论是在购物、游戏,体验不好就会走,现在我们逐步的也是在做企业市场,因为企业的应用越来越复杂,一个是越来越复杂,第二就是用的人越来越多,我们逐步的再去把我们的互联网公司能够接受的思维面向用户端倒推看数据中心的模式推给大家,因为运维本身是很复杂的事情,为了把东西做得简单,我们做了四点,一个是用户体验评分体系,第二是网络时间切片,第三是后台应用逻辑拓扑,第四就是应用过程和每段代码的时间偏移量。

看一下用户体验评分,我们的业务形态,在我们的用户端先说最重要的就是PC访问业务系统,能不能登上去,是不是有人反馈电脑重启才能登上去,还有就是打开的时间,比如操作一个APP,是不是有卡顿,是不是有白屏,有没有菊花转来转去,叫车的时候叫不上去可能就转易到等等,这个就是APP端用户体验,还有就是现在很多的微信公众号就是我们自己做的HTML5界面,比如我们看朋友圈,有人分享的文章很快就可以打开,有人分享就打不开,有没有考虑公司好不容易找到自己的公司的朋友转发,其他人打不开就关了,有没有考虑到这种问题?我们做的是用户体验评分,这有什么意义?我们首先做的事情就是量化,量化完之后干什么?我们全国APP这块有六个亿的嵌码量,我们可以得到均值,比如响应时间是多少,崩溃率是多少,表现在PC端也是一样,京东做什么事情?每天问我们,我们全国建了大约30万的会员体系,我们天天在帮助京东分析它的网站打开速度怎么样,淘宝的打开速度怎么样,天猫的打开速度怎么样,京东天天分析这些东西,我们一天24小时京东分析得比较细,500多个城市,我们每半个小时发起一次请求,如果京东比别人慢了,别人就不去那里。比如我还没有互联网业务,有互联网业务也没有那么重要,但是大家有没有想一个问题,有一部分集团当你做IT建设发展规划方向发展的时候,是不是需要一些数据的支撑,比如你想不想了解竞争对手、友商性能如何,是不是比别人弱,是不是有赶上的空间,这是用户体验评分体系,我们把它量化,有行业的标准去协助你做优化调整,第二就是网络时间切片,这是什么意思?当我们知道了我们的用户体验,现在是好还好,不好了之后,要干什么?对问题进行处理,这个时候我们是从用户视角开始帮助你分析一整套监控流程,到什么环节出问题,以前可能是需要很多的经验,很多的方面去分析,大家做运维的时候,说过一个笑话,最怕老板和老板的朋友,不知道大家有没有听过这个笑话,我觉得肯定会有人遇到过,突然有老板打电话说这个系统不行,我在河北一个电视台他们做了一个视频直播,所有的监控都非常好,但是还是很紧张,总是有领导说,我打不开,然后他们就很头大,为什么?所有的监控都是正常的,视频直播也是正常的,但是老板总是说打不开,他们很郁闷,最后找到我们,给分析到河北11个地市所有的运营商,联通、移动、电信的系统怎么样,让我们做一个分析,实际上是有某一个区域的移动用户确实打不开,怎么办?其实这个问题是可以解决的,电视台给移动打了电话一下子就解决了,一检查路游是有问题的。这个就是切片,我们会告诉你什么环节出问题了,当然我们的业务系统大部分的问题集中在什么地方?集中在内部数据中心,网络层可能没有那么多问题,我们到数据中心业务逻辑或者是框架本身就有问题,这个时候我们应该怎么处理?大家看这个图,画得很复杂,刚才也看到我们这边儿有一个也很复杂的图,就是定单,不知道咱们有没有人可以说清楚我们内部逻辑怎么调用的,比如一个用户单子来了,是怎么样的流转流程?可能都说不清楚,运维三板斧是什么?就是重启、重装、换设备,有没有发现换了之后还是没有解决掉,其实这是很尴尬的,申请了费用,我们的某一个系统慢,但是加了之后还是不行,因为没有正面面对问题,为什么隔5天重启一次,政府现在没有那么着急,他们就是这种情况,我说你们应该快速的把问题处理掉,他们说没有关系,5天重启一次,为什么要做脚本,如果不做,只能撑三天左右,这个系统肯定会死,要手动重启,其实可以换一种思路,为什么需要重启、重装换设备,因为我们没有了解架构,不了解系统之间是怎么运作的。很多时候的问题是内部有问题的,解决不了,所以要重启、扩容,有没有其他的办法?

我们的系统越来越复杂的时候,有定单、客服、CRM,但是一出问题就搞不清楚问题出在什么地方,最后发现内部有问题解决不了就是重启,这个就是让我们了解应用、架构,以前我们去了解网络,其实似曾相识,网络拓扑图肯定有,现在一看CRM有问题,就解决它好了。

然后看应用过程和每段代码的时间偏移量,我们可以把应用的过程和代码展示出来,比如假设发现是CRM系统有问题,黄色已经标出来了,进一步检查就可以得出CRM的哪段代码有问题,这段代码是不是数据库的问题,我们全部展示出来,这样的话,可能又会有一个疑问,展示出来有什么用呢?这个系统又不是我开发的,是我买的,有什么用呢?其实这样至少让你清楚问题出在什么环节,不会盲目地做IT的规划和建设,导致之后发现还是不行,至少可以发现问题出在什么地方。

首先改变思路,从用户端开始,然后我们做时间切片,希望让我们能够快速地把问题处理掉,降低问题的留存率,增加访问体验。我们看上面的图,一个是中医,一个是西医,可能我们传统的运维、运营更是像是中医,我们系统出问题了,叫一堆厂商来,或者是一堆部门的人过来,比如什么业务部门系统卡了,把防火墙、加密、开发的叫来,把服务器、虚拟化都叫来,他们会干什么?要解决问题,但是大家有没有发现问题,每个公司第一件做的事情是什么?有的不太讲技巧,这不是我们的问题,有的讲技巧说会论证很长时间这不是我们的问题,等说完不是我们的问题,又说虽然不是我们的问题,但是我们也会协助你们去解决,到最后其实大家这个问题解决下来很慢,一个很复杂的问题,我觉得我们作为领导,肯定深有感触,像政府部门的大系统,一个月能解决就很不错了,那种处理日程下来,你依赖的是什么?希望公司给你派牛的架构师,或者是很牛的老员工过来,因为他有经验。

但是现在呢?我们应该换一种思路,什么思路呢?我们要去借助右边这个,遇到小的问题,比如感冒发烧中医西医都很好,比如感冒颗粒中医也可以治,但是遇到肿瘤,还会去吃中药吗,肯定不会了,当你遇到大的问题,重要的事情,还是希望借助专业的,可量化、可视的工具去帮助我们去分析问题、解决问题,这才是目前我们在面对互联网+,面对90后这种小伙伴们访问业务系统的时候,它的一种严苛的要求下做的事情,就是快速地把问题解决掉,而不像以前一个系统挂一个周无所谓,为什么?因为运内系统不重要,现在做信息化,很多的系统一分钟都不能断,第一个要从前端到后端都要做快速地展示和定位、解决问题。

我们看现在的处理流程,我们在做运营的时候,是一般运维处理的流程,事件报告流程,就是我们会接到投诉,如果是简单的问题简单处理,大家想一个问题,用滴滴打车的时候,卡了会去投诉吗?或者是用爱奇艺视频的时候会投诉吗?不会,可能有其他的选择,我们作为一个企业,在做这种互联网尝试的时候,如果接到一个投诉,后端可能是一千人都有问题,第二,你知道怎么去解决了吗?当你清楚的时候,其实已经晚了,我们就通过这种快速切片的方式,从用户端监控的方式可以让你快速地能够在用户还没有投诉,我们希望在用户还没有投诉的时候,能够让你知道这个问题,其实我们内部系统肯定有人投诉,我知道政府很典型,每天早上9点有20人打不开,这会有什么后果?政府部门9点的时候打不开,这200人是营业厅柜台里面的人,他们的后果就是后面一排人在排着队,这就是公众对IT建设的不信任和置疑,当然我们大多数是面向自己的使用者,他们也是一样的,我们的使用者在使用的时候,会说现在所有的业务都很正常,就我们内部使用很烂,不会公开地说,但是也有这样的置疑,我们为什么不随着互联网把系统做得更好?

这个是我们提供听云的模式,我们在极力地避免我们在卖什么产品,我们是平台+服务,我们是整套的体系,从前端到后端做量化、切片、定位,同时我们还希望提供服务,为什么服务比较重要?也是我们比较想去告诉大家的事情,其实我们自己的公司一定也有IT,我们的IT可以解决80%的问题都不是问题,还有20%的问题,值不值得自己找很专业的专家作为专职员工呢?我觉得可以选用品牌、服务去解决比较疑难的问题,我觉得这种专业的公司有什么好处呢?没有吃过猪肉但是见过猪跑,其实我们一直在说,其实我们做互联网做了很长的时候,可能对互联网优化更专注一些,我们可能更多的知道京东、阿里等其他的公司架构是什么样的,遇到的问题应该怎么解决。

我再回头说一下我们希望给用户提供什么东西,第一,快慢数字化,我们希望以前我们在表达系统的时候,我们的速度有提升了,我们把形容词变成数字,我们的响应时间是多少秒,通过迭代现在的时间是多少秒,然后我们量化,然后供应我们参考。第二就是希望把访问的业务流程做一个切片,让你可以快速地知道什么环节出问题,可以快速地解决,从用户端的用户开始一直到后面代码的逻辑,一直到代码级的定位。第三就是希望我们提供的是一个平台+服务,这样可以让我们第一个不用改变我们原有的IT架构还可以提供更好的IT支撑,目标就是能够希望在用户投诉前发现问题,第二个就是这种平台+服务的方式可以降低我们的IT运营的成本,能够提高我们IT运营的效率,这是我整体总结出来的一些观点,谢谢大家。

关键字:互联网智能监控

原创文章 企业网D1Net

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^