
听云在聚美,大促时陈欧现场亲自督导
又到双十一,笔者电脑里充斥着各购物网站的海量广告,可以预见,这场网络商战将催生出怎样的一个商业传奇?而在背后,又有多少幕后英雄在各自岗位上拼杀?
在笔者微信朋友圈里,便有很多这样可爱的程序员英雄们!面对双十一,据说程序员们会紧张地全员穿上红内裤,还把关公像打印出来摆在办公室中央供奉,挨个给关公递条烟,献上各式果盘,祈求保佑。
当然,上述做法笔者并未亲睹!面对电商大促,几乎所有平台都选择做好预防。
电商双十一等大促挑战
无论是双十一,还是各电商自己的周年庆典日,电商大促一般具有以下四大挑战:
一是流量遭遇峰值;
二是终端设备、网络接入相当复杂;
三是交易额高,用户体验对GMV(成交总额)影响巨大;
四是数字化营销转化成功率压力大。
可以说,每年的双十一等大促对技术团队而言都是一次真枪实弹的数字战争。
双十一大促的四大准备
双十一等大促对电商技术部门而言是一次大考,技术部门在大考前务必要做好以下四点准备:
1、大促活动前要进行现网环境的压力测试,了解系统,提前预估流星,做好服务器、带宽扩容准备;
2、配备一套终端用户时时监控系统,时时关注真实用户的的业务体验,出问题时可以快速报警,提前预知;
3、出现问题时能有一套工具,可以快速定位问题出现在哪里个结点上,判断问题的影响范围。
4、大促对CDN稳定性、性能等要求比较高,运维部门需要了解CDN厂商各地区的解析是否正确。
双十一大促的两大关键:快和准
谷岳静----听云华北互联网技术支持总监,已连续多年在双十一活动当日镇守在各电商平台的第一现场。谷岳静告诉企业网d1net记者,类似双十一等活动大促时,电商的预防目标只有一个:别出事儿。同时把握两大关键点:快而准。
快:指发现问题快,定位问题快!对电商大促而言,时间就是金钱在此体现得分外充分,一分钟的延误可能就是上百万的损失。因此,需要快速发现问题;
准:就是需要对CDN、网络进行快速而准确的诊断,准确判断是运维问题、研发问题还是业务层面的问题?
上图为:听云华北互联网技术支持总监谷岳静
听云:以用户为中心的保障方案
为帮助电商客户快而准的找出并解决问题,听云推出的以用户为中心的保障方案已成功运行多年。防出事儿、快速定位、快速解决,三位一体,全方位监控客户的后台应用性能。
第一步,通过对用户访问的全栈溯源,对如何保障系统在活动期间健康运行?怎样对用户端问题做出快速感知?提前做好预防。
第二,进行快速定位:在如何精准定位性能瓶颈所在?怎样从多维度性能指标中快速定位问题,最终找到答案。
第三步,快速解决:如何快速定位故障负责部门,最终帮助客户实现快速解决,减少影响。
显然,如何在多维度性能指标中快速定位问题是APM的重点与难点,听云通过在指定时间内调度全国各地的监测节点对目标站点/应用发起监测,并周期性地增加同时并发量,通过确定一个系统的瓶颈或者不可用的性能点,来获得系统能提供的最大服务级别的测试;同时通过服务器探针:采集业务系统的性能数据,判断每个应用过程,方法的耗时,并快速定位延迟的代码段。
此外,听云通过上百种精细指标体系,实现快速切片定位问题的根因,这百种精细指标包括了:浏览器端、网络端、移动端、服务器端四大部分。同时,再通过各层指标的行业参考标准进行行业推断。
三重服务我为电商APM代言
而要真正做到双十一等活动大促时万无一失,谷岳静认为:“APM服务,显然并不只是解决方案,更多的是服务。”
在服务方面,听云实现了现场人员+7*24小时的监控团队时刻护航;
集成了多渠道实时告警:短信,邮件,以及人工告警服务,以确保第一时间感知故障问题;
最后,听云实现了故障数据回溯追查功能,可通过全栈多维度回溯性数据分析,确保对故障原因进行快速定位解决。
谷岳静说:“无论是以用户为中心的保障方案,还是我们现场人员+7*24小时的监控团队,对于听云所有员工而言,我们都以APM为电商护航。”