大数据:键盘福尔摩斯

责任编辑:editor005

2015-02-12 14:24:24

摘自:中国大数据

如果想要认识饮料店的可爱店员,可以发挥福尔摩斯般的洞察力以及联想力,依赖网路足迹找出资讯。客户的购买力、贡献度、忠诚度、通路使用、行为变化等等,根据店家所搜集的数据完整度与即时性,进而设计不同分析模式。

大数据

如果想要认识饮料店的可爱店员,可以发挥福尔摩斯般的洞察力以及联想力,依赖网路足迹找出资讯。时至今日,如果要了解「一大群人」的消费习惯或是更多更精细的行为预测,亦可以透过巨量数据的分析,继续安稳的待在萤幕前作键盘福尔摩斯。本次【M.I.C. ╳ IBM 大数据讲座:键盘福尔摩斯】邀请到核桃运算创办人薛文蔚以及IBM资深顾问许佩薰 Patience,带领我们学习键盘福尔摩斯们如何突破盲点,一次了解大数据的前世今生与未来。


  许多人在这个大数据的热潮上一直有所疑惑:难道大数据跟以往所做的分析有任何不同吗?Patience提到过去应用的数据量多在交易等级,例如某客户在银行一周交易五次就算得上大户;现在只要随身携有小米手环或是smart watch,就可以大量取得运动时的心跳、唿吸频率等健康照护的监测数据。也就是说大数据在跨产业上的数据搜集应用能够更加得心应手。

  大数据有 4V之美──数据量成长越来越多(Volume),文字、图片、影音等数据多样性(Variety),价值高(Value),输入和处理速度快而且数据不断行成(Velocity)。透过网路得到的大量数据,数位通路的数据该如何整合应用到先前实体通路等等,现在电子装置搜集数据需要更特殊的演算法加以分析。这些都可能成全未来新兴产业上分析的需求。

大数据

 数据科学家在产业界不同领域的百种应用

Patience举出新加坡交通的适应性控制为例,集时分享处理大量路况资讯,再送到前端处理视情况调整红绿灯,其判别度则可能跟基地台的密度有关。或是欧洲风力发电厂商(VESTAS)欲作投资,则需要得知土地前十年的气温、雨量、土壤硬度等,最后算出最省成本而最大产能的地区。

另外在健康医疗上,可以藉由过去累积数据推测追踪,具有哪些特定基因、生活环境的小朋友在是否将有潜在病徵出现。Patience也提到之前,IBM 的超级电脑"Watson"参加益智节目并赢得比赛,可不只是Google后回答这么简单而已:首先它必须了解主持人的问题,之后再去搜索、过滤、计算大量数据之后,得到正确答案(像人脑应用,而不只是单一机械化的运作)。Waston的演算方法亦应用于其他商务用法,前中后都有不同的应用主题和处理,来判定什么产品容易成功。

实际面对客户分析需求又是怎么样的情况呢?比如说Patience要为电信业者作「客户贡献度」或「流失度」模型。有些情况可能电信业者本身已知(如每当租约到期最易流失客群),所以他们在解释数据时必须想方设法分析出其他没被发现的、跳脱本来业务背景知识就已经知道的事情。像是银行金融工业的数据探测(data mining),如果想知道用户何时可能容易剪卡,他们就可以归纳出正疯狂兑换点数的用户较易有该行为。

就零售业来看,有个很有名的例子讨论「为什么买啤酒就要买尿布」, 用客户购买行为分析来支持销售决策,而不是厂商或店家自己觉得哪些商品比较好卖。或是健康纪录侦测可以设备搜集行为,作预先警醒机智;此外,工厂里从进料制作到产出,都有可能透过数据做决策,像是台积电若要探讨良率,就可以以这些分析过程连结出塬因。

分析流程

首先搜集巨量数据,来源可能有各种社群、通路消费或金融纪录,再依据不同数据性质决定分析方法。必须考虑如何对应数据来源、做出可以支持分析的结果,甚至是需要什么手段、应用于何种客户等等。最后结合到客户端,根据目标客群(targeted audience)及一致化的行为了解模式,透过其惯用通路让客户知道自己是被了解的。

举大卖场、零售的4W分析为例:

Who(卖给谁):高龄化地区比较有机会在上午10点到下午3点的一般上班时间,由阿公带着小朋友逛卖场,一手买人参饮一手买多多。

What(卖什么):洗碗精货架旁边应该摆放沙拉油,因为碗盘油腻时才会需要洗碗精;面包店根据天气来决定每天该准备什么样的产品(材料或成品受天气保存影响大)。

When(什么时候卖):什么时段7-11需要补充洗衣粉?(谁会晚上十点以后在7-11购买洗衣粉?)可能是晚晚下班通勤后回到家上班族,发现家中没有洗衣粉。

Where(在哪里卖):台北市通勤族在同一家连锁分店消费的距离大约在10公里内,也就是办公室与住家距离(客户在分店固定购买行为,可以分析客户忠诚度)。

客户的购买力、贡献度、忠诚度、通路使用、行为变化等等,根据店家所搜集的数据完整度与即时性,进而设计不同分析模式。应用在保险业的话,若欲在不同面向中找出特徵和刺激因子,来判定客户几年后是否会再回来购买保单,可以看看过去购买的保单等级:诸如近十年购买4至8张保单者或购买投资型定期定额保单,显示有定期投资行为就很有可能会再回购保单。大数据甚至可以推测出晚上十点到早上五点的车祸,可能是人为诈欺理赔的机率高--因为证据证人更不容易找到。

前面提到的应用倾向公司持有的客户数据,然而现在电子消费型产品的蓬勃,越来越多着重分析网路社群上的文字数据,来「倾听乡民的声音」。 Patience也说了,关于很多人询问的,现任台北市长「柯P」是如何利用网路了解民意。根据社群网路、关键字分析,他可以得知网友们对于政策的讨论方向或是休闲喜好,来决定应该要制定哪些政策、举办哪些活动或是说哪些话。

大数据分析师们,不论在学界或业界上面对需求者时都必须「倾听」。究竟在面对客户时如何听出背后的问题与需求?Patience提到,必须先了解需求者业务背景现况与规则,以此提出适用的结果讨论和建议才能帮助客户。常言道「见山不是山」,设身处地了解不同角色的需求与想法,针对不同的问题「看穿它」,并找出解决方法。

除了源数据,设计开放问题(open question)得出适意得到的方向、结果,并且大胆假设,小心求证;之后再思考有什么面向可以呈现。最后Patience说明困难点还是在于跟客户的沟通,「不能只回答他塬本第一层的问题,大数据必须告诉他,怎么优化决策和利用资源对他更有利。」

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号