二次大战时,德国纳粹军队所使用的「ENIGMA密码机」(音译:恩尼格玛密码机),可以将普通的讯息,加密成乱码,随着转轮与接线的设定和组合,变化出159京(1016)种密码,利用无线电报的方式,把密码传给远端的伙伴,由接收的一方,用相同的系统解密,还原讯息。
ENIGMA密码机的资讯量庞大,敌军如果没有解密系统,即便是最出色的数学家,也必须拦截大量电报,经过数星期的研究后,才能解开一个密码;然而,ENIGMA密码机只要稍微调节转轮和接线,瞬间就可产生无数组不同的密码。
经过长时间的研究解密,英国的数学家艾伦?图灵(Alan Mathison Turing)结合了统计方法,与长期从情报单位所累积的资料,终于破解了德军的ENIGMA密码机,解密的时间从数周,大幅减短成一个小时之内,盟军也藉着破解德国密码通讯,扭转了大西洋战场的战局,成为二次大战的一个重要转捩点。
3V组合而成的大数据
这几年,人人都在讨论大数据(Big Data、Megadata,或称巨量资料、海量资料、大资料),根据义大利研究顾问公司META Group(现在改称Gartner),分析员Doug Laney在2001年的研究报告中得知,大数据包含「量」(Volume,资料大小)、「速」(Velocity,资料输入输出的速度)与「多变」(Variety,多样性),合称「3V」或「3Vs」,有些企业更在3V之外,新增了真实性(Veracity)和价值(Value)两个V。
大数据近似于在二次大战难以破解的ENIGMA密码机,都拥有庞大的资讯量,并能在短时间之内,快速解构数据;不同的是,大数据包含许多非结构性(见动脑小字典)的数据。
IBM华生实验室经理张书平博士表示,员工本身交流的讯息、客户合作的建议、使用者对产品的看法等,都属于非结构性数据。
早期的技术,无法储存、分析庞大的数据,所以有很多珍贵的资料都被丢掉了;但现在分析技术进步了、所需的成本也降低了,这样的情况下,就看企业要不要处理数据、处理的目的为何,以及该如何处理,这些是企业主使用大数据分析前,需要积极思考的事。
民众走过的痕迹都是不容忽视的线索
根据全球27个行销联盟组成的GlobalDMA,和美国市调顾问公司Winterberry Group,在2015年3月访问了全球17个国家,约3000名广告人员,所做的行销人员使用大数据调查现况报告指出,行销人员最常获得大数据的来源,第一名是网站(66%),接下来依序是,智慧型手机App(58%)、电访(51%)、社群网站(49%)。
星传大中华区数据分析事业总监Kishore Parthasarathy指出,随着科技日渐进步,媒体从传统的电视、报纸、杂誌和广播,演变成各式各样的数位媒体,品牌经营者可以从 Facebook、Twitter、WeChat等社群平台,或是民众所使用的智慧型手机、平板、电脑等媒体载具,收集大量且变化快速的资料。
透过从不同数位媒体收集而来的数据,企业主更能清楚掌握民众的生活脉动,和媒体使用行为,像是民众关心什么议题、在什么时候什么地点、使用什么载体浏览与品牌相关的讯息,藉以规画出更切合民众生活习惯的活动,并进一步分析数据,用客观的数字来判断,在各个不同媒体上应该投放多少的预算。
Parthasarathy强调,每一笔资料都不容忽视,因为多样化的数据,可以慢慢拼凑出消费者的轮廓。而当企业运用大数据时,不仅应该让熟悉大数据的专业人员,来管理和分析各式数据资料,更需要与不同领域的策略伙伴,建立起资料合作关係(data partnership),并与时俱进地利用新科技与新工具,才能从数据中找出更多的机会。
让数字说话找出问题的解答
甲骨文亚太区企业架构师王任远认为,大数据最大的挑战在于,如何统整、储存和分析结构性和非结构性数据,并让数据跟传统的统计学相辅相成,用新的方法和思维,去分析、应用,找出数据的价值。
举例来说,第34届美国盃帆船竞赛(America's Cup),Oracle Team USA就运用从海面上的讯息,像是风速、风向、海面气象等,结合帆船本身收集来各种参数,每天产生近200GB的数据。
透过WIFI传送大量的数据到分析器Oracle Exadata,即使Oracle Team USA的数据分析团队不在比赛现场,都能知道Oracle Team USA当天的表现,哪些地方需要修正和调整。
Oracle Team USA的数据分析团队表示,Oracle Exadata缩短了数据生成及调查的时间。如此一来,各部门就能获得即时数据,并在开会前,先针对自己的部门修正问题。也因此,Oracle Team USA能在短短一天内,就有明显的进步,最后成功打败对手,卫冕冠军宝座。
王任远表示,企业应该要专注在数据资本(data capital)上,看数据能为企业带来什么价值,而价值也会因为产业、部门人员切入的角度不同,产生不同的价值。大数据不是只有企业的科技人员需要了解,行销、业务、财务人员都需要一同学习,因为大数据能够协助做出客观、聪明的决策。
王任远提醒,操作大数据前,企业不该假设如何解答问题,而是要让资料说话,透过跟资料互动,找出商业模式,之后再用简单的统计模型,检测用大数据得出的商业模式是否有效。
有了大数据精準找出民众需求
大数据除了能够应用在比赛中,更可以藉由累积和分析众多的歷史数据,观察民众的喜好、习惯,推荐他们可能需要的商品,Amazon网站近期推出的服务「Amazon Machine Learning」,就是一个很好的例子。
Amazon Machine Learning是以云端运算为基础的服务,协助合作厂商从庞杂的资料中,摘录出对企业最重要的资讯。当网友登入Amazon的网站后,Amazon Machine Learning可以根据网友的购物纪录,从成千上万笔的产品资讯中,找出网友可能会购买的产品,并让他们在30分鐘以内下单。
有了Amazon Machine Learning后,合作厂商和产品研发商可以透过分析数据,优化商品的服务或是消费体验,创造品牌忠诚度,也吸引顾客再次上门。
虽然云端运算服务能够提供企业主更多有用、精準的数据,但IBM华生实验室经理张书平指出,台湾的云端运算服务,因为牵涉到资讯安全,许多厂商不愿意把资料提供给第叁方公司处理,这也导致台湾云端运算技术,虽然讨论声量很高,却很少人因此从中获利。
张书平预估,大数据的发展会愈来愈成熟,并深入到民众的生活中,例如,透过大数据的收集、分析和应用,未来手机App可以客製化帮民众做更多事,是生活小帮手,也能跟手机的主人聊天,「大数据」可能会成为歷史名词,但实际应用会进入到各行各业。
从过去看见未来
大数据行销最迷人的地方在于,从歷史资料中找出精準的消费者洞察,也因此近几年来,大数据行销的话题热度持续延烧。
不过比较可惜的是,台湾因为企业规模小、愿意投注在大数据分析的资本也较少,再加上政府对相关法律的规範,相较于其他国家来得严谨,所以台湾在大数据行销上,仍有许多的发展空间。
利用大数据 赢得美国杯帆船竞赛冠军
Oracle Team USA在美国盃帆船竞赛中,每天观察海面上的讯息,并结合帆船本身的资讯,产生庞大的数据,让后勤的数据分析团队,时时调整、修正不足的地方,靠着理性的分析,成功卫冕冠军宝座。