当前位置:大数据业界动态 → 正文

大数据正潜移默化改变着一切

责任编辑:editor004 |来源:企业网D1Net  2013-12-17 17:54:32 本文摘自:数字商业时代

《时代周刊》为了选不选斯诺登做2013年度封面犹豫了很久,而大数据时代的到来已无需纠结。

从2013年6月初,斯诺登揭发美国的“棱镜门”事件,到九大互联网巨头卷入美国监控全球互联网计划,再到斯诺登到俄罗斯寻求避难,最后到美国政府斡旋大数据监控是为了所谓的“反恐”。这个通过分析海量通讯数据获取安全情报的大数据案例,让围绕大数据的话题与反思不断发酵,也让2013被称为“大数据元年”。

从可以自动转弯和刹车的汽车,到IBM沃森超级电脑在游戏节目《危险边缘》中打败人类,这项技术终将改变我们所居住的星球上的生活与生意。

一位居住在纽约布鲁克林的软件开发者 Federico Zannier“把自己卖了”,他通过发起“A bite of Me”项目,不断收集自己所有的数字轨迹,并挂到网站上销售。“那些公司在用我的数据赚钱,当你接受那些使用条款时,你就已经把这些数据的使用权白送给他们了。”

的确,亚马逊监视着我们的购物习惯,谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的“TA”,还有我们的社交关系网。

大数据能够越来越精确地预测世界的事情以及我们所处的位置,我们却还没准备好接受它对我们的隐私和决策过程带来的影响。我们的认知和制度都还不习惯这样一个数据充裕的时代,因为它们都建立在数据稀缺的基础之上。在大数据时代,不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了。

“斯诺登效应”还在继续,大数据时代的生存规则也将被每一个生产数据的你和我来书写。

PRISM

2013大数据年度事件:棱镜门

致我们无处安放的隐私

“棱镜门”为人们反思大数据时代的个人隐私与公共安全提供了一个范本,斯诺登潜逃、引渡以及政治庇护这样的情节增加了戏剧性,却无碍于反思这个问题的内核。

撰文/甘蓝

“谢谢你,斯诺登!”临近感恩节,一个自由组织为感谢斯诺登公开美国监听秘密,特地在华盛顿的一辆巴士上打出这样一幅致谢的广告。

从2013年6月初,斯诺登揭发美国的“棱镜门”事件,到九大互联网巨头卷入美国监控全球互联网计划,再到斯诺登到俄罗斯寻求避难,最后到美国政府斡旋大数据监控是为了所谓的“反恐”。从纯技术角度来看,“棱镜”是一个典型的通过分析海量通讯数据获取安全情报的大数据案例,但它也引发一个重要的思考:大数据时代,个人隐私该何处安放?

根据斯诺登提供的信息,美国国家安局拥有的正是一套基于“大数据”的新型情报收集系统,这套名为“无界爆料”的系统,以30天为周期,可以从全球网络系统中接收到970亿条讯息,再通过比对信用卡或者通讯记录等方式,能几近真实地还原个人的实时状况。

“棱镜门”为人们反思大数据时代的个人隐私与公共安全提供了一个范本,斯诺登潜逃、引渡以及政治庇护这样的情节增加了戏剧性,却无碍于反思这个问题的内核。

经过一段时间的辩论,斯诺登已经被“脸谱化”,一方认为他是公众隐私权的捍卫者,是自由的守护者;一方认为他是叛国者,是双面间谍,应该被引渡回国接受审判。当更多的事实披露出来,谁是英雄,谁是罪犯,也会慢慢浮出水面。

震惊源于“小数据”思维

“大数据”基础已完备

“斯诺登事件让我惊讶的不是‘棱镜’计划本身,而是如此众多的社会大众还是小数据’思维,对这个计划如此惊讶。”这是《大数据时代》一书的作者之一迈尔·史恩伯格在香港大学的演讲中,对此全球性事件的反应与感慨。

的确,对当今全球的绝大多数人而言,“大数据”还是个相当陌生的概念,甚至还未曾听闻,事实上它已悄然而至,从微观到宏观,从商业到政治到军事,铺天盖地,无所不在。斯诺登揭露了“棱镜”,“棱镜”揭示了“大数据”。

就商业用途而言,今天的谷歌、微软、惠普等,已完全可以通过它们掌握的数以百万计、千万计甚至亿计的数据,经由“超级计算”,准确推断消费者的习惯、电影的票房、流感疫情的发展趋势。商业如此,在政治、经济、军事等方面的用途和潜在利益当然也不遑多让。

这就是“大数据时代”。

“大数据时代”建立在三个基础之上:一,数以亿计的人们,无时无刻,不知不觉地在生产大量数据,每一个人在每一时间每一地点,那怕是一个最不经意的微小行为,就是一个数据。所以,合起来,就是海量的数据。二,数据虽已产生并存在,除非把它“上穷碧落下黄泉”地全数搜集网罗起来,否则没有意义,这就要靠像“棱镜”一样的网络技术。三,最后一步,就是将海量的数据以超级快的速度加以归纳、计算与分析,这就靠一代又一代推陈出新的超级计算机。第一个基础是从来就有的,现在,加上了第二与第三,我们就进入到了“大数据时代”了。

被手机“出卖”

没有什么与隐私无关

电子科技大学互联网科学中心主任周涛曾经介绍过2013年公开的一项最新研究成果:某个手机用户只要曾出现在4个基站的服务区,利用大数据模型,研究者就能把他从百万用户中区分出来,识别他的身份,准确率为95%。此文发表在《自然》出版集团的学术刊物《科学报告》上。

结论就是,别让我在4个基站看到你。

周涛是畅销书《大数据时代》的中文译者。他表示,大数据的“1.0版本”仅仅是分析那些与目标有直接相关性的数据,但到“2.0版本”后,大数据更关心“数据的外化”,也就是将更多看似无关的数据纳入视野。

周涛本人也正研究如何通过大数据识别个人信息,通过分析一个人某段时间的GPS定位数据,就能知道他的性取向:“瞒了家人几十年的秘密,也许一个手机软件就能出卖你。”

无论是“4个基站”,还是“手机与性取向”的研究,都表明一个事实:通常被认为与隐私无甚关联的信息,在大数据时代都将发生质变。周涛透露,国外科学家已经建立了模型,通过分析人们在Facebook上的行为,也能判断他的性取向,所需要的只是用户添加的“喜欢”或“不喜欢”标签,大约需要100个。

周涛强调,他的研究被置于严格的监管之下,而且是基于同性恋者自愿提供的信息,并不侵犯隐私。但是否每个大数据从业者都如此遵守规则?

北京邮电大学管理学院教授万岩说,她曾对自己的学生做了一个问卷:公开自己的信息从而得到更有针对性的营销,或是严格保护隐私但必须自己动手搜索商品,你会选哪一个?学生们的回答大致是50:50。

普通人对网络隐私的态度,也许还很有宽容度,他们必须接受,或者说忍受一个事实——大数据时代,人就是透明的。

正如《纽约时报》所说,斯诺登是一个时代的开始,因为他使人们看到了,像美国这样拥有世界上最强大的科技和情报能力的一个国家,他们会以什么样的方式来窃取全世界的情报。

谁塑造了

你现在的生活24小时?

苍穹之下

被大数据改变的生活图景

尽管我们仍处于大数据时代来临的前夕,但我们的日常生活已经离不开它了。

撰文/蔡佩爽

垃圾邮件过滤器可以自动过滤垃圾邮件,尽管它并不知道“发#票#销#售”是“发票销售”的一种变体;交友网站根据个人的性格与之前成功配对的情侣之间的关联来进行新的配对;具有“自动改正”功能的智能手机通过分析我们以前的输入,将个性化的新单词添加到手机词典里。

然而,对这些数据的利用还仅仅只是一个开始。从可以自动转弯和刹车的汽车,到IBM沃森超级电脑在游戏节目《危险边缘》中打败人类来看,这项技术终将改变我们所居住的星球上的许多东西。

Joan的工作日志

Joan是一位生活在北京的职场新人。早晨起床时,她睁开眼第一件事就是从床边抓起智能手机,关掉闹钟。这是第一个能叫醒她的闹钟Sleep cycle,睡前要把手机扣在枕头旁,它会记录你的上床时间、各个时间段的睡眠质量,甚至几点做了梦。它不一定准时在你设定的时间响起,而是提前半小时开始感知,发现你进入浅睡眠的时候,它就会响铃。

查看了自己近一个月的睡眠记录表,比上个月好了一些。Joan又刷新了邮箱,看看公司有没有发来新的电子邮件。邮件倒是没有,但她发现微信里多了一些信息,她的几个姐妹相约今晚一起去美食节目《美食地图》推荐的餐厅。

餐厅的名字有点耳熟,Joan想起曾经在大众点评看到过人们的评价,环境、服务、气氛都拿到5颗星,但最重要的食物口味似乎不太让人满意。

Joan把自己的想法告诉姐妹们,大家或许会换另一家餐厅。然后她起床梳洗,带上Nike+手环,穿上跑步鞋,准备到社区旁的公园慢跑,享受清晨的阳光。她打开手机天气,PM2.5只有78,是北京难得的好天气,Joan的心情一下子也明媚起来。

回到家,手环自动把把她今天跑步的里程、时间、消耗的能量等信息输入系统,系统根据耐克社区用户的数据告诉她达到了默认目标。她很开心地把结果分享在微博上,顺便看看朋友们都在忙什么。

7点半,手机上的拼车App提示她距离出发时间还有5分钟,她拿上东西匆匆出门,和另外两个邻居一同前往上班地点。这两位邻居也是在拼车网站上认识的,现在他们成了好朋友。在车上闲聊,一位邻居说他准备去北欧旅行,通过蚂蜂窝App下载了很多攻略,在淘宝浏览雪山需要的装备,这些天无论手机还是电脑,关于机票特价、酒店预订、滑雪装备的广告都多了起来。

到了公司,Joan打开网页,百度个性化首页根据她的浏览兴趣只推送了科技、财经、时尚等几个频道的新闻。微信忽然响起,是一位台湾的客户,着急地说Joan公司的一个设计出了问题,Joan在公司的IBM Notes中寻找相关的记录文件,并立刻反馈给了客户。

好不容易熬到中午,Joan来到楼下的赛百味,结账时把美团发来的团购号码出示给服务员,在角落坐下来,边用Kindles看书,边嚼着三明治。

Kevin的商务随行

午餐结束回到办公室,Joan收到了新的工作订单,要为客户设计网站。这时,她找到了位于中关村的IT服务商。与她接洽的Kevin迅速提供了公司介绍和服务项目,开始了两个公司的对接和谈判。

Kevin计划两天后去美国参加苹果开发者大会,现在有点担心出差会影响到新客户的谈判。几经沟通后,Kevin和Joan敲定了项目启动会的时间,已经订好机票的Kevin只好通过携程完成了改签。

已经3点半了,Kevin终于有时间看看今天的股市。他开通了“银证通”,为此券商还给他一定的佣金优惠。在互联网圈待了十几年,Kevin感觉到身边的一切都在进行着数字化的改变,从门户到搜索,从电商到互联网金融,互联网会席卷每一个行业。几个月之前,他还认为与银行、券商的合作仅仅是IT层面的网站搭建,没想到现在客户已经提出了构建互联网金融服务平台的需求。

除了股票,Kevin还在人人贷上把一部分存款投给了一家浙江的电商,他考察过这家电商的信用,信誉良好,这种P2P的模式也是他在美国时就知道的。

妻子把活期账户里的存款转到余额宝的时候,Kevin还因为货币基金的收益率嘲笑她,现在每天查看收益已经成了妻子的固定动作。不仅如此,从不关心理财产品的她开始询问他基金、炒股的事情,Kevin倒是有点担心自己的财政大权要转到妻子手里了。

电脑提示,距离另一场客户沟通会还有1个小时,地点是他没有去过的酒店。打开高德地图,选择了系统推荐的最通畅的路线,同步到车里的GPS导航,Kevin匆匆走到停车场。GPS导航已经在他同步的时候自动开启了。

走进会场,Kevin把电脑连到幻灯机上,他没有带任何存储设备,而是打开思杰的ShareFile,之前准备的PPT就呈现出来了。就在他们开会的时候,客户的部门负责人不在现场,网络会议让他如临现场,没有错过任何细节。

完成一天的工作,Kevin准备回家了。今天妻子不在家,但Kevin还是能享受到进门就有热水的好生活,他打开海尔物联网App,选择“一键回家”,家里的热水器、空调自动开启。

闺蜜们的欢乐时光

此时Joan正和姐妹们享受happy hour,她们果然换了另一家点评网站上得到5星推荐的餐厅,到达饭店的时候,门口围着许多排队等位的吃客。Joan报上了自己的电话号码,服务员立刻将她们引到预订的位置。她们从等位的人群中潇洒地穿过,似乎感觉到自己被羡慕嫉妒恨的眼光环绕。

坐下来的姐妹们依然各自面对着自己的手机,有的在刷朋友圈,有的在看其他网友的推荐菜,其中一位发现在街旁上签到之后她们就能享受9折优惠。Joan并不喜欢这样,朋友面对面坐着,眼睛还是离不开那一方窄窄的屏幕。她感叹:人世间最远的距离不是我爱你而你不知道,而是我们坐在一起看自己的手机。

直到第一道菜上桌,朋友们才算正式开始了今晚的聚会。

“你的包很漂亮,新买的吗?”

“双十一扫的。太可怕了,我没熬到12点,凌晨4点钟醒来发现购物车里的东西都改成‘商品不存在’了,已经被哄抢一空了你懂吗?还好我又翻到了这款5折的包。”

餐桌上的话题总是离不开购物,聊起来Joan忽然意识到,除了吃饭之外,姐妹们已经很少聚在一起了,以前还常常约着去逛街,现在这项活动好像消失了。

“很久没去KTV了,吃晚饭一起吧。”Joan提议。

“算了吧,这个时间包房没有优惠,咱俩唱吧上PK吧。”

说起唱吧,Joan的微博上常常有朋友发来自己录制的作品,还有朋友邀请她一起对唱,但她总感觉没有在KTV过瘾。

夜生活还是结束在吃饭上了,Joan虽然有些意犹未尽,奈何自己的提议总是得不到附和。9点钟在商业区打车总是要迎风等上半天。Joan打开嘀嘀打车,1公里之内的空车只有寥寥四五辆,语音输入自己想去的地方,很快便收到了系统回复,500米以内的一辆出租车接下了订单。

Joan和顺路的一位姐妹上了同一辆出租车,司机先后把她们送到家。Joan把今晚包括吃饭、打车在内的费用记录在AA账本里,每个人要给她多少钱一目了然。她把结果发送到朋友们的微信上,很快便收到了朋友在支付上转过来的钱。

支付宝上又有钱了,Joan习惯性地打开了淘宝。朋友双十一买的包都已经背上了,她买的衣服才刚刚发货,双十一真是伤不起。正抱怨时,她发现收藏夹多了些功能,按住一个商品,可以查看“相似款”和“搭配款”。这个小发现够她兴奋很久了,女人的衣柜里少的不止一件衣服,她把还在运输途中的两件衣服放进收藏夹了,查看了几十款搭配商品,“淘宝是一种病”,Joan已经感染了。

梳洗后上了床,Joan打开视频网站,发现《纸牌屋》第二季放出了明年上映的消息,那一点点睡意又一去无踪了。

只有看书才能让她安静下来,她习惯了看着书睡去,但是家里的书架很久没有摆上过新书了,自从买下Kindle,想看任何一本书的时候她首先想到的都是去看看有没有电子书。

今天她打开了《大数据时代》,书里说:“我们时刻都暴露在‘第三只眼’之下:亚马逊监视着我们的购物习惯,谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的‘TA’,还有我们的社交关系网。”

PRISM

思杰大中华区总裁曹衡康

数据跟我走

无论何时何地,曹衡康都能调出工作用的数据快速、便捷、安全地办公,碎片化时间一点也不浪费,因为数据跟他走。

撰文/覃怡敏

这是一个普通的假日。曹衡康正带着家人在上海郊区休假,突然接到了秘书的电话。公司总部的一个副总裁10月8日要来中国,但临时发现签证已过期,需要中国这边出具邀请函重新办理签证。

身为思杰大中华区的总裁,曹衡康休假期间从哪里去调邀请函签字呢?当时已经是10月4日,时间紧急,否则对方赶不过来,很多客户的会议时间都要重新调整。曹衡康不慌不忙地打开智能手机,通过公司的桌面虚拟系统接到公司自己电脑的云存储里,把邀请函调出来打开,远端签字,然后直接把签完的邀请函从云存储上用电子邮件发给了那个副总裁。

不用回办公室,不用找电脑,不需要下载下来,更不需要手写签字、传真,几分钟内问题得到了解决。曹衡康的办公生活往往就是在“指尖”下的手机、平板中进行的。

“我在哪里,数据就在哪里,数据跟我走”,曹衡康说,无论在家,还是在车上,或者是等飞机的候机大厅、酒店里,无论是用手边的平板电脑、笔记本或是智能手机,他都能调出工作用的数据快速、高效、便捷、安全地办公,随时随地都可以进入工作模式,碎片化时间一点也不浪费。

他的工作体验正在变得普遍。IDC的预测显示,2015年前亚太区(不含日本)的8亿3870万员工将实现移动办公。大数据在提升移动信息化办公及管理领域里的重要性将更加凸显,人们使用云端的数据将越来越像水、电一样方便。

移动达人的碎片时间

曹衡康最爱移动办公。不仅仅是因为他服务的思杰Citrix在全球致力于实现安全移动办公和云服务,更是因为他切身实实在在地体验着移动办公数据跟人走的便捷。

有时他会选择在家里上班。当小孩生病的时候,曹衡康会陪伴在身边。“小孩可能在旁边床上睡觉,你只要观察他,他的烧有没有退下去,有没有别的问题等,你的工作可以不受影响。”曹衡康说,许多小孩在5岁之前经常会有小毛病,当孩子不舒服的时候,他和员工们就选择在家上班,通过互联网就可以截取公司电脑里的数据进行操作。

个人电脑的空间毕竟有限,数据就存放在他们公司内部的磁盘再放入云存储。这样,无论在哪里,曹衡康可以随时享用数据,处理工作。堵车的路上,等候飞机的时候,他都可以充分利用起来办公。“你在外面用平板所拿到的数据跟自己在公司是一模一样的,你的数据随你而行,跟你一起走。”曹衡康说。

随时随地可以享用办公数据,对于他来说,这意味着更加精细化的时间管理。每天上班前就可以把昨天总部新发生的事情处理完,并把等待的时间利用起来,最后也许会有一整晚的工夫陪家人或散步。“数据跟我走”优化的是时间资源分配。

“数据跟我走”同时也意味着海量的数据。这个移动达人的碎片化时间里,享有的数据更多更便捷。

因为他的移动办公并不是一般人所理解的是仅随处收发电子邮件,用Dropbox、印象笔记同步编辑文件或者开视频(电话)会议。通过思杰的虚拟化技术,曹衡康实现的是真正桌面化的移动办公,而真正的工作是不可能脱离桌面的。

那么,遇到视频(电话)会议要演示PPT怎么办?能闻其声,或者见其人,但如何看到对方的详细演示情况并做沟通呢?

曹衡康毫不担心。作为思杰的中国大中华区负责人,他经常会有很多的会议。思杰目前有近10个分公司在全国各地,大家都时间一到就开始GoToMeeting。曹衡康能随时随地通过思杰的软件远程播放PPT去跟他们沟通。

他每个月会告诉员工们,公司目前最近发生什么事情,我们的作用在哪里。同时他也及时听取各个部门主管汇报情况。一切都可以远程完成。由于后台大数据的强有力支持,移动协同办公更便捷,效率更高。

飞行达人的“他设备”

“糟糕,笔记本Wi-Fi出了故障”,正在希腊机场启动办公模式的曹衡康面临了新问题。

这又要如何移动办公呢?就在刚才,曹衡康接到了公司财务打来的电话,提醒他本月要完成员工加薪的年度考评。本来这是要回国后做的,但他发现接下来的日程已经排得满满当当。当得知从希腊回国的飞机晚点5小时的消息后,他便开始准备调配跟自己走的数据了。

自己的设备出了问题,曹衡康于是借到了太太的iPad远程登录到公司内部系统,调出调薪的员工的考勤和绩效,在接下来的时间里完成了考评的任务。

即使是用别人的电脑,他也毫不担心数据的安全性问题。曹衡康很是自豪。

很多人担心移动办公时数据所潜藏的安全“炸弹”。比如可能会担心当自己在手机上修改数据时,也许会误发给陌生人或在某一刻丢失手机。但思杰的办公系统不用顾忌这些问题。因为所有的工作数据都不能被下载到设备上,都是在云上面处理。

“有人说那我不带走,但是我可以在中间看到一些情况抄录走。”曹衡康继续解疑,事后审计可以解决这一问题,事实上思杰已经把这个人一天操作的情况过程测录了下来。

实际上,思杰的客户遍及医疗、学校、制造工业等行业,许多行业都是要对安全性要求极高的。思杰从一开始就践行的就是“安全”。曹衡康说:“安全正是我们过去二十几年来的核心价值。”通过思杰的技术,用户可以选择保存数据的位置,制定并管理分区,这样既能保障安全,也能做到性能优化。当大数据时代人们普遍担心自己信息安全问题时,这其实对曹衡康和思杰都意味着机遇。

机遇越大挑战越大,他也越忙碌。由于每周都要出差,这个飞行达人就常在飞机场等飞机的时候处理很多事情。他总是要求自己把工作在一定时间完成,在对的时间做对的事。如果当时从希腊度假回来事情他无法在机场做完,如果借用他人的设备不能保障安全性,那势必意味着那个周末回到家再工作。

而安全的移动办公就解决了一切问题。安全感也是幸福感。言及此,曹衡康的语气里透着强烈的幸福感。“能够让大家在用大数据时既便捷又安全,这是我们公司提供的方案能够帮忙的地方。安全,也是方便的移动数据。” 曹衡康很乐见大数据的时代到来。事实上,提供完整的安全数据共享服务,即“follow-me-data”(数据跟我走)也正是他和思杰所倡导的。数据正是他所在的公司非常重要的战略组成部分,是实现未来移动战略的关键。

PM2.5

十面「霾」伏下的

大数据预言

大数据时代下的气象服务是什么样子?在看得见的未来,融入地理信息、社会经济等多维度数据,能够让人们知道下一刻哪里可能会发生什么,比如这阵风是否会吹翻门口的广告牌,前面一个高速路口是不是在下雨堵车。

撰文/白鹤

即将过去的2013年,“雾霾”几乎成为许多都市人最扰心的一个热词。在北京,政府甚至不得不以工地停工、公车停驶、工厂停产等种种措施,尽力减少各种污染物的排放。

十面“霾”伏的敌人来自何方?大数据时代的到来或许可以寻根溯源,因为它能帮助人们更准确地了解、判断生存环境中最重要的一面——空气质量。

未来大数据的价值核心在于预测。中科大信息科学技术学院院长李卫平介绍,中科大先进技术研究院中正在进行着一项科研,通过收集和分析雾霾天气产生的各种数据,找到产生雾霾天气最主要的原因。“这是一些看上去杂乱无章的数据,我们建立一个大数据库,从中找寻规律性的东西。”这个科研项目与微软合作,一旦找到其中规律,有望为政府治理雾霾天气提供科学依据。

2013年10月30日,在微软亚洲研究院创新日上透露的一种新技术,试图让人们了解所在地区空气质量的真实情况。在此基础上,人们就能做出更明智且更有利于健康的决策,例如何时何地最适合户外运动,或者何时应戴上口罩或关上窗户。

“这些工作都是在大数据的基础上才能够进行,无论模式如何先进,没有海量的数据进入,都不能达到很好的效果。”中国气象局公共气象服务中心高级工程师唐千红说。

在大数据时代,数据并非单纯指人们在互联网上发布的信息。全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、温度、湿度乃至空气中化学物质的变化。

微软根据现有监测站所提供的空气质量数据以及城市里的其他多种数据来源(包括气象情况、交通流量、人员流动趋向、路网结构、人口集中点等),运用数据挖掘和机器学习技术,对大数据加以充分利用,并在监测信息和对应结果之间建立一个隐式映射,从而可以实时推断出包含细颗粒物信息的城市空气质量数据。

大数据时代下的气象服务是什么样子?唐千红认为,在看得见的未来,融入了地理信息、社会经济数据的气象服务,能够让人们知道任意时间地点可能会发生什么,例如这阵风是否会吹翻门口的广告牌,前面一个高速路口是不是在下雨、会不会发生山洪。

其实大数据就在脚下,尽管很多时候我们没有意识到。

全球的数据量正在以每18个月翻一倍的惊人速度增长,世界正在高速数字化。事实上,从城市交通到空气质量,从建筑设计到影视制作,大数据分析应用已经渗透到生活的方方面面。大数据到底怎样改变了人们的生活轨迹?为此我们采访了微软研究院院长Peter Lee、微软亚洲研究院院长洪小文、微软全球资深副总裁周以真,揭开大数据的神秘面纱。

数字商业时代:什么是大数据与机器学习?这一技术的商业应用前景如何?

洪小文:我常常举一个例子,譬如说你妈妈明天要来北京看你,她在邮件里告诉你航班的号码,明天下午5点钟会到。可是你那天下午在开会,三四点的时候计算机就自动把邮件里面的航班号码抽出来,自己去航空公司的网站一查,告诉你班机晚点,要7点才来。而且它还会根据交通状况决定什么时候通知你出发,以什么方式出发。它可以建议你坐出租车、坐地铁要多少分钟,甚至可以在你的社交网络里找到附近的朋友开车来载你。

这些自动化都可以做得到,但是今天还没有这样的系统和服务,所以就只能隔几分钟看一看,很浪费时间,而且在很多场合不允许。这样的东西其实是大数据与机器学习的表征,需要很多不同种类的数据,有邮件的数据、地图的数据、飞机的数据、交通的数据。大数据不仅是大,还要有多样性和集成性。

大数据还应用在其他方面,比如报刊杂志上的文章到底有多少人看,大家有什么评价,转发给谁。以前这些东西可能要做问卷才能得到,今天通过互联网更有机会获取。如果搜集的大数据都是零散的、繁杂的,你怎么去看?这就需要数据可视化,这一点对管理者非常重要。管理者在做一个决定之前,想看看这个东西在某一个区域大家的反应会怎么样,调出来一看就知道。

大数据与机器学习真的是在每一个行业都有类似的应用。

数字商业时代:有人说,大数据与云计算是一个问题的两面,云计算是支撑大数据时代的基础。但当大数据和云计算真正落地,或是走向消费者的过程中遇到的障碍和挑战有哪些?

周以真:实际上,普通用户已经享受到很多大数据和云计算所带来的利益和好处,只是我们并没有清晰地意识到而已。比如用Windows Phone进行文字输入,输入前一个字,就会有下一个字或词汇的提示联想。或者用手机或PC收发邮件时,垃圾邮件的过滤功能。这些都是集成大数据和机器学习的技术才能得以实现。

类似的应用无处不在,甚至可能存在的地方太多了,我们都已经忽略它了。

另外一个典型的例子是关于云。比如我们把手机上的照片存储在云端,即使手机丢失再换一个新的,你仍可以从云上重新把照片下载下来。

数字商业时代:可穿戴设备就像“人体的物联网”,通过传感技术可以检测出用户的体温、血压、心率等数据,这些个人的身体数据库非常有价值。那么微软未来在可穿戴设备这一块最大的机会是在哪儿,是在硬件设备,是在云端,还是在软件上?

Peter Lee:这三个领域都有,但是我最感到振奋的就是云端。之所以说是云端,是因为云计算的环境当中有大量的数据、大量的计算能力,再加上机器学习的功能,可以展示出非常高级智能的产品。比如说从云端可以看到你过去一年运动量够不够,判断你所吃的食物是否足够健康,还可以把信息反馈给你的医生。这些都需要有非常好的云架构。

对话张晨:

个性化首页正是大数据的成果

基于大数据分析的商业决策将成为许多公司成功的关键。而普通用户将享受大数据给生活带来的便利,享受更智能更个性化的日常体验。

撰文/甘蓝

“用户体验是不可逆的,就像你习惯了iOS和安卓,让你回到塞班时代,这是无法想象的。” 雅虎全球北京研发中心总裁张晨边浏览雅虎首页,边讲起个性化首页带给他上网体验的改变,“有一天打开首页,信息都不是我感兴趣的,包括体育新闻中也不是我支持的球队信息。正疑惑时,发现原来我没有登录。”

登入自己的账号后,个性化首页呈现的才是张晨关注的信息。

2013年,雅虎推出了个性化首页和原生广告,让大数据的研究成果直接体现在用户体验以及网站商业价值的同步提升上。

“雅虎的媒体产品是由数据驱动”

数字商业时代:2013年,雅虎在大数据上还做了哪些事情,部署在哪些方面,颇有成效的是哪些,还有哪些不足?

张晨:2013年2月,雅虎推出了个性化首页,为全球8亿用户带来了精彩愉悦的定制内容服务。个性化内容的推送全是基于大数据的分析来进行的,这一块的底层平台也是我们雅虎北研的团队来开发的。

2013年,Flickr开始为9000万用户提供1TB的存储空间。这对用户来讲是一件非常好的事情,但是对于技术团队,怎样让大数据的处理和存储更高效、成本更低就成为一个很大的挑战。我们北京的MobStor团队就承担了这个任务。通过他们的工作,雅虎大数据的存储成本显著降低,效率也有很大的提高。

数字商业时代:大数据在雅虎内部的重要性如何凸显?雅虎内部的工作模式、方法是如何被大数据改变的?

张晨:我们在雅虎实验室有很多大数据领域的科学家直接参与到产品开发的过程中,大数据相关产品的开发团队还包括精于数据分析的产品经理、大数据系统和数据挖掘领域的工程师以及能够基于数据进行设计的设计师。比如雅虎新推出的个性化主页里面的瀑布流界面,就是包含了设计、产品、科学和工程等多方面努力的成果,它也在随着我们对数据处理和分析的深入开发而越变越精准。

雅虎自2006年以来就在大数据上有大规模的投入,目前雅虎不仅在大数据底层架构的开发上扮演重要角色,还领导了业界基于大数据的网络应用开发。我们已经看到深度的数据挖掘给雅虎广告业务带来的巨大提升,更重要的是,雅虎所有的媒体产品也是由大数据来驱动的。比如基于大数据的高度个性化不仅提升雅虎主页的用户体验,也涵盖了所有二级页面和移动应用。大数据帮助我们在2013年将全球用户数提升到8亿,超越谷歌再次成为全美访问用户数最多的网站。

数字商业时代:你怎么看当今世界大数据的发展态势?大数据可以为中国带来什么?

张晨:根据研究机构的预测,到2015年联网设备的总量将达到250亿台,包括PC、平板电脑和智能手机,还有即将进入人们生活的智能电视、智能汽车、智能建筑、移动健康监测设备等,它们将产生1.6ZB的数据,是目前全球云计算网络年度流量的12倍。(本刊注:1ZB=1024EB,1EB=1024PB,1PB=1024TB)是目前全球云计算网络年度流量(130 EB)的12倍。所以从全球范围看,数据大爆炸是正在发生的事,而激增的数据也推动着IT和互联网行业不断提出更高能效、更低成本的大数据应用解决方案。

中国的人口规模和经济规模决定了中国的数据资产规模,这位大数据技术的发展提供了最基本的数据资源。而大数据技术以开源为主,目前也没有形成绝对的技术垄断,大家都在同一个起跑线上,这也是一个好的方面。

大数据技术的发展给全球商业和人类生活都带来了重大的变革,中国企业也要自我革新来迎接这个潮流。对中国用户来说,越来越多基于大数据挖掘和分析的产品将让用户体验进一步提升,让大家的生活更便利。

“人才短缺是最大的挑战”

数字商业时代:大数据的革命性如何体现?谁将会成为大数据的真正受益者?

张晨:商业决策者和普通用户都将在大数据中受益。随着大数据技术从概念走向成熟, 基于精准、快速大数据分析的商业决策将成为许多公司成功的关键。普通用户将享受大数据给生活带来的便利,享受更智能更个性化的日常体验。

数字商业时代:移动互联网时代,大数据面临哪些机遇和挑战?

张晨:机遇方面,在移动时代,屏幕变得越小,用户对相关性的需求就越高。大数据带来的精准内容推送,将让移动互联网体验更加顺畅和愉悦。大数据技术的发展还将挑战传统产业和商业模式,并将催生一批新公司、新业务。

我们面对的挑战首先是人才短缺。一份麦肯锡公司的研究报告表明,预计至2018年,仅美国就将有14万~19万名拥有大数据深度分析能力的人才缺口,同时还需要150万位可以通过大数据分析做出有效决策的经理人和分析师。

数字商业时代:大数据应用下一步要解决的难点在哪些方面?对于雅虎而言的难点是什么?

张晨:更加巨大的数据规模、更加深入的数据挖掘、更快和更深的建模都是下一步大数据技术要解决的难点。数据规模将会是雅虎的一大挑战,我们拥有全球最大的私有云,数据量之大是绝大部分公司无法比拟的。

数字商业时代:2014年雅虎还将在大数据的研究与应用上有哪些部署?

张晨:未来一年雅虎还将继续发力大数据技术的研究和应用。雅虎每天都要处理PB级别的数据,我们的移动用户已经超过4亿并在飞速增长,这也带来了海量的数据。我们会加强大数据分析技术来获取对网络信息更加深入的分析结果,我们也致力于让所有的雅虎产品更加个性化、更注重移动领域的大数据分析,以及实现更加快速的分析处理。

抢广告 造内容 黏用户

社交数据「算计」影视

通过社交网络的大数据改变广告形态,甚至塑造内容,影视行业也要进入“算计”人群的时代。

撰文/覃怡敏

“最潮流的上海人,大爱炫目好莱坞,提到《环太平洋》最多;最文艺的北京人,追忆似水般流年,热衷于《致青春》;最激情的深圳人,爱飙车更爱创业,爱看《中国合伙人》;最赚钱的西安人,岂怕101次求婚!”

腾讯旗下社交平台QQ空间近日向业界分享起了有关影视方面的大数据。

从QQ空间发布的《大数据里看电影》的信息图可以看到,不同城市形成的气质、年龄影响的偏好、学历代表的口味、性别决定的追求等都直接影响着电影票房。他们相信“得社交网络者得票房”。

近年来,微信、微博等社交网络风生水起,但QQ空间的活跃度并未下降。这一次,作为中国首批认识到数据塑造影视重要性的社交网络之一,QQ空间迈出了第一步。

在乐视影业尝到运用数据营销发行《小时代》收获近5亿票房的甜头,大量增加人手收集影视数据的同时,社交网站们已经行动起来。

走得更快的是国际巨头。Facebook正在8国实施国际行动,向法国、德国等国10家电视台提供主流电视节目相关的用户评论数据,敞开大数据的怀抱。Twitter前不久也宣布与广告研究和顾问公司Kantar Media达成合作,将支持英国电视行业的节目规划和分析工作。

社交网络大佬们、网络电视台、影视制作方都欢欣鼓舞要运用好大数据,通过大数据改变广告形态,甚至塑造内容。影视行业也要进入“算计”人群的时代。

“互联网思维模式正在逐步重新定义传统企业。”腾讯社交平台部副总经理曾佳欣告诉《数字商业时代》,舆论环境的变化让社会化媒体营销崛起,社交网络的影响对影视行业的收视率或票房也将产生比较大的影响。

觉醒已经开始

“大数据”的思维和操作方式起步

2008年成立的艺恩咨询是国内影视产业数据收集和分析的先行者。

近两年,新媒体、社交网站、电子商务网站兴起,互联网技术不断革新,以及影视产业及其市场的大规模扩张,都为数据规模的提升提供了可能。艺恩咨询的发展轨迹就是很好的证明。

从收集专业部门的数据起家,如今,来自百度搜索、新浪微博、腾讯微博、淘宝等互联网平台的数据,已经成为艺恩咨询的重要数据来源。

与此同时,影视制作公司和社交网络也开始觉醒,“大数据”的思维和操作方式也开始起步。

视频网站爱奇艺透露其正在根据大数据挖掘的信息自制电视连续剧;盛大文学声称将基于大数据生产电视剧本;华策影视收购克顿传媒被指其大量数据储备和分析经验;乐视影业更是根据《小时代》的相关网络数据研究做了一次成功营销。无论《小时代》是否叫好,但其首日观影人次236万创下国产首日观影人次纪录而叫座于90后女性,不得不令人慨叹。中国影视行业不断与“大数据”这个时髦的概念发生关系,也越来越与社交网络紧密联系。

“《泰囧》上映时在QQ空间的提及次数达1600万次,是所有社交平台数据最高的。”年初,一篇关于《泰囧》的社会化营销攻略的分析文章引起了腾讯社交平台的重视。曾佳欣说,当时文章里对比了各大社交平台的数据,其中提及到QQ空间对电影营销的推动,很好地说明了平台用户的口碑传播对影片的价值。

紧接着,4月份《致青春》上映后,他们很快注意到,QQ空间里用户讨论致青春话题的内容在短短时间内超过9000万条。他们分析了上映后7天的话题趋势,《致青春》4月26日上映当晚,QQ空间网友就对其展开了热议,4月30日迎来一个热议高峰,而后,热议逐渐减弱,在假期归来上班第一天的5月2日,网友对其的讨论达到7天来的最高峰。

此外,他们也注意到,影视类如中国好声音等热门节目也都在QQ空间引起话题热议。

为何不把关于影视行业的大数据做一个单独的收集呢?从8月底开始准备,确定数据维度,然后数据建模,并开始对数据进行分析,最后QQ空间呈现给外界一幅关于大数据的影像图。从这些自发的用户口碑热议背后,腾讯社交平台开始尝试对外分享一些口碑传播的数据分析给影视类行业做参考。

事实上,中国已于2012年成为全球第二大电影市场。市场规模还在扩大,优质作品还需要增多,大数据也将愈发重要。艺恩咨询总裁郜寿智分析:“细分的消费市场会慢慢出现,分众化的传播方式也就越来越重要。”这个时候,社交网络更好地做出数据模型分析和利用产生在自家的影视内容也成为拉动产业和市场升级的突破口之一。

QQ空间的研究数据表明:一部电影在QQ空间讨论次数越多,其票房也就越高。在QQ空间,大到一篇观后感,小到一条说说,都会影响98个好友。从而形成细胞分裂般的传播速度和规模,影响成千上万人。社交网络的魔力更越来越凸显。

从买位置到买“人”

数据改变影视广告形态

假如你爱看网球赛,那么当你在某社交网站和朋友讨论的那一瞬间,“又一个网球迷,这个网页上有一个闲置广告位”的消息便迅速传到了该网站赞助商的广告主们那里。于是,下一刻,你接下来打开的页面将会出现相应广告。

原有的影视广告主们也将慢慢过渡分化到相应的社交网络上。进而,经过精准进化,广告主也要由买位置过渡到买“人”。

当然社交网络的意图并不在竞争,他们更看好合作,悄悄抢夺广告的同时,他们更要与电视、电影制作方达成合作。事实上,社交网络潜在的影响力在激起了广告主浓厚兴趣的同时,也引起了电视网络的关注。

尼尔森就发现,每一条同电视节目相关的Twitter消息平均会拥有50的点击次数,而围绕热门节目展开的广泛互动则可以为节目和Twitter带来更多观众。

Twitter自身也已意识到,围绕电视节目内容所展开的社交对话数量正在不断增多,而这样的趋势可以为公司带来更多的广告收入。当然对于电视台、影视制作公司而言,他们也能够去更好地说服广告主。

不甘落后的是Facebook。在美国,Facebook正和Twitter争做全美最佳电视节目讨论平台。

前不久,AMC旗下神剧《绝命毒师》的大结局总共吸引了1030万观众,成为了有史以来收视率最高的电视剧大结局之一。该剧剧终后,无数的粉丝纷纷在Twitter和Facebook上分享自己对这部片子的看法,进而引发了Facebook与Twitter新一轮的战争。

他们都有自己的标准来判断社交电视对话的效果。无论是相关话题的微博,还是对话中的帖子、评论或者“赞”,他们都要争着证明在自家网站上的讨论更火、数据更多,进而想进一步争取和电视台或者广告主的合作。

Twitter在近一年来已经与数十家广告主和内容分销商签订了电视相关交易。今年,它花费了大量精力与时间同福克斯、MTV等电视网络达成了合作协议,并与喜力等消费品牌展开了合作。在很多人眼中Twitter已经成为以电视为中心的社交对话方面的领军企业。

“我们围绕电视打造出了一项新业务,我们将自己视为一个拥有巨大信息传播能力的角色。”Twitter全球营收总裁亚当·贝恩这样总结。

Facebook正在拼命追赶。在展开国际行动的同时,Facebook也成功说服微软、福特和卡夫等传统电视广告主相信Facebook相比电视可以更高效地接触到目标用户。Facebook全球营销解决方案副总裁卡洛琳-艾佛森认为:市场营销人员希望和消费者保持同步,而他们就是这样一个强大的品牌建设平台。

祭出营销利器

数据塑造内容本身

一部《纸牌屋》红遍了全球网络,也证明了Netflix公司充分运用大数据的力量。

作为一家在线视频播放网站,Netflix网站根据用户数据发现了影片可能大卖的必要因素:BBC同名剧、导演大卫·芬奇、老戏骨凯文·史派西,于是自制了《纸牌屋》。

其实,面对复杂的市场环境,许多投资者和创作者都想知道,究竟什么样的影视作品才会得到观众和市场的认可和欢迎。“大数据”或许是一把通向更广阔市场的钥匙。大数据时代,观众不再是被动的观看者,出品方拍什么、谁来拍、谁来演、怎么播,都会参考观众的客观喜好来统计决定。

社交网络等将越来越多发挥作用。Netflix之后,亚马逊正在效仿制作《纸牌屋》的模式,同时运作10余个电视剧项目。不甘人后的还有微软、谷歌、苹果、英特尔和几家社交网站,它们都有计划通过大数据分析,制作影视剧或其他类似产品。

国内跟进者爱奇艺等在积极谋划自制剧的同时,还将大数据运用到了版权采买、广告投放、用户影视内容推荐等多方面。

电视内容目前依然是社交网络用户最喜欢的讨论话题之一。再进一步想象,随着数据的进一步增加,坐拥用户资源的社交网络、新媒体们完全有能力通过数据挖掘,分析用户癖好,向电视台定制一部电视剧甚至向好莱坞定制一部电影。大数据正在改变这些古老行业的行为规则。

对于社交网络本身,对大数据的应用也能使得他们黏住和赢得更多用户。腾讯曾佳欣告诉记者,对于社交网络平台来说,他们可以关注到话题的趋势变化和热点事件,来做热点事件运营,提升用户的活跃度。下一步,良性的生态里,自制剧、定制剧或将成为可能。

当然,大数据也并非“定海神针”,作用也不能过度放大。毕竟影视行业利用大数据讨巧的同时也必须靠自身内容说话,而数据能否有效地转化成生产力也还尚需时日。“算计”争夺战才刚刚拉开帷幕。

把技术变价值

舆情「舵手」红麦软件的马拉松

红麦软件的创业路径,是基于对互联网大数据的挖掘,满足企业最基本的舆情信息监测诉求。

采访·撰文/周颖 摄影/车庆久

挖掘互联网的大数据价值,成就了屈伟大学时代的创业梦想。

“当梦想变成了现实,你的奋斗目标就会变得更高。红麦未来的目标,是让新技术的价值最大化,借助新技术衍生出更完整的产业链条。”

身为红麦聚信(北京)软件技术有限公司(以下简称红麦软件)总裁,“80后”的屈伟无论是之前的工作还是现在的创业,都可以用“跨界”来形容。

原本水利系专业的屈伟,却对水利专业毫无兴趣,热衷计算机的他,大学时期就喜欢钻研新技术对生活、对社会的价值改变,以及由此创造出新的商业机会。在猫扑、搜狐任职期间,屈伟对互联网有了更深刻的认知。互联网虚拟的世界,却深刻改变并影响了现实世界。这个由大数据构成,甚至主宰世界的虚拟网络,是一座取之不尽的财富金矿。对互联网技术充满创新基因的屈伟来说,他的创业注定无法与互联网割裂。

每天都会有因互联网诞生的企业,每天也都会有败北于互联网的企业。红麦软件借助互联网的创业路径,是基于对互联网大数据的挖掘,满足企业最基本的舆情信息监测诉求。

创业灵感源于身边的触动

“红麦软件主要为品牌企业、政府部门提供舆情监测与分析服务。通过技术手段智能抓取互联网信息,为用户提供最及时、动态的舆情数据监测、数据分析及咨询服务,协助企业准确掌握产品和市场情况,掌握竞争对手和行业动态,了解网民口碑,为企业市场、营销决策提供支持支撑服务,帮助政府部门快速发现突发事件、重大事件,快速应对,提高政府和企业的形象。”屈伟说。

事实上,屈伟打造的红麦软件有其偶然性,更有其必然性。发生在屈伟身边的偶然事件,对他产生了很大的触动。

2007年春节,屈伟和朋友聚会期间,朋友向他诉苦不迭。原来,朋友所在的企业被竞争对手在网上散布谣言恶意中伤。虽然事后企业和相关部门都进行了澄清,但由于没有第一时间发现并迅速处理,谣言扩散很快,对企业形象造成了很大的影响,市场销售也因此出现大幅下滑。

一次寻常聚会,给屈伟带来了很大触动,甚至萌发了创业激情。“我当时就在思考,如果能有一种软件,可以帮助企业、政府不间断地对互联网动态进行监测,并为他们建立预警机制,一旦发现类似重大、负面、敏感的事情就自动第一时间通知用户,或许能为用户提供最有利的应对时机,避免事态进一步扩大。就好比建立一个火灾监控系统,在灾情刚刚萌芽的时间发现并预警,才能及时控制并把灾情损失降到最低。互联网作为大数据平台,其信息传播具有非常规的速度、广度和深度,如果能在这个平台上深度挖掘,或许是一个不错的创业机会。”

由此,2008年3月,红麦软件问世。

从互联网舆情监测软件市场来看,红麦软件并非起步最早。和同行相比,红麦软件的优势主要在于对互联网信息数据背后的深度挖掘,以及为客户提供专业、实用的研究报告。

一家国有金融机构的市场部负责人曾对记者表示,红麦软件并非仅仅是提供软件系统,着这只是最基础的服务。通过对监测到的信息进行深度挖掘,红麦软件为用户提供政策动向分析、行业动态分析、竞品动态分析、市场传播效果监测及传播策略咨询等服务,这些才是最有价值的,也是其他同行目前不具备的。

我们有一场约定而不是赌局

大数据,已成为2013年互联网企业出现频率最多的关键词。

大数据改变的商业模式,以及大数据引发未来的商业猜想,似乎能预见未来。专注于为品牌企业、政府部门提供舆情监测和咨询服务,是红麦软件的生存法则。

红麦软件舆情监控系统是将搜索引擎和中文信息处理技术应用在企业舆论情报服务的一次创新。系统利用独有的爬虫技术,根据用户预订的监控关键词在15分钟以内发现15万个重点新闻、论坛、博客等网站里的舆情信息,并对重要的舆情信息及时报警。

“我们的目标并不虚幻与宏大,而是必须务实。和其他行业软件相比,舆情监测软件比较特殊,由于是对互联网信息进行采集和分析处理,对自然语言的分析处理、情感判断就显得尤为重要,其操作具有很强的专业性。经过5年多的发展,我们的自然语言处理技术、中文分词技术和情感判断系统已臻于成熟。我们的技术和系统具有完全独立自主的知识产权,因此我们和自己有一场约定,就是要设立未来3~5年的目标,把目标当成一场马拉松赛,要跟自己赛跑。这不是一场赌局,而是我们能看到的未来的愿景,很多企业愿意和我们共同参与这场马拉松。”屈伟说。

红麦软件有着典型“80后”的思维方式与创业路径:他们致力于关注身边的事情,在创业的过程中敞开心胸与企业共同做大;他们在大数据中挖掘价值,他们思维活跃却做事专注。

创业是一场约定。在约定中屈伟左手托起了大数据平台,通过智能监测,将舆情市场的大数据做到了极致;右手祭起了技术创新的大旗,在和市场的较量中,红麦软件要用技术跑赢市场,要用专业赢得信任。

专业是一种信任,是一种态度。红麦软件通过利用中文分词技术、自然语言处理技术、中文信息处理技术,对互联网信息进行垃圾过滤、去重、相似性聚类、情感分析、提取摘要、自动聚类、自动分析热点等处理,辅助专业的分析师编制完成详细的舆情分析报告。

做一件有趣的事情其实比成功更重要。对于屈伟而言,实现自己的梦想,把技术变成价值,这正是好玩又有趣的事情。红麦软件的有趣在于,一支最年轻的创业团队,用自己的技术和服务,为众多重量级的品牌企业和政府部门提供最需要的内容。红麦软件的成长并不孤立,越来越多的企业来相伴,和他们一起成长。

“未来,红麦软件不只是提供基础的技术和服务,而是立志于为用户提供更具附加值的服务。我们目前整合了专业的危机应对团队、战略咨询团队和品牌管理团队,这将是我们今后的核心竞争力。大数据时代,在细分领域中,我们仍将专注于舆情服务。”屈伟说。

万能的大数据

技术不是最精准的决策标尺

正像科技产品永远不能成为人们最坚固的记忆硬盘或记事本一样,大数据也不能替代人脑成为人们生命中的决策标尺。

撰文/覃怡敏

“互联网的人都希望做出下一个《纸牌屋》,但是内容的创造并不是有大数据储备就能成功的。”前不久,视频行业的一个大佬在接受《数字商业时代》记者采访时坦陈。

《纸牌屋》的成功,已经成为充分应用大数据分析的成功案例,一众视频网站也希望自己能成为下一个Netflix,他们同时也深知,内容创造并不是一个程序或计算题,大数据能“算”出很多,“算”不出来的也许更多。

尽管基于数据分析的营销、决策更为精准,然而不可忽视的是,大数据再强大、再神奇,它都不能成为人们生活、工作中的价值杠杆。正像科技产品永远不能成为人们最坚固的记忆硬盘或记事本一样,大数据也不能替代人脑成为人们生命中的决策标尺。

正如硬币的两面,数据爆炸意味着更多的噪音——冗余、虚假、有害信息, 当全球网络压倒一切大数据无所不在时,我们必须防止自己迷失在记忆的碎片里,重新恢复忘记。

大数据“算”不出创意与想象

非人类记忆的尴尬与残忍

大数据来源于现实。

人类的许多想法却并非如此,创造性的思维与想象往往是非理性的,“创意和想象,用大数据是‘算’不出来的”,因《大数据时代》走红的牛津大学互联网研究院教授维克托·迈尔·舍恩伯格直言。

今天,人们用数据来记录这个世界,再通过研究数据去发现这个世界。但这个世界的生活、生意都需要创意和想象,大数据只能是一种参考。

全球新增的数据有95%是数字化信息,很容易被搜索查询、引用或转载,但是这其中有不少是无效信息,甚至是当事人不愿意记忆的信息。维克托指出:“随着廉价数字存储设备的普及,记忆成为数字时代的常态。但是互联网如果记住了我们想要忘记的东西,就很容易毁了我们的生活。”

比如,大数据让互联网广告进入精准时代,广告主们通过RTB实时竞价在网络上放置广告,也闹出了误点“骨灰盒”之后、眼前的橱窗广告被各式骨灰盒覆盖的尴尬。

大数据时代,人们的每一举一动都会“被搜集”,再加以资料整合与加总。网络通过大数据的搜集,会拥有比你更好的记忆力和分析能力,可能比你更懂你。当一些互联网公司拥有了“读心术”般的营销能力之后,人们就感到害怕了。的确,数字技术赋予人们前所未有的权利,可它也会产生意想不到的可怕后果。英国社会学者保罗·杜吉德也认为,“无止境的积累,会让人们迷失在记忆细节之中”。

维克托在《删除:数字时代遗忘的美德》一书中指出:“数字技术和全球网络压倒一切,使我们忘记自己的自然能力,我们必须重新恢复忘记。”

“人工智能”的终极遗憾

大数据不能替代人类思维

从犹疑到怀念,依赖于男友阿什生前在网络上留下的信息、数据,玛莎拥有了一个新的“真实的”、具有“人工智能”的阿什。

可慢慢的,她却发现,即使原来的阿什是社交网络达人,在Facebook、Twitter等网站上的信息数据量非常详尽,但新的阿什却并不能真正懂她。玛莎陷入了另一种悲痛。

发生在英剧《黑镜》里的故事令人心酸。在可以想见的未来里,智能合成肌肉研究成功,通过大数据,人类可以再造和逝去的人几乎一模一样的机器人。可是,人类的思维不可替代,直到后来小玛莎出生,玛莎才获得真正的陪伴,此时“人工智能”的阿什只能被玛莎“流放”到阁楼上生活。

人类的真实内心、思想并不能通过大数据完全测算出来。或许,网络科学家可以测量出我们在76%的时间里与6名同事的社交互动情况,但是,他们不可能捕捉到我们隐藏在心底对那些一年或许也见不了一次的儿时玩伴的感情。

人类的思维、决策镶嵌在时间序列和背景之中。人们往往擅长讲述交织了多重原因和多重背景的故事。但数据是不懂得这些背景的,数据分析不懂得如何叙事,也不懂得思维的浮现过程。

即便是一部普普通通的小说,数据分析也无法解释其中的思路。显而易见大数据不能代替人的思考。

“黑天鹅”事件的不可预知性

“价值密度较低”中去粗取精

大数据的核心功能之一就是预测。但大数据没法预测不可预知的事情,或者是毫无先兆的事情,这类事件通常被称为“黑天鹅”。

大数据是基于过去的数据来预测未来,当过去不可掌握时,它便无计可施。即便是过去看似可以掌握,以大数据为标尺的预测决策也不一定准确。大数据从来都不可能是“原始”的,数据总是依照人的倾向和价值观念而被构建出来的。这让数据的生产往往也掩盖了价值观念。

人们所眼见的大数据分析的结果看似客观公正,但其实价值选择贯穿了从构建到解读的全过程。从这个意义上讲,大数据也不能成为人们决策的精准标尺。真正的“黑天鹅”隐藏于无形之中,是很难被发现的。

著名商业思想家、《黑天鹅:如何应对不可知的未来》一书的作者纳西姆·塔勒布指出,随着我们掌握的数据越来越多,可以发现的统计上显著的相关关系也就越来越多。这些相关关系中,有很多都是没有实际意义的,在真正解决问题时很可能将人引入歧途。

“这种欺骗性会随着数据的增多而呈指数级地增长。在这个庞大的‘干草垛’里,我们要找的那根针被越埋越深。”纳西姆说。

因此,人们不但不能把大数据一股脑地当作宝库,反而要冷静审视数据的两面性。预知未来的高科技“水晶球”也有不为人知的一面,抛弃有害和无用的信息至关重要。

和任何一种伟大的工具一样,大数据有其拿手强项,也有不擅长的领域。要想用大数据,先知其短板。机器储存和分析难以囊括几十亿兆数据,即使储存了这些数据,专业人员也无法全部调阅,删除和忘掉无价值的、不相关的信息是处理大数据的重要原则。

正如维克托的建议,人类应采取的措施是“数字化节制、保护信息隐私权、建设数字隐私权基础设施、调整人类的现有认知、打造良性的信息生态、完全语境化”。

大数据 从云端到凡间

方之熙的一天

采访·撰文/白鹤 摄影/李铮

2013年11月29日15:07,在北京海淀区中国英特尔物联技术研究院里,院长方之熙正在和同事们研究一项时下颇热门的大数据应用,如何低成本地测量PM2.5。

测量仪器中的的传感器通过Wi-Fi、3G等网络将环境实时数据输送到“云端”,再通过机器学习和云计算,把数据更精确地反馈到手机上。这些数字可以清晰地表明你所处位置的pm2.5是多少。

方之熙从不抽烟,可是为了实验,一支烟就成为测试空气质量的最好道具。一旦香烟燃起,PM2.5指数立即上升,实验室里的那道光线也骤然发亮。

这一幕只不过是他日常工作中的管中窥豹,大数据和他24小时的生活已经分不开。

在不少公司、实验室和政府机构,“数据”被捧为21世纪新型“石油”。在方之熙看来,这种“新石油”在2013年最大的变化莫过于“飞入寻常百姓家。”

“大数据的应用已经很大程度地推广到老百姓生活当中去,比如人们上网买东西用支付宝,把钱存在余额宝里。我们出去吃饭总用定位查找哪个饭店最近,这些背后都有大数据在运作,尽管我们看不到。” 方之熙说。

小格子,大世界

英特尔研究院里每个员工的办公室都不过是几平方米的开放的小格子间,方之熙也不例外。

在这里他要用PC处理很多日常事务。唯一特殊的是,在旁边有一张小圆桌,他可以和同事面对面畅谈。

行走,数字无止境

方之熙的碎片时间也逃不脱工作,在车厢里处理邮件是最常见的一幕。当然他也常用手机地图查找路线,寻找美食餐厅。

视频不能承受之“逆差”

参加视频会议是方之熙最不愿为之的事情。会议往往是从美国时间早八点持续到下午16点,这意味着他要在这个视频会议室从凌晨12点一直呆到次日早8点。而这样的会议差不多每两周就要召开一次。年过的他往往在开会前小憩一会,还要备足咖啡零食,以熬“时差”之困。

但正是这样方便高效的智能办公,见证了英特尔的每一步重大计划与决定。

3D打印,创新的盐

3D打印将是英特尔研究院重要的研究方向之一。方之熙每每要投入30%的精力到此项可能主宰未来的技术中。

咖啡厅里的会议30分

楼下的咖啡店是方之熙除了办公室和家之外的“第三空间”,每周至少有两天他是在这里度过的,常常与属下共进午餐,不时要用手机当面沟通工作,这样最重要的意义在于节省时间。

BIG BANG

大数据的力量

寻找大数据的「掘金者」

评选背景:

在过去一年里,《数字商业时代》在对全国范围内的100多位CEO/CIO进行了调研,了解了他们对互联经济大格局下企业如何可持续发展的看法,发现CEO/CIO们并不满足于日益加强的IT管理,而是希望充分发挥大数据和互联科技的潜力,重新思考人与人互联后对企业带来的价值。

尤其在今天的环境里,数据量的爆发和以前完全不一样,有90%的数据是在过去两年创造的,到了2010年时,全世界要消化的数据量是现在的44倍以上。

而有越来越多的企业愿意投资在大数据的分析上,根据Gartner调查,目前有27%的企业已经投资了大数据分析系统,也有31%的企业预计在接下来的2年内投资,希望能加强大数据分析相关硬件和软件的能力。

如果能把大量的数据,用科学化的方式做到更优化的预估,那么,在面对复杂环境所带来的诸多挑战下,不管是企业或政府就有可能运用这些经过提炼的智慧,创造新的增长机遇以及全新的价值。

评选标准:

我们将从几个维度评估那些在大数据掘金的企业:

1 能否通过大数据进行预测

大数据的核心就是预测,它通常被视为人工智能的一部分,或者更确切的说是一种机器学习。在大数据时代,我们可以分析更多地数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。

案例:对冲基金通过剖析社交网络Twitter上的数据信息来预测股市的表现;亚马逊和奈飞(Netflix)根据用户在其网站上的类似查询来进行产品推荐;Twitter,Facebook和LinkedIn通过用户的社交网络图来得知用户的特别喜好。

2 能否将混杂的数据化繁为简

据估计,只有5%的数字数据是结构化的且能适用于传统数据库。如果不接受混乱,剩下的95%的非结构化数据都无法被利用,比如王业和视频资源。通过接受不精确性,我们打开了一个从未涉足的世界的窗户。

案例:2012年,让ZestFinance引以为豪的就是,它的贷款拖欠率比行业平均水平要低三分之一左右,制胜之道在于“拥抱”了混杂的数据。举个例子,有10%的客户属性信息显示“已经死亡”,但是依然可以从他们身上收回贷款。ZestFinance的数据显示,房贷给“僵尸”是一项不错的生意。

3 能否将数据“量化”

大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今的信息技术变革的重点在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚光灯打向“I”,开始关注信息本身了。

案例:UPS快递多效地利用了地理定位数据。为了使总部能在车辆出现晚点的时候跟踪到车辆的位置和预防引擎故障,它的货车上装有传感器、无线适配器和GPS。同时,这些设备也方便了公司监督管理员工并优化行车路线。2011年,UPS的驾驶员们少跑了近4828万公里的路程,节省了300万加仑的燃料并且减少了3万公吨的二氧化碳排放。

4 能否利用数据创新挖掘真正价值

数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。

案例:Farecast利用机票销售数据来预测未来的机票价格;谷歌重复使用搜索关键词来监测流感的传播;麦格雷戈博士用婴儿的生命体征来预测传染病的发生;莫里重新利用老船长的日志而发现了洋流。

5 是否拥有独立的数据“中间商”

在未来,我们可以利用数据做更多的事情,而数据的拥有者们也会真正意识到他们所拥有的财富。因此,他们可能会把他们手中的数据抓的更紧,也会以更高的价格再出售。

案例:微软以1.1亿美元的价格购买了大数据公司Farecast,而两年后谷歌则以7亿美元的价格购买了给Farecast提供数据的ITASoftware公司。

关键字:数据谷歌舆情信息大数据

本文摘自:数字商业时代

x 大数据正潜移默化改变着一切 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

大数据正潜移默化改变着一切

责任编辑:editor004 |来源:企业网D1Net  2013-12-17 17:54:32 本文摘自:数字商业时代

《时代周刊》为了选不选斯诺登做2013年度封面犹豫了很久,而大数据时代的到来已无需纠结。

从2013年6月初,斯诺登揭发美国的“棱镜门”事件,到九大互联网巨头卷入美国监控全球互联网计划,再到斯诺登到俄罗斯寻求避难,最后到美国政府斡旋大数据监控是为了所谓的“反恐”。这个通过分析海量通讯数据获取安全情报的大数据案例,让围绕大数据的话题与反思不断发酵,也让2013被称为“大数据元年”。

从可以自动转弯和刹车的汽车,到IBM沃森超级电脑在游戏节目《危险边缘》中打败人类,这项技术终将改变我们所居住的星球上的生活与生意。

一位居住在纽约布鲁克林的软件开发者 Federico Zannier“把自己卖了”,他通过发起“A bite of Me”项目,不断收集自己所有的数字轨迹,并挂到网站上销售。“那些公司在用我的数据赚钱,当你接受那些使用条款时,你就已经把这些数据的使用权白送给他们了。”

的确,亚马逊监视着我们的购物习惯,谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的“TA”,还有我们的社交关系网。

大数据能够越来越精确地预测世界的事情以及我们所处的位置,我们却还没准备好接受它对我们的隐私和决策过程带来的影响。我们的认知和制度都还不习惯这样一个数据充裕的时代,因为它们都建立在数据稀缺的基础之上。在大数据时代,不管是告知与许可、模糊化还是匿名化,这三大隐私保护策略都失效了。

“斯诺登效应”还在继续,大数据时代的生存规则也将被每一个生产数据的你和我来书写。

PRISM

2013大数据年度事件:棱镜门

致我们无处安放的隐私

“棱镜门”为人们反思大数据时代的个人隐私与公共安全提供了一个范本,斯诺登潜逃、引渡以及政治庇护这样的情节增加了戏剧性,却无碍于反思这个问题的内核。

撰文/甘蓝

“谢谢你,斯诺登!”临近感恩节,一个自由组织为感谢斯诺登公开美国监听秘密,特地在华盛顿的一辆巴士上打出这样一幅致谢的广告。

从2013年6月初,斯诺登揭发美国的“棱镜门”事件,到九大互联网巨头卷入美国监控全球互联网计划,再到斯诺登到俄罗斯寻求避难,最后到美国政府斡旋大数据监控是为了所谓的“反恐”。从纯技术角度来看,“棱镜”是一个典型的通过分析海量通讯数据获取安全情报的大数据案例,但它也引发一个重要的思考:大数据时代,个人隐私该何处安放?

根据斯诺登提供的信息,美国国家安局拥有的正是一套基于“大数据”的新型情报收集系统,这套名为“无界爆料”的系统,以30天为周期,可以从全球网络系统中接收到970亿条讯息,再通过比对信用卡或者通讯记录等方式,能几近真实地还原个人的实时状况。

“棱镜门”为人们反思大数据时代的个人隐私与公共安全提供了一个范本,斯诺登潜逃、引渡以及政治庇护这样的情节增加了戏剧性,却无碍于反思这个问题的内核。

经过一段时间的辩论,斯诺登已经被“脸谱化”,一方认为他是公众隐私权的捍卫者,是自由的守护者;一方认为他是叛国者,是双面间谍,应该被引渡回国接受审判。当更多的事实披露出来,谁是英雄,谁是罪犯,也会慢慢浮出水面。

震惊源于“小数据”思维

“大数据”基础已完备

“斯诺登事件让我惊讶的不是‘棱镜’计划本身,而是如此众多的社会大众还是小数据’思维,对这个计划如此惊讶。”这是《大数据时代》一书的作者之一迈尔·史恩伯格在香港大学的演讲中,对此全球性事件的反应与感慨。

的确,对当今全球的绝大多数人而言,“大数据”还是个相当陌生的概念,甚至还未曾听闻,事实上它已悄然而至,从微观到宏观,从商业到政治到军事,铺天盖地,无所不在。斯诺登揭露了“棱镜”,“棱镜”揭示了“大数据”。

就商业用途而言,今天的谷歌、微软、惠普等,已完全可以通过它们掌握的数以百万计、千万计甚至亿计的数据,经由“超级计算”,准确推断消费者的习惯、电影的票房、流感疫情的发展趋势。商业如此,在政治、经济、军事等方面的用途和潜在利益当然也不遑多让。

这就是“大数据时代”。

“大数据时代”建立在三个基础之上:一,数以亿计的人们,无时无刻,不知不觉地在生产大量数据,每一个人在每一时间每一地点,那怕是一个最不经意的微小行为,就是一个数据。所以,合起来,就是海量的数据。二,数据虽已产生并存在,除非把它“上穷碧落下黄泉”地全数搜集网罗起来,否则没有意义,这就要靠像“棱镜”一样的网络技术。三,最后一步,就是将海量的数据以超级快的速度加以归纳、计算与分析,这就靠一代又一代推陈出新的超级计算机。第一个基础是从来就有的,现在,加上了第二与第三,我们就进入到了“大数据时代”了。

被手机“出卖”

没有什么与隐私无关

电子科技大学互联网科学中心主任周涛曾经介绍过2013年公开的一项最新研究成果:某个手机用户只要曾出现在4个基站的服务区,利用大数据模型,研究者就能把他从百万用户中区分出来,识别他的身份,准确率为95%。此文发表在《自然》出版集团的学术刊物《科学报告》上。

结论就是,别让我在4个基站看到你。

周涛是畅销书《大数据时代》的中文译者。他表示,大数据的“1.0版本”仅仅是分析那些与目标有直接相关性的数据,但到“2.0版本”后,大数据更关心“数据的外化”,也就是将更多看似无关的数据纳入视野。

周涛本人也正研究如何通过大数据识别个人信息,通过分析一个人某段时间的GPS定位数据,就能知道他的性取向:“瞒了家人几十年的秘密,也许一个手机软件就能出卖你。”

无论是“4个基站”,还是“手机与性取向”的研究,都表明一个事实:通常被认为与隐私无甚关联的信息,在大数据时代都将发生质变。周涛透露,国外科学家已经建立了模型,通过分析人们在Facebook上的行为,也能判断他的性取向,所需要的只是用户添加的“喜欢”或“不喜欢”标签,大约需要100个。

周涛强调,他的研究被置于严格的监管之下,而且是基于同性恋者自愿提供的信息,并不侵犯隐私。但是否每个大数据从业者都如此遵守规则?

北京邮电大学管理学院教授万岩说,她曾对自己的学生做了一个问卷:公开自己的信息从而得到更有针对性的营销,或是严格保护隐私但必须自己动手搜索商品,你会选哪一个?学生们的回答大致是50:50。

普通人对网络隐私的态度,也许还很有宽容度,他们必须接受,或者说忍受一个事实——大数据时代,人就是透明的。

正如《纽约时报》所说,斯诺登是一个时代的开始,因为他使人们看到了,像美国这样拥有世界上最强大的科技和情报能力的一个国家,他们会以什么样的方式来窃取全世界的情报。

谁塑造了

你现在的生活24小时?

苍穹之下

被大数据改变的生活图景

尽管我们仍处于大数据时代来临的前夕,但我们的日常生活已经离不开它了。

撰文/蔡佩爽

垃圾邮件过滤器可以自动过滤垃圾邮件,尽管它并不知道“发#票#销#售”是“发票销售”的一种变体;交友网站根据个人的性格与之前成功配对的情侣之间的关联来进行新的配对;具有“自动改正”功能的智能手机通过分析我们以前的输入,将个性化的新单词添加到手机词典里。

然而,对这些数据的利用还仅仅只是一个开始。从可以自动转弯和刹车的汽车,到IBM沃森超级电脑在游戏节目《危险边缘》中打败人类来看,这项技术终将改变我们所居住的星球上的许多东西。

Joan的工作日志

Joan是一位生活在北京的职场新人。早晨起床时,她睁开眼第一件事就是从床边抓起智能手机,关掉闹钟。这是第一个能叫醒她的闹钟Sleep cycle,睡前要把手机扣在枕头旁,它会记录你的上床时间、各个时间段的睡眠质量,甚至几点做了梦。它不一定准时在你设定的时间响起,而是提前半小时开始感知,发现你进入浅睡眠的时候,它就会响铃。

查看了自己近一个月的睡眠记录表,比上个月好了一些。Joan又刷新了邮箱,看看公司有没有发来新的电子邮件。邮件倒是没有,但她发现微信里多了一些信息,她的几个姐妹相约今晚一起去美食节目《美食地图》推荐的餐厅。

餐厅的名字有点耳熟,Joan想起曾经在大众点评看到过人们的评价,环境、服务、气氛都拿到5颗星,但最重要的食物口味似乎不太让人满意。

Joan把自己的想法告诉姐妹们,大家或许会换另一家餐厅。然后她起床梳洗,带上Nike+手环,穿上跑步鞋,准备到社区旁的公园慢跑,享受清晨的阳光。她打开手机天气,PM2.5只有78,是北京难得的好天气,Joan的心情一下子也明媚起来。

回到家,手环自动把把她今天跑步的里程、时间、消耗的能量等信息输入系统,系统根据耐克社区用户的数据告诉她达到了默认目标。她很开心地把结果分享在微博上,顺便看看朋友们都在忙什么。

7点半,手机上的拼车App提示她距离出发时间还有5分钟,她拿上东西匆匆出门,和另外两个邻居一同前往上班地点。这两位邻居也是在拼车网站上认识的,现在他们成了好朋友。在车上闲聊,一位邻居说他准备去北欧旅行,通过蚂蜂窝App下载了很多攻略,在淘宝浏览雪山需要的装备,这些天无论手机还是电脑,关于机票特价、酒店预订、滑雪装备的广告都多了起来。

到了公司,Joan打开网页,百度个性化首页根据她的浏览兴趣只推送了科技、财经、时尚等几个频道的新闻。微信忽然响起,是一位台湾的客户,着急地说Joan公司的一个设计出了问题,Joan在公司的IBM Notes中寻找相关的记录文件,并立刻反馈给了客户。

好不容易熬到中午,Joan来到楼下的赛百味,结账时把美团发来的团购号码出示给服务员,在角落坐下来,边用Kindles看书,边嚼着三明治。

Kevin的商务随行

午餐结束回到办公室,Joan收到了新的工作订单,要为客户设计网站。这时,她找到了位于中关村的IT服务商。与她接洽的Kevin迅速提供了公司介绍和服务项目,开始了两个公司的对接和谈判。

Kevin计划两天后去美国参加苹果开发者大会,现在有点担心出差会影响到新客户的谈判。几经沟通后,Kevin和Joan敲定了项目启动会的时间,已经订好机票的Kevin只好通过携程完成了改签。

已经3点半了,Kevin终于有时间看看今天的股市。他开通了“银证通”,为此券商还给他一定的佣金优惠。在互联网圈待了十几年,Kevin感觉到身边的一切都在进行着数字化的改变,从门户到搜索,从电商到互联网金融,互联网会席卷每一个行业。几个月之前,他还认为与银行、券商的合作仅仅是IT层面的网站搭建,没想到现在客户已经提出了构建互联网金融服务平台的需求。

除了股票,Kevin还在人人贷上把一部分存款投给了一家浙江的电商,他考察过这家电商的信用,信誉良好,这种P2P的模式也是他在美国时就知道的。

妻子把活期账户里的存款转到余额宝的时候,Kevin还因为货币基金的收益率嘲笑她,现在每天查看收益已经成了妻子的固定动作。不仅如此,从不关心理财产品的她开始询问他基金、炒股的事情,Kevin倒是有点担心自己的财政大权要转到妻子手里了。

电脑提示,距离另一场客户沟通会还有1个小时,地点是他没有去过的酒店。打开高德地图,选择了系统推荐的最通畅的路线,同步到车里的GPS导航,Kevin匆匆走到停车场。GPS导航已经在他同步的时候自动开启了。

走进会场,Kevin把电脑连到幻灯机上,他没有带任何存储设备,而是打开思杰的ShareFile,之前准备的PPT就呈现出来了。就在他们开会的时候,客户的部门负责人不在现场,网络会议让他如临现场,没有错过任何细节。

完成一天的工作,Kevin准备回家了。今天妻子不在家,但Kevin还是能享受到进门就有热水的好生活,他打开海尔物联网App,选择“一键回家”,家里的热水器、空调自动开启。

闺蜜们的欢乐时光

此时Joan正和姐妹们享受happy hour,她们果然换了另一家点评网站上得到5星推荐的餐厅,到达饭店的时候,门口围着许多排队等位的吃客。Joan报上了自己的电话号码,服务员立刻将她们引到预订的位置。她们从等位的人群中潇洒地穿过,似乎感觉到自己被羡慕嫉妒恨的眼光环绕。

坐下来的姐妹们依然各自面对着自己的手机,有的在刷朋友圈,有的在看其他网友的推荐菜,其中一位发现在街旁上签到之后她们就能享受9折优惠。Joan并不喜欢这样,朋友面对面坐着,眼睛还是离不开那一方窄窄的屏幕。她感叹:人世间最远的距离不是我爱你而你不知道,而是我们坐在一起看自己的手机。

直到第一道菜上桌,朋友们才算正式开始了今晚的聚会。

“你的包很漂亮,新买的吗?”

“双十一扫的。太可怕了,我没熬到12点,凌晨4点钟醒来发现购物车里的东西都改成‘商品不存在’了,已经被哄抢一空了你懂吗?还好我又翻到了这款5折的包。”

餐桌上的话题总是离不开购物,聊起来Joan忽然意识到,除了吃饭之外,姐妹们已经很少聚在一起了,以前还常常约着去逛街,现在这项活动好像消失了。

“很久没去KTV了,吃晚饭一起吧。”Joan提议。

“算了吧,这个时间包房没有优惠,咱俩唱吧上PK吧。”

说起唱吧,Joan的微博上常常有朋友发来自己录制的作品,还有朋友邀请她一起对唱,但她总感觉没有在KTV过瘾。

夜生活还是结束在吃饭上了,Joan虽然有些意犹未尽,奈何自己的提议总是得不到附和。9点钟在商业区打车总是要迎风等上半天。Joan打开嘀嘀打车,1公里之内的空车只有寥寥四五辆,语音输入自己想去的地方,很快便收到了系统回复,500米以内的一辆出租车接下了订单。

Joan和顺路的一位姐妹上了同一辆出租车,司机先后把她们送到家。Joan把今晚包括吃饭、打车在内的费用记录在AA账本里,每个人要给她多少钱一目了然。她把结果发送到朋友们的微信上,很快便收到了朋友在支付上转过来的钱。

支付宝上又有钱了,Joan习惯性地打开了淘宝。朋友双十一买的包都已经背上了,她买的衣服才刚刚发货,双十一真是伤不起。正抱怨时,她发现收藏夹多了些功能,按住一个商品,可以查看“相似款”和“搭配款”。这个小发现够她兴奋很久了,女人的衣柜里少的不止一件衣服,她把还在运输途中的两件衣服放进收藏夹了,查看了几十款搭配商品,“淘宝是一种病”,Joan已经感染了。

梳洗后上了床,Joan打开视频网站,发现《纸牌屋》第二季放出了明年上映的消息,那一点点睡意又一去无踪了。

只有看书才能让她安静下来,她习惯了看着书睡去,但是家里的书架很久没有摆上过新书了,自从买下Kindle,想看任何一本书的时候她首先想到的都是去看看有没有电子书。

今天她打开了《大数据时代》,书里说:“我们时刻都暴露在‘第三只眼’之下:亚马逊监视着我们的购物习惯,谷歌监视着我们的网页浏览习惯,而微博似乎什么都知道,不仅窃听到了我们心中的‘TA’,还有我们的社交关系网。”

PRISM

思杰大中华区总裁曹衡康

数据跟我走

无论何时何地,曹衡康都能调出工作用的数据快速、便捷、安全地办公,碎片化时间一点也不浪费,因为数据跟他走。

撰文/覃怡敏

这是一个普通的假日。曹衡康正带着家人在上海郊区休假,突然接到了秘书的电话。公司总部的一个副总裁10月8日要来中国,但临时发现签证已过期,需要中国这边出具邀请函重新办理签证。

身为思杰大中华区的总裁,曹衡康休假期间从哪里去调邀请函签字呢?当时已经是10月4日,时间紧急,否则对方赶不过来,很多客户的会议时间都要重新调整。曹衡康不慌不忙地打开智能手机,通过公司的桌面虚拟系统接到公司自己电脑的云存储里,把邀请函调出来打开,远端签字,然后直接把签完的邀请函从云存储上用电子邮件发给了那个副总裁。

不用回办公室,不用找电脑,不需要下载下来,更不需要手写签字、传真,几分钟内问题得到了解决。曹衡康的办公生活往往就是在“指尖”下的手机、平板中进行的。

“我在哪里,数据就在哪里,数据跟我走”,曹衡康说,无论在家,还是在车上,或者是等飞机的候机大厅、酒店里,无论是用手边的平板电脑、笔记本或是智能手机,他都能调出工作用的数据快速、高效、便捷、安全地办公,随时随地都可以进入工作模式,碎片化时间一点也不浪费。

他的工作体验正在变得普遍。IDC的预测显示,2015年前亚太区(不含日本)的8亿3870万员工将实现移动办公。大数据在提升移动信息化办公及管理领域里的重要性将更加凸显,人们使用云端的数据将越来越像水、电一样方便。

移动达人的碎片时间

曹衡康最爱移动办公。不仅仅是因为他服务的思杰Citrix在全球致力于实现安全移动办公和云服务,更是因为他切身实实在在地体验着移动办公数据跟人走的便捷。

有时他会选择在家里上班。当小孩生病的时候,曹衡康会陪伴在身边。“小孩可能在旁边床上睡觉,你只要观察他,他的烧有没有退下去,有没有别的问题等,你的工作可以不受影响。”曹衡康说,许多小孩在5岁之前经常会有小毛病,当孩子不舒服的时候,他和员工们就选择在家上班,通过互联网就可以截取公司电脑里的数据进行操作。

个人电脑的空间毕竟有限,数据就存放在他们公司内部的磁盘再放入云存储。这样,无论在哪里,曹衡康可以随时享用数据,处理工作。堵车的路上,等候飞机的时候,他都可以充分利用起来办公。“你在外面用平板所拿到的数据跟自己在公司是一模一样的,你的数据随你而行,跟你一起走。”曹衡康说。

随时随地可以享用办公数据,对于他来说,这意味着更加精细化的时间管理。每天上班前就可以把昨天总部新发生的事情处理完,并把等待的时间利用起来,最后也许会有一整晚的工夫陪家人或散步。“数据跟我走”优化的是时间资源分配。

“数据跟我走”同时也意味着海量的数据。这个移动达人的碎片化时间里,享有的数据更多更便捷。

因为他的移动办公并不是一般人所理解的是仅随处收发电子邮件,用Dropbox、印象笔记同步编辑文件或者开视频(电话)会议。通过思杰的虚拟化技术,曹衡康实现的是真正桌面化的移动办公,而真正的工作是不可能脱离桌面的。

那么,遇到视频(电话)会议要演示PPT怎么办?能闻其声,或者见其人,但如何看到对方的详细演示情况并做沟通呢?

曹衡康毫不担心。作为思杰的中国大中华区负责人,他经常会有很多的会议。思杰目前有近10个分公司在全国各地,大家都时间一到就开始GoToMeeting。曹衡康能随时随地通过思杰的软件远程播放PPT去跟他们沟通。

他每个月会告诉员工们,公司目前最近发生什么事情,我们的作用在哪里。同时他也及时听取各个部门主管汇报情况。一切都可以远程完成。由于后台大数据的强有力支持,移动协同办公更便捷,效率更高。

飞行达人的“他设备”

“糟糕,笔记本Wi-Fi出了故障”,正在希腊机场启动办公模式的曹衡康面临了新问题。

这又要如何移动办公呢?就在刚才,曹衡康接到了公司财务打来的电话,提醒他本月要完成员工加薪的年度考评。本来这是要回国后做的,但他发现接下来的日程已经排得满满当当。当得知从希腊回国的飞机晚点5小时的消息后,他便开始准备调配跟自己走的数据了。

自己的设备出了问题,曹衡康于是借到了太太的iPad远程登录到公司内部系统,调出调薪的员工的考勤和绩效,在接下来的时间里完成了考评的任务。

即使是用别人的电脑,他也毫不担心数据的安全性问题。曹衡康很是自豪。

很多人担心移动办公时数据所潜藏的安全“炸弹”。比如可能会担心当自己在手机上修改数据时,也许会误发给陌生人或在某一刻丢失手机。但思杰的办公系统不用顾忌这些问题。因为所有的工作数据都不能被下载到设备上,都是在云上面处理。

“有人说那我不带走,但是我可以在中间看到一些情况抄录走。”曹衡康继续解疑,事后审计可以解决这一问题,事实上思杰已经把这个人一天操作的情况过程测录了下来。

实际上,思杰的客户遍及医疗、学校、制造工业等行业,许多行业都是要对安全性要求极高的。思杰从一开始就践行的就是“安全”。曹衡康说:“安全正是我们过去二十几年来的核心价值。”通过思杰的技术,用户可以选择保存数据的位置,制定并管理分区,这样既能保障安全,也能做到性能优化。当大数据时代人们普遍担心自己信息安全问题时,这其实对曹衡康和思杰都意味着机遇。

机遇越大挑战越大,他也越忙碌。由于每周都要出差,这个飞行达人就常在飞机场等飞机的时候处理很多事情。他总是要求自己把工作在一定时间完成,在对的时间做对的事。如果当时从希腊度假回来事情他无法在机场做完,如果借用他人的设备不能保障安全性,那势必意味着那个周末回到家再工作。

而安全的移动办公就解决了一切问题。安全感也是幸福感。言及此,曹衡康的语气里透着强烈的幸福感。“能够让大家在用大数据时既便捷又安全,这是我们公司提供的方案能够帮忙的地方。安全,也是方便的移动数据。” 曹衡康很乐见大数据的时代到来。事实上,提供完整的安全数据共享服务,即“follow-me-data”(数据跟我走)也正是他和思杰所倡导的。数据正是他所在的公司非常重要的战略组成部分,是实现未来移动战略的关键。

PM2.5

十面「霾」伏下的

大数据预言

大数据时代下的气象服务是什么样子?在看得见的未来,融入地理信息、社会经济等多维度数据,能够让人们知道下一刻哪里可能会发生什么,比如这阵风是否会吹翻门口的广告牌,前面一个高速路口是不是在下雨堵车。

撰文/白鹤

即将过去的2013年,“雾霾”几乎成为许多都市人最扰心的一个热词。在北京,政府甚至不得不以工地停工、公车停驶、工厂停产等种种措施,尽力减少各种污染物的排放。

十面“霾”伏的敌人来自何方?大数据时代的到来或许可以寻根溯源,因为它能帮助人们更准确地了解、判断生存环境中最重要的一面——空气质量。

未来大数据的价值核心在于预测。中科大信息科学技术学院院长李卫平介绍,中科大先进技术研究院中正在进行着一项科研,通过收集和分析雾霾天气产生的各种数据,找到产生雾霾天气最主要的原因。“这是一些看上去杂乱无章的数据,我们建立一个大数据库,从中找寻规律性的东西。”这个科研项目与微软合作,一旦找到其中规律,有望为政府治理雾霾天气提供科学依据。

2013年10月30日,在微软亚洲研究院创新日上透露的一种新技术,试图让人们了解所在地区空气质量的真实情况。在此基础上,人们就能做出更明智且更有利于健康的决策,例如何时何地最适合户外运动,或者何时应戴上口罩或关上窗户。

“这些工作都是在大数据的基础上才能够进行,无论模式如何先进,没有海量的数据进入,都不能达到很好的效果。”中国气象局公共气象服务中心高级工程师唐千红说。

在大数据时代,数据并非单纯指人们在互联网上发布的信息。全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、温度、湿度乃至空气中化学物质的变化。

微软根据现有监测站所提供的空气质量数据以及城市里的其他多种数据来源(包括气象情况、交通流量、人员流动趋向、路网结构、人口集中点等),运用数据挖掘和机器学习技术,对大数据加以充分利用,并在监测信息和对应结果之间建立一个隐式映射,从而可以实时推断出包含细颗粒物信息的城市空气质量数据。

大数据时代下的气象服务是什么样子?唐千红认为,在看得见的未来,融入了地理信息、社会经济数据的气象服务,能够让人们知道任意时间地点可能会发生什么,例如这阵风是否会吹翻门口的广告牌,前面一个高速路口是不是在下雨、会不会发生山洪。

其实大数据就在脚下,尽管很多时候我们没有意识到。

全球的数据量正在以每18个月翻一倍的惊人速度增长,世界正在高速数字化。事实上,从城市交通到空气质量,从建筑设计到影视制作,大数据分析应用已经渗透到生活的方方面面。大数据到底怎样改变了人们的生活轨迹?为此我们采访了微软研究院院长Peter Lee、微软亚洲研究院院长洪小文、微软全球资深副总裁周以真,揭开大数据的神秘面纱。

数字商业时代:什么是大数据与机器学习?这一技术的商业应用前景如何?

洪小文:我常常举一个例子,譬如说你妈妈明天要来北京看你,她在邮件里告诉你航班的号码,明天下午5点钟会到。可是你那天下午在开会,三四点的时候计算机就自动把邮件里面的航班号码抽出来,自己去航空公司的网站一查,告诉你班机晚点,要7点才来。而且它还会根据交通状况决定什么时候通知你出发,以什么方式出发。它可以建议你坐出租车、坐地铁要多少分钟,甚至可以在你的社交网络里找到附近的朋友开车来载你。

这些自动化都可以做得到,但是今天还没有这样的系统和服务,所以就只能隔几分钟看一看,很浪费时间,而且在很多场合不允许。这样的东西其实是大数据与机器学习的表征,需要很多不同种类的数据,有邮件的数据、地图的数据、飞机的数据、交通的数据。大数据不仅是大,还要有多样性和集成性。

大数据还应用在其他方面,比如报刊杂志上的文章到底有多少人看,大家有什么评价,转发给谁。以前这些东西可能要做问卷才能得到,今天通过互联网更有机会获取。如果搜集的大数据都是零散的、繁杂的,你怎么去看?这就需要数据可视化,这一点对管理者非常重要。管理者在做一个决定之前,想看看这个东西在某一个区域大家的反应会怎么样,调出来一看就知道。

大数据与机器学习真的是在每一个行业都有类似的应用。

数字商业时代:有人说,大数据与云计算是一个问题的两面,云计算是支撑大数据时代的基础。但当大数据和云计算真正落地,或是走向消费者的过程中遇到的障碍和挑战有哪些?

周以真:实际上,普通用户已经享受到很多大数据和云计算所带来的利益和好处,只是我们并没有清晰地意识到而已。比如用Windows Phone进行文字输入,输入前一个字,就会有下一个字或词汇的提示联想。或者用手机或PC收发邮件时,垃圾邮件的过滤功能。这些都是集成大数据和机器学习的技术才能得以实现。

类似的应用无处不在,甚至可能存在的地方太多了,我们都已经忽略它了。

另外一个典型的例子是关于云。比如我们把手机上的照片存储在云端,即使手机丢失再换一个新的,你仍可以从云上重新把照片下载下来。

数字商业时代:可穿戴设备就像“人体的物联网”,通过传感技术可以检测出用户的体温、血压、心率等数据,这些个人的身体数据库非常有价值。那么微软未来在可穿戴设备这一块最大的机会是在哪儿,是在硬件设备,是在云端,还是在软件上?

Peter Lee:这三个领域都有,但是我最感到振奋的就是云端。之所以说是云端,是因为云计算的环境当中有大量的数据、大量的计算能力,再加上机器学习的功能,可以展示出非常高级智能的产品。比如说从云端可以看到你过去一年运动量够不够,判断你所吃的食物是否足够健康,还可以把信息反馈给你的医生。这些都需要有非常好的云架构。

对话张晨:

个性化首页正是大数据的成果

基于大数据分析的商业决策将成为许多公司成功的关键。而普通用户将享受大数据给生活带来的便利,享受更智能更个性化的日常体验。

撰文/甘蓝

“用户体验是不可逆的,就像你习惯了iOS和安卓,让你回到塞班时代,这是无法想象的。” 雅虎全球北京研发中心总裁张晨边浏览雅虎首页,边讲起个性化首页带给他上网体验的改变,“有一天打开首页,信息都不是我感兴趣的,包括体育新闻中也不是我支持的球队信息。正疑惑时,发现原来我没有登录。”

登入自己的账号后,个性化首页呈现的才是张晨关注的信息。

2013年,雅虎推出了个性化首页和原生广告,让大数据的研究成果直接体现在用户体验以及网站商业价值的同步提升上。

“雅虎的媒体产品是由数据驱动”

数字商业时代:2013年,雅虎在大数据上还做了哪些事情,部署在哪些方面,颇有成效的是哪些,还有哪些不足?

张晨:2013年2月,雅虎推出了个性化首页,为全球8亿用户带来了精彩愉悦的定制内容服务。个性化内容的推送全是基于大数据的分析来进行的,这一块的底层平台也是我们雅虎北研的团队来开发的。

2013年,Flickr开始为9000万用户提供1TB的存储空间。这对用户来讲是一件非常好的事情,但是对于技术团队,怎样让大数据的处理和存储更高效、成本更低就成为一个很大的挑战。我们北京的MobStor团队就承担了这个任务。通过他们的工作,雅虎大数据的存储成本显著降低,效率也有很大的提高。

数字商业时代:大数据在雅虎内部的重要性如何凸显?雅虎内部的工作模式、方法是如何被大数据改变的?

张晨:我们在雅虎实验室有很多大数据领域的科学家直接参与到产品开发的过程中,大数据相关产品的开发团队还包括精于数据分析的产品经理、大数据系统和数据挖掘领域的工程师以及能够基于数据进行设计的设计师。比如雅虎新推出的个性化主页里面的瀑布流界面,就是包含了设计、产品、科学和工程等多方面努力的成果,它也在随着我们对数据处理和分析的深入开发而越变越精准。

雅虎自2006年以来就在大数据上有大规模的投入,目前雅虎不仅在大数据底层架构的开发上扮演重要角色,还领导了业界基于大数据的网络应用开发。我们已经看到深度的数据挖掘给雅虎广告业务带来的巨大提升,更重要的是,雅虎所有的媒体产品也是由大数据来驱动的。比如基于大数据的高度个性化不仅提升雅虎主页的用户体验,也涵盖了所有二级页面和移动应用。大数据帮助我们在2013年将全球用户数提升到8亿,超越谷歌再次成为全美访问用户数最多的网站。

数字商业时代:你怎么看当今世界大数据的发展态势?大数据可以为中国带来什么?

张晨:根据研究机构的预测,到2015年联网设备的总量将达到250亿台,包括PC、平板电脑和智能手机,还有即将进入人们生活的智能电视、智能汽车、智能建筑、移动健康监测设备等,它们将产生1.6ZB的数据,是目前全球云计算网络年度流量的12倍。(本刊注:1ZB=1024EB,1EB=1024PB,1PB=1024TB)是目前全球云计算网络年度流量(130 EB)的12倍。所以从全球范围看,数据大爆炸是正在发生的事,而激增的数据也推动着IT和互联网行业不断提出更高能效、更低成本的大数据应用解决方案。

中国的人口规模和经济规模决定了中国的数据资产规模,这位大数据技术的发展提供了最基本的数据资源。而大数据技术以开源为主,目前也没有形成绝对的技术垄断,大家都在同一个起跑线上,这也是一个好的方面。

大数据技术的发展给全球商业和人类生活都带来了重大的变革,中国企业也要自我革新来迎接这个潮流。对中国用户来说,越来越多基于大数据挖掘和分析的产品将让用户体验进一步提升,让大家的生活更便利。

“人才短缺是最大的挑战”

数字商业时代:大数据的革命性如何体现?谁将会成为大数据的真正受益者?

张晨:商业决策者和普通用户都将在大数据中受益。随着大数据技术从概念走向成熟, 基于精准、快速大数据分析的商业决策将成为许多公司成功的关键。普通用户将享受大数据给生活带来的便利,享受更智能更个性化的日常体验。

数字商业时代:移动互联网时代,大数据面临哪些机遇和挑战?

张晨:机遇方面,在移动时代,屏幕变得越小,用户对相关性的需求就越高。大数据带来的精准内容推送,将让移动互联网体验更加顺畅和愉悦。大数据技术的发展还将挑战传统产业和商业模式,并将催生一批新公司、新业务。

我们面对的挑战首先是人才短缺。一份麦肯锡公司的研究报告表明,预计至2018年,仅美国就将有14万~19万名拥有大数据深度分析能力的人才缺口,同时还需要150万位可以通过大数据分析做出有效决策的经理人和分析师。

数字商业时代:大数据应用下一步要解决的难点在哪些方面?对于雅虎而言的难点是什么?

张晨:更加巨大的数据规模、更加深入的数据挖掘、更快和更深的建模都是下一步大数据技术要解决的难点。数据规模将会是雅虎的一大挑战,我们拥有全球最大的私有云,数据量之大是绝大部分公司无法比拟的。

数字商业时代:2014年雅虎还将在大数据的研究与应用上有哪些部署?

张晨:未来一年雅虎还将继续发力大数据技术的研究和应用。雅虎每天都要处理PB级别的数据,我们的移动用户已经超过4亿并在飞速增长,这也带来了海量的数据。我们会加强大数据分析技术来获取对网络信息更加深入的分析结果,我们也致力于让所有的雅虎产品更加个性化、更注重移动领域的大数据分析,以及实现更加快速的分析处理。

抢广告 造内容 黏用户

社交数据「算计」影视

通过社交网络的大数据改变广告形态,甚至塑造内容,影视行业也要进入“算计”人群的时代。

撰文/覃怡敏

“最潮流的上海人,大爱炫目好莱坞,提到《环太平洋》最多;最文艺的北京人,追忆似水般流年,热衷于《致青春》;最激情的深圳人,爱飙车更爱创业,爱看《中国合伙人》;最赚钱的西安人,岂怕101次求婚!”

腾讯旗下社交平台QQ空间近日向业界分享起了有关影视方面的大数据。

从QQ空间发布的《大数据里看电影》的信息图可以看到,不同城市形成的气质、年龄影响的偏好、学历代表的口味、性别决定的追求等都直接影响着电影票房。他们相信“得社交网络者得票房”。

近年来,微信、微博等社交网络风生水起,但QQ空间的活跃度并未下降。这一次,作为中国首批认识到数据塑造影视重要性的社交网络之一,QQ空间迈出了第一步。

在乐视影业尝到运用数据营销发行《小时代》收获近5亿票房的甜头,大量增加人手收集影视数据的同时,社交网站们已经行动起来。

走得更快的是国际巨头。Facebook正在8国实施国际行动,向法国、德国等国10家电视台提供主流电视节目相关的用户评论数据,敞开大数据的怀抱。Twitter前不久也宣布与广告研究和顾问公司Kantar Media达成合作,将支持英国电视行业的节目规划和分析工作。

社交网络大佬们、网络电视台、影视制作方都欢欣鼓舞要运用好大数据,通过大数据改变广告形态,甚至塑造内容。影视行业也要进入“算计”人群的时代。

“互联网思维模式正在逐步重新定义传统企业。”腾讯社交平台部副总经理曾佳欣告诉《数字商业时代》,舆论环境的变化让社会化媒体营销崛起,社交网络的影响对影视行业的收视率或票房也将产生比较大的影响。

觉醒已经开始

“大数据”的思维和操作方式起步

2008年成立的艺恩咨询是国内影视产业数据收集和分析的先行者。

近两年,新媒体、社交网站、电子商务网站兴起,互联网技术不断革新,以及影视产业及其市场的大规模扩张,都为数据规模的提升提供了可能。艺恩咨询的发展轨迹就是很好的证明。

从收集专业部门的数据起家,如今,来自百度搜索、新浪微博、腾讯微博、淘宝等互联网平台的数据,已经成为艺恩咨询的重要数据来源。

与此同时,影视制作公司和社交网络也开始觉醒,“大数据”的思维和操作方式也开始起步。

视频网站爱奇艺透露其正在根据大数据挖掘的信息自制电视连续剧;盛大文学声称将基于大数据生产电视剧本;华策影视收购克顿传媒被指其大量数据储备和分析经验;乐视影业更是根据《小时代》的相关网络数据研究做了一次成功营销。无论《小时代》是否叫好,但其首日观影人次236万创下国产首日观影人次纪录而叫座于90后女性,不得不令人慨叹。中国影视行业不断与“大数据”这个时髦的概念发生关系,也越来越与社交网络紧密联系。

“《泰囧》上映时在QQ空间的提及次数达1600万次,是所有社交平台数据最高的。”年初,一篇关于《泰囧》的社会化营销攻略的分析文章引起了腾讯社交平台的重视。曾佳欣说,当时文章里对比了各大社交平台的数据,其中提及到QQ空间对电影营销的推动,很好地说明了平台用户的口碑传播对影片的价值。

紧接着,4月份《致青春》上映后,他们很快注意到,QQ空间里用户讨论致青春话题的内容在短短时间内超过9000万条。他们分析了上映后7天的话题趋势,《致青春》4月26日上映当晚,QQ空间网友就对其展开了热议,4月30日迎来一个热议高峰,而后,热议逐渐减弱,在假期归来上班第一天的5月2日,网友对其的讨论达到7天来的最高峰。

此外,他们也注意到,影视类如中国好声音等热门节目也都在QQ空间引起话题热议。

为何不把关于影视行业的大数据做一个单独的收集呢?从8月底开始准备,确定数据维度,然后数据建模,并开始对数据进行分析,最后QQ空间呈现给外界一幅关于大数据的影像图。从这些自发的用户口碑热议背后,腾讯社交平台开始尝试对外分享一些口碑传播的数据分析给影视类行业做参考。

事实上,中国已于2012年成为全球第二大电影市场。市场规模还在扩大,优质作品还需要增多,大数据也将愈发重要。艺恩咨询总裁郜寿智分析:“细分的消费市场会慢慢出现,分众化的传播方式也就越来越重要。”这个时候,社交网络更好地做出数据模型分析和利用产生在自家的影视内容也成为拉动产业和市场升级的突破口之一。

QQ空间的研究数据表明:一部电影在QQ空间讨论次数越多,其票房也就越高。在QQ空间,大到一篇观后感,小到一条说说,都会影响98个好友。从而形成细胞分裂般的传播速度和规模,影响成千上万人。社交网络的魔力更越来越凸显。

从买位置到买“人”

数据改变影视广告形态

假如你爱看网球赛,那么当你在某社交网站和朋友讨论的那一瞬间,“又一个网球迷,这个网页上有一个闲置广告位”的消息便迅速传到了该网站赞助商的广告主们那里。于是,下一刻,你接下来打开的页面将会出现相应广告。

原有的影视广告主们也将慢慢过渡分化到相应的社交网络上。进而,经过精准进化,广告主也要由买位置过渡到买“人”。

当然社交网络的意图并不在竞争,他们更看好合作,悄悄抢夺广告的同时,他们更要与电视、电影制作方达成合作。事实上,社交网络潜在的影响力在激起了广告主浓厚兴趣的同时,也引起了电视网络的关注。

尼尔森就发现,每一条同电视节目相关的Twitter消息平均会拥有50的点击次数,而围绕热门节目展开的广泛互动则可以为节目和Twitter带来更多观众。

Twitter自身也已意识到,围绕电视节目内容所展开的社交对话数量正在不断增多,而这样的趋势可以为公司带来更多的广告收入。当然对于电视台、影视制作公司而言,他们也能够去更好地说服广告主。

不甘落后的是Facebook。在美国,Facebook正和Twitter争做全美最佳电视节目讨论平台。

前不久,AMC旗下神剧《绝命毒师》的大结局总共吸引了1030万观众,成为了有史以来收视率最高的电视剧大结局之一。该剧剧终后,无数的粉丝纷纷在Twitter和Facebook上分享自己对这部片子的看法,进而引发了Facebook与Twitter新一轮的战争。

他们都有自己的标准来判断社交电视对话的效果。无论是相关话题的微博,还是对话中的帖子、评论或者“赞”,他们都要争着证明在自家网站上的讨论更火、数据更多,进而想进一步争取和电视台或者广告主的合作。

Twitter在近一年来已经与数十家广告主和内容分销商签订了电视相关交易。今年,它花费了大量精力与时间同福克斯、MTV等电视网络达成了合作协议,并与喜力等消费品牌展开了合作。在很多人眼中Twitter已经成为以电视为中心的社交对话方面的领军企业。

“我们围绕电视打造出了一项新业务,我们将自己视为一个拥有巨大信息传播能力的角色。”Twitter全球营收总裁亚当·贝恩这样总结。

Facebook正在拼命追赶。在展开国际行动的同时,Facebook也成功说服微软、福特和卡夫等传统电视广告主相信Facebook相比电视可以更高效地接触到目标用户。Facebook全球营销解决方案副总裁卡洛琳-艾佛森认为:市场营销人员希望和消费者保持同步,而他们就是这样一个强大的品牌建设平台。

祭出营销利器

数据塑造内容本身

一部《纸牌屋》红遍了全球网络,也证明了Netflix公司充分运用大数据的力量。

作为一家在线视频播放网站,Netflix网站根据用户数据发现了影片可能大卖的必要因素:BBC同名剧、导演大卫·芬奇、老戏骨凯文·史派西,于是自制了《纸牌屋》。

其实,面对复杂的市场环境,许多投资者和创作者都想知道,究竟什么样的影视作品才会得到观众和市场的认可和欢迎。“大数据”或许是一把通向更广阔市场的钥匙。大数据时代,观众不再是被动的观看者,出品方拍什么、谁来拍、谁来演、怎么播,都会参考观众的客观喜好来统计决定。

社交网络等将越来越多发挥作用。Netflix之后,亚马逊正在效仿制作《纸牌屋》的模式,同时运作10余个电视剧项目。不甘人后的还有微软、谷歌、苹果、英特尔和几家社交网站,它们都有计划通过大数据分析,制作影视剧或其他类似产品。

国内跟进者爱奇艺等在积极谋划自制剧的同时,还将大数据运用到了版权采买、广告投放、用户影视内容推荐等多方面。

电视内容目前依然是社交网络用户最喜欢的讨论话题之一。再进一步想象,随着数据的进一步增加,坐拥用户资源的社交网络、新媒体们完全有能力通过数据挖掘,分析用户癖好,向电视台定制一部电视剧甚至向好莱坞定制一部电影。大数据正在改变这些古老行业的行为规则。

对于社交网络本身,对大数据的应用也能使得他们黏住和赢得更多用户。腾讯曾佳欣告诉记者,对于社交网络平台来说,他们可以关注到话题的趋势变化和热点事件,来做热点事件运营,提升用户的活跃度。下一步,良性的生态里,自制剧、定制剧或将成为可能。

当然,大数据也并非“定海神针”,作用也不能过度放大。毕竟影视行业利用大数据讨巧的同时也必须靠自身内容说话,而数据能否有效地转化成生产力也还尚需时日。“算计”争夺战才刚刚拉开帷幕。

把技术变价值

舆情「舵手」红麦软件的马拉松

红麦软件的创业路径,是基于对互联网大数据的挖掘,满足企业最基本的舆情信息监测诉求。

采访·撰文/周颖 摄影/车庆久

挖掘互联网的大数据价值,成就了屈伟大学时代的创业梦想。

“当梦想变成了现实,你的奋斗目标就会变得更高。红麦未来的目标,是让新技术的价值最大化,借助新技术衍生出更完整的产业链条。”

身为红麦聚信(北京)软件技术有限公司(以下简称红麦软件)总裁,“80后”的屈伟无论是之前的工作还是现在的创业,都可以用“跨界”来形容。

原本水利系专业的屈伟,却对水利专业毫无兴趣,热衷计算机的他,大学时期就喜欢钻研新技术对生活、对社会的价值改变,以及由此创造出新的商业机会。在猫扑、搜狐任职期间,屈伟对互联网有了更深刻的认知。互联网虚拟的世界,却深刻改变并影响了现实世界。这个由大数据构成,甚至主宰世界的虚拟网络,是一座取之不尽的财富金矿。对互联网技术充满创新基因的屈伟来说,他的创业注定无法与互联网割裂。

每天都会有因互联网诞生的企业,每天也都会有败北于互联网的企业。红麦软件借助互联网的创业路径,是基于对互联网大数据的挖掘,满足企业最基本的舆情信息监测诉求。

创业灵感源于身边的触动

“红麦软件主要为品牌企业、政府部门提供舆情监测与分析服务。通过技术手段智能抓取互联网信息,为用户提供最及时、动态的舆情数据监测、数据分析及咨询服务,协助企业准确掌握产品和市场情况,掌握竞争对手和行业动态,了解网民口碑,为企业市场、营销决策提供支持支撑服务,帮助政府部门快速发现突发事件、重大事件,快速应对,提高政府和企业的形象。”屈伟说。

事实上,屈伟打造的红麦软件有其偶然性,更有其必然性。发生在屈伟身边的偶然事件,对他产生了很大的触动。

2007年春节,屈伟和朋友聚会期间,朋友向他诉苦不迭。原来,朋友所在的企业被竞争对手在网上散布谣言恶意中伤。虽然事后企业和相关部门都进行了澄清,但由于没有第一时间发现并迅速处理,谣言扩散很快,对企业形象造成了很大的影响,市场销售也因此出现大幅下滑。

一次寻常聚会,给屈伟带来了很大触动,甚至萌发了创业激情。“我当时就在思考,如果能有一种软件,可以帮助企业、政府不间断地对互联网动态进行监测,并为他们建立预警机制,一旦发现类似重大、负面、敏感的事情就自动第一时间通知用户,或许能为用户提供最有利的应对时机,避免事态进一步扩大。就好比建立一个火灾监控系统,在灾情刚刚萌芽的时间发现并预警,才能及时控制并把灾情损失降到最低。互联网作为大数据平台,其信息传播具有非常规的速度、广度和深度,如果能在这个平台上深度挖掘,或许是一个不错的创业机会。”

由此,2008年3月,红麦软件问世。

从互联网舆情监测软件市场来看,红麦软件并非起步最早。和同行相比,红麦软件的优势主要在于对互联网信息数据背后的深度挖掘,以及为客户提供专业、实用的研究报告。

一家国有金融机构的市场部负责人曾对记者表示,红麦软件并非仅仅是提供软件系统,着这只是最基础的服务。通过对监测到的信息进行深度挖掘,红麦软件为用户提供政策动向分析、行业动态分析、竞品动态分析、市场传播效果监测及传播策略咨询等服务,这些才是最有价值的,也是其他同行目前不具备的。

我们有一场约定而不是赌局

大数据,已成为2013年互联网企业出现频率最多的关键词。

大数据改变的商业模式,以及大数据引发未来的商业猜想,似乎能预见未来。专注于为品牌企业、政府部门提供舆情监测和咨询服务,是红麦软件的生存法则。

红麦软件舆情监控系统是将搜索引擎和中文信息处理技术应用在企业舆论情报服务的一次创新。系统利用独有的爬虫技术,根据用户预订的监控关键词在15分钟以内发现15万个重点新闻、论坛、博客等网站里的舆情信息,并对重要的舆情信息及时报警。

“我们的目标并不虚幻与宏大,而是必须务实。和其他行业软件相比,舆情监测软件比较特殊,由于是对互联网信息进行采集和分析处理,对自然语言的分析处理、情感判断就显得尤为重要,其操作具有很强的专业性。经过5年多的发展,我们的自然语言处理技术、中文分词技术和情感判断系统已臻于成熟。我们的技术和系统具有完全独立自主的知识产权,因此我们和自己有一场约定,就是要设立未来3~5年的目标,把目标当成一场马拉松赛,要跟自己赛跑。这不是一场赌局,而是我们能看到的未来的愿景,很多企业愿意和我们共同参与这场马拉松。”屈伟说。

红麦软件有着典型“80后”的思维方式与创业路径:他们致力于关注身边的事情,在创业的过程中敞开心胸与企业共同做大;他们在大数据中挖掘价值,他们思维活跃却做事专注。

创业是一场约定。在约定中屈伟左手托起了大数据平台,通过智能监测,将舆情市场的大数据做到了极致;右手祭起了技术创新的大旗,在和市场的较量中,红麦软件要用技术跑赢市场,要用专业赢得信任。

专业是一种信任,是一种态度。红麦软件通过利用中文分词技术、自然语言处理技术、中文信息处理技术,对互联网信息进行垃圾过滤、去重、相似性聚类、情感分析、提取摘要、自动聚类、自动分析热点等处理,辅助专业的分析师编制完成详细的舆情分析报告。

做一件有趣的事情其实比成功更重要。对于屈伟而言,实现自己的梦想,把技术变成价值,这正是好玩又有趣的事情。红麦软件的有趣在于,一支最年轻的创业团队,用自己的技术和服务,为众多重量级的品牌企业和政府部门提供最需要的内容。红麦软件的成长并不孤立,越来越多的企业来相伴,和他们一起成长。

“未来,红麦软件不只是提供基础的技术和服务,而是立志于为用户提供更具附加值的服务。我们目前整合了专业的危机应对团队、战略咨询团队和品牌管理团队,这将是我们今后的核心竞争力。大数据时代,在细分领域中,我们仍将专注于舆情服务。”屈伟说。

万能的大数据

技术不是最精准的决策标尺

正像科技产品永远不能成为人们最坚固的记忆硬盘或记事本一样,大数据也不能替代人脑成为人们生命中的决策标尺。

撰文/覃怡敏

“互联网的人都希望做出下一个《纸牌屋》,但是内容的创造并不是有大数据储备就能成功的。”前不久,视频行业的一个大佬在接受《数字商业时代》记者采访时坦陈。

《纸牌屋》的成功,已经成为充分应用大数据分析的成功案例,一众视频网站也希望自己能成为下一个Netflix,他们同时也深知,内容创造并不是一个程序或计算题,大数据能“算”出很多,“算”不出来的也许更多。

尽管基于数据分析的营销、决策更为精准,然而不可忽视的是,大数据再强大、再神奇,它都不能成为人们生活、工作中的价值杠杆。正像科技产品永远不能成为人们最坚固的记忆硬盘或记事本一样,大数据也不能替代人脑成为人们生命中的决策标尺。

正如硬币的两面,数据爆炸意味着更多的噪音——冗余、虚假、有害信息, 当全球网络压倒一切大数据无所不在时,我们必须防止自己迷失在记忆的碎片里,重新恢复忘记。

大数据“算”不出创意与想象

非人类记忆的尴尬与残忍

大数据来源于现实。

人类的许多想法却并非如此,创造性的思维与想象往往是非理性的,“创意和想象,用大数据是‘算’不出来的”,因《大数据时代》走红的牛津大学互联网研究院教授维克托·迈尔·舍恩伯格直言。

今天,人们用数据来记录这个世界,再通过研究数据去发现这个世界。但这个世界的生活、生意都需要创意和想象,大数据只能是一种参考。

全球新增的数据有95%是数字化信息,很容易被搜索查询、引用或转载,但是这其中有不少是无效信息,甚至是当事人不愿意记忆的信息。维克托指出:“随着廉价数字存储设备的普及,记忆成为数字时代的常态。但是互联网如果记住了我们想要忘记的东西,就很容易毁了我们的生活。”

比如,大数据让互联网广告进入精准时代,广告主们通过RTB实时竞价在网络上放置广告,也闹出了误点“骨灰盒”之后、眼前的橱窗广告被各式骨灰盒覆盖的尴尬。

大数据时代,人们的每一举一动都会“被搜集”,再加以资料整合与加总。网络通过大数据的搜集,会拥有比你更好的记忆力和分析能力,可能比你更懂你。当一些互联网公司拥有了“读心术”般的营销能力之后,人们就感到害怕了。的确,数字技术赋予人们前所未有的权利,可它也会产生意想不到的可怕后果。英国社会学者保罗·杜吉德也认为,“无止境的积累,会让人们迷失在记忆细节之中”。

维克托在《删除:数字时代遗忘的美德》一书中指出:“数字技术和全球网络压倒一切,使我们忘记自己的自然能力,我们必须重新恢复忘记。”

“人工智能”的终极遗憾

大数据不能替代人类思维

从犹疑到怀念,依赖于男友阿什生前在网络上留下的信息、数据,玛莎拥有了一个新的“真实的”、具有“人工智能”的阿什。

可慢慢的,她却发现,即使原来的阿什是社交网络达人,在Facebook、Twitter等网站上的信息数据量非常详尽,但新的阿什却并不能真正懂她。玛莎陷入了另一种悲痛。

发生在英剧《黑镜》里的故事令人心酸。在可以想见的未来里,智能合成肌肉研究成功,通过大数据,人类可以再造和逝去的人几乎一模一样的机器人。可是,人类的思维不可替代,直到后来小玛莎出生,玛莎才获得真正的陪伴,此时“人工智能”的阿什只能被玛莎“流放”到阁楼上生活。

人类的真实内心、思想并不能通过大数据完全测算出来。或许,网络科学家可以测量出我们在76%的时间里与6名同事的社交互动情况,但是,他们不可能捕捉到我们隐藏在心底对那些一年或许也见不了一次的儿时玩伴的感情。

人类的思维、决策镶嵌在时间序列和背景之中。人们往往擅长讲述交织了多重原因和多重背景的故事。但数据是不懂得这些背景的,数据分析不懂得如何叙事,也不懂得思维的浮现过程。

即便是一部普普通通的小说,数据分析也无法解释其中的思路。显而易见大数据不能代替人的思考。

“黑天鹅”事件的不可预知性

“价值密度较低”中去粗取精

大数据的核心功能之一就是预测。但大数据没法预测不可预知的事情,或者是毫无先兆的事情,这类事件通常被称为“黑天鹅”。

大数据是基于过去的数据来预测未来,当过去不可掌握时,它便无计可施。即便是过去看似可以掌握,以大数据为标尺的预测决策也不一定准确。大数据从来都不可能是“原始”的,数据总是依照人的倾向和价值观念而被构建出来的。这让数据的生产往往也掩盖了价值观念。

人们所眼见的大数据分析的结果看似客观公正,但其实价值选择贯穿了从构建到解读的全过程。从这个意义上讲,大数据也不能成为人们决策的精准标尺。真正的“黑天鹅”隐藏于无形之中,是很难被发现的。

著名商业思想家、《黑天鹅:如何应对不可知的未来》一书的作者纳西姆·塔勒布指出,随着我们掌握的数据越来越多,可以发现的统计上显著的相关关系也就越来越多。这些相关关系中,有很多都是没有实际意义的,在真正解决问题时很可能将人引入歧途。

“这种欺骗性会随着数据的增多而呈指数级地增长。在这个庞大的‘干草垛’里,我们要找的那根针被越埋越深。”纳西姆说。

因此,人们不但不能把大数据一股脑地当作宝库,反而要冷静审视数据的两面性。预知未来的高科技“水晶球”也有不为人知的一面,抛弃有害和无用的信息至关重要。

和任何一种伟大的工具一样,大数据有其拿手强项,也有不擅长的领域。要想用大数据,先知其短板。机器储存和分析难以囊括几十亿兆数据,即使储存了这些数据,专业人员也无法全部调阅,删除和忘掉无价值的、不相关的信息是处理大数据的重要原则。

正如维克托的建议,人类应采取的措施是“数字化节制、保护信息隐私权、建设数字隐私权基础设施、调整人类的现有认知、打造良性的信息生态、完全语境化”。

大数据 从云端到凡间

方之熙的一天

采访·撰文/白鹤 摄影/李铮

2013年11月29日15:07,在北京海淀区中国英特尔物联技术研究院里,院长方之熙正在和同事们研究一项时下颇热门的大数据应用,如何低成本地测量PM2.5。

测量仪器中的的传感器通过Wi-Fi、3G等网络将环境实时数据输送到“云端”,再通过机器学习和云计算,把数据更精确地反馈到手机上。这些数字可以清晰地表明你所处位置的pm2.5是多少。

方之熙从不抽烟,可是为了实验,一支烟就成为测试空气质量的最好道具。一旦香烟燃起,PM2.5指数立即上升,实验室里的那道光线也骤然发亮。

这一幕只不过是他日常工作中的管中窥豹,大数据和他24小时的生活已经分不开。

在不少公司、实验室和政府机构,“数据”被捧为21世纪新型“石油”。在方之熙看来,这种“新石油”在2013年最大的变化莫过于“飞入寻常百姓家。”

“大数据的应用已经很大程度地推广到老百姓生活当中去,比如人们上网买东西用支付宝,把钱存在余额宝里。我们出去吃饭总用定位查找哪个饭店最近,这些背后都有大数据在运作,尽管我们看不到。” 方之熙说。

小格子,大世界

英特尔研究院里每个员工的办公室都不过是几平方米的开放的小格子间,方之熙也不例外。

在这里他要用PC处理很多日常事务。唯一特殊的是,在旁边有一张小圆桌,他可以和同事面对面畅谈。

行走,数字无止境

方之熙的碎片时间也逃不脱工作,在车厢里处理邮件是最常见的一幕。当然他也常用手机地图查找路线,寻找美食餐厅。

视频不能承受之“逆差”

参加视频会议是方之熙最不愿为之的事情。会议往往是从美国时间早八点持续到下午16点,这意味着他要在这个视频会议室从凌晨12点一直呆到次日早8点。而这样的会议差不多每两周就要召开一次。年过的他往往在开会前小憩一会,还要备足咖啡零食,以熬“时差”之困。

但正是这样方便高效的智能办公,见证了英特尔的每一步重大计划与决定。

3D打印,创新的盐

3D打印将是英特尔研究院重要的研究方向之一。方之熙每每要投入30%的精力到此项可能主宰未来的技术中。

咖啡厅里的会议30分

楼下的咖啡店是方之熙除了办公室和家之外的“第三空间”,每周至少有两天他是在这里度过的,常常与属下共进午餐,不时要用手机当面沟通工作,这样最重要的意义在于节省时间。

BIG BANG

大数据的力量

寻找大数据的「掘金者」

评选背景:

在过去一年里,《数字商业时代》在对全国范围内的100多位CEO/CIO进行了调研,了解了他们对互联经济大格局下企业如何可持续发展的看法,发现CEO/CIO们并不满足于日益加强的IT管理,而是希望充分发挥大数据和互联科技的潜力,重新思考人与人互联后对企业带来的价值。

尤其在今天的环境里,数据量的爆发和以前完全不一样,有90%的数据是在过去两年创造的,到了2010年时,全世界要消化的数据量是现在的44倍以上。

而有越来越多的企业愿意投资在大数据的分析上,根据Gartner调查,目前有27%的企业已经投资了大数据分析系统,也有31%的企业预计在接下来的2年内投资,希望能加强大数据分析相关硬件和软件的能力。

如果能把大量的数据,用科学化的方式做到更优化的预估,那么,在面对复杂环境所带来的诸多挑战下,不管是企业或政府就有可能运用这些经过提炼的智慧,创造新的增长机遇以及全新的价值。

评选标准:

我们将从几个维度评估那些在大数据掘金的企业:

1 能否通过大数据进行预测

大数据的核心就是预测,它通常被视为人工智能的一部分,或者更确切的说是一种机器学习。在大数据时代,我们可以分析更多地数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。

案例:对冲基金通过剖析社交网络Twitter上的数据信息来预测股市的表现;亚马逊和奈飞(Netflix)根据用户在其网站上的类似查询来进行产品推荐;Twitter,Facebook和LinkedIn通过用户的社交网络图来得知用户的特别喜好。

2 能否将混杂的数据化繁为简

据估计,只有5%的数字数据是结构化的且能适用于传统数据库。如果不接受混乱,剩下的95%的非结构化数据都无法被利用,比如王业和视频资源。通过接受不精确性,我们打开了一个从未涉足的世界的窗户。

案例:2012年,让ZestFinance引以为豪的就是,它的贷款拖欠率比行业平均水平要低三分之一左右,制胜之道在于“拥抱”了混杂的数据。举个例子,有10%的客户属性信息显示“已经死亡”,但是依然可以从他们身上收回贷款。ZestFinance的数据显示,房贷给“僵尸”是一项不错的生意。

3 能否将数据“量化”

大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今的信息技术变革的重点在“T”(技术)上,而不是在“I”(信息)上。现在,我们是时候把聚光灯打向“I”,开始关注信息本身了。

案例:UPS快递多效地利用了地理定位数据。为了使总部能在车辆出现晚点的时候跟踪到车辆的位置和预防引擎故障,它的货车上装有传感器、无线适配器和GPS。同时,这些设备也方便了公司监督管理员工并优化行车路线。2011年,UPS的驾驶员们少跑了近4828万公里的路程,节省了300万加仑的燃料并且减少了3万公吨的二氧化碳排放。

4 能否利用数据创新挖掘真正价值

数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。

案例:Farecast利用机票销售数据来预测未来的机票价格;谷歌重复使用搜索关键词来监测流感的传播;麦格雷戈博士用婴儿的生命体征来预测传染病的发生;莫里重新利用老船长的日志而发现了洋流。

5 是否拥有独立的数据“中间商”

在未来,我们可以利用数据做更多的事情,而数据的拥有者们也会真正意识到他们所拥有的财富。因此,他们可能会把他们手中的数据抓的更紧,也会以更高的价格再出售。

案例:微软以1.1亿美元的价格购买了大数据公司Farecast,而两年后谷歌则以7亿美元的价格购买了给Farecast提供数据的ITASoftware公司。

关键字:数据谷歌舆情信息大数据

本文摘自:数字商业时代

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^