大潮交响曲:建设全球大数据创新中心

责任编辑:王李通

2014-03-08 08:21:19

摘自:和讯科技

上世纪60年代,沃尔玛连锁超市在研究销售记录时发现,给孩子买纸尿片的男人常会顺便买几瓶啤酒。为此,超市在尿布旁边摆上了啤酒架。

引子

评论家很喜欢谈论“尿片与啤酒”的故事。

上世纪60年代,沃尔玛连锁超市在研究销售记录时发现,给孩子买纸尿片的男人常会顺便买几瓶啤酒。为此,超市在尿布旁边摆上了啤酒架。

这是半个世纪之前的故事,被认为是大数据分析的开始。

20年后,影响全球的未来学书籍《第三次浪潮》预言,未来信息时代,必然有大数据的应用。

但直到五六年前,网上百科全书Wikipedia还不愿开辟“big data”的词条。

那时候,很多人认为,“big data”不过是两个单词的组合而已。当时,如果你浏览一下网页就会发现,人们更倾向于,大数据是一个概念和憧憬,志向不小,但成就不多。

不过,就在这两三年,大数据应用呈“爆炸”之势,五彩缤纷的创意开始变成现实。

“大数据时代,互联网思维促进行业转型升级的作用越来越明显。基于海量数据资源的挖掘和应用催生的大数据产业,是全球下一个促发创新、角力竞争、提高生产力的前沿领域。”中关村(000931,股吧)管委会主任郭洪说,“中关村将坚持把大数据产业作为战略性新兴产业发展的突破口,以大数据应用和商业模式创新为重点,全力建设全球大数据创新中心”。

第一部分:潮起中关村

“化学推动了工业时代的大繁荣,大数据正成为新时代的化学。在新时代里,可能会出现数据周期表和数据领域的门捷列夫。”在宽带资本董事长田溯宁看来,“经过计算机时代和互联网时代,大数据成为未来发展的重要方向。”

2012年底,在中关村大数据产业联盟成立大会上,田溯宁作为投资方代表,宣布了云天使基金、中云融汇基金、大数据实验室孵化基金三支基金的创立,这也拉开了中关村率先布局大数据产业的帷幕。

按照章程规定,三只基金将面向大数据等领域的早中期创业企业,关注这些行业种子期的技术和商业模式,发现、培育和扶持创造性的思想、创新的技术和创业的团队。

云天使基金的投资方之一,北极光董事总经理邓锋认为,在对互联网、物联网等渠道广泛大量数据资源收集基础上,数据存储、价值提炼、智能处理和分发的信息服务业需求越来越多,大数据时代悄然来临,本土数据可能会造就有世界影响力的中国企业。

就在那一年,大数据在IT领域进行着技术变革,并在不断冲击着政治、商业、社会、科技诸多领域。

在当年1月瑞士达沃斯召开的世界经济论坛上,大数据是主题之一,发布报告《大数据,大影响》宣称,数据已经成为一种新的经济资产类别,就像货币或黄金一样。

而在两个月后,美国政府发布了《大数据研发计划》。麦肯锡咨询公司评估认为,大数据关于非结构化数据的把握以及运用,不仅具有商业价值,还将成为国家战略的一部分。

片段之一:用大数据给电影“算命”

“预估票房3.8亿左右。”2012年11月9日,在媒体对于《1942》票房破7亿的热炒声中,刘晗在微博中泼了一盆冷水。数周后,《1942》最终票房3.64亿。

掌握可以改变行业未来、满足需求的技术,我想做出来。”刘晗希望用大数据挖掘冷却当前火热到有些反常、投资近乎盲目的中国电影市场,推它回归理性。

在旁人看来,他是在做梦;对于刘晗,他在接近自己的梦想。

百余平米,不足十人,刘晗创办的新影数讯公司,汇聚着大得惊人的数据流—“我们的基础数据库里有两万部电影,六万名艺人、四千位导演,以及公众对他们的评价。”

刘晗说,他的团队正精益求精地在这些数据中寻觅电影票房的先兆,“我们还有涵盖微博80%(活跃)用户约8000万人的偏好分析。”

“我们就是拿这些数据给电影"算命"。”刘晗调侃说。

“数据显示,300万20—22岁的女性喜欢青春偶像剧,150万30—35岁月收入过万的白领男性喜欢寻宝题材。”刘晗讲解着面前纤小笔记本上有图有数据的演示。他的思路延伸进决定电影受欢迎度的30—50个参数变量中,这赋予了软件高于80%的预测准确度。

片段之二:像“哆啦A梦”一样缩放“大数据”“服务器"撑死"了,什么都调不出来。”一次信息业务研讨会上,某公安厅交警处处长抱怨,“高速路每过一辆车就一通儿咔咔拍,每次事故处理和每个车驾档案都是数据,增长远比硬件扩容快。”

信息海无形的潮涌往往让有形的硬件跟不上趟儿,大数据时代是不是就需要“无穷大”的存储空间?

“这个文件23兆,”黔龙泰达创始人张春成,指着一个扫描文档演示,“你看,经过独特算法把文件转换成新格式,它变成了24K。再把它转回去看看。”张春成的演示下,文档又恢复原来大小,打开后图片质量不变。

用时拿出来放大、闲时揣起来缩小,有张大圆脸的张春成,变魔法般地随意压缩释放着图像、视频文件,像极了总能掏出神奇道具的“哆啦A梦”。

和“哆啦A梦”不同,张春成深谙缩放的原理,“这一片都是白色,我可以把这些白色的点统一描述成一个数据,”他顺手从桌边拿起张纸比划,“这些以前要用几万个字节描述的点,我只用几十个字节就描述清楚了,文件自然缩小。”

“我能把图像变为原来的百分之一甚至千分之一,这取决于你对还原时质量的要求。”张春成通过“独特算法”压“扁”大数据,解决了传输、管理和利用的难题。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号