从《西游记》中的Bug到大数据分析的优势!

责任编辑:editor006

作者:宋维军

2016-04-07 17:33:51

摘自:智客研习社

最近几年,以西游记为底本的娱乐影视又大火起来:包括动画,像《大圣归来》,《西游降魔篇》,《三打白骨精》,《大闹天宫》等等。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

最近几年,以西游记为底本的娱乐影视又大火起来:包括动画,像《大圣归来》,《西游降魔篇》,《三打白骨精》,《大闹天宫》等等。周星驰巩利周润发郭富城黄渤舒淇等明是也轮番轰炸。还有最近比较火的《疯狂动物城》。

吴承恩在写西游记时限于时代的局囿,若以今日大数据的方式做准备,就 大数据(big data)指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

  大数据与云计算的关系

对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

信息时代的今天,一个人一周内获得的有效信息量,比过去普通人一辈子获得的还要多。其实人脑本身就是大数据存储分析提取的云平台。

大数据特点

第一,数据体量巨大。从TB级别,跃升到PB级别。

第二,数据类型繁多,如前文提到的网络日志、视频、图片、地理位置信息,等等。

第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。

第四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落的各种各样的传感器,无一不是数据来源或者承载的方式。

大数据本身不且有创造性质,但在占有海量信息且有效分析提取后,在精准预测的基础上可激发人的各种想像力和灵感,从另一角度也可说量变导致质变,也算得一种创造。

链接已复制,快去分享吧

企业网版权所有©2010-2025 京ICP备09108050号-6京公网安备 11010502049343号