在今天上午召开的由中国计算机学会主办的“Hadoop与大数据技术大会”上,中科院计算所所长孙凝晖表示,如果说20世纪是一个石油为王的时代,21世纪就是一个数据为王的时代,21世纪数据的价值有可能等同于20世纪的石油。
但是,孙凝晖也指出,目前,互联网服务对大数据的处理和挖掘还远远不够,还有很多有价值的数据未被从海量的大数据里发掘出来,产生很多新的商业形态、新的企业和新的服务。
“如果把大数据和石油行业对比,数据勘探技术还很落后,跟石油的勘探技术相比还差得很多,我们在理论和技术的积累上还很弱,不知道大数据的几个基本的原理和算法是什么,最基本的操作是什么,不像数据库有基本和完整的理论体系,也没有成套的工具,这就需要产学研共同努力来发展理论和技术。”孙凝晖如是说。
孙凝晖表示,Hadoop是在互联网行业处理大数据的一个非常好的工具,同时大数据本身也超越了互联网行业,因为生物基因本身也是大数据,基因数据产生以后也会产生很多的学术价值、商业价值。利用Hadoop挖掘大数据,利用大数据开发更大的价值,探索富有创新的空间。