在2013APOE年度峰会暨亚太智能互联产业发展论坛上发言时,清华大学苏研院大数据中心主任林辉表示:“大数据时代的到来,将会带来人类文化的一场革命。”
他进而解释到因为IT技术发展进程的前三个阶段是通过设备和网络为我们提供服务,这是一个整体的服务系统;当服务关联到数据本身时,信息化建设也就发生了变化,而数据将成为信息化发展与建设的核心。
大数据源于云计算、物联网和移动互联网,而云计算是人们追求的一种模式和路径,大数据由此而产生。当今社会的发展主要分为:经济产业发展、政府职能管理、社会公共职能保障、军事和国防安全等几大部分。关于经济产业的发展和政府职能管理的关系,在近日召开的十八届三中全会中提出“治理”,而不是“管理”,就是使管理的主体变得多元化。
在当今社会与技术发展的过程中,数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。对于海量数据的挖掘和运用将会成为技术发展和社会发展需要突破的瓶颈。如果这个问题没有很好的得以解决,我们将永远沉浸在云计算、物联网、移动互联、智慧城市等所有的梦幻当中。数据不能有效的互联、互通、互享以及互用,云计算、物联网、移动互联、智慧城市都将只是一个幻想。
证券日报:能谈谈中美两国对大数据认识的差异吗?
林辉:中国和美国对大数据的理解和重视程度是不同的。美国提出这个概念的时候是基于用数据创造了新的模式和内容。而中国在基础设施建设和整个信息系统的发展上,跟美国有着非常大的差距,这个差距能够大到十年、二十年。但是在云计算、移动互联网领域,中国起步比美国仅仅晚两到三年,但在传统的信息系统,特别是应用系统的技术完善性上,中国与美国还存在着很大的差距,所以美国对大数据的理解是要用数据分析新的模式、新的路径。
中国对大数据认知到底是怎样的?无论是政府、企业,还是其他各行各业,所涉及到的大数据,一定要从数据的起源开始,从它的产生、存储、处理、统计、分析、挖掘、应用、互联互通等角度出发。站在整个数据价值链上去考虑,不能以美国的思维方式去考虑,因为美国的系统基本成熟,中国不能照它的路去走,否则就会像中国的汽车一样,发展这么长时间仍然存在很大的问题,虽然产能第一,但汽车的核心发动机、电速箱、底盘,甚至是外形设计,都受到别人的严重制约。因此,我们一定要用自身对数据的理解迎合中国的大数据时代,基于我国的国情、系统体系与现状,用我们的办法去实现对数据的使用。
证券日报:在大数据时代,数据可以成为新的生产要素吗?
林辉:数据是信息化的根本要素,只有关注了数据的实质,才能真正使信息化在各个板块中从辅助手段变成重要途径和创新动力。在大数据时代,数据的实质正在发生根本性改变。已经从过程记录的依据发展成生产要素。原有的生产要素大致分为:劳动力、土地及其他自然资源、人力资本和物质资本三大类,同时也曾经模糊地将技术和信息划在生产要素里,但不够准确和坚定。今后我们可以将数据定性为生产要素,不仅可以涵盖技术和信息的载体和表现形式,更能精准阐述其当今科技的核心实质。当一个新的生产要素加入到任何原有的生产方式时,就会对原有生产要素的比例、权重和质量有一个撼动原有存在状态的影响,形成新的爆发式增长甚至是技术性和产业性革命,进而促进人类文明的进步。
证券日报:您认为中国应该如何发展大数据产业?
林辉:以前一些科技巨头如IBM、微软、甲骨文等机构一直引导着中国信息系统的发展方向,但随着云计算、大数据的发展,这种模式正在遇到挑战。那么如何发展大数据产业?大概应从以下三个方面:众包、开源和长尾。
众包—集众人之力,一人独大的模式是不能也没有资本做全做好的。现在能向IBM、甲骨文、EMC、微软发起挑战的都是通过众包的模式进行的。集众人之力,也称作“群狼战术”。因为单个的机构买不起IBM的服务器,买不起甲骨文的数据库,买不起EMC的存储,所以要做分布式、虚拟化的调度实现大量数据的存储、分析与响应。
开源—开源可以汇众人之智,尽快丰富完善使其可用,降低成本。开源的概念其实源于原来的传统产业。有一个做化妆品的大企业聘请了大量的科研人员,研究各种配方,但后来发现这样做的产品成本会非常高,每个新出的化妆品价格必须在六百到八百美元左右,而且科研人员因研究任务复杂几乎被逼疯了。其中有一个化学工程师索性把他要研究的任务扔到网上了,许多志愿者开始研究这个东西,给他出各种的主意后又把结果反馈给他,这就是开源的由来。后来该企业的研究经费降低了20%左右。
长尾—长尾就是享众人之功。人人都做贡献了,人人就都可以在各个产业链条上分享各自的收获,使市场份额的曲线上不在显现头大尾短,而是头部适中,尾巴很长的曲线。
这三个要点其实有一个核心,就是要以开放的模式和心态共同创新。这同我们国家正在提倡以创新驱动解决改变模式、结构升级等问题的基调是高度吻合的。改革就是开发机制,释放创新。当政策理论和产业发展规律步调一致了,就会迎来一个新的春天。