当前位置:大数据业界动态 → 正文

被“大数据”的中国

责任编辑:editor004 |来源:企业网D1Net  2014-07-25 11:22:41 本文摘自:财新《新世纪》

时间是1948年,地点是中国东北。辽沈战役进入关键阶段。对于第四野战军司令员林彪来说,拿下锦州后的最重要目标就是打败前来增援的国民党新六军。林彪使用的方法就是每天听取“军情汇报”,由值班参谋员读出下属各个部队的当日战况和缴获情况。

那几乎是千篇一律的数据,异常枯燥。直到有一天,林彪突然发现,在胡家窝棚的一场两军遭遇战中,缴获短枪与长枪的比例比其他战斗略高,击毁小车与大车的比例比其他战斗略高,俘虏和击毙的军官与士兵的比例比其他战斗略高。

林彪由此断定,国民党军队的指挥所就在这附近,他下令立即对从这里逃走的败军进行追击。果然,部队很快就在附近抓住了国民党方面的指挥官廖耀湘,此成果揭开了中共军队辽沈战役胜利的序幕。

林彪当年的做法符合近年风行全球并深入改变世界的大数据的简单定义——从在别人看来枯燥乏味的数据中,发现有价值的信息,并将其转化为机会。 

人类社会全面数字化引发了数据量爆炸式增长。人、资金、商品的流动都以数据化方式呈现。当前,每天在全球各行各业产生的数据已经足以填满超过2亿张DVD光盘——在这些看似杂乱无章的数据中,蕴藏着无限的金矿。 

近年,伴随着存储能力、计算能力和传输能力的进步,人们开采这些金矿成为可能。数据不仅成为推动行业融合兼并、企业做大做强的战略性资产,更是体现一个国家综合国力的重要组成部分,成为陆、海、空权益之外的另一种国家核心资产。

当前,大数据时代无可争议地来临了。它源自全球数十年的技术积累,但仅用了最近两三年时间,便迅速渗透到各个行业。中国并不例外,百度、阿里巴巴、新浪微博、腾讯微信等最核心的资产便是大数据;众多行业、企业开始使用并利用大数据作出变革;中国6亿多网民的上网记录等正成为大数据的核心内容。 

在财新记者采访的诸多业内人士看来,大数据来临的势头甚至比十几年前互联网泡沫时期还要迅猛。大数据更加实际、更容易落地、盈利模式更清晰。由大数据推动的行业变革,将会对整个世界格局产生颠覆性的影响。 

而对于普通公众来说,虽处于大数据时代,但对大数据仍是陌生的。大数据在中国正在做些什么?一家企业或一个个人可以得到何种便利,又或可能遇到何种“坏处”?了解大数据,是解惑的开始。 

“国家核心资产” 

2012年3月22日,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略。奥巴马政府将大数据定义为“未来的新石油”,并表示一个国家拥有数据的规模、活性及解释运用的能力将成为综合国力的重要组成部分,对数据的占有和控制将成为陆权、海权、空权之外的另一种国家核心资产。 

美国的这一举动,是继1993年克林顿政府的“信息高速公路”计划后的又一次“狂飙突进”。在以中国为代表的新兴国家日益对美国的经济、政治影响力构成挑战的时候,通过大数据研究提高美国对数据资产的掌控能力,有助于美国抢占新的国际战略制高点。

但是什么是大数据,迄今为止,在产业界、学术界并没有形成一个公认的科学定义。上海软件产业促进中心主任唐全荣接受财新记者采访时说,他曾经和伦敦帝国理工大学一位华裔教授讨论,什么是大数据?而这位教授认为,能够处理的数据都不能称为大数据。

首先提出大数据概念的国际咨询公司麦肯锡,认为大数据就是大小超出常规数据库工具处理能力的数据。国际数据公司IDC则用“大体量(volume)”“多样性(variety)”“快速处理(velocity)”和“高价值(value)”来定义大数据。

正是由于大数据的这些特性,使得传统的数据分析、数据挖掘、数据处理手段都不再适用。社会需要为动态、高维、复杂的大数据建立形式化、结构化的描述方法,进而在此基础上发展大数据处理技术。

唐全荣说,跟云计算开始的时候一样,许多人在争论定义,而在IT基础设施从带宽到存储能力的发展让云计算真正走向应用的时候,就没有人再关心它的定义了。而大数据概念也是一样,它也是伴随着数据的处理、存储和分享能力的提升而出现的,从这个角度上看,大数据不仅是指需要处理的数据对象,也包括了处理的技术。 

如果说云计算为数据资产提供了保管、访问的场所和渠道,那么数据才是真正有价值的资产。随着人类活动和资源环境信息的数字化,更伴随着存储和处理能力的提升,让我们能够从包括文档、图片、视频乃至大量来自物联网的传感数据中获取有价值的信息。

虽然处理难度大,但是可能获取的价值更高。在美国,利用大数据可以帮助零售商增加60%的利润,帮助制造业减少50%的装配成本,基于大数据的智慧医疗,产值高达3000亿美元。

中关村大数据产业联盟副秘书长颜阳对财新记者说,现在的趋势就是数据要成资产。而这从Facebook上市获得的估值就可以看出来,它并没有多少实物资产,它上市后拥有的1000多亿美元的市值,都来自无形资产,最重要的无形资产就是它的数据。 

从中国的BAT(百度、阿里巴巴、腾讯)三大网络巨头来说,他们各自拥有不同的大数据,都是无价的资产。百度拥有用户搜索数据和公共网页数据。实际上百度、谷歌本身就是一个大数据公司,它们通过对全球网页数据的抓取和解析,帮助用户从海量数据中找出搜索结果,实质就是对数据的获取、组织、分析和挖掘的过程。 

阿里巴巴拥有交易数据和信用数据。这两种数据更容易变现,挖掘出商业价值。腾讯拥有用户关系数据和基于此产生的社交数据。这些数据可以分析人们的生活和行为,从里面挖掘出政治、社会、文化、商业、健康等领域的信息,甚至预测未来。

业内人士透露,也正是看到了用户数据的巨大价值,微博网站现在已经拒绝网络爬虫访问微博内容,这就让搜索引擎很难搜索到微博的内容,而微博自己则把这些数据打包出售。 

专门从事大数据分析的文思海辉技术有限公司首席技术官芮祥麟说,不久后,数据也将像技术、设备、人力资源那样,成为企业重要的资产。与其他资产不同的是,大数据资产越是开放,越是共享,越对整个产业和社会民生有利。

他认为,大数据的本质,将是把数据从应用中解放出来,独立形成价值链。今后将是数据定义应用,定义软件、定义网络、定义数据中心、定义一切。

据IDC预测,到2020年全球将总共拥有35ZB(1ZB=1万亿GB)的数据量。麦肯锡预测,未来大数据产品在个人位置服务市场的应用就将产生8000亿美元的价值,未来中国大数据产品的潜在市场规模有望达到1.57万亿元人民币,不仅将给IT行业开拓一个新的黄金时代,更将颠覆各行各业的竞争格局。 

掘金大数据 

“我们就是挖矿的。”在6月21日大连举行的大数据技术领袖峰会上,金电联行执行副总裁艾小缤对财新记者说,他们就是通过挖掘小微企业的财务数据,分析企业的信用等级,进而帮助他们拿到贷款。

对于广大中小企业来说,在中国缺乏信用体系的情况下,只能通过联保互保拿到贷款,而这实质上还是抵押质押。而这对银行来说,抵押品也并不安全。在经济下行的时候,一切担保的手段都会失效。

“在国外,有一个完整的体系去抑制失信情况的发生,但是我们没有。”艾小缤说。所以他们就想到了另外一个方法,就是让企业证明创造价值的能力,而这可以作为银行放款的必要条件。

这就用到了大数据。他们可以使用大数据技术描绘企业的赚钱能力。这些数据的来源,包括企业的采购情况、订单情况、库存情况,有多少应收账款、有多少现金、发了多少工资、交了多少税,甚至能耗的情况。

“我们不相信财务报表,而是看企业生产经营的真实数据,不看合计数,而是看明细数,因为合计数往往掩盖了真实的规律。”艾小缤说。例如在报表中,企业可以通过一笔过桥贷款而实现当季的赢利,但是在原始数据中,这笔突然而来的现金就会被发现。

从至少两年的原始数据中,可以还原这个企业创造财富的过程,判断企业是否有足够的赚钱能力。2010年,民生银行根据他们的信用报告,为一家企业发放了第一笔纯信用贷款。到现在他们已经帮助800多家企业拿到了40多亿元的贷款,最大一笔单笔贷款为6800万元。 

艾小缤自豪地说,在这800多家企业中,还没有出现一笔不良贷款。而且他们的大数据技术还可以帮助银行对这些企业进行贷后监管,相当于给企业穿上了可穿戴设备,随时监控企业的健康状态,企业的增长性、稳定性、活跃度,都可以从大数据反映出来。 

利用大数据为企业做体检,是大数据应用中比较另类的一个。而为个人做体检,让2011年从美国硅谷回来的糜万军,带回来了第一桶金。 

2000年在美国第一次创业时,在斯坦福刚刚完成计算机和金融学业的糜万军拿到了军方的一个实时翻译系统的研究项目,在完成这一项目之后,他开的第二家公司就是希望利用个人的医疗信息预测其医疗费用,给保险公司做参考。 

“这在技术上实际比第一个项目简单多了。”他说。利用数据挖掘技术,他们把斯坦福全校员工的体检记录和就诊记录综合分析,然后对所有人每年的医疗费用进行预测,这样可以让保险公司知道在谁身上挣钱,在谁身上赔钱。 

但是这个项目做到后来,大的企业代替保险公司成了他们最主要的客户。因为在美国很多大企业是自己承担员工的医疗费用,他们在帮助企业预测了每个员工可能的医疗支出后,再帮助企业制定员工的个性化健身计划,提前帮助员工改善健康状况,反而省下了医疗的开支。 

这样既帮企业省了钱,员工的工作效率也提高了,员工的幸福感也提高了。所以这项业务受到了美国许多大企业的欢迎,现在从斯坦福大学到思科、苹果等大公司,都是他们的客户。“这个项目既有经济效益,又有社会价值。”糜万军说。 

2013年8月,糜万军从北京来到上海,成立了经尔纬数据技术有限公司,专注于做大数据平台的垂直应用,包括广告营销,计算社会学和金融应用。在金融方面,他们本来想利用分析各种公开数据得到一些投资建议,为对冲基金服务。但是后来他们发现这种分析方法的效果非常好,于是他们不想卖了,自己成立了一家对冲基金。

“这是一个万亿级别的机会。”他对财新记者说,现在的这波大数据的热潮,势头一点也不亚于本世纪初互联网泡沫时期,而且势头更猛,落地更快,盈利模式更加清晰。在他看来,数据挖掘可以和各个行业结合创造价值。他现在也是宽带资本的投资合伙人,主要负责大数据实验室,专门投资利用大数据开发行业应用的公司。 

关键字:数据映射谷歌

本文摘自:财新《新世纪》

x 被“大数据”的中国 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

被“大数据”的中国

责任编辑:editor004 |来源:企业网D1Net  2014-07-25 11:22:41 本文摘自:财新《新世纪》

时间是1948年,地点是中国东北。辽沈战役进入关键阶段。对于第四野战军司令员林彪来说,拿下锦州后的最重要目标就是打败前来增援的国民党新六军。林彪使用的方法就是每天听取“军情汇报”,由值班参谋员读出下属各个部队的当日战况和缴获情况。

那几乎是千篇一律的数据,异常枯燥。直到有一天,林彪突然发现,在胡家窝棚的一场两军遭遇战中,缴获短枪与长枪的比例比其他战斗略高,击毁小车与大车的比例比其他战斗略高,俘虏和击毙的军官与士兵的比例比其他战斗略高。

林彪由此断定,国民党军队的指挥所就在这附近,他下令立即对从这里逃走的败军进行追击。果然,部队很快就在附近抓住了国民党方面的指挥官廖耀湘,此成果揭开了中共军队辽沈战役胜利的序幕。

林彪当年的做法符合近年风行全球并深入改变世界的大数据的简单定义——从在别人看来枯燥乏味的数据中,发现有价值的信息,并将其转化为机会。 

人类社会全面数字化引发了数据量爆炸式增长。人、资金、商品的流动都以数据化方式呈现。当前,每天在全球各行各业产生的数据已经足以填满超过2亿张DVD光盘——在这些看似杂乱无章的数据中,蕴藏着无限的金矿。 

近年,伴随着存储能力、计算能力和传输能力的进步,人们开采这些金矿成为可能。数据不仅成为推动行业融合兼并、企业做大做强的战略性资产,更是体现一个国家综合国力的重要组成部分,成为陆、海、空权益之外的另一种国家核心资产。

当前,大数据时代无可争议地来临了。它源自全球数十年的技术积累,但仅用了最近两三年时间,便迅速渗透到各个行业。中国并不例外,百度、阿里巴巴、新浪微博、腾讯微信等最核心的资产便是大数据;众多行业、企业开始使用并利用大数据作出变革;中国6亿多网民的上网记录等正成为大数据的核心内容。 

在财新记者采访的诸多业内人士看来,大数据来临的势头甚至比十几年前互联网泡沫时期还要迅猛。大数据更加实际、更容易落地、盈利模式更清晰。由大数据推动的行业变革,将会对整个世界格局产生颠覆性的影响。 

而对于普通公众来说,虽处于大数据时代,但对大数据仍是陌生的。大数据在中国正在做些什么?一家企业或一个个人可以得到何种便利,又或可能遇到何种“坏处”?了解大数据,是解惑的开始。 

“国家核心资产” 

2012年3月22日,奥巴马政府宣布投资2亿美元拉动大数据相关产业发展,将“大数据战略”上升为国家战略。奥巴马政府将大数据定义为“未来的新石油”,并表示一个国家拥有数据的规模、活性及解释运用的能力将成为综合国力的重要组成部分,对数据的占有和控制将成为陆权、海权、空权之外的另一种国家核心资产。 

美国的这一举动,是继1993年克林顿政府的“信息高速公路”计划后的又一次“狂飙突进”。在以中国为代表的新兴国家日益对美国的经济、政治影响力构成挑战的时候,通过大数据研究提高美国对数据资产的掌控能力,有助于美国抢占新的国际战略制高点。

但是什么是大数据,迄今为止,在产业界、学术界并没有形成一个公认的科学定义。上海软件产业促进中心主任唐全荣接受财新记者采访时说,他曾经和伦敦帝国理工大学一位华裔教授讨论,什么是大数据?而这位教授认为,能够处理的数据都不能称为大数据。

首先提出大数据概念的国际咨询公司麦肯锡,认为大数据就是大小超出常规数据库工具处理能力的数据。国际数据公司IDC则用“大体量(volume)”“多样性(variety)”“快速处理(velocity)”和“高价值(value)”来定义大数据。

正是由于大数据的这些特性,使得传统的数据分析、数据挖掘、数据处理手段都不再适用。社会需要为动态、高维、复杂的大数据建立形式化、结构化的描述方法,进而在此基础上发展大数据处理技术。

唐全荣说,跟云计算开始的时候一样,许多人在争论定义,而在IT基础设施从带宽到存储能力的发展让云计算真正走向应用的时候,就没有人再关心它的定义了。而大数据概念也是一样,它也是伴随着数据的处理、存储和分享能力的提升而出现的,从这个角度上看,大数据不仅是指需要处理的数据对象,也包括了处理的技术。 

如果说云计算为数据资产提供了保管、访问的场所和渠道,那么数据才是真正有价值的资产。随着人类活动和资源环境信息的数字化,更伴随着存储和处理能力的提升,让我们能够从包括文档、图片、视频乃至大量来自物联网的传感数据中获取有价值的信息。

虽然处理难度大,但是可能获取的价值更高。在美国,利用大数据可以帮助零售商增加60%的利润,帮助制造业减少50%的装配成本,基于大数据的智慧医疗,产值高达3000亿美元。

中关村大数据产业联盟副秘书长颜阳对财新记者说,现在的趋势就是数据要成资产。而这从Facebook上市获得的估值就可以看出来,它并没有多少实物资产,它上市后拥有的1000多亿美元的市值,都来自无形资产,最重要的无形资产就是它的数据。 

从中国的BAT(百度、阿里巴巴、腾讯)三大网络巨头来说,他们各自拥有不同的大数据,都是无价的资产。百度拥有用户搜索数据和公共网页数据。实际上百度、谷歌本身就是一个大数据公司,它们通过对全球网页数据的抓取和解析,帮助用户从海量数据中找出搜索结果,实质就是对数据的获取、组织、分析和挖掘的过程。 

阿里巴巴拥有交易数据和信用数据。这两种数据更容易变现,挖掘出商业价值。腾讯拥有用户关系数据和基于此产生的社交数据。这些数据可以分析人们的生活和行为,从里面挖掘出政治、社会、文化、商业、健康等领域的信息,甚至预测未来。

业内人士透露,也正是看到了用户数据的巨大价值,微博网站现在已经拒绝网络爬虫访问微博内容,这就让搜索引擎很难搜索到微博的内容,而微博自己则把这些数据打包出售。 

专门从事大数据分析的文思海辉技术有限公司首席技术官芮祥麟说,不久后,数据也将像技术、设备、人力资源那样,成为企业重要的资产。与其他资产不同的是,大数据资产越是开放,越是共享,越对整个产业和社会民生有利。

他认为,大数据的本质,将是把数据从应用中解放出来,独立形成价值链。今后将是数据定义应用,定义软件、定义网络、定义数据中心、定义一切。

据IDC预测,到2020年全球将总共拥有35ZB(1ZB=1万亿GB)的数据量。麦肯锡预测,未来大数据产品在个人位置服务市场的应用就将产生8000亿美元的价值,未来中国大数据产品的潜在市场规模有望达到1.57万亿元人民币,不仅将给IT行业开拓一个新的黄金时代,更将颠覆各行各业的竞争格局。 

掘金大数据 

“我们就是挖矿的。”在6月21日大连举行的大数据技术领袖峰会上,金电联行执行副总裁艾小缤对财新记者说,他们就是通过挖掘小微企业的财务数据,分析企业的信用等级,进而帮助他们拿到贷款。

对于广大中小企业来说,在中国缺乏信用体系的情况下,只能通过联保互保拿到贷款,而这实质上还是抵押质押。而这对银行来说,抵押品也并不安全。在经济下行的时候,一切担保的手段都会失效。

“在国外,有一个完整的体系去抑制失信情况的发生,但是我们没有。”艾小缤说。所以他们就想到了另外一个方法,就是让企业证明创造价值的能力,而这可以作为银行放款的必要条件。

这就用到了大数据。他们可以使用大数据技术描绘企业的赚钱能力。这些数据的来源,包括企业的采购情况、订单情况、库存情况,有多少应收账款、有多少现金、发了多少工资、交了多少税,甚至能耗的情况。

“我们不相信财务报表,而是看企业生产经营的真实数据,不看合计数,而是看明细数,因为合计数往往掩盖了真实的规律。”艾小缤说。例如在报表中,企业可以通过一笔过桥贷款而实现当季的赢利,但是在原始数据中,这笔突然而来的现金就会被发现。

从至少两年的原始数据中,可以还原这个企业创造财富的过程,判断企业是否有足够的赚钱能力。2010年,民生银行根据他们的信用报告,为一家企业发放了第一笔纯信用贷款。到现在他们已经帮助800多家企业拿到了40多亿元的贷款,最大一笔单笔贷款为6800万元。 

艾小缤自豪地说,在这800多家企业中,还没有出现一笔不良贷款。而且他们的大数据技术还可以帮助银行对这些企业进行贷后监管,相当于给企业穿上了可穿戴设备,随时监控企业的健康状态,企业的增长性、稳定性、活跃度,都可以从大数据反映出来。 

利用大数据为企业做体检,是大数据应用中比较另类的一个。而为个人做体检,让2011年从美国硅谷回来的糜万军,带回来了第一桶金。 

2000年在美国第一次创业时,在斯坦福刚刚完成计算机和金融学业的糜万军拿到了军方的一个实时翻译系统的研究项目,在完成这一项目之后,他开的第二家公司就是希望利用个人的医疗信息预测其医疗费用,给保险公司做参考。 

“这在技术上实际比第一个项目简单多了。”他说。利用数据挖掘技术,他们把斯坦福全校员工的体检记录和就诊记录综合分析,然后对所有人每年的医疗费用进行预测,这样可以让保险公司知道在谁身上挣钱,在谁身上赔钱。 

但是这个项目做到后来,大的企业代替保险公司成了他们最主要的客户。因为在美国很多大企业是自己承担员工的医疗费用,他们在帮助企业预测了每个员工可能的医疗支出后,再帮助企业制定员工的个性化健身计划,提前帮助员工改善健康状况,反而省下了医疗的开支。 

这样既帮企业省了钱,员工的工作效率也提高了,员工的幸福感也提高了。所以这项业务受到了美国许多大企业的欢迎,现在从斯坦福大学到思科、苹果等大公司,都是他们的客户。“这个项目既有经济效益,又有社会价值。”糜万军说。 

2013年8月,糜万军从北京来到上海,成立了经尔纬数据技术有限公司,专注于做大数据平台的垂直应用,包括广告营销,计算社会学和金融应用。在金融方面,他们本来想利用分析各种公开数据得到一些投资建议,为对冲基金服务。但是后来他们发现这种分析方法的效果非常好,于是他们不想卖了,自己成立了一家对冲基金。

“这是一个万亿级别的机会。”他对财新记者说,现在的这波大数据的热潮,势头一点也不亚于本世纪初互联网泡沫时期,而且势头更猛,落地更快,盈利模式更加清晰。在他看来,数据挖掘可以和各个行业结合创造价值。他现在也是宽带资本的投资合伙人,主要负责大数据实验室,专门投资利用大数据开发行业应用的公司。 

关键字:数据映射谷歌

本文摘自:财新《新世纪》

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^