当前位置:大数据业界动态 → 正文

大数据:要将我们带到何处去?

责任编辑:editor004 |来源:企业网D1Net  2014-07-10 13:43:32 本文摘自:人民政协报

时下,最热的话题不是大数据,而是“世界杯”。即便如此,“世界杯”上也难回避大数据的身影。今年的世界杯赛事,德国队已经把传感器装到了每一位队员的身上,也装到了足球上面。一场比赛下来就有6000万条记录。一个球员的控球时间、传球数量、奔跑速度、奔跑长度,这些全部都被记录下来。这告诉我们:数据是人为的现象,一切的数据都是人为收集的。在我们城市的大街小巷都布满了摄影头,它们就是一个个数据的采集员。而采集到的这些数据最后的目的还是用到“科技改变人的生活”上。因此,大数据虽然高端大气,但却与我们的生活紧密相连。作为中国创新活力的沃土——中关村创业讲坛上再次聚焦大数据,为大家解读大数据的奥妙,畅想大数据的未来。

最近一段时间以来,巴西“世界杯”可以说是最为社会广泛关注的一个热点。一份来自奥地利维也纳经济大学研究人员的公报声称,通过对网上博彩公司的长期赔率、各球队的历史表现和近期球员伤病情况的统计分析,他们预测巴西队问鼎世界杯胜算较大,夺冠几率为22.5%,紧跟其后的是阿根廷15.8%、德国13.4%。虽然夺冠头号热门巴西已经被德国挡在决赛门外,但并未封杀大数据在预测方面的可信度。例如,美国微软的必应搜索在前不久开始进行的八分之一决赛前,成功预测了巴西、哥伦比亚、荷兰、哥斯达黎加、法国、德国、阿根廷、比利时八支球队的晋级。

这些类似电子“章鱼保罗”的预测,其依据就是如今IT界三大技术趋势之一的“大数据”。

“云计算”方兴未艾,“大数据”又悄然兴起。如今,三大技术趋势正在重塑IT世界———云计算、移动互联网、大数据正在不断提供令人惊叹的新价值。为帮助创业者充分理解大数据的业务价值,中关村创业讲坛从2013年起就开展了多次关于大数据的培训活动。7月4日,第108期中关村创业讲坛再次聚焦大数据,特别邀请了微软高级程序员、通联数据首席研究员、《数据之巅》作者涂子沛和知名数据专家、神州数码工程院院长谢耘,带领大家一起认识大数据、畅想大数据的未来。

大数据是什么?

在本届世界杯上,德国队把传感器装到了每一个队员和足球上,一场比赛下来就有6000万条记录,包括球员的控球时间、传球数量、奔跑速度、奔跑长度。

这个例子完美地诠释了这样的说法:数据是人为的现象,一切的数据都是人为收集的。

数据有三个来源:一是测量,二是记录,三是计算。正是因为所有的数据都是收集来的,所以,建设好大数据一定需要顶层设计。

首先我们要弄清什么是数据

“在前信息时代数据意味着对客观世界的测量,它是一个有根据的数字。进入了信息时代之后,数据的内涵发生了深刻的变化,包括音频、视频在内的信息都统称为数据。特别是现在,我们整个城市都布满了摄像头,每个人身上都可能带有好几台智能设备,这个时候产生的大量数据和以前的数据是不一样的。以前的数据是结构化的数据,处于终端的数据,现在的数据属于非结构化的数据,没有办法用固定的字段来完成描述的数据。随着数据内涵的不断扩大,容量的不断增加,也就引发了大数据时代的到来。”据此,涂子沛给出了自己关于大数据的定义:传统的小数据+现代的大记录。现代的大记录是指音频、视频,它的来源是源于记录事件,而传统数据是来源于测量事件。

“以前数据都是和具体的应用绑在一起的,数据服务于应用,应用必须采集这些数据。但是今天大量的数据出现可能没有特定的目的。比如摄影,以前觉得这个景点特别好,才照一张留个纪念。现在则是拿着相机随处拍。”谢耘进一步解释到,随着技术和产品不断的进步,从而导致整个计算资源、通讯资源、存储资源成本大幅度降低,所以才会产生大量的数据。

传统的数据管理是按照一个一个应用把数据管起来,在大数据时代大量的数据产生的时候是没有明确应用的,但是这个数据的价值绝不仅仅在于这一点的应用。到底我们应该怎么管理这个数据?“管好数据才能用好数据。”谢耘认为,传统的方式是采集数据后会进入到各种应用系统,但是各个系统相互之间没有关联,数据也没有办法交换。虽然为了交换数据能够建立交换平台,但依然是传统的交换方式。“如果我们按照人、企业或城市,按照一个一个主体界定的范围,把这些数据依据彼此之间反应的逻辑管理起来,整个系统的建设将会发生根本性的变化。”

大数据的过去

“数据对生活当中的作用由来已久。”涂子沛以美国为例介绍说,美国在建国制定《宪法》时就强调用数据来管理,最典型的例子是每十年要进行一次人口普查,然后按照这个地区人口的多少去分配议员。美国南北战争中著名的将军谢尔曼当时表示,“我要切断后勤,不要补给,带着6万人打到东海岸去。”兵马未动、粮草先行,没有补给怎么打仗?他当时就是根据人口普查的数据,哪个地方有多少头牛、多少匹马、多少家禽,把部队分成五路大军,然后在地图上计算部队走到这里粮食能不能够支持到最后。后来证明这些数据非常有用,6万人一个多月所向披靡,很快到达了目标。谢尔曼在自己的回忆录中写到,“这场战争濒临结束之后种种事件证明,没有数据我赢不了。”

除了在政治和军事上的影响外,涂子沛还给大家列举了大数据在文化生活中的一个典型案例———大家知道美国热播的电视剧《纸牌屋》是大数据推动的结果。其实,大数据真正驱动的第一部影片是《乱世佳人》。1936年,一本名叫《乱世佳人》的小说迅速走红,但好莱坞对此却很迟疑,因为之前以南北战争为题材的电影,部部亏本,而小说版权方要价却很高。在此背景下,美国第一个具有现代意识的数据大师盖勒普做了两年调查,发现这本书的流行程度仅次于《圣经》。好莱坞著名制片人塞尔兹尼克为此信心大增,高价买下电影版权。

接下来,电影时长、演员选取、黑白还是彩色、广告如何设计等重要问题都完全按照盖勒普调查的数据进行。盖勒普甚至计算出,这部电影将是有史以来最卖座的电影,观影人数将达5650万。他还建议,影片的广告要突出“书”,小说的粉丝将是其巨大的潜在观众群体。结果,影片上映后,场场爆满,最后一共售出了5997万张电影票,而当时美国人口为1.3亿,至今仍是美国有史以来最赚钱的电影。

大数据的现在

看了历史再来看今天——大数据给我们生活带来了什么样的影响?

我们会发现我们生活中传感器无处不在。传感器在干什么?传感器在收集数据。一句话就是万物皆联、无处不计算。比如:埋在土里面根据土壤的湿度、结合空气的温度,能够确定花坛或草地什么时候开始浇水或者浇多少水。还有Google的无人驾驶汽车,也是大数据驱动的。首先是街景式的收集数据,然后才有无人驾驶汽车到路面。

那么,这个时代我们在干什么?涂子沛说,我们沿着这样的路径在前进———从数据到信息到知识再到智能。

我们未来的世界是什么样子?“数据之巅是通向智能社会,大数据的兴起标志着社会向智能化的社会迈进和转型。大数据的未来是数据驱动世界,软件定义世界,自动化接管世界,数据正成为智能世界的土壤。我们新的文明将在这块土壤之下延伸,开放数据就是土壤上的河流,河流流过之处就会孕育起发达的数据文明。”涂子沛如此描绘自己眼中的数据未来。

大数据的未来

“今年年初我参加了一个读书会,一位朋友问我:能不能设计一个系统,把一位局长的材料信息全放在系统里,然后系统就能告诉我这个人能不能当副部长,以后能不能当部长?当时我给他的回答是:‘如果一件事情没有人知道该怎么做的话,计算机也不会替你做。’”谢耘通过亲历的事例告诉大家,大数据确实引发了我们对智能的无限遐想,但计算机核心还是在做计算,但凡能变成计算的问题,计算机都可以解决。相反,上述的问题如果没人能够把它当做计算问题的话,给计算机灌多少数据都没有用,是解决不了的。

“我认为,能够实现的所谓智能还是能观察到、测量到、分析到的人的智能活动。智能未来的发展如果总结成一句话,就是让辅助人类体能和智能的工具,都和人逐步无缝连接起来。而不是说我们造一台机器,让它和我们拥有同样的智能,最后来挑战我们。”谢耘向大家描述了智能的未来。

对于智能,他认为具体还是机制模仿和机制替代。什么是机制模仿?就是按照人的大脑做事的方式做,比如:下棋,计算机可以挑战世界冠军并获胜。什么是机制替代?就是某个事情,人是怎么做的可能不知道,但是可以用另外一套机制来实现同样的效果。比如,用手写识别的过程代替人眼识别汉字的过程。

未来想要制造一台和人一样的机器,这个梦想还是非常遥远的,至少从近几十年来的科学实践证明是不太靠谱的。涂子沛提出,未来可实现的是通过向机器“喂取”数据,让机器产生智能,自动地为人类完成任务。谢耘也从IT产业迎来了第二个关键性的转变(即基础技术平台主宰整个产业发展的阶段已经结束了,真正主宰未来产业发展的将会是应用)。这个大的时代背景下提出,未来智能发展的过程是智能机制+知识、数据实现演变的过程。计算机的优势是逻辑计算和存储,人的优势是抽象推理和形象显现。未来的系统会把这两个结合在一起,结合的基点就是构建不同主体的虚拟映像利用大数据存在,使得我们的服务器全面服务于不同的映像,服务于人、服务于企业、服务于城市,从而让我们的生活更美好。

关键字:数据服务球员

本文摘自:人民政协报

x 大数据:要将我们带到何处去? 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

大数据:要将我们带到何处去?

责任编辑:editor004 |来源:企业网D1Net  2014-07-10 13:43:32 本文摘自:人民政协报

时下,最热的话题不是大数据,而是“世界杯”。即便如此,“世界杯”上也难回避大数据的身影。今年的世界杯赛事,德国队已经把传感器装到了每一位队员的身上,也装到了足球上面。一场比赛下来就有6000万条记录。一个球员的控球时间、传球数量、奔跑速度、奔跑长度,这些全部都被记录下来。这告诉我们:数据是人为的现象,一切的数据都是人为收集的。在我们城市的大街小巷都布满了摄影头,它们就是一个个数据的采集员。而采集到的这些数据最后的目的还是用到“科技改变人的生活”上。因此,大数据虽然高端大气,但却与我们的生活紧密相连。作为中国创新活力的沃土——中关村创业讲坛上再次聚焦大数据,为大家解读大数据的奥妙,畅想大数据的未来。

最近一段时间以来,巴西“世界杯”可以说是最为社会广泛关注的一个热点。一份来自奥地利维也纳经济大学研究人员的公报声称,通过对网上博彩公司的长期赔率、各球队的历史表现和近期球员伤病情况的统计分析,他们预测巴西队问鼎世界杯胜算较大,夺冠几率为22.5%,紧跟其后的是阿根廷15.8%、德国13.4%。虽然夺冠头号热门巴西已经被德国挡在决赛门外,但并未封杀大数据在预测方面的可信度。例如,美国微软的必应搜索在前不久开始进行的八分之一决赛前,成功预测了巴西、哥伦比亚、荷兰、哥斯达黎加、法国、德国、阿根廷、比利时八支球队的晋级。

这些类似电子“章鱼保罗”的预测,其依据就是如今IT界三大技术趋势之一的“大数据”。

“云计算”方兴未艾,“大数据”又悄然兴起。如今,三大技术趋势正在重塑IT世界———云计算、移动互联网、大数据正在不断提供令人惊叹的新价值。为帮助创业者充分理解大数据的业务价值,中关村创业讲坛从2013年起就开展了多次关于大数据的培训活动。7月4日,第108期中关村创业讲坛再次聚焦大数据,特别邀请了微软高级程序员、通联数据首席研究员、《数据之巅》作者涂子沛和知名数据专家、神州数码工程院院长谢耘,带领大家一起认识大数据、畅想大数据的未来。

大数据是什么?

在本届世界杯上,德国队把传感器装到了每一个队员和足球上,一场比赛下来就有6000万条记录,包括球员的控球时间、传球数量、奔跑速度、奔跑长度。

这个例子完美地诠释了这样的说法:数据是人为的现象,一切的数据都是人为收集的。

数据有三个来源:一是测量,二是记录,三是计算。正是因为所有的数据都是收集来的,所以,建设好大数据一定需要顶层设计。

首先我们要弄清什么是数据

“在前信息时代数据意味着对客观世界的测量,它是一个有根据的数字。进入了信息时代之后,数据的内涵发生了深刻的变化,包括音频、视频在内的信息都统称为数据。特别是现在,我们整个城市都布满了摄像头,每个人身上都可能带有好几台智能设备,这个时候产生的大量数据和以前的数据是不一样的。以前的数据是结构化的数据,处于终端的数据,现在的数据属于非结构化的数据,没有办法用固定的字段来完成描述的数据。随着数据内涵的不断扩大,容量的不断增加,也就引发了大数据时代的到来。”据此,涂子沛给出了自己关于大数据的定义:传统的小数据+现代的大记录。现代的大记录是指音频、视频,它的来源是源于记录事件,而传统数据是来源于测量事件。

“以前数据都是和具体的应用绑在一起的,数据服务于应用,应用必须采集这些数据。但是今天大量的数据出现可能没有特定的目的。比如摄影,以前觉得这个景点特别好,才照一张留个纪念。现在则是拿着相机随处拍。”谢耘进一步解释到,随着技术和产品不断的进步,从而导致整个计算资源、通讯资源、存储资源成本大幅度降低,所以才会产生大量的数据。

传统的数据管理是按照一个一个应用把数据管起来,在大数据时代大量的数据产生的时候是没有明确应用的,但是这个数据的价值绝不仅仅在于这一点的应用。到底我们应该怎么管理这个数据?“管好数据才能用好数据。”谢耘认为,传统的方式是采集数据后会进入到各种应用系统,但是各个系统相互之间没有关联,数据也没有办法交换。虽然为了交换数据能够建立交换平台,但依然是传统的交换方式。“如果我们按照人、企业或城市,按照一个一个主体界定的范围,把这些数据依据彼此之间反应的逻辑管理起来,整个系统的建设将会发生根本性的变化。”

大数据的过去

“数据对生活当中的作用由来已久。”涂子沛以美国为例介绍说,美国在建国制定《宪法》时就强调用数据来管理,最典型的例子是每十年要进行一次人口普查,然后按照这个地区人口的多少去分配议员。美国南北战争中著名的将军谢尔曼当时表示,“我要切断后勤,不要补给,带着6万人打到东海岸去。”兵马未动、粮草先行,没有补给怎么打仗?他当时就是根据人口普查的数据,哪个地方有多少头牛、多少匹马、多少家禽,把部队分成五路大军,然后在地图上计算部队走到这里粮食能不能够支持到最后。后来证明这些数据非常有用,6万人一个多月所向披靡,很快到达了目标。谢尔曼在自己的回忆录中写到,“这场战争濒临结束之后种种事件证明,没有数据我赢不了。”

除了在政治和军事上的影响外,涂子沛还给大家列举了大数据在文化生活中的一个典型案例———大家知道美国热播的电视剧《纸牌屋》是大数据推动的结果。其实,大数据真正驱动的第一部影片是《乱世佳人》。1936年,一本名叫《乱世佳人》的小说迅速走红,但好莱坞对此却很迟疑,因为之前以南北战争为题材的电影,部部亏本,而小说版权方要价却很高。在此背景下,美国第一个具有现代意识的数据大师盖勒普做了两年调查,发现这本书的流行程度仅次于《圣经》。好莱坞著名制片人塞尔兹尼克为此信心大增,高价买下电影版权。

接下来,电影时长、演员选取、黑白还是彩色、广告如何设计等重要问题都完全按照盖勒普调查的数据进行。盖勒普甚至计算出,这部电影将是有史以来最卖座的电影,观影人数将达5650万。他还建议,影片的广告要突出“书”,小说的粉丝将是其巨大的潜在观众群体。结果,影片上映后,场场爆满,最后一共售出了5997万张电影票,而当时美国人口为1.3亿,至今仍是美国有史以来最赚钱的电影。

大数据的现在

看了历史再来看今天——大数据给我们生活带来了什么样的影响?

我们会发现我们生活中传感器无处不在。传感器在干什么?传感器在收集数据。一句话就是万物皆联、无处不计算。比如:埋在土里面根据土壤的湿度、结合空气的温度,能够确定花坛或草地什么时候开始浇水或者浇多少水。还有Google的无人驾驶汽车,也是大数据驱动的。首先是街景式的收集数据,然后才有无人驾驶汽车到路面。

那么,这个时代我们在干什么?涂子沛说,我们沿着这样的路径在前进———从数据到信息到知识再到智能。

我们未来的世界是什么样子?“数据之巅是通向智能社会,大数据的兴起标志着社会向智能化的社会迈进和转型。大数据的未来是数据驱动世界,软件定义世界,自动化接管世界,数据正成为智能世界的土壤。我们新的文明将在这块土壤之下延伸,开放数据就是土壤上的河流,河流流过之处就会孕育起发达的数据文明。”涂子沛如此描绘自己眼中的数据未来。

大数据的未来

“今年年初我参加了一个读书会,一位朋友问我:能不能设计一个系统,把一位局长的材料信息全放在系统里,然后系统就能告诉我这个人能不能当副部长,以后能不能当部长?当时我给他的回答是:‘如果一件事情没有人知道该怎么做的话,计算机也不会替你做。’”谢耘通过亲历的事例告诉大家,大数据确实引发了我们对智能的无限遐想,但计算机核心还是在做计算,但凡能变成计算的问题,计算机都可以解决。相反,上述的问题如果没人能够把它当做计算问题的话,给计算机灌多少数据都没有用,是解决不了的。

“我认为,能够实现的所谓智能还是能观察到、测量到、分析到的人的智能活动。智能未来的发展如果总结成一句话,就是让辅助人类体能和智能的工具,都和人逐步无缝连接起来。而不是说我们造一台机器,让它和我们拥有同样的智能,最后来挑战我们。”谢耘向大家描述了智能的未来。

对于智能,他认为具体还是机制模仿和机制替代。什么是机制模仿?就是按照人的大脑做事的方式做,比如:下棋,计算机可以挑战世界冠军并获胜。什么是机制替代?就是某个事情,人是怎么做的可能不知道,但是可以用另外一套机制来实现同样的效果。比如,用手写识别的过程代替人眼识别汉字的过程。

未来想要制造一台和人一样的机器,这个梦想还是非常遥远的,至少从近几十年来的科学实践证明是不太靠谱的。涂子沛提出,未来可实现的是通过向机器“喂取”数据,让机器产生智能,自动地为人类完成任务。谢耘也从IT产业迎来了第二个关键性的转变(即基础技术平台主宰整个产业发展的阶段已经结束了,真正主宰未来产业发展的将会是应用)。这个大的时代背景下提出,未来智能发展的过程是智能机制+知识、数据实现演变的过程。计算机的优势是逻辑计算和存储,人的优势是抽象推理和形象显现。未来的系统会把这两个结合在一起,结合的基点就是构建不同主体的虚拟映像利用大数据存在,使得我们的服务器全面服务于不同的映像,服务于人、服务于企业、服务于城市,从而让我们的生活更美好。

关键字:数据服务球员

本文摘自:人民政协报

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^