当前位置:大数据业界动态 → 正文

可穿戴之父彭特兰:百度大数据已从纸上谈兵转化为有实用价值

责任编辑:editor005 |来源:企业网D1Net  2014-09-03 13:59:51 本文摘自:TechWeb.com.cn

u=3046887288,2308269495&fm=23&gp=0_副本

  百度大数据走出炼丹炉

9月2日消息, 世界杯已过去两个多月,但百度通过大数据实现了对世界杯相对精准的预知,“完胜”微软、谷歌、高盛等IT大佬,至今依然令人印象深刻。而早在今年百度大数据开放大会上,搞计算机学术理论的怀进鹏校长谈到大数据,听众们还觉得是一记闷棍。

实际上,怀校长的演讲在开头部分讲了大数据在这个时代对我们传统思维的冲击,一些价值观的建立,而可穿戴之父阿莱克斯·彭特兰则从另一个角度解读了关于大数据的一些看法。

可穿戴之父谈百度大数据:精确预测向全球创新借力

全球七大权威大数据专家之一的阿莱克斯·彭特兰(Alex Pentland)日前接受专访时谈到,百度精确预测世界杯是一次深度学习技术运用的成功案例,同时他还谈到了对百度大数据战略的看法,认为百度的成功在于它超越了创新的地域边界,懂得如何向全球创新借力。

彭特兰指出:“深度学习技术比传统人工智能更加高级,能够通过数据的搜集和发掘帮助人类更好地做出决定。”

彭特兰在评价百度大数据产品时说,正如与其他公司一样,百度开发了许多非常棒的产品和应用,这说明百度已经逐渐找到了如何把纸上谈兵的数据转化为具有实际运用价值的产品的有效方式。

他还指出,百度是世界人口最多国家的第一大搜索引擎,因而在发展大数据领域具有非常好的天然优势,并且百度本身是一个强大的公司,拥有强大的技术和市场作为支撑,也正是基于此,他们成了这个行业的翘楚之一。

说到大数据,究竟什么是大数据呢?

以百度为例。百度大数据引擎一共分三个部分。

开放云:百度的大规模分布式计算和超大规模存储云。过去的百度云主要面向开发者,大数据引擎的开放云则是面向有大数据存储和处理需求的“大开发者”。

百度的开放云拥有超过1.2万台的单集群,超过阿里飞天计划的5k集群。百度开放云还拥有CPU利用率高、弹性高、成本低等特点。百度是全球首家大规模商用ARM服务器的公司,而ARM架构的特征是能耗小和存储密度大,同时百度还是首家将GPU(图形处理器)应用在机器学习领域的公司,实现了能耗节省的目的。

数据工厂:开放云是基础设施和硬件能力,你可以把数据工厂理解为百度将海量数据组织起来的软件能力。就像数据库软件的位置一样。只不过数据工厂是被用作处理TB级甚至更大的数据。

百度数据工厂支持单词百TB异构数据查询,支持SQL-like以及更复杂的查询语句,支持各种查询业务场景。同时百度数据工厂还将承载对于TB级别大表的并发查询和扫描,大查询、低并发时每秒可达百GB,在业界已经是很领先的能力了。

百度大脑:有了大数据处理和存储的基础之后,还得有一套能够应用这些数据的算法。图灵奖获得者N.Wirth(沃斯)提出过“程序=数据结构+算法”的理论。如果说百度大数据引擎是一个程序,那么它的数据结构就是数据工厂+开放云,而算法则对应到百度大脑。

百度大脑将百度此前在人工智能方面的能力开放出来,主要是大规模机器学习能力和深度学习能力。此前它们被应用在语音、图像、文本识别,以及自然语言和语义理解方面,被应用在不少App,还通过百度Inside等平台开放给了智能硬件。现在这些能力将被用来对大数据进行智能化的分析、学习、处理、利用。百度深度神经网络拥有200亿个参数,是全球规模最大的,它拥有独立的深度学习研究院(IDL)和较早的布局,在人工智能上百度已经快了一步,现在贡献给业界表明了它要开放的决心。

大数据能干啥?

百度将基础设施能力、软件系统能力以及智能算法技术打包在一起,通过大数据引擎开放出来之后,拥有大数据的行业可以将自己的数据接入到这个引擎进行处理。同时,一些企业在没有大数据的情况下,还可以使用百度的数据以及大数据成果。

举几个例子可能你更加清楚百度大数据引擎究竟是什么。

[page]

许多政府部门拥有海量大数据——大数据经典之作《大数据》也是在讲美国政府的大数据。但政府部门几乎都没有大数据处理和挖掘技术。交通部门有车联网、物联网、路网监控、船联网、码头车站监控等地方的大数据,卫生部门拥有流感法定报告数据、全国流感样病例哨点监测和病原学监测数据,公安部门有大量的视频监控数据。如果这些数据与百度的搜索记录、全网数据、LBS数据结合,在利用百度大数据引擎的大数据能力,则可以实现智能路径规划、运力管理、流感预测、疫苗接种指导、安防追逃等等。

许多企业也拥有海量大数据——通信、金融、物流、制造、农业等行业。不过,它们几乎都没有大数据能力,坐拥海量数据却一筹莫展。这时候如果能够应用百度大数据引擎,则可以对海量数据进行可靠低成本的存储,进行智能化的由浅入深的价值挖掘。在百度技术开放日上,中国平安便介绍了如何利用百度的大数据能力加强消费者理解和预测,细分客户群制定个性化产品和营销方案。

可以看出,大数据引擎的输入实际上是百度拥有的大数据以及行业已有的大数据,而输出则是各种行业应用成果,也就是大数据的“价值”。

百度大数据走出炼丹炉

近日,联合国与百度宣布启动战略合作,共建大数据联合实验室,这也成为联合国开发计划署在全球范围内首次携手科技企业建立大数据实验室。百度将利用自己强大的技术创新实力,助力联合国解决环保、健康等人类发展问题。

百度携手联合国开发计划署共建大数据联合实验室,献礼互联网大会,意味着百度大数据已完全走出了“炼丹炉”,全面普及应用,成为政府、国际组织、环保、医疗等各个领域真正的“火眼金睛”。

据悉,联合国开发计划署与百度大数据联合实验室的目标是探索利用大数据解决全球性问题的创新模式。对于百度的大数据联合实验室来说,首先将目光聚焦在电子垃圾问题,开发“百度回收站”,通过收集与分析电子垃圾有关大数据,将得出的有效信息与知识为社会所用,推动电子垃圾回收产业发展,为解决世界电子垃圾回收问题提供政策参考,此举也是中国企业勇于承担解决全球发展问题的担当表现。

短时期哪些行业将会首先从大数据中获益?

美国可穿戴设备先驱阿莱克斯·彭特兰这样说,在短期内大数据会帮助公司和企业的内部运营更加有效。在长一点时期内,我认为会大数据会让公司和企业更加深入和综合,例如酒店经营,酒店不仅仅提供住宿而是综合客人的整个旅行体验。电子商店变得更符合你的个性化风格,因为他们了解你和你感兴趣的东西。

关键字:价值文本识别谷歌大数据

本文摘自:TechWeb.com.cn

x 可穿戴之父彭特兰:百度大数据已从纸上谈兵转化为有实用价值 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

可穿戴之父彭特兰:百度大数据已从纸上谈兵转化为有实用价值

责任编辑:editor005 |来源:企业网D1Net  2014-09-03 13:59:51 本文摘自:TechWeb.com.cn

u=3046887288,2308269495&fm=23&gp=0_副本

  百度大数据走出炼丹炉

9月2日消息, 世界杯已过去两个多月,但百度通过大数据实现了对世界杯相对精准的预知,“完胜”微软、谷歌、高盛等IT大佬,至今依然令人印象深刻。而早在今年百度大数据开放大会上,搞计算机学术理论的怀进鹏校长谈到大数据,听众们还觉得是一记闷棍。

实际上,怀校长的演讲在开头部分讲了大数据在这个时代对我们传统思维的冲击,一些价值观的建立,而可穿戴之父阿莱克斯·彭特兰则从另一个角度解读了关于大数据的一些看法。

可穿戴之父谈百度大数据:精确预测向全球创新借力

全球七大权威大数据专家之一的阿莱克斯·彭特兰(Alex Pentland)日前接受专访时谈到,百度精确预测世界杯是一次深度学习技术运用的成功案例,同时他还谈到了对百度大数据战略的看法,认为百度的成功在于它超越了创新的地域边界,懂得如何向全球创新借力。

彭特兰指出:“深度学习技术比传统人工智能更加高级,能够通过数据的搜集和发掘帮助人类更好地做出决定。”

彭特兰在评价百度大数据产品时说,正如与其他公司一样,百度开发了许多非常棒的产品和应用,这说明百度已经逐渐找到了如何把纸上谈兵的数据转化为具有实际运用价值的产品的有效方式。

他还指出,百度是世界人口最多国家的第一大搜索引擎,因而在发展大数据领域具有非常好的天然优势,并且百度本身是一个强大的公司,拥有强大的技术和市场作为支撑,也正是基于此,他们成了这个行业的翘楚之一。

说到大数据,究竟什么是大数据呢?

以百度为例。百度大数据引擎一共分三个部分。

开放云:百度的大规模分布式计算和超大规模存储云。过去的百度云主要面向开发者,大数据引擎的开放云则是面向有大数据存储和处理需求的“大开发者”。

百度的开放云拥有超过1.2万台的单集群,超过阿里飞天计划的5k集群。百度开放云还拥有CPU利用率高、弹性高、成本低等特点。百度是全球首家大规模商用ARM服务器的公司,而ARM架构的特征是能耗小和存储密度大,同时百度还是首家将GPU(图形处理器)应用在机器学习领域的公司,实现了能耗节省的目的。

数据工厂:开放云是基础设施和硬件能力,你可以把数据工厂理解为百度将海量数据组织起来的软件能力。就像数据库软件的位置一样。只不过数据工厂是被用作处理TB级甚至更大的数据。

百度数据工厂支持单词百TB异构数据查询,支持SQL-like以及更复杂的查询语句,支持各种查询业务场景。同时百度数据工厂还将承载对于TB级别大表的并发查询和扫描,大查询、低并发时每秒可达百GB,在业界已经是很领先的能力了。

百度大脑:有了大数据处理和存储的基础之后,还得有一套能够应用这些数据的算法。图灵奖获得者N.Wirth(沃斯)提出过“程序=数据结构+算法”的理论。如果说百度大数据引擎是一个程序,那么它的数据结构就是数据工厂+开放云,而算法则对应到百度大脑。

百度大脑将百度此前在人工智能方面的能力开放出来,主要是大规模机器学习能力和深度学习能力。此前它们被应用在语音、图像、文本识别,以及自然语言和语义理解方面,被应用在不少App,还通过百度Inside等平台开放给了智能硬件。现在这些能力将被用来对大数据进行智能化的分析、学习、处理、利用。百度深度神经网络拥有200亿个参数,是全球规模最大的,它拥有独立的深度学习研究院(IDL)和较早的布局,在人工智能上百度已经快了一步,现在贡献给业界表明了它要开放的决心。

大数据能干啥?

百度将基础设施能力、软件系统能力以及智能算法技术打包在一起,通过大数据引擎开放出来之后,拥有大数据的行业可以将自己的数据接入到这个引擎进行处理。同时,一些企业在没有大数据的情况下,还可以使用百度的数据以及大数据成果。

举几个例子可能你更加清楚百度大数据引擎究竟是什么。

[page]

许多政府部门拥有海量大数据——大数据经典之作《大数据》也是在讲美国政府的大数据。但政府部门几乎都没有大数据处理和挖掘技术。交通部门有车联网、物联网、路网监控、船联网、码头车站监控等地方的大数据,卫生部门拥有流感法定报告数据、全国流感样病例哨点监测和病原学监测数据,公安部门有大量的视频监控数据。如果这些数据与百度的搜索记录、全网数据、LBS数据结合,在利用百度大数据引擎的大数据能力,则可以实现智能路径规划、运力管理、流感预测、疫苗接种指导、安防追逃等等。

许多企业也拥有海量大数据——通信、金融、物流、制造、农业等行业。不过,它们几乎都没有大数据能力,坐拥海量数据却一筹莫展。这时候如果能够应用百度大数据引擎,则可以对海量数据进行可靠低成本的存储,进行智能化的由浅入深的价值挖掘。在百度技术开放日上,中国平安便介绍了如何利用百度的大数据能力加强消费者理解和预测,细分客户群制定个性化产品和营销方案。

可以看出,大数据引擎的输入实际上是百度拥有的大数据以及行业已有的大数据,而输出则是各种行业应用成果,也就是大数据的“价值”。

百度大数据走出炼丹炉

近日,联合国与百度宣布启动战略合作,共建大数据联合实验室,这也成为联合国开发计划署在全球范围内首次携手科技企业建立大数据实验室。百度将利用自己强大的技术创新实力,助力联合国解决环保、健康等人类发展问题。

百度携手联合国开发计划署共建大数据联合实验室,献礼互联网大会,意味着百度大数据已完全走出了“炼丹炉”,全面普及应用,成为政府、国际组织、环保、医疗等各个领域真正的“火眼金睛”。

据悉,联合国开发计划署与百度大数据联合实验室的目标是探索利用大数据解决全球性问题的创新模式。对于百度的大数据联合实验室来说,首先将目光聚焦在电子垃圾问题,开发“百度回收站”,通过收集与分析电子垃圾有关大数据,将得出的有效信息与知识为社会所用,推动电子垃圾回收产业发展,为解决世界电子垃圾回收问题提供政策参考,此举也是中国企业勇于承担解决全球发展问题的担当表现。

短时期哪些行业将会首先从大数据中获益?

美国可穿戴设备先驱阿莱克斯·彭特兰这样说,在短期内大数据会帮助公司和企业的内部运营更加有效。在长一点时期内,我认为会大数据会让公司和企业更加深入和综合,例如酒店经营,酒店不仅仅提供住宿而是综合客人的整个旅行体验。电子商店变得更符合你的个性化风格,因为他们了解你和你感兴趣的东西。

关键字:价值文本识别谷歌大数据

本文摘自:TechWeb.com.cn

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^