当前位置:大数据业界动态 → 正文

四家公司用"大数据"预测世界杯 你也可以变成"预言帝"

责任编辑:editor004 |来源:企业网D1Net  2014-07-16 14:36:57 本文摘自:青年时报

上一届世界杯,章鱼保罗风头大出,8猜8中的准确率,让人惊呼此乃“预言帝”。今年打得火热的世界杯,同样有看头,不过,这次看的不是动物,而是大数据。数家技术公司赛前就推断出各场比赛的输赢,堪称赛场外的另一场“世界杯”。

大数据,这三个字近几年来越来越火,听着也很高大上(高端大气上档次的缩写)。到底大数据是什么?它是怎么来预测赛事的输赢的?大数据还能用来干什么?记者连线浙大计算机科学与技术学院人工智能研究所吴飞教授,和大家一探究竟。

四家公司的预测PK赛

在世界杯期间,几家科技公司参与预测“世界杯”赛况。

微软、百度以及高盛参与了小组赛阶段48场比赛的预测。结果,准确率达58.33%的百度排在第一,紧随其后的是准确率为56.25%的微软,然后是37.5%的高盛。

在淘汰赛阶段,谷歌参与了进来,高盛则没有继续进行预测的PK赛。不过,谷歌仅预测了16进8和8进4的两轮比赛,微软和百度则进行了全程预测。最终,谷歌预测的12场比赛中,正确了11场,准确率达到了91.67%;而微软和百度则是除了季军队伍的预测出现偏差之外,其余的场次预测都是正确的。

这几家技术公司所采用的方法,全是有理有据,并非“天机不可泄露”。从各家公布的资料来看,他们建立预测模型的数据来源各有千秋。

微软的预测技术是基于对世界杯各支球队的过往比赛结果、比赛时间、天气情况、主场优势以及其他因素进行综合评估后作出的判断,相对而言,微软依赖于竞彩指数。

谷歌云计算平台,则是根据全球每个职业足球联盟的历史数据,以及巴西世界杯小组赛期间的统计数据,加上对世界杯参赛球员此前比赛中的表现进行分析,总的来说,谷歌对各国球队过去的球赛数据的分析借鉴得比较多。

百度则搜索了过去5年内全世界987支球队的3.7万场比赛数据,并将博彩市场数据融入到预测模型中,构建了本次预测模型。该模型共涉及到19972名球员和1.12亿条相关数据,所分析的球队不仅包括207支国家队,还囊括了欧洲、南美、亚洲等联赛俱乐部及低级别球队信息。

擅长投资分析的高盛,通过对自1960年以来的正式国际足球比赛数据的回归分析,来构建预测模型,还通过泊松模型分析了每场小组赛的比分情况。

数据之间的联动性很强

根据百度百科的解释,大数据,又叫巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。大数据有“4V”特点:大量、高速、多样,以及价值。

“从字面上来理解,大数据是指获取数据的数量,利用传统方法或者说现有的计算方法已经无法处理。”吴飞解释说,我们也可以进一步进行理解,就是从大量的数据中,获取有用的信息或知识,用来指导我们的生活、生产或学习,“我认为这也是大数据的最终目的。”

那我们要如何拿数据去预测呢?吴飞教授说,大家也可以通过大数据分析,去预测明天会不会下雨,“如说下雨是和云层有关的,假设有研究表明当云层厚度达到10米的时候,就会下雨;再通过搜集杭城两年来的温度、风向等数据,建立一个函数,我们就可以根据这个结论,进行预测。”

当然,这个例子是比较简单的,但现实生活中的现象通常都很复杂,数据之间的关联性也不断增强,吴飞教授表示,堵车,这件事的判断因素不仅仅是说地面车流的情况,杭州的交通能不能承载这么大的流量,它还可能和上下班的时间、是否有商场打折、附近是否有学校放学等一系列的因素有关,这时候,就无法像下雨那样,用一个小数据进行判断。

回到世界杯,足球比赛的预测同样是一件非常复杂的事情,不仅跟队员个人能力、家庭情况、队员之间的配合程度有关,教练的能力、国家的情况以及对手的相关情况,都会影响比赛的结果。“据我所知,德国就利用一套数据分析系统,可以导出每个球员的数据,从而来对队员进行针对性的训练,让他们能踢好比赛。”吴飞教授表示。

大数据还能测流感趋势

随着技术都在不断发展,大家收集数据的能力和手段也在不断增强,我们可以获得更多的看似无关却很有用的数据。“现在获取数据并不是一件困难的事情,对数据的处理能力、建立一个合理的模型是利用大数据进行预测的重要工作。”吴飞教授表示,如何从大量的数据中提取出有用的信息或知识,再转化成有关的计算机语言,输入到模型中让这个模型变得有效,这一系列步骤看着各自为政,其实环环相扣,缺一不可。

据了解,除了足球领域,微软的预测技术此前还成功预测过《美国之声》等选秀节目的晋级情况。这让人不禁疑惑,除了比赛结果,大数据还能用来干什么呢?

百度此前就利用它的APP,获取用户的地理位置,勾勒出全国人民春节迁徙图,“若是能进一步开发,获知哪些人是因为哪些事而迁徙的,这就能让我们更合理地分配社会资源。”吴飞教授补充说。

而谷歌在2009年的时候,也作了一项预测——流感。就拿我国来说,流感的发展趋势,通常是通过医院上报的数据,比如人数突然激增等来进行预警,而谷歌则不是,它利用以前的数据,还有该地区在该时间段进行关键词搜索的数量,来进行一个判断,预测流感是否会暴发。吴飞教授表示:“就以手足口病为例,如果周围有孩子生了这个病,家长就可能会开始搜索,这种病是什么、会怎么样、要怎么治疗等等,搜索量会显著增加。”

关键字:谷歌PK赛巴西世界杯预测模型

本文摘自:青年时报

x 四家公司用"大数据"预测世界杯 你也可以变成"预言帝" 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

四家公司用"大数据"预测世界杯 你也可以变成"预言帝"

责任编辑:editor004 |来源:企业网D1Net  2014-07-16 14:36:57 本文摘自:青年时报

上一届世界杯,章鱼保罗风头大出,8猜8中的准确率,让人惊呼此乃“预言帝”。今年打得火热的世界杯,同样有看头,不过,这次看的不是动物,而是大数据。数家技术公司赛前就推断出各场比赛的输赢,堪称赛场外的另一场“世界杯”。

大数据,这三个字近几年来越来越火,听着也很高大上(高端大气上档次的缩写)。到底大数据是什么?它是怎么来预测赛事的输赢的?大数据还能用来干什么?记者连线浙大计算机科学与技术学院人工智能研究所吴飞教授,和大家一探究竟。

四家公司的预测PK赛

在世界杯期间,几家科技公司参与预测“世界杯”赛况。

微软、百度以及高盛参与了小组赛阶段48场比赛的预测。结果,准确率达58.33%的百度排在第一,紧随其后的是准确率为56.25%的微软,然后是37.5%的高盛。

在淘汰赛阶段,谷歌参与了进来,高盛则没有继续进行预测的PK赛。不过,谷歌仅预测了16进8和8进4的两轮比赛,微软和百度则进行了全程预测。最终,谷歌预测的12场比赛中,正确了11场,准确率达到了91.67%;而微软和百度则是除了季军队伍的预测出现偏差之外,其余的场次预测都是正确的。

这几家技术公司所采用的方法,全是有理有据,并非“天机不可泄露”。从各家公布的资料来看,他们建立预测模型的数据来源各有千秋。

微软的预测技术是基于对世界杯各支球队的过往比赛结果、比赛时间、天气情况、主场优势以及其他因素进行综合评估后作出的判断,相对而言,微软依赖于竞彩指数。

谷歌云计算平台,则是根据全球每个职业足球联盟的历史数据,以及巴西世界杯小组赛期间的统计数据,加上对世界杯参赛球员此前比赛中的表现进行分析,总的来说,谷歌对各国球队过去的球赛数据的分析借鉴得比较多。

百度则搜索了过去5年内全世界987支球队的3.7万场比赛数据,并将博彩市场数据融入到预测模型中,构建了本次预测模型。该模型共涉及到19972名球员和1.12亿条相关数据,所分析的球队不仅包括207支国家队,还囊括了欧洲、南美、亚洲等联赛俱乐部及低级别球队信息。

擅长投资分析的高盛,通过对自1960年以来的正式国际足球比赛数据的回归分析,来构建预测模型,还通过泊松模型分析了每场小组赛的比分情况。

数据之间的联动性很强

根据百度百科的解释,大数据,又叫巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。大数据有“4V”特点:大量、高速、多样,以及价值。

“从字面上来理解,大数据是指获取数据的数量,利用传统方法或者说现有的计算方法已经无法处理。”吴飞解释说,我们也可以进一步进行理解,就是从大量的数据中,获取有用的信息或知识,用来指导我们的生活、生产或学习,“我认为这也是大数据的最终目的。”

那我们要如何拿数据去预测呢?吴飞教授说,大家也可以通过大数据分析,去预测明天会不会下雨,“如说下雨是和云层有关的,假设有研究表明当云层厚度达到10米的时候,就会下雨;再通过搜集杭城两年来的温度、风向等数据,建立一个函数,我们就可以根据这个结论,进行预测。”

当然,这个例子是比较简单的,但现实生活中的现象通常都很复杂,数据之间的关联性也不断增强,吴飞教授表示,堵车,这件事的判断因素不仅仅是说地面车流的情况,杭州的交通能不能承载这么大的流量,它还可能和上下班的时间、是否有商场打折、附近是否有学校放学等一系列的因素有关,这时候,就无法像下雨那样,用一个小数据进行判断。

回到世界杯,足球比赛的预测同样是一件非常复杂的事情,不仅跟队员个人能力、家庭情况、队员之间的配合程度有关,教练的能力、国家的情况以及对手的相关情况,都会影响比赛的结果。“据我所知,德国就利用一套数据分析系统,可以导出每个球员的数据,从而来对队员进行针对性的训练,让他们能踢好比赛。”吴飞教授表示。

大数据还能测流感趋势

随着技术都在不断发展,大家收集数据的能力和手段也在不断增强,我们可以获得更多的看似无关却很有用的数据。“现在获取数据并不是一件困难的事情,对数据的处理能力、建立一个合理的模型是利用大数据进行预测的重要工作。”吴飞教授表示,如何从大量的数据中提取出有用的信息或知识,再转化成有关的计算机语言,输入到模型中让这个模型变得有效,这一系列步骤看着各自为政,其实环环相扣,缺一不可。

据了解,除了足球领域,微软的预测技术此前还成功预测过《美国之声》等选秀节目的晋级情况。这让人不禁疑惑,除了比赛结果,大数据还能用来干什么呢?

百度此前就利用它的APP,获取用户的地理位置,勾勒出全国人民春节迁徙图,“若是能进一步开发,获知哪些人是因为哪些事而迁徙的,这就能让我们更合理地分配社会资源。”吴飞教授补充说。

而谷歌在2009年的时候,也作了一项预测——流感。就拿我国来说,流感的发展趋势,通常是通过医院上报的数据,比如人数突然激增等来进行预警,而谷歌则不是,它利用以前的数据,还有该地区在该时间段进行关键词搜索的数量,来进行一个判断,预测流感是否会暴发。吴飞教授表示:“就以手足口病为例,如果周围有孩子生了这个病,家长就可能会开始搜索,这种病是什么、会怎么样、要怎么治疗等等,搜索量会显著增加。”

关键字:谷歌PK赛巴西世界杯预测模型

本文摘自:青年时报

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^