当前位置:大数据业界动态 → 正文

大数据时代 数据已成热点名词

责任编辑:editor004 |来源:企业网D1Net  2013-12-17 17:24:48 本文摘自:新华网

北京12月17日电 按照业界比较普遍的看法,大数据具有海量、多种类、需要大规模处理和快速响应等特点。

根据IDC(国际数据公司)的跟踪分析,全球产生的数据总量2010年首次突破1泽(10的21次方)字节,2012年达到约2.8泽字节,2020年有望达到40泽字节。2012年,全球产生的数据中仅有约0.5%得到分析。到2020年,全球数据总量中有22%将来自中国。

从内容来看,这些海量数据可分为结构化和非结构化数据。问卷调查、产品评论、信用卡记录和实验结果等属于结构化数据,仅占数据总量的5%左右;大数据时代的数据量爆炸多来自非结构化数据,例如在社交网站上发布的照片和视频,在搜索引擎中输入的搜索词,手机产生的即时位置信息等,约占数据量的95%。

在大数据的处理上,舍恩伯格所著《大数据时代》一书指出,大数据处理分析面对的不是随机样本而是全体数据,不是精确性而是混杂性,不是因果关系而是相关关系。

比如,世界上第一部“先拍照后对焦”光场相机Lytro,就运用了大数据处理分析理念。与传统相机只记录一束光不同,Lytro可以记录整个光场里所有的光,也就是用总体数据取代了随机样本。用户没必要一开始就对焦,想要什么样的照片可以在拍摄之后再决定。

数据量大幅增加对人们注重精确性的习惯等提出了挑战,大数据需要技术和思维上的变革才能利用。谷歌公司人工智能专家说,谷歌翻译在语料库使用庞杂的网络内容后取得了飞跃发展,不完整的句子、拼写错误、语法错误等各种错误,让谷歌翻译可以正确地推算出英文词汇搭配在一起的可能性,混杂性和谬误反而让谷歌翻译在同类产品中更为突出。

关键字:谷歌词汇搭配数据量大数据

本文摘自:新华网

x 大数据时代 数据已成热点名词 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

大数据时代 数据已成热点名词

责任编辑:editor004 |来源:企业网D1Net  2013-12-17 17:24:48 本文摘自:新华网

北京12月17日电 按照业界比较普遍的看法,大数据具有海量、多种类、需要大规模处理和快速响应等特点。

根据IDC(国际数据公司)的跟踪分析,全球产生的数据总量2010年首次突破1泽(10的21次方)字节,2012年达到约2.8泽字节,2020年有望达到40泽字节。2012年,全球产生的数据中仅有约0.5%得到分析。到2020年,全球数据总量中有22%将来自中国。

从内容来看,这些海量数据可分为结构化和非结构化数据。问卷调查、产品评论、信用卡记录和实验结果等属于结构化数据,仅占数据总量的5%左右;大数据时代的数据量爆炸多来自非结构化数据,例如在社交网站上发布的照片和视频,在搜索引擎中输入的搜索词,手机产生的即时位置信息等,约占数据量的95%。

在大数据的处理上,舍恩伯格所著《大数据时代》一书指出,大数据处理分析面对的不是随机样本而是全体数据,不是精确性而是混杂性,不是因果关系而是相关关系。

比如,世界上第一部“先拍照后对焦”光场相机Lytro,就运用了大数据处理分析理念。与传统相机只记录一束光不同,Lytro可以记录整个光场里所有的光,也就是用总体数据取代了随机样本。用户没必要一开始就对焦,想要什么样的照片可以在拍摄之后再决定。

数据量大幅增加对人们注重精确性的习惯等提出了挑战,大数据需要技术和思维上的变革才能利用。谷歌公司人工智能专家说,谷歌翻译在语料库使用庞杂的网络内容后取得了飞跃发展,不完整的句子、拼写错误、语法错误等各种错误,让谷歌翻译可以正确地推算出英文词汇搭配在一起的可能性,混杂性和谬误反而让谷歌翻译在同类产品中更为突出。

关键字:谷歌词汇搭配数据量大数据

本文摘自:新华网

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^