当前位置:大数据业界动态 → 正文

“大数据”有多大——漫谈教育大数据(二)

责任编辑:editor004 作者:周庆 |来源:企业网D1Net  2015-05-17 20:58:22 本文摘自:大数据产业观察网

上一篇我们看到“大数据”已经深入到我们的日常生活中。在进一步介绍“大数据”技术前,我们先来了解一下“大数据”到底有多大。

我们常听到各种表示数据大小的单位,例如网络下载速度是每秒“50KB”,手机包月流量为“100MB”,视频文件大小为“1.8GB”,移动硬盘的容量为“2TB”。这些单位是什么意思,到底包含多少数据呢?

注意这些单位都以字母B结尾,B是英文字母“Byte”的缩写,中文叫做“字节”。1字节由8比特构成,每个比特要么是0要么是1。因此“2B”除了用来骂人外,也可表示2个字节或16比特的数据。

1KB等于 1024字节,或大约一千字节。K是一个较小的数据单位,例如一篇500字左右的作文大约有1KB的信息,而普通人的月收入一般为几K元。

1MB(兆字节)等于1024KB,或大约一百万字节。从数据的角度来看,M不算一个大单位。例如,一张普通图片只有1MB左右。但如果某人的年收入超过1M元,他就是年薪百万的富人了。

1GB(吉字节)等于1024MB,或大约十亿字节。即使从数据的角度,G也算一个较大的单位。例如,一个8GB的U盘可以装下2000本《天龙八部》,而比尔·盖茨的个人财产也只有几十G美元。

1TB(太字节)等于1024GB,或大约一万亿字节。2014年个人移动硬盘的容量约为1TB。T是一个很大的单位,只有少数国家的GDP超过1T美元。例如中国2014年的GDP约为10T美元。

尽管1T已经是很大的数,但在许多人看来这还称不上“大数据”。PB是比TB更大的单位。1PB(拍字节)等于1024TB,或大约1千万亿字节。传统数据库系统不能高效地处理1PB的数据,因为仅仅向磁盘写入1PB的数据就要耗费200多天。而全人类的总资产也不到1P美元。

再往下,1EB(艾字节)等于1024PB,1ZB(泽字节)等于约1百万PB或约十万亿亿字节。1ZB到底有多大呢?如果将这些数据用标准的光盘来存贮,大约可以堆成5堆光盘,每一堆都可以从地球伸到月球。据估计,到2020年,全球总数据量将超过40ZB。表1列出了从1K到1Z的相应例子。

表1. 从1KB到1Z:数量与举例

英文

中文

2n

数量

10n

财富

人体

信息量

1K

10

3

普通人的月收入约为5K

人的肌肉数目约为0.6K

一篇作文约为1KB

1M

20

百万

6

富翁的年收入约为1M

人的头发数目约为0.1M

一张照片约为1MB

1G

30

十亿

9

比尔·盖茨的资产约为70G

人类DNA的碱基数目约为6G

一部电影约为1GB

1T

40

万亿

12

中国2014年的GDP10T美元

人体内包含的细胞数目约50T

淘宝每天新产生的图片约20TB

1P

50

千万亿

15

--

人类脑神经元的连接数约为1P

百度每天处理的数据约为20PB

1E

60

百亿亿

18

--

--

全人类至今讲过的话语约为5EB

1Z

70

十万亿亿

21

--

--

2020年全球的数据总量预计达40ZB

为什么人类能产生如此庞大的数据?著名的摩尔定律可以解释这一现象。戈登·摩尔是Intel公司的创始人之一。他曾在1965年的一篇论文中提到“过去十年,硅芯片上的晶体管数目每年增加一倍”。在过去几十年中,数据量也基本按这一规律增加。以我个人为例,1995年读初中时,我使用的个人存储是一张软盘,其存储大小为1MB。时至2015年,我的个人存储变成移动硬盘,其存储大小为1TB。也就是说,在过去20年中,我拥有的数据量增加了一百万倍。我在1995年的个人财产大约为100元,如果财富也按摩尔定律增长,那么我今天的财产就会达到1亿元。

那到底多大的数据才称得上“大数据”呢?其实答案要视应用而定。例如,对于一般的文档处理系统,1TB的文档就可称作大数据;但对于关系数据库系统,可能100TB的数据才算大数据。从应用的角度来看,当数据量大到传统技术难以处理时,就可称为“大数据”了。此外,数据能否称为“大数据”,还要看数据的复杂性以及产生数据的速度等特征。在下一篇中,我们一起来看下大数据到底有哪些应用和特征。

关键字:字节大数据移动硬盘

本文摘自:大数据产业观察网

x “大数据”有多大——漫谈教育大数据(二) 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

“大数据”有多大——漫谈教育大数据(二)

责任编辑:editor004 作者:周庆 |来源:企业网D1Net  2015-05-17 20:58:22 本文摘自:大数据产业观察网

上一篇我们看到“大数据”已经深入到我们的日常生活中。在进一步介绍“大数据”技术前,我们先来了解一下“大数据”到底有多大。

我们常听到各种表示数据大小的单位,例如网络下载速度是每秒“50KB”,手机包月流量为“100MB”,视频文件大小为“1.8GB”,移动硬盘的容量为“2TB”。这些单位是什么意思,到底包含多少数据呢?

注意这些单位都以字母B结尾,B是英文字母“Byte”的缩写,中文叫做“字节”。1字节由8比特构成,每个比特要么是0要么是1。因此“2B”除了用来骂人外,也可表示2个字节或16比特的数据。

1KB等于 1024字节,或大约一千字节。K是一个较小的数据单位,例如一篇500字左右的作文大约有1KB的信息,而普通人的月收入一般为几K元。

1MB(兆字节)等于1024KB,或大约一百万字节。从数据的角度来看,M不算一个大单位。例如,一张普通图片只有1MB左右。但如果某人的年收入超过1M元,他就是年薪百万的富人了。

1GB(吉字节)等于1024MB,或大约十亿字节。即使从数据的角度,G也算一个较大的单位。例如,一个8GB的U盘可以装下2000本《天龙八部》,而比尔·盖茨的个人财产也只有几十G美元。

1TB(太字节)等于1024GB,或大约一万亿字节。2014年个人移动硬盘的容量约为1TB。T是一个很大的单位,只有少数国家的GDP超过1T美元。例如中国2014年的GDP约为10T美元。

尽管1T已经是很大的数,但在许多人看来这还称不上“大数据”。PB是比TB更大的单位。1PB(拍字节)等于1024TB,或大约1千万亿字节。传统数据库系统不能高效地处理1PB的数据,因为仅仅向磁盘写入1PB的数据就要耗费200多天。而全人类的总资产也不到1P美元。

再往下,1EB(艾字节)等于1024PB,1ZB(泽字节)等于约1百万PB或约十万亿亿字节。1ZB到底有多大呢?如果将这些数据用标准的光盘来存贮,大约可以堆成5堆光盘,每一堆都可以从地球伸到月球。据估计,到2020年,全球总数据量将超过40ZB。表1列出了从1K到1Z的相应例子。

表1. 从1KB到1Z:数量与举例

英文

中文

2n

数量

10n

财富

人体

信息量

1K

10

3

普通人的月收入约为5K

人的肌肉数目约为0.6K

一篇作文约为1KB

1M

20

百万

6

富翁的年收入约为1M

人的头发数目约为0.1M

一张照片约为1MB

1G

30

十亿

9

比尔·盖茨的资产约为70G

人类DNA的碱基数目约为6G

一部电影约为1GB

1T

40

万亿

12

中国2014年的GDP10T美元

人体内包含的细胞数目约50T

淘宝每天新产生的图片约20TB

1P

50

千万亿

15

--

人类脑神经元的连接数约为1P

百度每天处理的数据约为20PB

1E

60

百亿亿

18

--

--

全人类至今讲过的话语约为5EB

1Z

70

十万亿亿

21

--

--

2020年全球的数据总量预计达40ZB

为什么人类能产生如此庞大的数据?著名的摩尔定律可以解释这一现象。戈登·摩尔是Intel公司的创始人之一。他曾在1965年的一篇论文中提到“过去十年,硅芯片上的晶体管数目每年增加一倍”。在过去几十年中,数据量也基本按这一规律增加。以我个人为例,1995年读初中时,我使用的个人存储是一张软盘,其存储大小为1MB。时至2015年,我的个人存储变成移动硬盘,其存储大小为1TB。也就是说,在过去20年中,我拥有的数据量增加了一百万倍。我在1995年的个人财产大约为100元,如果财富也按摩尔定律增长,那么我今天的财产就会达到1亿元。

那到底多大的数据才称得上“大数据”呢?其实答案要视应用而定。例如,对于一般的文档处理系统,1TB的文档就可称作大数据;但对于关系数据库系统,可能100TB的数据才算大数据。从应用的角度来看,当数据量大到传统技术难以处理时,就可称为“大数据”了。此外,数据能否称为“大数据”,还要看数据的复杂性以及产生数据的速度等特征。在下一篇中,我们一起来看下大数据到底有哪些应用和特征。

关键字:字节大数据移动硬盘

本文摘自:大数据产业观察网

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^