当前位置:存储产品专区/SAN/NAS → 正文

未来存储新贵DNA 价格昂贵难接地气

责任编辑:editor003 |来源:企业网D1Net  2013-02-22 15:44:49 本文摘自:中国科学报

在未来某一天,DNA所记录的将不仅仅是一个人的生命蓝图,它将可以存储大量的文件、音乐、视频,并且用它小到难以置信的身量保存这些文件至几千年。

DNA,即脱氧核糖核酸,在普通人的认识中,它是一种传承生物遗传物质的分子,一部分DNA序列负责携带遗传讯息被称为基因,另一部分DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。在地球生命伊始,DNA就承担起了自然并且是必须的信息存储和传递的功能。因此DNA所携带的信息常被比喻为生命的“蓝图”。

既然DNA可以存储生物的遗传信息,并且可以持续上万年,是否有可能成为一种新的存储电子数据的媒介?

指尖上的莎士比亚

位于英国欣克斯顿的欧洲生物信息研究所的研究员利用一种新的方法,将大约739KB的文件存储到了DNA片段上。研究人员称,待DNA编码和合成的价格不断下降后,这种生物存储介质将在数十年内形成竞争力。他们的论文发表在1月23日的《自然》杂志上。

团队负责人尼克·戈德曼(Nick Goldman)在接受《中国科学报》记者邮件采访时说,研究所的团队在几乎不可见的微量DNA中储存了154首莎士比亚十四行诗、一张JPG格式的照片、一篇PDF的科学论文和美国民权领袖马丁·路德·金《我有一个梦想》演讲中的26秒时长的片段。总共大约739KB。

DNA含有用一种简单却无比强大的编码写成的遗传指令,这些指令由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四种被称作碱基的化学物质组成。

为了将文件存入DNA,戈德曼和他的同事将文本、图片或音频数据转成二进制代码。之后,用戈德曼编写的程序将这些二进制代码的“0”和“1”再转换成代表DNA的4个碱基的代码A、T、G、C。通过这串字母,他们绘制了几千个DNA片段的蓝图,每一个都包含文件的一段。戈德曼说,文件被分成片段,每一个片断要用指数代码标记,代码包括片段所归属文件以及在文件中的位置,就像是一本书中的页码和每页的标题一样。

通过两周的努力,他们将这些文件成功的完成了一个写入和读取的过程。“我们把这些片段合成完整的DNA,然后用DNA测序仪读取碱基A、T、G、C的顺序,”戈德曼说,“再用软件将碱基翻译成二进制代码‘0’和‘1’,这样就可以成功的将文件读取了。”

论文一发表,就引来了媒体的一片评论,很多国外媒体评论说,他们将DNA带入了一个革命性的数据存储时代,只需手掌般大小的人造DNA,便可容纳全世界高达30亿TB的数据。要想读取这些内容可以通过DNA测序,使其转换成计算机编码即可。

哈佛大学DNA专家乔治·丘奇(George Church)称,这种技术能够让一个人在指尖上存储维基百科的全部内容,而且现在全世界存储在磁盘上的信息都能够储存在手掌上。

1克DNA等于300万张CD

实际上,在2012年就已经先后有两篇相关的研究论文发表,一篇来自斯坦福大学,一篇来自哈佛大学。

2012年5月21日,《美国国家科学院院刊》刊登了斯坦福大学研究人员的研究成果,他们成功地将电脑文件编入了噬菌体的DNA片段并植入大肠杆菌的DNA,实现了在活体细胞的DNA中重复擦写数字信息。

但是这种方式有一些不足之处。首先,细胞会死亡,这并不是你存储学期论文的好方法。另外,细胞还会分裂、复制,其中会不断发生变异,从而改变数据的内容。

为了解决这些问题,乔治·丘奇领导的研究团队发明了一种DNA信息归档系统,完全不需要利用细胞。2012年8月17日,《科学》杂志报道了这一实验,并且评论该实验可能会为人类开发远超当前电脑芯片和磁盘容量的数据存储设备指明方向。他们将一本《创世纪》约610KB的内容写入DNA片段。

丘奇告诉《中国科学报》记者,他们利用一台喷墨打印机,将“0”转换为碱基中的A或C,“1”转换为碱基中的G或T,这4个碱基相当于4种墨水。每一个“点”都用159层“墨滴”被印刷在一片玻璃上。每一点中的每一个分子都有159个碱基的长度(159位)。

通过这样的转换,数据被存储在DNA片段中,同样的每段DNA中也包含着记录数据在源文件中位置的信息。

在读取信息时,需要DNA测序仪和电脑将所有片段按序重新组合起来,并转换为数字的格式。计算机还需要负责处理错误信息,因为每个数据块都可能会被复制上千次,经过比对,任何小错误都可以被发现和纠正。

戈德曼说,与丘奇团队所做的工作的区别就是,他们的方法避免存储中的错误,但需要一些冗余信息,冗余技术是计算机系统可靠性设计中常采用的一种技术,是提高计算机系统可靠性的最有效方法之一,但也会占用空间。他们希望在未来能将这些冗余部分尽量缩小而有更多的有效存储空间。

丘奇说:“DNA原本就是一个自然数据库。它记录着与生命有关的一切数据。我们只是简单地利用它的高容量达到一些新的目的。”

戈德曼告诉《中国科学报》记者,如果将一个小试管装满DNA,大约是0.5克,而1克DNA可存储2.2PB(1PB等于1024TB)的数据,相当于300万张CD的存储量。DNA的信息存储密度是目前已存在的存储介质的至少1000倍。

价格昂贵难接地气

利用生物技术存储信息这条路,人类实际上已经探寻了几十年。丘奇说:“1974年,我19岁开始作为一名核糖核酸的研究者,就已经在思考关于我们熟知的电子数据‘0’和‘1’与DNA当中4个碱基代码(A、C、G、T)之间的关系。”同时,他也在研究如何能降低在DNA上读写数据的成本。

他告诉《中国科学报》记者,麻省理工学院的乔·戴维斯(Joe Davis)在1986年将像素为5×7的电子图片编码录入到DNA。“到了2012年,我们终于将成本降低到可以将一本书《创世纪》的内容写入DNA,并且进行了700亿次的复制。”他说,“我用了十几年研究这种方法,但是仅仅用了几周就测试出了这个新想法。700亿次的复制仅仅用了几分钟和几美元。”

丘奇认为,哈佛大学和英国研究人员进行的这两次实验,是DNA存储研究领域的一次跳跃,可以预见的是很快会有更多的成就出现。他甚至表示,在未来的两年,DNA存储技术就有可能普及。

戈德曼告诉《中国科学报》记者,他们之所以选择了莎士比亚的著作和马丁·路德·金的演讲作为存储内容,就是因为,他们希望通过这些重要的著作体现此次研究的重要性。另一方面是说明DNA可以作为一种长期储存的方式,因为这些著作是要长久流传下去的。而那一篇PDF的科学论文正是生物学家沃森和克里克描述DNA双螺旋结构的文章,也具有重要的意义。同时戈德曼也希望能通过他们的方法,实验不同的文件格式的存储,比如文本文档,图片、视频以及PDF。他说:“虽然这种存储方法目前很昂贵,却可以为子孙后代保存下重要的历史和信息。DNA拥有令人惊奇的稳定性,因此它可以用任何简单的、便宜的而且不消耗能量的方法保存上几千年。”

存储数字信息的常规方法在其存在的很长一段时期内都在不断地显现问题。磁带是最具代表性,不仅易碎,而且磁条上的涂层用不了几十年就会消失。即使是其他的用于存储信息的物理媒介,存储格式也总是发生变化。这意味着一些数据总要通过转换成一种新的格式去存储,不然就有可能丢失。与此相比,随着时间的流逝,DNA更加稳定,并且只有一种存储格式。

但到目前为止,DNA的合成成本依然很高。戈德曼的团队估计,目前在DNA中编码每MB的数据成本需要1.24万美元,读取则需要220美元。如果价格能降两个数量级,那么在接下来的10年DNA存储器的价格将很快低于磁带。“我们有可能在10年内将DNA存储用于商业存储。”

丘奇认为,目前DNA的缺点就是读写比较慢,并且很昂贵。但实际上喷墨打印的方式已经加快了速度并降低了成本。

美国杜克大学半导体研究公司存储技术项目主管维克多·芝诺夫(Victor Zhirnov)认为,由于目前DNA存储的成本太高,在它进入实用阶段初期时使用频率不会很高。

丘奇也表示他还在研究这个问题,他说:“我们正在提高我们读取和写入DNA数据的能力,但是我想完全跳出目前的框架去思考这个问题。”

②③DNA含有用一种简单却无比强大的编码写成的遗传指令,这些指令由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四种被称作碱基的化学物质组成。

关键字:DNA编码MB

本文摘自:中国科学报

x 未来存储新贵DNA 价格昂贵难接地气 扫一扫
分享本文到朋友圈
当前位置:存储产品专区/SAN/NAS → 正文

未来存储新贵DNA 价格昂贵难接地气

责任编辑:editor003 |来源:企业网D1Net  2013-02-22 15:44:49 本文摘自:中国科学报

在未来某一天,DNA所记录的将不仅仅是一个人的生命蓝图,它将可以存储大量的文件、音乐、视频,并且用它小到难以置信的身量保存这些文件至几千年。

DNA,即脱氧核糖核酸,在普通人的认识中,它是一种传承生物遗传物质的分子,一部分DNA序列负责携带遗传讯息被称为基因,另一部分DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。在地球生命伊始,DNA就承担起了自然并且是必须的信息存储和传递的功能。因此DNA所携带的信息常被比喻为生命的“蓝图”。

既然DNA可以存储生物的遗传信息,并且可以持续上万年,是否有可能成为一种新的存储电子数据的媒介?

指尖上的莎士比亚

位于英国欣克斯顿的欧洲生物信息研究所的研究员利用一种新的方法,将大约739KB的文件存储到了DNA片段上。研究人员称,待DNA编码和合成的价格不断下降后,这种生物存储介质将在数十年内形成竞争力。他们的论文发表在1月23日的《自然》杂志上。

团队负责人尼克·戈德曼(Nick Goldman)在接受《中国科学报》记者邮件采访时说,研究所的团队在几乎不可见的微量DNA中储存了154首莎士比亚十四行诗、一张JPG格式的照片、一篇PDF的科学论文和美国民权领袖马丁·路德·金《我有一个梦想》演讲中的26秒时长的片段。总共大约739KB。

DNA含有用一种简单却无比强大的编码写成的遗传指令,这些指令由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四种被称作碱基的化学物质组成。

为了将文件存入DNA,戈德曼和他的同事将文本、图片或音频数据转成二进制代码。之后,用戈德曼编写的程序将这些二进制代码的“0”和“1”再转换成代表DNA的4个碱基的代码A、T、G、C。通过这串字母,他们绘制了几千个DNA片段的蓝图,每一个都包含文件的一段。戈德曼说,文件被分成片段,每一个片断要用指数代码标记,代码包括片段所归属文件以及在文件中的位置,就像是一本书中的页码和每页的标题一样。

通过两周的努力,他们将这些文件成功的完成了一个写入和读取的过程。“我们把这些片段合成完整的DNA,然后用DNA测序仪读取碱基A、T、G、C的顺序,”戈德曼说,“再用软件将碱基翻译成二进制代码‘0’和‘1’,这样就可以成功的将文件读取了。”

论文一发表,就引来了媒体的一片评论,很多国外媒体评论说,他们将DNA带入了一个革命性的数据存储时代,只需手掌般大小的人造DNA,便可容纳全世界高达30亿TB的数据。要想读取这些内容可以通过DNA测序,使其转换成计算机编码即可。

哈佛大学DNA专家乔治·丘奇(George Church)称,这种技术能够让一个人在指尖上存储维基百科的全部内容,而且现在全世界存储在磁盘上的信息都能够储存在手掌上。

1克DNA等于300万张CD

实际上,在2012年就已经先后有两篇相关的研究论文发表,一篇来自斯坦福大学,一篇来自哈佛大学。

2012年5月21日,《美国国家科学院院刊》刊登了斯坦福大学研究人员的研究成果,他们成功地将电脑文件编入了噬菌体的DNA片段并植入大肠杆菌的DNA,实现了在活体细胞的DNA中重复擦写数字信息。

但是这种方式有一些不足之处。首先,细胞会死亡,这并不是你存储学期论文的好方法。另外,细胞还会分裂、复制,其中会不断发生变异,从而改变数据的内容。

为了解决这些问题,乔治·丘奇领导的研究团队发明了一种DNA信息归档系统,完全不需要利用细胞。2012年8月17日,《科学》杂志报道了这一实验,并且评论该实验可能会为人类开发远超当前电脑芯片和磁盘容量的数据存储设备指明方向。他们将一本《创世纪》约610KB的内容写入DNA片段。

丘奇告诉《中国科学报》记者,他们利用一台喷墨打印机,将“0”转换为碱基中的A或C,“1”转换为碱基中的G或T,这4个碱基相当于4种墨水。每一个“点”都用159层“墨滴”被印刷在一片玻璃上。每一点中的每一个分子都有159个碱基的长度(159位)。

通过这样的转换,数据被存储在DNA片段中,同样的每段DNA中也包含着记录数据在源文件中位置的信息。

在读取信息时,需要DNA测序仪和电脑将所有片段按序重新组合起来,并转换为数字的格式。计算机还需要负责处理错误信息,因为每个数据块都可能会被复制上千次,经过比对,任何小错误都可以被发现和纠正。

戈德曼说,与丘奇团队所做的工作的区别就是,他们的方法避免存储中的错误,但需要一些冗余信息,冗余技术是计算机系统可靠性设计中常采用的一种技术,是提高计算机系统可靠性的最有效方法之一,但也会占用空间。他们希望在未来能将这些冗余部分尽量缩小而有更多的有效存储空间。

丘奇说:“DNA原本就是一个自然数据库。它记录着与生命有关的一切数据。我们只是简单地利用它的高容量达到一些新的目的。”

戈德曼告诉《中国科学报》记者,如果将一个小试管装满DNA,大约是0.5克,而1克DNA可存储2.2PB(1PB等于1024TB)的数据,相当于300万张CD的存储量。DNA的信息存储密度是目前已存在的存储介质的至少1000倍。

价格昂贵难接地气

利用生物技术存储信息这条路,人类实际上已经探寻了几十年。丘奇说:“1974年,我19岁开始作为一名核糖核酸的研究者,就已经在思考关于我们熟知的电子数据‘0’和‘1’与DNA当中4个碱基代码(A、C、G、T)之间的关系。”同时,他也在研究如何能降低在DNA上读写数据的成本。

他告诉《中国科学报》记者,麻省理工学院的乔·戴维斯(Joe Davis)在1986年将像素为5×7的电子图片编码录入到DNA。“到了2012年,我们终于将成本降低到可以将一本书《创世纪》的内容写入DNA,并且进行了700亿次的复制。”他说,“我用了十几年研究这种方法,但是仅仅用了几周就测试出了这个新想法。700亿次的复制仅仅用了几分钟和几美元。”

丘奇认为,哈佛大学和英国研究人员进行的这两次实验,是DNA存储研究领域的一次跳跃,可以预见的是很快会有更多的成就出现。他甚至表示,在未来的两年,DNA存储技术就有可能普及。

戈德曼告诉《中国科学报》记者,他们之所以选择了莎士比亚的著作和马丁·路德·金的演讲作为存储内容,就是因为,他们希望通过这些重要的著作体现此次研究的重要性。另一方面是说明DNA可以作为一种长期储存的方式,因为这些著作是要长久流传下去的。而那一篇PDF的科学论文正是生物学家沃森和克里克描述DNA双螺旋结构的文章,也具有重要的意义。同时戈德曼也希望能通过他们的方法,实验不同的文件格式的存储,比如文本文档,图片、视频以及PDF。他说:“虽然这种存储方法目前很昂贵,却可以为子孙后代保存下重要的历史和信息。DNA拥有令人惊奇的稳定性,因此它可以用任何简单的、便宜的而且不消耗能量的方法保存上几千年。”

存储数字信息的常规方法在其存在的很长一段时期内都在不断地显现问题。磁带是最具代表性,不仅易碎,而且磁条上的涂层用不了几十年就会消失。即使是其他的用于存储信息的物理媒介,存储格式也总是发生变化。这意味着一些数据总要通过转换成一种新的格式去存储,不然就有可能丢失。与此相比,随着时间的流逝,DNA更加稳定,并且只有一种存储格式。

但到目前为止,DNA的合成成本依然很高。戈德曼的团队估计,目前在DNA中编码每MB的数据成本需要1.24万美元,读取则需要220美元。如果价格能降两个数量级,那么在接下来的10年DNA存储器的价格将很快低于磁带。“我们有可能在10年内将DNA存储用于商业存储。”

丘奇认为,目前DNA的缺点就是读写比较慢,并且很昂贵。但实际上喷墨打印的方式已经加快了速度并降低了成本。

美国杜克大学半导体研究公司存储技术项目主管维克多·芝诺夫(Victor Zhirnov)认为,由于目前DNA存储的成本太高,在它进入实用阶段初期时使用频率不会很高。

丘奇也表示他还在研究这个问题,他说:“我们正在提高我们读取和写入DNA数据的能力,但是我想完全跳出目前的框架去思考这个问题。”

②③DNA含有用一种简单却无比强大的编码写成的遗传指令,这些指令由腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四种被称作碱基的化学物质组成。

关键字:DNA编码MB

本文摘自:中国科学报

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^