当前位置:存储行业动态 → 正文

DNA存储早日付诸实用

责任编辑:editor004 |来源:企业网D1Net  2013-08-20 16:57:32 本文摘自:凤凰科技

欧洲生物信息研究所(EMBL)的研究人员开创了一个新途径,可以将数据资料存储在DNA里,而DNA是一种可以存放数万年的材料。利用该存储法,有可能将至少1亿小时的高清录像存储在大约一茶杯的DNA中。

全世界拥有巨量的数字信息,而且新的数字内容仍不断地大量涌入,这给数据存储工作带来了真正的挑战。硬盘不但昂贵,而且需要不断地供电;甚至质量最好的“非耗电”归档材料(如磁带),在10年之内质量就会有所下降。这在生命科学领域是一个越来越突出的问题,该领域有大量包括DNA测序在内的数据资料,构成了科学记录的基础。

“我们已经了解到,DNA是存储信息的可靠途径,因为我们可以从猛犸象的骨头里提取DNA,而猛犸象可以追溯到几万年之前,因此我们了解到这是个存储的好方法。”欧洲分子生物学实验室生物信息研究所的尼克·高曼解释说,“DNA分子极小,但密度大,储存时不需要电力,因而运输、保存都很容易。”

读取DNA相当简单,但是到目前为止,编写DNA一直是把DNA存储变为现实的主要障碍。主要存在两种挑战:首先,利用目前的方法只能制造出短链DNA;其次,不管是编写DNA还是读取DNA都很容易出错,特别是当同一个DNA字符出现重复时,尤其容易出错。研究人员正着手创建一种可以解决上述两个问题的编码。

“我们知道,我们需要单独地利用短链DNA来进行编码,而且需要采取一种方法,使我们在编码时不可能出现一连串的同一字符。因此我们估计,把编码拆分为许多前后互相搭接的片段,利用索引信息来显示每个片段在全部编码中所属的位置,制定一个不允许重复的编码方案。这样,只有在四个不同的片段中犯同样错误时,编码才会失败——这样的情况极为罕见。”尤恩·伯尼说道。

这个新方法需要通过编码信息来合成DNA。安捷伦科技公司(Agilent Technologies, Inc)是位于加州的一家公司,自愿为此项研究提供服务。登录到安捷伦科技公司的网站,尤恩·伯尼和尼克·高曼给该公司发送了以下资料的编码版本:一个mp3格式的马丁·路德·金的演讲《我有一个梦想》;一张jpg格式的EMBL照片;一篇pdf格式的沃森和克里克合作的重要论文《核酸的分子结构》;一份包括所有莎士比亚十四行诗的txt格式文件;还有一份叙述本研究中编码情况的文件。

“我们从互联网上下载了这些文件,并利用这些文件来合成了数十万段DNA,合成的结果看起来就像一小块泥土。”安捷伦科技公司的埃米莉·勒普劳斯特说。安捷伦科技公司将这个合成样本邮寄给EMBL,EMBL的研究人员能够不出差错地为合成DNA测序,为文件解码。

“我们利用DNA分子创造了一种容错编码,据我们所知,这种分子形式将会在1万年甚至更长的时间里保持良好的状态。”尼克·高曼说,“只要有人知道这种编码是什么,利用一台可以读取DNA的机器就能够获取编码所存储的文件。”

尽管还有许多实际的问题需要解决,但是DNA固有的高密度性和耐久性使之成为引人瞩目的存储媒介。研究人员下一步将要完善这种编码方案,使DNA存储早日付诸实用。

关键字:DNA测序DNA分子

本文摘自:凤凰科技

x DNA存储早日付诸实用 扫一扫
分享本文到朋友圈
当前位置:存储行业动态 → 正文

DNA存储早日付诸实用

责任编辑:editor004 |来源:企业网D1Net  2013-08-20 16:57:32 本文摘自:凤凰科技

欧洲生物信息研究所(EMBL)的研究人员开创了一个新途径,可以将数据资料存储在DNA里,而DNA是一种可以存放数万年的材料。利用该存储法,有可能将至少1亿小时的高清录像存储在大约一茶杯的DNA中。

全世界拥有巨量的数字信息,而且新的数字内容仍不断地大量涌入,这给数据存储工作带来了真正的挑战。硬盘不但昂贵,而且需要不断地供电;甚至质量最好的“非耗电”归档材料(如磁带),在10年之内质量就会有所下降。这在生命科学领域是一个越来越突出的问题,该领域有大量包括DNA测序在内的数据资料,构成了科学记录的基础。

“我们已经了解到,DNA是存储信息的可靠途径,因为我们可以从猛犸象的骨头里提取DNA,而猛犸象可以追溯到几万年之前,因此我们了解到这是个存储的好方法。”欧洲分子生物学实验室生物信息研究所的尼克·高曼解释说,“DNA分子极小,但密度大,储存时不需要电力,因而运输、保存都很容易。”

读取DNA相当简单,但是到目前为止,编写DNA一直是把DNA存储变为现实的主要障碍。主要存在两种挑战:首先,利用目前的方法只能制造出短链DNA;其次,不管是编写DNA还是读取DNA都很容易出错,特别是当同一个DNA字符出现重复时,尤其容易出错。研究人员正着手创建一种可以解决上述两个问题的编码。

“我们知道,我们需要单独地利用短链DNA来进行编码,而且需要采取一种方法,使我们在编码时不可能出现一连串的同一字符。因此我们估计,把编码拆分为许多前后互相搭接的片段,利用索引信息来显示每个片段在全部编码中所属的位置,制定一个不允许重复的编码方案。这样,只有在四个不同的片段中犯同样错误时,编码才会失败——这样的情况极为罕见。”尤恩·伯尼说道。

这个新方法需要通过编码信息来合成DNA。安捷伦科技公司(Agilent Technologies, Inc)是位于加州的一家公司,自愿为此项研究提供服务。登录到安捷伦科技公司的网站,尤恩·伯尼和尼克·高曼给该公司发送了以下资料的编码版本:一个mp3格式的马丁·路德·金的演讲《我有一个梦想》;一张jpg格式的EMBL照片;一篇pdf格式的沃森和克里克合作的重要论文《核酸的分子结构》;一份包括所有莎士比亚十四行诗的txt格式文件;还有一份叙述本研究中编码情况的文件。

“我们从互联网上下载了这些文件,并利用这些文件来合成了数十万段DNA,合成的结果看起来就像一小块泥土。”安捷伦科技公司的埃米莉·勒普劳斯特说。安捷伦科技公司将这个合成样本邮寄给EMBL,EMBL的研究人员能够不出差错地为合成DNA测序,为文件解码。

“我们利用DNA分子创造了一种容错编码,据我们所知,这种分子形式将会在1万年甚至更长的时间里保持良好的状态。”尼克·高曼说,“只要有人知道这种编码是什么,利用一台可以读取DNA的机器就能够获取编码所存储的文件。”

尽管还有许多实际的问题需要解决,但是DNA固有的高密度性和耐久性使之成为引人瞩目的存储媒介。研究人员下一步将要完善这种编码方案,使DNA存储早日付诸实用。

关键字:DNA测序DNA分子

本文摘自:凤凰科技

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^