世界のスーパーコンピュータとそれを動かす人々


2月 24, 2014

DNAをベースとしたストレージの気配

HPCwire Japan

Tiffany Trader

・・・あるいはどうやってバンにインターネットを押し込む・・・

今日の科学と産業が直面する最も重要な課題の一つは、地球規模で作られ増え続けるデータ量を格納する事である。GoogleのEric Schmidtは、人類は2日ごとに文明発祥の黎明期から2003年までに行ったような多くの情報を生成していると主張する。この課題に世界最古の記憶媒体、DNA、のおかげで対処する方法があるかもしれない。ハーバード大学医学部遺伝学の教授で先駆的研究者のGeorge Churchと欧州バイオインフォマティクス研究所(EBI)の副所長のEwan Birneyによって行われた研究では、DNAベースのストレージは著しく有効かつ効率的であると示す。

昨年10月にEUDATの第2回会議のために基調講演を行い、Ewan Birneyは生物学とビッグデータ科学の交差点で発生している刺激的な活動について話し合った。ISGTWとのインタビューで、Birneyはシェイクスピアのソネットのような原材料、Martin Luther Kingの演説「私は夢がある」からの抜粋、DNAの二重らせん構造について述べているWatsonとCrickの有名な論文のPDFファイル、EBIの画像、そして符号化手順を説明するコードの一部などで作業する彼のDNA符号化プロジェクトついて追加の詳細説明を共有する。

ストレージメカニズムとしてのDNAの美しさは、Birneyによれば、電気的影響がなく、信じられないほど緻密で、かつ安定していることである。70万歳のDNAが回収された。「あなたは、それを冷たく乾燥した暗所に保管しているだけです。」とBirneyはISGTWで語った。

Birneyは、DNAを読み書きする技術は細菌が最初に遺伝的に1973年に設計されて以来、存在していると説明を続ける。パシフィックノースウエスト国立研究所のPak Chung Wong率いる2003プロジェクトは、それぞれ4つのDNA塩基(Adenine、Cytosine、Thymine及びGuanine-また略号A、C、T、およびGにより知られている)のひとつに対応する数字のベース4シーケンスの中へ各文字を変換することによりDNA中へ暗号化テキストを転送した。細菌は、それらが迅速に複製し、プロセス内のデータの複数コピーを生成するため、最適な宿主であると考えられ、もし個々の突然変異が細菌内で発生した場合、残りの細菌は依然として元の情報を保持する。

にもかかわらず、活きたDNAが問題がないわけではない。高速複製率は、長期間にわたって中間データを危険にさらす。挿入されたDNAは、細菌ゲノムを不安定化し、宿主細菌の正常な細胞のプロセスを妨げる可能性のリスクもある。英国のロンドン王立大学の生化学の助教授、Geoff Baldwinが説明するように「これは大容量データ記憶装置として細菌を使用のために良い前兆でありません。 」

生きた細胞をそのまま残すことはDNAのために必要ではないため、研究者は、代わりに「裸の」DNAを用いることを提案した。細菌と違って、裸のDNAはそれを宿主の中へ安全に挿入するために遺伝子操作を必要としない。Birneyと彼のチームは、裸のDNAコードの中へシェイクスピアのソネットの154のすべてを含む独特なデータの合計739KBのコンピュータファイルを符号化し、DNAを合成し、それを配列決定し、99%以上の精度でファイルを再構築した。

DNA読み書きの現在の高いコストで、この技術はまだ大容量記憶装置に適していない。しかし、核サイトの位置データやその他政府の長期的保存が必要だがあまり頻繁にアクセスされない法的、科学的なアーカイブなどの極めて長期的(1000年またはそれ以上)な用途のために、すでに経済的に実行可能である。さらに、研究者は、現在の傾向が10年以内に、長期アーカイブ用(〜50年の期間を)のコスト効果のあるDNAベースストレージを作るべきとするペースでDNA合成コストを削減していることを指摘する。

「DNAが素晴らしく、DNAのほんの1グラムで、データのペタバイト相当の記録ができ、それはそれは完全なエラー耐性があることを保証するために求められる冗長性を備えます。それはバンの大きさ(!)の中にインターネット全体を置くことができると推定されます。また、平凡にコピーすることもできます。現時点で唯一の問題はコストです:それは、DNAを書くことが法外に高価です。それにもかかわらず、この技術は今後数年間で劇的に価格が下がって来ることが予想されています。唯一の問題は、どれだけ迅速には価格が落ちてくるか?」とBirneyは観測する。