大きくなる地上の生物圏スーパーコンピュータ
Tiffany Trader

地球上にどのくらいのDNAデータがあるのか考えたことがあるのは、あなただけではない。しかし、イギリスの3人の研究者は考えただけではなかった。かれらは生物圏の全情報内容を計算するようにして、その結果と方法を最近のPLOS Biologyに掲載した。
この種では最初の会計報告において、DNAの総量はおよそ50 x 1030メガ塩基対(50兆兆兆塩基対)だった。重量で500億トンとなり、この遺伝物質の総量は10億個の輸送コンテナを埋め尽くすのだ。
この情報を保管するには、平均ストレージ容量が世界で最も強力な4台のスーパーコンピュータ(Tianhe-2、Titan、Sequoia、京コンピュータ)である1021台のコンピュータを必要とする、と論文の著者であるエジンバラ大学の研究者Hanna Landenmark、Duncan ForganとCharles Cockellは言っている。
このチームは、生物多様性の情報を見ると彼らが言う、生物圏における情報の総量をDNAの観点で表す別のアプローチを使った。
「生物圏はDNAの総量により表される情報ストーレージと転写率で象徴化される処理能力を持った大規模並列スーパーコンピュータで可視化可能です。」と書いている。「インターネットと同じように、地上のすべての有機物は情報の個々のコンテナであり、大規模で、グローバル、ボトムアップなネットワークの中で、相互作用と物質循環を介して繋がっているのです。」
この推定に到達するのに、研究者達は生物の5つの主要サブグループから開始した: 原核生物、植物、動物、単細胞真核生物(原生生物とも呼ばれる)、および真菌だ。そして、各グループの総バイオマスを予測し、ゲノムサイズと細胞の典型的な質量からDNAの内容を推定した。
著者達は、生物の遺伝的多様性の重要な指標としてこの新しいメトリックを見ている。主に種の多様性にフォーカスすることは十分ではないと彼らは言う。それにくっ付いているコンポーネントを数えることで、インターネットの情報のコンテンツを勘定するようなものだと、彼らは言うのだ。
この研究は生物圏の演算能力の興味深い議論につながり、生きているスーパーコンピュータとして考えることができるのだ。FLOPS(秒毎の浮動小数点演算回数)の代わりに、DNAの処理速度は毎秒何塩基対が転写されたかで表され、ヌクレオチドオペレーション毎秒(NOPS)で測られる。
中道の推測値に典型的なDNA転写率である毎秒30塩基対を使用すると、生物圏の潜在的計算能力はおよそ1015 yottaNOPS(yotta =1024)となる。これは現在のTOP500のチャンピオンである105テラフロップス(テラフロップス=1012)の処理能力を持つTianhe-2の1022倍の処理能力となる。また、直近のTOP500リスト(2014年11月)の全ての500システムの性能の合計は「たった」309ペタフロップスであることも考えてみよう。
注: 私は、一貫性と単純化のために著者らの表記スタイルを維持した。Tianhe-2の公開LINPACK速度は33.86ペタフロップス、または3.38×10^16フロップスである。