世界のスーパーコンピュータとそれを動かす人々


1月 22, 2014

ビッグコンピュート vs ビッグデータ

HPCwire Japan

Tiffany Trader

ビッグデータとビッグコンピュートは、新しい概念ではない。「ビッグデータ」と言う用語が流行語のように飛び立つ前に、HPCコミュニティは、計算集約型およびデータ集約型コンピューティングとしてのこれらと同じ考えを表明した。問題は、計算指向、もしくはI/O指向、もしくはその両方だった。

それはそうである。世界は、データの爆発の真っ只中であるからである。2013年に、インターネットを流れるデータ量は667 Exabytesで、1410億枚のDVDと同等の量だった。ビッグデータの概 念的フレームワークの急速の立ち上がりは、このパラダイムを反映している。ビッグコンピュートは、補完的な用語としてうまく機能する。それらは、本質的にコインの両面であるか、もしくはそれらは何か?

最近のTEDx Talkで、バージニア工科大学の教授と著名なHPC専門家のWu Feng(呉鳳)は、どのようにこれらの要素が国を横断して異なる経験をしているのかついて議論した。

Fengは、質問から彼の話を始める「今日の急速に進化する技術の世界では、私たちの未来はビッグデータですか、ビッグコンピュートですか?」

彼が用語の概要を説明したように、Fengは彼が開発し、2011年11月に米国で最もグリーンな商用スーパーコンピュータとして公開されたGPUアクセラレータ型スーパーコンピュータ、HokieSpeed を引用した。HokieSpeed は、ビッグコンピュートのリソースであり、典型的なPCよりも10万倍速い、毎秒500兆回の演算を行う能力があるとFengは述べている。

HokieSpeed と他のそのようなシステムは、病気の発生の際に公共政策を導くために使用することができる疫学的研究のために使用されている。シミュレーションは、どのようにウイルスが広がるかについて科学者の理解を高め、適切な防止措置を考案する公衆衛生当局を彼らが支援することを可能にする。

別のHokieSpeed プロジェクトでは、脳のリバースエンジニアリングを目指している。研究者たちは、EGG(electroencephalographs)脳波読み取り装置での高次運動機能の繰り返しパターンを見つけようとしている。シミュレーションは、神経経路マップを使用している。

今日のニュースで神経学的疾患のひとつは、脳の心的外傷、すなわち脳震盪の既往歴のあるスポーツ選手たちに影響を及ぼしている進行性退行性脳疾患、CTEと呼ばれているものである。CTEは、確かに死後にだけ診断することができるが、しかし神経科医は、生きている患者でCTEを診断し、治療することに向けて取り組んでいる。PC上では、この類いの研究は数時間または数日ではなく、数ヶ月または数年かかるだろう。

ビッグデータには多くの定義があり、そしてひとつの重要な特徴は、すなわち、あなたが使うよりも多くデータが相対的であるということである。「ビッグデータは、あなたのどでかい干し草の山であり、その干し草の山の周りに根付くために使用する様々なアルゴリズムです。ビッグコンピュートが沢山の金属探知機です。」とFengは説明する。「彼らは、幾らかの洞察と知識を拾い集めることができる干し草の山の中の情報の針を全て見つけようと試みるデバイスです。」

Fengは、ビッグデータやビッグコンピュートに投資することになると、様々な国が異なる優先順位を持つという意見を述べた。

2013年5月に戻って、Fengは、生命科学におけるDNA検索研究を議論するためにホワイトハウス当局者に話を聞いた。ここのアプリケーションのひとつは、ゲノム中の変異を見つけることが含まれている。これは、癌を引き起こしている種々な経路を推測することを可能にし、そして潜在的な治療のためのお膳立てを行う。この機能では、明らかにビッグデータに焦点がある、とFengは指摘し、一方ビッグコンピュートは、重要ながらも明らかに二の次だった。

3週間後、Fengは、米国代表団の一人として中国を訪れ、そこで逆が真であることを見つけた。

「ここで、私たちはより重要であるものとしてビッグデータを見ています。」とFengは述べる。「そして中国では、米国の最速のスーパーコンピュータより2倍速く、HokieSpeed よりも282倍高速とされるTIANHE-2と呼ばれるスーパーコンピュータを作ったように、ビッグコンピュートはビッグデータよりも重要です。」

彼らは、ビッグコンピュートの単なる応用領域としてビッグデータを考えている、とFengは指摘する。

コンピュート側が多くの場合、ユーザから隠されているため、ビッグデータは、少なくとも米国では、部分的にビッグコンピュートの上位まで上昇したことをFengは主張する。例えば、Googleは光の速度で検索結果を返すが、平均的な人は、この処理を有効にしている莫大な基本的計算基盤に気がついていない。

彼は、計算側が基本的に視聴者から隠されていた非常に目に見える「ビッグデータ」アプリケーションの別の例として、IBM WatsonのJeopardy!での外観を挙げている。

だから我々は何に投資すべきか?とFengは尋ねる。補完的な力として、データや計算は手と手を携えている。「データの意味を理解するために、私たちにはデータと計算が必要です。」データが情報となるサイクル、そして知識、そして知恵があり、これらのステップの各々はコンピューティングを必要とする。

 

*注釈:バージニア工科大学の発表によると、HokieSpeed は「455Teraflopsの単精度最大性能で毎秒455兆回の演算ができ、そして240Teraflopsの倍精度最大性能で毎秒240兆回の演算ができる」と主張する。