世界のスーパーコンピュータとそれを動かす人々


8月 20, 2018

高性能分子シミュレータを使用した分子科学の発展

HPCwire Japan

Ken Strandberg

原子、ボソン、およびフェルミ粒子が宇宙の各部分を構成しているとすれば、分子は壁、天井、床、そして基礎にあたるものであり、そして我々がモノとして認知しているものを形作るすべての構成要素、それこそが「物質(マター)」なのだ。しかし、これらは必ずしも単純な構造を持っているというわけではない。単純な分子から数千の原子、星間空間や自発的に分子が整列する超分子系に存在するエキゾチック分子から構成される大きな蛋白質まで、その規模、多様性、挙動は実に様々である。日本の分子科学研究所 (IMS),において、日本の研究者は世界の分子科学コミュニティと協力し、化学、物質、そして生物学系に欠かせない分子の機能と挙動を解き明かそうとしている。

分子科学の知識を深める際に核となるのは、大規模スーパーコンピュータを駆使した計算研究を用いて構造と挙動のシミュレーションを行うことである。水を例にとってみよう。水は、温度が摂氏0℃に達したときに凍り、。表面温度が摂氏0℃を超えたときに溶ける。表面から融解する場合、これを不均一融解という。氷は内部からも融解するが、これを均一融解と呼ぶ。後者の分子レベルの過程は、よく分かっていない。長年の研究と大規模スーパーコンピュータによるシミュレーション実験により、分子科学研究所の科学者は、平衡融解の解明についての明るい展望を持つに至った。その研究は、定期刊行の『Nature』誌(2013年6月20日発行、第498号、第350~354頁)に掲載された論文「Defect pair separation as the controlling step in homogeneous ice melting」に述べられている。

分子科学研究所計算科学研究センター (RCCS) センター長、斉藤真司教授によれば、「このような自然科学における飛躍的進歩を成し遂げるのは、計算的に容易ではない」とのことである。また、教授は「最大の難関は、未知の構造や挙動を解き明かすために研究者がスーパーコンピュータで実行しなければならない、膨大な数の計算の試行錯誤であり、計算に時間がかかればかかるほど、研究者が発見までに要する時間も長く必要となる。」ともコメントした。

超高性能分子シミュレータの構築

分子科学者は、超高性能計算機研究(HPC)システムを駆使して分子動力学法(MD法)によるシミュレーションや量子化学(QC)計算を行う。MD法シミュレーションは、並列計算に高度に特化しており、多くの量子アルゴリズムは計算を直列処理で行う傾向にある。計算方式について述べるなら、分子科学研究所はさまざまな研究者のニーズに的確に応えるため、異なる二種類のスーパーコンピュータ、つまり大規模並列計算機と高速直列計算機を用意しなければならない。

斉藤センター長は、「旧機は2011年に設置された」と語った。また、「研究者は6年前のテクノロジーを運用しており、今日のユーザの要望に応えるには、コア数と計算速度が不足していた。」ともコメントした。

分子科学研究所は、最新のインテル® Xeon®スケーラブル・プロセッサーおよびIntel® Omni-Pathアーキテクチャ・ファブリックによるコア数40,588のデュアルパーパスクラスタの構築を日本電気(NEC)に依頼した。日本電気はSuperMicro社製を採用し、22017年10月1日にサービスインした新機の計算能力は、旧クラスタと比較して7.3倍に増強1,2。「高性能分子シミュレータ」と呼ばれる新機は、1.8 petaFLOPS Linpack*および3.1 petaFLOPSの論理ピーク性能1を持ち、2017年11月時点の上位500機中の70位にランクインしている。

計算科学研究センターの班長を務める水谷文保技術職員は、「分子科学研究所は両方のタイプの計算領域で研究を支援しており、またCPUのコア速度は通常、コア数の多いものより劣るため、当センターは数千のコアを持つシステムとコア数が少なくても速度が速くメモリが大きいもの、両方の構造を持つソリューションが必要だったのです」と語った。

日本電気は並列および直列計算の両方を行うため、異なるプロセッサーを使用した。同社は、大規模並列MD法課題には20コアのインテル® Xeon® Gold 6148プロセッサーを、処理速度の早い直列量子計算には18コアの3.0~3.7GHz インテル® Xeon®Gold 6154プロセッサーを選択した。タイプの異なるワークロードに対応するため、双方向バイセクションバンド幅(full bi-sectional bandwidth、FBB)技術を用いて20コアのノード相互接続が構築され、また大量のメモリを使用するジョブ実行中の通信量を抑制するため、より高速なノードは1:3の割合でオーバーサブスクライブされた。本システムは、216,768GBのメモリを搭載している。

研究を2.1倍迅速に行うには

新システムでは既に生産が開始されており、80のユーザが1~1,000コアを使用してほぼ1,000のジョブを継続的かつ効率的に処理している。分子科学研究所によれば、新システムに搭載したGaussian09 Rev.d01(構造最適化および振動数計算の「改造試験397」のベンチマークの一つ)により、処理速度は旧システムの約2.1倍となったとのこと。

水谷班長は、「大量のメモリを使用するワークロードのGaussianベンチマーク結果が、「Spectre」や「Meltdown」ソフトウェアの更新やファームウェアのアップデートが適用される前に計算される間は、セキュリティのアップデートが適用された後に性能に影響しないと表示されるコードのテストはそれ以上行われません」とコメントした。

注1: 日本電気 LX Cluster、Xeon®Gold 6148/6154、40,558コアおよび3.1 petaFLOPS論理ピーク性能のインテル® Omni-Pathアーキテクチャ。
注2: 富士通 PRIMERGY CX250 および RX300、Xeon® E5-2690/E5-2697v3 2.9GHz/2.6Ghz, 12,992コアおよび.437427 petaFLOPSの論理性能のInfiniBand FDR/QDR。詳しくは https://www.top500.org/site/48473参照のこと。

 

Ken Strandbergはテクニカルライターです。Ken Strandberg氏は記事、白書、セミナー、Eラーニング、ビデオおよび動画の台本、技術マーケテイング、および新規参入技術企業、「Fortune 100」ランキング記載企業、および多国籍企業向け双方向担保についての記事を寄稿しています。同氏の専門分野はソフトウェア、超高性能計算機研究(HPC)、産業技術、自動設計、ネットワーク、医療技術、半導体、および通信などです。連絡先: ken@catlowcommunications.com.

本記事はインテル® の超高性能計算機研究(HPC)編集プログラムの一環として作成され、先進的技術を通じてHPCコミュニティが牽引する先端科学技術、研究、およびイノベーションを特集するものです。