4月 25, 2014

PhiベースのクラスタにおけるMPIベンチマーク

HPCwire Japan

Tiffany Trader

Intel製のMeny Integrated Core (MIC) アーキテクチュアは、高並列アプリケーションがMPIに適合するように設計された。Intel Xeon Phiコプロセッサー上で動くアプリケーションは、GPGPUのためのCUDAプログラミングのアプローチに似た、オフロード・プログラミングを使う。つまり、CPUの上で動くアプリケーションが、ディレクティブ(ソースコードの指示行)によって、多くの計算をする部分のコードとデータを、ホスト・システムのメモリーからコプロセッサーへ送って実行するということである。しかしGPUとは異なり、Xeon Phiは、それぞれのコアがIPアドレスを持ち、ホストCPUの助け無しにMPIのノードとして動くこともできる。CPUから成るクラスター用に作られたプログラムを比較的容易にPhiへ移植できるので、いわゆる対称形のクラスターモデルは魅力的である。データをオフロードするようにコードを書き換えなくても、HPCアプリケーションの高速化が可能である。

ヘテロジニアスなノードから成る対称形のクラスターのセットアップにおいて、MPIプロセスは直接コプロセッサーにおいて開始される。複数のPhiコプロッセッサー間のピア・ツー・ピア通信は、OSによって仮想化され、
ネットワーク機器を通して起きる。CPUのために開発されたMPIアプリケーションは、このように大きなコードの修正無しに動くかもしれない。しかし、ネットワーク・ハードウェアに特化していないために、通信の効率が落ちるかもしれない。

Colfax International の研究者 Vadim Karpusenko 氏と Andrey Vladimirov 氏は、PhiベースのクラスターをInfiniBandインターコネクトと適切なソフトウェアによって構築して、上記の欠点に対処した。彼らは最近の論文「 Configuration and Benchmarks of Peer-to-Peer MPI Communications Over Gigabit Ethernet and InfiniBand in a Cluster with Intel Xeon Phi Coprocessors」に研究の結果を掲載した。

著者は、イーサーネット・ファブリック上のTCPプロトコルとインフィニバンド・ファブリック上のDAPLプロトコルを比較した。そして、よりよいインフィニバンドの構成がある場合とない場合について、MPIのレイテンシーとバンド幅を測定し、検討した。インフィニバンド・ベースのPhiクラスターにおけるMPIアプリケーションのチューニング方法も議論される。あるAsianオプション価格設定アプリケーションへの影響についてである。さらに著者は、HPCアプリケーションがPCIエクスプレス・バスを通す不均一なバンド幅を使う際の、多くの推奨を書いた。

実験には、 Colfax ProEdge SXP8600pワークステーションから成るクラスターを使い、それぞれのノードには4個の Xeon Phi 31S1Pコプロセッサーが搭載され、後述の2種類のネットワーク構成のうちの1つが選択された。

1. Intel Gigabit Ethernet adapters installed in the systems and connected to a D-Link Gigabit Ethernet switch.
2. Mellanox InfiniBand ConnectX-3 Single-Port VPI 4X QDR adapters connected to a 36-port Mellanox Infiniscale IV switch.

OSは、CentOS 6.5、カーネルは 2.6.32-431.e16.x86_64、MPSS 3.1.2、Intel MPI 4.1.1.036、OFED 1.5.4.1であった。著者は、性能測定のためにIntel MPIに含まれている、Intel MPIベンチマーク(IMB)を使った。MPIは、分散メモリーあるいは共有メモリー・システムにおける並列プログラミング・モデルで、通信に様々な種類のネットワーク設定とハードウェアを使えるが、この実験においては、Intel MPIライブラリーだけがクラスター内のIntel Xeon Phiコプロセッサーをサポートできる実装であった。

Xeon Phiコプロセッサーが、PCIエクスプレス・バスに接続されるエンド・ポイントデバイスであり、直接イーサーネットあるいはインフィニバンドの接続するポートを持たないことは、重要な注意点である。その代わりに、コプロセッサー内で動くLinux OSと、ホスト(CPU)の「Manycore Platform Software Stack (MPSS)」がコプロセッサーのネットワークを仮想化する。著者は、コプロセッサーの間でのピア・ツー・ピア通信の性質を詳述して、いくつかの可能性があるネットワーク構成を提案する。

論文の何ページかは、イーサーネットとインフィニバンドの通信について、著者がどのようにヘテロジニアスなノードから成るクラスターを構成し、MPIアプリケーションを動かしたかの説明に占められた。

著者が示したところによると、TCPプロトコル即ちイーサーネットは、オフロード・モデルのアプリケーションの要求を満たしているが、直接コプロセッサー上で起動されるヘテロジニアスなMPIアプリケーションについては、実際のハードウェアの限界よりも低速である。

さらに著者は、MPSSの上にインフィニバンド・コントローラーと関連するソフトウェアをインストールして、クラスター内のホストとコプロセッサーの間の通信を大きく改良した。ノード内のCPUとコプロセッサー、ノード間のコプロセッサー同士、ノード間のコプロセッサーとCPUの全ての通信についてである。

著者によると、「いくつかの場合についてバンド幅が下がることはありますが、Intel Xeon Phiコプロセッサーとインフィニバンドを組み合わせると、ギガ・イーサーと比べて、1桁から2桁通信が高速になります。」

順位	機関名	システム名	ピーク性能(TFLOPS)
1	理化学研究所	富岳	537,212
2	東京工業大学	TSUBAME 4.0	59,400
3	産業技術総合研究所	ABCI 2.0	54,341
4	東京大学	Wisteria/BDEC-01	25,952
5	東北大学	AOBA-S	19,818
6	宇宙航空研究開発機構	TOKI-SORA	19,464
7	気象庁	PRIMEHPC FX1000	15,571
8	気象庁	PRIMEHPC FX1000	15,571
9	海洋研究開発機構	地球シミュレータ	13,448
10	匿名	Apollo 6500	9,669

すべての国内スパコンリストはこちらから。

西克也
西克也はフェアチャイルド社、クレイ・リサーチ社、ベストシステムズ社など、30年以上に渡ってHPCに関する仕事に従事している。Hpcwire Japanの編集長として記事の作成と翻訳を行っている。

島田佳代子
1999年～2007年まで英国在住。2001年よりスポーツ、旅、ビジネス、映画など幅広いジャンルで執筆活動を開始し、Hpcwire Japanでは主に日本のHPC業界が世界に誇る研究者、開発者の方々のインタビューを担当。

小柳義夫
小柳義夫氏は40年以上に亘ってHPCに携わってきた研究者であり、日本のHPC業界における生き字引として有名。現在　高度情報科学技術研究機構に所属し、産業界のHPC推進にあたっている。

小西史一
小西史一は、理化学研究所、東京工業大学においてHPCおよびバイオインフォマティクスに関する研究と教育に携わってきた研究者。2012年からフォトグラファーとしての活動を開始し、現在はIT技術・セキュリティのコンサルティング業務に携わっている。

eNewsletter

検索

PLUTNUM

GOLD

SILVER

HPCの歩み50年記事一覧

スパコンリスト日本

記事寄稿について

PhiベースのクラスタにおけるMPIベンチマーク

調達情報

ニュース記事

お知らせ

特別イベント

【CAE懇話会】第４４回中部CAE懇話会　ＣＡＥによる信州のモノつくりを活性化　～導入からAI活用まで～

SCA/HPCAsia 2026

技術資料ダウンロードサービス

スパコン調達手続き中

国内スパコン上位10システム(TOP500順)

近日開催国内イベント

【CAE懇話会】第４４回中部CAE懇話会　ＣＡＥによる信州のモノつくりを活性化　～導入からAI活用まで～

【RIST】第40回HPCプログラミングWebセミナー: 並列プログラミング入門（OpenMP編）

【JHPCN】学際大規模情報基盤共同利用・共同研究拠点第17回シンポジウム

【京都大学】学術情報メディアセンターセミナー「次世代の高性能線形計算技術」

第33回AT研究会オープンアカデミックセッション（ATOS33）特別企画「LLMによる生成AIのHPC適用」

【CAE懇話会】第102回関西CAE懇話会

2025年並列／分散／協調処理に関するサマー・ワークショップ（SWoPP 2025）

xSIG 2025

【産応協】第57回（2025年度第1回）産応協セミナー『AIとHPCの融合がもたらす次世代設計・予測最適化技術 – 自動車・材料設計，気象，トポロジー最適化 -』

CBI学会2025年大会

寄稿者

HPCwire Japan

E-Marketings, Inc.

PLUTNUM

GOLD

SILVER

HPCの歩み50年記事一覧

スパコンリスト日本

記事寄稿について

PhiベースのクラスタにおけるMPIベンチマーク

調達情報

ニュース記事

ホットな話題

お知らせ

特別イベント

技術資料ダウンロードサービス

スパコン調達手続き中

国内スパコン上位10システム(TOP500順)

近日開催国内イベント

寄稿者

HPCwire Japan

E-Marketings, Inc.