11月 21, 2013

アクセラレータの主流にJavaの一撃を

HPCwire Japan

Nicole Hemsoth

GPUや他のアクセラレータの利用が主流になると、主な障壁のひとつはプログラムの容易さである。アクセラレータ周辺のベンダーコミュニティは、学習曲線を平坦に抑えているが、実際はその教育プロセスに乗り出す一般開発者の一部に特別な労力が求められることに変わりはない。

HPCスペースは、最も大きな規模でGPUとアクセラレータが大幅な性能改善を引き出すことが出来ることを実証し、そして、これらは確かに伝統的な高性能コンピューティング以外の企業にとって確かに魅力的である。ただ疑問が生じる。高速化のためのプログラミングに飛び込む際に、主流の開発者にどんな「好条件を提示する」ことが出来るだろうか？

或る研究者、ライス大学のMax Grossman、によると、険しい学習曲線があり、高速化できるまでに暫く時間が掛かる。しかしその距離を縮める幾つかの注目すべきプロジェクトがある。以下のインタビューではこれらの挑戦が詳述されている。-この若い研究者と彼のチームによる特にOpenCL/Javaの面で何がなされたのか-　より高いレベルに高度なツールを持って行きたいと思う他の人には言及しない。

Grossmanは、幾つかのプラットフォーム（CPUやメニーコアGPUは、FPGAは、などから）に跨ってSIMDカーネルの互換性のある実行を可能にするためにOpenCLを使用することが可能にもかかわらず、JavaからOpenCLを使用することは危険な道筋であり、それは単純化に逆行すると言う。例えば、OpenCLカーネル言語でカーネルを書く等をする場合、データ転送を管理することを深く理解する必要がまだある。

これらの問題に取り組むために、彼らは、ベースとしてのOpenCLの自動生成を介して、Javaベースのプログラムを高速化するために幾つかのユニークなコンパイルとランタイム技術について協力した。チームは説明したように、彼らがHJ-OpenCLと呼ぶアプローチは、次の事を含んでいる; OpenCLカーネルとHabanero-Java(HJ)言語で利用出来るparallel-forコンストラクタ(FORALL)からJNIグルーコードの自動生成；OpenCLのデバイス上の正方配列、多次元配列を効率的にサポートするためのHJの配列表示言語構成の利用；自動生成されたOpenCLのカーネル内の全対全バリア同期のためにHJのフェイザー(次)構造の実装。

チームがまとめたように：

「私たちは、私たちのアプローチを評価する10のJavaベンチマーク1組を使用して、ネイティブなOpenCLの実行と並列処理の両方に起因するパフォーマンスの改善を観測します。AMD APUについて、 4コアCPUのホスト上で実行した時に逐次型Javaと比較して36.7倍の性能向上を確認し、そして、統合されたGPU上で実行した場合、最大55.0倍でした。Intel Xeon CPUと後付けのNVIDIA Fermi GPUを搭載したシステムでは、逐次型Javaへの相対的な速度向上は、12コアCPUで35.7倍、そしてGPUで324.0倍でした。さらに、私たちは、異なるアプリケーションが、JVMでの実行、OpenCLのCPU実行、およびOpenCLのGPU実行で最適に実行することを発見しました。この作業に含まれる言語機能、コンパイラ拡張およびランタイム拡張機能は、全てのOpenCLプラットフォームを横断して、移植性、ラピッド・プロトタイピング、およびJVMアプリケーションの透過的な実行を可能にするものです。」

これらおよび他のアプローチに加えて、Grossmanは、ベンダーコミュニティはより広い分野の開発者により多くのハードウェアを提供することを含め、アクセラレータとの実験を発展させるために行うことができる幾つかのシンプルなことがあると言う。

このライス大学グループの研究の詳細は、ここ(http://pppj2013.dhbw.de/conference-pppj2013/program.html)を参照。

順位	機関名	システム名	ピーク性能(TFLOPS)
1	理化学研究所	富岳	537,212
2	産業技術総合研究所	ABCI 3.0	181,490
3	ソフトバンク株式会社	CHIE-4	151,880
4	ソフトバンク株式会社	CHIE-3	138,320
5	ソフトバンク株式会社	CHIE-2	138,320
6	産業技術総合研究所	ABCI-Q	99,350
7	最先端共同HPC基盤施設	Miyabi-G	72,800
8	FPTジャパンホールディングス	FPT AI Factory	67,440
9	東京科学大学	TSUBAME 4.0	61,600
10	さくらインターネット	SAKURAONE	47,790

すべての国内スパコンリストはこちらから。

西克也
西克也はフェアチャイルド社、クレイ・リサーチ社、ベストシステムズ社など、30年以上に渡ってHPCに関する仕事に従事している。Hpcwire Japanの編集長として記事の作成と翻訳を行っている。

島田佳代子
1999年～2007年まで英国在住。2001年よりスポーツ、旅、ビジネス、映画など幅広いジャンルで執筆活動を開始し、Hpcwire Japanでは主に日本のHPC業界が世界に誇る研究者、開発者の方々のインタビューを担当。

小柳義夫
小柳義夫氏は40年以上に亘ってHPCに携わってきた研究者であり、日本のHPC業界における生き字引として有名。現在　高度情報科学技術研究機構に所属し、産業界のHPC推進にあたっている。

小西史一
小西史一は、理化学研究所、東京工業大学においてHPCおよびバイオインフォマティクスに関する研究と教育に携わってきた研究者。2012年からフォトグラファーとしての活動を開始し、現在はIT技術・セキュリティのコンサルティング業務に携わっている。

eNewsletter

検索

PLUTNUM

GOLD

SILVER

HPCの歩み50年記事一覧

スパコンリスト日本

記事寄稿について

アクセラレータの主流にJavaの一撃を

調達情報

ニュース記事

お知らせ

特別イベント

ISC 2026

International Conference for High Performance Computing, Networking, Storage & Analysis (SC26)

技術資料ダウンロードサービス

スパコン調達手続き中

国内スパコン上位10システム(TOP500順)

近日開催国内イベント

【RIST】第47回HPCプログラミングWebセミナー: 並列プログラミング入門（MPI編）

【東京大学】第274回お試しアカウント付き並列プログラミング講習会「OpenFOAM初級・自動車空力解析」

【東京大学】第275回お試しアカウント付き並列プログラミング講習会「HAIRDESC GPUプログラミング教材によるGPUプログラミング入門 –OpenACC編–」

【PCCC】PCCワークショップin 神戸 2026 「AIによるHPC／AI-driven HPC」

【RIST】第48回HPCプログラミングWebセミナー: チューニング技法入門

【CAE懇話会】第45回中部CAE懇話会　CAEを導入して、できる事、できない事

【CAE懇話会】第45回中部CAE懇話会： CAEを導入して、できる事、できない事～CAEを導入、利用するために必要な事～

2026年並列／分散／協調処理に関するサマー・ワークショップ（SWoPP 2026）

リコンフィギャラブルシステム研究会 (RECONF)

寄稿者

HPCwire Japan

E-Marketings, Inc.

PLUTNUM

GOLD

SILVER

HPCの歩み50年記事一覧

スパコンリスト日本

記事寄稿について

アクセラレータの主流にJavaの一撃を

調達情報

ニュース記事

ホットな話題

お知らせ

特別イベント

技術資料ダウンロードサービス

スパコン調達手続き中

国内スパコン上位10システム(TOP500順)

近日開催国内イベント

寄稿者

HPCwire Japan

E-Marketings, Inc.