10月 16, 2023

量子コンピュータが「HPC-ready」になるとはどういうこと

HPCwire Japan

Yuval Boger , Yoel Knoll オリジナル記事はこちら

編集部注：この寄稿記事のタイトルが気に入っている。量子コンピューティングがHPCレディになる、あるいは逆に、HPCセンターが量子レディになるとはどういうことか。この核心的な問いは、両側から取り組まれている。欧州は、量子コンピューティングをどのようにHPCに統合していくかについて、米国よりも早く考えを固めてきたと言えるかもしれないが、その状況は変わりつつある。

ライプニッツ・スーパーコンピューティング・センター（LRZ）の量子統合センターは、EC全体の量子開発に不可欠な存在であり、ミュンヘン量子バレー（MQV）地域の取り組みにおける緊密な協力者でもある。HPCwireの最新記事「Leibniz QIC’s Mission to Coax Qubits and Bits to Work Together」では、この取り組みについて詳しく紹介している。特に、QICはミュンヘン量子ソフトウェアスタックを開発しており、HPCと量子の融合エコシステムで実行される量子アプリケーションを実行・管理できることを目指している。

例えば、量子コンピュータを収容するためにしばしば必要とされる低温希釈冷凍機への対応などである。ライプニッツQICの責任者であり、HPCwire 2023 Person to Watchの1人であるラウラ・シュルツ氏は、HPCwireに次のように語っている。「HPCとエネルギー効率では、インフラ全体がすでに複雑で、独自の進化を遂げています。しかし今、私たちはクライオスタットの管理をしており、特定のスケジュールで窒素を交換しなければなりません。キャリブレーションの仕方や、キャリブレーションの維持の仕方も学ばなければならない。まったく新しい運用プログラムも学ばなければならない。湿度、温度、電磁放射など、その他すべての外的要因にも気を配らなければなりません。これは演算のための新しい装置であり、HPCセンターにどのように持ち込むかを考えなければならないのです。」

おわかりいただけただろうか。

ユヴァル・ボーガー氏とヨエル・ノール氏の寄稿によるこの解説は、少し骨格的な面もあるが、量子コンピュータの潜在的なユーザーが量子コンピュータを導入する準備として考慮すべき重要な事柄の多くを幅広く指摘している。しばらくの間、量子コンピュータのユーザーのほとんどは、ウェブポータルから量子デバイスにアクセスすることになるだろうと思われていた。しかし、最近では、ライプニッツのように主要なHPCセンターに組み込むか、IBMがクリーブランド・クリニックで行ったように、民間企業でオンプレミス・ソリューションを提供する量子コンピューター開発者が増えている。

注：ボーガー氏（QuEra、CMO）とノール氏（Quantum Machines、マーケティング担当副社長）は、ともに量子賞金レースに出馬している。

ハイパフォーマンス・コンピューティング（HPC）センターへの量子コンピューティングの統合は、ますます関心が高まり、緊急の課題となっている。量子コンピューティングが成熟するにつれ、その問題はもはや理論的な能力だけでなく、現実のコンピューティング環境における実用性も問われるようになっている。実際、量子コンピュータを購入しようとしている多くの組織は、「HPC-ready」であることを要求しており、強力であるだけでなく、既存のHPCインフラとの相乗効果が期待できる量子ソリューションを求めている。

しかし、「HPC-ready」とは何を意味するのだろうか？「HPC-ready」とは、量子コンピュータがパワフルであるだけでなく、HPCエコシステムの中で互換性があり、信頼性が高く、効率的であることを意味する。この記事では、量子コンピュータの物理的特性、ソフトウェアスタック、古典的/量子的なハイブリッドアルゴリズムの実行能力、システムの監視と管理といった重要な管理機能に焦点を当てながら、量子コンピュータが真に「HPC-ready」であるとはどういうことかを紐解いていく。

物理的属性

量子コンピュータの物理的なサイズは、HPCセンターの既存のインフラに合わせる必要がある。コンパクトになりつつある古典的なコンピュータとは異なり、量子コンピュータの中には非常にかさばるものもある。量子ハードウェアが指定されたスペースに収まることを確認することは、HPCへの準備の第一歩だ。

超伝導量子ビットを利用した量子コンピュータなど、特定の量子コンピュータは、量子コヒーレンスを維持するために極低温で動作する。希釈冷凍機のような特殊な冷却システムが必要となるが、これは物流上の課題となり得る。これらの冷却システムは、データセンターの既存の冷却インフラに統合する必要があり、慎重な計画と大幅な変更が必要になる可能性がある。

朗報としては、量子コンピュータの一般的な消費電力は、ハイエンドのHPCリソースと比較して低いことが挙げられる。今日の量子コンピュータ・システムの消費電力は5KWから最大25KWであり、従来型のシステムよりも大幅に効率的である。

ソフトウェア・スタック

システムが物理的にインストールされ、サポートされるようになったら、ソフトウェアスタックに注意を払う必要がある。

アプリケーション・プログラミング・インターフェース（API）とソフトウェア開発キット（SDK）は、開発者が量子コンピュータの機能を既存のアプリケーションに統合するために不可欠である。これらは、量子コンピュータが既存のソフトウェア環境に簡単に「プラグ＆プレイ」できるように、堅牢で文書化され、標準化されていることが理想的である。量子コンピュータはまだ発展途上の技術であるため、量子コンピュータソフトウェアの専門家は多くない。そのため、サンプルプログラムやスタートガイドが重要である。

ミドルウェアは、量子コンピュータと古典的なHPCシステムの接着剤の役割を果たす。ミドルウェアは、量子アルゴリズムの実行を容易にし、リソースを管理し、量子システムと古典システムが効果的に通信できるようにする。ミドルウェアソリューションは、既存のHPCソフトウェアスタックと互換性がなければならない。

多くのHPCセンターでは、SLURM（Simple Linux Utility for Resource Management）を使用しており、堅牢なジョブスケジューラとリソースマネージャとして機能している。SLURMの主な機能には、ジョブのキューイングと優先順位付け、仮想化、ノード選択と予約機能によるリソース割り当て、ジョブアレイとタスク分散による複雑なワークロード管理などがあります。SLURMはまた、リアルタイムのモニタリング、レポーティング、アクセス制御、アカウンティング機能も提供する。量子コンピュータは従来のHPCと並行して動作するため、SLURMを使用してHPCと量子システムの間で計算タスクを分割することが効率を高める方法となる。このようなHPC環境に最適に統合するためには、量子コンピュータもSLURMインターフェースを持つ必要がある。

量子アルゴリズムと量子コンピュータは複雑であるため、アルゴリズム、それを実装する量子回路、回路を改良するためのオプティマイザ、個々の量子ビットを駆動するパルスをきめ細かく制御できる柔軟でオープンなソフトウェア・スタックを持つことが重要である。

古典と量子のハイブリッド・アルゴリズム

量子コンピューティングにおける最もエキサイティングな発展の1つは、古典的リソースと量子リソースの両方を活用するハイブリッド・アルゴリズムの台頭である。このようなアルゴリズムでは、多くの場合、前処理や後処理に古典的なシステムを使用し、計算集約的なコア計算を量子コンピュータが処理する。HPC対応とは、このようなハイブリッド・アルゴリズムを効率的にサポートするソフトウェア・インフラを持つことを意味する。

このソフトウェア・インフラストラクチャの一部には、古典計算と量子計算のワークフローを管理するオーケストレーション・レイヤーがあり、タスクが最適なコンピューティング・リソースに割り当てられるようにする。このレイヤーは、エラー訂正や最適化も扱うことができ、プロセス全体をより効率的で信頼性の高いものにする。

興味深いアプローチは、量子コンピューターに密結合GPUを追加することだ。GPUは従来のHPCセンターでは非常に普及しているが、量子コンピューターと専用GPUリソースの間に高速で低レイテンシーの接続を追加することで、新たな可能性が開ける。GPUは量子コンピュータと連携して、エラー訂正のような時間に敏感なタスクを実行し、同時にハイブリッドアルゴリズムを実行することができる。

モニタリングと管理

リアルタイムモニタリングツールは、量子コンピュータの健全性とパフォーマンスを監視するために不可欠だ。これらのツールは、HPCセンターの既存のモニタリング・ソリューションとシームレスに統合する必要がある。これらのツールは、リソースの使用率、エラー率、その他の重要業績評価指標（KPI）に関する洞察を提供する必要がある。

量子コンピュータ環境でよく使用されるKPIには、以下のようなものがある：

実行時間：量子アルゴリズムが完了するまでの実行時間は重要なKPIである。従来のアルゴリズムと比較することで、量子計算の効率性を測ることができる。
ジョブの成功率：量子ジョブの中には失敗するものもあり、その失敗を追跡し、ユーザーに通知し、必要であれば自動的にジョブを再開することが重要だ。量子システムは、自動または手動で頻繁なキャリブレーションを必要とすることが多く、成功率を監視することで、キャリブレーションのタイミングを判断することができる。
キュー時間：HPC環境では、ジョブが実行される前にキューで待たされることがよくある。量子ジョブに特化したキュー時間のモニタリングは、リソース割り当て戦略の最適化に役立つ。
リソース利用：従来のコンピューティングと同様に、計算リソースの利用状況を把握することが重要。
システム稼働時間： HPC環境では、計画外の停止がない連続稼働が重要な要件となっている。システムの稼働時間メトリクスは、HPCエコシステムの中で量子コンピュータの信頼性を評価するのに効果的だ。
ユーザー・エンゲージメント・メトリクス：量子コンピュータがどのような目的で、どのような頻度で利用されているかを把握することで、将来のリソース計画やシステム改善のための貴重な情報を得ることができる。

経験豊富なHPCマネージャーは、センターがこのデータを収集し所有するだけでなく、この生データを実用的な洞察に変換するための適切な分析ツールを採用していることを保証する。

結論

結局のところ、量子コンピュータをHPCに対応させるための旅は、技術的な探求にとどまらず、計算科学の境界を再定義する可能性を秘めた変革的な取り組みなのである。この新時代の入り口に立っている今、HPC対応へのロードマップは、単なるガイドとしてではなく、イノベーションの協調精神の証として機能している。量子科学者、HPC専門家、ソフトウェア開発者がそれぞれの専門知識を結集し、計算可能性のフロンティアを押し広げるための行動への呼びかけである。量子コンピューティングの未開拓の可能性を実世界のアプリケーションに解き放つことは、大きな賭けである。

トップ画像： QuEra社の中性原子ベースの量子コンピューティング・プラットフォーム

順位	機関名	システム名	ピーク性能(TFLOPS)
1	理化学研究所	富岳	537,212
2	産業技術総合研究所	ABCI 3.0	181,490
3	ソフトバンク株式会社	CHIE-4	151,880
4	ソフトバンク株式会社	CHIE-3	138,320
5	ソフトバンク株式会社	CHIE-2	138,320
6	産業技術総合研究所	ABCI-Q	99,350
7	最先端共同HPC基盤施設	Miyabi-G	72,800
8	FPTジャパンホールディングス	FPT AI Factory	67,440
9	東京科学大学	TSUBAME 4.0	61,600
10	さくらインターネット	SAKURAONE	47,790

すべての国内スパコンリストはこちらから。

西克也
西克也はフェアチャイルド社、クレイ・リサーチ社、ベストシステムズ社など、30年以上に渡ってHPCに関する仕事に従事している。Hpcwire Japanの編集長として記事の作成と翻訳を行っている。

島田佳代子
1999年～2007年まで英国在住。2001年よりスポーツ、旅、ビジネス、映画など幅広いジャンルで執筆活動を開始し、Hpcwire Japanでは主に日本のHPC業界が世界に誇る研究者、開発者の方々のインタビューを担当。

小柳義夫
小柳義夫氏は40年以上に亘ってHPCに携わってきた研究者であり、日本のHPC業界における生き字引として有名。現在　高度情報科学技術研究機構に所属し、産業界のHPC推進にあたっている。

小西史一
小西史一は、理化学研究所、東京工業大学においてHPCおよびバイオインフォマティクスに関する研究と教育に携わってきた研究者。2012年からフォトグラファーとしての活動を開始し、現在はIT技術・セキュリティのコンサルティング業務に携わっている。

eNewsletter

検索

PLUTNUM

GOLD

SILVER

HPCの歩み50年記事一覧

スパコンリスト日本

記事寄稿について