12月 9, 2020

AWS、新しいP4 A100インスタンスで4,000GPUのUltraClustersを実現

HPCwire Japan

Tiffany Trader

Amazon Web Servicesがこの技術を採用した最新のパブリッククラウドベンダーとなったことで、NvidiaのA100 GPUがクラウドに導入されている。A100 GPUはAWSの新製品であるPシリーズインスタンスに採用され、4,000以上のGPUを搭載したEC2「UltraClusters」を構成するために利用することができる。


	Nvidiaの8-GPUHGXA100「ベースボード」はP4dインスタンスを支えている

本日発表されたAWSの新しいP4dインスタンスは、NVLinkで接続された8つのA100 “Ampere “GPUと48個のIntel Cascade Lakeプロセッサコア（96個のvCPU）によって構成されている。AWSによると、新しいインスタンスは400Gbpsのネットワークを持つ初めてのもので、Elastic Fabric Adapter（EFA）とNvidia GPUDirect RDMA（リモートダイレクトメモリアクセス）を活用しているという。

各8-GPUインスタンスは、最大2.5ペタフロップスの16ビット・Tensor性能（従来の64ビットでは77.6テラフロップス）と320GBの高帯域幅GPUメモリを提供し、1.1テラバイトのインスタンスメモリと8テラバイトのNVMEベースのローカルSSDストレージ（1秒間に最大16ギガバイトの読み取りスループットを実現可能）を提供する。

AWSによると、P4dは、前世代のv100ベースのP3インスタンスと比較して、ディープラーニング性能が2.5倍、倍精度浮動小数点性能が2倍、メモリが2.5倍、ネットワーク帯域幅が16倍、ローカルのNVMeベースのSSDストレージが4倍となり、最大60％のコスト削減を実現しているという。

400Gpbsのネットワークは、専用のペタビット・スケールのノンブロッキング・ネットワークファブリックを介して4つの100Gbpsのネットワーク接続で提供され、EFA経由でアクセスできるという。AWSのチーフエバンジェリストであるJeff Barは、このソリューションは、最大80,000 IOPSで19GbpsのEBSバースト帯域幅をサポートしており、P4インスタンスのためにカスタム設計されたものであると説明している。

提供：AWS

Nvidia GPUDirect RDMA技術を採用したElastic Fabric Adapterは、CPUをバイパスしたインスタンス間のハイスループットかつ低レイテンシのGPU間通信を可能にし、MLトレーニングやHPCアプリケーションの分散ワークロードをスケールアウトすることができるとAWSは述べている。

P4dインスタンスは、「4,000以上」のGPUにスケールできるEC2 UltraClustersを構成し、S3やAmazon FSx for Lustre、AWS ParallelClusterなどのAWSサービスに接続することが可能だ。

「これらのクラスタは、自然言語処理、物体検出と分類、シーン理解、地震分析、天気予報、財務モデリングなど、最も過酷なスーパーコンピュータ規模の機械学習とHPCのワークロードにも対応できます」とBarrはブログ記事で述べている。

利用事例は医療から自動車、高度な分析まで多岐にわたっており、GE Healthcare、Toyota Research Institute, Inc.（TRI）、OmniSci、Zenotech Ltd.などの顧客リストに反映されている。

「TRIでは、誰もが自由に動けるような未来の構築に取り組んでいます」と、TRIのインフラストラクチャ・エンジニアリング担当テクニカル・リード、Mike Garrisonは述べている。「前世代のP3インスタンスは、機械学習モデルのトレーニングに要する時間を数日から数時間に短縮してくれましたが、GPUメモリの追加とより効率的な浮動小数点演算フォーマットにより、機械学習チームはより複雑なモデルをより高速にトレーニングできるようになるため、P4dインスタンスの活用を楽しみにしています。」

新しいP4インスタンスは現在、p4d.24xlargeの1サイズで提供されている。

インスタンスは、米国東部（バージニア州北部）および米国西部（オレゴン）のリージョン内でアクセスでき、オンデマンド、スポットインスタンス、リザーブ・インスタンス、専用ホスト、またはAWSの節約プランを利用して購入することが可能だ。

オンデマンドの価格は1時間あたり32.77ドルからとなり、3年契約のリザーブ・インスタンスでは1時間あたり11.57ドルまで下がる。

P4のデビューは、Nvidia Tesla M2050 “Fermi” GPGPUを皮切りに、AWSがGPUを搭載したインスタンスを10年間提供してきたことを示すものである。GPUがデータセンターの要求の厳しいワークロードにユビキタスなものになってきたため、新たに提供されることは少なくなってきている。Barrが詳述しているように、「第1世代のCluster GPUインスタンスは2010年後半に発売され、その後、G2（2013年）、P2（2016年）、P3（2017年）、G3（2017年）、P3dn（2018年）、G4（2019年）のインスタンスが続いています。」

AWSは、NvidiaのA100「Ampere」GPUを採用した最新の大手パブリッククラウドベンダーだ。Google CloudはA100 GPUをベースにしたA2ファミリーを7月に発表しており、Ampereの登場から2ヶ月も経っていない。Microsoft Azureは8月にA100を搭載したNDv4インスタンスをプレビューモードで発表した。翌月、Oracle Cloudは、そのベアメタルのA100を燃料とするインスタンスであるGPU4.8の一般提供を発表した。

順位	機関名	システム名	ピーク性能(TFLOPS)
1	理化学研究所	富岳	537,212
2	東京工業大学	TSUBAME 4.0	59,400
3	産業技術総合研究所	ABCI 2.0	54,341
4	東京大学	Wisteria/BDEC-01	25,952
5	東北大学	AOBA-S	19,818
6	宇宙航空研究開発機構	TOKI-SORA	19,464
7	気象庁	PRIMEHPC FX1000	15,571
8	気象庁	PRIMEHPC FX1000	15,571
9	海洋研究開発機構	地球シミュレータ	13,448
10	匿名	Apollo 6500	9,669

すべての国内スパコンリストはこちらから。

西克也
西克也はフェアチャイルド社、クレイ・リサーチ社、ベストシステムズ社など、30年以上に渡ってHPCに関する仕事に従事している。Hpcwire Japanの編集長として記事の作成と翻訳を行っている。

島田佳代子
1999年～2007年まで英国在住。2001年よりスポーツ、旅、ビジネス、映画など幅広いジャンルで執筆活動を開始し、Hpcwire Japanでは主に日本のHPC業界が世界に誇る研究者、開発者の方々のインタビューを担当。

小柳義夫
小柳義夫氏は40年以上に亘ってHPCに携わってきた研究者であり、日本のHPC業界における生き字引として有名。現在　高度情報科学技術研究機構に所属し、産業界のHPC推進にあたっている。

小西史一
小西史一は、理化学研究所、東京工業大学においてHPCおよびバイオインフォマティクスに関する研究と教育に携わってきた研究者。2012年からフォトグラファーとしての活動を開始し、現在はIT技術・セキュリティのコンサルティング業務に携わっている。

eNewsletter

検索

PLUTNUM

GOLD

SILVER

HPCの歩み50年記事一覧

スパコンリスト日本

記事寄稿について

AWS、新しいP4 A100インスタンスで4,000GPUのUltraClustersを実現

調達情報

ニュース記事

お知らせ

特別イベント

SCA/HPCAsia 2026

技術資料ダウンロードサービス

スパコン調達手続き中

国内スパコン上位10システム(TOP500順)

近日開催国内イベント

CBI学会2025年大会

【東京大学】第257回お試しアカウント付き並列プログラミング講習会「指示文とMPIによるマルチGPUプログラミング入門」

Co-Processingによる可視化セミナーとKombyne利用者講習会「計算と可視化の融合で加速するHPC後処理」

【理研】第35回「富岳」利用セミナー入門編

International Symposium on Computing and Networking (CANDAR 2025)

オープンCAEシンポジウム2025

【東京大学】第258回お試しアカウント付き並列プログラミング講習会「OpenMPで並列化されたC++プログラムのGPU移植手法」

第202回ハイパフォーマンスコンピューティング研究発表会

Gfarmワークショップ2025

【東京大学】第259回お試しアカウント付き並列プログラミング講習会「CPUやGPUを用いたOpenFOAMの実行・プロファイリング・線形ソルバ性能比較」

寄稿者

HPCwire Japan

E-Marketings, Inc.

PLUTNUM

GOLD

SILVER

HPCの歩み50年記事一覧

スパコンリスト日本

記事寄稿について

AWS、新しいP4 A100インスタンスで4,000GPUのUltraClustersを実現

調達情報

ニュース記事

ホットな話題

お知らせ

特別イベント

技術資料ダウンロードサービス

スパコン調達手続き中

国内スパコン上位10システム(TOP500順)

近日開催国内イベント

寄稿者

HPCwire Japan

E-Marketings, Inc.