このシステムは、96台のNVIDIA DGX-2HスーパーコンピュータとMellanoxのインターコネクトテクノロジによって、わずか3週間で作り上げられた。9.4PFLOPSの演算性能を持つDGX SuperPODは、安全な自動運転車に必要な、膨大な数のディープニューラルネットワークのトレーニングを行える性能を備えている。
顧客は、NVIDIAのDGX SuperPODの設計に基づいたこのシステムの全部または一部をDGX-2パートナーから購入することができる。
自動運転車のAIトレーニングには、膨大な数値計算という根本的な課題がある。
1台のデータ収集車が生成するデータ量は、1時間あたり1TB(テラバイト)にも及ぶ。データ収集車の車隊全体が走行する年数にそのデータ量を掛けると、データはすぐにPB(ペタバイト)の単位に到達する。そのデータは、路上でのルールに基づいてアルゴリズムのトレーニングを行うために、ならびに車内で作動しているディープニューラルネットワークの潜在的な問題点を見つけ、継続的なループで再トレーニングを行うために使用される。
NVIDIAのAIインフラストラクチャ担当バイスプレジデントのクレメント・ファラベット氏 (Clement Farabet)は、次のように述べている。「AIでリーダーシップをとるには、演算インフラストラクチャでのリーダーシップが必要だ。AIの課題でもっとも困難なものの1つは自律走行車のトレーニングで、徹底的な正確さを追求するためには、ニューラルネットワークを数万回も再トレーニングする必要がある。それには、DGX SuperPODの圧倒的な処理能力が欠かせないのだ」
1,536のNVIDIA V100 TensorコアGPUがNVIDIAのNVSwitchおよびMellanoxのネットワークファブリックに相互接続されているDGX SuperPODは、スーパーコンピュータらしい比類なき性能でデータを処理する。
このシステムは休みなく処理を行い、自律走行車用ソフトウェアの最適化ならびにニューラルネットワークの再トレーニングをこれまでよりはるかに早いターンアラウンドタイムで行う。
たとえば、DGX SuperPODのハードウェアおよびソフトウェアのプラットフォームは、ResNet-50のトレーニングを2分未満で行う。2015年にこのAIモデルが登場したとき、当時最先端のシステムであった、単体のNVIDIA K80 GPUを使用した場合のトレーニングの所要時間は25日だった。DGX SuperPODにより、そのトレーニングが18,000倍早くなるのだ。
同様のレベルの性能を持つ、他のTOP500システムが数千のサーバーにて構築されているのに対して、DGX SuperPODの専有面積はわずかであり、同じランクのものよりおよそ400倍小さくなっている。
さらに、NVIDIA DGXシステムは、それぞれに膨大な演算を必要とするBMWやContinental、Ford、Zenuityといった自動車会社から、FacebookやMicrosoft、富士フイルムといった巨大企業、理化学研究所やアメリカ合衆国エネルギー省傘下の国立研究所といった学界のリーダー組織に至るところですでに導入されている。
DGX SuperPODは、ディープラーニングモデルを超高速で実行できるだけではない。モジュラー形式の、エンタープライズグレードの設計により、デプロイも驚くほど迅速にできるのだ。
この規模のシステムでは、デプロイまで6か月から9か月かかることもよくあるが、DGX SuperPODの場合は、エンジニアが所定の、検証済みのアプローチをとることで、わずか3週間でデプロイされた。
DGX SuperPODのようなスーパーコンピュータの構築により、NVIDIAでは、大規模なAIマシンのためにシステムを設計する方法を学ぶこともできた。これはスーパーコンピュータのテクノロジに重要な発展をもたらし、学界や輸送企業、ならびに自社のイニシアチブを加速させるハイパフォーマンスコンピューティングを必要とする、その他の業界に膨大な便益を提供するのだ。
AI対応のデータセンターを持っていないものの、NVIDIA SuperPODアーキテクチャを使ってニーズに対処したいと考える組織に対しては、NVIDIAは、DGX-Ready データセンタープログラムを通じての、簡略で、迅速なデプロイメントを提案している。
企業のデータセンターコロケーションサービスプロバイダーの場合は、DGXシステムを活用して、エンタープライズの顧客がワールドクラスのAIデータセンターを構築およびデプロイするのを支援することができる。
世界最速スーパーコンピュータのTOP500に入っている、NVIDIAが自社のみで開発したシステムはDGX SuperPODだけではない。
NVIDIAのSATURNVシステムがその最初となるもので、公開された2016年にGreen500リストのトップになり、世界で最もエネルギー効率に優れたシステムだと認知され、TOP500では28位となった。
それ以降、SATURNV Volta(NVIDIA DGX-1システムを実装)およびDGX-2H PODも、圧倒的な性能レベルと効率的な電力消費で高い評価を受けている。
NVIDIAのGPUを活用したデバイスは、最新のGreen500の上位25のスーパーコンピュータのうちの22のスーパーコンピュータに搭載されている。