logo

NVIDIA Tesla P100、HPCアプリケーションのパフォーマンスを30倍以上に

NVIDIA 2016年06月20日 16時54分
From PR TIMES

Pascalアーキテクチャを採用したTesla P100がデータセンターのスループットを大幅に向上



[画像: リンク ]


ドイツ・フランクフルト―ISC16―(2016年6月20日)― NVIDIA(本社:米国カリフォルニア州サンタクララ、社長兼CEO:ジェンスン・フアン(Jen-Hsun Huang)、Nasdaq:NVDA)は本日、現代のデータセンターに対するかつてない計算処理上の需要に応えるため、PCIeサーバ対応NVIDIA(R) Tesla(R) P100 GPUアクセラレータを発表しました。このアクセラレータは、CPUベースのシステムに比べてパフォーマンスと効率の大幅な向上をもたらします。

スーパーコンピューティング・サイクルに対する需要がかつてないほど高まっています。アメリカ国立科学財団のデータによると、科学者の大半が自身の研究を行うのに十分な時間を、スーパーコンピューティング・システムに確保することができません。(1) また、計算処理上の要求が高いディープラーニング・アプリケーションの処理速度を高めるため、高性能コンピューティング(HPC)テクノロジがますます必要とされる一方で、研究者は従来の科学分野の発展を促進するため、AI技術の応用を進めています。

PCIe対応Tesla P100 GPUアクセラレータは、NVIDIA Pascal™ GPUアーキテクチャの比類なきパフォーマンスと効率により、こうした計算処理上の需要に対応できます。CPUベースの汎用ノード32台分を超えるスループットを提供し、資本コストと運用コストを最大70%削減できる「スーパー・ノード」の実現を可能にします。(2)

NVIDIAのアクセラレーテッド・コンピューティング担当バイス・プレジデントであるイアン・バック(Ian Buck)は、次のように述べています。「HPCやAIによるスーパーコンピューティングに対する研究者の限りない需要に対応するうえで、進むべき唯一の道がアクセラレーテッド・コンピューティングです。このような需要への対応においてCPUのみのシステムを展開すると、大量の汎用計算ノードが必要になるため、コストが大幅に増加するわりに、それに見合ったパフォーマンスが得られないということになるでしょう。一方、より台数が少なく、より優れたTesla P100採用ノードによって劇的にパフォーマンスを高めることで、高額なインフラ・コストの代わりにコンピューティングへの投資を増やすことができます」

PCIe対応Tesla P100は、標準のPCIeフォーム・ファクタで提供され、現在のGPUアクセラレーテッド・サーバと互換性があります。計算処理上の要求が最も高いAIやHPCデータセンター・アプリケーションの処理速度を高めるために最適化されています。1台のTesla P100搭載サーバは、AMBER分子動力学コードの実行時にCPUのみのサーバ・ノード50台分よりも優れたパフォーマンスを実現し(3)、VASP材料科学アプリケーションの実行時にCPUのみのサーバ・ノード32台分よりも高速です(4)。

PCIe対応Tesla P100アクセラレータは、年内に、スイスのルガーノにあるスイス国立スーパーコンピューティング・センターの欧州最速スーパーコンピュータPiz Daintシステムのアップグレード・バージョンに採用される予定です。

チューリッヒ工科大学計算物理学教授兼スイス国立スーパーコンピューティング・センターのディレクタであるトーマス・シュルテス(Thomas Schulthess)氏は、次のように述べています。「Tesla P100アクセラレータは、現代の最も重要な計算処理上の課題のいくつかに対処する、新たなレベルのパフォーマンスと効率性をもたらします。Piz Daintの4,500台のGPUアクセラレーテッド・ノードをTesla P100 GPUにアップグレードすることで、システムのパフォーマンスが2倍以上になることが期待されています。その結果、研究者は、宇宙論、材料科学、地震学、気候学など、幅広い分野で大きな成果を達成できるようになるでしょう。」

PCIe対応Tesla P100は、NVIDIA Teslaアクセラレーテッド・コンピューティング・プラットフォームに新たに加わりました。主な機能は以下のとおりです。

●  さまざまなHPCワークロードに対応する比類なきアプリケーション・パフォーマンス — それぞれ4.7テラフロップスと9.3テラフロップスの倍精度および単精度ピーク・パフォーマンスを実現する、1台のPascalベースのTesla P100ノードが、CPUのみの汎用サーバ32台分以上と同等のパフォーマンスをもたらします。
● HBM2搭載CoWoSがもたらす前例のない効率 — Tesla P100は、プロセッサとデータを単一のパッケージに統合することで、前例のない計算効率を実現します。メモリ設計への革新的アプローチであるHBM2を搭載したCoWoS(Chip on Wafer on Substrate)により、NVIDIA Maxwell™アーキテクチャに比べ、3倍のメモリ帯域幅のパフォーマンス(720GB/秒)を達成できます。
● ページ移送エンジンによる並列プログラミングの簡素化 — 開発者は、データの動きを管理することに気をとられず、パフォーマンスの向上に向けたチューニングに集中できます。また、仮想メモリ・ページングのサポートにより、GPU物理メモリ・サイズを超えてアプリケーションを拡張できるようになります。さらに、統合メモリ・テクノロジによって、ノード全体に対して1つのメモリ領域を確認するだけでよくなり、大幅に生産性が高まります。
● 他に例を見ないアプリケーション・サポート — 410のGPUアクセラレーテッド・アプリケーション(トップ10のHPCアプリケーションのうち9つを含む)で利用されるTeslaプラットフォームは、世界をリードするHPCコンピューティング・プラットフォームです。

PCIe対応Tesla P100の仕様

● NVIDIA GPU BOOST™テクノロジによる4.7テラフロップスの倍精度パフォーマンス、9.3テラフロップスの単精度パフォーマンス、18.7テラフロップスの半精度パフォーマンス
● PCIe Gen 3インターコネクトのサポート(32GB/秒の双方向帯域幅)
● ページ移送エンジンと統合メモリによって強化されたプログラマビリティ
● ECC保護による信頼性の向上
● データセンターの最高のスループットと信頼性を実現するためのサーバ最適化
● 2つの構成オプション:
    o 16 GBのCoWoS HBM2スタックド・メモリで720 GB/秒のメモリ帯域幅を実現
    o 12 GBのCoWoS HBM2スタックド・メモリで540 GB/秒のメモリ帯域幅を実現

提供開始
PCIeベース・システム用NVIDIA Tesla P100 GPUアクセラレータの提供は、2016年第4四半期に開始する予定です。販売は、NVIDIAのリセラー・パートナーおよびサーバ・メーカ各社(Cray、Dell、Hewlett Packard Enterprise、IBM、SGIなど)を通じて行います。

(1) 情報源: リンク
(2) CPU サーバ:Dual socket Intel E5-2680v3 12コア、128 GB DDR4毎ノード、 FDR IB / GPUサーバ: 8x Tesla P100 for PCIe with Dual Socket Intel E5-2680v3
(3) SDSU Cometスーパーコンピュータにおけるシミュレーション
(4) VASP 5.4.1_05Feb16, Si-Huge データセット. 16, 32 ノードは、4-8ノードと同じスケールにより推定しています。

NVIDIAについての最新情報:
・公式ブログNVIDIA blog、Facebook、Google+、Twitter、LinkedIn、Instagram、NVIDIAに関する動画YouTube、 画像Flickr。

NVIDIAについて
1993年以来、NVIDIA(NASDAQ: NVDA)は、ビジュアル・コンピューティングという芸術的な科学の世界をリードしてきました。ゲーミング、自動車、データセンターおよびプロフェショナル・ビジュアリゼーションの分野で特化したプラットフォームを提供し続けています。NVIDIAの製品は仮想現実、人工知能、自律走行車の開発においても最新の技術を提供しています。詳しい情報は、リンクをご覧ください。

プレスリリース提供:PR TIMES リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

今日の主要記事