<NEC SX-9>
10月25日にNECのSX-9が発表され、スパコン業界も、1ペタフロップ級の登場が相次いでいる。 2008年へ向けてスタートラインにた立ったのは、NEC SX-9、 SUN Constellation、Cray Baker、IBM Blue Gene/P、などである。 SUNのConstalletionは、テキサス大TACCにRangerとして0.5Pflops機を構築中で、最大1.7Pflopsまで拡張可能であり、CrayのBakerは8月に$65Mでテネシー大に設置が決まった1Pflops機である。
NECのSX-9は、1チップで102.4GflopsのVector CPUを使い、Max512ノードで0.839Pflopsのスパコンで、2008年3月から出荷とされている。チップは65nmのプロダクション・ルールを使用している。
SX-8/8Rからの変更は、CPUに関してはクロックを2.2GHZから3.2GHZに引き上げ、パイプラインを増やすことで、CPU性能を35.2Gflopsから102.4Gflopsへ約3倍の増強をはかり、さらにラックにおいてもCPU数を8から16に増やすことで、ラック当たりの性能を1.6Tflopsに強化した。
消費電力はノード/ラック当たり30KWとなっているので、Tflops当たり18.3KWであり、512ノードでは15.4MWということになる。この消費電力にはクロスバーやファイル・サーバー、空調などが含まれていないが、それでも地球シミュレータの2.5倍である。
設置面積は保守エリア込みでノード当たり4.9平米と報道されているので、Tflops当たり3.0平米である。512ノードでは2500平米であり、クロスバーやファイルサーバーなどを入れると地球シミュレータと同様な床面積が必要になってしまうものと思える。
価格は最小構成の4CPUで、リース月額284万円(税抜き)と発表されており、4年償却を仮定すると推定買取額は約1億4千万円程度と考えられている。単純比例で推定すると16CPUノードは5億6千万円で、Tflops単価は3億3千万円ということになる。この単純比例で推定すると、地球シミュレータと同性能のシステムは133億円であり、最大の839Tflops機は2790億円ということになる。これらの推定価格は、単純比例のため、いささか信じ難い値であるので、半値、あるいは3分の1としても、依然として、極めて高額であることに変わりはない。(事後追加参照)
TACCのRanger(Opteron-Quad core)は82ラック、504Tflopsで消費電力は2.4MW、空調に1MWといわれており、調達価格はNSFからの総額$59Mで、その内のHWは$30M(約35億円、Y$117))とされている。ラック当たりの性能は6.14Tflops、29KWであり、設置面積は、SXとの比較のため保守エリアを加えても、およそ0.8平米である。Tflops当たりに換算すると、消費電力は4.7KW、設置面積は0.13平米、価格は約700万円である。
従って、SX-9はRangerに比べ、Tflops当たりの比較では、消費電力は約4倍、設置面積は約23倍、価格は単純比例推定で約48倍ということになる。
これらは、グリーン度からも、平面占有度からも、10年以上前のバプル時代の設計感覚であり、現在のエコ思想からは考えられないアナクロであろう。TCO(Total Cost of Ownership)の観点から、よほどの事情がない限り、SXの選択は難しいのではないだろうか。
実行性能に関しては、基本はHPCCベンチマークであり、文科省の次世代スパコンもこのベンチマークを評価項目としており、SX-9もこのベンチマークを実行し、データを公表すべきで、これにより公平な性能比較を行うことができるようになる。HPL、FFT、Random Access、Streamのデータは大変参考になる。
実際、SX-8(Stuttgart-576CPU)とOpteron-Dualコアのスカラー機であるRed StormのHPCCのFFTのデータでは、絶対性能的にはRed Stormが圧倒的に速く、Peakに対する比率においても、大きな違いは存在しない。
SX-9発表時のNECの主張では、SX-9はスカラー機に比べ、気象予測計算では3-4倍、物性計算では3-7倍の性能を示すとしている。この比較に使用したスカラー機の詳細やプログラムの最適化の状況などが不明で、疑問の多い主張であるが、とりあえず、この主張を受け入れたとしても、スカラー機としてRangerを例に取れば、ラック当たりの理論性能はSX-9の4倍近くあるので、SXの1ラックに対しRangerの2ラックを対応させれば、SXの実行性能以上の性能を確保出来ると考えられる。価格的には2ラックでもSXの1ラックより十分安価であり、消費電力、設置面積も小さくて済む。つまり、設置面積、消費電力、価格的にいうと、NECの主張を受け入れたとしても、SXが速いということは無いといえる。
従って、SXを導入するメリットは性能ではなく、SX用の既存のアプリケーションをそのまま作動できるといったようなこと以外、明確な理由付けは存在しないように思えるのである。
気象予測計算や物性計算に関しては、現在、米国ではスカラー機ベースの各種プログラムを研究開発中で、テキサス大のRangerやANLのBG/Pなども気象予測のWRF関連の開発を主要用途に上げており、アプリケーションのスカラー化は進んでいる。ベクター機に固執しすぎると世界の潮流から孤立してしまい、パソコンのPC-9800の二の舞になりかねない。
DOEのNERSCはスパコンの持続性能測定の目安として、気象(CAM3?NCAR)、計算化学(CAMESSーIOWA State)、核融合(GTC-PPPL)、天文(MADbench?LBNL)、QCD(MILC-Multi site Collaboration)、物性(PARTEC-LBNL/UCB)、生命科学(PMEMD-UNC-Chaple Hill)の7つのアプリケーションで構成されるベンチマークを作成している。SX-9もこうした全方位的で広範なベンチマークによる偏りの無い持続性能のデータを提供すべきであろう。
NECは2-3年後にSX-10を発表予定との報道がある。45nmを採用するとし、クロックを6GHZに倍増、パイプラインも倍増、ないしは、2コアとし、さらに1ラック32CPUと倍増しても、性能増加は8倍であり、相変わらず512ラックの非グリーンのバブル設計を採用しても、6.7Pflops程度になるに過ぎず、次世代スパコンの10Pflopsには届かないことも指摘しておく。
余談ではあるが、テキサス大TACCのRangerとテネシー大のCryaのBakerは、ともにNSFのCyberinfraプログラムのTrack2という1Pfops未満のスパコンに対するFundingであり、持続性能1Pflops超のTrack1では、$208Mでイリノイ大が提案したIBM-Blue WaterがFundingを受けている。
1Pflops超のプランとしては、NSF以外にはDARPAのHPCプログラムがあり、IBM-PERCSとCrayーCascadeがFundingを受けている。イリノイ大のBlue WaterはPower7を使用したPERCSと同じと考えられており、またテネシー大のBakerは、Cascadeのスカラー系の前段階のスパコンといわれているものである。CrayのロードマップではBakeの次にはMarbleという持続1Pflops機が置かれており、HPCwireによれば、テネシー大はこの持続1Pflops機をNSFのTack1に申請したがBlue Waterに破れ却下されてしまったとされている。まずはBakerを完成してからということであろう。
スパコンの調達価格に関しては、米国では、テキサス大TACCのRanger、テネシー大のCray Baker、DOEのTri-LABのAPPRO Xtreme-Xなど、Opteron系のTflops単価は700万円前後が多くなっている。日本に於てこの価格がそのまま適用されるかどうかはわからない。しかし、税金での調達に当たっては公務員は知恵を働かせるべきである。たとえば、スパコンの共同調達組織を立ち上げるとかして、量を確保し、量を背景に、米国での価格報道を出来る限り多く示し、タフな交渉を行い、米国価格に近づけるべきであることも指摘しておきたい。
なお、筆者の誤解、思い違い、転記ミス、計算違い、あるいは不適切な表現等がございましたら、ぜひ、コメント欄にてご指摘いただけますと幸いです。
===============================
事後追加
===============================
2007年12月公示の東北大のSX-9(26.2Tflops)の月額リース料は期間5年で10,248万円となっており、Tflops単価は月額リース料で391万円ということになります。したがって、SX-9のTflops当りの買取推定額は2億円前後と思えます。
ご承知のように、一般的にリース料金には本体価格のほか金利、固定資産税、保険,手数料等々が含まれますので、リース料金総額は、本体価格より高くなっていると考えられます。したがって、本体価格を推定するには、その分を割り引く必要があります。
また、公示される価格は、メモリやファイルサーバー、ログオン・サーバーなどシステムに必要なものをすべて含んだ価格ですので、ここでいうTflops単価はそれらを含んだ価格です。
※このエントリは CNET Japan ブロガーにより投稿されたものです。シーネットネットワークスジャパン および CNET Japan 編集部の見解・意向を示すものではありません。
アナリストが語る、サイトのユーザーエクスペリエンスを向上させる10個のカギ
原宿で野宿を含む15時間 - iPhone行列完全ドキュメント
「失われた10年」からの回復は、どういう課題を残したか?
Joomla CMSをカスタマイズするには・・・テンプレートが第一優先
最適なマウスの移動速度は?
パブリックコメントは国民に知られていなかった( 2 )
Google ツールバーの PageRank、数日以内に更新予定
Google Lively試してみました(クリボウの部屋へ行く)。
iPhoneの影で馬鹿売れしているみたい
動画配信の影響なのかインターネット部門が「終了」
Googleというネットの巨大なメディアに支配される脅威みんなのお題では、ブロガー同士で質問を出し合いそれに対する回答や意見を集めています。今日はどんな話題が盛り上がっているでしょう?
DELLが掲げる「新・仮想化アセスメントサービス」CNET Japan ブログネットワークは、元はCNET Japanの一読者であった読者ブロガーと、編集部の依頼により執筆されているアルファブロガーたちが、ブログを通じてオンタイムに批評や意見を発信する場である「オピニオンプレイス」、また、オピニオンを交換するブロガーたちが集うソサエティです。
広い視野と鋭い目を持ったブロガーたちが、今日のIT業界や製品に対するビジョンや見解について日々熱く語っています。
CNET Japanやその他サイトが提供するITニュースやコンテンツへの意見や分析、 ビジネスやテクノロジーに対するビジョンや見解について語っていただける方を 募集しています。ご応募はこちらから
ブログの投稿はこちらから(※ブロガー専用)
今年最も活躍したブロガーを表彰します。詳細はこちらから
これは、CNET Japan 編集部の依頼に基づいて執筆されているCNET Japan アルファブロガーによるブログの印です。
CNET Japan ブログネットワーク内で拍手の代わりに使用する機能です。ブログを読んで、感激した・役に立ったなど、うれしいと思ったときにクリックしてください。多くGood!を獲得した記事は、より多くの人に読まれるように表示されます。
[レビュー]高い信頼性を普通に使う地球に優しい電源ユニット--Antec EarthWattsシリーズ EA-650
オンリーワンの個性を極めた超薄型テレビ--日立 Wooo UTシリーズ
[レビュー]“この手があったか”と思わせるパワーユーザーも納得のPCオンデマンド--「VALUESTAR G タイプR Luiモデル」+「Lui RN」詳細レビュー
今週の新製品総チェック:ドコモ、au夏モデルが続々店頭へ、ビデオカメラは新機種ラッシュ
[レビュー]テレビを持ち歩ける最強ツール--ソニー、Blu-rayレコーダー「BDZ-A70」
[レビュー]ネットワーク対応の高機能デジタルフォトフレーム--ソニー「Canvas Online CP1」
15時間の行列で手に入れたiPhone 3Gファーストインプレッション--ソフトバンクモバイル「iPhone 3G」
北京を見逃すな!--2008年夏、今買うべき「薄型テレビ」
[レビュー]通勤鞄に忍ばせたい軽さと装着感--マクセルのノイキャンヘッドホン「HP-NC15」
SX-10は、6.7Pflops程度になるに過ぎずとありますが、おそらく間違っていると思われます。
通常であれば、強化モデルを発表してその1年後に新型を発表するのでもう少しSX-10の能力は高いと思われます。ただし誰も最大構成を買う人はいませんが・・・。
(誤)テネシー大のCryaのBakerは
(正) テネシー大のCrayのBakerは