<1テラフロップス・700万円のスパコン>
2007年10月2日のHPCwireが伝えるところでは、米エネルギー省の核安全保障局(NNSA)のリヴァモア、ロスアラモス、サンディアの3研究所は、シリコンバレーのMilpitasにあるスパコン・メーカー・APPRO社に$26M(30.4億円.・Yen$117)で合計性能438テラフロップのスパコンを発注した。
このスパコンはOpteron Quad CoreベースのAPPRO Xtreme-Xというスパコンで、21のSU(スケーラブル・ユニット)からなり、8つのクラスターに分けられ各研究所に数クラスターづつ納入される。時期は2007年末から2008年始めにかけてである。
12,096CPU-Chip/48,384Coreを1node4chipの3,024nodeで構成し、メモリは合計で96.8TB、32GB/nodeである。InterconnectはInfiniband20Gb/sでVoltairのGrid directorとMellanoxのAdapterで構成されるとなっている。
この発注はTLCC07(Tri-Lab Linux Capacity Cluster 2007)というプログラムによるもので、入札は2007年4月頃から非公式に公表されており、6月16日に正式入札仕様が告示され、8月3日が締め切りというハードなスケジュールで行われた。オプションとしてさらに、10SU、200テラフロップスの追加発注を$15.8M(18.5億円)で行う契約が含まれている。
これは3研究所の旧型システム群を高性能新型システムで置き換えることにより維持運用経費などのTCO(Total Cost of Ownership)の改善をはかり、同時に3研究所の計算容量(Capacity)を確保するためのシステムの機種統一を図ることを目指し、3研究所が一括発注したもので、価格性能比を重視したシステム選択であった。
http://www.hpcwire.com/hpc/1812897.html
http://www.hpcwire.com/hpc/1817328.html
http://www.eweek.com/article2/0,1895,2192303,00.asp
参考までに最近の注目すべきスパコン調達のテラフロップス単価を以下に示す。
◎TLCC07 (Xtreme-x、Opteron 4core、2.26GHZz?) 9/2007
主契約 438TF $26M 30.4億円 694万円/TF
オプション 200TF $15.8M 18.5億円 925万円/TF
◎TACC Ranger (Opteron 4core 2.0GHZ) 11/2006
504TF $30M 35.1億円 696万円/TF
◎Blue Gene/P (PPC450 0.85GHZ) 6/2007
13.9TF $1.3M 1.5億円 1,079万円/TF
◎PNNL (Opteron 4Core 2.2GHZ) 9/2007
(Pacific Northwest National Lab.)
163TF $24M 28.1億円 1,723万円/TF
◎九大 (Primequest Itanium2 2core) 3/2007
31.5TF ? 25億円 7,935万円/TF
Xtreme-Xの性能、品質に関しては、3研究所は事前に試行購入を行い検討済みであるので、いわばNNSAの3研究所の裏書付ということになり、また、テラフロップ単価はRangerの700万円弱と殆ど同じで、Blue Gene/Pの単価1,079万円とあいまって、今後のスパコンの価格に大きな影響を与えるものと思う。 主契約のテラ単価700万円は競争入札での頑張り価格としても、オプション契約のテラ単価900万円前後は通常の単価と考えてよいのではないかと思っている。この概ね、1テラ1000万円、10テラ1億円、100テラ10億円という相場感は世界的にスパコンの買換え需要を掘り起こすに足る値段と考えられるので、近々TOP500も激動が予想され、今後の推移が注目される。
<日本のスパコン調達>
これらの単価を基に、2006年設置の東工大のTSUBAMEの現在価値を射影してみると、5-6億円ということで、1年で価値は4分の1に下落し、ClearSpeedアクセラレータの価値は全くなくなっているとしか思えない。シンプルなQuad-CoreのCOTSに圧倒されてしまっているのである。
COTSの勢いは、Intelのロードマップでは2009年には32nmとなり、コア数も8、16となってゆくであろうし、クロックもリーク電流対策が組込まれ、再び3GHZ超になってゆくであろう上に、チップ・スタックによりメモリもロジックも3次元的に配置されるようになるので、今後とも、価格性能比、消費電力性能比、設置面積性能比などは改善され続けてゆくはずで、調達に当たっては、パソコン購入と同じで、テクノロジー更新の時期に注意を払わないと、価値の下落で目もあてられない事になる。
2002年設置の地球シミュレータの現在価値を射影してみると4-5億円ということになる。この現在価値5億円のシステムの維持管理運営のために、電気代5億円を含む年間50-60億円などとと報道されている巨額経費が毎年税金で支払われているのである。巨額運営経費の内訳を分析検討してみれば、あの巨大施設を維持すべきかどうかといった話が起きないほうが不自然であろう。Opteronの性能に関しては、HPCCのRed Stormのデータを参考にすれば、メンタルな問題を除いて、何の問題もないことがわかる。というより、そもそも世界中が安価なスカラー機で問題なく研究開発を行っているのであり、理論的にも、数値的にも、コスト的にも、べクター機に固執しなければならない理由は無いのである。財政赤字の現在、税金の無駄遣いは、厳に慎むべきである。
2007年3月の九大調達の25億円でテラ単価8,000万円/TFは、論外であろう。APPROのXtreme-XならOption契約を適用しても2億9千万円程度という計算になる。
2006年10月30日に公告された筑波大(80TFLOPS)、東大(150TFLOPS)、京大(66TFLOPS)のスパコン調達に上記のAPPRO Xtreme-Xで応札するなら、3大学合計の296TFLOPSは30億円でおつりが来る計算になる。余った分でメモリやファイルシステムなどの増強が可能であろうし、あるいは、九大の31.5TFのシステムをオマケで購入することも可能であろう。
5年リースとするなら、4大学の合計で月額5千万円程度という計算になる。現在、京大は理論性能の50%以下しか実行性能の出ない富士通のPrimepower2500を使っているはずで、その月額リース料金はおよそ1億円と報道されていたので、国際価格で調達すると、京大の現在の月額リース料金の半額で4大学のスパコンが賄える計算になるのである。
米国の国立研究所ではスパコンを安価に調達する努力を行っているのに、日本の国立大学法人や独立行政法人の研究所では、国際価格の動向に注意を払わず、国際価格を遥かに越えた高額な単価で、平気で、調達している例が多いのである。これは我々日本人の払っている税金の国際価値を著しく棄損する行為で、しかも、税金で給与を得ている公務員(見なしも含む)が行っているのである。 これでは、2重の背信行為と非難されても、やむを得ないのではないだろうか。
税金の有効活用は必須である。次世代スパコン開発といい、スパコン調達といい、科研費や振興調整費といい、科学技術という言葉をカモフラージュにした税金の無駄使いがひどすぎるのではないだろうか。
会計検査院、国会の決算委員会、ジャーナリズムを含め、税金の使途に対する国民の厳しい精査・監視は必須であろう。
<参考>
平成18年10月30日 資料等の提供招請
筑波大学:スーパーコンピュータシステム 一式
http://www-gpo3.mext.go.jp/kanpo/gporesultm.asp?idno=B0002948
東京大学:超並列型スーパーコンピュータシステム 一式
http://www-gpo3.mext.go.jp/kanpo/gporesultm.asp?idno=B0002952
京都大学:スーパーコンピューターシステム 一式
http://www-gpo3.mext.go.jp/kanpo/gporesultm.asp?idno=B0002965
九大のスパコン
http://itpro.nikkeibp.co.jp/article/NEWS/20070314/265076/
<日本のスパコン>
http://rblog-tech.japan.cnet.com/petaflops/2007/07/post_0774.html
Blue Gene/Lの値下げセール
http://rblog-tech.japan.cnet.com/petaflops/2007/08/blue_genel_4f40.html
なお、筆者の誤解、思い違い、転記ミス、計算違い、あるいは不適切な表現等がございましたら、ぜひ、コメント欄にてご指摘いただけますと幸いです。
※このエントリは CNET Japan ブロガーにより投稿されたものです。シーネットネットワークスジャパン および CNET Japan 編集部の見解・意向を示すものではありません。
ブロガー on 2007/10/14
非圧縮流体シミュレーション ES圧勝 おめでとうございます。
ところで http://www.top500.org/ を見ると 世界のスパコンの主流は 圧倒的に分散スカラマシンなのですが ベクタマシンをやっていない 他国の研究所は 非圧縮流体シミュレーション を どうやって計算しているのですか?
遅いままやっている? 元々遅くても良い計算分野? 日本だけ 特別早くこのシミュレーションを行うニーズがあるのでしょうか?
それとも現在 分散CPUを有効に使う方法を考えている? それとも それとも 今後さらにCPUが増えるのは明白なので 果報は寝て待て戦法なのでしょうか?
他国はどうしてる on 2007/10/14
能澤氏の虎の衣であるBG/Lですが、「非圧縮流体シミュレーション」では
地球シミュレータの足元にも及ばなかったことを能澤氏はご存知でしょうか。
http://sc05.supercomputing.org/schedule/event_detail.php?evid=5049
非圧縮流体シミュレーションを、65536CPU構成のBG/Lで2.76TFlopsという結果、
実行効率1%を割りますね。
一方ESは同じ計算ではないですが、「非圧縮流体シミュレーション」である
AFES(全球大気海洋大循環シミュレーション)にて、26TFlopsを実証してます。
LinpackではESの10倍性能を叩き出すような計算機が、
流体シミュレーションではESの10分の1も出せない。
能澤氏お得意の「TFlopsあたりの○○」で計算したらどんな結果でしょうかね。
自分は計算はしてませんがさぞかし興味深い結果がでるでしょう。
-----
テラフロップス、ペタフロップス時代においては、スーパーコンピュータに関する
設計も製造も利用も購入も性能評価も成果も、そのすべてにおいて、
「そもそも何を計算するのか(グランドチャレンジ)」を決して無視できません。
当ブログエントリを見る限り、能澤氏には「グランドチャレンジ」という
発想というか概念が全く欠落しているようにお見受けしますが、
スパ
WIND on 2007/10/10
ブログにコメントするにはCNET_IDにログインしてください。
この記事に対するTrackBackのURL:
Consumer ReportsがMacユーザーにSafariを捨てるように勧める
ネットとリアリティ 〜宮崎駿さんの「折り返し点」〜
原宿で野宿を含む15時間 - iPhone行列完全ドキュメント
毎日新聞もノスタルジア軍団だったのか?
DVD続々 「CATMAN」「ウサビッチ」「つみきのいえ」他
「夏期休暇」その前に…
電柱関連の意見募集一覧のリンク(募集中、募集終了の両方)
【メモ】 TechCrunch50 実況中継(準備段階)
Macは、やはり高いのか?
コンピュータの進化とデータマイニングみんなのお題では、ブロガー同士で質問を出し合いそれに対する回答や意見を集めています。今日はどんな話題が盛り上がっているでしょう?
CNET Japan ブログネットワークは、元はCNET Japanの一読者であった読者ブロガーと、編集部の依頼により執筆されているアルファブロガーたちが、ブログを通じてオンタイムに批評や意見を発信する場である「オピニオンプレイス」、また、オピニオンを交換するブロガーたちが集うソサエティです。
広い視野と鋭い目を持ったブロガーたちが、今日のIT業界や製品に対するビジョンや見解について日々熱く語っています。
CNET Japanやその他サイトが提供するITニュースやコンテンツへの意見や分析、 ビジネスやテクノロジーに対するビジョンや見解について語っていただける方を 募集しています。ご応募はこちらから
ブログの投稿はこちらから(※ブロガー専用)
今年最も活躍したブロガーを表彰します。詳細はこちらから
これは、CNET Japan 編集部の依頼に基づいて執筆されているCNET Japan アルファブロガーによるブログの印です。
CNET Japan ブログネットワーク内で拍手の代わりに使用する機能です。ブログを読んで、感激した・役に立ったなど、うれしいと思ったときにクリックしてください。多くGood!を獲得した記事は、より多くの人に読まれるように表示されます。
[レビュー]高い信頼性を普通に使う地球に優しい電源ユニット--Antec EarthWattsシリーズ EA-650
オンリーワンの個性を極めた超薄型テレビ--日立 Wooo UTシリーズ
今週の新製品総チェック:7色カラーのPC、ピンクのビデオカメラとカラフルモデルが続々と
[レビュー]テレビを持ち歩ける最強ツール--ソニー、Blu-rayレコーダー「BDZ-A70」
[レビュー]ネットワーク対応の高機能デジタルフォトフレーム--ソニー「Canvas Online CP1」
15時間の行列で手に入れたiPhone 3Gファーストインプレッション--ソフトバンクモバイル「iPhone 3G」
北京を見逃すな!--2008年夏、今買うべき「薄型テレビ」
(1)分類の大区分の名前は似ていても、全然内容の異なる計算の結果で性能を比較して、何の意味があるのでしょうかね? 読者を惑わすペテンの類としか思えませんね。
同じ条件での公平な比較としてはHPCCの主要4項目のデータが参考になるでしょう。地球シミュレータはHPCCにデータを送付していなので、HPCC公表データの中でSXの最新機種であるSX-8で、CPU数も一番多い576CPUのデータを以下に示します。
Chip数 G-HPL G-Random G-FFT EP-STREAM
TFLOPS Gup/s GFLOPS GB/s
NEC SX-8 576 8.009 0.019 160.95 23.556
CRAY XT3 12,960 90.990 29.818 1529.14 53892.0
BG/L 65,536 252.297 35.471 2311.09 160064.0
SX-8のG-HPLの値をES並みにして比較するため、4項目とも4.5倍して比べてみても、他の主要3項目とも、Cray-XT3(Opteron-Dual)にもBG/Lにも、全然、追いつきませんね。近々HPCCに、OPTERON Quad-CoreやBG/Pのデータが出てくるでしょうから、改めてHPCCを比較してみることをお勧めし