最終更新時刻:2009年11月7日(土) 10時00分
27

地球シミュレータ停止報道の余波

公開日時:
2007/11/18 09:30
著者:
能澤 徹

【地球シミュレータ停止報道の余波】
 最近、地球シミュレータの行く末に関する報道が相次いでいる。
1.日経BP【スクープ】地球シミュレータが08年度で停止、次期機は汎用製品で100テラを目指す  2007/11/01
http://itpro.nikkeibp.co.jp/article/NEWS/20071101/286127/
2.NHKニュース 2007/11/13
http://www.youtube.com/watch?v=rJwOGILoVFw
3.朝日「地球シミュレータ」部品交換で能力2倍に 海洋機構  2007年11月14日17時43分
http://www.asahi.com/science/update/1114/TKY200711140192.html
 時系列にニュースを見ると、まず、地球シミュレータ・センターは汎用スカラ系スパコンへの機種変更は可能と判断し、安価な機種への変更を示唆したところ、次に、納入業者は、あわてて、最大の顧客を失っては一大事とばかり、CPU入替案を持ち込んだ、と言うことのように思えるのである。
 要するに保守費45億の一部を、CPU入替のリース代金にまわすと、新しい機械が設置できるということで、いかに無駄な保守費を払い続けていたということを証明してくれたのである。
 保守費年間45億円ということは、毎月3億7500円分の、あるいは1年中休み無く毎日1,233万円分の、故障が発生すると言うことである。つまり、地球シミュレータは故障率が極めて高く、故障ばかりで殆どまじめに作動していなかったのではないかということか、あるいは作動していたのに全く実態のない保守費を払い続けていたのかの、どちらかである。そして今般わかったことは、後者であったと言うことであろう。
 本来、保守費は設置機械の故障率を元に計算すべきもので、故障率の低い機械を購入することが基本であるが、額に関しても前年の保守実績に基づき、見直しを行うといったような柔軟な保守契約にすべきなのであり、官公庁の契約は杜撰といわざるを得ない。

 一方、日立、富士通が2008年春にOpteron Quadを採用したスパコンを発売することが報道されている。
http://itpro.nikkeibp.co.jp/article/NEWS/20071116/287343/
これは、筑波、東大、京大が発表していた共通の入札仕様の線に沿ったもので、地盤割り的には日立は東大、富士通は京大向けということであろう。
 こちらも、やっと国際常識に沿った、x86系高性能市販CPUによるスパコン化路線が始まったようであるが、問題は価格であり、調達価格が国際価格に追随しているかどうかが決め手である。
<参考:スパコンの内外価格差、性能格差>
http://japan.cnet.com/blog/petaflops/2007/10/09/1700_ed63/

 どちらのケースも、調達側が少しはコスト意識をもち、国際常識を意識したことで、民間の納入業者はそれに従わざるを得なかったということで、国税を浪費する、調達側=公務員、の意識改革が、極めて重要であることを示す好例ではないかと思う。

 いずれにせよ、HPCの環境は大きく変貌を遂げており、地球シミュレータ・センターが、これまで無批判にアプリオリとして代々浪費してきた年間50-60億円といわれている維持運営経費の「お金の現在価値」を再認識し、がんじがらめの体制の中で一石を投じたことは、高く評価したいし、エールを送りたい。
 黙っていると何も起きなかったところを、「ベクタ型には拘らない」として一石を投じたことで、これまで支払ってきた保守費総額からすると当然とはいえ、部品交換であるにしても、少なくとも2倍近くの演算能力を手にすることができるのであるから、前進といってよい。引き続き、イニシャルコストの5億と年間保守費の削減に向け、同センターのシニア・マネジメント層の奮起を期待したい。
 くどい様であるが、国際価格について付記すると、TOP500第3位のニューメキシコ州政府のSGI-Xeon 172Tflops機は、たったの$11M(約12.7億円)であり、NSFがテネシー大学にファンドし2009年設置予定のCrayの1Pflops(1000Tflops)機XT5(Opteron)は$65M(約74.8億円)に過ぎない。
<参考:Top500: 日本のスパコン能力>
http://japan.cnet.com/blog/petaflops/2007/11/14/entry_25001629/
 これらのスパコンの性能に関しては、CrayのXT3(Red storm)はTop500の第6位でLinpac実行性能102.2Tflops、実行性能比は80.2%であり、SC07でのHPCC awardのG-FFTで2.87Tflopsを達成し第1位になっている。このXT3のG-FFTの性能は極めて高く、ShuttgartのSX-8(576CPU)の0.16Tflopsを参考に現在の地球シミュレータのG-FFTの値を推定してみると、地球シミュレータの数倍は出ているものと思える。
 従って、同センターは、若干のプログラム修正を覚悟さえすれば、いつでも、スカラー型への切替えは可能である、という点を前面に打ち出して、後継機選定交渉に望むべきであろう。

 さて、こうした現在の状況は、そもそも地球シミュレータ・プロジェクトの開始段階で予測できたことなのである。この期に及んでのドタバタ劇から判断すると、地球シミュレータのプロジェクト・プランには、ライフサイクル・マネジメントが欠落していたということであり、プロジェクト・プランがボロボロであったということの証左と考えてよいであろう。
 米国でのプロジェクトのライフサイクル・マネジメントに関しては、今般、LLNLのBGLはスムーズに性能を2倍近くに増強しており、また、サンディア研のRed Stormも最初の40Tflops程度から現在の127.5Tflopsまで計画的に増強を行っている。
 これに対し、地球シミュレータは、この5年間何も出来なかったということで、契約管理やライフサイクル・マネジメントを含んだプロジェクト管理が杜撰であったといわざるを得ない。
 商品として広く流通できないような機器を調達すると、必ず、その維持保守管理、後継機、アプリケーションのポータビリティなどの問題が発生することはわかっていたことであり、地球シミュレータはこれらを全く考慮していなかったとしか思えないのである。

【次世代スパコン・プロジェクト】

 では、次世代スパコン・プロジェクトは、こうした地球シミュレータが直面している問題の反省の上に立ってプランされているのか、というと、NO としかいい様がないのである。
<参考:地球シミュレータは失敗作>
http://japan.cnet.com/blog/petaflops/2007/08/29/post_ab53/
<日本のスパコン戦略はボロボロ>
http://japan.cnet.com/blog/petaflops/2007/08/27/post_d9cd/

 2005年10月の文科省の資料(べクタ0.5PFlops、スカラ1.0Pflops、特定20Pflopsという性能案)では、建屋は3階建で、総床面積は地球シミュレータの3.5倍程度もあり、2000台近くのラックと、消費電力40MWで、プロジェクト総経費1154億円といったプランである。地球シミュレータの首を絞めた年間維持管理費は80億円強となっている。 建設予定地のポートアイランドには、関電の発電所建設が決まったと報道されている。(現在の性能案では特定が無くなり、スカラかベクタでLinpack10Pflops、HPCC Award4項目第1位を達成することになったため、消費電力、ラック数は増加せざるを得ないのではないかと予測される)
 要するに、地球シミュレータに比べ、プロジェクト総額2倍、建物3.5倍、消費電力6.7倍、維持管理費1.5倍というプランである。

 これに対し、まず言わなければならないのは、地球シミュレータの使用者ですら、最早、「ベクタ機には拘らない」といっているご時勢に、高額の開発経費をかけて無理にベクタ機を開発しなければならない理由を、文科省は開発費用を含め国民に判るように説明し、批判に答えねばならないということである。
 と同時に、富士通、日立のx86スパコン開発の発表は、次世代スパコン・プロジェクトのスカラ部をx86系にして何が不都合なのか、という疑問を提起することになる。1154億円などといった巨額の開発費を使わずとも、商業ベースで自然と実現されるのではないか、という疑問に対し、文科省は巨額経費を投入してでも次世代スパコンを開発しなければならないことを、合理的に説明できなければならないということである。
 そして、次世代スパコンは、仮に完成できたとしても、その時点で市販汎用スパコンとの性能競争に勝てるという保証はさらさらない上、年80億円超の巨額運営経費をかけて運営することになり、完成時点で既に、地球シミュレータと同じように、巨額運営経費と相対性能の低下により停止せざるを得ないような状況に追い込まれる可能性すらあるのである。
 地球シミュレータ開発の当時は米国もノーマークであったが、今回は米国は手ぐすねを引いて待ち構えており、完成時点で既に相対性能の劣化、陳腐化が進んでしまっている可能性が十分考えられるのである。
 しかも、スカラ機の高性能低価格化に追随出来ないベクタ機は、買い手も無く、後継機の開発すら出来ない状況に陥っている可能性が極めて高いのである。

 これでは、何のための開発かわからないし、結局、次世代スパコン開発は、無駄な投資、税金の浪費、一部公務員の自己満足、一部企業への税金の供与、などに過ぎないのではないかと批判されてもやむを得ないのではないだろうか。

 

 なお、筆者の誤解、思い違い、転記ミス、計算違い、あるいは不適切な表現等がございましたら、ぜひ、コメント欄にてご指摘いただけますと幸いです。

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。

このエントリーへのコメント

8

To:コメント#7

>「一昔も、二昔も前の、銀行の勘定系システムなどではなく、単なる研究者向けの計算サーバー・システム」であるにも関わらず、保守料金が高いという事は、物の故障率だけでなく、 保守の要求仕様によっても大きく変わるという事、
  
ではなくて、 
 
【「一昔も、二昔も前の、銀行の勘定系システムなどではなく、単なる研究者向けの計算サーバー・システム」であるにも関わらず、保守料金が高いという事は、『物の故障率に基づかない、おかしな保守の要求仕様』、あるいは『おかしな保守契約』】と言うことでしょう。
 
 保守会社の人から見れば、「要求仕様」があるのだからしょうがない」といっているように聞こえますが、払う人(納税者)から見れば「とんでもない仕様だ」「とんでもない保守契約だ」ということになります。
 税金を使う人(調達者、契約を行った人)にとっては、予算は下りてくるのだし、自分の財布が傷むわけでもないので、「すぐに直してくれればどうでもよい」と言うことでしょうけれど、彼等には、納税者に対し説明責任があるはずで、たとえば「どうして60人常駐なのか」を説明できなければなりません。説明するには故障率は必須でしょう。

 要するに、要求仕様を含めた保守契約全体の合理性と内訳・積上の妥当性、つまり、保守契約のアカウンタビリティの基本になるのは「故障率」と言うことになると思います。

  能澤 徹 on 2007/12/05

7

> 一昔も、二昔も前の、銀行の勘定系システムなどではなく、単なる研究者向けの計算サーバー・システム

であるにも関わらず、保守料金が高いという事は、物の故障率だけでなく、
保守の要求仕様によっても大きく変わるという事、
またその装置の保守の容易さ(今時PCなら工学系の学生はだれでも扱えるけど、専用のスーパーコンピューターは保守できない)
によっても変わるという事が、理解いただければ良いです。

地球シミュレーターの保守料金が妥当だという主張をするつもりはありません。

  タクジ on 2007/12/05

6

To:コメント#5
>おそらく保守の要求スペックがあった上での金額であり、一律ではないと思います。

 勿論、保守要求仕様はあるでしょうし、保守経費の内訳・積上もあるでしょう。問題は、要求仕様の合理性と、内訳・積上の妥当性です。予算があるからといって、要求仕様を拡大解釈して、必要以上の積上を行ったのでは、一律と同じことなのではないでしょうか。

 一昔も、二昔も前の、銀行の勘定系システムなどではなく、単なる研究者向けの計算サーバー・システムで、しかも、システムの一部で故障が発生しても、ソフトウエア(OS)で、対象となるノードなり、ノードを集めたセグメントを、システムから切り離すことで、システム本体は何の問題も無く作動することが常識であるシステムです。

 保守経費が年間45億円、つまり、月額3.75億円ということは、パーツコスト等を保守費の半分程度と仮定し、保守要員の1人当たりの経費を月額100万円、1日3交代シフト、土日なしと仮定して、常時60人駐在の体勢になります。
 ESというシステムは、こういった保守要求仕様で、こういった保守体制をとらないと稼動できないシステムなんですね。
 

  能澤 徹 on 2007/12/05

5

>  要するに、400億円だ、600億円だなどといった巨額な売価の機械で、
> 一律に売価の10%とか20%とかを保守料金とするなどといった保守契約は、おかしいと言うことです。

私は担当したメーカーの人間では無いので、見込みでの話になりますが、
おそらく保守の要求スペックがあった上での金額であり、
一律ではないと思います。

「修理には、年1回だけ来れば良くて、あとは保守の必要ありません。」
という要求スペックであれば、さすがに一律1割といった見積もりにはならないと思います。
人の動きで言えば、
保守員が24時間常駐する場合と、9:00〜17:00、オンコールでの出動では、
人件費が大きく異なります。

あくまでも例えの話ですが、海外の大学が、PCベースの
超並列スーパーコンピューティングシステムを構築していて、
壊れたPCは、運用アルバイトの学生が丸ごと交換して、交換した後に、
メーカーに修理に発送する運用としていたとしたら、
それはメーカーとしても高い保守料は、要求できないハズです。

  タクジ on 2007/12/04

4

To コメント#3
 コメントで述べられているもろもろのことの基本になっているのが「故障の発生する確率」で、これにもとづいて、稼動要求を満たすための最適な保守体制/リソースを考え、費用を算定して、保守契約を締結するのではないでしょうか? 
 要するに、400億円だ、600億円だなどといった巨額な売価の機械で、一律に売価の10%とか20%とかを保守料金とするなどといった保守契約は、おかしいと言うことです。

  能澤 徹 on 2007/12/03

3

保守料金の考え方ですが、基本的には、故障率ではなく、
保守にかかるリソース(工数や部品代)がベースになるはずです。
それらのリソースは、求める運用能力によって異なります。
8割の稼働率で良くて、工数の安い時間帯に壊れた部品を
交換すれば良いという考え方と、
10割の稼働率が基本で、故障時には、2時間以内の回復が、
前提のシステムでは、ハードウェアが同じでも、保守に必要な、
リソースは異なります。

  タクジ on 2007/12/03

2

(To:コメント#1)
概ねご意見には同意です。
筆者の基本的考え方は以下をご参照ください。

<米国のスパコン戦略とスパコン・デバイド>
http://japan.cnet.com/blog/petaflops/2007/08/03/post_2be6/

  能澤 徹 on 2007/11/19

1

いつも楽しく読ませていただいています。

(国費を投入した)スパコンやその他のHPCについて、以前から抱いていた疑問がありました。それは要約すると、
(1)投入した費用に対して、それに見合う量の計算資源を調達できているのか。
(2)そうやって獲得した計算資源を有効に活用できているのか。(本来、より少ない計算資源で実行可能であるタスクに対して、無駄な計算資源を消費していないか。)
ということです。
これまで(そしてきっとこれからも)、このBlogで(1)について様々な検証をされてきたかと思いますが、(2)についてはどうなのでしょうか。
ぶっちゃけていうと、「スパコン、何に使っているの?、効率的に使っているの?」ということですが。

個人的には、(国内の活動に)必要な量の計算資源が調達できるのであれば、個別の機械の(特定のベンチマークで測定した)演算性能が世界トップレベルかどうかということには、こだわるべきではないと考えます。
たとえ国内に、世界トップレベルの性能を持つ機械がなくても、中程度以下の規模の(得られる計算資源に対して投資効率のよい)機械を(相対的に)多く保有することで、一国内の計算需要を満たせるのであれば、それで十分ではないでしょうか。個別の機械で「世界一の看板」を追求することに意味があるとはあまり思えません。

  shouichi on 2007/11/18

ブログにコメントするにはCNET_IDにログインしてください。

この記事に対するTrackBackのURL: 

CNET_ID

メンバー限定サービスをご利用いただく場合、このページの上部からログイン、またはCNET_ID登録(無料)をしてください。