最終更新時刻:2009年7月11日(土) 10時00分
21

T2K(筑波、東大、京大)のLinpack実行性能

公開日時:
2008/06/05 09:00
著者:
能澤 徹

【追加】6月18日発表のTop500第31版の中で筑波大のT2KはPeak性能92Tflopsで、実行性能が76.46Tflopsとなっており、実行性能比は83.1%となりますので、本文中の表をUpdate致しました。
 Linpackはピーク性能に近い性能を出しやすいベンチマークで、高性能汎用スパコンの必要条件の一つです(十分条件ではない)
。したがって、その実行性能比の芳しくないシステムは、当然、他のアプリケーションでも良い結果は期待できないわけで、システム設計の不具合を見つけるには最適のベンチマークです。
 
 
 
 
62日の報道では、東大のT2K(日立HA8000、理論性能140TflopsLinpackベンチマークで82.98Tflopsを達成し、京大のT2K(富士通HX600、理論性能61Tflops50.5Tflopsを達成したという事である。筑波大のT2KAPPRO Xtream)の実行性能の報道は、今のところ、見当たらない。

   Peak  リース メーカ  使用 Linpack  実行性能比
   TF  総額     Peak性能 実行性能  
筑波 
95  25.2億 APPRO     92  76.46     83.1%
東大 140  87.4億 日立HA800  113 82.98  73.4%
京大 
61  39.0億 富士通HX600 61  50.5  82.5%
  (
70.2:移行用機を含めた京大の合計性能

  公式発表によるものではないが、東大のT2Kの実行性能は、理論性能140Tflopsのフル・ノード・システムでのものではなく、113Tflops768ノード、12288コア)のサブシステムでの結果と考えられる。

 報道されたデータだけをもとに単純に計算すると、東大のT2Kの理論性能は140Tflops、京大が61Tflopsであるので実行性能比は東大が59.2%、京大が82.5%となり、東大はほとんど落第で追試が必要なレベル、京大は合格、といった事になってしまう。

 「ヘンだなー」と思いつつも、瞬間、脳裏をかすめたのは、京大の前機種で、名大や
JAXAの現機種でもあるPrimepower HPC2500Linpack実行性能比49.6%のことで、59.2%はこれよりは若干マシではあるが、誉められた数値ではない。49.6%59.2%2度もヘンな結果を全世界にばら撒く事になると、日本の技術力が世界から疑われてしまうのではないかと、余計な心配をしてしまった。


 どうやら、実態は、
512ノードのサブシステムと256ノードのサブシステムを結合した768ノードのサブシステムで行われた結果のようで、理論性能は113Tflopsなので、実行性能比は73.4%となる。

 この73.4%という数字は、驚きの59.2%程ではないが、京大の82.5%からは10%程度の性能劣化で、理論性能的には14Tflopsが、税金としては8.7億円が、意味も無く消えてしまうという事になる。


 現時点では筑波の
T2Kのデータは公表されていないので、筑波のT2Kとの比較は出来ないのであるが、とりあえず米エネルギー省のTri-LabAPPROのデータを参考にすると、筑波も80% 前後は達成できるのではないかと思う。すると筑波のT2Kの実行性能は76Tflops程度と予想され、サブシステムでの結果とはいえ東大の82.98Tflopsとあまり差がない事になってしまう。リース総額は東大が筑波の3.5倍であるから、今後公表されるであろう筑波の実行データ如何によっては、京大のケースも含めて、内外価格差論議が起こる可能性は否定はできない。


 技術的に何が原因なのか詳細は不明であるが、システムを大きく括ってみれば、システムボード、インターコネクト、システムソフトなどのブロックに分けられるので、問題の切り分けが第一歩であろう。

 外部から見た東大のT2Kと京大、筑波のT2Kで、目に付く相違はインターコネクトである。東大がMyrinetであるのに対し、京大、筑波はInfinibandである。インターコネクトに関連するものとしては、MPI周りのシステムソフトが関係している可能性も考えられる。この辺りが一つのポイントであろう。
 まずは、システムボード単体での実行性能を確認し、問題がシステムボードにあるのかインターコネクトなのかを切り分け、早急に改善策を打つべきであろう。

 予定調和的に考えてみれば、東大も京大も筑波も
CPUは同じで、基本設計も同じであるから、インプリメンテーションの差異部分の修正で80%超は可能と思う。
 
 担当者は、同じ仕様で発注していながら、10%もの性能格差が発生し、10%の税金が何の意味もなく消えてしまっているという事実を重く受け止め、メーカ任せにせず、改善の努力を行うべきであろう。
 
 また、ベンチマークで使用したシステムがフル・ノードのシステムでない点は、今回は設置前後でビジーであったためとも思えるが、やはり、折角の140Tflops機であるので、本質的ではないが、Linpackもフル構成のシステムで、実行性能比も80%を超える状況に改善し、実行性能で100Tflopsを超える結果を期待したい。
 
 この東大のT2Kは、昨年11月の第30回のTop500の番付では10位相当となるが、今月にドイツで行われるISCでの第31回の番付では20位内といったところではないかと思う。今回はRoadrunnerANLBlue Gene/PTACCRangerといった500Tflops超の大型機のエントリーと、100Tflopsクラスのステルス・プラン、従来機の増強、などが予想されるので、まあ20位内程度というのが妥当な線ではないかと思っている。     
  

  
 なお、筆者の誤解、思い違い、転記ミス、計算違い、あるいは不適切な表現等がございましたら、ぜひ、コメント欄にてご指摘いただけますと幸いです。

※このエントリは CNET Japan ブロガーにより投稿されたものです。シーネットネットワークスジャパン および CNET Japan 編集部の見解・意向を示すものではありません。

このエントリーへのコメント

1

Linpackでしか評価しないのは意味がない.

  chibaz on 2008/06/06

ブログにコメントするにはCNET_IDにログインしてください。

この記事に対するTrackBackのURL: 

CNET_ID

メンバー限定サービスをご利用いただく場合、このページの上部からログイン、またはCNET_ID登録(無料)をしてください。