「伝統的なものとは違うアプローチが必要だった」--IBMのストリームコンピューティングへの取り組み - (page 2)

柴田克己(編集部)2010年04月12日 13時42分

 InfoSphere Streamにおいては、SPADEで開発したプログラムをコンパイルし直すことにより、同じプログラムを1台のマシンでも、複数台のクラスタ構成でも同様に動かすことができる点が特徴という。「並列処理のプログラムを作成するにあたって、開発者が実行環境について考慮する必要がない。プロファイル情報をもとに、ほぼ自動的にクラスタ上へ最適配置ができる」とする。

 InfoSphere Streamには、開発環境はSPADEでのプログラミングが可能なEclipseベースの「Stream Studio」に、Linux x86ベースで最大125台のクラスタ構成が可能な実行環境、データマイニングやフィナンシャルサービスを実現するためのツールキットが付属する。

 小野寺氏は、これまでの試作事例としていくつかのストリームコンピューティングシステムを紹介した。Toronto Dominion Bank Financial Groupでは、毎秒500万超のイベントを平均150マイクロ秒で処理し、多様なデータソースから株式などの売買を自動実行するオプショントレードシステムを開発したという。

 またオンタリオ工科大学では、新生児集中医療棟で、血圧や体温、心電図、血液酸素飽和度といった生理学的データストリームを分析し、院内感染などの生命を脅かす状況を早期発見し、対応可能にするシステムを開発した。現場担当者が患者の顔色などから異変を判断する現行の対応よりも、最大で24時間早く発見ができ、早期介入により患者の死亡率が下がり、予後経過も良好に推移するようになった実績があるという。

 ストックホルム市では、車載GPS、混雑情報、公共の交通手段の状況、天候などのリアルタイムデータから、各車の状態を推定し交通状況を可視化。それをもとに、経路の予測やプランニングを実行する「リアルタイム交通流マネジメントシステム」に取り組んだ。この実験では、4台のx86ブレードサーバを使い、1秒間に25万個のGPSからのデータを処理できることを確認したとする。

 小野寺氏は、ストリームコンピューティングに関する今後の研究テーマとして、より使いやすい開発環境や高信頼、耐障害、大規模に対応する実行環境の強化に加え、「ストリームコンピューティングの伝統的なコンピューティングへの適用」を挙げた。

 「SPADEによって処理を簡潔に記述できれば、分散処理に対応したスケーラブルな実行環境で非常に効率よくプログラムを走らせることが可能になる。現在、時間をかけて行われているバッチ処理などをこの環境で行うことで効率を上げたり、ETLやデータ解析といったアプリケーションの性能向上が容易になるのではないかと考えている」(小野寺氏)という。

SPADE IBMがストリームコンピューティング向けに開発した新言語「SPADE」のプログラム例。汎用言語と比較して、大幅に開発工数を削減できるという。(画像クリックで拡大表示)

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]