InfoSphere Streamにおいては、SPADEで開発したプログラムをコンパイルし直すことにより、同じプログラムを1台のマシンでも、複数台のクラスタ構成でも同様に動かすことができる点が特徴という。「並列処理のプログラムを作成するにあたって、開発者が実行環境について考慮する必要がない。プロファイル情報をもとに、ほぼ自動的にクラスタ上へ最適配置ができる」とする。
InfoSphere Streamには、開発環境はSPADEでのプログラミングが可能なEclipseベースの「Stream Studio」に、Linux x86ベースで最大125台のクラスタ構成が可能な実行環境、データマイニングやフィナンシャルサービスを実現するためのツールキットが付属する。
小野寺氏は、これまでの試作事例としていくつかのストリームコンピューティングシステムを紹介した。Toronto Dominion Bank Financial Groupでは、毎秒500万超のイベントを平均150マイクロ秒で処理し、多様なデータソースから株式などの売買を自動実行するオプショントレードシステムを開発したという。
またオンタリオ工科大学では、新生児集中医療棟で、血圧や体温、心電図、血液酸素飽和度といった生理学的データストリームを分析し、院内感染などの生命を脅かす状況を早期発見し、対応可能にするシステムを開発した。現場担当者が患者の顔色などから異変を判断する現行の対応よりも、最大で24時間早く発見ができ、早期介入により患者の死亡率が下がり、予後経過も良好に推移するようになった実績があるという。
ストックホルム市では、車載GPS、混雑情報、公共の交通手段の状況、天候などのリアルタイムデータから、各車の状態を推定し交通状況を可視化。それをもとに、経路の予測やプランニングを実行する「リアルタイム交通流マネジメントシステム」に取り組んだ。この実験では、4台のx86ブレードサーバを使い、1秒間に25万個のGPSからのデータを処理できることを確認したとする。
小野寺氏は、ストリームコンピューティングに関する今後の研究テーマとして、より使いやすい開発環境や高信頼、耐障害、大規模に対応する実行環境の強化に加え、「ストリームコンピューティングの伝統的なコンピューティングへの適用」を挙げた。
「SPADEによって処理を簡潔に記述できれば、分散処理に対応したスケーラブルな実行環境で非常に効率よくプログラムを走らせることが可能になる。現在、時間をかけて行われているバッチ処理などをこの環境で行うことで効率を上げたり、ETLやデータ解析といったアプリケーションの性能向上が容易になるのではないかと考えている」(小野寺氏)という。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
OMO戦略や小売DXの実現へ
顧客満足度を高めるデータ活用5つの打ち手
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
パナソニックのV2H蓄電システムで創る
エコなのに快適な未来の住宅環境