IBM、Masalaで分散型検索への取り組みを拡大

Michael Kanellos (CNET News.com)2004年04月26日 17時02分

 IBMでは、情報を見つけだすことにますます力を入れている。

 同社はDB2 Information Integratorソフトウェアの新バージョンにあたる「Masala」のリリース準備を進めている。このソフトウェアを利用するユーザーは、データベースやアプリケーション、ウェブから同時に情報を取り出せるようになる。また今後登場してくる機能のなかには、「Criollo」というコード名を持つデータマイニングコンポーネントもある。

 このようなタイプのミドルウェア市場はまだ規模こそ小さいが、すでに高い関心を集めている。IBMのInformation Integration Software Groupでディレクターを務めるNelson Mattosは、IBMの顧客約1300社が、約1年前に登場したInformation Integratorの最初のバージョンを利用していると述べている。この1300社のなかで、2002年から2003年6月まで実施されたベータプログラムに参加したのはわずか120社だった。

 最近の技術業界では検索分野が非常に大きな注目を集めており、大小さまざまな企業が、外国語の文書、二次元および三次元の図面、古い電子メールや、ハードディスクの奥に隠れて見つけ出すのが困難な情報の検索に役立つ技術を考案している。

 RedMonkのアナリスト、Steve O'Gradyは、「一般に、このようなツールがリレーショナルデータベース関連製品をすぐに駆逐するようなことはないが、IBMは(リレーショナルDB以外の)製品をうまく利用している。MicrosoftやOracleなどの製品を見ると、どれもいまだに一元化を謳っている」と語った。

 だが、Microsoftも指をくわえているわけではない。同社も、次期Windows OS「Longhorn」と、「Yukon」(開発コード名)いうSQL Serverデータベースの新リリースで、自社の分散検索技術開発に取り組んでおり、自社版インターネット検索サービスの構築も計画している。また、BEA Systemsなどほかのベンダー各社でも、同様の技術の開発を進めている。

 IBMは、Masalaの自然言語検索コンポーネントのベータ版を自社の顧客にすでにリリースしており、5月上旬には完全なベータ版もリリースする。これまで、このような完全ベータ版は一部の選ばれた顧客にしか渡されていなかった。なお銅製品の市販は今年後半に開始される。

 Mattosは、必要なデータのありかを把握しておくことは「顧客にとって最大の悩みだ。情報があちこちに散らばっている」と話している。

 Information Integratorの採用が急速に進んだため、IBMは開発予算を50%引き上げたとMattosは話している。さらに、IBMは2月にInformation Integration Leadership Councilも設置している。川崎重工やMerrill Lynchなどの12社の顧客で構成される同団体は、Masalaの完全ベータ版のテストを行い、IBMに助言を行っている。

 Information Integratorは、1回のクエリでOracleデータベース、Microsoft Excel、IBMのDB2やLotusデータベースなど、さまざまなソフトウェアからデータを集めてくるソフトウェアレイヤだ。IBMなど各社は、検索で分散したデータソースを利用する「共用」データベースのアプローチを大々的に宣伝している。「共用」データベースは、1つのデータベースで大量の情報を提供/格納する手法に代わる可能性を秘めた低コストの選択肢だ。

 同社の巨大な研究部門では、WebFountainなどのプロジェクトで情報検索の分野にさらに深く踏み込んでおり、また社内シンクタンクのInstitute for Search and Text Analyticsなどでは、データウェアハウス、クエリ構造、データベース技術と検索とが重複する部分などについて研究を進めている。

 Masalaではデータソースが拡大されるなど、最初のバージョンから改善が見られる。また、自然言語によるクエリも可能になる。

 IBMではCriolloに手を加えて、データマイニングのようなタイプの実験を行おうとしている。これにより、たとえば生産量と販売量を比較したい場合には、一段と新しいデータを使えるようになると、Mattosは説明している。

 Information Integratorは、今後のバージョンでさらにインテリジェントな動作をするようになる。Mattosの話によると、同システムは法人ユーザーがどのように自社のデータを扱い、これを保存するのかを観測し、その動作に基づいてデータベースの集約、キャッシング、あるいは同期に関するアドバイスを行うようになるという。

 「重複したデータがあまりにも多く、使うべきでない古いデータまで紛れ込んでいる」(Mattos)

 現在までのところ、Information Integratorは一部の顧客で好結果を生んでいる。川崎重工では、ディーラーがネットワーク全体からスペアパーツを検索し、修理に要する時間を短縮可能なシステムを構築することができた。また中国のある保険会社では、このシステムを使って、企業買収で集めた顧客データベースを合体させている。

 同システムを使い、基盤となっているソフトウェア/ハードウェアの活用状況を調査した企業もあった。この会社では、特に大きな作業負荷の処理用に同じマシンを2台用意した。ところが調査の結果、作業の9割は1台のマシンで行われていたことが分かった。

 「彼らはほとんど使っていない大量のハードウェアとソフトウェアに投資していた」(Mattos)

この記事は海外CNET Networks発のニュースをCNET Japanが日本向けに編集したものです。

 

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]