logo

文書から知識を抽出する「Machine Reading Program」を開発--米BBNがDARPAと契約

文:Mark Rutherford(Special to CNET News) 翻訳校正:編集部2009年06月29日 12時37分
  • このエントリーをはてなブックマークに追加

 1ページずつ読むことなく、ウェブ上の情報が習得できればどんなによいだろうか?それこそ軍隊が望む機能である。

 米国防総省国防高等研究事業局(DARPA)は、ますます増大するデジタル文書の山と、絶えることなくデータのインプットを求め続ける知的コミュニティの間のギャップを埋めるための読み取りマシンを開発する企業を募った。

 文書から知識を抽出し、人工知能(AI)システムや人間のアナリストらが処理することのできる形式に出力することが可能な、ユニバーサルテキストエンジンの開発に関する2970万ドルの契約を獲得したのは、BBN Technologies

 軍隊では、「Machine Reading Program」という正式名称を持つこのマシンを用いて、各州や多国間にまたがる組織(アルカイダから国際連合にいたるまですべてを含む)の技術的および政治的活動を自動的に監視する予定である。

 これを実現するためにBBNは、「多種多様な文書の言語的構造や内容を一般化し、知識エンジニアがこれらの情報を符号化することなく、関係や原理をテキストから直接抽出することが可能な手法を開発する」予定である。

 BBN Technologiesのバイスプレジデントを務めるPrem Natarajan氏は、「DARPAが想定する読み取りシステムマシンは、 発展的なものというよりも、むしろ革新的なものである」と述べる。「このシステムは、地域の慣習に関する理解の欠如など、軍隊が直面している安定性を妨げる要因の多くを排除し、グローバルな技術成果に継続的にアクセスする能力をもたらす」(Natarajan氏)

 しかしBBNは、このプログラムが、インテリジェントボットから個人向けチューターにいたるまで、多くの新しい一般向けアプリケーションをも可能にすると期待している。マサチューセッツ州ケンブリッジを拠点とする同社によると、同システムにより、世界中の図書館に対するこれまでにはなかったアクセスや自動解析が可能となり、文化的意識や歴史的研究の幅が著しく広がることになるという。

 BBNは既に、リアルタイム音声ストリームを自動的に文章化し、英語に翻訳して、連続的に更新される国際的なテレビ放送の検索可能アーカイブを作成する放送監視システムを提供している。

 DARPAは入札を募集する文書の中で、「このReading Systemが、あるときはWWW上で魅力的な価格の自動車を検索するために利用され、またあるときは遺伝学における新しい研究成果を疾病の理論に取り入れるために用いられることを想像してみてほしい」と記している。

この記事は海外CBS Interactive発の記事をシーネットネットワークスジャパン編集部が日本向けに編集したものです。 原文へ

-PR-企画特集