logo

メタデータ、5W1Hキーワードを自動抽出して楽々検索できる「5W1H Mextractr」をInternet Explorer 8ユーザに提供

メタデータ株式会社(本社:東京都文京区、代表:野村直之)は5日、マイクロソフトの最新ウェブブラウザーInternet Explorer 8 (以下IE8)の新機能「アクセラレータ」用アドオンの1種として、指定した範囲の日本語テキストから5W1Hのキーワードと未知語(新語など)を自動抽出し、各キーワードに相応しい登録サービスの検索結果を選べるようにする「5W1H Mextractr」の無償提供を開始します。「5W1H Mextractr」は、日本語の意味解析エンジンを用いて自動抽出した5W1Hのキーワードごとに複数のサービスをユーザに提示し誘導する世界初のサービスとなります。

「5W1H Mextractr」を使う際には、通常のIE8アクセラレータ用アドオンと違って、単語画面上から単語を1つ1つ切り出す必要がありません。記事の中から5W1Hの事実情報(何月何日, どこ, 誰, 組織・法人, どんな出来事)や未知語(新製品名など)をチェックしたい辺りを適当に指定するだけで、これら5W1Hのキーワードを自動抽出します。このため、指定したい単語の開始文字の左側にキャレット(文字カーソル)を合わせてマウスをドラッグし、終了文字とその右側の文字の間に正確にキャレットを合わせてマウスボタンを離す、という面倒な単語指定を繰り返す負担からユーザは解放されます。英語のように単語が分かち書きされておらず、ダブルクリックで単語を指定できない日本語に好適なサービスです。

ブルーのアクセラレータ・ボタンを押し、アクセラレータ一覧から「5W1H Mextractr」にマウスオーバすると、自動抽出された5W1Hのキーワード一覧が表形式で出現します(リンク)。5W1Hの各キーワードごとに、予め登録されたサービスのアイコンをクリックするだけで、キーワードの説明内容や関連情報の検索結果をダイレクトに開くことができます。また、キーワード部分をクリックすると、Live Searchの検索結果を表示します(2009年2月5日現在)。

「5W1H Mextractr」の登録サービス一覧(2009年2月5日版):
WHEN : 「今日は何の日」   Live Search EventCast (互換表示推奨)
WHAT : ZDnet ITイベント検索 Event Eye  EventCast
WHERE : Live Map For Travel Yahooピンポイント天気
WHO : SpySee  Live画像サーチ&関連人物
ORG  : ZDnet企業紹介  104.com
未知語(新語):瞬!コレ  テクノラティ検索  Yahoo知恵袋 OK Wave

■「5W1H Mextractr」の特徴
 ・手作業による単語の切り出し、コピペ、検索窓の開閉が不要
 ・事実情報として重要な5W1Hと未知語(新語など)を楽々自動抽出
 ・アクセラレータ対応のフォームにコピペすれば、メーラやワープロ、PDF等、Web以外のテキストからも5W1H抽出、および登録サービスへのダイレクト・アクセスが可能

■「5W1H Mextractr」の今後の展開
ユーザの声を反映しつつ、今後、次のような展開、サービスの充実をはかってまいります。
 ・登録サービスの拡充、変更
 ・ユーザによるサービスの取捨選択、呼び出し方の変更
 ・興味ジャンルや感性の違いに応じたバリエーションの提供
 ・更新系サービスとの連動により書き込み(クリッピング)機能の提供

また、新たに募集する登録サービスの提供者様と調整して誘導先ページの自動検索結果を改善。自動抽出されたキーワード周辺に、興味ジャンルにぴったりの関連情報や広告を掲載するよう、展開してまいります。

■5W1H Mextractrサイト ~ 5W1H Mextractrインストール
リンク

□ IEギャラリー  
リンク

このプレスリリースの付帯情報

5W1H Mextractrのプレビュー画面

(画像をクリックすると拡大画像をご覧いただけます。)

用語解説

□ IE8 RC1版について
米国時間2009年1月26日にリリースされた、次世代WebブラウザInternet Explorer 8 (IE8)の製品候補版。IE8は、アクセラレータによるサービスの早見機能や、WebSlicesによりページ個別にプログラミングすることなくWeb 2.0世代のサービスを簡易的にマッシュアップできる斬新な機能を搭載しています。

□ Mextractrについて
「Mextractr」(Metadata extractor) は、日本語テキスト、すなわち普通の文章から、5W1Hにまとめられる数百種類の固有表現(→※)を自動抽出し、表現の統一(正規化)や、数値化を行うサーバソフトウェアです。関連製品に、「Mextractr個人情報フィルタ」、「Mextractr for Mashup」があります。「Mextractr for Mashup」は、主にサーバー側でプレーンテキストをマッシュアップ可能な素材(Atom+GDATA)に加工します。カレンダーや地図、名簿や製品データベース等と連携させ、軽量・安価で高機能なエンタープライズ・マッシュアップ普及の一助となることを目指しています。
                                                     
※固有表現
 様々な固有名詞に数量表現、型番、コードなどを加えたもの。Mextractrでは、300種類以上の固有表現を定義し、5W1Hに基づいて体系化、階層化した意味属性を用いて解析しています。その結果は、フィードの一種AtomにGData、georss、UBL2.0、および、独自の拡張を加えた形で出力しています。

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。