お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

13のセマンティック・サービスを紹介させてただきました

2009/02/27 20:30
  • このエントリーをはてなブックマークに追加

プロフィール

野村 直之

『人工知能が変える仕事の未来』https://goo.gl/9N7cJE ・書籍帯の紹介文より: 「…ここ数年、毎日のように、人工知能についてのインパクトのあるニュースがいくつも流れる中、人工知能の産業応用について一貫して考えつづけた結論をまとめたものです。その背景には、筆者が1985年以来、職業的にAI、自然言語処理の研究開発に従事し、1993年から1994年にマサチューセッツ工科大学人工知能研究所の客員研究員(Visiting Scientist)として、ノーム・チョムスキー(自然科学としての言語学を創始)、マービン・ミンスキー(人工知能の父)、ジョージ・A・ミラー(認知心理学の開祖、ワードネット[WordNet]プロジェクトを創始)他の薫陶を受けながら脳内の言語知識のモデルを研究した経験、その成果を踏まえて、類似検索の体感精度を改善したり、高精度な文章要約システムを開発したりした経験があります。  …AIの産業応用や、AIが浸透した社会における人間の役割、教育のあり方などに興味、関心をもっておられる方に、必ずや、お役立ていただくことができると思います。  (「はじめに」より)」
ブログ管理

最近のエントリー

  前回「12のセマンティック・サービスを紹介」を書いてから少し日が経ってしまいました。

※あまり間があくと、ブログ自体が削除されかねないので今後は注意しなくては。。

 さて、当日は、本ブログからご招待した方を含め、皆様、熱心に聴講、コメントいただき、まことに有り難うございました。当方も勉強になりました。勉強といえば、講演者4名が、自分の担当分以外について勉強になり、有意義でした。改めて、企画をされたJAGATさんに感謝申し上げます。

 内容ですが、最初、なぜWeb 3.0世代でセマンティック技術の台頭が見込まれているか、市場動向をふまえてお話しました。下図のようにエンタープライズにソーシャルの要素がどんどん入ってくる中で、外部のWebと比べて圧倒的に「人材不足」だから、というのが1つの大きな理由です。

 

「ネット全体で成功した “ソーシャル” は企業でも本当にうまくいくのか?」

・懸念: 圧倒的に少ない母集団 (4〜5桁以上異なる)
・ファシリテータ不足、活性化スキル不足
・社内外のリソースを横断で関連付けるニーズが大
・キーワードレス(ゼロターム)検索など「ぞんざい」でリアルタイム性の高い要求
 例:「去年の暮れに隣の事業部の偉いサンが出してインパクトのあった10頁位のレポートを出しておいてね。」

 この論点については、次回詳しくご紹介予定の、3/16 セマンティックWebコンファレンス2009のパネルにて討議予定ですので、さらに考察が深まりそうです。パネリストとして、楽しみにしております。

 以下、13の セマンティック・サービスを1つ1つご紹介したいところではありますが、他の講演者の分については、もう少し自分自身で咀嚼し、新たな解釈を加えてから、と考えています。そこで、「12」がいつのまにか「13」に変わった、追加分だけ取り上げて書くとともに、自分自身の発表から図面を引用して解説、ご報告したいと思います。

 メタデータのグラフ表現上の探索エンジンiMageのアプリ「人材マッチングシステム」

 

 直前に追加された講演は、iMageとその応用の紹介でした。紹介者は日本ユニシス小林茂さんです。iMageは、NTT情報流通プラットフォーム研究所NTTソフトウェアの共同研究の成果物。information Mixable graph explorerの略で、「アイメージ」と読みます。ほぼ一定の構造、形式で書かれた研究プロジェクト提案書とその付属資料(参考論文集が多いようです)から研究者、論文、プロジェクト、技術名、コミュニティの関係図をグラフの形で抽出します。受け皿となるXML言語は、W3Cによる"本家" SemanticWebの規格RDF, RDF-Sなどです。下図にその例があります。

 

 http://www.ntt.co.jp/journal/0804/files/jn200804062.pdf を元に小林茂さんが作図。

  iMageは、このようなグラフ構造を作り、類似の構造、パタンをみつけるソフトウェアです。新たな知識・情報の抽出・発見を行う次世代Web流通エンジン、と位置づけられています。このiMageエンジンの1アプリケーションとして、人材マッチングシステムを開発し、評価実験した結果が、 NTT技術ジャーナル 2008.4  に報告されています。

  SemanticWebの規格で表現したグラフ構造、その上のラベルの類似性から,プロジェクトに必要な人材やそのavailabilityを、広範囲から探索したりできるアプリを実際に作ったところが素晴らしいと思います。グラフ構造のデータさえ整備できていれば、

「ある技術について詳しい人」
「ある技術についてSNSにおいて積極的に交流している人」

など、比較的 "柔らかい条件" で検索して、視覚的にわかりやすく 表示するのも容易と思われます。

iMageというエンジンの汎用性、スケーラビリティなど興味は尽きないです。今後の類似研究や、ビジネス化に大いに期待したいところです。

 

Mextractrの動作原理他

 今回、Mextractrは、OpenCalaisと対比して解説いたしました。Mextractrの場合、日本語のプレーンテキストを入力として、AtomにくるんだGDataの形で5W1H抽出結果を出力する、ということで、入出力仕様はわりと単純です。そこで、内部構成や動作、そして、中間段階で活用している自社製の意味分類体系コードをご紹介しました。

 

  さらに、5W1Hごとに色分け出力された結果をアルバイトさんが快適に編集できる5W1Hエディタを用いてDB上のXMLを編集し、そうして加工したデータを本番Webサーバにdeployして運用するイメージをご紹介。

  今月発表の最新アプリとして、皆様に使って頂ける、アクセラレータ版5W1H Mextractr (IE8とFireFox3で動きます)のデモをお見せしました。皆様、こちらからインストールして是非使ってみてください。なお、FireFox3の方は、これを先に入れておいてください。

 

  メイドめーるの画期的な点、すなわち、push型でスケジュールや付加情報(天気予報など)を教えてくれたり、何より、メイドさんに「お返事が書ける!」、「予定を読み取って自動でマイ・カレンダーに登録してくれる!」という点をアピールさせていただきました。

 

 

 

国内でも今後セマンティック技術活用へ

  結論はこれでございます。

 

以上です。

なお、総計122枚の入魂のスライドがございます。

是非見てみたい、という方には、何らかの方法で個別にお渡ししたいと存じますので、適宜コンタクトしてください。

 

 

 

 

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー