お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

12のセマンティック・サービスを紹介

2009/02/14 23:58
  • このエントリーをはてなブックマークに追加

プロフィール

野村 直之

『人工知能が変える仕事の未来』https://goo.gl/9N7cJE ・書籍帯の紹介文より: 「…ここ数年、毎日のように、人工知能についてのインパクトのあるニュースがいくつも流れる中、人工知能の産業応用について一貫して考えつづけた結論をまとめたものです。その背景には、筆者が1985年以来、職業的にAI、自然言語処理の研究開発に従事し、1993年から1994年にマサチューセッツ工科大学人工知能研究所の客員研究員(Visiting Scientist)として、ノーム・チョムスキー(自然科学としての言語学を創始)、マービン・ミンスキー(人工知能の父)、ジョージ・A・ミラー(認知心理学の開祖、ワードネット[WordNet]プロジェクトを創始)他の薫陶を受けながら脳内の言語知識のモデルを研究した経験、その成果を踏まえて、類似検索の体感精度を改善したり、高精度な文章要約システムを開発したりした経験があります。  …AIの産業応用や、AIが浸透した社会における人間の役割、教育のあり方などに興味、関心をもっておられる方に、必ずや、お役立ていただくことができると思います。  (「はじめに」より)」
ブログ管理

最近のエントリー

先月、2008年の10大セマンティック・ウェブ・サービス紹介ページについてのブログを書きました。さらに、2007年のtop 10を加え、本コーナーでまだ取り上げていない下記のサービスを取り上げた講演会を2/16東京・杉並で開催。次回のブログで、当日の様子を軽くご報告したいと思います。

「ビジネス活用がすすむ次世代ウェブサービス 〜Web2.0からEnterprise2.0へ 〜セマンティック・サービスの現状と未来」

 開催日程・開催時間:2009年02月16日(月) 14:00-17:00(受付開始:13:30より)

 日本ユニシス小林茂,日立システムアンドサービス湯本正典,ナレッジワークス亀山悦治, メタデータ 野村直之 (以上、講演者)

 

「セマンティック・サービス」 講演の目次

 「エンタープライズ・サーチの次のハイライトはセマンティック技術の取り込みである」、と野村総研さんがぶちあげてくれたのを引用(インプレス・ビジネス刊「IT Leaders」2009年2月号)。セマンティックがいよいよ「3.0の本命になる」ことを、本講演の事例を通じて皆様に体感していただけるかと存じます。

 

 

目次全体はこうなっています:

1.本講演の狙い、背景
    Enterprise2.0 ,特にソーシャル関連市場予測
    なぜ今“セマンティック”が必要か?

2.セマンティック・サービスの事例
   - Twine, Inform, Evri
   - hakia , Powerset, Zemanta
   - Faviki,Juice
   - TripIt!  UpTake

3.  セマンティック技術の実際
 〜5W1H Mextractr とOpenCalais 
    マッシュアップによる応用
    印刷・出版オンライン化で付加価値化を達成するヒント

 

企業内で「なぜ今“セマンティック”が必要か?」

言い換えると、 「ネット全体で成功した “ソーシャル” は企業でも本当にうまくいくのか?」

 ・懸念: 圧倒的に少ない母集団 (参加者数が4〜5桁以上異なる)
・ファシリテータ不足、活性化スキル不足
・社内外のリソースを横断で関連付けるニーズが大
・キーワードレス(ゼロターム)検索など「ぞんざい」でリアルタイム性の高い要求
 例:「去年の暮れに隣の事業部の偉いサンが出してインパクトのあった10頁位のレポートを出しておいてね。」

   エンタープライズでは、ネット全体に比べると、圧倒的に人手不足なのでそれを代行する、エージェント的な機能が必要。このようなシンプルな論理で、セマンティックの必要性を概括します。今回ご紹介する事例がどこまで気の利いたものになっているかは評価中。一般(BtoC)向け公開サービスが先行して厳しい試練に耐え、強力に実用になる形で数年以内に企業に入ってくるのは間違いないと思います。

 ※だって上記のように、ニーズは外部Webよりはるかに強いのですから!!

 

ご紹介するセマンティック・サービスの概要

Twineは、外部からクリッピングした知識的なものに半自動でメタデータ、その間の関係(オントロジー)を付与します。精度、不足を補うソーシャルの仕組みも備えています。

 Informは、オンライン出版社のコンテンツを分析し、出版社の独自のコンテンツアーカイブ、また関連したサイト、ウェブ上の大量のコンテンツへのリンクを作成するサービス。

Evriは、Web上に掲載されている、コンテンツ、ニュースなどに登場する、
人、場所、モノ などを関連付けて表示する検索エンジン。SPYSEEに似ているようです。「search less. understand more.」として、検索試行回数少なく、意味のある関連情報を次々に手繰れるよう、目指しています。

hakiaや、Powersetは、検索ワードの意味を解釈するセマンティック検索エンジン。
様々な工夫を凝らして、現在のWeb検索エンジンとはまるで違って、検索意図を反映した、ノイズの少ない結果を出してきます。

Zemantaは、ブロガー入力した文章を解析し、幾つかのサイトから関連情報(写真、文字情報)を自動抽出します。画面に表示された自動検索結果をブログに取入れるUIもシンプルで使い易いようです

favikiは、ブックマークレットによりタグを付けるタイプのソーシャルブックマーク(Webページにタグを付ける)。Folksonomyだと発散してしまいがちなのを、Wikipediaにある用語をタグにうまく統制してくれるようです。自動メタデータ付与ではないけれど、14の言語に対応し、例えば日本語と英語の結びつけが可能。タグの一意性(概念の同一性)を機械翻訳経由で英語版wikipediaで確保しているあたりが、世界知識ベースの基礎としての片鱗を見せてくれている感じです。

juiceはZemantaと似た自動検索系のサービス。Webページ上で選択した領域に関する関連情報をサイドバーに表示。画像,動画をサイドバーに貯め込むことができるという、ユニークなブックマークです。自然言語解析により,文脈に合わせた情報を提示する「知的発見エンジン」と称しているようです。

TripIT!とUpTakeの概要は、前のブログをご参照ください。

Mextractr(日本語)とOpenCalais(英語)はいずれも、普通の文章から5W1H的なキーワードを自動抽出するエンジンです。

以上について、API(あれば)がどうなっていて、どんな複合アプリが組めそうかの感触もお伝えします。また、一部についてはビジネスモデルや活用アイディアに踏み込んでお話、デモができると思います。さらに、MextractrとOpenCalaisについては仕組みや、意味分類体系などのリソースについてもご紹介。

 

今後、各サービスの最新状況を含めて、本欄からもお知らせしてまいりたいと思います。

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー