お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

ソーシャルとセマンティックの関係について

2009/02/09 22:58
  • このエントリーをはてなブックマークに追加

プロフィール

野村 直之

『人工知能が変える仕事の未来』https://goo.gl/9N7cJE ・書籍帯の紹介文より: 「…ここ数年、毎日のように、人工知能についてのインパクトのあるニュースがいくつも流れる中、人工知能の産業応用について一貫して考えつづけた結論をまとめたものです。その背景には、筆者が1985年以来、職業的にAI、自然言語処理の研究開発に従事し、1993年から1994年にマサチューセッツ工科大学人工知能研究所の客員研究員(Visiting Scientist)として、ノーム・チョムスキー(自然科学としての言語学を創始)、マービン・ミンスキー(人工知能の父)、ジョージ・A・ミラー(認知心理学の開祖、ワードネット[WordNet]プロジェクトを創始)他の薫陶を受けながら脳内の言語知識のモデルを研究した経験、その成果を踏まえて、類似検索の体感精度を改善したり、高精度な文章要約システムを開発したりした経験があります。  …AIの産業応用や、AIが浸透した社会における人間の役割、教育のあり方などに興味、関心をもっておられる方に、必ずや、お役立ていただくことができると思います。  (「はじめに」より)」
ブログ管理

最近のエントリー

先般ご案内していた2月4日のビジネスモデル学会第10回KM研究会は、おかげさまでほぼ満場のご参加をいただき、大変盛り上がりました。最も活発にご質疑・ご討論に参加された3名にOK Wave兼元社長からのご献本3冊を無事贈呈。大半の方にご記入いただいたアンケートにも、密度の高い基調講演他への感謝のお言葉、鋭いコメントがちりばめられていました。皆様どうもありがとうございました。

 

私自身はパネルの司会に先だって、ソーシャルとセマンティックの関係について講演してまいりました。

"Social with Semantic"

  題名が韻を踏んでいるのは、内容的にも面白い対称性、双対性があるからであります。「グランズウェル」によってソーシャル・テクノロジーによる顧客(Crowd)の変化と、CRM(顧客関係管理)の劇的変化の流れが昨年まとめられたので、今後はどうなるだろう、と考えたわけです。

 学会では事例を深く掘り下げて分析し、理論、基礎的な考察から未来予測をする、というスタンスが求められます。そこで温故知新。10数年前のナレッジマネジメント(KM)と現在のソーシャル技術インフラとは質的、量的にどう違うかなど議論しました。

 これらの議論については後日、当日の記録をKM研究会事務局サイトで公開するとして、ここでは自分自身の着眼点に触れます。次のスライドにあるように、当初のSemantic Web、AI研究では、「有用なWeb空間を建設するために人々(Social)がメタデータや、オントロジー(メタデータ間の関係、構造)を手分けして記述すべし」という関係にあった。だから、うまくいかず、 Semantic Webも長年日の目を見なかったのではないか、と指摘。

 図中でGDAというのは、元産総研・現サイバーアシスト研究所の橋田浩一さんの提唱したGlobal Data Annotationのタグセットのことです。品詞など、言語的な属性を記述する仕組みが豊富で、野村の研究開発にとっても身近で馴染みがあったためにたまたま例としてあげさせていただきました。他にも、NTT研究所の淵さんが、一般ユーザに楽しみながらメタデータを付与してもらうオンライン・アプリケーションを10年位前に提唱されたのが先駆的な動きでした。アカデミックな研究が象牙の塔を出て、実社会(といってもサイバースペースですが)との接点において知識インフラの成長をはかろうとしたのは、「2.0」の先駆けだったかもしれません。OK Waveよりも先行していましたが、一般ユーザが「品詞」などを楽しんで付与するとは考えられず、無理があったともいえるでしょう。

 ともあれ、ソーシャルの手を借りて、「あればめちゃくちゃ役に立つ」メタデータやその構造(オントロジー)を拡充しようとしたわけです。メタデータをコーディングする人を外注で雇い、巨額の研究費を使って少量のデータを作ろうとしていた90年代初頭までの国家プロジェクト的やり方ではうまくいかなかったし、もうお金もない、という事情が手伝っていたといえるでしょう。多数の一般ユーザの手をボランティア的に借りてセマンティック・Web的な仕組みをを建設しよう、という流れは前世紀末頃から目立ってきたわけであります。

 その後、 Web 2.0で、データがとことん重要であり、ユーザ参加、そして、分類カテゴリ自体も、フォークソノミーという形で、緩く民主的に、ボトムアップに決めていく、という流れが、主流にまでなりました。大手WebサイトのCGM (Consumer Generated Media)、UGC (User Generated Contents) をテコにビジネスを拡大し、先行者利益を確かなものにする、という激しい競争原理の中で淘汰され、生き残ったやり方だ、ということもできます。

 そんな中から、斬新で有用なアプリケーション機能も少しずつ現れ、SNSの様々なバリエーションによって、UGCの蓄積が進みました。四季折々の金閣寺の写真の中からぴったりのものを1枚選んで引用したければ、英語サイトのFlickrに行った方が便利で早いという時代がありました。しかし、Kinkaku-ji templeの写真が数万枚になってくると、 こんどは選ぶのが大変になります。それを解決するのに、意味的な属性(何月何日の何時頃、どんな天候の下でどの角度から、どう撮ったか)や、写真自体の解析結果、そして、主観的な評など、様々なメタデータが付いていることが決定的に重要です。このことを明らかにしてくれたのが、Web 2.0の大きな功績でした。情報量の爆発の結果、そうなるのは見えていた、という主張もありましょうが、後出しじゃんけんの主張よりは、実社会で実証されたことの意義を高く評価することができます。

 昔軍事用のプロトタイプ製品が最高の機能・性能・品質を達成して(MIL規格)、それを民生用におろしていた時代は終わり、今は正反対に、民生用、それも無料サービスの中で実験的な先端サービスが提供された後で企業向けに徐々に取り入れられるようになりました。「これを”IT Consumerization” と呼ぶ」と、リアルコムの吉田健一取締役が2年ほど前に日本語でわかりやすく解説してくれています。

 では、企業内や、地域コミュニティの内側で、インターネット全体で成立したようなソーシャルによる知識集積、コンテンツの集積や構造化が進展するものでしょうか? まず、参加者の絶対数が4、5桁少ないというハンディはいかんともし難いものがあります。あるテーマを細分化した興味ごとに、優秀な知見が違いに刺激し合って蓄積、成長していくほど、多数の専門家が控えている、という贅沢な前提は無理です。企業やコミュニティがある特定の専門テーマに特化している、とはいっても、その業界全体の知識や知恵をカバーしきれるものではありません。研究開発にしてもマーケティングにしても、それより2桁、3桁多い専門家が外部に記述した知識を活用するのが必須となるでしょう。

 しかも、そのような知識、情報を手動でタイムリーに、必要となったコンテクストの中で「使える」形で取りこむのは至難です。常勝を誇るにはスーパーマンのような情報処理能力と、膨大な時間が必要。本業の合間にそうそう時間を捻出できるものではありません。 となると、人間に変わって、コンピュータ・エージェント、ソフトウェアの仕組みに代行させるしかないのではないでしょうか? メタデータの自動付与、メタデータ間の関連付け、メタデータを活用した高精度の検索と、それを支える、メタデータやオントロジーの共通化、標準規格が求められます。そうなってはじめて、バックに控える膨大な母集団情報からノイズレス、ピンポイントで必要な知識や情報だけをとってこれるようになる可能性があるのではないでしょうか。さらに、エージェントが新しい有用な情報や構造の候補を提示して、知識拡充自体も強力に補助することで、コミュニティ(あるいは個人)を中心とした知識拡充のサイクルが回っていく、という考えです。

"Crowd with Cloud"

  低コスト、特に初期費用が格安で済み、その後も「使っただけ」料金を払えば良い仕組みとして、Cloud computingが注目をあびています。サーバやデータの保守の煩雑さから解放されたい、というニーズも大きく、不況の今こそSaaS、Cloudへの流れが一挙に加速する可能性は大いにあります。

 これらは一般によく言われていることなので、KM研究会としては、ナレッジ創成、ナレッジ活用の仕組みとして今世紀になって注目されているCrowd Sourcingと結びつけて考えてみました。上図が現状を表し、下の方の図は、5〜10年後の姿を予測したものです。

 上図では、ネット上の様々なマッシュアップの仕組みを利用して、自分にとって簡単便利なインタフェースを介して、背後の膨大な情報、知識を活用する姿を描いています。自分にとって簡単便利なインタフェースの究極の1つが昔のアッシー君、メッシー君に変わる、「ググ夫くん」「ぐる夫くん」。情報やレストランを検索するようなノイズにまみれた汚れ仕事はそれが好きで得意そうなボーイフレンドに任せてしまい、自分はケータイのメールを彼(ら)に送って待つだけという最近の若い女性のライフスタイル(?)です)。

 本人が自らやるにせよ、代行してもらうにせよ、質の高い、有用な知識、情報をピンポイントで手に入れるにはコツが要ります。IE8アクセラレータのような「加速」の仕組みが求められるのは当然として、 その上の実際のサービス・メニュー、具体的な個々のコンテンツ・サービス、その仕組みを予め選定して、自分にとって便利な七つ道具のように整備、常備し、いつでも一瞬で取り出せるようにしておく必要があるのではないでしょうか。このように「なんとか用」「さらにこんな目的、状況で絞り込む場合」などの、道具の使いこなしノウハウみたいなものをオンライン・ツールの中に履歴、設定パラメータ(コントロールパネル)、メタデータ、オントロジー、のような形で保存しておく必要があるでしょう。

 こうして、手元の道具が洗練され、発達していくと、それをCloudに投げて共有し、お互いに便利になろう、という側面からも、 Cloud Computingが進展していきそうな予感がしています。さすれば、さまざまな基本的な道具自体もCloudからその都度引っ張ってきて(Excelの計算式が瞬時に世界中からピンポイントで現れてくれるイメージでしょうか)、どうしても新作が必要なもの、ローカルでしか通用しないものだけ、コミュニティや個人の手元の手製の道具箱を使う、ということになるでしょう。CommunityはCommunity Cloudを使い、個人はPersonal Cloudを使う。個人は、なんらかのコミュニティに属して、主体的にCrowd の知識拡充に関わったり、お隣のコミュニティに助けてもらって知識、情報を借用したりする。借用するのは、知識、情報そのものであったり、それをその場で作り上げるためのデータ構造化のノウハウ、すなわち、メタデータやオントロジーのローカル規格だけかもしれません。

 2月4日のKM研究会では、以上を15分程度で駆け足で喋りました。事後もメールでご質問、コメントいただき、大変感謝しております。そんな中から、かつて大変お世話になった、リコーの金崎技師長とのやりとりを引用し、本稿を締めくくりたいと思います:

・・・ご指摘のポイントは考えたことがなかったので有り難かったです。
kanasaki> SemanticがSocialに奉仕するというとき、Semanticは
kanasaki> さまざまなものに奉仕できてその一つがたまたまSocialなのか、
kanasaki> あるいはより本質的なつながりがあるのか・・・

 ソーシャルは、ネット全体に比べると非常に小さなコミュニティ規模("社内"は全てそうですね。社内の同好の集まりとなると社員数の数10分の1、数100分の1以下でしょう)では、どうしてもセマンティック技術を必要としていると思います。その逆ですが、、まず、コミュニティから編集、エッセンスを抽出した結果をグローバルなSemantic Webにある程度の知識フレームをもっていくべき(個人もコミュニティ「世界」に貢献したいはずだから)。
 こう考えると、普遍性のあるセマンティックのかなりの部分は、ソーシャルか産み出され、あるいは少なくとも検証されていく(そういえばオバマ政権で特許の審査に"市民レビュー"というWeb2.0的ソーシャルの仕組みを導入すると宣言されましたね!)、という意味で、セマンティックの発展も、ソーシャルに負うところが大きい、といいかとおもいます。

 

ps. 変わり種のIE8アクセラレータ "5W1H Mextractr" をリリースしました!

 プレスリリースでは、「主要21社」の1つに入れていただきました。"メタデータ" "IE8" で検索してみてください。

 マイクロソフトさんの下記公式サイト、または Mextractrサイトからインストールできます。便利な使い方など、時々ご紹介してまいりたいと思います。誘導先サービスや新機能のリクエストなど、いつでもコメントください。

http://ieaddons.com/jp/Details.aspx?Id=1912

おかげさまで好評で、ダウンロード数、評価数ともに好調です。

http://www.mextractr.net/  (FF3で使いたい方はこちらからどうぞ)

 

pps. 2/4 の開催にあたっては、日本印刷出版技術協会JAGATさんに会場を提供していただき、大変お世話になりました。この場を借りて、御礼申し上げます。

 

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー