お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

なぜARよりセマンティックがWeb 3.0に相応しいか?

2009/03/09 18:30
  • このエントリーをはてなブックマークに追加

プロフィール

野村 直之

『人工知能が変える仕事の未来』https://goo.gl/9N7cJE ・書籍帯の紹介文より: 「…ここ数年、毎日のように、人工知能についてのインパクトのあるニュースがいくつも流れる中、人工知能の産業応用について一貫して考えつづけた結論をまとめたものです。その背景には、筆者が1985年以来、職業的にAI、自然言語処理の研究開発に従事し、1993年から1994年にマサチューセッツ工科大学人工知能研究所の客員研究員(Visiting Scientist)として、ノーム・チョムスキー(自然科学としての言語学を創始)、マービン・ミンスキー(人工知能の父)、ジョージ・A・ミラー(認知心理学の開祖、ワードネット[WordNet]プロジェクトを創始)他の薫陶を受けながら脳内の言語知識のモデルを研究した経験、その成果を踏まえて、類似検索の体感精度を改善したり、高精度な文章要約システムを開発したりした経験があります。  …AIの産業応用や、AIが浸透した社会における人間の役割、教育のあり方などに興味、関心をもっておられる方に、必ずや、お役立ていただくことができると思います。  (「はじめに」より)」
ブログ管理

最近のエントリー

  拡張現実AR (Augmented Reality)も、セマンティック技術も、10年以上前から研究者が有用性をアピールしてきた、古くて新しい技術です。このブログは後者に軍配をあげる立場です。セマンティック技術の方が今後切実に必要とされ、Web 3.0の本命になる、との確信の下で書いています。そんな者にとっても、最近ARという言葉を聴く機会が増えてきました。

  筆者の知人だけをとってみても、KNNの神田敏晶さん、そして、日経BP社 IT Proの何人かの記者さんは、ARにコミットしておられます。 元NECの同僚だった暦本純一さんも創立にかかわったクウジットさんもARの関係だし、他にも多くの研究室から飛び出しそうな技術が日本にはあります。(数年前に情報処理学会大会で画像解析&合成の応用のセッションの座長をお引き受けして感心して発表に聞き入ったことがあります)

  少々強引ながら、印刷・出版業界さんのいう「クロスメディア」なコンテンツの扱いもAR的な情報メディアの進化、拡大の方向性、といえるかもしれません。Cnetブログでも経産省の村上さんが非常に説得力のある論考を、豊富な事例とともに、あげておられますね:

印刷改革のヒントは、印刷の中にある

  それでも尚、セマンティックこそが次世代Weの本命と確信しています。それは、メディアの表現力を拡大拡張するという、ユーザ、消費者を疲弊させる方向(広告・マーケティングは往々にしてこの方向ですね)とは正反対を向いているからです。人々の自然な意味記憶に沿うように情報を絞り込み、わかりやすくアレンジして必要最小限、控えめに伝えようとするのがセマンティックだからです。

  多くのユーザは、メールボックスを見るのが苦痛で不快になっています。情報爆発の中でおぼれかけ、押し流されそうになっているにもかかわらず、欲しい情報には行き当たらない。いや仮に、必須の情報・知識が目の前を通り過ぎようとしていても、それが分かり易い形で「私はあなたに必要ですよ!」とアピールしてくれないために、見過ごしてしまう。

  こんな絶望的な状況を解決してくれる技術こそ必要不可欠ではないでしょうか?

「ぼくは毎朝5000本のフィードに目を通し必要な記事は全部読んで反応している」と豪語するようなマッチョな人もいます。※そんな人の中にも、案外他人のイベントに足を運ばずに情報の意味を正しく理解しないまま表面的なトレンドに流されている人もいるかもしれませんが。

  でも、大多数の普通の人は、検索結果のランキング20番目までに、欲しかったものと全然関係のないものが数本でもヒットしていたら、それらに気をとられて、本来求めていたモノが何だったか忘れちゃったりするのです! こんな野蛮な状況をあと5年も10年も長続きさせて良いでしょうか?

  良くないとすれば、現行のWeb検索エンジンなんかよりももっと高精度に、人間の意味理解、意味記憶に沿う形で、適量をわかりやすく提示してくれる(もっと言えば広告なんか見せない)システムが強く求められているのではないでしょうか。

  1992年頃、フィラデルフィアのペンシルバニア大キャンパスで、George A. Miller先生(人間の短期記憶バッファが非常に小さいことを証明した論文"Magical Number 7(+-)2"をきっかけに認知心理学を創始された人)とWordNetのことで打ち合わせした際、情報爆発への対策について議論したことがあります。ヒトの感覚器官や言語処理能力、短期記憶を急に進化させるのは無理なので、結局長期記憶・2次記憶とスムーズにインタフェースを組んだシステムが必要なのではないか。長期記憶は意味記憶とも呼ばれます。自分が世界を理解した結果としての広大で複雑な知識体系にカッチリと紐付け、組み込まれること(つまり【理解】すること)で記憶が定着する。

  このように丸暗記(=短期記憶。一方「語呂合わせ」は疑似意味理解・疑似長期記憶でしょうか)でなく、ヒトが情報を自然に消化吸収して正しく対応するためには、長期記憶に照らした意味理解が不可欠。そこで例えば、ベタ書きのテキストの塊でなく、そこからメタデータを抽出して大見出し、小見出しとし、インデントした箇条書きに変換するなり、関連図を自動検索して引用するなり、というアシストを行えば、理解は速まり且つ深まるのではないか。

 それが出来るなら、システムが、長期記憶に照らした意味理解を支援することが出来たことになる。このような一連の技術は、まさにセマンティック技術と呼ぶべきでしょう。このような支援には、コンテクスト(作業文脈)の補充や、コンテクスト・スイッチ(背景、話題、ゴールがガラリと変わったこと)を強く印象付けるためのアシストも必要でしょう。その類としてARなりVRが機能するのであれば、セマンティック技術の仲間として大歓迎。だから、ダイナミック・ドリル・ダウンや音声による ガイダンスなどのリッチなUIはとても大切だと思います。

 

  以上、題名は少々挑発的、挑戦的だったかもしれませんが、わりとオーソドックスなことを書いているかと思います。あまりにユーザ本位なため、広告や、派手なIT投資(ハードが絡むとコストが跳ね上がりますね→※)に背を向けているところがあるやもしれませんが、そんなソフトウェア・ベンチャー仲間がどんどん出てきて欲しい、と思っております。

→※「派手なIT投資」が嫌悪され、「コスト削減」提案に注目が集まる不況だからこそ我々に大きなチャンスがあります。変化(チェンジ!)が求められています。IT投資のコストパフォーマンスを劇的に改善しなければなりません。定量的なコスト削減効果の数値ROI(Mextractrでの一例)を提示すべく、我々も頑張っています。

 

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー