お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

画像という情報媒体のイノベーション

2004/10/08 19:36
  • このエントリーをはてなブックマークに追加

以前に、平野啓一郎氏の小説に関するエントリ(『バベルのコンピューター』に見る新たなアポリア)を書いたとき以来、頭に取り憑いて離れない問題意識がある。

それは、「あるものの名前 − それ自体」の対比、「指すもの − 指されるもの」の関係、「識別子(ID) − 実体(Entity)」の結びつきにおいて、我々が「違い」を峻別できる識別子の空間がいかに狭いかということだ。

インターネットという空間の広さは、たった410ページの本のあらゆる可能性さえ汲み尽くすことができないことを、先述のエントリで証明した。それは、URLという文字集合による識別子の空間のサイズであり、人間が意識下に置くことのできる境界の認知限界でもあった。

■画像を識別子として用いるアイデア

そんなことを日々考えていたところ、こんな記事を見つけた。

CNET Japan : 文字よりも絵--記憶の仕組みを利用した新ナビゲーションプログラム「VisualID」

VisualIDs: Scenery for Data Worlds

現在主流のGUIベースOSでは、同じアプリケーションに従属するファイルには全て同じアイコンが付与される(例えば、「.pdf」の拡張子のファイルは全て一様なAdobeのマーク入りアイコンになる)。一方、VisualIDプロジェクトが目指すのは、各個別のファイルに対し、まるでファイル名の代わりのように個々のファイルに別々のアイコンを生成するというコンセプトである。

20041008-100404visualid.jpg

さて、私はこのVisualIDプロジェクトを、ひとまず素晴らしい着想であると讃えたい。一方同時に、このアプローチは完全に間違っているとも考えている。以下にその理由を述べよう。

人間の能力は、言葉を記憶し検索するよりも、画像を記憶し検索することの方が高速で、よりロバストである(誤差に強い)ことは一般に知られている。

このプロジェクトでは、こうした人間工学上の特性を使い、抽象・不定冠詞「a/an」の世界から具体・定冠詞「the」の世界へと画像の索引的効果を応用するものと言える。より詳しくは、コルモゴロフの複雑度を尺度として適当なエントロピーの画像(シンプル過ぎてもランダム過ぎてもいけない)を選び取り、似ている・似ていないの境界を極めて曖昧に(確率的に)定義し、それが参照する実体との結びつきを素早く想起させようという考え方である。

なるほど、なるほど。

そして、識別できる空間をできるだけ広くする(分散をかせぐ)ため、識別子として用いられる画像は無意味なものが選ばれる。このような考え方は、数学における無定義用語の概念と同じである。

さぁ、ここがダウトだ。

画像は、それを実体のままに扱うこと、その画像を見るという行為によって直接的に生じる表象(解釈、パターン符合)に価値がある。識別子として(言い換えれば、過剰なメタ化によって)意味的に無関係な別の何かを想起させるというのは、画像の機能ではないのだ。

「私」を示す最良のアイコン(のひとつ)は私の顔写真であって、三角や楕円などの幾何学図形ではない。示すものと示されるものを厳密に分離する抽象化の行き過ぎは、画像の持つ長所を殺してしまうだけだ。

■ビジュアルは抽象化の能力を必要としない

サヴァン症候群というものがある。一般に自閉症スペクトルのどこかに位置し、同時に何らかの特殊な能力を有する人々のことを指して言う。

10桁の平方根の解を一瞬で見つけたり、10桁の素数をたちまち列挙できたり、だれかが自分の生年月日をいえばそれが何曜日だったかをたちどころに教えてくれたり、これまでに読んだ1万冊の本をすべて丸暗記していたり、その能力というのは多種多様である。

そして、よく言われるように、これらの能力のほとんどはビジュアル処理と関係が深い。

◆天才と凡人の違い2〜サヴァン症候群と固有性という視点 2004.1.2

 わずか3歳にして、サッカー選手の素早い動きを正確に捉え、遠近法を駆使して高度な線画で絵を描くことができたナディア。
 一瞬にして通りすぎる貨物列車を線路脇に立って眺めるだけで、有蓋貨車が何台あったかを即座に言い当てられたジェレミー。
 一度聞いただけで、どんな難しい曲でも、どんな長い曲でも演奏できたレスリー。 
 サヴァン症候群の人たちは、概念でものを見ていないという。概念でものを見るということは、言語能力を獲得するということである。そしてこの特殊な能力は、言語能力が獲得されるとと失われてしまうのだ。

以下、中澤宏光氏のサイトからの引用とあるが、リンク先の筑波大学のURLが消えてしまっていたので、同ページから引用を引用する。

 《人間には「直観像」という能力がある。直観像は、言ってみれば写真のような記憶のことで、見たそのままを細部まで覚えており、それを頭の中に写真があるように思い出すことができる。
 ただこの能力は実際には子供の頃にはあっても、大人になるにしたがって消えてしまうという。
 物を見るとき、あるいはそれを記憶するとき、おそらくかなり言葉の影響をうけている。現代思想に大きな影響を与えた記号学の祖であるソシュールは、「ラング」によって、世界が分節化されているという(ここでいうラングは言葉と同じものと考えていい、厳密には違うが)。
 「ラングは、われわれと世界を媒介する関係の網目である。コップはコップという実体としてわれわれの眼に入ってくるのではなく、コップを他と区別し、理解するのである」
 ナディアは言語の発達が遅れていた。そのために彼女は上記のような言葉で世界を切って、見ることをせず、ありのままを受け取ることができたのだ。このありのままを受け取るのが「直観像」であり、言語の獲得と平行して失われる。ナディアの才能は、言葉を知らないから、花開いたといえなくもない》

さて、「直観」と「記号」、あるいは「特殊」と「一般」の対比において、言語能力とは普遍的な概念を括り出す能力であり、普遍的な概念とは社会において他の人と素早く表象を共有・交換する能力であり、「情報」というものの本質でもある。(余談だが、言語能力を持つ多くの人々は、単に多くの人と共有できるものを持っているからという一点においてのみマジョリティなのであって、どちらが健常だとか障害だとかいう議論にはまったく意味がない)

画像処理能力は先天的・原始的な能力であり、抽象化することもできるし、しないこともできる。だが、言語能力は抽象化の能力そのものである。

画像は、並行処理に長けた無意識下の脳のバンド幅をフル活用してこそ、即ち「抽象化しすぎないこと」にこそ価値があるのだ。

■曖昧な識別子としての可能性

URLの長さの上限は65,536文字であり、その情報量は最大で約21KBである(使用可能文字を83種と見なした)。一方、例えばMacOS Xのアイコン(128ピクセル平方のフルカラー画像)の情報量は最大で48KB程度である。この点だけを見れば、アイコン画像のありうる選択肢の総数はURLのそれよりも多い。

しかし、先述のエントリで述べたように、我々が目にして「何らかの意味を感じる」ことのできる画像は、デカルト平面に展開されたビットマップのあらゆる順列組み合わせの可能性からすれば奇跡のような確率でしか存在し得ない。そういった意味で、画像というのはひどくスパース(希薄)な情報媒体なのである。(つまり、65,536個の文字を読むこととアイコンを見ることとの間でスピードを比較するのは無意味で、むしろ性質上の違いに着目すべきということである)

画像に識別子としての十分な離散を期待するには、ある程度以上の面積+分解能と、それに伴う情報量的な冗長性が前提となる。従って、画像による識別子は、技術革新によって生まれた余剰能力をたちまち使い果たすような、そんな非常に贅沢な索引付けモデルになるだろう。また、画像は誤差を平準化する力が強いため、識別子といっても1:1の全単射である必要は全くなく、むしろN:1の対応関係を許し(例えば、同一人物の笑った顔の写真と表情のない顔の写真)、それを積極的に活用するものとなるはずだ。

厳密な検証を行ったことがあるわけではないが、実は文字を読むという行為だって、ある程度は単語や文節をひとまとまりとしてビジュアルに認識し、右脳の助けを借りて処理・推測するようになっていくものだ。画像というものを、単位面積あたりの情報量を増やす戦略として位置づけるのは、非常に効果的・有望なフレームワークである。半導体ほどではないにせよ、情報の集積度が向上することで、別種のイノベーションが起きる可能性は十分にある。

orkut以降のソーシャルネットワークが顔写真の掲載を当たり前のものにするというハードルを越えることができたのも、ネットワーク帯域やディスク容量の増加、デジカメの普及などの個々のイノベーションの蓄積があって、そこにちょっとした群衆心理学のエッセンスを加えることで実現したものである。この事例などは、画像が持つ非言語パワーの可能性を示す一つの徴候であろう。

文字ベースの識別子のように一対一の厳密な区別を必要としない用途、だいたいの輪郭、ラフな識別に必要十分な用途に向けて、画像による識別子というアイデアは大きな可能性を秘めている。

Peabo Bryson / Love Will Take Care of You

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー