お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

平野啓一郎『バベルのコンピューター』に見る新たなアポリア(後編)

2004/07/02 00:04
  • このエントリーをはてなブックマークに追加

昨日のエントリでは、『バベルのコンピューター』が次々に産み出す1.3MBのテキストデータが、280台のパソコンで構成される分散システムによって黙々とハードディスクに書き込まれていくということについて、特に性能面での技術的なリアリティについて皮相的な批評を行った。

そこで次に、

「記録されたデータに対してどのようにアクセスできるか?」

というより本質的な問いかけが、以後の検討の主題である。

■神は知性に何を託したか

論を進めよう。

ここで『バベルのコンピューター』によって生み出された「途方もない数ではあるが無限ではない」数の本たちは、それぞれを「いかに呼び分けるか」という新たなアポリア(難題)に直面する。

我々は一般に、本にタイトルや著者名、出版社、刊行日などのメタデータを付加することで、その本をそれ以外の本と区別している。(以下では簡単のため「本」と「タイトル」の関係だけに絞って議論する。即ち、タイトルは決して重複せず、それだけで本を一意に呼び分けられることを前提とする)

しかし、完全にランダムなアルファベットと記号で1,312,000文字が埋め尽くされた一連の本には「その1,312,000文字よりも短いタイトルを付与することができない」という驚くべき逆理が出現する。

具体的に言えば、例えば『バベルのコンピューター』が生成した各々1.3MBのデータを通常のファイルシステムに保管するとすれば、そのファイル名は1,312,000文字の長さとなる(もちろん現行のファイルシステムでは不可能である)。あるいは、オラクルなどのデータベースに格納するとすれば、データ列に対してキー列を設けることが無意味となり、インデックスの付与は不可能である(本文自体をテーブル上でフルスキャンする以外の方法がない)。従って、それぞれの本をどう格納するか、あるいはどう検索するか、という根本的な問題に行き着いてしまう。『バベルのコンピューター』の実装は設計段階でつまずくかも知れないわけである。

より科学的に言えば、例えば「1,312,000文字の『A』が並んだ本」や「1,311,999文字の『A』に続いて1文字の『B』が登場する本」のように、ある明白な特徴を持つ本に限ればこのように短い別名を与えられる可能性が(上述の別名には29種類のアルファベット以外の漢字・平仮名・数字・記号を使っていることは差し引いたとしても)残されているが、29種類の文字が1,312,000個並んだ本すべてに対して同じ29種類の文字の組み合わせだけでより短い別名を与えるような命名規則(アルゴリズム)は絶対に存在しない。言い換えれば、本文の1,312,000文字よりも短い名前でそれを呼ぶことができないという圧縮不能性、情報エントロピーの既約性の問題に行き着く。(別名群の一部を本文より短く、同時に一部を本文より長くすることは可能であるが、こうした別名群全体の大きさを本文群全体の大きさより小さくすることは決してできない)

データ圧縮の基礎

「『バベルのコンピューター』によって生成される本は、個々にではなく全体として見れば完全に均一なランダム状態であり何らパターン(偏り)を持たない」ということは、ある本を取り出したときに「1,312,000文字の『A』が並んだ本」のように本文それ自身よりも簡約に(かつ可逆に)表現できる可能性があるかどうかを事前に知る方法は決して存在しないことを意味している。

これは「19文字以内で記述できない最小の自然数(という言明が19文字で記述できてしまう)」というベリーのパラドックスに端を発したチャイティンの情報理論の着眼点そのものであり、そしてこれに先んじて存在したゲーデルの不完全性定理、チューリングの停止定理など、すべて本質的に同等の「自己参照のパラドックス」に帰着する。原理的にこれほど単純な初等算術の問題としてでさえ、自分で自分を説明しようという試みは奏功しないのである。

ここでソシュール言語学の視点で言い換えれば、シニフィアン(記号)とシニフィエ(対象)の結びつきの恣意性の由来は、人類が地域やコミュニティによって各国語へと分化していくヒューリスティックな過程であると解釈することができ、さらにもう一歩踏み込んだ審級において、シニフィアンがシニフィアンのインデックスとなるself-referenceな状況下では、各国語を操る人類がシニフィアンのもつ情報量をシニフィアンによってヒューリスティックに圧縮する過程であると解釈することもできる。つまり、一冊分の本文という文字集合に対してタイトルという文字集合が一対一の双方向の関数として存在すること自体が、シニフィアンそれ自体の可約性を内包していたわけである。

ソシュール思想の基本概念

即ち、索引が作れないということは「『単語(辞書)』や『文法』が存在し得ない」という言明と同値であり、チョムスキーを代表とする言語の形式性を重視する生成文法論者にも意味性を重視する認知言語学者にも、等しく叩きつけられた哲学的命題である。

しかし、現実に圧縮不可能な記号(例えば{2,3,5,7,11,13,...}と続いていく無限の素数列)に遭遇したときに人類が見せるふるまい、例えば一定の忠実度以内のひずみを許しながら不可逆な縮約を行う(例えば「無限の素数列」という言葉でその一切を完全に表現できているフリをすること)という行為はどこからやってくるのか。そもそも、記号とは、言語とは、情報とは、知性とは、何であるか。

■テクノロジーの限界、数学の限界

平野は更に、こう指摘する。

(20)サイバー・スペイスでの発表は、放出された文字群が検索エンジンを混乱させるとして批判する向きもある。これに対して、オリッチは何ら反論していない。

オリッチには、『バベルのコンピューター』をSETI@homeのような世界規模のグリッドコンピューティング・プロジェクトとし、収集された作品をウェブ・サイト上で公開するという企図があるという。

しかし、これらの作品をウェブ上で公開するということは、先ほどの議論によれば1,312,000文字よりも短いURL(インデックスとしての、あるいはキーとしての)を与えることができないということを意味している。代表的なブラウザであるInternet Explorerが扱えるURLの長さは2,083文字、HTML 4.01仕様で理論上許容されている長さでも65,536文字しかないことを考えると、仮にASCIIの図形文字94文字すべてを制限なくURLとして自由な組み合わせで使えると想定したとしても、これらの全蔵書をインターネット上に収容することは到底できない。言い換えれば、『バベルのコンピューター』の蔵書はインターネットの全空間よりも広い、ということになる。(また当然のことながら、ある本を探し出すのに本文を一字一句漏れなく入力しなければならないというのは、検索ではなく暗誦であり、目的と手段が逆転してしまう)

つまり、URL(参照するもの)とHTML本体(参照されるもの)の関係は破綻し、検索エンジン云々を議論するよりも遙かに手前のところで、物理的な限界に到達してしまうというわけである。

今一つは、こうした自らの計画への分裂した態度の表れだが、『バベルのコンピューター』が現在生み出し続けているペイジのすべてに対して著作権を主張し、その理不尽によって、テクノロジーの脅威に対する警鐘を鳴らすというものである。

同様にして、結局のところオリッチが『バベルのコンピューター』で暗示したものは、テクノロジーの脅威などではなくテクノロジーそれ自体の限界であったということになる。コンピュータの無謬性、インターネットの無尽蔵性を信じたい我々にとっては、コンピュータやインターネットが高々410ページのたった一冊の本のあらゆる可能性さえ汲み尽くすことができないことを知ってしまったという、もっともっと残酷な結末であったと言える。

■奇跡の世界に生きる私たちの希望

我々が住んでいる数学的空間は極めて狭い。我々が読んでいる文章は、聴いている音楽は、観ている画像は、指すチェスや将棋の指し手は、同じ規模のあらゆる順列組み合わせの可能性からすれば奇跡としか言いようのない確率でのみ出現するパターン(偏向)である。そして、情報のエントロピーが拡散傾向にあり(熱力学第2法則)、セマンティクスが希薄化の危機に晒されつつある現代(もしかしたらこの私の実感は錯覚かも知れないが)、望みの文章や音楽や画像や必勝パターンを適切に探り当てるという検索技術は、奇跡の中の奇跡というほかない。

しかし、例えば分子生物学的な見地から、約30億文字のA・G・C・Tのあらゆる順列組み合わせから我々人類が誕生したこともまた奇跡である以上、奇跡にもクラスやレベルがあり、我々の住む世界というシステムの内部にはそれなりの安定性があるということもまた、信じることができる。

人間理性、すなわちあらゆる科学の本質は、ある特定のスケール(あるいはクラス)において対象物に何らかの秩序を見出すことにある。「完全なランダム性」の概念は「無限」の概念と等しく「体系(=システム)」への挑戦である。1,312,000桁の全桁の濃度が等しく重ね合わされたホワイトノイズ状態は完全なランダム性を呈しており、S/N比はゼロであるということが、平野の物語では前半部の「脱-差異化」のくだりで慎重に隠喩されている。

だが、この理論的かつ思弁的な悪夢は人類の終焉のときまでには発現しないこともまた、『バベルのコンピューター』は我々に教えてくれたのである。

先述のグレゴリー・チャイティンは、「理論的に問題が解けないという限界がある」ことと「適当な時間内に良い近似を与えることができる」こととは別の問題だとし、人類の叡智の多く、例えば物理学などは後者の、より実学的なアプローチに立脚したものであるとした。この不可逆縮約と誤差を受け容れる美学こそが、『バベルのコンピューター』が我々に抱かせた希望そのものである。

LHAとZIP―圧縮アルゴリズム×プログラミング入門(山崎 敏・奥村 晴彦)
LHAとZIP―圧縮アルゴリズム×プログラミング入門

セクシーな数学(グレゴリー・J・チャイティン)
セクシーな数学

Jeff Beck / Led Boots

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー

個人情報保護方針
利用規約
訂正
広告について
運営会社