> >

絵文字が開いてしまった「パンドラの箱」第4回--絵文字が引き起こしたUnicode-MLの“祭り” - (page 3)

小形克宏2009年06月05日 06時00分

特集

「特別なルール」をなぜ「日本の絵文字」に適用するのか？

　ちょっと乱暴にマゴウワンのコメントをまとめると、以下のようになるでしょう。

（1）文字名が適切でない（色にかかわる文字名や誤字等）
（2）文化的な偏りへの不快感（たとえばうんちや「DISC」の表記）
（3）互換性確保／ソース分離への反発

　じつはその後Unicode-MLでは、マゴウワンの指摘をより微細に、そしてしばしば感情的に焼き直した意見が大量に投稿されました。つまり、上記のコメントはその後の議論を先取りしたものと言えます。

　図4にあるようにマゴウワンのコメントに対してGoogleはその度ごとに詳細な答えを返しています。19日のものに対してはシンボル符号化小委員会議長のマーカス・シェラーが、そして20日のものにはUnicodeコンソーシアム理事長、マーク・デイビス自らが。そうした返答を読んでもマゴウワンはまだ納得ができず、今度は自分の考えを数項目にまとめたものを投稿しています。

　このうち1番目のタイトルが「何を符号化するのか、そしてその理由は？」、3番目が「ソース分離について」というものなのですが、前者では冒頭から次のようにマゴウワンは言い切ります。

私は絵文字セットのほとんどが、ばかばかしくて浮ついた流行りものだと思う。

　おやおや、思い切ったことを言いますね。それでもすぐにこの後「しかし、これらの絵文字を必要とする人々がいることはよく分かっている」などとフォローがつづきますが、結局は「私は絵文字がUnicodeで符号化される必要があると、完全には確信できない」とあって、どうしても絵文字収録には賛成することができない。つまり冒頭の〈ばかばかしくて浮ついた流行りもの〉という感想はマゴウワンの本音に他ならず、上述（2）「文化的な偏りへの不快感」は変わってないわけです。

　また、「ソース分離について」が上述（3）と同じことは明白ですが、そこでは以下のように言っています。

日本のサービス提供業者はUnicodeを経由しない相互のマッピングをすでに持っているのだろう。そこにUnicode以外の「標準」との間に存在するマッピング上の問題を、彼等のために大盤振る舞いして解決してあげるのはUnicodeの仕事ではない。

　やはりここでは日本の絵文字と互換とするためソース分離を適用することに、あからさまな不快感を表明しています。言い換えると「どうして日本のキャリアに、ここまで親切にしなきゃいけないの？」ということでしょうか。前回にも書きましたが、ソース分離は、完全な互換性を保証できる反面、収録文字数が膨れあがる欠点があります。そのためかつて1990年代までに収録された漢字に適用されただけで、今は廃止になっている特別ルールなのです。それをなぜ日本の携帯電話の、しかもこんな馬鹿げた絵文字などに？　というわけです。

10日間で合計210通の議論

写真2　Unicodeコンソーシアム理事長のマーク・デイビス（Google）［出典：Unicode Directors, Officers and Staff］

　こうしたマゴウワンの投稿に対して、1時間ほどでマーク・デイビス（写真2）は返答しています。ここでは全部は引用できませんが、まず「何を符号化するのか、そしてその理由は？」で示されたマゴウワンの率直な意見に対して、以下のように絵文字をサポートするメリットを説きます。

確かに日本の携帯電話キャリアは今回のことで利益を受けるだろうが、これを提案しているのは、情報交換に関する現在の問題を解決したいと思っているUnicode会員企業（訳注：GoogleとAppleのこと）だ。今のところ絵文字はUnicodeの私用領域で符号化され通用している。そしてそこには情報交換に関する厄介な問題がある。

　「私用領域」とはUnicodeの中の外字領域です。この領域に限っては使用者はどのように符号を割り振っても自由で、合意のある者同士がお互いだけが知る符号を使う領域です。他の領域が一定のルールで管理された「公有地」だとすれば、この私用領域だけは何をしてもお構いなしの一種の無法地帯。したがって、ここで情報交換される符号はGoogleのウェブ検索の対象にもなりません。

　キャリアの絵文字符号表を見るとUnicode符号位置を掲げていますが、じつはこの私用領域のものなのです（図5）。ぞれぞれの符号位置はシフトJISの符号位置と1対1対応になっていますが、前回述べたように3キャリアの間で情報交換すると一対多対応になるケースが多く、簡単に第三者がこれらの文字を使うことはできません。Unicodeの側から見れば「第三者が使えないものをUnicodeとよぶなんて」です。デイビスの言う「厄介な問題」とは、このことを指します。それを解決する方法は、ソース分離によって絵文字を総て「公有地」に取り込むしかないということ（ここで、本当に「総て」である必要があるのか？　という疑問が浮かぶのですが、これは次回でゆっくり考えましょう）。

図5 NTTドコモの絵文字符号表。Unicode（赤枠内）といっても実際には私用領域の符号位置（U+E000〜U+E8FF）を使っている。これはKDDI、ソフトバンクも同様だが3キャリア間で重複はない。［出典：NTTドコモ「基本絵文字」］（※画像をクリックすると拡大します）

　さらに読み進むと「ソース分離について」に対する回答で面白いことを言ってます。

これは幾度もUTC委員会で議論された、主な原則のうちの1つだ。たぶんあなたはそれらの議論の間、居眠りしていましたね ;-)

　あなたも出席したUTC会議で、あんなに議論したじゃないかと言って退けているわけです。そしてメールの最後でデイビスは以下のように言い放ちます。

率直に言って、絵文字の符号化には（訳注：あなたが符号化をすすめているような）古代文字などよりずっと高い必要性がある。もしあなたが安定した産業需要にもとづく提案に本当に反対したいというのなら、あなたはエキゾチックな文字を符号化するに際して、UTCでは今よりも少ないサポートしか得られないだろう。

　マゴウワンはUnicodeコンソーシアムの副理事長という要職にありますが、デイビスは一番偉い理事長です。上の返答は恫喝にしか聞こえないのですが気のせいでしょうか（それにしても「エキゾチックな文字」とは大人気ない）。実際マゴウワンは言い過ぎたと思ったのでしょうか、この後ごく短く「私は提案が忘れられてないことを確認するために、公式フィードバックのフォーラムで余計なお節介をしてみただけ」とちょっと情けない言い訳をして、まるで尻尾を丸めるようにこの一連のディスカッションを終えています。

　しかしデイビスは知りませんでした。あと10数時間たつと、Unicode-MLの方で絵文字に対し非難の嵐が吹き荒れるようになることを。彼が部下を黙らせたのは12月20日。かねて18日から開始されていたパブリックレビューに対し、当時Unicode-MLに寄せられていた意見の数は、まだ18日と19日を合わせても6通のみ。そしてこの20日にはすこし増えて9通。ところがその翌日だけで、それまでの合計を倍も上回る33通の意見が投稿されたのです。

　以来、12月30日までの10日間で合計210通、一日平均で21通のメールが投稿されつづけました。その後も年初に一時落ち込んだものの、すぐに勢いを取り戻し、1月9日にはついに58通を記録することになります（図1）。この間、デイビスはマゴウワンにしたのとよく似た回答を書き続けるはめになりました。もちろんそこでは12月20日にしたような居丈高な書き方はしていません。Unicode-MLの投稿者達の多くは、デイビスの部下でもなんでもなかったから、当然といえば当然なのですが。