前回はどこまでお話ししましたっけ。世界中の文字の収録を目的とした文字コード規格、Unicodeは、米国のIT企業を中心に結成されたUnicodeコンソーシアムが制定するデファクト規格に過ぎないこと。しかし公的な国際機関が定めるデジュール規格ISO/IEC 10646と同期することで、WTO/TBT協定にもとづき世界中の国々に普及させられるメリットを得たこと。
また、Unicodeコンソーシアム自体はオープンな組織だけれど、意志決定を行うUTC(Unicode Technical Committee/Unicode技術委員会)で一票を投じる権利を持つのは一握りの団体に限られること。そしてUTCはISO/IEC 10646のアメリカ・ナショナルボディであるL2委員会と合同でしか開催されておらず、同時にL2委員会とUnicodeコンソーシアムの正式会員は、ほぼ同じであること。結果として、Google、アップル、IBM、マイクロソフトなどのUnicodeコンソーシアム正式会員は、文字コード規格について不思議なまでの強い力を持っていること。
Unicodeコンソーシアムの上級職をつとめる人々は、ほとんどがこれら正式会員である企業の出身者であり、なかでもUnicodeの創立者の1人でUnicodeコンソーシアム理事長のマーク・デイビス氏がGoogleに在籍していること。したがってそのGoogleが日本の携帯電話の絵文字をUnicodeに収録したいと言いだした以上、現実的にはこれが否決されることは考えられないこと。ところがそうした事情を承知の上で、他ならぬUnicodeコンソーシアムの上級職の人々が、「絵文字はUnicodeのレパートリとして、ふさわしくない」と疑問の声を上げたこと。こんなところでしょうか。
流れとしては、まず上述の「疑問の声」を紹介すべきところでしょうが、その前に絵文字のUnicode収録はどのような原理原則によるものなのかを整理しましょう。これについては最新の提案書であるEmoji Symbols Proposed for Encoding(英文/PDF)が参考になります。
まず注目したいのが冒頭の「Proposal」(提案)の項。これは提案の背景を述べているのですが、そこからわかるのは、目的はNTTドコモ、KDDI、ソフトバンクモバイルという3社レパートリと相互運用性を確保するところにあることです。つまりUnicodeに収録されようとしている「絵文字」とは、Googleが独自に収集・選別したものではなく、厳密にキャリア3社の絵文字に限定され、これらとの互換を目的に提案されているわけです。これは非常に重要な点です。
つぎにこの文書は、「Factors」(要素)として絵文字の符号化での6つの原則を挙げています。これを説明することこそが今回の主題なのですが、1つずつ解説するといかにもお勉強っぽくなるし、読む方だって面倒でしょう。そこで多少の漏れには目をつぶって、3つのキーワードに分けて解説してみようと思います。
ただし、それでも面倒なことに変わりはありません。簡単に言うと、ここで伝えたいことは絵文字のUnicode収録は矛盾に満ちたものにならざるを得ないということです。第1回でキャリア間の絵文字変換サービスは欠点が多く、つまるところ彼等は「簡単だけど未来のない現実を選択しただけ」などと辛辣なことを書きましたが、そうなるのも仕方がない理由というものがあります。絵文字の標準化は、とても高い壁に阻まれているのです。
このことさえ頭に入れてくだされば、次のページからは読み飛ばして、最後のまとめである6ページに進んでくれてかまいません。いや、むしろそうすることをお勧めします。おそらく次からの解説は、複雑すぎてほとんどの人は頭が混乱してしまうに違いありません。なによりえらく長いので、多くの人にとって読み通すのは大変はなずです。
絵文字の符号化とその変換は、現在の文字コードの中では最も複雑な部類に入るでしょう。これを理解すれば一般的な符号の変換など屁でもなくなります。同時に、普段は目に見えない文字がもつ混沌とした性質を目の当たりにできるでしょう。しかし断言しますが、それはまったく腹の足しにはならず、日常の役にも立ちません。技術トレンドを押さえたり、流行のトピックをキャッチアップしたいという方には時間の無駄です。繰り返しますがそれをお求めの向きは、どうか6ページにおすすみください。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力