混沌の館へようこそ。あんなに止めたのに、このページに進んでしまいましたね。仕方ありません、こうなったらとことんまでお付き合いいただきましょう。こちらも手加減はしませんよ。さっそく始めます。
最初にここまでの流れを短く整理します。「Emoji Symbols」によると、最初にUTCへ絵文字を符号化する草案が提出されたのは2007年8月3日。そこから何回か改訂をへて2008年12月17日から翌2009年1月14日までの期間にパブリックレビューが実施されました。ここでのフィードバックを元に改訂された提案が、翌月2月2〜6日の第118回UTCに提出され、まだ議事録が公開されていないので詳細は不明ながら、どうやら承認された模様。それというのも3月5日付でUnicodeコンソーシアム(=L2委員会)によって、ISO/IEC 10646に絵文字を追加する提案書(PDF)が提出されたからです。この提案は4月6日アイルランドで開催されるWG2総会で審議予定です。
前回までは「GoogleがUnicodeに絵文字を提案した」として原稿を書いてきました。しかしこの3月5日付提案により状況が変わりました。すでに絵文字を符号化することはUnicodeコンソーシアムの総意であるとして、今度はこれをISO/IEC 10646に追加させるべくWG2に提案してきたわけです。そこで以下で説明するにあたり、これを「Unicode提案」と呼ぶことにします。提案者の主語もUnicodeになります(まあ、前回説明したような事情で、UnicodeもGoogleもあまり変わりはないのですが)。説明を始める前に、参考まで主要な資料のリンクを示しておきます。
それでは始めましょう。Unicode提案は、3キャリアのレパートリとの互換を目的とするものであることは前述しました。この問題を考えるにあたり、これはいくら強調しても強調しすぎることはないほど大事です。そうであるからには、Unicode提案を理解しようとすれば、提案書だけでなく大元の既存キャリアの符号表やその変換サービスも参照すべき、というより参照しないと理解を誤ってしまいます。上でリンクを示したのは、そういう意図です。
ここでは、「色と動き」「ソース・セパレーション・ルール」「フォールバック対応」という3つのキーワードにしたがって説明をすすめます。これはUnicode提案における原理原則の総てではありませんが、その意図と手法を明らかにするには十分だと思われます。その説明の後で、これをどのように評価すべきかを考えたいと思います。
まず「色と動き」からいきましょうか。知る限り、総ての文字コードの規格票はモノクロで印刷されています。現在の文字コード規格では、色や動きまでは符号化せず、それをするのはデータフォーマットの仕事とされているからです。しかし既存キャリアの絵文字が属性として色と動きをもつ以上、それとの互換を目的とするUnicode提案が無視するわけにはいきません。
前出提案書「Emoji Symbols Proposed for Encoding(PDF)」ではこれについて、一般的な文字と同様に色と動きを切り離し、文字の名前によってそれらを区別することとしています。また、「Chart Legend」(対応表の凡例)では、色や動きによってしか区別できない場合は、ドット模様やハイライト等を使って表現するよう指示しています。これは現物を見てもらう方が早いでしょう。
苦労しているなあというのが第一印象。それも当然、繰り返しになりますが、本来は色や動きをもつ絵文字は文字コードによる符号化の対象にならないからです。あえてやろうとすれば、どこかに無理がでる。これをどう考えるかは後述するとして、ひとまず説明をすすめます。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力