符号化するに際して、最初に前段階の話をいろいろディスカッションしました。そこで聞いたことですが、2002年くらいに日本以外のある携帯用OSベンダーが、絵文字のプロポーザル(提案)を持ってきたことがあるんだそうです。もちろん日本の携帯絵文字をです。
それに対してUTC*2から符号化に際していろんな課題がだされ、次回までに回答をもってくることになっていたけど、約束されたミーティングに来なかったらしいです。
おそらくその会社も質問に答えることはできたでしょう。エンジアリング・グループなのですから。以前Unicodeのメーリングリストでものすごい議論がありましたね(連載第4回参照)。あれと同じで、2002年の時も反発があったと思うんです。Unicode自身が、まだ絵文字のようなシンボルについて、熟成された考え方をしていなかったと思うんですね。そうした反応を見てやめたのではないでしょうか。
今回の場合、よかったのはマーク・デイビス *3がUnicode Committeeにいたことでした。
私が絵文字の話をもっていったときに、マーク・デイビスはこう言ったんです。今、シンボルっていうのは、もしかしたら時期が良いのかもしれない。もしトライするならやってみたらどうかと、彼自身が言ってくれたんですね。
マークはUnicodeコンソーシアムをずっと見てきた経験から、今だったらメンバーがイエスと言う可能性が大きいと思ったようです。ここ3〜4年間、少しずついろいろなシンボル、ピクトグラム的なものをサポートしてきた。そういう状況から見て、シンボルに関するUnicodeコンソーシアムの中の認識が変わってきている。2002年の時点ではできなかったことが、いまはできるかもしれないよと。それを聞いてからですね、私が真剣に考えるようになったのは。
それで最初に話をもっていったのが、UTCのシンボル小委員会で、2007年10月のことでした。その後はトントントンと進みましたが、もとの基礎となる大きな仕事は、日本のGmailチームがやったマッピングと、そのシステムです。エンジニアリング的には素晴らしい、驚異的だと思いますよ。あれだけの複雑なものをよくやったなと。
複雑というのは、たとえばGmail側から出すメールに絵文字が含まれていれば、宛先の携帯会社によって違うコードポイントにしなければならない。場合によってはゲタ(〓)やアスキーアートに置き換えなくてはならないし、さらには絵文字のフォントを持っていないPC宛てだったらイメージにしなければなりません。
元は1つのメッセージだけれども、最終的には送り先によって複数の違ったメールデータに変える必要がある。最多の場合で、携帯3社用+iPhoneソフトバンク用+一般インターネット/Gmail用と、5種類のメールデータとして送られることになってしまう。こんなメールはあまりないと思うんですよね。
さらに単なる文字コードの変換だけでなく、コードポイントを変えても不具合を起こさず、きちんと送受信できるシステムを作り上げなければならなかった。その結果、Gmailのアーキテクチャの一部を変えないといけなくなったんですね。非常に複雑な仕事でしたが、それを日本のエンジニア・チームはやってのけた。
だからUTCに持っていくにあたって、すでに80%ぐらいは出来上がっていたんですね。ただ最終的にプロポーザルとして出すには抜けているところがあった。例えば文字の名前がデザインと一致していないものがあったり、一貫性がないものがあるとか、あるいはプロポーザルを出すならフォントが必要になります。キャリアにも問い合わせが必要だし、そういう詰めの作業を私たちがやったんですね。
システムそのものは出来上がっていても、安定化のために多くのテストが必要です。半年ちょっとの間はそうしたテストで問題がないことを確かめて、そのうえで公開に踏み切ったということですね。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
パナソニックのV2H蓄電システムで創る
エコなのに快適な未来の住宅環境
トラディショナルからモダンへ進化するBI
未来への挑戦の成功はデータとともにある