グーグルが絵文字を世界標準に提案した理由--国際化エンジニアに聞くプロジェクトの舞台裏(前編)

はじめに

 2008年11月27日、Googleは日本の携帯電話の絵文字をUnicodeに収録する計画を公表した。これまで7回にわたってお伝えしてきた連載「絵文字が開いてしまったパンドラの箱」は、この公表から後の動きを追ったものだ。

 では、それ以前の同社は何をしていたのか? つまり、Googleはどんなプロセスを経て絵文字をUnicodeに提案すると決めたのだろう。今回ご報告するのはこのことだ。

 インタビューに答えてくれたのは桃井勝彦氏。氏は大学時代にスカラシップ(奨学金)で渡って以来米国に暮しつづけている。言語学・日本語学を専攻する大学院生、大学教員などの経歴も持ち、1996年に学術界からNetscape国際化部門に入社。2004年にMozilla Japanの設立にかかわった後、2005年にGoogleに移った経験豊かな国際化エンジニアだ。マウンテンビューにある米本社にあって、今回の符号化プロジェクトを先頭に立って進めてきた。なお、インタビューはビデオ会議で東京とマウンテンビューを結んで行った。

今のままでは安心して使えない絵文字

――まず、なぜ絵文字をUnicodeに提案しようとしたのか、動機からお聞かせください。

 もしも絵文字を、公開された標準的なコードポイントで扱えるようになれば、いろいろな人と簡単に情報交換できるようになります。Googleでは全ての内部コードをUnicodeで扱っています。世界中に散らばる数千人、あるいは1万人を越えるエンジニアが、そのコードを見る可能性があります。

 現状では日本の携帯電話の絵文字はUnicodeに収録されていませんから、PUA *1にマップさせて使わざるを得ません。なので、あまりにもアドホック(その場限り)すぎて良くないということが1つ。

*1……Private Use Area。Unicodeにある領域の1つで1種の外字領域。未収録の文字であっても、使用者間の合意がある場合この領域内の利用を許される。他の領域が 一定のルールで管理された「公有地」であるなら、このPUAはいわば「無法地帯」。たとえばPUAの符号は、Googleのウェブ検索の対象にならない。

 こうした事情はGoogleだけにとどまりません。例えば他のデベロッパの方たちと、絵文字を使ったアプリケーションを作る時も同じです。プライベートなコードでやりとりをしていると、間違いが起こる元になります。システムによっては、プライベートなコードを通さないかもしれない。そうしたシステムではデータ・ロスが起こります。

 絵文字をプライベートなコードポイントで使っても、半永久的にはやっていけない。それはもう最初からわかっていたんです。でもスタンダードになれば、なんらかの形で先があるじゃないですか。いろんな人と共有できるし、オープンソースにした時にもやりやすくなる。たとえばAndroidにしてもね。

 もう1つ大きな理由として、日本において絵文字はすでに10年近く使われていて、安定しているということが挙げられます。私達の認識としては、いま現在メールで使われている絵文字は、クローズド・セットとしてもう出来上がっている。

 いろんな所に問い合わせたところ、彼ら(携帯電話会社)はこのセットを拡張するつもりはない。拡張するのはまた別の方法(デコメ等のようなファイルフォーマット)でやるのであって、現在コードポイントとしてやりとりしているものは拡張しない、そのように伺っています。それはAppleさんもまったく同じようなことをソフトバンクさんから聞いているらしいですね。

 なので、今ここで符号化するとタイムリーなのではないか。そして、なるべく早く終わらせる。それが符号化プロジェクトの1つの目的というか、モチベーションです。

絵文字対応を立案したのは誰?

――絵文字のUnicode収録計画が公表されたのは2008年の終わりでした。それ以前にどんな経緯があったのでしょう?

 そうですね。じつは2007年6月には、Gmail上で携帯3社間のマッピングとか絵文字を扱うシステムは、すでに作り上げられていました。コード的には完成していたんです。

 絵文字のプロジェクトが始まったのは、さらにさかのぼって2006年秋のことです。日本のGmailチームが、ビジネス・ニーズに応じて立ち上げました。日本の携帯電話に向けた「Gmailモバイル」の開発は当時日本でやっていたんですが、そこで絵文字を送受信できるようにしたい。それも当時提携したばかりだったKDDIさんだけでなく、携帯3社全部とやれるようにしたいということでした。

 Gmail側から携帯電話に送るときにも、あちらに迷惑をかけない、つまり別の文字に化けないように送りたい。あちらから送ってくるものを簡単にGmailで見せることができて、それを転送しても生き残るようにしたい。そうしたリクワイアメント(要求仕様)の元に、Gmailの日本チームが仕事をはじめて、2007年6月までにはGmailで携帯絵文字を扱うシステムができあがっていたんです。

 Gmailのコアのチームは米国ですから、やっぱりコアのプロジェクトと連携してやらなければならない。私自身は2005年からGmailに関わっていました。国際化に関するテストですとか、コンサルタントとしてGmailに参加しており、そんなこともあって絵文字のプロジェクトには最初の方から関わっていました。

 2007年6月ですかね、ちょうどGmailの携帯絵文字のシステムが完成するちょっと前ぐらいに、こちら(米国)のGoogle社内にあるUnicode Committeeで話し始めました。GoogleにはUnicodeに関する諸々のことを討論し、決定していく社内委員会があるのです。絵文字はこの次どうしようかと。Gmailに関してはいいんだけど、PUAでやっている限り将来はないねと。じゃあ将来がある方法ってなんなんだろう。この辺でなんとか符号化してしまった方がいいのではないかという話になったんです。

 Gmailのエンジニアの人たちは、すばらしいマッピング・テーブルとか、システムを作り上げました。だけども、彼等自身は符号化の専門家ではないし、また興味もない。じゃあ私が助けてあげましょうということで、そこから符号化プロジェクトが始まったのが、2007年の7月ですね。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]