絵文字が開いてしまった「パンドラの箱」第1回--日本の携帯電話キャリアが選んだ道

Unicodeが携帯電話の絵文字を収録へ

 絵文字ってなに?そう聞かれても多くの人は、ああ、それはと答えられるはず。そう言えばちょっと前に『メールのハートマークにだまされるな! 8割の女性は「恋人以外にも使う」』(RBB NAVI)なんていうニュースもありました。携帯電話の個人普及率が9割を上回る(平成20年内閣府消費動向調査)この国において、絵文字はごくありふれたものになっている現実があります。

 2008年の11月27日、Googleが携帯電話で使われる絵文字を国際的な文字コード規格、Unicodeに収録しようというプロジェクト進行中であることを発表しました。では、このニュースは何を意味するのでしょう。そして私たちに何をもたらすのでしょう。今回から3回に分けて考えてみようと思います。

 まず歴史を振り返ってみましょう。じつは絵文字を使ったのは携帯電話が最初というわけでありません。先行するものとして1996年にサービス開始された、PHSのDDIポケット(現在のウィルコム)におけるPメールが挙げられます(現在では絵文字は使用不可)。当時の代表的な端末としては、この頃大流行した「たまごっち」を組み込んだ「たまぴっち」があったと書けば、懐かしく思い出す人もいるでしょう。

 では携帯電話で絵文字を使うことができるようになったのはいつからかというと、1999年のこと。この年2月にNTTドコモによってインターネット網に接続するiモードがサービス開始、そこでのメールで絵文字が使用可能とされたのが最初です。ついで4月にDDIセルラーグループ(現在のKDDI)によるEZweb、同年10月にJ-PHONE(現在のソフトバンクモバイル)によるJ-スカイ(現在のYahoo!ケータイ)と同種のサービスがつづきます。

 しかし、この絵文字には大きな欠点がありました。同じキャリアの端末同士であればなんの問題もなくとも、ほかのキャリアの端末に絵文字を使ったメールを出した途端に、文字が化けてしまったのです。どうしてこんな現象がおこったかといえば、それは携帯電話の絵文字というものは最初から相互運用性をまったく考慮せずに割り当てられたからです。携帯電話はシフトJISという符号化方法を採用しています(図1)。ここでいう符号化方法とは、たとえば「あ」という文字に対してどのような符号を割り当てるのかという方式のことです。

図1 シフトJISの構造。シフトJISは全体で0x00〜0xFFの256の符号を2つ組み合わせた領域(=2バイト)を使用します。このうち0x00〜0x1Fはコントロールコード、0x20〜0x7Fと0xA0〜0xDFはJIS X 0201を割り当てることにして、1バイトでだけ使用します。残りを2バイトで使用しますが、トラブルがおきそうな所(グレイ部分)はさけ、それ以外の領域にJIS X 0208を割り当てます(イエロー部分)。しかしここにJIS X 0208を全部収容しても、まだ余りがでます(オレンジ部分)。そこで昔からここに外字を割り当てることがおこなわれてきました(参考文献:川俣晶『パソコンにおける日本語処理/文字コードハンドブック』1999年、技術評論社) 図1 シフトJISの構造。シフトJISは全体で0x00〜0xFFの256の符号を2つ組み合わせた領域(=2バイト)を使用します。このうち0x00〜0x1Fはコントロールコード、0x20〜0x7Fと0xA0〜0xDFはJIS X 0201を割り当てることにして、1バイトでだけ使用します。残りを2バイトで使用しますが、トラブルがおきそうな所(グレイ部分)はさけ、それ以外の領域にJIS X 0208を割り当てます(イエロー部分)。しかしここにJIS X 0208を全部収容しても、まだ余りがでます(オレンジ部分)。そこで昔からここに外字を割り当てることがおこなわれてきました(参考文献:川俣晶『パソコンにおける日本語処理/文字コードハンドブック』1999年、技術評論社)(※画像をクリックすると拡大します)

 上図を見ていただくとおわかりのように、シフトJISはJIS X 0201、JIS X 0208というJIS文字コードの文字セットを使用しています。JIS X 0201はいわゆる半角の英数字や記号、それに半角カナを収録する全部で159文字の規格です。JIS X 0208はいわゆる全角の英数字や記号と全角仮名、それに漢字を収録する全6879文字の規格です。シフトJISにもとづく実装をする限り、これらの規格にある文字を情報交換しても、化けたりすることなく使うことができるわけです。

 しかしよくこの図を見ると、これらのほかにオレンジ色の「JIS X 0208を収容した余りの部分」が大きく広がっていることがわかります。キャリア各社の絵文字はこの部分に割り当てられているのですが、問題は割り当て方が各社各様、思い思いに割り当ててしまったところにあります。つまり最初から情報交換して文字化けしないなどということは考えておらず、だからキャリア間で絵文字をやり取りして文字化けするのは当然の結果というわけです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]