絵文字が開いてしまった「パンドラの箱」第3回--Unicode提案の限界とメリット - (page 3)

絵文字だけ依怙贔屓?--“幻のルール”の復活

 つぎに「ソース・セパレーション・ルール」。図2をみてください。これは「トイレ」をあらわす絵文字です。

「トイレ」における3キャリア絵文字変換サービスとUnicode提案。赤い矢印は双方向の情報交換、青い矢印は片方だけの情報交換を意味する 図2「トイレ」における3キャリア絵文字変換サービスとUnicode提案。赤い矢印は双方向の情報交換、青い矢印は片方だけの情報交換を意味する(出典:Emoji Symbols: Background Data)(※画像をクリックすると拡大します)

 まず既存のキャリア絵文字変換サービスでの対応から見ていきましょう。NTTドコモが1文字であるのに対して、ソフトバンクは対応する意味の絵文字として3文字を符号化していることがわかるでしょうか。なお、上図にないKDDIもNTTドコモと同じく1文字なのですが、複雑になるので省略してあります。青い矢印をみて黙っていられない人もいるでしょうが、それはこの後に説明するので今はスルーしてください。

 さて、通常ISO/IEC 10646の審議でこのように3:1(実際にはKDDIも加えれば3:1:1)の状況を前にした場合、でてくる答は「1文字にユニファイ」(統合)でしょう。ISO/IEC 10646≒Unicodeは、基本的には各国の国内規格の集合体です(ISO/IEC 10646とUnicodeの関係については前回の3ページを参照)。世界中の文字コードを集めて「同じ字」は1つの符号位置に統合し、「違う字」には複数の符号位置を与えるというのが原則です。この例で言うとソフトバンクの3文字はどれも「トイレ」を意味しているのですから、1文字に統合するのが通常のやり方。

 ところが「それはしない」というのが今回のUnicode提案のキモの1つです。たとえソフトバンクだけが余分でも、これを却下して他の似た絵文字と1つに統合したりせず全部を収録する、そういう原則を立てています。具体的に見ていきましょう。再度図2をみてください。右の方を見るとわかるとおり、Unicode提案ではソフトバンクの3文字と対応する絵文字を、同じく3文字追加することにしました。これによりソフトバンクとの間で往復の情報交換が可能になり、互換性が確保されるわけです。

 このように複数の規格にある文字を収録しようとする際、いずれか1つの規格で分離していても、これを統合せずそのまま収録することを、ISO/IEC 10646では「ソース・セパレーション・ルール」と呼んでいます。これをISO/IEC 10646の翻訳規格であるJIS X 0221では「原規格分離漢字の取扱い規則」と訳しているのですが、ここに「漢字」という語が入っていることからも分かるとおり、じつはこれ、ISO/IEC 10646では漢字のための専用ルールとされているのです。それも適用されていたのは1990年代までに収録された漢字だけで、ここ10年の比較的新しい漢字レパートリでは廃止になったという、新規追加に関してはほとんど幻となっていたルールなのです。ところがUnicodeは、これを復活して絵文字に適用するのだと宣言しました。

 ソース・セパレーション・ルールのメリットは互換性を完全に実現できることです。しかし反面で収録文字数が膨れあがるというデメリットがあります。一部の漢字だけに許されていた特別ルールですから、今まで提案してもユニファイ、つまり却下されてきた側からすれば「日本の絵文字だけ依怙贔屓するのか」となるのは必至です。ということは、そういう横紙破りをしてまで3キャリアとの互換性確保が必要だったと見ることができます。

既存の3キャリア絵文字変換サービスとの対応

 どうですか、ついてこれていますか? あんなに脅かしたくせに、そんなに複雑でもない? まだ本番はこれからですよ。ここでもう一度図2に戻って右の方を見てほしいのですが、ソース・セパレーション・ルールを適用してUnicode⇔ソフトバンクで情報交換ができたとしても、元々1文字しか収録していないNTTドコモはソフトバンクとの間で情報交換できませんね。どうしましょう? ここで最後の「フォールバック対応」の出番です。では、図3を見てください。

図3「台風」における3キャリア絵文字変換サービスとUnicode提案 図3「台風」における3キャリア絵文字変換サービスとUnicode提案(出典:前出Emoji Symbols: Background Data)(※画像をクリックすると拡大します)

 これは「台風」に対応づけられている絵文字の例です。現状の絵文字変換サービスでの対応を見ると、3キャリア間は一対一対応です。したがって相互に往復の情報交換をしても文字化けすることはありません。これがUnicodeに収録されるとどうなるかというのが、太い矢印の先です。3キャリアの中央にUnicodeが収まり、ここを中継して3キャリアが相互に符号を交換できることを表しています。つまり既存の絵文字変換サービスと互換性が確保されているわけです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]