絵文字が開いてしまった「パンドラの箱」第5回--絵文字と日本マンガの親密な関係

  • このエントリーをはてなブックマークに追加

絵文字の収録をめぐって、国際規格で大論争--「Google提案」を振り返る

 皆さんこんにちは、面白くてタメになる(?)文字コード漫談の時間がやってまいりました。2月からとびとびで書いてきた絵文字の報告も、いよいよ今回が最終回。どうかよろしくお付き合いください。

 さて、前回はどこまでお話ししたのでしたっけ。日本の絵文字をUnicodeに収録しようとするGoogleとAppleによる提案(以下、主導者の名をとりGoogle提案と略)ですが、去年の12月にパブリックレビューが開始されると、Unicode-MLで時ならぬ非難の嵐が吹き荒れたこと。そこでの反発を一言で言い表すなら、日本の文化に強く依存する絵文字を単純に国際規格に収録しようとした点にあったこと。

 なぜなら国際規格の審議は参加各国の総意で成り立っており、特定の国しか便利に使えない文字を収録することは、当然強い反対をうけるからです。さらに言えば、Google提案とはそういう絵文字に対し「ソース分離」という手法をつかい、重複を除き1文字の漏れもなく収録しようとするものであったこと。Unicodeの原則では似た字は統合されますから、これは破格の優遇策と言えます。

 そんな強引とも言えるGoogle提案ではあったけれど、その社員で、かつUnicodeコンソーシアム理事長であるマーク・デイビス自らが主導することもあってか、無事にUnicodeの最高議決機関、UTC会議で承認され、今度はいよいよ国際規格ISO/IEC 10646への収録を目指して4月20〜24日に開かれたWG2ダブリン会議に提案が持ち込まれたこと(UnicodeとISO/IEC 10646の関係については第3回の冒頭をご参照ください)。

 ところがよせばいいのに、デイビスがUnicode-MLでWG2参加国を刺激するようなことを書いてしまい、それをプライベートに参加していたナショナルボディ(代表団。以下、NBと略)メンバーが見とがめたものだからさあ大変、ダブリン会議はUnicode-MLでの大論争の第2ラウンドとなる予感をはらみつつ、幕を開けることになってしまった……。とまあ、こんなところでしょうか。

Google提案の審議はどんな流れになるのか

 通常WG2では、本番となる会議が開催される前に、各NBは色々な文書を提出し合います。追加したい文字の提案、懸案事項へのコメント、あるいは他国が寄せた文書に反対する意見もあります。こうしてあらかじめ審議するテーマとそれへの各々の立場を、あらかじめ明確にすることで本番の会議が効率の良いものとなります(実際にはなかなか思い通りにならないのは、いずこも同じ)。

 これらの文書はWG2のサイトで基本的に公開されることになっています。つまり、どこの国から、いつ、どのような文書が提出されたかを追っていけば、会議での対立軸がある程度分かることになります。もちろん絵文字をめぐる提案の場合も同じです。

 まずGoogle提案がUTC会議で承認された約1カ月後の3月5日、一部を修正の上WG2に提出され、サイトで公開されました。これは以下の3つの書類からなっています。

  • N3582(PDF)『Proposal for encoding Emoji symbols (includes proposal summary form)』(絵文字シンボル符号化の提案/提案書式をふくむ)[提案者による和訳(PDF)
  • N3583(PDF)『Emoji Symbols Proposed for New Encoding For the Proposal for Encoding Emoji Symbols』(「絵文字シンボル符号化の提案」のための絵文字シンボル新規符号化の提案)
  • N3585(PDF)『Emoji Sources』(絵文字の原規格)

 このうちN3582は提案書そのもの、N3583は1文字ずつのデザインや名前を記したいリスト、そしてN3585は3キャリアとのマッピング表です。その具体的な内容については、今までさんざん述べてきたからよいでしょう。興味深いのは、ほとんど同時に以下の文書にGoogle提案の絵文字がそっくり追加されていることです。

  • N3580(PDF)『Pre-meeting 54 charts showing characters in the pipeline - Charts for new repertoire, including PDAM7』(第54回会議以前の新レパートリ一覧表/PDAM7をふくむ)

 PDAM7とは「Proposed Draft Amendment 7」の略で、和訳すると「追補7提案書草案」ということになりましょうか。ISO/IEC 10646は1300ページを越える大部の規格です。文字を追加するたびに出版し直したりすると効率が悪いので、「Amendment(追補)」という形で変更分だけ出版し、それ等が一定程度たまると新しい版を出すことにしています。現在の2003年版では追補5まで出版されていて、追補6と7が審議中。その片方がこのPDAM7というわけです。Google提案は、このPDAM7に入れるかどうかをダブリン会議で審議されることになりました(※2)。

 ところで追補の草案は、何度も投票を繰り返しながらチェックと修正を重ねるごとに以下のように名前を変え、完成度を高めていきます。

※1

(1)PDAM(Proposed Draft Amendment)
   ↓
(2)FPDAM(Final Proposed Draft Amendment)
   ↓
(3)FDAM(Final Draft Amendment)
   ↓
(4)AMD(Amendment)

 まるでブリやスズキのごとき出世魚のようですが、(5)に至ってようやく正式な出版となります。PDAM7は上記でいう(2)の段階です。


※1 お詫びと訂正 2010年1月25日

 DAMは少し特殊な手続きの中でしか使われないプロセスでした。これにともない、一文を削除しました。お詫びして訂正いたします。


訂正前

(1)DAM(Draft Amendment)
   ↓
(2)PDAM(Proposed Draft Amendment)
   ↓
(3)FPDAM(Final Proposed Draft Amendment)
   ↓
(4)FDAM(Final Draft Amendment)
   ↓
(5)AMD(Amendment)

訂正後

(1)PDAM(Proposed Draft Amendment)
   ↓
(2)FPDAM(Final Proposed Draft Amendment)
   ↓
(3)FDAM(Final Draft Amendment)
   ↓
(4)AMD(Amendment)

削除

 つまりGoogle提案は(1)の段階を飛ばして、いきなりここに加えてもらったことになります。一見すると割り込み乗車のようですが、その背景には以前からUTCで時間をかけて審議していること、及びISO/IEC 10646と対等の規格であるUnicodeへの配慮があると思われます。

※2 お詫びと訂正 2010年2月8日

 「その片方がこのPDAM7というわけです。」の後に、以下の一文を追加しました。従来の記述は、あたかも絵文字がPDAM7の一部であったかのようでした。

Google提案は、このPDAM7に入れるかどうかをダブリン会議で審議されることになりました。

  • このエントリーをはてなブックマークに追加