このシフトJISの大きな特徴はデファクト規格(私的規格)であることです。じつは「JIS」とあるのと裏腹に、長い間公的な規格としては規定されていませんでした。JISは工業標準化法にもとづき経済産業大臣が制定するものです。一方でシフトJISは1982年にアスキー、マイクロソフト、三菱電機といった民間会社が、製品開発をする中で産み出された符号化方法でした。
限られたメモリ、限られた人員でも効率よく開発できる使い勝手の良さをもっており、1980年代前半から1990年代にかけて、雨後の竹の子のように各社から発売された初期パソコンやワープロ専用機は、軒並みこの符号化方法を実装しました。そして、ここで当時のメーカーはJIS X 0201とJIS X 0208の領域は共通の符号位置を割り当てつつも、図1のオレンジの領域には、JIS X 0208にはない外字を思い思いに選定し、思い思いの符号位置に割り当てたのです※1(図2)。前述したように携帯電話で絵文字が使えるようになったのは1999年です(図3)。
どうしてそんな勝手な実装をしたのかと聞かれれば、シフトJISは咎める者が誰もいないデファクト規格だからと答えるしかありません。公的な標準が存在しない以上、図1のオレンジの領域にどんな文字を割り当てようがご意見無用です。この結果、当時「機種依存文字」とか「JIS外字」と呼ばれた文字は、情報交換した途端に化けるという時代が長く続きました。パソコンのOSで言えば、マイクロソフトのWindows MeまでのコンシューマOS、アップルコンピュータ(現在のアップル)のMac OS 9までです。
この種の文字化けで代表的なのがローマ数字でしょう。同じメーカーの違う機種間でローマ数字をやりとりする限りはたいてい問題はありません。しかし、たとえばNECのPC-9801VMから富士通のFM TOWNSへ、あるいはWindows 98からアップルのMac OS 8.5に、フロッピーディスクでファイルを渡したりすると、ローマ数字だけが化けるということが起きたのです※2(ほかにもいろんな原因でいろんな文字が化けたのですが、今は触れません)。現在でもメールやウェブページでは丸付き数字は使わない方がよいということが言われますが、それはシフトJISにおける空き領域の混乱が原因の1つです。そして、このシフトJISを採用したものこそが携帯電話でした。
前述したように携帯電話で絵文字が使えるようになったのは1999年です。これはシフトJISの実装としては最後発と言えます。しかもこの2年前の1997年、JIS X 0208は改正にあたって「シフト符号化表現」という名前で、正式にシフトJISを規定しています。ところがこれは図1のオレンジの領域を原則的に使用禁止にしているのです。1997年以前ならいざ知らず、すでにあったJISを無視して絵文字を空き領域に割り当てたキャリア各社の実装は、自分勝手と言われても仕方のないものです。
どうしてそんな選択をしたのか、その理由はおそらく草創期のパソコンやワープロ専用機と同じく、限られたメモリ、少ない開発人員、それに反比例する早い納期にあったことは簡単に想像できます。つまり、シフトJISを使うことでこれらに対処できるメリットが、相互運用性のデメリットを上回ったと見るべきでしょう。
さらに1999年当時、旧来からのシフトJIS(つまりシフト符号化表現に適合しない)が隆盛をきわめていたことを考えれば、スタート間もない携帯電話の絵文字は、深い考えもなく単純にこれら多数派にならっただけとも考えられます。まさか自分たちが10年後には日本国民の9割が持つようなモンスターに育つとは、当時考えもしなかったのかもしれません。
訂正(2008年3月2日)
※1 図2を挿入した本文の場所が不適切でした。ここでは〈初期パソコンやワープロ専用機〉での〈JIS X 0208を収容した余りの部分〉の話をしているのに、ここに携帯電話の絵文字の図版を入れるべきではありません。改めて適切な図版を以下のキャプションとともに図2として入れ、以前の図2を改めて図3として以下の場所に挿入し直すことにします。なお、図3以降の図番号を1つずつ送ることにします。
※2 当初、「図1のオレンジの領域」に割り当てた外字の例として、丸付き数字を挙げていましたが、これは適切な例とは言えませんでした。丸付き数字がメーカーによって異なる符号位置に割り当てられ、これが文字化けの原因となったこと自体は間違いはありません。しかしこれは〈JIS X 0208を収容した余りの部分〉には割り当てられておらず、JIS X 0208そのものに存在する、具体的には9〜15区にある空き領域に割り当てられています。シフトJISで言うと0x8740〜0x8753で、図1では上の黄色い領域の中にあります。この空き領域にも各メーカーは外字を割り当てていましたが、本文ではスペースの都合上省略しています。これを踏まえ本文を以下のように訂正しました。
・誤
この種の文字化けで代表的なのが丸付き数字でしょう。同じメーカーの違う機種間で丸付き数字をやりとりする限りはたいてい問題はありません。しかし、たとえばNECのPC-9801VMから富士通のFM TOWNSへ、あるいはWindows 98からアップルのMac OS 8.5に、フロッピーディスクでファイルを渡したりすると、丸付き数字だけが化けるということが起きたのです。
・正
この種の文字化けで代表的なのがローマ数字でしょう。同じメーカーの違う機種間でローマ数字をやりとりする限りはたいてい問題はありません。しかし、たとえばNECのPC-9801VMから富士通のFM TOWNSへ、あるいはWindows 98からアップルのMac OS 8.5に、フロッピーディスクでファイルを渡したりすると、ローマ数字だけが化けるということが起きたのです。
訂正(2008年3月3日)
当初「ギリシャ数字」と表記しておりましたが、「ローマ数字」誤りでした。お詫びして訂正いたします。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
「程よく明るい」照明がオフィスにもたらす
業務生産性の向上への意外な効果
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」