マーケティングチャンネル
文:Stephen Shankland(CNET News.com)
翻訳校正:編集部
2008/05/07 12:08
UnicodeがASCIIを追い越し、World Wide Web上で最も多く利用されている文字コード体系になったとGoogleのシニアインターナショナルソフトウェアアーキテクトMark Davis氏がブログで述べている。また、UnicodeはASCIIだけでなく、Western Europeanもほぼ同時に追い越している。
Unicodeは多くの言語に対応した標準文字コード体系で、発音区別符号などを利用したローマ字なども扱っている。何十年も前に定められたASCIIコードは128文字あるいは256文字(ASCIIで128 文字、拡張ASCIIで256文字)しか表現できず、タイプライターの影響を受けた同文字コードの拡張は苦戦している。
UnicodeがASCIIとWestern Europeanを追い越したのは12月で、双方が追い越された日は10日も違わなかった。
Unicodeの動きについて、同氏は「Unicodeが他を単純に上回ったことよりも、これが起きたスピードが印象的だ」と述べている。
GoogleはUnicodeを積極的に使用している。Googleはウェブサイトからのデータを処理する際、UnicodeでなければまずこれをUnicodeに変換する。これにより、言語をまたがった検索機能が向上するからだ。
「Unicodeの利用が継続的に増えてきているため、Googleがカバーする多くの言語の処理が容易になる」とDavis氏は述べた。
同氏はさらにGoogleがUnicode 5.1をサポートし始めたことも付け加えた。「このおかげでマラヤーラム語を話す人たちは、新しい文字を含んだ単語を検索することが可能になる」(Davis氏)
ASCIIと比べたときのUnicodeの短所としては、ローマ字を格納するのに2倍のメモリ容量を必要とする点が上げられる。これはUnicodeがより多くの文字記号に対応するため、文字をより多くのバイト数で表現するためである。
この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ
2007/09/16 23:57 [ ブログ ]
2004/10/06 09:55 [ 情報システム ]
2007/07/30 12:32 [ 経営一般 ]
2004/04/01 16:42 [ 情報システム ]
2009/09/28 10:00 [ リリース ]
メンバー限定サービスをご利用いただく場合、このページの上部からログイン、またはCNET_ID登録(無料)をしてください。
2009/11/08 17:15
2009/11/08 17:01
2009/11/08 14:31
2009/11/08 16:11
2009/11/08 14:45
2009/11/08 14:41