文:Stephen Shankland(CNET News.com)
翻訳校正:編集部
2008/05/07 12:08
UnicodeがASCIIを追い越し、World Wide Web上で最も多く利用されている文字コード体系になったとGoogleのシニアインターナショナルソフトウェアアーキテクトMark Davis氏がブログで述べている。また、UnicodeはASCIIだけでなく、Western Europeanもほぼ同時に追い越している。
Unicodeは多くの言語に対応した標準文字コード体系で、発音区別符号などを利用したローマ字なども扱っている。何十年も前に定められたASCIIコードは128文字あるいは256文字(ASCIIで128 文字、拡張ASCIIで256文字)しか表現できず、タイプライターの影響を受けた同文字コードの拡張は苦戦している。
UnicodeがASCIIとWestern Europeanを追い越したのは12月で、双方が追い越された日は10日も違わなかった。
Unicodeの動きについて、同氏は「Unicodeが他を単純に上回ったことよりも、これが起きたスピードが印象的だ」と述べている。
GoogleはUnicodeを積極的に使用している。Googleはウェブサイトからのデータを処理する際、UnicodeでなければまずこれをUnicodeに変換する。これにより、言語をまたがった検索機能が向上するからだ。
「Unicodeの利用が継続的に増えてきているため、Googleがカバーする多くの言語の処理が容易になる」とDavis氏は述べた。
同氏はさらにGoogleがUnicode 5.1をサポートし始めたことも付け加えた。「このおかげでマラヤーラム語を話す人たちは、新しい文字を含んだ単語を検索することが可能になる」(Davis氏)
ASCIIと比べたときのUnicodeの短所としては、ローマ字を格納するのに2倍のメモリ容量を必要とする点が上げられる。これはUnicodeがより多くの文字記号に対応するため、文字をより多くのバイト数で表現するためである。
この記事は海外CNET Networks発のニュースをシーネットネットワークスジャパン編集部が日本向けに編集したものです。海外CNET Networksの記事へ
最近のSQLインジェクション攻撃で150万ページ以上が影響を受ける
ケータイとPCの検索における5つの違い
M1、F1はもう古い--より深いターゲット分析がプランを変える
Yahoo!とGoogleだけでは不十分? モバイルSEOの対象検索エンジン
リスティング広告における競争優位性の維持
-Simplify IT- ITをシンプルに 連載第2回
内部統制対策を実現するIT運用管理ツール
[特集] Windows Vista SP1搭載の最新PCラインアップ
[特集]2008年春 ビデオカメラフルラインナップ
[レビュー]小さな本格派--ソニー「HANDYCAM HDR-TG1」
今週の新製品総チェック:東芝VARDIAに約半年ぶりの新製品
[レビュー]一番小さなホームシアター--パイオニア、サラウンドヘッドホン「SE-DRS3000C」
顔認識の発展とひと味違うモデルの台頭--コンパクトデジタルカメラの動向を探る
楽しさで選ぶか、個性を取るか?--デジタル一眼レフカメラ お薦めモデル
文字入力でネットを操るインターネットマシン--ソフトバンクモバイル「Internet Machine SoftBank 922SH」
[レビュー]5万9800円の格安ミニノートPC--工人舎SAシリーズ「SA5KX08AL」