検索大手のGoogleはウェブの国際化という野望を抱いているが、先ごろ米国政府が行ったテストでは、同社の自動翻訳ソフトウェアが、IBMや各学術機関の競合技術を上回る成績を残した。
National Institute of Science and Technology(NIST)が行ったこのテストで、Googleの自動翻訳ソフトは、アラビア語から英語への翻訳と、中国語から英語への翻訳で、それぞれ最高得点を記録した。このテストは、2004年12月1日から2005年1月24日の間に出されたAgence France Presse(AFP)と新華社通信による100の記事を翻訳するというもので、テストの結果は今月初めに公開された。
むかしからコンピュータ翻訳された英語は適切な表現にならないことが多いが、近年では計算処理能力とサンプルデータが増えたことで、研究者らは翻訳システムの精度を改善させてきている。
たとえば、ベンチャー企業のLanguage Weaverは、Al Jazeeraの放映する番組を翻訳するソフトウェアを開発している。また、この分野の研究はカーネギーメロン大学(CMU)の言語技術研究所をはじめとする複数の大学で行われている。なお、Language WeaverとCMUは今回のテストに参加していない。
Googleの自動翻訳ソフトのスコアは満点ではなかったが、競合する他のソフトウェアをはるかにしのぐものだった。1点満点での評価で、Googleソフトウェアのスコアは、アラビア語から英語への翻訳が0.5137、中国語から英語への翻訳が0.3531だった。総合2位は南カリフォルニア大学情報科学研究所の開発した技術で、アラビア語から英語への翻訳が0.4657、中国語から英語への翻訳が0.3073だった。IBMの技術はアラビア語から英語への翻訳が0.4646、中国語から英語への翻訳が0.2571だった。
このテストには、エジンバラ大学、ハルビン工業大学なども参加しており、またほとんどのソフトウェアは学術用のものだったとNISTは述べている。
Googleの好成績は、同社の持つ膨大な量の情報源が関与していると思われる。一般的に、自動翻訳ソフトウェアは与えられたデータが多いほど精度が上がるといわれている。Googleは、検索エンジンの運営を通して億単位の翻訳されたウェブページを収集している。
Yahooなどの他社と同様、Googleも新興国での新規ユーザー開拓を狙っている。このために、同社はいくつかの自動翻訳ツールを自社サイトに用意している。
この記事は海外CNET Networks発のニュースを編集部が日本向けに編集したものです。海外CNET Networksの記事へ
CNET Japanの記事を毎朝メールでまとめ読み(無料)
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来