グーグルの自動翻訳ソフト、米政府のテストでトップに

Michael Kanellos(CNET News.com)2005年08月23日 17時05分

 検索大手のGoogleはウェブの国際化という野望を抱いているが、先ごろ米国政府が行ったテストでは、同社の自動翻訳ソフトウェアが、IBMや各学術機関の競合技術を上回る成績を残した。

 National Institute of Science and Technology(NIST)が行ったこのテストで、Googleの自動翻訳ソフトは、アラビア語から英語への翻訳と、中国語から英語への翻訳で、それぞれ最高得点を記録した。このテストは、2004年12月1日から2005年1月24日の間に出されたAgence France Presse(AFP)と新華社通信による100の記事を翻訳するというもので、テストの結果は今月初めに公開された。

 むかしからコンピュータ翻訳された英語は適切な表現にならないことが多いが、近年では計算処理能力とサンプルデータが増えたことで、研究者らは翻訳システムの精度を改善させてきている。

 たとえば、ベンチャー企業のLanguage Weaverは、Al Jazeeraの放映する番組を翻訳するソフトウェアを開発している。また、この分野の研究はカーネギーメロン大学(CMU)の言語技術研究所をはじめとする複数の大学で行われている。なお、Language WeaverとCMUは今回のテストに参加していない。

 Googleの自動翻訳ソフトのスコアは満点ではなかったが、競合する他のソフトウェアをはるかにしのぐものだった。1点満点での評価で、Googleソフトウェアのスコアは、アラビア語から英語への翻訳が0.5137、中国語から英語への翻訳が0.3531だった。総合2位は南カリフォルニア大学情報科学研究所の開発した技術で、アラビア語から英語への翻訳が0.4657、中国語から英語への翻訳が0.3073だった。IBMの技術はアラビア語から英語への翻訳が0.4646、中国語から英語への翻訳が0.2571だった。

 このテストには、エジンバラ大学、ハルビン工業大学なども参加しており、またほとんどのソフトウェアは学術用のものだったとNISTは述べている。

 Googleの好成績は、同社の持つ膨大な量の情報源が関与していると思われる。一般的に、自動翻訳ソフトウェアは与えられたデータが多いほど精度が上がるといわれている。Googleは、検索エンジンの運営を通して億単位の翻訳されたウェブページを収集している。

 Yahooなどの他社と同様、Googleも新興国での新規ユーザー開拓を狙っている。このために、同社はいくつかの自動翻訳ツールを自社サイトに用意している。

この記事は海外CNET Networks発のニュースを編集部が日本向けに編集したものです。海外CNET Networksの記事へ

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]