2019年にはTOEIC 800点相当の機械翻訳へ--「みらい翻訳」が見据える可能性と未来

 2020年には東京五輪が開催され、海外からの観光客が一層多く訪れることが予想される。そこで注目されるのが、話した言葉を自動的に相手の国の言語に翻訳してくれる、機械翻訳システムだ。そして、国内で機械翻訳システムの開発に力を入れているのが、NTTドコモらの合弁によって設立された「みらい翻訳」。同社が手掛けている機械翻訳システムの仕組みと、機械翻訳の今後について、みらい翻訳の代表取締役社長兼CEOである栄藤稔氏に話を聞いた。

ドコモが機械翻訳事業に乗り出した理由と2つの課題

みらい翻訳 代表取締役社長兼CEOの栄藤稔氏
みらい翻訳 代表取締役社長兼CEOの栄藤稔氏

 みらい翻訳は、2014年にNTTドコモと、韓国で翻訳技術を開発しているシストラン、そして音声認識技術を持つフュートレックの3社によって設立された企業だ。現在は各社が持つ技術に加え、情報通信研究機構(NICT)とNTTが持つ翻訳技術やデータを活用した機械翻訳エンジンを開発しており、対話型の翻訳システムのほか、会議などで使用することを想定した“多対多”の翻訳システムなどの開発も進めている。

 しかしなぜ、通信事業者であるNTTドコモが機械翻訳事業に乗り出したのだろうか。栄藤氏はその理由について、「機械翻訳技術の事業化がいつ実現できるかを考えた結果だ」と話す。機械翻訳は技術的に、早すぎても遅すぎても事業化は難しい。だがかつては“夢物語”と思われていた音声認識も、2010年頃には実用レベルに達したものが提供されるようになった。そうしたことからリスクはあるとしながらも、「(2014年時点で)あと3年あれば機械翻訳の技術的課題が克服できるのではないか」(栄藤氏)と判断したことが、事業化のきっかけになったと明かす。

 栄藤氏によると、実は機械翻訳に関する要素技術は既にある程度出揃っていると説明する。一方で大きな課題が2つあり、その1つは「文法が大きく異なる言語の前処理をすること」だという。例えば日本語と英語とでは文法が大きく異なることから、日本語を英語に訳す場合はまず、日本語を単語に分解し、それを英語の文法に合わせる形で並べ替え、その上で翻訳している。その前処理をいかに自然な形で実現できるかが、クリアすべき課題の1つとなっているとした。

 そしてもう1つの課題は、日本語は文脈に依存する部分が多く、主語がない文章が存在するということ。主語のない文章を、文脈からいかに主語を導き出して訳するかというのも、大きな課題になっているという。

 また同じ日本語を機械翻訳するのでも、「秋葉原にはどうやって行けばいいか」など比較的短い文章は翻訳しやすいが、長文では関係代名詞などが入ってくるため、翻訳が難しくなりやすいと、栄藤氏は説明する。従来は文法や辞書などを基に、一定のルールに則った形で翻訳する「ルール型翻訳」で翻訳してきたが、栄藤氏によると「精度向上にはルールを変える作業が必要になってしまうため、手間がかかる」とした。

タブレットを使った自動翻訳。翻訳したい言語を選択する
タブレットを使った自動翻訳。翻訳したい言語を選択する
タブレットを中心に2人向かい合えば、それぞれ話したことが翻訳される
タブレットを中心に2人向かい合えば、それぞれ話したことが翻訳される

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]