お使いのブラウザは最新版ではありません。最新のブラウザでご覧ください。

CNET Japan ブログ

2020年の東京オリンピックに向けて改めて「自動翻訳」について調べてみた。

2017/02/12 19:00
  • このエントリーをはてなブックマークに追加

プロフィール

土屋夏彦

radikoが有料で全国が聴けるようになり、いよいよ聴き逃しサービス「タイムフリー」も始まるかと思いきや、2016年になってしまいましたが、AMが在京3局も含め順次ワイドFM化を始め、TOKYOFMグループのi-dioもいよいよこの3月から始まるようで、今年の地殻変動はかなり大きいかも!
ブログ管理

最近のエントリー


2月5日にニッポン放送が「アニメ紅白歌合戦vol6代々木ファイナル」を原宿の代々木第一体育館で実施しましたが、さまざまな想い出が詰まっているあの代々木第一体育館が、いよいよこの3月末から改修工事に入るそうです。2019年に工事が終わり、2020年の東京オリンピックでふたたび世界の檜舞台になります。

その東京オリンピックに向けて注力が注がれている分野の一つに自動翻訳があります。さまざまな諸外国の選手や観覧者、旅行者が2020年は一気に増えるからです。おもてなしの国日本としては、どんな国の方たちともスムーズにコミュニケーションができるように準備を進めなければなりません。

そんな中、Google翻訳がAIを導入したことで一気に翻訳の精度をアップさせてきました。日本も負けて入られません。どんどん進む海外の自動翻訳の精度に対抗して日本も国家プロジェクトとして技術の向上に務めているようです。

あと4年。今回も、先日ラジオ番組で特集した「自動翻訳事情」を元に、現状と今後についてここに記録しておこうと思います。

■自動翻訳機はいつ頃から考えられていたか・・・

翻訳機というと、みなさんはドラえもんの「ほんやくコンニャク」を思い出す方が多いんじゃないかと思いますが、僕はスタートレックが大好きだったので、さまざまな異星人と出くわした際に必ず使うものとしての「宇宙翻訳機=コミュニケーター=会話するための機械」を思い出します。

スタートレックの歴史によれば、22世紀末ころに、通信士のホシ・サトウが「翻訳マトリックス」を発明し、これを使うことで、地球上の主な言語間の同時通訳に使われるようになり、その後、恒久的な平和が地球に訪れた・・・とあります。宇宙翻訳の最初は、地球上での会話の翻訳だったんですね。

つまり普通なら意思の疎通がうまくいくはずのものが、さまざまな言語があることで、互いに誤解を招き、戦争が起きたりしているんだという考えは、このスタートレックの時代から、それもアメリカのような世界共通言葉とも言える英語圏でまで、そう思われていたんだということがわかります。

ましてや日本は島国であり、海外に対するコンプレックスが知らないうちに強くなっていき、小さいときから「英語を勉強しないと活動範囲が小さくなってしまうよ」とか言われ続けてきました。英語を始め海外の国の言葉がぺらぺら喋れたらどんなにかっこいいだろうと誰もが一度は思ったことではないでしょうか。

でも実はこうした機械による翻訳の歴史は浅く、1950年前後のアメリカで、ロシア語を機械的に翻訳するには、ロシア語が「暗号化された英語の文章」とみなして暗号を解く手法を使えばできるのではと、暗号技術を使うことから始まったとされているようです。

当時からも、これを日本の研究者が取り入れていろいろやってみるのですが、実用化には程遠いとさじを投げたようです。こうした機械的に翻訳する「機械翻訳」の技術は1990年ころになってようやく実用化にこぎつけたようですが、あくまで機械的に文章をバラバラにしてそれぞれの言葉を置き換えるため、みなさんも体験されたことがあるように、つい数年前までは、ほとんど使えなかったレベルのものでした。

■世界の言語をつなぐ人工知能・・・

ちなみにネットを探すと「世界で最も影響力のある25の言語ランキング」というのが出ていたんですが、これを見ると、日本語とドイツ語がどちらも話者数で1億3千万人、しかしながら影響力としてはベストテンギリギリ。その上位にはポルトガル語、ロシア語、中国語、アラビア語と続き、3位がスペイン語、2位フランス語、そして1位が英語となっていました。

面白いのは、英語は影響力では1位にもかかわらず、話者数では世界で約3億人程度。対して中国語は影響力は5位だが話者数は13億人もいるんですね。でも、中国語を話す人もフランス語を話す人も、海外に出たらコミュニケーションは結局英語でなんとかする・・・。でも本当は、自分の母国語でぺらぺらしゃべって相手に通じたらそれに越したことはない、さぞかし便利だろうな・・・とずーっと思ってきた世界中の人の夢でした。

これがここ数年の人工知能=AI技術の革新によって、一気に翻訳レベルが増してきたんだそうです。つまり、これまでは、入力された文章を単語やフレーズに分解し、それぞれ対応する外国語の単語やフレーズに移行後、合成し文章で出力するという「フレーズベース機械翻訳(PBMT)」を使い、せいぜいそこに、統計的にこっちの言葉のほうがよく使われている的なアルゴリズムが加味される程度だったものが、「Googleニューラルマシン翻訳(GNMT)」では、入力された文章を丸ごと読んで、人工知能が学習した膨大なデータのなかから適切な言葉をフレーズごと見つけることで、翻訳エラーが20%にまで減少させることに成功したんだそうです。

ここで、100以上の多言語の翻訳が可能なGoogle翻訳をiPhoneアプリでいくつか試してみました。

まずアプリをスタートさせて、英語>日本語モードで

「I have a pen. I have an apple. nnn Apple Pen」

と、PPAPのような発音でしゃべってみたところ・・・・

なんと!!認識率約60%(5回やって3回認識)!! さすがに英語の発音はそう簡単には認識してくれませんでしたが、認識できたときは

「ペンを持っています。りんごを持っています。nnnりんごペン」

とアプリが発声してくれました。翻訳率は100%ですね。

続いて、専門用語が入っている日本語>英語の翻訳

「腎機能と糖尿病の検査をしていただけますか?」

これはこのあと出て来る日本版自動翻訳アプリの「VoiceTra(ボイストラ)」の例題に出ているものなのですが、見事に日本語の認識率はほぼ100%、認識してくれさえすれば英語への翻訳は全く問題なく

「Could you test for kidney function and diabetes?」

と翻訳されました。お見事です。これなら実際に会話でも使えそうです。

■日本も負けてはいない・・・

自動翻訳と言えば、やはり無料で誰でも使えてしまうのでGoogle翻訳となってしまいますが、東京オリンピックに向けて日本だって頑張っています。いくつかの会社や研究団体をご紹介します。

◎みらい翻訳

2014年にNTTドコモと、韓国で翻訳技術を開発しているシストラン、そして音声認識技術を持つフュートレックの3社によって設立された企業

彼らは人工知能を使った自動翻訳ではなく、あくまで従来のルール型と統計型のハイブリッド。でも、それぞれの用途に合わせた専用対訳文を独自に開発していくため、汎用機にくらべて、精度を高くさせている。
グーグルなどがオールマイティな翻訳サービスとすれば、みらい翻訳はオートクチュールの翻訳サービス。

ちなみに現在のみらい翻訳はTOEICで言うと600点相当のレベルなんだそうです。これを2019年までに800点にまで持ち上げるとしています。

◎株式会社ロゼッタ

会社のHPに書かれている文言「我が国を言語的ハンディキャップの呪縛から解放する」

「自動翻訳機」というSFを実現するするために2004年に創業。創業当初よりAIを用いた翻訳エンジンを開発。2015年に自動翻訳「熟考 Ver4.0」をリリース。その11月に東証マザーズに上場。

今から約200年前の1799年、ナポレオン軍がエジプトで不思議な黒い岩を発見。そこにはギリシャ語とほかに2つの古代文字が並んでいた。これをパズルを解くように20年かけて解読に成功。その技術によってこれまで謎だった古代文字の解読が続々と進んでいった。これこそがロゼッタストーン、難問を解決させる石。その名にあやかって付けられた社名。(ロゼッタストーンはrosetta、社名はrozetta)

◎情報通信研究機構の多言語音声翻訳システム

東京の小平市にある情報通信研究機構の先進的音声翻訳研究開発推進センターでは、自動翻訳の研究開発が始まったのが1986年(いまから30年前)。前にもお話したように、ご多分に漏れず、ずっと長いこと実用化には程遠い状態が続いたそうです。

そんなとき、インターネットでの膨大な言葉の蓄積や、スマートフォン性能が一気に高まったことなどから、日本語、英語、中国語、ミャンマー語など世界31の言語での会話の自動翻訳を実現させました。そのアプリが「VoiceTra(ボイストラ)」。

ここでも実際に「VoiceTra(ボイストラ)」アプリを使ってさきほどと同じものを翻訳してみました。

◎「I have a pen. I have an apple. nnn Apple Pen」

なかなか英語の発音がうまくないので、認識してくれません。感覚的には30%程度の認識率です。でも英語が認識されれば、もちろん翻訳は完璧です。

◎「腎機能と糖尿病の検査をしていただけますか?」

さすがにこのアプリのサンプルとして載っている日本語なので、日本語の認識率もほぼ100%で、翻訳も完璧でした。ただ、Googleにはまだ及ばないところもあるので、何としても2020年までに日本のものづくりの意地を見せて挽回して欲しいところです。

■アプリ以外の単体自動翻訳機・・・

ちなみにアプリ以外でも、単体のリアルタイム音声翻訳機として最近話題なのが「ili(イリー)」。ICレコーダーくらいの大きさのスティック型機器で、音声認識すると自動で翻訳変換して、変換されたテキストを人工音声で読み上げてくれるもの。例えばボタンを押しながら「こんにちは」と「ili(イリー)」に向かって言い、ボタンを離した途端に「Hello」と翻訳した言葉が発声されます。(現在は法人向けにサービス中、今年度中に一般向けスタート)

もうひとつ注目なのが、耳に入ってしまう補聴器レベルの翻訳機「Pilot(パイロット)」。これはまるでスタートレックに出てくるような夢のような自動翻訳機で、イヤフォンのように耳に装着すれば、相手がしゃべる声を同時通訳してくれるのだそうです。言語が違う人同士が2人共つけていれば、別々のことばでしゃべっても意思の疎通ができてしまうという。ちなみにこの製品はクラウドファンディングサイト「Indiegogo」で資金を集めていましたが、昨年6月に目標額(7万5千ドル)の30倍以上を集めて今年の夏までに販売開始される模様です。

■自動翻訳機が進化したら英語学習は不要になるのか?

あと東京オリンピックまで4年弱。どうやら自動翻訳は、かなりの認識率と翻訳率で実用化できそうな気配が見えてまいりました。

ただこういった事情を必ずしもうれしがらない方々もいて「完璧な自動翻訳機ができたら通訳、翻訳家、英語教師は必要なくなっちゃうんじゃないの?」と言われている方が多いのも事実。

例えそうだとしても、自動翻訳機の発達は、世の中にとって絶対に良いことだと思うんです。調べていくと例えば、ドイツが多数の移民を受け入れていることについて、ただ単に受け入れればいいってもんじゃなく、風習や宗教など違うものが多い中でも、お互いに理解を深めるためには、「移民問題で言語の壁」は非常に厚いことをドイツは感じているんだそうです。そんな場所ではこうした自動翻訳アプリは絶大な効果を発揮しています。すべての移民たちに十分な通訳が着くとは限らないからです。

また例え、自動翻訳が完璧になることで、通訳、翻訳家、英語教師はほとんど必要なくなったとしても、それぞれの翻訳が言語学的に正しいのか正しくないのかを確認するためには、結局、人間の知恵が絶対必要になります。そのときに、通訳の能力が何もなくなっていたら、それ以上の発展はしなくなる・・・。即ち、AIとともに、人間もますます学習していく必要があるということなのではないかと思いました。


(Cnet:自動翻訳関連リンク)

※このエントリは CNET Japan ブロガーにより投稿されたものです。朝日インタラクティブ および CNET Japan 編集部の見解・意向を示すものではありません。
運営事務局に問題を報告

最新ブログエントリー