海外を旅行したときに、現地の言葉が話せずに苦労した経験はないだろうか?「質問を吹き込んだら、現地の言葉に翻訳して、代わりに喋ってくれるような装置があればいいのに・・」と考えたこともあるはずだ。米IBMの研究所は、こうした願いを叶えるべくソフトウェア開発に取り組んでいる。
IBMの研究所では、異なる言語を話す者どうしが、テキスト入力作業を行わず、互いの音声のみでコミュニケーションできる翻訳ソフトウェアのプロトタイプ、MASTOR(Multilingual Automatic Speech-to-Speech Technology)の開発/テストを行っている。現在、IBMを含む複数メーカーが提供する翻訳ソフトウェアは、テキストから音声に変換する形式をとっており、音声から音声に翻訳するソフトウェアの実現は、だいぶ先の話だ。
MASTORは音声翻訳ソフトウェアだが、基本となるのはテキスト翻訳だ。例えば英語圏のDavidが、メキシコ市で現地の人と会話するとしよう。Davidがコンピュータのマイクに「Hi, my name is David.」と話し掛けると、この音声を英文テキストに変換し、画面に表示する。これをスペイン語「Hola, me llamo David」に翻訳し、テキストとして画面に表示した後、音声を出すしくみになっている。現地の人が話すスペイン語も、同様の過程を経て英語の音声に変換する。
MASTORのもう1つの特徴は、翻訳の過程で「意味」を重視している点だ。つまり、「I'm injured and I need a doctor.(ケガをしているので医者に診てもらいたい)」と「Can you find me a doctor?(医者をお願いできますか?)」という2つの文章は、「医者の手当てが必要」という意味では同じため、いずれも同じ表現を翻訳に用いる。
音声から音声に翻訳するには、非常に多くの機能を組み合わせる必要があるため、技術者や言語学者にとっては、特に困難なものとなる。例えばMASTORでは、最初に音声を記録する音声認識ソフトウェア、他言語への翻訳を行なう翻訳ソフトウェア、翻訳後の文章を音声出力するテキスト読み上げソフトウェアの3種類を搭載する。
なお、IBMは昨年9月、テキスト入力した言葉を翻訳して、訳文のテキスト表示や読み上げを行なうPDA向け翻訳ソフトウェア、ViaVoice Translatorをリリースしている。
この記事は海外CNET Networks発のニュースをCNET Japanが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス