ポケトークは3月14日、法人向けのビジネスシリーズ「ポケトーク for BUSINESS」の提供を開始すると発表した。
ポケトーク for BUSINESSでは、2022年に発表していた「同時通訳」(Windows版)を同日より開始(Mac OS版は近日)。月額2200円(毎月30分無料)で提供する。
さらに、聞き手側のソフトウェアインストールが不要で多言語での会議をAI技術によって通訳できる「カンファレンス」、映像データの通訳・翻訳を容易にする「ムービー翻訳」など、ビジネスシーンに特化した機能を提供していくという。
ポケトーク for BUSINESS 同時通訳は、相手の話す英語を70言語の音声と字幕でリアルタイムに理解できるソフトウェアとなる。
英語を短く区切ってユーザーが選ぶ言語に翻訳し、音声でも発話するため、専属の同時通訳者がいるように相手の話がわかるという。また、オンラインだけでなく、対面でも使えることも特徴。
同社によると、同製品は「ポケトーク字幕」で実現していた、リモート会議で話したことを翻訳して画面に字幕を表示する機能を大幅に進化させたものになるという。
ポケトークシリーズは、主に音声からテキストに変換する「音声認識エンジン」、テキストを翻訳する「翻訳エンジン」そして翻訳したテキストを音声で発話する「音声合成エンジン」の3つのエンジンを組み合わせて構成されている。
ビジネスシーンにおける最も重要な点は、正しく音声認識を行い、速く・正確な翻訳および、通訳を実行することにある。
そこで、速く・正確な翻訳および、通訳を実現するため、ポケトーク for BUSINESSシリーズでは、音声からテキストに変換する音声認識エンジンに、OpenAIが提供する音声認識モデル「Whisper」を同社として初めて採用した。これにより、音声認識の精度が更に向上し、翻訳・発話する際の正確性も向上したという。
また、希少言語のひとつでもある日本語の音声合成エンジンに関しては、従来から「ポケトーク(端末)」で採用している東芝デジタルソリューションズの「RECAIUS 音声合成ミドルウェア ToSpeak」を同時通訳にも採用し、より自然な発話を実現した。
同社では、Whisperだけでなく、言語モデルの「GPT」シリーズなど、OpenAIのテクノロジーを採用し、言語にまつわる最先端の技術を、あらゆる人が実際に使えるかたちで提供していくとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス