次世代メディア処理AIを活用 音声認識ソフトウェアの新バージョンを販売開始

~人間の脳と同じような音声情報処理を実現~

NTTテクノクロス株式会社(本社:東京都港区、代表取締役社長:桑名栄二 以下、NTTテクノクロス)は、音声認識ソフトウェア「SpeechRec Server(スピーチレック サーバー)」の新バージョンを2021年11月19日から販売します。「SpeechRec Server」は、NTT研究所が新たに開発した、音声音響処理、自然言語処理などの情報処理を人間の脳と同じようにオールインワンで可能にするAIを活用しています。これにより、高精度な音声認識を実現しました。

■背景
 近年、デジタルトランスフォーメーション(DX)の浸透や働き方改革により、官公庁やコンタクトセンターをはじめとする企業などにおいて、音声認識ソフトウェアのニーズが高まっています。このような中、NTTテクノクロスでは、50年以上にもおよぶNTT研究所の音声研究の成果や最新技術を活用し、音声認識ソフトウェア「SpeechRec」を2012年より展開しています。今回、NTT コンピュータ&データサイエンス研究所が開発した次世代メディア処理AI「MediaGnosis™」*1を「SpeechRec Server」に活用し、より高精度で多機能な音声認識を実現しました。

■特長
(1)人間の脳と同じような音声情報処理により高精度にテキスト化
 「SpeechRec Server」新バージョンでは「MediaGnosis™」を活用した音声情報処理として「End-to-End」方式*2を採用しました。これまで一部の音声情報処理のみに適用していたディープニューラルネットワーク(以下、DNN)*3をすべてに適用し、音声データ入力からテキスト出力までをオールインワンで実現しています。人間の脳と同じように、音声から日本語を理解するスムーズな処理が可能になり、音声認識精度がさらに向上しました。

(2)話し言葉を読みやすく変換し、内容を分類
 「MediaGnosis™」により、相づちや「えー」「あのー」などのつなぎ言葉に加え、「私なんかは」などの話し言葉特有の表現を認識し、話の意味を理解しやすいようなテキストに変換します。また、テキスト化された情報を内容ごとに分類して表示することも可能です。従来の音声認識ソフトウェアは、音声認識結果の変換と分類にそれぞれ専用のソフトウェアが必要でしたが、「SpeechRec Server」新バージョンではオールインワンで処理を実現します。システムの複雑化やコスト低減につながるとともに、新たなテキスト処理のニーズが出てきた場合には、システム構成を変えずに対応することができます。

(3)音声の特徴から話者を識別(話者ダイアリゼーション機能)
 複数の話者が話す場合、話者を識別するために話者の音声を事前登録したり、話者ごとにマイクを分けたりする必要がなく、話者の声質や波形などの特徴から「MediaGnosis™」が自動で話者を識別します。

■価格
 実際の利用環境などにより構成や価格が変わるため、詳細はお問い合わせください。

このプレスリリースの付帯情報

「SpeechRec Server」による音声情報処理のイメージ

(画像をクリックすると拡大画像をご覧いただけます。)

用語解説

*1: MediaGnosis
 音声音響・画像映像・自然言語といったマルチメディアを統合的にオールインワンで扱うことで、人間の脳に近い情報処理機構を実現した次世代メディア処理AIです。日本電信電話株式会社が開発しました。(リンク

*2:「End-to-End」方式
 従来の「Hybrid」方式では、音響モデルや認識辞書、言語モデルなど複数の処理を組み合わせていましたが、「End-to-End」方式ではそれらの処理をDNNにより一括で行うことが可能です。

*3:ディープニューラルネットワーク(DNN)
 機械学習の一種であるニューラルネットワークの階層を深くしたアルゴリズムで、画像認識や音声認識などの分野で活用されています。

*「MediaGnosis」は日本電信電話株式会社の商標です。
*「SpeechRec」はNTTテクノクロス株式会社の登録商標です。
*「SpeechRec」はNTTグループのAI「corevo®」の音声認識技術を活用した製品の1つです。
*「corevo®」は日本電信電話株式会社の登録商標です。 (リンク
* 記載されている商品名・会社名などの固有名詞は一般に該当する会社もしくは組織の商標または登録商標です。

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]