事前学習なしで音声から発話者を推定する「話者ダイアライゼーション」が、リアルタイム認識でも音声認識APIの無料オプションとして利用可能に

株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木 清幸 以下、アドバンスト・メディア)の開発者向けボイステックプラットフォーム「AmiVoice Cloud Platform」で提供しているAI音声認識開発キット「AmiVoice SDK」の無料オプションとして「話者ダイアライゼーション」機能が利用できるようになりました。



[画像1: リンク ]

話者ダイアライゼーションは、複数の話者が含まれる音声に対して、誰がいつ話したのかを推定する技術です。アドバンスト・メディア独自開発の音響モデルを用いて、事前学習なしで音声から発話者を推定し、発言内容と発話者を自動的に紐づけます。会議や対面営業、面談、動画への字幕付与など、複数人が話をするシーンでご利用いただけます。
この度、AI音声認識開発キット「AmiVoice SDK」で話者ダイアライゼーションが利用できるようになりました。オフライン環境で話者ダイアライゼーション機能をご利用いただけます。

AmiVoice SDKの特長


1.オフラインで利用可能。よりセキュアな運用を実現
スタンドアローンで動作可能なため、医療現場などセキュリティの観点からインターネットに接続することが難しい環境下においても、音声認識機能をご利用いただけます。

2.ノイズに強いエンジン。屋外や工場向けのアプリ開発に
カスタマイズ性が高く、現場に合わせた認識パラメータの調整や単語登録による専門用語の認識が可能です。製造業の現場や屋外での点検保守業務などで利用する機器への組込みやアプリ開発でも活用されています。

3.単語・コマンド認識も可能。音声入力や音声操作にも
製品名と数の組み合わせや、数値やアルファベット、「異常なし」のようなコマンドワードなどの認識(ルールグラマ認識)を得意としています。もちろん文章も高精度で認識します。

4.豊富なサポートメニューで安心して開発できる
「AmiVoice SDK」の利用方法に関する技術的なお問い合わせに対し、1.技術スタッフが直接 2.日本語でサポートします。ご希望に応じて利用方法に関する講習も行っています。

■AmiVoice SDK 詳細
リンク

AmiVoice Cloud Platformとは


[画像2: リンク ]

音声認識を中心とした音声関連技術を提供する開発者向けボイステックプラットフォームです。国内シェアNo.1(※)の高精度かつ高速なAI音声認識AmiVoiceを、業界最安値の1時間99円(税込)~で利用できる「AmiVoice API」に加え、音声認識開発キット「AmiVoice SDK」を提供。クラウド/オンプレミス、リアルタイム/バッチなど、目的に合わせて最適なインターフェイスを選択できます。
また、Amazon Connectを利用したコンタクトセンター製品開発者向けサービスもご利用可能です。

■AmiVoice Cloud Platform 詳細
リンク

※出典:ecarlate「音声認識市場動向2023」音声認識ソフトウェア/クラウドサービス市場

【本件のお問い合わせ】
株式会社アドバンスト・メディア
SDX事業部
MAIL:info@advanced-media.co.jp
リンク

プレスリリース提供:PR TIMES リンク

本プレスリリースは発表元企業よりご投稿いただいた情報を掲載しております。
お問い合わせにつきましては発表元企業までお願いいたします。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]