「あー、ええと」などフィラー音を自動除去--AIボイスレコーダー「AutoMemo」が新エンジンに

 ソースネクストは3月14日、AIボイスレコーダー「AutoMemo」について、3月15日より音声認識エンジンのアップデートを開始すると発表した。

キャプション

 AutoMemoは、録音した音声ファイルを文字で確認できるAIボイスレコーダーだ。

 文字起こし機能は、毎月1時間までは無料。料金プランとして、毎月30時間までテキスト化できる月額プラン(980円/月)と年額プラン(9900円/年)を用意。また、1回のチャージで10時間分テキスト化できる「10時間チャージ」(1480円)、1回のチャージで100時間分までテキスト化できる「100時間チャージ」(1万4000円)も用意する。

 2020年12月発売以来、2023年2月末時点で登録累計アカウント数が6万件を超え、議事録の作成や取材の文字起こしといったさまざまなシーンで利用されている。

 今回のアップデートでは、OpenAIの音声認識エンジン「Whisper」を一部で採用。これにより、特に会議などの複数人での音声やマイクから距離の離れた小さな音声の認識精度が向上した。

 AutoMemoでは複数のAIエンジンや技術を組み合わせて開発している。今回、Whisperをエンジンの一部として採用するにあたっては、他のAIエンジンとの組合せの実現やユーザーニーズに応えるために独自にチューニングをする必要があり、その部分に試行錯誤したという。

キャプション

 同社によると、2人または、4人の音声を端末から1m地点で65dBになるように流して録音し、さらに3m地点で録音してテキスト化した平均値では、旧エンジンでのテキスト化精度が84.5%だったのが、新エンジンでは90.1%に向上したという

 また、“あー”や“ええと”といったフィラーも自動で除去できるようになった。同社では今後も、幅広く最適なAI技術を活用し、文字起こしの精度やサービスの向上に努めていくとしている。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画広告

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]