ソースネクストは3月14日、AIボイスレコーダー「AutoMemo」について、3月15日より音声認識エンジンのアップデートを開始すると発表した。
AutoMemoは、録音した音声ファイルを文字で確認できるAIボイスレコーダーだ。
文字起こし機能は、毎月1時間までは無料。料金プランとして、毎月30時間までテキスト化できる月額プラン(980円/月)と年額プラン(9900円/年)を用意。また、1回のチャージで10時間分テキスト化できる「10時間チャージ」(1480円)、1回のチャージで100時間分までテキスト化できる「100時間チャージ」(1万4000円)も用意する。
2020年12月発売以来、2023年2月末時点で登録累計アカウント数が6万件を超え、議事録の作成や取材の文字起こしといったさまざまなシーンで利用されている。
今回のアップデートでは、OpenAIの音声認識エンジン「Whisper」を一部で採用。これにより、特に会議などの複数人での音声やマイクから距離の離れた小さな音声の認識精度が向上した。
AutoMemoでは複数のAIエンジンや技術を組み合わせて開発している。今回、Whisperをエンジンの一部として採用するにあたっては、他のAIエンジンとの組合せの実現やユーザーニーズに応えるために独自にチューニングをする必要があり、その部分に試行錯誤したという。
同社によると、2人または、4人の音声を端末から1m地点で65dBになるように流して録音し、さらに3m地点で録音してテキスト化した平均値では、旧エンジンでのテキスト化精度が84.5%だったのが、新エンジンでは90.1%に向上したという
また、“あー”や“ええと”といったフィラーも自動で除去できるようになった。同社では今後も、幅広く最適なAI技術を活用し、文字起こしの精度やサービスの向上に努めていくとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス