AISenseが新たに開発した無料のモバイルアプリ「Otter Voice Meeting Notes」は、音声のテキスト化を、「Google Doc」で文字入力するのと同じくらい簡単で利用しやすいものにすることを目的としている。AISenseは、Googleや音声認識を手がけるNuanceなどで経験を積んだ人材が集まって設立された企業だ。
先週開催されたMobile World Congress(MWC)2018で発表されたOtterは、音声のテキスト変換を無料かつ正確にするだけでなく、スマートにすることも目指している。
Otterを使用する際には、マイクのアイコンをタップして録音を開始すると、話している内容のライブテキストが未加工の状態で瞬時に文字に起こされて表示されていく。Otterの人工知能(AI)が本領を発揮するのは、録音を終えた後だ。処理後、クリーンアップされたテキストは、交代で話したユーザーごとに区別される。Otterは登録プロセスの一環として、5つの段落からなる文章を読み上げるよう求めることで、ユーザーの「声紋」を取得する。ユーザーの音声を学習して、明確に識別するためだ。
Otterの音声テキストは、1つのテキスト内だけでなく、保存したすべての録音から検索できる。自動的にキーワードが生成されるので、ユーザーはキーワードをタップして検索することが可能だ。Otterでチームを作成すれば、アプリから個々のユーザーやチームメンバーとコンテンツを共有できる。任意のユーザーに音声テキストへのリンクを送信して、ウェブ上で閲覧してもらうこともできる。
素晴らしい機能の1つとして、録音を再生するとテキストと音声が同期されるので、テキストの任意の箇所をタップすると、音声はその箇所に即座にジャンプし、正しくテキスト化できているかどうかをすばやく確認できる。音声の再生中、アプリでは話している音声に合わせて単語の強調表示も行われる。
米国時間2月26日に一般公開されたこのアプリは初期段階にあり、筆者が試したところ、若干のバグもみられた。
以前に録音した会話をインポートできれば便利だが、現在のところそうした機能は無い。アプリとその基本的な音声テキストサービスは無料だが、AISenseは今後、Evernoteのビジネスモデルのように、無料サービスにはない機能を利用できるサブスクリプション制サービスを追加する計画だ。
Otterのデータは機密扱いで、暗号化される。AISenseがOtterで広告ベースのビジネスを構築する予定はないという。
同アプリは現在英語に対応し、「Android」「iOS」版が提供されている。ウェブでも一部機能が利用できる。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス