Rimo合同会社は9月1日、AIを活用した文字起こしサービス「Rimo Voice」をリリースした。日本語に特化したことで、句読点を含めた自然な日本語を読み込むことができるという。
PCやスマートフォンのブラウザを使った録音、もしくは既存の音声データをアップロードすることで、文字起こしデータを作成。日本語に特化した自然言語処理技術を使っているため、句読点を含めた自然な日本語を読み込むことができるという。
文字起こししたデータは3~5行程度の読みやすい形で表示され、読み取りが曖昧な箇所は文字の色が薄く表示されるようになっている。1時間の音声データを5分程度で文字化され、文字起こしデータと音声データがサービス上に保存。音声データと文字起こしデータは個別にダウンロードすることも可能。音声データと文字起こしデータはシンクしており、文字を選択することで、ピンポイントに該当部分の音声を聞くことができる。
横断検索でキーワードから該当するデータを探し出すことができるほか、文字起こしデータはユーザー自身で修正することが可能。文字起こしデータはURLで簡単にシェアすることもできる。
利用料金は30秒20円の従量課金のほか、別途定額プランも用意しているという。
Rimo Voiceを手掛けた、Rimoの代表社員兼エンジニアの相川直視氏は、自然言語処理や検索・推薦技術に関心を持ち、早稲田大学の検索など大規模並列処理を専門に扱う研究室に所属した後、Microsoft Researchでのインターンを経てグーグルに入社。検索システムの開発に従事していた経歴を持つ。2019年12月にRimo合同会社創設し、Rimo Voiceは自社として初のプロダクトとなっている。
相川氏はRimo Voiceについて、取材内容の文字起こしのみならず、会議の議事録や会話の記録といった利用シーンも想定。多くの企業がリモートワークの導入により、さまざまな課題に直面しているなか、新しい働き方をサポートするツールとしての活用を考えて開発したとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」