取材映像の書き起こしをリアルタイムに制作できる「音声認識による書き起こし制作システム」。取材映像の音声を認識して、リアルタイムに書き起こしを提供できる。 今回は複数の製作者が同時に認識結果を参照、修正できるインターフェースを開発することで、迅速な番組制作をサポート。従来は、ニュース番組、地域密着番組、社会情報番組と番組ごとに制作者が別々に書き起こしをしていたが、一本化することで、それぞれの使いたい部分をピックアップしつつ、修正が一度に行われるなど、作業の効率化に結び付くという。 音声認識は、これまでに書き起こされた4500時間の音声とテキストを学習することで、さまざまな発話環境や収録条件、話し方に対応できるようにしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画今、必要な戦略的セキュリティとガバナンス
企業や自治体、教育機関で再び注目を集める身近なメタバース活用を実現する
パナソニックのV2H蓄電システムで創るエコなのに快適な未来の住宅環境
OMO戦略や小売DXの実現へ顧客満足度を高めるデータ活用5つの打ち手
CNET Japan(Facebook窓)