取材映像の書き起こしをリアルタイムに制作できる「音声認識による書き起こし制作システム」。取材映像の音声を認識して、リアルタイムに書き起こしを提供できる。
今回は複数の製作者が同時に認識結果を参照、修正できるインターフェースを開発することで、迅速な番組制作をサポート。従来は、ニュース番組、地域密着番組、社会情報番組と番組ごとに制作者が別々に書き起こしをしていたが、一本化することで、それぞれの使いたい部分をピックアップしつつ、修正が一度に行われるなど、作業の効率化に結び付くという。
音声認識は、これまでに書き起こされた4500時間の音声とテキストを学習することで、さまざまな発話環境や収録条件、話し方に対応できるようにしている。