パナソニック、自動文字起こしサービス「P-VoT」提供開始--音声認識技術を活用

 パナソニック システムソリューションズ ジャパンは10月28日、音声処理・音声認識技術を活用した文字起こしサービス「P-VoT(ピーボット)」を正式に提供開始したと発表した。マスメディア向けに商用サービスとして提供する。サービス開始日は11月13日。価格は1コンテンツあたりの時間長を基準とした従量制で10秒20円になる。

サービスイメージ
サービスイメージ

 動画・音声ファイルをパナソニックのクラウドサービスにアップロードするだけで、文字起こしを自動化でき、文字起こし作業を、約3分の1の時間に削減できるとしている。

 多層のニューラルネットワークを用いた高精度音声認識により、幅広いジャンルの文字起こしに対応。インターネットに接続したウェブブラウザからのアップロードで、テキストの修正作業までができ、特別な機器・設備は不要としている。

 編集画面では文字をクリックすると、文字起こしした音声の位置から頭出し、プレビュー再生を開始。再生中はプレビュー動画、音声に追従して音声認識結果にマーキングするため、発声位置を探しだす作業もクリックひとつで可能だ。

 P-VoTは6月13日にベータ版の提供を開始しており、ベータ版の利用者アンケートであがった要望を反映させた上で正式版をリリース。編集画面のユーザーインターフェースを改良したほか、同時に最大5ファイルまでアップロードができるようになったという。

レイアウトイメージ
レイアウトイメージ

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]