NEC、音声認識技術を活用して映像データを話題ごとに分割する技術を開発

  • このエントリーをはてなブックマークに追加

 NECは5月29日、映像および音声コンテンツに含まれる音声から話題の変化を検出し、映像および音声コンテンツを話題ごとに分割する「トピック分割技術」を開発したと発表した。

 デジタル放送網やインターネット上で大量に流通する映像および音声コンテンツを話題ごとに検索、頭出し、視聴、閲覧でき、映像および音声コンテンツの効率的な提供と視聴が可能になるとしている。

 トピック分割技術は、自然な話し言葉を高精度でテキストに変換する音声認識技術と、テキストを意味のあるまとまりに切り分けるテキスト分割技術により実現したものだ。

 話題が違えば語やフレーズの出現傾向も違うという「話題間の差異」に着目してトピックを分類することにより、政治、芸能、スポーツなど、話題の具体的内容に影響されることなく分割できるという。

 また、一連の話題の移り変わりを数理的なモデルで表現し、話題の変化点をコンテンツ全体から総合的に判断することにより、話題が変わる頻度に関わらず安定して高い性能を実現するとしている。

 さらに、人工知能分野の最新の学習アルゴリズム(変分ベイズ法)を応用することにより、多くの語彙を含む複雑なコンテンツに対しても高い精度で話題の変化を検出できるという。

 現在、サービス利用者が映像情報を効率的に取得するための手段として、電子番組表(EPG)やコンテンツに付随する字幕などのメタデータ(関連情報)をキーワード検索することにより、視聴したいコンテンツを見つける技術が用いられているが、これらの技術では、メタデータ作成に大きなコストがかかるほか、ニュース番組の1ニュース項目のような意味のある単位での視聴が容易ではないといった問題点があった。

 今回の開発は、こうした課題を克服するもので、コンテンツを話題ごとに正確に分割することにより、意味的にまとまった話題単位でのコンテンツの頭出しや視聴が低コストで実現可能になるとNECは説明する。

 NECでは今後、コンテンツ関連事業での製品化を目指して研究開発を強化していくとしている。

  • このエントリーをはてなブックマークに追加