NECはこのほど、ロボットに向かって話すだけで、音声をテキストに変換し、その内容に関連する情報を自動収集してマルチメディアブログとして出力する「マルチメディアブログ創作システム」を開発した。
マルチメディアブログ創作システムは、自然な言葉で発声されたメッセージをテキストに変換する大語彙連続音声認識技術と、テキストから重要度を考慮してキーワードを抽出し、コンテンツを検索する自然言語文検索技術を、パーソナルロボット「PaPeRo(パペロ)」に統合したもの。
ロボットとの対話によって入力したビデオメッセージから発話内容を抽出し、音声認識によってテキストに変換したメッセージを、単語間の係り受け関係を利用し、目的語と述語の組み合わせ等を単位として、メッセージと検索対象コンテンツの説明文章との類似性を判定、メッセージ内容に関連するイラスト、映像、音楽、BGMなどのウェブ上のマルチメディア素材を高精度に検索し、入力したビデオメッセージとともにマルチメディアブログとして画面上に出力することができる。
本技術は、ロボットだけでなくさまざまな情報端末に応用できることから、NECでは、「ユビキタス社会を支える人に優しいコミュニケーションインタフェース」として、早期の実用化を目指し、研究・開発を強化するとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」