NTTドコモは5月8日、雑音環境での音声感情認識技術を3月にEmpathと共同開発したと発表した。2018年度に同技術をAIインフォテイメントサービスに導入することを目指す。
この技術は、NTTグループのAI「corevo」を構成する同社独自の音声感情認識技術と、Empathの音声感情解析AI「Empath」の技術をもとに開発。認識対象の音声に対して声の高さや音色などの音響的な特徴を分析し、あらかじめ機械学習で生成しておいた感情認識モデルを用いて、どの感情の音声であるかを推定するという。
両社は、2017年11月から2018年3月までの期間、走行雑音がある環境で音声による感情推定の認識率向上の取り組みを実施。走行時の自動車のエンジン音などの特徴を取り入れた認識モデルの生成技術により、停車中を想定した雑音が小さいSNR(Signal to Noise Ratio:信号対雑音比)が15dB以上の条件から、高速道路走行中を想定した雑音が大きいSNRが0dBの条件において、自然に発声された対話音声の「怒り」「喜び」「悲しみ」の感情の認識を平均正答率75%(従来は60%程度)で実現したという。
また、AIが感情を理解して感情にあわせた声かけを行うことで、ドライバーの眠気やだるさなどの倦怠感を表す指標値が50%減少し、被験者の93%はAIが自分の気持ちに寄り添ってくれていると感じ、気分良く運転できることが実証実験で確認されたとしている。
同技術によって、安心・安全な運転に貢献し、自動車に愛着が生まれるような新たなサービスの創出に取り組むという。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス