KDDI総合研究所は8月2日、独自の機械学習技術(表情認識AI)「多角適応型モデル制御技術」を開発し、あらゆる方向を向いた顔に対する高精度な表情認識を実現したと発表した。
この表情認識AIでは、顔の向きの変化への対応可能性を高めながら、軽量な表情認識を実現するために、2段階の機械学習モデルを構築。第1段階で顔の検出・顔の向き(上・下・左・右・中)を判定し、第2段階で顔の向きごとの表情認識モデルを適用することで、表情を認識するという。
世界的な標準である顔画像データセットLFWを用いて、表情認識AIと他社技術との比較実験を行った結果、顔検出の正解率、表情認識精度のそれぞれにおいて、同技術の優位性を確認。特に、顔の向きが45度以上で片目しか映っていない画像に対し、他社技術を大幅に上回る精度が実現できることを確認したという。
また、画像解析のアルゴリズムを大幅に効率化することで、従来比3分の1倍以下の軽量化を実現。高速な計算機や通信環境がない状況下での表情認識が可能となった。
小型のIoTデバイスの上でも単独動作が可能で、利用者の顔を含む画像をクラウドなどに送信する必要がなく、利用者のプライバシーを保護しながら表情認識できることが可能。これにより、活用できる場面が拡大し、人の表情を漏れなく解析できるため、さまざまなサービスでの実装が期待できるという。
たとえば、企業の会議では、室内に複数の人が任意の場所(角度)にいても、各人の表情を同時に認識でき、会議参加者の表情から、議論の活性度などを測定できるようになる。また、別の例としては、個人用の宅内ロボットに同技術を適用することにより、住人のプライバシーを保護しつつ、健康状態などをモニタリングするサービスや、利用者の心理状態に合わせて気の利いた対話を行うAIコミュニケーションなどのサービスも実現できるとしている。
なお、同技術は、自身の表情(笑顔)を意識することを目的としてKDDIのコールセンターに試験的に導入されており、約300名のコミュニケーターが実際の電話応対時に利用している。コールセンターでは、顧客からの問い合わせに対応するため、手元のスマートフォンを操作して下向きになるなど、顔の向きが正面から大きく逸れる場面がある。このような現場においても、表情認識の精度は97.05%という高い数値を達成。この取り組みを通じて、コミュニケーターの表情に対する意識が向上したほか、応対時の顧客の安心感や信頼度が向上する効果を確認しているという。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」