日本電気(NEC)は6月20日、日本テレビ放送網(日本テレビ)の生放送番組「ストレイトニュース」において、自動で字幕を付与する実証を5月末に実施したと発表した。
放送業界では、聴覚に障がいのある人や、TVの音が聞こえにくくなった人に対して、必要な情報が正しく伝わるように、字幕放送が求められているという。
しかし、字幕放送を実現するには、人手による手打ち入力が主流であるほか、音声認識システムを利用する場合でも、字幕内容の正確性を確保するため校正者を複数人配置する必要があり、運用負荷が課題となっていた。
そこで同社は、独自のAI音声認識技術を活用したDX支援サービス「NEC Enhanced Speech Analysis-高性能音声解析-」を活用。同サービスの音声認識モデルに、ニュース番組でよく使用される地名や人名などの放送用語を事前に学習させることで、放送業界向けに特化した音声認識技術を開発した。
また、同技術を日本テレビで日昼に約15分間放送される生放送のニュース番組「ストレイトニュース」で実証したところ、99.0%の認識精度を確認。従来の音声認識サービスでは、認識精度は91.6%であり、放送業界向けに特化したことで7.4ポイントの精度向上が認められた。
加えて、耐騒音性が求められるスポーツ中継などでの活用を視野に、周囲の雑音やBGMによる誤認識を低減するための技術も開発。同社の社内における実証では、電車内騒音や野外騒音などの騒音が加わった状態でも、一般的に騒音下で利用されている音声認識と比較して最大15.9ポイント高い、88.3%の認識精度を確認しているという。
同社では、同サービスが活用されることで、放送業界における業務効率化を支援。さらには、すべての人が公平に必要な情報を得られる社会の実現を目指すとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」