音声認識技術を、多様な話し方をする障害者にとってより有用なものにすることを目的とした、新しい研究イニシアチブが発足した。
米国時間10月3日に発足した「Speech Accessibility Project」は、イリノイ大学アーバナ・シャンペーン校が主導する。Amazon、Apple、Google、Meta、Microsoftのほか、いくつかの非営利の障害者団体がこのプロジェクトを支援している。
音声認識は、「Siri」や「Alexa」のような音声アシスタントや翻訳ツールに採用され、多くの人にとって日常生活の一部になっている。しかし、これらのシステムは、特定の発話パターン、特に障害に関連する発話パターンを認識しない場合がある。例えば、筋萎縮性側索硬化症(ALS)、パーキンソン病、脳性まひ、ダウン症などの影響を受けた発話パターンがこれに該当する。その結果、これらの音声技術を効果的に利用できない可能性のある人が多く存在する。
Speech Accessibility Projectは、こうした現状を変えるために、代表的な音声サンプルのデータセットを作成して機械学習モデルのトレーニングに利用し、多様な発話パターンの認識向上を目指す。
同プロジェクトでは、さまざまな発話パターンを代表する人々から音声サンプルを収集する計画だ。イリノイ大学のチームが、有償ボランティアを募集して録音した音声サンプルの提供を受け、「非公開の匿名化された」データセットを作成し、それを機械学習モデルのトレーニングに利用して、多様な発話パターンの認識向上を図る。さしあたっては米国英語を対象にするという。
Googleは、全盲および弱視の人が対象物や通貨を識別するのを助ける「Lookout」アプリや、言語に障害がある人のコミュニケーションを支援する「Project Relate」を提供している。Appleは、「iPhone」や「iPad」を使っている全盲および弱視の人向けに、他の人が近くにいることを知らせる「人の検出」機能を2020年にリリースしたほか、スクリーンリーダーの「VoiceOver」をアップデートし、30カ国語以上の音声を新たに加えている。Metaが運営する「Facebook」は、視覚障害者向けに画像の内容説明を自動生成する機能を強化しているほか、「Instagram」の「Instagram動画」や「ストーリーズ」への自動キャプション機能も導入している。
Amazonは、「Echo」シリーズのスマートスピーカーやディスプレイに、文字起こし機能や、視覚障害者が日用品などを識別するのを助ける「Show and Tell」など、さまざまなアクセシビリティー機能を追加している。またMicrosoftは、障害のあるゲーマー向けのコントローラー「Xbox Adaptive Controller」を2018年にリリースして話題を集めたほか、2021年には「Surface アダプティブキット」を発表し、キーキャップ、ポート、ケーブルなどに凹凸のあるラベルを貼り付けて識別できるようにした。さらに2022年5月には新たなアダプティブアクセサリーとして、「アダプティブマウス」、「アダプティブボタン」、最大4台のアダプティブボタンをワイヤレスで接続できる「アダプティブハブ」の各デバイスを発表している。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」