障害者の発話に対応する音声認識技術を目指すプロジェクト--MSなどIT大手が支援

Abrar Al-Heeti (CNET News) 翻訳校正: 矢倉美登里 高橋朋子 (ガリレオ)2022年10月04日 11時40分

 音声認識技術を、多様な話し方をする障害者にとってより有用なものにすることを目的とした、新しい研究イニシアチブが発足した。

スマートスピーカーに触れる手
提供:Amazon

 米国時間10月3日に発足した「Speech Accessibility Project」は、イリノイ大学アーバナ・シャンペーン校が主導する。Amazon、Apple、Google、Meta、Microsoftのほか、いくつかの非営利の障害者団体がこのプロジェクトを支援している。

 音声認識は、「Siri」や「Alexa」のような音声アシスタントや翻訳ツールに採用され、多くの人にとって日常生活の一部になっている。しかし、これらのシステムは、特定の発話パターン、特に障害に関連する発話パターンを認識しない場合がある。例えば、筋萎縮性側索硬化症(ALS)、パーキンソン病、脳性まひ、ダウン症などの影響を受けた発話パターンがこれに該当する。その結果、これらの音声技術を効果的に利用できない可能性のある人が多く存在する。

 Speech Accessibility Projectは、こうした現状を変えるために、代表的な音声サンプルのデータセットを作成して機械学習モデルのトレーニングに利用し、多様な発話パターンの認識向上を目指す。

 同プロジェクトでは、さまざまな発話パターンを代表する人々から音声サンプルを収集する計画だ。イリノイ大学のチームが、有償ボランティアを募集して録音した音声サンプルの提供を受け、「非公開の匿名化された」データセットを作成し、それを機械学習モデルのトレーニングに利用して、多様な発話パターンの認識向上を図る。さしあたっては米国英語を対象にするという。

 Googleは、全盲および弱視の人が対象物や通貨を識別するのを助ける「Lookout」アプリや、言語に障害がある人のコミュニケーションを支援する「Project Relate」を提供している。Appleは、「iPhone」や「iPad」を使っている全盲および弱視の人向けに、他の人が近くにいることを知らせる「人の検出」機能を2020年にリリースしたほか、スクリーンリーダーの「VoiceOver」をアップデートし、30カ国語以上の音声を新たに加えている。Metaが運営する「Facebook」は、視覚障害者向けに画像の内容説明を自動生成する機能を強化しているほか、「Instagram」の「Instagram動画」や「ストーリーズ」への自動キャプション機能も導入している。

 Amazonは、「Echo」シリーズのスマートスピーカーやディスプレイに、文字起こし機能や、視覚障害者が日用品などを識別するのを助ける「Show and Tell」など、さまざまなアクセシビリティー機能を追加している。またMicrosoftは、障害のあるゲーマー向けのコントローラー「Xbox Adaptive Controller」を2018年にリリースして話題を集めたほか、2021年には「Surface アダプティブキット」を発表し、キーキャップ、ポート、ケーブルなどに凹凸のあるラベルを貼り付けて識別できるようにした。さらに2022年5月には新たなアダプティブアクセサリーとして、「アダプティブマウス」、「アダプティブボタン」、最大4台のアダプティブボタンをワイヤレスで接続できる「アダプティブハブ」の各デバイスを発表している。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]