一方、カナダダウン症協会は、毎年11月に開催している啓発キャンペーンの計画に取り組んでいた。非営利の擁護団体である同協会は、ダウン症患者のメンバーを対象に調査を実施し、共通のテーマがあることに気づいた。MacNeilさんと同じように、ダウン症コミュニティーのメンバーの多くは、音声作動式テクノロジーに自分の言葉を理解してもらえないことにいら立ちを覚えており、テクノロジー企業各社に対して、もっと多様なユーザーが製品を利用できるように、行動を起こすことを望んでいたのだ。
そこで、同協会はGoogleにコンタクトをとり、ダウン症患者のサンプル収集を手伝うと申し出た。Project Understoodは、こうして生まれたのである。
カナダダウン症協会のセルフアドボケイト委員会の委員長を務めるMacNeilさんは2019年秋、カリフォルニア州マウンテンビューにあるGoogleの本社を訪れ、同プロジェクトで音声サンプルを提供する最初の1人となった。
「Googleが本社に招待してくれて本当に嬉しかった。彼らが社会の問題意識の向上を支援したいと考えていることがしっかりと伝わってきたからだ。そして、彼らは(自社のテクノロジーを)本当に改善したいと考えている」(MacNeilさん)
11月にProject Understoodを立ち上げて以来、Googleは成人のダウン症患者から600以上の音声サンプルを収集するという目標を達成した。今でも、Project Understoodのリンクを通して、サンプルを受け入れている。現在のところ、Googleが収集しているのは、英語の音声サンプルのみだ。
これらのサンプルが極めて重要なのは、音声アシスタントの訓練に使用されてきたアルゴリズムが、「一般的な話し方」とされるものに基づいているからだ。ダウン症やALS、発話に影響を及ぼすそのほかの病気の患者がなかなかアシスタントに理解してもらえないのは、そこに原因がある。
Googleアシスタントは、ダウン症患者が話す単語の約3分の1を聞き間違える。Googleが、一般的でない話し方を理解できるようにソフトウェアを訓練するためには、より多くのサンプルが必要になる。そこで、Project Understoodの出番だ。ダウン症患者は、「カリフォルニアストリートを左折して」「Cardi Bの曲を再生して」など、約1700のフレーズや、「今日はヨーヨーをやってあげる」といったランダムなフレーズを録音するよう依頼される。すべては、機械学習アルゴリズムでパターンを発見し、精度の向上に利用できるよう、十分な量のデータを生成することが目的だ。
GoogleのプロダクトマネージャーのJulie Cattiau氏は、「収集できる音声サンプルが多ければ多いほど、Googleがダウン症患者やあらゆる人の音声認識を改善できる可能性が高くなる」と語る。
「あらゆる人が、Googleアシスタントをそのままの状態で問題なく使用できるようになることが理想」とCattiau氏。しかし、一般的でない音声パターンにはばらつきがあるため、それは実現できない可能性があることも認めている。その代わりに、デジタルアシスタントは大幅なパーソナライゼーションが必要になってくるかもしれない。
Cattiau氏によると、パーソナライゼーションの問題を解決するには、より多くの機械学習データだけでなく、データ分析の技術革新も必要だという。
Googleは4人の医療言語聴覚士を雇用し、AIエンジニアと協力して、音声パターンの性質を理解し、データセットをグループ化してパターンを見つける方法を考える作業に取り組んでいる。
「われわれはエンジニアなので、病気自体や、それが音声や言語に及ぼす影響についての知識はない。その点で、医療言語聴覚士が大きな助けになっている」(Cattiau氏)
CNET Japanの記事を毎朝メールでまとめ読み(無料)
OMO戦略や小売DXの実現へ
顧客満足度を高めるデータ活用5つの打ち手
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
パナソニックのV2H蓄電システムで創る
エコなのに快適な未来の住宅環境
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス