「Googleアシスタント」は多くのダウン症患者から学んでいる - (page 3)

Marguerite Reardon (CNET News) 翻訳校正: 川村インターナショナル2020年06月12日 07時30分

 一方、カナダダウン症協会は、毎年11月に開催している啓発キャンペーンの計画に取り組んでいた。非営利の擁護団体である同協会は、ダウン症患者のメンバーを対象に調査を実施し、共通のテーマがあることに気づいた。MacNeilさんと同じように、ダウン症コミュニティーのメンバーの多くは、音声作動式テクノロジーに自分の言葉を理解してもらえないことにいら立ちを覚えており、テクノロジー企業各社に対して、もっと多様なユーザーが製品を利用できるように、行動を起こすことを望んでいたのだ。

 そこで、同協会はGoogleにコンタクトをとり、ダウン症患者のサンプル収集を手伝うと申し出た。Project Understoodは、こうして生まれたのである。

 カナダダウン症協会のセルフアドボケイト委員会の委員長を務めるMacNeilさんは2019年秋、カリフォルニア州マウンテンビューにあるGoogleの本社を訪れ、同プロジェクトで音声サンプルを提供する最初の1人となった。

 「Googleが本社に招待してくれて本当に嬉しかった。彼らが社会の問題意識の向上を支援したいと考えていることがしっかりと伝わってきたからだ。そして、彼らは(自社のテクノロジーを)本当に改善したいと考えている」(MacNeilさん)

 11月にProject Understoodを立ち上げて以来、Googleは成人のダウン症患者から600以上の音声サンプルを収集するという目標を達成した。今でも、Project Understoodのリンクを通して、サンプルを受け入れている。現在のところ、Googleが収集しているのは、英語の音声サンプルのみだ。

技術的な課題

 これらのサンプルが極めて重要なのは、音声アシスタントの訓練に使用されてきたアルゴリズムが、「一般的な話し方」とされるものに基づいているからだ。ダウン症やALS、発話に影響を及ぼすそのほかの病気の患者がなかなかアシスタントに理解してもらえないのは、そこに原因がある。

 Googleアシスタントは、ダウン症患者が話す単語の約3分の1を聞き間違える。Googleが、一般的でない話し方を理解できるようにソフトウェアを訓練するためには、より多くのサンプルが必要になる。そこで、Project Understoodの出番だ。ダウン症患者は、「カリフォルニアストリートを左折して」「Cardi Bの曲を再生して」など、約1700のフレーズや、「今日はヨーヨーをやってあげる」といったランダムなフレーズを録音するよう依頼される。すべては、機械学習アルゴリズムでパターンを発見し、精度の向上に利用できるよう、十分な量のデータを生成することが目的だ。

figure_2
提供:Canadian Down Syndrome Society

 GoogleのプロダクトマネージャーのJulie Cattiau氏は、「収集できる音声サンプルが多ければ多いほど、Googleがダウン症患者やあらゆる人の音声認識を改善できる可能性が高くなる」と語る。

 「あらゆる人が、Googleアシスタントをそのままの状態で問題なく使用できるようになることが理想」とCattiau氏。しかし、一般的でない音声パターンにはばらつきがあるため、それは実現できない可能性があることも認めている。その代わりに、デジタルアシスタントは大幅なパーソナライゼーションが必要になってくるかもしれない。

 Cattiau氏によると、パーソナライゼーションの問題を解決するには、より多くの機械学習データだけでなく、データ分析の技術革新も必要だという。

 Googleは4人の医療言語聴覚士を雇用し、AIエンジニアと協力して、音声パターンの性質を理解し、データセットをグループ化してパターンを見つける方法を考える作業に取り組んでいる。

 「われわれはエンジニアなので、病気自体や、それが音声や言語に及ぼす影響についての知識はない。その点で、医療言語聴覚士が大きな助けになっている」(Cattiau氏)

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]