Facebookの“未来研究”部門(砕いて言えば、ARおよびVRヘッドセットを開発する部門)であるFacebook Reality Labsは、ブレインコンピューターインターフェイス(BCI)分野での新たな進展を発表した。同社はこの新技術を有効利用しようとしている。
Facebookが支援するカリフォルニア大学サンフランシスコ校(UCSF)の研究者たちが、脳の活動から直接音声をデコードする技術で新たなベンチマークを打ち立てたのだ。Facebookにとって、UCSFの発見は同社がスマートフォンに代わると信じる次世代没入型PCプラットフォーム構築の鍵になるだろう。
電極で拾った人間の脳信号から言葉や文章を解読する研究は既に複数行われているが、確度と解読プロセスの速度はまだ極めて低い。UCSFの研究者によると、単語100個当たりの平均エラー率は60%以上だという。
だが、音声認識と言語翻訳のための高度な機械学習システムを使った脳神経活動の文章への変換で、UCSFの研究チームは最大300語の英単語を使ったテストでエラー率3%で実現した。この新記録は、同じチームが2019年7月に発表した論文のフォローアップだ。その論文では、脳から直接言葉をリアルタイムで音声にデコードする方法を詳解している。
Facebookは、脳のコミュニケーション活動を正確に検出し、自然な会話の早さの音声に変換する技術に関心を持っていることを隠していない。そうした洗練されたBCIは、ユーザーがハンズフリーで他のユーザーと仮想空間や離れた相手とコミュニケーションするVRあるいはARヘッドセットの開発という同社の野望に直結するからだ。
FacebookはUCSFの新たな研究結果を発表する中で、「新たな研究は、次世代コンピューティング向けの非侵襲的無発声音声インターフェイスを開発するというわれわれの使命の未来を照らす」「UCSFの成果が、完全に非侵襲なウェアラブルデバイスに必要なデコードアルゴリズムと技術仕様の開発に役立つことを願う」と述べた。
Facebook Reality Lasは何年も前から人間の脳とコンピューターを接続する研究に取り組んできた。同社は2017年の開発者会議「F8」で、ユーザーが発話を想像するだけでテキストを入力できるウェアラブルデバイスの構築を目標とするBCIプロジェクトを発表した。
Facebookは当時、無発声音声システムを開発しており、いつの日か1分当たり100語を「脳から直接」入力できるようになるとしていた。それは、われわれが現在スマートフォンでテキスト入力する速度の約5倍だ。
とは言え、Reality Labsが目指している現実と仮想の完全な調和が近い将来に実現するわけではない。Facebookは2017年にBCIの取り組みとARのビジョンを発表した際、この取り組みは「10年越しの投資」だと説明した。3年後、UCSFの世界トップレベルの研究チームから新たに有望な成果が上がったにもかかわらず、同社は「未来はまだ遠い先だ」と主張した。
また、Facebookが目的を達成したとしても、ユーザーがそのシリコンバレー製のヘッドセットを被って自分の脳の奥深くまでスキャンさせたがるかどうかは不明だ。Facebookはそのプロセスを、スマートフォンでの写真撮影に例えた。ユーザーはスマートフォンで写真を多数撮影しても、共有するのはその一部だ。「同様に、頭にはさまざまな考えが浮かぶが、ユーザーはそこから共有したいものだけ選ぶのだ」という。この説明で一般の人々を説得できるかどうかはまだ分からない。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス