人工知能(AI)のアシスタントと話していると、会話が自然に流れなかったり、アシスタントがこちらの指示を理解してくれなかったりして、もどかしくなることがある。
ソーシャルメディア大手のMeta(旧Facebook)はこの問題の解決に向けて取り組んできた。そして米国時間2月23日、AIアシスタントを改善するための新プロジェクト「Project CAIRaoke」を発表した。このプロジェクトは、拡張現実(AR)グラスや仮想現実(VR)ヘッドセット向けにMetaが開発するアシスタントの性能向上にも役立つはずだ。
Metaは仕事、交流、買い物などができる仮想空間であるメタバースに注力するという、大きな賭けに出ている。メタバースは大部分がまだ仮説の域を出ないとはいえ、Metaの今後のビジョンにおいてARとVRは欠かせない部分を占めている。一方で、Metaが没入的なオンライン空間への参加を人々に推進するのは今回が初めてではなく、メタバースをめぐるこの狂騒が今後尻すぼみに終わるのかは、今のところはっきりしない。また、メタバースの構築には、ブライバシーやハラスメントなど、Metaがソーシャルメディアで対応に苦戦しているのと同じ問題がついて回る。
Metaの共同創業者で最高経営責任者(CEO)のMark Zuckerberg氏は、メタバースをモバイルインターネットの次に来るものだとみている。人は今後、画面を凝視するよりも、仮想空間に別の人と一緒にいる感覚を味わいたくなるというのが、同氏の読みだ。
Metaが23日に開催したオンラインのイベントで同氏は、「それには、ハードウェアデバイスからソフトウェア、仮想世界の構築や探究に至るまで、あらゆる分野で進歩が必要になる。そうした進歩を解き放つためのカギがAIだ」と述べた。
同氏はこのイベントで、「Builder Bot」というAIコンセプトのデモを通じて、仮想世界でのアシスタントの活用法を紹介した。
このデモで、Zuckerberg氏のアバターは当初、公園の風景を描き出すようBuilder Botに頼むが、その後考えを変えて仮想のビーチに連れて行ってほしいと頼んだ。その後、同氏は雲や島、さらにはハイドロフォイルボード(水中翼をつけたサーフボード)を仮想世界に加えていった。同氏は以前、リアル世界でこのタイプのボードに乗っているところを写真に撮られたことがある。
「このテクノロジーをさらに進化させれば、ユーザーの声による指示だけで、微妙なニュアンスが表現された世界を構築し、他の人々と体験を共有できるようになる」と、同氏は語った。
Metaによれば、将来はProject CAIRaokeで作り出したモデルによって、人間が過去の会話を引き合いに出したり、話題を変えたり、あるいはジェスチャーを使ったりしても、AIアシスタントを混乱させることがなくなるという。ゆくゆくは、ARグラスをかけた人が「このパンツに合う服は何かな?」と尋ねると、アシスタントは「あなたが好きな色の赤のシャツがここにあります」などと答えられるようにするということだ。
「(AIは)人が見ているものを一人称視点で見たり、人が聞いていることを聞いたりできるようになる。そして最も重要なことに、人がいる状況の文脈を理解できるようになる」と、Facebook AIでシニアリサーチマネージャーを務めるAlborz Geramifard氏は語った。
MetaはProject CAIRaokeを解説する動画の中で、これを現時点のアシスタントで一般的に使用されている4つのモデル(自然言語理解、対話状態追跡、対話ポリシー管理、自然言語生成)を組み合わせたエンドツーエンドのAIモデルだと説明している。アシスタントによっては、特定の単語や語句を探すようにプログラミングされているものもあるが、CAIRaokeでは、文脈をより正確に理解し、同じ意味で使われている複数の異なる語句を認識することを目指すという。
Metaが取り組んでいるプロジェクトは、AIアシスタントの機能改善にとどまらない。Metaはさらに、ユーザーがオンラインコンテンツを自身の母語で利用する後押しとなるプロジェクトを2つ発表した。1つはあらゆる言語を学習できる翻訳システムの構築、もう1つはあらゆる言語を瞬時に音声翻訳するユニバーサルな音声言語翻訳プロジェクトだ。
Metaによると、メタバースでは、話す言葉や住んでいる国が異なる人々と交流することになるため、メタバースの構築には翻訳精度の向上が欠かせないのだという。
Facebook AI Research Parisの研究者であるAngela Fan氏は、「メタバースの創造や構築を多くの人が関わる共同作業として捉えた時、新しいテクノロジーに誰もがアクセスできるようにする取り組みを優先事項とする必要がある。それには、世界中の数十億人に向けて翻訳を用意しなければならない」と語った。Fan氏によると、Metaは英語がシステム内で使われるデフォルト言語ではなくなる状況に至るまで、翻訳を向上させることを目指している。
Metaの推定によると、世界のおよそ25%にあたる約20億人が、利用できる翻訳システムがいまだにない言語を話しているという。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
「程よく明るい」照明がオフィスにもたらす
業務生産性の向上への意外な効果
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス