Googleは先日の年次開発者会議「Google I/O 2022」で、「Pixel 7」や「Pixel Buds Pro」など、多くの新製品を発表した。魅力的なハードウェアの陰に隠れてあまり注目されなかったが、ジョークを理解できる人工知能(AI)も紹介した。
ジョークや皮肉、ユーモアを理解するためには、人間の言葉や行動の微妙なニュアンスを捉えられなければならない。コメディアンが皮肉やきわどい言葉を口にすると、観客は通常、そのトーンを聞き分けて、その発言は誇張だと察する。これは他者とのコミュニケーションを積み重ねることで習得できる能力だ。
しかしGoogleの新しい言語モデル「Pathways Language Model(PaLM)」は、ユーモアやジョークの理論を特別に学ぶことなく、この能力を身につけた。今回のI/Oでは、PaLMが2つのジョークの意味を正しく理解し、解説できることが示された。Googleのブログでは、まだインターネットに公開されていない新しいジョークをPaLMがどのように理解したかが紹介されている。
もっとも、Googleの親会社Alphabetの最終目標は、おやじギャグを理解できるAIの開発ではない。AIが自然言語やクエリのニュアンスを分析できれば、Googleは幅広い言語や話者による複雑な質問により速く、正確に答えられるようになる。そうすれば人間と機械の垣根は取り払われ、決められた手段ではなく、より自然な方法で対話できるようになるだろう。AIが見つけた情報を別の言語に翻訳した上で人間に伝えたり、人間が言葉で指示したことをプログラムのコードに反映したりすることも可能になるはずだ。
しかし、この技術の素晴らしさは一部のTwitterユーザーには伝わらなかったようだ。「#GoogleIO2022」で検索すると、上位の結果は新型Pixelの話題で埋め尽くされている。
テクノロジー分野の調査やコンサルティングを手がけるGartnerの上級主席アナリストTuong Nguyen氏は、「私の母親にLaMDAやPaLM、自然言語処理を説明しても、理解してもらうのは難しい」と指摘する。「デバイスは、ある意味では、Googleが開発している最先端のテクノロジーを人々に届ける役割を担っている」
Googleは、デバイスとPaLMを組み合わせることで、日常生活の小さなイライラを解消する方法を紹介している。米国時間5月11日のGoogle I/Oに登壇したAlphabetの最高経営責任者(CEO)Sundar Pichai氏は、マイナー言語の話者が直面しがちな問題として、インターネットで何かを調べても母語で書かれた答えが見つからないことを挙げた。たとえ答えが見つかっても、たいていは英語かスペイン語で書かれている。
Pichai氏は、PaLMにベンガル語で「ニューヨークで人気のピザのトッピングは何か」を尋ねると、PaLMが英語で書かれた答えを見つけ、それをベンガル語に翻訳して返すという例を紹介した。
「いずれは幅広いトピックの質問にあらゆる言語で答えられるようにしたい。検索をはじめ、すべてのGoogleサービスで知識を身近なものにしていく」と、Pichai氏は語った。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」