Googleが各地で提供している音声アシスタント機能「Google Duplex」は、AIが電話をかけ、相手と音声でコミュニケーションしてレストランの予約などを自動処理する。今時は、音声で応答している相手もAIだった、ということもあるだろう。AI同士であれば、音声でやり取りすることは効率が悪く、最初からデータ通信をした方がよい。
これに対し、Capital One Servicesは、音声コミュニケーションがAI間で始まることを検知すると、やり取りを音声通信からデジタルデータ通信へ切り替える技術を考案。この技術を米国特許商標庁(USPTO)へ出願したところ、米国時間8月20日に「ARRANGEMENTS FOR DETECTING BI-DIRECTIONAL ARTIFICIAL INTELLIGENCE (AI) VOICE COMMUNICATIONS AND NEGOTIATING DIRECT DIGITAL COMMUNICATIONS」(公開特許番号「US 2020/0267224 A1」)として公開された。出願日は2019年2月15日。
この特許は、一対一の音声コミュニケーションを開始する際、AI同士の対話かどうか確認し、AI同士である場合は音声でなくデジタルデータによる通信へ切り替える技術を説明したもの。一方が人間であるなら、音声によるコミュニケーションは理にかなっている。しかし、AI同士なら、音声よりもデジタルデータの方が情報密度を高くできるうえ、行き違いが生じにくく、情報交換の効率を高められる。
AI同士の音声コミュニケーションが始まることを認識するために、この特許ではあらかじめ定義しておいた識別情報を送信する。この情報を確認した場合は、双方がAIであると判断し、プロトコルに従ってデジタルデータ通信へ切り替える。
識別情報としては、人間が聞き取れて理解できる音声メッセージでもよいし、聞こえるものの内容を認識できないエンコードされたデータ列でもよいし、可聴域外の変調データ列でもよい。
なお、特許とは、技術的アイデアの権利保護を目的とした公的文書である。登録されて成立しても、実際の製品やサービスで利用されるとは限らない。さらに、アイデアの存在を公知の事実にする目的で出願され、登録に至らず公開止まりになるものも少なくない。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」