logo

AI同士の音声対話を検知したら、デジタルデータ通信へ切り替える技術--特許出願

  • 一覧
  • このエントリーをはてなブックマークに追加

 Googleが各地で提供している音声アシスタント機能「Google Duplex」は、AIが電話をかけ、相手と音声でコミュニケーションしてレストランの予約などを自動処理する。今時は、音声で応答している相手もAIだった、ということもあるだろう。AI同士であれば、音声でやり取りすることは効率が悪く、最初からデータ通信をした方がよい。

 これに対し、Capital One Servicesは、音声コミュニケーションがAI間で始まることを検知すると、やり取りを音声通信からデジタルデータ通信へ切り替える技術を考案。この技術を米国特許商標庁(USPTO)へ出願したところ、米国時間8月20日に「ARRANGEMENTS FOR DETECTING BI-DIRECTIONAL ARTIFICIAL INTELLIGENCE (AI) VOICE COMMUNICATIONS AND NEGOTIATING DIRECT DIGITAL COMMUNICATIONS」(公開特許番号「US 2020/0267224 A1」)として公開された。出願日は2019年2月15日。

公開されたCapital One Servicesの特許(出典:USPTO)
公開されたCapital One Servicesの特許(出典:USPTO)

 この特許は、一対一の音声コミュニケーションを開始する際、AI同士の対話かどうか確認し、AI同士である場合は音声でなくデジタルデータによる通信へ切り替える技術を説明したもの。一方が人間であるなら、音声によるコミュニケーションは理にかなっている。しかし、AI同士なら、音声よりもデジタルデータの方が情報密度を高くできるうえ、行き違いが生じにくく、情報交換の効率を高められる。

AIのかけた電話をAIが受けたのかもしれない(出典:USPTO)
AIのかけた電話をAIが受けたのかもしれない(出典:USPTO)

 AI同士の音声コミュニケーションが始まることを認識するために、この特許ではあらかじめ定義しておいた識別情報を送信する。この情報を確認した場合は、双方がAIであると判断し、プロトコルに従ってデジタルデータ通信へ切り替える。

 識別情報としては、人間が聞き取れて理解できる音声メッセージでもよいし、聞こえるものの内容を認識できないエンコードされたデータ列でもよいし、可聴域外の変調データ列でもよい。

AIによる音声コミュニケーションを識別情報で知らせる(出典:USPTO)
AIによる音声コミュニケーションを識別情報で知らせる(出典:USPTO)

 なお、特許とは、技術的アイデアの権利保護を目的とした公的文書である。登録されて成立しても、実際の製品やサービスで利用されるとは限らない。さらに、アイデアの存在を公知の事実にする目的で出願され、登録に至らず公開止まりになるものも少なくない。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]