Googleは米国時間12月11日、エージェントの時代の次世代AIモデルとして「Gemini 2.0」を発表した。また、コンピュータービジョンに基づくAIエージェント「Project Astra」のテスタープログラムを拡大することも明らかにした。
5月に開発者会議Google I/Oで発表されたProject Astraは、GoogleのAI研究における大きな進歩だ。スマートフォンやスマートグラスに搭載されたカメラを通して動作し、ユーザーの周囲の世界を認識・分析し、それに関する質問に回答できる。例えば、バスの行き先や本を置いた場所などだ。
Googleは、Astraの最新バージョンには、複数の言語および混合言語での会話能力、「Googleレンズ」や「Googleマップ」との連携、最大10分間の記憶保持、応答速度の向上が含まれるとしている。
一般公開の時期は明らかにされていない。
Project Astraの視覚的な機能は、プライバシーに関する懸念を引き起こす可能性が高い。Googleは、社内レビューグループであるResponsibility and Safety Committeeと協力し、潜在的なリスクを特定しているという。また、ユーザーが意図せずにエージェントに機密情報を共有することを防ぐための対策を検討中であり、ユーザーがセッションを簡単に削除できるようにするための制御をすでに組み込んでいる。
Googleによると、Gemini 2.0は一般的なクエリからコーディングの質問、さらには数学に至るまで、あらゆる分野でより優れた応答を可能にする高度な推論能力を備えるという。また、以前のバージョンよりも高速に動作する。Gemini 2.0 の最初のモデル「Gemini 2.0 Flash」は、一般公開に先駆けて開発者向けに提供されている。
また11日から、すべてのGeminiユーザーがデスクトップとモバイルのドロップダウンメニューから、Gemini 2.0 Flashの試験運用版にアクセスできるようになる。まもなくスマートフォンのGeminiアプリでも利用できるようになるという。Googleは2025年早々に、Gemini 2.0をより多くのGoogle製品に拡大するとしている。
Googleは、ブラウザーを使った複雑なタスクを支援するプロトタイプであるProject Marinerも発表した。試験運用版の「Chrome」拡張機能を介して、テキスト、画像、グラフなど、ピクセルやウェブ要素を含むブラウザー画面上の情報を分析し、その情報を使用して複雑なタスクを完了できる。Project Marinerはまだ初期段階で、精度や速度に課題があるという。この機能は一部のテスター向けに提供されている。
Googleのエンジニアは、AIがゲームを手助けする方法についても研究している。「クラッシュ・オブ・クラン」や「ブロスタ」の開発元であるSupercellと提携し、ボスを倒すために何をすべきかなど、プレイ中のゲームに関する質問に答えられるAIの開発に取り組んでいる。
同社はまた、コーディングを支援するAIエージェント「Jules」を開発中であることも発表した。JulesはGitHubのワークフローに統合されている。
Googleの発表
高コスパなシャオミのPD対応モバイルバッテリー(価格をAmazonでチェック)
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力