グーグル、エージェント時代の次世代AIモデル「Gemini 2.0」を発表

Imad Khan (CNET News) 翻訳校正: 編集部2024年12月12日 12時07分

 Googleは米国時間12月11日、エージェントの時代の次世代AIモデルとして「Gemini 2.0」を発表した。また、コンピュータービジョンに基づくAIエージェント「Project Astra」のテスタープログラムを拡大することも明らかにした。

Gemini 2.0の公式画像 提供:Google
※クリックすると拡大画像が見られます

 5月に開発者会議Google I/Oで発表されたProject Astraは、GoogleのAI研究における大きな進歩だ。スマートフォンやスマートグラスに搭載されたカメラを通して動作し、ユーザーの周囲の世界を認識・分析し、それに関する質問に回答できる。例えば、バスの行き先や本を置いた場所などだ。

Project Astra Project Astra
提供:CNET

※クリックすると拡大画像が見られます

 Googleは、Astraの最新バージョンには、複数の言語および混合言語での会話能力、「Googleレンズ」や「Googleマップ」との連携、最大10分間の記憶保持、応答速度の向上が含まれるとしている。

 一般公開の時期は明らかにされていない。

 Project Astraの視覚的な機能は、プライバシーに関する懸念を引き起こす可能性が高い。Googleは、社内レビューグループであるResponsibility and Safety Committeeと協力し、潜在的なリスクを特定しているという。また、ユーザーが意図せずにエージェントに機密情報を共有することを防ぐための対策を検討中であり、ユーザーがセッションを簡単に削除できるようにするための制御をすでに組み込んでいる。

Gemini 2.0と「Project Mariner」

 Googleによると、Gemini 2.0は一般的なクエリからコーディングの質問、さらには数学に至るまで、あらゆる分野でより優れた応答を可能にする高度な推論能力を備えるという。また、以前のバージョンよりも高速に動作する。Gemini 2.0 の最初のモデル「Gemini 2.0 Flash」は、一般公開に先駆けて開発者向けに提供されている。

 また11日から、すべてのGeminiユーザーがデスクトップとモバイルのドロップダウンメニューから、Gemini 2.0 Flashの試験運用版にアクセスできるようになる。まもなくスマートフォンのGeminiアプリでも利用できるようになるという。Googleは2025年早々に、Gemini 2.0をより多くのGoogle製品に拡大するとしている。

 Googleは、ブラウザーを使った複雑なタスクを支援するプロトタイプであるProject Marinerも発表した。試験運用版の「Chrome」拡張機能を介して、テキスト、画像、グラフなど、ピクセルやウェブ要素を含むブラウザー画面上の情報を分析し、その情報を使用して複雑なタスクを完了できる。Project Marinerはまだ初期段階で、精度や速度に課題があるという。この機能は一部のテスター向けに提供されている。

 Googleのエンジニアは、AIがゲームを手助けする方法についても研究している。「クラッシュ・オブ・クラン」や「ブロスタ」の開発元であるSupercellと提携し、ボスを倒すために何をすべきかなど、プレイ中のゲームに関する質問に答えられるAIの開発に取り組んでいる。

 同社はまた、コーディングを支援するAIエージェント「Jules」を開発中であることも発表した。JulesはGitHubのワークフローに統合されている。

Googleの発表

高コスパなシャオミのPD対応モバイルバッテリー(価格をAmazonでチェック)

この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画広告

企画広告一覧

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]