OpenAI、新たなAIモデル「o3」発表--AGIへ前進、軽量版は1月末公開

 OpenAIは、推論能力を大幅に強化した新しいAIモデル「o3」およびその軽量版「o3 mini」を発表した。複雑な問題解決能力を持ち、科学、数学、コーディングなどの幅広い分野で優れたパフォーマンスを発揮するという。2025年1月末頃に「o3 mini」が、その後すぐに強力な「o3」が登場する。


※クリックすると拡大画像が見られます

o3とは

 名称は順当なら「o2」となるはずだが、英国の携帯キャリア「O2」と名称が競合することを避けるため「o3」となった。

 OpenAIの5段階ロードマップによれば、o3はAIが人間以上の汎用知能を獲得する「AGI」への大きな前進で、その次の「エージェント能力の獲得」に向けた移行を加速させるという。「ほとんどのタスクで人間を上回る性能を備えている」(OpenAI)とし、AGIの達成が現実味を帯びていると強調した。

 数学的推論も進化し、o3は難易度の高い数学コンペティション「American Invitational Mathematics Examination」(AIME 2024)でほぼ満点の96.7%の正答率を達成した。なお、前モデルのo1の正答率は83.3%だった。さらに、コーディングや科学的知識についてもo1から性能が向上している。

キャプション o1から数学的推論も科学的知識も向上
※クリックすると拡大画像が見られます

AGIベンチマークで初の人間超え

 さらに、AIがAGIに近づいているかを測る「ARC-AGI」で、AIモデルとして初めて人間の平均スコアを超えたという。同テストはAIの直感的学習能力を測るもので、AIが未知の状況でどれだけ適応し、新しい問題を即座に学び解決できるかを測定するものだ。

 具体的には、複数色のマス目で構成されたパズルのような問題だ。各タスクには、入力と出力のペアが複数提供され、これらの例から共通するパターンやルールを見つけ出すことが求められる。人間は比較的容易に解答できるが、これまでのAIは苦手にしていた。

 軽量版のo3-miniは、計算コストを抑えつつ、o1モデルに匹敵する性能を発揮できるという。

 o3は現在、倫理的に不適切な回答を防止するなどの安全性テストが進行しているフェーズだという。

3年ぶりに登場した新「iPad mini」(価格をAmazonでチェック)

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画広告

企画広告一覧

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]