OpenAIは、推論能力を大幅に強化した新しいAIモデル「o3」およびその軽量版「o3 mini」を発表した。複雑な問題解決能力を持ち、科学、数学、コーディングなどの幅広い分野で優れたパフォーマンスを発揮するという。2025年1月末頃に「o3 mini」が、その後すぐに強力な「o3」が登場する。
名称は順当なら「o2」となるはずだが、英国の携帯キャリア「O2」と名称が競合することを避けるため「o3」となった。
OpenAIの5段階ロードマップによれば、o3はAIが人間以上の汎用知能を獲得する「AGI」への大きな前進で、その次の「エージェント能力の獲得」に向けた移行を加速させるという。「ほとんどのタスクで人間を上回る性能を備えている」(OpenAI)とし、AGIの達成が現実味を帯びていると強調した。
数学的推論も進化し、o3は難易度の高い数学コンペティション「American Invitational Mathematics Examination」(AIME 2024)でほぼ満点の96.7%の正答率を達成した。なお、前モデルのo1の正答率は83.3%だった。さらに、コーディングや科学的知識についてもo1から性能が向上している。
さらに、AIがAGIに近づいているかを測る「ARC-AGI」で、AIモデルとして初めて人間の平均スコアを超えたという。同テストはAIの直感的学習能力を測るもので、AIが未知の状況でどれだけ適応し、新しい問題を即座に学び解決できるかを測定するものだ。
具体的には、複数色のマス目で構成されたパズルのような問題だ。各タスクには、入力と出力のペアが複数提供され、これらの例から共通するパターンやルールを見つけ出すことが求められる。人間は比較的容易に解答できるが、これまでのAIは苦手にしていた。
軽量版のo3-miniは、計算コストを抑えつつ、o1モデルに匹敵する性能を発揮できるという。
o3は現在、倫理的に不適切な回答を防止するなどの安全性テストが進行しているフェーズだという。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力