> >

OpenAIが「GPT 4.1」公開--4oを凌駕　コストを抑えつつGPT 4.5 Previewと同等以上に

小口貴宏（編集部）2025年04月15日 06時16分

　OpenAIは2025年4月14日、「GPT‑4.1」をAPI向けに公開した。従来のGPT‑4o系を総合的に上回り、コーディング能力、指示追従性、長文脈処理の三領域で大幅な性能向上を実現した。最大100万トークンまでのコンテキスト対応と2024年6月時点までの知識を備え、実運用を念頭に最適化されたモデルとなる。

ChatGPT
※クリックすると拡大画像が見られます

最大100万トークンのコンテキストを理解
ベンチマークで4oを凌駕
運用コストも削減
GPT‑4.5 Previewは廃止。GPT 4.1がOpenAIの最新モデルに

最大100万トークンのコンテキストを理解

　GPT 4.1シリーズは「GPT‑4.1」「GPT‑4.1 mini」「GPT‑4.1 nano」の3つで構成される。

　第一の特徴となるのが「最大100万トークンのコンテキスト理解」だ。GPT-4oの最大12万8000トークンから大きく進化した。

　100万トークンは、Reactのコードベース全体の8倍以上に相当する量で、大規模なコードや長文のドキュメントの処理に向く。また、GPT-4oよりもはるかに正確に関連情報を見つけ出し、無関係な情報を無視できるようになったという。長文コンテキストの理解は、法律、プログラミング、カスタマーサポートなど、さまざまな分野で重要なスキルだとしている。

ベンチマークで4oを凌駕

　ベンチマークではGPT‑4.1がソフトウェア開発タスクの実行能力を測る「SWE‑bench Verified」で54.6％を記録し、GPT‑4o比で21.4ポイント向上した。複雑な推論力を試す「Scale MultiChallenge」では38.3％をマークし、視覚・映像理解を評価する「Video‑MME」（字幕なし長尺動画のマルチモーダル理解）では72.0％と、いずれも従来モデルを引き離している。

　小型モデルのGPT‑4.1 miniは、知能評価でGPT‑4oを凌駕しつつレイテンシをほぼ半減、コストを83％削減した。さらに最小構成のGPT‑4.1 nanoは1Mトークン対応を維持したまま、学術知識の網羅性を測るMMLUで80.1％を達成し、128kトークン入力時でも最初のトークンが5秒以内に返る高速性を示した。

ソフトウェア開発タスクの実行能力を測る「SWE‑bench Verified」
※クリックすると拡大画像が見られます

4oファミリーのレイテンシ比較
※クリックすると拡大画像が見られます

字幕なし長尺動画の理解力も向上
※クリックすると拡大画像が見られます

運用コストも削減

　運用コストも下がった。GPT‑4.1は中央値の問い合わせでGPT‑4oより26％安価となり、プロンプトキャッシュ割引は75％に拡大した。入力100万トークン当たりの料金はGPT‑4.1が2ドル、miniが0.40ドル、nanoが0.10ドルで、Batch API経由ならさらに50％の割引が適用される。

　実利用の事例では、トムソン・ロイターは法務AI「CoCounsel」にGPT‑4.1を導入することで、複数文書のレビューにおける正確性が従来モデル比で17％向上したと明かした。Carlyleは長大な財務資料からの情報抽出タスクにおいて、データ抽出精度が従来比で50％改善したという。