OpenAIが「GPT 4.1」公開--4oを凌駕 コストを抑えつつGPT 4.5 Previewと同等以上に

 OpenAIは2025年4月14日、「GPT‑4.1」をAPI向けに公開した。従来のGPT‑4o系を総合的に上回り、コーディング能力、指示追従性、長文脈処理の三領域で大幅な性能向上を実現した。最大100万トークンまでのコンテキスト対応と2024年6月時点までの知識を備え、実運用を念頭に最適化されたモデルとなる。

ChatGPT ChatGPT
※クリックすると拡大画像が見られます
  1. 最大100万トークンのコンテキストを理解
  2. ベンチマークで4oを凌駕
  3. 運用コストも削減
  4. GPT‑4.5 Previewは廃止。GPT 4.1がOpenAIの最新モデルに

最大100万トークンのコンテキストを理解

 GPT 4.1シリーズは「GPT‑4.1」「GPT‑4.1 mini」「GPT‑4.1 nano」の3つで構成される。

 第一の特徴となるのが「最大100万トークンのコンテキスト理解」だ。GPT-4oの最大12万8000トークンから大きく進化した。

 100万トークンは、Reactのコードベース全体の8倍以上に相当する量で、大規模なコードや長文のドキュメントの処理に向く。また、GPT-4oよりもはるかに正確に関連情報を見つけ出し、無関係な情報を無視できるようになったという。長文コンテキストの理解は、法律、プログラミング、カスタマーサポートなど、さまざまな分野で重要なスキルだとしている。

ベンチマークで4oを凌駕

 ベンチマークではGPT‑4.1がソフトウェア開発タスクの実行能力を測る「SWE‑bench Verified」で54.6%を記録し、GPT‑4o比で21.4ポイント向上した。複雑な推論力を試す「Scale MultiChallenge」では38.3%をマークし、視覚・映像理解を評価する「Video‑MME」(字幕なし長尺動画のマルチモーダル理解)では72.0%と、いずれも従来モデルを引き離している。

 小型モデルのGPT‑4.1 miniは、知能評価でGPT‑4oを凌駕しつつレイテンシをほぼ半減、コストを83%削減した。さらに最小構成のGPT‑4.1 nanoは1Mトークン対応を維持したまま、学術知識の網羅性を測るMMLUで80.1%を達成し、128kトークン入力時でも最初のトークンが5秒以内に返る高速性を示した。

4oファミリーのレイテンシ比較 4oファミリーのレイテンシ比較
※クリックすると拡大画像が見られます
字幕なし長尺動画の理解力も向上 字幕なし長尺動画の理解力も向上
※クリックすると拡大画像が見られます

運用コストも削減

 運用コストも下がった。GPT‑4.1は中央値の問い合わせでGPT‑4oより26%安価となり、プロンプトキャッシュ割引は75%に拡大した。入力100万トークン当たりの料金はGPT‑4.1が2ドル、miniが0.40ドル、nanoが0.10ドルで、Batch API経由ならさらに50%の割引が適用される。

 実利用の事例では、トムソン・ロイターは法務AI「CoCounsel」にGPT‑4.1を導入することで、複数文書のレビューにおける正確性が従来モデル比で17%向上したと明かした。Carlyleは長大な財務資料からの情報抽出タスクにおいて、データ抽出精度が従来比で50%改善したという。

GPT‑4.5 Previewは廃止。GPT 4.1がOpenAIの最新モデルに

 API限定提供に伴い、研究プレビューとして公開されていたGPT‑4.5 Previewは2025年7月14日に廃止される予定だ。GPT 4.1がGPT 4.5 Previewよりもコストを抑えつつ、同等以上の性能となるためだ。

Amazonで現在開催中のセールを見る

コンセントに挿して充電器にもなるAnkerのモバイルバッテリー(価格をAmazonでチェック)

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画広告

企画広告一覧

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]