OpenAIは日本時間8月8日未明、新たな大規模言語モデル「GPT-5」を発表し、同日より提供を開始した。「史上最も賢く、最速で、最も役立つモデル」と位置づけ、専門家レベルの知性を組み込んだ思考を誰もが利用できるとしている。
本日から、Plus、Pro、Team、そして無料版の全ユーザーがGPT-5を利用可能になった。無料版と有料版の主な違いは、送信可能なメッセージ数の上限にある。また、EnterpriseおよびEdu版では来週からの提供を予定している。
GPT-5では、これまで複数存在していたモデルを統合し、よりシンプルな運用が可能になった。タスクに応じて自動で思考が有効になるほか、複雑な思考を求めるタスクには「GPT-5 Thinkingモード」を選択することで、従来の「o3」を用いた処理を代替できる。
さらに、ハルシネーション(事実誤認)も大幅に低減した。OpenAIによれば、GPT-5はGPT-4oと比較して事実誤認が20%少なく、Thinkingモードではo3と比べて70%事実誤認を削減した。また、自由回答形式の質問に対しては、ハルシネーションの発生率をo3比で6分の1にまで抑えたという。
なお、GPT‑5は推論時、実行できないタスクをより見極め、その限界を明確にユーザーへ伝えるという。つまり「できないことはできない」と正直に申し出るわけだ。
これは、ChatGPTの実運用において文章生成時の大きな課題であったハルシネーション問題を大きく解消するもので、業務プロセスへのさらなる導入を後押しする可能性がある。
GPT-5は多方面において進化を遂げている。まずコーディング分野では、複雑なフロントエンドの生成や大規模なコードベースのデバッグ処理において特に性能が向上した。
具体的には、1つのプロンプトから、優れたWebサイトやアプリ、ゲームを直感的に作成可能で、初期テストではスペースやタイポグラフィ、余白といったデザインの理解力が大幅に向上したという。
文章作成能力についても、単なる構成補助にとどまらず、アイデアを文学的な深みとリズムがあり読みやすい文章へ昇華できる。弱強五歩格(iambic pentameter)や自由詩といった詩的表現にも対応し、日常的なレポートやメール、メモの作成においても高い実用性を発揮する。
ヘルスケア分野では、現実の臨床シナリオと医師が定めた評価基準に基づく「HealthBench」で、従来モデルを大幅に上回るスコアを記録。ユーザーの知識レベルや居住地域に応じた応答の最適化により、より安全で信頼性の高い情報提供が可能となっている。
各種ベンチマークにおける性能も著しく向上しており、AIME 2025(数学)では94.6%、SWE-bench(コーディング)では74.9%、MMMU(マルチモーダル理解)では84.2%、HealthBench Hard(医療)では46.2%を記録。いずれもこれまでの最高水準を塗り替える結果となった。
GPT‑5は全体的に思慮深くもなっているという。GPT‑4o と比べて過度に同調することが少なく、不要な絵文字の使用も抑えた。これにより、AIと話しているというより、博士号レベルの知性を備えた親しい友人と会話しているように感じられるという。
安全性においても、GPT-5は新たなアプローチを導入した。従来の「拒否」に基づいた安全性学習ではなく、「セーフコンプリーション」という新手法を導入。安全域を逸脱しない範囲で可能な限りユーザーに役立つ回答を提供し、拒否が必要な際には理由を明確に説明して安全な代替案を提示する。
最高難度のタスク向けには「GPT-5 Pro」も同時リリースされた。OpenAI o3-proに代わる新モデルで、長時間の思考と効率的な並列計算を活用して最高レベルの網羅的回答を実現する。給与水準の高い知識労働の遂行力を示す評価では、「外部専門家がGPT-5 thinkingよりGPT-5 Proの応答を好んだ割合」が67.8%に達した。
GPT-5 ProはProユーザーのほか、Team、Enterprise、Eduユーザーもまもなく利用可能になる。
Amazonで現在開催中のセールを見るCNET Japanの記事を毎朝メールでまとめ読み(無料)
ドコモビジネス×海外発スタートアップ
共創で生まれた“使える”人流解析とは
Copilot + PCならではのAI機能にくわえ
HP独自のAI機能がPCに変革をもたらす