OpenAI、オープンウェイトAIモデル「gpt-oss」公開--小型版はメモリ16GBのデバイスで動作

Katelyn Chedraoui (CNET News) 翻訳校正: 編集部2025年08月06日 08時15分

 2019年の「GPT-2」以降、OpenAIはオープンなモデルを公開していなかったが、米国時間8月5日に状況が変わった。最高経営責任者(CEO)のSam Altman氏が、「gpt-oss-120b」(1170億パラメータ)と「gpt-oss-20b」(210億パラメータ)という2つの推論向けオープンウェイトAIモデルを公開したのだ。

AIの文字とノートPC 提供:tadamichi/iStock via Getty Images
※クリックすると拡大画像が見られます

 オープンウェイトというAI用語が耳慣れない読者でも心配はいらない。ごく簡単に言えば、オープンウェイトモデルも、チャットボットや画像・動画生成ツールのような製品を動かすAIモデルの一種だ。ただし、今使っているAIツールの技術とは思想面で異なる可能性がある。「ChatGPT」「Gemini」「Copilot」はいずれもクローズドモデルで動いており、その「ブラックボックス」の中身は実質的に分からない。オープンウェイトのモデルは、いわば舞台裏の仕組みの一端を見せているようなものだ。

 開発者や機械学習の専門家でなくても、こうしたオープンなモデルの基本は理解でき、自分で動かすこともできる。以下に、オープンウェイトとオープンソースAIについて知っておくべき点を整理する。

オープンウェイトのAIモデルとは何か

 すべてのAIモデルには「重み(weights)」がある。モデルは学習によって、特定の結び付きに対し、より大きな重み、すなわち値が与えられる。

 米連邦取引委員会(FTC)の定義では、オープンウェイトモデルは、その名のとおり重みが公開されるモデルだ。開発者は重みと、それがAIモデルの作成にどう使われているかを確認できる。

 「おそらく大規模(言語)モデルで最も価値があるのは、実際には重みだ。重みさえあればできることは多く、これは従来のソフトウェアとは少し異なる」と、マサチューセッツ工科大学(MIT)のコンピュータサイエンス助教授でMITコンピュータ科学・人工知能研究所(CSAIL)の研究者であるOmar Khattab氏は米CNETに語った。

 例えばチャットボットは、文の次に来るもっともらしい単語を予測するのが得意になるよう作られている。学習データで頻繁に隣り合って現れる語を、論理的な順序で出力につなげるよう訓練される。よく並んで出てくる語は、そうでない語よりも大きな重みが与えられることがある。

AIのイメージ 提供:Elena Uve/iStock/Getty Images Plus
※クリックすると拡大画像が見られます

OpenAIの新しいオープンウェイトモデルの実力は

 OpenAIが公開した新しいオープンウェイトモデルは2種類で、1170億パラメータのgpt-oss-120bと、210億パラメータのgpt-oss-20bがある。コンテキストウィンドウはいずれも12万8000となっている。コンテキストウィンドウは、モデルが処理して回答に取り込める情報量を指す。大きいほど、より高度な応答が可能で、処理能力も高い傾向がある。

 OpenAIによると、gpt-oss-120bは主要な推論ベンチマークで「o4-mini」と「ほぼ同等」に達し、80GBのGPU1基で動作した。gpt-oss-20bはo3-miniと同程度の結果を出し、メモリが16GBのデバイスで動作した――つまり、この小型モデルはノートPCや一部のスマートフォンでもかなり実用的に動かせる可能性がある(ローカル実行の速度はデバイスの性能による)。

 これらのモデルはApache 2.0ライセンスで提供される。詳細な仕様はモデルカードや安全性トレーニングの論文で確認でき、OpenAIの開発者向けガイドラインのヒントも参照できる。重み自体はHuggingFaceGitHubで公開されている。

オープンウェイトはオープンソースと同じか

 オープンウェイトモデルはオープンソースAIと関係はあるが、同じものではない。オープンソースとは、特定の企業が専有せず、ソースコードが公開され、オープンソースライセンスの下で広く利用できるソフトウェアを指す概念だ。非営利団体Open Source InitiativeはオープンソースAIを「それをユーザーが自由に使用し、研究し、変更し、共有できるという条件で提供されるシステム」と定義している。

 オープンウェイトのAIモデルはオープンソースモデルと同一ではない。Mozilla.orgの最高執行責任者(COO)でMozilla corporationのシニアバイスプレジデントであるSuba Vasudevan氏は、違いを菓子作りにたとえて米CNETに語ってくれた。

 「オープンウェイトモデルは、誰かが焼き上がったケーキを持ってきて『小麦粉と砂糖と卵でできている』と言うようなものだ。これが重みだ。一方、誰かがレシピ全体と手順、各材料の正確な分量まで教えてくれたら、それがオープンソースだ」とVasudevan氏は言う。

 オープンウェイトモデルでは、学習に使われたデータや学習に使ったコードなどは開示されない。学習データをめぐっては、AI企業とコンテンツ制作者の間で対立が起きている。AI企業はモデルの精度向上のために、人間が制作した高品質なコンテンツを求めている。企業によってはライセンス契約でデータを集める一方、一部のパブリッシャーやクリエイターは、AI企業が著作権で保護されたコンテンツを違法に取得していると訴えている。

 出所にかかわらず、学習データはAI企業が持つ最も価値の高い資産の1つだ。しかしオープンウェイトモデルでこれが公開されることはまずない。

この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。

食品・飲料 本日のタイムセール(Amazon)

ソニーの“着るエアコン”「REON POCKET PRO」(価格をAmazonでチェック)

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画広告

企画広告一覧

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]