OpenAIは米国時間3月14日、話題の人工知能(AI)技術基盤「GPT」を大幅にアップグレードした「GPT-4」を発表した。チャットボット「ChatGPT」の有料版「ChatGPT Plus」を通じて利用できる。
OpenAIによると、新たなGPT-4は生成できる文字列がはるかに長くなり、画像を読み込ませても応答できるようになったほか、前バージョンの「GPT-3.5」で見られたAIの盲点をうまく回避できるよう設計されている。例えば、米国で弁護士として働くために合格が義務付けられている試験の模擬試験を受けさせると、GPT-3.5はスコアが下位10%にとどまるのに対し、GPT-4は上位10%に達するという。
GPTは「Generative Pre-trained Transformer」の略で、独自にテキストを生成(generate)できること、およびGoogleが開発したAI技術「Transformer」を利用していることにちなむ。これは大規模言語モデル(LLM)と呼ばれるAIの一種で、インターネットから収集した膨大な量のデータでトレーニングされる。GPTは数学的に学習することでパターンを見つけ出し、スタイルを再現できるようになる。
OpenAIは数年前から開発者がGPT技術を利用できるようにしてきたが、2022年11月に公開したChatGPTは、簡単なインターフェースで利用できるとあって、この技術をめぐる関心や実験的試行、否定的な側面に関する懸念が爆発的に拡大した。ChatGPTは、プログラミングコードの生成、試験問題への回答から、詩の創作、基本的事実の提供まで、さまざまなことができる。常に信頼できるわけではないが、驚くべき技術だ。
ChatGPTは無料で使えるが、需要が高まればそれが変わることもある。OpenAIは2月、利用者が最大になる時間帯でも確実に利用できるChatGPT Plusを月額20ドル(約2600円)で提供開始していた。
GPT-4を利用したい開発者向けに、「GPT-4 API」のウェイティングリストも公開されている。
OpenAIはGPT-4の性能について、「日常会話のようなやり取りの場合、GPT-3.5とGPT-4の差はごくわずかかもしれない。その違いは、タスクが十分に複雑になった場合に明確になる。GPT-4はGPT-3.5に比べて、より信頼性が高く、創造的で、はるかに繊細な指示を扱うことができる」と説明している。
GPT-4のもう1つの主要な進化は、テキストと写真が混在する入力データに対応できるようになったことだ。OpenAIの例では、旧式のかさばるコネクターを最近の「iPhone」の小さなLightningポートに差し込んだジョークをGPT-4に説明するよう求めている。
もう1つは、AIの「ハルシネーション」(妄想)と呼ばれる、不正確な回答をでっちあげる問題を回避する性能が向上したことだ。ハルシネーションは往々にして、AIが正しく導き出した回答と同じく、確かな根拠があるように見える。GPT-4はまた、間違ったことを言わせようとする試みを阻止する能力も向上している。この性能に関する社内の検証で、GPT-4のスコアは最新のGPT-3.5よりも40%高かったという。
Microsoftは3月14日、「Bing」の検索機能にGPT-4の技術を活用すると発表した。検索分野でOpenAIとMicrosoftが提携することは、Googleにとって大きな脅威となる。ただしGoogleは、同社が一部のテストユーザーに試験公開しているチャットボット「Bard」を含め、独自の大規模言語モデルの技術も保有している。
OpenAIはGPTをトレーニングするため、NVIDIAのGPU「A100」を多数稼動させるMicrosoftの「Azure」クラウドコンピューティングサービスを利用した。Azureは現在、NVIDIAの新プロセッサー「H100」を活用できる。H100は、AIのタスクを高速化する特別な回路を備えている。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」