人工知能(AI)によってテキストから画像を生成するツールを利用したことがある人なら、画像生成ツールへの関心に最初に火を付けたOpenAIの「DALL・E」をよく知っているだろう。OpenAIは9月、さらに進化したDALL・Eを発表し、今回それがリリースされた。
OpenAIは米国時間10月16日、リリースノートを通じて、「DALL・E 3」のベータ版がリリースされ、一部のユーザーを対象としてウェブ版およびモバイル版の「ChatGPT」から直接利用できるようになったことを発表した。
リリースノートには、DALL・Eの提供対象は明記されていないが、9月に初めて発表した際、OpenAIは、「ChatGPT Plus」「ChatGPT Enterprise」のユーザーへの提供を10月から開始すると述べていた。
ChatGPTでDALL・E 3を利用するためには、「GPT-4」オプションのドロップダウンリストからDALL・Eを選択しなければならない。
選択したら、文章による説明を入力し、描いてほしい新しいアートをChatGPTに伝えると、DALL・E 3が数秒で画像を生成する。説明文は、1文だけの短いものでも、複数の文で詳しく説明したものでも良い。
OpenAIはDALL・E 3を最初に発表したとき、生成する画像の精度が増し、プロンプトのニュアンスを読み取るのが上手になったことで、DALL・E 3は「DALL・E 2」を上回る能力を持つと述べていた。
リリースノートでは、ユーザーの不正利用があったためにいったん削除されたウェブブラウジング機能について、9月末に提供が再開されたベータ版から正式版に移行したことも明らかにされている。
つまり、ChatGPT PlusおよびChatGPT Enterpriseのユーザーは、ベータ版のトグルを切り替えなくても、GPT-4モデルのリストから「Browse with Bing」を選択できる。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
「程よく明るい」照明がオフィスにもたらす
業務生産性の向上への意外な効果
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」