テキストから画像を生成するAI「DALL-E」、枠外の部分を生成可能に

Stephen Shankland (CNET News) 翻訳校正: 矢倉美登里 吉武稔夫 (ガリレオ)2022年09月01日 13時37分

 OpenAIのオンラインサービスで、人工知能(AI)を利用して入力されたテキストから画像を生成する「DALL-E」は、より創造的な用途に使えるよう、枠外の部分を補完してさらに大きな画像を作成できるようになった

Outpainting
提供:OpenAI

 4月にサービスの提供を開始した時、DALL-Eは「オペラを歌っている青い宇宙人の肖像画」「スイスチーズで作られたボルダリング用の壁の3Dレンダリング」「スチームパンクの象」のようなテキストで指示すると、1024×1024ピクセルの画像を生成できる。OpenAIは米国時間8月31日、画像の枠外の部分を生成して大きくできる新機能「Outpainting」を追加した。OpenAIのエンジニアであるDavid Schnurr氏によると、これにはテキストによる指示と既にある画像を利用するという。

 DALL-Eのユーザーは、「さまざまなアスペクト比や、生成したコンセプトをより大きな画像に広げられることを求めていた」とSchnurr氏は述べている。処理能力が限られているため、DALL-Eは高解像度の画像を一から生成するのではなく、既にある画像を広げることしかできないという。

 DALL-Eという名称は、Pixarの映画に登場するロボット「WALL-E(ウォーリー)」とシュールレアリズムの画家サルバドール・ダリの名前を組み合わせたものだが、今AI技術で何ができるかを示す実例だ。OpenAIは、テキストでラベル付けした6億5000万枚の画像を使ってシステムを訓練した。DALL-Eは、さまざまな要素を混ぜ合わせて、テキストによる指示から画像を生成できる。

 DALL-Eは、1カ月に最大60枚の画像を無料で生成できるが、利用するには、サインアップして順番を待つ必要がある。製品マネージャーのJoanne Jang氏によると、これまでに100万人以上がDALL-Eにサインアップしたという。

 DALL-Eに関するツイートを見ると、人々はこれを使って空想的な画像を生成して楽しんでいるようだ。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]