OpenAIのオンラインサービスで、人工知能(AI)を利用して入力されたテキストから画像を生成する「DALL-E」は、より創造的な用途に使えるよう、枠外の部分を補完してさらに大きな画像を作成できるようになった。
4月にサービスの提供を開始した時、DALL-Eは「オペラを歌っている青い宇宙人の肖像画」「スイスチーズで作られたボルダリング用の壁の3Dレンダリング」「スチームパンクの象」のようなテキストで指示すると、1024×1024ピクセルの画像を生成できる。OpenAIは米国時間8月31日、画像の枠外の部分を生成して大きくできる新機能「Outpainting」を追加した。OpenAIのエンジニアであるDavid Schnurr氏によると、これにはテキストによる指示と既にある画像を利用するという。
DALL-Eのユーザーは、「さまざまなアスペクト比や、生成したコンセプトをより大きな画像に広げられることを求めていた」とSchnurr氏は述べている。処理能力が限られているため、DALL-Eは高解像度の画像を一から生成するのではなく、既にある画像を広げることしかできないという。
DALL-Eという名称は、Pixarの映画に登場するロボット「WALL-E(ウォーリー)」とシュールレアリズムの画家サルバドール・ダリの名前を組み合わせたものだが、今AI技術で何ができるかを示す実例だ。OpenAIは、テキストでラベル付けした6億5000万枚の画像を使ってシステムを訓練した。DALL-Eは、さまざまな要素を混ぜ合わせて、テキストによる指示から画像を生成できる。
DALL-Eは、1カ月に最大60枚の画像を無料で生成できるが、利用するには、サインアップして順番を待つ必要がある。製品マネージャーのJoanne Jang氏によると、これまでに100万人以上がDALL-Eにサインアップしたという。
DALL-Eに関するツイートを見ると、人々はこれを使って空想的な画像を生成して楽しんでいるようだ。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス