Googleの人工知能(AI)画像生成ツール「ImageFX」が公開されたのは、「DALL・E 3」の公開から1年以上経った米国時間2月1日のことだった。そのため、待つだけの価値はあったのかという疑問がどうしても湧いてくる。これに対する筆者の答えは、その価値はあった(しかも驚くべきものだった)というものだ。
この無料ツールは、米国など一部の国で提供されている。それらの国では、「LABS.GOOGLE」にアクセスして「IMAGEFX」を選択するか、ImageFXのページに直接アクセスし、Googleアカウントにサインインすると利用できる。
画像を生成する方法は、テキストから画像を生成できる他のツールと同じだ。画像にしたい内容を好きなだけ詳しく、あるいは好きなだけ簡単に入力すればいい。
GoogleはImageFXを支えるAIモデル「Imagen 2」について、手や顔の生成など、画像への変換が難しい分野への対応能力が向上したと説明していた。そこで試しに、筆者が「ノートPCを背景に銀色のキーボードでタイピングしている2本の手」というプロンプトを使用したところ、その結果は期待を裏切らないものだった。
ImageFXは、キーボードを使っている両手を描いた4種類の画像をすばやく生成したが、どの画像もリアルで、5本の指が長さの割合も正しく描かれており、生成AIモデルとして見事なものだった。また、品質も非常に高く、まるで「Getty Images」にあるストック写真のようだった。
生成した画像の下にダウンロードと共有のボタンがあるので、後で再利用するのも簡単だ。
ImageFXは「expressive chip」(表現力チップ)という機能を備えており、Googleによると「自身の創造物やアイデアに隣接した次元を素早く試せる」という。説明を読んだとき、最初は戸惑ったが、案外シンプルだ。
expressive chipにより、プロンプトの一部がハイライトされ、生成された画像を調整するために選択できるドロップダウンメニューが追加される。ドロップダウンをクリックして新しいオプションを選択すると、それに応じて調整された新しい画像が生成される。
例えば、「銀のキーボード」のドロップダウンを選択し、「赤のキーボード」に変更して「Generate」(生成)をクリックすると、同じような画像が生成され、大きな違いはキーボードの色だけだった。
expressive chipと、テキストボックスの下に表示されるスタイル提案により、ImageFXはAI画像生成を試したい場合や、楽しみながら画像を調整したい場合に適したものとなっている。
また、ImageFXによって生成されたものを含め、Imagen 2で生成されたすべての画像には、Google DeepMindが開発したツール「SynthID」によって、人間の目には見えない電子透かしが入ることも注目に値する。
この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」