筆者はAIを取り入れたクリエイティブソフトウェアを数多くテストしてきたが、画像生成ソフトウェア(最近は動画を生成できるものも登場)は大きく2つの種類に分類されるようだ。1つは、プロンプトを入力してAIが自分の意図を完璧にくみ取ってくれることを祈る方法、もう1つはAIを使わず、「Photoshop」などのプログラムを使って、すべてを手作業で作る方法だ。その中間の選択肢は、実質的にはほとんど存在しなかった――「Intangible」が登場するまでは。
Intangibleは、最新の生成AI技術を活用している多くのスタートアップ企業の1つだ。同社の看板である3Dモデリングツールは、操作可能な3Dシーンをテキストプロンプトから作成できる。作成したシーンは静止画や動画として書き出せるだけでなく、(仮想空間の)セットのカメラを回す感覚でコントロールできる。シーンを構成する要素をすべて手動で作成する必要もない。作業はブラウザ上で完結し、ソフトウェアのダウンロードも不要だ。著者の知る限り、Intangibleは他のAI画像・動画生成ツールとは一線を画す。
日常生活の中で3Dモデルが必要になる状況など思いつかないかもしれない。だが、例えば視覚優位の人、頭の中で想像するよりビジュアルで考えたいタイプの人には役に立ちそうだ。Intangibleの用途はアニメーション制作に限られない。例えば広告コンセプトの視覚化、結婚式場のようなイベントスペースの空間プランニングにも使えるように設計されている。
「莫大な予算がある大作映画や大作ゲームを作ろうとしているなら、Intangibleの出る幕はないかもしれない。しかしウェブアプリやプレゼン資料、企画資料を作りたいだけなら、Intangibleの質は十分すぎるはずだ」と語るのは、Intangibleの創業者で最高経営責任者(CEO)を務めるCharles Migos氏だ。
Migos氏は世界的なゲームエンジン開発企業、Unityでプロダクトデザイン担当バイスプレジデントを務めていた時期にIntangibleの構想を思いついた。しかしUnityではこの製品をリリースできないことが明確になったため、2024年にBharat Vasan氏と共にIntangibleを立ち上げた。これまでにベンチャーキャピタルやエンジェル投資家から集めた資金は400万ドル(約6億円)に上る。現在は招待者のみが参加できるクローズドベータテストを実施しており、「スター・ウォーズ」や「シュレック」など、CGIを駆使した映画を手がけたプロダクションデザイナーらがベータ版ユーザーとして参加している。
Migos氏によれば、Intangibleは2025年6月に一般公開を予定している。
筆者はリードプロダクトデザイナーのPhilip Metschan氏から、Intangibleの操作を特別に見せてもらった。Metschan氏はまず、テキストプロンプトを入力して、ニューヨークを思わせる3Dのビル群を生成した。あらかじめ用意されている要素の中から女性キャラクターを選んで配置する。外見はランナー風に仕上げた。テキストプロンプトを駆使して、見た目をさらにカスタマイズしていく。キャラクターの設定は維持したまま、他の部分を編集することも可能だ。さらに微調整を加え、走っているポーズをとらせる。続いて全体の視点を変更し、キャラクターを前景に配置して、角度を微調整した。
Metschan氏はPixarに約20年間勤務したベテランだ。「ウォーリー」や「インクレディブル・ファミリー」などの人気作にも携わり、超大作アニメーション映画の制作に求められる緻密な作業を熟知している。アニメーション制作は関わる人間が多いので、方向性を定めるだけでも途方もない時間がかかる。このプロセスを短縮できる可能性を秘めているのが、IntangibleのようなAIツールだ。さまざまなアイデアを手作業とは比べものにならないほど短い時間で形にできるため、意思決定のプロセスを大幅に短縮できる可能性がある。AIが生成した画像や動画が最終的な作品に使われることはなくても、クリエイターのビジョンを具体的に示し、作品の世界観や方向性を関係者が確認する助けにはなる。
「制作のプロセスで、最もコストがかかるのは意思決定だ」とMetschan氏は言う。「このプロセスを短縮できるツール、反復作業を効率化し、共同作業をサポートしてくれるツールは常に歓迎される」
Metschan氏は、Intangibleがこのプロセスをどう高速化できるかを具体的に見せてくれた。まずはIntangibleを用いて、テレビCM風の49秒の動画を作成する。かかった時間は全部合わせても3時間から4時間。通常なら数週間はかかるストーリーボード作成、ロケハン、キャスティング、撮影の工程を大幅に短縮できた。天候を変えるといった大がかりな変更も随時実行できる。プロンプトを使って作成したキャラクターの要素は保存し、別のキャンバスで再利用することも可能だ。例えばMetschan氏は、赤いジープが林道を走るシーンの背景を雪景色、雨天、晴天などに変更してみせた。
Intangibleの内部では2種類のモデルが動いている。1つはユーザーのプロンプトを認識し、処理するモデル、もう1つはさまざまな要素を生成するモデルだ。Intangibleは、ChatGPTとGrokに対応し、シーンの生成に使用するAIモデルは「Stable Diffusion」、「Flux」、「Kling」から選べる。Intangibleで作成した画像や動画の所有権はユーザーに帰属するが、現時点では透かしは入らないため、AI生成である旨を何らかの方法で明示することが望ましい。
Intangibleの経営陣は、すべてのクリエイターが生成AIの利用に前向きではないことも理解している。仕事を奪われる可能性、モデルの学習に作品が勝手に使われるリスク、ネット上にあふれる粗製乱造のAIコンテンツなど、AIをめぐる懸念は多い。しかしMigos氏は、Intangibleのようなテクノロジーは人間の創造性を増幅させると考えている。創造性は、AIが決して置き換えることのできない人間の「無形(intangible)」の資質であり、Intangibleという社名もここに由来する。
「クリエイターは優れた語り手だ」とMigos氏は言う。「観客の心の動きを読み、芸術表現の価値と美しさを理解している。私たちは、そういう人たちに力を与えるツールを作りたい」
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
先端分野に挑み続けるセックが語る
チャレンジする企業風土と人材のつくり方
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
すべての業務を革新する
NPUを搭載したレノボAIパソコンの実力
日本のインターステラテクノロジズが挑む
「世界初」の衛星通信ビジネス