話題のGoogleのAI動画ツール「Veo 3」。自分でも同じクオリティの動画を作れるのか、125ドル(通常は250ドル=日本では3万6400円だが初回3カ月間は半額)を払って試してみた。その結果をレポートする──。
私は普段からAIツールを使って画像や動画を生成し、その性能をレビューしている。今回もAIの実力を測るために定番プロンプトを用意した。それは「暖かなビーチで友達と焚き火を囲み、潮風が吹き、遠くからジミー・バフェットが聞こえる」という私の理想的なシーンだ。このプロンプトをGoogleの最新モデル「Veo 3」で試してみた。
正直、Veo 3にはあまり期待していなかった。SNSでは評価が高かったが、過去にAIが作った不自然な動画を何度も見てきたからだ。特にGoogleのAIクリエイティブ製品は、Geminiに付随する機能程度と認識していた。しかし今回のGoogle I/Oでは「Veo 3」が注目されていたので、実際に試してみることにした。
結果として、Veo 3はGoogleがAIクリエイティブの分野で本気になったことを示していた。特に印象的な機能がひとつあり、競争力は高いと感じた。ただし、まだいくつかの課題は残っている。以下で詳しく説明しよう。
Veo 3は現在、「Google AI Ultra」ユーザーとエンタープライズ向けVertexユーザーのみが利用できる。つまり、Veo 3を試すには課金が必須だ。UltraはGeminiで最も高価な新プランで、月額3万6400円(現在は3か月間半額の月1万8000円)。VertexはGoogleのAIエンタープライズプラットフォームで、使えるかどうかは貴社の契約状況で決まる。
高額なAIツールに抵抗がある場合は、前モデルのVeo 2をGoogle AIのProプラン(月額20ドル)で試す方法もある。1ヶ月の無料トライアルで十分判断できるので、そちらも検討すると良い。
なお、Geminiのプライバシーポリシーでは、Googleが情報を収集して技術改善に利用する可能性があるとしている。機密情報を入力しないことを推奨する。また、Googleが定める禁止事項ポリシーを守る必要もある。
Veo 3でいちばん驚かされたのは、新しく追加された音声生成機能だ。プロンプトに「音を付けて」と書かなくても、自動で効果音やBGMを重ねてくれる。OpenAIのSoraやAdobeのFireflyなど競合サービスでもまだ実装されておらず、この点だけでもGoogleは大きな先行者メリットを得たと言える。
もっとも、AI音声は完璧ではない。AI特有のぎこちなさは音楽やセリフに残っており、慣れた人ならすぐに気づくはずだ。それでも、異星人のバトルシーンでは金属がぶつかる音やうめき声が攻撃にきっちり同期していて、自分で後から効果音を当てるよりずっと楽だった。ただし、恐竜風のエイリアンが「ガオー」「シュー」と文字通り言ってしまうのはご愛嬌だ。
カヤックの動画では、パドルが水をかく動作と水音がほぼ合っていた。自然音の環境効果も心地よく、これまでAI動画に欠けていた奥行きを与えてくれる。ビーチの焚き火パーティーは、実際のパーティーと比べると少し違和感はあったが、「音付きAI動画第1号」としてはまずまずだろう。
もちろん、音が良くなったからといってAI特有の奇妙なクセが消えたわけではない。顔の描写――AIがもっとも苦手とする領域――では相変わらず歪みが出ることがあった。それでも、Veo 2で多発していた明らかな破綻よりは確実に改善している。
私はAI画像・動画生成でよく「幻覚(あり得ない生成ミス)」に出くわすので、まず編集機能の有無をチェックする。しかしVeo 3には細かく手直しできるツールがなく、これは痛い。プロ向けのワークフローでは必須の機能だからだ。代わりに追加プロンプトで「角度を変えて顔が見えるようにして」などと指示すれば、やり直し動画を生成してくれる。
ただし新規・再生成ともに3〜5分は待たされる。私が試したAI動画ツールの中で最長だが、音声付きになった分の“重さ”と考えれば許容範囲かもしれない。
最大の不満は1日の生成上限がすぐ尽きることだ。わずか5本作っただけで24時間ロックされ、検証が進まなくてイラッとした。GoogleのJosh Woodward副社長はX(旧Twitter)で、Ultra加入者はGeminiとFlowの両方で「最も多い回数」使えると言っていたが、Gemini経由では私の場合たった5本。Flowは125本らしい。
Googleにも確認を取ったが、返答は「Ultra加入者には最先端モデルVeo 3への最高レベルのアクセスが提供され、GeminiアプリとFlowの両方で利用できる」という一般論だけ。結局、上限はプロユースを想定していないことの裏返しだ。
凝ったプロンプトを練らなければすぐ生成回数を浪費し、顔が崩れたらやり直しもできない。Veo 3は“AI動画をちょっと試してみたい”愛好家向けであり、本職のクリエイター向けではない。
Veo 2が期待はずれだったので、Veo 3の実用性と精度にも半信半疑だった。しかし実際はかなり健闘しており、とりわけ音声生成は目を見張る。ただし編集など肝心の機能がまだ欠けているのも事実だ。
ハッキリ言えば、Veo 3のためだけに月数百ドルのGoogle AI Ultraを契約する合理的な理由はない。遊び目的なら、はるかに安いVeo 2で十分だし、プロクリエイターにとっては編集機能がない時点で物足りない。UltraプランはYouTube Premiumや30TBのクラウド容量、新しいGeminiモデルへのアクセスなど他の特典があるので、それらも込みで魅力を感じるなら契約してVeo 3で遊ぶのはアリだ。ただしVeo 3単体で見れば、そこまでの価値はない。
SNSで話題になった「革命的アップグレード」という触れ込みほどではないが、確かにVeo 2より一歩進んだ次世代モデルではある。Googleの今後のAI動画展開に期待を抱かせる出来栄えだ。ただし、試すにはそれなりに財布の紐を緩める覚悟が必要だろう。
コンセントに挿して充電器にもなるAnkerのモバイルバッテリー(価格をAmazonでチェック)
この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
働くあなたの心身コンディションを見守る
最新スマートウオッチが整える日常へ
イノベーションの「種」から社会実装へ--
社会課題の解決に挑む各社の挑戦
すべての業務を革新する
NPUを搭載したレノボAIパソコンの実力