> >

OpenAI、テキストから動画を生成するAIモデル「Sora」を発表

ZDNET Japan Staff2024年02月16日 11時54分

　OpenAIは米国時間2月15日、テキストから動画を生成できる人工知能（AI）モデル「Sora」を発表した。ユーザーのテキストプロンプトに基づき、現実的で想像力に富んだ最長1分間の動画を生成できるという。

OpenAIの動画からのスクリーンショット。ビル群の間を多数の魚が泳いでいる

提供：OpenAI/Screenshot by Lisa Lacy/CNET

　同社は、AIモデルが物理的な世界での動きを理解し、シミュレーションできるように訓練することで、現実世界のやり取りを必要とする問題解決に役立てたいと説明している。

　AIがもたらす害やリスクを評価するために編成された「レッドチーム」のメンバーや、ビジュアルアーティスト、デザイナー、映画制作者などに、同日よりSoraへのアクセスを提供し、今後の改善に向けてフィードバックを得る。

　Soraは複数のキャラクター、特定の種類のモーション、対象物や背景の詳細などを含む、複雑なシーンを生成できる。また、ユーザーのプロンプトを理解するだけでなく、それらのものが物理世界でどのように存在するかも理解できるという。

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

　一方、同社は現行のモデルに弱点があることも認めている。複雑なシーンの物理を正確にシミュレーションできなかったり、原因と結果を理解できないことがあるという。例えば、人がクッキーをかじった後、その跡がクッキーに反映されない場合などがある。

　ほかにも、左右を混同するなど、プロンプトの空間に関する説明や、カメラの動きをたどるといった経時的な出来事の説明を、誤って解釈することがあるという。

　同社は、誤解を招くコンテンツを特定できるように、Soraによって生成された動画を判別するためのツールも開発中だ。この生成モデルをOpenAI製品に導入する際は、動画の来歴情報が分かるC2PAメタデータを実装する計画だ。

　Soraが生成した多数の動画サンプルが、そのプロンプトとともに公開されている。ネオンの光がきらめく夜の東京を闊歩するスタイリッシュな女性や、雪原を歩んでくる巨大なマンモスの毛が風になびく様子などを見ることができる。

　1月にはGoogleが、テキストプロンプトや画像から非常にリアルな動画を生成するAIモデル「Lumiere」を発表していた。

CNET Japanの記事を毎朝メールでまとめ読み（無料）

「ChatGPT Enterprise」と「ChatGPT Team」、自社に適しているのはどっち？ 2024年02月13日 06時30分
ロシアや北朝鮮などの脅威アクターによるLLM悪用、マイクロソフトとOpenAIが報告 2024年02月15日 11時38分
OpenAIとMSは両社の成功に向け最善を尽くす関係--アルトマンCEO 2023年11月07日 12時53分
2024年は「ビジネスAI元年」になる--SAPジャパンが事業戦略を発表 2024年02月16日 07時00分
「ChatGPT」のGPTって何？--OpenAI言語モデルの違いをまとめて知る 2024年02月03日 08時30分

-PR-企画広告

無限に広がる可能性
すべての業務を革新する
NPUを搭載したレノボAIパソコンの実力
心と体をたった1分で見える化
働くあなたの心身コンディションを見守る
最新スマートウオッチが整える日常へ

企画広告一覧

ZDNET Japan 注目ヘッドライン

編集部おすすめの記事

人気の記事

CNET Japan（Facebook窓）

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]