OpenAIは米国時間3月25日、主力の対話型AI「ChatGPT」に、「GPT-4o」モデルを活用した画像生成機能を追加した。これにより、「DALL·E」を使わなくても、ChatGPTのウィンドウでAI画像をネイティブに作成できるようになる。同日より、無料プランおよび有料のPlus、Pro、Teamプランで提供を開始し、近くEnterpriseとEduプランでも提供予定だ。同社の動画生成AI「Sora」でも利用できる。
OpenAIのこれまでの画像生成への取り組みは、DALL·Eが中心となっていた。DALL·Eでは、SFのスペースオペラ風のシーンやストックフォト風のものなど、さまざまな画像を生成できる。DALL·EがAI画像生成ツールの中でも特に高く評価される理由の1つは、その独特な会話形式によって画像の作成や編集が簡単にできる点にある。幸い、この「チャットで編集する」機能はChatGPTにも導入される。なおDALL·Eは今後も利用可能だ。
GPT-4oによる画像生成は、インフォグラフィックや図表など、業務関連の画像にも重点を置いている。そのため、OpenAIはテキストレンダリングを改善したという。AIはしばしばハルシネーションを起こして画像中の言葉をおかしくしてしまうため、これは極めて需要な点だ。新機能では、アップロードした画像を編集することもできる。
OpenAIは発表の中で、同社のAIモデルは完璧ではなく限界があるため、今後も改良を続けていくとした。
DALL·Eと同様に、ChatGPTで生成した画像には目に見える透かしは追加されない。OpenAIは業界標準のC2PAメタデータを画像に付加することで、AI生成と分かるようにしている。安全面については、同社のコンテンツポリシーに反する画像生成リクエストをブロックするという。同社は特にヌードや生々しい暴力表現に対して「制限を強化した」としている。
OpenAIの発表この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
先端分野に挑み続けるセックが語る
チャレンジする企業風土と人材のつくり方
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
すべての業務を革新する
NPUを搭載したレノボAIパソコンの実力
日本のインターステラテクノロジズが挑む
「世界初」の衛星通信ビジネス