GPT-4o に画像生成機能が追加

OpenAI が 3 月 25 日、GPT-4o に組み込まれた画像生成機能「4o Image Generation」の提供を開始しました。

https://openai.com/index/introducing-4o-image-generation/

DALL-E と比較してテキストへの応答能力が飛躍的に向上しており、次のことが可能です。

画像内のテキスト指定が可能
一貫性を保った複数回の画像生成（マルチターン生成）
アップロードされた画像の文脈を理解し、それを反映した画像生成
GPT-4o の知識を活用した画像生成
より写実的で多様なスタイルの画像生成

同様の画像生成は今までも可能な手段がありましたが、「4o Image Generation」は既存の手法と比べて遥かに手軽に、実務において利用しやすい画像を手軽に生成できる点で大きな優位性があります。これは実際、発表を受けて多くのユーザーが一貫性やテキスト指定を有効活用した画像を SNS などで公開していることから明らかだと思います。

GPT-4o が利用できる状態になっていれば次の URL から試すことができます。 API での利用は数週間以内に提供予定とのことです。

https://chatgpt.com/?model=gpt-4o