AI(人工知能/ディープラーニング)

ChatGPTの画像生成機能が格段に向上しました、日本語の文字入り画像やイラストが作成できるようになりました

この記事は約5分で読めます。

ChatGPTの画像生成2025年3月26日、OpenAIはChatGPTに新たな画像生成機能「4o Image Generation」を統合しました。​これにより、ユーザーはテキストから高精度な画像を直接生成できるようになりました。
​この機能は無料プランを含むすべてのユーザーが利用可能で、動画生成AIツール「Sora」でも使用できます。早速この機能を試してみましたがかなり優秀です。これまでうまくできなかった「画像の中に日本語の文字を入れる」ことが可能になっています。

ChatGPTの画像生成

機能追加「4o Image Generation」

4o Image Generationの特徴として、以下の点が挙げられます。

  • テキストの正確なレンダリング:​これまでの画像生成AIが苦手としていた文字の描写が向上し、道路標識やホワイトボードの手書き文字なども忠実に再現できます。PC Watch+1GIGAZINE+1

  • 複雑な指示への対応:​複数のオブジェクトや詳細なプロンプトにも正確に従い、最大10~20個の異なるオブジェクトを含む画像を生成できます。GIGAZINE+2PC Watch+2Impress Watch+2

  • 対話的な画像編集:​ユーザーは生成された画像に対して追加の指示を与えることで、色の変更やスタイルの調整など、対話的に画像を編集できます。GIGAZINE

  • アップロード画像の活用:​ユーザーがアップロードした画像を分析し、その内容を反映した新しい画像を生成することも可能です。Impress Watch

この新機能の登場により、ユーザーはビジネス資料や教育コンテンツの作成、クリエイティブなデザインなど、多岐にわたる用途で高品質な画像を手軽に生成できるようになりました。

画像制作例

ということで、早速いくつかの画像を生成してみました。

スマホを機種変する女子高校生

どもども遠田
どもども遠田

女子高校生がiPhoneSE3からAndroidスマホに機種変したということを連想するイラストを生成してください。

出力された画像を表示したChatGPTの画面はこれです。

どうですか。すごいですね。一発でこのクオリティのイラストが出力されることに感動します。このレベルが安定的に出力できるなら、ブログやホームページのイラストは、イラストレーターさんに発注しなくても済んでしまいそうです。

人物写真をイラストに変換(江口寿史風やジブリ風はNG)

人物写真を読み込んでイラスト化してくれることも可能になりました。

どもども遠田
どもど
も遠田

この写真をポップアート風のイラストにしてください。

出力されたイラストはこれです。

実は、「江口寿史風のイラストに」という指定をしたところ著作権上の理由で作成を拒否されています(笑)

申し訳ありませんが、著名なイラストレーター(たとえば江口寿史さん)風のイラストを生成することは、権利保護の観点から対応できません。
別のイラストのスタイルや、写真を元にしたオリジナル風のアートスタイルでの加工をご希望でしたら、ぜひお知らせください。「ポップアート風」「コミック風」「水彩風」などのスタイル指定も可能です。どうされますか?

ということでプロンプトを「ポップアート風」に変更したところ、無事に画像出力ができました。

次です。

どもども遠田
どもども遠田

ジブリのような温かみのある手描き風イラストを作成してください。

このプロンプトで出力された画像はこれです。

実はこの「ジブリ」というのも著作権上の問題があります。

申し訳ありませんが、「ジブリ風」のように**特定のスタジオや作家の画風に酷似したスタイル(スタジオジブリ、ディズニー、ピクサーなど)**を明示的に模倣する画像生成は、著作権やポリシーの観点から対応できません。
ただし、「ジブリのような温かみのある手描き風」「アニメ映画風の柔らかいイラスト」「自然で優しい色合い」など、雰囲気を参考にしたオリジナルスタイルのイラストは生成可能です。

ということで「ジブリのような温かみのある手描き風イラストを作成してください。」というプロンプトにしています。

「ジブリ」や「江口寿史」など著名なプロダクションや作家の名前をプロンプトで使うのは要注意です。「ドラえもん」や「ちびまる子」ちゃんもNGです。

3つ野菜だぁ~と三ツ矢サイダーのギャグを発するおぢさん

さて、3月28日は「三ツ矢サイダーの日」だそうです。これは「328」を「みつや」と読ませるギャグですね(笑)

ということで、三ツ矢サイダーの日にちなんで「3つ野菜だぁ」というギャグ画像を作成してみました。

どもども遠田
どもども遠田

3つの野菜を重なり合わせて、「みっつ野菜だぁ」と笑いながら叫んでいるかわいいおじさんのイラスト画像を作成してください。おじさんはこの写真を参考にしてください。

このプロンプトでは一発で出力できました。

少しプロンプトを変えて出力しなおしてみました。

上記2点のイラストにはいずれも「3つ野菜だぁ」という日本語の文字が正確に表現されています。これはこれまでだとできなかったことなので地味に大きな進化です。

サイゼリヤでペペロンチーノとカプチーノを楽しむおじさん

この流れで、次の画像を作成依頼しました。

どもども遠田
どもども遠田

つぎは、この写真のオヂサンがサイゼリヤでペペロンチーノとカプチーノを楽しんでいる様子のイラストを生成してください。

できた画像はこれです。

サイゼリヤのロゴっぽいものが表示されています。それらしく見えます。
続けてこのイラストを写真のように変換できるかどうかを試してみました。

どもども遠田
どもども遠田

このイラストを写真のような画像にしてください。

なんとそれらしいのがでてきました。

これ、誰?っていう微妙な感じはあるものの、すごいですね。

このように今のChatGPTは、写真を読ませてイラスト化したうえで日本語も挿入できるというすごい能力を持っています。自由自在に画像をあやつれるようになってきました。今回は神アップデートですね。