AI(人工知能/ディープラーニング)

「首の短いキリン」をうまく描いてもらうという試行錯誤でプロンプトの工夫の重要性に気づきました(画像生成AI活用ポイント)

この記事は約5分で読めます。

首の短いキリン画像生成AIを利用すると、自分のイメージしたものを簡単にビジュアル化できます。しかし、「思い通りの画像が作れない…」と感じたことはありませんか?
その原因の一つとして、AIへの指示(プロンプト)の内容が適切でない可能性があります。
事例として「首の短いキリン」を生成AIにうまく描いてもらう試行錯誤を例にして、プロンプトの工夫と改善のポイントを紹介します。

画像生成AIとのプロンプト実験

実際にやってみた事例「首の短いキリン」

実際にChatGPTのDall-Eを使って画像生成をしてみました。
プロンプトは「首の短いキリンの画像を生成してください」です。

首の短いキリン

最初に生成されたのは普通のキリンですね。そこで、次のプロンプトは「このキリンは普通のキリンですね。もっと首を短くしてください。」にしました。

首の短いキリン

たしかに首が短くなっていますが中途半端な長さですね。

そこで「もっと首を短くしてください。現状の半分くらいの長さでよいです。」と、具体的に長さを半分くらいにするという指示を含んだプロンプトにしました。

首の短いキリン

ありゃりゃ。なんだか違う方向に行ってしまいましたね。(笑)
これはユニークでユーモラスですが、自分が最初に思い望んでいた「首の短いキリン」のイメージからは離れてしまいました。このまま、続けていくとおそらくだんだんとズレていくような気がします。

そこでプロンプトをまったく違う内容に変更しました。

首の短いキリン

だいたい思っていたような画像になりました!

このときのプロンプトは
リクエストを以下のように変更してください。
実在しない想像獣として画像を生成してください。そのイメージは体全体がポニーのような馬で、体の模様はキリンのようで、頭部分がキリンです。
です。

何度かためしてみましたが、いきなり「実在しない想像獣として画像を生成してください。そのイメージは体全体がポニーのような馬で、体の模様はキリンのようで、頭部分がキリンです。」というプロンプトを入れると、だいたい想像に近いものが生成されます。

つまり、途中の対話で修正しなくても一発のプロンプトで狙い通りの画像生成が可能ということです。

そこで、あらためて、プロンプトの書き方について考えてみました。

AIが「首の短いキリン」をうまく描けない理由

AIが「首の短いキリン」を正確に描くのが難しい理由はいくつか考えられます。

学習データにない概念

画像生成AIは、大量の既存画像をもとに学習しています。しかし、「首の短いキリン」という特殊な特徴を持つ画像は、学習データにほとんど含まれていない可能性があります。そのため、AIは「キリン」を認識しても、「首を短くする」という概念をうまく適用できないことがあります。

一般的なイメージに引っ張られる

AIは「キリン=首が長い」という一般的な特徴をもとに画像を生成します。そのため、「首の短いキリン」という指示を出しても、AIは通常のキリンの姿を優先してしまい、意図した結果が得られにくくなります。

指示が曖昧すぎる

「短い」と言っても、どの程度短いのか具体的な指示がないと、AIは適切に解釈できません。「通常の半分の長さ」や「ポニーのような体型」など、より明確な表現が求められます。

プロンプトの工夫で理想の画像を実現

AIに意図した画像を生成させるには、プロンプトを工夫することが重要です。実際に試行錯誤した結果、成功したプロンプトの例がこちらです。

成功したプロンプトの例

👉 「想像上の動物として描いてください。この動物はポニー(小型馬)のような体型で、体にはキリン模様があります。頭部はキリンそのものですが、首は非常に短くデザインされています。」

このプロンプトでは、以下のポイントを意識しました。

「想像上の動物」として説明 → AIが既存のキリンのイメージに引っ張られにくくなる
具体的な形状の比較対象を提示 → 「ポニーのような体型」で分かりやすく説明
詳細な特徴を追加 → 「キリン模様がある」「首は非常に短くデザイン」

このように、具体的な表現を使うことで、AIはより正確に意図をくみ取ることができます。

プロンプト作成時に意識すべきポイント

AIを活用する上で、プロンプトの工夫は非常に重要です。以下の点を意識すると、より理想的な画像を得やすくなります。

具体的で明確な指示を出す

曖昧な表現を避け、「通常の半分の長さ」など具体的な数値を使うと、AIが正しく解釈しやすくなります。

例:「通常よりも半分程度短い首」

既存の概念と組み合わせる

AIは、既存のイメージをもとに画像を生成するため、「ポニー型」や「馬に似た体型」など、親しみのある表現を使うと効果的です。

例:「ポニー型の体型にキリン模様」

背景や雰囲気も指定する

背景や全体の雰囲気を指定すると、よりイメージに合った画像が得られます。

例:「アフリカの草原で草を食べている」

「想像上の生物」として指示する

実在する動物としてではなく、「空想上の動物」として説明すると、AIがより自由に解釈してくれます。

例:「空想上の動物としてデザインしてください」

試行錯誤を繰り返すことでスキルが向上

一度で理想通りの結果が得られなくても、プロンプトを調整しながら試行錯誤を重ねることが大切です。

試行錯誤で得られるメリット

🔹 自分が求める結果への道筋が明確になる
🔹 AIとのコミュニケーションスキル(プロンプト作成力)が向上する
🔹 効率的に時間や労力を活用できるようになる

例えば今回のケースでは、最初は「首の短いキリン」という単純な指示から始まりましたが、「ポニーのような体型」「空想上の動物」などの要素を加えることで、より正確な画像を生成することができました。

このプロセスを繰り返すことで、次回以降さらに精度の高いプロンプトを作れるようになります。

「問いを立てるチカラ」がAI時代には特に重要になる。そう言われていますが、またひとつこのことを実感しました。