画像のプロンプト術
PonPon の AI 画像プロンプトの実践的な方法:信頼できる構成、弱→強の書き換え、モデルが理解するスタイルと光の語彙、参照、修正。
良い画像プロンプトは、写真家やイラストレーターに渡すブリーフのように読めます:フレーム内にあるもの、スタイル、構図、光。この 4 点を押さえれば、一語のプロンプトよりずっと高い確率で使える画像が得られます。

信頼できる構成
この順で書きます——実際にショットを計画する流れに沿っています。
- 被写体——フレーム内にあるもの、具体的に。「リネンのナプキンに置かれた陶器のコーヒーカップ。」
- スタイル——媒体と処理。「エディトリアルな商品写真」「フラットなベクターイラスト」「3D レンダー」「水彩」。
- 構図——フレーミングとアングル。「クローズアップ、俯瞰、中央、浅い被写界深度。」
- 光とムード——「柔らかな朝の光」「ネオンの夜」「スタジオのソフトボックス、ハイキー」。
濡れた石の表面に置かれたマットブラックのワイヤレスイヤホンケースのエディトリアルな商品写真、俯瞰、浅い被写界深度、柔らかく拡散したスタジオ光、ミニマル、クールトーン。
弱から強へ
同じ発想を、被写体の具体性、次にスタイル、それから光を足して研ぎ澄ます。
| プロンプト | 結果 |
|---|---|
| 「コーヒーカップ」 | ありふれたカップ、スタイルも光もランダム |
| 「リネンのナプキンに置かれた陶器のコーヒーカップ」 | 被写体は正しいが、平板で無個性 |
| 「リネンのナプキンに置かれた陶器のコーヒーカップのエディトリアル写真、クローズアップ」 | ブリーフに沿った構図 |
| 「リネンのナプキンに置かれた陶器のコーヒーカップのエディトリアル写真、クローズアップ、柔らかな朝の窓光、浅い被写界深度」 | 本当に欲しかったショット |
足すごとに、モデルが代わりに決めてしまう判断を 1 つずつ取り除けます。
モデルが理解する語彙
曖昧な形容詞ではなく具体的な用語を使いましょう——モデルはこれらを実際の視覚パターンに対応づけます。
- 媒体——写真、イラスト、3D レンダー、油彩、線画、アイソメトリック、クレイアニメ。
- ショットとレンズ——クローズアップ、ワイドショット、マクロ、俯瞰、目線の高さ、35mm、ボケ、魚眼。
- 光——ゴールデンアワー、逆光、リムライト、ソフトボックス、ハードシャドウ、ハイキー、ローキー。
- ムード/パレット——くすんだパステル、ハイコントラスト、モノクローム、暖色、シネマティック。
欲しくないものではなく、欲しいものを言う
モデルは否定よりも肯定の記述をはるかにうまく扱います。「何も載っていない机」ではなく「空っぽでミニマルな机」を頼みましょう。あとで上に文字やロゴを載せるなら、載せたくないものを描くより、余白を頼む——「上空にたっぷりの空」。
参照画像から作業する
最大 10 枚の参照画像を添付して、スタイル・構図・特定の被写体を導けます。プロンプトを書きながら @ を入力すると、添付した特定の画像を指せます。
@Image2 のテーブルの上に @Image1 を置き、@Image2 の光に合わせる。
複数の参照を 1 つのショットに組み合わせる最もきれいな方法です——参照と編集の全ワークフローは注釈編集と参照画像を参照してください。
プロンプトをモデルに合わせる
同じプロンプトはモデル間で引き継げますが、それぞれ少しずつ違う力点を喜びます。
- GPT Image 2——画像内テキストは引用符で正確に綴る;他より確実に文字を描きます。
- Seedream 5.0——フォトリアルな細部(肌・視線・奥行き)に寄せる;リアリズムをよく推論し、画像内テキストも扱えます。
- Midjourney V8——ムードとスタイルの語を与える;デフォルトでシネマティックかつ絵画的に傾きます。
- Nano Banana Pro——精密編集には変更点だけを述べる(「ジャケットを赤に」);マスクなしで局所編集し、画像内テキストにも強いです。
a neon sign reading "OPEN 24 HOURS"。GPT Image 2 のテキスト描画を参照。どれを使うか迷う?モデルの選び方が全モデルを噛み砕きます。
--ar、--v、--style のようなパラメータフラグをプロンプトに打ち込まないでください——PonPon はそれらを単語として解釈し、モデルは生成全体を拒否します。代わりに、プロンプトバーにあるアスペクト比・バージョン・スタイルのコントロールを使いましょう。よくある問題の修正
| 問題 | こうしてみる |
|---|---|
| 画像の文字が崩れる | GPT Image 2 に切り替え;正確な語を引用符で囲む |
| 被写体の強調が違う | 被写体を先頭に置く;プロンプトから背景の雑物を除く |
| 画像ごとにキャラクターが一貫しない | 参照画像と Nano Banana Pro のような一貫性に強いモデルを使う |
| ほぼ正しいが、細部が一箇所ずれる | 再生成せず——結果を編集するか、その領域だけ注釈編集する |
| スタイルが漂い続ける | 媒体を明示的に名指しし、参照画像を与える |
意図を持って反復する
一度に変える変数は 1 つ——まずモデル、次に光、それから構図——にすると、各手の効果が分かります。バッチが近づいたら、プロンプトを丸ごと書き直すより編集へ:テキスト編集で語を直し、マルチアングルでカメラを変え、最初からやり直す代わりに背景を整える。
この感覚を動きに持ち込む準備はできましたか?動画のプロンプト術を読んでください。