Prompts für Bilder

Eine praktische Methode für KI-Bild-Prompts auf PonPon: eine zuverlässige Struktur, Umschreibungen von schwach nach stark, das Stil- und Licht-Vokabular, das Modelle verstehen, Referenzen und Korrekturen.

Ein guter Bild-Prompt liest sich wie ein Briefing, das man einem Fotografen oder Illustrator übergeben würde: was im Bild ist, der Stil, die Komposition und das Licht. Wer diese vier Punkte abdeckt, erhält weit öfter ein brauchbares Bild als mit einem Ein-Wort-Prompt.

Der Prompt-Bereich des PonPon-Bildgenerators – Modell, Seitenverhältnis, Auflösung, Qualität und Anzahl einstellen; die Kredit-Kosten werden bei „Generieren“ angezeigt.

Eine zuverlässige Struktur

Schreibe in dieser Reihenfolge – sie spiegelt wider, wie eine Aufnahme tatsächlich geplant wird:

Motiv – was im Bild ist, konkret. „Eine Keramik-Kaffeetasse auf einer Leinenserviette.“
Stil – das Medium und die Behandlung. „Redaktionelles Produktfoto“, „flache Vektorillustration“, „3D-Render“, „Aquarell“.
Komposition – Bildausschnitt und Winkel. „Nahaufnahme, Draufsicht, zentriert, geringe Tiefenschärfe.“
Licht & Stimmung – „Weiches Morgenlicht“, „Neon-Nacht“, „Studio-Softbox, High-Key“.

Redaktionelles Produktfoto eines mattschwarz-kabellosen Ohrhörer-Cases auf einer nassen Steinoberfläche, Draufsicht, geringe Tiefenschärfe, weiches diffuses Studiolicht, minimalistisch, kühle Töne.

Von schwach zu stark

Dieselbe Idee, geschärft durch das Hinzufügen von Motivspezifität, dann Stil, dann Licht:

Prompt	Ergebnis
„eine Kaffeetasse“	Eine generische Tasse, zufälliger Stil und Beleuchtung
„eine Keramik-Kaffeetasse auf einer Leinenserviette“	Richtiges Motiv, aber flach und stillos
„redaktionelles Foto einer Keramik-Kaffeetasse auf einer Leinenserviette, Nahaufnahme“	Briefing-konforme Komposition
„redaktionelles Foto einer Keramik-Kaffeetasse auf einer Leinenserviette, Nahaufnahme, weiches Morgenfensterlicht, geringe Tiefenschärfe“	Die Aufnahme, die man eigentlich wollte

Jede hinzugefügte Klausel nimmt dem Modell eine Entscheidung ab, die es sonst für dich treffen würde.

Hinweis

Es gibt eine Obergrenze für die Prompt-Länge (die je nach Modell variiert), und PonPon kürzt einen zu langen Prompt nicht – er schlägt fehl, anstatt ausgeführt zu werden. Lege das Wesentliche zuerst fest; wenn du Klausel an Klausel reihst, bist du ohnehin schon past the point of diminishing returns.

Vokabular, das die Modelle verstehen

Greife auf konkrete Begriffe statt auf vage Adjektive zurück – Modelle ordnen diese echten visuellen Mustern zu:

Medium – Foto, Illustration, 3D-Render, Ölgemälde, Linienzeichnung, isometrisch, Claymation.
Einstellung & Objektiv – Nahaufnahme, Weitwinkel, Makro, Draufsicht, Augenhöhe, 35mm, Bokeh, Fischauge.
Licht – Goldene Stunde, Gegenlicht, Rim-Light, Softbox, harter Schatten, High-Key, Low-Key.
Stimmung / Farbpalette – gedämpfte Pastelltöne, hoher Kontrast, monochrom, warme Töne, cinematisch.

Tipp

Ein präziser Begriff schlägt drei unscharfe. „Gegenlicht bei der goldenen Stunde“ sagt dem Modell weit mehr als „schöne Beleuchtung“.

Sage, was du willst – nicht, was du nicht willst

Modelle verarbeiten positive Beschreibungen weit besser als Verneinungen. Bitte um „einen leeren, minimalistischen Schreibtisch“, nicht um „einen Schreibtisch, auf dem nichts liegt“. Wenn du später Text oder ein Logo darüber legen möchtest, prompt nach Negativraum – „viel leerer Himmel oben“ – statt zu beschreiben, was nicht da sein soll.

Mit Referenzbildern arbeiten

Hänge bis zu 10 Referenzbilder an, um Stil, Komposition oder ein bestimmtes Motiv zu steuern. Beim Schreiben des Prompts tippe @, um auf ein bestimmtes angehängtes Bild zu verweisen:

Platziere @Image1 auf dem Tisch in @Image2 und passe die Beleuchtung von @Image2 an.

Das ist der sauberste Weg, mehrere Referenzen in einer Aufnahme zu kombinieren – siehe Bearbeitungen annotieren & Referenzbilder für den vollständigen Referenz- und Bearbeitungs-Workflow.

Den Prompt dem Modell anpassen

Derselbe Prompt funktioniert bei allen Modellen, aber jedes belohnt einen leicht anderen Schwerpunkt:

GPT Image 2 – buchstabiere jeden Text im Bild genau aus, in Anführungszeichen; es rendert Wörter zuverlässiger als die anderen.
Seedream 5.0 – setze auf fotorealistische Details (Haut, Blick, Tiefe); es denkt gut über Realismus nach und verarbeitet auch Text in Bildern.
Midjourney V8 – gib ihm Stimmungs- und Stilwörter; es neigt standardmäßig zu Cinematischem und Malerischem.
Nano Banana Pro – für präzise Bearbeitungen beschreibe nur die Änderung („mache die Jacke rot“); es bearbeitet lokal ohne Maske und ist auch stark bei Text im Bild.

Tipp

Wörter innerhalb eines Bildes zu rendern ist das Schwierigste für die meisten Modelle. Wenn dein Design lesbaren Text benötigt – ein Schild, ein Etikett, ein Plakat – greife zu einem textstarken Modell und setze die genauen Wörter in Anführungszeichen: a neon sign reading "OPEN 24 HOURS". Siehe GPT Image 2 Textrendering.

Nicht sicher, welches du verwenden sollst? Ein Modell wählen erklärt sie alle.

Warnung

Kommst du von Discord Midjourney? Tippe keine Parameter-Flags wie --ar, --v oder --style in den Prompt – PonPon interpretiert sie als Wörter und das Modell lehnt die gesamte Generierung ab. Verwende stattdessen die Steuerelemente für Seitenverhältnis, Version und Stil in der Prompt-Leiste.

Häufige Probleme beheben

Problem	Versuch dies
Verzerrter Text im Bild	Wechsle zu GPT Image 2; setze die genauen Wörter in Anführungszeichen
Falscher Motivschwerpunkt	Setze das Motiv an erste Stelle; entferne störende Hintergrundelemente aus dem Prompt
Inkonsistente Figur über mehrere Bilder	Verwende ein Referenzbild und ein konsistenzstarkes Modell wie Nano Banana Pro
Fast richtig, ein Detail falsch	Nicht neu generieren – bearbeite das Ergebnis oder annotiere und bearbeite nur diesen Bereich
Stil driftet ständig	Benenne das Medium explizit und stelle ein Referenzbild bereit

Gezielt iterieren

Ändere eine Variable nach der anderen – Modell, dann Licht, dann Komposition – damit du lernst, was jeder Schritt bewirkt. Wenn ein Batch fast stimmt, wechsle zu Bearbeiten statt den gesamten Prompt umzuschreiben: korrigiere ein Wort mit Textbearbeitung, ändere die Kamera mit Mehrfachwinkel oder verfeinere den Hintergrund, anstatt von vorne anzufangen.

Bereit, diese Instinkte in Bewegung zu übertragen? Lies Prompts für Videos.

Prompts für Bilder

Eine zuverlässige Struktur

Schreibe in dieser Reihenfolge – sie spiegelt wider, wie eine Aufnahme tatsächlich geplant wird:

Motiv – was im Bild ist, konkret. „Eine Keramik-Kaffeetasse auf einer Leinenserviette.“
Stil – das Medium und die Behandlung. „Redaktionelles Produktfoto“, „flache Vektorillustration“, „3D-Render“, „Aquarell“.
Komposition – Bildausschnitt und Winkel. „Nahaufnahme, Draufsicht, zentriert, geringe Tiefenschärfe.“
Licht & Stimmung – „Weiches Morgenlicht“, „Neon-Nacht“, „Studio-Softbox, High-Key“.

Redaktionelles Produktfoto eines mattschwarz-kabellosen Ohrhörer-Cases auf einer nassen Steinoberfläche, Draufsicht, geringe Tiefenschärfe, weiches diffuses Studiolicht, minimalistisch, kühle Töne.

Von schwach zu stark

Dieselbe Idee, geschärft durch das Hinzufügen von Motivspezifität, dann Stil, dann Licht:

Prompt	Ergebnis
„eine Kaffeetasse“	Eine generische Tasse, zufälliger Stil und Beleuchtung
„eine Keramik-Kaffeetasse auf einer Leinenserviette“	Richtiges Motiv, aber flach und stillos
„redaktionelles Foto einer Keramik-Kaffeetasse auf einer Leinenserviette, Nahaufnahme“	Briefing-konforme Komposition
„redaktionelles Foto einer Keramik-Kaffeetasse auf einer Leinenserviette, Nahaufnahme, weiches Morgenfensterlicht, geringe Tiefenschärfe“	Die Aufnahme, die man eigentlich wollte

Jede hinzugefügte Klausel nimmt dem Modell eine Entscheidung ab, die es sonst für dich treffen würde.

Hinweis

Vokabular, das die Modelle verstehen

Greife auf konkrete Begriffe statt auf vage Adjektive zurück – Modelle ordnen diese echten visuellen Mustern zu:

Medium – Foto, Illustration, 3D-Render, Ölgemälde, Linienzeichnung, isometrisch, Claymation.
Einstellung & Objektiv – Nahaufnahme, Weitwinkel, Makro, Draufsicht, Augenhöhe, 35mm, Bokeh, Fischauge.
Licht – Goldene Stunde, Gegenlicht, Rim-Light, Softbox, harter Schatten, High-Key, Low-Key.
Stimmung / Farbpalette – gedämpfte Pastelltöne, hoher Kontrast, monochrom, warme Töne, cinematisch.

Tipp

Ein präziser Begriff schlägt drei unscharfe. „Gegenlicht bei der goldenen Stunde“ sagt dem Modell weit mehr als „schöne Beleuchtung“.

Sage, was du willst – nicht, was du nicht willst

Mit Referenzbildern arbeiten

Hänge bis zu 10 Referenzbilder an, um Stil, Komposition oder ein bestimmtes Motiv zu steuern. Beim Schreiben des Prompts tippe @, um auf ein bestimmtes angehängtes Bild zu verweisen:

Platziere @Image1 auf dem Tisch in @Image2 und passe die Beleuchtung von @Image2 an.

Das ist der sauberste Weg, mehrere Referenzen in einer Aufnahme zu kombinieren – siehe Bearbeitungen annotieren & Referenzbilder für den vollständigen Referenz- und Bearbeitungs-Workflow.

Den Prompt dem Modell anpassen

Derselbe Prompt funktioniert bei allen Modellen, aber jedes belohnt einen leicht anderen Schwerpunkt:

GPT Image 2 – buchstabiere jeden Text im Bild genau aus, in Anführungszeichen; es rendert Wörter zuverlässiger als die anderen.
Seedream 5.0 – setze auf fotorealistische Details (Haut, Blick, Tiefe); es denkt gut über Realismus nach und verarbeitet auch Text in Bildern.
Midjourney V8 – gib ihm Stimmungs- und Stilwörter; es neigt standardmäßig zu Cinematischem und Malerischem.
Nano Banana Pro – für präzise Bearbeitungen beschreibe nur die Änderung („mache die Jacke rot“); es bearbeitet lokal ohne Maske und ist auch stark bei Text im Bild.

Tipp

Nicht sicher, welches du verwenden sollst? Ein Modell wählen erklärt sie alle.

Warnung

Häufige Probleme beheben

Problem	Versuch dies
Verzerrter Text im Bild	Wechsle zu GPT Image 2; setze die genauen Wörter in Anführungszeichen
Falscher Motivschwerpunkt	Setze das Motiv an erste Stelle; entferne störende Hintergrundelemente aus dem Prompt
Inkonsistente Figur über mehrere Bilder	Verwende ein Referenzbild und ein konsistenzstarkes Modell wie Nano Banana Pro
Fast richtig, ein Detail falsch	Nicht neu generieren – bearbeite das Ergebnis oder annotiere und bearbeite nur diesen Bereich
Stil driftet ständig	Benenne das Medium explizit und stelle ein Referenzbild bereit

Gezielt iterieren

Bereit, diese Instinkte in Bewegung zu übertragen? Lies Prompts für Videos.

Prompts für Bilder

Eine zuverlässige Struktur

Von schwach zu stark

Vokabular, das die Modelle verstehen

Sage, was du willst – nicht, was du nicht willst

Mit Referenzbildern arbeiten

Den Prompt dem Modell anpassen

Häufige Probleme beheben

Gezielt iterieren

Verwandte Artikel

Prompts für Bilder

Eine zuverlässige Struktur

Von schwach zu stark

Vokabular, das die Modelle verstehen

Sage, was du willst – nicht, was du nicht willst

Mit Referenzbildern arbeiten

Den Prompt dem Modell anpassen

Häufige Probleme beheben

Gezielt iterieren

Verwandte Artikel