Prompts für Bilder
Eine praktische Methode für KI-Bild-Prompts auf PonPon: eine zuverlässige Struktur, Umschreibungen von schwach nach stark, das Stil- und Licht-Vokabular, das Modelle verstehen, Referenzen und Korrekturen.
Ein guter Bild-Prompt liest sich wie ein Briefing, das man einem Fotografen oder Illustrator übergeben würde: was im Bild ist, der Stil, die Komposition und das Licht. Wer diese vier Punkte abdeckt, erhält weit öfter ein brauchbares Bild als mit einem Ein-Wort-Prompt.

Eine zuverlässige Struktur
Schreibe in dieser Reihenfolge – sie spiegelt wider, wie eine Aufnahme tatsächlich geplant wird:
- Motiv – was im Bild ist, konkret. „Eine Keramik-Kaffeetasse auf einer Leinenserviette.“
- Stil – das Medium und die Behandlung. „Redaktionelles Produktfoto“, „flache Vektorillustration“, „3D-Render“, „Aquarell“.
- Komposition – Bildausschnitt und Winkel. „Nahaufnahme, Draufsicht, zentriert, geringe Tiefenschärfe.“
- Licht & Stimmung – „Weiches Morgenlicht“, „Neon-Nacht“, „Studio-Softbox, High-Key“.
Redaktionelles Produktfoto eines mattschwarz-kabellosen Ohrhörer-Cases auf einer nassen Steinoberfläche, Draufsicht, geringe Tiefenschärfe, weiches diffuses Studiolicht, minimalistisch, kühle Töne.
Von schwach zu stark
Dieselbe Idee, geschärft durch das Hinzufügen von Motivspezifität, dann Stil, dann Licht:
| Prompt | Ergebnis |
|---|---|
| „eine Kaffeetasse“ | Eine generische Tasse, zufälliger Stil und Beleuchtung |
| „eine Keramik-Kaffeetasse auf einer Leinenserviette“ | Richtiges Motiv, aber flach und stillos |
| „redaktionelles Foto einer Keramik-Kaffeetasse auf einer Leinenserviette, Nahaufnahme“ | Briefing-konforme Komposition |
| „redaktionelles Foto einer Keramik-Kaffeetasse auf einer Leinenserviette, Nahaufnahme, weiches Morgenfensterlicht, geringe Tiefenschärfe“ | Die Aufnahme, die man eigentlich wollte |
Jede hinzugefügte Klausel nimmt dem Modell eine Entscheidung ab, die es sonst für dich treffen würde.
Vokabular, das die Modelle verstehen
Greife auf konkrete Begriffe statt auf vage Adjektive zurück – Modelle ordnen diese echten visuellen Mustern zu:
- Medium – Foto, Illustration, 3D-Render, Ölgemälde, Linienzeichnung, isometrisch, Claymation.
- Einstellung & Objektiv – Nahaufnahme, Weitwinkel, Makro, Draufsicht, Augenhöhe, 35mm, Bokeh, Fischauge.
- Licht – Goldene Stunde, Gegenlicht, Rim-Light, Softbox, harter Schatten, High-Key, Low-Key.
- Stimmung / Farbpalette – gedämpfte Pastelltöne, hoher Kontrast, monochrom, warme Töne, cinematisch.
Sage, was du willst – nicht, was du nicht willst
Modelle verarbeiten positive Beschreibungen weit besser als Verneinungen. Bitte um „einen leeren, minimalistischen Schreibtisch“, nicht um „einen Schreibtisch, auf dem nichts liegt“. Wenn du später Text oder ein Logo darüber legen möchtest, prompt nach Negativraum – „viel leerer Himmel oben“ – statt zu beschreiben, was nicht da sein soll.
Mit Referenzbildern arbeiten
Hänge bis zu 10 Referenzbilder an, um Stil, Komposition oder ein bestimmtes Motiv zu steuern. Beim Schreiben des Prompts tippe @, um auf ein bestimmtes angehängtes Bild zu verweisen:
Platziere @Image1 auf dem Tisch in @Image2 und passe die Beleuchtung von @Image2 an.
Das ist der sauberste Weg, mehrere Referenzen in einer Aufnahme zu kombinieren – siehe Bearbeitungen annotieren & Referenzbilder für den vollständigen Referenz- und Bearbeitungs-Workflow.
Den Prompt dem Modell anpassen
Derselbe Prompt funktioniert bei allen Modellen, aber jedes belohnt einen leicht anderen Schwerpunkt:
- GPT Image 2 – buchstabiere jeden Text im Bild genau aus, in Anführungszeichen; es rendert Wörter zuverlässiger als die anderen.
- Seedream 5.0 – setze auf fotorealistische Details (Haut, Blick, Tiefe); es denkt gut über Realismus nach und verarbeitet auch Text in Bildern.
- Midjourney V8 – gib ihm Stimmungs- und Stilwörter; es neigt standardmäßig zu Cinematischem und Malerischem.
- Nano Banana Pro – für präzise Bearbeitungen beschreibe nur die Änderung („mache die Jacke rot“); es bearbeitet lokal ohne Maske und ist auch stark bei Text im Bild.
a neon sign reading "OPEN 24 HOURS". Siehe GPT Image 2 Textrendering.Nicht sicher, welches du verwenden sollst? Ein Modell wählen erklärt sie alle.
--ar, --v oder --style in den Prompt – PonPon interpretiert sie als Wörter und das Modell lehnt die gesamte Generierung ab. Verwende stattdessen die Steuerelemente für Seitenverhältnis, Version und Stil in der Prompt-Leiste.Häufige Probleme beheben
| Problem | Versuch dies |
|---|---|
| Verzerrter Text im Bild | Wechsle zu GPT Image 2; setze die genauen Wörter in Anführungszeichen |
| Falscher Motivschwerpunkt | Setze das Motiv an erste Stelle; entferne störende Hintergrundelemente aus dem Prompt |
| Inkonsistente Figur über mehrere Bilder | Verwende ein Referenzbild und ein konsistenzstarkes Modell wie Nano Banana Pro |
| Fast richtig, ein Detail falsch | Nicht neu generieren – bearbeite das Ergebnis oder annotiere und bearbeite nur diesen Bereich |
| Stil driftet ständig | Benenne das Medium explizit und stelle ein Referenzbild bereit |
Gezielt iterieren
Ändere eine Variable nach der anderen – Modell, dann Licht, dann Komposition – damit du lernst, was jeder Schritt bewirkt. Wenn ein Batch fast stimmt, wechsle zu Bearbeiten statt den gesamten Prompt umzuschreiben: korrigiere ein Wort mit Textbearbeitung, ändere die Kamera mit Mehrfachwinkel oder verfeinere den Hintergrund, anstatt von vorne anzufangen.
Bereit, diese Instinkte in Bewegung zu übertragen? Lies Prompts für Videos.
Verwandte Artikel
- Bildgenerierung — GrundlagenSchreibe einen guten Bild-Prompt, wähle zwischen Modellen wie GPT Image 2, Nano Banana Pro und Seedream 5.0, nutze Referenzbilder und bearbeite Ergebnisse mit den Annotierungswerkzeugen.
- Prompts für VideoEine praktische Methode für KI-Video-Prompts auf PonPon: Shot-Aufbau, die Kamerabewegungen, die die Modelle verstehen, Tempo, modellspezifische Tipps und häufige Fehler beheben.
- Modell auswählenWie du auf PonPon das richtige KI-Modell findest: Was jedes Bild- und Videomodell am besten kann, eine schnelle Entscheidungstabelle, ein praktischer Vergleich, direkte Gegenüberstellungen und die Standard-, Fast- und Pro-Stufen.