Como escrever prompts de imagem
Um método prático para prompts de imagem com IA no PonPon: uma estrutura confiável, reescritas do fraco ao forte, o vocabulário de estilo e luz que os modelos entendem, referências e correções.
Um bom prompt de imagem se lê como o briefing que você entregaria a um fotógrafo ou ilustrador: o que está no quadro, o estilo, como é composto e como é iluminado. Cubra esses quatro pontos e você terá uma imagem aproveitável com muito mais frequência do que com um prompt de uma palavra.

Uma estrutura confiável
Escreva nesta ordem — ela espelha como uma tomada é de fato planejada:
- Sujeito — o que está no quadro, específico. "Uma xícara de café de cerâmica sobre um guardanapo de linho."
- Estilo — o meio e o tratamento. "Foto de produto editorial", "ilustração vetorial flat", "render 3D", "aquarela".
- Composição — enquadramento e ângulo. "Close, de cima, centralizado, baixa profundidade de campo."
- Luz e clima — "Luz suave da manhã", "noite de neon", "softbox de estúdio, high-key".
Foto de produto editorial de um estojo de fones sem fio preto fosco sobre uma superfície de pedra molhada, de cima, baixa profundidade de campo, luz de estúdio suave e difusa, minimalista, tons frios.
Do fraco ao forte
A mesma ideia, afiada ao adicionar especificidade de sujeito, depois estilo e depois luz:
| Prompt | Resultado |
|---|---|
| "uma xícara de café" | Uma xícara genérica, estilo e luz aleatórios |
| "uma xícara de café de cerâmica sobre um guardanapo de linho" | Sujeito certo, mas chapado e sem estilo |
| "foto editorial de uma xícara de café de cerâmica sobre um guardanapo de linho, close" | Composição alinhada ao briefing |
| "foto editorial de uma xícara de café de cerâmica sobre um guardanapo de linho, close, luz suave da janela pela manhã, baixa profundidade de campo" | A tomada que você de fato queria |
Cada cláusula a mais tira uma decisão que o modelo, do contrário, tomaria por você.
O vocabulário que os modelos entendem
Recorra a termos concretos em vez de adjetivos vagos — os modelos os mapeiam para padrões visuais reais:
- Meio — foto, ilustração, render 3D, pintura a óleo, line art, isométrico, claymation.
- Tomada e lente — close, plano aberto, macro, de cima, na altura dos olhos, 35mm, bokeh, olho de peixe.
- Luz — golden hour, contraluz, rim light, softbox, sombra dura, high-key, low-key.
- Clima / paleta — pastéis suaves, alto contraste, monocromático, tons quentes, cinematográfico.
Diga o que você quer, não o que não quer
Os modelos lidam muito melhor com descrições positivas do que com negações. Peça "uma mesa vazia e minimalista", não "uma mesa sem nada em cima". Se for adicionar texto ou logo por cima depois, peça por espaço negativo — "bastante céu vazio em cima" — em vez de descrever o que não deveria estar ali.
Trabalhe a partir de imagens de referência
Anexe até 10 imagens de referência para guiar o estilo, a composição ou um sujeito específico. Ao escrever o prompt, digite @ para apontar uma imagem anexada específica:
Coloque @Image1 sobre a mesa em @Image2, combinando com a luz de @Image2.
É a forma mais limpa de combinar várias referências em uma só tomada — veja Edições por anotação e imagens de referência para o fluxo completo de referência e edição.
Ajuste o prompt ao modelo
O mesmo prompt se transfere entre modelos, mas cada um recompensa uma ênfase ligeiramente diferente:
- GPT Image 2 — soletre qualquer texto dentro da imagem com exatidão, entre aspas; ele renderiza palavras de forma mais confiável que os outros.
- Seedream 5.0 — aposte no detalhe fotorrealista (pele, olhar, profundidade); ele raciocina bem sobre realismo e também lida com texto em imagens.
- Midjourney V8 — dê a ele palavras de clima e estilo; por padrão, ele tende ao cinematográfico e pictórico.
- Nano Banana Pro — para edições de precisão, descreva só a mudança ("deixe a jaqueta vermelha"); ele edita localmente sem máscara e também é forte em texto dentro da imagem.
uma placa de neon escrito "OPEN 24 HOURS". Veja a renderização de texto do GPT Image 2.Na dúvida sobre qual usar? Como escolher um modelo detalha todos eles.
--ar, --v ou --style dentro do prompt — o PonPon as interpreta como palavras e o modelo rejeita a geração inteira. Use no lugar os controles de proporção, versão e estilo na barra de prompt.Corrigindo problemas comuns
| Problema | Tente isto |
|---|---|
| Texto embaralhado na imagem | Troque para o GPT Image 2; ponha as palavras exatas entre aspas |
| Ênfase errada do sujeito | Ponha o sujeito primeiro; tire a bagunça de fundo do prompt |
| Personagem inconsistente entre imagens | Use uma imagem de referência e um modelo forte em consistência como o Nano Banana Pro |
| Quase certo, um detalhe fora | Não regere — edite o resultado ou anote e edite só aquela área |
| O estilo fica escapando | Nomeie o meio explicitamente e forneça uma imagem de referência |
Itere com intenção
Mude uma variável de cada vez — modelo, depois luz, depois composição — para aprender o que cada ajuste faz. Quando um lote está perto, troque para editar em vez de reescrever o prompt inteiro: corrija uma palavra com editar texto, mude a câmera com multiângulo ou refine o fundo em vez de começar de novo.
Pronto para levar esses instintos ao movimento? Leia Como escrever prompts de vídeo.
Artigos relacionados
- Geração de imagensEscreva um bom prompt de imagem, escolha entre modelos como GPT Image 2, Nano Banana Pro e Seedream 5.0, use imagens de referência e edite resultados com as ferramentas de anotação.
- Prompts de vídeoUm método prático para prompts de vídeo com IA no PonPon: estrutura de tomada, os presets de câmera que os modelos entendem, ritmo, dicas por modelo e como corrigir falhas comuns.
- Como escolher um modeloComo escolher o modelo de IA certo no PonPon: no que cada modelo de imagem e vídeo é melhor, uma tabela rápida de decisão, uma comparação prática, confrontos diretos e os níveis Fast e Pro.