Como escrever prompts de imagem

Um método prático para prompts de imagem com IA no PonPon: uma estrutura confiável, reescritas do fraco ao forte, o vocabulário de estilo e luz que os modelos entendem, referências e correções.

Um bom prompt de imagem se lê como o briefing que você entregaria a um fotógrafo ou ilustrador: o que está no quadro, o estilo, como é composto e como é iluminado. Cubra esses quatro pontos e você terá uma imagem aproveitável com muito mais frequência do que com um prompt de uma palavra.

A barra de prompt do gerador de imagens do PonPon: defina o modelo, a proporção, a resolução, a qualidade e a quantidade; o custo em créditos aparece em Generate.

Uma estrutura confiável

Escreva nesta ordem — ela espelha como uma tomada é de fato planejada:

Sujeito — o que está no quadro, específico. "Uma xícara de café de cerâmica sobre um guardanapo de linho."
Estilo — o meio e o tratamento. "Foto de produto editorial", "ilustração vetorial flat", "render 3D", "aquarela".
Composição — enquadramento e ângulo. "Close, de cima, centralizado, baixa profundidade de campo."
Luz e clima — "Luz suave da manhã", "noite de neon", "softbox de estúdio, high-key".

Foto de produto editorial de um estojo de fones sem fio preto fosco sobre uma superfície de pedra molhada, de cima, baixa profundidade de campo, luz de estúdio suave e difusa, minimalista, tons frios.

Do fraco ao forte

A mesma ideia, afiada ao adicionar especificidade de sujeito, depois estilo e depois luz:

Prompt	Resultado
"uma xícara de café"	Uma xícara genérica, estilo e luz aleatórios
"uma xícara de café de cerâmica sobre um guardanapo de linho"	Sujeito certo, mas chapado e sem estilo
"foto editorial de uma xícara de café de cerâmica sobre um guardanapo de linho, close"	Composição alinhada ao briefing
"foto editorial de uma xícara de café de cerâmica sobre um guardanapo de linho, close, luz suave da janela pela manhã, baixa profundidade de campo"	A tomada que você de fato queria

Cada cláusula a mais tira uma decisão que o modelo, do contrário, tomaria por você.

Nota

Há um limite máximo para o comprimento do prompt (varia por modelo), e o PonPon não corta um prompt longo demais — ele falha em vez de rodar. Ponha o essencial primeiro; se você for empilhando cláusula após cláusula, de toda forma já passou do ponto de retornos decrescentes.

O vocabulário que os modelos entendem

Recorra a termos concretos em vez de adjetivos vagos — os modelos os mapeiam para padrões visuais reais:

Meio — foto, ilustração, render 3D, pintura a óleo, line art, isométrico, claymation.
Tomada e lente — close, plano aberto, macro, de cima, na altura dos olhos, 35mm, bokeh, olho de peixe.
Luz — golden hour, contraluz, rim light, softbox, sombra dura, high-key, low-key.
Clima / paleta — pastéis suaves, alto contraste, monocromático, tons quentes, cinematográfico.

Dica

Um termo preciso vence três difusos. "Em contraluz na golden hour" diz ao modelo muito mais do que "boa iluminação".

Diga o que você quer, não o que não quer

Os modelos lidam muito melhor com descrições positivas do que com negações. Peça "uma mesa vazia e minimalista", não "uma mesa sem nada em cima". Se for adicionar texto ou logo por cima depois, peça por espaço negativo — "bastante céu vazio em cima" — em vez de descrever o que não deveria estar ali.

Trabalhe a partir de imagens de referência

Anexe até 10 imagens de referência para guiar o estilo, a composição ou um sujeito específico. Ao escrever o prompt, digite @ para apontar uma imagem anexada específica:

Coloque @Image1 sobre a mesa em @Image2, combinando com a luz de @Image2.

É a forma mais limpa de combinar várias referências em uma só tomada — veja Edições por anotação e imagens de referência para o fluxo completo de referência e edição.

Ajuste o prompt ao modelo

O mesmo prompt se transfere entre modelos, mas cada um recompensa uma ênfase ligeiramente diferente:

GPT Image 2 — soletre qualquer texto dentro da imagem com exatidão, entre aspas; ele renderiza palavras de forma mais confiável que os outros.
Seedream 5.0 — aposte no detalhe fotorrealista (pele, olhar, profundidade); ele raciocina bem sobre realismo e também lida com texto em imagens.
Midjourney V8 — dê a ele palavras de clima e estilo; por padrão, ele tende ao cinematográfico e pictórico.
Nano Banana Pro — para edições de precisão, descreva só a mudança ("deixe a jaqueta vermelha"); ele edita localmente sem máscara e também é forte em texto dentro da imagem.

Dica

Renderizar palavras dentro de uma imagem é a coisa mais difícil para a maioria dos modelos. Se o seu design precisa de texto legível — uma placa, um rótulo, um cartaz — recorra a um modelo forte em texto e ponha as palavras exatas entre aspas: uma placa de neon escrito "OPEN 24 HOURS". Veja a renderização de texto do GPT Image 2.

Na dúvida sobre qual usar? Como escolher um modelo detalha todos eles.

Aviso

Vindo do Midjourney do Discord? Não digite flags de parâmetro como --ar, --v ou --style dentro do prompt — o PonPon as interpreta como palavras e o modelo rejeita a geração inteira. Use no lugar os controles de proporção, versão e estilo na barra de prompt.

Corrigindo problemas comuns

Problema	Tente isto
Texto embaralhado na imagem	Troque para o GPT Image 2; ponha as palavras exatas entre aspas
Ênfase errada do sujeito	Ponha o sujeito primeiro; tire a bagunça de fundo do prompt
Personagem inconsistente entre imagens	Use uma imagem de referência e um modelo forte em consistência como o Nano Banana Pro
Quase certo, um detalhe fora	Não regere — edite o resultado ou anote e edite só aquela área
O estilo fica escapando	Nomeie o meio explicitamente e forneça uma imagem de referência

Itere com intenção

Mude uma variável de cada vez — modelo, depois luz, depois composição — para aprender o que cada ajuste faz. Quando um lote está perto, troque para editar em vez de reescrever o prompt inteiro: corrija uma palavra com editar texto, mude a câmera com multiângulo ou refine o fundo em vez de começar de novo.

Pronto para levar esses instintos ao movimento? Leia Como escrever prompts de vídeo.

Como escrever prompts de imagem

Uma estrutura confiável

Escreva nesta ordem — ela espelha como uma tomada é de fato planejada:

Sujeito — o que está no quadro, específico. "Uma xícara de café de cerâmica sobre um guardanapo de linho."
Estilo — o meio e o tratamento. "Foto de produto editorial", "ilustração vetorial flat", "render 3D", "aquarela".
Composição — enquadramento e ângulo. "Close, de cima, centralizado, baixa profundidade de campo."
Luz e clima — "Luz suave da manhã", "noite de neon", "softbox de estúdio, high-key".

Foto de produto editorial de um estojo de fones sem fio preto fosco sobre uma superfície de pedra molhada, de cima, baixa profundidade de campo, luz de estúdio suave e difusa, minimalista, tons frios.

Do fraco ao forte

A mesma ideia, afiada ao adicionar especificidade de sujeito, depois estilo e depois luz:

Prompt	Resultado
"uma xícara de café"	Uma xícara genérica, estilo e luz aleatórios
"uma xícara de café de cerâmica sobre um guardanapo de linho"	Sujeito certo, mas chapado e sem estilo
"foto editorial de uma xícara de café de cerâmica sobre um guardanapo de linho, close"	Composição alinhada ao briefing
"foto editorial de uma xícara de café de cerâmica sobre um guardanapo de linho, close, luz suave da janela pela manhã, baixa profundidade de campo"	A tomada que você de fato queria

Cada cláusula a mais tira uma decisão que o modelo, do contrário, tomaria por você.

Nota

O vocabulário que os modelos entendem

Recorra a termos concretos em vez de adjetivos vagos — os modelos os mapeiam para padrões visuais reais:

Meio — foto, ilustração, render 3D, pintura a óleo, line art, isométrico, claymation.
Tomada e lente — close, plano aberto, macro, de cima, na altura dos olhos, 35mm, bokeh, olho de peixe.
Luz — golden hour, contraluz, rim light, softbox, sombra dura, high-key, low-key.
Clima / paleta — pastéis suaves, alto contraste, monocromático, tons quentes, cinematográfico.

Dica

Um termo preciso vence três difusos. "Em contraluz na golden hour" diz ao modelo muito mais do que "boa iluminação".

Diga o que você quer, não o que não quer

Trabalhe a partir de imagens de referência

Anexe até 10 imagens de referência para guiar o estilo, a composição ou um sujeito específico. Ao escrever o prompt, digite @ para apontar uma imagem anexada específica:

Coloque @Image1 sobre a mesa em @Image2, combinando com a luz de @Image2.

É a forma mais limpa de combinar várias referências em uma só tomada — veja Edições por anotação e imagens de referência para o fluxo completo de referência e edição.

Ajuste o prompt ao modelo

O mesmo prompt se transfere entre modelos, mas cada um recompensa uma ênfase ligeiramente diferente:

GPT Image 2 — soletre qualquer texto dentro da imagem com exatidão, entre aspas; ele renderiza palavras de forma mais confiável que os outros.
Seedream 5.0 — aposte no detalhe fotorrealista (pele, olhar, profundidade); ele raciocina bem sobre realismo e também lida com texto em imagens.
Midjourney V8 — dê a ele palavras de clima e estilo; por padrão, ele tende ao cinematográfico e pictórico.
Nano Banana Pro — para edições de precisão, descreva só a mudança ("deixe a jaqueta vermelha"); ele edita localmente sem máscara e também é forte em texto dentro da imagem.

Dica

Na dúvida sobre qual usar? Como escolher um modelo detalha todos eles.

Aviso

Corrigindo problemas comuns

Problema	Tente isto
Texto embaralhado na imagem	Troque para o GPT Image 2; ponha as palavras exatas entre aspas
Ênfase errada do sujeito	Ponha o sujeito primeiro; tire a bagunça de fundo do prompt
Personagem inconsistente entre imagens	Use uma imagem de referência e um modelo forte em consistência como o Nano Banana Pro
Quase certo, um detalhe fora	Não regere — edite o resultado ou anote e edite só aquela área
O estilo fica escapando	Nomeie o meio explicitamente e forneça uma imagem de referência

Itere com intenção

Pronto para levar esses instintos ao movimento? Leia Como escrever prompts de vídeo.

Como escrever prompts de imagem

Uma estrutura confiável

Do fraco ao forte

O vocabulário que os modelos entendem

Diga o que você quer, não o que não quer

Trabalhe a partir de imagens de referência

Ajuste o prompt ao modelo

Corrigindo problemas comuns

Itere com intenção

Artigos relacionados

Como escrever prompts de imagem

Uma estrutura confiável

Do fraco ao forte

O vocabulário que os modelos entendem

Diga o que você quer, não o que não quer

Trabalhe a partir de imagens de referência

Ajuste o prompt ao modelo

Corrigindo problemas comuns

Itere com intenção

Artigos relacionados