Cómo escribir prompts de imágenes

Un método práctico para prompts de imagen con IA en PonPon: una estructura fiable, reescrituras de débil a fuerte, el vocabulario de estilo e iluminación que entienden los modelos, referencias y soluciones.

Un buen prompt de imagen se lee como el encargo que le entregarías a un fotógrafo o ilustrador: qué hay en el encuadre, el estilo, cómo está compuesto y cómo está iluminado. Cubre esas cuatro cosas y obtendrás una imagen útil mucho más a menudo que con un prompt de una palabra.

La barra de prompt del generador de imágenes de PonPon: elige el modelo, la relación de aspecto, la resolución, la calidad y la cantidad; el costo en créditos aparece en Generate.

Una estructura fiable

Escribe en este orden: refleja cómo se planifica una toma de verdad.

Sujeto: qué hay en el encuadre, específico. «Una taza de café de cerámica sobre una servilleta de lino».
Estilo: el medio y el tratamiento. «Foto de producto editorial», «ilustración vectorial plana», «render 3D», «acuarela».
Composición: encuadre y ángulo. «Primer plano, cenital, centrado, poca profundidad de campo».
Luz y ambiente: «Luz suave de la mañana», «noche de neón», «softbox de estudio, alta luz».

Foto de producto editorial de un estuche de auriculares inalámbricos en negro mate sobre una superficie de piedra húmeda, cenital, poca profundidad de campo, luz de estudio suave y difusa, minimalista, tonos fríos.

De débil a fuerte

La misma idea, afilada al añadir especificidad de sujeto, luego estilo, luego luz:

Prompt	Resultado
«una taza de café»	Una taza genérica, estilo e iluminación al azar
«una taza de café de cerámica sobre una servilleta de lino»	Sujeto correcto, pero plano y sin estilo
«foto editorial de una taza de café de cerámica sobre una servilleta de lino, primer plano»	Composición al encargo
«foto editorial de una taza de café de cerámica sobre una servilleta de lino, primer plano, luz suave de ventana matinal, poca profundidad de campo»	La toma que de verdad querías

Cada cláusula que añades le quita al modelo una decisión que de otro modo tomaría por ti.

Nota

Hay un límite superior en la longitud del prompt (varía según el modelo), y PonPon no recorta un prompt demasiado largo: falla en vez de ejecutarse. Pon lo esencial primero; si vas amontonando cláusula tras cláusula, de todos modos ya pasaste el punto de rendimientos decrecientes.

Vocabulario que entienden los modelos

Recurre a términos concretos en vez de adjetivos vagos: los modelos los traducen a patrones visuales reales.

Medio: foto, ilustración, render 3D, óleo, arte lineal, isométrico, claymation.
Toma y lente: primer plano, plano general, macro, cenital, a la altura de los ojos, 35 mm, bokeh, ojo de pez.
Luz: hora dorada, contraluz, luz de borde, softbox, sombra dura, alta luz, clave baja.
Ambiente / paleta: pasteles apagados, alto contraste, monocromo, tonos cálidos, cinematográfico.

Consejo

Un término preciso vale más que tres difusos. «A contraluz en la hora dorada» le dice al modelo mucho más que «buena iluminación».

Di lo que quieres, no lo que no quieres

Los modelos manejan las descripciones positivas mucho mejor que las negaciones. Pide «un escritorio vacío y minimalista», no «un escritorio sin nada encima». Si vas a poner texto o un logo encima después, pide espacio negativo —«mucho cielo vacío arriba»— en lugar de describir lo que no debería estar ahí.

Trabaja a partir de imágenes de referencia

Adjunta hasta 10 imágenes de referencia para guiar el estilo, la composición o un sujeto concreto. Mientras escribes el prompt, escribe @ para apuntar a una imagen adjunta concreta:

Pon @Image1 sobre la mesa de @Image2, ajustando la iluminación a la de @Image2.

Es la forma más limpia de combinar varias referencias en una sola toma; consulta Anotar ediciones e imágenes de referencia para el flujo completo de referencia y edición.

Ajusta el prompt al modelo

El mismo prompt sirve entre modelos, pero cada uno premia un énfasis ligeramente distinto:

GPT Image 2: deletrea con exactitud cualquier texto dentro de la imagen, entre comillas; renderiza palabras de forma más fiable que el resto.
Seedream 5.0: apóyate en el detalle fotorrealista (piel, mirada, profundidad); razona bien sobre el realismo y también maneja texto en las imágenes.
Midjourney V8: dale palabras de ambiente y estilo; por defecto tiende a lo cinematográfico y pictórico.
Nano Banana Pro: para ediciones de precisión, describe solo el cambio («haz la chaqueta roja»); edita localmente sin máscara, y también es fuerte con el texto dentro de la imagen.

Consejo

Renderizar palabras dentro de una imagen es lo más difícil para la mayoría de los modelos. Si tu diseño necesita texto legible —un letrero, una etiqueta, un póster—, recurre a un modelo fuerte en texto y pon las palabras exactas entre comillas: un letrero de neón que dice "OPEN 24 HOURS". Consulta el renderizado de texto de GPT Image 2.

¿No sabes cuál usar? Elegir un modelo los desglosa todos.

Advertencia

¿Vienes del Midjourney de Discord? No escribas banderas de parámetros como --ar, --v o --style dentro del prompt: PonPon las interpreta como palabras y el modelo rechaza la generación entera. Usa en su lugar los controles de relación de aspecto, versión y estilo de la barra de prompt.

Cómo arreglar problemas comunes

Problema	Prueba esto
Texto ininteligible en la imagen	Cambia a GPT Image 2; pon las palabras exactas entre comillas
Énfasis equivocado del sujeto	Pon el sujeto primero; quita el desorden del fondo del prompt
Personaje inconsistente entre imágenes	Usa una imagen de referencia y un modelo fuerte en consistencia como Nano Banana Pro
Casi bien, un detalle desencaja	No vuelvas a tirar el prompt: edita el resultado o anota y edita solo esa zona
El estilo se sigue desviando	Nombra el medio explícitamente y aporta una imagen de referencia

Itera con intención

Cambia una variable a la vez —modelo, luego luz, luego composición— para aprender qué hace cada movimiento. Cuando un lote está cerca, cambia a editar en vez de reescribir el prompt entero: corrige una palabra con editar texto, cambia la cámara con multiángulo o refina el fondo en lugar de empezar de cero.

¿Listo para llevar estos instintos al movimiento? Lee Cómo escribir prompts de video.

Cómo escribir prompts de imágenes

Una estructura fiable

Escribe en este orden: refleja cómo se planifica una toma de verdad.

Sujeto: qué hay en el encuadre, específico. «Una taza de café de cerámica sobre una servilleta de lino».
Estilo: el medio y el tratamiento. «Foto de producto editorial», «ilustración vectorial plana», «render 3D», «acuarela».
Composición: encuadre y ángulo. «Primer plano, cenital, centrado, poca profundidad de campo».
Luz y ambiente: «Luz suave de la mañana», «noche de neón», «softbox de estudio, alta luz».

Foto de producto editorial de un estuche de auriculares inalámbricos en negro mate sobre una superficie de piedra húmeda, cenital, poca profundidad de campo, luz de estudio suave y difusa, minimalista, tonos fríos.

De débil a fuerte

La misma idea, afilada al añadir especificidad de sujeto, luego estilo, luego luz:

Prompt	Resultado
«una taza de café»	Una taza genérica, estilo e iluminación al azar
«una taza de café de cerámica sobre una servilleta de lino»	Sujeto correcto, pero plano y sin estilo
«foto editorial de una taza de café de cerámica sobre una servilleta de lino, primer plano»	Composición al encargo
«foto editorial de una taza de café de cerámica sobre una servilleta de lino, primer plano, luz suave de ventana matinal, poca profundidad de campo»	La toma que de verdad querías

Cada cláusula que añades le quita al modelo una decisión que de otro modo tomaría por ti.

Nota

Vocabulario que entienden los modelos

Recurre a términos concretos en vez de adjetivos vagos: los modelos los traducen a patrones visuales reales.

Medio: foto, ilustración, render 3D, óleo, arte lineal, isométrico, claymation.
Toma y lente: primer plano, plano general, macro, cenital, a la altura de los ojos, 35 mm, bokeh, ojo de pez.
Luz: hora dorada, contraluz, luz de borde, softbox, sombra dura, alta luz, clave baja.
Ambiente / paleta: pasteles apagados, alto contraste, monocromo, tonos cálidos, cinematográfico.

Consejo

Un término preciso vale más que tres difusos. «A contraluz en la hora dorada» le dice al modelo mucho más que «buena iluminación».

Di lo que quieres, no lo que no quieres

Trabaja a partir de imágenes de referencia

Adjunta hasta 10 imágenes de referencia para guiar el estilo, la composición o un sujeto concreto. Mientras escribes el prompt, escribe @ para apuntar a una imagen adjunta concreta:

Pon @Image1 sobre la mesa de @Image2, ajustando la iluminación a la de @Image2.

Es la forma más limpia de combinar varias referencias en una sola toma; consulta Anotar ediciones e imágenes de referencia para el flujo completo de referencia y edición.

Ajusta el prompt al modelo

El mismo prompt sirve entre modelos, pero cada uno premia un énfasis ligeramente distinto:

GPT Image 2: deletrea con exactitud cualquier texto dentro de la imagen, entre comillas; renderiza palabras de forma más fiable que el resto.
Seedream 5.0: apóyate en el detalle fotorrealista (piel, mirada, profundidad); razona bien sobre el realismo y también maneja texto en las imágenes.
Midjourney V8: dale palabras de ambiente y estilo; por defecto tiende a lo cinematográfico y pictórico.
Nano Banana Pro: para ediciones de precisión, describe solo el cambio («haz la chaqueta roja»); edita localmente sin máscara, y también es fuerte con el texto dentro de la imagen.

Consejo

¿No sabes cuál usar? Elegir un modelo los desglosa todos.

Advertencia

Cómo arreglar problemas comunes

Problema	Prueba esto
Texto ininteligible en la imagen	Cambia a GPT Image 2; pon las palabras exactas entre comillas
Énfasis equivocado del sujeto	Pon el sujeto primero; quita el desorden del fondo del prompt
Personaje inconsistente entre imágenes	Usa una imagen de referencia y un modelo fuerte en consistencia como Nano Banana Pro
Casi bien, un detalle desencaja	No vuelvas a tirar el prompt: edita el resultado o anota y edita solo esa zona
El estilo se sigue desviando	Nombra el medio explícitamente y aporta una imagen de referencia

Itera con intención

¿Listo para llevar estos instintos al movimiento? Lee Cómo escribir prompts de video.

Cómo escribir prompts de imágenes

Una estructura fiable

De débil a fuerte

Vocabulario que entienden los modelos

Di lo que quieres, no lo que no quieres

Trabaja a partir de imágenes de referencia

Ajusta el prompt al modelo

Cómo arreglar problemas comunes

Itera con intención

Artículos relacionados

Cómo escribir prompts de imágenes

Una estructura fiable

De débil a fuerte

Vocabulario que entienden los modelos

Di lo que quieres, no lo que no quieres

Trabaja a partir de imágenes de referencia

Ajusta el prompt al modelo

Cómo arreglar problemas comunes

Itera con intención

Artículos relacionados