Cómo escribir prompts de imágenes
Un método práctico para prompts de imagen con IA en PonPon: una estructura fiable, reescrituras de débil a fuerte, el vocabulario de estilo e iluminación que entienden los modelos, referencias y soluciones.
Un buen prompt de imagen se lee como el encargo que le entregarías a un fotógrafo o ilustrador: qué hay en el encuadre, el estilo, cómo está compuesto y cómo está iluminado. Cubre esas cuatro cosas y obtendrás una imagen útil mucho más a menudo que con un prompt de una palabra.

Una estructura fiable
Escribe en este orden: refleja cómo se planifica una toma de verdad.
- Sujeto: qué hay en el encuadre, específico. «Una taza de café de cerámica sobre una servilleta de lino».
- Estilo: el medio y el tratamiento. «Foto de producto editorial», «ilustración vectorial plana», «render 3D», «acuarela».
- Composición: encuadre y ángulo. «Primer plano, cenital, centrado, poca profundidad de campo».
- Luz y ambiente: «Luz suave de la mañana», «noche de neón», «softbox de estudio, alta luz».
Foto de producto editorial de un estuche de auriculares inalámbricos en negro mate sobre una superficie de piedra húmeda, cenital, poca profundidad de campo, luz de estudio suave y difusa, minimalista, tonos fríos.
De débil a fuerte
La misma idea, afilada al añadir especificidad de sujeto, luego estilo, luego luz:
| Prompt | Resultado |
|---|---|
| «una taza de café» | Una taza genérica, estilo e iluminación al azar |
| «una taza de café de cerámica sobre una servilleta de lino» | Sujeto correcto, pero plano y sin estilo |
| «foto editorial de una taza de café de cerámica sobre una servilleta de lino, primer plano» | Composición al encargo |
| «foto editorial de una taza de café de cerámica sobre una servilleta de lino, primer plano, luz suave de ventana matinal, poca profundidad de campo» | La toma que de verdad querías |
Cada cláusula que añades le quita al modelo una decisión que de otro modo tomaría por ti.
Vocabulario que entienden los modelos
Recurre a términos concretos en vez de adjetivos vagos: los modelos los traducen a patrones visuales reales.
- Medio: foto, ilustración, render 3D, óleo, arte lineal, isométrico, claymation.
- Toma y lente: primer plano, plano general, macro, cenital, a la altura de los ojos, 35 mm, bokeh, ojo de pez.
- Luz: hora dorada, contraluz, luz de borde, softbox, sombra dura, alta luz, clave baja.
- Ambiente / paleta: pasteles apagados, alto contraste, monocromo, tonos cálidos, cinematográfico.
Di lo que quieres, no lo que no quieres
Los modelos manejan las descripciones positivas mucho mejor que las negaciones. Pide «un escritorio vacío y minimalista», no «un escritorio sin nada encima». Si vas a poner texto o un logo encima después, pide espacio negativo —«mucho cielo vacío arriba»— en lugar de describir lo que no debería estar ahí.
Trabaja a partir de imágenes de referencia
Adjunta hasta 10 imágenes de referencia para guiar el estilo, la composición o un sujeto concreto. Mientras escribes el prompt, escribe @ para apuntar a una imagen adjunta concreta:
Pon @Image1 sobre la mesa de @Image2, ajustando la iluminación a la de @Image2.
Es la forma más limpia de combinar varias referencias en una sola toma; consulta Anotar ediciones e imágenes de referencia para el flujo completo de referencia y edición.
Ajusta el prompt al modelo
El mismo prompt sirve entre modelos, pero cada uno premia un énfasis ligeramente distinto:
- GPT Image 2: deletrea con exactitud cualquier texto dentro de la imagen, entre comillas; renderiza palabras de forma más fiable que el resto.
- Seedream 5.0: apóyate en el detalle fotorrealista (piel, mirada, profundidad); razona bien sobre el realismo y también maneja texto en las imágenes.
- Midjourney V8: dale palabras de ambiente y estilo; por defecto tiende a lo cinematográfico y pictórico.
- Nano Banana Pro: para ediciones de precisión, describe solo el cambio («haz la chaqueta roja»); edita localmente sin máscara, y también es fuerte con el texto dentro de la imagen.
un letrero de neón que dice "OPEN 24 HOURS". Consulta el renderizado de texto de GPT Image 2.¿No sabes cuál usar? Elegir un modelo los desglosa todos.
--ar, --v o --style dentro del prompt: PonPon las interpreta como palabras y el modelo rechaza la generación entera. Usa en su lugar los controles de relación de aspecto, versión y estilo de la barra de prompt.Cómo arreglar problemas comunes
| Problema | Prueba esto |
|---|---|
| Texto ininteligible en la imagen | Cambia a GPT Image 2; pon las palabras exactas entre comillas |
| Énfasis equivocado del sujeto | Pon el sujeto primero; quita el desorden del fondo del prompt |
| Personaje inconsistente entre imágenes | Usa una imagen de referencia y un modelo fuerte en consistencia como Nano Banana Pro |
| Casi bien, un detalle desencaja | No vuelvas a tirar el prompt: edita el resultado o anota y edita solo esa zona |
| El estilo se sigue desviando | Nombra el medio explícitamente y aporta una imagen de referencia |
Itera con intención
Cambia una variable a la vez —modelo, luego luz, luego composición— para aprender qué hace cada movimiento. Cuando un lote está cerca, cambia a editar en vez de reescribir el prompt entero: corrige una palabra con editar texto, cambia la cámara con multiángulo o refina el fondo en lugar de empezar de cero.
¿Listo para llevar estos instintos al movimiento? Lee Cómo escribir prompts de video.
Artículos relacionados
- Generación de imágenesEscribe un buen prompt de imagen, elige entre modelos como GPT Image 2, Nano Banana Pro y Seedream 5.0, usa imágenes de referencia y edita resultados con las herramientas de anotación.
- Prompts de videoUn método práctico para prompts de video con IA en PonPon: estructura de toma, los presets de cámara que entienden los modelos, ritmo, consejos por modelo y cómo arreglar fallos comunes.
- Elegir un modeloCómo escoger el modelo de IA adecuado en PonPon: en qué destaca cada modelo de imagen y video, una tabla de decisión rápida, una comparación práctica, enfrentamientos directos y cuándo usar los niveles Fast o Pro.