- La calidad de las imágenes generadas con IA en ChatGPT depende mucho más de la precisión del prompt que del modelo utilizado.
- Una estructura clara de sujeto, contexto, estilo, cámara, iluminación y ambiente permite controlar el resultado visual con mucha más consistencia.
- Los mismos prompts bien diseñados pueden adaptarse a otras IAs de imagen y combinarse con editores como MyEdit para un acabado profesional.
- Dominar los prompts no solo mejora tus imágenes, también convierte a ChatGPT en una herramienta potente para creatividad, trabajo y aprendizaje.
Si quieres sacarle todo el jugo a las imágenes generadas con IA en ChatGPT, el punto clave no es el modelo… es cómo le hablas. Un mismo modelo puede darte una foto que parece de banco de imágenes barato o una pieza digna de una campaña creativa, solo cambiando la forma de redactar el prompt.
En las próximas líneas vas a encontrar una guía completa con ejemplos de prompts para imágenes en ChatGPT, fórmulas para que crees los tuyos desde cero, ideas para trabajar con otras herramientas (Midjourney, Stable Diffusion, MyEdit, etc.) y trucos para editar tus propias fotos con IA sin volverte loco. Todo explicado en castellano de España, con lenguaje claro y pensando en que puedas copiar, adaptar y disparar imágenes desde ya.
Cómo genera imágenes ChatGPT y por qué el prompt lo es todo

Cuando pides una imagen a ChatGPT, el sistema utiliza GPT Image como motor visual (el sucesor de la serie DALL-E), coexistiendo con modelos de investigación como Nano Banana 2. Este modelo interpreta tu descripción en lenguaje natural y la traduce en píxeles, apoyándose en tres pilares fundamentales: comprensión del lenguaje, contexto y estilo visual.
Por debajo, la IA es capaz de entender relaciones entre objetos, estilos artísticos y términos fotográficos. Si hablas de lente de 85 mm, de hora dorada o de estética Pixar, el modelo sabe a qué tipo de encuadre, luz o acabado te refieres. GPT Image mejora a DALL-E en seguimiento de instrucciones, calidad de texto dentro de la imagen, nivel de detalle en edición y conocimiento del mundo real; además, convive en un ecosistema con modelos multimodales como Phi‑4 multimodal, que amplían las posibilidades creativas.
Aun así, el verdadero cuello de botella no es el modelo, sino la calidad del prompt que escribes. Una indicación vaga produce imágenes genéricas, mientras que una descripción rica en detalles concretos obliga al modelo a dejar de “adivinar” y seguir tu visión creativa. Ahí es donde está la diferencia entre algo olvidable y algo que parece salido de una agencia.
La fórmula base para prompts de fotos: pieza a pieza

Para sistematizar tus resultados, puedes usar una estructura muy sencilla que se repite en todos los buenos prompts fotográficos. Una especie de plantilla mental que te permite construir escenas completas sin quedarte en el típico “hazme una foto bonita”.
La fórmula general funciona así: Sujeto + contexto + estilo + cámara + iluminación + ambiente. Cada bloque controla un aspecto distinto de la imagen, y puedes intercambiarlos según lo que busques sin romper la coherencia del conjunto.
- Sujeto: quién o qué aparece en la escena. Puede ser una persona (“una mujer de unos 30 años”), un animal (“un golden retriever”), un objeto (“una hamburguesa vegetal”) o un espacio (“un rascacielos de cristal”).
- Contexto o escenario: el lugar y momento en que ocurre la escena, como “cruce de Shibuya de noche”, “interior de restaurante moderno”, “jungla tropical densa” o “fondo de estudio blanco”.
- Referencia de estilo: el lenguaje visual general, por ejemplo “editorial de revista Vogue”, “película de formato medio de los 90”, “renderizado 3D estilo Pixar” o “fotografía de producto hiperrealista”.
- Cámara y lente: parámetros que ChatGPT traduce en encuadres reconocibles, como “lente de retrato de 85mm”, “ojo de pez extremo”, “vista de pájaro” o “fotografiado en 35mm con f/1.4”.
- Iluminación: uno de los factores que más cambian el ambiente, con términos como “contraluz de hora dorada”, “luz de ventana difusa y suave”, “luz de estudio cálida direccional” o “iluminación dramática de borde”.
- Ambiente o tono: la carga emocional, por ejemplo “calmado y vintage”, “dominante y empoderador”, “juguetón y caprichoso” o “cinematográfico y tenso”.
Si lo juntamos todo, puedes pasar de una idea suelta a un prompt muy sólido. Imagina que quieres una escena tranquila en un parque: describes el sujeto, el entorno, el estilo fotográfico, el tipo de lente, la iluminación y el ambiente. Al final tienes una frase larga donde cada bloque aporta información visual concreta, sin necesidad de tirar de adjetivos vacíos como “increíble” o “espectacular”.
Cuando un resultado no te convence, suele ser porque falta alguna de estas piezas: un escenario demasiado genérico, una luz sin definir o la ausencia de referencias de estilo. Antes de regenerar, mira qué bloque has dejado cojo y corrígelo.
20 prompts de imágenes para ChatGPT según caso de uso

Vamos ahora con un repertorio amplio de prompts organizados por categorías. La idea es que puedas copiarlos tal cual, personalizarlos o usarlos como plantilla para tus propias escenas, sabiendo de antemano qué parte está haciendo el trabajo fuerte en cada caso.
Prompts de retrato: moda, editorial y escenas humanas
Los retratos son terreno perfecto para explotar las referencias de cámara, luz y estilo. Aquí unos cuantos modelos muy pulidos.
Retrato de moda cinematográfico
Un personaje fuerte, luz cálida y fondo controlado para campañas de moda o marca personal.
Prompt: Retrato ultra realista y cinematográfico de un hombre elegante de piel oscura con el cabello trenzado, gafas de sol negras futuristas y camisa de cuero marrón, de pie de perfil con la cabeza ligeramente levantada, expresión serena y segura, fondo de degradado intenso en tonos naranja y amarillo, iluminación cálida muy marcada con luz de borde dorada en rostro y hombros, leve halo de neblina rodeando al sujeto y reflejos en la prenda de cuero, estilo fotografía de moda editorial, poca profundidad de campo.
Retrato sincero en restaurante
Perfecto para contenido de estilo de vida, hostelería o apps de citas, con sensación de “estar allí”.
Prompt: Joven italiana sonriente con el pelo corto bien peinado, el viento moviendo algunos mechones, vestido de seda blanco plisado y suelto, sosteniendo una copa grande de vino blanco mientras toma la mano de un hombre con traje, encuadre en primera persona desde el punto de vista de ese hombre, mirándole a cámara con una sonrisa auténtica. Interior de restaurante moderno, colores vivos, atmósfera de momento feliz, contraste marcado, fotografía de moda con toque emocional, iluminación cinematográfica con contraluz dramático, bokeh pronunciado, grano fino de película, estilo Fujifilm X100V con lente de 35mm.
Toma de poder en ángulo bajo
Ángulo que exagera poder y presencia, muy útil para campañas con actitud.
Prompt: Mujer de pelo largo rojo intenso con blazer marrón entallado, extendiendo la mano hacia la cámara mostrando anillos de oro y un reloj, fotografiada desde un ángulo extremadamente bajo con distorsión de lente ojo de pez, barra de labios roja muy marcada, cabello al viento, rodeada de rascacielos de cristal contra un cielo azul limpio. Estética de editorial de moda de alto contraste, fuerte distorsión de perspectiva, sensación de energía dominante y empoderada, tomada con lente ojo de pez de 35mm.
Editorial de alta costura con flores
Jugar con la armonía de color entre ropa y entorno produce escenas con aire de revista de lujo.
Prompt: Primer plano de un icono de la moda italiana con blazer azul zafiro entallado, camisa de seda con rayas en naranja y aguamarina y pañuelo estampado al cuello, rodeado de lirios naranjas vibrantes, hortensias azules y follaje verde que complementan su atuendo. Iluminación tipo cine con sol suave, fondo ligeramente desenfocado, foco en texturas del tejido y expresión segura. Estilo revista de alta moda, elegancia italiana contemporánea, detalles lujosos, sensación de editorial sofisticada, ángulo a la altura de los ojos, acabado digital mate.
Retrato editorial con estética de los 90
Ideal para marcas y creadores que buscan un toque analógico y nostálgico.
Prompt: Retrato de estudio con aire cinematográfico de una joven con melena larga castaño oscuro y flequillo abierto, llevando un blazer gris de raya diplomática oversized. Piel clara con pecas, acabado mate, maquillaje mínimo y labios nude brillantes. Mira fijamente al objetivo con calma y seguridad. Fondo color terracota cálido iluminado con luz difusa tipo ventana, aspecto pictórico. Simula cámara analógica de formato medio (Mamiya RZ67 o Pentax 67) con película Kodak Portra 400 para tonos suaves, grano fino y textura atemporal. Ambiente tranquilo, elegante y vintage, evocando editoriales noventeras y poder suave.
Retrato cinematográfico en aula (con tu foto)
Aquí la gracia está en subir una imagen propia y convertirla en escena de película.
Prompt (tras subir tu foto): Retrato cinematográfico de la persona de la foto subida (manteniendo todos los rasgos faciales fieles), ambientado en un aula antigua. Cámara alejada, dejando ver una parte del respaldo de una silla en primer plano como si el fotógrafo tomara la imagen de forma discreta. Luz amarilla dorada entrando por una ventana lateral derecha, formando diagonales de luz que caen sobre el rostro y generan contraste emocional. El sujeto se sienta solo, con los pies apoyados sobre la mesa, expresión relajada y pensativa. Lleva auriculares rojos, jersey oscuro de punto, pantalones blancos y zapatillas rojas.
Prompts de paisaje y naturaleza

Los entornos naturales y urbanos se prestan a jugar con perspectivas poco habituales y efectos casi imposibles en fotografía tradicional.
Planeta ciudad esférico
El efecto “tiny planet” aplicado a cualquier ciudad famosa, listo para usar como póster o contenido de viajes.
Prompt: Panorama esférico hiperrealista de una versión encantadora de París, con sus monumentos icónicos curvándose alrededor de la superficie de un pequeño planeta. Incluir texto 3D blanco con la palabra “París” integrado de forma elegante en el paisaje urbano. Vista desde un ángulo cenital como si orbitara el planeta, enfatizando la sensación esférica. Luz de día suave filtrada por un cielo parcialmente nublado, sombras delicadas sobre césped y árboles. Fondo que se funde en un cielo dramático con nubes arremolinadas. Paleta natural pero viva con verdes intensos, azules suaves y tonos tierra apagados. Acabado pulido y fotorrealista con gran detalle arquitectónico y ambiental.
Escena submarina dividida
La clásica toma mitad bajo el agua, mitad por encima, pero sin equipo de buceo ni cúpulas caras.
Prompt: Fotografía profesional a nivel del agua con plano dividido: mitad de la imagen bajo el mar y mitad al aire libre. En la zona inferior, fondo marino arenoso con conchas de colores y piedras pulidas, peces nadando en el centro del encuadre, agua azul clara con excelente visibilidad. En la parte superior, una casa moderna y un coche al fondo sobre la línea de costa. Rayos de sol atravesando la superficie y penetrando en el agua desde arriba. Colores brillantes, estilo de fotografía de naturaleza fotorrealista.
Rayos de luz en océano profundo
Escena ideal para proyectos de meditación, conservación marina o simple inspiración visual.
Prompt: Vista del fondo del océano desde una gran profundidad. Potentes rayos de luz descienden desde la superficie del agua, iluminando un banco de peces dorados que nadan en la columna de agua. El lecho marino está cubierto de corales de colores y plantas marinas. Burbujas de aire suben hacia la parte superior del encuadre. Tonos azules y verde azulado profundos, estética de documental submarino cinematográfico, fotorrealismo y alto nivel de detalle.
Comida y estilo de vida: fotos que abren el apetito

La IA ha avanzado muchísimo en texturas de comida y líquidos, así que estos prompts van perfectos para restaurantes, marcas y creadores gastronómicos.
Cóctel junto a la piscina
Un clásico de Instagram: bebida, piscina y sombras tropicales.
Prompt: Fotografía cenital de un cóctel naranja en vaso de cristal a la orilla de una piscina. El agua turquesa muestra sombras de hojas de palmera proyectadas sobre la superficie, creando un ambiente tropical. Del vaso sale una pequeña salpicadura como si una gota acabara de caer sobre la bebida. En primer término aparece una barandilla de madera que conduce a la zona de baño, con algo de vegetación alrededor del borde de la piscina. Toma con cámara Sony A1 y objetivo 85mm G-Master, luz de estudio suave, tonos cálidos naturales y gran nivel de detalle.
Cocina a vista de pájaro
Una escena muy expresiva para chefs, escuelas de cocina o contenido foodie.
Prompt: Imagen tomada desde arriba con una lente ojo de pez de una joven chef en una cocina moderna impecable, con uniforme completo (delantal y gorro de chef), sosteniendo un utensilio de cocina y sonriendo con seguridad. El fondo muestra encimeras, estanterías con utensilios y luz cálida envolvente. Perspectiva gran angular muy marcada, profundidad dinámica e iluminación cinematográfica, alta resolución y estilo fotográfico profesional.
Hamburguesa explotada en el aire
Perfecta para carteles, menús y anuncios de comida, con efecto de acción congelada.
Prompt: Vista explotada hiperrealista de una hamburguesa vegetal alta, con pan multicereal, loncha de queso cheddar potente, hamburguesa de champiñones a la parrilla, tiras de pimiento rojo asado y hojas de espinaca crujientes, todos los ingredientes flotando en el aire sobre un fondo naranja dorado intenso. Hierbas frescas, migas de pan y tomates cherry suspendidos alrededor como si hubieran sido lanzados por una ráfaga de aire sabrosa. Iluminación cálida direccional que resalta gotas de humedad, texturas y brillos en cada capa. Fotorrealismo con profundidad de campo extrema, sombras dramáticas y gradación orgánica de color para transmitir sensación de comida gourmet recién hecha.
Prompts creativos y artísticos

Cuando no buscas imitar una foto real, puedes jugar con ilustración, ilusión óptica y mezclas de estilos. Aquí es donde la IA se suelta la melena.
Gato a través de papel rasgado
Una imagen minimalista, adorable y muy compartible.
Prompt: Fotografía hiperrealista en formato vertical 9:16, tomada lateralmente con una lente gran angular a f/1.4 para lograr una profundidad de campo muy reducida y una distorsión que enfatice la nariz de los objetos cercanos. Un gato extremadamente adorable asoma la cabeza a través de un agujero rasgado en una hoja de papel blanco impecable, en semiperfil, olfateando la lente con curiosidad y mirando directamente con ojos grandes y tiernos. La composición es minimalista y de alto contraste, transmitiendo calidez y juego.
Mascota dentro de una caja
El típico recurso que dispara el “aww” de cualquier espectador.
Prompt: Foto publicitaria colorida y dulce tomada desde el interior de una caja mirando hacia arriba a través de la abertura hacia un cielo luminoso. Se usa una lente gran angular a f/1.4 para crear profundidad de campo corta y distorsión que agrande la nariz del sujeto. Un animal extremadamente tierno ha introducido la cabeza en el interior de la caja, oliendo la lente, con los ojos muy grandes y expresivos enfocados en la cámara. La imagen debe maximizar la sensación de ternura y provocar una sonrisa instantánea.
Selfie con caracteres de dibujos animados (con tu foto)
Escena perfecta para redes sociales, mezclando realidad y personajes famosos.
Prompt (tras subir tu foto): Selfie ultra realista en formato vertical 9:16 con lente ojo de pez en el que aparezco junto a Sonic y Mario, todos haciendo muecas exageradamente divertidas. Escenario en una sala de estar pequeña y luminosa en tonos blancos. Ángulo de cámara alto con fuerte distorsión de ojo de pez. Iluminación realista y cinematográfica, personajes integrados en el entorno con un realismo estilizado que mezcla carne y hueso con estética de animación.
Selfie imposible con fauna salvaje
Una escena de selva que parece real pero sería impensable sin IA.
Prompt: Un gorila, un hombre y un tigre posan hombro con hombro en una jungla densa, los tres haciendo el gesto de paz con una mano o pata. El hombre aparece ligeramente a la derecha del centro, con el gorila a la izquierda y el tigre a la derecha, creando una composición casual de selfie. El gorila mira relajado a la cámara, el tigre levanta la pata en gesto de paz de forma sorprendentemente calmada, y el hombre lleva camisa vaquera y gafas, sonriendo de forma natural. Fondo de selva tropical verde con bokeh suave, algo desenfocado para centrar la atención en el trío. Luz diurna filtrada entre las hojas, estética de fotografía de vida salvaje hiperrealista con encuadre tipo selfie, lente de 35mm.
Todo puede ser un pastel
Uno de los conceptos más virales: objetos cotidianos que resultan ser tartas.
Prompt: Ilustración digital hiperrealista de un pastel diseñado con precisión para parecerse a un , colocado sobre una mesa blanca impecable. El pastel aparece con un mordisco que deja a la vista varias capas internas de bizcocho, crema y migas, rompiendo la ilusión del objeto original. El encuadre es ligeramente cenital para remarcar el contraste entre el exterior realista y el interior de repostería. Luz suave difusa para destacar texturas y proyectar sombras sutiles. Fondo limpio y luminoso para centrar toda la atención en el postre engañoso. Paleta viva y juguetona en las capas internas frente al exterior que imita al objeto, estilo fotorrealista con un toque caprichoso y apetecible.
Avatar 3D estilo Pixar
La típica petición para avatares, fotos de perfil o personajes de marca.
Prompt: Avatar 3D de una chica con expresión de sorpresa sobre fondo blanco, ilustración digital conceptual con estética de calidad Pixar, ojos verdes grandes y expresivos, cabello negro recogido en dos moños, gafas redondas, renderizado suave con iluminación limpia.
Productos y objetos: del peluche al hielo

La IA es muy eficaz para crear renders de producto pulidos sin un estudio real, algo muy útil para e‑commerce, branding o prototipos.
Objeto convertido en peluche
La idea es transformar cualquier cosa en juguete de fieltro o de peluche.
Prompt: Render 3D hiperrealista de un coche de juguete de peluche suave, con forma de coche en miniatura de bordes redondeados y superficie de tela mullida. Fondo blanco puro, iluminación de estudio uniforme, gran nivel de detalle en la textura del tejido. Estética fotorrealista, simulando una sesión de foto de producto profesional con cámara DSLR y resolución muy alta.
Objeto atrapado en hielo
Un recurso muy elegante para cartelería de bebidas, cosmética o packaging.
Prompt: Póster hiperrealista con un cubo de hielo sobre una superficie húmeda con gotas de condensación. Dentro del hielo se ve una naranja 3D realista, con textura de piel visible y color intenso, completamente integrada en el bloque, con burbujas de aire, irregularidades y refracciones de luz doblándose alrededor de la fruta para un efecto máximo de realismo. Iluminación suave difusa que potencia la profundidad, paleta en tonos fríos apagados (azules, blancos, verdes azulados suaves) para una apariencia moderna y elegante. Fondo de cocina ligeramente desenfocado con efecto bokeh, aportando contexto sin distraer. Composición ultra detallada y cinematográfica pensada para un póster de gama alta.
Cómo usar los prompts de imágenes en ChatGPT paso a paso

Más allá de copiar y pegar, conviene entender el flujo completo de trabajo con ChatGPT cuando generas o editas imágenes, porque ahí es donde realmente ahorras tiempo.
- Acceso al modelo de imagen: Tanto en la versión gratuita como en la de pago, ChatGPT permite pedir imágenes directamente escribiendo una descripción en un chat nuevo. En la versión de pago puedes notar mejor rendimiento y más generaciones por día, pero el proceso es el mismo: escribes el prompt, envías y esperas las variaciones que el sistema propone.
- Pegar el prompt y generar: Una vez copiado el prompt que quieres usar (o adaptado a tu gusto: cambiando ciudad, sujeto, colores…), lo pegas en el cuadro de texto y lo envías. ChatGPT generará una o varias opciones visuales. Si usas la fórmula de sujeto + contexto + estilo + cámara + luz + ambiente, el primer intento suele salir razonablemente cerca de lo que buscas.
- Revisar y ajustar: Es raro que la primera imagen sea perfecta. Lo normal es que tengas que afinar algún detalle: cambiar un accesorio, un color, un gesto… Si la composición general te sirve, no hace falta reescribir todo el prompt; basta con pedir cambios del tipo “mantén todo igual pero haz que el vestido sea azul oscuro” o “cambia el cielo nublado por un atardecer intenso”. GPT recuerda el contexto de la conversación y ajusta en consecuencia.
- Editar áreas concretas con la herramienta de selección: En muchas interfaces de ChatGPT con imagen aparece un botón para seleccionar solo una parte de la foto. Dibujas sobre la zona que quieres cambiar (por ejemplo, una espátula en la mano de un chef) y le das una instrucción como “sustituye la espátula de madera por un cucharón de acero inoxidable”. El modelo regenera únicamente esa región y deja el resto de la imagen intacto.
Prompts útiles de ChatGPT más allá de la imagen
Aunque aquí el foco sean los prompts de imágenes, merece la pena recordar que el mismo enfoque se puede aplicar a tareas del día a día. Puedes usar estructuras parecidas para productividad, aprendizaje o marketing, variando solo el tipo de salida que pides.
En trabajo y productividad, por ejemplo, puedes pedir resúmenes de artículos largos, borradores de correos formales, listas de temas para reuniones o ideas de contenido. En educación, puedes solicitar explicaciones sencillas con analogías, planes de estudio por días o ejercicios prácticos. Y en marketing y redes sociales, puedes encargar títulos de posts, variantes de copys para anuncios, guiones breves para vídeos o ideas de campañas visuales basadas precisamente en imágenes generadas con IA.
Entender que un buen prompt es un plano detallado de lo que quieres, ya sea una foto, un email o un guion, hace que ChatGPT pase de ser un juguete a una herramienta de trabajo seria.
Si combinas una estructura clara de prompts, ejemplos sólidos como los que has visto y el apoyo de generadores externos (Midjourney, Stable Diffusion, MyEdit, Robbie Prompts, SeaArt…), tienes un ecosistema entero para crear y pulir imágenes de IA a nivel muy alto. Al final, lo que marca la diferencia no es tanto el modelo que uses como tu capacidad para traducir tu idea visual en palabras precisas que la máquina pueda entender sin tener que rellenar huecos por su cuenta.
Soy un apasionado de la tecnología que ha convertido sus intereses «frikis» en profesión. Llevo más de 10 años de mi vida utilizando tecnología de vanguardia y trasteando todo tipo de programas por pura curiosidad. Ahora me he especializado en tecnología de ordenador y videojuegos. Esto es por que desde hace más de 5 años que trabajo redactando para varias webs en materia de tecnología y videojuegos, creando artículos que buscan darte la información que necesitas con un lenguaje entendible por todos.
Si tienes cualquier pregunta, mis conocimientos van desde todo lo relacionado con el sistema operativo Windows así como Android para móviles. Y es que mi compromiso es contigo, siempre estoy dispuesto a dedicarte unos minutos y ayudarte a resolver cualquier duda que tengas en este mundo de internet.
