GPT Image 1.5: així vol OpenAI convertir ChatGPT en un estudi creatiu d'imatges

Última actualització: 19/12/2025

  • GPT Image 1.5 arriba a tots els usuaris de ChatGPT ia través de l'API, amb generació d'imatges fins a quatre vegades més ràpida.
  • El model millora notablement l'edició precisa, la coherència visual i el seguiment d'instruccions complexes en diversos passos.
  • OpenAI estrena un espai dedicat a imatges a ChatGPT, pensat com un petit estudi creatiu amb filtres i suggeriments visuals.
  • El llançament s?emmarca en la competència directa amb Google Gemini i altres models de generació visual, amb un fort enfocament en usos professionals.
GPT Image 1.5

L'última actualització de OpenAI apunta directament els qui treballen diàriament amb contingut visual. La companyia ha reforçat l'editor d'imatges de ChatGPT amb un nou motor, GPT Image 1.5, que busca encaixar tant en lús quotidià com en fluxos de treball professionals de disseny, màrqueting i comerç electrònic.

Aquest model de generació visual s'estrena com la versió més avançada de la casa i ja està disponible per tots els usuaris de ChatGPT i per a desenvolupadors via API. Més enllà del salt tècnic, la jugada encaixa en un moment de competència forta al sector de la IA generativa, on OpenAI es mesura amb rivals com Google Gemini i altres models especialitzats en imatges.

Un model més ràpid, més barat i pensat per iterar

GPT Image-1.5

Un dels canvis més clars de GPT Image 1.5 és el rendiment: el model pot generar imatges fins a quatre vegades més ràpid que GPT Image 1, cosa que per a molts equips creatius suposa retallar esperes i facilitar la prova de variants sense perdre ritme.

En el pla econòmic, OpenAI ha ajustat també els costos a l'API. La companyia ha rebaixat al voltant d'un 20% el preu d´entrada i sortida d´imatges respecte a la versió anterior, permetent produir més material visual amb el mateix pressupost, cosa rellevant per a agències, startups i pimes que depenen de volums alts de contingut.

La combinació de major velocitat i menor cost està pensada per a entorns en què calen moltes iteracions: des de maquetar una campanya d'anuncis digitals fins a muntar diferents conceptes per a un client en poc temps.

OpenAI remarca que GPT Image 1.5 ja es pot provar directament al OpenAI Playground, on s'acompanyen les proves amb guies de prompts orientades a explotar millor les opcions del model, cosa útil per a perfils no experts en enginyeria de prompts.

Contingut exclusiu - Clic Aquí  OpenAI prepara una IA de música que funciona amb text i àudio

Edició precisa: canvis molt concrets sense trencar la imatge

exemple GPT Image 1.5

On OpenAI situa el salt qualitatiu més gran és en l'edició controlada. GPT Image 1.5 ha estat dissenyat per seguir instruccions complexes i en diversos passos amb menys errors i menys comportaments imprevisibles que els seus predecessors.

A la pràctica, l'usuari pot demanar modificacions molt localitzades -canviar el color d'una jaqueta, afegir un logotip a una cantonada concreta, ajustar un reflex o modificar només un objecte del fons- sense que la resta de l'escena es reinterpreti des de zero, un problema habitual en altres generadors d'imatges.

El model presta especial atenció a conservar amb major fidelitat trets facials, identitat de les persones, il·luminació, ombres i composició. Això és crític, per exemple, quan es treballa amb retrats, fotografies d'equip o imatges de producte on cada detall té impacte.

Un altre punt destacat és la consistència entre múltiples edicions o escenes relacionades. Personatges que reapareixen, estils artístics concrets o elements de marca solen mantenir-se coherents, cosa que facilita projectes com còmics, storyboards, sèries d'anuncis o catàlegs en què cal repetir la mateixa estètica sense desajustos estranys.

Per als equips de màrqueting i branding, OpenAI subratlla la capacitat del model per respectar logotips corporatius i elements gràfics clau, evitant deformacions o variacions de color que puguin comprometre la identitat visual.

Del simple retoc a un estudi creatiu complet

GPT Image 1.5 no es queda al retoc fotogràfic clàssic. OpenAI ho presenta com un model versàtil per fluxos de treball més complexos, on la imatge evoluciona a partir de proves i canvis iteratius.

Entre els usos que la companyia assenyala es troben les proves virtuals de roba, pentinats o accessoris, la transferència d'estils artístics a fotos o esbossos, la creació de maquetes de productes o les simulacions d'escenaris per a comerços en línia que volen mostrar un mateix article en diferents contextos.

L'eina també es recolza en capacitats avançades de manipulació de text dins les imatges. GPT Image 1.5 millora el renderitzat de tipografies petites o denses, obrint la porta a prototips més llegibles de interfícies, infografies, senyalètica i materials promocionals on el text s'ha de poder llegir sense problemes.

A nivell visual, OpenAI parla de un salt a realisme i qualitat estètica: textures més creïbles, materials més ben representats i una il·luminació més coherent, tant en fotografies simulades com en imatges orientades a campanyes comercials polides.

Contingut exclusiu - Clic Aquí  Què és el fine tuning i per què els teus prompts funcionen millor amb ell

El model també afina la generació de escenes amb múltiples cares, un punt feble tradicional de molts generadors, cosa que el fa més fiable per a fotos de grup, esdeveniments corporatius o composicions on intervenen diverses persones.

Un espai propi d'imatges dins de ChatGPT

editor Xat GPT image 1.5

Juntament amb el nou model, OpenAI ha actualitzat la experiència d'usuari a ChatGPT. La plataforma integra ara un espai específic dedicat a imatges, accessible des de la barra lateral tant a la versió web com a les aplicacions mòbils.

Aquest entorn funciona com una mena de estudi creatiu integrat, pensat per explorar idees visuals de forma àgil sense necessitat de redactar sempre prompts extensos. L'usuari pot partir de suggeriments predefinits o d'exemples i anar refinant els resultats sobre la marxa.

L'àrea d'imatges inclou filtres preconfigurats i suggeriments basats en tendències que s'actualitzen periòdicament, cosa que facilita arrencar projectes sense partir de zero. Per a qui no està acostumat a escriure instruccions detallades, aquestes dreceres poden marcar la diferència.

Una altra novetat pràctica és que la interfície permet continuar generant imatges mentre altres s'estan processant, cosa que encaixa amb jornades de treball en què es llancen diverses idees alhora i s'avaluen els resultats segons van arribant.

OpenAI indica que aquesta nova interfície s'està desplegant gradualment per a la majoria d'usuaris de ChatGPT, mentre que els comptes Business i Enterprise rebran l'accés complet una mica més endavant. El model GPT Image 1.5, En canvi, ja està activat per a tothom, sense que l'usuari hagi de seleccionar res manualment.

Competència amb Google Gemini i models rivals

El llançament de GPT Image 1.5 arriba en un moment de pressió competitiva elevada. En els darrers mesos, Google ha guanyat visibilitat amb la família de models Gemini i amb eines de generació visual que han aconseguit bona posició en diferents rànquings comparatius.

Diverses anàlisis del sector interpreten el moviment d'OpenAI com una resposta accelerada a aquesta pressió. Segons la informació difosa, l'empresa tenia previst llançar un nou generador d'imatges a principis d'any, però va optar per avançar els plans per no cedir més terreny en aquest segment.

Contingut exclusiu - Clic Aquí  Windows 11 torna a fallar: el mode fosc provoca llampades blanques i fallades visuals

El context intern mateix de la companyia reflecteix aquesta urgència: s'ha parlat d'una mena de “codi vermell” davant la possibilitat que competidors consolidin posicions en àmbits com la generació visual, on lexperiència dusuari pesa tant com la potència tècnica.

En paral·lel, models com Nano Banana Pro i altres generadors especialitzats empenyen que l'oferta s'orienti cada cop més a casos d'ús reals: catàlegs llestos per a impressió, campanyes omnicanal, peces per a xarxes socials o recursos gràfics integrats en eines no-code i low-code.

En aquest escenari, GPT Image 1.5 busca diferenciar-se especialment per la capacitat d'edició iterativa i la consistència visual, aspectes que resulten decisius per a equips que treballen amb marques i projectes a llarg termini.

Ús responsable i reptes pendents

Model GPT Image 1.5 d'OpenAI

Juntament amb les noves funcions, torna a la taula el debat sobre el ús responsable de la IA generativa. Eines d'aquest tipus faciliten tant la creació de campanyes legítimes com la possible difusió de continguts enganyosos o manipulats, tema sensible a Europa pel seu impacte en la desinformació.

Organitzacions del sector han insistit en la necessitat que empreses i administracions estableixin límits clars en àmbits com els drets d'autor, els biaixos algorísmics i la protecció de dades. La generació d'imatges que imiten estils concrets o cares reals continua generant debat jurídic i ètic.

OpenAI, per la seva banda, manté un discurs centrat en el ús professional i creatiu de GPT Image 1.5, animant a integrar-lo en projectes que busquin eficiència i qualitat, però recordant que la responsabilitat última sobre l'ús d'aquestes imatges recau en cada organització.

A la pràctica, la combinació de més potència, millor experiència d'ús i accessibilitat global converteix GPT Image 1.5 en una peça rellevant dins de l'ecosistema d'eines d'IA actuals, i planteja a usuaris i reguladors el repte de aprofitar els avantatges sense perdre de vista els riscos.

Amb aquesta actualització, ChatGPT reforça el seu perfil com entorn de treball híbrid, en què la paraula escrita i la imatge generada s'entrellacen per sostenir processos creatius, comercials i tècnics que fins fa poc requerien diversos serveis separats i més temps de producció.

Alternatives a Midjourney que funcionen sense Discord
Article relacionat:
Les millors alternatives a Midjourney que funcionen sense Discord