- "Nano Banana" és el nom en clau de Gemini 2.5 Flash Image, el nou model de Google per generar i editar imatges.
- Permet edició conversacional, manté la coherència de persones i objectes i combina imatges amb instruccions en llenguatge natural.
- Inclou SynthID com a marca d'aigua invisible i filtres per a contingut sensible i figures públiques.
- Es pot provar a l'app de Gemini ia Google AI Studio amb el model gemini-2.5-flash-image-preview.

Després de setmanes d'especulació, el sobrenom «Nano Banana» deixa de ser un misteri: correspon al nou motor de Google per a imatges, presentat oficialment com Gemini 2.5 Flash Image. La companyia activa una funció que combina generació i edició amb un enfocament conversacional que busca reduir friccions al flux creatiu.
El model arriba per competir amb generadors com Midjourney i amb editors tradicionals com Photoshop, reforçat per millores de coherència entre preses, preservació de trets i una velocitat de resposta que Google descriu com a «lightning fast». A més, s'integra a l'app de Gemini i està disponible mitjançant API ia Google AI Studio.
Què és Nano Banana i què aporta

Nano Banana és el nom intern del model , una evolució centrada en edició guiada per text i generació amb alt nivell de control. El sistema entén instruccions naturals i aplica canvis sobre la mateixa imatge, sense obligar-te a començar de zero cada cop.
Una de les claus és la consistència visual: en modificar una foto, el rostre, el posat o la il·luminació del subjecte es mantenen de forma estable entre versions. Això redueix deformacions o salts de perspectiva que encara apareixen en altres motors a escenaris complexos.
El fotorealisme fa un pas endavant amb textures i il·luminació més creïbles, i Google assegura avenços concrets en cares i mans, dos punts tradicionalment delicats a la IA d'imatges. El model també destaca per la seva rapidesa, cosa que facilita cicles de prova i millora més curts.
En benchmarking comunitari, com el de LM Arena, «Nano Banana» apareix entre els més ben valorats en edició per experiència d'usuari, impulsat pel seu equilibri entre qualitat, control i velocitat de resposta.
Funcions clau d'edició i generació
- Edició conversacional: dialoga amb la imatge i sol·licita ajustaments iteratius (per exemple, intensificar el cel, canviar el color d'un cotxe o afegir-hi un objecte).
- Selecció i retoc locals: tria zones concretes per esborrar elements, modificar el fons o ajustar llum i color sense afectar-ne la resta.
- Composició i barreja: combina diverses fotos en una sola escena i aplica l'estil d'una imatge sobre objectes d'una altra.
- Coherència de personatge: manté la semblança entre versions de la mateixa persona, mascota o objecte a través de múltiples edicions.
A més de la flexibilitat creativa, Google afegeix una capa de seguretat: totes les imatges generades o editades incorporen SynthID, una marca d'aigua imperceptible incrustada que resisteix transformacions i permet verificar si un contingut ha estat creat o alterat per IA.
El sistema inclou filtres per evitar la generació o manipulació de contingut sensible (violència, nuesa explícita) i bloqueja l'edició de persones famoses. Si l'usuari puja una fotografia real per alterar-la, els mecanismes de seguretat intenten frenar sol·licituds que puguin derivar en deepfakes.
A la pràctica, això significa menys temps perdut en proves tècniques i més focus en el resultat creatiu: les ordres en llenguatge natural es converteixen en accions sobre l'escena amb més precisió semàntica i respecte per escala, profunditat i estil.
Com utilitzar Nano Banana a l'app de Gemini ia AI Studio

L'experiència està integrada a la interfície de Gemini, sense necessitat d'acudir a programari addicional. En molts casos pots aprofitar-la fins i tot a la versió gratuïta, depenent del desplegament a la teva regió i compte.
- A l'app o web de Gemini: accedeix a gemini.google.com/app (o l'app mòbil), selecciona el model disponible i entra a «Crear imatges» dins de «Eines».
- Genera o edita: escriu un prompt per crear des de zero o puja una foto per editar-la. Podeu afegir instruccions encadenades per afinar el resultat en diverses rondes.
- Ordres útils: "converteix la presa a blanc i negre", "elimina l'objecte del fons", "canvia el fons per un paisatge urbà" o "aplica l'estil d'aquesta imatge a aquest vestit".
Si preferiu validar que utilitzeu el model correcte des de l'entorn de desenvolupadors, Google AI Studio ofereix un flux directe per a proves controlades amb gemini-2.5-flash-image-preview.
- Inicia sessió a Google AI Studio.
- Trieu el model «gemini-2.5-flash-image-preview» al selector.
- Introdueix prompts de text i/o puja imatges per veure edicions en temps real, amb suport per a edició multi-torn.
Si bé el comportament ha millorat en consistència i fotorealisme, convé recordar que la representació de text dins imatges o certs reflexos complexos poden no ser perfectes encara. Tot i així, l'edició guiada per llenguatge i les marques d'aigua aporten un interessant equilibri entre control creatiu i responsabilitat.
Amb la seva combinació d'edició conversacional, coherència de personatges, velocitat i salvaguardes com SynthID, Nano Banana encaixa com una opció versàtil per a creadors, marques i usuaris que vulguin ajustar fotos o compondre escenes sense complicar-se amb màscares i capes: tot des de la pròpia Gemini i amb un flux que afavoreix iterar fins a trobar la versió que millor encaixa amb la idea original.
Sóc un apassionat de la tecnologia que ha convertit els seus interessos frikis en professió. Porto més de 10 anys de la meva vida utilitzant tecnologia d'avantguarda i traslladant tota mena de programes per pura curiositat. Ara he especialitzat en tecnologia d'ordinador i videojocs. Això és perquè des de fa més de 5 anys que treballo redactant per a diverses webs en matèria de tecnologia i videojocs, creant articles que busquen donar-te la informació que necessites amb un llenguatge comprensible per tothom.
Si tens qualsevol pregunta, els meus coneixements van des de tot allò relacionat amb el sistema operatiu Windows així com Android per a mòbils. I és que el meu compromís és amb tu, sempre estic disposat a dedicar-te uns minuts i ajudar-te a resoldre qualsevol dubte que tinguis a aquest món d'internet.
