- „Nano Banana“ je kódové označení pro Gemini 2.5 Flash Image, nový model od Googlu pro generování a úpravu obrázků.
- Umožňuje konverzační úpravy, zachovává konzistenci mezi lidmi a objekty a kombinuje obrázky s instrukcemi v přirozeném jazyce.
- Zahrnuje SynthID jako neviditelný vodoznak a filtry pro citlivý obsah a veřejné osoby.
- Můžete si to otestovat v aplikaci Gemini a v Google AI Studiu pomocí modelu gemini-2.5-flash-image-preview.

Po týdnech spekulací přezdívka „Nano banán“ přestává být záhadou: odpovídá Nový obrazový engine od Googlu byl oficiálně představen jako Gemini 2.5 Obrázek v bleskuSpolečnost aktivuje funkci, která kombinuje generování a editaci s konverzačním přístupem, jehož cílem je snížit tření v tvůrčím toku.
Model přichází, aby konkuroval generátorům jako Midjourney a tradičním editorům, jako je Photoshop, a to díky vylepšením v... konzistence mezi záběry, zachování funkcí a rychlost odezvy, kterou Google popisuje jako „bleskově rychlou“. Kromě toho, Je integrován do aplikace Gemini a je k dispozici prostřednictvím API a v Google AI Studiu..
Co je „Nano Banana“ a co nabízí?

„Nano Banana“ je interní název modelu, vývoje zaměřeného na textově řízené úpravy a vysoce kontrolované generování. Systém rozumí přirozeným instrukcím a aplikuje změny na stejný obrázek, aniž by vás nutil pokaždé začínat od nuly.
Jedním z jeho klíčů je vizuální konzistence: Při úpravě fotografie zůstává obličej, póza nebo osvětlení objektu mezi verzemi konzistentní. Toto snižuje zkreslení nebo perspektivní skoky které se stále objevují v jiných motorech ve složitých situacích.
El Fotorealismus jde o krok vpřed s věrohodnějšími texturami a osvětleníma Google tvrdí, že dosáhl konkrétního pokroku v oblasti obličejů a rukou, dvou tradičně citlivých oblastí v oblasti umělé inteligence pro tvorbu obrázků. Model také vyniká svou rychlostí, což usnadňuje kratší cykly testování a vylepšování.
V komunitním benchmarkingu, jako je například LM Arena, se „Nano Banana“ objevuje mezi nejlépe hodnocené v úpravách uživatelského prostředí, a to díky vyvážení kvality, kontroly a rychlosti odezvy.
Funkce pro úpravu a generování klíčů
- Konverzační editace: vede dialog s obrázkem a požaduje iterativní úpravy (např. zesílení oblohy, změna barvy auta nebo přidání objektu).
- Lokální výběr a retušVyberte konkrétní oblasti, kde chcete vymazat prvky, upravit pozadí nebo upravit osvětlení a barvu, aniž byste ovlivnili zbytek.
- Složení a míchání: Spojí více fotografií do jedné scény a aplikuje styl jednoho obrázku na objekty v jiném.
- Soudržnost postavZachovává podobnost mezi verzemi stejné osoby, domácího mazlíčka nebo objektu napříč více úpravami.
Kromě kreativní flexibility Google přidává i vrstvu zabezpečeníVšechny generované nebo upravené obrázky obsahují SynthID, nepostřehnutelný vložený vodoznak, který odolává transformaci a umožňuje ověřit, zda byl obsah vytvořen nebo změněn umělou inteligencí.
Systém obsahuje filtry, které zabraňují generování nebo manipulaci citlivý obsah (násilí, explicitní nahota) a blokuje úpravy slavných osobností. Pokud uživatel nahraje skutečnou fotografii k úpravě, bezpečnostní mechanismy se pokusí zabránit požadavkům, které by mohly vést k deepfakes.
V praxi to znamená méně času stráveného technickým testováním a větší zaměření na kreativní výsledek: Příkazy v přirozeném jazyce se na scéně stávají akcemi s větší sémantickou přesností a respektem k měřítku, hloubce a stylu.
Jak používat Nano Banana v aplikaci Gemini a AI Studiu

Zkušenosti je integrován do rozhraní Gemini, bez nutnosti dalšího softwaru. V mnoha případech Můžete toho využít i v bezplatná verze, v závislosti na nasazení ve vašem regionu a účtu.
- V aplikaci nebo na webových stránkách Gemini: Přistoupit gemini.google.com/app (o mobilní aplikace), vyberte dostupnou šablonu a v části „Nástroje“ přejděte na „Vytvořit obrázky“.
- Generovat nebo upravovatZadejte výzvu k vytvoření od nuly nebo nahrajte fotografii k úpravě. Můžete přidat zřetězené instrukce pro doladění výsledku v několika kolech.
- Užitečné objednávky„udělat snímek černobílý“, „odstranit objekt z pozadí“, „změnit pozadí na městskou krajinu“ nebo „použít styl tohoto obrázku na tyto šaty“.
Pokud dáváte přednost ověření, že používáte správný model z vývojářského prostředí, Google AI Studio nabízí přímý tok pro řízené testování s náhled obrázku gemini-2.5-flash.
- Přihlaste se do Google AI Studia.
- Vyberte model „gemini-2.5-flash-image-preview“ ve voliči.
- Zadejte textové pokyny a/nebo nahrajte obrázky, abyste viděli úpravy v reálném čase., s podporou editace ve více směnách.
I když se chování zlepšilo v konzistenci a fotorealismu, stojí za to si uvědomit, že Reprezentace textu v obrázcích nebo určitých složitých odrazech nemusí být ještě dokonaláJazykově řízená editace a vodoznaky však poskytují zajímavou rovnováhu mezi tvůrčí kontrolou a odpovědností.
Díky kombinaci konverzační editace, konzistence postav, rychlosti a ochranných prvků, jako je SynthID, „Nano Banana“ se hodí jako všestranná volba pro tvůrce, značky a uživatele, kteří chtějí upravovat fotografie nebo komponovat scény, aniž by se museli komplikovat maskami a vrstvami.: vše ze samotného Gemini a s postupem, který podporuje iteraci, dokud se nenajde verze, která nejlépe odpovídá původní myšlence.
Jsem technologický nadšenec, který ze svých „geekovských“ zájmů udělal profesi. Strávil jsem více než 10 let svého života používáním nejmodernějších technologií a vrtáním se všemi druhy programů z čisté zvědavosti. Nyní se specializuji na počítačovou techniku a videohry. Je to proto, že již více než 5 let píšu pro různé webové stránky o technologiích a videohrách a tvořím články, které se vám snaží poskytnout informace, které potřebujete, v jazyce, který je srozumitelný všem.
Pokud máte nějaké dotazy, mé znalosti sahají od všeho, co se týká operačního systému Windows a také Androidu pro mobilní telefony. A můj závazek je vůči vám, jsem vždy ochoten strávit pár minut a pomoci vám vyřešit jakékoli otázky, které můžete mít v tomto internetovém světě.
