- „Nano Banana“ yra „Gemini 2.5 Flash Image“, naujo „Google“ vaizdų generavimo ir redagavimo modelio, kodinis pavadinimas.
- Tai leidžia redaguoti pokalbio formatu, išlaikyti nuoseklumą tarp žmonių ir objektų bei derinti vaizdus su natūralios kalbos instrukcijomis.
- Apima „SynthID“ kaip nematomą vandens ženklą ir filtrus jautriam turiniui bei viešiems asmenims.
- Galite tai išbandyti „Gemini“ programėlėje ir „Google AI Studio“ naudodami „gemini-2.5-flash-image-preview“ modelį.

Po kelių savaičių spėlionių, pravardė „Nano bananas“ nustoja būti paslaptimi: atitinka Oficialiai pristatyta nauja „Google“ vaizdų paieškos sistema. Dvyniai 2.5 Blykstės vaizdasĮmonė aktyvuoja funkciją, kuri sujungia generavimą ir redagavimą su pokalbio metodu, kuriuo siekiama sumažinti trintį kūrybiniame sraute.
Modelis konkuruoja su generatoriais, tokiais kaip „Midjourney“, ir tradiciniais redaktoriais, tokiais kaip „Photoshop“, sustiprintas patobulinimais. nuoseklumas tarp kadrų, funkcijų išsaugojimas ir reagavimo greitis, kurį „Google“ apibūdina kaip „žaibišką“. Be to, Jis integruotas į „Gemini“ programėlę ir pasiekiamas per API bei „Google AI Studio“..
Kas yra „Nano Banana“ ir ką jis suteikia?

„Nano Banana“ – tai vidinis modelio pavadinimas. Tai evoliucija, orientuota į teksto pagrindu atliekamą redagavimą ir itin kontroliuojamą generavimą. Sistema supranta natūralias instrukcijas ir pritaiko pakeitimus tam pačiam vaizdui, neversdama jūsų kaskart pradėti nuo nulio.
Vienas iš jo raktų yra vizualinis nuoseklumas: Redaguojant nuotrauką, objekto veidas, poza ar apšvietimas išlieka vienodi skirtingose versijose. Tai sumažina iškraipymus arba perspektyvos šuolius kurie vis dar pasirodo kituose varikliuose sudėtingose situacijose.
El Fotorealizmas žengia žingsnį į priekį su labiau įtikinamomis tekstūromis ir apšvietimu, o „Google“ teigia, kad pasiekta konkrečių pažangų veidų ir rankų srityje – dviejose tradiciškai jautriose vaizdų dirbtinio intelekto srityse. Modelis taip pat išsiskiria savo greičiu, o tai palengvina trumpesnius testavimo ir tobulinimo ciklus.
Bendruomenės lyginamojoje analizėje, pavyzdžiui, LM Arenos, „Nano Banana“ yra tarp geriausiai įvertintas vartotojo patirties redagavimo srityje, kurią lemia kokybės, kontrolės ir reagavimo greičio pusiausvyra.
Rakto redagavimo ir generavimo funkcijos
- Pokalbių redagavimas: dialoguoja su vaizdu ir prašo atlikti iteracinius pakeitimus (pvz., padidinti dangaus ryškumą, pakeisti automobilio spalvą arba pridėti objektą).
- Vietinis pasirinkimas ir retušavimas: Pasirinkite konkrečias sritis, kuriose norite ištrinti elementus, modifikuoti foną arba reguliuoti apšvietimą ir spalvas nepaveikdami likusių dalių.
- Sudėtis ir maišymas: Sujungia kelias nuotraukas į vieną sceną ir pritaiko vieno vaizdo stilių objektams kitame.
- Veikėjų darna: Išlaiko to paties asmens, augintinio ar objekto versijų panašumą atliekant kelis redagavimus.
Be kūrybinio lankstumo, „Google“ prideda ir saugumo lygmenį.Visuose sugeneruotuose arba redaguotuose vaizduose yra „SynthID“, nepastebimas įterptas vandens ženklas, kurio negalima transformuoti ir kuris leidžia patikrinti, ar turinį sukūrė ar pakeitė dirbtinis intelektas.
Sistemoje yra filtrai, skirti užkirsti kelią generavimui ar manipuliavimui neskelbtinas turinys (smurtas, atviras nuogumas) ir blokuoja garsių žmonių nuotraukų redagavimą. Jei vartotojas įkelia tikrą nuotrauką, kurią norima redaguoti, saugumo mechanizmai bando užkirsti kelią prašymams, kurie galėtų sukelti giluminius klastojimus.
Praktiškai tai reiškia mažiau laiko sugaištama techniniams bandymams ir daugiau dėmesio skiriama kūrybiniam rezultatui: Natūralios kalbos komandos tampa veiksmais scenoje su didesniu semantiniu tikslumu ir pagarba masteliu, gyliu bei stiliumi.
Kaip naudoti „Nano Banana“ „Gemini“ programėlėje ir „AI Studio“

Patirtis Jis integruotas į „Gemini“ sąsają, nereikalaujant papildomos programinės įrangos. Daugeliu atvejų Galite tuo pasinaudoti net ir tada, kai nemokama versija, priklausomai nuo diegimo jūsų regione ir paskyroje.
- „Gemini“ programėlėje arba svetainėje: Prisijunkite prie gemini.google.com/app (o mobilioji programėlė), pasirinkite galimą šabloną ir eikite į „Kurti vaizdus“, esantį skiltyje „Įrankiai“.
- Generuoti arba redaguotiĮveskite raginimą, kad sukurtumėte nuo nulio, arba įkelkite nuotrauką, kurią norite redaguoti. Galite pridėti grandinines instrukcijas, kad per kelis raundus tiksliai sureguliuotumėte rezultatą.
- Naudingi užsakymai: „padarykite kadrą nespalvotą“, „pašalinkite objektą iš fono“, „pakeiskite foną į miesto peizažą“ arba „pritaikykite šio vaizdo stilių šiai suknelei“.
Jei norite patvirtinti, kad naudojate teisingą modelį iš kūrėjo aplinkos, „Google AI Studio“ siūlo tiesioginį kontroliuojamo testavimo srautą su „Gemini 2.5“ blykstės vaizdo peržiūra.
- Prisijunkite prie „Google AI Studio“.
- Pasirinkite modelį „gemini-2.5-flash-image-preview“ selektoriuje.
- Įveskite tekstinius raginimus ir (arba) įkelkite vaizdus, kad matytumėte redagavimus realiuoju laiku., su kelių pamainų redagavimo palaikymu.
Nors elgesys pagerėjo nuoseklumo ir fotorealizmo požiūriu, verta prisiminti, kad Teksto atvaizdavimas vaizduose arba tam tikri sudėtingi atspindžiai dar gali būti ne tobuli.Vis dėlto kalbos valdomas redagavimas ir vandenženkliai suteikia įdomią pusiausvyrą tarp kūrybinės kontrolės ir atsakomybės.
Dėl pokalbių redagavimo, veikėjų nuoseklumo, greičio ir tokių apsaugos priemonių kaip „SynthID“ derinio, „Nano Banana“ yra universalus pasirinkimas kūrėjams, prekių ženklams ir vartotojams, norintiems koreguoti nuotraukas ar komponuoti scenas neapsunkinant savęs kaukėmis ir sluoksniais.: visa tai iš pačios „Gemini“ programos ir su srautu, kuris skatina iteraciją, kol randama versija, kuri geriausiai atitinka pradinę idėją.
Esu technologijų entuziastas, savo „geek“ pomėgius pavertęs profesija. Daugiau nei 10 savo gyvenimo metų praleidau naudodamas pažangiausias technologijas ir iš gryno smalsumo kūriau visas programas. Dabar aš specializuojasi kompiuterinėse technologijose ir vaizdo žaidimuose. Taip yra todėl, kad daugiau nei 5 metus rašau įvairioms interneto svetainėms apie technologijas ir vaizdo žaidimus, kurdamas straipsnius, kuriuose noriu pateikti jums reikalingą informaciją visiems suprantama kalba.
Jei turite klausimų, mano žinios svyruoja nuo visko, kas susiję su Windows operacine sistema, taip pat su Android mobiliesiems telefonams. Ir aš įsipareigoju jums, aš visada pasiruošęs skirti kelias minutes ir padėti jums išspręsti visus klausimus, kurie jums gali kilti šiame interneto pasaulyje.
