- „Nano Banana” to nazwa kodowa Gemini 2.5 Flash Image, nowego modelu Google’a służącego do generowania i edycji obrazów.
- Umożliwia edycję konwersacyjną, zachowuje spójność między osobami i obiektami oraz łączy obrazy z instrukcjami w języku naturalnym.
- Zawiera SynthID jako niewidoczny znak wodny oraz filtry dla wrażliwych treści i osób publicznych.
- Można przetestować tę funkcję w aplikacji Gemini i w Google AI Studio, korzystając z modelu gemini-2.5-flash-image-preview.

Po tygodniach spekulacji, pseudonim «Nano Banan» przestaje być tajemnicą:odpowiada Nowy silnik graficzny Google'a został oficjalnie zaprezentowany jako Gemini 2.5 Obraz FlashFirma wprowadza funkcję łączącą generowanie i edycję z podejściem konwersacyjnym, którego celem jest zmniejszenie tarć w procesie twórczym.
Model ten ma konkurować z generatorami takimi jak Midjourney i tradycyjnymi edytorami takimi jak Photoshop, wzmocnionymi ulepszeniami spójność między ujęciami, zachowanie funkcji i szybkość reakcji, którą Google określa jako „błyskawiczną”. Ponadto Jest zintegrowany z aplikacją Gemini i dostępny poprzez API oraz w Google AI Studio..
Czym jest „Nano Banana” i co zapewnia?

„Nano Banana” to wewnętrzna nazwa modelu, który stanowi ewolucję skoncentrowaną na edycji sterowanej tekstem i wysoce kontrolowanym generowaniu. System rozumie naturalne instrukcje i wprowadza zmiany do tego samego obrazu, nie zmuszając użytkownika do rozpoczynania pracy od nowa za każdym razem.
Jednym z jego kluczy jest spójność wizualna:Podczas edycji zdjęcia twarz, poza i oświetlenie obiektu pozostają spójne w różnych wersjach. redukuje zniekształcenia lub skoki perspektywy które nadal pojawiają się w innych silnikach w złożonych scenariuszach.
El Fotorealizm robi krok naprzód dzięki bardziej wiarygodnym teksturom i oświetleniu, a Google twierdzi, że dokonał konkretnych postępów w zakresie twarzy i dłoni, dwóch tradycyjnie delikatnych obszarów sztucznej inteligencji w obrazach. Model ten również wyróżnia się szybkością, co umożliwia skrócenie cykli testowania i udoskonalania.
W testach porównawczych społeczności, takich jak LM Arena, „Nano Banana” pojawia się wśród najlepiej oceniany w edycji doświadczeń użytkownika, napędzanej równowagą między jakością, kontrolą i szybkością reakcji.
Kluczowe funkcje edycji i generowania
- Edycja konwersacyjna:nawiązuje dialog z obrazem i żąda iteracyjnych korekt (np. wzmocnienia nieba, zmiany koloru samochodu lub dodania obiektu).
- Wybór lokalny i retusz: Wybierz konkretne obszary, aby usunąć elementy, zmodyfikować tło lub dostosować oświetlenie i kolor bez wpływu na resztę.
- Skład i mieszanie:Łączy wiele zdjęć w jedną scenę i stosuje styl jednego obrazu do obiektów na innym obrazie.
- Spójność postaci: Zachowuje podobieństwo między wersjami tej samej osoby, zwierzaka lub obiektu podczas wielu edycji.
Oprócz elastyczności kreatywnej Google dodaje warstwę bezpieczeństwa:Wszystkie wygenerowane lub edytowane obrazy zawierają SynthID, niewidoczny, osadzony znak wodny, który jest odporny na transformację i umożliwia sprawdzenie, czy treść została utworzona lub zmieniona przez sztuczną inteligencję.
System zawiera filtry zapobiegające generowaniu lub manipulowaniu poufne treści (przemoc, nagość) i blokuje edycję znanych osób. Jeśli użytkownik prześle prawdziwe zdjęcie do edycji, mechanizmy bezpieczeństwa próbują zapobiec żądaniom, które mogłyby prowadzić do deepfake'ów.
W praktyce oznacza to mniej czasu marnowanego na testy techniczne i większe skupienie się na efekcie kreatywnym: Polecenia języka naturalnego stają się działaniami na scenie z większą precyzją semantyczną i poszanowaniem skali, głębi i stylu.
Jak używać Nano Banana w aplikacji Gemini i AI Studio

Doświadczenie Jest zintegrowany z interfejsem Gemini, bez potrzeby dodatkowego oprogramowania. W wielu przypadkach Możesz z tego skorzystać nawet w Darmowa wersja, w zależności od wdrożenia w Twoim regionie i koncie.
- W aplikacji lub na stronie internetowej Gemini: Przystąp do gemini.google.com/app (o aplikacja mobilna), wybierz dostępny szablon i przejdź do „Utwórz obrazy” w „Narzędzia”.
- Wygeneruj lub edytuj: Wpisz monit, aby utworzyć plik od podstaw lub przesłać zdjęcie do edycji. Możesz dodać instrukcje łańcuchowe, aby dopracować wynik w kolejnych rundach.
- Przydatne zamówienia: „zmień zdjęcie na czarno-białe”, „usuń obiekt z tła”, „zmień tło na panoramę miasta” lub „zastosuj styl tego zdjęcia do tej sukienki”.
Jeśli wolisz sprawdzić, czy używasz prawidłowego modelu ze środowiska programistycznego, Google AI Studio oferuje bezpośredni przepływ do kontrolowanych testów z gemini-2.5-flash-image-preview.
- Zaloguj się do Google AI Studio.
- Wybierz model „gemini-2.5-flash-image-preview” w selektorze.
- Wprowadź tekst podpowiedzi i/lub prześlij obrazy, aby na bieżąco obserwować zmiany., ze wsparciem edycji wielozmianowej.
Choć zachowanie poprawiło się pod względem spójności i fotorealizmu, warto pamiętać, że Reprezentacja tekstu na obrazach lub w niektórych złożonych odbiciach może jeszcze nie być idealnaMimo wszystko edycja uwzględniająca język tekstu i stosowanie znaków wodnych zapewniają interesującą równowagę między kontrolą kreatywną a odpowiedzialnością.
Dzięki połączeniu edycji konwersacyjnej, spójności postaci, szybkości i zabezpieczeń, takich jak SynthID, „Nano Banana” to wszechstronne rozwiązanie dla twórców, marek i użytkowników, którzy chcą modyfikować zdjęcia lub komponować sceny bez zbędnych komplikacji związanych z maskami i warstwami.:wszystko pochodzi od samego Gemini i ma charakter zachęcający do iteracji, aż do znalezienia wersji, która najlepiej pasuje do pierwotnego pomysłu.
Jestem entuzjastą technologii, który swoje „geekowskie” zainteresowania przekształcił w zawód. Spędziłem ponad 10 lat mojego życia, korzystając z najnowocześniejszych technologii i majsterkując przy wszelkiego rodzaju programach z czystej ciekawości. Teraz specjalizuję się w technologii komputerowej i grach wideo. Dzieje się tak dlatego, że od ponad 5 lat piszę dla różnych serwisów poświęconych technologii i grom wideo, tworząc artykuły, których celem jest dostarczenie potrzebnych informacji w języku zrozumiałym dla każdego.
Jeśli masz jakieś pytania, moja wiedza obejmuje wszystko, co jest związane z systemem operacyjnym Windows, a także Androidem dla telefonów komórkowych. Moje zaangażowanie jest wobec Ciebie. Zawsze jestem gotowy poświęcić kilka minut i pomóc Ci rozwiązać wszelkie pytania, jakie możesz mieć w tym internetowym świecie.
