- „Nano Banana“ ist der Codename für Gemini 2.5 Flash Image, Googles neues Modell zum Erstellen und Bearbeiten von Bildern.
- Es ermöglicht die Bearbeitung im Dialogmodus, wahrt die Konsistenz zwischen Personen und Objekten und kombiniert Bilder mit Anweisungen in natürlicher Sprache.
- Enthält SynthID als unsichtbares Wasserzeichen und Filter für sensible Inhalte und Personen des öffentlichen Lebens.
- Sie können es in der Gemini-App und in Google AI Studio mit dem Modell gemini-2.5-flash-image-preview testen.

Nach wochenlangen Spekulationen wurde der Spitzname «Nano-Banane» hört auf, ein Mysterium zu sein: entspricht Googles neue Bild-Engine, offiziell vorgestellt als Zwillinge 2.5 Flash-BildDas Unternehmen aktiviert eine Funktion, die Generierung und Bearbeitung mit einem Konversationsansatz kombiniert, der Reibungsverluste im kreativen Fluss reduzieren soll.
Das Modell kommt, um mit Generatoren wie Midjourney und mit traditionellen Editoren wie Photoshop zu konkurrieren, verstärkt durch Verbesserungen in Konsistenz zwischen den Aufnahmen, Funktionserhalt und eine Reaktionsgeschwindigkeit, die Google als „blitzschnell“ beschreibt. Darüber hinaus Es ist in die Gemini-App integriert und über APIs und in Google AI Studio verfügbar..
Was ist „Nano Banana“ und was bietet es?

„Nano Banana“ ist der interne Name des Modells, einer Weiterentwicklung, die sich auf textgeführte Bearbeitung und hochkontrollierte Generierung konzentriert. Das System versteht natürliche Anweisungen und wendet Änderungen auf dasselbe Bild an, ohne dass Sie jedes Mal von vorne beginnen müssen.
Einer seiner Schlüssel ist visuelle Konsistenz: Wenn Sie ein Foto bearbeiten, bleiben Gesicht, Pose und Beleuchtung des Motivs zwischen den Versionen gleich. Dies reduziert Verzerrungen oder Perspektivsprünge die in komplexen Szenarien auch in anderen Engines noch vorkommen.
El Der Fotorealismus macht einen Schritt nach vorne mit glaubwürdigeren Texturen und Beleuchtung, und Google behauptet konkrete Fortschritte bei Gesichtern und Händen, zwei traditionell heiklen Bereichen der Bild-KI. Das Modell auch zeichnet sich durch seine Geschwindigkeit aus, was kürzere Test- und Verbesserungszyklen ermöglicht.
In Community-Benchmarkings, wie dem von LM Arena, erscheint "Nano Banana" unter den am besten bewertet in der Bearbeitung der Benutzererfahrung, angetrieben durch die Balance zwischen Qualität, Kontrolle und Reaktionsgeschwindigkeit.
Wichtige Bearbeitungs- und Generierungsfunktionen
- Konversationsbearbeitung: Dialog mit dem Bild und fordert iterative Anpassungen an (z. B. Intensivierung des Himmels, Änderung der Farbe eines Autos oder Hinzufügen eines Objekts).
- Lokale Auswahl und Retusche: Wählen Sie bestimmte Bereiche aus, um Elemente zu löschen, den Hintergrund zu ändern oder Beleuchtung und Farbe anzupassen, ohne den Rest zu beeinträchtigen.
- Zusammensetzung und Mischung: Kombiniert mehrere Fotos zu einer einzigen Szene und wendet den Stil eines Bildes auf Objekte in einem anderen an.
- Charakterkohärenz: Behält die Ähnlichkeit zwischen Versionen derselben Person, desselben Haustiers oder Objekts über mehrere Bearbeitungen hinweg bei.
Zusätzlich zur kreativen Flexibilität fügt Google eine Sicherheitsebene hinzu: Alle generierten oder bearbeiteten Bilder enthalten SynthID, ein nicht wahrnehmbares eingebettetes Wasserzeichen, das Transformationen widersteht und es Ihnen ermöglicht zu überprüfen, ob Inhalte von KI erstellt oder geändert wurden.
Das System enthält Filter, um die Generierung oder Manipulation von sensible Inhalte (Gewalt, explizite Nacktheit) und blockiert die Bearbeitung berühmter Personen. Wenn der Benutzer ein echtes Foto hochlädt, das bearbeitet werden soll, versuchen Sicherheitsmechanismen, Anfragen zu verhindern, die zu Deepfakes führen könnten.
In der Praxis bedeutet dies, dass weniger Zeit mit technischen Tests verschwendet wird und man sich stärker auf das kreative Ergebnis konzentrieren kann: Natürliche Sprachbefehle werden zu Aktionen vor Ort mit größerer semantischer Präzision und Respekt für Maßstab, Tiefe und Stil.
So verwenden Sie Nano Banana in der Gemini-App und im AI Studio

Erfahrung Es ist in die Gemini-Schnittstelle integriert, ohne dass zusätzliche Software erforderlich ist. In vielen Fällen Sie können davon profitieren, auch in der kostenlose Version, abhängig von der Bereitstellung in Ihrer Region und Ihrem Konto.
- In der Gemini-App oder -Website: Zustimmen gemini.google.com/app (o die mobile App), wählen Sie die vorhandene Vorlage aus und gehen Sie unter „Tools“ auf „Bilder erstellen“.
- Generieren oder bearbeiten: Geben Sie eine Eingabeaufforderung ein, um von Grund auf neu zu erstellen, oder laden Sie ein Foto zum Bearbeiten hoch. Sie können verkettete Anweisungen hinzufügen, um das Ergebnis über mehrere Runden hinweg zu optimieren.
- Nützliche Bestellungen: „Machen Sie die Aufnahme schwarzweiß“, „Entfernen Sie das Objekt aus dem Hintergrund“, „Ändern Sie den Hintergrund in eine Stadtlandschaft“ oder „Wenden Sie den Stil dieses Bildes auf dieses Kleid an“.
Wenn Sie lieber überprüfen möchten, ob Sie das richtige Modell aus der Entwicklerumgebung verwenden, bietet Google AI Studio einen direkten Ablauf für kontrollierte Tests mit Gemini-2.5-Flash-Bildvorschau.
- Bei Google AI Studio anmelden.
- Wählen Sie das Modell „gemini-2.5-flash-image-preview“ im Selektor.
- Geben Sie Textaufforderungen ein und/oder laden Sie Bilder hoch, um Änderungen in Echtzeit zu sehen., mit Unterstützung für die Bearbeitung im Mehrschichtbetrieb.
Obwohl sich das Verhalten in Bezug auf Konsistenz und Fotorealismus verbessert hat, sollte man bedenken, dass Die Darstellung von Text in Bildern oder bestimmten komplexen Reflexionen ist möglicherweise noch nicht perfektDennoch bieten sprachgesteuerte Bearbeitung und Wasserzeichen ein interessantes Gleichgewicht zwischen kreativer Kontrolle und Verantwortung.
Mit seiner Kombination aus Konversationsbearbeitung, Zeichenkonsistenz, Geschwindigkeit und Sicherheitsvorkehrungen wie SynthID, „Nano Banana“ eignet sich als vielseitige Option für Kreative, Marken und Benutzer, die Fotos anpassen oder Szenen komponieren möchten, ohne sich mit Masken und Ebenen herumschlagen zu müssen.: alles von Gemini selbst und mit einem Flow, der Iterationen fördert, bis die Version gefunden ist, die am besten zur ursprünglichen Idee passt.
Ich bin ein Technik-Enthusiast, der seine „Geek“-Interessen zum Beruf gemacht hat. Ich habe mehr als 10 Jahre meines Lebens damit verbracht, modernste Technologie zu nutzen und aus purer Neugier an allen möglichen Programmen herumzubasteln. Mittlerweile habe ich mich auf Computertechnik und Videospiele spezialisiert. Das liegt daran, dass ich seit mehr als fünf Jahren für verschiedene Websites zum Thema Technologie und Videospiele schreibe und Artikel erstelle, die Ihnen die Informationen, die Sie benötigen, in einer für jeden verständlichen Sprache vermitteln möchten.
Bei Fragen reicht mein Wissen von allem rund um das Windows-Betriebssystem bis hin zu Android für Mobiltelefone. Und mein Engagement gilt Ihnen, ich bin immer bereit, ein paar Minuten zu investieren und Ihnen bei der Lösung aller Fragen in dieser Internetwelt zu helfen.
