Google stellt Gemini 2.5 Flash-Lite vor: das schnellste und effizienteste Modell seiner KI-Familie

Letzte Aktualisierung: 24/06/2025

  • Gemini 2.5 Flash-Lite zeichnet sich durch Geschwindigkeit und niedrige Kosten aus
  • Das Modell eignet sich ideal für umfangreiche Aufgaben mit geringer Latenz wie Übersetzung und Klassifizierung.
  • Es befindet sich in der Vorschauphase, während Flash und Pro allgemein verfügbar werden.
  • Es bietet multimodale Integration und deutlich niedrigere Preise als Vorgängermodelle.
Gemini 2.5 Flash-Lite

Google erweitert sein Angebot an Modellen für künstliche Intelligenz mit der Einführung von Gemini 2.5 Flash-Lite weiter, ein Modell, das auf maximale Kosteneffizienz und Geschwindigkeit setzt. In den letzten Tagen gab das Unternehmen die allgemeine Verfügbarkeit seiner 2.5 Pro- und Flash-Modelle bekannt, während Flash-Lite im Vorschauformat für Entwickler und Unternehmen eingeführt wird, die an agilen und kostengünstigen Lösungen interessiert sind.

Diese Bewegung reagiert auf die wachsende Nachfrage nach Modellen, die kombinieren hohes Verarbeitungsvolumen und geringe Latenz, wodurch Aufgaben wie Übersetzungen, Datenklassifizierung oder alle Vorgänge, bei denen es auf Geschwindigkeit ankommt, erleichtert werden, ohne das Budget zu gefährden. Flash-Lite ist die bevorzugte Option für alle, die große Mengen an Informationen schnell und zu wettbewerbsfähigen Preisen, ohne dass dabei immer auf die maximale Denkleistung der Zwillingsfamilie zurückgegriffen werden muss.

Flash-Lite: Geminis schnellstes und günstigstes Modell

Zwillinge 2.5

Die neue Version Gemini 2.5 Flash-Lite übertrifft seinen Vorgänger (2.0 Flash-Lite) deutlich in Programmierung, Mathematik, Naturwissenschaften, logischem Denken und multimodalen Aufgaben-Benchmarks. Laut Google ist dieses Modell besonders effektiv bei massiven Dateneingabeszenarien, wie z. B. bei der Übersetzung langer Texte oder der Klassifizierung im großen Maßstab, mit Ergebnissen überlegen in Geschwindigkeit und Qualität im Vergleich zu anderen Vorschlägen in der Serie.

Exklusiver Inhalt – Klicken Sie hier  So verlassen Sie eine Klasse in Google Classroom

Auch die Latenz, ein weiterer entscheidender Parameter bei Echtzeitanwendungen, ist Minimum in Flash-Lite, übertrifft frühere Versionen in der Geschwindigkeit und positioniert sich als bevorzugte Option für diejenigen, die Wert auf Unmittelbarkeit legen.

Technische Funktionen und Verbesserungen im Vergleich zu Vorgängerversionen

Gemini 2.5 Flash Lite 0

Gemini 2.5 Flash-Lite behält viele der erweiterten Funktionen der Familie bei: multimodale Unterstützung (Text, Bild, Video und sogar Audio), Integration mit wichtigen Tools wie der Google-Suche, Codeausführung oder Kontexte mit bis zu einer Million Token. Darüber hinaus maximiert die Expert-Mixing-Architektur von Gemini 2.5 die Effizienz, indem sie für jede Abfrage nur das erforderliche neuronale Netzwerk aktiviert und so den Ressourcenverbrauch reduziert.

Ein weiterer entscheidender Vorteil ist die Kontrolle des „Denkbudgets“ Über einen API-Parameter können Entwickler entscheiden, in welchem ​​Umfang das Modell seine Argumentationsfähigkeiten für jede Aufgabe nutzen soll. In Flash-Lite ist diese Funktion standardmäßig deaktiviert, um ein optimales Verhältnis zwischen Geschwindigkeit und Kosten zu erreichen. Sie kann jedoch jederzeit aktiviert werden, wenn Genauigkeit Priorität hat.

Exklusiver Inhalt – Klicken Sie hier  Ein Paar fuhr mehr als drei Stunden, um einen Ort zu sehen, den es nicht gibt: KI generiert bereits gefälschte Touristenziele.

Die neuesten internen Benchmarks Die Ergebnisse von Flash-Lite sind hervorragend: 86,8 % in FACTS Grounding, 84,5 % in Multilingual MMLU und ebenso konkurrenzfähige Werte im visuellen VerständnisDiese Messwerte bestätigen seine Eignung für Anwendungen, bei denen Genauigkeit und Geschwindigkeit den Unterschied ausmachen.

Fotos bearbeiten Gemini Flash-4
Verwandte Artikel:
So bearbeiten Sie Fotos mit Gemini Flash 2.0 ohne Bearbeitungskenntnisse

Aktualisierte Verfügbarkeit und Preise für die Gemini-Familie

Zusätzlich zur Einführung von Flash-Lite, Gemini 2.5 Pro und Flash sind jetzt allgemein verfügbar, nachdem die Testphase bestanden wurde. Google hat die Gelegenheit genutzt, Vereinfachung des Preissystems durch Beseitigung der bisherigen Unterscheidung zwischen denkenden und nicht denkenden Tarifen, was bei den Entwicklern für Verwirrung sorgte. Nun, Das Flash-Modell berechnet 0,30 $ pro Million Eingabetoken für Text, Bilder und Videos und 2,50 $ pro Million Ausgabetoken., mit separaten Preisen für Audio.

Bei Flash-Lite sind die Preise noch stärker angepasst, etabliert sich als Einstiegsmodell für diejenigen, die große Datenmengen verarbeiten, aber keine maximale Komplexität im automatischen Denken benötigen.

Exklusiver Inhalt – Klicken Sie hier  So ändern Sie das Passwort bei Google Pixel 4a

Anwendungsfälle und Zugriff auf das Flash-Lite-Modell

Gemini 2.5 Flash-Lite Google AI Studio

Google richtet sich an Entwickler und Unternehmen mit Bedarf Massenübersetzung, Datenklassifizierung und groß angelegte Analyse sind die Hauptnutznießer von Flash-Lite. Das Modell eignet sich auch für die automatisierte Informationsorganisation, die Verarbeitung multimedialer Inhalte und Vorgänge, bei denen jede Millisekunde zählt, wie beispielsweise die sofortige Reaktion in Kundenservice-Tools oder Warn- und Überwachungssystemen.

Gemini 2.5 Flash-Lite ist jetzt verfügbar im Vorschaumodus verfügbar durch Google AI Studio und Vertex AIDie Flash- und Pro-Modelle können in diesen Diensten und in der Gemini-App verwendet werden. Alle diese Optionen ermöglichen es Ihnen, das Budget anzupassen und sich an das Profil jedes Projekts oder Bedarfs anzupassen.

Google möchte anbieten Lösungen für jedes Publikum und jedes Budgetund integriert diese Modelle sowohl in seine Suchmaschine AI Overviews als auch in Produktivitätsprodukte wie Meet, Docs und Sheets. Mit der Einführung von Flash Lite erweitert Google die Palette der verfügbaren Optionen und macht generative KI für Aufgaben, bei denen Volumen, Geschwindigkeit und Preis entscheidende Faktoren sind, noch einfacher zugänglich.

Verwandte Artikel:
Mit Gemini Flash 2.0 können Sie sehen, wie ein Kleidungsstück an jedem aussehen würde.