Gemma 3n: Googles neues Projekt bringt fortschrittliche KI auf jedes Gerät

Letzte Aktualisierung: 03.10.2023

  • Gemma 3n ist ein offenes, effizientes, multimodales KI-Modell, das für die lokale Ausführung sogar auf Mobilgeräten mit nur 2 GB RAM konzipiert ist.
  • Es ermöglicht die Verarbeitung von Text, Bildern, Audio und Video ohne Internetverbindung und legt dabei Wert auf Datenschutz und geringen Ressourcenverbrauch.
  • Es umfasst Innovationen wie MatFormer und Per Layer Embeddings, die die Effizienz und Anpassungsfähigkeit des Modells je nach Gerät verbessern.
  • Es steht Entwicklern auf Plattformen wie Google AI Studio, Hugging Face und Kaggle zur Verfügung und übertrifft andere mobile KIs hinsichtlich multimodaler Fähigkeiten und Offline-Ausführung.

Gemma 3n

Google hat einen bedeutenden Schritt in der Welt der künstlichen Intelligenz gemacht mit der Start von Gemma 3n, ein Open-Source-KI-Modell, das speziell für den Einsatz auf Geräten mit begrenzten Ressourcen entwickelt wurde. Dieser Vorschlag, der Es kann jetzt heruntergeladen und auf Mobiltelefonen, Tablets und Laptops installiert werden., supone Die Ankunft multimodaler KI in Ihrer Handfläche, selbst auf Geräten mit nur 2 GB RAM und ohne Internetverbindung. Sein Erscheinen erfolgt nach seiner Präsentation während der letzte Google I/Ound hat die Aufmerksamkeit von Entwicklern und Benutzern auf sich gezogen, die nach lokalen, privaten und effizienten KI-Lösungen suchen.

Dieses neue Modell basiert auf dem Ziel, Demokratisieren Sie den Zugriff auf fortschrittliche Tools der künstlichen Intelligenz, ohne auf Cloud-Server angewiesen zu seinDamit grenzt Google Gemma 3n deutlich von Alternativen wie Gemini ab, die einen geschlossenen Ansatz verfolgen und eher auf den Massenkonsum ausgerichtet sind. Bei Gemma liegt der Fokus auf offener Entwicklung sowie der Erforschung und personalisierten Nutzung von KI, die heruntergeladen, modifiziert und in eine Vielzahl von Anwendungen integriert werden kann.

Exklusiver Inhalt – Klicken Sie hier  So löschen Sie eine geschützte Zelle in Google Sheets

Multimodalität und herausragende Effizienz

Gemma 3n zeichnet sich besonders durch seine Multimodalität aus, es decir, kann Text, Bilder, Audio und Video interpretieren und generieren direkt vom Gerät aus, ohne auf die Cloud zurückgreifen zu müssen. Zu den Kernfunktionen gehören Spracherkennung, Transkription, Übersetzung und visuelle Echtzeitanalyse. Dadurch eignet es sich hervorragend für Bildungsaufgaben, persönliche Assistenten oder Übersetzungssysteme.

Die Architektur, auf der es basiert, genannt MatFormerermöglicht die Unterteilung des Modells in kleinere Versionen, die in eine Hauptversion integriert sind, wie eine Matrjoschka. Dank dieser Struktur Gemma 3n kann Ressourcen besser verwalten und sich an die Einschränkungen der Hardware anpassen, auf der es ausgeführt wird.. Darüber hinaus beinhaltet es die Technik Per Layer Embeddings (PLE), Das reduziert die Speichernutzung ohne Leistungseinbußen, sodass es auch auf Geräten mit bescheidenen Spezifikationen ausgeführt werden kann.

Gemma 3n wird in zwei Hauptvarianten angeboten: E2B y E4Bmit 2.000 bzw. 4.000 Milliarden effektiven Parametern. Dank ihres Designs können beide Modelle jedoch mit einem Speicherbedarf betrieben werden, der dem deutlich kleinerer Modelle entspricht. Dies öffnet die Tür zu fortschrittlicher KI auf herkömmlichen Geräten der unteren und mittleren Preisklasse.

Exklusiver Inhalt – Klicken Sie hier  So kündigen Sie Google One

Para el Bild- und VideoverarbeitungGemma 3n verwendet den Encoder MobileNet-V5, optimiert für einen reibungslosen Betrieb auch auf Mobilgeräten mit geringem Stromverbrauch. Auf neueren Modellen können Sie Videos mit 60 fps bearbeiten. Im Audiobereich ermöglicht es die lokale Transkription und sofortige Übersetzung von Stimmen.

Datenschutz, Leistung und Verfügbarkeit

Gemma 3n Lokale KI-Leistung

Das vollständige Offline-Arbeiten ist eine der großen Stärken von Gemma 3n. Es stellt sicher, dass alle von der KI verarbeiteten Daten auf dem Gerät selbst verbleiben, was die Privatsphäre der Nutzer im Vergleich zu anderen Cloud-basierten Lösungen stärkt. Diese Funktion führt auch zu höherer Energieeffizienz und geringerem Datenverbrauch – wichtige Faktoren bei mobilen Geräten und Umgebungen mit eingeschränkter Konnektivität.

En términos de rendimiento, Gemma 3n unterstützt 140 Sprachen für die Textverarbeitung und 35 Sprachen im multimodalen Modus.Es hat in Benchmarktests wie LMArena eine herausragende Leistung gezeigt, bei der das E4B-Modell 1.300 Punkte überschreitet und damit das erste Modell mit weniger als 10.000 Milliarden Parametern ist, das dieses Niveau erreicht.

Gemma 3n ist schon da disponible en múltiples plataformas para desarrolladores, wie Google AI Studio, Hugging Face, Kaggle und durch Tools wie Google AI Edge oder Ollama. Ihr offenes Design und ihre Integrationsflexibilität erleichtern die Entwicklung neuer, auf spezifische Bedürfnisse zugeschnittener Anwendungen, von Bildungssystemen über intelligente Assistenten bis hin zu Offline-Übersetzungstools.

Exklusiver Inhalt – Klicken Sie hier  So ändern Sie das Albumcover in Google Fotos

Vergleich mit anderen Alternativen und praktische Vorteile

Gemma 3n KI-Modell

Die Einführung von Gemma 3n erfolgt im Kontext der Entwicklung mobiler und Edge-KI, Weitere Vorschläge umfassen die Apple Neural Engine, Samsung Gauss sowie Modelle von Meta und Microsoft. Viele dieser Lösungen benötigen jedoch eine Serververbindung, bieten nur eingeschränkte Text- oder Bildfunktionen oder sind nicht für externe Entwicklungen offen. Gemma 3n Es setzt auf echte Multimodalität, Netzunabhängigkeit und Offenheit gegenüber der Community..

Die wichtigsten Vorteile für die Benutzer sind die Möglichkeit, Führen Sie fortschrittliche KI aus, ohne die Kontrolle über die Privatsphäre zu verlieren, genießen Sie sofortige Reaktion und reduzieren Sie die Kosten für die mobile Datennutzung. Für Hersteller und Entwickler bietet Gemma 3n Es bietet die Möglichkeit, intelligente Anwendungen auf ein viel breiteres Spektrum von Geräten zu bringen, ohne auf die neueste Hardware oder teure Speicher-Upgrades angewiesen zu sein..

Die Dynamik von Gemma 3n hat einige Hersteller sogar dazu motiviert, die RAM-Kapazität ihrer neuen Geräte zu erhöhen, da sie eine zukünftige massive Integration lokaler KI erwarten. Damit positioniert sich Google in einer relevanten Position im Rennen um Leistungsstarke, effiziente, offene und wirklich zugängliche künstliche Intelligenz.