- OpenAI veröffentlicht gpt-oss-120b und gpt-oss-20b als Sprachmodelle mit offenen Gewichten, die unter der Apache 2.0-Lizenz lizenziert sind.
- Sie ermöglichen die lokale Ausführung, Anpassung und kommerzielle Nutzung und bieten eine Leistung, die an proprietäre Modelle wie o3 und o4-mini heranreicht.
- Konzentriert sich auf fortgeschrittenes Denken, Kettendenken und Unterstützung für autonome Tools.
- Sicherheit hat Priorität, mit unabhängigen Überprüfungen und Protokollen gegen böswillige Nutzung.

OpenAI hat seine Strategie geändert und hat gpt-oss-120b zusammen mit gpt-oss-20b eingeführt, die ersten Sprachmodelle von offene Gewichte die es seit über fünf Jahren veröffentlicht hat. Diese Veröffentlichung markiert einen Bruch mit der Politik des Unternehmens, geschlossene Entwicklungen durchzuführen, und öffnet die Tür zu Entwickler, Unternehmen und Einzelpersonen können fortschrittliche KI nutzen, ohne auf proprietäre Dienste angewiesen zu sein oder große Kosten zu verursachen.
Beide Modelle sind ab sofort erhältlich in kostenlos auf der Hugging Face-Plattform und werden unter der Apache 2.0-Lizenz vertrieben. Dies ermöglicht jedem Benutzer Führen Sie sie lokal aus, passen Sie sie an bestimmte Aufgaben an, integrieren Sie sie in Ihre eigene Software und verwenden Sie sie sogar für kommerzielle Zwecke, ohne zusätzliche Kosten oder Einschränkungen. OpenAI betont, dass mit dieser Bewegung Ziel ist es, künstliche Intelligenz weltweit zugänglicher zu machen und Innovationen im Rahmen von Transparenz und Rechenschaftspflicht zu fördern..
Wichtige technische Merkmale von gpt-oss-120b

Das Modell gpt-oss-120b zeichnet sich durch seine Architektur aus, die auf einem „Mixture-of-Experts“ (MoE) basiert., sodass Sie Folgendes verwalten können: 117.000 Milliarden Parameter Mit bemerkenswerter Effizienz: Pro verarbeitetem Token werden nur 5.100 Milliarden Token aktiviert. Dadurch kann es trotz seiner Größe auf einer einzigen 80-GB-GPU ausgeführt werden, eine erschwingliche Voraussetzung für Forschungszentren und Unternehmen mit mäßig fortgeschrittenen Ressourcen. Die Variante gpt-oss-20b hingegen ist auf Geräte mit weniger Speicher ausgerichtet und kann auf Consumer-Hardware und sogar Laptops mit 16 GB RAM ausgeführt werden.
In beiden Fällen fortgeschrittene Argumentation wurde gewählt Dabei kommt die Technik der Gedankenkette zum Einsatz, die es ermöglicht, jede Antwort in erklärende Zwischenschritte zu zerlegen. Die Modelle werden mit MINT-fokussierten Daten trainiert, Programmierung und allgemeine Kenntnisse, die ihnen eine solide Grundlage für komplexe Aufgaben und die Verwendung bestimmter Tools, wie z. B. Websuche oder Ausführen von Python-Code.
Leistung und praktische Anwendungen
Vergleichstests zeigen, dass gpt-oss-120b nähert sich dem Niveau von o4-mini und übertrifft OpenAIs o3-mini bei den meisten Programmier-, Wettbewerbsmathematik- und Gesundheitsaufgaben. Das leichtere Modell gpt-oss-20b kann mit Lösungen von Drittanbietern wie DeepSeek R1 konkurrieren und übertrifft einige Benchmarks bei bestimmten Aufgaben, insbesondere auf Edge-Geräten.
Eine weitere Stärke ist die Anpassungsfähigkeit: Der Benutzer kann den Grad des Denkens (niedrig, mittel oder hoch) je nach Aufgabe anpassen, Dadurch wird Latenz und Genauigkeit ausgeglichenDiese Konfiguration sowie die Option, Modelle offline und hinter einer Firewall auszuführen, ist besonders in Unternehmensumgebungen mit Datenschutzbeschränkungen oder Prüfanforderungen nützlich.
Sicherheit, Auditing und Community
OpenAI hat besondere Aufmerksamkeit auf die Sicherheit und Risikominderung in diesen Modellen, verzögert ihre Veröffentlichung, um sie strengen internen und externen Bewertungen zu unterziehen. Sie haben Integrierte Filter und Ausrichtungsprotokolle zur Vermeidung von Missbrauch, wie etwa die Generierung sensibler Informationen oder Identitätsdiebstahl in Bereichen wie Cybersicherheit oder Biotechnologie.
Zusätzlich Das Unternehmen hat die Community eingeladen, an Red-Teaming-Herausforderungen teilzunehmen, ausgestattet mit einem 500.000-Dollar-Fonds zur Förderung der Erkennung neuer Schwachstellen und aufkommende Bedrohungen.
Was die Einschränkungen betrifft, OpenAI erkennt, dass, trotz seiner fortschrittlichen Architektur, Bei offenen Modellen kann die „Halluzinationsrate“ etwas höher sein als bei ihren proprietären Gegenstücken., und das Training wurde hauptsächlich mit englischen Daten durchgeführt. Die vorhandene Dokumentation und die Kontrollen erleichtern jedoch die Prüfung und kontinuierliche Anpassung dieser Modelle, und fördert eine verantwortungsvolle und sichere Nutzung innerhalb des globalen KI-Ökosystems.
Integrations-, Lizenzierungs- und Einführungsaussichten
Die Gewichte für beide Modelle werden im MXFP4-Format angeboten. Referenzimplementierungen existieren bereits für PyTorch, Apple Metal und bieten verbesserte Unterstützung für Plattformen wie Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten und Cloudflare. Die Apache 2.0-Lizenz erlaubt extrem flexibler Einsatz, einschließlich der Möglichkeit der Monetarisierung, Weiterverteilung und Integration in Tools von Drittanbietern.
Für die spanische und europäische Geschäftswelt eröffnet die Einführung von gpt-oss-120b und gpt-oss-20b neue Möglichkeiten für Analysen automatisieren, intelligente Assistenten entwickeln y Behalten Sie die Kontrolle über Ihre Daten innerhalb ihrer eigenen Infrastrukturen, während gleichzeitig Kosten gesenkt und Innovationszyklen beschleunigt werden. Angesichts der potenziellen Bedeutung künstlicher Intelligenz in verschiedenen Sektoren, Mit diesen Tools können Sie im Bereich KI experimentieren und forschen, ohne auf externe APIs oder restriktive Lizenzen angewiesen zu sein., und fördert die eigene technologische Entwicklung.
Dieser Fortschritt ermöglicht es den Akteuren des Technologiesektors, auf offenere, transparentere und anpassungsfähigere Tools zuzugreifen und so ein kollaborativeres und verantwortungsvolleres Innovationsökosystem zu fördern.
Ich bin ein Technik-Enthusiast, der seine „Geek“-Interessen zum Beruf gemacht hat. Ich habe mehr als 10 Jahre meines Lebens damit verbracht, modernste Technologie zu nutzen und aus purer Neugier an allen möglichen Programmen herumzubasteln. Mittlerweile habe ich mich auf Computertechnik und Videospiele spezialisiert. Das liegt daran, dass ich seit mehr als fünf Jahren für verschiedene Websites zum Thema Technologie und Videospiele schreibe und Artikel erstelle, die Ihnen die Informationen, die Sie benötigen, in einer für jeden verständlichen Sprache vermitteln möchten.
Bei Fragen reicht mein Wissen von allem rund um das Windows-Betriebssystem bis hin zu Android für Mobiltelefone. Und mein Engagement gilt Ihnen, ich bin immer bereit, ein paar Minuten zu investieren und Ihnen bei der Lösung aller Fragen in dieser Internetwelt zu helfen.
