OpenAI släpper gpt-oss-120b: deras hittills mest avancerade modell med öppna vikter.

Senaste uppdateringen: 07/08/2025
Författare: Alberto navarro

  • OpenAI släpper gpt-oss-120b och gpt-oss-20b som språkmodeller med öppna vikter licensierade under Apache 2.0-licensen.
  • De möjliggör lokal exekvering, anpassning, kommersiell användning och erbjuder prestanda som ligger nära proprietära modeller som o3 och o4-mini.
  • Fokuserad på avancerat resonemang, kedjetänkande och stöd för autonoma verktyg.
  • Säkerhet har varit en prioritet, med oberoende granskningar och protokoll mot skadlig användning.

Modell gpt-oss-120b

OpenAI har ändrat sin strategi och har introducerat gpt-oss-120b tillsammans med gpt-oss-20b, de första språkmodellerna för öppna vikter som den har publicerat på över fem år. Denna lansering markerar ett brott med företagets policy med stängda utvecklingar och öppnar dörren för utvecklare, företag och privatpersoner kan använda avancerad AI utan att förlita sig på proprietära tjänster eller ådra sig stora kostnader.

Båda modellerna finns nu tillgängliga i gratis på Hugging Face-plattformen och distribueras under Apache 2.0-licensen. Detta tillåter alla användare kör dem lokalt, anpassa dem till specifika uppgifter, integrera dem i din egen programvara och till och med använda dem för kommersiella ändamål, utan ytterligare betalning eller begränsningar. OpenAI betonar att med denna rörelse Den syftar till att göra artificiell intelligens mer tillgänglig globalt och främja innovation inom ett ramverk av transparens och ansvarsskyldighet..

Viktiga tekniska funktioner hos gpt-oss-120b

OpenAI Öppna Vikter

Modellen gpt-oss-120b utmärker sig genom sin arkitektur baserad på en "mixture-of-experts" (MoE), så att du kan hantera 117.000 miljarder parametrar Med anmärkningsvärd effektivitet: endast 5.100 miljarder tokens aktiveras per bearbetad token. Detta gör det möjligt, trots sin storlek, att köra på en enda 80 GB GPU, ett överkomligt krav för forskningscentra och företag med måttligt avancerade resurser. Varianten gpt-oss-20b riktar sig å andra sidan till enheter med mindre minne och kan köras på konsumenthårdvara och till och med bärbara datorer med 16 GB RAM.

Exklusivt innehåll - Klicka här  Vad är ett neuralt nätverk?

I båda fallen, avancerat resonemang har valts med hjälp av tankekedjans teknik, vilket gör att varje svar kan delas upp i förklarande mellansteg. Modellerna är tränade med STEM-fokuserade data, programmering och allmänkunskap, vilket ger dem en solid grund för komplexa uppgifter och användning av specifika verktyg, såsom webbsökning eller att köra Python-kod.

OpenAI modell med öppen vikt
Relaterad artikel:
OpenAI satsar på en "öppen vikt"-modell: så här kommer dess nya AI med avancerade resonemang att se ut.

Prestanda och praktiska tillämpningar

gpt oss 120b och 20b

Jämförande tester visar att gpt-oss-120b närmar sig nivån för o4-mini och överträffar OpenAIs o3-mini på de flesta programmerings-, tävlingsinriktade matematik- och sjukvårdsuppgifter. Modellen gpt-oss-20b, som är lättare, lyckas konkurrera med tredjepartslösningar som DeepSeek R1 och överträffar vissa riktmärken på specifika uppgifter, särskilt på edge-enheter.

En annan av dess starka sidor är dess anpassningsförmågaAnvändaren kan justera graden av resonemang (låg, medel eller hög) beroende på uppgiften, vilket balanserar latens och noggrannhetDen här konfigurationen, tillsammans med möjligheten att köra modeller offline och bakom en brandvägg, är särskilt användbar i företagsmiljöer med sekretessrestriktioner eller granskningsbehov.

Exklusivt innehåll - Klicka här  Hur man skapar bilder med Bing Image Creator steg för steg

Säkerhet, revision och community

OpenAI har ägnat särskild uppmärksamhet åt säkerhet och riskreducering i dessa modeller, och skjuter upp deras publicering för att utsätta dem för rigorösa interna och externa utvärderingar. De har Inbyggda filter och justeringsprotokoll för att förhindra felaktig användning, såsom generering av känslig information eller identitetsstöld inom områden som cybersäkerhet eller bioteknik.

Dessutom, Företaget har bjudit in allmänheten att delta i utmaningar med röda team, utrustad med en 500.000 XNUMX dollar i fond för att uppmuntra upptäckt av nya sårbarheter och framväxande hot.

När det gäller begränsningar, OpenAI inser att, trots sin avancerade arkitektur, Öppna modeller kan ha något högre "hallucinationsfrekvenser" än sina proprietära motsvarigheter., och dess utbildning har huvudsakligen genomförts med engelskspråkig data. Dokumentationen och kontrollerna som finns underlättar dock revision och kontinuerlig justering av dessa modeller, främjar ansvarsfull och säker användning inom det globala AI-ekosystemet.

Integrations-, licensierings- och implementeringsmöjligheter

Vikterna för båda modellerna erbjuds i MXFP4-format, och referensimplementeringar finns redan för PyTorch, Apple Metal och förbättrat stöd för plattformar som Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten och Cloudflare. Apache 2.0-licensen tillåter extremt flexibel användning, inklusive möjligheten att tjäna pengar på, omdistribuera och integrera dem i tredjepartsverktyg.

Exklusivt innehåll - Klicka här  Framtiden för skrivbordsläge på Android: hur man förvandlar sin telefon till en dator

För det spanska och europeiska näringslivet öppnar ankomsten av gpt-oss-120b och gpt-oss-20b nya vägar för automatisera analyser, utveckla intelligenta assistenter y behålla kontroll över data inom sina egna infrastrukturer, samtidigt som kostnaderna minskas och innovationscyklerna accelereras. Med tanke på den potentiella betydelsen av artificiell intelligens inom olika sektorer, Dessa verktyg låter dig experimentera och undersöka inom AI utan att förlita dig på externa API:er eller restriktiva licenser., främjar sin egen tekniska utveckling.

Denna utveckling gör det möjligt för aktörer inom tekniksektorn att få tillgång till mer öppna, transparenta och anpassningsbara verktyg, vilket främjar ett mer samarbetsinriktat och ansvarsfullt innovationsekosystem.