- OpenAI släpper gpt-oss-120b och gpt-oss-20b som språkmodeller med öppna vikter licensierade under Apache 2.0-licensen.
- De möjliggör lokal exekvering, anpassning, kommersiell användning och erbjuder prestanda som ligger nära proprietära modeller som o3 och o4-mini.
- Fokuserad på avancerat resonemang, kedjetänkande och stöd för autonoma verktyg.
- Säkerhet har varit en prioritet, med oberoende granskningar och protokoll mot skadlig användning.

OpenAI har ändrat sin strategi och har introducerat gpt-oss-120b tillsammans med gpt-oss-20b, de första språkmodellerna för öppna vikter som den har publicerat på över fem år. Denna lansering markerar ett brott med företagets policy med stängda utvecklingar och öppnar dörren för utvecklare, företag och privatpersoner kan använda avancerad AI utan att förlita sig på proprietära tjänster eller ådra sig stora kostnader.
Båda modellerna finns nu tillgängliga i gratis på Hugging Face-plattformen och distribueras under Apache 2.0-licensen. Detta tillåter alla användare kör dem lokalt, anpassa dem till specifika uppgifter, integrera dem i din egen programvara och till och med använda dem för kommersiella ändamål, utan ytterligare betalning eller begränsningar. OpenAI betonar att med denna rörelse Den syftar till att göra artificiell intelligens mer tillgänglig globalt och främja innovation inom ett ramverk av transparens och ansvarsskyldighet..
Viktiga tekniska funktioner hos gpt-oss-120b

Modellen gpt-oss-120b utmärker sig genom sin arkitektur baserad på en "mixture-of-experts" (MoE), så att du kan hantera 117.000 miljarder parametrar Med anmärkningsvärd effektivitet: endast 5.100 miljarder tokens aktiveras per bearbetad token. Detta gör det möjligt, trots sin storlek, att köra på en enda 80 GB GPU, ett överkomligt krav för forskningscentra och företag med måttligt avancerade resurser. Varianten gpt-oss-20b riktar sig å andra sidan till enheter med mindre minne och kan köras på konsumenthårdvara och till och med bärbara datorer med 16 GB RAM.
I båda fallen, avancerat resonemang har valts med hjälp av tankekedjans teknik, vilket gör att varje svar kan delas upp i förklarande mellansteg. Modellerna är tränade med STEM-fokuserade data, programmering och allmänkunskap, vilket ger dem en solid grund för komplexa uppgifter och användning av specifika verktyg, såsom webbsökning eller att köra Python-kod.
Prestanda och praktiska tillämpningar
Jämförande tester visar att gpt-oss-120b närmar sig nivån för o4-mini och överträffar OpenAIs o3-mini på de flesta programmerings-, tävlingsinriktade matematik- och sjukvårdsuppgifter. Modellen gpt-oss-20b, som är lättare, lyckas konkurrera med tredjepartslösningar som DeepSeek R1 och överträffar vissa riktmärken på specifika uppgifter, särskilt på edge-enheter.
En annan av dess starka sidor är dess anpassningsförmågaAnvändaren kan justera graden av resonemang (låg, medel eller hög) beroende på uppgiften, vilket balanserar latens och noggrannhetDen här konfigurationen, tillsammans med möjligheten att köra modeller offline och bakom en brandvägg, är särskilt användbar i företagsmiljöer med sekretessrestriktioner eller granskningsbehov.
Säkerhet, revision och community
OpenAI har ägnat särskild uppmärksamhet åt säkerhet och riskreducering i dessa modeller, och skjuter upp deras publicering för att utsätta dem för rigorösa interna och externa utvärderingar. De har Inbyggda filter och justeringsprotokoll för att förhindra felaktig användning, såsom generering av känslig information eller identitetsstöld inom områden som cybersäkerhet eller bioteknik.
Dessutom, Företaget har bjudit in allmänheten att delta i utmaningar med röda team, utrustad med en 500.000 XNUMX dollar i fond för att uppmuntra upptäckt av nya sårbarheter och framväxande hot.
När det gäller begränsningar, OpenAI inser att, trots sin avancerade arkitektur, Öppna modeller kan ha något högre "hallucinationsfrekvenser" än sina proprietära motsvarigheter., och dess utbildning har huvudsakligen genomförts med engelskspråkig data. Dokumentationen och kontrollerna som finns underlättar dock revision och kontinuerlig justering av dessa modeller, främjar ansvarsfull och säker användning inom det globala AI-ekosystemet.
Integrations-, licensierings- och implementeringsmöjligheter
Vikterna för båda modellerna erbjuds i MXFP4-format, och referensimplementeringar finns redan för PyTorch, Apple Metal och förbättrat stöd för plattformar som Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten och Cloudflare. Apache 2.0-licensen tillåter extremt flexibel användning, inklusive möjligheten att tjäna pengar på, omdistribuera och integrera dem i tredjepartsverktyg.
För det spanska och europeiska näringslivet öppnar ankomsten av gpt-oss-120b och gpt-oss-20b nya vägar för automatisera analyser, utveckla intelligenta assistenter y behålla kontroll över data inom sina egna infrastrukturer, samtidigt som kostnaderna minskas och innovationscyklerna accelereras. Med tanke på den potentiella betydelsen av artificiell intelligens inom olika sektorer, Dessa verktyg låter dig experimentera och undersöka inom AI utan att förlita dig på externa API:er eller restriktiva licenser., främjar sin egen tekniska utveckling.
Denna utveckling gör det möjligt för aktörer inom tekniksektorn att få tillgång till mer öppna, transparenta och anpassningsbara verktyg, vilket främjar ett mer samarbetsinriktat och ansvarsfullt innovationsekosystem.
Jag är en teknikentusiast som har gjort sina "nördar"-intressen till ett yrke. Jag har tillbringat mer än 10 år av mitt liv med att använda den senaste tekniken och mixtrat med alla typer av program av ren nyfikenhet. Nu har jag specialiserat mig på datateknik och tv-spel. Detta beror på att jag i mer än 5 år har arbetat med att skriva för olika webbplatser om teknik och videospel, skapa artiklar som försöker ge dig den information du behöver på ett språk som är begripligt för alla.
Om du har några frågor sträcker sig min kunskap från allt som rör operativsystemet Windows samt Android för mobiltelefoner. Och mitt engagemang är för dig, jag är alltid villig att spendera några minuter och hjälpa dig att lösa alla frågor du kan ha i den här internetvärlden.
