OpenAI avaldab gpt-oss-120b: oma seni kõige arenenuma avatud kaalude mudeli.

Viimane uuendus: 16.01.2024

  • OpenAI avaldab gpt-oss-120b ja gpt-oss-20b avatud kaaludega keelemudelitena, mis on litsentseeritud Apache 2.0 litsentsi alusel.
  • Need võimaldavad lokaalset teostust, kohandamist, ärilist kasutamist ning pakuvad jõudlust, mis on lähedane patenteeritud mudelitele, näiteks o3 ja o4-mini.
  • Keskendutakse edasijõudnutele arutluskäikudele, ahelmõtlemisele ja autonoomsete tööriistade toetamisele.
  • Turvalisus on olnud prioriteet, mille hulka kuuluvad sõltumatud ülevaated ja protokollid pahatahtliku kasutamise vastu.

Mudel gpt-oss-120b

OpenAI on oma strateegiat muutnud ja on tutvustanud gpt-oss-120b koos gpt-oss-20b-ga, mis on esimesed keelemudelid avatud raskused mida see on avaldanud enam kui viie aasta jooksul. See turuletoomine tähistab ettevõtte suletud arenduste poliitika murdmist ja avab ukse arendajad, ettevõtted ja eraisikud saab kasutada täiustatud tehisintellekti ilma patenteeritud teenustele toetumata või suuri kulusid kandmata.

Mõlemad mudelid on nüüd saadaval tasuta Hugging Face platvormil ja neid levitatakse Apache 2.0 litsentsi alusel. See võimaldab igal kasutajal käivitage need lokaalselt, kohandage neid konkreetsete ülesannete jaoks, integreerige need oma tarkvarasse ja kasutage neid isegi ärilistel eesmärkidel ilma lisatasu või piiranguteta. OpenAI rõhutab, et selle liikumisega Selle eesmärk on muuta tehisintellekt ülemaailmselt kättesaadavamaks ja edendada innovatsiooni läbipaistvuse ja vastutuse raamistikus..

gpt-oss-120b peamised tehnilised omadused

OpenAI avatud kaalud

gpt-oss-120b mudel paistab silma oma arhitektuuri poolest, mis põhineb "ekspertide segul" (MoE)., mis võimaldab teil hallata 117.000 millones de parámetros Märkimisväärse efektiivsusega: iga töödeldud žetooni kohta aktiveeritakse ainult 5.100 miljardit žetooni. See võimaldab vaatamata oma suurusele töötada ühel 80 GB graafikaprotsessoril, mis on taskukohane nõue uurimiskeskustele ja mõõdukalt arenenud ressurssidega ettevõtetele. gpt-oss-20b variant on aga suunatud väiksema mälumahuga seadmetele ning töötab tarbijariistvaral ja isegi 16 GB muutmäluga sülearvutitel.

Eksklusiivne sisu – klõpsake siin  Joonis 03: Humanoidrobot hüppab töökojast koju

En ambos casos, valitud on edasijõudnud arutluskäik mõtteahela tehnika kasutamine, mis võimaldab iga vastuse jagada selgitavateks vaheetappideks. Mudelid on treenitud STEM-kesksete andmetega, programmeerimine ja üldteadmised, mis neile pakuvad kindel alus keerukate ülesannete jaoks ja konkreetsete tööriistade kasutamine, näiteks veebiotsing või Pythoni koodi käivitamine.

OpenAI "avatud kaaluga" mudel
Seotud artikkel:
OpenAI panustab "avatud kaaluga" mudelile: selline näeb välja selle uus täiustatud arutlusvõimega tehisintellekt.

Toimivus ja praktilised rakendused

gpt oss 120b ja 20b

Võrdluskatsed näitavad, et gpt-oss-120b läheneb o4-mini tasemele ja edestab OpenAI o3-minit enamikus programmeerimis-, võistlusmatemaatika- ja tervishoiuülesannetes. Kergem gpt-oss-20b mudel suudab konkureerida kolmandate osapoolte lahendustega, näiteks DeepSeek R1, ja edestab mõningaid võrdlusaluseid teatud ülesannete puhul, eriti servaseadmetes.

Teine selle tugev külg on kohandamisvõimalusedKasutaja saab ülesandest olenevalt arutlusastme (madal, keskmine või kõrge) reguleerida. seega tasakaalustades latentsust ja täpsustSee konfiguratsioon koos võimalusega käitada mudeleid võrguühenduseta ja tulemüüri taga on eriti kasulik ettevõttekeskkondades, kus on privaatsuspiirangud või auditeerimisvajadused.

Eksklusiivne sisu – klõpsake siin  Poeülevaated: Chrome'i uus tehisintellekti funktsioon muudab veebis ostlemist

Turvalisus, auditeerimine ja kogukond

OpenAI on pööranud erilist tähelepanu ohutus ja riskide vähendamine nendes mudelites, lükates nende avaldamist edasi, et neid rangelt sise- ja välishindamisele allutada. Neil on Sisseehitatud filtrid ja joondusprotokollid väärkasutuse vältimiseks, näiteks tundliku teabe genereerimine või identiteedivargus sellistes valdkondades nagu küberturvalisus või biotehnoloogia.

Pealegi, Ettevõte on kutsunud kogukonda osalema punaste meeskondade väljakutsetes, varustatud a 500.000 XNUMX dollari suurune fond uute haavatavuste avastamise ergutamiseks ja tekkivad ohud.

En cuanto a limitaciones, OpenAI tunnistab, etvaatamata oma täiustatud arhitektuurile, Avatud mudelitel võib olla veidi kõrgem "hallutsinatsioonide" määr kui nende patenteeritud analoogidel.ja selle koolitus on läbi viidud peamiselt ingliskeelsete andmetega. Kehtiv dokumentatsioon ja kontrollimehhanismid hõlbustavad aga auditeerimist ja nende mudelite pidev reguleerimine, edendades vastutustundlikku ja ohutut kasutamist ülemaailmses tehisintellekti ökosüsteemis.

Integratsioon, litsentsimine ja kasutuselevõtu väljavaated

Mõlema mudeli kaalud pakutakse MXFP4-vormingus ning PyTorchi ja Apple Metali jaoks on juba olemas referentsiimplikatsioonid ning täiustatud tugi platvormidele nagu Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten ja Cloudflare. Apache 2.0 litsents lubab äärmiselt paindlik kasutamine, sealhulgas võimalus neid monetiseerida, levitada ja integreerida kolmandate osapoolte tööriistadesse.

Eksklusiivne sisu – klõpsake siin  Halvatud mees juhib robotkätt mõistusega tänu uuele liidesele

Hispaania ja Euroopa äriringkondade jaoks avab gpt-oss-120b ja gpt-oss-20b saabumine uusi võimalusi automatiseerida analüüsi, arendada intelligentseid assistente y säilitada kontroll andmete üle omaenda infrastruktuuri piires, vähendades samal ajal kulusid ja kiirendades innovatsioonitsükleid. Arvestades tehisintellekti potentsiaalset tähtsust erinevates sektorites, Need tööriistad võimaldavad teil tehisintellektiga katsetada ja uurida ilma välistele API-dele või piiravatele litsentsidele toetumata., edendades omaenda tehnoloogilist arengut.

See edasiminek võimaldab tehnoloogiasektori osalejatel pääseda ligi avatumatele, läbipaistvamatele ja kohandatavamatele tööriistadele, edendades seeläbi koostööpõhisemat ja vastutustundlikumat innovatsiooniökosüsteemi.