gpt-oss-120b: OpenAI-jev pristupačan i napredan otvoreni model

OpenAI objavljuje gpt-oss-120b i gpt-oss-20b kao otvorene jezične modele za težine licencirane pod Apache 2.0 licencom.
Omogućuju lokalno izvršavanje, prilagodbu, komercijalnu upotrebu i nude performanse bliske vlasničkim modelima kao što su o3 i o4-mini.
Fokusiran na napredno zaključivanje, lančano razmišljanje i podršku za autonomne alate.
Sigurnost je bila prioritet, s neovisnim pregledima i protokolima protiv zlonamjerne upotrebe.

Model gpt-oss-120b

OpenAI je promijenio svoju strategiju i uveo je gpt-oss-120b zajedno s gpt-oss-20b, prve jezične modele otvoreni utezi koje je objavila u više od pet godina. Ovo lansiranje označava prekid s politikom tvrtke o zatvorenim razvojima i otvara vrata programeri, tvrtke i pojedinci mogu koristiti naprednu umjetnu inteligenciju bez oslanjanja na vlasničke usluge ili stvaranja velikih troškova.

Oba modela su sada dostupna u besplatno na platformi Hugging Face i distribuiraju se pod Apache 2.0 licencom. To omogućuje bilo kojem korisniku pokreni ih lokalno, prilagodite ih specifičnim zadacima, integrirajte ih u vlastiti softver, pa čak i koristite ih u komercijalne svrhe, bez ikakvih dodatnih plaćanja ili ograničenja. OpenAI naglašava da s ovim pokretom Nastoji učiniti umjetnu inteligenciju dostupnijom globalno i potaknuti inovacije u okviru transparentnosti i odgovornosti..

Ključne tehničke značajke gpt-oss-120b

OpenAI Otvorene težine

Model gpt-oss-120b ističe se svojom arhitekturom temeljenom na „mješavini stručnjaka“ (MoE), što vam omogućuje upravljanje 117.000 milijardi parametara S izvanrednom učinkovitošću: samo 5.100 milijardi tokena aktivira se po obrađenom tokenu. To omogućuje, unatoč veličini, pokretanje na jednoj grafičkoj kartici od 80 GB, što je pristupačan zahtjev za istraživačke centre i tvrtke s umjereno naprednim resursima. Varijanta gpt-oss-20b, s druge strane, namijenjena je uređajima s manje memorije i može se pokretati na potrošačkom hardveru, pa čak i na prijenosnim računalima sa 16 GB RAM-a.

Ekskluzivan sadržaj - Kliknite ovdje Što je učenje s potkrepljenjem?

U oba slučaja, odabrano je napredno razmišljanje korištenjem tehnike lanca misli, što omogućuje da se svaki odgovor razloži na objašnjavajuće međukorake. Modeli su obučeni s podacima usmjerenim na STEM, programiranje i opće znanje, što im pruža čvrsta osnova za složene zadatke i korištenje specifičnih alata, kao što su pretraživanje weba ili pokretanje Python koda.

Povezani članak:

OpenAI se kladi na 'otvoreni' model: ovako će izgledati njegov novi AI s naprednim razmišljanjem.

Performanse i praktične primjene

Usporedni testovi pokazuju da gpt-oss-120b se približava razini o4-mini i nadmašuje OpenAI-jev o3-mini u većini programskih, kompetitivnih matematičkih i zdravstvenih zadataka. Model gpt-oss-20b, budući da je lakši, uspijeva konkurirati rješenjima trećih strana poput DeepSeek R1 i nadmašuje neke referentne vrijednosti u određenim zadacima, posebno na rubnim uređajima.

Još jedna od njegovih jakih strana je njegova prilagodljivostKorisnik može prilagoditi stupanj obrazloženja (nizak, srednji ili visok) ovisno o zadatku, čime se uravnotežuje latencija i točnostOva konfiguracija, zajedno s mogućnošću pokretanja modela izvan mreže i iza vatrozida, posebno je korisna u korporativnim okruženjima s ograničenjima privatnosti ili potrebama za revizijom.

Ekskluzivan sadržaj - Kliknite ovdje Google i Fitbit pokreću trenera s umjetnom inteligencijom i novu aplikaciju

Sigurnost, revizija i zajednica

OpenAI je posebnu pozornost posvetio sigurnost i smanjenje rizika u tim modelima, odgađajući njihovo objavljivanje kako bi ih podvrgli strogim internim i eksternim evaluacijama. Imaju Ugrađeni filteri i protokoli poravnanja za sprječavanje zlouporabe, kao što su generiranje osjetljivih informacija ili krađa identiteta u područjima kao što su kibersigurnost ili biotehnologija.

Osim toga, Tvrtka je pozvala zajednicu da sudjeluje u izazovima crvenog timskog rada., opremljen s Fond od 500.000 dolara za poticanje otkrivanja novih ranjivosti i novonastale prijetnje.

Što se tiče ograničenja, OpenAI prepoznaje da, unatoč svojoj naprednoj arhitekturi, Otvoreni modeli mogu imati nešto veće stope "halucinacija" od svojih vlasničkih pandana., a njegova obuka provedena je prvenstveno s podacima na engleskom jeziku. Međutim, dokumentacija i kontrole koje su na snazi olakšavaju reviziju i kontinuirano podešavanje ovih modela, promičući odgovornu i sigurnu upotrebu unutar globalnog ekosustava umjetne inteligencije.

Izgledi za integraciju, licenciranje i usvajanje

Težine za oba modela nude se u MXFP4 formatu, a referentne implementacije već postoje za PyTorch, Apple Metal i poboljšana podrška za platforme kao što su Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten i Cloudflare. Licenca Apache 2.0 omogućuje izuzetno fleksibilna upotreba, uključujući mogućnost monetizacije, redistribucije i integracije u alate trećih strana.

Ekskluzivan sadržaj - Kliknite ovdje Zorin OS 18 stiže taman na vrijeme za oproštaj od Windowsa 10 s novim dizajnom, pločicama i web aplikacijama.

Za španjolsku i europsku poslovnu zajednicu, dolazak gpt-oss-120b i gpt-oss-20b otvara nove mogućnosti. automatizirati analizu, razviti inteligentne asistente y održavati kontrolu nad podacima unutar vlastite infrastrukture, a sve to uz smanjenje troškova i ubrzavanje inovacijskih ciklusa. Uzimajući u obzir potencijalnu važnost umjetne inteligencije u različitim sektorima, Ovi alati vam omogućuju eksperimentiranje i istraživanje umjetne inteligencije bez oslanjanja na vanjske API-je ili restriktivne licence., promovirajući vlastiti tehnološki razvoj.

Ovaj napredak omogućuje akterima tehnološkog sektora pristup otvorenijim, transparentnijim i prilagodljivijim alatima, čime se potiče suradničkiji i odgovorniji inovacijski ekosustav.

Alberto navarro

Ja sam tehnološki entuzijast koji je svoje "geek" interese pretvorio u profesiju. Proveo sam više od 10 godina svog života koristeći vrhunsku tehnologiju i petljajući sa svim vrstama programa iz čiste znatiželje. Sada sam se specijalizirao za računalne tehnologije i video igre. To je zato što sam više od 5 godina pisao za razne web stranice o tehnologiji i videoigrama, stvarajući članke koji vam nastoje dati informacije koje su vam potrebne na jeziku koji je svima razumljiv.

Ako imate bilo kakvih pitanja, moje znanje seže od svega vezanog uz Windows operativni sustav kao i Android za mobitele. I moja je posvećenost vama, uvijek sam spreman odvojiti nekoliko minuta i pomoći vam riješiti sva pitanja koja imate u ovom internetskom svijetu.