gpt-oss-120b: OpenAI-jev pristupačan i napredan otvoreni model

OpenAI objavljuje gpt-oss-120b i gpt-oss-20b kao otvorene jezičke modele za težine licencirane pod Apache 2.0 licencom.
Omogućavaju lokalno izvršavanje, prilagođavanje, komercijalnu upotrebu i nude performanse bliske vlasničkim modelima kao što su o3 i o4-mini.
Fokusiran na napredno zaključivanje, lančano razmišljanje i podršku za autonomne alate.
Sigurnost je bila prioritet, s nezavisnim pregledima i protokolima protiv zlonamjerne upotrebe.

Model gpt-oss-120b

OpenAI je promijenio svoju strategiju i uvela je gpt-oss-120b zajedno sa gpt-oss-20b, prve jezičke modele od otvoreni utezi koje je objavila u više od pet godina. Ovo lansiranje označava prekid s politikom kompanije o zatvorenim razvojima i otvara vrata programeri, kompanije i pojedinci mogu koristiti naprednu umjetnu inteligenciju bez oslanjanja na vlasničke usluge ili stvaranja velikih troškova.

Oba modela su sada dostupna u besplatno na platformi Hugging Face i distribuiraju se pod Apache 2.0 licencom. To omogućava bilo kojem korisniku pokreni ih lokalno, prilagodite ih specifičnim zadacima, integrirajte ih u vlastiti softver, pa čak i koristite ih u komercijalne svrhe, bez ikakvih dodatnih plaćanja ili ograničenja. OpenAI naglašava da s ovim pokretom Cilj mu je učiniti umjetnu inteligenciju dostupnijom globalno i potaknuti inovacije u okviru transparentnosti i odgovornosti..

Ključne tehničke karakteristike gpt-oss-120b

OpenAI Otvorene Težine

Model gpt-oss-120b ističe se svojom arhitekturom zasnovanom na „mješavini stručnjaka“ (MoE), što vam omogućava da upravljate 117.000 milijardi parametara Sa izuzetnom efikasnošću: samo 5.100 milijardi tokena se aktivira po obrađenom tokenu. Ovo omogućava, uprkos njegovoj veličini, da radi na jednom GPU-u od 80 GB, što je pristupačan zahtjev za istraživačke centre i kompanije sa umjereno naprednim resursima. Varijanta gpt-oss-20b, s druge strane, namijenjena je uređajima sa manje memorije i može raditi na potrošačkom hardveru, pa čak i na laptopima sa 16 GB RAM-a.

Ekskluzivni sadržaj - kliknite ovdje Budućnost rada s umjetnom inteligencijom: Koje će se profesije pojaviti, a koje nestati?

U oba slučaja, odabrano je napredno razmišljanje korištenjem tehnike lanca misli, što omogućava da se svaki odgovor razloži na objašnjavajuće međukorake. Modeli su obučeni pomoću podataka usmjerenih na STEM, programiranje i opće znanje, što im pruža čvrsta osnova za složene zadatke i korištenje specifičnih alata, kao što su pretraživanje weba ili pokretanje Python koda.

Povezani članak:

OpenAI se kladi na model 'otvorene težine': ovako će izgledati njegov novi AI sa naprednim rezonovanjem.

Performanse i praktične primjene

Uporedni testovi pokazuju da gpt-oss-120b se približava nivou o4-mini i nadmašuje OpenAI-jev o3-mini u većini programskih, konkurentnih matematičkih i zdravstvenih zadataka. Model gpt-oss-20b, budući da je lakši, uspijeva se takmičiti s rješenjima trećih strana poput DeepSeek R1 i nadmašuje neke benchmarkove u specifičnim zadacima, posebno na edge uređajima.

Još jedna od njegovih jakih strana je to što mogućnosti prilagođavanjaKorisnik može prilagoditi stepen obrazloženja (nizak, srednji ili visok) u zavisnosti od zadatka, čime se balansira latencija i tačnostOva konfiguracija, zajedno s mogućnošću pokretanja modela van mreže i iza zaštitnog zida (firewall), posebno je korisna u korporativnim okruženjima s ograničenjima privatnosti ili potrebama za revizijom.

Ekskluzivni sadržaj - kliknite ovdje NASA ponovo otvara utrku za slijetanje na Mjesec pomoću modula Artemis 3.

Sigurnost, revizija i zajednica

OpenAI je posvetio posebnu pažnju sigurnost i smanjenje rizika u ovim modelima, odlažući njihovo objavljivanje kako bi ih podvrgli rigoroznim internim i eksternim evaluacijama. Oni imaju Ugrađeni filteri i protokoli za poravnanje kako bi se spriječila zloupotreba, kao što je generiranje osjetljivih informacija ili krađa identiteta u područjima kao što su kibernetička sigurnost ili biotehnologija.

Osim toga, Kompanija je pozvala zajednicu da učestvuje u izazovima crvenog timskog rada., opremljen sa Fond od 500.000 dolara za podsticanje otkrivanja novih ranjivosti i novonastale prijetnje.

Što se tiče ograničenja, OpenAI prepoznaje da, uprkos svojoj naprednoj arhitekturi, Otvoreni modeli mogu imati nešto veće stope "halucinacija" od svojih vlasničkih pandana., a obuka je provedena prvenstveno s podacima na engleskom jeziku. Međutim, dokumentacija i kontrole koje su na snazi olakšavaju reviziju i kontinuirano podešavanje ovih modela, promovirajući odgovornu i sigurnu upotrebu unutar globalnog ekosistema umjetne inteligencije.

Izgledi za integraciju, licenciranje i usvajanje

Težine za oba modela ponuđene su u MXFP4 formatu, a referentne implementacije već postoje za PyTorch, Apple Metal, te poboljšana podrška za platforme kao što su Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten i Cloudflare. Licenca Apache 2.0 omogućava... izuzetno fleksibilna upotreba, uključujući mogućnost monetizacije, redistribucije i integracije u alate trećih strana.

Ekskluzivni sadržaj - kliknite ovdje Šta je SearchGPT i kako radi novi pretraživač zasnovan na veštačkoj inteligenciji

Za špansku i evropsku poslovnu zajednicu, dolazak gpt-oss-120b i gpt-oss-20b otvara nove mogućnosti za... automatizirati analizu, razviti inteligentne asistente y održavati kontrolu nad podacima unutar vlastitih infrastruktura, a sve to uz smanjenje troškova i ubrzavanje inovacijskih ciklusa. Uzimajući u obzir potencijalni značaj umjetne inteligencije u različitim sektorima, Ovi alati vam omogućavaju da eksperimentišete i istražujete u oblasti veštačke inteligencije bez oslanjanja na eksterne API-je ili restriktivne licence., promovirajući vlastiti tehnološki razvoj.

Ovaj napredak omogućava akterima u tehnološkom sektoru pristup otvorenijim, transparentnijim i prilagodljivijim alatima, čime se promovira kolaborativniji i odgovorniji inovacijski ekosistem.

Alberto Navarro

Ja sam tehnološki entuzijasta koji je svoja "geek" interesovanja pretvorio u profesiju. Proveo sam više od 10 godina svog života koristeći najsavremeniju tehnologiju i petljajući po svim vrstama programa iz čiste radoznalosti. Sada sam se specijalizirao za kompjutersku tehnologiju i video igrice. To je zato što više od 5 godina pišem za razne web stranice o tehnologiji i video igricama, stvarajući članke koji nastoje dati vam potrebne informacije na jeziku koji je svima razumljiv.

Ako imate bilo kakvih pitanja, moje znanje seže od svega vezanog za Windows operativni sistem kao i Android za mobilne telefone. I moja posvećenost je vama, uvijek sam spreman potrošiti nekoliko minuta i pomoći vam da riješite sva pitanja koja imate u ovom svijetu interneta.