OpenAI objavljuje gpt-oss-120b: svoj najnapredniji model otvorenih težina do sada.

Posljednje ažuriranje: 01.02.2024.

  • OpenAI objavljuje gpt-oss-120b i gpt-oss-20b kao otvorene jezičke modele za težine licencirane pod Apache 2.0 licencom.
  • Omogućavaju lokalno izvršavanje, prilagođavanje, komercijalnu upotrebu i nude performanse bliske vlasničkim modelima kao što su o3 i o4-mini.
  • Fokusiran na napredno zaključivanje, lančano razmišljanje i podršku za autonomne alate.
  • Sigurnost je bila prioritet, s nezavisnim pregledima i protokolima protiv zlonamjerne upotrebe.

Model gpt-oss-120b

OpenAI je promijenio svoju strategiju i uvela je gpt-oss-120b zajedno sa gpt-oss-20b, prve jezičke modele od otvoreni utezi koje je objavila u više od pet godina. Ovo lansiranje označava prekid s politikom kompanije o zatvorenim razvojima i otvara vrata programeri, kompanije i pojedinci mogu koristiti naprednu umjetnu inteligenciju bez oslanjanja na vlasničke usluge ili stvaranja velikih troškova.

Oba modela su sada dostupna u besplatno na platformi Hugging Face i distribuiraju se pod Apache 2.0 licencom. To omogućava bilo kojem korisniku pokreni ih lokalno, prilagodite ih specifičnim zadacima, integrirajte ih u vlastiti softver, pa čak i koristite ih u komercijalne svrhe, bez ikakvih dodatnih plaćanja ili ograničenja. OpenAI naglašava da s ovim pokretom Cilj mu je učiniti umjetnu inteligenciju dostupnijom globalno i potaknuti inovacije u okviru transparentnosti i odgovornosti..

Ključne tehničke karakteristike gpt-oss-120b

OpenAI Otvorene Težine

Model gpt-oss-120b ističe se svojom arhitekturom zasnovanom na „mješavini stručnjaka“ (MoE), što vam omogućava da upravljate 117.000 milijardi parametara Sa izuzetnom efikasnošću: samo 5.100 milijardi tokena se aktivira po obrađenom tokenu. Ovo omogućava, uprkos njegovoj veličini, da radi na jednom GPU-u od 80 GB, što je pristupačan zahtjev za istraživačke centre i kompanije sa umjereno naprednim resursima. Varijanta gpt-oss-20b, s druge strane, namijenjena je uređajima sa manje memorije i može raditi na potrošačkom hardveru, pa čak i na laptopima sa 16 GB RAM-a.

Ekskluzivni sadržaj - kliknite ovdje  Budućnost rada s umjetnom inteligencijom: Koje će se profesije pojaviti, a koje nestati?

U oba slučaja, odabrano je napredno razmišljanje korištenjem tehnike lanca misli, što omogućava da se svaki odgovor razloži na objašnjavajuće međukorake. Modeli su obučeni pomoću podataka usmjerenih na STEM, programiranje i opće znanje, što im pruža čvrsta osnova za složene zadatke i korištenje specifičnih alata, kao što su pretraživanje weba ili pokretanje Python koda.

OpenAI 'open-weight' model
Povezani članak:
OpenAI se kladi na model 'otvorene težine': ovako će izgledati njegov novi AI sa naprednim rezonovanjem.

Performanse i praktične primjene

gpt oss 120b i 20b

Uporedni testovi pokazuju da gpt-oss-120b se približava nivou o4-mini i nadmašuje OpenAI-jev o3-mini u većini programskih, konkurentnih matematičkih i zdravstvenih zadataka. Model gpt-oss-20b, budući da je lakši, uspijeva se takmičiti s rješenjima trećih strana poput DeepSeek R1 i nadmašuje neke benchmarkove u specifičnim zadacima, posebno na edge uređajima.

Još jedna od njegovih jakih strana je to što mogućnosti prilagođavanjaKorisnik može prilagoditi stepen obrazloženja (nizak, srednji ili visok) u zavisnosti od zadatka, čime se balansira latencija i tačnostOva konfiguracija, zajedno s mogućnošću pokretanja modela van mreže i iza zaštitnog zida (firewall), posebno je korisna u korporativnim okruženjima s ograničenjima privatnosti ili potrebama za revizijom.

Ekskluzivni sadržaj - kliknite ovdje  NASA ponovo otvara utrku za slijetanje na Mjesec pomoću modula Artemis 3.

Sigurnost, revizija i zajednica

OpenAI je posvetio posebnu pažnju sigurnost i smanjenje rizika u ovim modelima, odlažući njihovo objavljivanje kako bi ih podvrgli rigoroznim internim i eksternim evaluacijama. Oni imaju Ugrađeni filteri i protokoli za poravnanje kako bi se spriječila zloupotreba, kao što je generiranje osjetljivih informacija ili krađa identiteta u područjima kao što su kibernetička sigurnost ili biotehnologija.

Osim toga, Kompanija je pozvala zajednicu da učestvuje u izazovima crvenog timskog rada., opremljen sa Fond od 500.000 dolara za podsticanje otkrivanja novih ranjivosti i novonastale prijetnje.

Što se tiče ograničenja, OpenAI prepoznaje da, uprkos svojoj naprednoj arhitekturi, Otvoreni modeli mogu imati nešto veće stope "halucinacija" od svojih vlasničkih pandana., a obuka je provedena prvenstveno s podacima na engleskom jeziku. Međutim, dokumentacija i kontrole koje su na snazi olakšavaju reviziju i kontinuirano podešavanje ovih modela, promovirajući odgovornu i sigurnu upotrebu unutar globalnog ekosistema umjetne inteligencije.

Izgledi za integraciju, licenciranje i usvajanje

Težine za oba modela ponuđene su u MXFP4 formatu, a referentne implementacije već postoje za PyTorch, Apple Metal, te poboljšana podrška za platforme kao što su Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten i Cloudflare. Licenca Apache 2.0 omogućava... izuzetno fleksibilna upotreba, uključujući mogućnost monetizacije, redistribucije i integracije u alate trećih strana.

Ekskluzivni sadržaj - kliknite ovdje  Šta je SearchGPT i kako radi novi pretraživač zasnovan na veštačkoj inteligenciji

Za špansku i evropsku poslovnu zajednicu, dolazak gpt-oss-120b i gpt-oss-20b otvara nove mogućnosti za... automatizirati analizu, razviti inteligentne asistente y održavati kontrolu nad podacima unutar vlastitih infrastruktura, a sve to uz smanjenje troškova i ubrzavanje inovacijskih ciklusa. Uzimajući u obzir potencijalni značaj umjetne inteligencije u različitim sektorima, Ovi alati vam omogućavaju da eksperimentišete i istražujete u oblasti veštačke inteligencije bez oslanjanja na eksterne API-je ili restriktivne licence., promovirajući vlastiti tehnološki razvoj.

Ovaj napredak omogućava akterima u tehnološkom sektoru pristup otvorenijim, transparentnijim i prilagodljivijim alatima, čime se promovira kolaborativniji i odgovorniji inovacijski ekosistem.