Inilabas ng OpenAI ang gpt-oss-120b: ang pinaka-advanced na modelo ng open weights hanggang sa kasalukuyan.

Huling pag-update: 07/08/2025

  • Inilabas ng OpenAI ang gpt-oss-120b at gpt-oss-20b bilang mga modelo ng wikang open weight na lisensyado sa ilalim ng lisensya ng Apache 2.0.
  • Pinapayagan nila ang lokal na pagpapatupad, pag-customize, komersyal na paggamit at nag-aalok ng pagganap na malapit sa mga proprietary na modelo gaya ng o3 at o4-mini.
  • Nakatuon sa advanced na pangangatwiran, chain thinking, at suporta para sa mga autonomous na tool.
  • Priyoridad ang seguridad, na may mga independiyenteng pagsusuri at protocol laban sa malisyosong paggamit.

Modelong gpt-oss-120b

Binago ng OpenAI ang diskarte nito at ipinakilala ang gpt-oss-120b kasama ang gpt-oss-20b, ang mga modelo ng unang wika ng bukas na mga timbang na nailathala nito sa loob ng mahigit limang taon. Ang paglulunsad na ito ay nagmamarka ng pahinga sa patakaran ng kumpanya sa mga saradong pagpapaunlad, at nagbubukas ng pinto sa mga developer, kumpanya at indibidwal maaaring gumamit ng advanced na AI nang hindi umaasa sa mga serbisyong pagmamay-ari o nagkakaroon ng malalaking gastos.

Ang parehong mga modelo ay magagamit na ngayon sa libre sa Hugging Face platform at ipinamamahagi sa ilalim ng lisensyang Apache 2.0. Pinapayagan nito ang sinumang gumagamit patakbuhin ang mga ito nang lokal, iakma ang mga ito sa mga partikular na gawain, isama ang mga ito sa sarili mong software, at kahit na gamitin ang mga ito para sa komersyal na layunin, nang walang anumang karagdagang pagbabayad o paghihigpit. OpenAI idiniin iyon sa kilusang ito Nilalayon nitong gawing mas naa-access sa buong mundo ang artificial intelligence at itaguyod ang pagbabago sa loob ng balangkas ng transparency at pananagutan..

Mga pangunahing teknikal na tampok ng gpt-oss-120b

OpenAI Open Weights

Ang modelong gpt-oss-120b ay namumukod-tangi para sa arkitektura nito batay sa "mixture-of-experts" (MoE), na nagpapahintulot sa iyo na pamahalaan 117.000 bilyong mga parameter May kahanga-hangang kahusayan: 5.100 bilyong token lang ang na-activate sa bawat naprosesong token. Ginagawa nitong posible, sa kabila ng laki nito, na tumakbo sa isang solong 80 GB GPU, isang abot-kayang kinakailangan para sa mga sentro ng pananaliksik at mga kumpanyang may katamtamang advanced na mga mapagkukunan. Ang gpt-oss-20b na variant, samantala, ay nakatutok sa mga device na may mas kaunting memorya, at maaaring tumakbo sa consumer hardware at maging sa mga laptop na may 16 GB ng RAM.

Eksklusibong nilalaman - Mag-click Dito  Dumating ang Spotify Jam sa Android Auto: ganito gumagana ang pakikipagtulungan ng musika sa iyong mga biyahe

Sa parehong mga kaso, advanced na pangangatwiran ay napili gamit ang chain of thought technique, na nagpapahintulot sa bawat tugon na hatiin sa mga paliwanag na intermediate na hakbang. Ang mga modelo ay sinanay gamit ang STEM-focused data, programming at pangkalahatang kaalaman, na nagbibigay sa kanila isang matibay na pundasyon para sa mga kumplikadong gawain at paggamit ng mga partikular na tool, gaya ng paghahanap sa web o pagpapatakbo ng Python code.

OpenAI 'open-weight' na modelo
Kaugnay na artikulo:
Ang OpenAI ay tumataya sa isang 'open-weight' na modelo: ito ang magiging hitsura ng bago nitong AI na may advanced na pangangatwiran.

Pagganap at praktikal na mga aplikasyon

gpt oss 120b at 20b

Ipinakikita iyon ng mga paghahambing na pagsusulit Ang gpt-oss-120b ay lumalapit sa antas ng o4-mini at nahihigitan ang pagganap ng o3-mini ng OpenAI sa karamihan ng mga gawain sa programming, mapagkumpitensyang matematika, at pangangalagang pangkalusugan. Ang modelo ng gpt-oss-20b, na mas magaan, ay nakakatugon sa mga solusyon sa third-party tulad ng DeepSeek R1 at nahihigitan nito ang ilang mga benchmark sa mga partikular na gawain, lalo na sa mga edge na device.

Ang isa pang malakas na punto nito ay ang kakayahan sa pagpapasadya: Maaaring ayusin ng user ang antas ng pangangatwiran (mababa, katamtaman o mataas) depende sa gawain, kaya binabalanse ang latency at katumpakanAng configuration na ito, kasama ang opsyong magpatakbo ng mga modelo nang offline at sa likod ng firewall, ay partikular na kapaki-pakinabang sa mga corporate environment na may mga paghihigpit sa privacy o mga pangangailangan sa pag-audit.

Eksklusibong nilalaman - Mag-click Dito  Narito kung paano ka makakagawa ng mga video gamit ang Perplexity sa Twitter (ngayon X) hanggang 8 segundo ang haba at may tunog

Seguridad, pag-audit at komunidad

Ang OpenAI ay nagbigay ng espesyal na pansin sa kaligtasan at pagbabawas ng panganib sa mga modelong ito, na inaantala ang kanilang paglalathala upang isailalim ang mga ito sa mahigpit na panloob at panlabas na mga pagsusuri. meron sila Mga built-in na filter at alignment protocol para maiwasan ang maling paggamit, gaya ng pagbuo ng sensitibong impormasyon o pagnanakaw ng pagkakakilanlan sa mga lugar gaya ng cybersecurity o biotechnology.

Bukod dito, Inimbitahan ng kumpanya ang komunidad na lumahok sa mga hamon ng red teaming, nilagyan ng a $500.000 na pondo upang hikayatin ang pagtuklas ng mga bagong kahinaan at mga umuusbong na banta.

Tungkol sa mga limitasyon, Kinikilala iyon ng OpenAI, sa kabila ng advanced na arkitektura nito, Ang mga bukas na modelo ay maaaring may bahagyang mas mataas na mga rate ng "hallucination" kaysa sa kanilang mga proprietary counterparts., at ang pagsasanay nito ay pangunahing isinagawa gamit ang data sa Ingles. Gayunpaman, ang dokumentasyon at mga kontrol sa lugar ay nagpapadali sa pag-audit at patuloy na pagsasaayos ng mga modelong ito, nagpo-promote ng responsable at ligtas na paggamit sa loob ng pandaigdigang AI ecosystem.

Mga prospect ng pagsasama, paglilisensya, at pag-aampon

Ang mga timbang para sa parehong mga modelo ay inaalok sa MXFP4 na format, at umiiral na ang mga reference na pagpapatupad para sa PyTorch, Apple Metal, at pinahusay na suporta para sa mga platform gaya ng Azure, AWS, vLLM, llama.cpp, LM Studio, Baseten, at Cloudflare. Ang lisensya ng Apache 2.0 ay nagpapahintulot lubhang nababaluktot na paggamit, kabilang ang posibilidad ng pagkakakitaan, muling pamamahagi, at pagsasama ng mga ito sa mga tool ng third-party.

Eksklusibong nilalaman - Mag-click Dito  Ang OpenAI ay sumusulong sa Codex at GPT-5: mga bagong kakayahan sa programming at artificial intelligence

Para sa Spanish at European na komunidad ng negosyo, ang pagdating ng gpt-oss-120b at gpt-oss-20b ay nagbubukas ng mga bagong paraan para sa i-automate ang pagsusuri, bumuo ng mga matatalinong katulong y panatilihin ang kontrol sa data sa loob ng sarili nilang mga imprastraktura, lahat habang binabawasan ang mga gastos at pinapabilis ang mga siklo ng pagbabago. Isinasaalang-alang ang potensyal na kahalagahan ng artificial intelligence sa iba't ibang sektor, Nagbibigay-daan sa iyo ang mga tool na ito na mag-eksperimento at magsaliksik sa AI nang hindi umaasa sa mga panlabas na API o mahigpit na lisensya., nagtataguyod ng sarili nitong pag-unlad ng teknolohiya.

Ang pagsulong na ito ay nagbibigay-daan sa mga manlalaro ng sektor ng teknolohiya na ma-access ang mas bukas, transparent, at madaling ibagay na mga tool, kaya nagpo-promote ng isang mas collaborative at responsableng innovation ecosystem.