Seo mar a dh’obraicheas tu le gpt-oss-20b gu h-ionadail: dè a tha ùr, coileanadh, agus mar a nì thu deuchainn air.

Ùrachadh mu dheireadh: 28/08/2025

  • Ruigidh gpt-oss-20b mar mhodail cuideam fosgailte le cur an gnìomh ionadail agus co-theacsa fada (suas ri 131.072 comharran).
  • Air a bharrrachadh airson NVIDIA RTX: Astaran a chaidh aithris suas ri 256 t/s; Bidh VRAM a’ gabhail thairis gus coileanadh a chumail suas.
  • Furasta a chleachdadh le Ollama agus roghainnean eile leithid llama.cpp, GGML, agus Microsoft AI Foundry Local.
  • Ri fhaighinn cuideachd ann an Intel AI Playground 2.6.0, le frèamaichean ùraichte agus riaghladh àrainneachd nas fheàrr.
gpt-oss-20b air an làrach

Teachd gpt-oss-20b airson cleachdadh ionadail a’ toirt modail reusanachaidh chumhachdach a ruitheas gu dìreach air a’ PC gu barrachd luchd-cleachdaidh. Tha an oidhirp seo, a rèir an Leasachadh airson GPUan NVIDIA RTX, a’ fosgladh an dorais gu sruthan-obrach dùbhlanach gun a bhith an urra ris an sgòth.

Tha am fòcas soilleir: a bhith a’ tabhann cuideam fosgailte le co-theacsa glè fhada airson gnìomhan iom-fhillte leithid rannsachaidhean adhartach, rannsachadh, taic còd no còmhraidhean fada, a’ toirt prìomhachas don prìobhaideachd agus smachd air cosgaisean nuair a bhios tu ag obair gu h-ionadail.

Dè tha gpt-oss-20b a’ toirt seachad nuair a bhios e a’ ruith gu h-ionadail?

Cur an gnìomh modalan GPT cuideam fosgailte gu h-ionadail

Bidh teaghlach gpt-oss a’ nochdadh an toiseach le modailean de cuideaman fosgailte air a dhealbhadh gus a bhith furasta an amalachadh a-steach do na fuasglaidhean agad fhèin. Gu sònraichte, gpt-oss-20b Tha e a’ seasamh a-mach airson cothromachadh a dhèanamh eadar comas reusanachaidh agus riatanasan bathar-cruaidh reusanta airson PC deasg.

Is e feart eadar-dhealaichte an uinneag co-theacsa leudaichte, le taic airson suas ri 131.072 comharran anns an raon gpt-oss. Tha an fhaid seo a’ comasachadh còmhraidhean fada, mion-sgrùdadh air sgrìobhainnean mòra no slabhraidhean smuaintean nas doimhne gun ghearraidhean no briseadh sìos.

Susbaint sònraichte - Cliog an seo  Dè an ìre de RAM a tha a dhìth Windows 10?

An coimeas ri modalan dùinte, tha am moladh cuideam fosgailte a’ toirt prìomhachas don sùbailteachd amalachaidh ann an tagraidhean: bho luchd-cuideachaidh le innealan (riochdairean) eadhon plugain airson rannsachadh, sgrùdadh lìn agus prògramadh, uile a’ gabhail brath air co-dhùnadh ionadail.

Ann an dòigh phractaigeach, am pasgan de Tha gpt-oss:20b timcheall air 13 GB air a stàladh ann an àrainneachdan ruith-ùine mòr-chòrdte. Bidh seo a’ suidheachadh an tòna airson na goireasan a tha a dhìth agus a’ cuideachadh le bhith a’ sgèileadh an VRAM gus coileanadh a chumail suas gun bhacadh sam bith.

Tha caochladh nas motha ann cuideachd (gpt-oss-120b), air a dhealbhadh airson suidheachaidhean le barrachd ghoireasan grafaigeachAirson a’ mhòr-chuid de PCn, ge-tà, an 20B ’S e seo an t-àite tòiseachaidh as reusanta air sgàth a’ chàirdeis eadar astar, cuimhne agus càileachd.

A’ dèanamh an fheum as fheàrr airson RTX: Astar, Co-theacsa, agus VRAM

Innealan airson gpt-oss 20b a ruith gu h-ionadail

A’ cur modailean GPT-OSS an sàs san eag-shiostam NVIDIA RTX a’ ceadachadh ìrean gineadh àrd. Ann an uidheamachd àrd-inbhe, mullaichean suas ri 256 comharran / diog le atharrachaidhean iomchaidh, a’ gabhail brath air leasachaidhean agus mionaideachd sònraichte leithid MXFP 4.

Tha na toraidhean an urra ris a’ chairt, an co-theacsa, agus an rèiteachadh. Ann an deuchainnean le a RTX 5080, ràinig gpt-oss 20b timcheall air 128 t/s le co-theacsan cuibhrichte (≈8k). Le bhith ag àrdachadh an Uinneag 16k agus a’ sparradh cuid den luchd a-steach do RAM an t-siostaim, thuit an ìre gu ~50,5 t/s, leis an GPU a’ dèanamh a’ mhòr-chuid den obair.

Susbaint sònraichte - Cliog an seo  Mar a làimhsicheas tu Rfc

Tha an leasan soilleir: an Riaghailtean VRAMAnn an AI ionadail, a RTX 3090 le barrachd cuimhne Faodaidh e coileanadh nas fheàrr na GPU nas ùire ach le nas lugha de VRAM, oir tha e a’ cur casg air cus-shruthadh chun an cuimhne siostaim agus eadar-theachd a bharrachd an CPU.

Airson gpt-oss-20b, tha e goireasach meud a’ mhodail a ghabhail mar iomradh: mu 13 GB barrachd rùm airson an Tasglann KV agus gnìomhan dian. Mar stiùireadh luath, thathar a’ moladh gum bi 16 GB de VRAM co-dhiù agus ag amas air 24 GB ma thathar an dùil ri co-theacsan fada no luchdan leantainneach.

Faodaidh an fheadhainn a tha airson am bathar-cruaidh a bhrùthadh sgrùdadh a dhèanamh mionaideachd èifeachdach (leithid MXFP4), atharraich fad a’ cho-theacsa no cleachd rèiteachaidhean ioma-GPU nuair a tha sin comasach, an-còmhnaidh a’ cumail an amas de seachain iomlaidean a dh’ionnsaigh RAM.

Stàladh agus cleachdadh: Ollama agus slighean eile

Coileanadh GPT-OSS air GPUan RTX

Gus am modail a dhearbhadh ann an dòigh shìmplidh, Olama a’ tabhann eòlas dìreach air PCan RTX: Leigidh seo leat GPT-OSS-20B a luchdachadh sìos, a ruith, agus cabadaich leis gun rèiteachaidhean iom-fhillte., a bharrachd air taic a thoirt do PDFan, faidhlichean teacsa, brosnachaidhean ìomhaighean, agus atharrachadh co-theacsa.

Tha slighean eile ann cuideachd do luchd-cleachdaidh adhartach, mar eisimpleir Stàlaich LLM air Windows 11Frèamaichean mar gairm.cpp agus leabharlannan seòrsa GGML air an leasachadh airson RTX, le oidhirpean o chionn ghoirid ann an lughdaich an luchd CPU agus gabh brath Grafaichean CUDAAig an aon àm, Fùirneis AI Microsoft Ionadail (ro-shealladh) Amalaich modailean tro CLI, SDK no APIan le luathachadh CUDA agus TensorRT.

Susbaint sònraichte - Cliog an seo  Mar a chleachdas tu Autoruns gus prògraman a thoirt air falbh a thòisicheas gu fèin-ghluasadach gun chead

Ann an eag-shiostam nan innealan, Raon-cluiche Intel AI 2.6.0 air gpt-oss-20b a thoirt a-steach am measg nan roghainnean aigeTha an t-ùrachadh a’ cur smachd mionaideach air dreachan airson backends agus ath-sgrùdaidhean air frèamaichean leithid OpenVINO, ComfyUI y gairm.cpp (le taic bho Vulkan agus atharrachadh co-theacsa), a’ comasachadh àrainneachdan ionadail seasmhach.

Mar stiùireadh tòiseachaidh, thoir sùil air an VRAM ri fhaighinn, luchdaich sìos an caochladh modail a fhreagras air an GPU agad, dearbhaich an astar chomharran le brosnachaidhean riochdachail agus ag atharrachadh an uinneag co-theacsa gus an luchd gu lèir a chumail air a’ chairt grafaiceachd.

Leis na pìosan seo, tha e comasach luchd-cuideachaidh a thogail airson rannsachadh agus mion-sgrùdadh, innealan de sgrùdadh no taicean bho prògraman a bhios ag obair gu tur air a’ choimpiutair, a’ cumail uachdranas dàta.

Tha an cothlamadh de gpt-oss-20b le luathachadh RTX, riaghladh VRAM faiceallach, agus innealan mar Ollama, llama.cpp, no AI Playground a’ daingneachadh roghainn aibidh airson AI reusanachaidh a ruith gu h-ionadail; slighe a tha a’ cothromachadh coileanadh, cosgais, agus prìobhaideachd gun a bhith an urra ri seirbheisean taobh a-muigh.

gpt-oss-120b
Artaigil co-cheangailte:
Tha OpenAI a’ leigeil ma sgaoil gpt-oss-120b: am modail cuideaman fosgailte as adhartaiche aige gu ruige seo.