gpt-oss-20b-യിൽ പ്രാദേശികമായി എങ്ങനെ പ്രവർത്തിക്കാമെന്ന് ഇതാ: പുതിയതെന്താണ്, പ്രകടനം, അത് എങ്ങനെ പരീക്ഷിക്കാം.

അവസാന പരിഷ്കാരം: 28/08/2025

  • gpt-oss-20b ലോക്കൽ എക്സിക്യൂഷനും ലോംഗ് കോൺടെക്സും (131.072 ടോക്കണുകൾ വരെ) ഉള്ള ഒരു ഓപ്പൺ-വെയ്റ്റ് മോഡലായി എത്തുന്നു.
  • NVIDIA RTX-നായി ഒപ്റ്റിമൈസ് ചെയ്‌തു: 256 t/s വരെ വേഗത റിപ്പോർട്ട് ചെയ്‌തു; പ്രകടനം നിലനിർത്താൻ VRAM ഏറ്റെടുക്കുന്നു.
  • ഒല്ലാമയിലും llama.cpp, GGML, Microsoft AI ഫൗണ്ടറി ലോക്കൽ തുടങ്ങിയ ഇതരമാർഗങ്ങളിലും ഉപയോഗിക്കാൻ എളുപ്പമാണ്.
  • പുതുക്കിയ ചട്ടക്കൂടുകളും മെച്ചപ്പെട്ട പരിസ്ഥിതി മാനേജ്മെന്റും ഉള്ള ഇന്റൽ AI പ്ലേഗ്രൗണ്ട് 2.6.0 ലും ലഭ്യമാണ്.
ലോക്കലിൽ gpt-oss-20b

വരവ് gpt-oss-20b എന്നതിനുള്ള പ്രാദേശിക ഉപയോഗം പിസിയിൽ നേരിട്ട് പ്രവർത്തിക്കുന്ന ശക്തമായ ഒരു യുക്തിസഹമായ മാതൃക കൂടുതൽ ഉപയോക്താക്കളിലേക്ക് എത്തിക്കുന്നു. ഈ പുഷ്, NVIDIA RTX GPU-കൾക്കുള്ള ഒപ്റ്റിമൈസേഷൻ, ക്ലൗഡിനെ ആശ്രയിക്കാതെ തന്നെ ആവശ്യപ്പെടുന്ന വർക്ക്ഫ്ലോകളിലേക്കുള്ള വാതിൽ തുറക്കുന്നു.

ലക്ഷ്യം വ്യക്തമാണ്: വാഗ്ദാനം ചെയ്യുക വളരെ നീണ്ട സന്ദർഭത്തോടുകൂടിയ ഓപ്പൺ-വെയ്റ്റ് മുൻ‌ഗണന നൽകുന്ന, വിപുലമായ തിരയലുകൾ, ഗവേഷണം, കോഡ് സഹായം അല്ലെങ്കിൽ നീണ്ട ചാറ്റുകൾ പോലുള്ള സങ്കീർണ്ണമായ ജോലികൾക്കായി സ്വകാര്യത പ്രാദേശികമായി പ്രവർത്തിക്കുമ്പോൾ ചെലവ് നിയന്ത്രണം.

ലോക്കലായി പ്രവർത്തിക്കുമ്പോൾ gpt-oss-20b എന്താണ് നൽകുന്നത്?

ഓപ്പൺ-വെയ്റ്റ് ജിപിടി മോഡലുകളുടെ ലോക്കൽ എക്സിക്യൂഷൻ

ജിപിടി-ഒഎസ് കുടുംബം മോഡലുകളുമായി അരങ്ങേറ്റം കുറിക്കുന്നു ഓപ്പൺ വെയിറ്റുകൾ നിങ്ങളുടെ സ്വന്തം പരിഹാരങ്ങളിലേക്ക് എളുപ്പത്തിൽ സംയോജിപ്പിക്കാൻ രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു. പ്രത്യേകിച്ചും, ജിപിടി-ഒഎസ്എസ്-20ബി ഒരു ഡെസ്‌ക്‌ടോപ്പ് പിസിക്ക് വേണ്ടി യുക്തിസഹമായ ശേഷിയും ന്യായമായ ഹാർഡ്‌വെയർ ആവശ്യകതകളും സന്തുലിതമാക്കുന്നതിൽ ഇത് വേറിട്ടുനിൽക്കുന്നു.

ഒരു പ്രത്യേക സവിശേഷതയാണ് വിപുലീകൃത സന്ദർഭ വിൻഡോ, gpt-oss ശ്രേണിയിൽ 131.072 ടോക്കണുകൾ വരെ പിന്തുണയ്ക്കുന്നു. ഈ ദൈർഘ്യം സുഗമമാക്കുന്നു നീണ്ട സംഭാഷണങ്ങൾ, വലിയ രേഖകളുടെ വിശകലനം അല്ലെങ്കിൽ മുറിവുകളോ വിഘടനമോ ഇല്ലാതെ ആഴത്തിലുള്ള ചിന്താ ശൃംഖലകൾ.

എക്സ്ക്ലൂസീവ് ഉള്ളടക്കം - ഇവിടെ ക്ലിക്ക് ചെയ്യുക  വിൻഡോസ് 10 ന് എത്ര റാം ആവശ്യമാണ്?

അടച്ച മോഡലുകളുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ, ഓപ്പൺ-വെയ്റ്റ് നിർദ്ദേശം മുൻഗണന നൽകുന്നത് സംയോജന വഴക്കം ആപ്ലിക്കേഷനുകളിൽ: നിന്ന് ഉപകരണങ്ങളുള്ള സഹായികൾ (ഏജന്റുകൾ) പ്ലഗിനുകൾ പോലും ഗവേഷണം, വെബ് തിരയൽ, പ്രോഗ്രാമിംഗ്, എല്ലാം പ്രാദേശിക അനുമാനത്തിന്റെ പ്രയോജനം നേടുന്നു.

പ്രായോഗികമായി പറഞ്ഞാൽ, പാക്കേജ് gpt-oss:20b ഏകദേശം 13 GB ആണ് ജനപ്രിയ റൺടൈം പരിതസ്ഥിതികളിൽ ഇൻസ്റ്റാൾ ചെയ്തിട്ടുണ്ട്. ഇത് ആവശ്യമായ ഉറവിടങ്ങൾക്കായുള്ള ടോൺ സജ്ജമാക്കുകയും സ്കെയിൽ ചെയ്യാൻ സഹായിക്കുകയും ചെയ്യുന്നു. VRAM തടസ്സങ്ങളില്ലാതെ പ്രകടനം നിലനിർത്താൻ.

സാഹചര്യങ്ങൾക്കായി രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്ന ഒരു വലിയ വകഭേദവും (gpt-oss-120b) ഉണ്ട്. കൂടുതൽ വിശാലമായ ഗ്രാഫിക് ഉറവിടങ്ങൾഎന്നിരുന്നാലും, മിക്ക പിസികൾക്കും, ക്സനുമ്ക്സബ് വേഗത, മെമ്മറി, ഗുണനിലവാരം എന്നിവ തമ്മിലുള്ള ബന്ധം കാരണം ഇത് ഏറ്റവും യാഥാർത്ഥ്യബോധമുള്ള ആരംഭ പോയിന്റാണ്.

RTX-നുള്ള ഒപ്റ്റിമൈസേഷൻ: വേഗത, സന്ദർഭം, VRAM

gpt-oss 20b പ്രാദേശികമായി പ്രവർത്തിപ്പിക്കുന്നതിനുള്ള ഉപകരണങ്ങൾ

ജിപിടി-ഒഎസ്എസ് മോഡലുകളെ ആവാസവ്യവസ്ഥയുമായി പൊരുത്തപ്പെടുത്തൽ. എൻ‌വിഡിയ ആർ‌ടി‌എക്സ് ഉയർന്ന ഉൽപ്പാദന നിരക്കുകൾ അനുവദിക്കുന്നു. ഉയർന്ന നിലവാരമുള്ള ഉപകരണങ്ങളിൽ, സെക്കൻഡിൽ 256 ടോക്കണുകൾ വരെയുള്ള പരമാവധി പോയിന്റുകൾ ഉചിതമായ ക്രമീകരണങ്ങളോടെ, നിർദ്ദിഷ്ട ഒപ്റ്റിമൈസേഷനുകളുടെയും കൃത്യതകളുടെയും പ്രയോജനം നേടിക്കൊണ്ട്, MXFP4.

ഫലങ്ങൾ കാർഡ്, സന്ദർഭം, കോൺഫിഗറേഷൻ എന്നിവയെ ആശ്രയിച്ചിരിക്കുന്നു. a ഉപയോഗിച്ചുള്ള പരിശോധനകളിൽ RTX 5080, gpt-oss 20b ചുറ്റും എത്തി 128 ടൺ/സെ. ഉൾക്കൊള്ളുന്ന സന്ദർഭങ്ങൾക്കൊപ്പം (≈8k). വർദ്ധിപ്പിച്ചുകൊണ്ട് 16k വിൻഡോ കൂടാതെ സിസ്റ്റത്തിന്റെ റാമിലേക്ക് കുറച്ച് ലോഡ് നിർബന്ധിച്ചപ്പോൾ, നിരക്ക് ~ ആയി കുറഞ്ഞു.50,5 ടൺ/സെ., മിക്ക ജോലികളും ചെയ്യുന്നത് GPU ആണ്.

എക്സ്ക്ലൂസീവ് ഉള്ളടക്കം - ഇവിടെ ക്ലിക്ക് ചെയ്യുക  ഒരു Rfc എങ്ങനെ പ്രോസസ്സ് ചെയ്യാം

പാഠം വ്യക്തമാണ്: VRAM നിയമങ്ങൾ. പ്രാദേശിക AI-യിൽ, ഒരു കൂടുതൽ മെമ്മറിയുള്ള RTX 3090 പുതിയ GPU-വിനേക്കാൾ മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കാൻ ഇതിന് കഴിയും, പക്ഷേ കുറഞ്ഞ VRAM-ൽ, കാരണം ഇത് ഓവർഫ്ലോ തടയുന്നു സിസ്റ്റം മെമ്മറി സിപിയുവിന്റെ അധിക ഇടപെടലും.

gpt-oss-20b-ക്ക്, മോഡലിന്റെ വലുപ്പം ഒരു റഫറൻസായി എടുക്കുന്നത് സൗകര്യപ്രദമാണ്: ഏകദേശം 13 ബ്രിട്ടൻ കൂടുതൽ സ്ഥലം കെവി കാഷെ തീവ്രമായ ജോലികളും. ഒരു ദ്രുത ഗൈഡ് എന്ന നിലയിൽ, ഇത് ശുപാർശ ചെയ്യുന്നു VRAM- ന്റെ 16 GB കുറഞ്ഞത് ലക്ഷ്യം വയ്ക്കുക 24 ബ്രിട്ടൻ ദൈർഘ്യമേറിയ സന്ദർഭങ്ങളോ സുസ്ഥിരമായ ലോഡുകളോ പ്രതീക്ഷിക്കുന്നുണ്ടെങ്കിൽ.

ഹാർഡ്‌വെയർ ചൂഷണം ചെയ്യാൻ ആഗ്രഹിക്കുന്നവർക്ക് പര്യവേക്ഷണം ചെയ്യാം കാര്യക്ഷമമായ കൃത്യതകൾ (MXFP4 പോലുള്ളവ), സന്ദർഭ ദൈർഘ്യം ക്രമീകരിക്കുക അല്ലെങ്കിൽ സാധ്യമാകുമ്പോൾ മൾട്ടി-GPU കോൺഫിഗറേഷനുകൾ അവലംബിക്കുക, എല്ലായ്പ്പോഴും ലക്ഷ്യം നിലനിർത്തുക. സ്വാപ്പുകൾ ഒഴിവാക്കുക റാമിലേക്ക്.

ഇൻസ്റ്റാളേഷനും ഉപയോഗവും: ഒല്ലാമയും മറ്റ് റൂട്ടുകളും

RTX GPU-കളിലെ GPT-OSS പ്രകടനം

ലളിതമായ രീതിയിൽ മോഡൽ പരീക്ഷിക്കാൻ, ഒള്ളമ RTX-ൽ പ്രവർത്തിക്കുന്ന പിസികളിൽ നേരിട്ടുള്ള അനുഭവം പ്രദാനം ചെയ്യുന്നു: സങ്കീർണ്ണമായ കോൺഫിഗറേഷനുകളില്ലാതെ GPT-OSS-20B ഡൗൺലോഡ് ചെയ്യാനും പ്രവർത്തിപ്പിക്കാനും ചാറ്റ് ചെയ്യാനും നിങ്ങളെ അനുവദിക്കുന്നു., PDF-കൾ, ടെക്സ്റ്റ് ഫയലുകൾ, ഇമേജ് പ്രോംപ്റ്റുകൾ, സന്ദർഭ ക്രമീകരണം എന്നിവ പിന്തുണയ്ക്കുന്നതിന് പുറമേ.

ഉദാഹരണത്തിന്, വിപുലമായ ഉപയോക്താക്കൾക്കായി ഇതര റൂട്ടുകളും ഉണ്ട് വിൻഡോസ് 11-ൽ എൽഎൽഎം ഇൻസ്റ്റാൾ ചെയ്യുക. പോലുള്ള ഫ്രെയിംവർക്കുകൾ call.cpp ലൈബ്രറികൾ ടൈപ്പ് ചെയ്യുക ജിജിഎംഎൽ RTX-നായി ഒപ്റ്റിമൈസ് ചെയ്‌തിരിക്കുന്നു, സമീപകാല ശ്രമങ്ങൾക്കൊപ്പം സിപിയു ലോഡ് കുറയ്ക്കുക മുതലെടുക്കുക CUDA ഗ്രാഫുകൾ. സമാന്തരമായി, മൈക്രോസോഫ്റ്റ് AI ഫൗണ്ടറി ലോക്കൽ (പ്രിവ്യൂവിൽ) CLI, SDK അല്ലെങ്കിൽ API-കൾ വഴി മോഡലുകൾ CUDA, TensorRT ആക്സിലറേഷൻ ഉപയോഗിച്ച് സംയോജിപ്പിക്കുക.

എക്സ്ക്ലൂസീവ് ഉള്ളടക്കം - ഇവിടെ ക്ലിക്ക് ചെയ്യുക  അനുവാദമില്ലാതെ ഓട്ടോറണുകൾ ഉപയോഗിച്ച് ഓട്ടോസ്റ്റാർട്ട് ചെയ്യുന്ന പ്രോഗ്രാമുകൾ എങ്ങനെ നീക്കം ചെയ്യാം

ഉപകരണങ്ങളുടെ ആവാസവ്യവസ്ഥയിൽ, ഇന്റൽ AI പ്ലേഗ്രൗണ്ട് 2.6.0 അതിന്റെ ഓപ്ഷനുകളിൽ gpt-oss-20b ഉൾപ്പെടുത്തിയിട്ടുണ്ട്.പോലുള്ള ഫ്രെയിംവർക്കുകളിലേക്കുള്ള ബാക്കെൻഡുകൾക്കും പുനരവലോകനങ്ങൾക്കുമായി അപ്‌ഡേറ്റ് മികച്ച പതിപ്പിംഗ് നിയന്ത്രണം ചേർക്കുന്നു ഓപ്പൺവിനോ, കോംഫിയുഐ y call.cpp (പിന്തുണയോടെ അഗ്നിപര്വ്വതം സന്ദർഭ ക്രമീകരണം), സൗകര്യമൊരുക്കുന്നു സ്ഥിരമായ പ്രാദേശിക പരിതസ്ഥിതികൾ.

ഒരു സ്റ്റാർട്ടപ്പ് മാർഗ്ഗനിർദ്ദേശം എന്ന നിലയിൽ, പരിശോധിക്കുക ലഭ്യമായ VRAM, നിങ്ങളുടെ GPU-യ്ക്ക് അനുയോജ്യമായ മോഡൽ വേരിയന്റ് ഡൗൺലോഡ് ചെയ്യുക, സാധൂകരിക്കുക ടോക്കൺ പ്രവേഗം പ്രതിനിധി നിർദ്ദേശങ്ങളോടെയും ക്രമീകരണങ്ങളോടെയും സന്ദർഭ വിൻഡോ ഗ്രാഫിക്സ് കാർഡിൽ മുഴുവൻ ലോഡും നിലനിർത്താൻ.

ഈ കഷണങ്ങൾ ഉപയോഗിച്ച്, സഹായികളെ നിർമ്മിക്കാൻ കഴിയും തിരയലും വിശകലനവും, ഉപകരണങ്ങൾ അന്വേഷണം അല്ലെങ്കിൽ പിന്തുണയ്ക്കുന്നവ പ്രോഗ്രാമിംഗ് പൂർണ്ണമായും കമ്പ്യൂട്ടറിൽ പ്രവർത്തിക്കുന്ന, ഡാറ്റാ പരമാധികാരം നിലനിർത്തുന്ന.

gpt-oss-20b യും RTX ആക്സിലറേഷൻ, ശ്രദ്ധാപൂർവ്വമായ VRAM മാനേജ്മെന്റ്, Ollama, llama.cpp, അല്ലെങ്കിൽ AI പ്ലേഗ്രൗണ്ട് പോലുള്ള ഉപകരണങ്ങൾ എന്നിവയും പ്രാദേശികമായി യുക്തിസഹമായ AI പ്രവർത്തിപ്പിക്കുന്നതിനുള്ള ഒരു പക്വമായ ഓപ്ഷൻ ഉറപ്പിക്കുന്നു; ബാഹ്യ സേവനങ്ങളെ ആശ്രയിക്കാതെ പ്രകടനം, ചെലവ്, സ്വകാര്യത എന്നിവ സന്തുലിതമാക്കുന്ന ഒരു പാത.

ജിപിടി-ഒഎസ്എസ്-120ബി
അനുബന്ധ ലേഖനം:
ഓപ്പൺഎഐ gpt-oss-120b പുറത്തിറക്കുന്നു: ഇന്നുവരെയുള്ള അതിന്റെ ഏറ്റവും നൂതനമായ ഓപ്പൺ വെയ്റ്റ് മോഡൽ.