Nemotron 3: Bet agored mawr NVIDIA ar gyfer AI aml-asiant

Diweddariad diwethaf: 17/12/2025

  • Mae Nemotron 3 yn deulu agored o fodelau, data a llyfrgelloedd sy'n canolbwyntio ar AI asiantaidd a systemau aml-asiant.
  • Mae'n cynnwys tri maint MoE (Nano, Super ac Ultra) gyda phensaernïaeth hybrid a hyfforddiant 4-bit effeithlon ar NVIDIA Blackwell.
  • Mae Nemotron 3 Nano bellach ar gael yn Ewrop trwy Hugging Face, cwmwl cyhoeddus ac fel microwasanaeth NIM, gyda ffenestr o 1 miliwn o docynnau.
  • Mae'r ecosystem wedi'i gwblhau gyda setiau data enfawr, NeMo Gym, NeMo RL ac Evaluator i hyfforddi, tiwnio ac archwilio asiantau AI sofran.

Model Deallusrwydd Artiffisial Nemotron 3

Mae'r ras am ddeallusrwydd artiffisial yn symud o sgwrsio robotiaid syml, ynysig i systemau asiant sy'n cydweithio â'i gilydd, yn rheoli llifau gwaith hir, ac sydd angen bod yn archwiliadwy. Yn y senario newydd hwn, Mae NVIDIA wedi penderfynu cymryd cam eithaf clir: agor nid yn unig modelau, ond hefyd data ac offerfel y gall cwmnïau, gweinyddiaethau cyhoeddus a chanolfannau ymchwil adeiladu eu llwyfannau AI eu hunain gyda mwy o reolaeth.

Mae'r mudiad hwnnw'n dod i'r amlwg yn Nemotron 3, teulu o fodelau agored wedi'u hanelu at AI aml-asiant Mae'n ceisio cyfuno perfformiad uchel, costau casglu isel, a thryloywder. Nid yw'r cynnig wedi'i fwriadu fel sgwrsbot cyffredinol arall, ond fel sylfaen i ddefnyddio asiantau sy'n rhesymu, cynllunio a chyflawni tasgau cymhleth mewn sectorau rheoleiddiedigMae hyn yn arbennig o berthnasol yn Ewrop a Sbaen, lle mae sofraniaeth data a chydymffurfiaeth reoleiddiol yn bwysig.

Teulu agored o fodelau ar gyfer AI asiantaidd a sofran

Cyflwynir Nemotron 3 fel ecosystem gyflawn: modelau, setiau data, llyfrgelloedd a ryseitiau hyfforddi o dan drwyddedau agored. Syniad NVIDIA yw nad yn unig y mae sefydliadau'n defnyddio AI fel gwasanaeth anhryloyw, ond y gallant archwilio beth sydd y tu mewn, addasu'r modelau i'w parthau, a'u defnyddio ar eu seilwaith eu hunain, boed yn y cwmwl neu mewn canolfannau data lleol.

Mae'r cwmni'n fframio'r strategaeth hon o fewn ei ymrwymiad i Sofran AIMae llywodraethau a chwmnïau yn Ewrop, De Korea, a rhanbarthau eraill yn chwilio am ddewisiadau amgen agored i systemau caeedig neu dramor, nad ydynt yn aml yn cyd-fynd yn dda â'u cyfreithiau diogelu data na'u gofynion archwilio. Nod Nemotron 3 yw bod yn sylfaen dechnegol i adeiladu modelau cenedlaethol, sectoraidd, neu gorfforaethol arni gyda mwy o welededd a rheolaeth.

Ochr yn ochr, Mae NVIDIA yn cryfhau ei safle y tu hwnt i galedweddHyd yn hyn, darparwr GPU cyfeiriol ydoedd yn bennaf; gyda Nemotron 3, mae hefyd yn gosod ei hun yn yr haen offer modelu a hyfforddi, gan gystadlu'n fwy uniongyrchol â chwaraewyr fel OpenAI, Google, Anthropic, neu hyd yn oed Meta, ac yn erbyn modelau premiwm fel SuperGrok TrwmMae Meta wedi bod yn lleihau ei ymrwymiad i ffynhonnell agored yn y cenedlaethau diweddar o Llama.

I'r ecosystem ymchwil a busnesau newydd Ewropeaidd—sy'n ddibynnol iawn ar fodelau agored a gynhelir ar lwyfannau fel Hugging Face—mae argaeledd pwysau, data synthetig, a llyfrgelloedd o dan drwyddedau agored yn cynrychioli dewis arall pwerus i'r modelau Tsieineaidd ac Americanwyr sy'n dominyddu'r poblogrwydd a'r safleoedd meincnod.

Cynnwys unigryw - Cliciwch Yma  Ni fydd Microsoft Store yn agor neu'n cau'n barhaus: atebion manwl

Pensaernïaeth hybrid MoE: effeithlonrwydd ar gyfer asiantau ar raddfa fawr

Nodwedd dechnegol ganolog Nemotron 3 yw a Pensaernïaeth hybrid o gymysgedd cudd o arbenigwyr (MoE)Yn lle actifadu holl baramedrau'r model ym mhob casgliad, dim ond cyfran ohonynt sy'n cael eu troi ymlaen, sef yr is-set o arbenigwyr sydd fwyaf perthnasol i'r dasg neu'r tocyn dan sylw.

Mae'r dull hwn yn caniatáu lleihau cost gyfrifiadurol a defnydd cof yn sylweddolMae hyn hefyd yn cynyddu trwybwn tocynnau. Ar gyfer pensaernïaethau aml-asiant, lle mae dwsinau neu gannoedd o asiantau yn cyfnewid negeseuon yn barhaus, mae'r effeithlonrwydd hwn yn allweddol i atal y system rhag dod yn anghynaladwy o ran costau GPU a chwmwl.

Yn ôl data a rennir gan NVIDIA a meincnodau annibynnol, mae'r Nemotron 3 Nano yn cyflawni hyd at bedair gwaith yn fwy o docynnau yr eiliad O'i gymharu â'i ragflaenydd, y Nemotron 2 Nano, mae'n lleihau cynhyrchu tocynnau rhesymu diangen tua 60%. Yn ymarferol, mae hyn yn golygu atebion cywir yr un mor gywir neu hyd yn oed yn fwy cywir, ond gyda llai o "eiriau" a chost is fesul ymholiad.

Mae pensaernïaeth hybrid y MoE, ynghyd â thechnegau hyfforddi penodol, wedi arwain at Mae llawer o'r modelau agored mwyaf datblygedig yn mabwysiadu cynlluniau arbenigol.Mae Nemotron 3 yn ymuno â'r duedd hon, ond mae'n canolbwyntio'n benodol ar AI asiantaidd: llwybrau mewnol wedi'u cynllunio ar gyfer cydlynu rhwng asiantau, defnyddio offer, trin cyflyrau hir, a chynllunio cam wrth gam.

Tri maint: Nano, Super, ac Ultra ar gyfer gwahanol lwythi gwaith

Pensaernïaeth model Nemotron 3

Mae teulu Nemotron 3 wedi'i drefnu yn tri phrif faint o fodel MoE, pob un ohonynt ar agor a chyda pharamedrau gweithredol llai diolch i'r bensaernïaeth arbenigol:

  • Nemotron 3 Nanotua 30.000 biliwn o baramedrau i gyd, gyda thua 3.000 biliwn o asedau fesul tocynFe'i cynlluniwyd ar gyfer tasgau wedi'u targedu lle mae effeithlonrwydd yn bwysig: dadfygio meddalwedd, crynhoi dogfennau, adfer gwybodaeth, monitro systemau, neu gynorthwywyr AI arbenigol.
  • Nemotron 3 Supertua 100.000 biliwn o baramedrau, gyda 10.000 biliwn mewn asedau ym mhob cam. Mae wedi'i anelu at Rhesymu uwch mewn pensaernïaeth aml-asiantgyda hwyrni isel hyd yn oed pan fydd nifer o asiantau'n cydweithio i ddatrys llifau cymhleth.
  • Nemotron 3 Ultra: y lefel uchaf, gyda thua 500.000 biliwn o baramedrau a hyd at 50.000 biliwn o asedau fesul tocynMae'n gweithredu fel peiriant rhesymu pwerus ar gyfer ymchwil, cynllunio strategol, cefnogaeth i benderfyniadau lefel uchel, a systemau AI sy'n arbennig o heriol.

Yn ymarferol, mae hyn yn caniatáu i sefydliadau Dewiswch faint y model yn ôl eich cyllideb a'ch gofynionNano ar gyfer llwythi gwaith enfawr, dwys a chostau tynn; Super pan fo angen mwy o ddyfnder rhesymu gyda llawer o asiantau cydweithredol; ac Ultra ar gyfer achosion lle mae ansawdd a chyd-destun hir yn drech na chost GPU.

Cynnwys unigryw - Cliciwch Yma  TAG Heuer Connected Calibre E5: y naid i feddalwedd perchnogol ac argraffiad New Balance

Am y tro, Dim ond y Nemotron 3 Nano sydd ar gael i'w ddefnyddio ar unwaith.Mae'r amrywiadau Super ac Ultra wedi'u cynllunio ar gyfer hanner cyntaf 2026, gan roi amser i gwmnïau a labordai Ewropeaidd arbrofi gyda Nano yn gyntaf, sefydlu piblinellau ac, yn ddiweddarach, mudo achosion sydd angen mwy o gapasiti.

Nemotron 3 Nano: ffenestr tocynnau 1 miliwn a chost wedi'i chynnwys

Nemotron 3 Nano

Mae Nemotron 3 Nano, o heddiw ymlaen, blaen ymarferol y teuluMae NVIDIA yn ei ddisgrifio fel y model mwyaf cost-effeithlon o ran cyfrifiadura yn yr ystod, wedi'i optimeiddio i gyflawni'r perfformiad mwyaf mewn llifau gwaith aml-asiant a thasgau dwys ond ailadroddus.

Ymhlith ei nodweddion technegol, mae'r canlynol yn sefyll allan: ffenestr gyd-destun o hyd at filiwn o docynnauMae hyn yn caniatáu cadw cof ar gyfer dogfennau helaeth, cronfeydd cod cyfan, neu brosesau busnes aml-gam. Ar gyfer cymwysiadau Ewropeaidd mewn bancio, gofal iechyd, neu weinyddiaeth gyhoeddus, lle gall cofnodion fod yn swmpus, mae'r gallu cyd-destun hirdymor hwn yn arbennig o werthfawr.

Meincnodau'r sefydliad annibynnol Mae dadansoddiad artiffisial yn gosod Nemotron 3 Nano fel un o'r modelau ffynhonnell agored mwyaf cytbwys Mae'n cyfuno deallusrwydd, cywirdeb a chyflymder, gyda chyfraddau trwybwn o gannoedd o docynnau yr eiliad. Mae'r cyfuniad hwn yn ei gwneud yn ddeniadol i integreiddwyr AI a darparwyr gwasanaethau yn Sbaen sydd angen profiad defnyddiwr da heb gostau seilwaith sy'n codi'n sydyn.

O ran achosion defnydd, mae NVIDIA yn targedu Nano yn Crynodeb o gynnwys, dadfygio meddalwedd, adfer gwybodaeth, a chynorthwywyr AI menterDiolch i'r gostyngiad mewn tocynnau rhesymu diangen, mae'n bosibl rhedeg asiantau sy'n cynnal sgyrsiau hir gyda defnyddwyr neu systemau heb i'r bil casgliadau godi'n sydyn.

Data agored a llyfrgelloedd: NeMo Gym, NeMo RL ac Evaluator

Llyfrgelloedd NeMo

Un o nodweddion mwyaf nodedig Nemotron 3 yw bod Nid yw wedi'i gyfyngu i ryddhau pwysau modelMae NVIDIA yn cyd-fynd â'r teulu gyda chyfres gynhwysfawr o adnoddau agored ar gyfer hyfforddi, tiwnio a gwerthuso asiantau.

Ar y naill law, mae'n darparu corpws synthetig o sawl triliwn o docynnau o ddata cyn-hyfforddi, ôl-hyfforddi ac atgyfnerthuMae'r setiau data hyn, sy'n canolbwyntio ar resymu, codio, a llifau gwaith aml-gam, yn caniatáu i gwmnïau a chanolfannau ymchwil gynhyrchu eu hamrywiadau penodol eu hunain o Nemotron (e.e., cyfreithiol, gofal iechyd, neu ddiwydiannol) heb ddechrau o'r dechrau.

Ymhlith yr adnoddau hyn, mae'r canlynol yn sefyll allan: Set ddata Diogelwch Asiant NemotronMae'n casglu data telemetreg ar ymddygiad asiantau mewn senarios byd go iawn. Ei nod yw helpu timau i fesur a chryfhau diogelwch systemau ymreolaethol cymhleth: o ba gamau y mae asiant yn eu cymryd pan fydd yn dod ar draws data sensitif, i sut mae'n ymateb i orchmynion amwys neu a allai fod yn niweidiol.

Cynnwys unigryw - Cliciwch Yma  Y nodweddion diweddaraf sy'n dod i Windows 11: deallusrwydd artiffisial a ffyrdd newydd o reoli eich cyfrifiadur personol

O ran yr adran offer, mae NVIDIA yn lansio NeMo Gym a NeMo RL fel llyfrgelloedd ffynhonnell agored ar gyfer hyfforddiant atgyfnerthu ac ôl-hyfforddiant, ynghyd â Gwerthuswr NeMo ar gyfer asesu diogelwch a pherfformiad. Mae'r llyfrgelloedd hyn yn darparu amgylcheddau efelychu a phiblinellau parod i'w defnyddio gyda theulu Nemotron, ond gellir eu hymestyn i fodelau eraill.

Mae'r holl ddeunydd hwn—pwysau, setiau data, a chod—wedi'i ddosbarthu drwy Mae GitHub a Hugging Face wedi'u trwyddedu o dan Drwydded Model Agored NVIDIA.fel y gall timau Ewropeaidd ei integreiddio'n ddi-dor i'w MLOps eu hunain. Mae cwmnïau fel Prime Intellect ac Unsloth eisoes yn ymgorffori NeMo Gym yn uniongyrchol i'w llif gwaith i symleiddio dysgu atgyfnerthu ar Nemotron.

Argaeledd mewn cwmwl cyhoeddus ac ecosystem Ewrop

Wyneb Cwtsio Nano Nemotron 3

Mae Nemotron 3 Nano ar gael nawr yn Wyneb Hugging y GitHubyn ogystal â thrwy ddarparwyr casgliadau fel Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, a Together AI. Mae hyn yn agor y drws i dimau datblygu yn Sbaen brofi'r model trwy API neu ei ddefnyddio ar eu seilweithiau eu hunain heb gymhlethdod gormodol.

Ar flaen y cwmwl, Mae Nemotron 3 Nano yn ymuno ag AWS trwy Amazon Bedrock ar gyfer casglu di-weinyddion, ac mae wedi cyhoeddi cefnogaeth i Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale, a Yotta. I sefydliadau Ewropeaidd sydd eisoes yn gweithio ar y llwyfannau hyn, mae hyn yn ei gwneud hi'n haws mabwysiadu Nemotron heb newidiadau sylweddol i'w pensaernïaeth.

Yn ogystal â'r cwmwl cyhoeddus, mae NVIDIA yn hyrwyddo defnyddio Nemotron 3 Nano fel Microwasanaeth NIM y gellir ei ddefnyddio ar unrhyw seilwaith sy'n cael ei gyflymu gan NVIDIAMae hyn yn caniatáu ar gyfer senarios hybrid: rhan o'r llwyth mewn cymylau rhyngwladol a rhan mewn canolfannau data lleol neu mewn cymylau Ewropeaidd sy'n blaenoriaethu preswylio data yn yr UE.

Y fersiynau Nemotron 3 Super ac Ultra, wedi'u hanelu at lwythi gwaith rhesymu eithafol a systemau aml-asiant ar raddfa fawr, yn wedi'i gynllunio ar gyfer hanner cyntaf 2026Mae'r amserlen hon yn rhoi amser i ecosystem ymchwil a busnes Ewrop arbrofi gyda Nano, dilysu achosion defnydd, a dylunio strategaethau mudo i fodelau mwy pan fo angen.

Mae Nemotron 3 yn gosod NVIDIA fel un o brif ddarparwyr modelau agored pen uchel wedi'u hanelu at AI asiantaiddGyda chynnig sy'n cyfuno effeithlonrwydd technegol (MoE hybrid, NVFP4, cyd-destun enfawr), agoredrwydd (pwysau, setiau data a llyfrgelloedd sydd ar gael) a ffocws clir ar sofraniaeth a thryloywder data, agweddau sy'n arbennig o sensitif yn Sbaen a gweddill Ewrop, lle mae rheoleiddio a phwysau i archwilio AI yn gynyddol fwy.

Microsoft Discovery IA-2
Erthygl gysylltiedig:
Mae Microsoft Discovery AI yn gyrru datblygiadau gwyddonol ac addysgol gyda deallusrwydd artiffisial wedi'i bersonoli