Nemotron 3: Modelau agored NVIDIA ar gyfer AI aml-asiant

Mae Nemotron 3 yn deulu agored o fodelau, data a llyfrgelloedd sy'n canolbwyntio ar AI asiantaidd a systemau aml-asiant.
Mae'n cynnwys tri maint MoE (Nano, Super ac Ultra) gyda phensaernïaeth hybrid a hyfforddiant 4-bit effeithlon ar NVIDIA Blackwell.
Mae Nemotron 3 Nano bellach ar gael yn Ewrop trwy Hugging Face, cwmwl cyhoeddus ac fel microwasanaeth NIM, gyda ffenestr o 1 miliwn o docynnau.
Mae'r ecosystem wedi'i gwblhau gyda setiau data enfawr, NeMo Gym, NeMo RL ac Evaluator i hyfforddi, tiwnio ac archwilio asiantau AI sofran.

Model Deallusrwydd Artiffisial Nemotron 3

Mae'r ras am ddeallusrwydd artiffisial yn symud o sgwrsio robotiaid syml, ynysig i systemau asiant sy'n cydweithio â'i gilydd, yn rheoli llifau gwaith hir, ac sydd angen bod yn archwiliadwy. Yn y senario newydd hwn, Mae NVIDIA wedi penderfynu cymryd cam eithaf clir: agor nid yn unig modelau, ond hefyd data ac offerfel y gall cwmnïau, gweinyddiaethau cyhoeddus a chanolfannau ymchwil adeiladu eu llwyfannau AI eu hunain gyda mwy o reolaeth.

Mae'r mudiad hwnnw'n dod i'r amlwg yn Nemotron 3, teulu o fodelau agored wedi'u hanelu at AI aml-asiant Mae'n ceisio cyfuno perfformiad uchel, costau casglu isel, a thryloywder. Nid yw'r cynnig wedi'i fwriadu fel sgwrsbot cyffredinol arall, ond fel sylfaen i ddefnyddio asiantau sy'n rhesymu, cynllunio a chyflawni tasgau cymhleth mewn sectorau rheoleiddiedigMae hyn yn arbennig o berthnasol yn Ewrop a Sbaen, lle mae sofraniaeth data a chydymffurfiaeth reoleiddiol yn bwysig.

Teulu agored o fodelau ar gyfer AI asiantaidd a sofran

Cyflwynir Nemotron 3 fel ecosystem gyflawn: modelau, setiau data, llyfrgelloedd a ryseitiau hyfforddi o dan drwyddedau agored. Syniad NVIDIA yw nad yn unig y mae sefydliadau'n defnyddio AI fel gwasanaeth anhryloyw, ond y gallant archwilio beth sydd y tu mewn, addasu'r modelau i'w parthau, a'u defnyddio ar eu seilwaith eu hunain, boed yn y cwmwl neu mewn canolfannau data lleol.

Mae'r cwmni'n fframio'r strategaeth hon o fewn ei ymrwymiad i AI SofranMae llywodraethau a chwmnïau yn Ewrop, De Korea, a rhanbarthau eraill yn chwilio am ddewisiadau amgen agored i systemau caeedig neu dramor, nad ydynt yn aml yn cyd-fynd yn dda â'u cyfreithiau diogelu data na'u gofynion archwilio. Nod Nemotron 3 yw bod yn sylfaen dechnegol i adeiladu modelau cenedlaethol, sectoraidd, neu gorfforaethol arni gyda mwy o welededd a rheolaeth.

Ochr yn ochr, Mae NVIDIA yn cryfhau ei safle y tu hwnt i galedweddHyd yn hyn, darparwr GPU cyfeiriol ydoedd yn bennaf; gyda Nemotron 3, mae hefyd yn gosod ei hun yn yr haen offer modelu a hyfforddi, gan gystadlu'n fwy uniongyrchol â chwaraewyr fel OpenAI, Google, Anthropic, neu hyd yn oed Meta, ac yn erbyn modelau premiwm fel SuperGrok TrwmMae Meta wedi bod yn lleihau ei ymrwymiad i ffynhonnell agored yn y cenedlaethau diweddar o Llama.

I'r ecosystem ymchwil a busnesau newydd Ewropeaidd—sy'n ddibynnol iawn ar fodelau agored a gynhelir ar lwyfannau fel Hugging Face—mae argaeledd pwysau, data synthetig, a llyfrgelloedd o dan drwyddedau agored yn cynrychioli dewis arall pwerus i'r modelau Tsieineaidd ac Americanwyr sy'n dominyddu'r poblogrwydd a'r safleoedd meincnod.

Cynnwys unigryw - Cliciwch Yma Sut i drwsio fy AI nad yw'n ymddangos ar Snapchat

Pensaernïaeth hybrid MoE: effeithlonrwydd ar gyfer asiantau ar raddfa fawr

Nodwedd dechnegol ganolog Nemotron 3 yw a Pensaernïaeth hybrid o gymysgedd cudd o arbenigwyr (MoE)Yn lle actifadu holl baramedrau'r model ym mhob casgliad, dim ond cyfran ohonynt sy'n cael eu troi ymlaen, sef yr is-set o arbenigwyr sydd fwyaf perthnasol i'r dasg neu'r tocyn dan sylw.

Mae'r dull hwn yn caniatáu lleihau cost gyfrifiadurol a defnydd cof yn sylweddolMae hyn hefyd yn cynyddu trwybwn tocynnau. Ar gyfer pensaernïaethau aml-asiant, lle mae dwsinau neu gannoedd o asiantau yn cyfnewid negeseuon yn barhaus, mae'r effeithlonrwydd hwn yn allweddol i atal y system rhag dod yn anghynaladwy o ran costau GPU a chwmwl.

Yn ôl data a rennir gan NVIDIA a meincnodau annibynnol, mae'r Nemotron 3 Nano yn cyflawni hyd at bedair gwaith yn fwy o docynnau yr eiliad O'i gymharu â'i ragflaenydd, y Nemotron 2 Nano, mae'n lleihau cynhyrchu tocynnau rhesymu diangen tua 60%. Yn ymarferol, mae hyn yn golygu atebion cywir yr un mor gywir neu hyd yn oed yn fwy cywir, ond gyda llai o "eiriau" a chost is fesul ymholiad.

Mae pensaernïaeth hybrid y MoE, ynghyd â thechnegau hyfforddi penodol, wedi arwain at Mae llawer o'r modelau agored mwyaf datblygedig yn mabwysiadu cynlluniau arbenigol.Mae Nemotron 3 yn ymuno â'r duedd hon, ond mae'n canolbwyntio'n benodol ar AI asiantaidd: llwybrau mewnol wedi'u cynllunio ar gyfer cydlynu rhwng asiantau, defnyddio offer, trin cyflyrau hir, a chynllunio cam wrth gam.

Tri maint: Nano, Super, ac Ultra ar gyfer gwahanol lwythi gwaith

Pensaernïaeth model Nemotron 3

Mae teulu Nemotron 3 wedi'i drefnu yn tri phrif faint o fodel MoE, pob un ohonynt ar agor a chyda pharamedrau gweithredol llai diolch i'r bensaernïaeth arbenigol:

Nemotron 3 Nanotua 30.000 biliwn o baramedrau i gyd, gyda thua 3.000 biliwn o asedau fesul tocynFe'i cynlluniwyd ar gyfer tasgau wedi'u targedu lle mae effeithlonrwydd yn bwysig: dadfygio meddalwedd, crynhoi dogfennau, adfer gwybodaeth, monitro systemau, neu gynorthwywyr AI arbenigol.
Nemotron 3 Supertua 100.000 biliwn o baramedrau, gyda 10.000 biliwn mewn asedau ym mhob cam. Mae wedi'i anelu at Rhesymu uwch mewn pensaernïaeth aml-asiantgyda hwyrni isel hyd yn oed pan fydd nifer o asiantau'n cydweithio i ddatrys llifau cymhleth.
Nemotron 3 Ultra: y lefel uchaf, gyda thua 500.000 biliwn o baramedrau a hyd at 50.000 biliwn o asedau fesul tocynMae'n gweithredu fel peiriant rhesymu pwerus ar gyfer ymchwil, cynllunio strategol, cefnogaeth i benderfyniadau lefel uchel, a systemau AI sy'n arbennig o heriol.

Yn ymarferol, mae hyn yn caniatáu i sefydliadau Dewiswch faint y model yn ôl eich cyllideb a'ch gofynionNano ar gyfer llwythi gwaith enfawr, dwys a chostau tynn; Super pan fo angen mwy o ddyfnder rhesymu gyda llawer o asiantau cydweithredol; ac Ultra ar gyfer achosion lle mae ansawdd a chyd-destun hir yn drech na chost GPU.

Cynnwys unigryw - Cliciwch Yma Yr apiau deallusrwydd artiffisial gorau ar gyfer astudio a chael graddau gwell

Am y tro, Dim ond y Nemotron 3 Nano sydd ar gael i'w ddefnyddio ar unwaith.Mae'r amrywiadau Super ac Ultra wedi'u cynllunio ar gyfer hanner cyntaf 2026, gan roi amser i gwmnïau a labordai Ewropeaidd arbrofi gyda Nano yn gyntaf, sefydlu piblinellau ac, yn ddiweddarach, mudo achosion sydd angen mwy o gapasiti.

Nemotron 3 Nano: ffenestr tocynnau 1 miliwn a chost wedi'i chynnwys

Mae Nemotron 3 Nano, o heddiw ymlaen, blaen ymarferol y teuluMae NVIDIA yn ei ddisgrifio fel y model mwyaf cost-effeithlon o ran cyfrifiadura yn yr ystod, wedi'i optimeiddio i gyflawni'r perfformiad mwyaf mewn llifau gwaith aml-asiant a thasgau dwys ond ailadroddus.

Ymhlith ei nodweddion technegol, mae'r canlynol yn sefyll allan: ffenestr gyd-destun o hyd at filiwn o docynnauMae hyn yn caniatáu cadw cof ar gyfer dogfennau helaeth, cronfeydd cod cyfan, neu brosesau busnes aml-gam. Ar gyfer cymwysiadau Ewropeaidd mewn bancio, gofal iechyd, neu weinyddiaeth gyhoeddus, lle gall cofnodion fod yn swmpus, mae'r gallu cyd-destun hirdymor hwn yn arbennig o werthfawr.

Meincnodau'r sefydliad annibynnol Mae dadansoddiad artiffisial yn gosod Nemotron 3 Nano fel un o'r modelau ffynhonnell agored mwyaf cytbwys Mae'n cyfuno deallusrwydd, cywirdeb a chyflymder, gyda chyfraddau trwybwn o gannoedd o docynnau yr eiliad. Mae'r cyfuniad hwn yn ei gwneud yn ddeniadol i integreiddwyr AI a darparwyr gwasanaethau yn Sbaen sydd angen profiad defnyddiwr da heb gostau seilwaith sy'n codi'n sydyn.

O ran achosion defnydd, mae NVIDIA yn targedu Nano yn Crynodeb o gynnwys, dadfygio meddalwedd, adfer gwybodaeth, a chynorthwywyr AI menterDiolch i'r gostyngiad mewn tocynnau rhesymu diangen, mae'n bosibl rhedeg asiantau sy'n cynnal sgyrsiau hir gyda defnyddwyr neu systemau heb i'r bil casgliadau godi'n sydyn.

Data agored a llyfrgelloedd: NeMo Gym, NeMo RL ac Evaluator

Llyfrgelloedd NeMo

Un o nodweddion mwyaf nodedig Nemotron 3 yw bod Nid yw wedi'i gyfyngu i ryddhau pwysau modelMae NVIDIA yn cyd-fynd â'r teulu gyda chyfres gynhwysfawr o adnoddau agored ar gyfer hyfforddi, tiwnio a gwerthuso asiantau.

Ar y naill law, mae'n darparu corpws synthetig o sawl triliwn o docynnau o ddata cyn-hyfforddi, ôl-hyfforddi ac atgyfnerthuMae'r setiau data hyn, sy'n canolbwyntio ar resymu, codio, a llifau gwaith aml-gam, yn caniatáu i gwmnïau a chanolfannau ymchwil gynhyrchu eu hamrywiadau penodol eu hunain o Nemotron (e.e., cyfreithiol, gofal iechyd, neu ddiwydiannol) heb ddechrau o'r dechrau.

Ymhlith yr adnoddau hyn, mae'r canlynol yn sefyll allan: Set ddata Diogelwch Asiant NemotronMae'n casglu data telemetreg ar ymddygiad asiantau mewn senarios byd go iawn. Ei nod yw helpu timau i fesur a chryfhau diogelwch systemau ymreolaethol cymhleth: o ba gamau y mae asiant yn eu cymryd pan fydd yn dod ar draws data sensitif, i sut mae'n ymateb i orchmynion amwys neu a allai fod yn niweidiol.

Cynnwys unigryw - Cliciwch Yma Wicipedia dan bwysau dros draffig enfawr ymlusgo AI

O ran yr adran offer, mae NVIDIA yn lansio NeMo Gym a NeMo RL fel llyfrgelloedd ffynhonnell agored ar gyfer hyfforddiant atgyfnerthu ac ôl-hyfforddiant, ynghyd â Gwerthuswr NeMo ar gyfer asesu diogelwch a pherfformiad. Mae'r llyfrgelloedd hyn yn darparu amgylcheddau efelychu a phiblinellau parod i'w defnyddio gyda theulu Nemotron, ond gellir eu hymestyn i fodelau eraill.

Mae'r holl ddeunydd hwn—pwysau, setiau data, a chod—wedi'i ddosbarthu drwy Mae GitHub a Hugging Face wedi'u trwyddedu o dan Drwydded Model Agored NVIDIA.fel y gall timau Ewropeaidd ei integreiddio'n ddi-dor i'w MLOps eu hunain. Mae cwmnïau fel Prime Intellect ac Unsloth eisoes yn ymgorffori NeMo Gym yn uniongyrchol i'w llif gwaith i symleiddio dysgu atgyfnerthu ar Nemotron.

Argaeledd mewn cwmwl cyhoeddus ac ecosystem Ewrop

Wyneb Cwtsio Nano Nemotron 3

Mae Nemotron 3 Nano ar gael nawr yn Wyneb Cofleidio y GitHubyn ogystal â thrwy ddarparwyr casgliadau fel Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter, a Together AI. Mae hyn yn agor y drws i dimau datblygu yn Sbaen brofi'r model trwy API neu ei ddefnyddio ar eu seilweithiau eu hunain heb gymhlethdod gormodol.

Ar flaen y cwmwl, Mae Nemotron 3 Nano yn ymuno ag AWS trwy Amazon Bedrock ar gyfer casglu di-weinyddion, ac mae wedi cyhoeddi cefnogaeth i Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale, a Yotta. I sefydliadau Ewropeaidd sydd eisoes yn gweithio ar y llwyfannau hyn, mae hyn yn ei gwneud hi'n haws mabwysiadu Nemotron heb newidiadau sylweddol i'w pensaernïaeth.

Yn ogystal â'r cwmwl cyhoeddus, mae NVIDIA yn hyrwyddo defnyddio Nemotron 3 Nano fel Microwasanaeth NIM y gellir ei ddefnyddio ar unrhyw seilwaith sy'n cael ei gyflymu gan NVIDIAMae hyn yn caniatáu ar gyfer senarios hybrid: rhan o'r llwyth mewn cymylau rhyngwladol a rhan mewn canolfannau data lleol neu mewn cymylau Ewropeaidd sy'n blaenoriaethu preswylio data yn yr UE.

Y fersiynau Nemotron 3 Super ac Ultra, wedi'u hanelu at lwythi gwaith rhesymu eithafol a systemau aml-asiant ar raddfa fawr, yn wedi'i gynllunio ar gyfer hanner cyntaf 2026Mae'r amserlen hon yn rhoi amser i ecosystem ymchwil a busnes Ewrop arbrofi gyda Nano, dilysu achosion defnydd, a dylunio strategaethau mudo i fodelau mwy pan fo angen.

Mae Nemotron 3 yn gosod NVIDIA fel un o brif ddarparwyr modelau agored pen uchel wedi'u hanelu at AI asiantaiddGyda chynnig sy'n cyfuno effeithlonrwydd technegol (MoE hybrid, NVFP4, cyd-destun enfawr), agoredrwydd (pwysau, setiau data a llyfrgelloedd sydd ar gael) a ffocws clir ar sofraniaeth a thryloywder data, agweddau sy'n arbennig o sensitif yn Sbaen a gweddill Ewrop, lle mae rheoleiddio a phwysau i archwilio AI yn gynyddol fwy.

Erthygl gysylltiedig:

Mae Microsoft Discovery AI yn gyrru datblygiadau gwyddonol ac addysgol gyda deallusrwydd artiffisial wedi'i bersonoli

Alberto Navarro

Rwy'n frwd dros dechnoleg sydd wedi troi ei ddiddordebau "geek" yn broffesiwn. Rwyf wedi treulio mwy na 10 mlynedd o fy mywyd yn defnyddio technoleg flaengar ac yn tinkering gyda phob math o raglenni allan o chwilfrydedd pur. Nawr rydw i wedi arbenigo mewn technoleg gyfrifiadurol a gemau fideo. Mae hyn oherwydd ers mwy na 5 mlynedd rwyf wedi bod yn ysgrifennu ar gyfer gwefannau amrywiol ar dechnoleg a gemau fideo, gan greu erthyglau sy'n ceisio rhoi'r wybodaeth sydd ei hangen arnoch mewn iaith sy'n ddealladwy i bawb.

Os oes gennych unrhyw gwestiynau, mae fy ngwybodaeth yn amrywio o bopeth sy'n ymwneud â system weithredu Windows yn ogystal ag Android ar gyfer ffonau symudol. Ac mae fy ymrwymiad i chi, rwyf bob amser yn barod i dreulio ychydig funudau a'ch helpu i ddatrys unrhyw gwestiynau sydd gennych yn y byd rhyngrwyd hwn.