Nemotron 3: NVIDIAn avoimet mallit moniagenttiselle tekoälylle

Nemotron 3 on avoin mallien, datan ja kirjastojen perhe, joka keskittyy agenttiseen tekoälyyn ja moniagenttijärjestelmiin.
Se sisältää kolme MoE-kokoa (Nano, Super ja Ultra) hybridiarkkitehtuurilla ja tehokkaalla 4-bittisellä koulutuksella NVIDIA Blackwellillä.
Nemotron 3 Nano on nyt saatavilla Euroopassa Hugging Facen, julkisten pilvipalveluiden ja NIM-mikropalvelun kautta, ja siinä on miljoonan tokenin ikkuna.
Ekosysteemiä täydentävät massiiviset datajoukot, NeMo Gym, NeMo RL ja Evaluator itsenäisten tekoälyagenttien kouluttamiseen, virittämiseen ja auditointiin.

Nemotron 3 -tekoälymalli

Tekoälyn kilpailu on siirtymässä yksinkertaisista, erillisistä chatboteista agenttijärjestelmiin, jotka tekevät yhteistyötä keskenään, hallitsevat pitkiä työnkulkuja ja joiden on oltava auditoitavissa. Tässä uudessa skenaariossa NVIDIA on päättänyt ottaa melko selkeän askeleen: avata paitsi mallit, myös datan ja työkalutjotta yritykset, julkishallinnot ja tutkimuskeskukset voivat rakentaa omia tekoälyalustojaan entistä paremmin hallittuna.

Tuo liike konkretisoituu siinä, Nemotron 3, avoimen mallin perhe, joka on suunnattu moniagenttiseen tekoälyyn Se pyrkii yhdistämään korkean suorituskyvyn, alhaiset päättelykustannukset ja läpinäkyvyyden. Ehdotusta ei ole tarkoitettu vain yhdeksi yleiskäyttöiseksi chatbotiksi, vaan… tukikohta, jolle voidaan sijoittaa agentteja, jotka päättelevät, suunnittelevat ja suorittavat monimutkaisia tehtäviä säännellyillä aloillaTämä on erityisen tärkeää Euroopassa ja Espanjassa, joissa datasuvereniteetti ja sääntelyn noudattaminen ovat tärkeitä.

Avoin malliperhe agenttiselle ja itsenäiselle tekoälylle

Nemotron 3 esitetään seuraavasti täydellinen ekosysteemi: mallit, datajoukot, kirjastot ja harjoitusreseptit avoimien lisenssien alaisuudessa. NVIDIAn ajatuksena on, että organisaatiot eivät ainoastaan käytä tekoälyä läpinäkymättömänä palveluna, vaan voivat myös tarkastaa sen sisällön, mukauttaa mallit omiin toimialueisiinsa ja ottaa ne käyttöön omassa infrastruktuurissaan, joko pilvessä tai paikallisissa datakeskuksissa.

Yhtiö kehystää tämän strategian sitoutumisensa puitteissa Suvereeni tekoälyHallitukset ja yritykset Euroopassa, Etelä-Koreassa ja muilla alueilla etsivät avoimia vaihtoehtoja suljetuille tai ulkomaisille järjestelmille, jotka eivät usein ole linjassa heidän tietosuojalakien tai auditointivaatimusten kanssa. Nemotron 3:n tavoitteena on olla tekninen perusta, jolle voidaan rakentaa kansallisia, sektorikohtaisia tai yrityskohtaisia malleja, joilla on parempi näkyvyys ja hallinta.

Samanaikaisesti NVIDIA vahvistaa asemaansa laitteiston ulkopuolellaTähän asti se on ollut ensisijaisesti referenssi-GPU-toimittaja; Nemotron 3:n myötä se on myös asemoinut itsensä mallinnus- ja koulutustyökalujen tasolle kilpaillen suoremmin toimijoiden, kuten OpenAI:n, Googlen, Anthropicin tai jopa Metan, kanssa ja premium-mallien, kuten SuperGrok HeavyMeta on vähentänyt sitoutumistaan avoimen lähdekoodin ohjelmistoihin viimeisten Llama-sukupolvien aikana.

Eurooppalaiselle tutkimus- ja startup-ekosysteemille – joka on vahvasti riippuvainen Hugging Facen kaltaisilla alustoilla isännöidyistä avoimista malleista – painojen, synteettisen datan ja kirjastojen saatavuus avoimilla lisensseillä on tehokas vaihtoehto Kiinalaiset mallit ja amerikkalaiset, jotka hallitsevat suosiota ja vertailukohtia.

Ainutlaatuinen sisältö - Napsauta tästä Vertaile hintoja ChatGPT:ssä: edistynyt opas rahan säästämiseen tekoälyn avulla ostoksilla

Hybridi MoE-arkkitehtuuri: tehokkuutta laaja-alaisille agenteille

Nemotron 3:n keskeinen tekninen ominaisuus on Latenttien asiantuntijoiden hybridiarkkitehtuuri (MoE)Sen sijaan, että kaikki mallin parametrit aktivoitaisiin jokaisessa päättelyssä, vain osa niistä kytketään päälle, eli kyseiseen tehtävään tai tokeniin eniten relevanttien asiantuntijoiden osajoukko.

Tämä lähestymistapa mahdollistaa vähentää merkittävästi laskentakustannuksia ja muistin kulutustaTämä lisää myös token-läpivirtausta. Usean agentin arkkitehtuureissa, joissa kymmenet tai sadat agentit vaihtavat jatkuvasti viestejä, tämä tehokkuus on avainasemassa järjestelmän kestämättömyyden estämiseksi GPU- ja pilvikustannusten kannalta.

NVIDIAn ja riippumattomien vertailuarvojen mukaan Nemotron 3 Nano saavuttaa jopa neljä kertaa enemmän tokeneita sekunnissa Edeltäjäänsä, Nemotron 2 Nanoon, verrattuna se vähentää tarpeettomien päättelytokenien generointia noin 60 %. Käytännössä tämä tarkoittaa yhtä tarkkoja tai jopa tarkempia vastauksia, mutta vähemmän "sanamaista" ja alhaisempia kyselykohtaisia kustannuksia.

Hybridi MoE-arkkitehtuuri yhdistettynä erityisiin koulutustekniikoihin on johtanut Monet edistyneimmistä avoimista malleista käyttävät asiantuntijajärjestelmiäNemotron 3 liittyy tähän trendiin, mutta keskittyy erityisesti agenttiseen tekoälyyn: sisäisiin reitteihin, jotka on suunniteltu agenttien välistä koordinointia, työkalujen käyttöä, pitkien tilojen käsittelyä ja vaiheittaista suunnittelua varten.

Kolme kokoa: Nano, Super ja Ultra erilaisiin työkuormiin

Nemotron 3 -mallin arkkitehtuuri

Nemotron 3 -perhe on organisoitu seuraavasti: MoE-mallin kolme pääkokoa, kaikki ne ovat avoimia ja niillä on pienemmät aktiiviset parametrit asiantuntevan arkkitehtuurin ansiosta:

Nemotron 3 Nanonoin 30.000 miljardia parametria yhteensä, noin 3.000 miljardia omaisuuserää tokenia kohdenSe on suunniteltu kohdennettuihin tehtäviin, joissa tehokkuudella on merkitystä: ohjelmistojen virheenkorjaukseen, asiakirjojen yhteenvetoon, tiedonhakuun, järjestelmän valvontaan tai erikoistuneisiin tekoälyavustajiin.
Nemotron 3 Supernoin 100.000 miljardia parametria, ja 10.000 miljardin omaisuus joka askeleella. Se on suunnattu Edistynyt päättely moniagenttiarkkitehtuureissapienellä latenssilla, vaikka useat agentit tekisivät yhteistyötä monimutkaisten tietovirtojen ratkaisemiseksi.
Nemotron 3 Ultra: ylempi taso, jossa on noin 500.000 miljardia parametria ja jopa 50.000 miljardia omaisuuserää tokenia kohdenSe toimii tehokkaana päättelymoottorina tutkimukselle, strategiselle suunnittelulle, korkean tason päätöksenteon tuelle ja erityisen vaativille tekoälyjärjestelmille.

Käytännössä tämä mahdollistaa organisaatioille Valitse mallin koko budjettisi ja tarpeidesi mukaanNano massiivisiin, intensiivisiin työkuormiin ja tiukkoihin kustannuksiin; Super, kun tarvitaan syvällisempää päättelyä useiden yhteistyössä toimivien agenttien kanssa; ja Ultra tapauksiin, joissa laatu ja pitkä konteksti painavat enemmän kuin GPU-kustannukset.

Ainutlaatuinen sisältö - Napsauta tästä Google kehittää Gemini Kidsiä: tekoälyä, joka on mukautettu lasten oppimiseen

Toistaiseksi Vain Nemotron 3 Nano on saatavilla välittömään käyttöön.Super- ja Ultra-variantit on suunniteltu vuoden 2026 alkupuoliskolle, mikä antaa eurooppalaisille yrityksille ja laboratorioille aikaa kokeilla ensin Nanolla, luoda kehitysputkia ja myöhemmin siirtää tapauksia, jotka vaativat suurempaa kapasiteettia.

Nemotron 3 Nano: miljoonan merkin ikkuna ja rajoitetut kustannukset

Nemotron 3 Nano on tänään perheen käytännönläheinen keihäänkärkiNVIDIA kuvailee sitä sarjan laskennallisesti kustannustehokkaimmaksi malliksi, joka on optimoitu tarjoamaan maksimaalisen suorituskyvyn moniagenttityönkuluissa ja intensiivisissä mutta toistuvissa tehtävissä.

Teknisistä ominaisuuksistaan erottuvat seuraavat: jopa miljoonan tokenin konteksti-ikkunaTämä mahdollistaa laajojen dokumenttien, kokonaisten koodivarastojen tai monivaiheisten liiketoimintaprosessien säilyttämisen muistissa. Eurooppalaisissa pankki-, terveydenhuolto- tai julkishallinnon sovelluksissa, joissa tiedot voivat olla valtavia, tämä pitkän aikavälin kontekstiominaisuus on erityisen arvokas.

Riippumattoman organisaation vertailuarvot Keinotekoinen analyysi sijoittaa Nemotron 3 Nanon yhdeksi tasapainoisimmista avoimen lähdekoodin malleista Se yhdistää älykkyyden, tarkkuuden ja nopeuden sekä satojen tokeneiden sekunnissa tapahtuvan läpimenonopeuteen. Tämä yhdistelmä tekee siitä houkuttelevan tekoälyintegraattoreille ja palveluntarjoajille Espanjassa, jotka tarvitsevat hyvän käyttökokemuksen ilman pilviin nousevia infrastruktuurikustannuksia.

Käyttötapausten osalta NVIDIA tähtää Nanoon Sisällön yhteenveto, ohjelmistojen virheenkorjaus, tiedonhaku ja yritysten tekoälyavustajatRedundanttien päättelytokenien vähentämisen ansiosta on mahdollista käyttää agentteja, jotka ylläpitävät pitkiä keskusteluja käyttäjien tai järjestelmien kanssa ilman, että päättelylasku nousee pilviin.

Avoin data ja kirjastot: NeMo Gym, NeMo RL ja Evaluator

NeMo-kirjastot

Yksi Nemotron 3:n erottuvimmista ominaisuuksista on se, että Se ei rajoitu mallien painojen vapauttamiseenNVIDIA tarjoaa tuoteperheen tueksi kattavan valikoiman avoimia resursseja agenttien koulutukseen, virittämiseen ja arviointiin.

Yhtäältä se tarjoaa synteettisen aineiston useita biljoonia tokeneita koulutusta edeltävää, koulutusta seuraavaa ja vahvistusdataaNämä päättelyyn, koodaukseen ja monivaiheisiin työnkulkuihin keskittyvät tietojoukot mahdollistavat yrityksille ja tutkimuskeskuksille Nemotronin omien toimialakohtaisten varianttien (esim. laki-, terveydenhuolto- tai teollisuuskäyttöön) luomisen ilman, että heidän tarvitsee aloittaa alusta.

Näistä resursseista erottuvat seuraavat: Nemotron Agentic Safety -aineistoSe kerää telemetriadataa agenttien käyttäytymisestä todellisissa tilanteissa. Sen tavoitteena on auttaa tiimejä mittaamaan ja vahvistamaan monimutkaisten autonomisten järjestelmien turvallisuutta: agentin toimista arkaluontoisten tietojen kohdatessa siihen, miten se reagoi epäselviin tai mahdollisesti haitallisiin komentoihin.

Ainutlaatuinen sisältö - Napsauta tästä Kuinka poistaa AnonAddy-sivustolla luotu väliaikainen osoite

Työkaluosion osalta NVIDIA julkaisee NeMo Gym ja NeMo RL avoimen lähdekoodin kirjastoina vahvistuskoulutukseen ja jälkikoulutukseen sekä NeMo Evaluator turvallisuuden ja suorituskyvyn arviointiin. Nämä kirjastot tarjoavat käyttövalmiita simulointiympäristöjä ja -putkia Nemotron-tuoteperheelle, mutta niitä voidaan laajentaa muihin malleihin.

Kaikki tämä materiaali – painot, datajoukot ja koodi – jaetaan GitHub ja Hugging Face on lisensoitu NVIDIA Open Model License -lisenssillä.jotta eurooppalaiset tiimit voivat integroida sen saumattomasti omiin MLOp-toimintoihinsa. Yritykset, kuten Prime Intellect ja Unsloth, sisällyttävät jo NeMo Gymin suoraan työnkulkuihinsa yksinkertaistaakseen vahvistusoppimista Nemotronilla.

Saatavuus julkisissa pilvipalveluissa ja eurooppalaisessa ekosysteemissä

Nemotron 3 Nano -halausnaama

Nemotron 3 Nano on nyt saatavilla osoitteessa Halaava kasvot y GitHubsekä päättelypalveluntarjoajien, kuten Basetenin, DeepInfran, Fireworksin, FriendliAI:n, OpenRouterin ja Together AI:n, kautta. Tämä avaa oven Espanjan kehitystiimeille testata mallia API:n kautta tai ottaa sen käyttöön omissa infrastruktuureissaan ilman liiallista monimutkaisuutta.

Pilvirintamalla Nemotron 3 Nano liittyy AWS:ään Amazon Bedrockin kautta palvelimetonta päättelyä varten ja on ilmoittanut tukevansa Google Cloudia, CoreWeavea, Crusoea, Microsoft Foundrya, Nebiusta, Nscaleta ja Yottaa. Näillä alustoilla jo työskenteleville eurooppalaisille organisaatioille tämä helpottaa Nemotronin käyttöönottoa ilman radikaaleja muutoksia arkkitehtuuriinsa.

Julkisen pilven lisäksi NVIDIA edistää Nemotron 3 Nanon käyttöä mm. NIM-mikropalvelu, joka on käytettävissä missä tahansa NVIDIA-kiihdytetyssä infrastruktuurissaTämä mahdollistaa hybridiskenaariot: osa kuormituksesta kansainvälisissä pilvipalveluissa ja osa paikallisissa datakeskuksissa tai eurooppalaisissa pilvipalveluissa, joissa datan sijainti EU:ssa on etusijalla.

Versiot Nemotron 3 Super ja Ultra, suunnattu äärimmäisiin päättelykuormiin ja laaja-alaisiin moniagenttijärjestelmiin, ovat suunniteltu vuoden 2026 ensimmäiselle puoliskolleTämä aikataulu antaa eurooppalaiselle tutkimus- ja liiketoimintaekosysteemille aikaa kokeilla nanoteknologiaa, validoida käyttötapauksia ja suunnitella tarvittaessa siirtymisstrategioita suurempiin malleihin.

Nemotron 3 sijoittaa NVIDIAn yhdeksi johtavista ohjelmistojen toimittajista. agenttiseen tekoälyyn suunnatut huippuluokan avoimet mallitEhdotuksella, joka yhdistää teknisen tehokkuuden (hybridi MoE, NVFP4, massiivinen konteksti), avoimuuden (painotukset, tietojoukot ja saatavilla olevat kirjastot) ja selkeän keskittymisen datasuvereniteettiin ja läpinäkyvyyteen – näkökohtiin, jotka ovat erityisen herkkiä Espanjassa ja muualla Euroopassa, missä sääntely ja paine tekoälyn auditoinnille ovat yhä suuremmat.

Aiheeseen liittyvä artikkeli:

Microsoft Discovery AI edistää tieteellisiä ja koulutuksellisia läpimurtoja personoidun tekoälyn avulla

Alberto Navarro

Olen teknologian harrastaja, joka on muuttanut "nörtti"-harrastuksensa ammatiksi. Olen käyttänyt yli 10 vuotta elämästäni uusinta teknologiaa käyttäen ja kaikenlaisten ohjelmien parissa puhtaasta uteliaisuudesta. Nyt olen erikoistunut tietotekniikkaan ja videopeleihin. Tämä johtuu siitä, että yli 5 vuoden ajan olen työskennellyt kirjoittaen useille teknologiaa ja videopelejä käsitteleville verkkosivustoille ja luonut artikkeleita, jotka pyrkivät antamaan sinulle tarvitsemaasi tietoa kielellä, jota kaikki ymmärtävät.

Jos sinulla on kysyttävää, tietoni ulottuu kaikesta Windows-käyttöjärjestelmään liittyvästä sekä matkapuhelimien Androidista. Ja sitoumukseni on sinulle, olen aina valmis käyttämään muutaman minuutin ja auttamaan sinua ratkaisemaan kaikki kysymyksesi, joita sinulla saattaa olla tässä Internet-maailmassa.