Nemotron 3. NVIDIA-ի բաց մոդելները բազմագենտ արհեստական բանականության համար

Nemotron 3-ը մոդելների, տվյալների և գրադարանների բաց ընտանիք է, որը կենտրոնացած է գործակալական արհեստական բանականության և բազմագործակալ համակարգերի վրա։
Այն ներառում է MoE-ի երեք չափսեր (Nano, Super և Ultra)՝ հիբրիդային ճարտարապետությամբ և NVIDIA Blackwell-ի վրա արդյունավետ 4-բիթային մարզումով։
Nemotron 3 Nano-ն այժմ հասանելի է Եվրոպայում Hugging Face-ի, հանրային ամպերի և որպես NIM միկրոսերվիս՝ 1 միլիոն տոկենների պատուհանով։
Էկոհամակարգը լրացված է հսկայական տվյալների հավաքածուներով, NeMo Gym-ով, NeMo RL-ով և Evaluator-ով՝ ինքնիշխան արհեստական ինտելեկտի գործակալներին մարզելու, կարգաբերելու և աուդիտ անելու համար։

Nemotron 3 արհեստական բանականության մոդել

Արհեստական բանականության մրցավազքը պարզ, մեկուսացված չաթբոտերից տեղափոխվում է գործակալական համակարգերի, որոնք համագործակցում են միմյանց հետ, կառավարում են երկար աշխատանքային հոսքեր և պետք է աուդիտի ենթարկվեն։ Այս նոր սցենարում, NVIDIA-ն որոշել է բավականին հստակ քայլ կատարել՝ բացել ոչ միայն մոդելները, այլև տվյալները և գործիքները։որպեսզի ընկերությունները, պետական մարմինները և հետազոտական կենտրոնները կարողանան կառուցել իրենց սեփական արհեստական ինտելեկտի հարթակները՝ ավելի մեծ վերահսկողություն ունենալով։

Այդ շարժումը մարմնավորվում է Nemotron 3, բաց մոդելների ընտանիք, որը նախատեսված է բազմա-գործակալային արհեստական բանականության համար Այն ձգտում է համատեղել բարձր արդյունավետությունը, ցածր եզրակացության ծախսերը և թափանցիկությունը: Առաջարկը նախատեսված չէ որպես ևս մեկ ընդհանուր նշանակության չաթբոտ, այլ որպես հիմք, որի վրա կարելի է տեղակայել գործակալներ, որոնք տրամաբանում, պլանավորում և կատարում են բարդ առաջադրանքներ կարգավորվող ոլորտներումՍա հատկապես արդիական է Եվրոպայում և Իսպանիայում, որտեղ տվյալների ինքնիշխանությունը և կարգավորիչ մարմինների համապատասխանությունը կարևոր են։

Գործակալական և ինքնիշխան արհեստական բանականության համար մոդելների բաց ընտանիք

Նեմոտրոն 3-ը ներկայացված է որպես ամբողջական էկոհամակարգ՝ մոդելներ, տվյալների հավաքածուներ, գրադարաններ և ուսումնական բաղադրատոմսեր բաց լիցենզիաներով: NVIDIA-ի գաղափարն այն է, որ կազմակերպությունները ոչ միայն սպառեն արհեստական բանականությունը որպես անթափանց ծառայություն, այլև կարողանան ստուգել ներսում եղածը, հարմարեցնել մոդելները իրենց տիրույթներին և տեղակայել դրանք իրենց սեփական ենթակառուցվածքներում՝ լինի դա ամպում, թե տեղական տվյալների կենտրոններում:

Ընկերությունը այս ռազմավարությունը սահմանում է իր պարտավորության շրջանակներում՝ Ինքնիշխան AIԵվրոպայի, Հարավային Կորեայի և այլ տարածաշրջանների կառավարություններն ու ընկերությունները փնտրում են բաց այլընտրանքներ փակ կամ օտարերկրյա համակարգերին, որոնք հաճախ լավ չեն համապատասխանում նրանց տվյալների պաշտպանության օրենքներին կամ աուդիտի պահանջներին: Nemotron 3-ը նպատակ ունի դառնալ տեխնիկական հիմք, որի վրա կարելի է կառուցել ազգային, ոլորտային կամ կորպորատիվ մոդելներ՝ ավելի մեծ տեսանելիությամբ և վերահսկողությունով:

Զուգահեռաբար, NVIDIA-ն ամրապնդում է իր դիրքերը սարքավորումների սահմաններից դուրսՄինչև այժմ այն հիմնականում գրաֆիկական պրոցեսորների մատակարար էր։ Nemotron 3-ի միջոցով այն նաև դիրքավորվում է մոդելավորման և մարզման գործիքների մակարդակում՝ ավելի անմիջականորեն մրցակցելով OpenAI-ի, Google-ի, Anthropic-ի կամ նույնիսկ Meta-ի նման խաղացողների և պրեմիում մոդելների հետ, ինչպիսիք են… ՍուպերԳրոկ ՀևիLlama-ի վերջին սերունդներում Meta-ն նվազեցնում է բաց կոդով ծրագրավորման իր հանձնառությունը։

Եվրոպական հետազոտական և ստարտափ էկոհամակարգի համար, որը մեծապես կախված է Hugging Face-ի նման հարթակներում տեղակայված բաց մոդելներից, բաց լիցենզիաների ներքո կշիռների, սինթետիկ տվյալների և գրադարանների առկայությունը ներկայացնում է հզոր այլընտրանք… Չինական մոդելներ և ամերիկացիները, ովքեր գերիշխում են ժողովրդականության և չափանիշային վարկանիշներում։

Բացառիկ բովանդակություն - Սեղմեք այստեղ Microsoft Store-ը չի բացվում կամ անընդհատ փակվում է. մանրամասն լուծումներ

Հիբրիդային MoE ճարտարապետություն. արդյունավետություն մեծածավալ գործակալների համար

Nemotron 3-ի հիմնական տեխնիկական առանձնահատկությունն այն է, որ Փորձագետների թաքնված խառնուրդի (MoE) հիբրիդային ճարտարապետությունՅուրաքանչյուր եզրակացության մեջ մոդելի բոլոր պարամետրերը ակտիվացնելու փոխարեն, միացված է միայն դրանց մի մասը՝ տվյալ խնդրին կամ թոքենին առավել համապատասխան փորձագետների ենթաբազմությունը։

Այս մոտեցումը թույլ է տալիս զգալիորեն կրճատել հաշվողական ծախսերը և հիշողության սպառումըՍա նաև մեծացնում է տոկենների թողունակությունը։ Բազմագողակարգային ճարտարապետությունների համար, որտեղ տասնյակ կամ հարյուրավոր գործակալներ անընդհատ փոխանակվում են հաղորդագրություններով, այս արդյունավետությունը գլխավորն է համակարգի անկայուն դառնալը GPU-ի և ամպային ծախսերի առումով կանխելու համար։

NVIDIA-ի և անկախ չափորոշիչների կողմից տրամադրված տվյալների համաձայն, Nemotron 3 Nano-ն հասնում է հետևյալ արդյունքներին. մինչև չորս անգամ ավելի շատ տոկեններ վայրկյանում Իր նախորդի՝ Nemotron 2 Nano-ի համեմատ, այն մոտ 60%-ով նվազեցնում է ավելորդ դատողական տոկենների առաջացումը։ Գործնականում սա նշանակում է նույնքան կամ նույնիսկ ավելի ճշգրիտ պատասխաններ, բայց ավելի քիչ «բառապաշարով» և մեկ հարցման համար ավելի ցածր գնով։

Հիբրիդային կրթության նախարարության ճարտարապետությունը, զուգորդված հատուկ մարզման տեխնիկայի հետ, հանգեցրել է հետևյալի. Առավել առաջադեմ բաց մոդելներից շատերը կիրառում են փորձագիտական սխեմաներNemotron 3-ը միանում է այս միտմանը, բայց հատկապես կենտրոնանում է գործակալական արհեստական բանականության վրա՝ գործակալների միջև համակարգման, գործիքների օգտագործման, երկար վիճակների կառավարման և քայլ առ քայլ պլանավորման համար նախատեսված ներքին երթուղիներ։

Երեք չափսեր՝ Nano, Super և Ultra՝ տարբեր աշխատանքային բեռների համար

Nemotron 3 մոդելի ճարտարապետությունը

Nemotron 3 ընտանիքը կազմակերպված է հետևյալ կերպ՝ Էներգետիկայի նախարարության մոդելի երեք հիմնական չափսեր, բոլորը բաց են և նվազեցված ակտիվ պարամետրերով՝ շնորհիվ փորձագիտական ճարտարապետության։

Նեմոտրոն 3 Նանոմոտ 30.000 միլիարդ ընդհանուր պարամետրեր, մոտավորապես 3.000 միլիարդ ակտիվ մեկ թոքենի համարԱյն նախատեսված է թիրախային առաջադրանքների համար, որտեղ արդյունավետությունը կարևոր է. ծրագրային ապահովման վրիպազերծում, փաստաթղթերի ամփոփում, տեղեկատվության որոնում, համակարգի մոնիթորինգ կամ մասնագիտացված արհեստական բանականության օգնականներ։
Նեմոտրոն 3 Սուպերմոտավորապես 100.000 միլիարդ պարամետր, 10.000 միլիարդ ակտիվներ ամեն քայլափոխի։ Այն ուղղված է Զարգացած դատողություն բազմագենտային ճարտարապետություններումցածր լատենտությամբ, նույնիսկ երբ մի քանի գործակալներ համագործակցում են բարդ հոսքեր լուծելու համար։
Նեմոտրոն 3 Ուլտրավերին մակարդակը՝ մոտավորապես 500.000 միլիարդ պարամետրերով և մինչև 50.000 միլիարդ ակտիվ մեկ թոքենի համարԱյն գործում է որպես հզոր դատողության շարժիչ հետազոտությունների, ռազմավարական պլանավորման, բարձր մակարդակի որոշումների աջակցության և հատկապես պահանջկոտ արհեստական բանականության համակարգերի համար։

Գործնականում սա թույլ է տալիս կազմակերպություններին Ընտրեք մոդելի չափը՝ ըստ ձեր բյուջեի և պահանջներիNano՝ մեծածավալ, ինտենսիվ աշխատանքային բեռների և սահմանափակ ծախսերի համար, Super՝ երբ շատ համագործակցող գործակալների դեպքում անհրաժեշտ է ավելի խորը դատողություն, և Ultra՝ այն դեպքերի համար, երբ որակը և երկարատև համատեքստը գերազանցում են GPU-ի արժեքին։

Բացառիկ բովանդակություն - Սեղմեք այստեղ TAG Heuer Connected Calibre E5. անցում դեպի սեփական ծրագրային ապահովում և New Balance տարբերակ

Մինչ այժմ, Միայն Nemotron 3 Nano-ն է հասանելի անհապաղ օգտագործման համար։Super և Ultra տարբերակները նախատեսված են 2026 թվականի առաջին կեսին, ինչը եվրոպական ընկերություններին և լաբորատորիաներին ժամանակ կտա նախ փորձարկել Nano-ն, ստեղծել խողովակաշարեր, իսկ ավելի ուշ՝ տեղափոխել ավելի մեծ հզորություն պահանջող դեպքերը։

Nemotron 3 Nano. 1 միլիոն տոկենների պատուհան և սահմանափակ ծախս

Նեմոտրոն 3 Նանո

Nemotron 3 Nano-ն, այսօրվա դրությամբ, ընտանիքի գործնական առաջնորդըNVIDIA-ն այն նկարագրում է որպես իր շարքում ամենաարդյունավետ հաշվողական մոդելը, որը օպտիմալացված է բազմագենտային աշխատանքային հոսքերի և ինտենսիվ, բայց կրկնվող առաջադրանքների դեպքում առավելագույն արդյունավետություն ապահովելու համար։

Տեխնիկական առանձնահատկությունների շարքում առանձնանում են հետևյալները. մինչև մեկ միլիոն տոկենների համատեքստային պատուհանՍա թույլ է տալիս պահպանել հիշողությունը ծավալուն փաստաթղթերի, ամբողջական կոդի պահոցների կամ բազմափուլ բիզնես գործընթացների համար: Բանկային, առողջապահական կամ պետական կառավարման եվրոպական կիրառությունների համար, որտեղ գրառումները կարող են ծավալուն լինել, այս երկարաժամկետ համատեքստային հնարավորությունը հատկապես արժեքավոր է:

Անկախ կազմակերպության չափանիշները Արհեստական վերլուծությունը Nemotron 3 Nano-ն դասում է որպես ամենահավասարակշռված բաց կոդով մոդելներից մեկը։ Այն համատեղում է ինտելեկտը, ճշգրտությունը և արագությունը՝ վայրկյանում հարյուրավոր տոկենների թողունակությամբ։ Այս համադրությունը այն գրավիչ է դարձնում Իսպանիայում արհեստական բանականության ինտեգրատորների և ծառայություն մատուցողների համար, ովքեր կարիք ունեն լավ օգտագործողի փորձի՝ առանց ենթակառուցվածքային ծախսերի կտրուկ աճի։

Օգտագործման դեպքերի առումով, NVIDIA-ն թիրախավորում է Nano-ն Բովանդակության ամփոփում, ծրագրային ապահովման վրիպազերծում, տեղեկատվության որոնում և ձեռնարկության արհեստական բանականության օգնականներԱվելորդ դատողական տոկենների կրճատման շնորհիվ հնարավոր է գործարկել գործակալներ, որոնք երկար զրույցներ են վարում օգտատերերի կամ համակարգերի հետ՝ առանց եզրակացությունների ծախսերի կտրուկ աճի։

Բաց տվյալներ և գրադարաններ՝ NeMo Gym, NeMo RL և Evaluator

NeMo գրադարաններ

Nemotron 3-ի ամենաառանձնահատուկ առանձնահատկություններից մեկն այն է, որ Այն չի սահմանափակվում մոդելի կշիռների հրապարակմամբNVIDIA-ն ընտանիքին ուղեկցում է գործակալների վերապատրաստման, կարգավորման և գնահատման համար նախատեսված բաց ռեսուրսների համապարփակ փաթեթով։

Մի կողմից, այն մատչելի է դարձնում սինթետիկ կորպուս մի քանի տրիլիոն տոկեն նախնական, հետմարզական և ամրապնդման տվյալներԱյս տվյալների հավաքածուները, որոնք կենտրոնացած են դատողության, կոդավորման և բազմափուլ աշխատանքային հոսքերի վրա, թույլ են տալիս ընկերություններին և հետազոտական կենտրոններին ստեղծել Nemotron-ի իրենց սեփական տիրույթին հատուկ տարբերակները (օրինակ՝ իրավական, առողջապահական կամ արդյունաբերական)՝ առանց զրոյից սկսելու։

Այս ռեսուրսների շարքում առանձնանում են հետևյալները. Nemotron գործակալի անվտանգության տվյալների հավաքածուԱյն հավաքում է հեռաչափման տվյալներ գործակալի վարքագծի վերաբերյալ իրական աշխարհի սցենարներում: Դրա նպատակն է օգնել թիմերին չափել և ամրապնդել բարդ ինքնավար համակարգերի անվտանգությունը՝ սկսած այն գործողություններից, որոնք գործակալը ձեռնարկում է զգայուն տվյալների հետ հանդիպելիս, մինչև այն, թե ինչպես է արձագանքում երկիմաստ կամ պոտենցիալ վնասակար հրամաններին:

Բացառիկ բովանդակություն - Սեղմեք այստեղ Windows 11-ի նորագույն հնարավորությունները՝ արհեստական բանականություն և համակարգիչը կառավարելու նոր եղանակներ

Գործիքների բաժնի վերաբերյալ, NVIDIA-ն գործարկում է NeMo Gym-ը և NeMo RL-ը որպես բաց կոդով գրադարաններ ուժեղացման և հետուսուցման համար, ինչպես նաև NeMo Evaluator-ի հետ միասին՝ անվտանգությունն ու կատարողականը գնահատելու համար: Այս գրադարանները տրամադրում են պատրաստի օգտագործման սիմուլյացիոն միջավայրեր և խողովակաշարեր Nemotron ընտանիքի հետ, բայց կարող են ընդլայնվել նաև այլ մոդելների համար:

Այս ամբողջ նյութը՝ կշիռները, տվյալների հավաքածուները և կոդը, բաշխվում են GitHub-ը և Hugging Face-ը լիցենզավորված են NVIDIA Open Model License-ի ներքո։որպեսզի եվրոպական թիմերը կարողանան անխափան ինտեգրել այն իրենց սեփական MLOps-ներում: Prime Intellect-ի և Unsloth-ի նման ընկերություններն արդեն իսկ NeMo Gym-ը ներառում են անմիջապես իրենց աշխատանքային հոսքերի մեջ՝ Nemotron-ում ուժեղացված ուսուցումը պարզեցնելու համար:

Հասանելիություն հանրային ամպերում և եվրոպական էկոհամակարգում

Նեմոտրոն 3 Նանո գրկախառնվող դեմք

Nemotron 3 Nano-ն այժմ հասանելի է Գրկելով դեմքը y GitHubինչպես նաև Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter և Together AI જેવા եզրակացությունների մատակարարների միջոցով: Սա հնարավորություն է տալիս Իսպանիայի մշակողների թիմերին փորձարկել մոդելը API-ի միջոցով կամ տեղակայել այն իրենց սեփական ենթակառուցվածքներում՝ առանց ավելորդ բարդության:

Ամպի ճակատում, Nemotron 3 Nano-ն միանում է AWS-ին Amazon Bedrock-ի միջոցով սերվերային եզրակացության համար և հայտարարել է Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale և Yotta-ի աջակցության մասին: Այս հարթակների վրա արդեն աշխատող եվրոպական կազմակերպությունների համար սա հեշտացնում է Nemotron-ի ներդրումը՝ առանց իրենց ճարտարապետության մեջ կտրուկ փոփոխությունների:

Հանրային ամպից բացի, NVIDIA-ն խթանում է Nemotron 3 Nano-ի օգտագործումը որպես NIM միկրոսերվիս, որը կարող է տեղակայվել ցանկացած NVIDIA-ի կողմից արագացված ենթակառուցվածքի վրաՍա թույլ է տալիս իրականացնել հիբրիդային սցենարներ. բեռի մի մասը միջազգային ամպերում, իսկ մյուս մասը՝ տեղական տվյալների կենտրոններում կամ եվրոպական ամպերում, որոնք առաջնահերթություն են տալիս տվյալների ԵՄ-ում գտնվելուն։

Տարբերակները Նեմոտրոն 3 Սուպեր և Ուլտրա, ուղղված են ծայրահեղ դատողական աշխատանքային բեռներին և մեծածավալ բազմագործակալային համակարգերին, նախատեսված է 2026 թվականի առաջին կեսի համարԱյս ժամանակացույցը եվրոպական հետազոտական և բիզնես էկոհամակարգին ժամանակ է տալիս փորձարկելու Nano-ն, ստուգելու օգտագործման դեպքերը և անհրաժեշտության դեպքում մշակելու ավելի մեծ մոդելներին անցնելու ռազմավարություններ։

Nemotron 3-ը NVIDIA-ն դասում է առաջատար մատակարարների շարքում։ բարձրակարգ բաց մոդելներ, որոնք ուղղված են գործակալական արհեստական բանականությանըԱռաջարկով, որը համատեղում է տեխնիկական արդյունավետությունը (հիբրիդային ԿԳՆ, NVFP4, զանգվածային համատեքստ), բացությունը (կշիռներ, տվյալների հավաքածուներ և հասանելի գրադարաններ) և տվյալների ինքնիշխանության և թափանցիկության վրա հստակ կենտրոնացումը, ասպեկտներ, որոնք հատկապես զգայուն են Իսպանիայում և Եվրոպայի մնացած մասում, որտեղ արհեստական բանականության աուդիտի կարգավորումը և ճնշումը գնալով մեծանում են։

Առնչվող հոդված.

Microsoft Discovery արհեստական բանականությունը խթանում է գիտական և կրթական առաջընթացները անհատականացված արհեստական բանականության միջոցով

Ալբերտո Նավարո

Ես տեխնոլոգիայի էնտուզիաստ եմ, ով իր «գիկ» հետաքրքրությունները վերածել է մասնագիտության։ Ես իմ կյանքի ավելի քան 10 տարին անցկացրել եմ՝ օգտագործելով նորագույն տեխնոլոգիաներ և զուտ հետաքրքրասիրությունից դրդված բոլոր տեսակի ծրագրերի հետ աշխատելիս: Այժմ ես մասնագիտացել եմ համակարգչային տեխնիկայի և տեսախաղերի մեջ։ Դա պայմանավորված է նրանով, որ ավելի քան 5 տարի ես գրում եմ տարբեր կայքերի համար տեխնոլոգիայի և վիդեոխաղերի վերաբերյալ՝ ստեղծելով հոդվածներ, որոնք փորձում են ձեզ տրամադրել ձեզ անհրաժեշտ տեղեկատվությունը բոլորին հասկանալի լեզվով:

Եթե ունեք հարցեր, իմ գիտելիքները տատանվում են Windows օպերացիոն համակարգի հետ կապված ամեն ինչից, ինչպես նաև բջջային հեռախոսների համար նախատեսված Android-ից: Եվ իմ հանձնառությունն է ձեզ, ես միշտ պատրաստ եմ մի քանի րոպե ծախսել և օգնել ձեզ լուծել ցանկացած հարց, որը կարող եք ունենալ այս ինտերնետային աշխարհում:

Գործակալական և ինքնիշխան արհեստական ​​բանականության համար մոդելների բաց ընտանիք