- „Gemma 3n“ yra atviras, efektyvus, multimodalinis dirbtinio intelekto modelis, sukurtas veikti lokaliai net mobiliuosiuose įrenginiuose, turinčiuose tik 2 GB RAM.
- Tai leidžia apdoroti tekstą, vaizdus, garso ir vaizdo įrašus be interneto ryšio, pabrėžiant privatumą ir mažą išteklių suvartojimą.
- Jame yra tokių naujovių kaip „MatFormer“ ir „Per Layer Embeddings“, kurios pagerina modelio efektyvumą ir pritaikomumą pagal įrenginį.
- Jis prieinamas kūrėjams tokiose platformose kaip „Google AI Studio“, „Hugging Face“ ir „Kaggle“ ir lenkia kitas mobiliąsias dirbtinio intelekto technologijas pagal multimodalines galimybes ir vykdymą neprisijungus.
„Google“ žengė svarbų žingsnį dirbtinio intelekto pasaulyje, pristatydama... „Gemma 3n“ paleidimas, atvirojo kodo dirbtinio intelekto modelis, specialiai sukurtas veikti ribotų išteklių įrenginiuose. Šis pasiūlymas, kuris Dabar ją galima atsisiųsti ir įdiegti mobiliuosiuose telefonuose, planšetiniuose kompiuteriuose ir nešiojamuosiuose kompiuteriuose., tai reiškia Multimodalinio dirbtinio intelekto atėjimas į delną, net ir įrenginiuose, turinčiuose tik 2 GB RAM ir neturinčius interneto ryšioJo pasirodymas įvyksta po pateikimo per paskutinis „Google I/O“ir patraukė kūrėjų bei vartotojų, ieškančių vietinių, privačių ir efektyvių dirbtinio intelekto sprendimų, dėmesį.
Šis naujas modelis yra pagrįstas tikslu Demokratizuoti prieigą prie pažangių dirbtinio intelekto įrankių nepasikliaujant debesijos serveriaisTaigi, „Google“ aiškiai skiria „Gemma 3n“ nuo alternatyvų, tokių kaip „Gemini“, kurios laikosi uždaro požiūrio ir labiau orientuotos į masinį vartojimą. „Gemma“ atveju dėmesys sutelktas į atvirą kūrimą, dirbtinio intelekto tyrimus ir suasmenintą naudojimą, leidžiantį jį atsisiųsti, modifikuoti ir integruoti į daugybę programų.
Multimodalinės galimybės ir išskirtinis efektyvumas
„Gemma 3n“ ypač išsiskiria tuo, kad yra multimodalinis, kitaip tariant, gali interpretuoti ir generuoti tekstą, vaizdus, garso ir vaizdo įrašus tiesiai iš įrenginio, nesinaudojant debesijos paslaugomis. Pagrindinės jo funkcijos apima kalbos atpažinimą, transkripciją, vertimą ir vizualinę analizę realiuoju laiku, todėl jis puikiai tinka švietimo užduotims, asmeniniams asistentams ar vertimo sistemoms.
Architektūra, ant kurios ji pastatyta, vadinama MatFormer, leidžia modelį suskirstyti į mažesnes versijas, integruotas į pagrindinę versiją, pavyzdžiui, matriošką. Dėl šios struktūros, „Gemma 3n“ gali geriau valdyti išteklius ir prisitaikyti prie aparatinės įrangos, kurioje ji veikia, apribojimų.Be to, jame yra technika Įterpimai sluoksniuose (PLE), kad sumažina atminties naudojimą neprarandant našumo, todėl jis gali veikti net ir įrenginiuose su kukliomis specifikacijomis.
„Gemma 3n“ siūlomas dviem pagrindiniais variantais: E2B y E4B, su atitinkamai 2.000 milijardais ir 4.000 milijardais efektyvių parametrų. Tačiau dėl savo konstrukcijos abu modeliai gali veikti su atminties reikalavimais, atitinkančiais daug mažesnių modelių reikalavimus, kuri atveria duris pažangiam dirbtiniam intelektui tradiciniuose žemos ir vidutinės klasės įrenginiuose.
Dėl vaizdų ir vaizdo įrašų apdorojimas, Gemma 3n naudoja kodavimo įrenginį „MobileNet-V5“, optimizuotas sklandžiai veikti net ir mažai energijos naudojančiuose mobiliuosiuose įrenginiuose, leidžiantis dirbti su vaizdo įrašais 60 kadrų per sekundę greičiu naujausiuose modeliuose. Garso skyriuje galima atlikti balso transkripciją ir momentinį vertimą – visa tai vietoje.
Privatumas, našumas ir prieinamumas

Darbas visiškai neprisijungus prie interneto yra vienas didžiausių „Gemma 3n“ privalumų. Tai užtikrina, kad visi dirbtinio intelekto apdoroti duomenys liktų pačiame įrenginyje, taip sustiprinant naudotojų privatumą, palyginti su kitais debesijos sprendimais. Ši funkcija taip pat reiškia didesnį energijos vartojimo efektyvumą ir mažesnį duomenų suvartojimą – tai pagrindiniai veiksniai mobiliuosiuose įrenginiuose ir aplinkoje, kurioje yra ribotas ryšys.
Kalbant apie našumą, „Gemma 3n“ palaiko 140 teksto apdorojimo kalbų ir 35 kalbas multimodaliniu režimu.Jis pademonstravo išskirtinius rezultatus tokiuose etaloniniuose testuose kaip „LMArena“, kur E4B modelis viršija 1.300 taškų ir tapo pirmuoju, turinčiu mažiau nei 10.000 milijardų parametrų, pasiekusiu šį lygį.
Gemma 3n jau čia galima įsigyti keliose platformose kūrėjams, pavyzdžiui, „Google AI Studio“, „Hugging Face“, „Kaggle“, ir per tokius įrankius kaip „Google AI Edge“ ar „Ollama“. Jų atviras dizainas ir integravimo lankstumas leidžia lengvai kurti naujas programas, pritaikytas konkretiems poreikiams – nuo edukacinių sistemų iki išmaniųjų asistentų ir neprisijungus naudojamų vertimo įrankių.
Palyginimas su kitomis alternatyvomis ir praktiniai privalumai
„Gemma 3n“ pasirodymas vyksta mobiliųjų ir periferinių dirbtinio intelekto evoliucijos kontekste., Kiti pasiūlymai apima „Apple Neural Engine“, „Samsung Gauss“ ir „Meta“ bei „Microsoft“ modelius. Tačiau, nors daugeliui šių sprendimų reikalingas serverio ryšys, jie siūlo ribotas teksto ar vaizdo galimybes arba nėra atviri išorinei plėtrai, „Gemma 3n“... Ji yra įsipareigojusi tikram multimodalumui, nepriklausomybės nuo tinklo nebuvimui ir atvirumui bendruomenei..
Didžiausias vartotojų privalumas yra galimybė paleisti pažangų dirbtinį intelektą neprarandant privatumo kontrolės, mėgaukitės greitu atsakymu ir sumažinkite su mobiliųjų duomenų naudojimu susijusias išlaidas. Gamintojams ir kūrėjams „Gemma 3n“ Tai suteikia galimybę pritaikyti išmaniąsias programas daug platesniam įrenginių spektrui, nepasikliaujant naujausia aparatine įranga ar brangiais atminties atnaujinimais..
„Gemma 3n“ pagreitis netgi paskatino kai kuriuos gamintojus padidinti savo naujų įrenginių RAM talpą, numatant būsimą masinę vietinio dirbtinio intelekto integraciją. Taigi, „Google“ užima svarbią poziciją lenktynėse siekiant Galingas, efektyvus, atviras ir tikrai prieinamas dirbtinis intelektas.
Esu technologijų entuziastas, savo „geek“ pomėgius pavertęs profesija. Daugiau nei 10 savo gyvenimo metų praleidau naudodamas pažangiausias technologijas ir iš gryno smalsumo kūriau visas programas. Dabar aš specializuojasi kompiuterinėse technologijose ir vaizdo žaidimuose. Taip yra todėl, kad daugiau nei 5 metus rašau įvairioms interneto svetainėms apie technologijas ir vaizdo žaidimus, kurdamas straipsnius, kuriuose noriu pateikti jums reikalingą informaciją visiems suprantama kalba.
Jei turite klausimų, mano žinios svyruoja nuo visko, kas susiję su Windows operacine sistema, taip pat su Android mobiliesiems telefonams. Ir aš įsipareigoju jums, aš visada pasiruošęs skirti kelias minutes ir padėti jums išspręsti visus klausimus, kurie jums gali kilti šiame interneto pasaulyje.
