Gemma 3n: Нови подухват компаније Google доноси напредну вештачку интелигенцију на било који уређај

Последње ажурирање: 01.02.2024.

  • Gemma 3n је отворени, ефикасан, мултимодални AI модел дизајниран да ради локално чак и на мобилним уређајима са само 2GB RAM-а.
  • Омогућава обраду текста, слика, звука и видеа без потребе за интернет конекцијом, истичући приватност и ниску потрошњу ресурса.
  • Укључује иновације као што су MatFormer и Per Layer Embeddings које побољшавају ефикасност и прилагодљивост модела према уређају.
  • Доступан је програмерима на платформама као што су Google AI Studio, Hugging Face и Kaggle, и надмашује друге мобилне вештачке интелигенције у мултимодалним могућностима и офлајн извршавању.

Џема 3н

Гугл је направио значајан корак у свету вештачке интелигенције са... Лансирање Геме 3н, модел вештачке интелигенције отвореног кода посебно дизајниран за рад на уређајима са ограниченим ресурсима. Овај предлог, који Сада се може преузети и инсталирати на мобилне телефоне, таблете и лаптопове., то подразумева Долазак мултимодалне вештачке интелигенције на длан, чак и на уређајима са само 2 ГБ РАМ-а и без интернет конекцијеЊегова појава се дешава након презентације током последњи Google I/O, и привукао је пажњу програмера и корисника који траже локална, приватна и ефикасна вештачка интелигенција решења.

Овај нови модел је заснован на циљу Демократизујте приступ напредним алатима вештачке интелигенције без ослањања на клауд сервереДакле, Google јасно разликује Gemma 3n од алтернатива попут Gemini-ја, које одржавају затворен приступ и више су фокусиране на масовну потрошњу. У случају Gemma-е, фокус је на отвореном развоју и истраживању и персонализованој употреби вештачке интелигенције, што омогућава њено преузимање, модификовање и интеграцију у мноштво апликација.

Ексклузивни садржај - Кликните овде  Вештачка интелигенција

Мултимодалне могућности и изузетна ефикасност

Гема 3н се посебно истиче по томе што је мултимодална, es decir, може да интерпретира и генерише текст, слике, аудио и видео директно са уређаја, без прибегавања облаку. Његове основне могућности укључују препознавање говора, транскрипцију, превод и визуелну анализу у реалном времену, што га чини погодним за образовне задатке, личне асистенте или системе за превођење.

Архитектура на којој је изграђена, названа MatFormer, омогућава да се модел подели на мање верзије интегрисане унутар главне, попут матрјошке. Захваљујући овој структури, Gemma 3n може боље да управља ресурсима и да се прилагоди ограничењима хардвера на којем ради.Поред тога, укључује техника Per Layer Embeddings (PLE), то смањује потрошњу меморије без губитка перформанси, што му омогућава да ради чак и на уређајима са скромним спецификацијама.

Gemma 3n се нуди у две главне варијанте: E2B y E4B, са 2.000 милијарде и 4.000 милијарде ефективних параметара, респективно. Међутим, захваљујући свом дизајну, оба модела могу да раде са захтевима за меморијом еквивалентним много мањим моделима, што отвара врата напредној вештачкој интелигенцији на традиционалним уређајима ниског и средњег ранга.

Ексклузивни садржај - Кликните овде  ChatGPT за Mac дебитује са интеграцијом у облаку и новим напредним функцијама

За обрада слика и видеа, Gemma 3n користи енкодер MobileNet-V5, оптимизован за глатко функционисање чак и на мобилним уређајима мале потрошње енергије, омогућавајући вам рад са видео записима при 60 кадрова у секунди на новијим моделима. У аудио одељку, омогућава транскрипцију гласа и тренутни превод, све локално.

Приватност, перформансе и доступност

Gemma 3n Локалне вештачке интелигенције Перформансе

Потпуно офлајн рад је једна од великих предности Gemma 3n-а, Осигурава да сви подаци које обрађује вештачка интелигенција остају на самом уређају, чиме се појачава приватност корисника у поређењу са другим решењима заснованим на облаку. Ова функција се такође преводи у већу енергетску ефикасност и мању потрошњу података, кључне факторе код мобилних уређаја и окружења са ограниченим везама.

En términos de rendimiento, Gemma 3n подржава 140 језика за обраду текста и 35 језика у свом мултимодалном режиму.Показао је изванредне перформансе у тестовима референтних вредности као што је LMArena, где модел E4B прелази 1.300 поена, постајући први са мање од 10.000 милијарди параметара који је достигао овај ниво.

Џема 3н је већ овде disponible en múltiples plataformas para desarrolladores, као што су Google AI Studio, Hugging Face, Kaggle, и путем алата попут Google AI Edge или Ollama. Њихов отворени дизајн и флексибилност интеграције олакшавају креирање нових апликација прилагођених специфичним потребама, од образовних система до паметних асистената и алата за офлајн превођење.

Ексклузивни садржај - Кликните овде  Гемини 2.5 Про је сада бесплатан: Ево како функционише Гоогле-ов најсвеобухватнији АИ модел.

Поређење са другим алтернативама и практичне предности

Модел вештачке интелигенције Gemma 3n

Долазак Gemma 3n долази у контексту еволуције мобилне и edge AI технологије., Други предлози укључују Apple Neural Engine, Samsung Gauss и моделе од Meta и Microsoft-а. Међутим, док многа од ових решења захтевају везу са сервером, нуде ограничене могућности текста или слика или нису отворена за спољни развој, Gemma 3n Посвећен је правој мултимодалности, одсуству зависности од мреже и отворености према заједници..

Најзначајније предности за кориснике су могућност покрените напредну вештачку интелигенцију без губитка контроле над приватношћу, уживајте у тренутном одзиву и смањите трошкове повезане са коришћењем мобилних података. За произвођаче и програмере, Gemma 3n То представља прилику да се интелигентне апликације донесу много ширем спектру уређаја, без ослањања на најновији хардвер или скупе надоградње меморије..

Замах који је Gemma 3n развио је чак и неке произвођаче да повећају капацитет RAM меморије својих нових уређаја, очекујући будућу масовну интеграцију локалне вештачке интелигенције. Тиме се Google ставља у релевантну позицију у трци за постизање Моћна, ефикасна, отворена и истински приступачна вештачка интелигенција.