- A Google szinte az összes Android-eszközre kiterjeszti a Gemini Live kamera- és képernyőmegosztási funkcióit.
- Ezekhez a funkciókhoz elő kell fizetni a Gemini Advanced szolgáltatásra a Google One AI Premium csomag keretében.
- A valós idejű vizuális elemzési lehetőségek lehetővé teszik az objektumok azonosítását vagy a képernyőn megjelenő dolgok értelmezését.
- A megvalósítás fokozatosan zajlik, így még nem minden felhasználó rendelkezik azonnali hozzáféréssel.

A Google mesterséges intelligenciája, az úgynevezett A Gemini újabb lépést tett az Android-eszközökkel való integráció terén. Az olyan konferenciákon, mint például az MWC 2025, valamint a következő generációs Pixel és Galaxy eszközökre korlátozódó korábbi bejelentések után a vállalat hivatalosan is megerősítette, hogy az Gemini Live speciális funkciók Szinte minden Android-terminálhoz elérhetők, amely megfelel bizonyos követelményeknek.
Ezek az új eszközök magukban foglalják képes elemezni az élő videót a kamerán keresztül, és megosztani a képernyőt a Geminivel, lehetővé téve az AI-asszisztens számára, hogy valós időben kommunikáljon a megjelenített vizuális tartalommal. Olyan előrelépés, amely természetesebbé, hasznosabbá és spontánabbá kívánja tenni az asszisztenssel való interakciót, közelebb hozva a használatát a mindennapi helyzetekhez, mint például a tárgyak azonosítása, nyomtatott szövegek olvasása vagy az iskolai problémákban való segítségnyújtás.
Mire képes a mesterséges intelligencia a mobil kamerájával és képernyőjével

Valós idejű kamera funkció lehetővé teszi, hogy a telefont egy tárgyra irányítsa, hogy az asszisztens felismerje azt, és kontextus szerinti válaszokat kínáljon. Attól kezdve, hogy tudja, melyik emlékművet nézi, a dekorációs ötletek megszerzéséig vagy a növény nevének és fajának azonosításáig, Az Ikrek elemzik a rögzített képet, és azonnal reagálnak. Ez a képesség a „számítógépes látás” fogalmára emlékeztet, a mesterséges intelligencia azon ágára, amely egyre inkább előrehalad a bonyolult vizuális minták felismerésében.
Ezen túlmenően, képernyőmegosztó eszköz lehetővé teszi az asszisztens számára, hogy értelmezze, mit lát az eszközén. Akár webhelyen böngészik, akár egy dokumentumot néz át, vagy egy alkalmazást böngész, a Gemini anélkül tud segítséget nyújtani, hogy konkrét kérdéseket kellene feltennie. A funkció a képernyőn fedvényként jelenik meg olyan opciókkal, mint a „Képernyő megosztása élőben” vagy „Kérdezzen arról, amit lát”.
Mindkét funkció a telepítésnek köszönhetően működik multimodális képességek, amelyek lehetővé teszik a Gemini számára, hogy szöveget, hangot és képet kombináljon, hogy teljesebb és testreszabottabb válaszokat adjon a környezetre. Az aktiválás a Gemini alkalmazás megnyitásával, beszélgetés elindításával és az adott eszközök interaktív felületről történő elérésével történik.
Követelmények és kompatibilitás: milyen eszközökkel használható?
A korai tesztelés során úgy tűnt, hogy ezek a funkciók a Pixel telefonokra vagy a Samsung jövőbeli Galaxy S25 termékcsaládjára korlátozódnak. Viszont, A Google támogatási oldalán megjelent frissítés megerősítette, hogy a funkció minden Android 10 vagy újabb rendszert futtató eszközön elérhető, amennyiben a felhasználó előfizetéssel rendelkezik a Gemini Advanced szolgáltatásra..
Ez azt jelenti A legújabb okostelefonok és táblagépek túlnyomó többsége hozzáfér majd ehhez a funkcióhoz, szakítva az exkluzivitás gondolatával, amely kezdetben zavart keltett a felhasználók körében. A gyakorlatban az olyan gyártók, mint a Xiaomi, a OnePlus, a Motorola vagy akár a régebbi Samsung modellek is ki tudják használni ezeket a funkciókat, amennyiben megfelelnek az operációs rendszer alapvető követelményeinek, és telepítve van a Google alkalmazás legújabb verziója.
Igen, a megvalósítás fokozatosan történik, és sok esetben előfordulhat, hogy a rendelkezésre állás nem azonnali. A Google úgy döntött, hogy ezeket a funkciókat szakaszosan vezeti be a széles körben elterjedt hibák elkerülése és a megfelelő teljesítmény biztosítása érdekében, mielőtt az összes kompatibilis eszközt elérné.
Előfizetés szükséges: Google One AI Premium
Az egyik legfontosabb szempont, amelyet szem előtt kell tartani, az Az élő kamera és képernyőmegosztási funkciók használatához elő kell fizetnie a Gemini Advanced fizetős csomagra., amely a Google One AI Premium ajánlat része. Ez az előfizetés számos előnnyel jár, többek között:
- Hozzáférés a Gemini legfejlettebb AI modelljeihez, amely kompatibilis az olyan alkalmazásokkal, mint a Gmail, a Documents vagy magával a Gemini alkalmazással.
- 2 TB felhőtárhely, hasznos fájlok, képek és személyes projektek mentéséhez.
- Írás, tervezés és feladatsegítő funkciók támogatása AI-n keresztül.
A csomag ára Európában havi 21,99 euró. Egyes eszközök – például a legújabb Pixel-kiadások – egy bizonyos időszakra szóló ingyenes próba-előfizetést tartalmaznak, ami megkönnyíti az új funkciók további költség nélküli kipróbálását.
Az Ikrek a többi asszisztens versenytársaként
A Google által a Gemininek adott lendület egyértelműen reagál arra a talajra, amelyet más platformok, például a ChatGPT vagy a Copilot nyertek. Az olyan eszközök megjelenésével, mint a Gemini Live, Az amerikai cég nem csak a szöveges asszisztensekben igyekszik pozícionálni magát, hanem a valós idejű vizuális és kontextuális interakcióban is. Ez a multimodalitás iránti elkötelezettség összhangban van az olyan rendezvényeken javasolt jövővel, mint a Google I/O vagy az idei Mobile World Congress.
Ezzel párhuzamosan más funkciók, mint például az úgynevezett „Gems” (személyre szabott mesterséges intelligencia-profilok konkrét válaszokkal) is kezdik elérni az ingyenes felhasználókat, bár korlátozásokkal. És bár az erősebb modellek, például a Gemini 2.5 Pro csak haladó előfizetők számára érhetők el, Az androidos mobilokhoz készült integrált verzió által kínált lehetőségek kínálata már most is jelentős ugrást jelent a néhány hónappal ezelőttihez képest..
Ezen eszközök megjelenésével A Gemini teljes mértékben bekapcsolódik az intelligens asszisztensek jövőjéről szóló beszélgetésbe azzal a céllal, hogy a mindennapi élet hasznos eszközévé váljon. Bár a kontextuskezelés és a folyamatos interakció terén még vannak csiszolnivalók, a felhasználó által látott dolgok valós idejű elemzésének képessége nagyon érdekes lehetőségeket nyit meg szakmai, oktatási és személyes téren.
Ami kísérleti funkcionalitásként indult, az már megtalálta a helyét egy szélesebb körben elterjedt megvalósításban. A Gemini Live megmutatja, hogy a mesterséges intelligencia túlmutat a kérdések szöveges megválaszolásán: Mobiltelefonján keresztül is láthatja, értelmezheti és alkalmazkodhat a környezethez, így az emberek és a gépek közötti együttműködés új szakasza a tenyeréből indul ki.
Technológia-rajongó vagyok, aki "geek" érdeklődését szakmává változtatta. Életemből több mint 10 évet töltöttem a legmodernebb technológiával, és pusztán kíváncsiságból mindenféle programmal bütykölgettem. Most a számítástechnikára és a videojátékokra szakosodtam. Ennek az az oka, hogy több mint 5 éve írok különféle technológiával és videojátékokkal foglalkozó weboldalakra, olyan cikkeket készítve, amelyek mindenki számára érthető nyelven igyekeznek megadni a szükséges információkat.
Ha bármilyen kérdése van, tudásom a Windows operációs rendszerrel, valamint a mobiltelefonokhoz készült Androiddal kapcsolatos mindenre kiterjed. És az én elkötelezettségem az Ön iránti elkötelezettségem, mindig készen állok néhány percet rászánni arra, hogy segítsek megoldani minden kérdését ebben az internetes világban.

