„Google Translate“ žengia žingsnį į vertimą realiuoju laiku naudojant ausines, dėka „Gemini AI“

Paskutinis atnaujinimas: 2025-15-12

  • „Google Translate“ programėlėje yra tiesioginio vertimo funkcija su įprastomis ausinėmis, naudojant „Gemini“ dirbtinį intelektą, ir ji palaiko daugiau nei 70 kalbų.
  • Ši funkcija pirmiausia bus pasiekiama beta versijoje „Android“ įrenginiuose JAV, Meksikoje ir Indijoje, o plėtra į „iOS“ ir kitus regionus planuojama nuo 2026 m.
  • „Gemini“ pagerina vertimų natūralumą, interpretuoja slengą ir idiomas, išsaugo originalaus balso toną, kirčiavimą ir ritmą.
  • „Google Translate“ prideda kalbų mokymosi įrankius ir pozicionuoja save kaip atvirą alternatyvą uždaresniam „Apple“ ekosistemos požiūriui.

Dirbtinio intelekto valdomas vertimas „Google Translate“ programoje

El „Google“ vertėjas Nuo pat paleidimo ji patiria vieną didžiausių pokyčių. Bendrovė pradėjo diegti funkciją, skirtą vertimas realiuoju laiku tiesiai į ausinesparemta savo dirbtinio intelekto modelio galimybėmis DvyniaiIdėja paprasta paaiškinti, bet sudėtinga įgyvendinti: kad per ausines beveik akimirksniu galėtumėte išgirsti, ką kitas žmogus sako kita kalba, su mažiau robotinis dirbtinis balsas.

Šis žingsnis atitinka „Google“ strategiją paversti „Vertėjas“ daugiau nei paprastu teksto vertėju. Dabar ji siekia tapti... centrinė priemonė bendravimui ir kalbų mokymuisinaudojant dirbtinį intelektą, siekiant geriau suprasti slengą ir kultūrinius niuansus, ir padėti vartotojui kasdienėje praktikoje. Kol kas naujoji funkcija paleidžiama konkrečiose rinkose ir beta fazėjetačiau tai aiškiai rodo pasaulinį diegimą ateinančiais metais.

Vertimas realiuoju laiku naudojant bet kokias ausines

Vertimas realiuoju laiku naudojant „Google Translate“

Įspūdingiausia savybė yra nauja tiesioginio pokalbio vertimas per ausinesTai, kas anksčiau buvo prieinama tik tam tikriems modeliams, pavyzdžiui, „Pixel Buds“, dabar prieinama praktiškai visoms ausinėms ar ausinėms su ausinėmis, suderinamoms su jūsų telefonu. Viskas, ko jums reikia, yra įdiegta programėlė. „Google“ vertėjasPrijunkite ausines ir įjunkite tiesioginio vertimo režimą.

„Android“ sistemoje procesas apima programos atidarymą, pokalbio kalbų pasirinkimą ir mygtuko paspaudimą. „Gyvas vertimas“ (Tiesioginis vertimas). Iš ten telefono mikrofonas Jis automatiškai nustato, kada kiekvienas asmuo kalba ir kokia kalba.Jis transkribuoja realiuoju laiku, siunčia garsą į „Google“ serverius, kad „Gemini“ jį apdorotų, ir atkuria vertimą per ausines su santykinai mažu vėlavimu.

„Google“ paaiškina, kad už tai atsakingas dirbtinis intelektas. išlaikyti originalaus kalbėtojo toną, ritmą ir akcentąTai leidžia suprasti ne tik sakomo teksto turinį, bet ir dalį intencijos: ar kas nors pyksta, juokauja, ar kalba rimčiau. Tuo pačiu metu mobiliojo telefono ekrane rodomas išversto pokalbio transkriptas, naudingas, jei norite peržiūrėti, kas buvo pasakyta, arba bakstelėti konkretų segmentą, kad jį dar kartą išgirstumėte.

Iš pradžių ši funkcija diegiama kaip beta versija „Vertėjo“ programėlėje Androidas, o prieinamumas tokiose rinkose kaip Jungtinės Valstijos, Meksika ir IndijaNepaisant to, kalbinis suderinamumas yra platus: sistema gali pasiūlyti tiesioginį balso vertimą daugiau nei 70 kalbomis, su tūkstančiais galimų kalbų porų kombinacijų.

Tuo atveju, jei iPhone„Google“ patvirtino, kad vertimas realiuoju laiku su ausinėmis taip pat bus pasiekiamas. Vertėjo programėlė „iPhone“ telefonenors diegimas įvyks vėliau. Bendrovė nusibrėžė horizontą 2026 m. bus išplėsti regionai ir paleista funkcija „iOS“ sistemojeTai reiškia, kad prieš plačiau diegiant sistemą Europoje ir kitose šalyse, teks gerokai pažengti testavimo laikotarpiu.

Išskirtinis turinys – spustelėkite čia  Kaip išlenkti tekstą „Google“ piešinyje

Kaip veikia „Live Translate“ ir ką jis siūlo kasdien

„Google“ vertėjo vertimas

Be pagrindinio dirbtinio intelekto aspekto, svarbiausia yra naudotojo patirtis. Kai režimas suaktyvinamas „Gyvas vertimas“ Programėlėje vartotojas gali kalbėtis nuolat nežiūrėdamas į ekraną. Sistema Groja vertimą per originalų balsą kurį užfiksuoja mikrofonas, todėl galite stebėti pranešimą, pristatymą ar net ekskursiją su ausinėmis.

Remiantis vidiniais testais ir kai kuriomis specializuotomis žiniasklaidos priemonėmis, Vėlavimas paprastai yra mažesnis nei viena sekundė Kai duomenų ryšys stabilus, šios ribos pakanka, kad pokalbis vyktų gana natūraliai, nedarant ilgų pauzių tarp sakinių. Praktinis efektas pastebimas, pavyzdžiui, sekant paaiškinimą kita kalba arba klausantis užsienio kalbos konferencijoje.

Vienas iš sistemos stipriųjų pusių yra tas, kad Nereikia „išmaniųjų“ ausinių ar oficialių modeliųBet kokios „Bluetooth“ arba laidinės ausinės, veikiančios su mobiliuoju telefonu, gali būti naudojamos kaip garso išvestis vertimui. Tai jas išskiria iš uždaresnių sprendimų, kur tam tikros funkcijos apsiriboja konkretaus prekės ženklo įrenginiais, ir leidžia vartotojams pasinaudoti šia funkcija neatnaujinant aparatinės įrangos.

Praktiškai našumas priklauso nuo aplinkos. Vietose, kur intensyvus aplinkos triukšmas Arba, kai vienu metu kalba daug žmonių, padaugėja kalbos atpažinimo klaidų – tai įprasta bet kurioje dabartinėje sistemoje. „Google“ nurodo, kad „Gemini“ turi mechanizmus, skirtus Išfiltruokite dalį foninio triukšmo ir sutelkite dėmesį į pagrindinį vokaląTačiau jis pripažįsta, kad idealios sąlygos išlieka gana tylūs kambariai ir aiškiai kalbantys kalbėtojai.

Kalbant apie konkretų naudojimą, įrankis skirtas tokioms situacijoms kaip kelionės, darbo susitikimai, užsiėmimai, pokalbiai ar administracinės procedūros kita kalba. Vienpusio bendravimo scenarijuose (vienas kalba, o kiti klausosi) patirtis yra ypač sklandi; labai greituose pokalbiuose arba kai keli pašnekovai vienas kitą pertraukia, sistemai gali būti sunkiau segmentuoti kiekvieną intervenciją.

Dvyniai: dirbtinis intelektas, kuris stengiasi skambėti mažiau robotiškai

Oficialūs būdai pasiekti „Gemini Pro“

Už šios naujos ausinių funkcijos ir kitų „Google Translate“ patobulinimų slypi Dvyniai„Google“ kalbos modelis, kurį bendrovė palaipsniui integruoja į pagrindinius produktus, tokius kaip pati „Search and Translate“, siekia peržengti pažodinio vertimo ribas. interpretuoti visą frazių reikšmę.

Praktiškai tai reiškia mažiau pažodinis ir natūralesnis vertimasTai ypač aktualu, kai vartojami šnekamosios kalbos posakiai, idiomos ar vietinis slengas. Tipiniai pavyzdžiai, tokie kaip angliškas „stealing my thunder“ arba ispaniški posakiai, tokie kaip „me robó el pelo“ (jis patraukė mano koją), dažnai duodavo keistų rezultatų, kai buvo verčiami pažodžiui. Naudojant „Gemini“, sistema analizuoja kontekstą ir siūlo alternatyvas, kurios geriau atspindi tikrąją frazės reikšmę tiksline kalba.

„Google“ teigia, kad šis metodas leidžia geriau užfiksuoti kalbos modelius, subtilią ironiją ar tono pokyčiusTai tiesiogiai veikia šnekamųjų pokalbių vertimą. Neutralios žinutės vertimas nėra tas pats, kas sarkastiškos frazės ar pusiau juokais pasakyto komentaro vertimas. Nors vis dar yra paklaidos riba, bendrovė teigia, kad jos vidiniai rodikliai rodo dviženkliais vertimo kokybės patobulinimais palyginti su ankstesnėmis sistemomis, ypač tarp labai skirtingų kalbų.

Išskirtinis turinys – spustelėkite čia  Kaip peržiūrėti savo istoriją „Lamour“ programėlėje?

Šios galimybės neapsiriboja garsu. Dirbtinis intelektas taip pat atlieka svarbų vaidmenį teksto ir vaizdinio turinio vertimaspavyzdžiui, mobiliojo telefono kamera nufotografuoti ženklai ar meniu. Skirtumas tas, kad dabar sistema gali pateikti rezultatus su natūralesnėmis sintaksinėmis struktūromis, siūlyti žodyno alternatyvas ir kai kuriais atvejais pritaikyti formalumo lygį pagal kontekstą.

Visas šis apdorojimas atliekamas derinant debesies išteklius su užduotimis pačiame įrenginyje. Dalis sunkiųjų darbų atliekama „Google“ serveriuose, o tokie elementai kaip kalbos sintezė ir tam tikri filtrai tvarkomi mobiliajame įrenginyje. Pasak bendrovės, Baterijos sunaudojimas panašus į balso skambučio ar trumpo vaizdo skambučio.Todėl jums nereikės ypač galingos įrangos, kad retkarčiais galėtumėte naudoti šią funkciją.

Daugiau nei vertimas: vertimas kaip kalbos mokymosi priemonė

Kas yra „Bluetooth LE Audio“ ir kaip naudoti garso bendrinimą sistemoje „Windows 11“

Be vertimo realiuoju laiku, „Google“ stiprina „Translate“ edukacinį profilį. Programėlėje dabar integruota: Dirbtiniu intelektu pagrįstos kalbos mokymosi funkcijos, siekiant papildyti konkrečias platformas, tokias kaip „Duolingo“ ar iTranslatejų nepakeičiant.

Tarp naujų funkcijų yra patobulintas tarimo atsiliepimasŠios priemonės teikia konkretesnių pasiūlymų praktikuojantis sakytines frazes. Vartotojas gali pakartoti išraišką ir gauti atsiliepimų apie ritmą, intonaciją ar prastai artikuliuotus garsus, padėdamas savo kalbai tapti labiau gimtąja ir mažiau robotiška.

Programėlėje taip pat yra integruota serijų sistema arba iš eilės einančios treniruočių dienosŠi funkcija seka, kiek dienų iš eilės įrankis buvo naudojamas mokymuisi. Šis mechanizmas, plačiai paplitęs edukacinėse programose, siekia palaikyti motyvaciją per mažus dienos tikslus ir nuolatinės pažangos jausmą.

„Google“ pradeda siūlyti šias parinktis apie 20 šalių ir regionų, iš pradžių buvęs tokiose rinkose kaip Vokietija, Indija arba ŠvedijaPlečiantis į daugiau Europos teritorijų, tikimasi, kad programėlė taps įprastesniu pasirinkimu tiems, kurie kalbas praktikuoja neoficialiai, derindami jas su kursais, užsiėmimais ar kita veikla. Versti vaizdo įrašus iš anglų į ispanų kalbą.

Tuo pačiu metu bendrovė eksperimentuoja „Google Labs“ platformoje. trys nemokamos mokymosi patirtysTai apima tokius pasiūlymus kaip trumpos pamokos, kuriose daugiausia dėmesio skiriama naudingam žodynui, moduliai, skirti slengui ir neoficialioms išraiškoms, bei vaizdinės veiklos, kurių metu dirbtinis intelektas atpažįsta objektus nuotraukoje ir moko jų pavadinimų kita kalba. Nors šie testai nėra griežtai „Translate“ programėlės dalis, jie rodo platesnę kalbos įrankių ekosistemą, kurią visas varo tas pats dirbtinio intelekto variklis.

Palyginimas su „Apple“ ir Europos vaidmuo

„Google“ požiūris skiriasi nuo „Apple“ požiūrio vertimo realiuoju laiku srityje. Nors Kupertino bendrovė pasirinko funkciją, integruotą į savo ekosistemą ir susietą su... konkretūs AirPods modeliai„Google“ pasirinko programinės įrangos pagrindu sukurtą sprendimą, suderinamą su bet kokios standartinės ausinėsŠis skirtumas ypač pastebimas rinkose, kuriose įrenginių įvairovė yra norma, pavyzdžiui, Europos „Android“ aplinkoje.

Išskirtinis turinys – spustelėkite čia  Kaip sukurti Gif „VivaVideo“?

„Apple“ teikia pirmenybę vietinis garso apdorojimasTai reiškia, kad didžioji dalis darbo atliekama pačiame „iPhone“ arba „iPad“. Tai suteikia pranašumų privatumo ir ryšio požiūriu, tačiau riboja sistemos mastelio keitimą ir palaikomų kalbų skaičių; kiti sprendimai, pvz. „Microsoft Teams“Jie prideda vertimą realiuoju laiku. Savo ruožtu „Google“ intensyviau naudojasi debesijos paslaugomis, kurios leidžia jai valdyti daugiau nei 70 kalbų katalogas balso vertimui ir centralizuotai atnaujinti modelius.

Europos vartotojo požiūriu, „Google“ pasiūlymas gali atrodyti lankstesnis: norint naudotis tiesioginiu vertimu, nereikia keisti ausinių ar mobiliojo įrenginio. Tačiau svarbu nepamiršti, kad Ši funkcija dar nėra aktyvuota visoje Europoje.Nors programėlėje jau yra pokalbių vertimo režimas ir kiti pažangūs įrankiai, nuolatinio klausymosi per ausines funkcija vis dar diegiama palaipsniui, atsižvelgiant į šalį.

„Google“ nepateikė išsamaus Ispanijai ar likusiai ES daliai skirto laiko grafiko, tačiau aiškiai pasakė, kad ši beta versija bus naudojama siekiant Delsos reguliavimas, vietinio akcento atpažinimo gerinimas ir serverių apkrovos vertinimas prieš plečiant aprėptį. Pagrįstai manyti, kad diegimo tempui taip pat turės įtakos tokie veiksniai kaip Europos duomenų reglamentai ir pusiausvyra tarp duomenų apdorojimo vietoje ir debesyje.

Nors lyginant su „Apple“ dažniausiai daugiausia dėmesio skiriama patogumui ir integracijai, šiuo atveju nagrinėjami tokie klausimai kaip... Garso privatumas ir jautrių duomenų valdymas„Google“ tvirtina, kad taiko filtrus triukšmui pašalinti ir kad informacija naudojama vertimo kokybei gerinti, tačiau diskusija apie tai, kaip šie pokalbiai tvarkomi, išliks aktuali, ypač regionuose, kuriuose galioja griežti reglamentai, pavyzdžiui, Europoje.

Vertėjas, norintis tapti nematomu tarpininku

Be techninių detalių, šio atnaujinimo žinutė yra ta, kad „Google“ vertėjas siekia būti vis labiau diskretiškas tarpininkas tarp žmonių, kurie neturi bendros kalbosJi nepristato naujų įrenginių ir neverčia vartotojų mokytis sudėtingų sąsajų: ji remiasi mobiliaisiais telefonais, įprastomis ausinėmis ir nuolatiniais programinės įrangos tobulinimais, kuriuos skatina „Gemini“.

Tiesioginio vertimo funkcija vis dar yra testavimo etape ir nėra prieinama visose rinkose, tačiau ji aiškiai parodo, kuria kryptimi juda pramonė: Greitesni vertimai, suteikiantys daugiau konteksto ir artimesni tam, kaip mes iš tikrųjų kalbameTuo pačiu metu integruotos mokymosi priemonės ir patobulintas slengo bei idiomų valdymas rodo, kad vertėjas naudojamas kasdien, o ne tik konkrečiai kelionei.

Vis dar yra akivaizdžių iššūkių – nuo ​​tikslumo triukšmingoje aplinkoje iki labai lokalizuotų ar kultūriškai angažuotų išraiškų apdorojimo, jau nekalbant apie garso siuntimo į debesį pasekmes. Nepaisant to, šuolis nuo pažodinio vertimo vos prieš kelerius metus yra didelis: daugeliui vartotojų derinys „Gemini“, „Google Translate“ ir kelios įprastos ausinės Jau pradeda pakakti, kad būtų galima lengviau pereiti pokalbius, kurie anksčiau būtų buvę neįmanomi be žmogaus vertėjo.

Susijęs straipsnis:
Kaip momentinis vertimas veikia „Google“ vertėjo programėlėje?