Pateicoties Gemini mākslīgajam intelektam, Google Translate veic lēcienu uz reāllaika tulkošanu ar austiņām

Pēdējais atjauninājums: 2025. gada 15. oktobrī

  • Google Translate lietotne ietver tiešraides tulkošanu ar parastajām austiņām, izmantojot Gemini mākslīgo intelektu, un atbalstu vairāk nekā 70 valodām.
  • Šī funkcija sākotnēji beta versijā būs pieejama operētājsistēmā Android ASV, Meksikā un Indijā, un paplašināšana uz iOS un citiem reģioniem ir plānota, sākot ar 2026. gadu.
  • Gemini uzlabo tulkojumu dabiskumu, interpretē slengu un idiomas, kā arī saglabā oriģinālās balss toni, uzsvaru un ritmu.
  • Google Translate pievieno valodu apguves rīkus un pozicionē sevi kā atvērtu alternatīvu Apple ekosistēmas slēgtākajai pieejai.

Ar mākslīgo intelektu nodrošināta tulkošana pakalpojumā Google Translate

El Google tulkotājs Kopš palaišanas tā piedzīvo vienu no lielākajām izmaiņām. Uzņēmums ir sācis ieviest funkciju, lai reāllaika tulkojums tieši jūsu austiņāsko atbalsta tā mākslīgā intelekta modeļa iespējas DvīņiIdeja ir vienkārši izskaidrojama, bet sarežģīta īstenojama: lai jūs gandrīz acumirklī varētu dzirdēt, ko cita persona saka citā valodā caur austiņām, ar mazāk robotiska sintētiskā balss.

Šis solis atbilst Google stratēģijai pārveidot Tulkotāju par vairāk nekā tikai vienkāršu teksta tulkotāju. Tagad tas tiecas kļūt par centrālais instruments saziņai un valodu apguveiizmantojot mākslīgo intelektu gan lai labāk izprastu slengu un kultūras nianses, gan palīdzētu lietotājam ikdienas praksē. Pagaidām jaunā funkcija tiek palaista konkrētos tirgos un beta fāzētaču tas nepārprotami norāda uz globālu ieviešanu turpmākajos gados.

Reāllaika tulkošana ar jebkurām austiņām

Tulkošana reāllaikā, izmantojot Google Translate

Visievērojamākā iezīme ir jaunā tiešraides sarunas tulkošana, izmantojot austiņasKas iepriekš bija pieejams tikai noteiktiem modeļiem, piemēram, Pixel Buds, tagad ir pieejams praktiski jebkurām austiņām vai austiņām, kas ir saderīgas ar jūsu tālruni. Viss, kas jums nepieciešams, ir instalēta lietotne. Google tulkotājsPievienojiet austiņas un piekļūstiet tiešraides tulkošanas režīmam.

Operētājsistēmā Android process ietver lietojumprogrammas atvēršanu, sarunu valodu izvēli un pogas nospiešanu. "Tiešraides tulkojums" (Tiešraides tulkojums). No turienes tālruņa mikrofons Tas automātiski nosaka, kad katra persona runā un kādā valodā.Tas transkribē reāllaikā, nosūta audio uz Google serveriem apstrādei, ko veic Gemini, un atskaņo tulkojumu austiņās ar relatīvi nelielu aizkavi.

Google skaidro, ka par to ir atbildīga mākslīgā intelekta saglabāt sākotnējā runātāja toni, ritmu un uzsvaruTas ļauj saprast ne tikai teiktā saturu, bet arī daļu no nodoma: vai kāds ir dusmīgs, joko vai runā nopietnākā tonī. Vienlaikus mobilā tālruņa ekrānā tiek parādīts tulkotās sarunas transkripts, kas ir noderīgi, ja vēlaties pārskatīt teikto vai pieskarties konkrētam segmentam, lai to noklausītos vēlreiz.

Sākotnēji šī funkcija tiek izvietota kā beta versija lietotnē Tulkotājs Androidar ierobežotu pieejamību tādos tirgos kā Amerikas Savienotās Valstis, Meksika un IndijaPat ja tā, valodu saderība ir plaša: sistēma spēj piedāvāt tiešraides balss tulkojumu vairāk nekā 70 valodās, ar tūkstošiem iespējamu kombināciju starp valodu pāriem.

Gadījumā, ja iPhoneGoogle ir apstiprinājis, ka reāllaika tulkošana ar austiņām būs pieejama arī Tulkotāja lietotne iPhone tālrunīlai gan ieviešana notiks vēlāk. Uzņēmums ir noteicis horizontu 2026. gadā tiks paplašināti reģioni un palaista funkcija operētājsistēmā iOSTas nozīmē, ka pirms plašākas ieviešanas Eiropā un citās valstīs ir nepieciešams ievērojams testēšanas periods.

Ekskluzīvs saturs — noklikšķiniet šeit  Kā noņemt fonu pakalpojumā Google prezentācijas

Kā darbojas Live Translate un ko tas piedāvā ikdienā

Google tulkotāja tulkojums

Papildus galvenajam mākslīgajam intelektam, lietotāja pieredze ir svarīga. Kad režīms ir aktivizēts. "Tiešraides tulkojums" Lietotnē lietotājs var sarunāties, nepārtraukti neskatoties ekrānā. Sistēma Atskaņo tulkojumu virs oriģinālbalss ko uztver mikrofons, ļaujot sekot līdzi runai, prezentācijai vai pat ekskursijai ar austiņām.

Saskaņā ar iekšējiem testiem un dažiem specializētiem plašsaziņas līdzekļiem, Latentums parasti tiek turēts zem vienas sekundes Kad datu savienojums ir stabils, šī rezerve ir pietiekama, lai saruna ritētu samērā dabiski, bez piespiedu garām pauzēm starp teikumiem. Praktiskais efekts ir manāms, piemēram, sekojot skaidrojumam citā valodā vai klausoties ārzemju runātāju konferencē.

Viena no sistēmas stiprajām pusēm ir tā, ka Tam nav nepieciešamas "viedās" austiņas vai oficiāli modeļiJebkuras Bluetooth vai vadu austiņas, kas darbojas ar mobilo tālruni, var kalpot kā audio izeja tulkošanai. Tas tās atšķir no slēgtākiem risinājumiem, kur noteiktas funkcijas ir pieejamas tikai konkrēta zīmola ierīcēm, un ļauj lietotājiem izmantot šo funkciju, nejauninot aparatūru.

Praksē veiktspēja atšķiras atkarībā no vides. Vietās ar intensīvs apkārtējais troksnis Vai arī, ja vienlaikus runā daudzi cilvēki, palielinās runas atpazīšanas kļūdu skaits, kas ir ierasta lieta jebkurā pašreizējā sistēmā. Google norāda, ka Gemini ir iestrādāti mehānismi, kas Izfiltrējiet daļu fona trokšņa un koncentrējieties uz galveno vokāluTaču viņš atzīst, ka ideāli apstākļi joprojām ir relatīvi klusas telpas un runātāji, kas skaidri artikulējas.

Runājot par konkrētiem lietojumiem, rīks ir paredzēts tādām situācijām kā braucieni, darba sanāksmes, nodarbības, intervijas vai administratīvās procedūras citā valodā. Vienvirziena scenārijos (kāds runā, bet pārējie klausās) pieredze ir īpaši vienmērīga; ļoti ātrās sarunās vai ar vairākiem sarunu biedriem, kas viens otru pārtrauc, sistēmai var būt grūtāk segmentēt katru iejaukšanos.

Dvīņi: mākslīgais intelekts, kas cenšas izklausīties mazāk robotisks

Oficiālas piekļuves metodes pakalpojumam Gemini Pro

Aiz šīs jaunās austiņu funkcijas un pārējiem Google Translate uzlabojumiem slēpjas DvīņiGoogle valodas modelis, ko uzņēmums pakāpeniski integrē tādos galvenajos produktos kā meklēšana un tulkošana, tiecas pārsniegt burtisku tulkošanu. interpretēt frāžu pilno nozīmi.

Praksē tas nozīmē mazāk burtiski un dabiskāki tulkojumiTas jo īpaši attiecas uz sarunvalodas izteicieniem, idiomām vai vietējo slengu. Tipiski piemēri, piemēram, angļu valodas izteiciens "stealing my thunder" vai spāņu valodas izteicieni, piemēram, "me robó el pelo" (viņš pavilka manu kāju), burtiski tulkojot, bieži vien deva dīvainus rezultātus. Izmantojot Gemini, sistēma analizē kontekstu un piedāvā alternatīvas, kas labāk atspoguļo frāzes faktisko nozīmi mērķa valodā.

Google apgalvo, ka šī pieeja ļauj lai labāk uztvertu runas modeļus, smalkas ironijas vai toņa izmaiņasTas tieši ietekmē runāto sarunu tulkošanu. Neitrāla ziņojuma tulkošana nav tas pats, kas sarkastiskas frāzes vai puspajokam izteikta komentāra tulkošana. Lai gan joprojām pastāv kļūdas robeža, uzņēmums apgalvo, ka tā iekšējie rādītāji liecina, ka divciparu uzlabojumi tulkojumu kvalitātē salīdzinājumā ar iepriekšējām sistēmām, īpaši starp ļoti atšķirīgām valodām.

Ekskluzīvs saturs — noklikšķiniet šeit  Kā noņemt vertikālo asi Google izklājlapās

Šīs iespējas neaprobežojas tikai ar audio. Arī mākslīgajam intelektam ir nozīme teksta un vizuālā satura tulkošanapiemēram, ar mobilā tālruņa kameru fotografētas zīmes vai ēdienkartes. Atšķirība ir tāda, ka tagad sistēma var piedāvāt rezultātus ar dabiskākām sintaktiskām struktūrām, ieteikt vārdu krājuma alternatīvas un dažos gadījumos pielāgot formalitātes līmeni atbilstoši kontekstam.

Visa šī apstrāde tiek veikta, apvienojot mākoņa resursus ar uzdevumiem pašā ierīcē. Daļa no smagā darba tiek veikta Google serveros, savukārt tādi elementi kā runas sintēze un noteikti filtri tiek apstrādāti mobilajā ierīcē. Saskaņā ar uzņēmuma teikto, Akumulatora patēriņš ir salīdzināms ar balss zvana vai īsa videozvana patēriņu.Tādēļ, lai šo funkciju izmantotu neregulāri, jums nebūtu nepieciešama īpaši jaudīga aparatūra.

Vairāk nekā tulkošana: tulkošana kā valodas apguves instruments

Kas ir Bluetooth LE Audio un kā izmantot audio koplietošanu operētājsistēmā Windows 11

Līdztekus tulkošanai reāllaikā Google stiprina lietotnes Translate izglītojošo profilu. Lietotnē tagad ir iekļauts Mākslīgā intelekta balstītas valodu apguves funkcijas, lai papildinātu konkrētas platformas, piemēram, Duolingo vai iTranslateneaizstājot tos.

Starp jaunajām funkcijām ir uzlabota izrunas atgriezeniskā saiteŠie rīki piedāvā konkrētākus ieteikumus, praktizējot runātas frāzes. Lietotājs var atkārtot izteiksmi un saņemt atsauksmes par ritmu, intonāciju vai slikti artikulētām skaņām, palīdzot savai runai kļūt līdzīgākai dzimtajai valodai un mazāk robotiskai.

Lietotnē ir iekļauts arī sēriju sistēma vai secīgas treniņu dienasŠī funkcija izseko, cik dienas pēc kārtas rīks ir izmantots mācībām. Šāda veida mehānisms, kas ir plaši izplatīts izglītojošās lietotnēs, ir paredzēts, lai uzturētu motivāciju, izmantojot mazus ikdienas mērķus un nepārtraukta progresa sajūtu.

Google sāk ieviest šīs iespējas. aptuveni 20 valstīs un reģionos, ar sākotnējo klātbūtni tādos tirgos kā Vācija, Indija vai ZviedrijaPaplašinoties uz vairāk Eiropas teritorijām, paredzams, ka lietotne kļūs par izplatītāku iespēju tiem, kas neformāli praktizē valodas, apvienojot to ar kursiem, nodarbībām vai Tulkojiet video no angļu valodas uz spāņu valodu.

Paralēli uzņēmums veic eksperimentus pakalpojumā Google Labs ar trīs bezmaksas mācību pieredzesTie ietver tādus priekšlikumus kā īsas nodarbības, kas koncentrējas uz noderīgu vārdu krājumu, moduļus, kas veltīti slengu un neformālām izpausmēm, kā arī vizuālas aktivitātes, kurās mākslīgais intelekts identificē objektus fotoattēlā un māca to nosaukumus citā valodā. Lai gan šie testi nav stingri daļa no lietotnes Tulkotājs, tie norāda uz plašāku valodas rīku ekosistēmu, ko visus darbina viens un tas pats mākslīgā intelekta dzinējs.

Salīdzinājums ar Apple un Eiropas loma

Google pieeja reāllaika tulkošanas jomā atšķiras no Apple pieejas. Lai gan Cupertino uzņēmums ir izvēlējies funkciju, kas integrēta tā ekosistēmā un saistīta ar konkrēti AirPods modeļiGoogle ir izvēlējies programmatūras risinājumu, kas ir saderīgs ar jebkuras standarta austiņasŠī atšķirība ir īpaši jūtama tirgos, kur ierīču daudzveidība ir norma, piemēram, Eiropas Android vidē.

Ekskluzīvs saturs — noklikšķiniet šeit  Kā programmā Excel izmantot koplietoto rediģēšanu?

Apple piešķir prioritāti lokālā audio apstrādeTas nozīmē, ka lielākā daļa darba tiek veikta pašā iPhone vai iPad ierīcē. Tas piedāvā priekšrocības privātuma un savienojamības ziņā, taču ierobežo sistēmas mērogojamību un atbalstīto valodu skaitu; citi risinājumi, piemēram, Microsoft komandasViņi pievieno reāllaika tulkošanu. Google savukārt intensīvāk izmanto mākoni, kas ļauj tam pārvaldīt vairāk nekā 70 valodu katalogs balss tulkošanā un centralizēti atjaunināt modeļus.

No Eiropas lietotāja viedokļa Google priekšlikums varētu šķist elastīgāks: lai piekļūtu tiešraides tulkojumam, nav jāmaina austiņas vai mobilā ierīce. Tomēr ir svarīgi paturēt prātā, ka Šī funkcija vēl nav aktivizēta visā Eiropā.Lai gan lietotnē jau ir iekļauts sarunu tulkošanas režīms un citi uzlaboti rīki, nepārtrauktas klausīšanās austiņās joprojām tiek pakāpeniski ieviesta pa valstīm.

Google nav piedāvājis detalizētu laika grafiku Spānijai vai pārējai ES, taču ir skaidri norādījis, ka šī beta fāze kalpos Latentuma pielāgošana, lokālā akcenta atpazīšanas uzlabošana un serveru slodzes novērtēšana pirms pārklājuma paplašināšanas. Ir pamatoti uzskatīt, ka tādi faktori kā Eiropas datu noteikumi un līdzsvars starp lokālo un mākoņapstrādi ietekmēs arī ieviešanas tempu.

Lai gan salīdzinājumi ar Apple parasti koncentrējas uz ērtībām un integrāciju, šajā gadījumā tādi jautājumi kā... audio privātums un sensitīvu datu pārvaldībaGoogle uzstāj, ka tas izmanto filtrus trokšņu noņemšanai un ka informācija tiek izmantota tulkojuma kvalitātes uzlabošanai, taču diskusija par to, kā šīs sarunas tiek apstrādātas, paliks aktuāla, īpaši reģionos ar stingriem noteikumiem, piemēram, Eiropā.

Tulkotājs, kurš vēlas kļūt par neredzamu starpnieku

Papildus tehniskajām detaļām šī atjauninājuma vēstījums ir tāds, ka Google Translate tiecas kļūt par arvien diskrētāks starpnieks starp cilvēkiem, kuriem nav kopīgas valodasTas neražo jaunas ierīces un nespiež lietotājus apgūt sarežģītas saskarnes: tas paļaujas uz mobilajiem tālruņiem, parastajām austiņām un nepārtrauktiem programmatūras uzlabojumiem, ko virza Gemini.

Tiešraides tulkošanas funkcija joprojām ir testēšanas fāzē un nav pieejama visos tirgos, taču tā skaidri parāda, kurp virzās nozare: Ātrāki tulkojumi ar plašāku kontekstu un precīzāku to, kā mēs patiesībā runājamVienlaikus integrētie mācību rīki un uzlabotā slenga un idiomu apstrāde norāda uz tulkotāja ikdienas lietošanu, ne tikai konkrēta ceļojuma vajadzībām.

Joprojām pastāv acīmredzamas problēmas, sākot ar precizitāti trokšņainā vidē un beidzot ar ļoti lokalizētu vai kultūras ziņā spriedzējošu izteiksmju apstrādi, nemaz nerunājot par audio nosūtīšanas uz mākoni sekām. Tomēr lēciens no burtiskās tulkošanas tikai pirms dažiem gadiem ir ievērojams: daudziem lietotājiem kombinācija Gemini, Google Translate un dažas parastas austiņas Ar to sāk pietikt, lai ar zināmu vieglumu orientētos sarunās, kas iepriekš nebūtu bijušas iespējamas bez cilvēka tulka.

Saistīts raksts:
Kā darbojas tūlītējās tulkošanas funkcija lietotnē Google Translate?