- Google Translate-appen har liveöversättning med vanliga hörlurar med Gemini AI och stöd för fler än 70 språk.
- Funktionen kommer först i betaversion på Android i USA, Mexiko och Indien, med en expansion till iOS och fler regioner planerad från och med 2026.
- Gemini förbättrar översättningarnas naturlighet, tolkar slang och idiom och bevarar tonen, betoningen och rytmen i den ursprungliga rösten.
- Google Translate lägger till verktyg för språkinlärning och positionerar sig som ett öppet alternativ till den mer slutna metoden i Apples ekosystem.
El Google Translate Den genomgår en av sina största förändringar sedan lanseringen. Företaget har börjat lansera en funktion för att realtidsöversättning direkt i dina hörlurarstödd av funktionerna i dess artificiella intelligensmodell tvillingarnaIdén är enkel att förklara men komplex att genomföra: så att du nästan omedelbart kan höra vad en annan person säger på ett annat språk genom dina hörlurar, med en mindre robotisk syntetisk röst.
Detta drag passar in i Googles strategi att förvandla Translate till mer än bara en enkel textöversättare. Det strävar nu efter att vara en centralt verktyg för kommunikation och språkinlärninganvänder AI både för att bättre förstå slang och kulturella nyanser och för att hjälpa användaren i deras dagliga arbete. För närvarande lanseras den nya funktionen i specifika marknader och i betafasmen det pekar tydligt på en global utrullning under de kommande åren.
Översättning i realtid med valfritt headset

Det mest slående kännetecknet är den nya översättning av livekonversationer via headsetDet som tidigare var begränsat till specifika modeller som Pixel Buds är nu tillgängligt för praktiskt taget alla hörlurar eller öronsnäckor som är kompatibla med din telefon. Allt du behöver är att appen är installerad. Google TranslateAnslut hörlurarna och få tillgång till liveöversättningsläget.
På Android innebär processen att öppna appen, välja konversationsspråk och trycka på knappen. "Liveöversättning" (Liveöversättning). Därifrån, telefonens mikrofon Den känner automatiskt av när varje person talar och på vilket språk.Den transkriberar i realtid, skickar ljudet till Googles servrar för bearbetning av Gemini och spelar upp översättningen via hörlurarna med relativt låg fördröjning.
Google förklarar att AI är ansvarig för bibehålla tonen, kadensen och betoningen hos den ursprungliga talarenDetta gör att du kan förstå inte bara innehållet i det som sägs, utan också en del av avsikten: om någon är arg, skämtar eller talar i en mer allvarlig ton. Samtidigt visas en transkription av den översatta konversationen på mobilskärmen, användbart om du vill granska vad som sades eller trycka på ett specifikt segment för att höra det igen.
Funktionen distribueras initialt som beta-version i Översätt-appen för Android, med begränsad tillgänglighet på marknader som USA, Mexiko och IndienTrots detta är den språkliga kompatibiliteten bred: systemet kan erbjuda röstöversättning i realtid på mer än tio språk, med tusentals möjliga kombinationer mellan språkpar.
I fallet med iPhoneGoogle har bekräftat att realtidsöversättning med hörlurar också kommer att finnas tillgängligt. Översättningsapp på iPhoneäven om utrullningen kommer att ske senare. Företaget har satt horisonten för 2026 för att utöka regioner och lansera funktionen på iOSDetta lämnar en betydande testperiod innan den kan lanseras i större utsträckning i Europa och andra länder.
Hur Live Translate fungerar och vad det erbjuder dagligen

Utöver den övergripande AI:n är användarupplevelsen avgörande. När läget är aktiverat "Liveöversättning" I appen kan användaren ha en konversation utan att ständigt titta på skärmen. Systemet Spelar översättningen över originalrösten som mikrofonen fångar upp, så att du kan följa ett föredrag, en presentation eller till och med en guidad tur med hörlurar på.
Enligt interna tester och vissa specialiserade mediebolag, den Latensen hålls generellt under en sekund När dataanslutningen är stabil är denna marginal tillräcklig för att samtalet ska flyta någorlunda naturligt, utan att tvinga fram långa pauser mellan meningarna. Den praktiska effekten är märkbar till exempel när man följer en förklaring på ett annat språk eller lyssnar på en utländsk talare på en konferens.
En av systemets starka sidor är att Det kräver inte "smarta" hörlurar eller officiella modellerAlla Bluetooth- eller trådbundna headset som fungerar med en mobiltelefon kan fungera som ljudutgång för översättning. Detta skiljer det från mer slutna lösningar, där vissa funktioner är begränsade till enheter av ett specifikt märke, och gör det möjligt för användare att dra nytta av funktionen utan att behöva uppgradera sin hårdvara.
I praktiken varierar prestandan beroende på miljön. På platser med intensivt omgivande ljud Eller med många personer som talar samtidigt ökar felen i taligenkänningen, något som är vanligt i alla nuvarande system. Google indikerar att Gemini har mekanismer för Filtrera bort en del av bakgrundsljudet och fokusera på sångenMen han medger att de ideala förhållandena förblir relativt tysta rum och talare som artikulerar tydligt.
När det gäller specifika användningsområden är verktyget utformat för situationer som resor, arbetsmöten, kurser, intervjuer eller administrativa förfaranden på ett annat språk. I envägsscenarier (någon talar och resten lyssnar) är upplevelsen särskilt smidig; i mycket snabba samtal eller med flera samtalspartners som avbryter varandra kan systemet ha svårare att segmentera varje intervention.
Gemini: AI:n som försöker låta mindre robotisk

Bakom den här nya hörlursfunktionen och resten av förbättringarna i Google Translate finns tvillingarnaGoogles språkmodell, som företaget gradvis integrerar i viktiga produkter som Search och Translate, syftar till att gå bortom ordagrant översättning. tolka frasernas fulla betydelse.
I praktiken innebär detta mindre bokstavliga och mer naturliga översättningarDetta gäller särskilt när vardagliga uttryck, idiom eller lokal slang kommer in i bilden. Typiska exempel som det engelska "stealing my thunder" eller spanska uttryck som "me robó el pelo" (han drog mitt ben) ledde ofta till märkliga resultat när de översattes bokstavligt. Med Gemini analyserar systemet sammanhanget och föreslår alternativ som bättre återspeglar frasens faktiska betydelse på målspråket.
Google hävdar att den här metoden tillåter för att bättre fånga talmönster, subtila ironier eller tonförändringarDetta påverkar direkt översättningen av talade samtal. Att översätta ett neutralt meddelande är inte samma sak som att översätta en sarkastisk fras eller en kommentar som görs halvt på skämt. Även om det fortfarande finns en felmarginal hävdar företaget att deras interna mätvärden visar tvåsiffriga förbättringar av översättningskvaliteten jämfört med tidigare system, särskilt mellan mycket olika språk.
Dessa funktioner är inte begränsade till ljud. AI spelar också en roll i översättning av text och visuellt innehållsåsom skyltar eller menyer fotograferade med en mobiltelefonkamera. Skillnaden är att systemet nu kan erbjuda resultat med mer naturliga syntaktiska strukturer, föreslå ordförrådsalternativ och i vissa fall anpassa formalitetsnivån efter sammanhanget.
All denna bearbetning sker genom att kombinera molnresurser med uppgifter på själva enheten. En del av det tunga arbetet görs på Googles servrar, medan element som talsyntes och vissa filter hanteras på den mobila enheten. Enligt företaget, Batteriförbrukningen är jämförbar med den för ett röstsamtal eller ett kort videosamtalDärför skulle du inte behöva särskilt kraftfull hårdvara för att använda funktionen ibland.
Bortom översättning: Översätt som verktyg för språkinlärning

Vid sidan av realtidsöversättning stärker Google Translates utbildningsprofil. Appen innehåller nu AI-baserade språkinlärningsfunktioner, med syftet att komplettera specifika plattformar som Duolingo eller jag översätterutan att ersätta dem.
Bland de nya funktionerna är förbättrad uttalsåterkopplingDessa verktyg erbjuder mer specifika förslag när man övar talade fraser. Användaren kan upprepa ett uttryck och få feedback på rytm, intonation eller dåligt artikulerade ljud, vilket hjälper deras tal att bli mer infödd och mindre robotiskt.
Appen har också inkluderat en strecksystem eller på varandra följande dagar av träningDen här funktionen spårar hur många dagar i följd verktyget har använts för studier. Den här typen av mekanism, som är utbredd i utbildningsappar, syftar till att upprätthålla motivationen genom små dagliga mål och en känsla av kontinuerliga framsteg.
Google börjar lansera dessa alternativ i cirka 20 länder och regioner, med en initial närvaro på marknader som Tyskland, Indien eller SverigeI takt med att appen expanderar till fler europeiska territorier förväntas den bli ett vanligare alternativ för dem som övar språk informellt och kombinerar den med kurser, lektioner eller annat. Översätt videor från engelska till spanska.
Parallellt experimenterar företaget i Google Labs med tre gratis lärupplevelserDessa inkluderar förslag som korta lektioner inriktade på användbart ordförråd, moduler dedikerade till slang och informella uttryck, och visuella aktiviteter där AI identifierar objekt i ett foto och lär ut deras namn på ett annat språk. Även om dessa tester inte strikt är en del av Translate-appen, pekar de på ett bredare ekosystem av språkverktyg, alla drivna av samma AI-motor.
Jämförelse med Apple och Europas roll
Googles tillvägagångssätt står i kontrast till Apples inom området realtidsöversättning. Medan företaget från Cupertino har valt en funktion som är integrerad i sitt eget ekosystem och kopplad till specifika AirPods-modellerGoogle har valt en mjukvarubaserad lösning som är kompatibel med vilket standardheadset som helstDenna skillnad är särskilt märkbar på marknader där en mängd olika enheter är normen, såsom den europeiska Android-miljön.
Apple prioriterar lokal ljudbehandlingDet vill säga att det mesta arbetet utförs på själva iPhone eller iPad. Detta erbjuder fördelar när det gäller integritet och anslutning, men begränsar systemets skalbarhet och antalet språk som stöds; andra lösningar, som till exempel Microsoft-lagDe lägger till realtidsöversättning. Google, å sin sida, använder molnet mer intensivt, vilket gör det möjligt att hantera en katalog med över 70 språk inom röstöversättning och uppdatera modeller centralt.
Ur en europeisk användares perspektiv kan Googles förslag verka mer flexibelt: det kräver inte att man byter hörlurar eller mobil enhet för att få tillgång till liveöversättning. Det är dock viktigt att komma ihåg att Funktionen har ännu inte aktiverats i EuropaÄven om appen redan inkluderar ett läge för konversationsöversättning och andra avancerade verktyg, är kontinuerlig lyssning i hörlurar fortfarande föremål för en gradvis utrullning per land.
Google har inte presenterat någon detaljerad tidslinje för Spanien eller resten av EU, men har gjort det klart att denna betafas kommer att bidra till Justera latens, förbättra lokal accentigenkänning och utvärdera belastningen på deras servrar innan täckningen utökas. Det är rimligt att tro att faktorer som europeiska dataförordningar och balansen mellan lokal och molnbaserad hantering också kommer att påverka implementeringstakten.
Även om jämförelser med Apple vanligtvis fokuserar på bekvämlighet och integration, så är det i det här fallet problem som... Ljudsekretess och hantering av känsliga dataGoogle insisterar på att de använder filter för att ta bort brus och att informationen används för att förbättra översättningens kvalitet, men diskussionen om hur dessa konversationer hanteras kommer att förbli uppe på bordet, särskilt i regioner med strikta regler som Europa.
En översättare som vill bli en osynlig mellanhand
Utöver de tekniska detaljerna är budskapet i den här uppdateringen att Google Translate strävar efter att vara en en alltmer diskret mellanhand mellan människor som inte delar ett språkDen lanserar inte nya enheter eller tvingar användare att lära sig komplicerade gränssnitt: den förlitar sig på mobiltelefoner, konventionella hörlurar och kontinuerliga programvaruförbättringar drivna av Gemini.
Funktionen för liveöversättning är fortfarande i testfasen och är inte tillgänglig på alla marknader, men den illustrerar tydligt vart branschen är på väg: Snabbare översättningar, med mer sammanhang och mer likt hur vi faktiskt talarParallellt pekar de integrerade inlärningsverktygen och den förbättrade hanteringen av slang och idiom mot en mer vardaglig användning av översättaren, inte bara för att ta sig fram på en specifik resa.
Det finns fortfarande uppenbara utmaningar, från noggrannhet i bullriga miljöer till hantering av starkt lokaliserade eller kulturellt laddade uttryck, för att inte tala om konsekvenserna av att skicka ljud till molnet. Ändå är språnget från bokstavlig översättning för bara några år sedan betydande: för många användare är kombinationen av Gemini, Google Translate och några vanliga hörlurar Det börjar vara tillräckligt för att med viss lätthet navigera i samtal som tidigare skulle ha varit omöjliga utan en mänsklig tolk.
Jag är en teknikentusiast som har gjort sina "nördar"-intressen till ett yrke. Jag har tillbringat mer än 10 år av mitt liv med att använda den senaste tekniken och mixtrat med alla typer av program av ren nyfikenhet. Nu har jag specialiserat mig på datateknik och tv-spel. Detta beror på att jag i mer än 5 år har arbetat med att skriva för olika webbplatser om teknik och videospel, skapa artiklar som försöker ge dig den information du behöver på ett språk som är begripligt för alla.
Om du har några frågor sträcker sig min kunskap från allt som rör operativsystemet Windows samt Android för mobiltelefoner. Och mitt engagemang är för dig, jag är alltid villig att spendera några minuter och hjälpa dig att lösa alla frågor du kan ha i den här internetvärlden.