Google Tafsiri yafanya mabadiliko makubwa katika utafsiri wa wakati halisi kwa kutumia vipokea sauti vya masikioni kutokana na Gemini AI

Sasisho la mwisho: 15/12/2025

  • Programu ya Google Translate inajumuisha tafsiri ya moja kwa moja na vipokea sauti vya masikioni vya kawaida vinavyotumia Gemini AI na usaidizi kwa zaidi ya lugha 70.
  • Kipengele hiki kinapatikana kwa mara ya kwanza katika toleo la beta kwenye Android nchini Marekani, Mexico, na India, huku upanuzi ukipangwa kufanyika hadi iOS na maeneo mengine kuanzia mwaka wa 2026.
  • Gemini huboresha uhalisia wa tafsiri, hufasiri misimu na nahau, na huhifadhi sauti, msisitizo, na mdundo wa sauti asilia.
  • Google Tafsiri huongeza zana za kujifunza lugha na kujiweka kama njia mbadala iliyo wazi kwa mbinu iliyofungwa zaidi ya mfumo ikolojia wa Apple.

Tafsiri inayoendeshwa na akili bandia (AI) katika Google Tafsiri

El Tafsiri ya Google Inapitia moja ya mabadiliko makubwa tangu kuzinduliwa kwake. Kampuni imeanza kusambaza kipengele cha tafsiri ya moja kwa moja kwenye vipokea sauti vyako vya masikioniinaungwa mkono na uwezo wa mfumo wake wa akili bandia GeminiWazo ni rahisi kuelezea lakini ni gumu kutekeleza: ili uweze kusikia, karibu mara moja, kile mtu mwingine anasema kwa lugha nyingine kupitia vipokea sauti vyako vya masikioni, kwa moja sauti ya sintetiki isiyo na roboti nyingi.

Hatua hii inaendana na mkakati wa Google wa kubadilisha Tafsiri kuwa zaidi ya mtafsiri rahisi wa maandishi. Sasa inatamani kuwa zana kuu ya kuwasiliana na kujifunza lughakutumia akili bandia (AI) ili kuelewa vyema misimu na mambo muhimu ya kitamaduni na kumsaidia mtumiaji katika utendaji wake wa kila siku. Kwa sasa, kipengele kipya kinazinduliwa katika masoko maalum na katika awamu ya betalakini inaashiria waziwazi kusambazwa kimataifa katika miaka ijayo.

Tafsiri ya wakati halisi na vifaa vya sauti vyovyote

Tafsiri ya wakati halisi ukitumia Google Tafsiri

Kipengele kinachovutia zaidi ni kipya Tafsiri ya mazungumzo ya moja kwa moja kupitia vifaa vya sautiKile ambacho hapo awali kilikuwa kimepunguzwa kwa mifumo maalum kama vile Pixel Buds sasa kinapatikana kwa karibu vifaa vyovyote vya masikioni au vifaa vya masikioni vinavyoendana na simu yako. Unachohitaji ni programu iliyosakinishwa. Tafsiri ya GoogleUnganisha vipokea sauti vya masikioni na ufikie hali ya utafsiri wa moja kwa moja.

Kwenye Android, mchakato unahusisha kufungua programu, kuchagua lugha za mazungumzo, na kubonyeza kitufe. "Tafsiri ya moja kwa moja" (Tafsiri ya Moja kwa Moja). Kutoka hapo, maikrofoni ya simu Hutambua kiotomatiki wakati kila mtu anapozungumza na kwa lugha gani.Inanukuu kwa wakati halisi, hutuma sauti kwenye seva za Google ili zishughulikiwe na Gemini, na hucheza tafsiri kupitia vipokea sauti vya masikioni kwa ucheleweshaji mdogo kiasi.

Google inaelezea kwamba AI inawajibika kwa kudumisha sauti, kasi, na msisitizo wa mzungumzaji wa awaliHii hukuruhusu kuelewa sio tu maudhui ya kile kinachosemwa, lakini pia sehemu ya nia: ikiwa mtu amekasirika, anatania, au anazungumza kwa sauti nzito zaidi. Wakati huo huo, nakala ya mazungumzo yaliyotafsiriwa huonyeshwa kwenye skrini ya simu, muhimu ikiwa unataka kukagua kile kilichosemwa au kugonga sehemu maalum ili kuisikia tena.

Kipengele hiki kinatumika mwanzoni kama toleo la beta katika programu ya Tafsiri ya Android, huku upatikanaji wake ukiwa mdogo katika masoko kama vile Marekani, Meksiko na IndiaHata hivyo, utangamano wa lugha ni mpana: mfumo una uwezo wa kutoa tafsiri ya sauti ya moja kwa moja katika zaidi ya lugha 70, pamoja na maelfu ya michanganyiko inayowezekana kati ya jozi za lugha.

Katika kesi ya iPhoneGoogle imethibitisha kwamba tafsiri ya wakati halisi yenye vipokea sauti vya masikioni pia itatolewa kwa Programu ya mtafsiri kwenye iPhoneingawa uzinduzi utafanyika baadaye. Kampuni imeweka upeo wa 2026 kupanua maeneo na kuzindua kipengele hiki kwenye iOSHii inaacha kipindi kikubwa cha majaribio kabla ya kuweza kusambazwa zaidi barani Ulaya na nchi zingine.

Maudhui ya kipekee - Bofya Hapa  Je, CapCut ina kipengele cha kukata video kiotomatiki?

Jinsi Tafsiri ya Moja kwa Moja inavyofanya kazi na inatoa nini kila siku

Tafsiri ya Google Tafsiri

Zaidi ya kichwa cha habari bandia (AI), uzoefu wa mtumiaji ni muhimu. Mara tu hali inapowashwa "Tafsiri ya moja kwa moja" Katika programu, mtumiaji anaweza kufanya mazungumzo bila kuangalia skrini kila mara. Hucheza tafsiri badala ya sauti asilia ambayo maikrofoni huipokea, ikikuruhusu kufuatilia hotuba, uwasilishaji au hata ziara iliyoongozwa ukiwa umewasha vipokea sauti vya masikioni.

Kulingana na majaribio ya ndani na baadhi ya vyombo vya habari maalum, Muda wa kusubiri kwa kawaida huwekwa chini ya sekunde moja Wakati muunganisho wa data ukiwa thabiti, ukingo huu unatosha kwa mazungumzo kutiririka kiasili, bila kulazimisha kusimama kwa muda mrefu kati ya sentensi. Athari ya vitendo inaonekana, kwa mfano, wakati wa kufuata maelezo katika lugha nyingine au kumsikiliza mzungumzaji wa kigeni kwenye mkutano.

Mojawapo ya nguvu za mfumo ni kwamba Haihitaji vipokea sauti vya masikioni "mahiri" au mifumo rasmiKifaa chochote cha sauti cha Bluetooth au waya kinachofanya kazi na simu ya mkononi kinaweza kutumika kama towe la sauti kwa ajili ya tafsiri. Hii inakitofautisha na suluhisho zilizofungwa zaidi, ambapo kazi fulani hupunguzwa kwa vifaa vya chapa maalum, na huruhusu watumiaji kutumia fursa ya kipengele hicho bila kulazimika kuboresha vifaa vyao.

Kwa vitendo, utendaji hutofautiana kulingana na mazingira. Katika maeneo yenye kelele kali ya mazingira Au kwa watu wengi kuzungumza kwa wakati mmoja, makosa ya utambuzi wa usemi huongezeka, jambo ambalo ni la kawaida katika mfumo wowote wa sasa. Google inaonyesha kwamba Gemini inajumuisha mifumo ya Chuja baadhi ya kelele za chinichini na uzingatie sauti za kiongoziLakini anakubali kwamba hali bora hubaki kuwa vyumba tulivu na wasemaji wanaoweza kuongea waziwazi.

Kwa upande wa matumizi maalum, kifaa hiki kimeundwa kwa ajili ya hali kama vile safari, mikutano ya kazi, madarasa, mahojiano au taratibu za kiutawala katika lugha nyingine. Katika hali za upande mmoja (mtu huzungumza na wengine husikiliza) uzoefu ni laini hasa; katika mazungumzo ya haraka sana au na wazungumzaji kadhaa wanaokatizana, mfumo unaweza kuwa na ugumu zaidi wa kugawanya kila uingiliaji kati.

Gemini: AI inayojaribu kusikika kama roboti kidogo

Njia rasmi za kufikia Gemini Pro

Nyuma ya kipengele hiki kipya cha vipokea sauti vya masikioni na maboresho mengine katika Google Tafsiri ni GeminiMfumo wa lugha wa Google, ambao kampuni hiyo inauunganisha hatua kwa hatua katika bidhaa muhimu kama vile Tafuta na Tafsiri yenyewe, unalenga kwenda zaidi ya tafsiri ya neno kwa neno. kutafsiri maana kamili ya vifungu vya maneno.

Kwa vitendo, hii ina maana ya tafsiri zisizo halisi na za asili zaidiHili ni kweli hasa wakati misemo ya mazungumzo, nahau, au lugha ya mtaani inapotumika. Mifano ya kawaida kama vile Kiingereza "stealing my thunder" au misemo ya Kihispania kama vile "me robó el pelo" (alinivuta mguu) mara nyingi ilisababisha matokeo ya ajabu yanapotafsiriwa kihalisi. Kwa kutumia Gemini, mfumo huu huchambua muktadha na kupendekeza njia mbadala zinazoakisi vyema maana halisi ya kifungu cha maneno katika lugha lengwa.

Google inadai kwamba mbinu hii inaruhusu ili kunasa vyema mifumo ya usemi, kejeli ndogo, au mabadiliko ya sautiHii huathiri moja kwa moja tafsiri ya mazungumzo yanayozungumzwa. Kutafsiri ujumbe usioegemea upande wowote si sawa na kutafsiri kifungu cha kejeli au maoni yaliyotolewa kwa utani. Ingawa bado kuna kiwango kidogo cha makosa, kampuni inadai kwamba vipimo vyake vya ndani vinaonyesha maboresho ya tarakimu mbili katika ubora wa tafsiri ikilinganishwa na mifumo ya awali, hasa kati ya lugha tofauti sana.

Maudhui ya kipekee - Bofya Hapa  Jinsi ya kuongeza sauti ya Ramani za Google

Uwezo huu hauzuiliwi na sauti pekee. AI pia ina jukumu katika tafsiri ya maandishi na maudhui ya kuonakama vile ishara au menyu zilizopigwa picha kwa kutumia kamera ya simu ya mkononi. Tofauti ni kwamba sasa mfumo unaweza kutoa matokeo yenye miundo asilia zaidi ya kisintaksia, kupendekeza njia mbadala za msamiati, na, katika baadhi ya matukio, kurekebisha kiwango cha utaratibu kulingana na muktadha.

Usindikaji huu wote unafanywa kwa kuchanganya rasilimali za wingu na kazi kwenye kifaa chenyewe. Baadhi ya kazi nzito hufanywa kwenye seva za Google, huku vipengele kama vile usanisi wa usemi na vichujio fulani vikishughulikiwa kwenye kifaa cha mkononi. Kulingana na kampuni hiyo, Matumizi ya betri yanafanana na yale ya simu ya sauti au simu fupi ya videoKwa hivyo, hutahitaji vifaa vyenye nguvu sana ili kutumia kipengele hiki mara kwa mara.

Zaidi ya tafsiri: Tafsiri kama zana ya kujifunza lugha

Sauti ya Bluetooth LE ni nini na jinsi ya kutumia kushiriki sauti katika Windows 11

Pamoja na tafsiri ya wakati halisi, Google inaimarisha wasifu wa kielimu wa Tafsiri. Programu sasa inajumuisha Kazi za kujifunza lugha zinazotegemea akili bandia (AI), kwa lengo la kukamilisha mifumo maalum kama vile Duolingo au ninatafsiribila kuzibadilisha.

Miongoni mwa vipengele vipya, vifuatavyo vinajitokeza: maoni yaliyoboreshwa ya matamshiZana hizi hutoa mapendekezo mahususi zaidi wakati wa kufanya mazoezi ya misemo inayozungumzwa. Mtumiaji anaweza kurudia usemi na kupokea maoni kuhusu mdundo, sauti, au sauti zisizotamkwa vizuri, na kusaidia usemi wake kuwa wa asili zaidi na usio wa roboti.

Programu hiyo pia imejumuisha mfumo wa michirizi au siku mfululizo za mazoeziKipengele hiki hufuatilia ni siku ngapi mfululizo ambazo kifaa kimetumika kwa ajili ya kusoma. Aina hii ya utaratibu, iliyoenea katika programu za kielimu, inalenga kudumisha motisha kupitia malengo madogo ya kila siku na hisia ya maendeleo endelevu.

Google inaanza kutoa chaguzi hizi katika takriban nchi na maeneo 20, huku uwepo wa awali ukionekana katika masoko kama vile Ujerumani, India au UswidiKadri inavyopanuka hadi maeneo mengi ya Ulaya, programu hii inatarajiwa kuwa chaguo la kawaida zaidi kwa wale wanaofanya mazoezi ya lugha bila utaratibu rasmi, wakiichanganya na kozi, madarasa, au Tafsiri video kutoka Kiingereza hadi Kihispania.

Sambamba na hilo, kampuni hiyo inajaribu katika Maabara ya Google na uzoefu wa kujifunza bila malipoHizi ni pamoja na mapendekezo kama vile masomo mafupi yanayolenga msamiati muhimu, moduli zilizowekwa kwa ajili ya misimu na misemo isiyo rasmi, na shughuli za kuona ambapo AI hutambua vitu kwenye picha na kufundisha majina yao kwa lugha nyingine. Ingawa majaribio haya si sehemu ya programu ya Tafsiri pekee, yanaelekeza kwenye mfumo mpana wa zana za lugha, zote zikiendeshwa na injini moja ya AI.

Ulinganisho na Apple na jukumu la Ulaya

Mbinu ya Google inapingana na ile ya Apple katika uwanja wa tafsiri ya wakati halisi. Ingawa kampuni ya Cupertino imechagua kipengele kilichojumuishwa katika mfumo wake wa ikolojia na kuunganishwa na mifumo maalum ya AirPodsGoogle imechagua suluhisho linalotegemea programu linaloendana na vifaa vya sauti vya kawaida vyovyoteTofauti hii inaonekana wazi katika masoko ambapo vifaa mbalimbali ni kawaida, kama vile mazingira ya Android ya Ulaya.

Maudhui ya kipekee - Bofya Hapa  Jinsi ya kuongeza kwenye Ugomvi?

Apple inaweka vipaumbele usindikaji wa sauti wa ndaniHiyo ni, kazi nyingi hufanywa kwenye iPhone au iPad yenyewe. Hii inatoa faida katika suala la faragha na muunganisho, lakini hupunguza uwezo wa kupanuka wa mfumo na idadi ya lugha zinazotumika; suluhisho zingine, kama vile Matimu ya MicrosoftWanaongeza tafsiri ya wakati halisi. Google, kwa upande wake, inatumia wingu kwa kina zaidi, jambo ambalo huiruhusu kudhibiti orodha ya lugha zaidi ya 70 katika tafsiri ya sauti na kusasisha mifumo katikati.

Kwa mtazamo wa mtumiaji wa Ulaya, pendekezo la Google linaweza kuonekana kuwa rahisi zaidi: halihitaji kubadilisha vipokea sauti vya masikioni au kifaa cha mkononi ili kufikia tafsiri ya moja kwa moja. Hata hivyo, ni muhimu kukumbuka kwamba Kipengele hiki bado hakijawashwa kote UlayaIngawa programu tayari inajumuisha hali ya utafsiri wa mazungumzo na zana zingine za hali ya juu, kusikiliza kwa kuendelea kwenye vipokea sauti vya masikioni bado kunakabiliwa na usambazaji wa taratibu kulingana na nchi.

Google haijatoa ratiba ya kina kwa Uhispania au sehemu nyingine za EU, lakini imeweka wazi kwamba awamu hii ya beta itatumika kwa Kurekebisha ucheleweshaji, kuboresha utambuzi wa lafudhi ya ndani, na kutathmini mzigo kwenye seva zao kabla ya kupanua wigo wa habari. Ni jambo la busara kufikiria kwamba mambo kama vile kanuni za data za Ulaya na usawa kati ya kazi za ndani na usindikaji wa wingu pia yataathiri kasi ya uwasilishaji.

Ingawa kulinganisha na Apple kwa kawaida huzingatia urahisi na ujumuishaji, katika kesi hii masuala kama vile... Faragha ya sauti na usimamizi wa data nyetiGoogle inasisitiza kwamba inatumia vichujio ili kuondoa kelele na kwamba taarifa hiyo inatumika kuboresha ubora wa tafsiri, lakini majadiliano kuhusu jinsi mazungumzo haya yanavyoshughulikiwa yatabaki mezani, hasa katika maeneo yenye kanuni kali kama vile Ulaya.

Mtafsiri anayetaka kuwa mpatanishi asiyeonekana

Zaidi ya maelezo ya kiufundi, ujumbe wa sasisho hili ni kwamba Google Tafsiri inatamani kuwa mpatanishi anayezidi kuwa na busara kati ya watu ambao hawashiriki lugha mojaHaizindui vifaa vipya au kuwalazimisha watumiaji kujifunza violesura tata: inategemea simu za mkononi, vipokea sauti vya masikioni vya kawaida, na maboresho endelevu ya programu yanayoendeshwa na Gemini.

Kipengele cha tafsiri ya moja kwa moja bado kiko katika awamu ya majaribio na hakipatikani katika masoko yote, lakini kinaonyesha wazi mahali ambapo tasnia inaelekea: Tafsiri za haraka zaidi, zenye muktadha zaidi na karibu zaidi na jinsi tunavyozungumzaSambamba na hilo, zana jumuishi za kujifunzia na uboreshaji wa utunzaji wa misimu na nahau zinaonyesha matumizi ya kila siku ya Mtafsiri, si tu kwa ajili ya kujikimu katika safari maalum.

Bado kuna changamoto dhahiri, kuanzia usahihi katika mazingira yenye kelele hadi kushughulikia misemo ya ndani au yenye chaji za kitamaduni, bila kusahau athari za kutuma sauti kwenye wingu. Hata hivyo, hatua kutoka kwa tafsiri halisi miaka michache iliyopita ni kubwa: kwa watumiaji wengi, mchanganyiko wa Gemini, Google Translate, na baadhi ya vipokea sauti vya masikioni vya kawaida Inaanza kutosha kuzungukia kwa urahisi katika mazungumzo ambayo hapo awali yasingewezekana bila mkalimani wa kibinadamu.

Nakala inayohusiana:
Je, tafsiri ya papo hapo hufanya kazi vipi katika programu ya Tafsiri ya Google?