Gemini 2.5 Flash Native Audio: Báyìí ni ohùn AI Google ṣe ń yípadà

Imudojuiwọn ti o kẹhin: 15/12/2025

  • Gemini 2.5 Flash Native Audio mu ki awọn ibaraẹnisọrọ ohun pẹlu AI Google dara si, deede, ati irọrun.
  • Àwòṣe náà ń tún àwọn ìpè sí àwọn iṣẹ́ òde ṣe, ó ń tẹ̀lé àwọn ìtọ́ni tó díjú dáadáa, ó sì ń mú kí àyíká ọ̀rọ̀ dára síi nínú àwọn ìjíròrò gígùn.
  • Ó ní ìtumọ̀ ohùn-sí-ohùn ní àkókò gidi, pẹ̀lú àtìlẹ́yìn fún èdè tó ju 70 lọ àti àwọn ìdàpọ̀ ìtumọ̀ 2.000, èyí tó ń pa ohùn àti ìró ohùn mọ́.
  • A ti ṣepọ rẹ̀ sinu Google AI Studio, Vertex AI, Gemini Live ati Search Live, a sì ti ń lò ó ninu awọn ọjà Google ati awọn ẹni-kẹta.

Gemini 2.5 Flash Native Audio

Google ti gbe igbesẹ miiran ninu idagbasoke eto-ẹkọ imọ-jinlẹ atọwọda rẹ pẹlu imudojuiwọn pataki si Gemini 2.5 Flash Native AudioA ṣe àwòṣe náà láti lóye àti láti mú ohùn jáde ní àkókò gidi. Ìmọ̀-ẹ̀rọ yìí ni a ṣe láti mú kí ìbáṣepọ̀ ohùn túbọ̀ muná dóko. sunmọ ibaraẹnisọrọ eniyanmejeeji ni igbesi aye ojoojumọ ati ni awọn agbegbe ọjọgbọn.

Kò sí láti “fi ohùn kan” sí ìdáhùn olùrànlọ́wọ́, àti ní ìfiwéra pẹ̀lú àwọn àṣàyàn mìíràn nínú Àwọn àfiwé ohùn AIA ṣe apẹrẹ awoṣe yii fun láti mú àwọn ìjíròrò àdánidá, iṣẹ́ àti ti àyíká dúró, Ṣíṣe ìpinnu nípa ìgbà tí a ó wá ìwífún síi àti ṣíṣàkóso àwọn ìlànà dídíjú láìsí ìyípadà ìjíròrò náàPẹ̀lú èyí, Google ń fi kún ìdúróṣinṣin rẹ̀ láti sọ̀rọ̀ gẹ́gẹ́ bí ọ̀nà pàtàkì láti bá àwọn iṣẹ́ AI rẹ̀ lò.

Kí ni Gemini 2.5 Flash Native Audio àti níbo ni wọ́n ti ń lò ó?

Gemini 2.5 Flash Native Audio ni ẹ̀dà tuntun ti àwòṣe ohùn ìbílẹ̀ Google, tí ó lè ṣe fetísílẹ̀, lóye, kí o sì dáhùn nípasẹ̀ ohùn ní àkókò gidi. Láìdàbí àwọn ètò ìṣáájú tí a fojú sí ìṣẹ̀dá ọ̀rọ̀ sísọ nìkan, a ṣe ẹ̀rọ yìí láti ṣiṣẹ́ pẹ̀lú ohùn gẹ́gẹ́ bí ìtẹ̀síwájú àti ìjáde ní àkókò kan náà, èyí tí ó mú kí ó dára fún àwọn olùrànlọ́wọ́ ìjíròrò.

Ile-iṣẹ naa ti ṣafikun ẹya yii sinu ọpọlọpọ awọn iru ẹrọ pataki rẹ: Google AI Studio, Vertex AI, Gemini Live and Search LiveÈyí túmọ̀ sí wípé àwọn olùgbékalẹ̀ àti àwọn ilé-iṣẹ́ lè bẹ̀rẹ̀ sí í kọ́ ilé náà Àwọn aṣojú ohùn tó ti ní ìlọsíwájú lórí ìmọ̀ ẹ̀rọ kan náà tó ń fún àwọn ìrírí ìjíròrò tuntun ti Google lágbára nípa ìfọ̀rọ̀wérọ̀.

Ní ìṣe, àwọn olùlò yóò kíyèsí àwọn àyípadà wọ̀nyí nínú àwọn ìrírí bíi Gemini Live (ipo ibaraẹnisọrọ ohun pẹlu oluranlọwọ) tabi ninu Wa Live laarin ipo AI ti ohun elo Google, nibiti awọn idahun ti a sọ ba dun diẹ sii ni afihan diẹ sii, ṣe kedere diẹ sii, ati ni alaye ti o dara julọSíwájú sí i, o tilẹ̀ lè béèrè lọ́wọ́ olùrànlọ́wọ́ náà láti sọ̀rọ̀ díẹ̀díẹ̀, kí o sì ṣe àtúnṣe iyàrá ìjíròrò náà nípa ti ara.

Yàtọ̀ sí Google fúnra rẹ̀, àwọn agbára wọ̀nyí ti wà fún àwọn ẹgbẹ́ kẹta nípasẹ̀ Vertex AI àti Gemini APIkí àwọn ilé-iṣẹ́ míràn lè ṣẹ̀dá adase òjíṣẹ ohùn, àwọn olùgbàlejò tàbí àwọn irinṣẹ́ ìrànlọ́wọ́ pẹ̀lú ìpele kan náà ti ìmọ̀-ẹ̀rọ ohùn.

Awọn iṣẹ ita ti o peye diẹ sii ati awọn awoṣe ti o ni idiyele ti o dara julọ

Ohùn Google AI

Ọ̀kan lára ​​àwọn agbègbè tí Gemini 2.5 Flash Native Audio ti ṣe ìlọsíwájú jùlọ ni agbára rẹ̀ láti pe awọn iṣẹ itaNí àwọn ọ̀rọ̀ tó rọrùn, àwòṣe náà ti túbọ̀ ṣeé gbẹ́kẹ̀lé nígbà tí ó bá kan ṣíṣe ìpinnu. nigbati o ba nilo lati kan si awọn iṣẹ akoko gidi tabi dataFún àpẹẹrẹ, láti gba ìwífún tuntun, ṣàyẹ̀wò ipò àṣẹ kan, tàbí bẹ̀rẹ̀ iṣẹ́ aládàáṣe kan.

Iyasoto akoonu - Tẹ Nibi  Bii o ṣe le fi iyaworan Google kan sinu Awọn ifaworanhan Google

Google tọ́ka sí i pé ìpele tí a fi kún un yìí túmọ̀ sí àwọn àṣìṣe díẹ̀ nígbà tí a bá ń fa àwọn ìgbésẹ̀, èyí tí ó ń dín àwọn ipò tí ó burú kù níbi tí olùrànlọ́wọ́ náà kò bá ṣiṣẹ́ dáadáa tàbí tí ó bá ṣe nǹkan ní àkókò tí kò tó. fi data ti a gba pada sinu idahun ohun naa láìsí pé olùlò náà rí àwọn ìgékúrú tó ń ṣẹlẹ̀ lójijì nínú ìjíròrò náà.

Láti wọn àwọn ìlọsíwájú wọ̀nyí, ilé-iṣẹ́ náà ti fi àpẹẹrẹ náà sí àwọn ìdánwò bíi Ohùn ComplexFuncBench, ìgbìmọ̀ ìṣàyẹ̀wò tí ó dojúkọ àwọn iṣẹ́-ṣíṣe onípele púpọ̀ pẹ̀lú àwọn ìdíwọ́. Nínú ipò yìí, Gemini 2.5 Flash Native Audio ti ṣàṣeyọrí ní nǹkan bí Oṣuwọn aṣeyọri 71,5% ni ṣiṣe awọn iṣẹ ti o nira, tí a gbé e sí òkè àwọn àtúnṣe ìṣáájú àti àwọn àwòṣe ìdíje mìíràn nínú irú lílò yìí.

Iṣẹ́ yìí ṣe pàtàkì ní pàtàkì ní àwọn ibi tí a ti nílò àwọn iṣẹ́ àgbékalẹ̀ aládàáṣe tó gbajúmọ̀, bíi awọn ile-iṣẹ ipe, atilẹyin imọ-ẹrọ tabi ṣiṣe iṣowo (fún àpẹẹrẹ, iṣẹ́ ìnáwó tàbí iṣẹ́ ìṣàkóso) níbi tí ìgbésẹ̀ kọ̀ọ̀kan sinmi lórí èyí tí ó ti kọjá àti pé kò sí àyè fún àṣìṣe púpọ̀.

Ìtọ́pinpin ìtọ́ni tó dára jù àti àwọn ọ̀rọ̀ ìjíròrò tó péye jù

Àfikún mìíràn ti àtúnṣe náà ni bí àwòṣe náà ṣe rí túmọ̀ àti tẹ̀lé àwọn ìlànà náà èyí tí ó ń gbà láti ọ̀dọ̀ àwọn olùlò ìkẹyìn àti àwọn olùgbékalẹ̀. Gẹ́gẹ́ bí ìwádìí tí Google ṣe, ìwọ̀n ìtẹ̀lé ìlànà ti dínkù láti 84% sí Ìfaramọ́ 90%Èyí túmọ̀ sí àwọn ìdáhùn tó bá ohun tí wọ́n béèrè mu.

Fífò yìí ṣe pàtàkì nínú àwọn iṣẹ́ tí ó yẹ kí ó ṣe awọn ilana ti o nira, awọn igbesẹ pupọ, tabi awọn ipo pupọFún àpẹẹrẹ, nígbà tí a bá ń béèrè fún àlàyé ní ọ̀nà pàtó kan, bíbéèrè fún àkópọ̀ pẹ̀lú àwọn àkókò pàtó kan, tàbí ṣíṣètò iṣẹ́ kan tí ó sinmi lórí àwọn ìpinnu tí a so pọ̀ mọ́ra.

Ní ìsopọ̀ pẹ̀lú èyí, Gemini 2.5 Flash Native Audio ti ní agbára láti ṣe Ṣe àtúnṣe àyíká àwọn ìránṣẹ́ tí ó ti kọjáNínú ìjíròrò onípele-pupọ, àwòṣe náà máa ń rántí ohun tí a ti sọ dáadáa, àwọn ìtumọ̀ tí olùlò fi hàn, àti àwọn àtúnṣe tí a ṣe ní gbogbo ìjíròrò náà.

Ìdàgbàsókè yìí nínú ìrántí ìjíròrò dín àìní láti tún ìwífún kan náà sọ lẹ́ẹ̀kọ̀ọ̀kan kù, ó sì ń ran àwọn ìbáṣepọ̀ lọ́wọ́ láti mú kí ó gbéṣẹ́ sí i. tutu ati ki o kere si ibanujeÌrírí náà sún mọ́ bíbá ẹni tí ó gbé kókó ọ̀rọ̀ kan kalẹ̀ níbi tí ó ti dúró, dípò kí ó bẹ̀rẹ̀ láti ìbẹ̀rẹ̀ pẹ̀lú ìdáhùn kọ̀ọ̀kan.

Àwọn ọ̀ràn lílo ní ayé gidi: láti ìtajà lórí íńtánẹ́ẹ̀tì sí àwọn iṣẹ́ ìnáwó

Yàtọ̀ sí àwọn ìwọ̀n inú ilé, Google ń gbẹ́kẹ̀lé àpẹẹrẹ àwọn oníbàárà láti ṣàfihàn ipa tí Gemini 2.5 Flash Native Audio ní lórí iṣẹ́. Nínú ẹ̀ka ìṣòwò e-commerce, Shopify ti fi àwọn agbára wọ̀nyí kún olùrànlọ́wọ́ rẹ̀. Apa apa", èyí tí ó ń ran àwọn olùtajà lọ́wọ́ láti ṣàkóso àwọn ilé ìtajà wọn àti láti yanjú àwọn iyèméjì nípa iṣẹ́ náà."

Iyasoto akoonu - Tẹ Nibi  LinkedIn ṣatunṣe AI rẹ: awọn iyipada aṣiri, awọn agbegbe, ati bii o ṣe le mu u ṣiṣẹ

Gẹgẹbi ile-iṣẹ naa, ọpọlọpọ awọn olumulo Wọ́n tilẹ̀ gbàgbé pé wọ́n ń bá AI sọ̀rọ̀ Lẹ́yìn ìṣẹ́jú díẹ̀ tí wọ́n ti jọ sọ̀rọ̀, olùlò náà tilẹ̀ dúpẹ́ lọ́wọ́ bot náà lẹ́yìn ìwádìí gígùn. Irú ìṣesí yìí fihàn pé ìlọsíwájú nínú ìwà àti ohùn ẹ̀dá ló ń mú kí ìmọ̀ ẹ̀rọ gba ipò kejì.

Ni eka eto inawo, olupese naa Àjọpọ̀ Mortgage (UWM) Ó ti so àwòṣe náà pọ̀ mọ́ olùrànlọ́wọ́ "Mia" rẹ̀ láti ṣàkóso àwọn iṣẹ́ tó ní í ṣe pẹ̀lú owó ilé. Pẹ̀lú àpapọ̀ Gemini 2.5 àti àwọn ètò inú ilé mìíràn, ilé-iṣẹ́ náà sọ pé òun ní àwọn gbèsè tó ju ẹgbẹ̀rún mẹ́rìnlá lọ fún àwọn alábáṣiṣẹpọ̀ rẹ̀, tí ó gbẹ́kẹ̀lé àwọn ìbáṣepọ̀ aládàáṣe tí ó nílò ìpéye àti ìtẹ̀lé ìlànà.

Fun apakan rẹ, ibẹrẹ naa Newo.ai Ó ń lo Gemini 2.5 Flash Native Audio láti ọwọ́ Vertex AI láti fi agbára rẹ̀ sí i. foju receptionistsÀwọn olùrànlọ́wọ́ ohùn wọ̀nyí lè dá olùgbọ́rọ̀ pàtàkì mọ̀ kódà ní àwọn àyíká ariwo, wọ́n lè yí àwọn èdè padà láàárín ìjíròrò, wọ́n sì lè máa ṣe àtúnṣe ìforúkọsílẹ̀ ohùn àdánidá pẹ̀lú àwọn ìyípadà ìmọ̀láraèyí tí ó ṣe pàtàkì nínú iṣẹ́ ìránṣẹ́ oníbàárà.

Ìtumọ̀ ohùn-sí-ohùn ní àkókò gidi: àwọn èdè púpọ̀ sí i àti àwọn ìtumọ̀ míìrán

Ọkan ninu awọn afikun ti o yanilenu julọ ninu ẹya yii ni Ìtumọ̀ ohùn-sí-ohùn láàyèNí àkọ́kọ́ tí a fi sínú àpù Google Translate, Gemini 2.5 Flash Native Audio kọjá wíwulẹ̀ yíyí ohùn padà sí ọ̀rọ̀ tàbí fífúnni ní àwọn ìtumọ̀ tí a pín sí wẹ́wẹ́, èyí tí ó mú kí ìrírí tí ó wúni lórí túbọ̀ pọ̀ sí i. igbakanna itumọ súnmọ́ ìtumọ̀ ènìyàn.

Eto naa le ṣiṣẹ ni ipo ti fífetísílẹ̀ nígbà gbogboÈyí á jẹ́ kí olùlò lè fi ètí-orí sí orí wọn kí ó sì gbọ́ ohun tó ń ṣẹlẹ̀ ní àyíká wọn tí a túmọ̀ sí èdè wọn, láìsí pé ó nílò láti dákẹ́ tàbí tẹ bọ́tìnnì fún gbólóhùn kọ̀ọ̀kan. Àṣàyàn yìí lè wúlò nígbà tí a bá ń rìnrìn àjò, nígbà tí a bá ń lọ sí àwọn ìpàdé àgbáyé, tàbí níbi àwọn ìṣẹ̀lẹ̀ níbi tí ọ̀pọ̀ èdè ti wà.

A tun ṣe akiyesi awọn ipo ti ìjíròrò ọ̀nà méjìFún àpẹẹrẹ, tí ẹnìkan bá ń sọ̀rọ̀ ní èdè Gẹ̀ẹ́sì tí èkejì sì ń sọ̀rọ̀ ní èdè Hindi, àwọn agbekọri máa ń gbọ́ ìtumọ̀ èdè Gẹ̀ẹ́sì ní àkókò gidi, nígbà tí fóònù náà máa ń gbọ́ ìtumọ̀ èdè Hindi nígbà tí ẹni àkọ́kọ́ bá parí ọ̀rọ̀ rẹ̀. Ètò náà máa ń yí èdè ìjáde padà láìsí pé olùlò máa ń yí àwọn ètò padà láàrín àkókò.

Ọkan ninu awọn alaye pataki julọ ti iṣẹ yii ni agbara rẹ lati pa ohùn àtilẹ̀wá mọ́, ìlù, àti ohùn àtilẹ̀wá láti ọ̀dọ̀ agbọ̀rọ̀sọ. Èyí yọrí sí àwọn ìtumọ̀ tí kò dún bí robot tí ó sì sún mọ́ ọ̀nà ohùn agbọ̀rọ̀sọ, èyí tí ó mú kí ó rọrùn láti lóye àti ìrírí náà jẹ́ ti àdánidá.

Atilẹyin ede, wiwa laifọwọyi ati sisẹ ariwo

Ní ti ìmọ̀ èdè, ìtumọ̀ ohùn tí ó dá lórí Gemini 2.5 ń fúnni ní ìtìlẹ́yìn fún èdè tó lé ní àádọ́rin àti nǹkan bí ẹgbẹ̀rún méjì (2.000) àwọn ìtúmọ̀ èdèNípa pípa ìmọ̀ àgbáyé ti àwòṣe náà pọ̀ mọ́ àwọn agbára ohùn tó ní láti sọ èdè púpọ̀ àti ohùn ìbílẹ̀, ó lè bo onírúurú àkópọ̀ èdè, títí kan ọ̀pọ̀lọpọ̀ tí àwọn irinṣẹ́ mìíràn kò fi bẹ́ẹ̀ ṣe pàtàkì sí i.

Iyasoto akoonu - Tẹ Nibi  Awọn ọna abuja keyboard ti o dara julọ ni Grok Code Yara 1 lati ṣe eto yiyara

Ètò náà le ṣàkóso ìwọlé onírúurú èdè Nínú ìgbìmọ̀ kan ṣoṣo, ó lóye èdè ju ẹyọ kan lọ ní àkókò kan náà láìsí pé kí olùlò ṣe àtúnṣe àwọn ètò náà pẹ̀lú ọwọ́ nígbàkúgbà tí ẹnìkan bá yí èdè padà. Ẹ̀yà ara yìí wúlò gan-an nínú ìjíròrò níbi tí a ti da àwọn èdè púpọ̀ pọ̀ nípa ti ara.

O ṣeun si wíwá èdè tí a ń sọ láìfọwọ́síOlùlò kò nílò láti mọ èdè tí ẹni tí ó ń bá wọn sọ̀rọ̀ ń lò tẹ́lẹ̀: àwòṣe náà dá èdè náà mọ̀, ó sì bẹ̀rẹ̀ sí í túmọ̀ rẹ̀ lójúkannáà, èyí tí ó dín ìfọ́mọ́ra àti ìgbésẹ̀ àárín kù.

Gemini 2.5 Flash Native Audio tun ni awọn ilana fun agbara lodi si ariwoÓ lè ṣàtúnṣe díẹ̀ lára ​​ohùn àyíká láti fi ṣe pàtàkì sí ohùn pàtàkì, èyí tó ń jẹ́ kí a lè bá àwọn èèyàn sọ̀rọ̀ ní àwọn òpópónà tó kún fún ìgbòkègbodò, àwọn ibi tí wọ́n ṣí sílẹ̀, tàbí àwọn ibi tí orin àbálẹ̀ wà.

Wiwa, imuṣiṣẹ ati awọn ireti fun Yuroopu

Ìtumọ̀ ohùn láyè tí ó dá lórí àwòṣe yìí wà lọ́wọ́lọ́wọ́ ní ìpele beta nínú àpù Google Translate fún àwọn ẹ̀rọ Android ní ọjà bíi Amẹ́ríkà, Mẹ́síkò, àti Íńdíà. Google ti jẹ́rìí sí i pé iṣẹ́ náà yóò máa lọ síwájú sí i. awọn agbegbe ati awọn iru ẹrọ diẹ sii, pẹlu awọn eto alagbeka miiran.

Ni afiwe, isopọpọ Gemini 2.5 Flash Native Audio ni Gemini Gbe ati Wa Laaye A n gbe e kalẹ fun awọn olumulo ti Google app lori Android ati iOS, bẹrẹ lati Amẹrika. Bi awọn ẹya wọnyi ṣe n dagba ti wọn si kọja awọn ipele idanwo ati iyipada akọkọ, a nireti pe wọn yoo de awọn agbegbe miiran pẹlu. awọn orilẹ-ede diẹ sii, o ṣee ṣe ki o pẹlu awọn ọja Yuroopu, níbi tí ìbéèrè fún àwọn olùrànlọ́wọ́ ìtumọ̀ àti ohùn ti ga jùlọ.

Google tun ti kede ero rẹ lati ṣafikun iriri ohùn ati itumọ yii sinu awọn ọja miiran, pẹlu Gemini APILáàárín oṣù àti ọdún tí ń bọ̀, èyí yóò ṣí ilẹ̀kùn fún àwọn ilé-iṣẹ́ ilẹ̀ Yúróòpù ní àwọn ẹ̀ka bíi ìrìn àjò, ètò ìṣiṣẹ́, ẹ̀kọ́, àti ìṣàkóso gbogbogbò láti fi àwọn agbára wọ̀nyí sínú iṣẹ́ tiwọn.

Ilé-iṣẹ́ náà ń gbé àwọn ẹ̀yà tuntun wọ̀nyí kalẹ̀ gẹ́gẹ́ bí apá kan nínú ètò tó gbòòrò láti jẹ́ kí àwọn olùgbékalẹ̀ ṣe kọ awọn aṣoju ibaraẹnisọrọ pẹlu ohùn adayeba Láti ìsinsìnyí lọ, a máa lo àǹfààní Gemini 2.5 Flash Native Audio àti àwọn àwòṣe mìíràn nínú ìdílé 2.5 Flash àti Pro tí a gbé kalẹ̀ sí ìṣẹ̀dá ohùn tí a ṣàkóso (ṣíṣe àtúnṣe ohùn, èrò, iyára, àti bẹ́ẹ̀ bẹ́ẹ̀ lọ) àti àwọn férémù bíi Aṣoju AI Foundation.

Pẹ̀lú àwọn àtúnṣe yìí, Google fi kún èrò náà pé ohùn yóò jẹ́ ọ̀kan lára ​​àwọn ọ̀nà pàtàkì tí a lè gbà bá ìmọ̀ ọgbọ́n orí lò: láti ọ̀dọ̀ àwọn olùrànlọ́wọ́ tí wọ́n ń ṣe ìpè àwọn oníbàárà àti àwọn iṣẹ́ tó díjú, sí àwọn ètò ìtúmọ̀ ní àkókò kan náà tí ó ń mú kí ìbánisọ̀rọ̀ rọrùn láàrín àwọn ènìyàn tí kò ní èdè kan. Gemini 2.5 Flash Native Audio ni olórí iṣẹ́ yìí, ó ń ṣe àtúnṣe òye ohùn àti ìṣàfihàn rẹ̀ dáadáa. láti jẹ́ kí ìmọ̀ ẹ̀rọ náà wúlò síi kí ó sì dín ìdààmú kù nínú ìgbésí ayé ojoojúmọ́, nígbà tí ó ń dúró de ìgbà tí a ó fi ṣiṣẹ́ ní gbogbo ilẹ̀ Yúróòpù àti àwọn ọjà mìíràn.

Voice.ai vs ElevenLabs vs Udio: Ewo ni o dun dara julọ?
Nkan ti o jọmọ:
Voice.ai vs ElevenLabs vs Udio: Ifiwewe pipe ti awọn ohun AI