- Veo 3-k testu sinple batetik abiatuta audio eta elkarrizketa errealistak dituzten bideoak sortzeko aukera ematen dizu.
- Image 4-k xehetasun, testu eta kalitate paregabeko irudiak lortzen ditu AI-n, 2K-raino eta hainbat formatutan.
- Bi ereduak Gemini, Flow eta Google Workspace tresnetan integratuta daude dagoeneko.

Adimen artifizialak aurrerapauso erraldoiak ematen jarraitzen du. Arlo honetan erritmoa markatzen jarraitzen duen enpresa bat baldin badago, zalantzarik gabe, hori da. Google. Bere aspalditik itxaroten zenean Google I/O 2025 urteko ekitaldiaenpresa bi aurrerapen aurkeztuz, edukien sorkuntza irauli du berriro ere irudiak eta bideoak ekoizteko modua aldatzeko promesa egiten dutenak: eredu generatiboak 3 eta 4. irudia ikusten ditut. Bietako bakoitzak berrikuntza aurreratu eta ustekabeko sorta bat dakar, eta horiek arnasarik gabe utzi dituzte bai adituak bai IA sortzailearen erabiltzaileak.
desde la giro-soinua eta elkarrizketak dituzten bideoen sorkuntza erabat errealista, pasatzen argazki tradizional batetik ia bereiztezinak diren xehetasunak dituzten irudiak, bulegoko tresnetan eta sormen-plataformetan integrazio ezin hobea izan arte, modelo hauek aurreko eta ondorengo bat markatzen dute ikus-entzunezkoei aplikatutako adimen artifizialaren aldetik espero dezakegun horretan. Ikus dezagun zer egin dezaketen benetan Veo 3 eta Imagen 4-k, heldu diezaiogun horri.
Zer da Veo 3: Adimen artifizialak sortutako bideoaren aro berria, audio errealistarekin
Veo 3 Ez da beste eguneratze bat besterik; sortzen duen Google-ren lehen IA sortzailearen etorrera adierazten du automatikoki sortutako soinu natiboa duten bideoak. Orain arte, OpenAIren Sora bezalako beste lehiakide eredu batzuk atzean geratu dira alderdi honetan, sorkuntza prozesuan bertan audio sinkronizatua gehitzeko gai ez baitira. Googlek proposamen benetan bereizgarria jartzen du mahai gainean: bideoak giro-soinuak, elkarrizketak eta baita soinu-efektuak ere guztiz sintetikoa baina errealista, guztia erabiltzaileak emandako deskribapenetan oinarrituta. Adibidez, “trafikoa eta jendea hizketan ari den hiri-eszena bat” eska dezakezu eta horixe bera lortuko duzu, ohiko soinuekin eta pertsonaien ezpainen sinkronizazioarekin.
Horrek Veo 3 kokatzen du IA gisa galdera konplexuak hobeto ulertzen ditu eta ekintza bihurtzen ditu ikus-entzunezko. Zein pertsonaia nahi dituzun, zer esan behar duten eta baita giro jakin bat lortzeko inguruneak nola entzun behar duen ere zehaztu dezakezu. Bi minutu arteko 4K bideoak sortzeko gaitasun hau (Veo 2 eredutik heredatua) errealismo geruza batekin indartzen da orain, eta horrek IA bidez sortutako fikzioa zinema-estandarretara hurbiltzen du.
Gainera, Veo 3-k emaitza berehala aldatzeko aukera ematen dizu: objektuak gehitu edo kendu, markoa aldatu (bertikaletik horizontalera eta alderantziz), eta baita ikus-eremua zabaldu ere, margotze teknikak erabiliz. Kameraren kontrol zehatzagoekin konbinatuta (biraketak, zooma, jarraipena), emaitza kontsumitzaileen adimen artifizialean inoiz ikusi ez den ikus-entzunezko narrazioaren gaineko kontrol maila bat da.
Sarbidea errazteko, Googlek eredu hau integratu du Gemini aplikazioa. (lehen Bard), baita plataforma berrian ere Flow (horri buruz geroago hitz egingo dugu) eta tresna profesionaletan, hala nola Erpin AI.
Xehetasun aurreratuak: Ezpainen sinkronizaziotik zuzeneko ediziora
Bideo sortzailearen IAren erronka handienetako bat lortzea izan zen Elkarrizketek ezpainen sinkronizazio naturala eta sinesgarria zuten. Veo 3-k aurrerapauso bat ematen du ezpainen mugimendua sortutako audioarekin ezin hobeto egokitzen duen teknologia txertatuz, bideo-elkarrizketak sinesgarriak eta fluidoak bihurtuz. Horrek ez du errealismoaren pertzepzioa hobetzen bakarrik, baizik eta hezkuntzan, ikus-entzunezkoetan eta publizitatean erabilera berrietarako atea irekitzen du.
Gainera, Google-ren AI ez dago hasierako belaunaldira mugatuta: erabiltzaileari eszena handitu, orientazioa aldatu eta elementu bisualak bere lehentasunen arabera doitzeko aukera ematen dio, guztia testu-deskribapen batekin. Horrela, plano hurbil bat ikuspegi panoramiko bihur dezakezu, modu bertikaletik horizontalera aldatu edo objektu berriak txertatu hutsetik hasi beharrik gabe. Nahi ez diren elementuak ere kendu ditzakezu, eta hori oso erabilgarria da eduki pertsonalizatua azkar ekoizteko.
4. irudia: Irudien sorkuntzan IA bidezko iraultza
Veo 3-rekin batera, Google-k aurkeztu du Imagen 4, adimen artifiziala erabiliz irudiak sortzeko bere eredu berria. Bertsio honen aipagarriena ikusgarria da xehetasunetan eta erantzun-abiaduran kalitate-jauzia. IAk lehenago huts egiten zuen ehundura finak (ur tantak, animalien ilea, isla konplexuak) erreproduzitzeko, baina orain Image 4-k argazkilaritza profesionalaren pareko irudiak sortzen ditu, bai ingurune errealistetan bai konposizio abstraktuetan.
Beste abantaila handia da belaunaldi-abiadura4. irudia gehienez Aurrekoa baino 10 aldiz azkarragoa, dagoeneko aurreratua den Image 3. Horri esker, lan-fluxu askoz arinagoak egin daitezke, eta sormena erraztu egiten da berehalakotasuna eskatzen duten proiektuetan ere, hala nola premiazko diseinu grafikoan edo sare sozialetarako piezen ekoizpenean.
Kalitate teknikoari dagokionez, 4. irudiak 2K-ko bereizmeneko irudiak sortzen ditu, definizio handiko inprimaketarako eta aurkezpen handietarako egokiak bihurtuz. Hainbat alderdi-erlaziotan errendatzea ere onartzen du, formatu karratuetatik hasi eta panoramikoetaraino, postaletatik hasi eta posterretaraino denetarik sortzeko moldakortasun osoa eskainiz.
Xehetasun bereziki garrantzitsua da ortografian eta tipografian hobekuntza nabarmenaAdimen artifizialak testua behar bezala txertatu dezake orain irudietan, txartelak, gonbidapenak, posterrak eta baita komikiak ere diseinatzeko aukera emanez, testu irakurgarri eta ondo formatuarekin. Horrek aurreko eredu generatiboek aurkezten zituzten erronka nagusietako bat ezabatzen du, askotan txertatutako testua idaztean gertatzen ziren akatsak.
Google ekosisteman integratzea eta erabilgarritasuna
Bi modeloak, 3 eta 4. irudia ikusten ditutez dute tresna isolatu gisa funtzionatzen, baizik eta Google ekosisteman integratuta daude. Erabiltzaileek zuzenean atzitu ditzakete Gemini aplikaziotik eta Flow-etik, baina integratuta ere agertzen dira Docs, Slides, Vids eta beste lan-eremu tresnak bezalako plataformak. Horri esker, ikasleek, sortzaileek eta profesionalek beren eduki bisualak eta ikus-entzunezkoak zuzenean ekar ditzakete eguneroko proiektuetara, Google ingurunea utzi gabe.
Hala ere, lehen fase honetan eskuragarritasuna mugatua da. Veo 3 beta bertsioan dago eskuragarri Gemini-n Google AI Ultra harpidetza duten AEBetako erabiltzaileentzat bakarrik, eta 4. irudia dagoeneko Gemini-ra eta Google-ren beste tresnetara zabaldu da onartutako lurralde guztietarako. Whisk eta bezalako aplikazio espezializatuetan ere agertzen dira. Erpin AI, negozioetarako erabilerarako eta produktu pertsonalizatuen garapenerako diseinatua.
Imagen 4-rekin sortutako eduki guztiak darama SynthID izeneko ur-marka digitala. Marka honek erraz identifikatzea ahalbidetzen du irudi bat SynthID Detector tresna erabiliz adimen artifizialarekin sortu den ala ez, gardentasun eta konfiantza geruza bat gehituz edukiaren benetakotasuna funtsezkoa den inguruneetan.
Flow: Veo, Imagen eta Geminiren onena batzen duen tresna zinematikoa
Eskaeretan oinarritutako sorkuntza-ereduekin batera, Googlek Flow kaleratu du, Veo 3, Image 4 eta Gemini-tik etekinik handiena ateratzeko diseinatutako bideoak sortzeko eta editatzeko tresna bat. Flow-ek VideoFX-en aurreko esperientzian oinarritzen da (Google Labs-en esperimentu bat) eta askoz haratago eramaten du, erabiltzaileei aukera emanez bideo-klipak ekoiztu, eszenak editatu, kameraren mugimenduak kontrolatu eta aktiboak kudeatu modu sinple eta indartsu batean.
Bere ezaugarri aurreratuen artean, Flow-ek kameraren mugimendua eta perspektiba kontrolatzeko aukera ematen dizu, zabaldu dauden eszenak, gehitu plano berriak Scenebuilder sistema erabiliz eta kudeatu baliabide grafikoak eta soinuzkoak interfaze bakar batetik. Prozesu osoa IAk gidatzen du, ikaskuntza-kurba minimoa bihurtuz edizio-aditu ez direnentzat ere.
Gainera, Flow-ek osagai soziala du, eta horrek IArekin sortutako edukia partekatzera eta aurkitzera gonbidatzen zaitu.. Adibidez, Flow TV-rekin, erabiltzaileek beste sortzaile batzuek sortutako bideoak arakatu, inspirazioa aurkitu eta teknologia eta sormena elkartzen diren komunitate dinamiko batean parte hartu dezakete.
Nola sartzen naiz Veo 3 eta Imagen 4-ra? Oraingoz, AEBetan bakarrik
Punta-puntako teknologia hauetarako sarbidea faseka antolatu da. Google AI Ultra Harpidetza esklusiboena da, azken berriak eta eredu aurreratuena lehenengo eskuratu nahi dutenentzat zuzendua. Gemini, baita Veo 3, Flow, Whisk ere, KoadernoaLM, Gemini Google ekosisteman integratuta, Gemini Chrome-n, YouTube Premium-en eta 30TB hodeiko biltegiratzea.
Kostua, oraingoz, 249,99 $ balio du hilean, nahiz eta hasierako deskontuak egon. Estatu Batuetako erabiltzaileek bakarrik eman dezakete izena momentuz, baina Nazioarteko hedapena laster aurreikusita dago.
Enpresek eta profesionalek Veo 3-ren abantailak aprobetxatu ditzakete honen bidez: Erpin AI, aukera ematen diena Integratu bideo eta audio sorkuntza zure enpresako lan-fluxuetan, produktuen garapena edo marketin kanpaina aurreratuak. Erabiltzaile sortzaile eta zaletuek Imagen 4 eta Flow-en funtzio batzuetara sar daitezke Google-ren AI ekosistemaren Pro eta Basic planetan.
Googlek ere diseinatu du ekosistema kolaboratiboa, non modeloen hobekuntzak azkar hedatzen diren bere produktibitate eta sorkuntza tresna guztietara, azken garapenetara beti sarbidea izan dezazun ahalegin gehigarririk gabe.
Zergatik da Veo 3 aurrerapauso bat lehiakideekin alderatuta?
Veo 3 iritsi arte, merkatuan zeuden IA bideo-sortzaile gehienek (Runway, Luma AI edo Pika Labs bezalakoek) gehitzea baino ez zuten baimentzen. kanpoko audioa belaunaldiaren ondoren. Ezin zituzten soinu natibo sinkronizatuak sortu pieza berean, eta horrek arazo bat sortzen zuen emaitza guztiz automatikoak bilatzen zituztenentzat. Veo 3-k erronka hori konpontzen du eta Google lidergoan jartzen du ikus-entzunezko AIren lasterketan, OpenAI-ren Sora bezalako proposamenen aurretik ere, zeinak oraindik ez baitu lortu audioa bideoen hasierako belaunaldian integratzea.
Ikusmen-kalitateari dagokionez, Image 4-k ehunduretan, argiztapenean eta estiloaren erreprodukzio-zehaztasunean lortutako xehetasunek egungo irudien AI estandarrak gainditzen dituzte.. Irudien barruan testu ondo idatziak eta elementu grafiko konplexuak sortzeko gaitasunak erabilera aukerak handitzen ditu, sorkuntza artistikotik hasi eta diseinu grafiko profesionalera arte, aisialdiko eta hezkuntzako aplikazioak barne.
Gaitasun konbinatuak: benetako sormena mugarik gabe
Google-ren ikuspegiaren elementu bereizgarria bere modeloak elkarren artean nola konbinatzen diren da. Veo 3 eta Imagen 4 elkarrekin lan egin dezakete Flow eta Geminiri esker, sormen-fluxuak ahalbidetuz, non irudi finko batekin hasi, eszena animatu batean eraldatu, audioa gehitu eta bideo profesional bat sortzeko doikuntza egin dezakezun. Plataforma anitzeko integrazio honek Google bikotekide aproposa bihurtzen du ikasleentzat, profesional sortzaileentzat, publizitate agentzientzat edo, besterik gabe, lurralde bisual berriak erraz eta eraginkortasunez arakatu nahi dituen edonorentzat.
Ekosistemak beste teknologia batzuk ere baditu, hala nola Lyria 2, honetarako diseinatua. musika moldagarriaren sorrera bideoen trantsizioak eta emozioak modu adimentsu eta koherentean laguntzen dituena. Horrek zirkulua ixten du eta estudioko kalitateko piezak ekoiztea ahalbidetzen du soinu-bankuetara edo kanpoko materialera jo beharrik gabe.
Garatzaile eta enpresentzat, APIak eta edukien kudeaketa tresnek erraz integratzen dituzte irtenbide horiek azken produktuetan, zerbitzu pertsonalizatuetan, aplikazioetan eta plataforma digitaletan, hezkuntza, komunikazioa, osasuna eta entretenimendua bezalako sektoreetan berrikuntza sustatuz.
Google a gisa kokatzen da adimen artifizial sortzailearen erreferentea, lehen zientzia fikzioa ziruditen aukerak irekiz. Konbinazioa kontrola, errealismoa eta pertsonalizazioa Ekosistema bateratu batean, estandar berri bat ezartzen du eduki bisualak, audio-eduki eta grafikoak sortzeko, eta eragin potentzial izugarria du sektore desberdinetan eta sortzaileek beren ideiak ekoizten eta partekatzen dituzten moduan.
Bere "geek" interesak lanbide bihurtu dituen teknologia zalea naiz. Nire bizitzako 10 urte baino gehiago eman ditut punta-puntako teknologia erabiltzen eta era guztietako programak moldatzen jakin-min hutsagatik. Orain informatikako teknologian eta bideo-jokoetan espezializatu naiz. Izan ere, 5 urte baino gehiago daramatzadala teknologia eta bideo-jokoen inguruko hainbat webgunetan idazten, denontzat ulergarria den hizkuntza batean behar duzun informazioa eman nahi duten artikuluak sortzen.
Zalantzarik baduzu, nire ezagutza Windows sistema eragilearekin zerikusia duen guztia eta baita telefono mugikorretarako Android ere barne hartzen du. Eta nire konpromisoa zurekin da, beti prest nago minutu batzuk pasatzeko eta Interneteko mundu honetan izan ditzakezun zalantzak konpontzen laguntzeko.




