Google Veo 3.1: atjauninājums, kas uzlabo audio un radošo kontroli

Pēdējais atjauninājums: 2025. gada 16. oktobrī

  • Dzimtā audio visos Flow rīkos: sinhronizēts dialogs, atmosfēra un efekti
  • Lielāka uzvednes ievērošana un labāki attēla un video rezultāti
  • Jaunas rediģēšanas vadīklas: Sastāvdaļas, Rāmji, Paplašināt un Ievietot; Dzēst būs pieejams drīzumā.
  • Pieejamība Flow, Gemini lietotnē, Vertex AI un Gemini API

Google Veo 3.1 AI video modelis

Google ir atjauninājis savu video ģenerēšanas modeli ar Veo 3.1, iterācija, kas koncentrējas uz audiovizuālo kvalitāti, radošo kontroli un uzticamību. Uzņēmums integrē Galvenie uzlabojumi redaktora un instrukciju izpratnē lai paātrinātu kinematogrāfiska izskata darbu izveidi.

La Visredzamākais jaunums ir tajā, dzimtā audio, tagad klātesoša visā darbplūsmā: dialogi, atmosfēra un efekti tiek radīti sinhronizēti ar vizuālajiem efektiem. Turklāt, Plūsma ietver pielāgojumus, kas atvieglo ainu precizēšanu, samazina testu skaitu un saglabā konsekvenci starp mēģinājumiem..

Kas ir Veo 3.1 un kādas ir izmaiņas salīdzinājumā ar Veo 3?

Google Veo 3.1

Balstīts uz Veo 3jaunajā modelī prioritāte tiek piešķirta ievērošana norādījumam un video un skaņas izvades precizitāte. Google norāda, ka regulēšana samazina nevajadzīgas iterācijas, nodrošinot lielāku kontroli un konsekventus rezultātus ar to, kas tika prasīts.

Atjauninājums tiek piedāvāts pēc vairāku mēnešu intensīvas Flow lietošanas no satura veidotāju puses. simtiem miljonu klipu radīts kopš tā palaišanasŠī mācīšanās nodrošina uzticamāku sarežģītu ainu interpretāciju, lielāku tekstūru reālismu un labāku nepārtrauktību starp kadriem.

Ekskluzīvs saturs — noklikšķiniet šeit  Kā pārvietot Google tērzēšanu uz labo pusi

Uzņēmums arī pastiprina atbalstu 16:9 malu attiecībām gan horizontāli, gan vertikāli, lai labāk integrētos. starpplatformu vidēs un pašreizējās publikāciju plūsmas.

Vietējā audio integrācija un atbalstītie formāti

 

Ar Veo 3.1 skaņa tiek ģenerēta a sinhronizēts un kontekstuāls visos plūsmas rīkos: Atmosfēra, efekti un balsis atbilst katram kadram, nepaļaujoties uz ārēju pēcapstrādi.

Modelis ražo aptuveni šādu pamatsaspraudņu izmēru: 8 sekundes ar 1080p izšķirtspēju un 24 kadriem sekundē, ar iespēju paplašināties, nezaudējot laika saskaņotību. Atbalsta arī 9:16 vertikālo formātu, paredzēts mobilai izplatīšanai.

Šīs audio iespējas paplašina iepriekš klusinātas funkcijas, ļaujot dzirdētajam attīstīties līdzās redzētajam un soļu saglabāšana galīgajā montāžā.

Plūsmas rīki: vadība un rediģēšana

Es redzu 3.1

Plūsma ietver vadīklas, kas palīdz vadīt vizuālo stāstījumu. Sastāvdaļas video veidošanai, viņi var augšupielādēt vairākus atsauces attēlus, lai izveidotu tēlus, objektus un stilu, saglabājot konsekvenci starp kadriem.

Ekskluzīvs saturs — noklikšķiniet šeit  Kā sadalīt Google dokumentus sadaļās

Funkcija Video kadri ģenerē pāreju starp sākotnējo attēlu un galīgo attēlu, noderīgi ainas sākuma un beigu noteikšanai un izmēģinājumu un kļūdu laika samazināšanai.

Ar PaplašinātTas ir iespējams pagarināt klipus ilgāk par vienu minūti, sasaistot segmentus ar vizuālu un skaņas nepārtrauktību, lai veidotu garus kadrus vai lēnākus naratīvus.

Rediģēšanas sadaļā Ievietot ļauj pievienot elementus esošam kadram, vienlaikus ievērojot apgaismojumu, ēnas un perspektīvu. Opcija Likvidēt drīzumā ieradīsies: tā mērķis ir noņemt nevēlamus objektus un dabiski atjaunot jūras gultni.

Veiktspēja, ierobežojumi un kvalitāte

Veo 3.1 parāda progresu rakstura saskaņotība starp kadriem un pamatfizikas (gravitācijas, sadursmju vai šķidrumu) attēlojumā, kā arī uzlabojumi attēla un video mijiedarbībā, labāk saglabājot smalkas detaļas.

Tāpat kā ģeneratīvā mākslīgā intelekta gadījumā, var būt punktu artefakti, īpaši ātri kustīgās ainās vai sarežģītās pārejās. Lūpu sinhronizācija ir uzlabojusies, lai gan tai joprojām ir nepieciešama retušēšana prasīgās producēšanā.

Google pievieno redzamas ūdenszīmes un SynthID (digitālā kadra identifikācija) ģenerētā satura izsekojamībai — pasākums, ko nevar deaktivizēt.

Ekskluzīvs saturs — noklikšķiniet šeit  Kāda ir atšķirība starp mašīnmācīšanos un dziļo mācīšanos?

Pieejamība un kā to pārbaudīt

Veo 3.1 ir izvietots Plūsma, Gemini lietotne, Vertex AI un Gemini izstrādātāja APIPieejamība var atšķirties atkarībā no reģiona un, visticamāk, Dažām papildu funkcijām ir nepieciešams abonements.

Tehniskajām komandām un uzņēmumiem piekļuve, izmantojot Vertex AI un API, atvieglo modeļa integrēšanu iekšējos rīkos, vienlaikus Atsevišķi veidotāji var eksperimentēt lietotnē Dvīņi vai plūsmas redaktorā.

Konkurenti un praktisks pielietojums

Sora 2 lietotne

Saskaroties Sora 2 no OpenAIVeo 3.1 uzsver lietotāja kontroli izveides laikā (attēlu norādes, ainu rediģēšana un integrētā audio). Sora 2 izceļas ar savu uzsvaru uz reālismu, tāpēc izvēle ir atkarīga no radošā mērķa.

Mārketingā, žurnālistikā un izglītībā šīs funkcijas ļauj prototipu idejas, veidot skaidrojošas vizualizācijas un veidot tematiskus klipus bez tradicionālās filmēšanas, paātrinot satura piegādi.

Ar šo atjauninājumu Google pilnveido formulu: lielāka kontrole, integrēts audio un labāki rediģēšanas rīki, lai satura veidotājs varētu vadīt stāstu ar mazāku berzi, saglabājot formātu un plūsmu saderību ar galvenajām platformām.

SynthID ūdenszīme
Saistīts raksts:
Kas ir SynthID, mākslīgā intelekta ūdenszīme?