Google Veo 3.1: Aktualizácia, ktorá posilňuje ovládanie zvuku a kreativity

Posledná aktualizácia: 01.02.2024

  • Natívny zvuk vo všetkých nástrojoch Flow: synchronizované dialógy, atmosféra a efekty
  • Lepšie dodržiavanie pokynov a lepšie výsledky pri konverzii obrazu na video
  • Nové ovládacie prvky úprav: Zložky, Rámy, Rozšíriť a Vložiť; Odstrániť čoskoro
  • Dostupnosť v aplikáciách Flow, Gemini, Vertex AI a Gemini API

Model videa s umelou inteligenciou v Google Veo 3.1

Google aktualizoval svoj model generovania videa s verziou Veo 3.1., iterácia zameraná na audiovizuálnu kvalitu, kreatívnu kontrolu a spoľahlivosť. Spoločnosť integruje Kľúčové vylepšenia editora a pochopenia inštrukcií urýchliť tvorbu filmových diel.

La Najviditeľnejšou novinkou je natívny zvuk, teraz prítomný v celom pracovnom postupe: dialógy, atmosféra a efekty sa vytvárajú synchronizovane s vizuálmi. Okrem toho, Flow obsahuje úpravy, ktoré uľahčujú doladenie scén, znižujú počet testov a udržiavajú konzistenciu medzi jednotlivými zábermi..

Čo je Veo 3.1 a aké sú zmeny v porovnaní s Veo 3?

Google Veo 3.1

Na základe Veo 3, nový model uprednostňuje dodržiavanie pokynov a presnosť vo video a zvukových výstupoch. Google poznamenáva, že ladenie znižuje nepotrebné iterácie, čím poskytuje väčšiu kontrolu a konzistentné výsledky s tým, čo bolo požadované.

Aktualizácia prichádza po mesiacoch intenzívneho používania aplikácie Flow tvorcami. stovky miliónov klipov vygenerované od jeho spusteniaToto učenie sa premieta do spoľahlivejšej interpretácie zložitých scén, väčšieho realizmu textúr a lepšej kontinuity medzi zábermi.

Exkluzívny obsah – kliknite sem  Ako otvoriť ChatGPT pomocou klávesovej skratky v systéme Windows 11: tu je návod, ako ho jednoducho nakonfigurovať

Spoločnosť tiež posilňuje podporu pomeru strán 16:9, a to horizontálne aj vertikálne, aby sa lepšie integroval do multiplatformové prostredia a aktuálne publikačné toky.

Natívna integrácia zvuku a podporované formáty

 

S Veo 3.1 sa zvuk generuje v synchronizované a kontextové vo všetkých nástrojoch Flow: Atmosféra, efekty a hlasy sa zhodujú s každým záberom bez nutnosti externej postprodukcie.

Model produkuje základné klipy približne 8 sekúnd pri rozlíšení 1080p a 24 FPS, s možnosťou rozšírenia bez straty časovej koherencie. Tiež podporuje vertikálny formát 9:16, určený pre mobilnú distribúciu.

Tieto zvukové možnosti sa rozširujú aj na predtým tiché funkcie, čo umožňuje, aby sa to, čo počujete, vyvíjalo spolu s tým, čo vidíte a... kroky úspory v záverečnej montáži.

Nástroje toku: Ovládanie a úprava

Vidím 3.1

Flow obsahuje ovládacie prvky, ktoré pomáhajú riadiť vizuálny príbeh. Ingrediencie pre video, môžu nahrajte viacero referenčných obrázkov na vytvorenie postáv, objektov a štýlu, udržiavanie konzistencie medzi zábermi.

Exkluzívny obsah – kliknite sem  Ako môžem premenovať stĺpce v Tabuľkách Google

Funkcia Rámy pre video generuje prechod medzi počiatočným obrázkom a konečným obrázkom, užitočné na definovanie začiatku a konca scény a skrátenie času pokusov a omylov.

S PredĺžiťJe to možné predĺžiť klipy o viac ako jednu minútu, prepájaním segmentov vizuálnou a zvukovou kontinuitou s cieľom vytvoriť dlhé zábery alebo pomalšie príbehy.

V sekcii úprav, Vložiť umožňuje pridať prvky do existujúceho záberu s ohľadom na osvetlenie, tiene a perspektívu. Táto možnosť Eliminovať sa očakáva čoskoro: jeho cieľom je odstrániť nechcené predmety a prirodzene obnoviť morské dno.

Výkon, limity a kvalita

Veo 3.1 ukazuje pokrok v súdržnosť postáv medzi snímkami a v reprezentácii základnej fyziky (gravitácia, kolízie alebo tekutiny), okrem vylepšení prenosu obrazu do videa s lepším zachovaním jemných detailov.

Rovnako ako v prípade generatívnej umelej inteligencie, môže existovať bodové artefakty, najmä v rýchlo sa pohybujúcich scénach alebo zložitých prechodoch. Synchronizácia pier sa zlepšila, hoci stále vyžaduje retušovanie v náročných produkciách.

Google používa viditeľné vodoznaky a SynthID (identifikácia digitálneho rámca) pre sledovateľnosť vygenerovaného obsahu, opatrenie, ktoré nie je možné deaktivovať.

Exkluzívny obsah – kliknite sem  Ako chrániť svoje súkromie v novom režime umelej inteligencie Copilota v Edge

Dostupnosť a ako ju otestovať

Veo 3.1 je nasadený v Prietok, Aplikácia Gemini, Vertex AI a rozhranie Gemini Developer APIDostupnosť sa môže líšiť v závislosti od regiónu a pravdepodobne Niektoré pokročilé funkcie vyžadujú predplatné.

Pre technické tímy a spoločnosti umožňuje prístup prostredníctvom Vertex AI a API jednoduchú integráciu modelu do interných nástrojov, zatiaľ čo Jednotliví tvorcovia môžu experimentovať priamo z aplikácie Blíženci alebo editor Flow.

Konkurenti a praktické využitie

Aplikácia Sora 2

Tvárou v tvár Sora 2 od OpenAIVeo 3.1 kladie dôraz na kontrolu používateľa počas tvorby (orientačné body obrazu, úprava scén a integrovaný zvuk). Sora 2 vyniká svojím zameraním na realizmus, takže výber závisí od kreatívneho cieľa.

V marketingu, žurnalistike a vzdelávaní tieto funkcie umožňujú nápady na prototypy, vytvárať vysvetľujúce vizualizácie a tematické klipy bez tradičného natáčania, čím sa urýchľuje dodávanie obsahu.

Vďaka tejto aktualizácii spoločnosť Google vylepšuje vzorec: poskytuje viac kontroly, integrovaný zvuk a lepšie nástroje na úpravu, aby tvorca mohol... režírovať príbeh s menším trením, pričom sa zachovávajú formáty a postupy kompatibilné s hlavnými platformami.

Vodoznak SynthID
Súvisiaci článok:
Čo je SynthID, vodoznak umelej inteligencie?