- Natívny zvuk vo všetkých nástrojoch Flow: synchronizované dialógy, atmosféra a efekty
- Lepšie dodržiavanie pokynov a lepšie výsledky pri konverzii obrazu na video
- Nové ovládacie prvky úprav: Zložky, Rámy, Rozšíriť a Vložiť; Odstrániť čoskoro
- Dostupnosť v aplikáciách Flow, Gemini, Vertex AI a Gemini API

Google aktualizoval svoj model generovania videa s verziou Veo 3.1., iterácia zameraná na audiovizuálnu kvalitu, kreatívnu kontrolu a spoľahlivosť. Spoločnosť integruje Kľúčové vylepšenia editora a pochopenia inštrukcií urýchliť tvorbu filmových diel.
La Najviditeľnejšou novinkou je natívny zvuk, teraz prítomný v celom pracovnom postupe: dialógy, atmosféra a efekty sa vytvárajú synchronizovane s vizuálmi. Okrem toho, Flow obsahuje úpravy, ktoré uľahčujú doladenie scén, znižujú počet testov a udržiavajú konzistenciu medzi jednotlivými zábermi..
Čo je Veo 3.1 a aké sú zmeny v porovnaní s Veo 3?

Na základe Veo 3, nový model uprednostňuje dodržiavanie pokynov a presnosť vo video a zvukových výstupoch. Google poznamenáva, že ladenie znižuje nepotrebné iterácie, čím poskytuje väčšiu kontrolu a konzistentné výsledky s tým, čo bolo požadované.
Aktualizácia prichádza po mesiacoch intenzívneho používania aplikácie Flow tvorcami. stovky miliónov klipov vygenerované od jeho spusteniaToto učenie sa premieta do spoľahlivejšej interpretácie zložitých scén, väčšieho realizmu textúr a lepšej kontinuity medzi zábermi.
Spoločnosť tiež posilňuje podporu pomeru strán 16:9, a to horizontálne aj vertikálne, aby sa lepšie integroval do multiplatformové prostredia a aktuálne publikačné toky.
Natívna integrácia zvuku a podporované formáty
S Veo 3.1 sa zvuk generuje v synchronizované a kontextové vo všetkých nástrojoch Flow: Atmosféra, efekty a hlasy sa zhodujú s každým záberom bez nutnosti externej postprodukcie.
Model produkuje základné klipy približne 8 sekúnd pri rozlíšení 1080p a 24 FPS, s možnosťou rozšírenia bez straty časovej koherencie. Tiež podporuje vertikálny formát 9:16, určený pre mobilnú distribúciu.
Tieto zvukové možnosti sa rozširujú aj na predtým tiché funkcie, čo umožňuje, aby sa to, čo počujete, vyvíjalo spolu s tým, čo vidíte a... kroky úspory v záverečnej montáži.
Nástroje toku: Ovládanie a úprava

Flow obsahuje ovládacie prvky, ktoré pomáhajú riadiť vizuálny príbeh. Ingrediencie pre video, môžu nahrajte viacero referenčných obrázkov na vytvorenie postáv, objektov a štýlu, udržiavanie konzistencie medzi zábermi.
Funkcia Rámy pre video generuje prechod medzi počiatočným obrázkom a konečným obrázkom, užitočné na definovanie začiatku a konca scény a skrátenie času pokusov a omylov.
S PredĺžiťJe to možné predĺžiť klipy o viac ako jednu minútu, prepájaním segmentov vizuálnou a zvukovou kontinuitou s cieľom vytvoriť dlhé zábery alebo pomalšie príbehy.
V sekcii úprav, Vložiť umožňuje pridať prvky do existujúceho záberu s ohľadom na osvetlenie, tiene a perspektívu. Táto možnosť Eliminovať sa očakáva čoskoro: jeho cieľom je odstrániť nechcené predmety a prirodzene obnoviť morské dno.
Výkon, limity a kvalita
Veo 3.1 ukazuje pokrok v súdržnosť postáv medzi snímkami a v reprezentácii základnej fyziky (gravitácia, kolízie alebo tekutiny), okrem vylepšení prenosu obrazu do videa s lepším zachovaním jemných detailov.
Rovnako ako v prípade generatívnej umelej inteligencie, môže existovať bodové artefakty, najmä v rýchlo sa pohybujúcich scénach alebo zložitých prechodoch. Synchronizácia pier sa zlepšila, hoci stále vyžaduje retušovanie v náročných produkciách.
Google používa viditeľné vodoznaky a SynthID (identifikácia digitálneho rámca) pre sledovateľnosť vygenerovaného obsahu, opatrenie, ktoré nie je možné deaktivovať.
Dostupnosť a ako ju otestovať
Veo 3.1 je nasadený v Prietok, Aplikácia Gemini, Vertex AI a rozhranie Gemini Developer APIDostupnosť sa môže líšiť v závislosti od regiónu a pravdepodobne Niektoré pokročilé funkcie vyžadujú predplatné.
Pre technické tímy a spoločnosti umožňuje prístup prostredníctvom Vertex AI a API jednoduchú integráciu modelu do interných nástrojov, zatiaľ čo Jednotliví tvorcovia môžu experimentovať priamo z aplikácie Blíženci alebo editor Flow.
Konkurenti a praktické využitie

Tvárou v tvár Sora 2 od OpenAIVeo 3.1 kladie dôraz na kontrolu používateľa počas tvorby (orientačné body obrazu, úprava scén a integrovaný zvuk). Sora 2 vyniká svojím zameraním na realizmus, takže výber závisí od kreatívneho cieľa.
V marketingu, žurnalistike a vzdelávaní tieto funkcie umožňujú nápady na prototypy, vytvárať vysvetľujúce vizualizácie a tematické klipy bez tradičného natáčania, čím sa urýchľuje dodávanie obsahu.
Vďaka tejto aktualizácii spoločnosť Google vylepšuje vzorec: poskytuje viac kontroly, integrovaný zvuk a lepšie nástroje na úpravu, aby tvorca mohol... režírovať príbeh s menším trením, pričom sa zachovávajú formáty a postupy kompatibilné s hlavnými platformami.
Som technologický nadšenec, ktorý zo svojich „geekovských“ záujmov urobil povolanie. Strávil som viac ako 10 rokov svojho života používaním špičkových technológií a hraním so všetkými druhmi programov z čistej zvedavosti. Teraz som sa špecializoval na počítačovú techniku a videohry. Je to preto, že už viac ako 5 rokov píšem pre rôzne webové stránky o technológiách a videohrách a vytváram články, ktoré sa snažia poskytnúť vám potrebné informácie v jazyku, ktorý je zrozumiteľný pre každého.
Ak máte nejaké otázky, moje znalosti siahajú od všetkého, čo súvisí s operačným systémom Windows, ako aj Androidom pre mobilné telefóny. A môj záväzok je voči vám, vždy som ochotný venovať pár minút a pomôcť vám vyriešiť akékoľvek otázky, ktoré môžete mať v tomto internetovom svete.