Google Veo 3.1: Aktualizace, která posiluje ovládání zvuku a kreativity

Poslední aktualizace: 16/10/2025

  • Nativní zvuk ve všech nástrojích Flow: synchronizované dialogy, ambientní zvuk a efekty
  • Lepší dodržování pokynů a lepší výsledky převodu obrazu na video
  • Nové ovládací prvky pro úpravy: Ingredience, Rámce, Rozšířit a Vložit; Smazat brzy
  • Dostupnost ve Flow, aplikaci Gemini, Vertex AI a Gemini API

Model videa s umělou inteligencí v Google Veo 3.1

Google aktualizoval svůj model generování videa s Veo 3.1., což je iterace zaměřená na audiovizuální kvalitu, kreativní kontrolu a spolehlivost. Společnost integruje Klíčová vylepšení editoru a porozumění instrukcím urychlit tvorbu filmově vypadajících děl.

La Nejviditelnější novinkou je nativní zvuk, nyní přítomný v celém pracovním postupu: dialogy, atmosféra a efekty jsou vytvářeny synchronizovaně s vizuální stránkou. Kromě toho, Flow zahrnuje úpravy, které usnadňují doladění scén, snižují počet testů a udržují konzistenci mezi jednotlivými záběry..

Co je Veo 3.1 a jaké jsou změny oproti Veo 3?

Google Veo 3.1

Na základě Veo 3, nový model upřednostňuje dodržování výzvy a přesnost ve video a zvukových výstupech. Google poznamenává, že ladění snižuje zbytečné iterace a poskytuje větší kontrolu a konzistentní výsledky s tím, co bylo požadováno.

Aktualizace přichází po měsících intenzivního používání Flowu tvůrci. stovky milionů klipů generováno od jeho uvedení na trhToto učení se promítá do spolehlivější interpretace složitých scén, většího realismu textur a lepší kontinuity mezi záběry.

Exkluzivní obsah – klikněte zde  Java 25: Nové jazykové funkce, výkon, zabezpečení a podpora LTS

Společnost také posiluje podporu poměru stran 16:9, a to jak horizontálně, tak vertikálně, aby se lépe integrovala do multiplatformní prostředí a aktuální publikační toky.

Nativní integrace zvuku a podporované formáty

 

U Veo 3.1 je zvuk generován synchronizované a kontextové ve všech nástrojích Flow: Atmosféra, efekty a hlasy se sladí s každým záběrem bez nutnosti externí postprodukce.

Model produkuje základní klipy o objemu přibližně 8 sekund v rozlišení 1080p a 24 FPS, s možností rozšíření bez ztráty časové koherence. Také podporuje vertikální formát 9:16, určený pro mobilní distribuci.

Tyto zvukové možnosti se rozšiřují i ​​na dříve tiché funkce, což umožňuje, aby se to, co slyšíte, vyvíjelo spolu s tím, co vidíte a… úsporné kroky v závěrečné montáži.

Nástroje pro řízení toku: Ovládání a úpravy

Veo 3.1

Flow zahrnuje ovládací prvky, které pomáhají řídit vizuální vyprávění. Ingredience pro video, oni mohou nahrajte více referenčních obrázků pro vytvoření postav, objektů a stylu, udržování konzistence mezi záběry.

Exkluzivní obsah – klikněte zde  Příklady umělé inteligence

Funkce Rámy pro video generuje přechod mezi počátečním a finálním obrázkem, užitečné pro definování začátku a konce scény a zkrácení doby pokusů a omylů.

s prodlužovačje možné prodloužit klipy o více než jednu minutu, propojování segmentů vizuální a zvukovou kontinuitou za účelem budování dlouhých záběrů nebo pomalejších vyprávění.

V editační sekci, Vložit umožňuje přidat prvky do existujícího záběru s ohledem na osvětlení, stíny a perspektivu. Tato možnost odstranit se očekává brzký příjezd: jeho cílem je odstranit nežádoucí předměty a přirozenou obnovou mořského dna.

Výkon, limity a kvalita

Veo 3.1 ukazuje pokrok v soudržnost postav mezi snímky a v reprezentaci základní fyziky (gravitace, srážky nebo tekutiny), a to vše navíc ke zlepšení převodu obrazu na video s lepším zachováním jemných detailů.

Stejně jako u generativní umělé inteligence může existovat bodové artefakty, zejména v rychlých scénách nebo složitých přechodech. Synchronizace rtů se zlepšila, i když stále vyžaduje retuše v náročných produkcích.

Google používá viditelné vodoznaky a SynthID (digitální identifikace rámce) pro sledovatelnost generovaného obsahu, což je opatření, které nelze deaktivovat.

Exkluzivní obsah – klikněte zde  Microsoft zavírá svůj obchod s filmy a televizními pořady pro Xbox a Windows

Dostupnost a jak ji otestovat

Veo 3.1 je nasazen v Flow, Aplikace Gemini, Vertex AI a Gemini Developer APIDostupnost se může lišit v závislosti na regionu a je pravděpodobné, že Některé pokročilé funkce vyžadují předplatné.

Pro technické týmy a firmy přístup přes Vertex AI a API usnadňuje integraci modelu do interních nástrojů a zároveň... Jednotliví tvůrci mohou experimentovat přímo z aplikace Blíženci nebo editor Flow.

Konkurenti a praktické využití

Aplikace Sora 2

Proti Sora 2 z OpenAIVeo 3.1 klade důraz na uživatelskou kontrolu během tvorby (obrazové cue pointy, úpravy scén a integrovaný zvuk). Sora 2 vyniká svým zaměřením na realismus, takže volba závisí na tvůrčím cíli.

V marketingu, žurnalistice a vzdělávání tyto funkce umožňují nápady na prototypy, vytvářet vysvětlující vizualizace a tematické klipy bez tradičního natáčení, čímž se urychluje distribuce obsahu.

S touto aktualizací Google vyladil vzorec: více kontroly, integrovaný zvuk a lepší editační nástroje, aby tvůrce mohl režírovat příběh s menším třením, přičemž se zachovává kompatibilita formátů a toků s hlavními platformami.

Vodoznak SynthID
Související článek:
Co je SynthID, vodoznak umělé inteligence?