„Google Veo 3.1“: atnaujinimas, sustiprinantis garso ir kūrybinį valdymą

Paskutinis atnaujinimas: 2025-16-10

  • Gimtoji garso kokybė visuose „Flow“ įrankiuose: sinchronizuoti dialogai, aplinkos garsai ir efektai
  • Didesnis raginimo laikymasis ir geresni vaizdo įrašų konvertavimo rezultatai
  • Nauji redagavimo valdikliai: Ingredientai, Rėmeliai, Išplėtimas ir Įterpimas; Ištrinti bus pasiekiama netrukus
  • Prieinamumas „Flow“, „Gemini“ programėlėje, „Vertex AI“ ir „Gemini API“

„Google Veo 3.1“ dirbtinio intelekto vaizdo modelis

„Google“ atnaujino vaizdo įrašų generavimo modelį su „Veo 3.1“, iteracija, orientuota į audiovizualinę kokybę, kūrybinę kontrolę ir patikimumą. Įmonė integruoja Svarbiausi redaktoriaus ir instrukcijų supratimo patobulinimai pagreitinti kinematografiškai atrodančių kūrinių kūrimą.

La Ryškiausia naujovė yra ta, kad gimtoji garso versija, dabar matomas visame darbo procese: dialogai, atmosfera ir efektai kuriami sinchronizuotai su vaizdais. Be to, „Flow“ apima koregavimus, kurie palengvina scenų tikslinimą, sumažina bandymų skaičių ir išlaiko nuoseklumą tarp bandymų..

Kas yra „Veo 3.1“ ir kuo jis skiriasi nuo „Veo 3“?

„Google Veo 3.1“

Remiantis Veo 3, naujasis modelis teikia pirmenybę raginimo laikymasis ir tikslus vaizdo bei garso išvestis. „Google“ pažymi, kad derinimas sumažina nereikalingas iteracijas, užtikrindamas didesnę kontrolę ir nuoseklesnius rezultatus su tuo, ko buvo prašoma.

Atnaujinimas pasirodė po kelių mėnesių intensyvaus kūrėjų naudojimosi „Flow“ platforma. šimtai milijonų klipų sukurtas nuo jo paleidimoŠis mokymasis reiškia patikimesnį sudėtingų scenų interpretavimą, didesnį tekstūrų realizmą ir geresnį kadrų tęstinumą.

Išskirtinis turinys – spustelėkite čia  Kaip cituoti „Google“ formas

Bendrovė taip pat sustiprina 16:9 formato santykių palaikymą tiek horizontaliai, tiek vertikaliai, kad geriau integruotųsi į kelių platformų aplinkose ir dabartiniai leidinių srautai.

Gimtoji garso integracija ir palaikomi formatai

 

Su „Veo 3.1“ garsas generuojamas a sinchronizuotas ir kontekstinis visuose srauto įrankiuose: Atmosfera, efektai ir balsai dera prie kiekvieno kadro, nesiremiant išoriniu postprodukcijos procesu.

Modelis gamina maždaug 8 sekundžių 1080p raiška ir 24 kadrai per sekundę, su galimybe plėstis neprarandant laiko darnos. Taip pat palaikomas 9:16 vertikalus formatas, skirtas mobiliajam platinimui.

Šios garso galimybės apima ir anksčiau tylias funkcijas, leisdamos girdimiems vaizdams keistis kartu su matomumu. taupymo žingsniai galutiniame susirinkime.

Srauto įrankiai: valdymas ir redagavimas

Matau 3.1

„Flow“ apima valdiklius, kurie padeda valdyti vaizdinį pasakojimą. Vaizdo įrašo ingredientai, jie gali įkelkite kelis pavyzdinius vaizdus, ​​kad nustatytumėte veikėjus, objektus ir stilių, išlaikyti nuoseklumą tarp kadrų.

Išskirtinis turinys – spustelėkite čia  Kaip pakeisti numatytąjį skirtuką „Google“ skaičiuoklėse

Funkcija Vaizdo įrašų rėmeliai sukuria perėjimą tarp pradinio ir galutinio vaizdo, naudinga apibrėžiant scenos pradžią ir pabaigą bei sutrumpinant bandymų ir klaidų laiką.

Su IšplėstiTai įmanoma pratęsti klipus ilgiau nei vieną minutę, sujungiant segmentus su vaizdiniu ir garsiniu tęstinumu, siekiant sukurti ilgus kadrus arba lėtesnius pasakojimus.

Redagavimo skiltyje Įterpti leidžia prie esamo kadro pridėti elementų, atsižvelgiant į apšvietimą, šešėlius ir perspektyvą. Ši parinktis Pašalinti tikimasi netrukus atvykti: jo tikslas – pašalinti nepageidaujamus objektus ir natūraliai atkurti jūros dugną.

Našumas, ribos ir kokybė

„Veo 3.1“ rodo pažangą charakterio darna tarp kadrų ir pagrindinės fizikos (gravitacijos, susidūrimų ar skysčių) vaizdavime, be to, patobulintas vaizdo ir vaizdo įrašų perteikimas, geriau išsaugant smulkias detales.

Kaip ir generatyvinio dirbtinio intelekto atveju, gali būti taškiniai artefaktai, ypač greitai judančiose scenose arba sudėtinguose perėjimuose. Lūpų sinchronizavimas pagerėjo, nors vis dar reikia retušavimas sudėtinguose kūriniuose.

„Google“ taiko matomus vandens ženklus ir SynthID (skaitmeninio kadro identifikavimas) sugeneruoto turinio atsekamumui – priemonė, kurios negalima deaktyvuoti.

Išskirtinis turinys – spustelėkite čia  „Chrome“ sustiprina automatinį pildymą su „Google“ paskyra ir pinigine

Prieinamumas ir kaip jį išbandyti

„Veo 3.1“ yra įdiegtas Srautas, „Gemini“ programėlė, „Vertex AI“ ir „Gemini“ kūrėjo APIPrieinamumas gali skirtis priklausomai nuo regiono ir greičiausiai bus Kai kurioms išplėstinėms funkcijoms reikalinga prenumerata.

Techninėms komandoms ir įmonėms prieiga per „Vertex AI“ ir API leidžia lengvai integruoti modelį į vidinius įrankius. Individualūs kūrėjai gali eksperimentuoti naudodami programėlę Dvyniai arba srauto redaktorius.

Konkurentai ir praktinis panaudojimas

„Sora 2“ programėlė

Susidūrimas Sora 2 pateikė OpenAI„Veo 3.1“ pabrėžia vartotojo valdymą kūrimo metu (vaizdo užuominų taškai, scenų redagavimas ir integruotas garsas). „Sora 2“ išsiskiria tuo, kad dėmesiu skiriamas realizmui, tad pasirinkimas priklauso nuo kūrybinio tikslo.

Rinkodaros, žurnalistikos ir švietimo srityse šios funkcijos leidžia prototipų idėjos, kurti aiškinamąsias vizualizacijas ir kurti teminius klipus be tradicinio filmavimo, taip paspartinant turinio pateikimą.

Šiuo atnaujinimu „Google“ patobulina formulę: daugiau valdymo, integruotas garsas ir geresni redagavimo įrankiai, kad kūrėjas galėtų režisuoti istoriją su mažesne trintimi, išlaikant formatus ir srautus, suderinamus su pagrindinėmis platformomis.

SynthID vandens ženklas
Susijęs straipsnis:
Kas yra „SynthID“ – dirbtinio intelekto vandenženklis?