Google Veo 3.1: Абнаўленне, якое паляпшае кіраванне гукам і творчасцю

Апошняе абнаўленне: 16/10/2025

  • Уласнае аўдыё ва ўсіх інструментах Flow: сінхранізаваныя дыялогі, атмасфера і эфекты
  • Лепшае прытрымліванне падказкі і лепшыя вынікі пераўтварэння выявы ў відэа
  • Новыя элементы кіравання рэдагаваннем: Інгрэдыенты, Фрэймы, Пашырыць і Уставіць; Выдаліць хутка
  • Даступнасць у Flow, дадатку Gemini, Vertex AI і Gemini API

Мадэль відэа Google Veo 3.1 са штучным інтэлектам

Google абнавіў сваю мадэль генерацыі відэа з дапамогай Veo 3.1., ітэрацыя, арыентаваная на аўдыёвізуальную якасць, творчы кантроль і надзейнасць. Кампанія інтэгруе Ключавыя паляпшэнні рэдактара і разумення інструкцый каб паскорыць стварэнне кінематаграфічных твораў.

La Найбольш прыкметная навінка заключаецца ў тым, роднае аўдыё, цяпер прысутнічае на працягу ўсяго працоўнага працэсу: дыялогі, атмасфера і эфекты ствараюцца сінхранізавана з візуальнымі элементамі. Акрамя таго, Flow уключае карэкціроўкі, якія спрашчаюць дапрацоўку сцэн, скарачаюць колькасць тэстаў і падтрымліваюць паслядоўнасць паміж дублямі..

Што такое Veo 3.1 і якія змены ў параўнанні з Veo 3?

Google Veo 3.1

На аснове Veo 3, новая мадэль аддае прыярытэт прытрымліванне загаду і дакладнасць відэа- і гукавых вывадаў. Google адзначае, што налада памяншае колькасць непатрэбных ітэрацый, забяспечваючы большы кантроль і паслядоўныя вынікі з тым, што было запытана.

Абнаўленне з'явілася пасля некалькіх месяцаў інтэнсіўнага выкарыстання Flow стваральнікамі. сотні мільёнаў кліпаў згенеравана з моманту яго запускуГэта навучанне прыводзіць да больш надзейнай інтэрпрэтацыі складаных сцэн, большага рэалізму тэкстур і лепшай бесперапыннасці паміж кадрамі.

Эксклюзіўны кантэнт - націсніце тут  Як перамясціць выяву назад у Google Slides

Кампанія таксама ўзмацняе падтрымку суадносін бакоў 16:9 як па гарызанталі, так і па вертыкалі, каб лепш інтэгравацца ў кросплатформенныя асяроддзі і бягучыя патокі публікацый.

Інтэграцыя з убудаваным аўдыё і падтрымоўваныя фарматы

 

З Veo 3.1 гук генеруецца ў сінхранізаваныя і кантэкстуальныя ва ўсіх інструментах Flow: Атмасфера, эфекты і галасы супадаюць з кожным кадрам без неабходнасці звяртацца да знешняга постпрадакшну.

Мадэль вырабляе базавыя кліпы прыкладна 8 секунд пры дазволе 1080p і 24 кадрах у секунду, з магчымасцю пашырэння без страты часовай кагерэнтнасці. Таксама падтрымлівае вертыкальны фармат 9:16, прызначаны для мабільнага распаўсюджвання.

Гэтыя аўдыёмагчымасці распаўсюджваюцца на раней бясшумныя функцыі, дазваляючы таму, што вы чуеце, развівацца разам з тым, што вы бачыце і крокі эканоміі у канчатковай зборцы.

Інструменты патоку: кіраванне і рэдагаванне

Я бачу 3.1

Flow мае элементы кіравання, якія дапамагаюць кіраваць візуальным апавяданнем. У Інгрэдыенты для відэа, яны могуць загрузіце некалькі эталонных малюнкаў, каб вызначыць персанажаў, аб'екты і стыль, падтрыманне паслядоўнасці паміж стрэламі.

Эксклюзіўны кантэнт - націсніце тут  Як выдаліць выявы з Google Lens

функцыя Рамкі для відэа стварае пераход паміж пачатковай выявай і канчатковай выявай, карысна для вызначэння пачатку і канца сцэны і скарачэння часу спроб і памылак.

з напаўняльнікмагчыма падоўжыць кліпы больш чым на адну хвіліну, злучаючы сегменты з візуальнай і гукавой бесперапыннасцю для стварэння доўгіх планаў або больш павольных апавяданняў.

У раздзеле рэдагавання, Устаўце дазваляе дадаваць элементы да існуючага здымка, захоўваючы пры гэтым асвятленне, цені і перспектыву. Гэтая опцыя Выдаленне чакаецца хуткае прыбыццё: яго мэта — выдаліць непатрэбныя прадметы і аднавіць марское дно натуральным шляхам.

Прадукцыйнасць, абмежаванні і якасць

Veo 3.1 дэманструе прагрэс у цэласнасць характараў паміж кадрамі і ў прадстаўленні асноўных фізічных фактараў (гравітацыя, сутыкненні або вадкасці), а таксама паляпшэнні пераўтварэння выявы ў відэа з лепшым захаваннем дробных дэталяў.

Як і ў выпадку з генератыўным штучным інтэлектам, могуць быць кропкавыя артэфакты, асабліва ў хутка рухаючыхся сцэнах або складаных пераходах. Сінхранізацыя губ палепшылася, хоць яна ўсё яшчэ патрабуе рэтуш у складаных пастаноўках.

Google наносіць бачныя вадзяныя знакі і SynthID (лічбавая ідэнтыфікацыя кадра) для адсочвання згенераванага кантэнту, мера, якую нельга дэактываваць.

Эксклюзіўны кантэнт - націсніце тут  Як дадаць панэлі памылак у Google Sheets

Даступнасць і як яе праверыць

Veo 3.1 разгорнуты ў Паток, Праграма Gemini, штучны інтэлект Vertex і API распрацоўшчыка GeminiДаступнасць можа адрознівацца ў залежнасці ад рэгіёна і, верагодна, Для некаторых пашыраных функцый патрабуецца падпіска.

Для тэхнічных каманд і кампаній доступ праз Vertex AI і API дазваляе лёгка інтэграваць мадэль ва ўнутраныя інструменты, у той час як Асобныя стваральнікі могуць эксперыментаваць з праграмы двайняты або рэдактар ​​Flow.

Канкурэнты і практычнае выкарыстанне

Праграма Sora 2

Супраць Сора 2 ад OpenAIVeo 3.1 робіць акцэнт на кантролі карыстальніка падчас стварэння (кропкі выявы, рэдагаванне сцэны і інтэграваны гук). Sora 2 вылучаецца сваёй акцэнтам на рэалізм, таму выбар залежыць ад творчай мэты.

У маркетынгу, журналістыцы і адукацыі гэтыя функцыі дазваляюць ідэі прататыпаў, ствараць тлумачальныя візуалізацыі і тэматычныя кліпы без традыцыйнай здымкі, паскараючы дастаўку кантэнту.

З дапамогай гэтага абнаўлення Google удасканальвае формулу: больш кантролю, інтэграваны аўдыё і лепшыя інструменты рэдагавання, каб стваральнік мог кіраваць гісторыяй з меншым трэннем, захоўваючы сумяшчальнасць фарматаў і патокаў з асноўнымі платформамі.

Вадзяны знак SynthID
звязаныя артыкулы:
Што такое SynthID, вадзяны знак штучнага інтэлекту?