Google Veo 3.1: Päivitys, joka vahvistaa äänentoistoa ja luovaa hallintaa

Viimeisin päivitys: 06.12.2023
Kirjoittaja: Alberto Navarro

  • Natiiviääni kaikissa Flow-työkaluissa: synkronoitu dialogi, tunnelma ja tehosteet
  • Parempi noudattaminen kehotteessa ja paremmat kuvasta videoon -tulokset
  • Uudet muokkaustoiminnot: Ainesosat, Kehykset, Laajenna ja Lisää; Poista tulossa pian
  • Saatavuus Flow'ssa, Gemini-sovelluksessa, Vertex AI:ssa ja Gemini API:ssa

Google Veo 3.1 AI -videomalli

Google on päivittänyt videoiden luontimallinsa Veo 3.1:llä, iteraatio, joka keskittyy audiovisuaaliseen laatuun, luovaan hallintaan ja luotettavuuteen. Yritys integroi Tärkeitä parannuksia editorin ja ohjeiden ymmärtämiseen nopeuttaakseen elokuvamaisen näköisten teosten luomista.

La Näkyvimpänä uutuutena on mm. natiiviääni, nyt läsnä koko työnkulussa: dialogi, tunnelma ja tehosteet tuotetaan synkronoidusti visuaalien kanssa. Lisäksi, Flow sisältää säätöjä, jotka helpottavat kohtausten hienosäätöä, vähentävät testejä ja ylläpitävät yhdenmukaisuutta ottojen välillä..

Mikä on Veo 3.1 ja mitä muutoksia siinä on Veo 3:een verrattuna?

Google Veo 3.1

Perustuu Veoon 3, uusi malli priorisoi kehotteen noudattaminen ja tarkkuutta video- ja äänilähdöissä. Google huomauttaa, että virittäminen vähentää tarpeettomia iteraatioita, mikä tarjoaa enemmän hallintaa ja johdonmukaisempia tuloksia sen kanssa, mitä pyydettiin.

Päivitys tulee kuukausien intensiivisen Flow'n käytön jälkeen sisällöntuottajien keskuudessa. satoja miljoonia klippejä syntynyt sen julkaisusta lähtienTämä oppiminen tarkoittaa monimutkaisten kohtausten luotettavampaa tulkintaa, tekstuurien suurempaa realismia ja parempaa jatkuvuutta kuvien välillä.

Ainutlaatuinen sisältö - Napsauta tästä  Kuinka palauttaa Googlen pikkukuvat

Yritys vahvistaa myös 16:9-kuvasuhteiden tukea sekä vaakasuunnassa että pystysuunnassa integroituakseen paremmin... alustojenvälisissä ympäristöissä ja nykyiset julkaisuvirrat.

Natiiviääniintegraatio ja tuetut tiedostomuodot

 

Veo 3.1:n avulla ääni generoidaan a:na synkronoitu ja kontekstuaalinen kaikissa Flow-työkaluissa: Tunnelma, tehosteet ja äänet mukautuvat jokaiseen otokseen ilman ulkoista jälkituotantoa.

Malli tuottaa noin 8 sekuntia 1080p-resoluutiolla ja 24 FPS:llä, ja laajentumisen mahdollisuus menettämättä ajallista yhtenäisyyttä. Tukee myös 9:16-pystysuuntaista formaattia, suunniteltu mobiilijakeluun.

Nämä ääniominaisuudet ulottuvat aiemmin mykistetyille toiminnoille, jolloin kuulemasi kehittyy näkemäsi rinnalla ja tallentavat askeleet lopullisessa kokoonpanossa.

Flow-työkalut: Ohjaus ja muokkaus

Näen 3.1

Flow sisältää ohjaimia, jotka auttavat ohjaamaan visuaalista kerrontaa. Videon ainekset, he voivat lataa useita referenssikuvia hahmojen, objektien ja tyylin määrittämiseksi, johdonmukaisuuden ylläpitäminen laukausten välillä.

Ainutlaatuinen sisältö - Napsauta tästä  AMD ja Stability AI mullistavat paikallisen tekoälyrenderöinnin kannettavissa tietokoneissa Amuse 3.1:llä

Toiminto Videokehykset luo siirtymän alkuperäisen kuvan ja lopullisen kuvan välille, hyödyllinen kohtauksen alun ja lopun määrittämiseen ja yritys- ja erehdysajan lyhentämiseen.

Kanssa LaajennaOn mahdollista pidentää klippejä yli minuutin, yhdistämällä segmenttejä visuaaliseen ja äänelliseen jatkuvuuteen pitkien kohtausten tai hitaampien kerrontojen rakentamiseksi.

Muokkausosiossa Lisää voit lisätä elementtejä olemassa olevaan kuvaan ottaen huomioon valaistuksen, varjot ja perspektiivin. Vaihtoehto Poistaa odotetaan saapuvan pian: sen tavoitteena on poistaa ei-toivotut esineet ja rakentaa merenpohja uudelleen luonnollisesti.

Suorituskyky, rajoitukset ja laatu

Veo 3.1 näyttää edistystä luonteen yhtenäisyys ruutujen välillä ja perusfysiikan (painovoima, törmäykset tai nesteet) esitystavassa, sekä kuvan ja videon välisen suhteen parannusten lisäksi, mikä parantaa hienojen yksityiskohtien säilymistä.

Kuten generatiivisen tekoälyn kohdalla, voi olla pistemäiset esineet, erityisesti nopeasti liikkuvissa kohtauksissa tai monimutkaisissa siirtymissä. Huulisynkroni on parantunut, vaikka se vaatii edelleen retusointi vaativissa tuotannoissa.

Google lisää näkyviä vesileimoja ja SynthID (digitaalinen kehyksen tunnistus) luodun sisällön jäljitettävyyttä varten, toimenpidettä, jota ei voida deaktivoida.

Ainutlaatuinen sisältö - Napsauta tästä  Kuinka päästä eroon Google Doodlesta

Saatavuus ja miten sitä testataan

Veo 3.1 on otettu käyttöön Virtaus, Gemini-sovellus, Vertex AI ja Gemini-kehittäjärajapintaSaatavuus voi vaihdella alueittain ja todennäköisesti Jotkin lisäominaisuudet vaativat tilauksen.

Teknisille tiimeille ja yrityksille Vertex AI:n ja API:n kautta tapahtuva käyttö helpottaa mallin integrointia sisäisiin työkaluihin samalla, kun Yksittäiset luojat voivat kokeilla sovelluksessa Kaksoset tai Flow-editorissa.

Kilpailijat ja käytännön käyttötarkoitukset

Sora 2 -sovellus

Kohtaaminen Sora 2 kirjoittanut OpenAIVeo 3.1 korostaa käyttäjän hallintaa luomisen aikana (kuvan vihjepisteet, kohtausten muokkaus ja integroitu ääni). Sora 2 erottuu edukseen realismiin keskittymisellään, joten valinta riippuu luovasta tavoitteesta.

Markkinoinnissa, journalismissa ja koulutuksessa nämä toiminnot mahdollistavat prototyyppi-ideoita, luo selittäviä visualisointeja ja tuota teemaleikkeitä ilman perinteistä kuvaamista, mikä nopeuttaa sisällön toimitusta.

Tämän päivityksen myötä Google hienosäätää kaavaa: enemmän hallintaa, integroitu ääni ja paremmat muokkaustyökalut, jotta luoja voi ohjaa tarinaa vähemmällä kitkalla, säilyttäen formaatit ja virrat yhteensopivina pääalustojen kanssa.

SynthID-vesileima
Aiheeseen liittyvä artikkeli:
Mikä on SynthID, tekoälyn vesileima?