Ég sé mynd 3 og mynd 4: Svona er Google að gjörbylta mynda- og myndbandagerð með gervigreind.

Síðasta uppfærsla: 23/05/2025

  • Veo 3 gerir þér kleift að búa til myndbönd með raunverulegu hljóði og samtölum úr einföldum texta.
  • Mynd 4 nær myndum með óviðjafnanlegri smáatriðum, texta og gæðum í gervigreind, allt að 2K og mörgum sniðum.
  • Báðar gerðirnar eru þegar samþættar forritum eins og Gemini, Flow og Google Workspace verkfærum.
Mynd 4 Ég sé 3-4

Gervigreind heldur áfram að taka gríðarlegum framförum. Ef það er fyrirtæki sem heldur áfram að vera leiðandi á þessu sviði, þá er það án efa, Google. Í löngu væntanlegri ferð sinni Árlegi viðburður Google I/O 2025, félagið hefur enn á ný gjörbylta efnissköpun með því að kynna tvær framfarir sem lofa að breyta því hvernig við framleiðum myndir og myndbönd: kynslóðarlíkön Ég sé 3 og mynd 4. Báðar koma með röð af framsæknum og óvæntum nýjungum sem hafa gert bæði sérfræðinga og notendur skapandi gervigreindar andlausa.

Desde kynslóð myndbanda með umhverfishljóði og samtölum að fullu raunhæft, fara í gegnum Myndir þar sem smáatriði eru næstum ómöguleg að greina frá hefðbundinni ljósmynd, til óaðfinnanlegrar samþættingar við skrifstofutól og skapandi palla, marka þessar gerðir fyrir og eftir í því sem við getum búist við af gervigreind sem notuð er í sjónrænu og hljóðrænu formi. Við skulum sjá hvað Veo 3 og Imagen 4 geta í raun gert, við skulum komast að því.

Hvað er Veo 3: Nýja tímabil gervigreindarframleiddra myndbanda með raunverulegu hljóði

Veo 3 Þetta er ekki bara enn ein uppfærslan; táknar komu fyrstu skapandi gervigreindar Google sem býr til myndbönd með sjálfvirkt mynduðu innfæddu hljóði. Hingað til hafa aðrar samkeppnislíkön eins og Sora frá OpenAI verið á eftir í þessu tilliti og getað ekki bætt samstilltu hljóði við sjálft myndunarferlið. Google leggur fram tillögu sem er sannarlega ólík: myndbönd með umhverfishljóð, samræður og jafnvel hljóðáhrif algerlega tilbúið en raunsætt, allt byggt á lýsingum sem notandinn gefur. Til dæmis geturðu beðið um „borgarumhverfi með umferð og fólki sem talar“ og þú munt fá nákvæmlega það, með venjulegum hljóðum og persónum sem eru að para saman.

Þetta setur Veo 3 sem gervigreindina sem skilur betur flóknar fyrirmæli og umbreytir þeim í aðgerðir hljóð- og myndefni. Þú getur útskýrt hvaða persónur þú vilt, hvað þær ættu að segja og jafnvel hvernig umhverfið ætti að hljóma til að ná fram ákveðnu andrúmslofti. Þessi möguleiki á að búa til 4K myndbönd, allt að tvær mínútur að lengd (sem erft er frá Veo 2 líkaninu), er nú styrktur með lagi af raunsæi sem færir skáldskapinn, sem gervigreind hefur skapað, nær kvikmyndalegum stöðlum.

Að auki, Veo 3 gerir þér kleift að breyta niðurstöðunni á augabragði: bæta við eða fjarlægja hluti, breyta ramma (úr lóðréttri í lárétta og öfugt) og jafnvel stækka sjónsviðið með því að nota útmálunartækni. Í bland við mun nákvæmari myndavélastýringar (snúninga, aðdrátt, mælingar) fæst stjórn á hljóð- og myndrænni frásögn sem aldrei hefur sést áður í gervigreind neytenda.

Til að auðvelda aðgang hefur Google samþætt þessa gerð í Gemini appið (áður Bard), sem og á nýja kerfinu Flow (sem við munum ræða um síðar) og í faglegum verkfærum eins og Vertex AI.

Heiðra 400
Tengd grein:
Google kynnir nýtt gervigreindarknúið myndbandstæki fyrir Honor snjallsíma.

Ítarlegri upplýsingar: Frá varasamstillingu til klippingar á flugu

Ein af stóru áskorununum fyrir gervigreind í myndböndum var að fá Samræðurnar voru náttúrulegar og sannfærandi varir. Veo 3 tekur stórt stökk fram á við með því að fella inn tækni sem passar fullkomlega við hljóðið sem myndast, sem gerir myndsamræður trúverðugar og fljótandi. Þetta bætir ekki aðeins skynjun á raunsæi, heldur opnar einnig dyr að nýrri notkun í menntun, hljóð- og myndmiðlun og auglýsingum.

Einkarétt efni - Smelltu hér  Hvernig á að tengja Google Classroom við Infinite Campus

Að auki, Gervigreind Google takmarkast ekki við fyrstu kynslóðinaGerir notandanum kleift að súmma inn á vettvang, breyta stefnu og aðlaga sjónræna þætti eftir smekk, allt með textalýsingu. Þannig er hægt að breyta nærmynd í víðmynd, skipta úr lóðréttri í lárétta stillingu eða fella inn nýja hluti án þess að þurfa að byrja frá grunni. Þú getur einnig fjarlægt óæskileg atriði, sem er afar gagnlegt við hraða framleiðslu á sérsniðnu efni.

Mynd 4: Byltingin í myndagerð með gervigreind

Mynd 4 og ég sé 3 frá Google

Samhliða Veo 3 hefur Google kynnt 4 mynd, nýja líkan þess til að búa til myndir með gervigreind. Hápunktur þessarar útgáfu er áhrifamikill stökk fram úr í gæðum í smáatriðum og svörunarhraða. Þótt gervigreind hafi áður staðið undir væntingum í þáttum eins og að endurskapa fínar áferðir (vatnsdropa, dýrafeld, flóknar speglun), þá býr Image 4 nú til myndir sem keppa við fagmannlega ljósmyndun bæði í raunverulegum umgjörðum og abstraktum samsetningum.

Hinn stóri kosturinn er kynslóðarhraðiMynd 4 er komin upp í 10 sinnum hraðari en forveri þess, hið þegar háþróaða Image 3. Þetta gerir kleift að framkvæma mun sveigjanlegri vinnuflæði og auðvelda sköpunargáfu jafnvel í verkefnum sem krefjast tafarlausrar notkunar, svo sem brýnnar grafískrar hönnunar eða framleiðslu á verkum fyrir samfélagsmiðla.

Hvað varðar tæknilega gæði, Mynd 4 býr til myndir í allt að 2K upplausn, sem gerir þær hentugar fyrir háskerpu prentun og stórar kynningar. Það styður einnig birtingu í ýmsum hlutföllum, allt frá ferningum til víðmynda, sem býður upp á mikla fjölhæfni til að búa til allt frá póstkortum til veggspjalda.

Sérstaklega viðeigandi smáatriði er verulegar framfarir í stafsetningu og leturfræðiGervigreind getur nú fellt texta rétt inn í myndir, sem gerir þér kleift að hanna kort, boðskort, veggspjöld og jafnvel teiknimyndasögur með læsilegum og vel sniðnum texta. Þetta útrýmir einni af helstu áskorununum sem fyrri kynslóðarlíkön buðu enn upp á, sem voru oft villur við ritun innfellds texta.

Samþætting við vistkerfi Google og framboð

Tvær fyrirmyndirnar, Ég sé 3 og mynd 4þau virka ekki sem einangruð verkfæri, heldur frekar eru samþættar vistkerfi Google. Notendur geta nálgast þau beint úr Gemini appinu og úr Flow, en þau virðast einnig vera samþætt í kerfi eins og Docs, Slides, Vids og önnur verkfæri í Workspace. Þetta gerir nemendum, höfundum og fagfólki kleift að færa sjónrænt og hljóð- og myndefni beint inn í dagleg verkefni sín án þess að yfirgefa Google umhverfið.

Einkarétt efni - Smelltu hér  Hvernig á að bæta hljóði við Google Slide kynningu

Aðgengi er þó takmarkað í þessum fyrsta áfanga. Veo 3 er fáanlegt í beta útgáfu innan Gemini aðeins fyrir bandaríska notendur með Google AI Ultra áskrift, en Image 4 hefur þegar verið sett inn í Gemini og önnur Google verkfæri fyrir öll studd svæði. Þau birtast einnig í sérhæfðum forritum eins og þeytara og Vertex AI, hannað til notkunar í viðskiptum og þróun sérsniðinna vara.

Allt efni sem búið er til með Imagen 4 inniheldur stafrænt vatnsmerki sem kallast SynthID. Þetta merki auðveldar að bera kennsl á hvort mynd var búin til með gervigreind með SynthID Detector tólinu, sem bætir við gegnsæi og trausti í umhverfum þar sem áreiðanleiki efnis er mikilvægur.

Flow: kvikmyndatólið sem sameinar það besta frá Veo, Imagen og Gemini

Samhliða myndunarlíkönum sem byggja á fyrirmælum hefur Google hleypt af stokkunum Flow, tóli til að búa til og breyta myndböndum sem er hannað til að fá sem mest út úr Veo 3, Image 4 og Gemini. Flow byggir á fyrri reynslu af VideoFX (tilraun Google Labs) og tekur hana mun lengra, sem gerir notendum kleift að framleiða myndskeið, klippa senu, stjórna hreyfingum myndavélarinnar og stjórna eignum á einfaldan og öflugan hátt.

Meðal háþróaðra eiginleika þess, Flow gerir þér kleift að stjórna hreyfingum myndavélarinnar og sjónarhorni., lengja núverandi senur, bæta við nýjum tökum með Scenebuilder kerfinu og stjórna grafík og hljóðauðlindum úr einu viðmóti. Allt ferlið er stýrt af gervigreind, sem gerir námsferilinn lágmarkan, jafnvel fyrir þá sem eru ekki sérfræðingar í ritstjórn.

Að auki, Flow hefur samfélagslegan þátt sem býður þér að deila og uppgötva efni sem búið er til með gervigreind.. Til dæmis, með Flow TV geta notendur skoðað myndbönd sem aðrir skaparar hafa búið til, fundið innblástur og tekið þátt í kraftmiklu samfélagi þar sem tækni og sköpunargáfa fléttast saman.

Hvernig fæ ég aðgang að Veo 3 og Imagen 4? Í bili, aðeins í Bandaríkjunum

Google AI Ultra

Aðgangur að þessari nýjustu tækni hefur verið skipulagður í áföngum. Google AI Ultra Þetta er einkaréttasta áskriftin, ætluð þeim sem vilja vera fyrstir til að fá aðgang að nýjustu fréttum og fullkomnustu gerðinni af ... Gemini, sem og Veo 3, Flow, Whisk, Minnisbók LM, Gemini samþætt í vistkerfi Google, Gemini í Chrome, YouTube Premium og 30 TB af skýjageymslu.

Kostnaðurinn, í bili, Það kostar 249,99 dollara á mánuði, þó að kynningarafslættir séu í boði. Aðeins notendur í Bandaríkjunum geta skráð sig í þetta eins og er, en Alþjóðleg útrás er fyrirhuguð fljótlega.

Fyrirtæki og fagfólk geta nýtt sér Veo 3 í gegnum Vertex AI, sem leyfir þeim Samþættu mynd- og hljóðframleiðslu í vinnuflæði fyrirtækisins, vöruþróun eða háþróaðar markaðsherferðir. Skapandi og áhugasamir notendur geta nálgast Imagen 4 og suma eiginleika Flow í Pro og Basic áskriftunum í gervigreindarvistkerfi Google.

Einkarétt efni - Smelltu hér  Hvernig á að breyta stærð Google myndir

Google hefur einnig hannað samvinnuvistkerfi, þar sem líkanbætur ná fljótt til allra framleiðni- og sköpunartækja þess, sem tryggir að þú hafir alltaf aðgang að nýjustu þróuninni án auka fyrirhafnar.

Hvers vegna er Veo 3 stórt stökk fram á við í samanburði við samkeppnina?

Þar til Veo 3 kom út leyfðu flestir gervigreindarmyndbandsframleiðendur á markaðnum (eins og Runway, Luma AI eða Pika Labs) aðeins að bæta við utanaðkomandi hljóð eftir kynslóðina. Þeir gátu ekki búið til samstillta innfædda hljóð innan sama verksins, sem olli vandamáli fyrir þá sem vildu fá fullkomlega sjálfvirkar niðurstöður. Veo 3 leysir þá áskorun og setur Google í forystu í kapphlaupinu um hljóð- og myndræna gervigreind, jafnvel á undan tillögum eins og Sora frá OpenAI, sem hefur ekki enn tekist að samþætta hljóð í fyrstu kynslóð myndbanda.

Hvað varðar sjónræna gæði, þá Smáatriðin sem Image 4 nær fram í áferð, lýsingu og nákvæmni endurgerð stíls fara fram úr núverandi stöðlum um gervigreind í myndum.. Hæfni til að búa til vel skrifaðan texta og flókin grafísk atriði innan myndanna sjálfra eykur notkunarmöguleika, allt frá listsköpun til faglegrar grafískrar hönnunar, þar á meðal afþreyingar- og fræðsluforrita.

Sameinuð hæfni: sönn sköpun án takmarkana

4 mynd

Það sem greinir aðferðafræði Google frá öðrum liggur í því hvernig líkön þess samræmast hver annarri. Veo 3 og Imagen 4 geta unnið saman þökk sé Flow og Gemini, sem gerir sköpunarflæði mögulegt þar sem þú getur byrjað með kyrrstöðumynd, umbreytt henni í hreyfimynd, bætt við hljóði og fínstillt hana til að búa til faglegt myndband. Þessi samþætting milli kerfa gerir Google að kjörnum samstarfsaðila fyrir nemendur, skapandi fagfólk, auglýsingastofur eða einfaldlega alla sem vilja kanna ný sjónræn landsvæði auðveldlega og á áhrifaríkan hátt.

Vistkerfið inniheldur einnig aðra tækni eins og Lyria 2, sem er hönnuð fyrir aðlögunarhæf tónlistarframleiðsla sem fylgir umbreytingum og tilfinningum myndböndanna á greindan og samhangandi hátt. Þetta fullkomnar hringinn og gerir kleift að framleiða verk í stúdíógæðum án þess að þurfa að grípa til hljóðbanka eða utanaðkomandi efnis.

Fyrir forritara og fyrirtæki auðvelda API-forritaskilin og efnisstjórnunartólin að samþætta þessar lausnir í lokaafurðir, sérsniðna þjónustu, öpp og stafræna palla, sem eykur nýsköpun í fjölbreyttum geirum eins og menntun, fjarskipti, heilbrigðisþjónustu og afþreyingu.

Google er staðsett sem viðmið í skapandi gervigreind, sem opnar upp möguleika sem áður virtust vera vísindaskáldskapur. Samsetningin af stjórn, raunsæi og sérstillingar Í sameinuðu vistkerfi setur það nýjan staðal fyrir framleiðslu á sjónrænu, hljóðrænu og grafísku efni, með gríðarlegum mögulegum áhrifum á mismunandi geira og á þann hátt sem skaparar framleiða og deila hugmyndum sínum.

FartölvuLM Android-1
Tengd grein:
NotebookLM er nú fáanlegt á Android: allt um gervigreindarappið frá Google til að búa til, taka saman og hlusta á glósur.