Rwy'n gweld Delwedd 3 a Delwedd 4: Dyma sut mae Google yn chwyldroi creu delweddau a fideos gyda deallusrwydd artiffisial.

Diweddariad diwethaf: 23/05/2025

  • Mae Veo 3 yn caniatáu ichi gynhyrchu fideos gyda sain a deialog realistig o destun syml.
  • Mae Delwedd 4 yn cyflawni delweddau gyda manylder, testun ac ansawdd digynsail mewn AI, hyd at 2K a fformatau lluosog.
  • Mae'r ddau fodel eisoes wedi'u hintegreiddio i apiau fel Gemini, Flow, ac offer Google Workspace.
Delwedd 4 Rwy'n gweld 3-4

Mae deallusrwydd artiffisial yn parhau i wneud camau breision. Os oes cwmni sy'n parhau i osod y cyflymder yn y maes hwn, mae'n ddiamau, google. Yn ei hir-ddisgwyliedig Digwyddiad blynyddol Google I/O 2025, y cwmni wedi chwyldroi creu cynnwys unwaith eto drwy gyflwyno dau ddatblygiad sy'n addo newid y ffordd rydyn ni'n cynhyrchu delweddau a fideos: modelau cynhyrchiol Rwy'n gweld 3 a Delwedd 4. Mae'r ddau yn dod â chyfres o arloesiadau arloesol ac annisgwyl sydd wedi gadael arbenigwyr a defnyddwyr AI cynhyrchiol yn ddi-anadl.

Ers yr cynhyrchu fideos gyda sain amgylchynol a deialogau yn llwyr realistig, yn mynd drwodd delweddau gyda manylion bron yn amhosibl eu gwahaniaethu o ffotograff traddodiadol, i integreiddio di-dor i offer swyddfa a llwyfannau creadigol, mae'r modelau hyn yn nodi cyn ac ar ôl yn yr hyn y gallwn ei ddisgwyl gan ddeallusrwydd artiffisial a gymhwysir i feysydd gweledol a sain. Gadewch i ni weld beth all Veo 3 ac Imagen 4 ei wneud mewn gwirionedd, gadewch i ni fynd ati.

Beth yw Veo 3: Yr oes newydd o fideo a gynhyrchir gan AI gyda sain realistig

Veo 3 Nid dim ond diweddariad arall ydyw; yn cynrychioli dyfodiad AI cynhyrchiol cyntaf Google sy'n creu fideos gyda sain frodorol a gynhyrchir yn awtomatig. Hyd yn hyn, mae modelau cystadleuol eraill fel Sora OpenAI wedi llusgo ar ei hôl hi yn hyn o beth, gan nad ydynt yn gallu ychwanegu sain cydamserol yn ystod y broses gynhyrchu ei hun. Mae Google yn cyflwyno cynnig gwirioneddol wahanol: fideos gyda synau amgylchynol, deialog, a hyd yn oed effeithiau sain hollol synthetig ond realistig, i gyd yn seiliedig ar ddisgrifiadau a ddarperir gan y defnyddiwr. Er enghraifft, gallwch ofyn am “olygfa drefol gyda thraffig a phobl yn siarad” a chewch chi yn union hynny, gyda’r synau a’r cymeriadau arferol yn cyd-fynd â gwefusau.

Mae hyn yn gosod Veo 3 fel yr AI sydd yn deall awgrymiadau cymhleth yn well ac yn eu trosi'n weithredu clyweledol. Gallwch chi roi manylion am ba gymeriadau rydych chi eu heisiau, beth ddylen nhw ei ddweud, a hyd yn oed sut y dylai'r amgylchedd swnio i gyflawni awyrgylch penodol. Mae'r gallu hwn i greu fideos 4K, hyd at ddwy funud o hyd (a etifeddwyd o'r model Veo 2), bellach wedi'i atgyfnerthu â haen o realaeth sy'n dod â'r ffuglen a grëwyd gan AI yn agosach at safonau sinematig.

Yn ogystal â hyn, Mae Veo 3 yn caniatáu ichi addasu'r canlyniad ar unwaith.: ychwanegu neu ddileu gwrthrychau, newid y fframio (o fertigol i lorweddol ac i'r gwrthwyneb), a hyd yn oed ehangu'r maes golygfa gan ddefnyddio technegau peintio allan. Ynghyd â rheolyddion camera llawer mwy manwl gywir (cylchdroadau, chwyddo, olrhain), y canlyniad yw lefel o reolaeth dros naratif clyweledol na welwyd erioed o'r blaen mewn deallusrwydd artiffisial defnyddwyr.

Er mwyn hwyluso mynediad, mae Google wedi integreiddio'r model hwn i mewn yr ap Gemini (Bard gynt), yn ogystal ag ar y platfform newydd Llif (y byddwn yn siarad amdano yn ddiweddarach) ac mewn offer proffesiynol fel Vertex AI.

Honor 400
Erthygl gysylltiedig:
Mae Google yn datgelu ei offeryn creu fideo newydd sy'n cael ei bweru gan AI ar gyfer ffonau clyfar Honor.

Manylion Uwch: O Gydamseru Gwefusau i Olygu Ar y Pryd

Un o'r heriau mawr ar gyfer AI fideo cynhyrchiol oedd cael y roedd gan y deialogau gydamseru gwefusau naturiol ac argyhoeddiadol. Mae Veo 3 yn cymryd cam ymlaen trwy ymgorffori technoleg sy'n paru symudiad gwefusau'n berffaith â'r sain a gynhyrchir, gan wneud sgyrsiau fideo yn gredadwy ac yn hylifol. Mae hyn nid yn unig yn gwella'r canfyddiad o realaeth, ond mae hefyd yn agor y drws i ddefnyddiau newydd mewn addysg, clyweledol a hysbysebu.

Cynnwys unigryw - Cliciwch Yma  Sut i gysylltu Google Classroom ag Infinite Campus

Yn ogystal â hyn, Nid yw AI Google wedi'i gyfyngu i'r genhedlaeth gychwynnol: yn caniatáu i'r defnyddiwr chwyddo i mewn ar yr olygfa, newid y cyfeiriadedd, ac addasu'r elfennau gweledol yn ôl eu dewisiadau, a hynny i gyd gyda disgrifiad testunol. Fel hyn, gallwch drawsnewid llun agos yn olygfa banoramig, newid o fodd fertigol i fodd llorweddol, neu ymgorffori gwrthrychau newydd heb orfod dechrau o'r dechrau. Gallwch hefyd gael gwared ar elfennau diangen, sy'n hynod ddefnyddiol wrth gynhyrchu cynnwys wedi'i deilwra'n gyflym.

Delwedd 4: Y chwyldro mewn cynhyrchu delweddau gyda deallusrwydd artiffisial

Delwedd 4 ac rwy'n gweld 3 o Google

Ochr yn ochr â Veo 3, mae Google wedi cyflwyno 4 image, ei fodel newydd ar gyfer cynhyrchu delweddau gan ddefnyddio deallusrwydd artiffisial. Uchafbwynt y fersiwn hon yw'r trawiadol naid o ran ansawdd o ran manylder a chyflymder ymateb. Er bod AI wedi methu o'r blaen mewn agweddau fel atgynhyrchu gweadau mân (diferynnau dŵr, ffwr anifeiliaid, adlewyrchiadau cymhleth), mae Image 4 bellach yn creu delweddau sy'n cystadlu â ffotograffiaeth broffesiynol mewn lleoliadau realistig a chyfansoddiadau haniaethol.

Y fantais fawr arall yw'r cyflymder cynhyrchuDelwedd 4 yw hyd at 10 gwaith yn gyflymach na'i ragflaenydd, y Delwedd 3 sydd eisoes yn ddatblygedig. Mae hyn yn caniatáu llif gwaith llawer mwy ystwyth, gan hwyluso creadigrwydd hyd yn oed mewn prosiectau sy'n gofyn am gyflymder, fel dylunio graffig brys neu gynhyrchu darnau ar gyfer cyfryngau cymdeithasol.

O ran ansawdd technegol, Mae Delwedd 4 yn creu delweddau mewn datrysiad hyd at 2K, gan eu gwneud yn addas ar gyfer argraffu diffiniad uchel a chyflwyniadau ar raddfa fawr. Mae hefyd yn cefnogi rendro mewn amrywiaeth o gymhareb agwedd, o fformatau sgwâr i banoramig, gan ddarparu hyblygrwydd llwyr ar gyfer creu popeth o gardiau post i bosteri.

Manylyn arbennig o berthnasol yw'r gwelliant sylweddol mewn sillafu a theipograffegGall deallusrwydd artiffisial bellach fewnosod testun yn gywir mewn delweddau, gan ganiatáu ichi ddylunio cardiau, gwahoddiadau, posteri, a hyd yn oed comics gyda thestun darllenadwy, wedi'i fformatio'n dda. Mae hyn yn dileu un o'r prif heriau a oedd yn dal i gael eu cyflwyno gan fodelau cynhyrchiol blaenorol, a oedd yn aml yn wallau wrth ysgrifennu testun mewnosodedig.

Integreiddio i ecosystem Google ac argaeledd

Y ddau fodel, Rwy'n gweld 3 a Delwedd 4, nid ydynt yn gweithio fel offer ynysig, ond yn hytrach wedi'u hintegreiddio i ecosystem Google. Gall defnyddwyr eu cyrchu'n uniongyrchol o ap Gemini ac o Flow, ond maent hefyd yn ymddangos wedi'u hintegreiddio i mewn llwyfannau fel Docs, Slides, Vids ac offer Workspace eraill. Mae hyn yn caniatáu i fyfyrwyr, crewyr a gweithwyr proffesiynol ddod â'u cynnwys gweledol a chlyweledol yn uniongyrchol i'w prosiectau bob dydd heb adael amgylchedd Google.

Cynnwys unigryw - Cliciwch Yma  Sut i ychwanegu sain at gyflwyniad Google Slide

Fodd bynnag, mae argaeledd yn gyfyngedig yn y cam cyntaf hwn. Mae Veo 3 ar gael mewn beta o fewn Gemini dim ond ar gyfer defnyddwyr yr Unol Daleithiau sydd â thanysgrifiad Google AI Ultra, tra bod Image 4 eisoes wedi'i gyflwyno i Gemini ac offer Google eraill ar gyfer yr holl diriogaethau a gefnogir. Maent hefyd yn ymddangos mewn cymwysiadau arbenigol fel Whisk a Vertex AI, wedi'i gynllunio ar gyfer defnydd busnes a datblygu cynhyrchion wedi'u haddasu.

Mae pob cynnwys a gynhyrchir gydag Imagen 4 yn cario dyfrnod digidol o'r enw SynthID. Mae'r marc hwn yn ei gwneud hi'n hawdd nodi a grëwyd delwedd gyda deallusrwydd artiffisial gan ddefnyddio'r offeryn SynthID Detector, gan ychwanegu haen o dryloywder ac ymddiriedaeth mewn amgylcheddau lle mae dilysrwydd cynnwys yn hanfodol.

Llif: yr offeryn sinematig sy'n uno'r gorau o Veo, Imagen a Gemini

Ynghyd â'r modelau cynhyrchu sy'n seiliedig ar awgrymiadau, mae Google wedi lansio Flow, teclyn creu a golygu fideos a gynlluniwyd i gael y gorau o Veo 3, Image 4, a Gemini. Mae Flow yn adeiladu ar brofiad blaenorol VideoFX (arbrawf Google Labs) ac yn mynd ag ef ymhellach o lawer, gan ganiatáu i ddefnyddwyr cynhyrchu clipiau fideo, golygu golygfeydd, rheoli symudiadau camera a rheoli asedau mewn ffordd syml a phwerus.

Ymhlith ei nodweddion uwch, Mae Flow yn caniatáu ichi reoli symudiad a phersbectif y camera, ymestyn golygfeydd presennol, ychwanegu ergydion newydd gan ddefnyddio'r system Scenebuilder, a rheoli adnoddau graffig a sain o un rhyngwyneb. Mae'r broses gyfan yn cael ei harwain gan AI, gan wneud y gromlin ddysgu yn fach iawn hyd yn oed i bobl nad ydyn nhw'n arbenigwyr golygu.

Yn ogystal â hyn, Mae gan Flow gydran gymdeithasol sy'n eich gwahodd i rannu a darganfod cynnwys a grëwyd gyda deallusrwydd artiffisial.. Er enghraifft, gyda Flow TV, gall defnyddwyr archwilio fideos a grëwyd gan grewyr eraill, dod o hyd i ysbrydoliaeth, a chymryd rhan mewn cymuned ddeinamig lle mae technoleg a chreadigrwydd yn cydblethu.

Sut mae cael mynediad at Veo 3 ac Imagen 4? Am y tro, yn yr Unol Daleithiau yn unig

Google AI Ultra

Mae mynediad at y technolegau arloesol hyn wedi'i drefnu mewn cynlluniau graddol. Google AI Ultra Dyma'r tanysgrifiad mwyaf unigryw, wedi'i anelu at y rhai sydd eisiau bod y cyntaf i gael mynediad at y newyddion diweddaraf a'r model mwyaf datblygedig o Gemini, yn ogystal â Veo 3, Llif, Chwisg, Llyfr nodiadauLM, Gemini wedi'i integreiddio i ecosystem Google, Gemini yn Chrome, YouTube Premium a 30 TB o storfa cwmwl.

Y gost, am nawr, Mae'n $249,99 y mis, er bod gostyngiadau cyflwyniadol. Dim ond defnyddwyr yn yr Unol Daleithiau all gofrestru ar ei gyfer ar hyn o bryd, ond Mae ehangu rhyngwladol wedi'i gynllunio cyn bo hir.

Gall cwmnïau a gweithwyr proffesiynol fanteisio ar Veo 3 drwy Vertex AI, sy'n caniatáu iddynt Integreiddio cynhyrchu fideo a sain i mewn i'ch llif gwaith corfforaethol, datblygu cynnyrch neu ymgyrchoedd marchnata uwch. Gall defnyddwyr creadigol a brwdfrydig gael mynediad at Imagen 4 a rhai o nodweddion Flow yng nghynlluniau Pro a Basic ecosystem AI Google.

Cynnwys unigryw - Cliciwch Yma  Sut i newid maint Google Photos

Mae Google hefyd wedi dylunio ecosystem gydweithredol, lle mae gwelliannau i'r modelau'n ymestyn yn gyflym i'w holl offer cynhyrchiant a chreu, gan sicrhau bod gennych chi fynediad bob amser at y datblygiadau diweddaraf heb ymdrech ychwanegol.

Pam mae Veo 3 yn gam ymlaen o'i gymharu â'r gystadleuaeth?

Hyd at ddyfodiad Veo 3, dim ond ychwanegu oedd yn cael ei ganiatáu gan y rhan fwyaf o generaduron fideo AI ar y farchnad (fel Runway, Luma AI neu Pika Labs). sain allanol ar ôl y genhedlaeth. Ni allent greu synau brodorol cydamserol o fewn yr un darn, a oedd yn broblem i'r rhai oedd yn chwilio am ganlyniadau cwbl awtomatig. Mae Veo 3 yn datrys yr her honno a yn rhoi Google ar y blaen yn y ras am AI clyweledol, hyd yn oed o flaen cynigion fel Sora gan OpenAI, nad yw eto wedi llwyddo i integreiddio sain i'r genhedlaeth gychwynnol o fideos.

O ran ansawdd gweledol, y Mae'r manylion a gyflawnir gan Delwedd 4 o ran gweadau, goleuo, a chywirdeb atgynhyrchu arddull yn rhagori ar safonau AI delwedd cyfredol.. Mae'r gallu i gynhyrchu testun wedi'i ysgrifennu'n dda ac elfennau graffig cymhleth o fewn delweddau eu hunain yn cynyddu'r posibiliadau ar gyfer defnydd, o greadigaeth artistig i ddylunio graffig proffesiynol, gan gynnwys cymwysiadau hamdden ac addysgol.

Galluoedd cyfunol: creadigrwydd gwirioneddol heb derfynau

4 image

Yr elfen wahaniaethol yn null Google yw sut mae ei fodelau'n cyfuno â'i gilydd. Gall Veo 3 ac Imagen 4 weithio gyda'i gilydd diolch i Flow a Gemini, gan alluogi llifau creadigol lle gallwch chi ddechrau gyda delwedd llonydd, ei thrawsnewid yn olygfa animeiddiedig, ychwanegu sain, a'i mireinio i greu fideo proffesiynol. Mae'r integreiddio traws-lwyfan hwn yn gwneud Google yn bartner delfrydol i fyfyrwyr, gweithwyr proffesiynol creadigol, asiantaethau hysbysebu, neu unrhyw un sydd eisiau archwilio tiriogaethau gweledol newydd yn hawdd ac yn effeithiol.

Mae'r ecosystem hefyd yn cynnwys technolegau eraill fel Lyria 2, a gynlluniwyd ar gyfer y cynhyrchu cerddoriaeth addasol sy'n cyd-fynd â thrawsnewidiadau ac emosiynau'r fideos mewn ffordd ddeallus a chydlynol. Mae hyn yn cwblhau'r cylch ac yn caniatáu cynhyrchu darnau o ansawdd stiwdio heb yr angen i droi at fanciau sain na deunydd allanol.

I ddatblygwyr a busnesau, mae'r offer API a rheoli cynnwys yn ei gwneud hi'n hawdd integreiddio'r atebion hyn i gynhyrchion terfynol, gwasanaethau wedi'u teilwra, apiau a llwyfannau digidol, gan hybu arloesedd mewn sectorau mor amrywiol â addysg, cyfathrebu, gofal iechyd ac adloniant.

google wedi'i leoli fel meincnod mewn deallusrwydd artiffisial creadigol, gan agor posibiliadau a oedd gynt yn ymddangos fel ffuglen wyddonol. Y cyfuniad o rheolaeth, realaeth ac addasu Mewn ecosystem unedig, mae'n gosod safon newydd ar gyfer cynhyrchu cynnwys gweledol, sain a graffig, gyda photensial i effeithio'n enfawr ar draws gwahanol sectorau a'r ffordd y mae crewyr yn cynhyrchu ac yn rhannu eu syniadau.

NotebookLM Android-1
Erthygl gysylltiedig:
Mae NotebookLM bellach ar gael ar Android: popeth am ap AI Google ar gyfer creu, crynhoi a gwrando ar eich nodiadau.