- Veo 3 нь энгийн текстээс бодитой аудио болон харилцан яриа бүхий видео бичлэг хийх боломжийг танд олгоно.
- Зураг 4 нь хиймэл оюун ухаан, 2К хүртэл, олон форматтай урьд өмнө хэзээ ч байгаагүй нарийвчлал, текст, чанар бүхий зургийг олж авдаг.
- Хоёр загвар хоёулаа Gemini, Flow, Google Workspace хэрэгсэл зэрэг програмуудад аль хэдийн нэгдсэн байна.

Хиймэл оюун ухаан асар том алхмуудыг хийсээр байна. Хэрэв энэ салбарт хурдацтай хөгжиж буй компани байгаа бол энэ нь эргэлзээгүй. Google-ийн. Түүний удаан хүлээсэн хугацаанд Google I/O 2025 жилийн арга хэмжээ, компани хоёр дэвшлийг танилцуулснаар контент бүтээхэд дахин хувьсгал хийсэн Энэ нь бидний зураг, видео үйлдвэрлэх арга барилыг өөрчлөхийг амлаж байна: үүсгэгч загварууд Би 3 ба 4-р зургийг харж байна. Аль аль нь сүүлийн үеийн, гэнэтийн шинэлэг санаануудыг авчирсан нь мэргэжилтнүүд болон хиймэл хиймэл оюун ухааны хэрэглэгчдийн аль алиныг нь амьсгал хураасан.
Дэддэ орчны дуу чимээ, харилцан яриа бүхий видеог бүрэн бүтээх бодитой, өнгөрч байна Нарийвчилсан мэдээлэл бүхий зургуудыг уламжлалт гэрэл зургаас ялгах бараг боломжгүй юм, Оффисын хэрэгсэл болон бүтээлч платформд саадгүй нэгтгэхийн тулд эдгээр загварууд нь харааны болон аудионд хэрэглэгдэх хиймэл оюун ухаанаас бидний хүлээж болохуйц өмнөх болон дараачийн үеийг тэмдэглэж байна. Veo 3 болон Imagen 4 нь үнэхээр юу хийж чадахыг харцгаая, тэгээд үүнд орцгооё.
Veo 3 гэж юу вэ: Бодит аудио бүхий хиймэл оюун ухаанаар бүтээсэн видеоны шинэ эрин үе
Veo 3 Энэ нь зүгээр л нэг шинэчлэл биш юм; бүтээдэг Google-ийн анхны хиймэл оюун ухаан гарч ирснийг илэрхийлж байна автоматаар үүсгэгдсэн эх дуутай видеонууд. Өнөөг хүртэл OpenAI-ийн Sora зэрэг бусад өрсөлдөгч загварууд энэ талаараа хоцрогдсон тул үүсгэх явцад синхрончлогдсон аудио нэмж чадахгүй байна. Google нь үнэхээр ялгаатай саналыг ширээн дээр тавьдаг: видеонууд орчны дуу чимээ, харилцан яриа, тэр ч байтугай дууны эффект бүхэлдээ синтетик боловч бодитой, бүгд хэрэглэгчийн өгсөн тайлбар дээр үндэслэсэн. Жишээлбэл, та "хөдөлгөөн ихтэй, хүмүүс ярьж буй хотын дүр зураг" -ыг асууж болох бөгөөд ердийн дуу чимээ, дүрүүд уруул синхрончлолоор яг үүнийг авах болно.
Энэ нь Veo 3-ийг хиймэл оюун ухаан болгон байрлуулдаг нарийн төвөгтэй зөвлөмжийг илүү сайн ойлгож, тэдгээрийг үйлдэл болгон хувиргадаг аудиовизуал. Та ямар дүрүүдийг хүсч байгаагаа, тэд юу хэлэх ёстойг, тэр ч байтугай тодорхой уур амьсгалыг бий болгохын тулд хүрээлэн буй орчин хэрхэн дуугарахыг нарийвчлан хэлж болно. Хоёр минутын урттай (Veo 4 загвараас өвлөн авсан) 2K видео үүсгэх энэхүү чадвар нь одоо хиймэл оюунаар бүтээсэн уран зохиолыг кино урлагийн стандартад ойртуулах бодит байдлын давхаргаар бататгасан.
Мөн түүнчлэн, Veo 3 нь үр дүнг шууд өөрчлөх боломжийг танд олгоно: объект нэмэх, хасах, хүрээг өөрчлөх (босоооос хэвтээ болон эсрэгээр), бүр цаашлаад будах арга техникийг ашиглан харах талбарыг өргөтгөх боломжтой. Илүү нарийн камерын удирдлагатай (эргэлт, томруулалт, хянах) хослуулан үр дүн нь хэрэглэгчийн хиймэл оюун ухаанд урьд өмнө хэзээ ч байгаагүй аудиовизуал өгүүлэмжийг хянах түвшин юм.
Хандалтыг хөнгөвчлөхийн тулд Google энэ загварыг нэгтгэсэн Gemini програм (хуучин Бард), түүнчлэн шинэ платформ дээр Урсгал (энэ талаар бид дараа нь ярих болно) болон мэргэжлийн багаж хэрэгсэлд Vertex AI.
Нарийвчилсан мэдээлэл: Уруулын синхрончлолоос эхлээд шууд засварлах хүртэл
Видео хиймэл оюун ухаанд тулгарч буй томоохон сорилтуудын нэг нь видеог олж авах явдал байв харилцан яриа нь байгалийн бөгөөд итгэл үнэмшилтэй уруул синхрончлолтой байв. Veo 3 нь уруулын хөдөлгөөнийг үүсгэсэн аудиотой төгс тааруулж, видео яриаг найдвартай, уян хатан болгох технологийг нэвтрүүлснээр урагшилдаг. Энэ нь бодит байдлын талаарх ойлголтыг сайжруулаад зогсохгүй боловсрол, аудиовизуал, зар сурталчилгааны шинэ хэрэглээг нээх боломжийг нээж өгдөг.
Мөн түүнчлэн, Google-ийн хиймэл оюун ухаан нь зөвхөн эхний үеийнх биш юм: Хэрэглэгч үзэгдлийг томруулж, чиг баримжаагаа өөрчлөх, визуал элементүүдийг өөрийн үзэмжээр тохируулах боломжийг олгодог бөгөөд бүгд бичвэр тайлбартай. Ингэснээр та ойроос авсан зургийг панорама болгон хувиргаж, босоо горимоос хэвтээ горимд шилжиж эсвэл эхнээс нь эхлүүлэх шаардлагагүйгээр шинэ объект оруулах боломжтой. Та мөн хүсээгүй элементүүдийг устгах боломжтой бөгөөд энэ нь захиалгат контентыг хурдан үйлдвэрлэхэд маш их хэрэгтэй байдаг.
Зураг 4: AI ашиглан зураг үүсгэх хувьсгал
Veo 3-тай зэрэгцэн Google танилцуулсан 4 зураг, хиймэл оюун ухаан ашиглан зураг бүтээх шинэ загвар. Энэ хувилбарын онцлох зүйл бол гайхалтай юм дэлгэрэнгүй чанарын үсрэлт болон хариу хурд. Өмнө нь хиймэл оюун ухаан нь нарийн бүтэцтэй (усны дусал, амьтны үс, нийлмэл тусгал) хуулбарлах зэрэг тал дээр дутагдалтай байсан бол 4-р зураг одоо бодит байдал болон хийсвэр найруулгын аль алинд нь мэргэжлийн гэрэл зурагтай өрсөлдөхүйц зургийг бүтээж байна.
Өөр нэг том давуу тал нь үеийн хурд: Зураг 4 хүртэл байна Өмнөхөөсөө 10 дахин хурдан, аль хэдийн дэвшилтэт зураг 3. Энэ нь илүү хурдан ажлын урсгалыг бий болгож, яаралтай график дизайн хийх эсвэл олон нийтийн мэдээллийн хэрэгсэлд зориулж бүтээл хийх гэх мэт нэн даруй шаарддаг төслүүдэд бүтээлч байдлыг хөнгөвчлөх боломжийг олгодог.
Техникийн чанарын хувьд, Зураг 4 нь 2К хүртэлх нарийвчлалтай зураг үүсгэдэг, тэдгээрийг өндөр нарийвчлалтай хэвлэх, том хэмжээний танилцуулга хийхэд тохиромжтой. Энэ нь мөн дөрвөлжин форматаас панорама хүртэл янз бүрийн харьцаагаар үзүүлэхийг дэмжиж, ил захидлуудаас эхлээд зурагт хуудас хүртэл бүх зүйлийг бүтээхэд бүрэн дүүрэн уян хатан байдлыг хангадаг.
Ялангуяа хамааралтай нарийн ширийн зүйл бол зөв бичгийн дүрэм, бичгийн найруулгад мэдэгдэхүйц сайжирсанAI нь одоо зураг дотор текстийг зөв оруулах боломжтой болж, карт, урилга, зурагт хуудас, тэр ч байтугай гаргацтай, сайн форматтай бичвэр бүхий комик зохиох боломжтой. Энэ нь суулгагдсан текст бичихэд ихэвчлэн алдаа гардаг байсан өмнөх үүсгэгч загваруудад тулгарч байсан гол бэрхшээлүүдийн нэгийг арилгадаг.
Google-ийн экосистемд нэгтгэх, ашиглах боломжтой байдал
Хоёр загвар, Би 3 ба 4-р зургийг харж байна, тэдгээр нь тусгаарлагдсан хэрэгсэл шиг ажиллахгүй, харин ч илүү Google-ийн экосистемд нэгдсэн. Хэрэглэгчид Gemini аппликейшн болон Flow-аас шууд хандах боломжтой, гэхдээ тэдгээр нь бас нэгдмэл байдлаар харагддаг Docs, Slides, Vids болон бусад Workspace хэрэгслүүд гэх мэт платформууд. Энэ нь оюутнууд, бүтээгчид болон мэргэжилтнүүдэд Google-ийн орчноос гаралгүйгээр өөрсдийн өдөр тутмын төсөлдөө визуал болон аудиовизуал контентоо шууд оруулах боломжийг олгодог.
Гэхдээ энэ эхний үе шатанд ашиглах боломж хязгаарлагдмал. Veo 3 нь Gemini-н бета хувилбарт байдаг Зөвхөн Google AI Ultra-ийн захиалгатай АНУ-ын хэрэглэгчдэд зориулагдсан бол Image 4 нь Gemini болон бусад Google хэрэгслүүдэд дэмжигдсэн бүх нутаг дэвсгэрт аль хэдийн гарсан байна. Тэд мөн Whisk болон зэрэг тусгай програмуудад гарч ирдэг Vertex AI, бизнесийн хэрэглээ болон захиалгат бүтээгдэхүүн боловсруулахад зориулагдсан.
Imagen 4-ээр үүсгэгдсэн бүх агуулга нь a SynthID хэмээх дижитал усан тэмдэг. Энэ тэмдэг нь SynthID илрүүлэгч хэрэглүүрийг ашиглан хиймэл оюун ухаанаар дүрс бүтээгдсэн эсэхийг тодорхойлоход хялбар болгож, агуулгын үнэн зөв байдал чухал байдаг орчинд ил тод байдал, итгэлцлийн давхаргыг нэмж өгдөг.
Урсгал: Veo, Imagen, Gemini-ийн шилдэгүүдийг нэгтгэсэн кино урлагийн хэрэгсэл
Шуурхай технологид суурилсан загваруудын хамт Google нь Veo 3, Image 4, Gemini-г бүрэн ашиглах зорилготой видео бүтээх, засварлах хэрэгсэл болох Flow-ийг гаргасан. Урсгал нь VideoFX-ийн өмнөх туршлага дээр тулгуурлан (Google Labs-ийн туршилт) илүү ахиулж, хэрэглэгчдэд видео клип хийх, үзэгдэл засах, камерын хөдөлгөөнийг хянах, хөрөнгийг удирдах энгийн бөгөөд хүчирхэг аргаар.
Түүний дэвшилтэт шинж чанаруудын дунд Урсгал нь камерын хөдөлгөөн, хэтийн төлөвийг хянах боломжийг танд олгоно, одоо байгаа үзэгдлүүдийг өргөтгөх, Scenebuilder системийг ашиглан шинэ зураг нэмэх, график болон дууны нөөцийг нэг интерфейсээс удирдах боломжтой. Бүх үйл явцыг хиймэл оюун ухаан удирддаг бөгөөд энэ нь засвар хийдэггүй мэргэжилтнүүдэд ч гэсэн сурах муруйг хамгийн бага болгодог.
Мөн түүнчлэн, Flow нь таныг хиймэл оюун ухаанаар бүтээгдсэн контентыг хуваалцах, нээхийг урьж буй нийгмийн бүрэлдэхүүн хэсэгтэй.. Жишээлбэл, Flow TV-ийн тусламжтайгаар хэрэглэгчид бусад бүтээгчдийн бүтээсэн видеонуудыг үзэж, урам зоригийг олж, технологи, бүтээлч байдал хоорондоо уялдаа холбоотой байдаг динамик нийгэмлэгт оролцох боломжтой.
Би Veo 3 болон Imagen 4-д хэрхэн хандах вэ? Одоогоор зөвхөн АНУ-д
Эдгээр дэвшилтэт технологид нэвтрэх боломжийг үе шаттайгаар зохион байгуулсан. Google AI Ultra Энэ бол хамгийн сүүлийн үеийн мэдээ, хамгийн дэвшилтэт загварт хамгийн түрүүнд хандахыг хүсдэг хүмүүст зориулагдсан хамгийн онцгой захиалга юм. Gemini, түүнчлэн Veo 3, Flow, Whisk, NotebookLM, Google экосистемд нэгдсэн Gemini, Chrome дахь Gemini, YouTube Premium болон 30 TB үүл хадгалах сан.
Зардал, Одоогын хувьд, Энэ нь сард 249,99 доллар юм, хэдийгээр танилцуулах хөнгөлөлтүүд байдаг. Одоогоор зөвхөн АНУ-ын хэрэглэгчид үүнд бүртгүүлж болно, гэхдээ Удахгүй олон улсын хэмжээнд өргөжүүлэхээр төлөвлөж байна.
Компаниуд болон мэргэжлийн хүмүүс Veo 3-ын давуу талыг ашиглах боломжтой Vertex AI, энэ нь тэдэнд зөвшөөрдөг Корпорацийн ажлын урсгалдаа видео болон аудио үүсгэхийг нэгтгэ, бүтээгдэхүүн хөгжүүлэх эсвэл дэвшилтэт маркетингийн кампанит ажил. Бүтээлч, сонирхогч хэрэглэгчид Imagen 4 болон Google-ийн AI экосистемийн Pro болон Basic төлөвлөгөөн дэх Flow-ийн зарим онцлогт хандах боломжтой.
Google мөн a хамтын экосистем, Загваруудын сайжруулалт нь түүний бүтээмж, бүтээлийн бүх хэрэгсэлд хурдан нэвтэрч, нэмэлт хүчин чармайлтгүйгээр хамгийн сүүлийн үеийн хөгжүүлэлтүүдэд үргэлж нэвтрэх боломжийг танд олгоно.
Veo 3 яагаад өрсөлдөөнтэй харьцуулахад үсрэлт вэ?
Veo 3 гарч ирэх хүртэл зах зээл дээрх ихэнх AI видео генераторууд (Runway, Luma AI эсвэл Pika Labs гэх мэт) зөвхөн нэмэхийг зөвшөөрдөг байсан. гадаад аудио үеийн дараа. Тэд нэг хэсэг дотор синхрончлогдсон эх дууг үүсгэж чадахгүй байсан нь бүрэн автомат үр дүнг хайж буй хүмүүст асуудал үүсгэсэн. Veo 3 нь энэ сорилтыг шийдэж, Google-ийг тэргүүлж байна Аудио-визуал хиймэл оюун ухааны төлөөх өрсөлдөөнд Sora by OpenAI гэх мэт саналуудаас ч түрүүлж, аудиог анхны үеийн видео бичлэгт нэгтгэж чадаагүй байна.
Харааны чанарын хувьд Бүтэц, гэрэлтүүлэг, хэв маягийн хуулбарлах нарийвчлал зэрэг 4-р зургийн олж авсан дэлгэрэнгүй мэдээлэл нь одоогийн дүрсний AI стандартаас давсан байна.. Зургийн дотроос сайн бичсэн текст болон нарийн төвөгтэй график элементүүдийг үүсгэх чадвар нь уран сайхны бүтээлээс эхлээд мэргэжлийн график дизайн, түүний дотор амралт зугаалга, боловсролын хэрэглээ хүртэл ашиглах боломжийг нэмэгдүүлдэг.
Хосолсон чадвар: хязгааргүй жинхэнэ бүтээлч байдал
Google-ийн арга барилын ялгарах элемент нь түүний загварууд бие биетэйгээ хэрхэн уялдаж байгаад оршдог. Veo 3 болон Imagen 4 нь Flow болон Gemini-ийн ачаар хамтран ажиллах боломжтой, та хөдөлгөөнгүй зургаас эхэлж, хөдөлгөөнт үзэгдэл болгон хувиргаж, аудио нэмж, нарийн тааруулж мэргэжлийн видео бүтээх боломжтой бүтээлч урсгалуудыг идэвхжүүлдэг. Энэхүү платформ хоорондын интеграци нь Google-ийг оюутнууд, бүтээлч мэргэжилтнүүд, зар сурталчилгааны агентлагууд эсвэл шинэ харааны газар нутгийг хялбар бөгөөд үр дүнтэй судлахыг хүсдэг бүх хүмүүст хамгийн тохиромжтой түнш болгодог.
Тус экосистемд Lyria 2 зэрэг бусад технологиуд багтсан болно дасан зохицох хөгжмийн үе Энэ нь видеонуудын шилжилт, сэтгэл хөдлөлийг ухаалаг, уялдаатай дагалддаг. Энэ нь тойргийг дуусгаж, дуу чимээтэй банкууд эсвэл гадны материалд хандах шаардлагагүйгээр студи чанартай бүтээлүүдийг үйлдвэрлэх боломжийг олгодог.
Хөгжүүлэгчид болон бизнесийн хувьд API болон агуулгын удирдлагын хэрэгслүүд нь эдгээр шийдлүүдийг эцсийн бүтээгдэхүүн, тусгайлан тохируулсан үйлчилгээ, аппликейшн болон дижитал платформд нэгтгэхэд хялбар болгож, боловсрол, харилцаа холбоо, эрүүл мэнд, зугаа цэнгэл зэрэг олон салбар дахь инновацийг идэвхжүүлдэг.
Google-ийн байдлаар байрлаж байна бүтээлч хиймэл оюун ухааны жишиг, өмнө нь шинжлэх ухааны уран зөгнөлт мэт санагдаж байсан боломжуудыг нээж өгсөн. -ийн хослол хяналт, бодит байдал, тохируулга Нэгдсэн экосистемийн хувьд энэ нь янз бүрийн салбаруудад асар их нөлөө үзүүлэх, бүтээгчид өөрсдийн санаагаа үйлдвэрлэх, хуваалцах арга замд асар их нөлөө үзүүлэх визуал, аудио, график контент үүсгэх шинэ стандартыг тогтоодог.
Би өөрийн "геек" сонирхлоо мэргэжил болгож чадсан технологи сонирхогч хүн. Би амьдралынхаа 10 гаруй жилийг хамгийн сүүлийн үеийн технологи ашиглан, бүх төрлийн программыг сониуч зандаа зориулж өнгөрүүлсэн. Одоо би компьютерийн технологи, видео тоглоомоор мэргэшсэн. Учир нь би 5-аас дээш жил технологи, видео тоглоомын талаар янз бүрийн вэб сайтуудад зориулж, танд хэрэгтэй мэдээллийг хүн бүрт ойлгомжтой хэлээр өгөхийг зорьсон нийтлэлүүдийг бүтээж байна.
Хэрэв танд асуулт байгаа бол миний мэдлэг Windows үйлдлийн систем, гар утсанд зориулсан Android-тай холбоотой бүх зүйлээс хамаарна. Мөн миний амлалт бол таны өмнө, би үргэлж хэдэн минут зарцуулж, энэ интернет ертөнцөд байгаа бүх асуултыг шийдвэрлэхэд тань туслахад бэлэн байна.




