Google გამოუშვებს Veo 2: ახალ AI-ს ჰიპერ-რეალისტური ვიდეოების გენერირებისთვის, რომელიც რევოლუციას ახდენს ბაზარზე

ბოლო განახლება: 17/12/2024

მე ვხედავ 2 ia-0

Google-მა კიდევ ერთხელ აჩვენა თავისი ლიდერობა ხელოვნურ ინტელექტში (AI) თავისი უახლესი ტექნოლოგიური ძვირფასი ქვის, Veo 2-ის წარდგენით. ეს არის რევოლუციური ხელსაწყო, რომელიც გვპირდება გარდაქმნის ვიდეოების შექმნის გზას, აღნიშნავს წინ და შემდეგ გენერაციულ AI ბაზარზე. ამ ტექნოლოგიას აქვს მნიშვნელოვანი გაუმჯობესებები მის წინამორბედთან შედარებით, რაც კიდევ ერთხელ ადასტურებს Google-ის განზრახვას, კონსოლიდირებული იყოს ლიდერად მის მთავარ კონკურენტთან, OpenAI-სთან შედარებით, რომლის Sora მოდელი, როგორც ჩანს, უკან დარჩა.

Veo 2-ის გაშვება არ არის იზოლირებული მოძრაობა. ეს არის მულტინაციონალური მცდელობის ნაწილი გენერაციული ხელოვნური ინტელექტის წინსვლისთვის, რომელიც წარმოადგენს არა მხოლოდ უფრო მძლავრ ინსტრუმენტს, არამედ უფრო საიმედოსაც. გარდა ამისა, ეს ინსტრუმენტი გვპირდება მაღალი დონის დაყენებას ხარისხისა და გამოყენების თვალსაზრისით, ტექნიკური ინოვაციებით, რომლებიც აგვარებენ ტრადიციულ პრობლემებს, როგორიცაა ხელოვნური ინტელექტის ჰალუცინაციები და რეალიზმის ნაკლებობა გენერირებულ ვიდეოებში.

მე ვხედავ 2 AI Google-ს

მე ვხედავ 2: 4K ვიდეოებს ხელოვნური ინტელექტით

Veo 2 გამოირჩევა ორი წუთიანი ვიდეოების გენერირების უნარით 4K გარჩევადობით. ეს გაუმჯობესება სამჯერ აძლიერებს იმ ხარისხს, რომელსაც მისი მთავარი კონკურენტი, Sora, ამჟამად სთავაზობს, რაც მომხმარებლებს საშუალებას აძლევს შექმნან ვიზუალური ნაწილები დეტალებისა და რეალიზმის უპრეცედენტო დონით. გარდა ამისა, ხელსაწყოს ესმის კინემატოგრაფიული ენა, რაც იმას ნიშნავს, რომ შეიძლება შეიცავდეს სპეციფიკურ მოთხოვნებს კადრების, კუთხეების, ვიზუალური ეფექტებისა და ფილტრების შესახებ.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  როგორ დავაკოპიროთ რიგები Google Sheets-ში

მაგალითად, Veo 2-ით შესაძლებელია შეუკვეთოთ დეტალური კინემატოგრაფიული კადრები, როგორიცაა ძაღლი ხტება აუზში, სადაც კამერა აკვირდება მოძრაობას წყლის ქვეშ, ანათებს სველი ბეწვის ყველა დეტალს და ჩაძირვის დინამიურ ბუშტებს. რეალური სამყაროს ფიზიკის გაგებისა და ვირტუალური კამერების უფრო დახვეწილი კონტროლის წყალობით, შედეგები ძალიან რეალისტურია და შესანიშნავია კრეატიული ან კომერციული აპლიკაციებისთვის.

ძირითადი ტექნიკური მახასიათებლები და მიღწევები

გარდა გარჩევადობისა და ხანგრძლივობის შთამბეჭდავი დიაპაზონისა, Veo 2 წარადგენს ტექნიკურ მიღწევებს, რომლებიც განასხვავებს მას სხვა გენერაციული ვიდეო მოდელებისგან. მისი ერთ-ერთი ყველაზე მნიშვნელოვანი სიახლეა ხელოვნური ინტელექტის ჰალუცინაციების შემცირება, ტიპიური შეცდომები, როდესაც მოდელი წარმოქმნის არათანმიმდევრულ ან არარეალურ ელემენტებს. ახლა, Google ინსტრუმენტი გარანტიას იძლევა შედეგების უფრო მეტ თანმიმდევრულობასა და სიზუსტეს, რაც ვიდეოებში ობიექტებს, ტექსტურებსა და ურთიერთქმედებებს გაცილებით ბუნებრივს ხდის.

კიდევ ერთი მნიშვნელოვანი მომენტია უხილავი SynthID ჭვირნიშნის ჩართვა Veo 2-ით შექმნილ ყველა ვიდეოზე. ეს ინოვაციური სისტემა უზრუნველყოფს კლიპების იდენტიფიცირებას, როგორც ხელოვნური ინტელექტის მიერ გენერირებული, რაც ეხმარება დეზინფორმაციასთან ბრძოლაში და უზრუნველყოფს ატრიბუციას. transparente.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  Microsoft Phi-4 Multimodal: AI, რომელიც ესმის ხმა, სურათები და ტექსტი

კინემატოგრაფიული კონტროლი Veo 2-ში

ამჟამინდელი შეზღუდვები და შეზღუდული ხელმისაწვდომობა

ამ დროისთვის, Veo 2 არ არის ხელმისაწვდომი ყველა მომხმარებლისთვის. Google-მა ჩართო წვდომა VideoFX-ის მეშვეობით, Google Labs-ის ექსპერიმენტული ხელსაწყოდან, თუმცა მხოლოდ მომხმარებელთა შერჩეული ჯგუფისთვის. ეს საშუალებას აძლევს კომპანიას შეაგროვოს მონაცემები მისი მუშაობის შესახებ, განსაზღვროს გაუმჯობესების სფეროები და შეიტანოს კორექტირება 2025 წელს დაგეგმილი გლობალური გაშვების წინ.

მიუხედავად ამისა, პირველი ტესტები იყო დიდი წარმატება, მომხმარებლები ხაზს უსვამენ მნიშვნელოვან გაუმჯობესებებს მის წინა ვერსიასთან და კონკურენტ ინსტრუმენტებთან შედარებით. მიუხედავად ამ პროგრესისა, DeepMind-ის დეველოპერებმა გააცნობიერეს, რომ ჯერ კიდევ არსებობს გამოწვევები, რომლებიც უნდა გადალახონ, როგორიცაა თანმიმდევრულობა უფრო რთულ ვიდეოებში ან მუდმივად მოძრავი სცენების გახანგრძლივებული გენერაცია.

მე ვხედავ 2 ექსპერიმენტულ გამოყენებაში

შედარება სორასთან OpenAI-დან

Veo 2-ის მოსვლა არა მხოლოდ წარმოადგენს პროგრესს Google-ის მომხმარებლებისთვის, არამედ OpenAI-ს არასასიამოვნო მდგომარეობაში აყენებს. მისი Sora მოდელი, თუმცა ინოვაციურია, მაგრამ ჩამორჩება გარჩევადობის, ხანგრძლივობისა და საერთო ვიდეოს ხარისხის მიხედვით. მაშინ როცა სორა ძლივს აღწევს Full HD რეზოლუციებს და ქმნის დაახლოებით 20 წამის კლიპებს, Veo 2 გთავაზობთ 4K ვიდეოებს ორ წუთამდე, მეტი კონტროლით კინემატოგრაფიულ ეფექტებზე და ფიზიკურ რეალიზმს.

ექსკლუზიური შინაარსი - დააწკაპუნეთ აქ  Google-მა და Samsung-მა წარმოადგინეს Android XR: გაფართოებული რეალობის მომავალი

ეს არა მხოლოდ ხაზს უსვამს Google-ის ტექნიკურ ოსტატობას, არამედ მის სტრატეგიულ მიდგომასაც. მიუხედავად იმისა, რომ OpenAI-მა Sora გაავრცელა ფართო საზოგადოებისთვის, Google-მა მიიღო უფრო ფრთხილი მიდგომა, Veo 2-ზე წვდომის შეზღუდვა იმის უზრუნველსაყოფად, რომ ინსტრუმენტი მიაღწევს ხარისხისა და უსაფრთხოების ოპტიმალურ დონეებს.

I See 2 წარმოადგენს Google-ის ერთ-ერთ ყველაზე დიდ ფსონს გენერაციულ ხელოვნურ ინტელექტზე. ასეთი ხელსაწყოებით, კომპანია არა მხოლოდ ლიდერობს სექტორში, არამედ ადგენს ახალ სტანდარტებს ჰიპერრეალისტური აუდიოვიზუალური კონტენტის შექმნაში. შექმნილია შემქმნელებისა და ბიზნესის მოთხოვნების დასაკმაყოფილებლად, Veo 2 მიზნად ისახავს რევოლუციას მოახდინოს მთელ ინდუსტრიებში, იდეების ვიზუალურ შედევრებად გარდაქმნის უნარით.