- وييو 3 توهان کي سادي متن مان حقيقي آڊيو ۽ ڊائلاگ سان وڊيوز ٺاهڻ جي اجازت ڏئي ٿو.
- تصوير 4 AI ۾ بي مثال تفصيل، متن، ۽ معيار سان تصويرون حاصل ڪري ٿي، 2K تائين ۽ ڪيترن ئي فارميٽ ۾.
- ٻئي ماڊل اڳ ۾ ئي Gemini، Flow، ۽ Google Workspace ٽولز جهڙين ايپس ۾ ضم ٿيل آهن.

مصنوعي ذهانت وڏيون ترقيون ڪندي رهي ٿي. جيڪڏهن ڪا ڪمپني آهي جيڪا هن ميدان ۾ رفتار قائم ڪندي رهي ٿي، ته اها آهي، بنا ڪنهن شڪ جي، گوگل. سندس ڊگهي انتظار ۾ گوگل آءِ/او 2025 جو سالياني پروگرام، ڪمپني هڪ ڀيرو ٻيهر ٻه اڳڀرائي پيش ڪندي مواد جي تخليق ۾ انقلاب آندو آهي جيڪي اسان جي تصويرن ۽ وڊيوز جي پيداوار جي طريقي کي تبديل ڪرڻ جو واعدو ڪن ٿا: پيداواري ماڊل مون کي 3 ۽ تصوير 4 نظر اچي ٿي.. ٻئي جديد ۽ غير متوقع جدتن جو هڪ سلسلو آڻين ٿا جنهن ماهرن ۽ جنريٽو AI جي استعمال ڪندڙن ٻنهي کي ساهه بند ڪري ڇڏيو آهي.
خواهش مڪمل طور تي ماحول جي آواز ۽ ڊائلاگ سان وڊيوز جي نسل حقيقت پسند، جي ذريعي تفصيل سان تصويرون روايتي تصوير کان فرق ڪرڻ تقريبن ناممڪن آهيآفيس ٽولز ۽ تخليقي پليٽ فارمن ۾ بيحد انضمام لاءِ، اهي ماڊل بصري ۽ آڊيو تي لاڳو ڪيل مصنوعي ذهانت مان اسان جي توقع ڪرڻ ۾ اڳ ۽ پوءِ جي نشاندهي ڪن ٿا. اچو ته ڏسون ته وييو 3 ۽ امجين 4 اصل ۾ ڇا ڪري سگهن ٿا، اچو ته ان تي هلون.
وييو 3 ڇا آهي: حقيقي آڊيو سان گڏ اي آءِ پاران تيار ڪيل وڊيو جو نئون دور
مان 3 ڏسان ٿو. اهو صرف هڪ ٻي تازه ڪاري ناهي؛ گوگل جي پهرين جنريٽو اي آءِ جي آمد جي نمائندگي ڪري ٿو جيڪا پيدا ڪري ٿي خودڪار طريقي سان پيدا ٿيندڙ اصلي آواز سان وڊيوز. هاڻي تائين، ٻيا مقابلي وارا ماڊل جهڙوڪ اوپن اي آءِ جو سورا هن سلسلي ۾ پوئتي رهجي ويا آهن، جنريشن جي عمل ۾ هم وقت ساز آڊيو شامل ڪرڻ جي قابل نه رهيا آهن. گوگل هڪ واقعي مختلف تجويز پيش ڪري ٿو: وڊيوز سان ماحولي آواز، ڊائلاگ، ۽ حتي صوتي اثرات مڪمل طور تي مصنوعي پر حقيقي، سڀ استعمال ڪندڙ پاران مهيا ڪيل وضاحتن تي ٻڌل. مثال طور، توهان "ٽريفڪ ۽ ماڻهن جي ڳالهائڻ سان هڪ شهري منظر" لاءِ پڇي سگهو ٿا ۽ توهان کي بلڪل اهو ئي ملندو، عام آوازن ۽ ڪردارن جي لپ سنڪنگ سان.
هي Veo 3 کي AI طور رکي ٿو جيڪو پيچيده اشارن کي بهتر سمجهي ٿو ۽ انهن کي عمل ۾ آڻي ٿو آڊيو بصري. توهان تفصيل سان ٻڌائي سگهو ٿا ته توهان ڪهڙا ڪردار چاهيو ٿا، انهن کي ڇا چوڻ گهرجي، ۽ اهو به ته هڪ مخصوص ماحول حاصل ڪرڻ لاءِ ماحول ڪيئن آواز ڏيڻ گهرجي. ٻن منٽن تائين ڊگھيون 4K وڊيوز ٺاهڻ جي صلاحيت (Veo 2 ماڊل مان ورثي ۾ ملي آهي)، هاڻي حقيقت نگاري جي هڪ پرت سان مضبوط ڪئي وئي آهي جيڪا AI پاران ٺاهيل فڪشن کي سينيما جي معيارن جي ويجهو آڻي ٿي.
انهي سان گڏ، وييو 3 توهان کي فوري طور تي نتيجو تبديل ڪرڻ جي اجازت ڏئي ٿو.: شيون شامل ڪريو يا هٽايو، فريمنگ تبديل ڪريو (عمودي کان افقي ۽ ان جي برعڪس)، ۽ آئوٽ پينٽنگ ٽيڪنڪ استعمال ڪندي ڏسڻ جي ميدان کي به وڌايو. وڌيڪ صحيح ڪئميرا ڪنٽرولز (گردش، زوم، ٽريڪنگ) سان گڏ، نتيجو آڊيو ويزوئل داستان تي ڪنٽرول جي هڪ سطح آهي جيڪا صارف AI ۾ اڳ ڪڏهن به نه ڏٺي وئي هئي.
رسائي کي آسان بڻائڻ لاءِ، گوگل هن ماڊل کي ان ۾ ضم ڪيو آهي جيمينائي ايپ (اڳوڻي بارڊ)، انهي سان گڏ نئين پليٽ فارم تي وهڪري (جنهن بابت اسين بعد ۾ ڳالهائينداسين) ۽ پيشه ورانه اوزارن جهڙوڪ Vertex AI.
اعليٰ تفصيل: لپ سنڪرونائيزنگ کان وٺي آن دي فلائي ايڊيٽنگ تائين
جنريٽو وڊيو AI لاءِ هڪ وڏو چئلينج حاصل ڪرڻ هو ڊائلاگ ۾ قدرتي ۽ قائل ڪندڙ لب جي هم وقت سازي هئي.. وييو 3 هڪ قدم اڳتي وڌي ٿو ٽيڪنالاجي کي شامل ڪندي جيڪا لب جي حرڪت کي مڪمل طور تي پيدا ٿيل آڊيو سان ملائي ٿي، وڊيو گفتگو کي قابل اعتماد ۽ رواني بڻائي ٿي. هي نه رڳو حقيقت نگاري جي تصور کي بهتر بڻائي ٿو، پر تعليم، آڊيو ويزوئل ۽ اشتهارن ۾ نون استعمالن جا دروازا پڻ کولي ٿو.
انهي سان گڏ، گوگل جو AI صرف شروعاتي نسل تائين محدود ناهي.: استعمال ڪندڙ کي منظر کي زوم ڪرڻ، رخ تبديل ڪرڻ، ۽ بصري عنصرن کي انهن جي ترجيحن مطابق ترتيب ڏيڻ جي اجازت ڏئي ٿو، سڀ ڪجهه متن جي وضاحت سان. هن طريقي سان، توهان هڪ ويجهي تصوير کي پينورامڪ منظر ۾ تبديل ڪري سگهو ٿا، عمودي کان افقي موڊ ۾ سوئچ ڪري سگهو ٿا، يا نئين شين کي شروع کان شروع ڪرڻ کان سواءِ شامل ڪري سگهو ٿا. توهان ناپسنديده عنصرن کي به هٽائي سگهو ٿا، جيڪو ڪسٽم مواد جي تيز پيداوار ۾ انتهائي ڪارآمد آهي.
تصوير 4: AI سان تصوير جي پيداوار ۾ انقلاب
وييو 3 جي متوازي ۾، گوگل پيش ڪيو آهي 4 تصويري، مصنوعي ذهانت استعمال ڪندي تصويرون ٺاهڻ لاءِ ان جو نئون ماڊل. هن نسخي جي خاص ڳالهه متاثر ڪندڙ آهي تفصيل ۽ جواب جي رفتار ۾ معيار ۾ واڌارو. جڏهن ته AI اڳ ۾ نفيس بناوتن (پاڻيءَ جا ڦڙا، جانورن جي فر، پيچيده عڪاسي) جي پيداوار جهڙن پهلوئن ۾ گهٽ هو، تصوير 4 هاڻي اهڙيون تصويرون ٺاهي ٿي جيڪي پيشه ور فوٽوگرافي جو مقابلو حقيقي سيٽنگن ۽ تجريدي ڪمپوزيشن ٻنهي ۾ ڪن ٿيون.
ٻيو وڏو فائدو اهو آهي ته پيداوار جي رفتار: تصوير 4 تائين آهي پنهنجي اڳوڻي کان 10 ڀيرا تيز، اڳ ۾ ئي ترقي يافته تصوير 3. هي تمام گهڻو چست ڪم جي وهڪري جي اجازت ڏئي ٿو، تخليقيت کي آسان بڻائي ٿو جيتوڻيڪ انهن منصوبن ۾ جيڪي فوري طور تي گهربل آهن، جهڙوڪ فوري گرافڪ ڊيزائن يا سوشل ميڊيا لاءِ ٽڪرن جي پيداوار.
ٽيڪنيڪل معيار جي حوالي سان، تصوير 4 2K تائين ريزوليوشن ۾ تصويرون ٺاهي ٿي.، انهن کي هاءِ ڊيفينيشن پرنٽنگ ۽ وڏي پيماني تي پيشڪش لاءِ موزون بڻائي ٿو. اهو مختلف اسپيڪٽ ريشوز ۾ رينڊرنگ کي پڻ سپورٽ ڪري ٿو، چورس کان پينورامڪ فارميٽ تائين، پوسٽ ڪارڊ کان پوسٽرن تائين هر شيءِ ٺاهڻ لاءِ مڪمل ورسٽائلٽي فراهم ڪري ٿو.
هڪ خاص طور تي لاڳاپيل تفصيل اها آهي ته اسپيلنگ ۽ ٽائيپوگرافي ۾ اهم بهتريAI هاڻي تصويرن ۾ متن کي صحيح طرح سان شامل ڪري سگهي ٿو، توهان کي ڪارڊ، دعوت ناما، پوسٽر، ۽ حتي ڪامڪس کي پڙهڻ واري، سٺي فارميٽ ٿيل متن سان ڊزائين ڪرڻ جي اجازت ڏئي ٿو. هي هڪ اهم چئلينج کي ختم ڪري ٿو جيڪو اڳئين جنريٽو ماڊل اڃا تائين پيش ڪندا هئا، جيڪي اڪثر ڪري ايمبيڊڊ ٽيڪسٽ لکڻ وقت غلطيون هونديون هيون.
گوگل ايڪو سسٽم ۽ دستيابي ۾ انضمام
ٻہ ماڊل، مون کي 3 ۽ تصوير 4 نظر اچي ٿي.، اهي الڳ ٿيل اوزارن جي طور تي ڪم نه ڪندا آهن، پر ان جي بدران گوگل ايڪو سسٽم ۾ ضم ٿيل آهن. استعمال ڪندڙ انهن تائين سڌو سنئون Gemini ايپ ۽ Flow مان رسائي حاصل ڪري سگهن ٿا، پر اهي پڻ ان ۾ ضم ٿيل نظر اچن ٿا پليٽ فارم جهڙوڪ دستاويز، سلائڊ، وڊيوز ۽ ٻيا ورڪ اسپيس اوزار. هي شاگردن، تخليقڪارن، ۽ پيشه ور ماڻهن کي گوگل جي ماحول کي ڇڏڻ کان سواءِ پنهنجي بصري ۽ آڊيو ويزوئل مواد کي سڌو سنئون پنهنجي روزمره جي منصوبن ۾ آڻڻ جي اجازت ڏئي ٿو.
جڏهن ته، هن پهرين مرحلي ۾ دستيابي محدود آهي. وييو 3 جيمينائي اندر بيٽا ۾ موجود آهي. صرف آمريڪي استعمال ڪندڙن لاءِ جن وٽ گوگل اي آءِ الٽرا سبسڪرپشن آهي، جڏهن ته تصوير 4 اڳ ۾ ئي سڀني سپورٽ ٿيل علائقن لاءِ جيمني ۽ ٻين گوگل ٽولز تي رول آئوٽ ڪيو ويو آهي. اهي خاص ايپليڪيشنن جهڙوڪ وِسڪ ۽ ۾ پڻ ظاهر ٿين ٿا Vertex AI، ڪاروباري استعمال ۽ ڪسٽمائيز شين جي ترقي لاءِ ٺهيل.
Imagen 4 سان ٺاهيل سڀ مواد هڪ رکي ٿو ڊجيٽل واٽر مارڪ جنهن کي SynthID سڏيو ويندو آهي. هي نشان اهو سڃاڻڻ آسان بڻائي ٿو ته ڇا تصوير SynthID Detector ٽول استعمال ڪندي AI سان ٺاهي وئي هئي، شفافيت ۽ اعتماد جي هڪ پرت کي ماحول ۾ شامل ڪري ٿو جتي مواد جي صداقت اهم آهي.
فلو: سئنيما جو اوزار جيڪو ويو، امجين ۽ جيمني جي بهترين کي متحد ڪري ٿو
پرامپٽ تي ٻڌل جنريشن ماڊلز سان گڏ، گوگل فلو لانچ ڪيو آهي، هڪ وڊيو ٺاهڻ ۽ ايڊيٽنگ جو اوزار جيڪو وييو 3، اميج 4، ۽ جيميني مان وڌ کان وڌ فائدو حاصل ڪرڻ لاءِ ٺاهيو ويو آهي. فلو وڊيو ايف ايڪس (هڪ گوگل ليبز تجربو) جي پوئين تجربي تي تعمير ڪري ٿو ۽ ان کي گهڻو اڳتي وٺي ٿو، صارفين کي اجازت ڏئي ٿو ته وڊيو ڪلپس ٺاهڻ، منظرن کي ايڊٽ ڪرڻ، ڪئميرا جي حرڪتن کي ڪنٽرول ڪرڻ ۽ اثاثن جو انتظام ڪرڻ هڪ سادي ۽ طاقتور انداز ۾.
ان جي ترقي يافته خاصيتن ۾، فلو توهان کي ڪئميرا جي حرڪت ۽ نقطه نظر کي ڪنٽرول ڪرڻ جي اجازت ڏئي ٿو.، موجوده منظرن کي وڌايو، سين بلڊر سسٽم استعمال ڪندي نوان شاٽ شامل ڪريو، ۽ هڪ ئي انٽرفيس مان گرافڪ ۽ آواز جي وسيلن کي منظم ڪريو. سڄو عمل AI جي رهنمائي هيٺ آهي، جيڪو غير ايڊيٽنگ ماهرن لاءِ به سکيا جو عمل گهٽ ۾ گهٽ بڻائي ٿو.
انهي سان گڏ، فلو ۾ هڪ سماجي جزو آهي جيڪو توهان کي AI سان ٺاهيل مواد شيئر ڪرڻ ۽ دريافت ڪرڻ جي دعوت ڏئي ٿو.. مثال طور، فلو ٽي وي سان، استعمال ڪندڙ ٻين تخليقڪارن پاران ٺاهيل وڊيوز کي ڳولي سگهن ٿا، الهام ڳولي سگهن ٿا، ۽ هڪ متحرڪ برادري ۾ حصو وٺي سگهن ٿا جتي ٽيڪنالاجي ۽ تخليقيت هڪٻئي سان ڳنڍيل آهن.
مان Veo 3 ۽ Imagen 4 تائين ڪيئن رسائي حاصل ڪري سگهان ٿو؟ هاڻي لاءِ، صرف آمريڪا ۾
انهن جديد ٽيڪنالاجي تائين رسائي کي مرحليوار منصوبن ۾ منظم ڪيو ويو آهي. گوگل اي آءِ الٽرا اهو سڀ کان وڌيڪ خاص سبسڪرپشن آهي، جيڪو انهن لاءِ آهي جيڪي تازين خبرن ۽ جديد ترين ماڊل تائين رسائي حاصل ڪرڻ لاءِ پهريون ٿيڻ چاهين ٿا. Gemini، انهي سان گڏ وييو 3، فلو، وِسڪ، نوٽ بڪ ايل ايم، گوگل ايڪو سسٽم ۾ ضم ٿيل جيميني، ڪروم ۾ جيميني، يوٽيوب پريميئم ۽ 30 ٽي بي ڪلائوڊ اسٽوريج.
قيمتھاڻي لاءِ ، اهو هر مهيني 249,99 ڊالر آهي.، جيتوڻيڪ تعارفي رعايتون آهن. هن وقت صرف آمريڪا ۾ استعمال ڪندڙ ان لاءِ سائن اپ ڪري سگهن ٿا، پر بين الاقوامي توسيع جلد ئي منصوبابندي ڪئي ويندي..
ڪمپنيون ۽ پيشيور وييو 3 جو فائدو وٺي سگهن ٿا Vertex AI، جيڪو انهن کي اجازت ڏئي ٿو پنهنجي ڪارپوريٽ ورڪ فلو ۾ وڊيو ۽ آڊيو جنريشن کي ضم ڪريو، پراڊڪٽ ڊولپمينٽ يا جديد مارڪيٽنگ مهمون. تخليقي ۽ پرجوش استعمال ڪندڙ گوگل جي AI ايڪو سسٽم جي پرو ۽ بيسڪ پلانن ۾ Imagen 4 ۽ فلو جي ڪجهه خاصيتن تائين رسائي حاصل ڪري سگهن ٿا.
گوگل پڻ هڪ ڊزائين ڪيو آهي تعاون وارو ماحولياتي نظام، جتي ماڊل ۾ بهتري تيزي سان ان جي سڀني پيداواري ۽ تخليق جي اوزارن تائين وڌندي آهي، انهي کي يقيني بڻائيندي ته توهان کي هميشه اضافي ڪوشش کان سواءِ جديد ترقيات تائين رسائي حاصل هجي.
مقابلي جي مقابلي ۾ وييو 3 ڇو هڪ اڳتي آهي؟
وييو 3 جي اچڻ تائين، مارڪيٽ ۾ گھڻا اي آءِ وڊيو جنريٽر (جهڙوڪ رن وي، لوما اي آءِ يا پڪا ليبز) صرف شامل ڪرڻ جي اجازت ڏيندا هئا ٻاهرين آڊيو نسل کان پوءِ. اهي ساڳئي ٽڪري اندر هم وقت ساز مقامي آواز نه ٺاهي سگهيا، جيڪو مڪمل طور تي خودڪار نتيجا ڳولڻ وارن لاءِ مسئلو پيدا ڪيو. وييو 3 انهي چئلينج کي حل ڪري ٿو ۽ گوگل کي اڳواڻي ۾ رکي ٿو آڊيو ويزوئل اي آءِ جي ڊوڙ ۾، اوپن اي آءِ پاران سورا جهڙين تجويزن کان به اڳتي، جيڪو اڃا تائين وڊيوز جي شروعاتي نسل ۾ آڊيو کي ضم ڪرڻ ۾ ڪامياب نه ٿيو آهي.
بصري معيار جي حوالي سان، تصوير 4 پاران بناوت، روشني، ۽ انداز جي پيداوار جي درستگي ۾ حاصل ڪيل تفصيل موجوده تصوير جي AI معيارن کان وڌيڪ آهن.. تصويرن اندر چڱي طرح لکيل متن ۽ پيچيده گرافڪ عنصر پيدا ڪرڻ جي صلاحيت فنڪارانه تخليق کان وٺي پيشيور گرافڪ ڊيزائن تائين، تفريحي ۽ تعليمي ايپليڪيشنن سميت استعمال جي امڪانن کي وڌائي ٿي.
گڏيل صلاحيتون: حقيقي تخليقيت بغير ڪنهن حد جي
گوگل جي طريقي جو فرق ڪندڙ عنصر اهو آهي ته ان جا ماڊل هڪ ٻئي سان ڪيئن ملن ٿا. فلو ۽ جيميني جي مهرباني، وييو 3 ۽ امجين 4 گڏجي ڪم ڪري سگهن ٿا.، تخليقي وهڪري کي فعال ڪندي جتي توهان هڪ اسٽل تصوير سان شروع ڪري سگهو ٿا، ان کي هڪ اينيميٽڊ منظر ۾ تبديل ڪري سگهو ٿا، آڊيو شامل ڪري سگهو ٿا، ۽ هڪ پيشه ور وڊيو ٺاهڻ لاءِ ان کي فائن ٽيون ڪري سگهو ٿا. هي ڪراس پليٽ فارم انٽيگريشن گوگل کي شاگردن، تخليقي پيشه ور ماڻهن، اشتهاري ايجنسين، يا صرف هر ڪنهن لاءِ مثالي پارٽنر بڻائي ٿو جيڪو آساني سان ۽ اثرائتي طريقي سان نوان بصري علائقا ڳولڻ چاهي ٿو.
ماحولياتي نظام ۾ ٻيون ٽيڪنالاجيون پڻ شامل آهن جهڙوڪ ليريا 2، جيڪي موافق موسيقي جي نسل جيڪو وڊيوز جي منتقلي ۽ جذبات سان گڏ هڪ ذهين ۽ مربوط انداز ۾ گڏ هوندو آهي. هي دائرو مڪمل ڪري ٿو ۽ اسٽوڊيو معيار جي ٽڪڙن جي پيداوار جي اجازت ڏئي ٿو بغير آواز جي بينڪن يا ٻاهرين مواد جي ضرورت جي.
ڊولپرز ۽ ڪاروبار لاءِ، API ۽ مواد جي انتظام جا اوزار انهن حلن کي آخري شين، ترتيب ڏنل خدمتن، ايپس، ۽ ڊجيٽل پليٽ فارمن ۾ ضم ڪرڻ آسان بڻائين ٿا، تعليم، مواصلات، صحت جي سار سنڀال، ۽ تفريح جهڙن مختلف شعبن ۾ جدت کي وڌائين ٿا.
گوگل جي طور تي رکيل آهي تخليقي مصنوعي ذهانت ۾ معيار، امڪانن کي کوليندي جيڪي اڳ ۾ سائنس فڪشن وانگر لڳندا هئا. جو ميلاپ ڪنٽرول، حقيقت نگاري ۽ حسب ضرورت هڪ متحد ماحولياتي نظام ۾، اهو بصري، آڊيو، ۽ گرافڪ مواد پيدا ڪرڻ لاءِ هڪ نئون معيار مقرر ڪري ٿو، جنهن ۾ مختلف شعبن تي تمام گهڻو امڪاني اثر پوي ٿو ۽ تخليقڪار پنهنجا خيال ڪيئن پيدا ڪن ٿا ۽ شيئر ڪن ٿا.
مان هڪ ٽيڪنالاجي جو شوقين آهيان جنهن پنهنجي ”جيڪ“ مفادن کي پيشو بڻائي ڇڏيو آهي. مون پنهنجي زندگيءَ جا 10 سال کان وڌيڪ وقت جديد ٽيڪنالاجي استعمال ڪندي گذاريا آهن ۽ هر قسم جي پروگرامن کي خالص تجسس کان ٻاهر ڪڍيو آهي. هاڻي مون ڪمپيوٽر ٽيڪنالاجي ۽ وڊيو گيمز ۾ ماهر ڪيو آهي. اهو ئي سبب آهي ته 5 سالن کان وڌيڪ عرصي کان آئون ٽيڪنالاجي ۽ وڊيو گيمز تي مختلف ويب سائيٽن لاءِ لکي رهيو آهيان، آرٽيڪل ٺاهي رهيو آهيان جيڪي توهان کي گهربل معلومات ڏيارڻ جي ڪوشش ڪندا اهڙي ٻولي ۾ جيڪا هرڪو سمجهي سگهي.
جيڪڏهن توهان وٽ ڪو سوال آهي، منهنجي ڄاڻ هر شيءِ کان وٺي ونڊوز آپريٽنگ سسٽم سان گڏو گڏ موبائل فون لاءِ Android سان لاڳاپيل آهي. ۽ منهنجو عزم توهان سان آهي، مان هميشه ڪجهه منٽ خرچ ڪرڻ لاءِ تيار آهيان ۽ توهان جي هن انٽرنيٽ جي دنيا ۾ جيڪي به سوال آهن انهن کي حل ڪرڻ ۾ توهان جي مدد ڪرڻ لاءِ تيار آهيان.




