إصدار Google Veo 3.1 متوفر الآن: الصوت الأصلي والأدوات الجديدة

الصوت الأصلي في جميع أدوات Flow: الحوار المتزامن والأجواء والتأثيرات
التزام أكبر بالنتائج السريعة وأفضل للصورة إلى الفيديو
عناصر تحكم جديدة في التحرير: المكونات، والإطارات، والتمديد، والإدراج؛ سيتم إضافة ميزة الحذف قريبًا
التوفر في Flow، تطبيق Gemini، Vertex AI وGemini API

نموذج فيديو Google Veo 3.1 AI

قامت Google بتحديث نموذج إنشاء الفيديو الخاص بها باستخدام Veo 3.1، وهو إصدار يركز على جودة الصوت والصورة، والتحكم الإبداعي، والموثوقية. تدمج الشركة تحسينات رئيسية في محرر النصوص الخاص بك وفهم التعليمات لتسريع إنشاء القطع ذات المظهر السينمائي.

La الجديد الأكثر وضوحا هو في الصوت الأصلي، حاضرة الآن في جميع مراحل سير العمل: يتم إنتاج الحوار والأجواء والمؤثرات بتناغم مع المرئيات. بالإضافة إلى ذلك، يتضمن Flow تعديلات تجعل من الأسهل ضبط المشاهد وتقليل الاختبارات والحفاظ على الاتساق بين اللقطات..

ما هو Veo 3.1 وما هي التغييرات مقارنة بـ Veo 3؟

جوجل فيو 3.1

استنادًا إلى Veo 3، النموذج الجديد يعطي الأولوية لـ الالتزام بالمطالبة والدقة في مخرجات الفيديو والصوت. جوجل يلاحظ أن الضبط يقلل من التكرارات غير الضرورية، مما يوفر المزيد من التحكم والنتائج المتسقة مع ما طلب.

يأتي التحديث بعد أشهر من الاستخدام المكثف لتطبيق Flow من قبل المبدعين، مع مئات الملايين من المقاطع تم إنشاؤها منذ إطلاقهايؤدي هذا التعلم إلى تفسير أكثر موثوقية للمشاهد المعقدة، وواقعية أكبر في القوام، واستمرارية أفضل بين اللقطات.

محتوى حصري - اضغط هنا كيفية فتح ChatGPT باستخدام اختصار لوحة المفاتيح في Windows 11: إليك كيفية تكوينه بسهولة

كما تعمل الشركة على تعزيز دعم نسب العرض إلى الارتفاع 16:9، أفقيًا ورأسيًا، للتكامل بشكل أفضل مع بيئات متعددة المنصات وتدفقات النشر الحالية.

تكامل الصوت الأصلي والتنسيقات المدعومة

مع Veo 3.1، يتم إنشاء الصوت في متزامنة وسياقية في جميع أدوات التدفق: تتوافق الأجواء والمؤثرات والأصوات مع كل لقطة دون الاعتماد على مرحلة ما بعد الإنتاج الخارجية.

ينتج النموذج مقاطع أساسية بحجم حوالي 8 ثوانٍ بدقة 1080 بكسل و24 إطارًا في الثانية، مع إمكانية التوسع دون فقدان التماسك الزمني. يدعم أيضًا التنسيق الرأسي 9:16، مصممة للتوزيع عبر الهاتف المحمول.

تمتد هذه القدرات الصوتية إلى الوظائف الصامتة سابقًا، مما يسمح لما تسمعه بالتطور جنبًا إلى جنب مع ما تراه خطوات الادخار في التجميع النهائي.

أدوات التدفق: التحكم والتحرير

أرى 3.1

يتضمن التدفق عناصر تحكم تساعد في توجيه السرد المرئي. مكونات الفيديوبإمكانهم قم بتحميل صور مرجعية متعددة لتحديد الشخصيات والأشياء والأسلوب، الحفاظ على الاتساق بين اللقطات.

محتوى حصري - اضغط هنا كيف يمكنني إعادة تسمية الأعمدة في جداول بيانات Google

الوظيفة إطارات للفيديو يولد الانتقال بين الصورة الأولية والصورة النهائية، مفيد لتحديد بداية ونهاية المشهد وتقليل وقت المحاولة والخطأ.

مع يمتدمن الممكن تمديد المقاطع لأكثر من دقيقة واحدة، ربط الأجزاء مع الاستمرارية البصرية والصوتية لبناء لقطات طويلة أو سرد أبطأ.

في قسم التحرير، أدخل يتيح لك إضافة عناصر إلى لقطة موجودة مع مراعاة الإضاءة والظلال والمنظور. الخيار اِسْتَبْعَد ومن المتوقع أن يصل قريبا: هدفه هو إزالة الأجسام غير المرغوب فيها وإعادة بناء قاع البحر بشكل طبيعي.

الأداء والحدود والجودة

يظهر Veo 3.1 تقدمًا في تماسك الشخصية بين الإطارات وفي تمثيل الفيزياء الأساسية (الجاذبية، الاصطدامات أو السوائل)، بالإضافة إلى التحسينات في تحويل الصورة إلى فيديو، مع الحفاظ بشكل أفضل على التفاصيل الدقيقة.

كما هو الحال مع الذكاء الاصطناعي التوليدي، قد يكون هناك قطع أثرية نقطية، خاصةً في المشاهد سريعة الحركة أو الانتقالات المعقدة. لقد تحسن مزامنة الشفاه، على الرغم من أنها لا تزال تتطلب التنقيح في الإنتاجات الصعبة.

تطبق Google علامات مائية مرئية و معرف التركيب (تحديد الإطار الرقمي) لإمكانية تتبع المحتوى الناتج، وهو إجراء لا يمكن إلغاء تنشيطه.

محتوى حصري - اضغط هنا كيفية حماية خصوصيتك في وضع الذكاء الاصطناعي الجديد في Copilot في Edge

التوفر وكيفية اختباره

تم نشر Veo 3.1 في تدفق, تطبيق Gemini وVertex AI وواجهة برمجة تطبيقات Gemini Developerقد يختلف التوفر حسب المنطقة ومن المرجح أن تتطلب بعض الميزات المتقدمة اشتراكًا.

بالنسبة للفرق الفنية والشركات، فإن الوصول عبر Vertex AI وAPI يجعل من السهل دمج النموذج في الأدوات الداخلية، بينما يمكن للمبدعين الأفراد إجراء التجارب من خلال التطبيق تَوأَم أو محرر التدفق.

المنافسون والاستخدامات العملية

تطبيق سورا 2

Frente a سورا 2 بواسطة OpenAIيركز Veo 3.1 على تحكم المستخدم أثناء الإنشاء (نقاط الإشارة للصورة، وتحرير المشهد، والصوت المتكامل). تتميز لعبة Sora 2 بتركيزها على الواقعيةلذا فإن الاختيار يعتمد على الهدف الإبداعي.

في التسويق والصحافة والتعليم، تسمح هذه الوظائف أفكار النماذج الأوليةإنشاء تصورات توضيحية وإنتاج مقاطع فيديو موضوعية دون الحاجة إلى التصوير التقليدي، مما يؤدي إلى تسريع تسليم المحتوى.

مع هذا التحديث، تعمل Google على ضبط الصيغة: المزيد من التحكم، والصوت المتكامل، وأدوات التحرير الأفضل حتى يتمكن المبدع من توجيه القصة مع احتكاك أقل، والحفاظ على التنسيقات والتدفقات المتوافقة مع المنصات الرئيسية.

مقال ذو صلة:

ما هو SynthID، العلامة المائية للذكاء الاصطناعي؟

ألبرتو نافارو

أنا من عشاق التكنولوجيا وقد حول اهتماماته "المهووسة" إلى مهنة. لقد أمضيت أكثر من 10 سنوات من حياتي في استخدام التكنولوجيا المتطورة والتعديل على جميع أنواع البرامج بدافع الفضول الخالص. الآن تخصصت في تكنولوجيا الكمبيوتر وألعاب الفيديو. وذلك لأنني منذ أكثر من 5 سنوات أكتب لمواقع مختلفة حول التكنولوجيا وألعاب الفيديو، وأقوم بإنشاء مقالات تسعى إلى تزويدك بالمعلومات التي تحتاجها بلغة مفهومة للجميع.

إذا كان لديك أي أسئلة، فإن معرفتي تتراوح بين كل ما يتعلق بنظام التشغيل Windows وكذلك Android للهواتف المحمولة. والتزامي تجاهك هو أنني على استعداد دائمًا لقضاء بضع دقائق ومساعدتك في حل أي أسئلة قد تكون لديكم في عالم الإنترنت هذا.