يأخذ عالم الذكاء الاصطناعي قفزة مذهلة مرة أخرى بفضل NVIDIA، الذي قدمه فوجاتو، وهو نموذج رائد يعد بإحداث ثورة في طريقة توليد الأصوات وتحويلها. تم تصميم هذه الأداة لتقدم حلول متقدمة في مجالات مثل الموسيقى وألعاب الفيديو والإعلان. بفضل الإمكانات الفريدة لتغيير وإنشاء الصوت من الصفر، تهدف Fugatto إلى أن تصبح جوهرة تكنولوجية حقيقية.
اسم Fugatto يأخذ أصله من المصطلحات الموسيقية الكلاسيكية، مما يستحضر تعقيد وبراعة الشرود، ولكنه ينطبق على البيئة الصوتية الحديثة. إذا كنت قد تخيلت من أي وقت مضى قم بإنشاء أغنية من وصف بسيط أو قم بتحويل الصوت الموجود إلى شيء جديد تمامًا، هذا الذكاء الاصطناعي قادر على تحقيق ذلك.
آلة تجمع بين الابتكار والدقة
تتميز NVIDIA Fugatto بقدرتها على توليد الصوت من النص. من لحن البيانو الحزين مع إيقاعات الجاز إلى العاصفة التي تتطور إلى فجر مع زقزقة الطيور - الاحتمالات لا حدود لها عمليًا. تتيح لك تقنية الاستدلال الخاصة بها، والتي تسمى ComposableART، القيام بذلك دمج الأوامر التي تم تعلمها مسبقًا لإنشاء أصوات فريدة ومخصصة لا تقتصر على بيانات التدريب الأصلية.
ومن ميزاته الثورية الأخرى تعديل الصوت الموجود. ماذا يعني هذا؟ تخيل تحميل ملف صوتي والقدرة على تغيير لهجته أو نغمته العاطفية، أو أخذ لحن جيتار وتحويله إلى مقطوعة تشيلو. بل كان ذلك ممكنًا في المظاهرة قم بتغيير خط البيانو بحيث يبدو وكأنه صوت بشري يغني. تتراوح التطبيقات من إنشاء تأثيرات الأفلام إلى الأدوات التعليمية المتقدمة.

إمكانات فوجاتو في الصناعة الإبداعية
يهدف Fugatto إلى إحداث ثورة في القطاعات الإبداعية مثل الموسيقى أو السينما أو ألعاب الفيديو. وقد أبرز برايان كاتانزارو، نائب رئيس أبحاث التعلم العميق التطبيقي في NVIDIA، ذلك «الذكاء الاصطناعي التوليدي يهدف إلى إحداث تغيير جذري في تصميم الموسيقى والصوت». لن يتمكن المبدعون من ذلك فحسب أتمتة المهام الروتينية، ولكن أيضًا قم بتجربة أصوات جديدة ومتكيفة تمامًا.
على سبيل المثال، يمكن لمطوري الألعاب استخدام Fugatto لإنشاء اللعبة التأثيرات الديناميكية التي تستجيب للتغيرات في الوقت الحقيقي داخل اللعبة. وبالمثل، يمكن للموسيقيين والمنتجين أن يفعلوا ذلك الأغاني النموذجية بسرعةوإضافة الترتيبات والمتغيرات دون الحاجة إلى معدات باهظة الثمن أو جلسات طويلة.
ماذا وراء التدريب والتحديات الأخلاقية؟
وفقا لNVIDIA، كان هذا النموذج تم تدريبهم على البيانات مفتوحة المصدر، باستخدام خوادم DGX مع 32 مسرع H100 ومعالجة إجمالي 2.500 مليار معلمة. ومع ذلك، ليست كل الأخبار جيدة. وقد أشارت الشركة إلى ذلك التنفيذ العام لـ Fugatto لا يزال قيد المناقشةلأن المخاوف الأخلاقية تشكل عائقًا كبيرًا.
إن الخوف من الانتهاكات المحتملة للتكنولوجيا التوليدية، مثل إنشاء محتوى مزيف، أو التلاعب بالأصوات للحصول على معلومات مضللة، أو انتهاك حقوق الطبع والنشر، دفع NVIDIA إلى اتخاذ موقف حذر. على الرغم من أن شركة Fugatto تستخدم مجموعات بيانات مفتوحة، إلا أنه ليس من الواضح ما إذا كان بإمكانها إنشاء محتوى ذلك انتهاك حقوق الملكية الفكرية أو إعادة إنتاج صوت أو موسيقى الفنانين الحاليين بشكل خطير.
نظرة على مستقبل فوجاتو
هذا النموذج ليس حالة معزولة في عالم الذكاء الاصطناعي التوليدي. كما طورت شركات مثل جوجل أو ميتا تقنيات مماثلة، على الرغم من اختلاف أساليبها. على سبيل المثال، قدمت جوجل MusicLM، وهو نظام قادر على توليد الموسيقى من النص، لكنها قررت عدم نشره بسبب مشاكل قانونية تتعلق بالسرقة الفكرية.
على الرغم من التحديات، يوضح فوجاتو أن الاتجاه في الذكاء الاصطناعي يشير نحو ذلك أدوات متعددة الوظائف. في حين كانت هناك حاجة في السابق إلى عدة نماذج لمهام محددة، أصبح الآن بإمكان نظام واحد القيام بذلك تنفيذ عمليات متعددة، من تركيب الموسيقى إلى تحويل الصوت بدرجة غير مسبوقة من التخصيص.
على الرغم من أنه لا يوجد حتى الآن تاريخ محدد لإطلاقها في السوق، إلا أن فوجاتو تبرز كمعيار لما يمكن أن تحققه تقنيات الذكاء الاصطناعي التوليدية. وسيكون للصناعات الإبداعية، من الألعاب إلى الموسيقى، حليف في هذا النموذج الذي لن يقلل من الجهود التقنية فحسب، بل سيفتح أيضا الأبواب أمام نطاق غير مسبوق من الإمكانيات الفنية.
أنا من عشاق التكنولوجيا وقد حول اهتماماته "المهووسة" إلى مهنة. لقد أمضيت أكثر من 10 سنوات من حياتي في استخدام التكنولوجيا المتطورة والتعديل على جميع أنواع البرامج بدافع الفضول الخالص. الآن تخصصت في تكنولوجيا الكمبيوتر وألعاب الفيديو. وذلك لأنني منذ أكثر من 5 سنوات أكتب لمواقع مختلفة حول التكنولوجيا وألعاب الفيديو، وأقوم بإنشاء مقالات تسعى إلى تزويدك بالمعلومات التي تحتاجها بلغة مفهومة للجميع.
إذا كان لديك أي أسئلة، فإن معرفتي تتراوح بين كل ما يتعلق بنظام التشغيل Windows وكذلك Android للهواتف المحمولة. والتزامي تجاهك هو أنني على استعداد دائمًا لقضاء بضع دقائق ومساعدتك في حل أي أسئلة قد تكون لديكم في عالم الإنترنت هذا.