NVIDIA Fugatto: ध्वनिको भविष्यलाई रूपान्तरण गर्नको लागि अभिनव एआई

पछिल्लो अपडेट: २०२४/०२/०१

nvidia fugatto-1

कृत्रिम बुद्धिमत्ताको संसारले फेरि एक प्रभावशाली छलांग लिन्छ NVIDIA लाई धन्यवाद, जुन फुगाटोले प्रस्तुत गरेको छ, एउटा अवान्त-गार्डे मोडेल जसले आवाजहरू उत्पन्न गर्ने र रूपान्तरण गर्ने तरिकामा क्रान्तिकारी परिवर्तन गर्ने वाचा गर्दछ। यो उपकरण प्रस्ताव गर्न डिजाइन गरिएको छ संगीत, भिडियो गेम र विज्ञापन जस्ता क्षेत्रहरूमा उन्नत समाधानहरू। स्क्र्याचबाट अडियो परिवर्तन गर्न र सिर्जना गर्न अद्वितीय क्षमताहरूसँग, Fugatto एक साँचो प्राविधिक रत्न बन्ने लक्ष्य राख्छ।

फुगाटो नामको उत्पत्ति शास्त्रीय संगीतका शब्दहरूबाट भएको हो, एक fugue को जटिलता र चतुरता जगाउन, तर आधुनिक ध्वनि वातावरण मा लागू। यदि तपाईंले कहिल्यै कल्पना गर्नुभएको छ साधारण विवरणबाट एउटा गीत सिर्जना गर्नुहोस् वा अवस्थित ध्वनिलाई पूर्ण रूपमा नयाँमा रूपान्तरण गर्नुहोस्, यो AI यो गर्न सक्षम छ।

एक मेसिन जसले नवीनता र सटीक संयोजन गर्दछ

NVIDIA Fugatto पाठबाट अडियो उत्पन्न गर्ने क्षमताको लागि बाहिर खडा छ। ज्याज लयको साथ एक उदास पियानो धुन देखि एक तूफान सम्म जुन चराहरु को चीरपिंग संग एक बिहान को रूप मा विकसित हुन्छ - सम्भावनाहरु व्यावहारिक रूपमा असीमित छन्। यसको अनुमान प्रविधि, कम्पोजेबलएआरटी भनिन्छ, तपाईंलाई अनुमति दिन्छ पहिले सिकेका आदेशहरू मर्ज गर्नुहोस् मौलिक प्रशिक्षण डेटामा प्रतिबन्धित नभएको अद्वितीय, अनुकूलन ध्वनिहरू सिर्जना गर्न।

विशेष सामग्री - यहाँ क्लिक गर्नुहोस्  कृत्रिम बुद्धिमत्ताको क्षेत्रमा आवाज पहिचान कसरी प्रयोग गरिन्छ?

यसको अर्को क्रान्तिकारी विशेषताहरू अवस्थित अडियोको परिमार्जन हो। यसको मतलब के हो? भ्वाइस फाइल लोड गर्दै र यसको उच्चारण वा भावनात्मक टोन परिवर्तन गर्न सक्षम भएको कल्पना गर्नुहोस्, वा गिटारको धुन लिनुहोस् र यसलाई सेलो टुक्रामा रूपान्तरण गर्नुहोस्। एक प्रदर्शन मा, यो पनि सम्भव थियो पियानो लाइन परिवर्तन गर्नुहोस् ताकि यो मानव आवाज गायन जस्तै सुनियो। अनुप्रयोगहरू चलचित्र प्रभावहरू सिर्जना गर्नेदेखि लिएर उन्नत शैक्षिक उपकरणहरू सम्मका हुन्छन्।

उत्पादन मा Fugatto प्रयोग गर्दै

रचनात्मक उद्योगमा फुगाटोको सम्भावना

Fugatto को उद्देश्य संगीत, सिनेमा वा भिडियो गेम जस्ता रचनात्मक क्षेत्रहरूमा क्रान्ति ल्याउने हो। ब्रायन क्याटान्जारो, NVIDIA मा लागू गहिरो शिक्षा अनुसन्धानका उपाध्यक्ष, हाइलाइट गरे कि "उत्पादक एआईले संगीत र ध्वनि डिजाइनलाई आमूल परिवर्तन गर्ने लक्ष्य राखेको छ"। सृष्टिकर्ताले मात्र सक्दैनन् नियमित कार्यहरू स्वचालित गर्नुहोस्, तर पूर्ण रूपमा नयाँ र अनुकूली ध्वनिहरूको साथ पनि प्रयोग गर्नुहोस्।

उदाहरणका लागि, खेल विकासकर्ताहरूले उत्पन्न गर्न Fugatto प्रयोग गर्न सक्छन् गतिशील प्रभावहरू जसले वास्तविक समयमा परिवर्तनहरूलाई प्रतिक्रिया दिन्छ खेल भित्र। त्यसैगरी संगीतकार र निर्माताले पनि गर्न सक्छन् प्रोटोटाइप गीतहरू छिटो, महँगो उपकरण वा लामो सत्रहरूको आवश्यकता बिना व्यवस्था र भिन्नताहरू थप्दै।

विशेष सामग्री - यहाँ क्लिक गर्नुहोस्  Copilot कसरी प्रयोग गर्ने सिक्नुहोस्: थप उत्पादन गर्नुहोस्, समय बचत गर्नुहोस्

प्रशिक्षण र नैतिक चुनौतीहरूको पछाडि के छ?

NVIDIA को अनुसार, यो मोडेल भएको छ 32 H100 एक्सेलेटरहरूसँग DGX सर्भरहरू प्रयोग गरेर खुला स्रोत डेटामा प्रशिक्षित र कुल 2.500 बिलियन प्यारामिटरहरू प्रशोधन गर्दै। यद्यपि, यो सबै राम्रो समाचार होइन। कम्पनीले यस्तो संकेत गरेको छ फुगाटोको सार्वजनिक कार्यान्वयन अझै बहसमा छ, नैतिक सरोकारहरु एक महत्वपूर्ण बाधा हो।

जेनेरेटिभ टेक्नोलोजीको सम्भावित दुरुपयोगको डर, जस्तै नक्कली सामग्री सिर्जना गर्ने, गलत जानकारीको लागि आवाजहरू हेरफेर गर्ने, वा प्रतिलिपि अधिकार उल्लङ्घनले NVIDIA लाई सावधानी अपनाउन प्रेरित गरेको छ। यद्यपि फुगाटोले खुला डाटासेटहरू प्रयोग गर्दछ, यो स्पष्ट छैन कि यसले सामग्री उत्पन्न गर्न सक्छ बौद्धिक सम्पत्ति अधिकारको उल्लङ्घन गर्ने वा अवस्थित कलाकारहरूको आवाज वा संगीतलाई खतरनाक रूपमा पुन: उत्पादन गर्ने.

Fugatto को भविष्य मा एक नजर

यो मोडेल जेनेरेटिभ AI को संसारमा एक अलग मामला होइन। गुगल वा मेटा जस्ता कम्पनीहरूले पनि समान प्रविधिहरू विकास गरेका छन्, यद्यपि फरक दृष्टिकोणका साथ। उदाहरणका लागि, Google ले MusicLM पेश गर्‍यो, पाठबाट संगीत उत्पादन गर्न सक्षम प्रणाली, तर साहित्यिक चोरीसँग सम्बन्धित कानुनी समस्याहरूको कारणले यसलाई सार्वजनिक नगर्ने निर्णय गरियो।

विशेष सामग्री - यहाँ क्लिक गर्नुहोस्  कृत्रिम बुद्धिमत्ता भनेको के हो?

चुनौतीहरूको बावजुद, फुगाटोले कृत्रिम बुद्धिमत्ताको प्रवृति तर्फ इंगित गरेको देखाउँछ। बहुकार्यात्मक उपकरण। जबकि धेरै मोडेलहरू पहिले विशिष्ट कार्यहरूको लागि आवश्यक थियो, अब एकल प्रणालीले गर्न सक्छ धेरै अपरेशनहरू गर्नुहोस्, संगीत संश्लेषण देखि अनुकूलन को एक अभूतपूर्व डिग्री संग अडियो रूपान्तरण सम्म।

यद्यपि यसको बजार प्रक्षेपणको लागि अझै कुनै निश्चित मिति छैन, फुगाटो जेनेरेटिभ एआई टेक्नोलोजीहरूले हासिल गर्न सक्ने बेन्चमार्कको रूपमा उभरिरहेको छ। रचनात्मक उद्योगहरू, खेलदेखि संगीतसम्म, यस मोडेलमा सहयोगी हुनेछ जसले प्राविधिक प्रयासहरूलाई मात्र कम गर्दैन, तर कलात्मक सम्भावनाहरूको अभूतपूर्व चौडाइको ढोका पनि खोल्नेछ।