NVIDIA Fugatto: ஒலியின் எதிர்காலத்தை மாற்றும் புதுமையான AI

கடைசியாக புதுப்பிக்கப்பட்டது: 25/11/2024
ஆசிரியர்: ஆல்பர்டோ நவரோ

என்விடியா ஃபுகாட்டோ-1

செயற்கை நுண்ணறிவு உலகம் மீண்டும் என்விடியாவிற்கு நன்றி செலுத்தும் வகையில் ஒரு அற்புதமான பாய்ச்சலை எடுத்துள்ளது, இது ஃபுகாட்டோ வழங்கியது, ஒலிகள் உருவாக்கப்படும் மற்றும் மாற்றப்படும் விதத்தில் புரட்சியை ஏற்படுத்துவதாக உறுதியளிக்கும் ஒரு அவாண்ட்-கார்ட் மாதிரி. இந்த கருவி வழங்குவதற்காக வடிவமைக்கப்பட்டுள்ளது இசை, வீடியோ கேம்கள் மற்றும் விளம்பரம் போன்ற துறைகளில் மேம்பட்ட தீர்வுகள். புதிதாக ஆடியோவை மாற்றுவதற்கும் உருவாக்குவதற்கும் தனித்துவமான திறன்களுடன், Fugatto உண்மையான தொழில்நுட்ப ரத்தினமாக மாறுவதை நோக்கமாகக் கொண்டுள்ளது.

ஃபுகாட்டோ என்ற பெயர் கிளாசிக்கல் இசைச் சொற்களிலிருந்து அதன் தோற்றத்தை எடுத்தது, ஒரு ஃபியூகின் சிக்கலான தன்மையையும் நுணுக்கத்தையும் தூண்டுகிறது, ஆனால் நவீன ஒலி சூழலுக்குப் பயன்படுத்தப்படுகிறது. நீங்கள் எப்போதாவது கற்பனை செய்திருந்தால் ஒரு எளிய விளக்கத்திலிருந்து ஒரு பாடலை உருவாக்கவும் அல்லது ஏற்கனவே உள்ள ஒலியை முற்றிலும் புதியதாக மாற்றவும், இந்த AI அதைச் செய்யும் திறன் கொண்டது.

புதுமையையும் துல்லியத்தையும் இணைக்கும் இயந்திரம்

NVIDIA Fugatto உரையிலிருந்து ஆடியோவை உருவாக்கும் திறனுக்காக தனித்து நிற்கிறது. ஜாஸ் தாளங்களுடன் கூடிய ஒரு மெலஞ்சோலிக் பியானோ மெலடி முதல் பறவைகள் கிண்டலுடன் விடியலாக உருவாகும் புயல் வரை - சாத்தியங்கள் நடைமுறையில் வரம்பற்றவை. ComposableART எனப்படும் அதன் அனுமான நுட்பம் உங்களை அனுமதிக்கிறது முன்பு கற்றுக்கொண்ட கட்டளைகளை இணைக்கவும் அசல் பயிற்சித் தரவுகளுடன் கட்டுப்படுத்தப்படாத தனித்துவமான, தனிப்பயன் ஒலிகளை உருவாக்க.

பிரத்தியேக உள்ளடக்கம் - இங்கே கிளிக் செய்யவும்  ஊட்டத்தில் AI உள்ளடக்கத்தைக் குறைக்க Pinterest கட்டுப்பாடுகளை செயல்படுத்துகிறது

அதன் மற்றொரு புரட்சிகரமான அம்சம் ஏற்கனவே இருக்கும் ஆடியோவை மாற்றியமைப்பது. இதன் பொருள் என்ன? ஒரு குரல் கோப்பை ஏற்றுவது மற்றும் அதன் உச்சரிப்பு அல்லது உணர்ச்சித் தொனியை மாற்றுவது அல்லது கிட்டார் மெல்லிசையை எடுத்து அதை செலோ துண்டுகளாக மாற்றுவது பற்றி கற்பனை செய்து பாருங்கள். ஒரு ஆர்ப்பாட்டத்தில், அது கூட சாத்தியமானது ஒரு பியானோ வரியை மாற்றினால் அது ஒரு மனித குரல் பாடுவது போல் இருக்கும். திரைப்பட விளைவுகளை உருவாக்குவது முதல் மேம்பட்ட கல்விக் கருவிகள் வரை பயன்பாடுகள் உள்ளன.

உற்பத்தியில் ஃபுகாட்டோவைப் பயன்படுத்துதல்

படைப்புத் துறையில் ஃபுகாட்டோவின் திறன்

ஃபுகாட்டோ இசை, சினிமா அல்லது வீடியோ கேம்கள் போன்ற படைப்புத் துறைகளில் புரட்சியை ஏற்படுத்துவதை நோக்கமாகக் கொண்டுள்ளது. என்விடியாவின் பயன்பாட்டு ஆழமான கற்றல் ஆராய்ச்சியின் துணைத் தலைவர் பிரையன் கேடன்சாரோ அதை எடுத்துரைத்தார் "உருவாக்கும் AI ஆனது இசை மற்றும் ஒலி வடிவமைப்பை தீவிரமாக மாற்றுவதற்கு விதிக்கப்பட்டுள்ளது". படைப்பாளிகள் மட்டும் முடியாது வழக்கமான பணிகளை தானியக்கமாக்குகிறது, ஆனால் முற்றிலும் புதிய மற்றும் தகவமைப்பு ஒலிகளுடன் பரிசோதனை செய்யவும்.

எடுத்துக்காட்டாக, கேம் டெவலப்பர்கள் உருவாக்க ஃபுகாட்டோவைப் பயன்படுத்தலாம் நிகழ்நேரத்தில் ஏற்படும் மாற்றங்களுக்கு பதிலளிக்கும் மாறும் விளைவுகள் விளையாட்டிற்குள். அதேபோல், இசைக்கலைஞர்கள் மற்றும் தயாரிப்பாளர்கள் முடியும் விரைவாக முன்மாதிரி பாடல்கள், விலையுயர்ந்த உபகரணங்கள் அல்லது நீண்ட அமர்வுகள் தேவையில்லாமல் ஏற்பாடுகள் மற்றும் மாறுபாடுகளைச் சேர்த்தல்.

பிரத்தியேக உள்ளடக்கம் - இங்கே கிளிக் செய்யவும்  ஐ-டா, மன்னர் மூன்றாம் சார்லஸின் உருவப்படத்துடன் மனித கலைக்கு சவால் விடும் ரோபோ கலைஞர்.

பயிற்சி மற்றும் நெறிமுறை சவால்களுக்குப் பின்னால் என்ன இருக்கிறது?

NVIDIA படி, இந்த மாதிரி இருந்தது 32 H100 முடுக்கிகளுடன் DGX சேவையகங்களைப் பயன்படுத்தி, திறந்த மூல தரவுகளில் பயிற்சியளிக்கப்பட்டது மற்றும் மொத்தம் 2.500 பில்லியன் அளவுருக்களை செயலாக்குகிறது. இருப்பினும், இது அனைத்தும் நல்ல செய்தி அல்ல. என்று நிறுவனம் சுட்டிக்காட்டியுள்ளது Fugatto இன் பொது செயல்படுத்தல் இன்னும் விவாதத்தில் உள்ளது, நெறிமுறைக் கவலைகள் ஒரு குறிப்பிடத்தக்க தடையாக இருப்பதால்.

போலியான உள்ளடக்கத்தை உருவாக்குதல், தவறான தகவலுக்கான குரல்களைக் கையாளுதல் அல்லது பதிப்புரிமை மீறல் போன்ற உருவாக்கக்கூடிய தொழில்நுட்பத்தின் சாத்தியமான துஷ்பிரயோகங்கள் பற்றிய பயம், NVIDIA ஒரு எச்சரிக்கையான நிலைப்பாட்டை எடுக்க வழிவகுத்தது. Fugatto திறந்த தரவுத்தொகுப்புகளைப் பயன்படுத்தினாலும், அது உள்ளடக்கத்தை உருவாக்க முடியுமா என்பது தெளிவாகத் தெரியவில்லை அறிவுசார் சொத்துரிமைகளை மீறுதல் அல்லது ஏற்கனவே உள்ள கலைஞர்களின் குரல் அல்லது இசையை ஆபத்தான முறையில் மீண்டும் உருவாக்குதல்.

ஃபுகாட்டோவின் எதிர்காலத்தைப் பற்றிய ஒரு பார்வை

உருவாக்கும் AI உலகில் இந்த மாதிரி ஒரு தனிமைப்படுத்தப்பட்ட வழக்கு அல்ல. கூகுள் அல்லது மெட்டா போன்ற நிறுவனங்களும் இதே போன்ற தொழில்நுட்பங்களை உருவாக்கியுள்ளன, இருப்பினும் வெவ்வேறு அணுகுமுறைகள் உள்ளன. எடுத்துக்காட்டாக, கூகிள் MusicLM என்ற அமைப்பை அறிமுகப்படுத்தியது, இது உரையிலிருந்து இசையை உருவாக்கும் திறன் கொண்டது, ஆனால் திருட்டு தொடர்பான சட்ட சிக்கல்கள் காரணமாக அதை பொதுவில் வெளியிட வேண்டாம் என்று முடிவு செய்தது.

பிரத்தியேக உள்ளடக்கம் - இங்கே கிளிக் செய்யவும்  உள்ளூரில் ஜெமினி AI-ஐ எவ்வாறு நடத்துவது: ஒரு முழுமையான வழிகாட்டி

சவால்கள் இருந்தபோதிலும், செயற்கை நுண்ணறிவின் போக்கு அதை நோக்கிச் செல்கிறது என்பதை ஃபுகாட்டோ நிரூபிக்கிறார் மல்டிஃபங்க்ஸ்னல் கருவிகள். குறிப்பிட்ட பணிகளுக்கு முன்னர் பல மாதிரிகள் தேவைப்பட்டாலும், இப்போது ஒரு முறைமையால் முடியும் பல செயல்பாடுகளைச் செய்யவும், இசையை ஒருங்கிணைப்பதில் இருந்து முன்னோடியில்லாத அளவு தனிப்பயனாக்கத்துடன் ஆடியோவை மாற்றுவது வரை.

அதன் சந்தை வெளியீட்டிற்கு இன்னும் குறிப்பிட்ட தேதி இல்லை என்றாலும், Fugatto உருவாக்கக்கூடிய AI தொழில்நுட்பங்கள் என்ன சாதிக்க முடியும் என்பதற்கான அளவுகோலாக உருவாகி வருகிறது. கிரியேட்டிவ் தொழில்கள், விளையாட்டுகள் முதல் இசை வரை, இந்த மாதிரியில் ஒரு கூட்டாளியாக இருக்கும், இது தொழில்நுட்ப முயற்சிகளைக் குறைப்பது மட்டுமல்லாமல், கலை சாத்தியக்கூறுகளின் முன்னோடியில்லாத அகலத்திற்கான கதவுகளைத் திறக்கும்.