由於 NVIDIA,人工智慧世界再次實現了令人印象深刻的飛躍Fugatto 提出的一種前衛模型有望徹底改變聲音的生成和轉換方式。該工具旨在提供 音樂、電玩遊戲和廣告等領域的先進解決方案。憑藉著從頭開始改變和創建音訊的獨特功能,Fugatto 旨在成為真正的技術瑰寶。
Fugatto 這個名字源自於古典音樂術語,喚起賦格曲的複雜性和技巧,但適用於現代聲音環境。如果你曾經想像過 根據簡單的描述創作一首歌曲,或將現有的聲音轉變為全新的聲音,這個人工智慧有能力實現它。
集創新與精密於一體的機器
NVIDIA Fugatto 因其從文字生成音訊的能力而脫穎而出。從帶有爵士節奏的憂鬱鋼琴旋律,到演變為鳥兒鳴叫的黎明的風暴——可能性幾乎是無限的。它的推理技術稱為 ComposableART,讓您 合併以前學過的命令 創建不限於原始訓練資料的獨特的自訂聲音。
它的另一個革命性功能是對現有音訊的修改。這意味著什麼?想像一下載入一個語音檔案並能夠改變其口音或情緒基調,或將吉他旋律轉換為大提琴作品。在演示中,甚至有可能 改變鋼琴線,使其聽起來像人聲唱歌。應用範圍從創建電影效果到高級教育工具。

Fugatto 在創意產業的潛力
Fugatto 旨在徹底改變音樂、電影或電玩等創意領域。 NVIDIA 應用深度學習研究副總裁 Bryan Catanzaro 強調: “生成式人工智慧注定會從根本上改變音樂和聲音設計”。創作者不僅能夠 自動化日常任務,還可以嘗試全新的自適應聲音。
例如,遊戲開發者可以使用 Fugatto 來生成 即時回應變化的動態效果 遊戲內。同樣,音樂家和製作人可以 快速原型歌曲,無需昂貴的設備或長時間的會議即可添加安排和變體。
訓練和道德挑戰背後的原因是什麼?
據 NVIDIA 稱,該型號已 使用 32 個 H100 加速器的 DGX 伺服器進行開源資料訓練 總共處理2.500億個參數。然而,這也不全然是好消息。該公司已表示 Fugatto 的公開實施仍在爭論中,因為道德問題是一個重大障礙。
由於擔心生成技術可能被濫用,例如創建虛假內容、操縱聲音傳播錯誤訊息或侵犯版權,NVIDIA 採取了謹慎的立場。儘管 Fugatto 使用開放資料集,但尚不清楚它是否可以產生以下內容: 侵犯知識產權或危險地複製現有藝術家的聲音或音樂.
展望 Fugatto 的未來
這種模型並不是生成人工智慧領域的孤例。谷歌或 Meta 等公司也開發了類似的技術,儘管方法不同。例如,Google推出了MusicLM,一個能夠從文字生成音樂的系統,但由於與抄襲相關的法律問題決定不公開。
儘管面臨挑戰,Fugatto 表明人工智慧的趨勢指向 多功能工具。雖然以前需要多個模型來執行特定任務,但現在單一系統可以 執行多項操作,從合成音樂到以前所未有的定製程度轉換音訊。
儘管目前還沒有具體的上市日期,但 Fugatto 正在成為生成式人工智慧技術所能實現的目標的基準。從遊戲到音樂的創意產業將在這種模式中擁有盟友,這不僅會減少技術工作,而且會打開前所未有的藝術可能性之門。
我是一名技術愛好者,已將自己的“極客”興趣變成了職業。出於純粹的好奇心,我花了 10 多年的時間使用尖端技術並修改各種程序。現在我專攻電腦技術和電玩遊戲。這是因為五年多來,我一直在為各種技術和視頻遊戲網站撰寫文章,力求以每個人都能理解的語言為您提供所需的資訊。
如果您有任何疑問,我的知識範圍涵蓋與 Windows 作業系統以及手機 Android 相關的所有內容。我對您的承諾是,我總是願意花幾分鐘幫助您解決在這個網路世界中可能遇到的任何問題。