NVIDIA Fugatto:創新 AI 改變聲音的未來

最後更新: 25/11/2024

英偉達 Fugatto-1

由於 NVIDIA,人工智慧世界再次實現了令人印象深刻的飛躍Fugatto 提出的一種前衛模型有望徹底改變聲音的生成和轉換方式。該工具旨在提供 音樂、電玩遊戲和廣告等領域的先進解決方案。憑藉著從頭開始改變和創建音訊的獨特功能,Fugatto 旨在成為真正的技術瑰寶。

Fugatto 這個名字源自於古典音樂術語,喚起賦格曲的複雜性和技巧,但適用於現代聲音環境。如果你曾經想像過 根據簡單的描述創作一首歌曲,或將現有的聲音轉變為全新的聲音,這個人工智慧有能力實現它。

集創新與精密於一體的機器

NVIDIA Fugatto 因其從文字生成音訊的能力而脫穎而出。從帶有爵士節奏的憂鬱鋼琴旋律,到演變為鳥兒鳴叫的黎明的風暴——可能性幾乎是無限的。它的推理技術稱為 ComposableART,讓您 合併以前學過的命令 創建不限於原始訓練資料的獨特的自訂聲音。

獨家內容 - 點擊這裡  什麼是 SearchGPT 以及新的基於人工智慧的搜尋引擎如何運作

它的另一個革命性功能是對現有音訊的修改。這意味著什麼?想像一下載入一個語音檔案並能夠改變其口音或情緒基調,或將吉他旋律轉換為大提琴作品。在演示中,甚至有可能 改變鋼琴線,使其聽起來像人聲唱歌。應用範圍從創建電影效果到高級教育工具。

在生產中使用 Fugatto

Fugatto 在創意產業的潛力

Fugatto 旨在徹底改變音樂、電影或電玩等創意領域。 NVIDIA 應用深度學習研究副總裁 Bryan Catanzaro 強調: “生成式人工智慧注定會從根本上改變音樂和聲音設計”。創作者不僅能夠 自動化日常任務,還可以嘗試全新的自適應聲音。

例如,遊戲開發者可以使用 Fugatto 來生成 即時回應變化的動態效果 遊戲內。同樣,音樂家和製作人可以 快速原型歌曲,無需昂貴的設備或長時間的會議即可添加安排和變體。

獨家內容 - 點擊這裡  NotebookLM 增強了深度研究功能,並支援 Drive 音訊。

訓練和道德挑戰背後的原因是什麼?

據 NVIDIA 稱,該型號已 使用 32 個 H100 加速器的 DGX 伺服器進行開源資料訓練 總共處理2.500億個參數。然而,這也不全然是好消息。該公司已表示 Fugatto 的公開實施仍在爭論中,因為道德問題是一個重大障礙。

由於擔心生成技術可能被濫用,例如創建虛假內容、操縱聲音傳播錯誤訊息或侵犯版權,NVIDIA 採取了謹慎的立場。儘管 Fugatto 使用開放資料集,但尚不清楚它是否可以產生以下內容: 侵犯知識產權或危險地複製現有藝術家的聲音或音樂.

展望 Fugatto 的未來

這種模型並不是生成人工智慧領域的孤例。谷歌或 Meta 等公司也開發了類似的技術,儘管方法不同。例如,Google推出了MusicLM,一個能夠從文字生成音樂的系統,但由於與抄襲相關的法律問題決定不公開。

獨家內容 - 點擊這裡  Palantir AI:與微軟抗衡的企業 AI

儘管面臨挑戰,Fugatto 表明人工智慧的趨勢指向 多功能工具。雖然以前需要多個模型來執行特定任務,但現在單一系統可以 執行多項操作,從合成音樂到以前所未有的定製程度轉換音訊。

儘管目前還沒有具體的上市日期,但 Fugatto 正在成為生成式人工智慧技術所能實現的目標的基準。從遊戲到音樂的創意產業將在這種模式中擁有盟友,這不僅會減少技術工作,而且會打開前所未有的藝術可能性之門。