得益于 NVIDIA,人工智能世界再次实现了令人印象深刻的飞跃Fugatto 提出的一种前卫模型有望彻底改变声音的生成和转换方式。该工具旨在提供 音乐、视频游戏和广告等领域的先进解决方案。凭借从头开始改变和创建音频的独特功能,Fugatto 旨在成为真正的技术瑰宝。
Fugatto 这个名字源自古典音乐术语,唤起赋格曲的复杂性和技巧,但适用于现代声音环境。如果你曾经想象过 根据简单的描述创作歌曲或将现有的声音转变为全新的声音,这个人工智能有能力实现它。
集创新与精密于一体的机器
NVIDIA Fugatto 因其从文本生成音频的能力而脱颖而出。从带有爵士节奏的忧郁钢琴旋律,到演变为鸟儿鸣叫的黎明的风暴——可能性几乎是无限的。它的推理技术称为 ComposableART,可以让您 合并以前学过的命令 创建不限于原始训练数据的独特的自定义声音。
它的另一个革命性功能是对现有音频的修改。这意味着什么?想象一下加载一个语音文件并能够改变其口音或情绪基调,或者将吉他旋律转换为大提琴曲子。在演示中,甚至有可能 改变钢琴线,使其听起来像人声唱歌。应用范围从创建电影效果到高级教育工具。

Fugatto 在创意产业的潜力
Fugatto 旨在彻底改变音乐、电影或视频游戏等创意领域。 NVIDIA 应用深度学习研究副总裁 Bryan Catanzaro 强调: “生成式人工智能注定会从根本上改变音乐和声音设计”。创作者不仅能够 自动化日常任务,还可以尝试全新的自适应声音。
例如,游戏开发者可以使用 Fugatto 来生成 实时响应变化的动态效果 游戏内。同样,音乐家和制作人可以 快速原型歌曲,无需昂贵的设备或长时间的会议即可添加安排和变体。
培训和道德挑战背后的原因是什么?
据 NVIDIA 称,该型号已 使用带有 32 个 H100 加速器的 DGX 服务器进行开源数据训练 总共处理2.500亿个参数。然而,这也不全是好消息。该公司已表示 Fugatto 的公开实施仍在争论中,因为道德问题是一个重大障碍。
由于担心生成技术可能被滥用,例如创建虚假内容、操纵声音传播错误信息或侵犯版权,NVIDIA 采取了谨慎的立场。尽管 Fugatto 使用开放数据集,但尚不清楚它是否可以生成以下内容: 侵犯知识产权或危险地复制现有艺术家的声音或音乐.
展望 Fugatto 的未来
这种模型并不是生成人工智能领域的孤例。谷歌或 Meta 等公司也开发了类似的技术,尽管方法不同。例如,谷歌推出了MusicLM,一个能够从文本生成音乐的系统,但由于抄袭相关的法律问题决定不公开。
尽管面临挑战,Fugatto 表明人工智能的趋势指向 多功能工具。虽然以前需要多个模型来执行特定任务,但现在单个系统就可以 执行多项操作,从合成音乐到以前所未有的定制程度转换音频。
尽管目前还没有具体的上市日期,但 Fugatto 正在成为生成式人工智能技术所能实现的目标的基准。从游戏到音乐的创意产业将在这种模式中拥有盟友,这不仅会减少技术工作,而且会打开前所未有的艺术可能性之门。
我是一名技术爱好者,已将自己的“极客”兴趣变成了职业。出于纯粹的好奇心,我花了 10 多年的时间使用尖端技术并修改各种程序。现在我专攻计算机技术和视频游戏。这是因为 5 年多来,我一直在为各种技术和视频游戏网站撰写文章,旨在以每个人都能理解的语言为您提供所需的信息。
如果您有任何疑问,我的知识范围涵盖与 Windows 操作系统以及手机 Android 相关的所有内容。我对您的承诺是,我总是愿意花几分钟帮助您解决在这个互联网世界中可能遇到的任何问题。