NVIDIA Fugatto: de innovatieve AI om de toekomst van geluid te transformeren

Laatste update: 25/11/2024

nvidia fugatto-1

De wereld van kunstmatige intelligentie maakt dankzij NVIDIA opnieuw een indrukwekkende sprong, dat Fugatto heeft gepresenteerd, een avant-garde model dat belooft een revolutie teweeg te brengen in de manier waarop geluiden worden gegenereerd en getransformeerd. Deze tool is ontworpen om te bieden geavanceerde oplossingen op gebieden als muziek, videogames en reclame. Met unieke mogelijkheden om audio vanaf het begin aan te passen en te creëren, wil Fugatto een echt technologisch juweeltje worden.

De naam Fugatto ontleent zijn oorsprong aan klassieke muzikale termen, dat de complexiteit en finesse van een fuga oproept, maar toegepast op de moderne geluidsomgeving. Als je het je ooit hebt voorgesteld creëer een nummer vanuit een eenvoudige beschrijving of transformeer een bestaand geluid in iets compleet nieuws, deze AI kan dit mogelijk maken.

Een machine die innovatie en precisie combineert

NVIDIA Fugatto valt op door zijn vermogen om audio uit tekst te genereren. Van een melancholische pianomelodie met jazzritmes tot een storm die uitmondt in een dageraad met fluitende vogels – de mogelijkheden zijn vrijwel onbeperkt. De inferentietechniek, genaamd ComposableART, maakt dit mogelijk eerder geleerde opdrachten samenvoegen om unieke, aangepaste geluiden te creëren die niet beperkt zijn tot de originele trainingsgegevens.

Exclusieve inhoud - Klik hier  Hoe u Gemini AI lokaal kunt hosten: een complete gids

Een ander revolutionair kenmerk is de wijziging van bestaande audio. Wat betekent dit? Stel je voor dat je een stembestand laadt en het accent of de emotionele toon ervan kunt veranderen, of een gitaarmelodie kunt nemen en deze in een cellostuk kunt transformeren. Bij een demonstratie kon het zelfs verander een pianolijn zodat deze klinkt als een menselijke stem die zingt. Toepassingen variëren van het creëren van filmeffecten tot geavanceerde educatieve hulpmiddelen.

Fugatto gebruiken in de productie

Fugatto's potentieel in de creatieve industrie

Fugatto is gericht op het revolutioneren van creatieve sectoren zoals muziek, film of videogames. Bryan Catanzaro, vice-president van toegepast deep learning-onderzoek bij NVIDIA, benadrukte dat «Generatieve AI is voorbestemd om muziek en geluidsontwerp radicaal te veranderen». Makers zullen dat niet alleen kunnen routinetaken automatiseren, maar experimenteer ook met compleet nieuwe en adaptieve geluiden.

Game-ontwikkelaars kunnen bijvoorbeeld Fugatto gebruiken om te genereren dynamische effecten die in realtime op veranderingen reageren binnen het spel. Op dezelfde manier zouden muzikanten en producers dat ook kunnen doen snel prototype-nummers maken, door arrangementen en varianten toe te voegen zonder de noodzaak van dure apparatuur of lange sessies.

Exclusieve inhoud - Klik hier  Het kan zijn dat je YouTube Shorts-video's er anders uitzien, en dat is niet jouw schuld: het platform test automatische filters.

Wat zit er achter de training en ethische uitdagingen?

Volgens NVIDIA is dit model dat wel getraind op open source data, met behulp van DGX-servers met 32 ​​H100-accelerators en verwerking van in totaal 2.500 miljard parameters. Het is echter niet allemaal goed nieuws. Dat heeft het bedrijf aangegeven publieke implementatie van Fugatto staat nog steeds ter discussie, aangezien ethische zorgen een belangrijke barrière vormen.

Angst voor mogelijk misbruik van generatieve technologie, zoals het creëren van nepinhoud, het manipuleren van stemmen voor verkeerde informatie of inbreuk op het auteursrecht, heeft ertoe geleid dat NVIDIA een voorzichtige houding heeft aangenomen. Hoewel Fugatto open datasets gebruikt, is het niet duidelijk of het daarvoor inhoud kan genereren intellectuele eigendomsrechten schenden of op gevaarlijke wijze de stem of muziek van bestaande artiesten reproduceren.

Een blik in de toekomst van Fugatto

Dit model staat niet op zichzelf in de wereld van generatieve AI. Bedrijven als Google of Meta hebben ook soortgelijke technologieën ontwikkeld, zij het met een verschillende aanpak. Google introduceerde bijvoorbeeld MusicLM, een systeem dat muziek uit tekst kan genereren, maar besloot dit niet openbaar te maken vanwege juridische problemen in verband met plagiaat.

Exclusieve inhoud - Klik hier  Zo kun je eenvoudig afbeeldingen maken in WhatsApp met ChatGPT, vanaf je mobiel.

Ondanks de uitdagingen laat Fugatto zien dat de trend op het gebied van kunstmatige intelligentie in de richting wijst multifunctionele gereedschappen. Waar voorheen meerdere modellen nodig waren voor specifieke taken, is dat nu mogelijk met één enkel systeem meerdere bewerkingen uitvoeren, van het synthetiseren van muziek tot het transformeren van audio met een ongekende mate van maatwerk.

Hoewel er nog steeds geen specifieke datum is voor de marktintroductie, komt Fugatto naar voren als maatstaf voor wat generatieve AI-technologieën kunnen bereiken. Creatieve industrieën, van games tot muziek, zullen in dit model een bondgenoot hebben die niet alleen de technische inspanningen zal verminderen, maar ook de deuren zal openen naar een ongekende breedte van artistieke mogelijkheden.