Verden av kunstig intelligens tar et imponerende sprang igjen takket være NVIDIA, som Fugatto har presentert, en avantgardemodell som lover å revolusjonere måten lyder genereres og transformeres på. Dette verktøyet er designet for å tilby avanserte løsninger innen felt som musikk, videospill og reklame. Med unike evner til å endre og lage lyd fra bunnen av, har Fugatto som mål å bli en sann teknologisk perle.
Navnet Fugatto kommer fra klassiske musikalske termer, som fremkaller kompleksiteten og finessen til en fuga, men brukt på det moderne lydmiljøet. Hvis du noen gang har forestilt deg lage en sang fra en enkel beskrivelse eller forvandle en eksisterende lyd til noe helt nytt, denne AI-en er i stand til å få det til.
En maskin som kombinerer innovasjon og presisjon
NVIDIA Fugatto skiller seg ut for sin evne til å generere lyd fra tekst. Fra en melankolsk pianomelodi med jazzrytmer til en storm som utvikler seg til en daggry med fuglekvitter – mulighetene er praktisk talt ubegrensede. Dens slutningsteknikk, kalt ComposableART, lar deg slå sammen tidligere lærte kommandoer å lage unike, tilpassede lyder som ikke er begrenset til de originale treningsdataene.
En annen av dens revolusjonerende funksjoner er modifikasjon av eksisterende lyd. Hva betyr dette? Tenk deg å laste inn en stemmefil og kunne endre aksent eller følelsesmessig tone, eller ta en gitarmelodi og forvandle den til et cellostykke. I en demonstrasjon var det til og med mulig endre en pianolinje slik at den hørtes ut som en menneskestemme som synger. Applikasjoner spenner fra å lage filmeffekter til avanserte pedagogiske verktøy.
- NVIDIA Fugatto er en AI som er i stand til å generere og transformere lyder, stemmer og musikk fra tekst og lyd.
- Den bruker ComposableART-teknikken for å kombinere komplekse instruksjoner og generere unik lyd.
- Foreløpig er offentlig tilgang under debatt på grunn av etiske og juridiske hensyn.
- Teknologien søker å revolusjonere auditiv skapelse i flere bransjer som videospill, musikk og kino.
Fugattos potensial i den kreative bransjen
Fugatto har som mål å revolusjonere kreative sektorer som musikk, kino eller videospill. Bryan Catanzaro, visepresident for anvendt dyplæringsforskning ved NVIDIA, fremhevet det «Generativ AI er bestemt til å radikalt endre musikk og lyddesign». Skapere vil ikke bare kunne automatisere rutineoppgaver, men også eksperimentere med helt nye og adaptive lyder.
For eksempel kan spillutviklere bruke Fugatto til å generere dynamiske effekter som reagerer på endringer i sanntid i spillet. På samme måte kunne musikere og produsenter prototype sanger raskt, legger til arrangementer og varianter uten behov for dyrt utstyr eller lange økter.
Hva ligger bak trenings- og etiske utfordringer?
Ifølge NVIDIA har denne modellen vært det trent med åpen kildekode-data, ved hjelp av DGX-servere med 32 H100-akseleratorer og behandler totalt 2.500 milliarder parametere. Men det er ikke bare gode nyheter. Det har selskapet antydet offentlig implementering av Fugatto fortsatt under debatt, ettersom etiske bekymringer er en betydelig barriere.
Frykt for potensielt misbruk av generativ teknologi, som å lage falskt innhold, manipulere stemmer for feilinformasjon eller brudd på opphavsrett, har fått NVIDIA til å innta en forsiktig holdning. Selv om Fugatto bruker åpne datasett, er det ikke klart om det kan generere innhold som krenke immaterielle rettigheter eller farlig reprodusere stemmen eller musikken til eksisterende artister.
Et blikk inn i fremtiden til Fugatto
Denne modellen er ikke et isolert tilfelle i verden av generativ AI. Selskaper som Google eller Meta har også utviklet lignende teknologier, men med forskjellige tilnærminger. For eksempel introduserte Google MusicLM, et system som kan generere musikk fra tekst, men bestemte seg for ikke å offentliggjøre det på grunn av juridiske problemer knyttet til plagiering.
Til tross for utfordringene demonstrerer Fugatto at trenden innen kunstig intelligens peker mot multifunksjonelle verktøy. Mens flere modeller tidligere var nødvendig for spesifikke oppgaver, kan et enkelt system nå utføre flere operasjoner, fra å syntetisere musikk til å transformere lyd med en enestående grad av tilpasning.
Selv om det fortsatt ikke er noen spesifikk dato for markedslansering, fremstår Fugatto som en målestokk for hva generative AI-teknologier kan oppnå. Kreative næringer, fra spill til musikk, vil ha en alliert i denne modellen som ikke bare vil redusere teknisk innsats, men også åpne dørene til en enestående bredde av kunstneriske muligheter.
Jeg er en teknologientusiast som har gjort sine "geek"-interesser til et yrke. Jeg har brukt mer enn 10 år av livet mitt på å bruke banebrytende teknologi og fikse med alle slags programmer av ren nysgjerrighet. Nå har jeg spesialisert meg på datateknologi og videospill. Dette er fordi jeg i mer enn 5 år har skrevet for forskjellige nettsteder om teknologi og videospill, og laget artikler som prøver å gi deg den informasjonen du trenger på et språk som er forståelig for alle.
Hvis du har spørsmål, spenner min kunnskap fra alt relatert til Windows-operativsystemet samt Android for mobiltelefoner. Og mitt engasjement er til deg, jeg er alltid villig til å bruke noen minutter og hjelpe deg med å løse eventuelle spørsmål du måtte ha i denne internettverdenen.