NVIDIA heeft een innovatief generatief AI-model gepresenteerd dat in staat is om geluiden, muziek en stemmen te creëren en te transformeren aan de hand van tekst- en audiocommandos. Het model, genaamd Fugatto, biedt gebruikers de mogelijkheid om audio op een geheel nieuwe manier te manipuleren, van het aanpassen van stemmen en instrumenten tot het creëren van volledig nieuwe geluiden die voorheen nog niet gehoord zijn.
Geluid gecreëerd door AI: Van muziek tot ongekende geluiden
Fugatto is ontwikkeld als een veelzijdig gereedschap voor geluid, vergelijkbaar met een Zwitserse zakmes. Gebruikers kunnen eenvoudig tekstinstructies invoeren om een muziekfragment te genereren, een bepaald instrument toe te voegen of te verwijderen, of zelfs de emotie of het accent van een stem te veranderen. Het model is uniek in zijn vermogen om op basis van simpele tekst- of audiocommandos allerlei geluiden te produceren, van klassieke muziek tot innovatieve geluiden die nooit eerder zijn gehoord.
Een nieuwe maan in de creatieve industrie
De technologie heeft het potentieel om de muziek- en filmindustrie te transformeren. Producenten kunnen Fugatto gebruiken om snel ideeën voor muziek te prototypen of te bewerken, verschillende stijlen en geluiden uit te proberen, en zelfs effecten toe te voegen. Het biedt ook nieuwe mogelijkheden voor bijvoorbeeld reclamebureaus die stemmen kunnen aanpassen aan specifieke emoties of accenten voor verschillende regio’s.
Daarnaast kan de technologie een revolutie teweegbrengen in taalonderwijs, waarbij studenten kunnen leren van stemmen die ze zelf kiezen, of zelfs in videospellen, waar geluidseffecten dynamisch kunnen worden aangepast op basis van de spelactie.
De toekomst van geluidscreatie
Fugatto gebruikt een geavanceerd generatief transformer-model met 2,5 miljard parameters en is getraind op duizenden audiobestanden. Het model is in staat om geluiden die het nooit eerder heeft gehoord te genereren, dankzij de technologie van "temporal interpolation" waarmee gebruikers geluiden kunnen creëren die veranderen in de tijd, zoals het geluid van een onweersbui die langzaam vervaagt.
Met deze indrukwekkende mogelijkheden opent Fugatto nieuwe deuren voor creatievelingen in verschillende industrieën, van muziekproductie tot gaming en meer. Het is een veelbelovende stap in de richting van een toekomst waarin AI niet alleen een hulpmiddel is, maar een partner in creatieve processen.
Now Hear This: World’s Most Flexible Sound Machine DebutsFugatto generates or transforms any mix of music, voices and sounds described with prompts using any combination of text and audio files.
|