Nvidia ha svelato Fugatto, una nuova frontiera nel campo dell’audio generativo basato sull’intelligenza artificiale. Questo innovativo strumento non solo può comporre musica o modificare voci, ma è capace di creare suoni inediti, mai uditi prima. L’obiettivo è rivoluzionare la produzione audio, aprendo nuove possibilità creative per musicisti, designer sonori e sviluppatori di contenuti multimediali.
A differenza di altri strumenti simili sviluppati da realtà come OpenAI, Google DeepMind e Stability AI, Fugatto non si limita a replicare o manipolare suoni già esistenti. Nvidia sostiene che il modello può generare combinazioni sonore originali e sorprendenti, come un sassofono che “ulula e abbaia”, oppure creare effetti ispirati a descrizioni fantasiose, come “impulsi bassi e rimbombanti accompagnati da cinguettii digitali intermittenti”.
Grazie alla capacità di interpretare input testuali e audio, Fugatto è in grado di soddisfare richieste altamente specifiche. Ad esempio, può trasformare una semplice frase in un’esperienza sonora unica o modificare voci umane cambiandone accento, tono e persino emozione. Inoltre, il modello offre la possibilità di isolare elementi musicali, sostituire strumenti o arricchire una composizione con arrangiamenti complessi. Per sviluppare questo strumento, Nvidia ha costruito un set di dati contenente milioni di campioni audio, tra cui la rinomata libreria di effetti sonori della BBC.
Il modello è stato addestrato con istruzioni dettagliate che ne hanno ampliato le capacità, rendendolo versatile e in grado di affrontare compiti nuovi senza richiedere ulteriori dati. Un esempio pratico mostrato da Nvidia evidenzia la capacità di Fugatto di comporre brani musicali su richiesta, come una sequenza di musica elettronica accompagnata da effetti sonori che ricordano “cani che abbaiano“.
Non si tratta solo di generazione casuale: il modello integra i suoni in modo armonico, offrendo risultati che sorprendono per complessità e originalità. Nonostante il suo potenziale, Fugatto non è privo di sfide. La creazione di suoni mai sentiti prima solleva questioni relative alla proprietà intellettuale e al copyright, un tema caldo nel mondo dell’intelligenza artificiale generativa. Diverse aziende, infatti, sono già coinvolte in dispute legali per l’uso di dataset non autorizzati o per la creazione di contenuti basati su opere esistenti. Inoltre, Nvidia non ha ancora confermato se e quando Fugatto sarà disponibile al grande pubblico. Tuttavia, la promessa di uno strumento così avanzato potrebbe presto spingere altri sviluppatori a seguire la stessa strada, alimentando una competizione che porterà a una rapida evoluzione del settore.