ElevenLabs lancia Turbo 2.5: la nuova frontiera della sintesi vocale AI

ElevenLabs ha lanciato Turbo 2.5, un modello AI di sintesi vocale veloce che supporta 32 lingue, promettendo interazioni più naturali e veloci in molteplici applicazioni, dagli agenti conversazionali ai videogiochi.

Software e App

di Fabrizio Ferrara

21 Lug 2024 / 10:28

Facebook

ElevenLabs, la società specializzata in soluzioni di intelligenza artificiale, ha recentemente annunciato il lancio di Turbo 2.5, un avanzato modello di sintesi vocale a bassa latenza. Questo nuovo modello è in grado di operare in ben 32 lingue, tra cui spicca anche l’italiano, rappresentando un significativo passo avanti nel campo della tecnologia vocale.

Turbo 2.5 si distingue per la sua capacità di fornire sintesi vocale rapida e naturale in diverse lingue. Secondo quanto riportato dalla società nel suo blog ufficiale, il modello permette alle aziende di sviluppare agenti conversazionali avanzati, integrarli in dispositivi hardware come occhiali intelligenti in grado di leggere testi e utilizzarli nei videogiochi per animare i personaggi. Con questa tecnologia, lingue come l’italiano, il francese, lo spagnolo e il mandarino diventano tre volte più veloci, mentre l’inglese beneficia di un incremento del 25% in termini di velocità.

Gli sviluppatori interessati a integrare Turbo 2.5 nei propri prodotti e servizi possono accedere all’API di ElevenLabs tramite la pagina dedicata sul sito dell’azienda. Le aziende che necessitano di accesso a volumi maggiori possono invece contattare direttamente il reparto vendite di ElevenLabs. Questo nuovo strumento apre la porta a una vasta gamma di applicazioni, offrendo nuove opportunità per innovazioni basate sull’intelligenza artificiale.

All’inizio di questo mese, ElevenLabs aveva già lanciato un’altra innovazione: l’API Voice Isolator. Questo strumento, come suggerisce il nome, utilizza l’intelligenza artificiale per rimuovere il rumore di fondo dalle clip audio, isolando i dialoghi puliti. Una dimostrazione pratica di Voice Isolator è stata presentata attraverso un sito web che utilizza Claude di Anthropic, consentendo agli utenti di fornire un link di YouTube per poi eliminare il rumore di fondo dall’audio. Questa tecnologia promette di trovare molteplici applicazioni creative da parte degli sviluppatori terzi.

ElevenLabs ha recentemente annunciato diverse partnership strategiche. Tra queste, una collaborazione con AMGI Studios per la creazione di personaggi interattivi e un’altra con Thoughtly, che utilizzerà la tecnologia di ElevenLabs per sviluppare call center basati sull’intelligenza artificiale. Inoltre, l’azienda ha rivelato nuovi miglioramenti al suo Voiceover / Dubbing Studio, dimostrando il suo impegno costante nell’innovazione tecnologica. Anche altre aziende leader nel settore dell’intelligenza artificiale stanno facendo passi avanti nella tecnologia di sintesi vocale. OpenAI, per esempio, sta lavorando su nuove applicazioni vocali e ha recentemente offerto un accesso limitato a una piattaforma di generazione di testo-voce chiamata Voice Engine. Questa tecnologia, iniziata a sviluppare alla fine del 2022, ha già fornito voci preimpostate per l’API di sintesi vocale e la funzione di lettura ad alta voce di ChatGPT.

Continua a leggere su Fidelity News