ElevenLabs, leader nel settore della tecnologia audio basata su intelligenza artificiale, ha recentemente introdotto due innovazioni significative che potrebbero trasformare il panorama della sintesi vocale e della lettura automatica. Le due novità, Turbo 2.5 e ElevenLabs Reader, offrono nuove opportunità per le aziende e migliorano notevolmente l’esperienza degli utenti finali.
Turbo 2.5: sintesi vocale ad alta velocità
La prima grande novità è il Turbo 2.5, un modello di sintesi vocale avanzata che promette di ridefinire gli standard della velocità e della qualità nella generazione di voce artificiale. Annunciato il 21 luglio 2024, Turbo 2.5 è progettato per garantire una sintesi vocale estremamente rapida e fluida, supportando ben 32 lingue, tra cui italiano, francese, spagnolo, e mandarino. Questa versatilità linguistica rappresenta un grande passo avanti per le aziende che desiderano integrare tecnologie di sintesi vocale nei loro prodotti e servizi globali. Grazie a Turbo 2.5, la sintesi vocale nelle lingue supportate è ora tre volte più veloce rispetto ai modelli precedenti, mentre l’inglese ha visto un incremento del 25% nella velocità di sintesi. Questo miglioramento non solo accelera il processo di generazione del parlato, ma consente anche una risposta più naturale e immediata negli agenti conversazionali e nelle interfacce utente basate su voce.
Le aziende possono utilizzare questo modello per creare esperienze utente più interattive e coinvolgenti, sia in contesti commerciali che ricreativi. Ad esempio, possono sviluppare assistenti virtuali avanzati, integrare la sintesi vocale in dispositivi hardware come occhiali intelligenti che leggono testi ad alta voce, o animare personaggi nei videogiochi con una voce generata artificialmente. Per gli sviluppatori interessati a sfruttare Turbo 2.5, ElevenLabs offre l’accesso all’API attraverso la sua pagina dedicata, mentre le aziende che necessitano di soluzioni personalizzate o di volumi maggiori possono contattare direttamente il reparto vendite per discutere le opzioni disponibili.
ElevenLabs Reader: la nuova frontiera della lettura automatica
La seconda grande innovazione di ElevenLabs è l’app ElevenLabs Reader, lanciata il 22 agosto 2024 e disponibile gratuitamente su iOS e Android. Quest’applicazione rappresenta un avanzamento significativo nel campo delle tecnologie di lettura automatica, offrendo un’alternativa di alta qualità alle tradizionali letture robotiche. ElevenLabs Reader utilizza la stessa tecnologia di sintesi vocale avanzata di Turbo 2.5 per produrre voci naturali e realistiche che rendono la lettura di testi un’esperienza più coinvolgente e meno monotona. L’app offre una vasta gamma di voci in 32 lingue e permette agli utenti di caricare e leggere testi in vari formati, inclusi EPUB, PDF e TXT. Inoltre, grazie alla funzionalità OCR (riconoscimento ottico dei caratteri), gli utenti possono leggere testi da documenti scansionati, ampliando ulteriormente le possibilità di utilizzo. Gli utenti hanno accesso a testi precaricati come “Cenerentola” e “Le avventure di Sherlock Holmes”, e possono caricare i propri testi tramite scrittura diretta, incollando link o importando file.
Nonostante le sue funzionalità avanzate, ElevenLabs Reader è progettata per uso personale e non permette il download o l’esportazione dei contenuti audio per scopi commerciali. Questo approccio garantisce che l’app rimanga uno strumento utile per la lettura di testi di dominio pubblico e per chi cerca un’alternativa economica ai servizi di audiolibri a pagamento. Gli utenti possono sfruttare risorse come Project Gutenberg e Standard Ebooks per accedere a una vasta gamma di libri di dominio pubblico da ascoltare attraverso l’app.