Meta, la nota azienda di tecnologia e social media, ha annunciato di aver sviluppato un nuovo modello di traduzione vocale multilingue, chiamato SeamlessM4T, che promette di rivoluzionare il campo della comunicazione interculturale. SeamlessM4T è un modello di intelligenza artificiale (IA) che è in grado di tradurre la voce umana da e verso un gran numero di lingue, con una qualità e una velocità senza precedenti.SeamlessM4T si basa su una tecnica chiamata “end-to-end speech translation“, che consiste nel tradurre direttamente la voce da una lingua a un’altra, senza passare per la fase intermedia del testo.
Questo permette di evitare errori e perdite di informazione dovuti alla conversione da voce a testo e viceversa, e di rendere la traduzione più fluida e naturale.Secondo Meta, SeamlessM4T è in grado di riconoscere e tradurre fino a 100 lingue diverse, tra cui alcune poco diffuse o minoritarie, e di produrre il testo o la voce tradotta in 35 lingue.
Inoltre, il modello è capace di adattarsi al contesto e al cambiamento di lingua durante il discorso, anche se questo avviene più volte all’interno della stessa frase.Meta ha dichiarato che il suo obiettivo è quello di creare un vero e proprio “traduttore universale”, ispirato al Babel Fish, il famoso dispositivo immaginario della Guida Galattica per Autostoppisti, che permetteva di capire qualsiasi lingua semplicemente inserendolo nell’orecchio.
Per raggiungere questo scopo, Meta ha utilizzato oltre un milione di ore di dati audio provenienti da diverse fonti, tra cui i suoi stessi servizi e piattaforme sociali. Inoltre, Meta ha applicato dei filtri per eliminare le parole offensive o incitanti all’odio, al fine di garantire una traduzione rispettosa e sicura.
Meta ha reso disponibile il suo modello SeamlessM4T sotto licenza Creative Commons CC BY-NC 4.0, che consente a chiunque di utilizzarlo per scopi non commerciali e di modificarlo o migliorarlo. Meta ha invitato gli sviluppatori esterni a collaborare al progetto, fornendo feedback e suggerimenti. La traduzione vocale multilingue è una sfida importante per il progresso della società e della scienza, in quanto facilita la comunicazione e la condivisione di conoscenze tra persone di culture diverse. Meta ha dimostrato di essere all’avanguardia in questo campo, grazie alla sua esperienza e ai suoi investimenti nell’intelligenza artificiale.
Oltre a SeamlessM4T, Meta ha sviluppato altri modelli linguistici innovativi, come Segment Anything, che rileva gli oggetti nelle immagini senza bisogno di addestramento, o ImageBind, che genera contenuti multisensoriali a partire da parole chiave. Inoltre, Meta ha collaborato con Microsoft per creare Llama 2, un modello linguistico open source che supporta fino a 200 lingue.SeamlessM4T è solo l’ultimo esempio della visione e della creatività di Meta nel campo della traduzione vocale multilingue. Con questo modello, Meta si avvicina sempre più al sogno di creare un traduttore universale che possa abbattere le barriere linguistiche e culturali tra le persone.