Negli ultimi mesi l’intelligenza artificiale ha compiuto enormi progressi, ma il nuovo aggiornamento della modalità vocale di ChatGPT segna un vero e proprio punto di svolta: per molti utenti, la differenza rispetto a una conversazione umana è diventata praticamente impercettibile. OpenAI ha annunciato che la funzione vocale avanzata di ChatGPT ora consente all’assistente virtuale non solo di parlare con maggiore naturalezza, ma anche di esprimere emozioni sfumate e convincenti, rendendo l’esperienza utente più coinvolgente e autentica che mai.
A fare da base a questa innovazione è ancora GPT-4o, il modello multimodale presentato nel 2024, già capace di rispondere in circa 320 millisecondi, emulando i tempi di una vera conversazione. Tuttavia, la novità introdotta a giugno 2025 riguarda in particolare il tono della voce sintetica: la nuova modalità riproduce pause naturali, variazioni di ritmo, accenti contestuali e perfino forme di espressività complesse come empatia, ironia o stanchezza.
In pratica, ChatGPT non si limita più a “parlare”, ma comunica. Le prime impressioni degli utenti sono state entusiastiche: alcuni hanno affermato di sentirsi come in presenza di una persona reale, descrivendo l’AI come un interlocutore empatico, ironico o semplicemente attento, a seconda del contesto. Questa nuova modalità migliora anche l’ascolto passivo: ad esempio, ChatGPT può ora raccontare una storia o leggere un testo con un’intonazione che si adatta perfettamente al contenuto.
Un’altra funzione inedita è quella della traduzione simultanea vocale. L’utente può chiedere a ChatGPT di tradurre una conversazione e l’AI continuerà in automatico a tradurre tutto ciò che viene detto, mantenendo il flusso fino a un nuovo comando. Questo la rende un’opzione promettente per chi lavora in ambienti multilingue o ha bisogno di uno strumento portatile per comunicare all’estero. Naturalmente, queste funzionalità sono attualmente disponibili solo per gli utenti abbonati ai piani a pagamento di ChatGPT. Inoltre, OpenAI ha avvertito che la funzione è ancora in fase di affinamento. Alcuni utenti hanno segnalato sporadici problemi, come leggere fluttuazioni nella qualità della voce, variazioni di tono inaspettate o l’occasionale comparsa di suoni indesiderati.
Malgrado ciò, l’impressione generale è che si stia entrando in una nuova era dell’interazione vocale con l’AI. L’obiettivo di OpenAI è chiaro: rendere ChatGPT un “super assistente AI” entro la prima metà del 2025. Questo comporterà un’integrazione sempre più profonda con le attività quotidiane, dalla produttività personale alla gestione di compiti complessi. L’evoluzione della modalità vocale rappresenta un tassello fondamentale di questo ambizioso progetto, che sembra sempre più vicino a trasformare il nostro rapporto con la tecnologia.