GPT-5.2: il nuovo salto evolutivo di OpenAI verso un’AI più strutturata, precisa e capace di ragionare su lunghi flussi di lavoro

GPT-5.2 segna un’evoluzione nelle capacità professionali dell’AI, migliorando ragionamento, gestione dei documenti lunghi, precisione dei contenuti e affidabilità degli strumenti, con progressi evidenti in coding, visione, workflow complessi e analisi avanzate.

GPT-5.2: il nuovo salto evolutivo di OpenAI verso un’AI più strutturata, precisa e capace di ragionare su lunghi flussi di lavoro

OpenAI ha presentato GPT-5.2, una piattaforma che mira a ridefinire gli standard dell’intelligenza artificiale applicata alle attività professionali. Il nuovo modello nasce per aumentare in modo concreto la produttività, un obiettivo che parte da un dato ormai consolidato: gli utenti aziendali di ChatGPT dichiarano di risparmiare in media dai 40 ai 60 minuti al giorno, un valore che sale fino a oltre dieci ore settimanali per i power user. Questa nuova generazione vuole ampliare quel margine attraverso una maggiore struttura nella creazione di documenti, una gestione più efficiente di strumenti e workflow complessi e una notevole maturazione nelle capacità di ragionamento.

La nuova serie è stata sviluppata in collaborazione con NVIDIA e Microsoft, sfruttando infrastrutture Azure basate su GPU H100, H200 e GB200-NVL72. Il risultato è un ecosistema costituito da tre modelli distinti, pensati per adattarsi a esigenze diverse. La variante Instant punta sulla velocità e offre risposte più immediate e ordinate, ideale per il reperimento di informazioni, la scrittura tecnica e le traduzioni. Il modello Thinking privilegia la profondità, diventando uno strumento adatto a compiti articolati come la risoluzione di problemi matematici, la creazione di codice o l’analisi di documenti molto lunghi.

La versione Pro predilige il ragionamento di qualità superiore, utile quando l’accuratezza è prioritaria anche a costo di tempi più lunghi. Le prestazioni segnano un punto di svolta in quasi ogni ambito di valutazione. Nel benchmark GDPval, che misura la capacità di un modello di lavorare su compiti di alto valore economico in 44 professioni, GPT-5.2 Thinking e Pro raggiungono risultati superiori alla media degli esperti umani, mantenendo però tempi di completamento più di undici volte inferiori e costi ridotti a meno dell’un per cento. L’aumento della precisione è evidente anche in settori molto tecnici: nella programmazione, GPT-5.2 stabilisce nuovi record su SWE-Bench Pro e Verified, con progressi tangibili nella scrittura di codice complesso, nel refactoring e nella gestione di interi cicli di sviluppo.

Le testimonianze dei partner confermano un netto miglioramento nelle attività data-driven, nelle catene di strumenti e nei flussi multi-agente. Uno degli aspetti più solidi della nuova versione riguarda la gestione del contesto lungo. GPT-5.2 Thinking raggiunge prestazioni ai vertici su MRCRv2, garantendo una capacità senza precedenti di mantenere coerenza e precisione anche su documenti da centinaia di migliaia di token. Questo apre la strada a un utilizzo più efficace per report estesi, progetti multi-file, analisi contrattuali o ricerche accademiche.

Altrettanto significativa è l’evoluzione nel campo della visione artificiale: il modello dimezza gli errori su grafici e interfacce software, migliorando l’interpretazione di dashboard, schemi tecnici e immagini di prodotto. L’affidabilità cresce anche nella gestione delle conoscenze: GPT-5.2 Thinking riduce del 30% la presenza di errori fattuali rispetto alla versione precedente, migliorando la qualità delle risposte per ricerca, analisi e supporto decisionale. Progressi simili emergono nel ragionamento matematico e scientifico: GPT-5.2 Thinking stabilisce un nuovo primato su FrontierMath e la variante Pro supera il 90% su ARC-AGI-1 Verified, un risultato che evidenzia una maggiore capacità di astrazione e problem-solving.

Sul fronte della sicurezza, la nuova serie consolida gli interventi avviati con GPT-5, con risposte più controllate nelle conversazioni sensibili e un nuovo sistema di rilevamento automatico dell’età per rafforzare le protezioni destinate ai minori. OpenAI riconosce comunque margini di miglioramento, soprattutto in termini di eccessive cautele. Il rollout è già partito per gli utenti Plus, Pro, Go, Business ed Enterprise, mentre l’API introduce i nuovi endpoint per GPT-5.2 Instant, Thinking e Pro, insieme al livello di ragionamento xhigh pensato per attività estremamente complesse. Sul piano dei costi, l’aumento del prezzo per token è mitigato da una maggiore efficienza nei compiti multi-agente e dalla possibilità di sfruttare sconti sui token memorizzati in cache.

Continua a leggere su Fidelity News