L’intelligenza artificiale continua la sua evoluzione con una serie di annunci di grande impatto. DeepSeek ha rilasciato il suo modello V3 con prestazioni avanzate su hardware consumer, Google ha presentato Gemini 2.5 Pro con capacità di ragionamento potenziate e OpenAI ha introdotto un nuovo generatore di immagini direttamente integrato in ChatGPT. Scopriamo nel dettaglio queste innovazioni.
Novità DeepSeek
L’azienda cinese DeepSeek ha lanciato DeepSeek-V3-0324, un modello AI di grandi dimensioni che si distingue per due caratteristiche chiave: è utilizzabile su hardware consumer e ha una licenza MIT, che consente l’uso commerciale gratuito. Con 641 gigabyte di dati, il modello è stato rilasciato sulla piattaforma AI Hugging Face, confermando la strategia dell’azienda di lanciare i suoi prodotti in modo discreto ma efficace. Uno degli aspetti più innovativi è la sua capacità di funzionare su dispositivi di fascia consumer, come il Mac Studio con chip M3 Ultra, con un’elaborazione di oltre 20 token al secondo. Questo cambia radicalmente il panorama dell’AI, che finora richiedeva potenti infrastrutture di data center per gestire modelli linguistici avanzati.
DeepSeek V3 utilizza un’architettura mixture-of-experts (MoE), che seleziona dinamicamente solo 37 miliardi dei suoi 685 miliardi di parametri, garantendo efficienza e prestazioni elevate. Il modello è accessibile gratuitamente su Hugging Face, OpenRouter e la piattaforma di chat di DeepSeek, e si candida a essere una delle alternative più interessanti nel panorama AI.
Novità Gemini
Google ha presentato Gemini 2.5 Pro, il suo modello AI più avanzato di sempre, progettato per eccellere in ragionamento complesso e coding. Questa versione sperimentale ha debuttato al primo posto nella classifica LMArena leaderboard, superando la concorrenza con un netto margine. Rispetto alla versione precedente, Gemini 2.5 Pro ha fatto un salto enorme nella scrittura di codice, con un punteggio di 63,8% su SWE-Bench Verified, test standard del settore. Può generare web app visivamente accattivanti, trasformare codice e persino scrivere videogiochi eseguibili da un singolo prompt.
Con una finestra di contesto da 1 milione di token, che presto arriverà a 2 milioni, il modello può processare testo, immagini, audio, video e codice complesso con elevata accuratezza. Gli sviluppatori possono testarlo su Google AI Studio o utilizzarlo tramite Gemini Advanced. Nelle prossime settimane arriverà anche su Vertex AI, con piani di prezzo dedicati a utenti aziendali.
Novità OpenAI
OpenAI ha annunciato una rivoluzione nel mondo della generazione di immagini AI: ChatGPT ora può creare immagini direttamente, senza passare per DALL-E. Questa nuova funzionalità sfrutta il modello GPT-4o e sarà disponibile sia per utenti gratuiti che per abbonati Plus a 20 dollari al mese. Le immagini generate si concentreranno su infografiche, diagrammi e contenuti professionali, migliorando la leggibilità del testo e la qualità visiva.
Restano alcune limitazioni, come la precisione nei dettagli complessi e la gestione del testo multilingua, ma OpenAI ha promesso miglioramenti continui. Le immagini non avranno watermark visibili, ma saranno riconoscibili dagli esperti grazie a metadati che ne certificano l’origine. OpenAI applicherà inoltre rigide restrizioni di sicurezza, impedendo la creazione di contenuti sensibili o inappropriati.