Due novità rivoluzionarie nel campo dell’intelligenza artificiale: Microsoft Phi-3-vision e xAI Grok

Negli ultimi anni, l'intelligenza artificiale ha fatto passi da gigante, e recenti sviluppi da parte di Microsoft e xAI promettono di ampliare ulteriormente le sue capacità.

Due novità rivoluzionarie nel campo dell’intelligenza artificiale: Microsoft Phi-3-vision e xAI Grok

Negli ultimi anni, l’intelligenza artificiale ha fatto passi da gigante, trasformandosi da semplice curiosità tecnologica a componente essenziale in molteplici settori. Recentemente, due sviluppi significativi hanno attirato l’attenzione degli esperti e degli appassionati del settore: il lancio di Phi-3-vision di Microsoft e il progresso verso la multimodalità di Grok, l’AI di xAI fondata da Elon Musk. Questi sviluppi promettono di ampliare le capacità delle AI, rendendole più versatili e potenti. 

Durante l’evento Build 2024, Microsoft ha presentato Phi-3-vision, un nuovo modello di linguaggio della famiglia Phi-3 che porta l’intelligenza artificiale su un nuovo livello di comprensione. Phi-3-vision è un modello multimodale, il che significa che può elaborare non solo input testuali, ma anche immagini. Questo lo distingue nettamente dai suoi predecessori, che si concentravano esclusivamente sull’elaborazione del testo. 

Con 4.2 miliardi di parametri, Phi-3-vision si colloca a metà strada tra i modelli Phi-3 Mini e Phi-3 Small, offrendo un equilibrio tra complessità e capacità di elaborazione. Le applicazioni di Phi-3-vision sono molteplici: può rispondere a domande su grafici, analizzare immagini per fornire risposte a domande aperte e supportare attività di ragionamento visivo generale. Queste capacità lo rendono uno strumento prezioso per settori che vanno dalla ricerca scientifica all’analisi dei dati aziendali. 

Attualmente, Phi-3-vision è disponibile in versione preliminare, con una data di rilascio ufficiale ancora da definire. Tuttavia, gli altri modelli della famiglia Phi-3 sono già accessibili tramite il servizio Azure AI di Microsoft. Questo nuovo sviluppo rappresenta un passo avanti significativo nell’evoluzione delle capacità delle intelligenze artificiali, ampliando le possibilità di utilizzo in contesti complessi e multidisciplinari. 

Parallelamente, xAI, la compagnia fondata da Elon Musk, sta facendo grandi progressi con il suo chatbot Grok, che si sta preparando a diventare multimodale. Grok è stato introdotto per la prima volta nel novembre 2023 e ha già subito diversi aggiornamenti significativi. La versione 1.5, rilasciata a marzo, ha migliorato notevolmente le capacità di ragionamento e la memoria del chatbot, ma mancava ancora di funzionalità multimodali, un’area in cui Grok era nettamente svantaggiato rispetto ai suoi concorrenti. 

La nuova versione, Grok 1.5V, promette di colmare questa lacuna. xAI ha recentemente mostrato i progressi del suo sviluppo, rivelando che il chatbot sarà presto in grado di accettare e analizzare immagini oltre al testo. Questa evoluzione renderà Grok capace di comprendere documenti complessi, grafici, screenshot e fotografie, ampliando enormemente le sue applicazioni pratiche. L’addestramento del modello Grok si è basato esclusivamente su fonti pubblicamente disponibili, con l’intervento di revisori umani noti come AI Tutors per garantire l’accuratezza e la qualità delle informazioni. xAI ha anche assicurato che non sono stati utilizzati dati provenienti dal social network X, garantendo così un alto livello di trasparenza e rispetto della privacy degli utenti.

Continua a leggere su Fidelity News