Il 31 marzo 2025, Amazon ha lanciato un’innovazione che potrebbe cambiare il panorama dell’intelligenza artificiale e degli assistenti vocali. Il gigante dell’e-commerce ha presentato Nova Act, un agente AI avanzato in grado di interagire autonomamente con i browser web, compiendo azioni quotidiane e semplici per gli utenti.
Questa mossa segna un passo importante nel campo della tecnologia AI agentica, con l’azienda che si prepara a competere con altre realtà di spicco come OpenAI e Anthropic. Nova Act è progettato per essere un agente AI versatile, capace di svolgere compiti automatizzati che normalmente richiederebbero l’intervento umano. Una delle principali caratteristiche di Nova Act è la sua capacità di interagire autonomamente con il web: può visitare pagine, compilare moduli, selezionare date e, in generale, portare a termine una serie di azioni quotidiane senza bisogno di un intervento diretto dell’utente.
Questo nuovo sistema è stato sviluppato nel laboratorio AGI di Amazon a San Francisco, che è stato fondato da alcuni ex ricercatori di OpenAI, tra cui David Luan e Pieter Abbeel. Questi esperti, che hanno precedentemente creato startup come Adept e Covariant, sono ora impegnati nell’obiettivo di spingere l’intelligenza artificiale verso nuove frontiere, con un focus particolare sul miglioramento degli agenti AI. L’innovazione più interessante di Nova Act riguarda la sua integrazione con Alexa, l’assistente vocale di Amazon. La nuova versione Alexa+ sarà potenziata dall’intelligenza artificiale generativa, che permetterà agli utenti di interagire con il dispositivo in modo molto più sofisticato rispetto a quanto avveniva in precedenza.
In pratica, Nova Act non solo permetterà a Alexa di rispondere a comandi vocali, ma anche di eseguire compiti specifici per conto dell’utente, come prenotare cene, ordinare cibo o completare altre azioni online, il tutto in modo autonomo.Il lancio di Nova Act segna il punto di partenza di un nuovo capitolo per gli assistenti vocali e gli agenti AI, in cui la loro capacità di eseguire compiti più complessi e autonomi sarà fondamentale per attrarre nuovi utenti.
La sua funzionalità si basa su un potente SDK (Software Development Kit), che permetterà agli sviluppatori di creare e testare prototipi di agenti AI in grado di automatizzare azioni basilari. Questo toolkit è già disponibile tramite il sito web ufficiale di Amazon, nova.amazon.com, che fungerà anche da piattaforma per ulteriori aggiornamenti e nuove versioni del modello Nova. Amazon sta cercando di consolidare la sua posizione nel campo dell’intelligenza artificiale, dove si sta confrontando con giganti come OpenAI e Anthropic. Nova Act si propone di competere con prodotti simili come Operator di OpenAI e Computer Use di Anthropic.
Nonostante Amazon non sia la prima ad introdurre una tecnologia in grado di navigare nel web autonomamente, l’integrazione di Nova Act in Alexa+ potrebbe darle un vantaggio significativo, poiché il colosso dell’e-commerce già possiede una base utenti enorme. I test interni eseguiti su Nova Act hanno dimostrato che il sistema supera altre soluzioni concorrenti in termini di prestazioni. Un esempio di ciò è il test ScreenSpot Web Text, in cui Nova Act ha ottenuto un punteggio del 94%, superando agenti di OpenAI e Anthropic. Questi risultati confermano le potenzialità di Nova Act, che potrebbe diventare uno strumento indispensabile per l’automazione di compiti semplici e ripetitivi.
La creazione di Nova Act è solo un piccolo tassello nel grande progetto di Amazon per l’intelligenza artificiale generica (AGI). David Luan, uno dei fondatori del laboratorio AGI, ha dichiarato che il loro obiettivo finale è quello di sviluppare un sistema AI che possa “fare qualsiasi cosa un umano fa su un computer“. In altre parole, l’AGI non si limita a compiti specifici, ma mira a realizzare una forma di intelligenza artificiale in grado di adattarsi e compiere qualsiasi tipo di azione, proprio come un essere umano. L’introduzione di Nova Act, quindi, potrebbe essere vista come un passo fondamentale verso il raggiungimento di una vera intelligenza artificiale generica. L’adozione di un agente AI che possa eseguire attività pratiche come ordinare cibo o prenotare un appuntamento è solo l’inizio di un processo che, nel tempo, potrebbe espandersi per coprire una vasta gamma di compiti più complessi.