OpenAI lancia Operator: l’agente AI che naviga e interagisce al posto tuo

OpenAI ha introdotto Operator, un agente AI in grado di navigare autonomamente sul web, interagendo con le interfacce e svolgendo compiti al posto dell'utente, con un focus su flessibilità, sicurezza e privacy.

OpenAI lancia Operator: l’agente AI che naviga e interagisce al posto tuo

OpenAI ha recentemente introdotto Operator, un innovativo agente basato sull‘intelligenza artificiale che permette di navigare sul web e svolgere attività al posto dell’utente. Questo strumento, attualmente disponibile per gli utenti “Pro” negli Stati Uniti, rappresenta un importante passo verso l’automazione delle operazioni online. L’obiettivo di Operator è semplificare i flussi di lavoro complessi e ridurre il carico di compiti ripetitivi, che sia per uso personale o aziendale.

Operator si fonda sul modello Computer-Using Agent (CUA), una tecnologia che unisce le capacità visive di GPT-4 con un sofisticato sistema di ragionamento. Grazie a questa combinazione, l’agente è in grado di “vedere” le schermate del browser e interagire con gli elementi dell’interfaccia, come pulsanti, menu e campi di testo, replicando azioni tipiche di un utente umano. Ciò consente all’agente di eseguire operazioni come cliccare, scorrere e digitare, senza la necessità di API specifiche per piattaforme o sistemi operativi.

Il funzionamento di Operator si basa su un processo iterativo che prevede tre fasi principali. Prima di tutto, l’agente acquisisce uno screenshot dell’interfaccia per raccogliere informazioni sullo stato attuale del sistema. Poi, analizza questi dati per pianificare le operazioni successive, tenendo conto di ciò che è già stato fatto. Infine, esegue le azioni necessarie, come cliccare, scorrere o digitare, per completare il compito. Se l’operazione richiede l’inserimento di dati sensibili, come credenziali o la conferma di un acquisto, Operator chiederà il permesso all’utente prima di procedere.

Nonostante la sua autonomia, Operator è progettato per collaborare strettamente con l’utente. Il sistema permette agli utenti di mantenere il controllo su operazioni delicate o situazioni in cui l’agente potrebbe non essere in grado di prendere decisioni autonome. Per esempio, l’agente non eseguirà operazioni bancarie o altre attività ad alto rischio senza prima chiedere conferma all’utente. Inoltre, è stato sviluppato con misure di sicurezza per proteggere da tentativi di manipolazione come attacchi di prompt injection o phishing.

Operator è anche in grado di rilevare e ignorare contenuti sospetti, bloccando l’esecuzione di operazioni pericolose. La privacy degli utenti è una priorità per OpenAI, che ha implementato opzioni per cancellare la cronologia di navigazione e disattivare l’uso dei dati personali per l’addestramento del modello. Questo garantisce che gli utenti possano mantenere il controllo completo su come vengono gestiti i loro dati.

Nonostante il potenziale, Operator è ancora in fase di sviluppo e presenta alcune sfide. Ad esempio, l’agente potrebbe non essere in grado di gestire interfacce particolarmente complesse o compiti non standardizzati. Le sue prestazioni dipendono anche dalla qualità delle istruzioni fornite dall’utente. In alcuni test, Operator ha ottenuto buoni risultati, come un successo del 58,1% su WebArena e dell’87% su WebVoyager, test che misurano la capacità di completare compiti reali sui browser. Tuttavia, resta ancora distante dalle capacità di un essere umano, soprattutto in situazioni più complicate.

Il futuro di Operator prevede un ampliamento dell’accesso, inizialmente destinato agli utenti Plus, Team ed Enterprise. OpenAI prevede anche di integrare Operator direttamente in ChatGPT, permettendo una gestione ancora più fluida delle operazioni online. Inoltre, CUA verrà reso disponibile tramite API, consentendo agli sviluppatori di creare agenti personalizzati per esigenze specifiche. Con il continuo miglioramento, Operator potrebbe rivoluzionare il modo in cui interagiamo con il web, semplificando compiti quotidiani e offrendo soluzioni innovative per aziende e privati.

Continua a leggere su Fidelity News