Google-Extended: un nuovo strumento per proteggere i dati degli editori dall’intelligenza artificiale

Google-Extended è uno strumento che permette agli editori di siti web di impedire che i loro dati vengano usati per addestrare l’intelligenza artificiale di Google, pur rimanendo indicizzati nella ricerca.

Google-Extended: un nuovo strumento per proteggere i dati degli editori dall’intelligenza artificiale

Google ha appena annunciato che offrirà agli editori di siti web un modo per rinunciare all’utilizzo dei propri dati per addestrare i modelli di intelligenza artificiale dell’azienda pur rimanendo accessibili tramite Ricerca Google. Il nuovo strumento, chiamato Google-Extended, consente ai siti di continuare a essere analizzati e indicizzati da crawler come Googlebot evitando che i loro dati vengano utilizzati per addestrare modelli di intelligenza artificiale man mano che si sviluppano nel tempo.

La società afferma che Google-Extended consentirà agli editori di “gestire se i loro siti aiutano a migliorare le API generative Bard e Vertex AI“, aggiungendo che gli editori web possono utilizzare l’interruttore per “controllare l’accesso ai contenuti su un sito“. Google ha confermato a luglio che sta addestrando il suo chatbot AI, Bard, sui dati pubblicamente disponibili recuperati dal web. Google-Extended è disponibile tramite robots.txt, noto anche come file di testo che informa i web crawler se possono accedere a determinati siti.

Google osserva che “con l’espansione delle applicazioni AI“, continuerà a esplorare “ulteriori approcci leggibili dalle macchine alla scelta e al controllo per gli editori web” e che presto avrà altro da condividere. Molti siti si sono già mossi per bloccare il web crawler che OpenAI utilizza per raccogliere dati e addestrare ChatGPT, tra cui The New York Times, CNN, Reuters e Medium. Tuttavia, ci sono state preoccupazioni su come bloccare Google.

Dopotutto, i siti web non possono chiudere completamente i crawler di Google, altrimenti non verranno indicizzati nei risultati di ricerca. Ciò ha portato alcuni siti, come il New York Times, a bloccare legalmente Google, aggiornando invece i propri termini di servizio per vietare alle aziende di utilizzare i loro contenuti per addestrare l’intelligenza artificiale. Ma ora, con Google-Extended, gli editori hanno una nuova opzione per proteggere i propri dati senza perdere la visibilità online. Questo potrebbe essere particolarmente utile per i siti che producono contenuti originali, creativi o sensibili che non vogliono essere copiati o manipolati da modelli di intelligenza artificiale. Ad esempio, un sito web letterario potrebbe voler impedire che le sue poesie o storie vengano utilizzate per generare testi falsi o plagiati.

Oppure, un sito web giornalistico potrebbe voler evitare che le sue notizie vengano distorte o alterate da modelli di intelligenza artificiale che potrebbero avere scopi maliziosi o disinformanti. Google-Extended è una mossa positiva da parte di Google per riconoscere i diritti degli editori sulle proprie opere e per dare loro maggiore controllo su come vengono utilizzate le loro informazioni. Tuttavia, resta da vedere quanto sarà efficace questo strumento nel prevenire l’uso improprio dei dati da parte dell’intelligenza artificiale e se altri motori di ricerca seguiranno l’esempio di Google. Inoltre, gli editori dovrebbero essere consapevoli dei potenziali svantaggi di rinunciare all’utilizzo dei propri dati per addestrare l’intelligenza artificiale, come la perdita di opportunità di collaborazione o innovazione. In definitiva, gli editori dovranno valutare attentamente i pro e i contro di Google-Extended prima di decidere se utilizzarlo o meno.

 

Continua a leggere su Fidelity News