OpenAI utilizza oltre un milione di ore di video di YouTube per addestrare il suo modello di intelligenza artificiale

OpenAI ha utilizzato oltre un milione di ore di video di YouTube per addestrare il suo modello GPT-4, sollevando domande sulla privacy e sull'etica dell'uso dei dati.

OpenAI utilizza oltre un milione di ore di video di YouTube per addestrare il suo modello di intelligenza artificiale

OpenAI ha compiuto un passo significativo nell’ambito dell’intelligenza artificiale utilizzando oltre un milione di ore di video di YouTube per addestrare il suo modello di intelligenza artificiale, noto come GPT-4.

Questo sforzo massiccio di acquisizione e analisi dei dati è stato riportato dal New York Times, sottolineando che OpenAI era consapevole della questione legale, ma riteneva che fosse un utilizzo lecito. Secondo il rapporto, il presidente di OpenAI, Greg Brockman, ha avuto un coinvolgimento diretto nella raccolta dei video utilizzati per l’addestramento del modello. Tuttavia, la società ha sottolineato che utilizza una varietà di fonti dati, tra cui dati pubblici e partenariati per dati non pubblici, per mantenere la sua competitività nella ricerca globale sull’intelligenza artificiale.

Google, proprietaria di YouTube, ha risposto affermando di aver ricevuto segnalazioni non confermate sull’attività di OpenAI. La società ha anche chiarito che sia il file robots.txt che i Termini di servizio di YouTube proibiscono lo scraping o il download non autorizzato di contenuti dal sito.

Questo non è il primo rapporto che solleva preoccupazioni sull’utilizzo di dati da parte di OpenAI. L’anno scorso, The Information ha rivelato che OpenAI ha addestrato alcuni dei suoi modelli di intelligenza artificiale utilizzando dati prelevati da YouTube, eliminando il marchio di riconoscimento dei dati. YouTube rappresenta una delle più grandi e ricche fonti di dati multimediali e testuali sul web, offrendo un’enorme quantità di immagini, audio e trascrizioni di testo.

Tuttavia, l’utilizzo di tali dati per l’addestramento dei modelli di intelligenza artificiale solleva domande riguardo alla privacy, alla proprietà dei dati e alla conformità legale. In sintesi, l’impiego di oltre un milione di ore di video di YouTube da parte di OpenAI per addestrare il suo modello di intelligenza artificiale rappresenta un’impresa ambiziosa che solleva importanti questioni etiche e legali nel campo della raccolta e dell’utilizzo dei dati. Questo scenario evidenzia la necessità di regolamentazioni chiare e di un dialogo aperto tra le aziende tecnologiche, le istituzioni normative e il pubblico per garantire un uso etico e responsabile dell’intelligenza artificiale.

Continua a leggere su Fidelity News