Bluesky e la privacy violata: i tuoi post usati per addestrare le AI senza consenso

I contenuti pubblicati su Bluesky sono spesso utilizzati senza autorizzazione per addestrare modelli di intelligenza artificiale, sollevando dubbi etici e legali.

Bluesky e la privacy violata: i tuoi post usati per addestrare le AI senza consenso

Bluesky, la piattaforma social emergente e alternativa a X (ex Twitter), è recentemente finita al centro di un acceso dibattito. Nonostante sia apprezzata per la sua natura decentralizzata e l’approccio innovativo, una questione di fondo sta destando preoccupazioni tra gli utenti: i contenuti pubblicati sono spesso utilizzati senza autorizzazione per addestrare modelli di intelligenza artificiale.

La polemica ha preso piede quando Daniel van Strien, esperto di machine learning di Hugging Face, ha pubblicato un dataset contenente un milione di post provenienti da Bluesky. Hugging Face è una piattaforma open-source per lo sviluppo di modelli AI, e i suoi dataset sono liberamente accessibili. L’iniziativa ha generato una forte reazione negativa: van Strien ha rimosso il dataset e si è scusato per aver agito senza trasparenza né consenso. Tuttavia, l’episodio ha evidenziato quanto sia facile per chiunque raccogliere e utilizzare i post degli utenti di Bluesky senza restrizioni.

La natura aperta della piattaforma consente agli sviluppatori di creare dataset, anche di enormi dimensioni. Tra questi, uno particolarmente provocatorio chiamato “gay sex” ha raccolto quasi 300 milioni di post, accompagnato da una descrizione che deride gli utenti preoccupati per la propria privacy.

Sebbene molti di questi dataset siano caotici e poco utili per fini di addestramento AI, il problema principale rimane: i dati degli utenti, spesso non anonimizzati, sono vulnerabili e accessibili a chiunque. Altri sviluppatori, come Alpine Dale e Alim Maasoglu, hanno creato raccolte più piccole e con finalità di ricerca. In questi casi, almeno, i dati sono stati anonimizzati per proteggere la privacy degli utenti. Tuttavia, la questione legale è complessa.

Secondo gli esperti, il semplice trattamento di dati personali non vincola automaticamente chi li utilizza alle norme del GDPR, il regolamento europeo sulla protezione dei dati. La conformità dipende dall’ambito materiale e territoriale del trattamento: non sempre chi raccoglie o utilizza dati da Bluesky è soggetto alle regole europee, specialmente se l’operazione avviene al di fuori del territorio UE.

Continua a leggere su Fidelity News