Google ha lanciato uno strumento innovativo chiamato Audio Overview, che utilizza l’intelligenza artificiale per generare podcast realistici basati sui contenuti forniti dagli utenti tramite NotebookLM. Questo strumento è alimentato dal potente modello Gemini 1.5 di Google e permette di creare podcast automatici su qualsiasi argomento, trasformando contenuti come link, video, PDF e testi in conversazioni vocali tra due presentatori, uno maschile e uno femminile. Nonostante sia ancora limitato alla lingua inglese, la qualità dei podcast generati è sorprendentemente realistica, al punto che è difficile distinguere le voci artificiali da quelle umane.
Gli utenti possono caricare vari tipi di contenuti su NotebookLM e fare domande per ottenere risposte in formato podcast. Il sistema crea una conversazione fluida e naturale tra due presentatori, che discutono del materiale caricato in modo molto simile a un vero podcast. Le voci non solo parlano in modo coerente e chiaro, ma imitano anche le caratteristiche tipiche di una conversazione umana: pause, intercalari e persino lievi interruzioni, rendendo il tutto incredibilmente credibile.
Diversi esempi sono già disponibili online, e la qualità è tale che è facile scambiare i podcast generati per vere conversazioni tra persone. La tecnologia non si limita a rispondere in modo automatico, ma ricrea l’esperienza di un vero dialogo tra due conduttori di un podcast. L’intelligenza artificiale riesce a gestire ogni aspetto del flusso della conversazione, dal ritmo delle battute alla coerenza delle risposte.
L’introduzione di Audio Overview ha già dato vita a una vasta gamma di contenuti. Ad esempio, Allie K. Miller, consulente AI, ha usato questo strumento per creare un podcast che riassume e discute Il Grande Gatsby di F. Scott Fitzgerald, offrendo un aiuto prezioso a studenti e appassionati. La versatilità dello strumento consente di affrontare qualsiasi argomento, dalle opere letterarie ai temi più tecnici. Un altro esempio viene dal ricercatore Aaditya Ura, che ha caricato il codice dell’architettura Llama-3 di Meta su NotebookLM e ha creato un podcast di divulgazione scientifica, associando anche immagini al contenuto per facilitarne l’apprendimento. Lo strumento permette infatti di integrare vari elementi per creare contenuti più coinvolgenti, come dimostra il podcaster Alex Volkov, che ha sintetizzato gli annunci del Dev Day di OpenAI in un episodio del suo show Deep Dive. Non solo professionisti, ma anche utenti comuni hanno sperimentato lo strumento, generando conversazioni curiose e, in alcuni casi, surreali.
Un esempio divertente è quello di un podcast in cui le voci create dall’intelligenza artificiale si rendono conto di essere entità generate, dando vita a un dialogo dai toni ironici e quasi esistenziali. Altri utenti, invece, hanno utilizzato lo strumento per creare contenuti più leggeri e grotteschi, giocando con temi ridicoli come “fart” e “poop”. Il lancio di Audio Overview solleva domande importanti per il futuro della creazione di contenuti. Se l’intelligenza artificiale è in grado di generare podcast realistici e di alta qualità, quale sarà il ruolo dei podcaster tradizionali?
Per molti, questo strumento rappresenta una minaccia per il lavoro umano, dato che può creare in pochi minuti ciò che richiederebbe ore di preparazione e registrazione a un vero team di produzione. Al contempo, ci sono coloro che vedono in Audio Overview un’opportunità: non come sostituto del lavoro umano, ma come strumento di supporto per semplificare la produzione di contenuti e raggiungere un pubblico più ampio. Resta da vedere come questa tecnologia si evolverà, ma è certo che il futuro dei podcast, e della creazione di contenuti in generale, sarà fortemente influenzato dall’intelligenza artificiale.