Google I/O 2024: valanga di novità con focus sull’intelligenza artificiale

L'evento Google I/O 2024 si è concentrato sull'intelligenza artificiale, presentando diverse innovazioni come Gemini 1.5 Flash e Gemini Live, che rendono l'IA più accessibile e potente per gli sviluppatori.

Google I/O 2024: valanga di novità con focus sull’intelligenza artificiale

L’evento Google I/O 2024, sfrondato del già noto Pixel 8a, si è concentrato in quel di Mountain View sull’intelligenza artificiale, con l’amministratore delegato di Google, Sundar Pichai, che in apertura ha parlato formalmente di una “Gemini Era” in cui il suo gruppo è ufficialmente entrato. 

Gemini a tutto gas: focus su Gemini 1.5 Flash e Gemini Live

Il tool di elaborazione delle informazioni critiche NotebookLM ora userà Gemini 1.5 Pro.   Le novità su Gemini non finiscono mica qui. Google ha presentato Gemini 1.5 Flash, un nuovo membro della famiglia Gemini di intelligenza artificiale progettato per essere più veloce ed efficiente, rendendo l’AI più accessibile agli sviluppatori. Utilizzando un processo di “distillazione”, Gemini 1.5 Flash trasferisce le conoscenze essenziali del modello Gemini 1.5 Pro in una versione più leggera e compatta. Pur essendo pensato per attività come riassunti, conversazioni in chat e altro, Gemini 1.5 Flash mantiene la potenza del modello Pro, consentendo agli sviluppatori di creare prodotti e servizi di intelligenza artificiale con maggiore facilità. Parallelamente, Google ha anche annunciato aggiornamenti per Gemini 1.5 Pro, migliorando le sue capacità di scrittura del codice e analisi di audio e immagini. Con l’introduzione di Gemini 1.5 Flash e gli aggiornamenti a Gemini 1.5 Pro, Google si impegna a rendere l’intelligenza artificiale più accessibile e potente per gli sviluppatori, aprendo nuove possibilità per la creazione di innovative applicazioni e servizi. D’altro canto, Gemini 1.5 avrà ora comunque sino a 2 milioni di token, potendo fare ben di più. 

Con l’avvento sempre più pervasivo dell’intelligenza artificiale, Google sta ridefinendo l’interazione con gli assistenti virtuali attraverso Gemini Live, una nuova esperienza mobile che promette conversazioni naturali con l’IA direttamente sugli smartphone. Durante il Google I/O di oggi, l’azienda ha presentato Gemini Live come una svolta significativa nell’ambito delle interazioni con l’IA. Mentre negli ultimi tempi la corsa all’intelligenza artificiale sembrava focalizzata principalmente sull’input di testo e sulle immagini, Google ha colto l’opportunità di portare le conversazioni con gli assistenti virtuali a un livello superiore. Gemini Live offre una serie di potenziali utilizzi: potrebbe essere un prezioso alleato per chi si prepara a un colloquio di lavoro, fornendo domande pertinenti alla posizione e consigli per affrontarle al meglio. Allo stesso modo, potrebbe offrire supporto a chi deve affrontare una pubblica presentazione, fornendo suggerimenti e informazioni utili per il discorso. Ciò che rende unico Gemini Live è la sua capacità di adattarsi al ritmo e allo stile di conversazione dell’utente. Grazie a questa caratteristica, l’interazione con l’IA diventa più fluida e naturale, simile a una conversazione con un essere umano piuttosto che a un semplice scambio con un assistente vocale. L’introduzione di Gemini Live rappresenta un passo avanti significativo nell’evoluzione degli assistenti virtuali, aprendo la strada a un’interazione più intuitiva e personalizzata con l’intelligenza artificiale. Al momento, Gemini Live sarà disponibile esclusivamente per gli abbonati a Gemini Advanced, con la promessa di essere reso accessibile a un pubblico più ampio nei prossimi mesi.

Google Foto e la funzione Ask Photos

Molte novità di quest’evento hanno riguardato il multidiale. Google “Ask Photos” segna un passo avanti nell’evoluzione di Google Foto grazie all’implementazione dell’intelligenza artificiale Gemini. Questa nuova funzione, annunciata durante la conferenza I/O per sviluppatori da Sundar Pichai, CEO di Google, promette di rendere il ritrovamento e la rivisitazione dei ricordi fotografici un’esperienza più intuitiva e coinvolgente. Disponibile inizialmente per gli abbonati a Google One negli Stati Uniti, “Chiedi a Foto” sfrutta le capacità di Gemini per interpretare le domande degli utenti in linguaggio naturale e fornire risposte pertinenti, rendendo più semplice che mai trovare foto specifiche o creare album tematici. Con un’attenzione particolare alla sicurezza e alla privacy dei dati degli utenti, Google assicura che le conversazioni con “Chiedi a Foto” non vengono memorizzate e che l’elaborazione avviene nel cloud, garantendo la massima riservatezza. Grazie a questa integrazione, Google Foto si trasforma da un semplice archivio di immagini a uno strumento completo per rivivere i ricordi in modo più significativo e senza sforzo.

Creazione multimediale: Veo, Imagen 3, e Music AI Sandbox 

Passiamo dalla fruizione alla creazione multimediale agevolata di immagini, video e audio. In tal senso, Google ha da offrire tre novità AI based.  In primis, Veo è una rivoluzionaria innovazione nel campo della creazione video, consentendo di generare filmati in alta definizione (1080p) a partire da semplici descrizioni testuali. Grazie alla sua avanzata capacità di comprensione del linguaggio naturale e della semantica visiva, Veo è in grado di produrre video di oltre un minuto di durata, che includono anche tecniche cinematografiche come il timelapse. Questo strumento rappresenta una sfida diretta a Sora di OpenAI, ponendosi come un concorrente di rilievo nel panorama dell’intelligenza artificiale applicata alla produzione di contenuti visivi. Per evidenziare le potenzialità di Veo e per rassicurare gli artisti sul fatto che l’IA non intende sostituire la loro creatività, Google ha collaborato con il celebre Donald Glover e il suo studio creativo Gilga. Sebbene i risultati di questa partnership non siano stati ancora resi pubblici, le aspettative sono alte, poiché si prevede che possano portare a contenuti innovativi e stimolanti. Tra le caratteristiche distintive di Veo vi è la capacità di simulare la fisica del mondo reale in modo più realistico rispetto ai modelli precedenti, consentendo la creazione di video più coinvolgenti e autentici. Inoltre, il rendering dei video in alta definizione è stato notevolmente migliorato, garantendo una qualità visiva superiore. Resta da vedere se il pubblico accoglierà con entusiasmo i video generati dall’IA, ma Google è ottimista riguardo alle potenzialità di Veo e punta a integrarlo in strumenti come VideoFX e YouTube Shorts, offrendo agli utenti una nuova ed entusiasmante esperienza nella creazione e condivisione di contenuti video.

Imagen 3 rappresenta l’ultima frontiera nell’evoluzione del modello di Google per la generazione di immagini a partire da testo. L’azienda promette una qualità senza precedenti, caratterizzata da un incredibile livello di dettaglio, che si traduce in immagini fotorealistiche e realistiche, con una minore presenza di artefatti. La sfida principale per Imagen 3 sarà il confronto con altri modelli di intelligenza artificiale come Dall-E 3 di OpenAI e soluzioni come Stable Diffusion o Midjourney, soprattutto per quanto riguarda la gestione dei prompt testuali. Google dichiara di aver potenziato la comprensione del testo e la capacità di elaborare dettagli anche in prompt più lunghi, anticipando una competizione accesa nel settore della generazione di immagini mediante IA. Con l’obiettivo di superare gli standard esistenti e fornire agli utenti risultati sempre più sorprendenti, Imagen 3 si propone di ridefinire i limiti della creatività visiva attraverso l’intelligenza artificiale. La sua capacità di produrre immagini fotorealistiche e dettagliate apre nuove opportunità nel campo della produzione di contenuti visivi, offrendo agli utenti la possibilità di esprimere la propria creatività e ottenere risultati mozzafiato con una semplice descrizione testuale.

Google ha ampliato ulteriormente il suo arsenale di strumenti basati sull’intelligenza artificiale presentando Music AI Sandbox durante l’evento I/O. Questa suite di strumenti è progettata per agevolare la creazione musicale utilizzando algoritmi avanzati, aprendo le porte a un nuovo mondo di possibilità nel campo della produzione musicale. Collaborando con artisti di fama mondiale come Wyclef Jean e Bjorn, Google ha testato Music AI Sandbox per mostrare il suo potenziale nel generare musica creativa e innovativa. I demo prodotti durante questa collaborazione anticipano un futuro ricco di possibilità per la musica generata dall’intelligenza artificiale, suggerendo che gli artisti potranno sfruttare queste tecnologie per esplorare nuove frontiere musicali e accrescere la loro creatività. Le novità presentate da Google a I/O evidenziano i notevoli progressi nell’ambito dell’intelligenza artificiale e il suo potenziale per trasformare radicalmente il modo in cui vengono creati i contenuti multimediali. Tuttavia, resta da vedere se l’intelligenza artificiale sarà in grado di generare musica con una vera “anima” e se i suoi progressi si tradurranno in un miglioramento tangibile della nostra esperienza musicale.

Project Astra: l’AI ora ha gli occhi

Restiamo nel multimediale. Google sta portando l’intelligenza artificiale (IA) al livello successivo con Project Astra, un’app che integra l’assistente AI direttamente nella fotocamera dello smartphone. Questa innovazione consente all’IA di Gemini di “vedere” il mondo circostante attraverso la fotocamera, per identificare oggetti nell’ambiente circostante, dalle semplici stringhe di codice sullo schermo ai pastelli su un tavolo. Ma le capacità di Project Astra vanno oltre il riconoscimento degli oggetti: è possibile assegnare all’assistente AI compiti creativi o pratici, come creare un’allitterazione sui pastelli o aiutare a trovare oggetti smarriti. Inoltre, il trailer suggerisce la possibilità di utilizzare occhiali tech che lavorano in sinergia con Project Astra. Questi occhiali sono dotati di una fotocamera integrata nella cornice delle lenti, consentendo agli utenti di interagire con l’IA senza l’uso dello smartphone e lasciando loro le mani libere. Sebbene il design degli occhiali presentati nel trailer sembri ancora grezzo, potrebbero rappresentare un’anteprima delle future applicazioni di Project Astra nel mondo degli occhiali smart. Non possiamo escludere la possibilità che Google stia preparando il terreno per il lancio di nuovi occhiali intelligenti, una mossa che ricorda il tentativo di commercializzare i Google Glass sette anni fa. Tuttavia, questa volta, con l’avanzamento dell’IA e delle tecnologie di visione artificiale, potremmo assistere a una nuova era di dispositivi indossabili più sofisticati e funzionali.

Google Search e Google Meet

Google Search sta per subire una trasformazione epocale grazie all’intelligenza artificiale (IA), che lo renderà molto più di un semplice motore di ricerca. Durante la conferenza I/O per gli sviluppatori, Google ha annunciato una serie di innovazioni volte a migliorare l’esperienza di ricerca degli utenti, fornendo risposte complete direttamente dalle query e aiutandoli nella pianificazione di eventi e nella ricerca di idee. Al cuore di questa rivoluzione c’è Panoramica IA, una funzione che mostrerà risposte generate dall’IA in cima ai risultati di ricerca per la maggior parte delle query. Questa funzionalità, ora accessibile a centinaia di milioni di utenti negli Stati Uniti e presto estesa ad altri Paesi, mira a fornire risposte rapide e complete direttamente dalla pagina dei risultati di ricerca. Per alcune ricerche specifiche, come ristoranti, ricette, film, musica e libri, Google introdurrà una nuova pagina di risultati organizzata dall’IA. Questa funzione, pensata per fornire idee e ispirazione, utilizzerà l’IA per generare un layout intuitivo e facilitare la navigazione dell’utente attraverso i risultati di ricerca. Gli utenti che si iscrivono a Search Labs avranno accesso a funzionalità ancora più avanzate, come la capacità di semplificare il linguaggio in Panoramica IA o porre domande complesse ottenendo risposte esaustive su una singola pagina. Search Labs offrirà anche strumenti per la pianificazione di pasti e viaggi, consentendo agli utenti di creare piani alimentari personalizzati o trovare idee per le vacanze. Infine, Google sta lavorando su una funzione innovativa che permetterà agli utenti di utilizzare un video come query di ricerca, aprendo a nuove possibilità per la ricerca online e l’accesso ai contenuti multimediali. Non meno importante sarà il fatto che Google Meet fornirà riepiloghi sulle riunioni, basate sull’intelligenza artificiale.

 

 

Continua a leggere su Fidelity News