Google continua a innovare il suo ecosistema integrando tecnologie all’avanguardia come Gemini e strumenti creativi avanzati come Veo e Imagen 3. Queste novità introducono un’IA più empatica e funzionale nell’Assistente Google, con voci naturali e nuove possibilità di interazione, e ridefiniscono la produzione di contenuti visivi tramite modelli intelligenti su Vertex AI. Con queste soluzioni, Google punta a migliorare la vita quotidiana degli utenti e a supportare aziende nella creazione di esperienze sempre più connesse e coinvolgenti.
Google potenzia l’Assistente con la tecnologia Gemini
Con l’introduzione dei modelli di linguaggio avanzati Gemini, Google sta trasformando il suo Assistente per offrire risposte più naturali, interazioni colloquiali e nuove funzionalità che migliorano l’esperienza utente su dispositivi smart e telefoni Android. Due aggiornamenti principali stanno iniziando a essere distribuiti, evidenziando un’evoluzione significativa: una nuova voce per l’Assistente e la possibilità di effettuare chiamate e inviare messaggi senza sbloccare il dispositivo.
Una nuova voce per risposte più naturali e coinvolgenti
Da agosto, Google aveva annunciato che avrebbe migliorato l’Assistente Google sugli smart speaker e display utilizzando le capacità dei modelli Gemini. Questo cambiamento è ora in fase di distribuzione per alcuni utenti, con una nuova voce più calorosa e naturale attiva su determinati comandi. Ad esempio, i dispositivi Nest, come Nest Mini, utilizzano ancora la voce tradizionale per domande semplici, come “che tempo fa“. Tuttavia, per richieste più colloquiali, come “What’s up?“, l’Assistente risponde con una voce basata su Gemini, progettata per un dialogo più interattivo e un tono più amichevole.
Google ha sviluppato un set personalizzato di voci per questa funzione, che non sono presenti in Gemini Live. Queste voci mirano a creare una comunicazione più empatica, incoraggiando conversazioni più lunghe tramite domande di follow-up. In futuro, è previsto un ampliamento di queste capacità, rendendo le risposte più dettagliate e capaci di riassumere argomenti complessi in modo chiaro.
Gemini si apre alla trasparenza: le fonti saranno finalmente visibili
Google sta lavorando per rendere Gemini più trasparente, introducendo una funzione che permetterà agli utenti di verificare facilmente le fonti utilizzate dall’IA per generare risposte. Questa nuova opzione, individuata nel codice beta dell’app Google, prevede una sezione dedicata alle fonti alla fine di ogni AI Overview. In questo modo, sarà possibile controllare rapidamente l’affidabilità delle informazioni, eliminando la necessità di ricerche manuali e rafforzando la fiducia nell’uso dell’IA. Un passo avanti significativo per avvicinare Gemini al livello di trasparenza già offerto da Google Search.
Effettua chiamate e invia messaggi senza sbloccare il telefono
Un’altra novità che sta rendendo Gemini sempre più centrale nell’ecosistema Android è la funzione “Effettua chiamate e invia messaggi senza sbloccare“. Questa impostazione, attualmente in fase di rilascio graduale, consente di effettuare chiamate e inviare messaggi direttamente dalla schermata di blocco. Disponibile nelle Impostazioni Gemini, questa funzionalità richiede l’attivazione delle app di chiamata e messaggistica associate all’Assistente. Una volta configurata, permette di eseguire queste operazioni in modo rapido e sicuro, senza la necessità di sbloccare manualmente il dispositivo.
Questa novità rappresenta un passo avanti significativo per migliorare l’efficienza e la comodità nell’utilizzo di Gemini come assistente telefonico. Pur essendo legata a estensioni specifiche, l’implementazione non richiede aggiornamenti hardware e funziona su un numero crescente di dispositivi con la versione beta 15.48 dell’app Google.
Google Cloud ridefinisce la creatività: ecco Veo e Imagen 3 su Vertex AI
Google Cloud ha lanciato oggi due strumenti rivoluzionari per la generazione di contenuti multimediali tramite l’IA: Veo e Imagen 3. Disponibili su Vertex AI, queste tecnologie permettono di creare video a partire da prompt testuali o immagini, oltre a generare immagini ad alta qualità. Veo, disponibile inizialmente in preview, si distingue come il primo modello hyperscaler per la trasformazione da immagine a video, offrendo filmati fluidi e realistici con 24 o 30 FPS. Con una comprensione profonda del linguaggio naturale e della semantica visiva, Google punta a supportare aziende in settori come pubblicità, marketing, educazione e molto altro, ridefinendo il modo in cui si realizzano contenuti creativi.