Nelle ultime ore, il blog di Google dedicato alle ricerche realizzate all’interno dei propri laboratori ha pubblicato una notizia, passata un po’ inosservata ma molto importante per chi utilizzerà l’assistente vocale di Mountain View, Google Now, per le sue ricerche vocali o per la fase di dettatura dei testi.
Il comunicato in questione ha annunciato l’implementazione di alcune tecnologie che dovrebbero migliorare l’accuratezza del riconoscimento vocale, anche in situazione di forte rumore ambientale, sia a favore delle ricerche vocali che a favore del processo di dettatura, Nello specifico, alle tecnologie già esistenti, è stato affiancato il funzionamento di alcune reti neurali. Le reti neurali, per intenderci, simulano il funzionamento delle connessioni tra neuroni nel cervello umano e, quindi, sono in grado di conferire – ad un sistema informatico – la medesima capacità di ragionare.
Nel caso in questione, l’applicazione delle reti neurali al riconoscimento vocale permetterà di riconoscere non solo singoli fonemi ma la parole intere e di memorizzarle così da riconoscerle qualora queste parole medesime dovessero essere usati più avanti nel discorso (lo stesso o uno successivo).
Sempre nel medesimo comunicato si parla anche dell’applicazione di un’altra feature al riconoscimento vocale di Google Now. Si tratta del Connectionist Temporal Classification: in questo frangente, tale sistema non cerca di operare un riconoscimento, per i fonemi, per ogni istante di tempo ma elabora dei picchi acustici più ampi nei quali siano contenuti più fonemi.
Il risultato, in questo caso è che vengono eseguite meno elaborazioni ed ottenuto un riconoscimento vocale più simile a quello che avviene, nell’orecchio umano – e quindi nel cervello – quando vengono pronunciate naturalmente le parole di un discorso.
Una chicca rivelata dai tecnici di Google, infine, ha riguardato un trucchetto che hanno adottato per implementare ancor di più il riconoscimento vocale – ribadiamolo, anche in un contesto di forte rumore ambientale: in pratica il riconoscimento vocale è stato allungato di 300 millisecondi perché si era notato che le previsioni sulla reale entità delle parole funzionava meglio se si allungava un po’ di più il tempo di ascolto del fonema vocale.
Tutto questo, ora, è disponibile nel Google Now a disposizione degli utenti che potranno, finalmente, disporre di questo utile strumento di gestione per i loro device Android. Che dire…la guerra degli assistenti vocali sembra proprio entrata nel vivo!