Cet outil, qui a été annoncé lors de l'événement annuel des développeurs de l'entreprise (Google I/O), est désormais disponible aux États-Unis pour le gadget Nest susmentionné. Une fois cette option activée, l'utilisateur pourra regarder l'écran et demander ce dont il a besoin.
Par exemple, lorsqu'il entre dans une pièce , l'utilisateur peut simplement regarder son Nest Hub Max et lui demander de lui rappeler un rendez-vous programmé ou de rechercher un type de données . Tout cela sans avoir à mettre le fameux "Ok, Google" en premier.
Selon Google, le changement vise à rendre les conversations avec le système plus naturelles.
Look and Talk est conçu pour être activé lorsque l'utilisateur active l'option sur son équipement. Les outils Face Match et Voice Match, intégrés à l'assistant, reconnaîtront l'identité de la personne. De cette façon, vous savez quand il est temps de vous réveiller et de répondre aux commandes reçues.
D'autre part, dans un souci de sécurité et de confidentialité, la société a précisé que la vidéo de ces interactions réalisées avec l'assistant est entièrement traitée sur l'appareil, par conséquent, les données ne sont partagées ni avec Google ni avec personne d'autre.
Commandes rapides uniquement par reconnaissance vocale
Le système a été amélioré afin que l'assistant puisse comprendre des commandes simples ou des phrases rapides telles que "allumer la lumière" ou "régler l'alarme" simplement en les écoutant et, dans ce cas également, sans que l'utilisateur ait à mettre l'expression "Ok, Google".
En d'autres termes, il suffira à l'utilisateur de dire ces phrases, sans même regarder le Hub, et le système effectuera l'action demandée. L'utilisateur a la possibilité d'activer ou de désactiver cette fonctionnalité de "phrases rapides". Si vous les activez, le système pourra répondre aux demandes lorsqu'il reconnaîtra la voix de l'utilisateur, grâce à Voice Match.
L'assistant reconnaît désormais également les doutes
En parlant, il est courant de faire des pauses ou des expressions de doute telles que "um" ou d'autres interjections qui indiquent que l'utilisateur prend du temps pour terminer sa phrase ou trouver le mot correct. Entre humains, cela est facile à traiter et à comprendre, mais ce n'est pas si simple pour les systèmes d'intelligence artificielle.
La nouveauté est que, grâce aux nouveaux développements mis en œuvre, Google Assistant pourra désormais comprendre ces pauses et expressions de doute dans le discours . Au cours de l'événement, des démonstrations pratiques ont été faites pour démontrer cette capacité et le système était capable d'interpréter ces espaces de silence de manière adéquate.
Dans les coulisses
Tout cela se passe en temps réel afin que l'appareil soit capable de capturer, de reconnaître l'utilisateur et de répondre ensuite à ses demandes.
Un autre point intéressant est que l'année dernière Real Tone a été intégré, un outil qui permet aux utilisateurs de mieux reconnaître les différents tons de peau .
Et dans le but d'approfondir la portée de cette option, l'échelle de tons Monk présentée lors de cet événement commencera à être utilisée, ce qui est une optimisation de cette fonction afin que les systèmes soient capables d'identifier encore mieux les diversités.
Des modèles de compréhension linguistique plus puissants
" Nous nous rapprochons de la fluidité des conversations en temps réel avec la puce Tensor, qui est conçue sur mesure pour gérer des tâches d'apprentissage automatique ultra-rapides sur l'appareil", ont-ils souligné de la société.
Petit à petit, l'assistant est capable de mieux comprendre les imperfections de la parole humaine, telles que les interruptions, les interjections de doute et d'autres éléments, ce qui permet d'avoir des conversations plus naturelles avec le système d'intelligence artificielle.
CONTINUER À LIRE:
Avec l'effervescence de la Copa América, plusieurs fans recherchent la meilleure façon de regarder les matchs sur leur Smart TV. L’une des meilleures alternatives est le mode football ou le mode sport.
WhatsApp a réuni une partie du casting de Modern Family pour jouer dans une nouvelle publicité axée sur la promotion de groupes entre familles utilisant à la fois des appareils iPhone et Android.
Au cours des dernières décennies, la technologie est non seulement devenue un outil de base, mais elle fait également partie de notre vie quotidienne, au point qu’il est presque impossible d’imaginer ce que serait d’accomplir des tâches sans elle.
Tether, la cryptomonnaie de type stablecoin qui prétend que chacun de ses tokens est adossé à un dollar américain, est émise par la société Tether Limited et depuis ses origines a été impliquée dans diverses controverses.
Pour les utilisateurs de WhatsApp souhaitant personnaliser leur expérience, l’activation du « mode cœur noir » est une excellente option. Ce mode remplace l’icône d’appel téléphonique standard (qui est généralement blanche) par l’emoji cœur noir.