X

Vous n'êtes pas connecté

Maroc Maroc - INFORMATICIEN.BE - Actualités - 14/May 20:43

Le nouvel assistant visuel de Google semble terriblement interactif, peut-être trop interactif pour être vrai

Il s'appelle Project Astra et promet de devenir votre bouée de sauvetage quotidienne. Nous parlons évidemment d'une nouvelle fonctionnalité liée à Google Gemini et à l'écosystème d'intelligence artificielle de Google , capable d'utiliser la reconnaissance visuelle comme jamais auparavant. Une sorte de réponse directe au GPT-4o et à l'actualité présentée hier soir par OpenAI, qui démontre à quel point Google veut devenir sérieux avec l'IA multimodale . Le projet Astra est la première expérience d'assistant d'IA multimodale basée sur les capacités de Google Gemini. Le développement a été confié à l'équipe de Google DeepMind, qui a créé une vidéo de démonstration montrant les extraordinaires possibilités offertes par cet outil. L'assistant est intégré directement dans un Google Pixel , et utilise l' appareil photo du smartphone pour visualiser et interpréter tout ce qui est cadré. Non seulement cela, car l'utilisateur peut interagir avec l'assistant via des commandes vocales , en demandant des informations relatives à ce qui est encadré, voire en indiquant des éléments spécifiques. Mais cela ne s'arrête pas là. Le projet Astra travaille également sur les lunettes intelligentes , celles équipées d'une caméra vidéo et d'un microphone. L'expérience utilisateur semble très intuitive : avec vos lunettes vous cadrez la scène devant vous et avec votre voix demandez à Gemini ce que vous voulez. Et que peut faire le Projet Astra pour vous ? Potentiellement tout. Grâce à la fonctionnalité multimodale , il est capable de reconnaître le paysage à l'extérieur de la fenêtre, de résoudre une formule mathématique, de lire et d'interpréter une partie de code, de reconnaître les parties d'un locuteur, d'inventer de jolis noms pour les animaux de compagnie. Il y a deux choses qui sont les plus impressionnantes dans cette démo. D’une part, l’incroyable interactivité et proactivité du Projet Astra, qui semble pouvoir passer d’une opération à l’autre de manière fluide et naturelle. En revanche, une latence quasi nulle , encore accentuée par le fait que le système doit reconnaître visuellement une scène, traiter l'information, produire un résultat et le communiquer à l'utilisateur. Tout cela se produit en quelques instants seulement. Si vous souhaitez voir les capacités du projet Astra en action, vous trouverez ci-dessous la première vidéo officielle publiée par Google. Comme mentionné, la démo du Projet Astra est vraiment impressionnante et parfois difficile à croire. Nous avons déjà eu de mauvaises surprises avec les systèmes d'intelligence artificielle de Google, avec de belles promesses qui ne se sont pas réalisées. Faut-il le croire cette fois-ci ? Google a déclaré que le projet est toujours en développement, mais que certaines des fonctionnalités présentées seront intégrées aux produits Google plus tard cette année. On parle de quelques mois donc, un laps de temps très court pour bien mettre en œuvre une fonctionnalité complexe comme celle-ci. nXVvvRhiGjI Il faut dire que ces dernières années le secteur de l’intelligence artificielle a fait – et fait – des pas de géant, accélérant toujours plus les capacités offertes par les différents systèmes concurrents. Le nouveau GPT-4o évoqué en début d'article s'inscrit également dans cette évolution très rapide . Cependant, de nombreux doutes restent à clarifier. Le Projet Astra sera-t-il intégré à tous les smartphones Pixel ? Fonctionnera-t-il localement ou se connectera-t-il aux serveurs de Google ? La latence des fonctions interactives sera-t-elle vraiment aussi faible (quasiment inexistante) que dans la démo ? Pour répondre à toutes ces questions, nous devrons attendre, espérons-le, encore plusieurs mois. Pourtant, la direction est déjà tracée : l'intelligence artificielle partout et dans tous les cas, utilisable avec les yeux et avec la voix, intégrée aux smartphones et aux lunettes, capable de répondre à toutes vos questions , ou presque. (Lire la suite)

Articles similaires

Sorry! Image not available at this time

Samsung et Google travaillent sur des lunettes pour réalité mixte

informaticien.be - 06/Sep 11:09

Samsung et Google collaborent depuis quelques temps pour créer un appareil « mystérieux » dédié à la réalité mixte. La nouvelle a été...

Sorry! Image not available at this time

Les Pixel Buds ne lisent plus les notifications tactiles. Vous devez maintenant demander oralement à l'assistant

informaticien.be - 19/Sep 14:39

Les Pixel Buds perdent une fonction utile, mais selon Google, c'est ce que demandent les utilisateurs : désormais, vous ne pouvez plus faire lire les...

Sorry! Image not available at this time

Les anniversaires arrivent sur Google Agenda : comment les enregistrer

informaticien.be - 13:11

L'innovation introduite par Google est particulièrement significative pour ceux qui ne veulent même pas oublier les anniversaires de leurs proches. ...

Sorry! Image not available at this time

La recherche et les annonces Google afficheront si le contenu est généré par IA

informaticien.be - 18/Sep 11:39

Google vient d'annoncer la mise en œuvre d'une nouvelle technologie dans la recherche et la publicité qui permettra de comprendre si une photo a...

Sorry! Image not available at this time

La recherche devient plus puissante que jamais sur Google Photos : voici comment procéder

informaticien.be - 06/Sep 11:11

Ceux qui utilisent Google Photos comme service principal pour sauvegarder et synchroniser des photos et des vidéos personnelles connaissent...

Sorry! Image not available at this time

Gemini Live disponible pour tous les utilisateurs. Qui et comment peut parler à l'IA de Google

informaticien.be - 13/Sep 12:51

Lancé le mois dernier exclusivement pour les abonnés Gemini Advanced , Gemini Live représente l'évolution de Gemini : un assistant IA qui devient...

Sorry! Image not available at this time

Google prépare l'extension Google Photos dans Gemini. Comment ça marche et à quoi ça sert

informaticien.be - 13/Sep 12:52

Si vous avez utilisé Gemini, vous saurez que l'un des outils de chatbot de Google sont des extensions, qui vous permettent de poser des questions...

Sorry! Image not available at this time

Nous serons plus conscients des images d'IA sur Facebook et Instagram : comment les reconnaître

informaticien.be - 13/Sep 12:53

Générer ou éditer des images avec l’IA ouvre des voies infinies à ceux qui créent du contenu sur les réseaux sociaux. En effet, des outils de...

Sorry! Image not available at this time

Android 15 résoudra un problème pour ceux qui utilisent plusieurs appareils et reçoivent de nombreuses notifications

informaticien.be - 17/Sep 13:51

Le célèbre Mishaal Rahman , très actif dans l'analyse des codes Android pour découvrir les nouvelles fonctionnalités développées par Google, a...

Sorry! Image not available at this time

Proteros Blade Nagual : saurez-vous reconnaître la voiture qui se cache sous cette robe bleue ?

turbo.fr - 06/Sep 09:00

La voiture dont il est question est certainement complètement inconnue pour 99,9% des passionnés. La Blade Nagual est en fait une création unique,...